CN107406838A

CN107406838A - Rna引导的内切核酸酶向细胞中的肽介导的递送

Info

Publication number: CN107406838A
Application number: CN201580072629.XA
Authority: CN
Inventors: R.L.弗里施; X.范; S-P.洪; E.N.贾克森
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2014-11-06
Filing date: 2015-11-03
Publication date: 2017-11-28
Also published as: US20190100737A1; EA038321B1; JP2017532979A; DK3597740T3; CA2966731A1; DK3215611T3; US10208298B2; US10584322B2; EP3215611A1; EP3215611B1; JP6823593B2; AU2015343307B2; KR102424721B1; US20200157516A1; KR20170077238A; EP3597740B1; EA201790968A1; US20170335300A1; AU2015343307A1; EP3597740A1

Abstract

披露的是一种组合物，该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该RGEN蛋白组分和CPP在RGEN蛋白‑CPP复合物中彼此共价或非共价地连接。RGEN蛋白‑CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。在某些实施例中，RGEN蛋白‑CPP复合物的RGEN蛋白组分可以与合适的RNA组分缔合以提供能够进行特异性DNA靶向的RGEN。进一步披露的是包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种CPP的组合物，以及将RGEN蛋白递送到微生物细胞中的方法，以及用RGEN靶向DNA的方法。

Description

RNA引导的内切核酸酶向细胞中的肽介导的递送

本申请要求于2014年11月6日提交的美国临时申请号62/075999的权益，该申请通过引用以其全文结合在此。

发明领域

本发明属于分子生物学领域。具体地，本发明涉及使用细胞穿透肽，将RNA引导的内切核酸酶的蛋白组分递送到细胞中。

以电子方式提交的序列表的引用

该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交，文件名为“20151013_CL6273PCT_SequenceListing_ST25.txt”，创建于2015年10月13日，且具有384千字节大小，并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用结合在此。

背景

了解生物体内基因的功能的方法是抑制其表达。基因表达的抑制可以例如通过打断或缺失基因的DNA序列来实现，导致基因的“敲除”(Austin等人，Nat.Genetics[自然遗传学]36：921-924)。基因敲除主要通过适用于从细菌到哺乳动物的广泛的生物体的技术，即同源重组(HR)进行。研究基因功能的另一种方法可以是通过遗传“敲入”，其通常也通过HR进行。出于基因靶向(敲除或敲入)目的的HR可以利用与靶位点(“供体DNA”)具有同源性的外源提供的DNA的存在。

当靶向的DNA位点含有双链断裂时，已显示用于基因靶向的HR被增强(Rudin等人，Genettcs[遗传学]122：519-534；Smih等人，Nucl.Acids Res.[核酸研究]23：5012-5019)。因此已经开发了引入双链断裂来促进HR介导的DNA靶向的策略。例如，当存在供体DNA时，锌指核酸酶已经被工程化以切割特定的DNA位点，导致在该位点增加的HR水平(Bibikova等人，Science[科学]300：764；Bibikova等人，Mol.Cell.Biol.[分子细胞生物学]21：289-297)。类似地，人工大范围核酸酶(归巢内切核酸酶)和转录激活子样效应子(TALE)核酸酶也被开发用于HR介导的DNA靶向(Epinat等人，Nucleic Acids Res.[核酸研究]31：2952-2962；Miller等人，Nat.Biotech.[自然生物技术]29：143-148)。

编码CRISPR(成簇的规律间隔的短回文重复序列)DNA切割系统的基因座仅在约40％的细菌基因组和大多数古细菌基因组中被发现(Horvath和Barrangou，Science[科学]327：167-170；Karginov和Hannon，Mol.Cell[分子细胞]37：7-19)。特别地，已经开发了II型CRIPSR系统的CRISPR相关(Cas)RNA引导的内切核酸酶(RGEN)Cas9作为引入用供体DNA刺激HR的位点特异性DNA链断裂的手段(美国临时申请号61/868,706，提交于2013年8月22日)。可以设计Cas9的RNA组分的序列，这样使得Cas9识别并切割含有(i)与RNA组分的一部分互补的序列和(ii)前间区序列邻近基序(PAM)序列的DNA。

天然的Cas9/RNA复合物包含两个RNA序列，CRISPR RNA(crRNA)和反式激活CRISPRRNA(tracrRNA)。在5′至3′方向上，crRNA包含与靶DNA位点互补的唯一序列和由该crRNA所起源的CRISPR基因座的重复区编码的序列的一部分。在5′至3′方向上，tracrRNA包含与crRNA的重复区和含茎环的部分退火的序列。最近的工作已经获得指导RNA(gRNA)的开发，该指导RNA在5′至3′方向上含有与tracrRNA连接的crRNA的嵌合序列(美国临时申请号61/868,706，提交于2013年8月22日)。

已经通过重组DNA表达策略在一些研究中提供了用于在细胞中进行Cas9介导的DNA靶向的蛋白质和RNA组分。例如，Cas9蛋白已经使用基于核酸的表达系统在细胞中被表达。在某些细胞类型中表达RNA组分例如gRNA的方法包括使用RNA聚合酶III(Pol III)启动子，其允许具有精确定义的未修饰的5′-和3′-末端的RNA的转录(DiCarlo等人，NucleicAcids Res.[核酸研究]41：4336-4343；Ma等人，Mol.Ther.Nucleic Acids[分子疗法-核酸]3：e161)。这些蛋白质和RNA表达技术已经应用于包括玉米和大豆(美国临时申请号61/868,706，提交于2013年8月22日)以及人类、小鼠、斑马鱼、木霉属(Trichoderma)和酿酒酵母(Sacchromyces cerevisiae)在内的几种不同物种的细胞中。

尽管有这些进展，但是在细胞(例如微生物细胞)中提供蛋白质和RNA组分以介导Cas9介导的DNA靶向的其他方法是引人关注的。

发明概述

在一个实施例中，本发明涉及包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物，其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，并且其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

在第二个实施例中，RGEN的蛋白组分与至少一种RNA组分缔合，该RNA组分包含与微生物细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合靶位点序列，并且任选地在靶位点序列处切割一条或两条DNA链。在第三个实施例中，RNA组分包含引导RNA(gRNA)，该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPRRNA(crRNA)。在第四个实施例中，RGEN可以在靶位点序列处切割一条或两条DNA链。

在第五个实施例中，RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。

在第六个实施例中，RGEN蛋白组分和CPP共价地连接。

在第七个实施例中，RGEN蛋白组分和CPP非共价地连接。

在第八个实施例中，CPP是阳离子性或两亲性的。

在第九个实施例中，CPP包括(i)来自爱泼斯坦-巴尔二氏(Epstein-Barr)病毒Zebra(斑马鱼)反式激活蛋白的CPP、(ii)具有6个或更多个连续精氨酸残基的CPP、(iii)转运蛋白-10(TP10)CPP、或(iv)来自血管内皮钙粘素蛋白的CPP。

在第十个实施例中，RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。

第十一个实施例涉及包含本文披露的组合物的微生物细胞。

第十二个实施例涉及将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法。该方法包括使微生物细胞与包含RGEN蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接。作为该接触步骤的结果，RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜，从而进入微生物细胞中。

在第十三个实施例中，关于该方法，(i)组合物进一步包含与RGEN的蛋白组分缔合的至少一种RNA组分，或(ii)微生物细胞包含RNA组分，其中在RGEN蛋白-CPP复合物进入微生物细胞中之后该RNA组分与RGEN的蛋白组分缔合；其中在(i)或(ii)中的RNA组分包含与微生物细胞中的染色体或附加体上的靶位点序列互补的序列，并且其中该RGEN可以结合靶位点序列，并且任选地在靶位点序列处切割一条或两条DNA链。在第十四个实施例中，该RGEN可以在靶位点序列处切割一条或两条DNA链。在第十五个实施例中，该微生物细胞进一步包含供体多核苷酸，该供体多核苷酸含有与靶位点序列处或其附近的序列同源的至少一个序列，其中该供体多核苷酸通过同源重组整合在靶位点序列处或其附近。

第十六个实施例涉及包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列，该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)，其中任选地，该核苷酸序列可操作地连接到启动子序列。

第十七个实施例涉及生产RGEN蛋白-CPP融合蛋白的方法。该方法包括：(a)提供包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列，该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)，其中任选地，该核苷酸序列可操作地连接到启动子序列；(b)从该多核苷酸序列表达该RGEN蛋白-CPP融合蛋白，从而产生该RGEN蛋白-CPP融合蛋白，其中该表达任选地在微生物细胞中进行；以及(c)任选地分离在步骤(b)中产生的RGEN蛋白-CPP融合蛋白。

第十八个实施例涉及包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物，其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

第十九个实施例涉及用于修饰微生物细胞的基因组中的靶位点的方法。该方法包括向微生物细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶，其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

附图和序列的简述

图1：pZUFCas9质粒(SEQ ID NO：6)含有在SEQ ID NO：5中阐述的耶氏酵母属(Yarrowia)密码子优化的Cas9表达盒。复制的起点(ARS 18、f1 ori、ColE1)为交叉阴影线，并且可选择标记(Ura3、Amp)为灰色。参考实例1。

图2A：用于在大肠杆菌(E.coli)中表达异源蛋白质的pBAD/HisB质粒(SEQ ID NO：10)。pBAD启动子为白色的。复制的起点为交叉阴影线。参考实例1。

图2B：用于在大肠杆菌中表达Cas9-NLS(图中的“Cas9”)的pRF48质粒(SEQ ID NO：11)。复制的起点为交叉阴影线。参考实例1。

图3A：用于在大肠杆菌中表达6xHis-Zebra CPP-Cas9-NLS融合物的pRF144质粒(SEQ ID NO：20)。复制的起点为交叉阴影线。参考实例1。

图3B：用于在大肠杆菌中表达6xHis-PolyR CPP-Cas9-NLS融合物的pRF145质粒(SEQ ID NO：21)复制的起点为交叉阴影线。参考实例1。

图3C：用于在大肠杆菌中表达6xHis-TP10 CPP-Cas9-NLS融合物的pRF146质粒(SEQ ID NO：22)。复制的起点为交叉阴影线。参考实例1。

图3D：用于在大肠杆菌中表达6xHis-pVEC CPP-Cas9-NLS融合物的pRF162质粒(SEQ ID NO：23)。复制的起点为交叉阴影线。参考实例1。

图4：6xHis-Zebra-Cas9-NLS纯化级分的SDS-PAGE分离。指出了裂解液、洗涤液、洗脱级分和分子量标准品。参考实例1。

图5：单引导多核苷酸例如单引导RNA(sgRNA)的结构模型。可变靶向(VT)结构域域显示为灰色。Cas9内切核酸酶识别(CER)结构域显示为黑色。

图6：源自质粒pRF46(SEQ ID NO：30)的模板的RGR sgRNA(靶向Can1-1基因座)的体外转录。孵育2、4、6和18小时的体外转录反应产生类似水平的sgRNA。还生产了核酶自催化的切割产物。参考实例2。

图7：使用与sgRNA(对Can1-1靶位点具有特异性)复合的Zebra CPP-Cas9的体外切割测定。在每个反应中包括含有Can1-1靶位点的DNA多核苷酸(982bp)。将每个反应在1.2％凝胶上进行电泳分解。“仅靶标”、“仅sgRNA”、“仅Zebra-Cas9”和“仅Zebra-Cas9(2xFT)”(FT，冻融)反应未切割靶多核苷酸。“Zebra-Cas9/sgRNA”、“Zebra-Cas9/sgRNA(2xFT)”和“Cas9/sgRNA”(野生型Cas9)反应如所得切割产物所指示的按特异性方式切割靶多核苷酸。参考实例3。

图8：测量Zebra CPP-Cas9(未与sgRNA缔合)和Zebra CPP-Cas9/gRNA复合物在其与解脂耶氏酵母(Yarrowia lipolytica)细胞接触后的基因组靶向效率。单独使用的Zebra-Cas9的终浓度为5μM，而在sgRNA复合物中使用不同终浓度(1-5μM)的Zebra CPP-Cas9。将突变频率报告为酵母菌落(在使细胞与Zebra CPP-Cas9或Zebra CPP-Cas9/gRNA接触之后在非选择性培养基上生长)的比例，其被记为在转移至含刀豆蛋白的培养基上时对刀豆氨酸的抗性。参考实例4。

图9：CPP-dsRED纯化的PAGE凝胶分析的实例。将12.5％PAGE凝胶用简单蓝(Simplyblue)染料染色。泳道1：分子量标准品，泳道2：澄清的细胞提取物tp10-dsREDexpress，泳道3：珠粒处理后澄清的细胞提取物tp10-dsREDexpress，泳道4：最终蛋白质溶液tp10-dsREDexpress，泳道5：澄清的细胞提取物MPG-dsREDexpress，泳道3：珠粒处理后澄清的细胞提取物MPG-dsREDexpress，泳道4：最终蛋白质溶液MPG-dsREDexpress。

表1

核酸和蛋白质SEQ ID号的总结

发明详细说明

所有引用的专利和非专利文献的披露内容通过引用以其全文结合在此。

如本文中所使用，术语“发明”或“披露的发明”不旨在是限制性的，而是广泛适用于在权利要求中限定的或本文所述的任何发明。这些术语在本文中可互换使用。

本文中的术语“细胞”是指任何类型的细胞，例如原核或真核细胞。真核细胞具有细胞核和其他膜封闭的结构(细胞器)，而原核细胞缺乏细胞核。在某些实施例中的细胞可以是哺乳动物细胞或非哺乳动物细胞。非哺乳动物细胞可以是真核的或原核的。例如，本文中的非哺乳动物细胞可以是指微生物细胞或非哺乳动物多细胞生物体例如植物、昆虫、线虫、鸟类物种、两栖动物、爬行类或鱼类的细胞。

本文中的微生物细胞可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如，藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌纲细胞。本文中的原核细胞可以是指例如细菌细胞或古细菌细胞。真菌细胞(例如，酵母细胞)、原生生物细胞(例如藻类细胞)、眼虫藻细胞、原生藻菌细胞和卵菌纲细胞代表真核微生物细胞的实例。真核微生物细胞具有细胞核和其他膜封闭的结构(细胞器)，而原核细胞缺乏细胞核。

本文中的术语“酵母”是指主要以单细胞形式存在的真菌物种。可替代地，酵母可以被称为“酵母细胞”。本文中的酵母可以被表征为例如常规酵母或非常规酵母。

本文中术语“常规酵母”(“模式酵母”)通常是指酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)酵母物种。在某些实施例中，常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。

本文中术语“非常规酵母”是指不是酵母属或裂殖酵母属酵母物种的任何酵母。非常规酵母描述于Non-Conventional Yeasts in Genetics，Biochemistry and Biotechnology：Practical Protocols(K.Wolf，K.D.Breunig，G.Barth，Eds.，Springer- Verlag，Berlin，Germany，2003)[遗传学、生物化学和生物技术中的非常规酵母菌：实践方案(K.Wolf、K.D.Breunig、G.Barth，编辑，德国柏林施普林格出版社，2003)]以及Spencer等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]58：147-156)中，其通过引用结合在此。在某些实施例中，非常规酵母可能另外地(或可替代地)是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。按照这些原则，非常规酵母的定义-偏好NHEJ超过HR-被Chen等人(PLoS ONE 8：e57952，其通过引用结合在此)进一步披露。本文中优选的非常规酵母是耶氏酵母属的那些(例如解脂耶氏酵母)。

本文中术语“植物”是指整株植物、植物器官、植物组织、植物细胞、种子及其子代。植物细胞包括但不限于得自下列物质的细胞：种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物部分包括分化和未分化的组织，包括但不限于根、茎、芽、叶、花粉、种子、肿瘤组织和各种形式的细胞和培养物(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以是在植物中或在植物器官、组织或细胞培养物中的。术语“植物器官”是指植物组织或构成植物的形态上和功能上不同部分的一组组织。术语“基因组”是指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部补体(基因和非编码序列)；和/或从一个亲本遗传为(单倍体)单位的完整染色体组。“子代”包括植物的任何后续世代。

转基因植物包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内，这样使得多核苷酸被传递给连续世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。异源多核苷酸可以包括起源于外来物种的序列，或者如果来自相同物种，可以是从其天然形式上进行实质改变的序列。转基因植物材料可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物，这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法，通过本文所述的不导致外源多核苷酸的插入的基因组编辑程序，或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的植物基因组(染色体或染色体外)的改变并不旨在被视为转基因。

可育的植物是产生有活力的雄性和雌性配子并且是自体受精的植物。这样的自体受精的植物可以产生子代植物，而没有来自任何其他植物的配子和其中所含的遗传物质的贡献。雄性不育植物包括不产生有活力的或以其他方式能够受精的雄性配子的植物。雌性不育植物包括不产生有活力的或以其他方式能够受精的雌性配子的植物。公认雄性不育和雌性不育植物可以分别是雌性可育的和雄性可育的。此外，公认当与雌性可育植物杂交时，雄性可育(但是雌性不育)植物可以产生有活力的后代，并且当与雄性可育植物交叉时，雌性可育(但是雄性不育)植物可以产生有活力的子代。

在本文中术语“RNA引导的内切核酸酶”(RGEN)是指包含至少一种CRISPR(成簇的规律间隔的短回文重复序列)相关(Cas)蛋白质和至少一种RNA组分的复合物。术语“RGEN的蛋白组分”和“RGEN蛋白组分”在本文中可互换使用，并且是指作为RGEN的内切核酸酶组分的Cas蛋白，或者形成其一部分的Cas蛋白。在某些实施例中蛋白组分可以是完整的内切核酸酶(例如Cas9)；这样的蛋白组分可以可替代地被称为RGEN的“内切核酸酶组分”。鉴于其与至少一种RNA组分缔合，本文中的RGEN通常具有特异性DNA靶向活性。

简言之，RGEN的RNA组分含有与靶位点序列中的DNA序列互补的序列。基于这种互补性，RGEN可以特异地识别和切割特定的DNA靶位点序列。本文中RGEN可以包含四种已知的CRISPR系统(Horvath和Barrangou，Science[科学]327：167-170)(例如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的RNA组分。在优选的实施例中，RGEN包含Cas9内切核酸酶(CRISPR II系统)和至少一种RNA组分(例如，crRNA和tracrRNA、或gRNA)。

术语“CRISPR”(成簇的规律间隔的短回文重复序列)是指I类、II类或III类DNA切割系统的某些遗传基因座编码因子，例如被细菌和古细胞用来破坏外源DNA(Horvath和Barrangou，Science[科学]327：167-170)的那些。本文中以异源方式利用CRISPR系统的组分，用于细胞中的DNA靶向。

术语“II型CRISPR系统”和“II型CRISPR-Cas系统”在本文中可互换使用，并且是指利用与至少一种RNA组分复合的Cas9内切核酸酶的DNA切割系统。例如，Cas9可以与CRISPRRNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中，Cas9可以与引导RNA复合。因此，crRNA、tracrRNA和引导RNA是本文中RNA组分的非限制性实例。

本文中术语CRISPR相关(“Cas”)内切核酸酶是指由Cas基因编码的Cas蛋白。当与合适的RNA组分复合时，Cas内切核酸酶在某些实施例中能够切割全部或部分特异性DNA靶序列。例如，其能够在特异性DNA靶序列中引入单链或双链断裂；可替代地其可以被表征为能够切割特异性DNA靶序列的一条或两条链。Cas内切核酸酶可以在靶序列处解开DNA双链体并切割至少一条DNA链，如通过与Cas复合的crRNA或引导RNA识别靶序列所介导的。如果正确的前间区序列邻近基序(PAM)位于或相邻于DNA靶序列的3′末端，则通过Cas内切核酸酶对靶序列进行的此类识别和切割通常会发生。可替代地，本文中的Cas蛋白质可能缺乏DNA切割或切口活性，但是当与合适的RNA组分复合时，仍然可以特异性结合DNA靶序列。本文中优选的Cas蛋白是Cas9。

任何引导的内切核酸酶可以用于本文披露的方法中。这样的内切核酸酶包括但不限于Cas9和Cpf1内切核酸酶。迄今为止已经描述了许多内切核酸酶，它们可以识别特定的PAM序列(参见例如-于2015年5月15日提交的美国专利申请62/162377和于2015年5月15日提交的美国专利申请62/162353以及Zetsche B等人2015.Cell[细胞]163，1013)并且在特定位置处切割靶DNA。应当理解的是，基于本文所述的使用引导的Cas系统的方法和实施例，现在人们可以定制这些方法，使得它们可以利用任何引导的内切核酸酶系统。

本文中“Cas9”(以前称为Cas5、Csn1、或Csx12)是指与crRNA和tracrRNA或与引导RNA形成复合物的II型CRISPR系统的Cas内切核酸酶，用于特异性识别和切割全部或部分的DNA靶序列。Cas9蛋白包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域，其各自在靶序列上切割单个DNA链(两个结构域的协同作用导致DNA双链切割，而一个结构域的活性导致一个缺口)。通常，RuvC结构域包含亚结构域I、II和III，其中亚结构域I位于Cas9的N末端附近，并且亚结构域II和III位于蛋白质的中间，即位于HNH结构域的侧翼(Hsu等人，Cell[细胞]157：1262-1278)。“Apo-Cas9”是指不与RNA组分复合的Cas9。Apo-Cas9可以结合DNA，但以非特异性方式进行，且不能切割DNA(Sternberg等人，Nature[自然]507：62-67)。

本文中术语“RNA组分”是指RGEN的RNA组分，其含有与DNA靶序列的链互补的核糖核酸序列。该互补序列在本文中被称为“引导序列”或“可变靶向结构域”序列(图5)。本文中合适的RNA组分的实例包括crRNA和引导RNA。在某些实施例中的RNA组分(例如，仅引导RNA、crRNA+tracrRNA)可以使得RGEN组分能够进行特异性DNA靶向。

本文中术语“CRISPR RNA”(crRNA)是指可以与一种或多种Cas蛋白(例如Cas9)形成复合物的RNA序列，并且为复合物提供DNA结合特异性。crRNA提供DNA结合特异性，因为其含有与DNA靶序列的链互补的“引导序列”(“可变靶向结构域”[VT])。crRNA进一步包含由crRNA起源的CRISPR基因座的重复区编码的“重复序列”(“tracr RNA配对序列”)。crRNA的重复序列可以为在tracrRNA的5′-端的序列退火。在天然CRISPR系统中的crRNA源自于从CRISPR基因座转录的“前crRNA”。前crRNA包括间隔区和重复区；间隔区包含与DNA靶位点序列互补的独特序列。天然系统中的前crRNA被处理成多个不同的crRNA，每个沿着重复序列的一部分具有引导序列。例如为了DNA靶向特异性，CRISPR系统利用crRNA。

本文中术语“反式激活CRISPR RNA”(tracrRNA)是指在II型CRISPR系统中使用的非编码RNA，并且在5′至3′方向上包含(i)与CRISPR II型crRNA的重复区退火的序列和(ii)含茎环的部分(Deltcheva等人，Nature[自然]471：602-607)。

术语“引导RNA”(gRNA)和“单引导RNA”(sgRNA)在本文中可互换使用。本文中的gRNA可以是指含有与tracrRNA可操作地连接的crRNA的嵌合序列。可替代地，例如，gRNA可以是指crRNA和tracrRNA的合成融合物。还可以按照具有引导序列(可变靶向结构域)、随后是Cas内切核酸酶识别(CER)结构域来表征gRNA。CER结构域可以包含tracrRNA配对序列，随后是tracrRNA序列。

可以任选地使用“CRISPR DNA”(crDNA)而不是RNA组分。crDNA具有对应于如本文披露的crRNA的序列的DNA序列。crDNA可以与crDNA/tracrRNA复合物中的tracrRNA一起使用，其进而可以与RGEN蛋白组分缔合。美国申请号61/953,090披露了crDNA以及其用于RGEN介导的DNA靶向的方法。相应地，预期本文中关于crRNA的任何披露内容同样适用于使用crDNA。因此，在结合了crDNA的本文的实施例中，“RNA引导的内切核酸酶”(RGEN)可以反而被称为包含至少一种Cas蛋白和至少一种crDNA的复合物。

如本文中所使用，术语“引导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列，并且使得Cas内切核酸酶能够识别并任选地切割DNA靶位点。引导多核苷酸可以是单分子或双分子。引导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地，引导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰，例如但不限于锁核酸(LNA)、5-甲基dC、2，6-二氨基嘌呤、2′-氟代A、2’-氟代U、2′-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。仅包含核糖核酸的引导多核苷酸也被称为“引导RNA”。

引导多核苷酸可以是双分子(也称为双链体引导多核苷酸)，其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子引导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中，包含连接到CER结构域(“cr核苷酸”)的VT结构域的双链体引导多核苷酸的第一个分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在一些实施例中，包含CER结构域的双链体引导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。

引导多核苷酸还可以是单分子，其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单引导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中，单引导多核苷酸包含连接到tracr核苷酸(包含CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域)，其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单引导多核苷酸可以被称为“单引导RNA”(当由RNA核苷酸的连续延伸构成时)或“单引导DNA”(当由DNA核苷酸的连续延伸构成时)或“单引导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。

因此，在某些实施例中，引导多核苷酸和II型Cas内切核酸酶可以彼此形成复合物(被称为“引导多核苷酸/Cas内切核酸酶复合物”或也被称为“引导多核苷酸/Cas内切核酸酶系统”)，其中该引导多核苷酸/Cas内切核酸酶复合物可以指导Cas内切核酸酶靶向细胞(例如植物细胞)中的基因组靶位点，任选地使得Cas内切核酸酶在基因组靶位点引入单链或双链断裂。引导多核苷酸/Cas内切核酸酶复合物可以连接至至少一种CPP，其中这样的复合物能够结合到细胞(例如，植物细胞)的靶位点，并且任选地对其产生单链或双链断裂)。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且是指与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一个核苷酸序列结构域(VT结构域)与靶序列之间的互补百分比可以为至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、63％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。可变靶标结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中，可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任意组合构成。

术语引导多核苷酸的“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换使用，并且涉及与Cas内切核酸酶多肽相互作用的核苷酸序列(例如引导多核苷酸的第二核苷酸序列结构域)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任意组合构成。

术语“靶位点”、“靶序列”、“靶DNA”、“DNA靶序列”、“靶基因座”、“前间区序列(protospacer)”等在本文中可互换使用。靶位点序列是指在本文的RGEN可以识别、结合并任选地产生切口或切割的细胞的基因组中的染色体、附加体或任何其他DNA分子上的多核苷酸序列。靶位点可以是(i)细胞中的内源/天然位点，(ii)与细胞异源，因此不是天然存在于基因组中的，或(iii)与其天然发生的位置相比在异源基因组位置中发现的。

本文中的靶位点序列长度为至少13个核苷酸，并且具有一条链，该链与(crRNA或gRNA的)引导序列具有足够互补性以便能够与该引导序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM在某些实施例中与靶序列相邻)。切割/切口位点(适用于内切核苷酸的或切口Cas)可以位于靶序列内(例如，使用Cas9)或切割/切口位点可能在靶序列之外(例如，使用与异源内切核酸酶结构域(例如源自于FokI酶的结构域)融合的Cas9)。靶位点序列也可能被缺乏切割或切口活性的RGEN结合。

本文中的“人工靶位点”或“人工靶序列”是指已经导入细胞基因组的靶序列。在一些实施例中，人工靶序列可以在序列上与细胞基因组中的天然靶序列相同，但是位于基因组中的不同位置(异源位置)，或者如果位于细胞基因组中的相同位置其可以不同于天然靶序列。

本文中的“附加体”是指可以独立于细胞染色体自主存在于细胞中(可以复制并传递给子细胞)的DNA分子。附加体DNA对于细胞而言可以是天然的或异源的。本文中天然附加体的实例包括线粒体DNA(mtDNA)和叶绿体DNA。本文中异源性附加体的实例包括质粒和酵母人工染色体(YAC)。

本文中的“前间区序列邻近基序”(PAM)是指由本文中的RGEN识别的短序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同，但通常为例如2、3、4、5、6、7或8个核苷酸长。

术语“5′-帽”和“7-甲基鸟苷酸(m⁷G)帽”在本文中可互换使用。7-甲基鸟苷酸残基位于真核生物中由RNA聚合酶II(Pol II)转录的RNA的5′末端。本文中带帽的RNA具有5′-帽，而未带帽的RNA不具有这样的帽。

术语“未带帽”、“不具有5′-帽”等在本文中可互换使用，是指缺少5′-帽并任选地具有例如5′-羟基基团而不是5′-帽的RNA。因为5′-带帽的RNA有核输出的倾向，转录以后未带帽的RNA可以更好地积累在细胞核中。

术语“核酶”、“核糖核酸酶”和“自切割核酶”在本文中可互换使用。核酶是指形成二级、三级和/或四级结构的一个或多个RNA序列，其可以在特定部位、特别是在相对于核酶序列的顺式位点切割RNA(即自动催化、或自切割)。已经描述了核酶核溶解活性的一般性质(例如，Lilley，Biochem.Soc.Trans.[生化学会学报]39：641-646)。本文中的“锤头状核酶”(HHR)可以包含由三个碱基配对的茎组成的小的催化RNA基序和参与催化的高度保守的、非互补性核苷酸的核。Pley等人(Nature 372：68-74)和Hammann等人(RNA 18：871-885)(其通过引用结合在此)披露了锤头状核酶结构和活性。本文中的锤头状核酶可以包含如例如Scott等人(Cell[细胞]81：991-1002，通过引用结合在此)所披露的“最小锤头状”序列。

术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”在本文中可互换使用。本文中的DNA靶向可能是在特定的DNA序列(例如细胞的染色体或附加体)中特异性引入插入缺失(indel)、敲除或敲入。通常，DNA靶向可以通过在具有与合适的RNA组分缔合的Cas蛋白的细胞中的特异性DNA序列处切割一条或两条链来进行。这样的DNA切割，如果是双链断裂(DSB)，可以促进NHEJ过程，这可能导致靶位点的插入缺失形成。而且，无论切割是单链断裂(SSB)还是DSB，如果在DNA切口或切割位点提供合适的供体DNA多核苷酸，则可以促进HR过程。取决于供体DNA多核苷酸的序列，这样的HR过程可以用于在靶位点引入敲除或敲入。可替代地，本文中DNA靶向可以是指本文中的Cas/RNA组分复合物与靶DNA序列的特异性缔合，其中Cas蛋白质切割或不切割DNA链(取决于Cas蛋白质的内切核酸结构域的状态)。

本文中术语“插入缺失(indel)”是指在染色体或附加体中的靶DNA序列中插入或缺失一个或多个核苷酸碱基。这样的插入或缺失可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中，插入缺失可以甚至更大，至少约20、30、40、50、60、70、80、90或100个碱基。如果在基因的开放阅读框(ORF)中引入插入缺失，通常该插入缺失会通过产生移码突变来破坏由ORF编码的蛋白质的野生型表达。

术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除代表通过用Cas蛋白靶向而部分或完全不起作用的本文中的细胞的DNA序列；敲除之前这样的DNA序列例如可以已经编码氨基酸序列或者可以具有调节功能(例如，启动子)。可以通过插入缺失(通过由Cas介导的切割促进的NHEJ)或通过特异性去除序列(当还使用合适的供体DNA多核苷酸时，通过由Cas介导的切割或切口促进的HR)来产生敲除，其减少或完全破坏靶向位点处、邻接位置处或附近的序列的功能。可替代地，本文中敲除的DNA多核苷酸序列可以被表征为例如被部分或完全破坏或下调。

术语“敲入”、“基因敲入”和“遗传敲入”在本文中可互换使用。敲入表示通过用Cas蛋白靶向在细胞中的特异性DNA序列处的DNA序列的替换或插入(当还使用合适的供体DNA多核苷酸时，通过由Cas介导的切割或切口促进的HR)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入，或转录调控元件在遗传基因座中的特异性插入。

术语“供体多核苷酸”、“供体DNA”、“靶向多核苷酸”和“靶向DNA”在本文中可互换使用。供体多核苷酸是指包含与在DNA靶位点(例如本文中由Cas蛋白特异性靶向的序列)处或附近的序列同源的至少一个序列的DNA序列。如果靶位点含有SSB或DSB(例如可以使用本文中与适当的RNA组分缔合的某些Cas蛋白质来引入)，则合适的供体多核苷酸能够用DNA靶位点进行HR。本文中供体多核苷酸内的“同源序列”可以例如包含至少约25个核苷酸，例如与靶位点处或附近的序列具有100％同一性，或与靶位点处或附近的序列具有至少约90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性的序列或由其组成。

在某些实施例中，供体DNA多核苷酸可以具有两个同源序列，它们被与在靶位点处的序列同源的序列(或碱基对)分隔开。这样的供体多核苷酸的这两个同源序列可以被称为异源序列侧翼的“同源臂”。在靶位点和具有两个同源臂的供体多核苷酸之间的HR通常导致在靶位点处的序列被供体多核苷酸的异源序列替代(位于与供体多核苷酸的同源臂同源的DNA序列之间的靶位点序列被供体多核苷酸的异源序列替代)。在具有两个同源臂的供体多核苷酸中，臂可以被1个或多个核苷酸分隔开(即供体多核苷酸中的异源序列可以为至少1个核苷酸长度)。可以在本文中的细胞中进行的各种HR程序披露在例如DNA Recombination：Methods and Protocols：1st Edition(H.Tsubouchi，Ed.，Springer-Verlag，New York，2011)[DNA重组：方法与方案(第1版)(H.Tsubouchi，编辑，纽约施普林格出版社，2011)]中，其通过引用结合在此。

术语“细胞穿透肽”(CPP)和“蛋白质转导结构域”(PTD)在本文中可互换使用。CPP是指通常约5-60个氨基酸残基长度的肽，其可促进分子货物(molecular cargo)，特别是本文的一种或多种RGEN蛋白组分(例如Cas9蛋白)的细胞摄取。这样的蛋白质货物可以通过共价或非共价的连接与一个或多个CPP缔合。在某些实施例中，CPP也可以表征为能够促进分子货物跨越/通过脂质双层、胶束、细胞膜、细胞器膜、囊泡膜或细胞壁中的一种或多种的移动或穿越。在某些实施例中，本文中的CPP可以是阳离子性、两亲性或疏水性的。在本文有用的CPP的实例以及一般性CPP的进一步描述披露于Schmidt等人(FEBS Lett.584：1806-1813)、Holm等人(Nature Protocols[自然实验手册]1：1001-1005)、Yandek等人(Biophys.J.[生物物理学杂志]92：2434-2444)、Morris等人(Nat.Biotechnol.[自然生物技术]19：1173-1176)、以及美国专利申请公开号2014/0068797中，所述文献都通过引用结合在此。

本文中的“阳离子性”或“聚阳离子性”CPP是指具有高相对丰度(至少60％)的带正电荷的氨基酸例如赖氨酸(K)、精氨酸(R)和/或组氨酸(H)的CPP。

“两亲性”(amphipathic或amphiphilic)CPP是指具有包含交替模式的极性/带电荷残基和非极性疏水残基的氨基酸序列的CPP。可替代地，两亲性CPP可以被表征为具有亲水和亲脂两种特性。

本文中的“疏水性”或“亲脂性”CPP主要含有或仅含有具有低净电荷和/或疏水氨基酸基团的非极性残基。

术语“共价连接的”(covalently linked)、“共价附接的”(covalentlyattached)、“共价缔合的”(covalently associated)、“共价连接”(covalent linkage)、“共价相互作用”(covalent interaction)等在本文中可互换使用。本文中的共价连接可以是经由例如一个或多个肽键或一个或多个化学交联。共价连接可以是直接的，例如其中直接在RGEN蛋白组分和CPP之间存在共价连接(直接连接)(例如，在RGEN蛋白组分的原子和CPP的原子之间存在化学键[电子共享])。可替代地，共价连接可以是间接的，例如，其中RGEN蛋白组分和CPP通过至少一个中间因子彼此连接。这样的中间因子或它们自己共同连接在一起的一组中间因子与RGEN蛋白组分和CPP共价连接。因此，中间因子或其组可以被表征为在RGEN蛋白组分和CPP之间的桥。

术语“融合蛋白”、“蛋白质融合物”、“嵌合蛋白”等在本文中可互换使用。本文中的融合蛋白包含在单个多肽内连接在一起的至少两个不同的(异源的)氨基酸序列。融合蛋白通常通过基因工程过程产生，其中编码不同氨基酸序列的DNA序列连接在一起以编码含有不同氨基酸序列的单个蛋白质。本文中融合蛋白的实例包括RGEN蛋白-CPP融合物(与一个或多个CPP氨基酸序列融合的RGEN蛋白氨基酸序列)。

术语“非共价连接的”、“非共价附接的”、“非共价缔合的”、“非共价连接”、“非共价相互作用”等在本文中可互换使用。本文中非共价连接是指在电子不共享的原子之间的相互作用。这类相互作用弱于共价连接。疏水相互作用代表可能在RGEN蛋白组分和一个或多个CPP之间发生的非共价连接的实例。可应用于本文的非共价连接的其他实例包括静电力(例如离子、氢键)和范德华力(伦敦色散力)。

如本文中所使用，“RGEN蛋白-CPP复合物”是指在RGEN的蛋白组分和至少一种CPP之间的复合物，其中RGEN和CPP经由共价或非共价连接相互作用。在该复合物中的RGEN和CPP组分通常都保留如本文披露的其各自的活性/功能的全部或一些(例如至少50％)。例如，在RGEN蛋白组分为Cas9的实施例中，在Cas9-CPP复合物中的Cas9能够与合适的RNA组分(例如，gRNA)缔合，并将Cas9-CPP复合物靶向于细胞中的DNA靶位点。

术语“穿过”(traverse)、“经过”(travel through)、“穿越”(cross through)、“横过”(goes across)等在本文中可互换使用。

术语“细胞膜”、“质膜”和“细胞质膜”在本文中可互换使用，并且是指将细胞内部与其外部分隔开的生物膜。细胞膜通常包含具有嵌入其中的蛋白质的磷脂双层。在其他若干功能中，细胞膜可以用作细胞外结构例如细胞壁或糖萼结构的附着表面。关于细胞膜脂质双层的详细信息提供于Molecular Biology of the Cell.4th Edition(B.Alberts等人，Eds.，Garland Science，New York，2002)[细胞分子生物学(第4版)(B.Alberts等人，编辑，纽约加兰科学出版社，2002)]，其通过引用结合在此。

本文中的术语“细胞壁”是指围绕一些类型的非哺乳动物细胞(例如细菌、植物、藻类、真菌例如酵母)的坚韧、柔韧的(但有时相当坚硬的)层。其位于细胞膜外部，并且为细胞提供结构支持和保护。在某些实施例中细胞壁的主要功能是帮助维持细胞渗透压。真菌细胞(例如，酵母细胞)壁通常包含几丁质，并且藻类细胞壁通常包含糖蛋白和多糖。植物细胞壁通常主要包含具有较少量的其他组分的多糖(例如酚酯、结构蛋白)。“初生细胞壁”和/或“次生细胞壁”可以用于表征植物细胞壁，其中次生壁位于初生壁内。木质素是次生壁的主要组分。细菌细胞壁通常包含肽聚糖作为主要成分。在某些方面，例如在细菌中，细胞壁可以在其外层进一步包含糖萼，其通常是多糖的包被。

本文中术语“亮氨酸拉链结构域”是指二聚体化结构域，其特征在于在约35个残基的延伸中每第七个残基存在一个亮氨酸残基。亮氨酸拉链结构域通过α-螺旋卷成的卷曲结合在一起形成二聚体。卷成的卷曲每个转角具有3.5个残基，这意味着每第七个残基相对于螺旋轴占据等同的位置。卷成的卷曲内的亮氨酸的规则排列通过疏水和范德华相互作用来稳定结构。

术语“百分比体积”(percent by volume)、“体积百分比”(volume percent)、“vol％”和“v/v％”在本文中可互换使用。在溶液中溶质的体积百分比可以使用以下公式确定：[(溶质体积)/(溶液体积)]×100％。

术语“重量百分比”、“重量百分率(wt％)”和“重量-重量百分率(％w/w)”在本文中可互换使用。重量百分比是指当包含在组合物、混合物或溶液中时，材料在质量基础上的百分数。

术语“多核苷酸”、“多核苷酸序列”和“核酸序列”在本文可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物，其任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段组成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以通过单字母名称表示如下：“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA)，“C”表示胞苷酸或脱氧胞苷酸(分别用于RNA或DNA)，“G”表示鸟苷酸或脱氧鸟苷酸(分别用于RNA或DNA)，“U”表示尿苷酸(用于RNA)，“T”表示脱氧胸苷酸(用于DNA)，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，“W”表示A或T，并且“N”表示任何核苷酸(例如，如果提及DNA序列，N可以是A、C、T或G；如果提及RNA序列，N可以是A、C、U或G)。本文披露的任何RNA序列(例如，crRNA、tracrRNA、gRNA)可以由合适的DNA序列编码。

如本文中所使用，术语“分离的”是指已经从其天然来源完全或部分纯化的多核苷酸或多肽分子。在一些情况下，分离的多核苷酸或多肽分子是更大组合物、缓冲系统或试剂混合物的一部分。例如，分离的多核苷酸或多肽分子能以异源方式包含在细胞或生物体内。本文中包含RGEN的蛋白组分和细胞穿透肽的组合物可以被认为是分离的组合物。这些组合物包含异源组分，并且不在自然界中出现。

如本文中所使用，术语“基因”是指从编码区表达RNA(RNA从DNA多核苷酸序列转录)的DNA多核苷酸序列，该RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA(例如本文中的crRNA、tracrRNA、或gRNA)。基因可以是指单独的编码区，或者可以包括编码区上游和/或下游的调控序列(例如启动子、5′-非翻译区、3′-转录终止子区)。可替代地，编码蛋白质的编码区可以在本文中被称为“开放阅读框”(ORF)。“天然的”或“内源的”基因是指如在自然界中发现的具有其自身调节序列的基因；这样的基因位于宿主细胞的基因组中的天然位置。“嵌合”基因是指不是天然基因的任何基因，该基因包括在自然界中未一起发现的调节序列和编码序列(即，调节区和编码区彼此是异源的)。因此，嵌合基因可包括源于不同来源的调控序列和编码序列，或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“外来”或“异源”的基因是指通过基因转移导入宿主生物体的基因。外来/异源基因可包括插入到非天然生物体内的天然基因、导入到天然宿主内的新位置的天然基因，或嵌合基因。在某些实施例中本文披露的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如，转化)已经引入基因组中的基因。“密码子优化的”开放阅读框的密码子使用频率被设计为模拟宿主细胞优选密码子使用的频率。

“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中，突变基因包含通过使用如本文披露的引导多核苷酸/Cas内切核酸酶系统进行的改变。突变的植物是包含至少一个突变基因的植物。

包含在本文的细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会发生在这样的细胞或生物体的天然(自然)对应物中。

如本文中所使用，“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5′非翻译区和3′非编码区，并且该调节序列可以影响转录、加工或稳定性、或从该基因转录的RNA的翻译。本文中，调节序列可以包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及调节基因表达的其他元件。本文中一个或多个调节元件可以与本文的编码区异源。

如本文中所使用的“启动子”是指能够控制来自基因的RNA转录的DNA序列。通常，启动子序列位于基因的转录起始位点的上游。启动子可以全部来源于天然基因，或者由源自于在自然界存在的不同启动子的不同元件构成，或者甚至包含合成的DNA区段。在多数时候在所有情况下引起基因在细胞中表达的启动子通常称为“组成型启动子”。本文中一个或多个启动子可以与本文的编码区异源。

如本文中所使用的“强启动子”是指可以引导每单位时间相对大量的生产性启动的启动子，和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。

植物启动子是能够在植物细胞中启动转录的启动子；关于植物启动子的综述，参见Potenza等人，(2004)In Vitro Cell Dev Biol[体外细胞与发育生物学]40：1-22。组成型启动子包括例如Rsyn7启动子的核心启动子以及披露于WO 99/43838和美国专利号6072050中的其他组成型启动子；核心CaMV35S启动子(Odell等人，(1985)Nature[自然]313：810-2)；稻肌动蛋白(McElroy等人，(1990)Plant Cell[植物细胞]2：163-71)；泛素(Christensen等人，(1989)Plant Mol Biol[植物分子生物学]12：619-32；Christensen等人，(1992)Plant MolBiol[植物分子生物学]18：675-89)；pEMU(Last等人，(1991)TheorAppl Genet[理论与应用遗传学]81：581-8)；MAS(Velten等人，(1984)EMBO J3：2723-30)；ALS启动子(美国专利号5659026)等。其他组成型启动子被描述于例如美国专利号5608149；5608144；5604121；5569597；5466785；5399680；5268463；5608142和6177611中。在一些实例中，可以使用诱导型启动子。在被病原体感染后诱导的病原体诱导型启动子包括但不限于调节PR蛋白、SAR蛋白、β-1，3-葡聚糖酶、几丁质酶等的表达的启动子。

可以使用化学调节型启动子以通过应用外源化学调节剂来调节植物中的基因表达。在应用化学品诱导基因表达的情况下启动子可以是化学诱导型启动子，或者在应用化学品阻抑基因表达的情况下启动子可以是化学阻抑型启动子。化学品诱导型启动子包括但不限于：由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人，(1997)PlantCell Physiol[植物细胞生理学]38：568-77)、由用作出苗前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-11-27，WO 93/01294)、以及由水杨酸激活的烟草PR-1a启动子(Ono等人，(2004)Biosci Biotechnol Biochem[生物科学生物技术生物化学]68：803-7)。其他化学调节的启动子包括类固醇反应启动子(参见，例如，糖皮质激素诱导型启动子(Schena等人，(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88：10421-5；McNellis等人，(1998)Plant J[植物学]14：247-257)；四环素诱导型和四环素阻抑型启动子(Gatz等人，(1991)Mol Gen Genet[分子遗传和基因组学]227：229-37；美国专利号5814618和5789156)。

组织偏好性启动子可以用于靶向特定植物组织内的增强的表达。组织偏好性启动子包括，例如Kawamata等人，(1997)Plant Cell Physiol[植物细胞生理学]38：792-803；Hansen等人，(1997)Mol Gen Genet[分子遗传和基因组学]254：337-43；Russell等人，(1997)Transgenic Res[转基因研究]6：157-68；Rinehart等人，(1996)Plant Physiol[植物生理学]112：1331-41；Van Camp等人，(1996)Plant Physiol[植物生理学]112：525-35；Canevascini等人，(1996)Plant Physiol[植物生理学]112：513-524；Lam，(1994)ResultsProbl Cell Differ[细胞分化的结果和问题]20：181-96；以及Guevara-Garcia等人，(1993)Plant J[植物学]4：495-505。叶偏好性启动子包括，例如，Yamamoto等人，(1997)Plant J[植物学]12：255-65；Kwon等人，(1994)Plant Physiol[植物生理学]105：357-67；Yamamoto等人，(1994)Plant Cell Physiol[植物细胞生理学]35：773-8；Gotor等人，(1993)Plant J[植物学]3：509-18；Orozco等人，(1993)Plant Mol Biol[植物分子生物学]23：1129-38；Matsuoka等人，(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90：9586-90；Simpson等人，(1958)EMBO J 4：2723-9；Timko等人，(1988)Nature[自然]318：57-8。根偏好性启动子包括，例如，Hire等人，(1992)Plant Mol Biol[植物分子生物学]20：207-18(soybean root-specific glutamine synthase gene[大豆根特异性谷氨酰胺合成酶基因])；Miao等人，(1991)Plant Cell[植物细胞]3：11-22(cytosolic glutaminesynthase(GS)[胞浆谷氨酰胺合成酶(GS)])；Keller和Baumgartner(1991)Plant Cell[植物细胞]3：1051-61(root-specific control element in the GRP 1.8 gene of Frenchbean[法国菜豆的GRP 1.8基因中的根特异性控制元件])；Sanger等人，(1990)Plant MolBiol[植物分子生物学]14：433-43(root-specific promoter of A.tumefaciensmannopine synthase(MAS)[根瘤土壤杆菌甘露碱合酶的根特异性启动子(MAS)])；Bogusz等人，(1990)Plant Cell[植物细胞]2：633-41(root-specific promoters isolated fromParasponia andersonii and Trema tomentosa[从Parasponia andersonii和山黄麻(Trema tomentosa)中分离的根特异性启动子])；Leach和Aoyagi，(1991)Plant Sci[植物科学]79：69-76(A.rhizogenes rolC and rolD root-inducing genes[毛根土壤杆菌(A.rhizogenes)rolC和rolD根诱导基因])；Teeri等人，(1989)EMBO J8：343-50(Agrobacterium wound-induced TR1′and TR2’genes[土壤杆菌伤口诱导的TR1′和TR2′基因])；VfENOD-GRP3基因启动子(Kuster等人，(1995)Plant Mol Biol[植物分子生物学]29：759-72)；和rolB启动子(Capana等人，(1994)Plant Mol Biol[植物分子生物学]25：681-91；菜豆素基因(Murai等人，(1983)Science[科学]23：476-82；Sengopta-Gopalen等人，(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82：3320-4)。还参见美国专利号5837876；5750386；5633363；5459252；5401836；5110732和5023179。

“种子偏好性”启动子包括在种子发育期间有活性的种子特异性启动子以及在种子发芽期间有活性的种子发芽性启动子两者。参见Thompson等人，(1989)BioEssays[生物学分析]10：108。种子偏好性启动子包括但不限于Cim1(细胞分裂素诱导的信号)；cZ19B1(玉蜀黍19kDa玉米蛋白)；和milps(肌醇-1-磷酸盐合酶)；(WO 00/11177；以及美国专利6225529)。对于双子叶植物，种子偏好性启动子包括但不限于：菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物，种子偏好性启动子包括但不限于玉蜀黍15kDa玉米蛋白、22kDa玉米蛋白、27kDaγ玉米蛋白、蜡质、收缩素1、收缩素2、球蛋白1、油质蛋白和nucl。还参见WO 00/12733，其中披露了来自END1和END2基因的种子偏好性启动子。

如本文中所使用，术语“3’非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其它序列。

如本文中所使用，术语“盒”是指与编码蛋白质编码RNA或非蛋白质编码RNA的DNA序列可操作地连接的启动子。盒可以任选地可操作地连接到3′非编码序列。

如本文关于多核苷酸所使用的术语“上游”和“下游”分别是指“5’的”和“3’的”。

如本文中所使用，术语“表达”是指(i)来自编码区的RNA(例如，mRNA或非蛋白质编码RNA，例如crRNA、tracrRNA或gRNA)的转录，或(ii)多肽从mRNA的翻译。

当用于描述基因或多核苷酸序列的表达时，术语“下调”、“破坏”、“抑制”、“失活”和“沉默”在本文中可互换使用，是指当多核苷酸序列的转录被降低或消除时的情况。这导致来自多核苷酸序列的RNA转录物的减少或消除，其引起源自于多核苷酸序列的蛋白质表达的降低或消除(如果该基因包含ORF)。可替代地，下调可能是指从由多核苷酸序列产生的转录物的蛋白质翻译被减少或消除的情况。可替代地，下调可能是指由多核苷酸序列表达的蛋白质具有降低的活性的情况。在细胞中任何上述过程(转录、翻译、蛋白质活性)的减少可以是相对于合适的对照细胞的转录、翻译或蛋白质活性的约20％、30％、40％、50％、60％、70％、80％、90％、95％或100％。下调可以是例如如本文所披露的靶向事件的结果(例如，添加缺失、敲除)。

术语“对照细胞”和“合适的对照细胞”在本文中可互换使用，并且可以关于已经进行了特定修饰(例如，多核苷酸的过表达、多核苷酸下调)的细胞(即，“实验细胞”)进行参比。对照细胞可以是不具有或不表达实验细胞的特定修饰的任何细胞。因此，对照细胞可以是未转化的野生型细胞，或者可以进行遗传转化但不表达遗传转化。例如，对照细胞可以是实验细胞的直接亲本，该直接亲本细胞不具有在实验细胞中的特定修饰。可替代地，对照细胞可以是通过一个或多个世代移除的实验细胞的亲本。仍可替代地，对照细胞可以是实验细胞的同胞，该同胞不包括存在于实验细胞中的特定修饰。

如本文中所使用，术语“增加”可以是指比该增加的量或活性与之进行比较的量或活性多至少约1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、50％、100％、或200％的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”和“改进的”在本文中可互换使用。术语“增加”可以用于表征编码蛋白质的多核苷酸的表达，例如，其中“增加的表达”也可以意指“过表达”。

如本文中所使用，术语“可操作地连接”是指两个或更多个核酸序列的缔合，这样使得其中一种核酸序列的功能受到另一种核酸序列的影响。例如，当启动子能够影响编码序列的表达时，它可操作地连接编码序列。即，编码序列处于启动子的转录控制下。例如，编码序列可以与调节序列可操作地连接。而且，例如，crRNA可以与本文中的tracrRNA可操作地连接(融合)，这样使得crRNA的tracrRNA配对序列与tracrRNA的5′序列退火。这样的可操作的连接可以包含合适的形成环的序列，例如GAAA(SEQ ID NO：36)、CAAA(SEQ ID NO：37)或AAAG(SEQ ID NO：38)。而且，例如，RGEN可以与一个或多个CPP可操作地连接(融合)。

如本文中所使用，术语“重组”是指例如通过化学合成或者通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。

用于制备本文中的重组构建体/载体(例如，编码本文中的RNA组分盒的DNA多核苷酸，或编码本文中的Cas蛋白或Cas-CPP融合蛋白的DNA多核苷酸)的方法可以遵循标准重组DNA和分子克隆技术，这些技术是如在以下参考文献中描述的：例如，J.Sambrook和D.Russell(Molecular Cloning：A Laboratory Manual，3rd Edition，Cold SpringHarbor Laboratory Press，Cold Spring Harbor，NY，2001)[J.Sambrook和D.Russell(分子克隆：实验手册，第3版，纽约冷泉港冷泉港实验室出版社，2001)]；T.J.Silhavy等人(Experiments with Gene Fusions，Cold Spring Harbor Laboratory Press，ColdSpring Harbor，NY，1984)[T.J.Silhavy等人(使用基因融合的实验，纽约冷泉港冷泉港实验室出版社，1984)]；以及F.M.Ausubel等人(Short Protocols in Molecular Biology，5th Ed.Current Protocols，John Wiley and Sons，Inc.，NY，2002)[F.M.Ausubel等人(简明分子生物学试验方案，第5版，当前试验方案，纽约州约翰威利父子公司，2002)]。

如本文中所使用，术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中披露了适用于转化的核酸分子的非限制性实例，例如质粒和线性DNA分子。

本文中“转基因植物”包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内，这样使得多核苷酸被传递给连续世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。转基因植物材料可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物，这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法，通过不导致外源多核苷酸的插入的基因组编辑程序，或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的基因组(染色体或染色体外)的改变并不意图被视为转基因。

“表型标记”是可筛选或可选择的标记，其包括视觉标记和可选择标记，无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地，可选择或可筛选的标记包含允许人们通常在特定条件下鉴定或选择含有它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性，例如但不限于RNA、肽或蛋白质的产生，或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

可选择标记的实例包括但不限于包含限制酶位点的DNA区段；编码提供对包括抗生素在内的其他毒性化合物的抗性的产物的DNA区段，该抗生素例如是大观霉素、氨苄青霉素、卡那霉素、四环素、巴斯塔(Basta)、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)；编码另外在受体细胞中缺少的产物的DNA区段(例如，tRNA基因、营养缺陷型标记)；编码可以容易地鉴定的产物的DNA区段(例如，表型标记例如β-半乳糖苷酶、GUS；荧光蛋白，例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白)；产生用于PCR的新引物位点(例如，以前未并列的两个DNA序列的并列)，包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列；并且包含允许其鉴定的特异性修饰(例如，甲基化)所需的DNA序列。

另外的可选择标记包括赋予除草剂化合物(例如草胺磷、溴草腈、咪唑啉酮和2，4-二氯苯氧基乙酸酯(2，4-D))抗性的基因参见例如，Yarranton，(1992)Curr Opin Biotech[生物技术新见]3：506-11；Christopherson等人，(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89：6314-8；Yao等人，(1992)Cell[细胞]71：63-72；Reznikoff，(1992)MolMicrobiol[分子微生物学]6：2419-22；Hu等人，(1987)Cell[细胞]48：555-66；Brown等人，(1987)Cell[细胞]49：603-12；Figge等人，(1988)Cell[细胞]52：713-22；Deuschle等人，(1989)Proc.Natl.Acad.Sci.USA 86：5400-4；Fuerst等人，(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86：2549-53；Deuschle等人，(1990)Science[科学]248：480-3；Gossen，(1993)Ph.D.Thesis，University of Heidelberg[海德堡大学博士论文]；Reines等人，(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90：1917-21；Labow等人，(1990)Mol Cell Biol[分子细胞生物学]10：3343-56；Zambretti等人，(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89：3952-6；Baim等人，(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88：5072-6；Wyborski等人，(1991)Nucleic Acids Res[核酸研究]19：4647-53；Hillen和Wissman，(1989)Topics Mol StrucBiol[热点分子结构生物学]10：143-62；Degenkolb等人，(1991)Antimicrob AgentsChemother[抗微生物剂]35：1591-5；Kleinschnidt等人，(1988)Biochemistry[生物化学]27：1094-104；Bonin，(1993)Ph.D.Thesis，University of Heidelberg[海德堡大学博士论文]；Gossen等人，(1992)Prroc.Natl.Acad.Sci.USA[美国国家科学院院刊]89：5547-51；Oliva等人，(1992)Antimicrob Agents Chemother[抗微生物剂]36：913-9；Hlavka等人，(1985)Handbook of Experimental Pharmacology[实验药理学手册]，Vol.78(Springer-Verlag，Berlin[柏林施普林格出版社])；Gill等人，(1988)Nature[自然]334：721-4。

如本文中所使用，关于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在两个序列中的核酸残基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。如本文中所使用，“序列同一性百分比”或“百分比同一性”是指通过在比较窗口上比较两个最佳比对的序列所确定的值，其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时，该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗口中的位置的总数目，然后将该结果乘以100以产生序列同一性百分比。应当理解的是，当计算DNA序列和RNA序列之间的序列同一性时，DNA序列的T残基与RNA序列的U残基比对，并且可以被认为与其“一致”。出于确定第一和第二多核苷酸的百分比互补性的目的，可以通过确定(i)第一多核苷酸和第二多核苷酸的补体序列之间的百分比同一性(或反之亦然)，例如和/或(ii)将产生规范的沃森和克里克碱基对的第一和第二多核苷酸之间的碱基百分比来获得。

可以使用在美国国家生物技术信息中心(NCBI)网站上在线获得的基本局部比对搜索工具(BLAST)，例如，来测量在两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的百分比同一性。可替代地，使用Clustal算法(例如，ClustalW或ClustalV)可以进行序列之间的百分比同一性比对。对于使用Clustal比对方法的多重比对，默认值可以对应于空位罚分(GAP PENALTY)＝10和空位长度罚分(GAP LENGTHPENALTY)＝10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以是KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对话框(DIAGONALSSAVED)＝5。对于核酸，这些参数可以是KTUPLE＝2、空位罚分＝5、窗口＝4、以及存储的对话框＝4。仍可替代地，序列之间的百分比同一性可以使用BLOSUM矩阵(例如，BLOSUM62)，使用具有参数例如空位开始(GAP OPEN)＝10、空位延伸(GAP EXTEND)＝0.5、最终空位罚分(ENDGAP PENALTY)＝错误(false)、最终空位开始(END GAP OPEN)＝10、最终空位延伸(END GAPEXTEND)＝0.5的EMBOSS算法(例如，needle)来执行。

本文中，与第二序列“互补”的第一序列可替代地可以被称为处于第二序列的“反义”取向。

作为本披露的发明的某些实施例的特征，本文披露了各种多肽氨基酸序列和多核苷酸序列。可以使用与本文披露的序列具有至少约70％-85％、85％-90％、或90％-95％同一性的这些序列的变体。可替代地，变体氨基酸序列或多核苷酸序列可以与本文披露的序列具有至少70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。变体氨基酸序列或多核苷酸序列具有所披露的序列的相同功能/活性，或具有所披露的序列的功能/活性的至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的功能/活性。

在Cas9蛋白的每个氨基酸位置处本文披露的所有氨基酸残基都是实例。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即，保守的)，Cas9中每个位置处的氨基酸可以是如所披露的序列提供的或被如下保守的氨基酸残基取代(“保守的氨基酸取代”)：

1.以下小的脂肪族、非极性或轻微极性的残基可以互相取代：Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G)；

2.以下极性、带负电荷的残基和它们的氨基化合物可以互相取代：Asp(D)、Asn(N)、Glu(E)、Gln(Q)；

3.以下极性、带正电荷的残基可以互相取代：His(H)、Arg(R)、Lys(K)；

4.以下脂肪族、非极性残基可以互相取代：Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M)；并且

5.以下大的芳香族残基可以互相取代：Phe(F)、Tyr(Y)、Trp(W)。

已经取得了在细胞中表达蛋白质和RNA组分以于其中进行RGEN介导的DNA靶向的进展(例如，美国临时申请号61/868，706和62/036，652)。这样的策略通常需要在靶细胞中的重组DNA表达。在细胞中提供蛋白质和RNA组分以介导RGEN介导的DNA靶向的另外的方法是令人感兴趣的。

所披露的发明的实施例涉及包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物，其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接。RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

有意义的是，所披露的发明的某些实施例可以用于将已经与RNA组分缔合(预先缔合)的RGEN递送到细胞中。这样的实施例可以避免将DNA构建体递送到用于表达RGEN RNA组分的细胞中的需要，从而避免将外源DNA引入细胞中的任何潜在的有害影响。然而，所披露的发明是灵活的，因为在某些其他实施例中，可以在正在递送RGEN蛋白-CPP复合物的细胞中提供(例如表达)RNA组分。以这种方式提供的RNA组分可以在RGEN蛋白-CPP复合物递送/进入细胞后与RGEN蛋白组分缔合。不管RNA组分递送的方式如何，本文中的RGEN蛋白-CPP复合物能够与RNA组分缔合，形成可以靶向细胞中特异性DNA序列的RGEN-CPP复合物。因此，所披露的发明提供了在细胞中提供RGEN以执行RGEN介导的DNA靶向的实质性灵活性。

在某些实施例中披露的组合物包含RGEN的至少一种蛋白组分。本文中的RGEN是指包含至少一种Cas蛋白和至少一种RNA组分的复合物。因此，RGEN蛋白组分可能是指Cas蛋白，例如Cas9。合适的Cas蛋白的实例包括I型、II型或III型CRISPR系统的一种或多种Cas内切核酸酶(Bhaya等人，Annu.Rev.Genet.[遗传学年度评论]45：273-297，通过引用结合在此)。例如，I型CRISPR Cas蛋白可以是Cas3或Cas4蛋白。例如，II型CRISPR Cas蛋白可以是Cas9蛋白。例如，III型CRISPR Cas蛋白可以是Cas10蛋白。在某些优选实施例中使用Cas9蛋白。在某些实施例中的Cas蛋白可以是细菌或古细菌蛋白质。例如，本文中的I-III型CRISPRCas蛋白通常起源于原核生物；I型和III型Cas蛋白可以源自于细菌或古细菌物种，而II型Cas蛋白(即Cas9)可以源自于细菌种类。在其他实施例中，合适的Cas蛋白包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4中的一种或多种，其同系物或其修改版本。

在所披露的发明的其他方面，本文中的Cas蛋白可以来自任何以下属：气火菌属(Aeropyrum)、火棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球状菌属(Archaeoglobus)、嗜盐小盒菌属(Haloarcula)、甲烷杆菌属(Methanobacteriumn)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、火球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、Thernioplasnia、棒状杆菌属(Corynebacterium)、分支杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产液菌属(Aquifrx)、卟啉单胞菌属(Porphvromonas)、绿菌属(Chlorobiumm)、Thermus、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、高温厌氧杆菌属(Thermoanaerobacter)、支原菌属(Mycoplasma)、梭形杆菌属(Fusobacterium)、Azarcus、色素杆菌属(Chromobacterium)、奈瑟氏菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、土杆菌属(Geobacter)、Myrococcus、弯曲杆菌属(Campylobacter)、沃林氏菌属(Wolinella)、不动细菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、军团杆菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德氏菌属(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞杆菌属(Xanthomonas)、耶尔森氏菌属(Yersinia)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、弗朗西斯氏菌属(Francisella)、或栖热孢菌属(Thermotoga)。可替代地，本文中的Cas蛋白可以例如由SEQID NO：462-465、467-472、474-477、479-487、489-492、494-497、499-503、505-508、510-516或517-521编码，如披露于美国申请公开号2010/0093617中，其通过引用结合在此。

例如，RGEN蛋白组分可以包含Cas9氨基酸序列。包含这种类型的蛋白组分的RGEN通常可以被表征为具有作为RGEN的内切核酸酶组分的Cas9。本文中Cas9蛋白的氨基酸序列，以及本文中某些其他Cas蛋白，可能源自于，例如，链球菌属(例如化脓性链球菌(S.pyogenes)、肺炎链球菌(S.pneumoniae)、嗜热链球菌(S.thermophilus)、无乳链球菌(S.agalactiae)、副血链球菌(S.parasanguinis)、口腔链球菌(S.oralis)、唾液链球菌(S.salivarius)、猕猴链球菌(S.macacae)、停乳链球菌(S.dysgalactiae)、咽峡炎链球菌(S.anginosus)、星座链球菌(S.constellatus)、假豕链球菌(S.pseudoporcinus)、变异链球菌(S.mutans))、李斯特菌属(Listeria)(例如，无害利斯特菌(L.innocua))、螺原体属(Spiroplasma)(例如，蜂螺旋原体(S.apis)、S.syrphidicola)、消化链球菌科(Peptostreptococcaceae)、奇异菌属(Atopobium)、卟啉单胞菌属(Porphyromonas)(例如，P.catoniae)、普雷沃菌属(Prevotella)(例如，中间普雷沃菌(P.intermedia))、韦荣球菌属(Veillonella)、密螺旋体属(Treponema)(例如，索氏密螺旋体(T.socranskii)、齿垢密螺旋体(T.denticola))、二氧化碳噬细胞菌属(Capnocytophaga)、芬戈尔德菌属(Finegoldia)(例如，大芬戈尔德菌(F.magna))、红蝽菌科(Coriobacteriaceae)(例如，C.bacterium)、Olsenella(例如，O.profusa)、嗜血杆菌属(Haemophilus)(例如，H.sputorum、H.pittmaniae)、巴斯德氏菌属(Pasteurella)(例如，贝氏巴斯德菌(P.bettyae))、Olivibacter(例如，O.sitiensis)、Epilithonimonas(例如，E.tenax)、Mesonia(例如，M.mobilis)、乳杆菌属(Lactobacillus)、芽孢杆菌属(Bacillus(例如，蜡样芽孢杆菌(B.cereus))、Aquimarina(例如，A.muelleri)、金黄杆菌属(Chryseobacterium)(例如，C.palustre)、多形杆状菌属(Bacteroides)(例如，B.graminisolvens)、奈瑟氏菌属(Neisseria)(例如，脑膜炎奈瑟氏菌(N.meningitidis))、弗朗西斯氏菌属(Francisella(例如，新凶手弗朗西斯菌(F.novicida))、或黄杆菌属(Flavobacterium)(例如，寒冷黄杆菌(f.frigidarium)、F.soli物种。本文中，在某些方面优选化脓性链球菌Cas9。作为另一个实例，Cas9蛋白可以是描述于Chylinski等人(RNA Biology[RNA生物学]10：726-737，其通过引用结合在此)中的任何Cas9蛋白。

因此，本文中Cas9蛋白的序列可以包含，例如，在以下各项中披露任何Cas9氨基酸序列：基因库(GenBank)登记号G3ECR1(嗜热链球菌(S.thermophilus))、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(嗜热链球菌)、EGP66723、EGS38969、EGV05092、EHI65578(假豕链球菌)、EIC75614(口腔链球菌)、EID22027(星座链球菌)、EIJ69711、EJP22331(口腔链球菌)、EJP26004(咽峡炎链球菌)、EJP30321、EPZ44001(化脓性链球菌)、EPZ46028(化脓性链球菌)、EQL78043(化脓性链球菌)、EQL78548(化脓性链球菌)、ERL10511、ERL12345、ERL19088(化脓性链球菌)、ESA57807(化脓性链球菌)、ESA59254(化脓性链球菌)、ESU85303(化脓性链球菌)、ETS96804、UC75522、EGR87316(停乳链球菌)、EGS33732、EGV01468(口腔链球菌)、EHJ52063(猕猴链球菌)、EID26207(口腔链球菌)、EID33364、EIG27013(副血链球菌)、EJF37476、EJO19166(链球菌属BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(无乳链球菌)、TS89875、ETS90967(链球菌属SR4)、ETS92439、EUB27844(链球菌属BS21)、AFJ08616、EUC82735(链球菌属CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1、或Q99ZW2(化脓性链球菌)，其通过引用结合。可以使用任何这些Cas9蛋白序列的变体，但是当与本文中的RNA组分缔合时，它们应当具有针对DNA的特异性结合活性和任选地切割或切口活性。这样的变体可以包含与参比Cas9的氨基酸序列具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列。

可替代地，例如，本文中的Cas9蛋白可以由如披露于美国申请公开号2010/0093617中的(通过引用结合在此)SEQ ID NO：462(嗜热链球菌)、474(嗜热链球菌)、489(无乳链球菌)、494(无乳链球菌)、499(变异链球菌)、505(化脓性链球菌)、或518(化脓性链球菌)中的任何一个编码。仍可替代地，本文中的Cas9蛋白可以包含，例如，SEQ ID NO：3的氨基酸序列，或SEQ ID NO：3的残基1-1368、2-1368或2-1379。仍可替代地，Cas9蛋白可以包含例如，与任何前述氨基酸序列具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。当与本文中的RNA组分缔合时，这样的变体Cas9蛋白应当具有针对DNA的特异性结合活性，以及任选地切割或切口活性。

本文中使用的Cas蛋白(例如Cas9)的起源可以是与RNA组分所源自的相同物种，或者其可以来自不同的物种。例如，包含源自于链球菌属物种(例如，化脓性链球菌或嗜热链球菌)的Cas9蛋白的RGEN可以与具有源自于相同的链球菌属物种的序列(例如，crRNA重复序列、tracrRNA序列)的至少一种RNA组分复合。可替代地，本文中使用的Cas蛋白(例如Cas9)的起源可以来自RNA组分所源自的不同物种(Cas蛋白和RNA组分可以彼此异源)；这样的异源Cas/RNA组分RGEN应当具有DNA靶向活性。

确定本文中的Cas蛋白针对特异性靶DNA序列的结合活性和/或内切核酸酶活性可以通过本领域已知的任何合适的测定法(例如在美国专利号8697359(其通过引用披露在此)中披露的)来评估。例如，可以通过在细胞中表达Cas蛋白和合适的RNA组分，然后检查预测的DNA靶位点是否存在插入缺失来进行确定(在该特定测定法中Cas蛋白通常具有完全的内切核酸酶活性[双链切割活性])。例如，在预测的靶位点处检查是否存在改变/修饰(例如，插入缺失)可以经由DNA测序方法进行，或通过测定靶序列的功能丧失来推断改变/修饰形成。在另一个实例中，可以通过在已经提供了包含与靶位点处或附近的序列同源的序列的供体DNA的细胞中表达Cas蛋白和合适的RNA组分来确定Cas蛋白活性。在靶位点处的供体DNA序列的存在(例如将通过供体和靶序列之间成功的HR来预测)将表明靶向发生。在又另一个实例中，可以使用将Cas蛋白和合适的RNA组分与含有合适的靶序列的DNA多核苷酸混合在一起的体外测定来确定Cas蛋白活性。该测定法可以用于检测通过缺乏切割活性的Cas蛋白的结合(例如凝胶转移)或通过具有内切核酸能力的Cas蛋白的切割。

在某些方面，本文中的Cas蛋白例如Cas9可以进一步包含异源核定位序列(NLS)。例如，本文中的异源NLS氨基酸序列可能具有足够的强度来驱动在本文的细胞核中可检测的量的Cas蛋白或Cas蛋白-CPP复合物的积累。NLS可以包含碱性、带正电荷的残基(例如赖氨酸和/或精氨酸)的一个(单份的)或更多个(例如，单份的)短序列(例如，2至20个残基)，并且可以位于Cas氨基酸序列的任何地方，但使得其暴露在蛋白质表面上。例如，NLS可以可操作地连接到本文中的Cas蛋白的N末端或C末端。两个或更多个NLS序列可以连接到Cas蛋白，例如在Cas蛋白的N末端和C末端两者。本文中合适的NLS序列的非限制性实例包括在美国专利号6660830和7309576(例如，其中的表1)中披露的那些，其都通过引用结合在此。本文中有用的NLS的另一个实例包括SEQ ID NO：3的氨基酸残基1373-1379。例如，如本文中披露的Cas蛋白可以与CPP融合(Cas蛋白与CPP共价连接的实例)。应当理解的是，这样的Cas-CPP融合蛋白还可以包含如上所述的NLS。还应当理解的是，在Cas蛋白与靶向不同细胞器(例如线粒体)的氨基酸序列融合的实施例中，这样的Cas蛋白通常不含有NLS。

在某些实施例中，由Cas蛋白引导DNA特异性靶向的Cas蛋白及其各自的RNA组分(例如，crRNA)可以与细胞(特别是非原核细胞)异源。这些RGEN组分的异源性质是由于Cas蛋白及其各自的RNA组分仅被认为存在于原核生物(细菌和古细菌)中。

在一些实施例中，Cas蛋白是包含一个或多个异源蛋白质结构域(例如除Cas蛋白之外的1、2、3或更多个结构域)的融合蛋白的一部分。例如，这些实施例可以涵盖共价连接到CPP和一个或多个另外的异源氨基酸序列的Cas蛋白质。例如，其他实施例可以涵盖与不包括CPP的一种或多种另外的异源氨基酸序列共价连接的Cas蛋白(在这样的实施例中CPP将非共价连接到Cas融合蛋白)。包含Cas蛋白的融合蛋白可以包含任何另外的蛋白质序列，以及任选地在任何两个结构域之间(例如在Cas和第一异源结构域之间)的连接体序列。可以与本文中的Cas蛋白融合的蛋白质结构域的实例包括但不限于表位标签(例如，组氨酸[His，聚组氨酸]、V5、FLAG、流感血球凝集素[HA]、myc、VSV-G、硫氧还蛋白[Trx])；报道子(例如谷胱甘肽-5-转移酶[GST]、辣根过氧化物酶[HRP]、氯霉素乙酰转移酶[CAT]、β-半乳糖苷酶、β-葡萄糖醛酸酶[GUS]、荧光素酶、绿色荧光蛋白[GFP]、HcRed、DsRed、青色荧光蛋白[CFP]、黄色荧光蛋白[YFP]、蓝色荧光蛋白[BFP])；以及具有一个或多个以下活性的结构域：甲基化酶活性、脱甲基酶活性、转录激活活性(例如，VP16或VP64)、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。在其他实施例中的Cas蛋白可能与结合DNA分子或其他分子的蛋白质融合，例如麦芽糖结合蛋白(MBP)、S-标签、Lex ADNA结合结构域(DBD)、GAL4A DNA结合结构域和单纯疱疹病毒(HSV)VP16。可以是包含本文中的Cas蛋白的融合蛋白的一部分的其他结构域披露在美国专利申请公开号2011/0059502中，其通过引用结合在此。在Cas蛋白与异源蛋白(例如转录因子)融合的某些实施例中，Cas蛋白具有DNA识别和结合活性(当与本文中合适的RNA组分复合时)，但没有DNA切口或切割活性。例如，如本文中披露的Cas蛋白可以与CPP融合(Cas蛋白与CPP共价连接的实例)。应当理解的是，必要时，这样的Cas-CPP融合蛋白还可以与一个或多个如上所述的异源结构域融合。

可以连接到本文中的Cas蛋白的异源结构域的其他实例包括将蛋白质靶向到特定细胞器中的氨基酸序列(即定位信号)。可以被靶向的细胞器的实例包括线粒体和叶绿体。通常，当靶向核外DNA位点时，使用这样的靶向结构域而不是NLS。例如，线粒体靶向序列(MTS)可以位于Cas蛋白的N末端或其附近。MTS实例被披露于美国专利申请公开号2007/0011759和2014/0135275中，其通过引用结合在此。例如，叶绿体靶向序列可以是如披露于美国专利申请公开号2010/0192262或2012/0042412中的，其通过引用结合在此。

例如，RGEN的蛋白组分可以与至少一种RNA组分缔合(从而构成完整的RGEN)，所述RNA组分包括与细胞中的染色体或附加体上的靶位点序列互补的序列。在这样的实施例中的RGEN可以结合靶位点序列，并且任选地在靶位点序列处切割一条或两条DNA链。例如，RGEN可以切割DNA靶序列的一条或两条链。在另一个实例中，RGEN可以切割DNA靶序列的两条链。应当理解的是，在所有这些实施例中，RGEN蛋白组分可以与RGEN蛋白-CPP复合物中的至少一种CPP共价或非共价连接。RGEN蛋白-CPP复合物与本文中的RNA组分的缔合可以被表征为形成RGEN-CPP复合物。除非另有说明，本文关于RGEN的任何披露内容同样适用于RGEN-CPP复合物的RGEN组分。

本文中可以切割DNA靶序列的两条链的RGEN通常包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。因此，在Cas蛋白的每个内切核酸酶结构域中保留一些或全部活性的野生型Cas蛋白(例如，本文披露的Cas9蛋白)或其变体是可以切割DNA靶序列的两条链的RGEN的合适实例。包含功能性RuvC和HNH核酸酶结构域的Cas9蛋白是可以切割DNA靶序列的两条链的Cas蛋白的实例。本文中可以切割DNA靶序列的两条链的RGEN通常在相同位置切割两条链，这样使得在切割位点处形成钝端(即，没有核苷酸突出端)。

本文中可以切割DNA靶序列的一条链的RGEN可以在本文中表征为具有切口酶活性(例如，部分切割能力)。本文中的Cas切口酶(例如，Cas9切口酶)通常包含一个功能性内切核酸酶结构域，该结构域允许Cas仅切割DNA靶序列的一条链(即，形成切口)。例如，Cas9切口酶可以包含(i)突变体、功能失调的RuvC结构域和(ii)功能性HNH结构域(例如野生型HNH结构域)。作为另一个实例，Cas9切口酶可以包含(i)功能性RuvC结构域(例如野生型RuvC结构域)和(ii)突变的功能失调的HNH结构域。

适用于本文使用的Cas9切口酶的非限制性实例披露于以下文献中：Gasiunas等人(Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]109：E2579-E2586)、Jinek等人(Science[科学]337：816-821)、Sapranauskas等人(Nucleic Acids Res.[核酸研究]39：9275-9282)以及美国专利申请公开号2014/0189896，其通过引用结合在此。例如，本文中的Cas9切口酶可以包含嗜热链球菌Cas9，该嗜热链球菌Cas9具有Asp-31取代(例如，Asp-31-Ala)(突变的RuvC结构域的实例)，或His-865取代(例如，His-865-Ala)、Asn-882取代(例如，Asn-882-Ala)或Asn-891取代(例如，Asn-891-Ala)(突变的HNH结构域的实例)。而且，例如，本文中的Cas9切口酶可以包含化脓性链球菌Cas9，该化脓性链球菌Cas9具有Asp-10取代(例如，Asp-10-Ala)、Glu-762取代(例如，Glu-762-Ala)或Asp-986取代(例如，Asp-986-Ala)(突变的RuvC结构域的实例)，或His-840取代(例如，His-840-Ala)、Asn-854取代(例如，Asn-854-Ala)或Asn-863取代(例如，Asn-863-Ala)(突变的HNH结构域的实例)。关于化脓性链球菌Cas9，三个RuvC亚结构域通常分别位于氨基酸残基1-59、718-769和909-1098，并且HNH结构域位于氨基酸残基775-908(Nishimasu等人，Cell 156：935-949)。

必要时，本文中的Cas9缺口酶可以用于细胞中的各种目的。例如，Cas9切口酶可以用于在DNA靶位点序列处或其附近用合适的供体多核苷酸刺激HR。由于缺口DNA不是用于NHEJ过程的底物，而是由HR过程所识别的，特异性靶位点处的切口DNA应该使得位点更容易被用合适的供体多核苷酸进行的HR所接受。

作为另一个实例，可以使用一对Cas9切口酶来增加DNA靶向的特异性。一般来说，这可以通过提供两个Cas9切口酶来进行，这两个Cas9切口酶通过与具有不同引导序列的RNA组分缔合，在希望靶向的区域的相反链上在DNA序列附近进行靶向和切口。每个DNA链的这样的附近的切割产生DSB(即，具有单链突出端的DSB)，其然后被识别为NHEJ的底物(导致插入缺失形成)或HR的底物(如果提供，导致与合适的供体多核苷酸重组)。在这些实施例中的每个切口可以，例如，彼此分离至少约5、10、15、20、30、40、50、60、70、80、90、或100(或在5与100之间的任何整数)个碱基。本文中的一个或两个Cas9切口酶蛋白可以用于如上所述的Cas9切口酶对。例如，可以使用具有突变的RuvC结构域但具有功能性HNH结构域的Cas9切口酶(即，Cas9HNH⁺/RuvC^-)(例如，化脓性链球菌Cas9 HNH⁺/RuvC^-)。通过使用本文中的合适的RNA组分(具有将每个切口酶靶向每个特异性DNA位点的引导RNA序列)，将每个Cas9切口酶(例如，Cas9 HNH⁺/RuvC^-)引导到彼此邻近(分离多达100个碱基对)的特定的DNA位点。

在某些实施例中的RGEN可以结合DNA靶位点序列，但不切割在靶位点序列处的任何链。这样的RGEN可以包含其中所有核酸酶结构域都是突变的、功能失调的Cas蛋白。例如，可以结合到DNA靶位点序列但在靶位点序列处不切割任何链的本文的Cas9蛋白可以包含突变的、功能失调的RuvC结构域和突变的、功能失调的HNH结构域。这样的Cas9蛋白的非限制性实例包括上文披露的任何RuvC和HNH核酸酶结构域突变(例如，具有Asp-10取代(例如Asp-10-Ala)和His-840取代(例如His-840-Ala)的化脓性链球菌Cas9)。结合但不切割靶DNA序列的本文中的Cas蛋白可以用于调节基因表达，例如，在该情况下，Cas蛋白可以与转录因子(或其部分)融合(例如抑制子或激活子，例如本文披露的那些中的任一种)。例如，可以将包含具有Asp-10取代(例如Asp-10-Ala)和His-840取代(例如His-840-Ala)的化脓性链球菌Cas9的Cas9融合到VP16或VP64转录激活子结构域。例如，在这样RGEN的RNA组分中使用的引导序列将与在基因启动子或其他调控元件(例如，内含子)中的DNA序列互补。

本文中的RGEN可以结合靶位点序列，并且任选地在染色体、附加体或细胞基因组中的任何其他DNA分子中切割靶位点序列的一条或两条链。鉴于RGEN的RNA组分包含与靶序列的链互补的序列(引导序列)，靶序列的这种识别和结合是特异性的。在某些实施例中的靶位点可以是独特的(即，在受试者基因组中存在靶位点序列的单一出现)。

本文中靶序列的长度可以是至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸；在13-30个核苷酸之间；在17-25个核苷酸之间；或在17-20个核苷酸之间。该长度可以包括或排除PAM序列。而且，本文中的靶序列的链与(crRNA或gRNA的)引导序列具有足够的互补性以便与引导序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM与靶序列相邻，参见下文)。在引导序列与其对应的DNA靶序列的链之间的互补程度为例如至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。例如，本文中的靶位点可以位于编码基因产物(例如，蛋白质或RNA)的序列或非编码序列(例如调节序列或“垃圾”序列)中。

PAM(前间区序列邻近基序)序列可以与靶位点序列相邻。PAM序列是由本文中的RGEN识别的短DNA序列。缔合的PAM和DNA靶序列的前11个核苷酸可能对Cas9/gRNA靶向和切割很重要(Jiang等人，Nat.Biotech.[自然生物技术]31：233-239)。本文中的PAM序列的长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而变化，但通常为例如2、3、4、5、6、7或8个核苷酸长。例如，PAM序列紧邻靶位点序列下游或在其下游2个或3个核苷酸内，该靶位点序列与该靶位点中的链互补，该链反过来与RNA组分引导序列互补。在RGEN是与RNA组分复合的内切核酸活性的Cas9蛋白的本文中的实施例中，Cas9如通过RNA组分指导的结合靶序列，并且紧邻PAM序列上游的第三核苷酸位置的5′处切割两条链。考虑靶位点的以下实例：PAM序列：

5’-NNNNNNNNNNNNNNNNNNNNXGG-3’(SEQ ID NO：43)。

在该实例序列中N可以是A、C、T或G，并且X可以是A、C、T或G(X也可以被称为N_PAM)。在该实例中的PAM序列是XGG(下划线)。合适的Cas9/RNA组分复合物将紧邻双下划线N的5′处切割该靶标。在SEQ ID NO：43中的N串表示例如与本文中的RNA组分中的引导序列具有至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的靶序列(其中DNA靶序列的任何T与RNA引导序列中的任何U匹配)。在该靶序列处(其代表本文中的靶位点)的识别和结合中的Cas9复合物的RNA组分的引导序列将与N串的互补序列退火；在引导序列与靶位点补体之间的互补性百分比为例如至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。如果使用Cas9切口酶来靶向在基因组中的SEQ ID NO：43，切口酶将紧邻双下划线N的5′处或在互补链的相同位置处产生切口，这取决于该切口酶中哪个内切核酸酶结构域功能失调。如果使用没有溶核活性的Cas9(RuvC和HNH结构域两者都是功能失调的)靶向在基因组中的SEQ ID NO：43，那么它将识别并结合靶序列，但不对序列进行任何切割。

鉴于正在使用的RGEN的类型，通常选择本文中的PAM。本文中的PAM序列可以是由包含Cas(例如Cas9)的RGEN识别的PAM序列，该Cas9源自于例如可从其得到Cas的本文披露的任何物种。在某些实施例中，PAM序列可以是由包含Cas9的RGEN所识别的PAM序列，该Cas9源自于化脓性链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus)、无乳链球菌(S.agalactiae)、脑膜炎奈瑟氏球菌(N.meningitidis)、齿垢密螺旋体(T.denticola)或新凶手弗朗西斯菌(F.novicida)。例如，源自于化脓性链球菌的合适的Cas9可以用于靶向具有NGG的PAM序列(SEQ ID NO：44；N可以是A、C、T或G)的基因组序列。作为其他实例，当靶向具有以下PAM序列的DNA序列时，合适的Cas9可以源自于以下物种中的任一种：嗜热链球菌(NNAGAA[SEQ ID NO：45])、无乳链球菌(NGG[SEQ ID NO：44])、NNAGAAW[SEQ ID NO：46，W是A或T]、NGGNG[SEQ ID NO：47])、脑膜炎奈瑟氏菌(NNNNGATT[SEQ ID NO：48])、齿垢密螺旋体(NAAAAC[SEQ ID NO：49])、或新凶手弗朗西斯菌(NG[SEQ ID NO：50])(其中在所有这些具体的PAM序列中的N是A、C、T或G)。可用于本文中的Cas9/PAM的其他实例包括在Shah等人(RNA Biology[RNA生物学]10：891-899)以及Esvelt等人(Nature Methods[自然方法]10：1116-1121)(其通过引用结合在此)中披露的那些。本文中的靶序列的实例遵循SEQ ID NO：43，但是其中‘XGG’PAM被前述PAM中的任一种替代。

本文中的RNA组分可以包含与细胞中的染色体或附加体中的靶位点序列互补的序列。基于该序列互补性，RGEN可以特异性结合靶位点序列，并且任选地切割靶位点序列的一条或两条链。因此，在所披露的发明的某些实施例中，RNA组分的互补序列也可以被称为引导序列或可变靶向结构域。

例如，本文中RNA组分(例如，crRNA或gRNA)的引导序列可以是至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核糖核苷酸长度；在13-30个之间的核糖核苷酸长度；在17-25个之间的核糖核苷酸长度；或在17-20个之间的核糖核苷酸长度。通常，本文中的引导序列与靶DNA序列的链具有足够的互补性以便与靶序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM与靶序列相邻)。在引导序列与其对应的DNA靶序列之间的互补程度为例如至少约90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。可以相应地设计引导序列以将RGEN靶向细胞中的DNA靶序列。

本文中的RNA组分可以包含crRNA，例如，其包含引导序列和重复(tracrRNA配对)序列。引导序列通常位于crRNA的5′末端或其附近(在1、2、3、4、5、6、7、8、9、10或更多个碱基之内)。在crRNA的引导序列的下游是与tracrRNA的5′末端处的序列互补并且可以与其杂交的“重复”或“tracrRNA配对”序列。引导和tracrRNA配对序列可以直接相邻，或者例如被1、2、3、4或更多个碱基分开。tracrRNA配对序列与tracrRNA的5’末端具有例如至少50％、60％、70％、80％、90％、95％、96％、97％、98％、99％或100％序列互补性。通常，互补性程度可以是沿着两个序列中较短者的长度，参比tracrRNA配对序列和tracrRNA序列的5′末端的最佳比对。本文中的tracrRNA配对序列的长度可以是例如至少8、9、10、11、12、13、14、15、16、17或18个核糖核苷酸长度，并且与在tracrRNA的5′末端的相同或相似长度(例如加上或减去1、2、3、4或5个碱基)的序列杂交。本文中的tracrRNA配对序列的合适实例包含SEQ IDNO：51(guuuuuguacucucaagauuua)、SEQ ID NO：52(guuuuuguacucuca)、SEQ ID NO：53(guuuuagagcua)或SEQ ID NO：54(guuuuagagcuag)、或其变体，该变体(i)具有至少约90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的序列同一性并且(ii)可以与tracrRNA的5′-末端序列退火。本文中的crRNA的长度可以是例如，至少约18、20、22、24、26、28、30、32、34、36、38、40、42、44、46或48个核糖核苷酸；或约18-48个核糖核苷酸；或约25-50个核糖核苷酸。

在RGEN中包含II型CRISPR系统的Cas9蛋白的实施例中，tracrRNA可以与crRNA一起包含在内。在5′-至-3′方向，本文中的tracrRNA包含(i)与crRNA的重复区(tracrRNA配对序列)退火的序列和(ii)含茎环的部分。例如，(i)的序列的长度可以与上文所披露的任何tracrRNA配对序列长度相同或类似(例如，加上或减去1、2、3、4或5个碱基)。本文中的tracrRNA的总长度(即序列成分[i]和[ii])可以是例如，至少约30、35、40、45、50、55、60、65、70、75、80、85或90(或在30与90之间的任何整数)个核糖核苷酸。tracrRNA可以进一步包括在3′-末端的1、2、3、4、5或更多个尿嘧啶残基，其可以凭借用转录终止子序列表达tracrRNA而存在。

本文中的tracrRNA可以源自于例如上文所列出的从其可以得到Cas9序列的任何细菌物种。合适的tracrRNA序列的实例包括在美国专利号8697359和Chylinski等人(RNABiology[RNA生物学]10：726-737)(其通过引用结合在此)中披露的那些。本文中优选的tracrRNA可以源自于链球菌属(Streptococcus)物种tracrRNA(例如，化脓性链球菌、嗜热链球菌)。本文中的tracrRNA的其他合适的实例可以包括：

SEQ ID NO：55：

uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc，

SEQ ID NO：56：

uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagug，或

SEQ ID NO：57：

uagcaaguuaaaauaaggcuaguccguuauca，

其源自于化脓性链球菌tracrRNA。本文中的tracrRNA的其他合适的实例可以包括：

SEQ ID NO：58：

uaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa，

SEQ ID NO：59：

ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuua，或

SEQ ID NO：60：

ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu，

其源自于嗜热链球菌tracrRNA。

本文中tracrRNA的又其他实例是这些tracrRNA SEQ ID NO的变体，该变体(i)与其具有至少约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性以及(ii)可以作为tracrRNA起作用(例如，5′-末端序列可以退火到crRNA的tracrRNA配对序列，5′-末端序列下游的序列可以形成一个或多个发夹，变体tracrRNA可以与Cas9蛋白形成复合物)。

本文披露的RGEN的RNA组分(或所述另一种方式，可以与RGEN蛋白组分缔合的RNA组分)可以包含例如引导RNA(gRNA)，该引导RNA包含与tracrRNA可操作地连接或融合的crRNA。在某些优选实施例中，gRNA的crRNA组分在tracrRNA组分的上游(即，这样的gRNA在5′-至-3′方向上包含与tracrRNA可操作地连接的crRNA)。例如，如本文(例如上述实施例)所披露的的任何crRNA和/或tracrRNA(和/或其部分，例如crRNA重复序列、tracrRNA配对序列或tracrRNA 5’-末端序列)可以包含在gRNA中。

本文中的gRNA的crRNA组分的tracrRNA配对序列应当能够与tracrRNA组分的5′-末端退火，从而形成发夹结构。例如，关于在(crRNA组分的)tracrRNA配对序列和(tracrRNA组分的)5′-末端序列之间的长度和百分比互补性的任何上述披露内容可以表征gRNA的crRNA组分和tracrRNA组分。为了促进该退火，crRNA和tracrRNA组分的可操作连接或融合优选包含合适的形成环的核糖核苷酸序列(即，形成环的序列可以将crRNA和tracrRNA组分连接在一起，形成gRNA)。形成RNA环的序列的合适实例包括GAAA(SEQ ID NO：36)、CAAA(SEQID NO：37)和AAAG(SEQ ID NO：38)。然而，也可以使用较长或较短的环序列，如可以是替代性环序列。环序列优选包含核糖核苷酸三联体(例如AAA)和在三联体的任一端的另外的核糖核苷酸(例如C或G)。

本文中的gRNA通过其(crRNA组分的)tracrRNA配对序列和tracrRNA5’-末端序列部分的退火形成发夹(“第一发夹”)。取决于gRNA的tracrRNA组分的序列，一个或多个(例如，1、2、3或4个)另外的发夹结构可以在该第一发夹下游形成。因此，gRNA可以具有例如多达五个发夹结构。在gRNA序列的末端后，gRNA可以进一步包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基，其可以凭借例如用转录终止子序列表达gRNA而存在。取决于终止子序列的选择，这些另外的残基可以是所有U残基，或例如至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的U残基。

可用于所披露的发明的合适的gRNA的非限制性实例可以包括：

SEQ ID NO：61：

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaagauuuaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa，

SEQ ID NO：62：

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa，

SEQ ID NO：63：

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu，

SEQ ID NO：64：

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA aggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc，

SEQ ID NO：65：

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuaucaacuugaaaaagug，

SEQ ID NO：66：

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuauca，或

SEQ ID NO：67：

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。

在SEQ ID NO：61-67的每一个中，单下划线的序列代表gRNA的crRNA部分。每个“N”代表合适的引导序列的核糖核苷酸碱基(A、U、G或C)。小写字母的第一个嵌段代表tracrRNA配对序列。小写字母的第二个嵌段代表gRNA的tracrRNA部分。双下划线的序列近似于与tracrRNA配对序列退火以形成第一发夹的tracrRNA序列的部分。环序列(GAAA，SEQ ID NO：36)以大写字母显示，其可操作地连接每个gRNA的crRNA和tracrRNA部分。本文中的gRNA的其他实例包括前述gRNA的变体，该变体(i)与这些序列具有至少约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性(在这个计算中排除引导序列)，以及(ii)可以作为gRNA起作用，该gRNA特异性靶向Cas9蛋白以与靶DNA序列结合并任选地切口或切割靶DNA序列。

还可以按照具有引导序列(VT结构域)、随后是Cas内切核酸酶识别(CER)结构域来表征本文中的gRNA。CER结构域包含tracrRNA配对序列、随后是tracrRNA序列。可用于本文中的CER结构域的实例包括以上SEQ ID NO：61-67(每个中的CER结构域是VT结构域的N后面的序列)中包含的那些。CER结构域的另一个合适的实例是SEQ ID NO：24(参见实例)，其在5′-至-3′方向上包含SEQ ID NO：53的tracrRNA配对序列、SEQ ID NO：36(GAAA)环形成序列和SEQ ID NO：55的tracrRNA序列。

RGEN的RNA组分任选地不具有5′-帽(7-甲基鸟苷酸[m⁷G]帽)(即，这样的RNA组分在其5′-末端不具有m⁷G帽)。本文中的RNA组分可以具有例如5′-羟基基团而不是5′-帽。可替代地，本文中的RNA组分可以具有例如5′磷酸酯而不是5′-帽。据信，在这些实施例中的RNA组分可以更好地积累在细胞核中(例如在其细胞核内转录之后，或在其RGEN介导的进入细胞核后，取决于本文如何提供RNA组分)，因为5’-带帽的RNA(即具有5′m⁷G帽的RNA)有核输出的倾向。本文中未带帽的RNA组分的优选实例包括合适的gRNA、crRNA和/或tracrRNA。在某些实施例中，由于通过RNA组分的前体的5′-末端处的核酶序列的RNA自动加工(即，包含RNA组分例如gRNA上游的核酶序列的前体RNA经历核酶介导的自动加工以除去核酶序列，从而留下没有5′-帽的下游RNA组分)，本文中的RNA组分缺少5′-帽，并且任选地反而具有5′-羟基基团。在某些其他实施例中，本文中的RNA组分不是通过从RNA聚合酶III(Pol III)启动子的转录产生的。

本文中的细胞穿透肽(CPP)可以为例如约5-30、5-25、5-20、10-30、10-25或10-20个氨基酸残基长度。作为其他实例，CPP可以为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸残基长度。然而，在本文的另外的方面，CPP可以为多达约35、40、45、50、55或60个氨基酸残基长度。

本文披露的CPP可以是例如阳离子性或两亲性的。本文中的阳离子性CPP通常包含至少约60％的带正电荷的氨基酸，例如赖氨酸(K)、精氨酸(R)和/或组氨酸(H)。可替代地，阳离子性CPP可以包含例如至少60％、65％、70％、75％、80％、85％、90％或95％带正电荷的氨基酸(例如，R残基；K残基；K和R残基；K、R和H残基)。在某些实施例中，阳离子性CPP可以被表征为富含精氨酸(例如，包含至少70％或80％R残基)或富含赖氨酸(例如，包含至少70％或80％L残基)。可用于本文中的阳离子性CPP的实例披露于Schmidt等人(FEBS Lett.584：1806-1813)以及Wender等人(polylysine；Proc.Natl.Acad.Sci.USA[聚赖氨酸；美国国家科学院院刊]97：13003-13008)中，其通过引用结合在此。阳离子性CPP的其他实例包括最初源自于HIV Tat蛋白质的GRKKRRQRRR(SEQ ID NO：68)、RKKRRQRRR(SEQ ID NO：69)、或RKKRRQRR(SEQ ID NO：70)，和穿膜肽(RQIKIWFQNRRMKWKK，SEQ ID NO：71)，其最初源自于果蝇属(Drosophila)的触角足突变同源结构域蛋白。

阳离子性CPP的另一个实例包括具有足以指导CPP及其货物(例如，RGEN蛋白组分或RGEN)进入细胞的多个连续精氨酸的聚精氨酸序列。在这样的聚精氨酸序列中的连续精氨酸残基的数目可以是例如至少3、4、5、6、7、8、9、10或10-50个精氨酸。在本文中的某些方面，CPP可以具有6个或更多个连续精氨酸残基(例如6-7、6-8、6-9或6-10个精氨酸残基)。必要时，“PolyR”(GGGGRRRRRRRRRLLLL，SEQ ID NO：15)可以包含在聚精氨酸CPP中。其他聚精氨酸CPP实例包括THRLPRRRRRR(SEQ ID NO：72)或GGRRARRRRRR(SEQ ID NO：73)。在一些实施例中，CPP是可活化的CPP(“ACPP”)(Aguilera等人，Integr Biol.(Camb)1：371-381；通过引用结合在此)。ACPP通常包含经由可切割的连接体连接到匹配聚阴离子(例如九个连续谷氨酸盐)的聚阳离子性CPP(例如九个连续精氨酸)，其将净电荷降低到几乎为零，从而抑制CPP粘附和摄取到细胞中。在切割连接体时，聚阴离子被释放，局部地暴露聚阳离子部分及其固有的粘合性，从而允许CPP细胞进入。本文中另一个实例是聚赖氨酸CPP；任何上述聚精氨酸的实施例(但是其中R被K替代)是本文中聚赖氨酸CPP的实例。

本文中两亲性CPP包含含有交替模式的极性/带电荷残基和非极性疏水残基的氨基酸序列。以下CPP被认为是两亲性的，并且在某些方面是有用的(无论两亲性术语是否完美适用)：包含转运蛋白-10(TP10)肽(例如，AGYLLGKINLKACAACAKKIL，SEQ ID NO：14)的CPP；来自血管内皮钙粘素蛋白的CPP，例如包含pVEC肽(例如，LIILRRRIRKQAHAHSK，SEQ IDNO：74；LLIILRRRIRKQAHAHSK，SEQ ID NO：13)的CPP；来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，例如包含Zebra肽(例如，ECDSELEIKRYKRVRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMC，SEQ ID NO：12)的CPP；包含(KFF)₃K肽(例如，KFFKFFKFFK，SEQ ID NO：75)的CPP；包含MAP肽(KLALKLALKALKAALKLA，SEQ ID NO：76)的CPP；包含RRQRRTSKLMKR(SEQ IDNO：77)的CPP；包含KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO：78)的CPP。本文中适合的其他两亲性CPP包括富含脯氨酸的CPP，例如包含VHLPPP(SEQ ID NO：79)或VRLPPP(SEQID NO：80)的至少3、4、5、6、7或8个重复的那些。

作为其他实例，本文中的CPP可以包含MPG肽(例如，GALFLGFLGAAGSTMGAWSQPKSKRKV，SEQ ID NO：81)；Pep-1肽(例如KETWWETWWTEWSQPKKKRKV，SEQ ID NO：82)；或来自人降钙素蛋白(例如hCT肽(例如，LGTYTQDFNKFHTFPQTAIGVGAP，SEQ ID NO：83；CGNLSTCMLGTYTQDFNK，SEQ ID NO：84))的CPP。本文中的CPP的又其他实例包括披露在Regberg等人(Int.J.Pharm.464：111-116)中的那些，所述文献通过引用结合在此。

可替代地，本文中适合的CPP可以包含例如，与任何本文披露的CPP氨基酸序列具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。这样的变体CPP蛋白应当具有CPP活性，例如介导细胞摄取分子货物(例如，包含一个或多个RGEN蛋白组分[例如Cas9]的氨基酸序列或包含一个或多个与RNA组分缔合的RGEN蛋白组分[例如Cas9]的氨基酸序列)的能力。测试变体CPP的活性能以任何数量的方式进行，例如通过将它与荧光蛋白(例如GFP)共价连接并测量从与CPP-荧光蛋白复合物接触的细胞发射的荧光的程度。

必要时，可以修改本文的CPP，使其甚至能够更加容易地将RGEN蛋白质货物从细胞外部携带到细胞内部。例如，可以将CPP修改为在其N-或C-末端具有脂质基团。合适的脂质基团包括酰基基团，例如硬脂基和肉豆蔻基基团。脂质基团的其他实例是具有8、9、10、11、12、13、14、15、16、17或18个碳的酰基基团。用脂质基团修饰肽的条件披露在例如Regberg等人(Int.J.Pharm.464：111-116)以及Anko等人(Biochim.Biophys.Acta-Biomembranes1818：915-924)中，其通过引用结合在此。

在本文中的某些方面，本文中的RGEN蛋白组分和至少一种CPP可以在RGEN蛋白-CPP复合物中彼此共价连接。例如，RGEN蛋白组分和至少一种CPP可以在单个氨基酸序列中融合在一起(即，RGEN蛋白组分和至少一种CPP可以包含在融合蛋白内)。因此，本文中的共价连接的实例可以经由肽键实现的，在该肽键中RGEN蛋白组分的氨基酸序列与CPP的氨基酸序列融合，这样使得这两个氨基酸序列都包含在单个氨基酸序列中。这样的融合蛋白(或“嵌合蛋白”)可以被表征为本文中的RGEN蛋白-CPP融合物。在RNA组分与RGEN蛋白组分缔合的那些实施例中，这样的融合蛋白可以被表征为RGEN-CPP融合物。

例如，一个或多个CPP可以位于RGEN蛋白-CPP融合物的N-末端或C-末端。可替代地，一个或多个CPP可以位于RGEN蛋白-CPP融合物的N-末端和C-末端两者。仍可替代地，一个或多个CPP可以位于RGEN蛋白-CPP融合物的氨基酸序列内。本文中包含多于一个CPP的实施例可以包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个CPP，或5-10、5-20或10-20个CPP。与RGEN蛋白组分融合的CPP可以相同或不同(例如，2、3、4或更多个不同类型的CPP)。一个或多个CPP可以直接融合到RGEN蛋白的氨基酸序列，和/或可以融合到一个或多个与RGEN蛋白融合的异源结构域(例如，NLS或其他靶向细胞器的序列，例如MTS)。

本文中的CPP和RGEN蛋白组分之间的融合可以是直接的(即，CPP氨基酸序列通过肽键直接连接到RGEN氨基酸序列)。可替代地，在CPP和RGEN蛋白组分之间的融合可以是经由中间氨基酸序列实现(这是间接连接的CPP和RGEN蛋白组分的实例)。中间氨基酸序列的实例包括合适的连接体序列，其包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100个氨基酸残基，例如甘氨酸、丝氨酸、丙氨酸和/或脯氨酸。合适的氨基酸连接体披露在例如美国专利号8828690、8580922和5990275中，其通过引用结合在此。中间氨基酸序列的其他实例可以包含一种或多种其他类型的蛋白质和/或结构域。例如，标记蛋白(例如荧光蛋白，例如本文披露的那些中的任一种)可以包含在中间氨基酸序列中。

包含RGEN蛋白组分和至少一种CPP的共价复合物(例如在融合蛋白中)的组合物可以与本文披露的任何细胞类型一起使用。然而，任选地，该组合物可以与非哺乳动物细胞例如酵母、真菌和植物一起使用，但排除在哺乳动物细胞上的使用。

本文中的RGEN蛋白-CPP融合蛋白的实例可以包含SEQ ID NO：39(Zebra CPP-Cas9-NLS融合蛋白)、40(PolyR CPP-Cas9-NLS融合蛋白)、41(TP10 CPP-Cas9-NLS融合蛋白)、或42(pVEC CPP-Cas9-NLS融合蛋白)。SEQ ID NO：39-42是Cas9-CPP融合蛋白的实例。RGEN蛋白-CPP融合蛋白的其他实例包括与SEQ ID NO：39-42中任一个具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。这样的变体融合蛋白应该具有(i)可以介导融合蛋白的细胞摄取的CPP结构域，和(ii)当与RNA组分缔合时针对DNA具有特异性结合活性以及任选地切割或切口活性的Cas9蛋白。SEQ ID NO：39、40、41和42分别包含Zebra CPP(SEQ ID NO：12)、PolyR CPP(SEQ ID NO：15)、TP10 CPP(SEQ ID NO：14)和pVEC CPP(SEQID NO：13)，其可操作地连接到Cas9(化脓性链球菌)-NLS蛋白(SEQ ID NO：3的残基2-1379)。

在某些实施例中，引导多核苷酸/Cas内切核酸酶系统的蛋白组分可以与CPP融合，其中该CPP包含：

(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，

(ii)具有6个或更多个连续精氨酸残基的CPP，

(iii)转运蛋白-10(TP10)CPP，

(iv)来自血管内皮钙粘素蛋白的CPP，或

(vi)选自下组的CPP，该组由以下各项组成：合成的九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP。

合成的九精氨酸、富含组氨酸的九精氨酸和Pas九精氨酸CPP的实例披露在例如Liu等人(Advanced Studies in Biology[生物学高级研究]5(2)：71-88，HIKARI公司)，其通过引用结合在此。

RGEN蛋白组分和至少一种CPP可以如何共价连接的另一个实例是经由交联(化学交联)。因此，本文中的RGEN蛋白-CPP复合物的实例可以包含与至少一种CPP交联的RGEN蛋白。本文中的交联是指通过一个或多个共价键在化学上连接两个或更多个分子(在这种情况下为RGEN蛋白组分和至少一种CPP)的方法。可以使用本领域已知的任何数量的方法进行交联，例如披露于以下各项中的那些：美国专利申请公开号2011/0190813、美国专利号8642744、以及Bioconjugate Techniques，2nd Edition(G.T.Hermanson，Academic Press，2008)[生物共轭技术(第2版)(G.T.Hermanson，学术出版社，2008)]，其全部都通过引用结合在此。

通常，出于将CPP交联到RGEN蛋白组分上的目的，CPP可以被修饰和/或合成以在其N-末端、C-末端和/或氨基酸侧基上含有合适的蛋白质连接基团。“蛋白质连接基团”是指能够在合适的条件(例如，水性条件)下，自发地或激活后(例如光)与RGEN蛋白组分的可接近的侧链官能团直接反应以产生CPP与RGEN蛋白的共价连接的基团。蛋白质连接基团可以与例如在RGEN蛋白质中的Lys、Cys、Ser、Thr、Tyr、His或Arg氨基酸残基的侧链官能团反应以产生与蛋白质的共价连接。例如，可以使用同源双功能(例如，能够连接胺与胺)或异源双功能(例如，能够连接胺与硫醇)蛋白质连接基团。在某些实施例中，CPP上的蛋白质连接基团也可以与RGEN蛋白质的末端基团(例如N-末端)反应。本文中合适的蛋白质连接基团包括氨基反应性(例如NHS酯或亚氨基酯)、硫醇(巯基)-反应性(例如，马来酰亚胺例如BMOE、BMB或BMH)、羟基反应性、咪唑基反应性、或胍基-反应性基团。示例性蛋白质连接基团包括活性酯(例如氨基反应性NHS酯)和硫醇反应性马来酰亚胺或碘乙酰胺基团。例如，在Bioconjugate Techniques，2nd Edition(G.T.Hermanson，Academic Press，2008)[生物共轭技术(第2版)(G.T.Hermanson，学术出版社，2008)]中描述了本文有用的另外的示例性蛋白质连接基团以及使用它们的方法。

本文中的蛋白质连接基团通常可以在CPP和长度为20个原子或更少的骨架的RGEN蛋白之间产生连接。例如，这样的连接可以是在1和20个原子长度之间，或约1、2、3、4、5、6、8、10、12、14、16、18或20个碳原子长度。在某些实施例中，连接可以是直链、支链、环状或单个原子。在某些情况下，连接体主链的一个、两个、三个、四个或五个或更多个碳原子可以被硫、氮或氧杂原子取代。骨架原子之间的键可以是饱和的或不饱和的(在连接体主链中通常不多于一个、两个或三个不饱和键)。连接体可以包括但不限于低聚(乙二醇)；醚；硫醚；叔胺；或烷基基团，其可以是直链或支链的(例如甲基、乙基、正丙基、异丙基、正丁基、正戊基、叔丁基)。作为其他实例，连接体主链可以包括环状基团，例如芳基、杂环或环烷基基团，其中环状基团的2个或更多个原子(例如2、3或4个原子)包括在主链中。

在某些实施例中，多于一种类型的CPP(例如2、3、4或更多种不同类型的CPP)可以交联至RGEN蛋白组分。当交联时可以使用的一个或多个CPP与RGEN蛋白的比例(摩尔比)可以为例如，至少约1∶1、2∶1、3∶1、4∶1、5∶1、6∶1、7∶1、8∶1、9∶1、10∶1 15∶1、20∶1、30∶1、40∶1或50∶1。在其他方面，与RGEN蛋白交联的CPP的平均数目可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25，或至少5-10、5-15、5-20或5-25。

必要时，RGEN蛋白组分和至少一种CPP可以交联为复合物，该复合物进一步包含一个或多个其他蛋白质/肽/结构域。这样的其他元件可以任选地用于桥接RGEN蛋白组分与CPP，并且可以包含上述任何中间氨基酸序列。

在本文中的某些方面，本文中的RGEN蛋白组分和至少一种CPP可以在RGEN蛋白-CPP复合物中彼此非共价连接。虽然不意图被任何特定的理论或机制束缚，但是考虑了在RGEN蛋白组分和至少一种CPP之间的非共价连接可以归因于静电、范德华力和/或疏水力。在RNA组分与RGEN蛋白组分缔合的那些实施例中，这样的实施例可以被表征为包含在RGEN-CPP复合物中与至少一种CPP非共价连接的RGEN。包含非共价连接的RGEN蛋白组分和CPP的组合物可以任选地被表征为这些组分的混合物。

在某些实施例中，RGEN蛋白组分与至少一种CPP非共价连接，该CPP具有仅由CPP氨基酸序列组成的氨基酸序列。尽管没有任何“非CPP”氨基酸序列，这样的CPP可以任选地包含如本文披露的修饰例如脂质基团。

可替代地，与RGEN蛋白组分非共价连接的CPP可以包含在具有CPP氨基酸序列和一个或多个异源氨基酸序列(非RGEN蛋白序列)的融合蛋白中。在这样的实施例中，异源序列可以是结构域或蛋白质的异源序列(例如，荧光蛋白，例如本文披露的那些中任一种，或上述披露内容中关于Cas融合物所列出的任何结构域/蛋白质)。另一个实例是将二聚化结构域融合到CPP，该二聚化结构域能够结合与RGEN蛋白组分连接或融合的二聚化结构域。

亮氨酸拉链结构域是本文中的二聚化结构域的实例。亮氨酸拉链结构域可以代表已知含有这样的结构域的天然蛋白质的那些(例如转录因子)，或可以合成设计。连接到CPP的亮氨酸拉链结构域可以与RGEN蛋白组分的亮氨酸拉链结构域缔合(“拉在一起”)，从而在非共价复合物中连接CPP和RGEN蛋白组分。用于非共价连接CPP和RGEN蛋白组分的一对亮氨酸拉链结构域可以是相同的(这样的结构域对形成同型二聚体亮氨酸拉链)或不同的(这样的结构域对形成异质二聚体亮氨酸拉链)。亮氨酸拉链结构域的实例包括在美国专利申请公开号2003/0108869和2004/0147721中披露的那些。在某些方面，可以使用来自GCN4转录因子的亮氨酸拉链结构域形成同型二聚体亮氨酸拉链，然而在其他方面，可以分别使用来自fos和jun转录因子的亮氨酸拉链结构域形成异质二聚体亮氨酸拉链。

必要时，RGEN蛋白组分和至少一种CPP的非共价复合物可以进一步包含一个或多个其他蛋白质/肽/结构域。这样的其他元件可以任选地用于桥接RGEN蛋白组分与CPP，并且可以包含上述任何中间氨基酸序列。

在某些实施例中，多于一种类型的CPP(例如2、3、4或更多种不同类型的CPP)可以非共价连接到RGEN蛋白组分。可以用于制备这样的复合物的一个或多个CPP与RGEN蛋白的比率(摩尔比)可以为例如，至少约1∶1、2∶1、3∶1、4∶1、5∶1、6∶1、7∶1、8∶1、9∶1、10∶115∶1、20∶1、30∶1、40∶1或50∶1。在其他方面，与RGEN蛋白非共价连接的CPP的平均数目可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25，或至少5-10、5-15、5-20或5-25。

在某些实施例中，RGEN蛋白组分和至少一种CPP的非共价复合物可以通过在水性介质中将适量的每种组分进行混合(例如，以获得上文所披露的CPP与RGEN蛋白的比率)来制备。例如，合适的水性介质可以包含缓冲溶液例如PBS或无血清培养基，例如DMEM。例如，可以在约4℃至45℃的温度下将混合物孵育约30、60、90或120分钟，以允许形成非共价RGEN蛋白-CPP复合物。能以细胞类型适当的方式将包含复合物的该溶液的合适体积(例如，充分覆盖/浸渍正在处理的细胞的最小体积)应用于细胞。在RNA组分与RGEN蛋白组分缔合的实施例中，RGEN的这样的形成可以包括在将CPP与RGEN蛋白组分一起孵育之前、同时或之后添加RNA组分。

包含RGEN蛋白组分和至少一种CPP的非共价复合物的组合物可以与本文披露的任何细胞类型一起使用。然而，任选地，该组合物可以与非哺乳动物细胞例如酵母、真菌和植物一起使用，但排除在哺乳动物细胞上的使用。

在应用于细胞之前可以存在于组合物中的RGEN蛋白-CPP复合物可以是例如至少约30％、40％、50％、60％、65％、70％、75％、80％、85％、90％、95％、98％或99％纯度。在某些实施例中，这样的纯度可以是以蛋白质为基础的。作为实例，如果复合物的纯度至少为80％，这将意味着组合物中所有蛋白质的至少80％由复合物构成。可替代地，复合物纯度可以不仅考虑以蛋白质为基础的纯度，还可以考虑到其他生物分子(例如脂质、糖类和/或核酸)。作为实例，如果复合物的纯度至少为80％，这将意味着在本文的组合物中所有生物分子的至少80％由复合物构成。在某些实施例中，化合物例如碳水化合物、盐和/或脂质等不影响本文中纯度百分比的测定。关于纯度的所有这些披露内容也可以应用于RGEN-CPP复合物(即，复合物的RGEN蛋白组分与RNA组分缔合)。

本文中的组合物优选是水性的，其中溶解有RGEN蛋白-CPP复合物或RGEN-CPP复合物的溶剂为至少约70wt％、75wt％、80wt％、85wt％、90wt％、95wt％、98wt％或99wt％的水。例如，组合物中复合物的浓度可以为至少约0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0μM、或约0.5至5.0μM、0.5至2.5μM、1.0至5.0μM、1.0至2.5μM、或2.5至5.0μM。应当理解的是，这样的组合物可以是处于液体状态。

在某些实施例中，组合物的pH可以在约4.0至约10.0之间。可替代地，pH可以为约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5或10.0。可以通过添加或掺入合适的缓冲液来调节或控制pH，该缓冲液包括但不限于：HEPES、磷酸盐(例如，PBS)、Tris、Tris-HCl、柠檬酸盐、或其组合。在本文的组合物中的缓冲液浓度可以为例如从0mM至约100mM、或约10mM、20mM或50mM。在某些方面，可以使用HEPES缓冲液(例如，约25mM HEPES，例如25mMHEPES/KOH pH 7.5、200mM KCl、20％甘油、1mM DTT)。

除了RGEN蛋白-CPP复合物或RGEN-CPP复合物之外，本文中的组合物可以任选地包含其他组分。例如，该组合物可以包含一种或多种盐，例如钠盐(例如NaCl、Na₂SO₄)。盐的其他非限制性实例包括具有(i)铝、铵、钡、钙、铬(II或III)、铜(I或II)、铁(II或III)、氢、铅(II)、锂、镁、锰(II或III)、汞(I或II)、钾、银、钠、锶、锡(II或IV)或锌阳离子，以及(ii)乙酸盐、硼酸盐、溴酸盐、溴化物、碳酸盐、氯酸盐、氯化物、亚氯酸盐、铬酸盐、重铬酸盐、磷酸二氢盐、铁氰化物、亚铁氰化物、氟化物、碳酸氢盐、磷酸氢盐、硫酸氢盐、硫化氢、亚硫酸氢盐、氢化物、氢氧化物、次氯酸盐、碘酸盐、碘化物、硝酸盐、氮化物、亚硝酸盐、草酸盐、氧化物、高氯酸盐、高锰酸盐、过氧化物、磷酸盐、磷化物、亚磷酸盐、硅酸盐、锡酸盐、亚锡酸盐、硫酸盐、硫化物、亚硫酸盐、酒石酸盐或硫氰酸盐阴离子的那些。因此，例如，具有上述(i)中的阳离子和上述(ii)中的阴离子的任何盐可以处于本文中的组合物中。例如，盐能以约0.01至约10.00(或在0.01至10.00之间的任何百分之一增量)的wt％存在。

本文中的RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。在RGEN蛋白组分与RNA组分缔合(从而构成完整的RGEN)的那些实施例中，RGEN-CPP复合物类似地具有穿过该细胞膜/细胞壁的能力。在本文的某些方面，RGEN蛋白-CPP复合物或RGEN-CPP复合物可以穿过细胞壁和细胞膜。

本文中的RGEN蛋白-CPP或RGEN-CPP复合物可以任选地穿过包含糖萼(被膜)的细胞壁。这些实施例通常涉及原核细胞(例如细菌)，其中一些细胞可能具有糖萼，取决于物种类型和生长条件。

虽然不意图被任何特定的理论或机制束缚，但是据信本文中的CPP可以经由内吞过程将RGEN蛋白组分递送到细胞中。这样的过程的实例可能包括大胞饮作用、网格蛋白介导的内吞作用、细胞膜穴样内陷/脂质筏介导的内吞作用和/或受体介导的内吞作用机制(例如，清道夫受体介导的摄取、蛋白多糖介导的摄取)。

一旦RGEN蛋白-CPP或RGEN-CPP复合物在细胞内，它可以穿过例如细胞器膜，例如细胞核膜或线粒体膜。在某些实施例中，该能力取决包含有RGEN蛋白的至少一种细胞器靶向序列(例如，NLS、MTS)的存在。但是，在其他实施例中，穿过细胞器膜(例如细胞核膜或线粒体膜)的能力不取决于细胞器靶向序列的存在(即，在这样的实施例中，一个或多个CPP可能负责允许RGEN穿过细胞器例如细胞核或线粒体)。

本文中的细胞可以是哺乳动物细胞或非哺乳动物细胞，其中在某些优选实施例中使用后者。在某些其他方面，本文中的细胞可以如它(i)在生物体/体内组织中，(ii)在离体的组织或细胞组内，或(iii)处于体外状态中存在的。

本文中的微生物细胞可以是以分离状态(例如，体外细胞、培养细胞)或非分离状态原样存在。

在某些实施例中，微生物细胞是真菌细胞，例如酵母细胞。在某些方面，本文中的酵母可以是无性生殖(无性型)或有性(有性型)的酵母。虽然本文中的酵母通常以单细胞形式存在，但是某些类型的这些酵母可任选地能够形成假菌丝(连接的芽殖细胞的串)。在又另外的方面，酵母可以是单倍体或二倍体，和/或可以具有以这些倍性形式中的任一者存在的能力。

酵母的实例包括常规酵母和非常规酵母。在某些实施例中，常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。本文中常规酵母的实例包括以下属的物种：酵母属(Saccharomyces)(例如，酿酒酵母(S.cerevisiae)，其也被称为芽殖酵母、烘焙酵母、和/或啤酒酵母；贝酵母(S.bayanus)；布拉酵母(S.boulardii)；S.bulderi；S.cariocanus；S.cariocus；薛瓦酵母(S.chevalieri)；S.dairenensis；葡萄酒酵母(S.ellipsoideus)；真贝酵母(S.eubayanus)；少孢酵母(S.exiguus)；S.florentinus；克鲁弗酵母(S.kluyveri)；S.martiniae；S.monacensis；S.norbensis；奇异酵母(S.paradoxus)；巴氏酵母(S.pastorianus)；S.spencerorum；S.turicensis；单孢酵母(S.unisporus)；葡萄汁酵母(S..uvarum)；S.zonatus)以及裂殖酵母属(Schizosaccharomyces)(例如，粟酒裂殖酵母(S.pombe)，其也被称为裂殖酵母；S.cryophilus；S.japonicus；八孢裂殖酵母(S.octosporus))。

本文中的非常规酵母不是常规酵母，例如酵母属(例如酿酒酵母)或裂殖酵母属(例如粟酒裂殖酵母)物种。在某些实施例中，非常规酵母可以是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。常规酵母例如酿酒酵母和粟酒裂殖酵母通常表现出具有短侧翼同源臂(30-50bp)的供体DNA的特异性整合，其效率通常超过70％，而非常规酵母例如巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichia stipitis)、多形汉逊酵母(Hansenula polymorpha)、解脂耶氏酵母(Yarrowia lipolytica)和乳酸克鲁维酵母(Kluyveromyces lactis)通常以低于1％的效率显示与类似结构的供体DNA的特异性整合(Chen等人，PLoS ONE 8：e57952)。因此，可以测量HR过程的偏好，例如通过用合适的供体DNA转化酵母并确定其与预测被供体DNA靶向的基因组位点的特异性重组的程度。例如，如果这样的测定产生供体DNA在酵母基因组中的高度随机整合，则证明偏好NHEJ(或低的HR偏好)。用于确定DNA在酵母中的特异性(HR介导的)和/或随机(NHEJ介导的)整合的比率的测定是本领域已知的(例如，Ferreira和Cooper，Genes Dev.[基因与发育]18：2249-2254；Corrigan等人，PLoS ONE 8：e69628；Weaver等人，Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]78：6354-6358；Keeney和Boeke，Genetics[遗传学]136：849-856)。

鉴于其低水平的HR活性，本文中的非常规酵母可以(i)表现出具有30-50bp侧翼同源臂的合适供体DNA的例如小于约1％、2％、3％、4％、5％，、6％、7％或8％的特异性靶向率，和/或(ii)表现出前述供体DNA的例如大于约65％、66％、67％、68％、69％、70％、71％、72％、73％、74％或75％的随机整合率。合适的供体DNA的这些(i)特异性靶向率和/或(ii)随机整合率可以表征非常规酵母，因为其在提供如本文所披露的RGEN之前存在。在某些实施例中向非常规酵母提供RGEN的目的是产生位点特异性DNA单链断裂(SSB)或双链断裂(DSB)，用于使酵母偏向特异性位点的HR。因此，在非常规酵母中提供合适的RGEN通常应当允许酵母表现出与特定供体DNA的HR的增加比率。这样的增加比率可以比在合适的对照(例如，用相同的供体DNA转化的相同的非常规酵母，但缺少合适的RGEN)中的HR的比率高至少约2-、3-、4-、5-、6-、7-、8-、9-或10-倍。

本文中的非常规酵母可以按照本领域已知的任何手段进行培养，这些手段是例如在以下文献中所描述的：Non-Conventional Yeasts in Genetics，Biochemistry and Biotechnology：Practical Protocols(K.Wolf，K.D.Breunig，G.Barth，Eds.，Springer-Verlag，Berlin，Germany，2003)[遗传学、生物化学和生物技术中的非常规酵母：实践方案(K.Wolf、K.D.Breunig、G.Barth，编辑，德国柏林施普林格出版社，2003)]，Yeasts in Natural and Artificial Habitats(J.F.T.Spencer，D.M.Spencer，Eds.，Springer-Verlag，Berlin，Germany，1997)[在天然和人工栖息地的酵母(J.F.T.Spencer、D.M.Spencer，编辑，德国柏林施普林格出版社，1997)]和/或Yeast Biotechnology： Diversity and Applications(T.Satyanarayana，G.Kunze，Eds.，Springer，2009)[酵母生物技术：多样性与应用(T.Satyanarayana、G.Kunze，编辑，施普林格出版社，2009)]，其全部通过引用结合在此。

本文中的非常规酵母的非限制性实例包括以下属的酵母：耶氏酵母属(Yarrowia)、毕赤酵母属(Pichia)、许旺酵母属(Schwanniomyces)、克鲁维酵母属(Kluyveromyces)、Arxula、毛孢子菌属(Trichosporon)、假丝酵母属(Candida)、黑粉菌属(Ustilago)、球拟酵母属(Torulopsis)、接合酵母属(Zygosaccharomyces)、三角酵母属(Trigonopsis)、隐球菌属(Cryptococcus)、红酵母属(Rhodotorula)、法夫酵母属(Phaffia)、掷孢酵母属(Sporobolomyces)、管囊酵母属(Pachysolen)、和小丛梗孢属(Moniliella)。耶氏酵母属(Yarrowia)物种的合适的实例是解脂耶氏酵母(Y.lipolytica)。毕赤酵母属(Pichia)物种的合适的实例包括巴斯德毕赤酵母(P.pastoris)、甲醇毕赤酵母(P.methanolica)、树干毕赤酵母(P.stipitis)、异常毕赤酵母(P.anomala)和安格斯毕赤酵母(P.angusta)。许旺酵母属(Schwanniomyces)物种的合适的实例包括S.castellii、S.alluvius、S.hominis、S.occidentalis、S.capriottii、S.etchellsii、多形许旺酵母(S.polymorphus)、假多形许旺酵母(S.pseudopolymorphus)、S.vanrijiae和S.yamadae。克鲁维酵母属(Kluyveromyces)物种的合适的实例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆弱克鲁维酵母(K.fragilis)、K.drosophilarum、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、K.vanudenii、K.waltii、非洲克鲁维酵母(K.africanus)和多孔克鲁维酵母(K.polysporus)。Arxula物种的合适的实例包括A.adeninivorans和A.terrestre。毛孢子菌属(Trichosporon)物种的合适的实例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capitatum)、墨汁丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适的实例包括白念珠菌(C.albicans)、C.ascalaphidarum、C.amphixiae、南极洲假丝酵母(C.antarctica)、蜂生假丝酵母(C.apicola)、C.argentea、大西洋假丝酵母(C.atlantica)、大气假丝酵母(C.atmosphaerica)、C.blattae、C.bromeliacearum、C.carpophila、C.carvajalis、C.cerambycidarum、C.chauliodes、C.corydali、C.dosseyi、杜氏假丝酵母(C.dubliniensis)、C.ergatensis、果实假丝酵母(C.fructus)、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙念珠菌(C.guilliermondii)、希木龙假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中间假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、海洋假丝酵母(C.marina)、膜醭假丝酵母(C.membranifaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、C.oleophila、C.oregonensis、近平滑念珠菌(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶念珠菌(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.shehatea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带念珠菌(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、C.sojae、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和C.zemplinina。黑粉菌属(Ustilago)物种的合适的实例包括燕麦散黑粉菌(U.avenae)、茭白黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉蜀黍黑粉菌(U.maydis)、裸黑粉(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适的实例包括T.geochares、T.azyma、光滑球拟酵母(T.glabrata)和白色球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适的实例包括拜耳接合酵母(Z.bailii)、双孢接合酵母(Z.bisporus)、Z.cidri、发酵型结合酵母(Z.fermentati)、Z.florentinus、Z.kombuchaensis、Z.lentus、Z.mellis、Z.microellipsoides、Z.mrakii、Z.pseudorouxii和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适的实例包括变异三角酵母(T.variabilis)。隐球菌属(Cryptococcus)物种的合适的实例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球菌(C.neoformans)、格特隐球菌(C.gattii)、单咽隐球菌(C.uniguttulatus)、C.adeliensis、C.aerius、C.albidosimilis、C.antarcticus、C.aquaticus、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球菌(C.curvatus)、C.phenolicus、C.skinneri、地生隐球酵母(C.terreus)和C.vishniacci。红酵母属(Rhodotorula)物种的合适的实例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、北美红酵母(R.americana)、R.araucariae、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、R.auriculariae、高产酵母菌株(R.bacarum)、海洋红酵母(R.benthica)、R.biourgei、R.bogoriensis、支气管红酵母(R.bronchialis)、R.buffonii、R.calyptogenae、R.chungnamensis、R.cladiensis、珊瑚藻红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、分流红酵母(R.diffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、R.fujisanensis、R.futronensis、胶状红酵母(R.gelatinosa)、冰河红酵母(R.glacialis)、粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、牧草红酵母(R.graminis)、R.grinbergsii、R.himalayensis、R.hinnulea、落组织红酵母(R.histolytica)、袋唇兰红酵母(R.hylophila)、肉色红酵母(R.incarnata)、R.ingeniosa、R.javanica、R.koishikawensis、R.lactosa、R.lamellibrachiae、喉小囊红酵母(R.laryngis)、嗜木红酵母(R.lignophila)、R.lini、R.longissima、R.ludwigii、R.lysinophila、海洋红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、粘质红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、稻红酵母(R.oryzae)、太平洋红酵母(R.pacifica)、浅红酵母(R.pallida)、R.peneaus、R.philyla、R.phylloplana、R.pilatii、果蝇红酵母(R.pilimanae)、R.pinicola、褶皱红酵母(R.plicata)、多形红酵母(R.polymorpha)、R.psychrophenolica、嗜冷红酵母(R.psychrophila)、R.pustula、R.retinophila、R.rosacea、R.rosulata、发红红酵母(R.rubefaciens)、R.rubella、变红红酵母(R.rubescens)、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、血红色红酵母(R.sanguinea)、R.sanniei、R.sartoryi、R.silvestris、R.simplex、R.sinensis、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、土地红酵母(R.terrea)、R.texensis、东京红酵母(R.tokyoensis)、R.ulzamae、香草红酵母(R.vanillica)、R.vuilleminii、欧蓍草红酵母(R.yarrowii)、R.yunnanensis和R.zsoltii。法夫酵母属(Phaffia)物种的合适的实例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适的实例包括S.alborubescens、S.bannaensis、北京掷孢酵母(S.beijingensis)、S.bischofiae、S.clavatus、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、S.elongatus、S.gracilis、S.inositophilus、S.johnsonii、S.koalae、S.magnisporus、S.novozealandicus、香掷孢酵母(S.odorus)、S.patagonicus、长生蜿掷孢酵母(S.productus)、玫瑰掷孢酵母(S.roseus)、(S.sasicola)、S.shibatanus、S.singularis、(S.subbrunneus)、匀称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、S.tsugae、克桑托斯掷孢酵母(S.xanthus)和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)和小丛梗孢属(Moniliella)物种的合适的实例分别包括嗜鞣管囊酵母(P.tannophilus)和丛梗孢酵母(M.pollinis)。本文中的非常规酵母的其他实例还包括Pseudozyma属物种(例如，S.antarctica)、Thodotorula属物种(例如，T.bogoriensis)、Wickerhamiella属物种(例如，W.domercqiae)、和Starmerella属物种(例如，S.bombicola)。

在本文披露的某些实施例中，解脂耶氏酵母(Yarrowia lipolytica)是优选的。

合适的解脂耶氏酵母的实例包括可获得自美国典型培养物保藏中心(AmericanType Culture Collection)(ATCC，弗吉尼亚州马纳萨斯市)的以下分离株：菌株名称ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。

本文中的真菌细胞可以是酵母(例如，如上所述)或任何其他真菌类型例如丝状真菌。例如，本文中的真菌可以是担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)。本文中的丝状真菌的实例包括以下属的那些：木霉属(Trichoderma)；金孢子菌属(Chrysosporium)；梭孢壳属(Thielavia)；脉孢菌属(Neurospora)(例如，粗糙脉孢菌(N.crassa)、好食脉孢霉(N.sitophila))；丛赤壳属(Cryphonectria)(例如，栗丛赤壳菌(C.parasitica))；短梗霉属(Aureobasidium)(例如，出芽短梗霉菌(A.pullulans))；黑粉酵母属(Filibasidium)；瘤胃壶菌属(Piromyces)；隐球菌属(Cryplococcus)；支顶孢属(Acremonium)；弯颈霉属(Tolypocladium)；柱顶孢霉(Scytalidium)；裂褶菌属(Schizophyllum)；侧孢霉属(Sporotrichum)；青霉属(Penicillium)(例如，P.bilaiae、沙门柏干酪青霉(P.camemberti)、白青霉(P.candidum)、产黄青霉(P.chrysogenum)、扩展青霉(P.expansum)、绳状青霉(P.funiculosum)、灰绿青霉(P.glaucum)、马尔尼菲青霉(P.marneffei)、娄地青霉(P.roqueforti)、疣孢青霉(P.verrucosum)、鲜绿青霉(P.viridicatum))；赤霉菌属(Gibberella)(例如，G.acuminata、燕麦赤霉菌(G.avenacea)、G.baccata、G.circinata、G.cyanogena、藤仓赤霉(G.fujikuroi)、错综赤霉(G.intricans)、虱状赤霉(G.pulicaris)、G.stilboides、G.tricincta、玉米赤霉(G.zeae))；毁丝霉属(Myceliophthora)；毛霉属(Mucor)(例如，鲁西氏毛霉菌(M.rouxii)、卷枝毛霉(M.circinelloides)；曲霉属(Aspergillus)(例如，黑曲霉(A.niger)、米曲霉(A.oryzae)、构巢曲霉(A.nidulans)、黄曲霉(A.flavus)、A.lentulus、土曲霉(A.terreus)、棒曲霉(A.clavatus)、烟曲霉(A.fumigatus))；镰刀菌属(Fusarium)(例如，禾谷镰刀菌(F.graminearum)、尖孢镰刀菌(F.oxysporum)、F.bubigenum、腐皮镰刀菌(F.solani)、尖孢镰刀菌(F.oxysporum)、轮枝镰刀菌(F.verticillioides)、层生镰刀菌(F.proliferatum)、镶片镰刀菌(F.venenatum))；以及腐质霉属(Humicola)，及其无性型和有性型。必要时，可以通过Barnett和Hunter(Illustrated Genera of Imperfect Fungi，3rd Edition，Burgess PublishingCompany，1972[不完全真菌的示例性属(第3版)，伯吉斯出版公司，1972)]中披露通过形态来定义本文中的真菌的属和物种。在某些实施例中，真菌可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。

在某些方面，本文中的木霉属(Trichoderma)物种包括侵占木霉(T.aggressivum)、亚马逊木霉(T.amazonicum)、棘孢木霉(T.asperellum)、深绿木霉(T.atroviride)、黄绿木霉(T.aureoviride)、T.austrokoningii、T.brevicompactum、T.candidum、加勒比木霉(T.caribbaeum)、T.catoptron、T.cremeum、T.ceramicum、T.cerinum、T.chlorosporum、T.chromospermum、T.cinnamomeum、桔绿木霉(T.citrinoviride)、T.crassum、T.cremeum、T.dingleyeae、T.dorotheae、T.effusum、T.erinaceum、T.estonicum、可育木霉(T.fertile)、凝胶状木霉(T.gelatinosus)、T.ghanense、钩状木霉(T.hamatum)、哈茨木霉(T.harzianum)、T.helicum、T.intricatum、康长木霉(T.konilangbra)、康氏木霉(T.koningii)、T.koningiopsis、长柄木霉(T.longibrachiatum)、T.longipile、T.minutisporum、T.oblongisporum、T.ovalisporum、T.petersenii、T.phyllostahydis、T.piluliferum、侧耳木霉(T.pleuroticola)、T.pleurotum、多孢木霉(T.polysporum)、拟康氏木霉(T.pseudokoningii)、T.pubescens、里氏木霉(T.reesei)、T.rogersonii、T.rossicum、T.saturnisporum、T.sinensis、T.sinuosum、螺旋木霉(T.spirale)、T.stramineum、T.strigosum、T.stromaticum、T.surrotundum、台湾木霉(T.taiwanense)、泰国木霉(T.thailandicum)、T.thelephoricolum、T.theobromicola、T.tomentosum、T.velutinum、绿木霉(T.virens)、绿色木霉(T.viride)和淡绿色木霉(T.viridescens)。可以如在例如Trichoderma：Biology and Applications(P.K.Mukherjee等人，Eds.，CABI，Oxfordshire，UK，2013)[木霉属：生物学与应用(P.K.Mukherjee等人，编辑，英国牛津郡CABI)，2013](其通过引用结合在此)中所述的培养和/或操作本文中的木霉属物种。

在某些实施例中，微生物细胞是藻类细胞。例如，藻类细胞可以来自以下各项中的任一种：绿藻门(Chlorophyta)(绿藻)、红藻门(Rhodophyta)(红藻)、褐藻纲(Phaeophyceae)(褐藻)、硅藻纲(Bacillariophycaeae)(硅藻类)和涡鞭藻(Dinoflagellata)(鞭毛藻类)。在其他方面，藻类细胞可以是微藻类(例如，浮游植物、微小植物、或浮游藻类)或大型藻类(巨藻、海草)。作为另外的实例，本文中的藻类细胞可以是紫菜属(Porphyra)(紫菜)；第三腕板属(Palmaria)物种例如掌叶树(P.palmata)(掌状红皮藻)；节旋藻属(Arthrospira)物种例如钝顶节旋藻(A.platensis)(螺旋藻属(spirulina))、小球藻属(Chlorella)(例如，原始小球藻(C.protothecoides))；角叉菜属(Chondrus)物种例如皱波角叉菜(C.crispus)(爱尔兰藓)；丝囊藻属(Aphanizomenon)；马尾藻属(Sargassum)；Cochayuyo；葡萄藻属(Botryococcus)(例如，布朗葡萄藻(B.braunii))；杜氏藻属(Dunaliella)(例如，盐生杜氏藻(D.tertiolecta))；江蓠属(Gracilaria)；Pleurochrysis(例如，P.carterae)；纤维藻属(Ankistrodesmus)；小环藻属(Cyclotella)；菱板藻属(Hantzschia)；微球藻属(Nannochloris)；微拟球藻属(Nannochloropsis)；菱形藻属(Nitzschia)；褐指藻属(Phaeodactylum)(例如，三角褐指藻(P.tricornutum))；栅列藻属(Scenedesmus)；裂丝藻属(Stichococcus)；扁藻属(Tetraselmis)(例如，T.suecica)；海链藻属(Thalassiosira)(例如，假微型海链藻(T.pseudonana))；隐甲藻属(Crypthecodinium)(例如，寇氏隐甲藻(C.cohnii))；新绿藻属(Neochloris)(例如，富油新绿藻(N.oleoabundans))；或Schiochytrium。可以如例如在Thompson(Algal Cell Culture.Encyclopedia of Life Support System(EOLSS)， Biotechnology Vol 1[藻类细胞培养，生命支持系统百笠全书(EOLSS)，生物技术第1卷]，可获自eolss.net/sample-chapters internet site)(其通过引用结合在此)中所述来培养和/或操作藻类物种。

在一个实施例中，该方法包括将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法，所述方法包括：使微生物细胞与包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，由此进入微生物细胞。可用于本文所述方法和组合物的微生物细胞包括选自以下各项的细胞：疫霉属(Phytophthora)物种例如辣椒疫霉菌(Phytophtora capsici)(Lamour等人，2012.The oomycete broad-host-rangepathogenPhytophthora capsici.Mol.Plant Pathol.May 13(4)：329-337[卵菌纲广谱宿主围病原体辣椒疫霉菌，分子植物病理学，5月，13(4)：329-337])，Zymoseptoria物种例如小麦壳针孢(Septoria tritici)(Testa等人2015.Overview of genomic andbioinformatics resources for Zymoseptoria tritici.Fungal Genet.Biol.Jun.79：13-16[Zymoseptoria tritici.的基因组和生物信息学资源概述，真菌遗传与生物学，6月，79：13-16])以及葡萄孢属(Botrytis)物种例如灰葡萄孢菌(Botrytis cinerea)(HahnM.2014.The rising threat of fungicide resistance in plant pathogenic fungi：Botrytis as a case study.J.Chem.Biol 7：133-141[杀虫剂抗性在植物致病真菌中的威胁日益增加：以葡萄孢属为例，生物化学杂志，7：133-141])。

本文中的原生生物细胞可以选自例如，纤毛纲(Ciliata)(例如四膜虫属、草履虫属、豆形虫属、肾形虫属、瞬膜虫属(Glaucoma)、匙口虫属(Platyophrya)、钟虫属、波托虫属(Potomacus)、伪康纤虫属(Pseudocohnilembus)、游仆虫属(Euplotes)、Engelmaniella和Stylonichia)；亚门鞭毛纲(Mastigophora)(鞭毛虫)；植鞭毛纲(Phytomastigophorea)(例如眼虫属(Euglena)、变胞藻属(Astasia)、红球藻属(Haematococcus)和隐甲藻属(Crypthecodinium))；动鞭毛虫纲(Zoomastigophorea)；亚纲根足亚纲(Rhizopoda)、叶足纲(Lobosea)(例如，变形虫属(Amoeba))和真胶丝菌纲(Eumycetozoea)(例如网柄菌属(Dictyostelium)和绒胞菌属(Physarum))。可以如例如在 Protistology Culture Guide：tips and techniques for propagating protozoa and algae[ 原生生物学培养指南：繁殖原生动物和藻类的技巧和技术](2013，可获自美国典型培养物保藏中心互联网网站)(其通过引用结合在此)中所述的来培养和/或操作本文中的某些原生生物物种。在某些实施例中，原生生物可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。

在某些实施例中，细菌细胞可以是球菌、杆菌、螺旋体、原生质球、原生质体等形式的细菌细胞。细菌的其他非限制性实例包括革兰氏阴性和革兰氏阳性的细菌。细菌的另外其他非限制性实例包括以下属中的那些：沙门氏菌属(Salmonella)(例如，伤寒沙门氏菌(S.typhi)、肠炎沙门氏菌(S.enteritidis))、志贺氏菌属(Shigella)(例如，痢疾志贺氏菌(S.dysenteriae))、埃希氏菌属(Escherichia)(例如，大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、沙雷氏菌属(Serratia)、变形杆菌属(Proteus)、耶尔森氏菌属(Yersinia)、柠檬酸杆菌属(Citrobacter)、爱德华菌属(Edwardsiella)、普罗维登斯菌属(Providencia)、克雷伯氏菌属(Klebsiella)、哈夫尼菌属(Hafnia)、爱文菌属(Ewingella)、克吕沃氏菌属(Kluyvera)、摩根氏菌属(Morganella)、动性球菌属(Planococcus)、口腔球菌属(Stomatococcus)、微球菌属(Micrococcus)、葡萄球菌属(Staphylococcus)(例如，金黄色葡萄球菌(S.aureus)、表皮葡萄球菌(S.epidermidis))、弧菌属(Vibrio)(例如，霍乱弧菌(V.cholerae))、气单胞菌属(Aeromonas)、Plessiomonas、嗜血杆菌属(Haemophilus)(例如，流感嗜血杆菌(H.influenzae))、放线杆菌属(Actinobacillus)、巴斯德氏菌属(Pasteurella)、支原菌属(Mycoplasma)(例如，肺炎支原体(M.pneumonia))、脲原体属(Ureaplasma)、立克次氏体(Rickettsia)、考克斯氏体属(Coxiella)、罗克利马体属(Rochalimaea)、埃利希氏体属(Ehrlichia)、链球菌属(Streptococcus)(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、肺炎链球菌(S.pneumoniae))、肠球菌属(Enterococcus)(例如，粪肠球菌(E.faecalis))、气球菌属(Aerococcus)、兼性双球菌属(Gemella)、乳球菌属(Lactococcus)(例如，乳酸乳球菌(L.lactis))、明串珠菌属(Leuconostoc(例如，肠膜明串珠菌(L.mesenteroides))、片球菌属(Pedicoccus)、芽孢杆菌属(Bacillus)(例如，蜡样芽孢杆菌(B.cereus)、枯草芽孢杆菌(B.subtilis)、苏云金芽孢杆菌(B.thuringiensis))、棒状杆菌属(Corynebacterium)(例如，白喉棒状杆菌(C.diphtheriae))、隐秘杆菌属(Arcanobacterium)、放线菌属(Actinomyces)、红球菌属(Rhodococcus)、李斯特菌属(Listeria)(例如，单核细胞增生李斯特菌(L.monocytogenes))、丹毒杆菌属(Erysipelothrix)、加德纳菌属(Gardnerella)、奈瑟氏菌属(Neisseria)(例如，脑膜炎奈瑟氏菌(N.meningitidis)、淋病奈瑟氏菌(N.gonorrhoeae))、弯曲杆菌属(Campylobacter)、弓形菌属(Arcobacter)、沃林氏菌属(Wolinella)、缠绕杆菌属(Helicobacter)(例如，幽门螺杆菌(H.pylori))、无色杆菌属(Achromobacter)、不动细菌属(Acinetobacter)、土壤杆菌(Agrobacterium)(例如，根癌土壤杆菌(A.tumefaciens))、产碱杆菌属(Alcaligenes)、华丽单胞菌属(Chryseomonas)、丛毛单胞菌属(Comamonas)、埃肯菌属(Eikenella)、黄色单胞菌(Flavimonas)、黄杆菌属(Flavobacterium)、摩拉克氏菌属(Moraxella)、寡源杆菌属(Oligella)、假单胞菌属(Pseudomonas)(例如，铜绿假单胞菌(P.aeruginosa))、希瓦氏菌属(Shewanella)、威克氏菌(Weeksella)、考单胞杆菌属(Xanthomonas)、博德特氏菌(Bordetella)、Franciesella、布氏杆菌属(Brucella)、军团杆菌属(Legionella)、阿菲波菌属(Afipia)、巴尔通氏体属(Bartonella)、荚膜菌属(Calymmatobacterium)、心杆菌属(Cardiobacterium)、链杆菌属(Streptobacillus)、螺旋状菌属(Spirillum)、消化链球菌属(Peptostreptococcus)、消化球菌(Peptococcus)、Sarcinia、粪球菌属(Coprococcus)、瘤胃球菌属(Ruminococcus)、丙酸杆菌属(Propionibacterium)、动弯杆菌属(Mobiluncus)、双歧杆菌属(Bifidobacterium)、真细菌属(Eubacterium)、乳杆菌属(Lactobacillus)(例如，乳酸乳杆菌(L.lactis)、嗜酸乳杆菌(L.acidophilus))、罗思氏菌属(Rothia)、梭菌属(Clostridium)(例如，肉毒梭菌(C.botulinum)、产气荚膜梭菌(C.perfringens))、多形杆状菌属(Bacteroides)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、梭形杆菌属(Fusobacterium)、嗜胆菌属(Bilophila)、纤毛菌属(Leptotrichia)、沃林氏菌属(Wolinella)、氨基酸球菌属(Acidaminococcus)、巨球型菌属(Megasphaera)、Veilonella、诺卡氏菌属(Norcardia)、马杜拉放线菌属(Actinomadura)、拟诺卡氏菌属(Norcardiopsis)、链霉菌属(Streptomyces)、小多孢菌属(Micropolysporas)、高温放线菌属(Thermoactinomycetes)、分枝杆菌(Mycobacterium)(例如，结核分枝杆菌(M.tuberculosis)、牛分枝杆菌(M.bovis)、麻风分枝杆菌(M.leprae))、密螺旋体属(Treponema)、包柔氏螺旋体属(Borrelia)(例如，伯氏包柔氏螺旋体(B.burgdorferi))、钩端螺旋体属(Leptospira)、以及衣原体(Chlamydiae)。在某些实施例中，细菌可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。在某些实施例中，细菌可以包含在混合的微生物群体中(例如，含有其他细菌，或含有酵母和/或其他细菌)。

在某些实施例中，古细胞可以来自任何古细菌门，例如广古菌门(Euryarchaeota)、泉古菌门(Crenarchaeota)、纳古菌门(Nanoarchaeota)、初古菌门(Korarchaeota)、曙古菌门(Aigarchaeota)或奇古菌门(Thaumarchaeota)。本文中的古细菌细胞可以是例如嗜极生物(extremophilic)(例如，能够在对大多数生命有害的物理或地球化学的极端条件下生长和/或茁壮成长)。嗜极生物古细菌的一些实例包括嗜热的(例如，可以在45℃-122℃之间的温度下生长)、超嗜热的(例如，可以在80℃-122℃的温度下生长)、嗜酸的(例如，可以在3或以下的pH水平下生长)、嗜碱性(例如，可以在9或以上的pH水平下生长)和/或嗜盐(例如，可以在高盐浓度[例如20％-30％NaCl]中生长)的那些。古细菌物种的实例包括以下属的那些：盐杆菌属(Halobacterium)(例如，沃氏富盐菌(H.volcanii))、硫化叶菌属(Sulfolobus)(例如，硫磺矿硫化叶菌(S.solfataricus))、酸热硫化叶菌(S.acidocaldarius))、热球菌属(Thermococcus)(例如，T.alcaliphilus、速生热球菌(T.celer)、T.chitonophagus、T.gammatolerans、T.hydrothermalis、超耐热菌(T.kodakarensis)、嗜热高温球菌(T.litoralis)、T.peptonophilus、深部热球菌(T.profundus)、T.stetteri)、甲烷暖球菌属(Methanocaldococcus)(例如，M.thermolithotrophicus、詹氏甲烷暖球菌(M.jannaschii))、产甲烷球菌属(Methanococcus)(例如，海沼甲烷球菌(M..maripaludis))、甲烷热杆菌属(Methanothermobacter)(例如，M.marburgensis、热自养甲烷热杆菌(M.thermautotrophicus))、古生球菌属(Archaeoglobus)(例如，闪烁古生球菌(A.fulgidus))、亚硝化侏儒菌属(Nitrosopumilus)(例如，海洋亚硝化侏儒菌(N.maritimus))、生金球菌属(Metallosphaera)(例如，勤奋金属球菌(M.sedula))、铁原体属(Ferroplasma)、热原体属(Thermoplasma)、甲烷短杆菌属(Methanobrevibacter)(例如，史密斯氏甲烷短杆菌(M.smithii))、以及甲烷球形菌属(Methanosphaera)(例如，M.stadtmanae)。

本文中的昆虫细胞的实例包括草地贪夜蛾(Spodoptera frugiperda)细胞、粉纹夜蛾(Trichoplusia ni)细胞、家蚕(Bombyx mori)细胞等。草地贪夜蛾(S.frugiperda)细胞包括例如Sf9和Sf21。粉纹夜蛾(T.ni)卵巢细胞包括例如HIGH FIVE细胞(别名BTI-TN-5B1-4，由英杰公司(Invitrogen)制造)。家蚕(B.mori)细胞包括例如N4。可以如在例如Growth and Maintenance of Insect cell lines[昆虫细胞系的生长和维护](2010，英杰公司(Invitrogen)，手册编号(Manual part no.)25-0127，MAN0000030)(其通过引用结合在此)中所述的来培养和/或操作本文中的某些昆虫细胞。在其他方面，昆虫细胞可以是植物有害生物/病原体的细胞，例如粘虫、小地老虎、玉米穗蛾、玉米跳甲、玉米叶蚜、玉米根蚜、欧洲玉米蛀虫、秋粘虫、粒肤地老虎、日本甲虫、小玉米茎蛀虫、玉米象虫、普通梳爪叩头虫(melanotus communis)、种蝇、草地螟、高粱瘿蚊、高粱瘤蛾、南方玉米象虫、南方玉米根虫、南方玉米草螟、南方马铃薯铁线虫、六点黄蜘蛛、条螟、甘蔗甲虫，烟草金针虫、白蛴螬、棉子象鼻虫、螟蛉虫复合体、甘蓝尺蠖、牧草盲蝽、蓟马、二斑叶螨、黄纹粘虫、苜蓿象鼻虫、三叶草叶象甲、三叶草根象鼻虫、秋粘虫、蝗虫、牧场沫蝉、豌豆蚜、马铃薯叶蝉、草地螟、杂色夜蛾、小玉米茎蛀虫、烟蓟马、铁线虫、黑角负泥虫、麦长蝽、麦长管蚜、麦二叉蚜、麦廮蝇、豆叶甲、甜菜夜蛾、斑蝥、葡萄肖叶甲、三叶草绿夜蛾、墨西哥豆甲虫、大豆尺蠖、大豆茎蛀虫、椿象、三角苜蓿跳虫、毛豆毛虫、蚜虫、甘蓝尺蠖、夜蛾、绿色六月甲虫、绿色桃蚜、天蛾幼虫、马铃薯块茎蛾、南方蝼蛄、suckfly、烟草跳甲、蔬菜象鼻虫、或白缘象甲。可替代地，昆虫细胞可以是动物(例如人类)的有害生物/病原体的细胞。

例如，线虫细胞可以是来自以下任何属的线虫：根结线虫属(根结线虫)、短体线虫属(坏死线虫)、异皮线虫属(胞囊线虫)、胞囊线虫属(Globodera)(胞囊线虫)、茎线虫属(茎和球茎线虫)、小垫刃属(柑橘线虫)、剑线虫属(Xiphinema)(匕首线虫)、穿孔线虫属(Radopholus)(穿孔线虫)、肾状线虫属(Rotylenchulus)(肾形线虫)、螺旋线虫属(螺旋线虫)或刺线虫属(Belonolaimus)(刺线虫)。在某些实施例中，线虫可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。在其他方面，线虫可以是雅致暗内孢(C.elegans)。

本文中的鱼细胞可以是以下各项中披露的那些，例如美国专利号7408095和7217564以及Tissue Culture of Fish Cell Lines(T.Ott，NWFHS LaboratoryProcedures Manual-Second Edition，Chapter 10，2004)[鱼细胞系的组织培养(T.Ott，NWFHS实验室程序手册-第二版，第10章，2004)]，其通过引用结合在此。这些参考文献还披露了关于培养和/或操作鱼细胞的信息。鱼细胞的非限制性实例可以来自诸如斑马鱼、青鳉、巨斑马鱼(Giant rerio)或河豚鱼之类的硬骨鱼。

本文中的植物细胞可以是例如单子叶植物细胞或双子叶植物细胞。本文中的单子叶植物的实例包括玉米(玉蜀黍)、水稻(rice或Oryza sativa)、黑麦(rye或Secalecereale)、高粱(甜高粱(Sorghum bicolor)、高粱(Sorghum vulgare))、小米(例如，珍珠小米、御谷(Pennisetum glaucum))、黍稷(粟米(Panicum miliaceum))、粟(谷子(Setariaitalica))、穇子(龙爪稷(Eleusine coracana))、小麦(wheat或Triticum aestivum)、甘蔗(甘蔗属(Saccharum spp.))、燕麦(燕麦属(Avena))、大麦(大麦属(Hordeum))，柳枝稷(switchgrass或Panicum virgatum)、菠萝(pineapple或Ananas comosus)、香蕉(香蕉属(Musa spp.))、棕榈、观赏植物和草坪草。本文中的双子叶植物的实例包括大豆(soybean或Glycine max)、卡诺拉(欧洲油菜和芸苔(B.campestris))、苜蓿(紫花苜蓿(Medicagosativa))、烟草(tobacco或Nicotiana tabacum)、拟南芥(Arabidopsis或A.thaliana)、向日葵(sunflower或Helianthus annuus)、棉花(木本棉(Gossypium arboreum))、花生(peanut或Arachis hypogaea)、番茄(tomato或Solanum lycopersicum)和马铃薯(potato或Solanum tuberosum))。植物细胞可以来自植物的任何部分和/或来自植物发育的任何阶段。

本文中的植物细胞可以使用常规条件生长或再生成植物，参见例如，McCormick等人，(1986)Plant Cell Rep[植物细胞报告]5：81-4。然后可以使再生植物生长，并用相同的菌株或不同的菌株进行授粉，并且产生具有所希望的特征(例如，改变)和/或包含所鉴定的引入的多核苷酸或多肽的子代。可以生长两个或更多个世代，以确保改变的稳定维持和遗传，并收获种子。

在某些实施例中，哺乳动物细胞可以是人类、非人灵长类(例如猴、猿)、啮齿动物(例如小鼠、大鼠、仓鼠、豚鼠)、兔、狗、猫、牛、猪、马、山羊或绵羊细胞。本文中的哺乳动物细胞的其他实例包括原发性上皮细胞(例如角质细胞、宫颈上皮细胞、支气管上皮细胞、气管上皮细胞、肾上皮细胞、视网膜上皮细胞)；已建立的细胞系(例如，293胚肾细胞、HeLa宫颈上皮细胞、PER-C6视网膜细胞、MDBK、CRFK、MDCK、CHO、BeWo、张氏(Chang)细胞、Detroit562、Hep-2、KB、LS 180、LS 174T、NCI-H-548、RPMI 2650、SW-13、T24、WI-28VA13、2RA、WISH、BS-C-I、LLC-MK2、克隆M-3、RAG、TCMK-1、LLC-PK1、PK-15、GH1、GH3、L2、LLC-RC 256、MH1C1、XC、MDOK、VSW、TH-I、B1细胞)；来自任何组织或器官(例如皮肤、心脏、肝脏、肾脏、结肠、小肠、食管、胃、神经组织例如脑或脊髓；肺；血管组织；淋巴组织例如淋巴腺、腺样体、扁桃体、骨髓或血液；脾)中的任何上皮、间叶细胞(例如纤维原细胞)、神经或肌肉细胞；以及纤维原细胞或纤维原细胞样细胞系(例如TRG-2、IMR-33、Don细胞、GHK-21、瓜氨酸血症细胞、Dempsey细胞、Detroit 551、Detroit 510、Detroit 525、Detroit 529、Detroit 532、Detroit 539、Detroit 548、Detroit 573、HEL 299、IMR-90、MRC-5、WI-38、WI-26、MiCl1、CV-1、COS-1、COS-3、COS-7、Vero、DBS-FrhL-2、BALB/3T3、F9、SV-T2、M-MSV-BALB/3T3、K-BALB、BLO-11、NOR-10、C3H/IOTI/2、HSDM1C3、KLN205、McCov细胞、小鼠L细胞、SCC-PSA1、Swiss/3T3细胞、印度麂细胞、SIRC、Jensen细胞)。培养和操作哺乳动物细胞系的方法是本领域已知的。

在某些实施例中，微生物细胞可以是动物或植物的任何病原体和/或有害生物的细胞。这样的病原体/有害生物的实例包括各种类型的细菌、真菌、酵母、原生生物、线虫和昆虫。本领域技术人员将认识到上文披露的病原体/有害生物的实例。

如本文所述(参见实例10)，细胞穿透肽能够将货物递送到不同的真核生物物种中，包括辣椒疫霉菌(Phytophthora capsici)、小麦壳针孢(Septoria tritici)和灰葡萄孢菌(Botrytis cinerea)。

在一个实施例中，本文所述方法是将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法，该微生物细胞选自下组，该组由以下各项组成：辣椒疫霉菌(Phytophthora capsici)、小麦壳针孢(Septoria tritici)和灰葡萄孢菌(Botrytiscinerea)，所述方法包括：使微生物细胞与包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，由此进入微生物细胞。

在本文的某些实施例中的组合物可以包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该蛋白组分和CPP在多核苷酸/内切核酸酶蛋白-CPP复合物中彼此共价或非共价地连接，并且其中该多核苷酸/内切核酸酶蛋白-CPP复合物可以穿过细胞(例如微生物细胞)的(i)细胞膜或(ii)细胞壁和细胞膜。引导多核苷酸和Cas内切核酸酶能够形成称为“引导多核苷酸/Cas内切核酸酶复合物”的复合物，其使得Cas内切核酸酶能够在DNA靶位点处引入双链断裂。

所披露的发明还涉及将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到细胞(例如微生物细胞)中的方法。该方法包括使细胞与包含RGEN蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物彼此中共价或非共价地连接。作为该接触步骤的结果，RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，从而进入细胞中。在RGEN蛋白组分与RNA组分缔合(从而形成RGEN)的某些实施例中，所披露的方法涉及将RGEN-CPP复合物递送到细胞中。另外，由于在某些实施例中RGEN可以用于RGEN介导的DNA靶向，所以该方法可以任选地被表征为靶向细胞中的DNA的方法。

可以使用关于每种方法特征(例如，细胞类型、RGEN蛋白组分、CPP、细胞器靶向序列等)的任何上述披露的实施例或下文实例来实施该方法。因此，可以适当地使用在上文或实例中披露的任何特征或这些特征的任意组合来表征本文的递送方法的实施例。以下递送方法特征是实例。

本文中的递送方法的实施例包括使细胞(例如微生物细胞)与包含RGEN蛋白-CPP复合物的组合物接触。据信这样的接触导致复合物与细胞的外表面(例如，细胞膜、细胞壁)的相互作用，从而允许复合物的CPP组分开始穿过(i)细胞膜或(ii)细胞壁和细胞膜。

将包含RGEN蛋白-CPP复合物的组合物与细胞(例如微生物细胞)接触可以在允许复合物进入细胞的温度下进行。这样的接触可以在例如约4℃和45℃之间的任何温度下进行。在非限制性实施例中，接触温度可以为约4℃、15℃、20℃、30℃、37℃或42℃。可以在接触步骤期间维持相同的温度或温度范围，或适当地修改(例如，两个或更多个不同的温度)。

可以将包含RGEN蛋白-CPP复合物的组合物与细胞的接触进行足以允许复合物进入细胞的时间量。例如，细胞可以与RGEN蛋白-CPP复合物一起孵育至少约15、30、45、60、75、90、105、120、135、150、165、180、240、300、360、420、480、540、600、660或720分钟。

进行接触的环境(例如，缓冲液、水和盐浓度、pH、RGEN蛋白-CPP复合物的纯度)可以是以上关于包含RGEN蛋白-CPP复合物的组合物所披露的的那些条件中的任一种。例如，可以将细胞与在HEPES缓冲液(例如，约25mM HEPES，例如25mM HEPES/KOH pH 7.5、200mMKCl、20％甘油、1mM DTT)或PBS(例如，1X PBS，pH 7)中的复合物一起孵育。

可以将一种或多种细胞(例如微生物细胞)与包含RGEN蛋白-CPP复合物的组合物接触。本文中的细胞可以可以如它(i)在生物体/体内组织中，(ii)在离体的组织或细胞组内，或(iii)处于体外状态(例如，培养细胞)中存在的。

RGEN蛋白-CPP复合物进入本文中的细胞通常是指当复合物已经完全穿过(i)细胞膜或(ii)细胞壁和细胞膜，并且包含在至少细胞质中时。虽然不意图被任何特定的理论或机制束缚，但是据信在RGEN蛋白-CPP复合物实现细胞进入后，通过非共价连接结合在一起的RGEN蛋白-CPP复合物保留在完全或部分复合物中，或者RGEN蛋白组分与复合物的一个或多个CPP组分分离。在任一情况下，RGEN蛋白组分能够与本文中合适的RNA组分缔合；这样的缔合可以发生在例如细胞质、细胞核或线粒体中。该能力同样适用于通过共价连接结合在一起的RGEN蛋白-CPP复合物。

在RGEN蛋白递送方法的某些实施例中，本文中的组合物进一步包含与RGEN蛋白-CPP复合物的RGEN蛋白组分缔合的至少一种RNA组分(即组合物包含RGEN-CPP复合物)。本实施例中的RNA组分可以如本文所披露的，包含与微生物细胞中染色体或附加体上的靶位点序列互补的序列。RGEN可以结合靶位点序列，并且任选地在靶位点序列处切割一条或两条DNA链。这样的实施例也可以被表征为将RGEN-CPP复合物递送到微生物细胞中的方法，或可替代地被表征为将RNA递送到微生物细胞中的方法。

可以使用本领域已知的任何数量的手段制备用于该实施例的RNA组分(例如，gRNA)。例如，可以使用体外转录过程来制备本文中的RNA组分。在某些非限制性实施例中，细菌RNA聚合酶(例如，T7、T3、SP6)可以用于从编码RNA组分的合适的DNA构建体转录RNA组分。必要时，RNA组分可以被加工至相对于其他生物分子(例如蛋白质、糖类、脂质)的至少约70％、80％、90％或95％的纯度。

为了制备包含RNA组分和RGEN蛋白-CPP复合物的组合物，可以将RNA组分溶解在其中已经溶解了RGEN蛋白-CPP复合物的组合物中，或反之亦然(或者这些组分可以同时溶解)。当将这些元素混合在一起时，可以使用例如，至少约0.5∶1、1.0∶1、1.5∶1、2.0∶1、2.5∶1、3.0∶1、3.5∶1或4.0∶1的RNA组分与RGEN蛋白-CPP复合物的摩尔比。在某些方面，RNA组分与RGEN蛋白-CPP复合物的摩尔比可以为约3.0∶1，或者可以在约2.5∶1至3.5∶1、2.75∶1至3.25∶1、或2.9∶1至3.1∶1的范围内。在这些和其他方面，与RNA组分混合的RGEN蛋白-CPP复合物的浓度可以为至少约0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0μM、或约0.5至5.0μM、0.5至2.5μM、1.0至5.0μM、1.0至2.5μM、或2.5至5.0μM。允许RNA与RGEN蛋白-CPP复合物缔合以形成RGEN-CPP复合物的时间量可以是例如至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、45或60分钟。RNA组分可以与RGEN蛋白-CPP复合物缔合的其他条件(例如，温度、缓冲液、水和盐浓度、pH、RGEN蛋白-CPP复合物的纯度)可以是上述关于(i)包含RGEN蛋白-CPP复合物的组合物，或(ii)将RGEN蛋白-CPP复合物与细胞接触所披露的那些条件中的任一种。例如，可以将RNA组分(例如gRNA)与在HEPES缓冲液(例如约25mMHEPES，例如25mM HEPES/KOH pH 7.5、200mM KCl、20％甘油、1mM DTT)或PBS(例如，1X PBS，pH 7)中的RGEN蛋白-CPP复合物在室温(例如约20℃-25℃)下接触约15分钟。在通过非共价连接结合在一起的RGEN蛋白-CPP复合物的那些实施例中，RNA组分与RGEN蛋白的缔合可以包括在将CPP与RGEN蛋白组分孵育之前、同时或之后添加RNA组分。

例如，在将RNA组分与RGEN蛋白-CPP复合物缔合后，可以将包含RGEN-CPP复合物(例如CPP-Cas9/gRNA)的所得组合物与细胞立即接触。例如，可以在RNA组分和RGEN蛋白-CPP复合物缔合的环境中进行接触(例如，参见上文)。必要时，包含RGEN-CPP复合物的组合物可以在约室温、4℃或冷冻(例如-20℃或-80℃)下储存以备后用。即使该复合物是处于已经通过一次、二次或更多次冻融循环的组合物中，RGEN-CPP复合物的稳定性和/或进入细胞并影响DNA靶向的能力可以保持不变，或可以分别具有至少约50％、60％、70％、80％、90％或95％的活性。

用于与细胞接触的、包含RGEN蛋白-CPP复合物或RGEN-CPP复合物的组合物可以任选地包含一种或多种体积排阻剂，其被考虑为增强在细胞和复合物之间的接触点。本文中的合适的体积排阻剂的实例包括甘油和聚乙二醇(PEG)。其他实例包括阴离子聚合物例如聚丙烯酸酯、聚甲基丙烯酸酯或阴离子多糖聚合物(例如硫酸葡聚糖)。体积排阻剂的又其他实例披露在美国专利4886741中，其通过引用结合在此。

在RGEN蛋白递送方法的某些实施例中，在RGEN蛋白-CPP复合物进入细胞后(即，从而在细胞中形成RGEN-CPP复合物)，细胞(例如微生物细胞)包含与RGEN蛋白-CPP复合物的RGEN蛋白组分缔合的RNA组分。本实施例中的RNA组分可以如本文所披露的，包含与细胞中染色体或附加体上的靶位点序列互补的序列。RGEN可以结合靶位点序列，并且任选地在靶位点序列处切割一条或两条DNA链。

本文中的一种或多种RNA组分可以稳定或瞬时表达于例如引入RGEN蛋白-CPP复合物的细胞(例如微生物细胞)中。作为瞬时表达的实例，RGEN蛋白-CPP复合物可以(i)递送到先前已经被修饰以瞬时表达RNA组分的细胞中，(ii)与RNA组分一起共递送到细胞中，或(iii)递送到随后细胞被修饰用于瞬时RNA组分表达的细胞中。

包含(i)启动子和(ii)编码RNA组分的核苷酸序列((i)可操作地连接到(ii))的DNA多核苷酸序列通常可以用于本文中稳定和/或瞬时的RNA组分表达。这样的多核苷酸序列可以包含在例如质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒或线性DNA(例如，线性PCR产物)中，或包含在任何其他类型的用于将多核苷酸序列转移到细胞中的载体或构建体中。该多核苷酸序列能够在细胞中瞬时存在(即未整合到基因组中)或稳定存在(即整合到基因组中)。而且，该多核苷酸序列可以包含或缺少一个或多个合适的标记序列(例如选择或表型标记)。

包含在用于在表达本文中的RNA组分的多核苷酸序列中的合适的启动子可以是例如组成型的或可诱导的。在某些方面，启动子可以包含一个强启动子，该强启动子是每单位时间内可以指导相对大量的生产性启动的启动子，和/或是在包含该强启动子的细胞中驱动比基因的平均转录水平更高的转录水平的启动子。

用于本文的某些方面(例如真菌和/或酵母细胞)中的强启动子的实例包括在以下各项中披露的那些：美国专利申请公开号2012/0252079(DGAT2)、2012/0252093(EL1)、2013/0089910(ALK2)、2013/0089911(SPS19)、2006/0019297(GPD和GPM)、201I/0059496(GPD和GPM)、2005/0130280(FBA、FBAIN、FBAINm)、2006/0057690(GPAT)和2010/0068789(YAT1)，其通过引用结合在此。强启动子的其他实例包括在表2中所列出的那些，其也可以用于例如真菌和/或酵母细胞中。

表2.强启动子

^a该表中的每个参考文献通过引用结合在此。

用于本文的某些实施例的强启动子的其他实例包括PGK1、ADH1、TDH3、TEF1、PHO5、LEU2和GAL1启动子，以及在Velculescu等人(Cell[细胞]88：243-251，其通过引用结合在此)中披露的强酵母启动子。

用于本文中RNA组分的稳定和/或瞬时表达的启动子可以是例如RNA聚合酶II(PolII)启动子。据信所有上述强启动子都是合适的Pol II启动子的实例。例如，来自Pol II启动子的转录可以涉及形成至少约12种蛋白质(例如，RPB1-RPN12蛋白质)的RNA聚合酶II复合物。从本文的Pol II启动子转录的RNA通常为5′-带帽的(例如，在5′-末端含有m⁷G基团)和/或具有聚腺苷酸(polyA)尾。必要时，当从Pol II启动子表达RNA组分时，可以使用从RNA组分去除5′-帽和/或polyA尾的手段。用于有效地从本文的Pol II转录的RNA组分中去除5′-帽和/或polyA尾的合适的手段包括，例如，适当使用一种或多种核酶(参见下文)、第1组自剪接内含子和第2组自剪接内含子。

可替代地，用于本文中RNA组分的稳定和/或瞬时表达的启动子可以是例如RNA聚合酶III(Pol III)启动子。这样的启动子通常允许用限定的5′-和3′-末端表达RNA组分，因为可以控制用RNA聚合酶III进行的转录的起始和终止。用于本文的Pol III启动子的实例包括U6和H1启动子。其他合适的Pol III启动子披露在例如美国专利申请公开号2010/0160416中，其通过引用结合在此。

可以使用一个或多个核酶序列来产生定义的5′和/或3′转录物末端，例如在PolII启动子用于在细胞中表达RNA组分的那些实施例中。例如，本文中编码RNA组分的核苷酸序列可以进一步编码在编码RNA组分的序列上游的核酶。因此，在某些实施例中，细胞进一步包含DNA多核苷酸序列，该多核苷酸序列包含(i)一个启动子，(ii)在5′-至-3′方向编码核酶和RNA组分的核苷酸序列，其中(i)可操作地连接于(ii)。从这样的多核苷酸序列表达的转录物自动催化除去核酶序列以产生具有定义的5′-末端(不含5′-帽)但含有RNA组分序列的RNA。这种“自动加工的”RNA可以包含例如crRNA或gRNA，并且可以与RGEN蛋白组分例如Cas9复合，从而形成RGEN。

本文中的核酶可以是例如锤头状(HH)核酶、丁型肝炎病毒(HDV)核酶、第I组内含子核酶、RnaseP核酶或发夹核酶。本文中的核酶的其他非限制性实例包括Varkud卫星(VS)核酶、葡萄糖胺-6-磷酸激活的核酶(glmS)和CPEB3核酶。Lilley(Biochem.Soc.Trans.[生化学会学报]39：641-646)披露了有关核酶结构和活性的信息。应当适用于本文的核酶的实例包括在EP 0707638和美国专利号6063566、5580967、5616459、和5688670(其通过引用结合在此)中披露的核酶。关于使用核酶表达具有定义的5′和/或3′末端的RNA组分的进一步信息披露于美国专利申请号62/036,652(2014年8月13日提交)中。

在某些实施例中，包含用于表达RNA组分的盒的DNA多核苷酸包含RNA组分序列下游的合适的转录终止序列。用于本文的转录终止序列的实例披露于美国专利申请公开号2014/0186906中，其通过引用结合在此。这样的实施例通常包括在RNA组分序列末端后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基，取决于终止子序列的选择。取决于终止子序列的选择，这些另外的残基可以是所有U残基，或例如至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的U残基。可替代地，核酶序列(例如锤头状或HDV核酶)可以是例如RNA组分序列的3′(例如下游的1、2、3、4、5、6、7、8、9、10或更多个核苷酸)。可以相应地定位3′核酶序列，这样使得其从RNA组分序列中切割其自身；这样的切割将使转录物完全结束于RNA组分序列的末端，或者在RNA组分序列的末端后具有例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个残基。

在其他实例中，RNA组分可以提供在递送RGEN蛋白-CPP复合物的细胞的细胞核和/或细胞质中。例如，可以预期不使用位于5’处的核酶序列的、由Pol II启动子表达的RNA组分存在于细胞核和细胞质两者中。在其他实施例中，可以预期从任何类型的启动子(例如Pol II或III启动子)并使用位于5’处的核酶序列表达的RNA组分主要存在于细胞核中。在某些方面，可以预期由Pol III启动子表达的RNA组分主要存在于细胞核中。在某些方面，RNA组分未带帽(例如，通过由Pol III启动子表达，和/或通过核酶自动加工)，并且通常位于细胞核中，而在其他方面是带帽的并且位于细胞核和细胞质位置。通常，一旦递送到细胞中，RGEN蛋白-CPP复合物的RGEN蛋白组分可以与在细胞质和/或细胞核(取决于RNA组分位置)中的RNA组分缔合(从而形成RGEN)。在细胞核中的这样的缔合通常是由于本文中的RGEN蛋白组分按照NLS的指导定位于细胞核的能力。

本文中的RGEN可用于RGEN介导的DNA靶向。任何上述关于将RGEN蛋白组分递送到细胞中的实施例可以应用于DNA靶向方法中。例如，RGEN蛋白-CPP复合物可以与在微生物细胞外的至少一种RNA组分接触，以形成用于递送至细胞中以便在其中进行DNA靶向的RGEN-CPP复合物。作为另一个实例，RGEN蛋白-CPP复合物在其递送到微生物细胞后可以与微生物细胞内的至少一种RNA组分接触以在其中形成RGEN-CPP复合物，该复合物然后可以介导DNA靶向。关于靶向方法的以下披露内容涉及“RGEN”，而不是指“RGEN-CPP复合物”。应当理解的是，取决于在本文中的RGEN递送方法中是否使用共价或非共价RGEN-CPP复合物(并且取决于在使用非共价RGEN-CPP复合物的实施例中非共价连接的强度如何)，下文对RGEN的提及相应地是指这样的RGEN-CPP复合物。

可以切割DNA靶序列的一条或两条DNA链的本文中的RGEN可以用于例如DNA靶向方法。如果在该方法中提供合适的供体DNA，则这样的DNA靶向方法可以涉及HR-介导的DNA靶向。因此，在某些实施例中，在本文的靶向方法中的微生物细胞可以包含供体多核苷酸，该多核苷酸包含与靶位点序列(由本文中的RGEN特异性靶向的序列)处或其附近的序列同源的至少一个序列。这样的实施例可以任选地被表征为该靶向方法进一步包括向微生物细胞提供合适的供体多核苷酸的步骤。

如果靶位点含有SSB或DSB(例如可以使用本文中的RGEN引入)，则本文中的供体多核苷酸可以用在DNA靶位点处或其附近的序列进行HR。在本文的供体多核苷酸内的“同源序列”可以例如包含至少约25、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸、或约50-500、50-550、50-600、50-650个核苷酸或由其组成，其与在靶位点序列或其附近的序列具有100％同一性，或与在靶位点序列或其附近的序列具有例如至少约90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

本文中的供体多核苷酸可以具有两个同源序列(同源臂)，例如这两个同源序列被与在靶位点序列处或其附近的序列异源的序列分开。在供体多核苷酸和靶位点序列之间的HR通常导致在靶位点处的序列被供体多核苷酸的异源序列替代(即，位于与供体多核苷酸的同源臂同源的靶位点序列之间的靶位点序列被供体多核苷酸的异源序列替代)。在具有两个同源臂的供体多核苷酸中，臂可以分开例如至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸(即，在供体多核苷酸中的异源序列可以是至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸长度)。每个同源臂的长度(例如，上文针对同源序列披露的任何长度)可以相同或不同。在靶位点处或其附近具有相应同源序列的每个臂的百分比同一性(例如，上文针对同源序列披露的任何％同一性)可以相同或不同。

与供体多核苷酸中的相应同源序列同源的靶位点序列处或其附近(可替代地，处于其所在位置处或其近端)的DNA序列可以离在靶序列中预测的RGEN切割位点(DSB或切口)例如约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、450、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000或60000(或在1和60000之间的任何整数)个核苷酸(例如，约1-1000、100-1000、500-1000、1-500或100-500个核苷酸)以内。这些核苷酸距离可以以切割位点向上游或下游方向，从切割位点标记到同源序列的第一个核苷酸。例如，与供体多核苷酸中的相应序列同源的靶序列附近的序列可以从靶序列中预测的RGEN切割位点下游的500个核苷酸碱基对开始。在使用具有两个同源臂(例如，通过异源序列分离的第一和第二同源臂)的供体多核苷酸的本文的实施例中，例如，同源序列(对应于与供体的第一同源臂同源)可以在预测的RGEN切割位点的上游，并且同源序列(对应于与供体的第二同源臂同源)可以在预测的RGEN切割位点的下游。这些上游和下游同源序列中的每一个距预测的切割位点的核苷酸距离可以相同或不同，并且可以是例如以上披露的任何核苷酸距离。例如，同源序列(对应于与供体的第一同源臂同源)的3’末端可以位于预测的RGEN切割位点上游600个核苷酸碱基对处，并且同源序列(对应于与供体的第二同源臂同源)的5′末端可以位于预测的RGEN切割位点下游400个核苷酸碱基对处。

在不同方面，可以在当将RGEN蛋白-CPP复合物递送到细胞中时的时间或其附近(例如，在1、2、3或更多个小时内)将供体多核苷酸递送到细胞(例如微生物细胞)中。这样的递送可以经由本领域已知的适合于正在使用的特定类型的细胞的任何手段进行。这些技术包括例如转化(例如，乙酸锂转化[Methods in Enzymology[酶学方法]，194：186-187])、转染、基因枪冲击、电穿孔和显微注射。例如，美国专利号4880741和5071764以及Chen等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]48：232-235)(其通过引用结合在此)描述了解脂耶氏酵母的DNA转移技术。用于植物中的递送模式的实例包括土壤杆菌介导的转化和基因枪粒子轰击。

在本文的DNA靶向的其他非限制性实施例中，可以使用切割DNA靶序列的一条或两条DNA链的RGEN来产生插入缺失。可以如上文对HR介导的靶向所披露的那样进行在细胞中形成插入缺失的方法，但不再进一步提供可以在靶DNA位点处或其附近可能经历HR的供体DNA多核苷酸(即，在该方法中诱导NHEJ)。本文披露了可以产生插入缺失的实例。插入缺失的大小可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中，插入缺失可以甚至更大，例如至少约20、30、40、50、60、70、80、90、100、110、120、130、140或150个碱基。在又其他实施例中，插入或缺失可以是至少约500、750、1000或1500个碱基。当在某些实施例中尝试产生插入缺失时，相反可以在靶位点序列中形成单个碱基取代。因此，例如，出于产生单个碱基取代的目的，可以进行本文的靶向方法。

在本文针对插入缺失形成的靶向方法的某些实施例中，在非常规酵母(例如，解脂耶氏酵母)中的插入缺失形成的频率显著高于在常规酵母例如酿酒酵母中使用相同或相似的靶向策略所观察到的频率。例如，虽然在常规酵母中插入缺失形成的频率可以为约0.0001至0.001(DiCarlo等人，Nucleic Acids Res.[核酸研究]41：4336-4343)，但是在本文的非常规酵母中的频率可以是至少约0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75或0.80。因此，在本文的非常规酵母中插入缺失形成的频率可以比在常规酵母中使用相同或相似的RGEN介导的靶向策略所观察到的高例如至少约50、100、250、500、750、1000、2000、4000或8000倍。

在某些实施例中，可以进行靶向方法以破坏编码蛋白质或非编码RNA的一种或多种DNA多核苷酸序列。可以靶向破坏的、这样的序列的实例是编码标记(即标记基因)的序列。本文中的标记的非限制性实例包括可筛选标记和可选择标记。本文中的可筛选标记可以是在适当的条件下使细胞视觉上不同的标记。可筛选标记的实例包括编码β-葡萄糖醛酸酶(GUS)、β-半乳糖苷酶(1acZ)和荧光蛋白(例如，GFP、RFP、YFP、BFP)的多核苷酸。本文中的可选择标记可以是使细胞对选择性试剂或选择性环境有抗性的标记。可选择标记的实例是营养缺陷型标记例如HIS3、LEU2、TRP1、MET15或URA3，其允许例如酵母细胞的细胞分别在不存在外源提供的组氨酸、亮氨酸、色氨酸、甲硫氨酸或尿嘧啶的情况下存活。可选择标记的其他实例是抗生素或抗真菌抗性标记，例如使细胞对氨苄青霉素、氯霉素、潮霉素B、诺尔丝菌素、腐草霉素、嘌呤霉素或新霉素(例如G418)有抗性的那些。这些方法的实例可以任选地被表征为标记再循环方法(marker recycling method)。

在某些实施例中，破坏标记的至少一个目的可以是用于标记再循环。标记回收是一个过程，例如，包括(i)用标记和异源DNA序列转化细胞，(ii)选择包含该标记和异源DNA序列的转化细胞(其中标记可选择的细胞通常具有较高的含有异源DNA序列的机会)，(iii)破坏标记，然后根据需要重复步骤(i)-(iii)多次(使用相同的[或不同的]标记，但每个循环使用不同的异源DNA序列)以便用多个异源DNA序列转化细胞。在该过程中的一个或多个异源序列可以包含处于供体多核苷酸形式的标记本身(例如，侧翼同源臂用于靶向特定基因座的标记)。本文中的标记再循环过程的实例包括使用URA3作为标记的那些，例如在使用酵母(例如，非常规酵母例如解脂耶氏酵母)的某些方法中。

可以结合DNA靶位点序列但不切割靶位点序列上的任何链的本文中的RGEN可以用于其他实施例中的DNA靶向方法。本文披露的仅具有功能失调的核酸酶结构域但保留特异性DNA结合活性的RGEN可以用于这种类型的靶向方法中。

在使用不具有功能性核酸酶结构域的RGEN的DNA靶向的某些实施例中，RGEN可以结合靶位点并调节多核苷酸序列的转录(即基因转录)。通常，将RGEN靶向调节序列例如启动子(例如，在转录起始位点上游1-1000、1-500、1-250、1-125或1-50个碱基内)、编码5′-非翻译RNA序列的序列、或内含子(例如，第一内含子)以实现多核苷酸序列的转录调节。

作为非限制性实例，可以将与抑制子转录因子或其抑制子结构域连接或融合的RGEN用于抑制或沉默一个或多个多核苷酸序列的表达。在某些替代性实施例中，RGEN本身(不具有抑制子或其结构域)可以抑制基因表达；这样的RGEN可以被靶向，这样使得其抑制转录所必需的RNA转录机器的结合和/或移动。掺入任何抑制性RGEN的方法可以任选地被表征为基因沉默或转录沉默方法。与应用抑制性RGEN之前的转录水平相比，在沉默方法中转录下调的水平可以是例如约100％(基因完全沉默)、或至少约30％(基因中度沉默)、40％、50％、60％、70％、80％、90％或95％(基因实质上沉默)。

与激活子转录因子或其激活子结构域连接或融合的RGEN可以用于上调一个或多个多核苷酸序列的表达。掺入这样的激活性RGEN的方法可以任选地被表征为转录上调或激活方法。与应用激活性RGEN之前的转录水平相比，在这样的方法中转录上调水平可以是例如至少约25％、50％、75％、100％、250％、500％或1000％。

在某些实施例中，可以结合DNA靶位点序列、但优选不切割靶位点序列的任何链的RGEN可以被用作诊断工具(例如用于检测DNA序列的探针)。在DNA探针中的RGEN蛋白组分可以与报道剂例如报道蛋白(例如荧光蛋白例如GFP)连接。可以利用报道剂的活性将RGEN-报道蛋白的特异性DNA结合(如通过RGEN的RNA组分所说明的)掺入相应的检测系统中。流式细胞术(例如，流式激活的细胞分选[FACS])和荧光原位杂交(FISH))是本文使用荧光报道子的合适的检测系统的实例。

本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶位点的这样的方式进行。这样的方法可以任选地被表征为多重方法。在某些实施例中可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶位点。多重方法通常通过本文的靶向方法进行，其中提供了多个不同的RNA组分，每一个被设计成将RGEN引导到唯一的DNA靶位点。例如，可以使用两种或更多种不同的RNA组分在体外制备RGEN-CPP复合物的混合物(例如，按照本文披露的用于将RNA组分与RGEN蛋白-CPP复合物缔合的程序)，然后将该混合物与细胞接触。

本文中的多重靶向的另一方面可以包括在细胞中提供两种或更多种不同的RNA组分，该RNA组分与已经穿越到细胞中的RGEN蛋白-CPP复合物的RGEN蛋白组分缔合。这样的方法可以包括例如向细胞提供(i)各自的DNA多核苷酸，其每一个表达特定的RNA组分，和/或(ii)编码两种或更多种RNA组分的至少一个DNA多核苷酸(例如，参见下面关于串联核酶-RNA组分盒的披露内容)。

多重方法可以任选地靶向非常接近相同序列的DNA位点(例如，启动子或开放阅读框)，和/或彼此远离的位点(例如，在不同的基因和/或染色体中)。在其他实施例中，取决于所希望的靶向结果(是否使用内切核酸酶或切口酶组分的RGEN)，可以使用(对于HR)或不使用(对于导致插入缺失和/或碱基取代的NHEJ)合适的供体DNA多核苷酸进行多重方法。在又其他实施例中，可以使用如本文所披露的抑制性或激活性RGEN进行多重方法。例如，可以提供多种抑制性RGEN，其下调一组基因，例如涉及特定代谢途径的基因。

在某些实施例中，多重方法可以包括向细胞提供DNA多核苷酸，该DNA多核苷酸包含(i)启动子，(ii)包含多于一个核酶-RNA组分盒(即串联盒)的序列，其中(i)可操作地连接至(ii)。从这样的DNA多核苷酸表达的转录物可以具有例如2、3、4、5、6、7、8、9、10或更多个盒。可以任选地在所有或一些RNA组分序列之后包括3′核酶序列，以允许RNA组分从下游转录物序列的切割和分离(即，串联盒可以包含一个或多个核酶-RNA组分-核酶盒)。本文中用于表达串联核酶-RNA组分-核酶盒的DNA多核苷酸可以被设计成使得在每个盒之间存在约10、20、30、40、50、60、70、80、90、100或更多个核苷酸(例如，非编码间隔序列)。在每个盒之间的距离可以相同或不同。

包含编码本文所述的RNA组分的DNA多核苷酸的任何构建体或载体可以通过本领域已知的适用于正在使用的特定类型的细胞的任何手段引入细胞。例如，可以使用上文所披露的将供体DNA递送到细胞中的任何手段。

本文中的某些实施例涉及修饰或改变微生物细胞基因组中的靶位点的方法，其中该方法包括使该微生物细胞与引导多核苷酸和共价或非共价连接到CPP的Cas内切核酸酶接触，其中该引导多核苷酸和CPP-Cas内切核酸酶能够形成复合物，该复合物使得Cas内切核酸酶能够在微生物细胞基因组中的靶位点处引入双链断裂。靶位点的修饰或改变可以包括(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任意组合。

本文中的某些实施例涉及包含编码融合蛋白的核苷酸序列的多核苷酸序列，该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)。例如，如本文所披露的任何融合蛋白可以由核苷酸序列编码。核苷酸序列可以任选地与启动子序列可操作地连接。某些实施例包括例如一种多核苷酸(例如，载体或构建体)，该多核苷酸包含编码本文所披露的任何RGEN蛋白-CPP融合物的至少一个开放阅读框。这样的编码区可以任选地可操作地连接到适合于在例如细胞(例如，细菌细胞；真核细胞例如酵母、昆虫或哺乳动物细胞)中或在体外蛋白表达系统中表达RGEN蛋白-CPP融合物的启动子序列上。载体或构建体的实例包括环状(例如质粒)和非环状(例如线性DNA，例如扩增的DNA序列)多核苷酸分子。

本文中的某些实施例涉及产生RGEN蛋白-CPP融合蛋白的方法，该方法包括以下步骤：提供具有编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列，并且从该多核苷酸序列表达RGEN蛋白-CPP融合蛋白，从而产生RGEN蛋白-CPP融合蛋白。在这样的方法中的表达步骤可以任选地在细胞(例如细菌细胞例如大肠杆菌；真核细胞例如酵母[例如酿酒酵母]、昆虫或哺乳动物细胞)中进行。可替代地，可以在体外蛋白质表达系统(例如，无细胞的蛋白质表达系统，例如使用兔网织红细胞裂解物或小麦胚芽提取物的那些)中进行RGEN蛋白-CPP融合蛋白的表达。而且，可以任选地分离在表达步骤中产生的RGEN蛋白-CPP融合蛋白。例如，这样的分离能以产生具有任何上文所披露的特征(例如纯度、pH、缓冲液和/或盐水平))的组合物的方式进行。

本文披露的组合物和方法的非限制性实例包括：

1.一种组合物，该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，并且

其中该RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

2.如实施例1所述的组合物，其中该RGEN的蛋白组分与至少一种RNA组分缔合，该RNA组分包含与该细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合该靶位点序列，并且任选地在该靶位点序列处切割一条或两条DNA链。

3.如实施例2所述的组合物，其中该RNA组分包含引导RNA(gRNA)，该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。

4.如实施例2所述的组合物，其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。

5.如实施例1所述的组合物，其中该RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。

6.如实施例1所述的组合物，其中该RGEN蛋白组分和CPP共价地连接。

7.如实施例1所述的组合物，其中该RGEN蛋白组分和CPP非共价地连接。

8.如实施例1所述的组合物，其中该CPP是阳离子性或两亲性的。

9.如实施例1所述的组合物，其中该CPP包含：

(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，

(ii)具有6个或更多个连续精氨酸残基的CPP，

(iii)转运蛋白-10(TP10)CPP，或

(iv)来自血管内皮钙粘素蛋白的CPP。

10.如实施例1所述的组合物，其中该RGEN蛋白-CPP复合物可以穿过细胞的细胞壁和细胞膜。

11.一种细胞，包含根据实施例1所述的组合物。

12.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到细胞中的方法，该方法包括：

使该细胞与包含该RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，

其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，

其中该RGEN蛋白-CPP复合物穿过该细胞的(i)细胞膜或(ii)细胞壁和细胞膜，从而进入该细胞。

13.如实施例12所述的方法，其中：

(i)该组合物进一步包含与该RGEN的蛋白组分缔合的至少一种RNA组分；或

(ii)该细胞包含该RNA组分，其中在该RGEN蛋白-CPP复合物进入该细胞之后，该RNA组分与该RGEN的蛋白组分缔合；

其中该RNA组分包含与在该细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合该靶位点序列，并且任选地在该靶位点序列处切割一条或两条DNA链。

14.如实施例13所述的方法，其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。

15.如实施例14所述的方法，其中该细胞进一步包含供体多核苷酸，该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列。

16.如实施例12所述的方法，其中该细胞是非哺乳动物细胞。

17.一种组合物，该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，其中该细胞任选地是植物细胞。

18.如实施例17所述的组合物，其中该Cas内切核酸酶是植物优化的Cas9内切核酸酶。

19.如实施例17所述的组合物，其中该引导多核苷酸包含

(i)与在靶DNA中的核苷酸序列互补的第一核苷酸序列结构域，以及

(ii)与Cas内切核酸酶相互作用的第二核苷酸序列结构域，

其中该第一核苷酸序列结构域和该第二核苷酸序列结构域由脱氧核糖核酸(DNA)、核糖核酸(RNA)或其组合构成。

20.如实施例17所述的组合物，其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过植物细胞的细胞壁。

21.如实施例17所述的组合物，其中该CPP包含：

(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，

(ii)具有6个或更多个连续精氨酸残基的CPP，

(iii)转运蛋白-10(TP10)CPP，

(iv)来自血管内皮钙粘素蛋白的CPP，或

22.如实施例20所述的组合物，其中该植物细胞是单子叶植物细胞或双子叶植物细胞。

23.如实施例22所述的组合物，其中该单子叶植物选自下组，该组由以下各项组成：玉米、水稻、高粱、黑麦、大麦、小麦、小米、燕麦、甘蔗、草坪草和柳枝稷。

24.如实施例22所述的组合物，其中该双子叶植物选自下组，该组由以下各项组成：大豆、卡诺拉、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥和红花。

25.一种用于在细胞的基因组中修饰靶位点的方法，该方法包括向该细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶，其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，其中该细胞任选地是植物细胞。

26.如实施例25所述的方法，进一步包括鉴定在该靶位点处具有修饰的至少一种植物细胞，其中在该靶位点处的该修饰选自下组，该组由以下各项组成：(i)至少一个核苷酸的替代，(ii)至少一个核苷酸的缺失，(iii)至少一个核苷酸的插入，和(iv)(i)-(iii)的任意组合。

27.如实施例25所述的方法，其中该植物细胞是单子叶植物细胞或双子叶植物细胞。

28.一种组合物，该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，并且

其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

29.如实施例28所述的组合物，其中该RGEN的蛋白组分与至少一种RNA组分缔合，该RNA组分包含与该微生物细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合该靶位点序列，并且任选地在该靶位点序列处切割一条或两条DNA链。

30.如实施例28所述的组合物，其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。

31.一种微生物细胞，包含根据实施例28所述的组合物。

32.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法，该方法包括：

使该微生物细胞与包含该RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触，

其中该RGEN蛋白-CPP复合物穿过该微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜，从而进入该微生物细胞。

33.如实施例32所述的方法，其中：

(ii)该微生物细胞包含该RNA组分，其中在该RGEN蛋白-CPP复合物进入该微生物细胞之后，该RNA组分与该RGEN的蛋白组分缔合；

其中该RNA组分包含与在该微生物细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合该靶位点序列，并且任选地在该靶位点序列处切割一条或两条DNA链。

34.如实施例33所述的方法，其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。

34.如实施例34所述的方法，其中该微生物细胞进一步包含供体多核苷酸，该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列。

36.如实施例32所述的方法，其中该微生物细胞是酵母细胞。

37.一种组合物，该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

38.如实施例37所述的组合物，其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过该微生物细胞的细胞壁。

39.一种用于修饰微生物细胞的基因组中的靶位点的方法，该方法包括向该微生物细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶，其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

23.如实施例39所述的方法，进一步包括鉴定在该靶位点处具有修饰的至少一种微生物细胞，其中在该靶位点处的该修饰选自下组，该组由以下各项组成：(i)至少一个核苷酸的替代，(ii)至少一个核苷酸的缺失，(iii)至少一个核苷酸的插入，和(iv)(i)-(iii)的任意组合。

实例

将在以下的实例中进一步定义所披露的发明。应该理解，这些实例尽管说明了本发明的某些优选方面，但仅是以例证的方式给出的。通过上述论述和这些实施例，本领域的技术人员可确定本发明的必要特征，并且在不脱离本发明的精神和范围内的前提下，可对本发明进行各种变化和修改以使其适应多种用途和条件。

实例1

用于在大肠杆菌中表达Cas9-CPP(细胞穿透肽)融合蛋白的载体

在本实例中，产生被设计用于包含Cas9蛋白和细胞穿透肽(CPP)的翻译融合蛋白的可诱导表达的载体，并测试其在大肠杆菌中的表达。显示Cas9-CPP融合蛋白如预期在大肠杆菌中表达，并且随后被纯化。

来自化脓性链球菌M1 GAS(SF370)的Cas9基因的开放阅读框经密码子优化用于在耶氏酵母中按标准技术进行表达，产生SEQ ID NO：1。编码猿病毒40(SV40)单份的细胞核定位信号(NLS)加上短连接体(4个氨基酸)的DNA序列被掺入到SEQ ID NO：1的最后一个有义密码子之后以产生SEQ ID NO：2。SEQ ID NO：2编码在SEQ ID NO：3中所示的氨基酸序列。SEQ ID NO：3的最后7个氨基酸编码所添加的NLS，而SEQ ID NO：3的位置1369-1372处的残基编码所添加的连接体。通过标准分子生物学技术将耶氏酵母属密码子优化的Cas9-NLS序列(SEQ ID NO：2)与耶氏酵母属组成型启动子FBA1(SEQ ID NO：4)连接。包含组成型FBA1启动子、耶氏酵母属密码子优化的Cas9、和SV40NLS的耶氏酵母属密码子优化的Cas9表达盒在SEQ ID NO：5阐述。将该Cas9表达盒(SEQ ID NO：5)克隆到质粒pZUF，产生构建体pZUFCas9(图1，SEQ ID NO：6)。

使用标准分子生物学技术从pZUFCas9(SEQ ID NO：6)PCR扩增耶氏酵母属密码子优化的Cas9-NLS序列。用于PCR反应的引物是SEQ ID NO：7(正向)和SEQ ID NO：8(反向)，其分别向扩增的DNA产物添加5’EcoRI位点和3’HindIII位点。在扩增产物中添加的5’EcoRI位点替代了Cas9-NLS开放阅读框(ORF)的ATG起始密码子。扩增产物(SEQ ID NO：9)用EcoRI和HindIII进行消化，然后使用Zymoclean^TM和浓缩柱(Zymo研究公司，加利福尼亚州欧文市(Irvine，CA))进行纯化。将纯化的DNA片段克隆到来自生命科技公司(Life Technologies)(加利福尼亚州卡尔斯巴德)的质粒pBAD/HisB的EcoRI和HindIII位点(图2A，SEQ ID NO：10)中，以产生质粒构建体pRF48(图2B，SEQ ID NO：11)。质粒pRF48能够在大肠杆菌中表达在其N-末端包含六组氨酸(6xHis)标签的Cas9-NLS。

为了将细胞穿透肽(CPP)序列融合到Cas9-NLS，制备了各自的DNA多核苷酸序列，每个密码子被优化以用于在大肠杆菌中表达并且包含编码与以下特定CPP氨基酸序列连接的6xHis标签的序列：Zebra肽(ECDSELEIKRYKRVRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMC，SEQ ID NO：12)，来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白；pVEC肽(LLIILRRRIRKQAHAHSK，SEQ ID NO：13)，来自鼠内皮钙粘素蛋白；TP10肽(AGYLLGKINLKACAACAKKIL，SEQ ID NO：14)，来自神经肽甘丙肽蛋白；以及合成的富精氨酸“PolyR”肽(GGGGRRRRRRRRRLLLL，SEQ ID NO：15)。每个DNA多核苷酸序列包含5′-末端NcoI限制位点和3′-末端EcoRI位点，以产生如下结构的克隆序列：NcoI-6xHis-CPP-EcoRI(SEQID NO：16-19)。将SEQ ID NO：16-19中的每一个单独克隆到pRF48的NcoI和EcoRI位点，从而产生能够在大肠杆菌中表达某些6xHis-CPP-Cas9-NLS融合蛋白的质粒构建体。具体地，制备用于表达6xHis-Zebra CPP-Cas9-NLS融合物的质粒构建体pRF144(图3A，SEQ ID NO：20)；制备用于表达6xHis-PolyR CPP-Cas9-NLS融合物的质粒构建体pRF145(图3B，SEQ IDNO：21)；制备用于表达6xHis-TP10 CPP-Cas9-NLS融合物的质粒构建体pRF146(图3C，SEQID NO：22)；并且制备用于表达6xHis-pVEC CPP-Cas9-NLS融合物的质粒构建体pRF162(图3D，SEQ ID NO：23)。

将质粒pRF48、pRF144、pRF145、pRF146和pRF162中的每一个单独转化到TOP10感受态细胞(生命科技公司)中。细胞在含有0.4％(w/v)葡萄糖和100μg/mL氨苄青霉素的L肉汤(米勒公司(Miller))中在37℃下振摇(220rpm)生长过夜。每个预培养物在含有100μg/mL氨苄青霉素的2X YT培养基中以1∶100稀释，并在37℃下伴随振摇(220rpm)进一步生长。当培养物达到约0.5的OD₆₀₀时，通过添加L-阿拉伯糖至0.2％(w/v)的终浓度来诱导来自每个质粒的蛋白质表达。培养物在18℃下振摇(200rpm)培养另外的18小时。细胞在4℃以5000x g沉淀15分钟。处理培养基，并且将细胞沉淀物在-80℃下冷冻至少4小时。将细胞沉淀在冰上解冻15分钟，并且重悬于15mL的裂解缓冲液(20mM tris pH 7.5、500mM NaCl、1mM MgCl₂、10mM咪唑、120单位/mL DNaseI、1mM PMSF、1mM DTT)每升原始培养物中。通过两次通过16000psi的大弗细胞压力池(French pressure cell)来裂解细胞。细胞碎片在4℃下以20000x g沉淀30分钟。将上清液转移到50-mL圆锥管中，向其中添加2ml的含有Ni-NTA树脂(凯杰公司(Qiagen))的50％浆液以结合每个表达的融合蛋白的6xHis标签。将每个管在4℃下缓慢旋转1小时，然后应用到允许上清液流过的空的重力柱。取流出的样品(75μL)，添加到25μL的4x还原的Laemmeli缓冲液中，并储存在冰上。用5ml的洗涤缓冲液(20mM tris pH7.5、500mM NaCl、10mM咪唑、1mM PMSF、1mM DTT)在每个柱中洗涤树脂四次。从每次洗涤中取出样品(75μL)，添加到25μL的4x还原的Laemmeli缓冲液中，并储存在冰上。将洗脱缓冲液(20mM Tris pH 7.5、500mM NaCl、1mM MgCl₂、500mM咪唑、1mM PMSF、1mM DTT)的1-ml等分试样应用到每个柱中的树脂上，并允许其孵育10分钟。通过在280nm处的吸光度监测蛋白质洗脱。从每个洗脱液中取出样品(75μL)，添加到25μL的4x还原的Laemmeli缓冲液中，并储存在冰上。对于每个质粒表达实验，将含有来自柱的洗脱蛋白质的级分合并，加载到10000MWCO透析膜中，并针对透析缓冲液(25mM HEPES/KOH pH 7.5、200mM KCl、20％甘油、1mM DTT)在4℃下透析至少14小时。使用Bradford测定法和在565nm处的吸光度测定每种透析液的蛋白质浓度。将纯化的蛋白质分成两个等分试样，其中一份在-80℃下冷冻并且另一份在4℃下储存在冰上。对于每个质粒表达实验将在柱纯化过程期间取出的样品在95℃下加热5分钟，并且加载到具有4％(w/v)堆积凝胶的8％(w/v)tris-甘氨酸聚丙烯酰胺分离胶上。将蛋白质在200伏特下电泳分离30分钟，并用考马斯蓝染色。用于6xHis-Zebra-Cas9-NLS纯化过程的凝胶作为实例示于图4中。

因此，表达和分离了四种不同的CPP-Cas9融合蛋白。这些融合蛋白代表本文中RGEN蛋白-CPP复合物的实例。

实例2

通过体外转录表达短引导RNA(sgRNA)

在本实例中，设计了编码sgRNA的DNA序列，该sgRNA分别在核酶的5′-和3′-末端与其融合(称为“RGR”)。RGR序列允许具有精确定义的末端的sgRNA通过T7 RNA聚合酶进行体外转录。

图5示出了sgRNA分子，其是含有两个区域(可变靶向结构域(VT)(引导序列)和Cas内切核酸酶识别(CER)结构域)的单个RNA分子(SEQ ID NO：24代表CER的实例)。VT区域可以是例如与靶向的核酸分子具有同一性的20mer的RNA多核苷酸。VT结构域指定了位于PAM基序5′的靶位点中用于切割的靶位点。CER结构域与Cas9蛋白相互作用，并且允许VT结构域与Cas9蛋白相互作用和指导Cas9蛋白切割(Jinek等人，Science[科学]337：816-821)。VT和CER结构域两者都是sgRNA的功能所必需的。

向sgRNA序列添加5′锤头状(HH)和3′丁型肝炎病毒(HDV)核酶允许从任何启动子表达sgRNA，而不考虑一些RNA聚合酶的某些转录要求(例如，T7RNA聚合酶需要一个直接在转录起始后的转录的G残基，但具有三个转录的G残基时作用最佳)。当表达这样的sgRNA时，存在于前sgRNA转录物中的核酶自切割，从而与转录物分离，留下未修饰的sgRNA。

制备了编码在解脂耶氏酵母中靶向Can1-1基因座(SEQ ID NO：25)的sgRNA的DNA序列；该sgRNA包含SEQ ID NO：24作为其CER结构域。sgRNA编码序列在其5′-末端与编码HH核酶(SEQ ID NO：26)的序列连接，并在其3′-末端与编码HDV核酶(SEQ ID NO：27)的序列连接，这样使得HH核酶的前6个碱基与sgRNA的VT区域的前6个碱基反向互补。该特定RGRsgRNA由SEQ ID NO：28编码。然后将SEQ ID NO：28的RGR sgRNA经由标准分子生物学技术与T7RNA聚合酶启动子(SEQ ID NO：29)连接以产生质粒pRF46(SEQ ID NO：30)。

使用标准技术从质粒pRF46(SEQ ID NO：30)PCR扩增T7-RGR sgRNA编码序列。PCR反应的引物是SEQ ID NO：31(T7正向引物)和SEQ ID NO：32(gRNArev1反向引物)。PCR产物通过乙醇沉淀来纯化，并重悬于ddH₂O中；将该DNA用作体外转录反应中的模板。在20-μL体外转录反应(MEGAshortscript^TM T7试剂盒，生命科技公司)中添加模板DNA至150nM的终浓度。允许反应进行不同的时间(2小时、4小时、6小时和过夜)以确定体外转录的合适条件(图6)。然后在37℃下用10个单位的DNaseI处理反应15分钟以除去模板DNA。使用乙醇和标准方案沉淀RNA。每个20-μl体外转录反应产生在60和100μg之间的RNA。

因此，在体外合成了具有定义的5′-和3′-末端的sgRNA。如在下面实例3中所示，体外转录的sgRNA可以与Cas9-CPP融合蛋白缔合以形成RGEN-CPP复合物。

实例3

使用与sgRNA复合的Cas9-CPP融合蛋白进行的靶DNA序列的特异性体外切割

在本实例中，测试与sgRNA复合的Zebra CPP-Cas9融合蛋白(包含SEQ ID NO：39)的靶向内切核酸酶功能，以证实与CPP的融合不阻碍Cas9内切核酸酶活性。

含有SEQ ID NO：25的Can1-1靶序列的体外Canl切割试验DNA多核苷酸(SEQ IDNO：35)从解脂耶氏酵母细胞(ATCC 20362)PCR扩增并且使用标准技术进行纯化。PCR反应的引物是SEQ ID NO：33(IV-上正向引物)和SEQ ID NO：34(IV-下反向引物)。

将纯化的Zebra CPP-Cas9融合蛋白(600ng，在实例1中制备)、靶向Canl-1靶位点的sgRNA(250ng，在实例2中制备)、NEBuffer 3.1(马萨诸塞州伊普斯维奇市新英格兰生物实验室(New England BioLabs，Ipswich，MA))和Can1切割试验DNA(150ng，SEQ ID NO：35)在10μL反应物(用ddH₂O将体积调至最终体积)中混合。作为阴性对照，还制备了缺乏ZebraCPP-Cas9融合蛋白或缺乏sgRNA的反应。作为阳性对照，在反应中使用野生型Cas9蛋白(加利福尼亚州千橡市PNA生物公司(PNA Bio，Thousand Oaks，CA))而不是Zebra CPP-Cas9。将反应在37℃下孵育60分钟。然后，将RNaseI(4μg)添加到每个反应中，并且在37℃下孵育15分钟以降解sgRNA。添加终止溶液(1μL；30％[w/v]甘油、1.2％[w/v]SDS、250mM EDTA，pH8.0)以终止反应，然后在37℃下将该反应进一步孵育15分钟。将每个反应物加载到1.2％FlashGel^TM(瑞士巴塞尔龙沙公司(Lonza，Basel，Switzerland))上，并在200伏特下电泳10分钟(图7)。由Zebra CPP-Cas9提供的靶DNA切割模式与由野生型Cas9提供的切割模式一致(图7)，从而表明Zebra CPP-Cas9融合物在体外正常发挥功能。此外，使用已经进行了两次冻融循环的Zebra CPP-Cas9/sgRNA也没有抑制该活性。

因此，与合适的sgRNA复合的CPP-Cas9融合蛋白(即，RGEN-CPP复合物的实例)具有特异性DNA切割活性。已显示该活性与野生型Cas9-sgRNA复合物的活性相似，从而表明CPP融合物不抑制Cas9-sgRNA内切核酸的功能。虽然在本实例中的CPP-Cas9融合蛋白包含SEQID NO：39(Zebra CPP-Cas9)，但是考虑了包含例如SEQ ID NO：40、41或42的CPP-Cas9融合蛋白，当与作为RNA组分的合适的sgRNA缔合时，也具有切割活性。

实例4

将CPP-Cas9/sgRNA复合物递送到酵母细胞中并在其中切割靶DNA

在本实例中，测试了与sgRNA复合的Zebra CPP-Cas9融合蛋白(包含SEQ ID NO：39)(Zebra CPP-Cas9/sgRNA)在与细胞接触之后进入酵母细胞的能力。对Can1-1特异的Zebra CPP-Cas9/sgRNA能够进入细胞并切割Canl基因，从而使细胞成为对刀豆氨酸有抗性的。

将解脂耶氏酵母酵母细胞(ATCC 20362)在30℃、振摇(220rpm)下、在YPD(2％葡萄糖、2％蛋白胨、1％酵母提取物)液体培养基中生长至OD₆₀₀＝0.5(约5x10⁶个细胞/mL培养基)。将纯化的Zebra CPP-Cas9融合蛋白(在实例1中制备)和靶向Can1-1靶位点的sgRNA(在实例2中制备)分别以1：3的摩尔比混合在实例1中使用的透析缓冲液中，并且在室温下预孵育15分钟以允许sgRNA与Zebra CPP-Cas9缔合。将5x10⁵解脂耶氏酵母细胞混合到ZebraCPP-Cas9/sgRNA制剂中，这样使得Zebra CPP-Cas9的终浓度为1μM、2.5μM或5μM。将细胞也与5μM终浓度的Zebra CPP-Cas9单独(不含sgRNA作为RNA组分)混合，作为阴性对照。将所有细胞-Cas9制剂在30℃、振摇(220rpm)下孵育2小时。然后将细胞连续稀释1000倍和10000倍。将每个连续稀释液(100μL)涂板到缺乏精氨酸(CM-Arg)的完全培养基上，并允许在30℃下回收48小时。

计数10^-3稀释板的菌落以确定涂板的细胞的总数。经由重复涂板技术将菌落转移到具有刀豆氨酸(60μg/mL)的CM-Arg板上。允许菌落在30℃下生长48小时。将对刀豆氨酸有抗性的菌落的数量进行评分，并除以菌落的总数(来自不含刀豆氨酸的板)以确定每种情况的突变频率。使细胞与Zebra CPP-Cas9/sgRNA复合物接触产生了以总菌落的约2％至10％的频率对刀豆氨酸具有抗性的菌落(图8)。预期这种刀豆氨酸抗性是归因于在Can1基因编码序列中在预测的Cas9切割位点处/其附近的插入缺失形成导致的Can1基因功能的丧失。然而，使细胞与单独的Zebra CPP-Cas9(没有sgRNA)接触没有产生对刀豆氨酸有抗性的菌落(图8)，表明实验细胞中的刀豆氨酸抗性依赖于给予至CPP-Cas9蛋白的基于sgRNA的特异性。鉴于酵母细胞的性质，CPP-Cas9/sgRNA复合物可能必须穿过细胞壁和细胞膜两个结构以介导特异性DNA靶向。

因此，与合适的sgRNA复合的CPP-Cas9融合蛋白(即，RGEN-CPP复合物的实例)能够进入酵母细胞(穿过细胞壁和细胞膜)并靶向其中的特异性DNA序列。虽然在本实例中的CPP-Cas9融合蛋白包含SEQ ID NO：39(Zebra CPP-Cas9)，但是考虑了包含例如SEQ ID NO：40、41或42的CPP-Cas9融合蛋白，当与作为RNA组分的合适的sgRNA缔合时，也具有细胞进入活性且在细胞中具有特异的DNA靶向活性。

实例5

将CPP促进性Cas9/sgRNA复合物递送到植物细胞中并在其中切割靶DNA

可以通过将大豆愈伤组织细胞与融合到CPP的DS-RED荧光蛋白一起孵育来测试CPP促进性蛋白质向大豆细胞中的递送。预期荧光信号在CPP-DS-RED处理中产生，但不在仅与DS-RED蛋白质一起孵育的对照中产生。能以这种方式测试各种CPP，以帮助鉴定用于植物细胞穿透和蛋白质货物递送的最有效CPP。可以测试的CPP的一些实例包括：

(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，

(ii)具有6个或更多个连续精氨酸残基的CPP，

(iii)转运蛋白-10(TP10)CPP，

(iv)来自血管内皮钙粘素蛋白的CPP，或

(vi)选自下组的CPP，该组由以下各项组成：合成九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP。合成的九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP的实例披露在例如Liu等人(Advanced Studies in Biology[生物学高级研究]5(2)：71-88，HIKARI公司)。

体外翻译的Cas9蛋白和合成的sgRNA可以与CPP通过自身或融合(例如，上文中的CPP-DS-RED)来混合，并且与大豆愈伤组织一起孵育来测试Cas9/sgRNA是否可以转运到细胞中。一旦在细胞中，Cas9/sgRNA复合物可以识别由sgRNA靶向序列指定的基因组靶标来产生DNA双链断裂(DSB)。通过细胞机器自发修复DSB可能通过非同源末端连接(NHEJ)导致突变，或者如果存在适当的供体DNA，则可能通过同源重组导致基因整合。CPP也可以共价连接到Cas9蛋白上以获得潜在更好的效率。例如，可以通过PCR分析在特异性靶位点上检测突变或基因整合来验证CPP-Cas9/sgRNA递送到大豆细胞中以及CPP-Cas内切核酸酶复合物由此穿过植物细胞壁和植物细胞膜的转移的成功。

实例6

从大肠杆菌细胞表达和纯化CPP-dsREDexpress蛋白质。

为了快速评估给定的细胞穿透肽进入特定细胞类型的能力，产生了与dsREDexpress蛋白质(SEQ ID NO：85)的CPP融合物，将其在大肠杆菌细胞中表达，并纯化。CPP-dsREDexpress蛋白质融合物是一种允许通过给定的CPP快速评估货物递送到给定细胞类型中的工具。这允许选择物种、细胞类型或菌株特异的CPP分子，以便通过显微镜检查或流式细胞术分析评估细胞荧光来以快速和高通量方式最大化货物的递送。

合成了大肠杆菌密码子优化的dsREDexpress基因(SEQ ID NO：86)(IDT DNA)并将其克隆到的pBAD/HisB(SEQ ID NO：87)的NcoI/HinDIII位点，产生pRF161(SEQ ID NO：88)。大肠杆菌密码子优化的dsREDexpress包含内部EcoRI位点，这样使得用NcoI/EcoRI消化质粒将允许his标签被各种his标签-CPP序列替代以产生his标签-CPP-dsREDexpress融合表达质粒。各种his-标签-CPP融合物；TAT(SEQ ID NO：89)、TLM(SEQ ID NO：90)、MPG1(SEQ IDNO：91)、pep1(SEQ ID NO：92)和CFFKDEL(SEQ ID NO：93)；是针对大肠杆菌进行了密码子优化的，并且其侧翼有框架内5’NcoI和3’EcoRI位点(分别为SEQ ID NO：94-98)，并且使用标准技术将其克隆到pRF161的NcoI/EcoRI位点(SEQ ID NO：88)，his标签序列用相应的his标签-CPP融合物替代并产生质粒pRF224(his-TAT-dsREDexpress SEQ ID NO：99)、pRF214(his-TLM-dsREDexpress SEQ ID NO：100)、pRF213(his-MPG1-dsREDexpress SEQ ID NO：101)、pRF217(his-pep1-dsREDexpress SEQ ID NO：102)、pRF216(his-CFFKDEL-dsREDexpress SEQ ID NO：103)。使用标准测序技术和oligo 36(SEQ ID NO：104)验证插入片段的序列。

通过标准PCR技术，使用oligo 36(SEQ ID NO：104)和oligo 153(SEQ ID NO：111)，分别从pRF144(SEQ ID NO：108)、pRF162(SEQ ID NO：109)和pRF146(SEQ ID NO：110)PCR扩增大肠杆菌密码子优化的His-Zebra(SEQ ID NO：105)、His-tp10(SEQ ID NO：106)和His-pVEC(SEQ ID NO：107)。将PCR片段克隆到pRF161(SEQ ID NO：88)的NcoI/EcoRI位点，产生质粒pRF186(his-Zebra-dsREDexpress SEQ ID NO：112)、pRF192(his-tp10-dsREDexpress SEQ ID NO：113)和pRF190(his-pVEC-dsREDexpress SEQ ID NO：114)。使用oligo 36(SEQ ID NO：104)验证序列。

使用标准技术表达His标记的CPP-dsREDexpress融合蛋白。简言之，在37℃和220RPM下，在125ml烧瓶中，在10ml ZYM-505(1％N-Z胺、0.5％酵母提取物、5％甘油、1.0％右旋糖、25mM Na₂HPO₄、25mM KH₂PO₄、50mM NH₄Cl、5mM Na₂SO₄、1x微量金属(泰克诺瓦公司(Teknova))、5x10^-5％硫胺素、2mM MgCl₂、100μg/ml氨苄青霉素)或溶原肉汤(lysogenybroth)(1％胰蛋白胨、0.5％酵母提取物、1％氯化钠、100μg/ml氨苄青霉素、0.4％右旋糖)中将细胞预孵育12-16小时。将预培养物以1∶1000(ZYM-505)在500ml ZYM-5052(1％N-Z胺、0.5％酵母提取物、5％甘油、0.5％右旋糖、2％L-阿拉伯糖、25mM Na₂HPO₄、25mM KH₂PO₄、50mM NH₄Cl、5mM Na₂SO₄、1x微量金属(泰克诺瓦公司(Teknova))、5x10^-5％硫胺素、2mMMgCl₂、100μg/ml氨苄青霉素)中，或以1∶100(裂解肉汤)在500ml 2x YT(1.6％胰蛋白胨、1％酵母提取物、0.5％NaCl、100μg/ml氨苄青霉素)中稀释，并且在37℃220RPM下、在2.9LFernbach烧瓶中生长至OD₆₀₀为约0.5。向2x YT培养物中添加L-阿拉伯糖至终浓度为0.1％，并且将所有培养物转移至18℃220RPM持续20-30小时以进行蛋白质表达。以5000RPM收集细胞10分钟，丢弃耗尽的培养基，并且在-80℃冷冻细胞沉淀。

将细胞沉淀解冻并重悬于变性裂解缓冲液(50mM Tris pH 8.0、150mM NaCl、8M尿素、20mM咪唑)中，并经由穿过在16,000PSI下的弗细胞压力池两次进行裂解。通过在10,000g、4℃下离心15分钟从上清液中除去固体沉淀物。将20μl澄清的提取物与20μl的2xLaemmli缓冲液(4％SDS、20％甘油、100mM DTT、0.004％溴酚蓝、125mM Tris pH 6.8)混合，加热至95℃持续5分钟并在-20℃下冷冻保存用于分析。将澄清的提取物与6ml 50％(v/v)镍-NTA-琼脂糖浆在室温下混合1小时。在2000RPM下将珠粒从混合物中沉淀5分钟。除去上清液，并且取出20μl样品作为澄清的提取物。将沉淀的珠粒重悬于10ml的变性裂解缓冲液中，并应用于重力流色谱柱。允许液体流出，留下一层塞满的珠粒。该层使用不同比率的洗涤缓冲液1(50mM Tris pH 8.0、150mM NaCl、8M尿素、20mM咪唑)和洗涤缓冲液2(50mM TrispH 8.0、500mM NaCl、20mM咪唑)以系列洗涤液来洗涤，以逐步降低变性剂(尿素)的浓度并逐步提高NaCl的浓度，并允许蛋白质在柱上重新折叠。简言之，该柱用以下缓冲液洗涤(缓冲液1：缓冲液2)：10ml的1∶0(8M尿素、150mM NaCl)、10ml的7∶1(7M尿素、194mM NaCl)、10ml的3∶1(6M尿素、238mM NaCl)10ml的5∶3(5M尿素、281mM NaCl)、10ml的1∶1(4M尿素、325mMNaCl)、20ml的3∶5(3M尿素、369mM NaCl)、20ml的1∶3(2M尿素、413mM NaCl)、20ml的3∶13(1.5M尿素、434mM NaCl)、20ml的1∶5(1M尿素、456mM NaCl)、20ml的1∶15(0.5M尿素、478mMNaCl)、以及30ml的0∶1(0M尿素、500mM NaCl)。将蛋白质以10x1ml级分在天然洗脱缓冲液(50mM Tris pH 8.0、500mM NaCl、10％甘油、500mM咪唑)中洗脱。含有洗脱的dsREDexpress或CPP-dsREDexpress蛋白质的级分是红色的。将红色的级分合并，并且在室温下、在10,000MWCO再生纤维素透析膜中、用1000体积的透析缓冲液(50mM Tris pH 8.0、10％甘油)透析过夜。将蛋白质溶液从透析膜中除去并使用0.22μM膜进行过滤灭菌。处理20μl的蛋白质溶液作为澄清的细胞提取物。

将在Laemmli缓冲液中纯化期间取出的样品加热至95℃持续5分钟并加载到12.5％PAGE凝胶上。将凝胶在200伏特恒压下运行1小时，并使用简单蓝(Simply blue)染料染色。用于纯化CPP-dsREDexpress标记的蛋白质的代表性PAGE凝胶的实例示于图9中。使用牛血清白蛋白作为标准品，使用Pierce^TM Coomassie Plus测定法来确定每种纯化蛋白质的总蛋白质浓度。每种纯化的CPP-dsREDexpress融合物的浓度在表3中给出。

表3：纯化dsREDexpress蛋白融合物的浓度。

实例7

从大肠杆菌细胞表达和纯化另外的CPP-Cas9蛋白。

将Cas9递送到不同的细胞类型可能需要用不同的CPP分子标记的Cas9。为了分离各种CPP-Cas9融合蛋白，将不同的CPP与大肠杆菌表达载体中的Cas9融合。这些蛋白质从大肠杆菌细胞中表达和纯化，用于将Cas9/sgRNA核糖核蛋白复合物CPP介导递送至细胞。

为了制得His-CFFKDEL-Cas9(SEQ ID NO：115)和His-MPG1-Cas9(SEQ ID NO：116)融合表达盒，分别使用产生质粒pRF243(his-CFFKDEL-Cas9 SEQ ID NO：118)和pRF238(his-MPG1-Cas9，SEQ ID NO：119)的标准技术，将pRF216(CFFKDEL SEQ ID NO：103)或pRF213(MPG1 SEQ ID NO：101)的NcoI/EcoRI片段克隆到Cas9蛋白表达质粒pRF48(SEQ IDNO：117)的相同位点。使用oligo 36(SEQ ID NO：104)经由Sanger测序确认了MPG1-Cas9或CFFKDEL-Cas9融合盒的正确构建。

使用标准技术表达His标记的CPP-Cas9融合蛋白。简言之，在37℃和220RPM下，在125ml烧瓶中，在10ml ZYM-505(1％N-Z胺、0.5％酵母提取物、5％甘油、1.0％右旋糖、25mMNa₂HPO₄、25mM KH₂PO₄、50mM NH₄Cl、5mM Na₂SO₄、1x微量金属(泰克诺瓦公司(Teknova))、5x10^-5％硫胺素、2mM MgCl₂、100μg/ml氨苄青霉素)或溶原肉汤(lysogeny broth)(1％胰蛋白胨、0.5％酵母提取物、1％氯化钠、100μg/ml氨苄青霉素、0.4％右旋糖)中将细胞预孵育12-16小时。将预培养物以1∶1000(ZYM-505)在500ml ZYM-5052(1％N-Z胺、0.5％酵母提取物、5％甘油、0.5％右旋糖、2％L-阿拉伯糖、25mM Na₂HPO₄、25mM KH₂PO₄、50mM NH₄Cl、5mMNa₂SO₄、1x微量金属(泰克诺瓦公司(Teknova))、5x10^-5％硫胺素、2mM MgCl₂、100μg/ml氨苄青霉素)中，或以1∶100(裂解肉汤)在500ml 2x YT(1.6％胰蛋白胨、1％酵母提取物、0.5％NaCl、100μg/ml氨苄青霉素)中稀释，并且在37℃220RPM下、在2.9L Fernbach烧瓶中生长至OD₆₀₀为约0.5。向2x YT培养物中添加L-阿拉伯糖至终浓度为0.1％，并且将所有培养物转移至18℃220RPM持续20-30小时以进行蛋白质表达。以5000RPM收集细胞10分钟，丢弃耗尽的培养基，并且在-80℃冷冻细胞沉淀。如实例1中所述来纯化蛋白质。如通过Coomasie Plus测定法(Pierce^TM)确定的纯化CPP-Cas9蛋白的终浓度在表4中列出。

表4：纯化的CPP-Cas9蛋白的浓度。

蛋白质	mg/ml	μM
			Zebra-Cas9(SEQ ID NO：758)	1.5	9
CFFKDEL-Cas9(SEQ ID NO：730)	4.6	28
			MPG1-Cas9(SEQ ID NO：731)	3.8	23
pVEC-Cas9(SEQ ID NO：759)	2.5	15

实例8

在大肠杆菌细胞中CPP-Cas9/gRNA介导的基因靶向。

本实例显示用CPP-Cas9/sgRNA核糖核蛋白复合物处理大肠杆菌，其中sgRNA靶向大肠杆菌的galK基因。CPP-Cas9/sgRNA进入细胞中允许在galK基因内发生的靶向和切割，通过易错DNA修复机制导致基因失活，其在表型上可以被监测为对半乳糖的抗性。这种方法依赖于经由CPP介导的递送将Cas9/sgRNA货物递送到细胞中。

大肠杆菌的galK基因(SEQ ID NO：120)负责在糖半乳糖存在下在galE突变体中观察到的半乳糖敏感表型。当半乳糖进入细胞时，其被半乳糖激酶(galK基因(SEQ ID NO：120)的产物)磷酸化。半乳糖磷酸盐对细胞有毒性。在野生型细胞中，半乳糖磷酸盐被gale(SEQ ID NO：121)和galT(SEQ ID NO：122)基因的产物进一步代谢并用作碳源。在galE或galT功能丧失突变体中，半乳糖磷酸盐积累导致细胞死亡。因此，可以在galE突变体的背景中选择在galK基因中的功能丧失突变，因为在半乳糖存在下允许菌落形成。

为了生产在galK2-1靶位点(SEQ ID NO：134)靶向galK基因(SEQ ID NO：120)的sgRNA(SEQ ID NO：135)，产生体外转录模板(SEQ ID NO：131)。首先，在标准PCR反应(SEQID NO：124)中，使用CER正向引物(SEQ ID NO：126)和通用反向引物(SEQ ID NO：127)从pRF291(SEQ ID NO：125)扩增编码CER结构域(SEQ ID NO：123)的DNA的PCR产物。使用25个柱的Zymo^TM清洁和浓缩(Zymo^TM clean and concentrate)来纯化编码CER的PCR产物(SEQID NO：124)，并在35μl的ddH₂O中洗脱。sgRNA体外转录模板的扩增使用了包含4个引物的多重PCR，这4个引物为：含有T7启动子的通用正向引物(SEQ ID NO：128)、含有某种T7启动子和某一靶位点的靶特异性正向引物(SEQ ID NO：129)、含有某一靶位点且与CER结构域重叠的靶反向引物(SEQ ID NO：130)、以及通用反向引物(SEQ ID NO：127)。使用Phusion flash预混物运行PCR反应，该预混物含有15nM CER结构域PCR产物(SEQ ID NO：124)、通用正向(SEQ ID NO：128)和反向引物(SEQ ID NO：127)各自1μM、以及靶正向(SEQ ID NO：129)和靶反向(SEQ ID NO：130)引物各自300nM。如标准反应那样进行PCR反应循环。使用25个柱的Zymo清洁和浓缩来纯化sgRNA体外转录模板(SEQ ID NO：131)，并在35μl的ddH₂O中洗脱。sgRNA体外转录模板(SEQ ID NO：131)含有T7启动子(SEQID NO：132)、编码galK2-1可变靶向结构域的DNA(SEQ ID NO：133)和编码CER结构域的DNA(SEQ ID NO：125)。如在实例2中所述进行产生galK2-1sgRNA(SEQ ID NO：135)的体外转录反应。

通过在37℃、220RPM下，在溶原肉汤(1％胰蛋白胨、0.5％酵母提取物、1％NAC1)中使缺失galE的大肠杆菌的菌株生长过夜，进行Cas9/sgRNA核蛋白复合物的CPP递送。培养物在新鲜的溶原肉汤中以1∶100稀释，并在37℃、220RPM下生长2小时以获得指数生长期的细胞。将CPP-Cas9(pvEC-Cas9(SEQ ID NO：144)、Zebra-Cas9(SEQ ID NO：143)、MPG1-Cas9(SEQ ID NO：116)、CFFKDEL-Cas9(SEQ ID NO：115))以10μM终浓度在10μM galK2-1sgRNA(SEQ ID NO：135)存在或不存在下，在50μl体积中在室温下孵育30分钟。对于该处理，将1.2ml的细胞以3000RPM沉淀3分钟，丢弃上清液，并且将细胞重悬于600μl的含有2x核酸酶缓冲液(200mM NaCl、100mM Tris-HCl、20mM MgCl₂、200μg/ml BSA pH 7.9)的LB中。将50μl的细胞悬浮液与每个反应以及仅gRNA(对照且不处理)混合。在37℃、220RPM下将样品孵育4小时。将100μl的10^-3、10^-4、和10^-5的样品稀释物涂板在溶原肉汤板上，以便在处理结束时获得活细胞计数，将反应的剩余物涂板在溶原肉汤板上并在37℃下孵育过夜。从10^-5稀释物中计数活细胞，以确定在样本溶菌肉汤板上涂板的活菌落形成单位(CFU)的数目。将样品板经由标准技术重复涂板到用1.5％(w/v)Bacto琼脂固化、含有0.2％(w/v)甘油和0.2％(w/v)半乳糖作为碳源的最小A培养基(1g/L(NH₄)₂SO₄、4.5g/L KH₂PO₄、10.5g/L K₂HPO₄、0.5g/L柠檬酸钠2H₂O、1mM MgSO₄·7H₂O、5x10^-5％硫胺素)上。将板在37℃下孵育24小时，然后为菌落形成打分。来自含有半乳糖的板上的galE菌株的每个CFU代表galK基因的基因失活事件。重复涂板的结果显示于表5中。

表5：在用CPP-Cas9/sgRNA处理的galE突变大肠杆菌细胞中galK基因失活的频率。

在一些情况下，用CPP-Cas9/sgRNA核糖核蛋白复合物处理大肠杆菌细胞超过未处理细胞的背景增强了galK失活的频率约4倍。仅用CPP-Cas9或仅用sgRNA处理的细胞中没有观察到这种增强，这表明galK基因失活的增加归因于CPP-Cas9/sgRNA核糖核蛋白进入细胞中并在galK基因内的galK2-1靶位点上产生DNA双链断裂。

实例9

将CPP-dsREDexpress蛋白递送到古细菌细胞中

为了测试使用细胞穿透肽将货物递送到古细菌细胞并确定穿过古细菌细胞壁的候选CPP，该古细菌细胞壁包含类似于细菌和真核细胞壁(例如磷脂)和膜的元件以及古细菌所特有的元件(例如S层)，用CPP-dsREDexpress蛋白质融合物处理古细菌细胞。在该筛选中鉴定的CPP可以用于将其他货物(例如Cas9/sgRNA核糖核蛋白复合物)递送至古细菌细胞。

将古生菌(archeon)嗜盐菌(Halobacterium salinarum)ATCC19700在用1.5％Bacto琼脂固化的培养基213(250g/L NaCl、10g/L MgSO₄·7H₂O、5g/L KCl、0.2g/L CaCl₂·6H₂O、10g/L酵母提取物、2.5g/L胰蛋白胨)上，在37℃下生长直到菌落形成(4天)。在250ml烧瓶中，使用单个菌落接种50ml的培养基213。使培养物在37℃、220RPM下生长直到OD₆₀₀达到约0.5(表明指数生长期)。在24孔块中，将100μl的细胞与无蛋白、5μM dsREDexpress(SEQID NO：85)、5μM MPGl-dsREDexpress(SEQ ID NO：136)、5μM pVEC-dsREDexpress(SEQ IDNO：137)、5μM CFFKDEL-dsREDexpress(SEQ ID NO：138)、5μM TLM-dsREDexpress(SEQ IDNO：139)、5μM pep1-dsREDexpress(SEQ ID NO：141)、或5μM tp10 dsRED-express(SEQ IDNO：142)混合。将混合物在37℃、220RPM下孵育4小时。将细胞用不含胰蛋白胨和酵母提取物的培养基213洗涤两次，并重悬于100μl的不含胰蛋白胨和酵母提取物的培养基213中。将细胞在Accuri C5流式细胞仪的红色通道中分析荧光，以确定哪些CPP标签已经将dsREDexpress货物递送到嗜盐菌(H.salinarum)细胞中。使用未处理的细胞来产生非红细胞和红细胞之间的流式细胞术数据的分析门控，这样使得门控产生落在红色门控中的未处理细胞的假阳性率为0.2％(表6)。

表6：CPP递送dsREDexpress至嗜盐菌。

¹数据代表三个重复±标准偏差。

将dsREDexpress货物递送到古细菌细胞中证明，至少三种细胞穿透肽(pVEC、TLM、tp10)能够将蛋白质货物递送到古细菌细胞中，其效率高达单独递送dsREDexpress蛋白的50倍以上，表明这三种CPP基序可以用于将其他货物递送到古细菌细胞(例如Cas9核糖核蛋白复合物)中。另外，CPP基序将货物递送到整个细胞群体的多达16％，表明通过CPP将货物递送到古细菌细胞中是一个有效的过程。

实例10

将CPP-dsREDexpress蛋白递送到真核生物细胞中

为了测试细胞穿透肽将货物递送到不同真核生物物种中的能力，使用各种CPP-dsREDexpress融合物处理三种物种(辣椒疫霉菌(Phytophthora capsici)(卵菌纲)、Septori tritici(真实真菌)和灰葡萄孢菌(Botrytis cinerea)(真实真菌))的小组。通过FACS分析针对各种CPP部分监测dsREDexpress货物的递送以确定向其递送货物的细胞的百分比。能够将dsREDexpress货物递送到这些细胞的CPP表明CPP将能够将其他货物递送到这些类型的真核生物细胞(例如Cas9/sgRNA核糖核蛋白复合物)中。

在23℃下、在黑暗中，使辣椒疫霉菌(P.capsici)在用1.8％Bacto琼脂固化的V8培养基(20％V8果汁、4.5g/L CaCO₃)上生长3天。然后将板放置在23℃下、在光下持续另外的7天。将板在4℃下冷却30分钟。将水置于板上以正好覆盖表面，并允许在室温下孵育30分钟。除去液体以收获游动孢子。经由显微镜检查分析确认了游动孢子。将等体积的2x胞囊形成培养基(40g/L胰蛋白胨、10g/L酵母提取物、200ml/L 10x SOC盐[5.84g/L NaCl、1.86g/LKCl、20.3g/L MgCl₂·6H₂O、24.6g/L MgSO₄·7H₂O、36g/L右旋糖]、36.4g/L山梨糖醇、1.47g/L CaCl₂·2H₂O)添加到游动孢子中并轻轻混合。将在胞囊形成培养基中的游动孢子在室温下孵育20分钟。显微镜检查确认了胞囊形成。将孢子沉淀并重悬于等体积的YMA培养基(2g/L酵母提取物、4g/L麦芽提取物)中，并使用血细胞计数器计数。在YMA中将游动孢子稀释至3x10⁷孢子/ml。将100μl的在YMA中的游动孢子与各种dsREDexpress融合蛋白(新实例5，表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na₂HPO₄·2H₂O、0.24g/L KH₂PO₄pH6.8)洗涤两次，并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacteriumsalinarium)，使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例9)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比，这样使得0.1％的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表7。pVEC、pep1和tp10比单独的dsREDexpress处理的细胞产生5.8、5.5、和1.8倍更多的红细胞，表明这些CPP部分可能是将其他货物递送到卵菌纲的候选物(例如Cas9/sgRNA核糖核蛋白复合物)

表7：CPP递送dsREDexpress至辣椒疫霉菌(Phytophora capsici)。

¹数据代表三个生物重复±标准偏差。

在黑暗中，使灰葡萄孢菌(B.cinerea)在用1.8％Bacto琼脂固化的PDA培养基(24g/L马铃薯右旋糖肉汤)上生长5至10天。使用无菌塑料涂布器将分生孢子收获在水中，并将其通过2层粗棉布过滤。将分生孢子在血细胞计数器上计数，并在YMA培养基中稀释至3x10⁷个分生孢子/ml。将100μl的在YMA中的分生孢子与各种dsREDexpress融合蛋白(新实例5，表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na₂HPO₄·2H₂O、0.24g/L KH₂PO₄pH6.8)洗涤两次，并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacteriumsalinarium)，使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例8)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比，这样使得0.1％的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表8。

表8：CPP递送dsREDexpress至灰葡萄孢菌(Botrytis cinerea)

¹数据代表三个生物重复±标准偏差。

在23℃、在光照下，使S.tritici在含有1.8％Bacto琼脂的YMA培养基上生长。在5至10天后，用无菌塑料涂布器和水收获分生孢子。将分生孢子在血细胞计数器上计数，并在YMA培养基中稀释至3x10⁷个分生孢子。将100μl的在YMA中的分生孢子与各种dsREDexpress融合蛋白(新实例5，表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na₂HPO₄·2H₂O、0.24g/L KH₂PO₄pH 6.8)洗涤两次，并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacterium salinarium)，使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例9)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比，这样使得0.1％的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表9。与单独的dsREDexpress相比，pVEC、TLM、pep1、和tp10分别增加了dsREDexpress递送25、4、3和5倍。这表明这些CPP将是递送其他货物至真实真菌的良好候选者(例如Cas9/sgRNA核糖核蛋白复合物)。

表9：CPP递送dsREDexpress至Septori tritici

¹数据代表三个生物重复±标准偏差。

实例11

将七个CPP-dsRED和两个CPP-tagRFP递送到七种肠道细菌中

在本实例中，测试了CPP将两种货物蛋白质(dsRED和tag RFP)递送到7种肠道细菌物种(其对宿主生理学的有益效果已被证明)中的效率。

在厌氧帐篷(80％N₂、15％CO₂、和5％H₂)中，在旋转振摇器中，以150rpm、在37℃下使细菌细胞在合适的培养基(参见表10)中生长过夜。对于该测定，在96孔板中将1x10⁸个细菌细胞与终浓度为5μM的CPP-dsRED和CPP-tagRFP蛋白混合，随后在37℃下过生长2小时。为了测量细胞中的dsRED和RFP荧光信号，通过离心(3,500×g，4℃，20min)收集细菌细胞，并将其在磷酸盐缓冲盐水(100μl/孔)中洗涤两次。荧光强度用装备有554nm激发和586nm发射过滤器、具有10nm带宽的Tecan Spark 10M板读数器(瑞士门内多夫帝肯公司(Tecan，Switzerland))进行定量。原始荧光值从未处理的细胞(背景)中减去。将7000的荧光强度值视为递送CPP至细胞内部的最小截断值。

表10.7种细菌物种的培养基

如在表11中所示，这些结果表明，包含MPG、pVEC、TLM、ZEBRA和pep1的五种CPP被有效地递送到属于厚壁菌门和拟杆菌门的厌氧肠道细菌中，从而表明CPP可以穿过这些细菌的细胞膜(表9)。

表11.如通过高于截断值7000的荧光强度显示的CPP在不同细菌菌株中的差异递送效率

序列表

<110> E.I.内穆尔杜邦公司（E. I. du Pont de Nemours and Company）

Fan, Xiaochun

Frisch, Ryan

Hong, Seung-Pyo

Jackson, Ethel Noland

<120> RNA引导的内切核酸酶进入细胞中的肽介导的递送

<130> CL6273 PCT

<150> 62/075999

<151> 2014-11-06

<160> 144

<170> PatentIn版本3.5

<210> 1

<211> 4107

<212> DNA

<213> 人工序列

<220>

<223> 化脓性链球菌Cas9

<400> 1

atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactaa 4107

<210> 2

<211> 4140

<212> DNA

<213> 人工序列

<220>

<223> 具有NLS的化脓性链球菌Cas9

<400> 2

atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140

<210> 3

<211> 1379

<212> PRT

<213> 人工序列

<220>

<223> 具有NLS的化脓性链球菌Cas9

<400> 3

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1370 1375

<210> 4

<211> 543

<212> DNA

<213> 解脂耶氏酵母

<400> 4

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

acc 543

<210> 5

<211> 4683

<212> DNA

<213> 人工序列

<220>

<223> Cas9-NLS表达盒（FBA1启动子和Cas9-NLS开放阅读框）

<400> 5

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600

gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660

cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720

gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780

tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840

cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900

ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960

aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020

cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080

gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140

cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200

agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260

aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320

gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380

gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440

attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500

tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560

cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620

gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680

ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740

cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800

cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860

atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920

tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980

gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040

aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100

gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160

ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 2220

actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280

atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340

attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400

gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460

gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520

ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580

ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640

gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700

ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760

actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820

gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880

cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940

cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000

cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060

cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120

tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180

aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240

cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300

caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360

aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420

tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480

aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540

aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600

aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660

tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720

agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780

tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840

gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900

atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960

gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020

gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080

gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140

aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200

ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260

tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320

gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380

gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440

aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500

gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560

aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620

atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680

taa 4683

<210> 6

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pZUFCas9质粒

<400> 6

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 7

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Cas9-NLS正向PCR引物

<400> 7

gggggaattc gacaagaaat actccatcgg cctgg 35

<210> 8

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> Cas9-NLS反向PCR引物

<400> 8

ccccaagctt agcggccgct tagacctttc g 31

<210> 9

<211> 4166

<212> DNA

<213> 人工序列

<220>

<223> EcoRI-Cas9-NLS-HinDIII PCR产物

<400> 9

gggggaattc gacaagaaat actccatcgg cctggacatt ggaaccaact ctgtcggctg 60

ggctgtcatc accgacgagt acaaggtgcc ctccaagaaa ttcaaggtcc tcggaaacac 120

cgatcgacac tccatcaaga aaaacctcat tggtgccctg ttgttcgatt ctggcgagac 180

tgccgaagct accagactca agcgaactgc tcggcgacgt tacacccgac ggaagaaccg 240

aatctgctac ctgcaggaga tcttttccaa cgagatggcc aaggtggacg attcgttctt 300

tcatcgactg gaggaatcct tcctcgtcga ggaagacaag aaacacgagc gtcatcccat 360

ctttggcaac attgtggacg aggttgctta ccacgagaag tatcctacca tctaccacct 420

gcgaaagaaa ctcgtcgatt ccaccgacaa ggcggatctc agacttatct acctcgctct 480

ggcacacatg atcaagtttc gaggtcattt cctcatcgag ggcgatctca atcccgacaa 540

cagcgatgtg gacaagctgt tcattcagct cgttcagacc tacaaccagc tgttcgagga 600

aaaccccatc aatgcctccg gagtcgatgc aaaggccatc ttgtctgctc gactctcgaa 660

gagcagacga ctggagaacc tcattgccca acttcctggc gagaaaaaga acggactgtt 720

tggcaacctc attgcccttt ctcttggtct cacacccaac ttcaagtcca acttcgatct 780

ggcggaggac gccaagctcc agctgtccaa ggacacctac gacgatgacc tcgacaacct 840

gcttgcacag attggcgatc agtacgccga cctgtttctc gctgccaaga acctttcgga 900

tgctattctc ttgtctgaca ttctgcgagt caacaccgag atcacaaagg ctcccctttc 960

tgcctccatg atcaagcgat acgacgagca ccatcaggat ctcacactgc tcaaggctct 1020

tgtccgacag caactgcccg agaagtacaa ggagatcttt ttcgatcagt cgaagaacgg 1080

ctacgctgga tacatcgacg gcggagcctc tcaggaagag ttctacaagt tcatcaagcc 1140

aattctcgag aagatggacg gaaccgagga actgcttgtc aagctcaatc gagaggatct 1200

gcttcggaag caacgaacct tcgacaacgg cagcattcct catcagatcc acctcggtga 1260

gctgcacgcc attcttcgac gtcaggaaga cttctacccc tttctcaagg acaaccgaga 1320

gaagatcgag aagattctta cctttcgaat cccctactat gttggtcctc ttgccagagg 1380

aaactctcga tttgcttgga tgactcgaaa gtccgaggaa accatcactc cctggaactt 1440

cgaggaagtc gtggacaagg gtgcctctgc acagtccttc atcgagcgaa tgaccaactt 1500

cgacaagaat ctgcccaacg agaaggttct tcccaagcat tcgctgctct acgagtactt 1560

tacagtctac aacgaactca ccaaagtcaa gtacgttacc gagggaatgc gaaagcctgc 1620

cttcttgtct ggcgaacaga agaaagccat tgtcgatctc ctgttcaaga ccaaccgaaa 1680

ggtcactgtt aagcagctca aggaggacta cttcaagaaa atcgagtgtt tcgacagcgt 1740

cgagatttcc ggagttgagg accgattcaa cgcctctttg ggcacctatc acgatctgct 1800

caagattatc aaggacaagg attttctcga caacgaggaa aacgaggaca ttctggagga 1860

catcgtgctc actcttaccc tgttcgaaga tcgggagatg atcgaggaac gactcaagac 1920

atacgctcac ctgttcgacg acaaggtcat gaaacaactc aagcgacgta gatacaccgg 1980

ctggggaaga ctttcgcgaa agctcatcaa cggcatcaga gacaagcagt ccggaaagac 2040

cattctggac tttctcaagt ccgatggctt tgccaaccga aacttcatgc agctcattca 2100

cgacgattct cttaccttca aggaggacat ccagaaggca caagtgtccg gtcagggcga 2160

cagcttgcac gaacatattg ccaacctggc tggttcgcca gccatcaaga aaggcattct 2220

ccagactgtc aaggttgtcg acgagctggt gaaggtcatg ggacgtcaca agcccgagaa 2280

cattgtgatc gagatggcca gagagaacca gacaactcaa aagggtcaga aaaactcgcg 2340

agagcggatg aagcgaatcg aggaaggcat caaggagctg ggatcccaga ttctcaagga 2400

gcatcccgtc gagaacactc aactgcagaa cgagaagctg tatctctact atctgcagaa 2460

tggtcgagac atgtacgtgg atcaggaact ggacatcaat cgtctcagcg actacgatgt 2520

ggaccacatt gtccctcaat cctttctcaa ggacgattct atcgacaaca aggtccttac 2580

acgatccgac aagaacagag gcaagtcgga caacgttccc agcgaagagg tggtcaaaaa 2640

gatgaagaac tactggcgac agctgctcaa cgccaagctc attacccagc gaaagttcga 2700

caatcttacc aaggccgagc gaggcggtct gtccgagctc gacaaggctg gcttcatcaa 2760

gcgtcaactc gtcgagacca gacagatcac aaagcacgtc gcacagattc tcgattctcg 2820

gatgaacacc aagtacgacg agaacgacaa gctcatccga gaggtcaagg tgattactct 2880

caagtccaaa ctggtctccg atttccgaaa ggactttcag ttctacaagg tgcgagagat 2940

caacaattac caccatgccc acgatgctta cctcaacgcc gtcgttggca ctgcgctcat 3000

caagaaatac cccaagctcg aaagcgagtt cgtttacggc gattacaagg tctacgacgt 3060

tcgaaagatg attgccaagt ccgaacagga gattggcaag gctactgcca agtacttctt 3120

ttactccaac atcatgaact ttttcaagac cgagatcacc ttggccaacg gagagattcg 3180

aaagagacca cttatcgaga ccaacggcga aactggagag atcgtgtggg acaagggtcg 3240

agactttgca accgtgcgaa aggttctgtc gatgcctcag gtcaacatcg tcaagaaaac 3300

cgaggttcag actggcggat tctccaagga gtcgattctg cccaagcgaa actccgacaa 3360

gctcatcgct cgaaagaaag actgggatcc caagaaatac ggtggcttcg attctcctac 3420

cgtcgcctat tccgtgcttg tcgttgcgaa ggtcgagaag ggcaagtcca aaaagctcaa 3480

gtccgtcaag gagctgctcg gaattaccat catggagcga tcgagcttcg agaagaatcc 3540

catcgacttc ttggaagcca agggttacaa ggaggtcaag aaagacctca ttatcaagct 3600

gcccaagtac tctctgttcg aactggagaa cggtcgaaag cgtatgctcg cctccgctgg 3660

cgagctgcag aagggaaacg agcttgcctt gccttcgaag tacgtcaact ttctctatct 3720

ggcttctcac tacgagaagc tcaagggttc tcccgaggac aacgaacaga agcaactctt 3780

cgttgagcag cacaaacatt acctcgacga gattatcgag cagatttccg agttttcgaa 3840

gcgagtcatc ctggctgatg ccaacttgga caaggtgctc tctgcctaca acaagcatcg 3900

ggacaaaccc attcgagaac aggcggagaa catcattcac ctgtttactc ttaccaacct 3960

gggtgctcct gcagctttca agtacttcga taccactatc gaccgaaagc ggtacacatc 4020

caccaaggag gttctcgatg ccaccctgat tcaccagtcc atcactggcc tgtacgagac 4080

ccgaatcgac ctgtctcagc ttggtggcga ctccagagcc gatcccaaga aaaagcgaaa 4140

ggtctaagcg gccgctaagc ttgggg 4166

<210> 10

<211> 4092

<212> DNA

<213> 人工序列

<220>

<223> pBAD/HisB质粒

<400> 10

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360

atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420

tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480

gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540

tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600

acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660

atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720

cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780

aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840

agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900

taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960

tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020

gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080

gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140

cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200

tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260

tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320

atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380

ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440

gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500

gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560

gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620

gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680

gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740

cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800

atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860

tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920

ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980

gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040

tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100

ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160

ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220

gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280

ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340

tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400

ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460

agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520

agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580

gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640

tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700

accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760

gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820

atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880

cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940

cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000

tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060

ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120

acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180

ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240

actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300

caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360

tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420

ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480

caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540

ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600

gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660

gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720

tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780

cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840

gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900

ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960

taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020

taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080

cgccattcag ag 4092

<210> 11

<211> 8237

<212> DNA

<213> 人工序列

<220>

<223> pRF48质粒

<400> 11

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160

acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220

agctggtacc atatggg 8237

<210> 12

<211> 54

<212> PRT

<213> 爱泼斯坦-巴尔二氏病毒

<400> 12

Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Arg Val Arg Val

1 5 10 15

Ala Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr

20 25 30

Arg Glu Val Ala Ala Ala Lys Ser Ser Glu Asn Asp Arg Leu Arg Leu

35 40 45

Leu Leu Lys Gln Met Cys

50

<210> 13

<211> 18

<212> PRT

<213> 小家鼠

<400> 13

Leu Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His

1 5 10 15

Ser Lys

<210> 14

<211> 21

<212> PRT

<213> 未知

<220>

<223> TP10 CPP

<400> 14

Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu Lys Ala Cys Ala Ala Cys

1 5 10 15

Ala Lys Lys Ile Leu

20

<210> 15

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> PolyR CPP

<400> 15

Gly Gly Gly Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Leu Leu Leu

1 5 10 15

Leu

<210> 16

<211> 194

<212> DNA

<213> 人工序列

<220>

<223> NcoI-6xHis-ZEBRA CPP-EcoRI

<400> 16

ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60

aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120

atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180

aaatgtgcga attc 194

<210> 17

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> NcoI-6xHis-pVEC CPP-EcoRI

<400> 17

ccatggggca tcaccaccat caccacttat tgattatctt gcgtcgtcgc atccgcaaac 60

aggcgcacgc acatagcaag gaattc 86

<210> 18

<211> 95

<212> DNA

<213> 人工序列

<220>

<223> NcoI-6xHis-TP10 CPP-EcoRI

<400> 18

ccatggggca tcaccaccat caccacgcgg gttacctgct gggcaagatt aatcttaaag 60

cctgcgccgc gtgtgctaag aaaattttgg aattc 95

<210> 19

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> NcoI-6xHis-PolyR CPP-EcoRI

<400> 19

ccatggggca tcaccaccat caccacggcg ggggtggtcg tcgtcgccgt cgccgccgtc 60

gtcgcctcct gctgctggaa ttc 83

<210> 20

<211> 8294

<212> DNA

<213> 人工序列

<220>

<223> pRF144质粒

<400> 20

ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60

aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120

atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180

aaatgtgcga attcgacaag aaatactcca tcggcctgga cattggaacc aactctgtcg 240

gctgggctgt catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa 300

acaccgatcg acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg 360

agactgccga agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga 420

accgaatctg ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt 480

tctttcatcg actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc 540

ccatctttgg caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc 600

acctgcgaaa gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg 660

ctctggcaca catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg 720

acaacagcga tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg 780

aggaaaaccc catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct 840

cgaagagcag acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac 900

tgtttggcaa cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg 960

atctggcgga ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca 1020

acctgcttgc acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt 1080

cggatgctat tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc 1140

tttctgcctc catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg 1200

ctcttgtccg acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga 1260

acggctacgc tggatacatc gacggcggag cctctcagga agagttctac aagttcatca 1320

agccaattct cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg 1380

atctgcttcg gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg 1440

gtgagctgca cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc 1500

gagagaagat cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca 1560

gaggaaactc tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga 1620

acttcgagga agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca 1680

acttcgacaa gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt 1740

actttacagt ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc 1800

ctgccttctt gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc 1860

gaaaggtcac tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca 1920

gcgtcgagat ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc 1980

tgctcaagat tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg 2040

aggacatcgt gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca 2100

agacatacgc tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca 2160

ccggctgggg aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa 2220

agaccattct ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca 2280

ttcacgacga ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg 2340

gcgacagctt gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca 2400

ttctccagac tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg 2460

agaacattgt gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact 2520

cgcgagagcg gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca 2580

aggagcatcc cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc 2640

agaatggtcg agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg 2700

atgtggacca cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc 2760

ttacacgatc cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca 2820

aaaagatgaa gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt 2880

tcgacaatct taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca 2940

tcaagcgtca actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt 3000

ctcggatgaa caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta 3060

ctctcaagtc caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag 3120

agatcaacaa ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc 3180

tcatcaagaa ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg 3240

acgttcgaaa gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact 3300

tcttttactc caacatcatg aactttttca agaccgagat caccttggcc aacggagaga 3360

ttcgaaagag accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg 3420

gtcgagactt tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga 3480

aaaccgaggt tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg 3540

acaagctcat cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc 3600

ctaccgtcgc ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc 3660

tcaagtccgt caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga 3720

atcccatcga cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca 3780

agctgcccaa gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg 3840

ctggcgagct gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct 3900

atctggcttc tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac 3960

tcttcgttga gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt 4020

cgaagcgagt catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc 4080

atcgggacaa acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca 4140

acctgggtgc tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca 4200

catccaccaa ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg 4260

agacccgaat cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc 4320

gaaaggtcta agcggccgct aagcttggct gttttggcgg atgagagaag attttcagcc 4380

tgatacagat taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca 4440

gtagcgcggt ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg 4500

atggtagtgt ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga 4560

aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 4620

ctgagtagga caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg 4680

tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg 4740

acggatggcc tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa 4800

tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 4860

gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 4920

tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 4980

tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 5040

ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 5100

atcccgtgtt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 5160

cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 5220

attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 5280

gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 5340

ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 5400

gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 5460

agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 5520

gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 5580

gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 5640

ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 5700

tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 5760

tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 5820

catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 5880

gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 5940

aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6000

gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 6060

gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6120

gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6180

atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6240

cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 6300

cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 6360

agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 6420

tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 6480

gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 6540

catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 6600

agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 6660

ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 6720

atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg 6780

ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg 6840

ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg 6900

agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat 6960

tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt 7020

ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac 7080

aacttgacgg ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg 7140

gccccggtgc attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg 7200

cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata 7260

cgttggtcct cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac 7320

agacgcgacg gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct 7380

gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg 7440

agcgactcgt taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc 7500

agcagctccg aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg 7560

ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac 7620

ggccagttaa gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac 7680

cattcgcgag cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa 7740

atatcacccg gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga 7800

atggtgagat tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga 7860

taaccgttgg cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc 7920

ggcagcaggg gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa 7980

gaaaccaatt gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc 8040

tcgctaacca aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa 8100

gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat 8160

tatttgcacg gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat 8220

cctacctgac gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta 8280

acaggaggaa ttaa 8294

<210> 21

<211> 8183

<212> DNA

<213> 人工序列

<220>

<223> pRF145质粒

<400> 21

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggcatcacc accatcacca cggcgggggt ggtcgtcgtc gccgtcgccg 8160

ccgtcgtcgc ctcctgctgc tgg 8183

<210> 22

<211> 8195

<212> DNA

<213> 人工序列

<220>

<223> pRF146质粒

<400> 22

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggcatcacc accatcacca cgcgggttac ctgctgggca agattaatct 8160

taaagcctgc gccgcgtgtg ctaagaaaat tttgg 8195

<210> 23

<211> 8186

<212> DNA

<213> 人工序列

<220>

<223> pRF162质粒

<400> 23

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggcatcacc accatcacca cttattgatt atcttgcgtc gtcgcatccg 8160

caaacaggcg cacgcacata gcaagg 8186

<210> 24

<211> 80

<212> RNA

<213> 人工序列

<220>

<223> Cas9内切核酸酶识别（CER）结构域

<400> 24

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 25

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 25

tcaaacgatt acccaccctc 20

<210> 26

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 锤头状（HH）核糖酶

<220>

<221> 尚未归类的特征

<222> (1)..(6)

<223> n是a、c、g、或u

<400> 26

nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 43

<210> 27

<211> 68

<212> RNA

<213> 丁型肝炎病毒

<400> 27

ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60

aaugggac 68

<210> 28

<211> 211

<212> DNA

<213> 人工序列

<220>

<223> HH-sgRNA-HDV (RGR) 前-sgRNA表达盒

<400> 28

gtttgactga tgagtccgtg aggacgaaac gagtaagctc gtctcaaacg attacccacc 60

ctcgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 120

agtggcaccg agtcggtgct tttggccggc atggtcccag cctcctcgct ggcgccggct 180

gggcaacatg cttcggcatg gcgaatggga c 211

<210> 29

<211> 20

<212> DNA

<213> 噬菌体T7

<400> 29

taatacgact cactataggg 20

<210> 30

<211> 2875

<212> DNA

<213> 人工序列

<220>

<223> pRF46质粒

<400> 30

agcttgtccc attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg 60

gaccatgccg gccaaaagca ccaccgactc ggtgccactt tttcaagttg ataacggact 120

agccttattt taacttgcta tttctagctc taaaacgagg gtgggtaatc gtttgagacg 180

agcttactcg tttcgtcctc acggactcat cagtcaaacc cctatagtga gtcgtattag 240

aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 300

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 360

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 420

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 480

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 540

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 600

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 660

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 720

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 780

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 840

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 900

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 960

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1020

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1080

tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1140

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1200

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1260

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1320

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1380

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 1440

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 1500

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 1560

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 1620

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 1680

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 1740

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 1800

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 1860

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 1920

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 1980

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2040

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 2100

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 2160

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 2220

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 2280

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 2340

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 2400

ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 2460

acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 2520

ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 2580

ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag 2640

attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa 2700

taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 2760

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 2820

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgcca 2875

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> T7正向PCR引物

<400> 31

ccggctcgta tgttgtgtgg 20

<210> 32

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> gRNArev1反向引物

<400> 32

aaaagcaccg actcggtgcc 20

<210> 33

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> IV-上正向引物

<400> 33

ccacgaaacg acgtttcgac c 21

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> IV-下反向引物

<400> 34

gcaaagactc ggttgatggc 20

<210> 35

<211> 982

<212> DNA

<213> 解脂耶氏酵母

<400> 35

ccacgaaacg acgtttcgac cttaacgacc ctgccgtctc catccatccg accacaatgg 60

aaaagacatt ttcaaacgat tacccaccct ccgggactga ggcccacatc cacatcaacc 120

acacggccca ctcggatgac tcagaggagg tgccctcgca caaggaaaat tacaacacca 180

gtggccacga cctggaggag tccgacccgg ataaccatgt cggtgagacc ctcgaggtca 240

agcgaggtct caagatgcga cacatctcca tgatctcgct tggaggaacc attggtaccg 300

gtctcttcat tggtaccgga ggagctctcc agcaggccgg tccctgtggc gccctcgtcg 360

cctacgtgtt catggccacc attgtctact ctgttgccga gtctcttgga gaactggcta 420

cgtacattcc catcaccggc tcctttgccg tctttactac ccgatatctg tcacagtcgt 480

ttggtgcctc catgggctgg ctatactggt tctcgtgggc gatcaccttc gccatcgagc 540

tcaacaccat tggtcccgtg attgagtact ggactgacgc cgttcctact gctgcctgga 600

ttgccatctt cttcgtcatc ctcactacca tcaacttctt ccccgtgggc ttctatggcg 660

aagtcgagtt ctgggtggcc tccgtgaagg tcattgccat cattggatgg ctcatctacg 720

cgctctgcat gacgtgtgga gcaggtgtaa caggtcctgt gggattcaga tactggaacc 780

accccggacc catgggagac ggaatctgga ccgacggcgt gcccattgtg cgaaacgcgc 840

ccggtcgacg attcatggga tggctcaatt cgctcgttaa cgccgccttc acctaccagg 900

gctgtgagct ggtcggagtc actgccggtg aggcccagaa ccccagaaag tccgtccctc 960

gagccatcaa ccgagtcttt gc 982

<210> 36

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA环形成序列 (GAAA)

<400> 36

gaaa 4

<210> 37

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA环形成序列 (CAAA)

<400> 37

caaa 4

<210> 38

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA环形成序列 (AAAG)

<400> 38

aaag 4

<210> 39

<211> 1434

<212> PRT

<213> 人工序列

<220>

<223> Zebra CPP-Cas9-NLS融合蛋白

<400> 39

Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Arg Val Arg Val

1 5 10 15

Ala Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr

20 25 30

Arg Glu Val Ala Ala Ala Lys Ser Ser Glu Asn Asp Arg Leu Arg Leu

35 40 45

Leu Leu Lys Gln Met Cys Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu

50 55 60

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

65 70 75 80

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

85 90 95

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

100 105 110

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

115 120 125

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

130 135 140

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

145 150 155 160

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

165 170 175

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

180 185 190

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

195 200 205

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

210 215 220

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

225 230 235 240

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

245 250 255

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

260 265 270

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

275 280 285

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

290 295 300

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

305 310 315 320

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

325 330 335

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

340 345 350

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

355 360 365

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

370 375 380

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

385 390 395 400

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

405 410 415

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

420 425 430

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

435 440 445

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

450 455 460

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

465 470 475 480

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

485 490 495

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

500 505 510

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

515 520 525

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

530 535 540

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

545 550 555 560

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

565 570 575

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

580 585 590

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

595 600 605

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

610 615 620

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

625 630 635 640

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

645 650 655

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

660 665 670

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

675 680 685

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

690 695 700

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

705 710 715 720

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

725 730 735

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

740 745 750

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

755 760 765

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

770 775 780

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

785 790 795 800

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

805 810 815

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

820 825 830

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

835 840 845

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

850 855 860

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

865 870 875 880

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

885 890 895

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

900 905 910

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

915 920 925

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

930 935 940

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

945 950 955 960

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

965 970 975

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

980 985 990

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

995 1000 1005

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys

1010 1015 1020

Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His

1025 1030 1035

Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile

1040 1045 1050

Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr

1055 1060 1065

Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu

1070 1075 1080

Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met

1085 1090 1095

Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg

1100 1105 1110

Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val

1115 1120 1125

Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser

1130 1135 1140

Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly

1145 1150 1155

Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys

1160 1165 1170

Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly

1175 1180 1185

Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys

1190 1195 1200

Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu

1205 1210 1215

Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro

1220 1225 1230

Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp

1235 1240 1245

Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn

1250 1255 1260

Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly

1265 1270 1275

Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu

1280 1285 1290

Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu

1295 1300 1305

Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu

1310 1315 1320

Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala

1325 1330 1335

Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg

1340 1345 1350

Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe

1355 1360 1365

Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp

1370 1375 1380

Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu

1385 1390 1395

Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr

1400 1405 1410

Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro

1415 1420 1425

Lys Lys Lys Arg Lys Val

1430

<210> 40

<211> 1397

<212> PRT

<213> 人工序列

<220>

<223> PolyR CPP-Cas9-NLS融合蛋白

<400> 40

Gly Gly Gly Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Leu Leu Leu

1 5 10 15

Leu Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn

20 25 30

Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys

35 40 45

Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn

50 55 60

Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr

65 70 75 80

Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg

85 90 95

Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp

100 105 110

Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp

115 120 125

Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val

130 135 140

Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu

145 150 155 160

Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu

165 170 175

Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu

180 185 190

Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln

195 200 205

Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val

210 215 220

Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu

225 230 235 240

Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe

245 250 255

Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser

260 265 270

Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr

275 280 285

Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr

290 295 300

Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu

305 310 315 320

Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser

325 330 335

Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu

340 345 350

Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile

355 360 365

Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly

370 375 380

Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys

385 390 395 400

Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu

405 410 415

Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile

420 425 430

His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr

435 440 445

Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe

450 455 460

Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe

465 470 475 480

Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe

485 490 495

Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg

500 505 510

Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys

515 520 525

His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys

530 535 540

Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly

545 550 555 560

Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys

565 570 575

Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys

580 585 590

Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser

595 600 605

Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe

610 615 620

Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr

625 630 635 640

Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr

645 650 655

Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg

660 665 670

Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile

675 680 685

Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp

690 695 700

Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu

705 710 715 720

Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp

725 730 735

Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys

740 745 750

Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val

755 760 765

Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu

770 775 780

Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys

785 790 795 800

Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu

805 810 815

His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr

820 825 830

Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile

835 840 845

Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe

850 855 860

Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys

865 870 875 880

Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys

885 890 895

Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln

900 905 910

Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu

915 920 925

Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln

930 935 940

Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys

945 950 955 960

Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu

965 970 975

Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys

980 985 990

Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

995 1000 1005

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1010 1015 1020

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1025 1030 1035

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1040 1045 1050

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1055 1060 1065

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1070 1075 1080

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1085 1090 1095

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1100 1105 1110

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1115 1120 1125

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1130 1135 1140

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1145 1150 1155

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1160 1165 1170

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1175 1180 1185

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1190 1195 1200

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1205 1210 1215

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1220 1225 1230

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1235 1240 1245

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1250 1255 1260

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1265 1270 1275

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1280 1285 1290

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1295 1300 1305

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1310 1315 1320

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1325 1330 1335

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1340 1345 1350

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1355 1360 1365

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1370 1375 1380

Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1385 1390 1395

<210> 41

<211> 1401

<212> PRT

<213> 人工序列

<220>

<223> TP10 CPP-Cas9-NLS融合蛋白

<400> 41

Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu Lys Ala Cys Ala Ala Cys

1 5 10 15

Ala Lys Lys Ile Leu Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp

20 25 30

Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys

35 40 45

Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser

50 55 60

Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr

65 70 75 80

Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg

85 90 95

Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met

100 105 110

Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu

115 120 125

Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile

130 135 140

Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu

145 150 155 160

Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile

165 170 175

Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile

180 185 190

Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile

195 200 205

Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn

210 215 220

Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys

225 230 235 240

Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys

245 250 255

Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro

260 265 270

Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu

275 280 285

Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile

290 295 300

Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp

305 310 315 320

Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys

325 330 335

Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln

340 345 350

Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys

355 360 365

Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr

370 375 380

Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro

385 390 395 400

Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn

405 410 415

Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile

420 425 430

Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln

435 440 445

Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys

450 455 460

Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly

465 470 475 480

Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr

485 490 495

Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser

500 505 510

Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys

515 520 525

Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn

530 535 540

Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala

545 550 555 560

Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys

565 570 575

Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys

580 585 590

Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg

595 600 605

Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys

610 615 620

Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp

625 630 635 640

Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu

645 650 655

Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln

660 665 670

Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu

675 680 685

Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe

690 695 700

Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His

705 710 715 720

Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser

725 730 735

Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser

740 745 750

Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu

755 760 765

Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu

770 775 780

Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg

785 790 795 800

Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln

805 810 815

Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys

820 825 830

Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln

835 840 845

Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val

850 855 860

Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr

865 870 875 880

Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu

885 890 895

Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys

900 905 910

Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly

915 920 925

Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val

930 935 940

Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg

945 950 955 960

Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys

965 970 975

Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe

980 985 990

Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp

995 1000 1005

Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

1010 1015 1020

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr

1025 1030 1035

Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys

1040 1045 1050

Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe

1055 1060 1065

Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1070 1075 1080

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys

1085 1090 1095

Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln

1100 1105 1110

Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser

1115 1120 1125

Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1130 1135 1140

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser

1145 1150 1155

Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys

1160 1165 1170

Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile

1175 1180 1185

Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1190 1195 1200

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile

1205 1210 1215

Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys

1220 1225 1230

Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu

1235 1240 1245

Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1250 1255 1260

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln

1265 1270 1275

Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu

1280 1285 1290

Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn

1295 1300 1305

Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1310 1315 1320

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr

1325 1330 1335

Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile

1340 1345 1350

Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr

1355 1360 1365

Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1370 1375 1380

Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys

1385 1390 1395

Arg Lys Val

1400

<210> 42

<211> 1398

<212> PRT

<213> 人工序列

<220>

<223> pVEC CPP-Cas9-NLS融合蛋白

<400> 42

Leu Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His

1 5 10 15

Ser Lys Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr

20 25 30

Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser

35 40 45

Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys

50 55 60

Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala

65 70 75 80

Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn

85 90 95

Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val

100 105 110

Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu

115 120 125

Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu

130 135 140

Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys

145 150 155 160

Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala

165 170 175

Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp

180 185 190

Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val

195 200 205

Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly

210 215 220

Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg

225 230 235 240

Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu

245 250 255

Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys

260 265 270

Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp

275 280 285

Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln

290 295 300

Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu

305 310 315 320

Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu

325 330 335

Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr

340 345 350

Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu

355 360 365

Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly

370 375 380

Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu

385 390 395 400

Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp

405 410 415

Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln

420 425 430

Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe

435 440 445

Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr

450 455 460

Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg

465 470 475 480

Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn

485 490 495

Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu

500 505 510

Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro

515 520 525

Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr

530 535 540

Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser

545 550 555 560

Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg

565 570 575

Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu

580 585 590

Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala

595 600 605

Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp

610 615 620

Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu

625 630 635 640

Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys

645 650 655

Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg

660 665 670

Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly

675 680 685

Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser

690 695 700

Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser

705 710 715 720

Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly

725 730 735

Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile

740 745 750

Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys

755 760 765

Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg

770 775 780

Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met

785 790 795 800

Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys

805 810 815

Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu

820 825 830

Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp

835 840 845

Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser

850 855 860

Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp

865 870 875 880

Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys

885 890 895

Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr

900 905 910

Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser

915 920 925

Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg

930 935 940

Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr

945 950 955 960

Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr

965 970 975

Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr

980 985 990

Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu

995 1000 1005

Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu

1010 1015 1020

Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg

1025 1030 1035

Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala

1040 1045 1050

Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu

1055 1060 1065

Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu

1070 1075 1080

Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp

1085 1090 1095

Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile

1100 1105 1110

Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser

1115 1120 1125

Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys

1130 1135 1140

Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val

1145 1150 1155

Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser

1160 1165 1170

Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met

1175 1180 1185

Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1190 1195 1200

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro

1205 1210 1215

Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu

1220 1225 1230

Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro

1235 1240 1245

Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys

1250 1255 1260

Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val

1265 1270 1275

Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser

1280 1285 1290

Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys

1295 1300 1305

Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu

1310 1315 1320

Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly

1325 1330 1335

Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys

1340 1345 1350

Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His

1355 1360 1365

Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln

1370 1375 1380

Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1385 1390 1395

<210> 43

<211> 23

<212> DNA

<213> 未知

<220>

<223> Cas9靶位点的实例：PAM序列

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、T、或G

<220>

<221> 尚未归类的特征

<222> (21)..(21)

<223> n = A、C、T、或G（在说明书中表示为“X”）

<400> 43

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 44

<211> 3

<212> DNA

<213> 未知

<220>

<223> PAM序列NGG

<220>

<221> 尚未归类的特征

<222> (1)..(1)

<223> n = A、C、T、或G

<400> 44

ngg 3

<210> 45

<211> 6

<212> DNA

<213> 未知

<220>

<223> PAM序列NNAGAA

<220>

<221> 尚未归类的特征

<222> (1)..(2)

<223> n = A、C、T、或G

<400> 45

nnagaa 6

<210> 46

<211> 7

<212> DNA

<213> 未知

<220>

<223> PAM序列NNAGAAW

<220>

<221> 尚未归类的特征

<222> (1)..(2)

<223> n = A、C、T、或G

<220>

<221> 尚未归类的特征

<222> (7)..(7)

<223> w = A或T

<400> 46

nnagaaw 7

<210> 47

<211> 5

<212> DNA

<213> 未知

<220>

<223> PAM序列NGGNG

<220>

<221> 尚未归类的特征

<222> (1)..(1)

<223> n = A、C、T、或G

<220>

<221> 尚未归类的特征

<222> (4)..(4)

<223> n = A、C、T、或G

<400> 47

nggng 5

<210> 48

<211> 8

<212> DNA

<213> 未知

<220>

<223> PAM序列NNNNGATT

<220>

<221> 尚未归类的特征

<222> (1)..(4)

<223> n = A、C、T、或G

<400> 48

nnnngatt 8

<210> 49

<211> 6

<212> DNA

<213> 未知

<220>

<223> PAM序列NAAAAC

<220>

<221> 尚未归类的特征

<222> (1)..(1)

<223> n = A、C、T、或G

<400> 49

naaaac 6

<210> 50

<211> 2

<212> DNA

<213> 未知

<220>

<223> PAM序列NG

<220>

<221> 尚未归类的特征

<222> (1)..(1)

<223> n = A、C、T、或G

<400> 50

ng 2

<210> 51

<211> 22

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列实例1

<400> 51

guuuuuguac ucucaagauu ua 22

<210> 52

<211> 15

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列实例2

<400> 52

guuuuuguac ucuca 15

<210> 53

<211> 12

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列实例3

<400> 53

guuuuagagc ua 12

<210> 54

<211> 13

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列实例4

<400> 54

guuuuagagc uag 13

<210> 55

<211> 60

<212> RNA

<213> 化脓性链球菌

<400> 55

uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60

<210> 56

<211> 45

<212> RNA

<213> 化脓性链球菌

<400> 56

uagcaaguua aaauaaggcu aguccguuau caacuugaaa aagug 45

<210> 57

<211> 32

<212> RNA

<213> 化脓性链球菌

<400> 57

uagcaaguua aaauaaggcu aguccguuau ca 32

<210> 58

<211> 85

<212> RNA

<213> 嗜热链球菌

<400> 58

uaaaucuugc agaagcuaca aagauaaggc uucaugccga aaucaacacc cugucauuuu 60

auggcagggu guuuucguua uuuaa 85

<210> 59

<211> 77

<212> RNA

<213> 嗜热链球菌

<400> 59

ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60

gguguuuucg uuauuua 77

<210> 60

<211> 65

<212> RNA

<213> 嗜热链球菌

<400> 60

ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60

ggugu 65

<210> 61

<211> 131

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例1

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 61

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucaagauu uagaaauaaa ucuugcagaa 60

gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu cauuuuaugg caggguguuu 120

ucguuauuua a 131

<210> 62

<211> 117

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例2

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 62

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60

gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuuucgu uauuuaa 117

<210> 63

<211> 104

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例3

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 63

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60

gcuucaugcc gaaaucaaca cccugucauu uuauggcagg gugu 104

<210> 64

<211> 99

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例4

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 64

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau agcaaguuaa aauaaggcua 60

guccguuauc aacuugaaaa aguggcaccg agucggugc 99

<210> 65

<211> 81

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例5

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 65

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu g 81

<210> 66

<211> 68

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例6

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 66

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuauca 68

<210> 67

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> gRNA实例7

<220>

<221> 尚未归类的特征

<222> (1)..(20)

<223> n = A、C、U、或G

<400> 67

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 68

<211> 10

<212> PRT

<213> 人类免疫缺陷病毒

<400> 68

Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5 10

<210> 69

<211> 9

<212> PRT

<213> 人类免疫缺陷病毒

<400> 69

Arg Lys Lys Arg Arg Gln Arg Arg Arg

1 5

<210> 70

<211> 8

<212> PRT

<213> 人类免疫缺陷病毒

<400> 70

Arg Lys Lys Arg Arg Gln Arg Arg

1 5

<210> 71

<211> 16

<212> PRT

<213> 黑腹果蝇

<400> 71

Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys

1 5 10 15

<210> 72

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 聚精氨酸CPP实例2

<400> 72

Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg

1 5 10

<210> 73

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 聚精氨酸CPP实例3

<400> 73

Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg

1 5 10

<210> 74

<211> 17

<212> PRT

<213> 小家鼠

<400> 74

Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His Ser

1 5 10 15

Lys

<210> 75

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> (KFF)3K CPP

<400> 75

Lys Phe Phe Lys Phe Phe Lys Phe Phe Lys

1 5 10

<210> 76

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> MAP肽CPP

<400> 76

Lys Leu Ala Leu Lys Leu Ala Leu Lys Ala Leu Lys Ala Ala Leu Lys

1 5 10 15

Leu Ala

<210> 77

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> CPP (RRQRRTSKLMKR)

<400> 77

Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg

1 5 10

<210> 78

<211> 33

<212> PRT

<213> 人工序列

<220>

<223> CPP (KALAWEAKLAKALAKALAKHLAKALAKALKCEA)

<400> 78

Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala

1 5 10 15

Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu

20 25 30

Ala

<210> 79

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 富脯氨酸CPP重复实例1

<400> 79

Val His Leu Pro Pro Pro

1 5

<210> 80

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 富脯氨酸CPP重复实例2

<400> 80

Val His Arg Pro Pro Pro

1 5

<210> 81

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> MPG肽CPP

<400> 81

Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly

1 5 10 15

Ala Trp Ser Gln Pro Lys Ser Lys Arg Lys Val

20 25

<210> 82

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> Pep-1肽CPP

<400> 82

Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys

1 5 10 15

Lys Lys Arg Lys Val

20

<210> 83

<211> 24

<212> PRT

<213> 智人

<400> 83

Leu Gly Thr Tyr Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln

1 5 10 15

Thr Ala Ile Gly Val Gly Ala Pro

20

<210> 84

<211> 18

<212> PRT

<213> 智人

<400> 84

Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr Thr Gln Asp Phe

1 5 10 15

Asn Lys

<210> 85

<211> 240

<212> PRT

<213> 人工序列

<220>

<223> his标记的dsRED

<400> 85

Met Gly Ser Ser His His His His His His Glu Phe Gly Gly Gly Gly

1 5 10 15

Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val Arg

20 25 30

Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly

35 40 45

Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr

50 55 60

Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe

65 70 75 80

Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro Asp

85 90 95

Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met

100 105 110

Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu

115 120 125

Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn Phe

130 135 140

Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala

145 150 155 160

Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu Ile

165 170 175

His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu Phe

180 185 190

Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr Tyr

195 200 205

Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr

210 215 220

Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe Leu

225 230 235 240

<210> 86

<211> 731

<212> DNA

<213> 人工序列

<220>

<223> 大肠杆菌密码子优化的dsRED

<400> 86

ccatgggctc cagccatcat catcaccatc atgaattcgg aggtggcggt gcatcctcgg 60

aggatgtgat taaagaattt atgcggttta aagtacgtat ggaaggatcg gtgaatggcc 120

atgaatttga gattgagggt gaaggcgaag gccgcccgta cgaaggaact caaacagcga 180

aattaaaagt tacaaaagga ggtcctctgc cgtttgcctg ggacatcttg agcccgcaat 240

tccagtacgg ttccaaagtg tatgtaaaac accctgcgga tattccggat tataaaaaac 300

tgagttttcc cgaggggttt aaatgggaac gggtgatgaa ttttgaggat ggtggagttg 360

tcaccgtgac ccaggactct agcttacaag acggtagttt catctacaaa gtaaaattta 420

tcggcgtaaa cttcccatcg gacggccccg tcatgcagaa aaagacgatg ggctgggaag 480

ccagcaccga acgtttgtac ccacgggacg gcgttttgaa aggggaaatc cataaggccc 540

ttaaactgaa agacggtggt cactatctcg tggagtttaa atcgatttat atggctaaaa 600

aaccagtaca gcttccgggt tattattacg ttgactccaa attggacatc acatcgcata 660

atgaagatta cacgattgtt gaacagtacg agcgcgccga gggccggcac catctgtttc 720

tgtaaaagct t 731

<210> 87

<211> 4092

<212> DNA

<213> 人工序列

<220>

<223> pBAD/HisB

<400> 87

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360

atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420

tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480

gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540

tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600

acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660

atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720

cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780

aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840

agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900

taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960

tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020

gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080

gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140

cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200

tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260

tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320

atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380

ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440

gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500

gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560

gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620

gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680

gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740

cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800

atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860

tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920

ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980

gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040

tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100

ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160

ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220

gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280

ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340

tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400

ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460

agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520

agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580

gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640

tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700

accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760

gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820

atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880

cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940

cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000

tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060

ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120

acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180

ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240

actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300

caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360

tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420

ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480

caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540

ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600

gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660

gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720

tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780

cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840

gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900

ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960

taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020

taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080

cgccattcag ag 4092

<210> 88

<211> 4679

<212> DNA

<213> 人工序列

<220>

<223> pRF161

<400> 88

catgggctcc agccatcatc atcaccatca tgaattcgga ggtggcggtg catcctcgga 60

ggatgtgatt aaagaattta tgcggtttaa agtacgtatg gaaggatcgg tgaatggcca 120

tgaatttgag attgagggtg aaggcgaagg ccgcccgtac gaaggaactc aaacagcgaa 180

attaaaagtt acaaaaggag gtcctctgcc gtttgcctgg gacatcttga gcccgcaatt 240

ccagtacggt tccaaagtgt atgtaaaaca ccctgcggat attccggatt ataaaaaact 300

gagttttccc gaggggttta aatgggaacg ggtgatgaat tttgaggatg gtggagttgt 360

caccgtgacc caggactcta gcttacaaga cggtagtttc atctacaaag taaaatttat 420

cggcgtaaac ttcccatcgg acggccccgt catgcagaaa aagacgatgg gctgggaagc 480

cagcaccgaa cgtttgtacc cacgggacgg cgttttgaaa ggggaaatcc ataaggccct 540

taaactgaaa gacggtggtc actatctcgt ggagtttaaa tcgatttata tggctaaaaa 600

accagtacag cttccgggtt attattacgt tgactccaaa ttggacatca catcgcataa 660

tgaagattac acgattgttg aacagtacga gcgcgccgag ggccggcacc atctgtttct 720

gtaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 780

agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 840

acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 900

tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 960

actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 1020

cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 1080

cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 1140

cgtttctaca aactcttttg tttatttttc taaatacatt caaatatgta tccgctcatg 1200

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 1260

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 1320

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 1380

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 1440

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 1500

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 1560

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 1620

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1680

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1740

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1800

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1860

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1920

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 1980

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 2040

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 2100

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 2160

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 2220

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 2280

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 2340

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 2400

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 2460

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 2520

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 2580

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 2640

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 2700

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2760

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2820

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2880

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 2940

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 3000

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 3060

cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt 3120

acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact 3180

gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3240

tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3300

ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat caattcgcgc gcgaaggcga 3360

agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa accctatgct 3420

actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg acggctacat 3480

cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg gtgcattttt 3540

taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg acggtggcga 3600

taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg tcctcgcgcc 3660

agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc gacggcgaca 3720

agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg tgatcgctga 3780

tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac tcgttaatcg 3840

cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc tccgaatagc 3900

gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa tgcggctggt 3960

gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag ttaagccatt 4020

catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg cgagcctccg 4080

gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca cccggtcggc 4140

aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg agattgagaa 4200

tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg ttggcctcaa 4260

tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc aggggatcat 4320

tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc aattgtccat 4380

attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta accaaaccgg 4440

taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg acaaaaacgc 4500

gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg cacggcgtca 4560

cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc tgacgctttt 4620

tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga ggaattaac 4679

<210> 89

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> TAT

<400> 89

Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys

1 5 10 15

Lys Arg Lys Val

20

<210> 90

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> TLM

<400> 90

Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Lys Lys Lys Arg

1 5 10 15

Lys Val

<210> 91

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> MPG1

<400> 91

Ala Leu Phe Leu Gly Gln Leu Gly Ala Ala Gly Ser Thr Met Gly Ala

1 5 10 15

Pro Lys Lys Lys Arg Lys Val

20

<210> 92

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> pep1

<400> 92

Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys

1 5 10 15

Lys Lys Arg Lys Val

20

<210> 93

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> CFFKDEL

<400> 93

Cys Phe Phe Lys Asp Glu Leu

1 5

<210> 94

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> his-TAT大肠杆菌优化的

<400> 94

ccatggggca tcaccatcat catcacggcc gcaaaaaacg tcgtcagcgc cggcgtccgc 60

cccagccgaa aaaacggaaa gtgggcggcg gcgaattc 98

<210> 95

<211> 89

<212> DNA

<213> 人工序列

<220>

<223> his-TLM大肠杆菌优化的

<400> 95

ccatggggca tcaccatcat catcatccgt taagctcgat cttttctcgt atcggtgatc 60

cgccaaaaaa gaaacgcaaa gtagaattc 89

<210> 96

<211> 104

<212> DNA

<213> 人工序列

<220>

<223> his-MPG1大肠杆菌优化的

<400> 96

ccatggggca tcatcatcac catcacggcg ccctgttctt aggccagctg ggcgccgcgg 60

gatccacgat gggtgcgccg aagaaaaagc gcaaagttga attc 104

<210> 97

<211> 95

<212> DNA

<213> 人工序列

<220>

<223> his-pep1大肠杆菌优化的

<400> 97

ccatggggca ccatcaccat caccataaag aaacttggtg ggagacttgg tggaccgaat 60

ggtcccagcc gaagaaaaaa cgcaaggttg aattc 95

<210> 98

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> his-CFFKDEL大肠杆菌优化的

<400> 98

ccatggggca tcaccatcac caccattgtt ttttcaaaga cgaactggaa t 51

<210> 99

<211> 4739

<212> DNA

<213> 人工序列

<220>

<223> pRF224；

<400> 99

catggggcat caccatcatc atcacggccg caaaaaacgt cgtcagcgcc ggcgtccgcc 60

ccagccgaaa aaacggaaag tgggcggcgg cgaattcgga ggtggcggtg catcctcgga 120

ggatgtgatt aaagaattta tgcggtttaa agtacgtatg gaaggatcgg tgaatggcca 180

tgaatttgag attgagggtg aaggcgaagg ccgcccgtac gaaggaactc aaacagcgaa 240

attaaaagtt acaaaaggag gtcctctgcc gtttgcctgg gacatcttga gcccgcaatt 300

ccagtacggt tccaaagtgt atgtaaaaca ccctgcggat attccggatt ataaaaaact 360

gagttttccc gaggggttta aatgggaacg ggtgatgaat tttgaggatg gtggagttgt 420

caccgtgacc caggactcta gcttacaaga cggtagtttc atctacaaag taaaatttat 480

cggcgtaaac ttcccatcgg acggccccgt catgcagaaa aagacgatgg gctgggaagc 540

cagcaccgaa cgtttgtacc cacgggacgg cgttttgaaa ggggaaatcc ataaggccct 600

taaactgaaa gacggtggtc actatctcgt ggagtttaaa tcgatttata tggctaaaaa 660

accagtacag cttccgggtt attattacgt tgactccaaa ttggacatca catcgcataa 720

tgaagattac acgattgttg aacagtacga gcgcgccgag ggccggcacc atctgtttct 780

gtaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 840

agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 900

acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 960

tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 1020

actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 1080

cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 1140

cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 1200

cgtttctaca aactcttttg tttatttttc taaatacatt caaatatgta tccgctcatg 1260

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 1320

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 1380

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 1440

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 1500

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 1560

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 1620

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 1680

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1740

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1800

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1860

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1920

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1980

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 2040

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 2100

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 2160

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 2220

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 2280

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 2340

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 2400

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 2460

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 2520

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 2580

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 2640

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 2700

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 2760

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2820

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2880

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2940

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 3000

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 3060

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 3120

cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt 3180

acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact 3240

gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3300

tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3360

ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat caattcgcgc gcgaaggcga 3420

agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa accctatgct 3480

actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg acggctacat 3540

cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg gtgcattttt 3600

taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg acggtggcga 3660

taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg tcctcgcgcc 3720

agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc gacggcgaca 3780

agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg tgatcgctga 3840

tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac tcgttaatcg 3900

cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc tccgaatagc 3960

gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa tgcggctggt 4020

gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag ttaagccatt 4080

catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg cgagcctccg 4140

gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca cccggtcggc 4200

aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg agattgagaa 4260

tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg ttggcctcaa 4320

tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc aggggatcat 4380

tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc aattgtccat 4440

attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta accaaaccgg 4500

taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg acaaaaacgc 4560

gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg cacggcgtca 4620

cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc tgacgctttt 4680

tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga ggaattaac 4739

<210> 100

<211> 4730

<212> DNA

<213> 人工序列

<220>

<223> pRF214

<400> 100

catggggcat caccatcatc atcatccgtt aagctcgatc ttttctcgta tcggtgatcc 60

gccaaaaaag aaacgcaaag tagaattcgg aggtggcggt gcatcctcgg aggatgtgat 120

taaagaattt atgcggttta aagtacgtat ggaaggatcg gtgaatggcc atgaatttga 180

gattgagggt gaaggcgaag gccgcccgta cgaaggaact caaacagcga aattaaaagt 240

tacaaaagga ggtcctctgc cgtttgcctg ggacatcttg agcccgcaat tccagtacgg 300

ttccaaagtg tatgtaaaac accctgcgga tattccggat tataaaaaac tgagttttcc 360

cgaggggttt aaatgggaac gggtgatgaa ttttgaggat ggtggagttg tcaccgtgac 420

ccaggactct agcttacaag acggtagttt catctacaaa gtaaaattta tcggcgtaaa 480

cttcccatcg gacggccccg tcatgcagaa aaagacgatg ggctgggaag ccagcaccga 540

acgtttgtac ccacgggacg gcgttttgaa aggggaaatc cataaggccc ttaaactgaa 600

agacggtggt cactatctcg tggagtttaa atcgatttat atggctaaaa aaccagtaca 660

gcttccgggt tattattacg ttgactccaa attggacatc acatcgcata atgaagatta 720

cacgattgtt gaacagtacg agcgcgccga gggccggcac catctgtttc tgtaaaagct 780

tggctgtttt ggcggatgag agaagatttt cagcctgata cagattaaat cagaacgcag 840

aagcggtctg ataaaacaga atttgcctgg cggcagtagc gcggtggtcc cacctgaccc 900

catgccgaac tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc 960

gagagtaggg aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct 1020

ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgggag 1080

cggatttgaa cgttgcgaag caacggcccg gagggtggcg ggcaggacgc ccgccataaa 1140

ctgccaggca tcaaattaag cagaaggcca tcctgacgga tggccttttt gcgtttctac 1200

aaactctttt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 1260

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 1320

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 1380

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 1440

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 1500

agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc cgggcaagag 1560

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 1620

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 1680

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 1740

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 1800

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 1860

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 1920

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 1980

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 2040

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 2100

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 2160

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 2220

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 2280

ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 2340

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 2400

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 2460

cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 2520

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 2580

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 2640

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 2700

ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 2760

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 2820

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 2880

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 2940

ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 3000

gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 3060

acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt 3120

ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc 3180

tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg 3240

ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 3300

catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 3360

cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg cgcgaaggcg aagcggcatg 3420

cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 3480

agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 3540

tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 3600

gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 3660

gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 3720

cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 3780

gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 3840

aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 3900

gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 3960

cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 4020

ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 4080

aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 4140

cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 4200

ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 4260

tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 4320

aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 4380

cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 4440

gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 4500

ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 4560

gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 4620

atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 4680

tctctactgt ttctccatac ccgttttttg ggctaacagg aggaattaac 4730

<210> 101

<211> 4745

<212> DNA

<213> 人工序列

<220>

<223> pRF213

<400> 101

catggggcat catcatcacc atcacggcgc cctgttctta ggccagctgg gcgccgcggg 60

atccacgatg ggtgcgccga agaaaaagcg caaagttgaa ttcggaggtg gcggtgcatc 120

ctcggaggat gtgattaaag aatttatgcg gtttaaagta cgtatggaag gatcggtgaa 180

tggccatgaa tttgagattg agggtgaagg cgaaggccgc ccgtacgaag gaactcaaac 240

agcgaaatta aaagttacaa aaggaggtcc tctgccgttt gcctgggaca tcttgagccc 300

gcaattccag tacggttcca aagtgtatgt aaaacaccct gcggatattc cggattataa 360

aaaactgagt tttcccgagg ggtttaaatg ggaacgggtg atgaattttg aggatggtgg 420

agttgtcacc gtgacccagg actctagctt acaagacggt agtttcatct acaaagtaaa 480

atttatcggc gtaaacttcc catcggacgg ccccgtcatg cagaaaaaga cgatgggctg 540

ggaagccagc accgaacgtt tgtacccacg ggacggcgtt ttgaaagggg aaatccataa 600

ggcccttaaa ctgaaagacg gtggtcacta tctcgtggag tttaaatcga tttatatggc 660

taaaaaacca gtacagcttc cgggttatta ttacgttgac tccaaattgg acatcacatc 720

gcataatgaa gattacacga ttgttgaaca gtacgagcgc gccgagggcc ggcaccatct 780

gtttctgtaa aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat 840

taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt 900

ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt 960

ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt 1020

cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga 1080

caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag 1140

gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc 1200

tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa tatgtatccg 1260

ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 1320

attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 1380

gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 1440

ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 1500

cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt 1560

gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1620

tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1680

gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1740

ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 1800

tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1860

gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1920

caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1980

cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 2040

atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 2100

gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 2160

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 2220

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 2280

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 2340

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 2400

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 2460

ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 2520

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 2580

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2640

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2700

acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2760

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2820

agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2880

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 2940

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 3000

cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 3060

gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 3120

ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 3180

ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac 3240

gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg 3300

cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt 3360

gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga 3420

aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc 3480

tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg 3540

ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc 3600

attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg 3660

tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct 3720

cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg 3780

gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat 3840

cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt 3900

taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg 3960

aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg 4020

gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa 4080

gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag 4140

cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg 4200

gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat 4260

tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg 4320

cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg 4380

gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt 4440

gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca 4500

aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa 4560

aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg 4620

gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac 4680

gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta acaggaggaa 4740

ttaac 4745

<210> 102

<211> 4736

<212> DNA

<213> 人工序列

<220>

<223> pRF217

<400> 102

catggggcac catcaccatc accataaaga aacttggtgg gagacttggt ggaccgaatg 60

gtcccagccg aagaaaaaac gcaaggttga attcggaggt ggcggtgcat cctcggagga 120

tgtgattaaa gaatttatgc ggtttaaagt acgtatggaa ggatcggtga atggccatga 180

atttgagatt gagggtgaag gcgaaggccg cccgtacgaa ggaactcaaa cagcgaaatt 240

aaaagttaca aaaggaggtc ctctgccgtt tgcctgggac atcttgagcc cgcaattcca 300

gtacggttcc aaagtgtatg taaaacaccc tgcggatatt ccggattata aaaaactgag 360

ttttcccgag gggtttaaat gggaacgggt gatgaatttt gaggatggtg gagttgtcac 420

cgtgacccag gactctagct tacaagacgg tagtttcatc tacaaagtaa aatttatcgg 480

cgtaaacttc ccatcggacg gccccgtcat gcagaaaaag acgatgggct gggaagccag 540

caccgaacgt ttgtacccac gggacggcgt tttgaaaggg gaaatccata aggcccttaa 600

actgaaagac ggtggtcact atctcgtgga gtttaaatcg atttatatgg ctaaaaaacc 660

agtacagctt ccgggttatt attacgttga ctccaaattg gacatcacat cgcataatga 720

agattacacg attgttgaac agtacgagcg cgccgagggc cggcaccatc tgtttctgta 780

aaagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga ttaaatcaga 840

acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg tggtcccacc 900

tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggtctcc 960

ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1020

gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc 1080

cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca ggacgcccgc 1140

cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc ctttttgcgt 1200

ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 1260

caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 1320

ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 1380

gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 1440

gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 1500

atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg 1560

caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 1620

gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 1680

accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 1740

ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 1800

gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 1860

acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 1920

atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 1980

ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 2040

gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 2100

gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 2160

tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 2220

taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 2280

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 2340

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 2400

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 2460

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 2520

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 2580

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 2640

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 2700

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 2760

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 2820

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2880

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2940

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 3000

tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 3060

agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 3120

tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca 3180

atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg 3240

tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc 3300

tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt 3360

tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg aaggcgaagc 3420

ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc ctatgctact 3480

ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg gctacatcat 3540

tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg cattttttaa 3600

atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg gtggcgatag 3660

gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc tcgcgccagc 3720

ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac ggcgacaagc 3780

aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga tcgctgatgt 3840

actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg ttaatcgctt 3900

ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc gaatagcgcc 3960

cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc ggctggtgcg 4020

cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta agccattcat 4080

gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga gcctccggat 4140

gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc ggtcggcaaa 4200

caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga ttgagaatat 4260

aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg gcctcaatcg 4320

gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg ggatcatttt 4380

gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat tgtccatatt 4440

gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc aaaccggtaa 4500

ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca aaaacgcgta 4560

acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac ggcgtcacac 4620

tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga cgctttttat 4680

cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga attaac 4736

<210> 103

<211> 4694

<212> DNA

<213> 人工序列

<220>

<223> pRF216

<400> 103

catggggcat caccatcacc accattgttt tttcaaagac gaactggaat tcggaggtgg 60

cggtgcatcc tcggaggatg tgattaaaga atttatgcgg tttaaagtac gtatggaagg 120

atcggtgaat ggccatgaat ttgagattga gggtgaaggc gaaggccgcc cgtacgaagg 180

aactcaaaca gcgaaattaa aagttacaaa aggaggtcct ctgccgtttg cctgggacat 240

cttgagcccg caattccagt acggttccaa agtgtatgta aaacaccctg cggatattcc 300

ggattataaa aaactgagtt ttcccgaggg gtttaaatgg gaacgggtga tgaattttga 360

ggatggtgga gttgtcaccg tgacccagga ctctagctta caagacggta gtttcatcta 420

caaagtaaaa tttatcggcg taaacttccc atcggacggc cccgtcatgc agaaaaagac 480

gatgggctgg gaagccagca ccgaacgttt gtacccacgg gacggcgttt tgaaagggga 540

aatccataag gcccttaaac tgaaagacgg tggtcactat ctcgtggagt ttaaatcgat 600

ttatatggct aaaaaaccag tacagcttcc gggttattat tacgttgact ccaaattgga 660

catcacatcg cataatgaag attacacgat tgttgaacag tacgagcgcg ccgagggccg 720

gcaccatctg tttctgtaaa agcttggctg ttttggcgga tgagagaaga ttttcagcct 780

gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 840

tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 900

tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 960

aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 1020

tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 1080

ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 1140

cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 1200

atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 1260

agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 1320

cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 1380

gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 1440

cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 1500

tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 1560

ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 1620

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 1680

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 1740

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 1800

atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 1860

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 1920

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 1980

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 2040

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 2100

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 2160

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 2220

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 2280

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 2340

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 2400

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 2460

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 2520

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 2580

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 2640

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 2700

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 2760

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 2820

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 2880

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 2940

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 3000

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 3060

gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata 3120

tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 3180

tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 3240

cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 3300

gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt 3360

cgcgcgcgaa ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc 3420

tgcaaaccct atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca 3480

acttgacggc tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg 3540

ccccggtgca ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc 3600

gaccgacggt ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac 3660

gttggtcctc gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca 3720

gacgcgacgg cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg 3780

ccaggtgatc gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga 3840

gcgactcgtt aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca 3900

gcagctccga atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc 3960

tgaaatgcgg ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg 4020

gccagttaag ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc 4080

attcgcgagc ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa 4140

tatcacccgg tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa 4200

tggtgagatt gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat 4260

aaccgttggc ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg 4320

gcagcagggg atcattttgc gcttcagcca tacttttcat actcccgcca ttcagagaag 4380

aaaccaattg tccatattgc atcagacatt gccgtcactg cgtcttttac tggctcttct 4440

cgctaaccaa accggtaacc ccgcttatta aaagcattct gtaacaaagc gggaccaaag 4500

ccatgacaaa aacgcgtaac aaaagtgtct ataatcacgg cagaaaagtc cacattgatt 4560

atttgcacgg cgtcacactt tgctatgcca tagcattttt atccataaga ttagcggatc 4620

ctacctgacg ctttttatcg caactctcta ctgtttctcc atacccgttt tttgggctaa 4680

caggaggaat taac 4694

<210> 104

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> oligo 36

<400> 104

ccataagatt agcggatcct acc 23

<210> 105

<211> 331

<212> DNA

<213> 人工序列

<220>

<223> His-Zebra PCR

<400> 105

ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60

acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccacgaa 120

tgcgactcag aactggaaat caaacgctat aaacgtgtgc gtgtggcatc ccgtaaatgt 180

cgcgcaaagt ttaaacagct gctgcaacat tatcgtgaag tagcggctgc gaaaagctcc 240

gaaaacgacc gtttacgcct cctcctgaag caaatgtgcg aattcgacaa gaaatactcc 300

atcggcctgg acattggaac caactctgtc g 331

<210> 106

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> His-tp10 PCR

<400> 106

ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60

acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccacgcg 120

ggttacctgc tgggcaagat taatcttaaa gcctgcgccg cgtgtgctaa gaaaattttg 180

gaattcgaca agaaatactc catcggcctg gacattggaa ccaactctgt cg 232

<210> 107

<211> 223

<212> DNA

<213> 人工序列

<220>

<223> His-pVEC PCR

<400> 107

ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60

acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccactta 120

ttgattatct tgcgtcgtcg catccgcaaa caggcgcacg cacatagcaa ggaattcgac 180

aagaaatact ccatcggcct ggacattgga accaactctg tcg 223

<210> 108

<211> 8294

<212> DNA

<213> 人工序列

<220>

<223> pRF144

<400> 108

ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60

aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120

atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180

aaatgtgcga attcgacaag aaatactcca tcggcctgga cattggaacc aactctgtcg 240

gctgggctgt catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa 300

acaccgatcg acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg 360

agactgccga agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga 420

accgaatctg ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt 480

tctttcatcg actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc 540

ccatctttgg caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc 600

acctgcgaaa gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg 660

ctctggcaca catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg 720

acaacagcga tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg 780

aggaaaaccc catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct 840

cgaagagcag acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac 900

tgtttggcaa cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg 960

atctggcgga ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca 1020

acctgcttgc acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt 1080

cggatgctat tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc 1140

tttctgcctc catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg 1200

ctcttgtccg acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga 1260

acggctacgc tggatacatc gacggcggag cctctcagga agagttctac aagttcatca 1320

agccaattct cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg 1380

atctgcttcg gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg 1440

gtgagctgca cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc 1500

gagagaagat cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca 1560

gaggaaactc tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga 1620

acttcgagga agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca 1680

acttcgacaa gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt 1740

actttacagt ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc 1800

ctgccttctt gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc 1860

gaaaggtcac tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca 1920

gcgtcgagat ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc 1980

tgctcaagat tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg 2040

aggacatcgt gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca 2100

agacatacgc tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca 2160

ccggctgggg aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa 2220

agaccattct ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca 2280

ttcacgacga ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg 2340

gcgacagctt gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca 2400

ttctccagac tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg 2460

agaacattgt gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact 2520

cgcgagagcg gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca 2580

aggagcatcc cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc 2640

agaatggtcg agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg 2700

atgtggacca cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc 2760

ttacacgatc cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca 2820

aaaagatgaa gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt 2880

tcgacaatct taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca 2940

tcaagcgtca actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt 3000

ctcggatgaa caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta 3060

ctctcaagtc caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag 3120

agatcaacaa ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc 3180

tcatcaagaa ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg 3240

acgttcgaaa gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact 3300

tcttttactc caacatcatg aactttttca agaccgagat caccttggcc aacggagaga 3360

ttcgaaagag accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg 3420

gtcgagactt tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga 3480

aaaccgaggt tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg 3540

acaagctcat cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc 3600

ctaccgtcgc ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc 3660

tcaagtccgt caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga 3720

atcccatcga cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca 3780

agctgcccaa gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg 3840

ctggcgagct gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct 3900

atctggcttc tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac 3960

tcttcgttga gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt 4020

cgaagcgagt catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc 4080

atcgggacaa acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca 4140

acctgggtgc tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca 4200

catccaccaa ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg 4260

agacccgaat cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc 4320

gaaaggtcta agcggccgct aagcttggct gttttggcgg atgagagaag attttcagcc 4380

tgatacagat taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca 4440

gtagcgcggt ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg 4500

atggtagtgt ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga 4560

aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 4620

ctgagtagga caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg 4680

tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg 4740

acggatggcc tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa 4800

tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 4860

gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 4920

tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 4980

tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 5040

ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 5100

atcccgtgtt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 5160

cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 5220

attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 5280

gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 5340

ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 5400

gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 5460

agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 5520

gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 5580

gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 5640

ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 5700

tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 5760

tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 5820

catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 5880

gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 5940

aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6000

gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 6060

gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6120

gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6180

atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6240

cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 6300

cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 6360

agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 6420

tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 6480

gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 6540

catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 6600

agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 6660

ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 6720

atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg 6780

ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg 6840

ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg 6900

agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat 6960

tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt 7020

ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac 7080

aacttgacgg ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg 7140

gccccggtgc attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg 7200

cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata 7260

cgttggtcct cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac 7320

agacgcgacg gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct 7380

gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg 7440

agcgactcgt taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc 7500

agcagctccg aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg 7560

ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac 7620

ggccagttaa gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac 7680

cattcgcgag cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa 7740

atatcacccg gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga 7800

atggtgagat tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga 7860

taaccgttgg cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc 7920

ggcagcaggg gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa 7980

gaaaccaatt gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc 8040

tcgctaacca aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa 8100

gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat 8160

tatttgcacg gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat 8220

cctacctgac gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta 8280

acaggaggaa ttaa 8294

<210> 109

<211> 8195

<212> DNA

<213> 人工序列

<220>

<223> pRF162

<400> 109

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggcatcacc accatcacca cgcgggttac ctgctgggca agattaatct 8160

taaagcctgc gccgcgtgtg ctaagaaaat tttgg 8195

<210> 110

<211> 8186

<212> DNA

<213> 人工序列

<220>

<223> pRF146

<400> 110

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggcatcacc accatcacca cttattgatt atcttgcgtc gtcgcatccg 8160

caaacaggcg cacgcacata gcaagg 8186

<210> 111

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> oligo 153

<400> 111

cgacagagtt ggttccaatg 20

<210> 112

<211> 4835

<212> DNA

<213> 人工序列

<220>

<223> pRF186

<400> 112

catggggcat caccaccatc accacgaatg cgactcagaa ctggaaatca aacgctataa 60

acgtgtgcgt gtggcatccc gtaaatgtcg cgcaaagttt aaacagctgc tgcaacatta 120

tcgtgaagta gcggctgcga aaagctccga aaacgaccgt ttacgcctcc tcctgaagca 180

aatgtgcgaa ttcggaggtg gcggtgcatc ctcggaggat gtgattaaag aatttatgcg 240

gtttaaagta cgtatggaag gatcggtgaa tggccatgaa tttgagattg agggtgaagg 300

cgaaggccgc ccgtacgaag gaactcaaac agcgaaatta aaagttacaa aaggaggtcc 360

tctgccgttt gcctgggaca tcttgagccc gcaattccag tacggttcca aagtgtatgt 420

aaaacaccct gcggatattc cggattataa aaaactgagt tttcccgagg ggtttaaatg 480

ggaacgggtg atgaattttg aggatggtgg agttgtcacc gtgacccagg actctagctt 540

acaagacggt agtttcatct acaaagtaaa atttatcggc gtaaacttcc catcggacgg 600

ccccgtcatg cagaaaaaga cgatgggctg ggaagccagc accgaacgtt tgtacccacg 660

ggacggcgtt ttgaaagggg aaatccataa ggcccttaaa ctgaaagacg gtggtcacta 720

tctcgtggag tttaaatcga tttatatggc taaaaaacca gtacagcttc cgggttatta 780

ttacgttgac tccaaattgg acatcacatc gcataatgaa gattacacga ttgttgaaca 840

gtacgagcgc gccgagggcc ggcaccatct gtttctgtaa aagcttggct gttttggcgg 900

atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 960

acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 1020

agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 1080

ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 1140

gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 1200

cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 1260

ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact cttttgttta 1320

tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 1380

caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 1440

ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 1500

gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 1560

aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 1620

ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact cggtcgccgc 1680

atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 1740

gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 1800

gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 1860

atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 1920

aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 1980

actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 2040

aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 2100

tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 2160

ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 2220

agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 2280

tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 2340

aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 2400

gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 2460

atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 2520

gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 2580

gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 2640

tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 2700

accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 2760

ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 2820

cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 2880

agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 2940

ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 3000

tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 3060

ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 3120

cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 3180

gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg 3240

tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag 3300

ttaagccagt atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc 3360

cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 3420

aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 3480

gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 3540

aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 3600

gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 3660

cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 3720

gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 3780

gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 3840

gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 3900

cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 3960

gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 4020

gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 4080

tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 4140

ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 4200

agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 4260

ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 4320

tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 4380

ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 4440

gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 4500

tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 4560

gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 4620

tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 4680

gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 4740

tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 4800

catacccgtt ttttgggcta acaggaggaa ttaac 4835

<210> 113

<211> 4736

<212> DNA

<213> 人工序列

<220>

<223> pRF192

<400> 113

aattcggagg tggcggtgca tcctcggagg atgtgattaa agaatttatg cggtttaaag 60

tacgtatgga aggatcggtg aatggccatg aatttgagat tgagggtgaa ggcgaaggcc 120

gcccgtacga aggaactcaa acagcgaaat taaaagttac aaaaggaggt cctctgccgt 180

ttgcctggga catcttgagc ccgcaattcc agtacggttc caaagtgtat gtaaaacacc 240

ctgcggatat tccggattat aaaaaactga gttttcccga ggggtttaaa tgggaacggg 300

tgatgaattt tgaggatggt ggagttgtca ccgtgaccca ggactctagc ttacaagacg 360

gtagtttcat ctacaaagta aaatttatcg gcgtaaactt cccatcggac ggccccgtca 420

tgcagaaaaa gacgatgggc tgggaagcca gcaccgaacg tttgtaccca cgggacggcg 480

ttttgaaagg ggaaatccat aaggccctta aactgaaaga cggtggtcac tatctcgtgg 540

agtttaaatc gatttatatg gctaaaaaac cagtacagct tccgggttat tattacgttg 600

actccaaatt ggacatcaca tcgcataatg aagattacac gattgttgaa cagtacgagc 660

gcgccgaggg ccggcaccat ctgtttctgt aaaagcttgg ctgttttggc ggatgagaga 720

agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 780

tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 840

gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 900

caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 960

gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa 1020

cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag 1080

aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttttgtt tatttttcta 1140

aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1200

ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1260

ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1320

agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1380

tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1440

tggcgcggta ttatcccgtg ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1500

ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1560

gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1620

acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1680

tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1740

gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1800

actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1860

aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1920

cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 1980

tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2040

cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2100

tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2160

ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2220

ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2280

cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2340

aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 2400

agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2460

tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2520

ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2580

cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2640

atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2700

ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2760

tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2820

gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2880

gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 2940

cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3000

gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 3060

ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 3120

gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 3180

cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 3240

accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 3300

cagcagatca attcgcgcgc gaaggcgaag cggcatgcat aatgtgcctg tcaaatggac 3360

gaagcaggga ttctgcaaac cctatgctac tccgtcaagc cgtcaattgt ctgattcgtt 3420

accaattatg acaacttgac ggctacatca ttcacttttt cttcacaacc ggcacggaac 3480

tcgctcgggc tggccccggt gcatttttta aatacccgcg agaaatagag ttgatcgtca 3540

aaaccaacat tgcgaccgac ggtggcgata ggcatccggg tggtgctcaa aagcagcttc 3600

gcctggctga tacgttggtc ctcgcgccag cttaagacgc taatccctaa ctgctggcgg 3660

aaaagatgtg acagacgcga cggcgacaag caaacatgct gtgcgacgct ggcgatatca 3720

aaattgctgt ctgccaggtg atcgctgatg tactgacaag cctcgcgtac ccgattatcc 3780

atcggtggat ggagcgactc gttaatcgct tccatgcgcc gcagtaacaa ttgctcaagc 3840

agatttatcg ccagcagctc cgaatagcgc ccttcccctt gcccggcgtt aatgatttgc 3900

ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg ggcgaaagaa ccccgtattg 3960

gcaaatattg acggccagtt aagccattca tgccagtagg cgcgcggacg aaagtaaacc 4020

cactggtgat accattcgcg agcctccgga tgacgaccgt agtgatgaat ctctcctggc 4080

gggaacagca aaatatcacc cggtcggcaa acaaattctc gtccctgatt tttcaccacc 4140

ccctgaccgc gaatggtgag attgagaata taacctttca ttcccagcgg tcggtcgata 4200

aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac ccgccaccag atgggcatta 4260

aacgagtatc ccggcagcag gggatcattt tgcgcttcag ccatactttt catactcccg 4320

ccattcagag aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt 4380

tactggctct tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa 4440

agcgggacca aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa 4500

gtccacattg attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata 4560

agattagcgg atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg 4620

ttttttgggc taacaggagg aattaaccat ggggcatcac caccatcacc acgcgggtta 4680

cctgctgggc aagattaatc ttaaagcctg cgccgcgtgt gctaagaaaa ttttgg 4736

<210> 114

<211> 4727

<212> DNA

<213> 人工序列

<220>

<223> pRF190

<400> 114

aattcggagg tggcggtgca tcctcggagg atgtgattaa agaatttatg cggtttaaag 60

tacgtatgga aggatcggtg aatggccatg aatttgagat tgagggtgaa ggcgaaggcc 120

gcccgtacga aggaactcaa acagcgaaat taaaagttac aaaaggaggt cctctgccgt 180

ttgcctggga catcttgagc ccgcaattcc agtacggttc caaagtgtat gtaaaacacc 240

ctgcggatat tccggattat aaaaaactga gttttcccga ggggtttaaa tgggaacggg 300

tgatgaattt tgaggatggt ggagttgtca ccgtgaccca ggactctagc ttacaagacg 360

gtagtttcat ctacaaagta aaatttatcg gcgtaaactt cccatcggac ggccccgtca 420

tgcagaaaaa gacgatgggc tgggaagcca gcaccgaacg tttgtaccca cgggacggcg 480

ttttgaaagg ggaaatccat aaggccctta aactgaaaga cggtggtcac tatctcgtgg 540

agtttaaatc gatttatatg gctaaaaaac cagtacagct tccgggttat tattacgttg 600

actccaaatt ggacatcaca tcgcataatg aagattacac gattgttgaa cagtacgagc 660

gcgccgaggg ccggcaccat ctgtttctgt aaaagcttgg ctgttttggc ggatgagaga 720

agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 780

tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 840

gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 900

caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 960

gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa 1020

cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag 1080

aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttttgtt tatttttcta 1140

aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1200

ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1260

ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1320

agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1380

tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1440

tggcgcggta ttatcccgtg ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1500

ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1560

gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1620

acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1680

tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1740

gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1800

actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1860

aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1920

cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 1980

tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2040

cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2100

tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2160

ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2220

ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2280

cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2340

aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 2400

agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2460

tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2520

ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2580

cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2640

atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2700

ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2760

tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2820

gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2880

gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 2940

cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3000

gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 3060

ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 3120

gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 3180

cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 3240

accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 3300

cagcagatca attcgcgcgc gaaggcgaag cggcatgcat aatgtgcctg tcaaatggac 3360

gaagcaggga ttctgcaaac cctatgctac tccgtcaagc cgtcaattgt ctgattcgtt 3420

accaattatg acaacttgac ggctacatca ttcacttttt cttcacaacc ggcacggaac 3480

tcgctcgggc tggccccggt gcatttttta aatacccgcg agaaatagag ttgatcgtca 3540

aaaccaacat tgcgaccgac ggtggcgata ggcatccggg tggtgctcaa aagcagcttc 3600

gcctggctga tacgttggtc ctcgcgccag cttaagacgc taatccctaa ctgctggcgg 3660

aaaagatgtg acagacgcga cggcgacaag caaacatgct gtgcgacgct ggcgatatca 3720

aaattgctgt ctgccaggtg atcgctgatg tactgacaag cctcgcgtac ccgattatcc 3780

atcggtggat ggagcgactc gttaatcgct tccatgcgcc gcagtaacaa ttgctcaagc 3840

agatttatcg ccagcagctc cgaatagcgc ccttcccctt gcccggcgtt aatgatttgc 3900

ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg ggcgaaagaa ccccgtattg 3960

gcaaatattg acggccagtt aagccattca tgccagtagg cgcgcggacg aaagtaaacc 4020

cactggtgat accattcgcg agcctccgga tgacgaccgt agtgatgaat ctctcctggc 4080

gggaacagca aaatatcacc cggtcggcaa acaaattctc gtccctgatt tttcaccacc 4140

ccctgaccgc gaatggtgag attgagaata taacctttca ttcccagcgg tcggtcgata 4200

aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac ccgccaccag atgggcatta 4260

aacgagtatc ccggcagcag gggatcattt tgcgcttcag ccatactttt catactcccg 4320

ccattcagag aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt 4380

tactggctct tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa 4440

agcgggacca aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa 4500

gtccacattg attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata 4560

agattagcgg atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg 4620

ttttttgggc taacaggagg aattaaccat ggggcatcac caccatcacc acttattgat 4680

tatcttgcgt cgtcgcatcc gcaaacaggc gcacgcacat agcaagg 4727

<210> 115

<211> 1395

<212> PRT

<213> 人工序列

<220>

<223> his-CFFKDEL-Cas9

<400> 115

Met Gly His His His His His His Cys Phe Phe Lys Asp Glu Leu Glu

1 5 10 15

Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

20 25 30

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

35 40 45

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

50 55 60

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

65 70 75 80

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

85 90 95

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

100 105 110

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

115 120 125

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

130 135 140

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

145 150 155 160

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

165 170 175

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

180 185 190

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

195 200 205

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

210 215 220

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

225 230 235 240

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

245 250 255

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

260 265 270

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

275 280 285

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

290 295 300

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

305 310 315 320

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

325 330 335

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

340 345 350

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

355 360 365

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

370 375 380

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

385 390 395 400

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

405 410 415

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

420 425 430

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

435 440 445

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

450 455 460

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

465 470 475 480

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

485 490 495

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

500 505 510

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

515 520 525

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

530 535 540

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

545 550 555 560

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

565 570 575

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

580 585 590

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

595 600 605

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

610 615 620

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

625 630 635 640

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

645 650 655

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

660 665 670

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

675 680 685

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

690 695 700

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

705 710 715 720

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

725 730 735

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

740 745 750

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

755 760 765

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

770 775 780

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

785 790 795 800

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

805 810 815

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

820 825 830

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

835 840 845

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

850 855 860

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

865 870 875 880

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

885 890 895

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

900 905 910

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

915 920 925

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

930 935 940

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

945 950 955 960

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

965 970 975

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

980 985 990

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

995 1000 1005

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu

1010 1015 1020

Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile

1025 1030 1035

Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1040 1045 1050

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu

1055 1060 1065

Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly

1070 1075 1080

Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr

1085 1090 1095

Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1100 1105 1110

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro

1115 1120 1125

Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp

1130 1135 1140

Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser

1145 1150 1155

Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1160 1165 1170

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser

1175 1180 1185

Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr

1190 1195 1200

Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser

1205 1210 1215

Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1220 1225 1230

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr

1235 1240 1245

Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly

1250 1255 1260

Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His

1265 1270 1275

Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1280 1285 1290

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser

1295 1300 1305

Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu

1310 1315 1320

Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala

1325 1330 1335

Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr

1340 1345 1350

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile

1355 1360 1365

Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1370 1375 1380

Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1385 1390 1395

<210> 116

<211> 1412

<212> PRT

<213> 人工序列

<220>

<223> his-MPG1-Cas9

<400> 116

Met Gly His His His His His His Gly Ala Leu Phe Leu Gly Gln Leu

1 5 10 15

Gly Ala Ala Gly Ser Thr Met Gly Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser

35 40 45

Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys

50 55 60

Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu

65 70 75 80

Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg

85 90 95

Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile

100 105 110

Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp

115 120 125

Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys

130 135 140

Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala

145 150 155 160

Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val

165 170 175

Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala

180 185 190

His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn

195 200 205

Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr

210 215 220

Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp

225 230 235 240

Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu

245 250 255

Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly

260 265 270

Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn

275 280 285

Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr

290 295 300

Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala

305 310 315 320

Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser

325 330 335

Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala

340 345 350

Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu

355 360 365

Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe

370 375 380

Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala

385 390 395 400

Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met

405 410 415

Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu

420 425 430

Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His

435 440 445

Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro

450 455 460

Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg

465 470 475 480

Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala

485 490 495

Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu

500 505 510

Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met

515 520 525

Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His

530 535 540

Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val

545 550 555 560

Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu

565 570 575

Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val

580 585 590

Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe

595 600 605

Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu

610 615 620

Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu

625 630 635 640

Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu

645 650 655

Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr

660 665 670

Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg

675 680 685

Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg

690 695 700

Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly

705 710 715 720

Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr

725 730 735

Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser

740 745 750

Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys

755 760 765

Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met

770 775 780

Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn

785 790 795 800

Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg

805 810 815

Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His

820 825 830

Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr

835 840 845

Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn

850 855 860

Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu

865 870 875 880

Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn

885 890 895

Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met

900 905 910

Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg

915 920 925

Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu

930 935 940

Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile

945 950 955 960

Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr

965 970 975

Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys

980 985 990

Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

995 1000 1005

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1010 1015 1020

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1025 1030 1035

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1040 1045 1050

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1055 1060 1065

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1070 1075 1080

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1085 1090 1095

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1100 1105 1110

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1115 1120 1125

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1130 1135 1140

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1145 1150 1155

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1160 1165 1170

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1175 1180 1185

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1190 1195 1200

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1205 1210 1215

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1220 1225 1230

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1235 1240 1245

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1250 1255 1260

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1265 1270 1275

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1280 1285 1290

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1295 1300 1305

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1310 1315 1320

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1325 1330 1335

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1340 1345 1350

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1355 1360 1365

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1370 1375 1380

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1385 1390 1395

Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1400 1405 1410

<210> 117

<211> 8237

<212> DNA

<213> 人工序列

<220>

<223> pRF48

<400> 117

aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60

tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120

gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180

aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240

gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300

gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360

gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420

agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480

acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540

atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600

ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660

gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720

acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780

aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840

cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900

ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960

ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020

gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080

ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140

tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200

ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260

acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320

tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380

ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440

aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500

agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560

tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620

tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680

ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740

tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800

ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860

tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920

ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980

gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040

tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100

attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160

tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220

ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280

tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340

ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400

ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460

gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520

acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580

ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640

agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700

ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760

aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820

acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880

ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940

attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000

aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060

agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120

ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180

gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240

ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300

ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360

tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420

cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480

tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540

acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600

agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660

tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720

ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780

agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840

tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900

aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960

ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020

aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080

tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140

aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200

ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260

tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320

tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380

tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440

acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500

ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560

ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800

gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040

tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100

accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160

ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220

agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280

gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340

ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400

tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460

ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520

gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580

acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640

aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700

atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760

gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820

tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880

ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940

ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000

ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060

aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120

cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180

gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240

ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300

cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360

tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420

cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540

tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600

cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660

gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720

tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780

aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840

ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900

gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960

cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020

gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080

tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140

ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200

tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260

ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320

gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380

ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440

agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500

gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560

ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620

ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680

gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740

ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800

tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860

aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920

aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980

ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040

cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100

attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160

acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220

agctggtacc atatggg 8237

<210> 118

<211> 8153

<212> DNA

<213> 人工序列

<220>

<223> pRF243

<400> 118

catggggcat caccatcacc accattgttt tttcaaagac gaactggaat tcgacaagaa 60

atactccatc ggcctggaca ttggaaccaa ctctgtcggc tgggctgtca tcaccgacga 120

gtacaaggtg ccctccaaga aattcaaggt cctcggaaac accgatcgac actccatcaa 180

gaaaaacctc attggtgccc tgttgttcga ttctggcgag actgccgaag ctaccagact 240

caagcgaact gctcggcgac gttacacccg acggaagaac cgaatctgct acctgcagga 300

gatcttttcc aacgagatgg ccaaggtgga cgattcgttc tttcatcgac tggaggaatc 360

cttcctcgtc gaggaagaca agaaacacga gcgtcatccc atctttggca acattgtgga 420

cgaggttgct taccacgaga agtatcctac catctaccac ctgcgaaaga aactcgtcga 480

ttccaccgac aaggcggatc tcagacttat ctacctcgct ctggcacaca tgatcaagtt 540

tcgaggtcat ttcctcatcg agggcgatct caatcccgac aacagcgatg tggacaagct 600

gttcattcag ctcgttcaga cctacaacca gctgttcgag gaaaacccca tcaatgcctc 660

cggagtcgat gcaaaggcca tcttgtctgc tcgactctcg aagagcagac gactggagaa 720

cctcattgcc caacttcctg gcgagaaaaa gaacggactg tttggcaacc tcattgccct 780

ttctcttggt ctcacaccca acttcaagtc caacttcgat ctggcggagg acgccaagct 840

ccagctgtcc aaggacacct acgacgatga cctcgacaac ctgcttgcac agattggcga 900

tcagtacgcc gacctgtttc tcgctgccaa gaacctttcg gatgctattc tcttgtctga 960

cattctgcga gtcaacaccg agatcacaaa ggctcccctt tctgcctcca tgatcaagcg 1020

atacgacgag caccatcagg atctcacact gctcaaggct cttgtccgac agcaactgcc 1080

cgagaagtac aaggagatct ttttcgatca gtcgaagaac ggctacgctg gatacatcga 1140

cggcggagcc tctcaggaag agttctacaa gttcatcaag ccaattctcg agaagatgga 1200

cggaaccgag gaactgcttg tcaagctcaa tcgagaggat ctgcttcgga agcaacgaac 1260

cttcgacaac ggcagcattc ctcatcagat ccacctcggt gagctgcacg ccattcttcg 1320

acgtcaggaa gacttctacc cctttctcaa ggacaaccga gagaagatcg agaagattct 1380

tacctttcga atcccctact atgttggtcc tcttgccaga ggaaactctc gatttgcttg 1440

gatgactcga aagtccgagg aaaccatcac tccctggaac ttcgaggaag tcgtggacaa 1500

gggtgcctct gcacagtcct tcatcgagcg aatgaccaac ttcgacaaga atctgcccaa 1560

cgagaaggtt cttcccaagc attcgctgct ctacgagtac tttacagtct acaacgaact 1620

caccaaagtc aagtacgtta ccgagggaat gcgaaagcct gccttcttgt ctggcgaaca 1680

gaagaaagcc attgtcgatc tcctgttcaa gaccaaccga aaggtcactg ttaagcagct 1740

caaggaggac tacttcaaga aaatcgagtg tttcgacagc gtcgagattt ccggagttga 1800

ggaccgattc aacgcctctt tgggcaccta tcacgatctg ctcaagatta tcaaggacaa 1860

ggattttctc gacaacgagg aaaacgagga cattctggag gacatcgtgc tcactcttac 1920

cctgttcgaa gatcgggaga tgatcgagga acgactcaag acatacgctc acctgttcga 1980

cgacaaggtc atgaaacaac tcaagcgacg tagatacacc ggctggggaa gactttcgcg 2040

aaagctcatc aacggcatca gagacaagca gtccggaaag accattctgg actttctcaa 2100

gtccgatggc tttgccaacc gaaacttcat gcagctcatt cacgacgatt ctcttacctt 2160

caaggaggac atccagaagg cacaagtgtc cggtcagggc gacagcttgc acgaacatat 2220

tgccaacctg gctggttcgc cagccatcaa gaaaggcatt ctccagactg tcaaggttgt 2280

cgacgagctg gtgaaggtca tgggacgtca caagcccgag aacattgtga tcgagatggc 2340

cagagagaac cagacaactc aaaagggtca gaaaaactcg cgagagcgga tgaagcgaat 2400

cgaggaaggc atcaaggagc tgggatccca gattctcaag gagcatcccg tcgagaacac 2460

tcaactgcag aacgagaagc tgtatctcta ctatctgcag aatggtcgag acatgtacgt 2520

ggatcaggaa ctggacatca atcgtctcag cgactacgat gtggaccaca ttgtccctca 2580

atcctttctc aaggacgatt ctatcgacaa caaggtcctt acacgatccg acaagaacag 2640

aggcaagtcg gacaacgttc ccagcgaaga ggtggtcaaa aagatgaaga actactggcg 2700

acagctgctc aacgccaagc tcattaccca gcgaaagttc gacaatctta ccaaggccga 2760

gcgaggcggt ctgtccgagc tcgacaaggc tggcttcatc aagcgtcaac tcgtcgagac 2820

cagacagatc acaaagcacg tcgcacagat tctcgattct cggatgaaca ccaagtacga 2880

cgagaacgac aagctcatcc gagaggtcaa ggtgattact ctcaagtcca aactggtctc 2940

cgatttccga aaggactttc agttctacaa ggtgcgagag atcaacaatt accaccatgc 3000

ccacgatgct tacctcaacg ccgtcgttgg cactgcgctc atcaagaaat accccaagct 3060

cgaaagcgag ttcgtttacg gcgattacaa ggtctacgac gttcgaaaga tgattgccaa 3120

gtccgaacag gagattggca aggctactgc caagtacttc ttttactcca acatcatgaa 3180

ctttttcaag accgagatca ccttggccaa cggagagatt cgaaagagac cacttatcga 3240

gaccaacggc gaaactggag agatcgtgtg ggacaagggt cgagactttg caaccgtgcg 3300

aaaggttctg tcgatgcctc aggtcaacat cgtcaagaaa accgaggttc agactggcgg 3360

attctccaag gagtcgattc tgcccaagcg aaactccgac aagctcatcg ctcgaaagaa 3420

agactgggat cccaagaaat acggtggctt cgattctcct accgtcgcct attccgtgct 3480

tgtcgttgcg aaggtcgaga agggcaagtc caaaaagctc aagtccgtca aggagctgct 3540

cggaattacc atcatggagc gatcgagctt cgagaagaat cccatcgact tcttggaagc 3600

caagggttac aaggaggtca agaaagacct cattatcaag ctgcccaagt actctctgtt 3660

cgaactggag aacggtcgaa agcgtatgct cgcctccgct ggcgagctgc agaagggaaa 3720

cgagcttgcc ttgccttcga agtacgtcaa ctttctctat ctggcttctc actacgagaa 3780

gctcaagggt tctcccgagg acaacgaaca gaagcaactc ttcgttgagc agcacaaaca 3840

ttacctcgac gagattatcg agcagatttc cgagttttcg aagcgagtca tcctggctga 3900

tgccaacttg gacaaggtgc tctctgccta caacaagcat cgggacaaac ccattcgaga 3960

acaggcggag aacatcattc acctgtttac tcttaccaac ctgggtgctc ctgcagcttt 4020

caagtacttc gataccacta tcgaccgaaa gcggtacaca tccaccaagg aggttctcga 4080

tgccaccctg attcaccagt ccatcactgg cctgtacgag acccgaatcg acctgtctca 4140

gcttggtggc gactccagag ccgatcccaa gaaaaagcga aaggtctaag cggccgctaa 4200

gcttggctgt tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg 4260

cagaagcggt ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga 4320

ccccatgccg aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca 4380

tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg 4440

cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg 4500

gagcggattt gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat 4560

aaactgccag gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 4620

tacaaactct tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 4680

taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 4740

cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 4800

acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4860

ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4920

atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtgttga cgccgggcaa 4980

gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 5040

acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 5100

atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5160

accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5220

ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 5280

acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5340

gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5400

tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5460

ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 5520

actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 5580

taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 5640

tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 5700

gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 5760

cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 5820

gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5880

gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 5940

tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 6000

ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 6060

cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6120

gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6180

gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6240

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6300

cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6360

tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6420

cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6480

cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 6540

tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 6600

tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca 6660

tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 6720

cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 6780

caccgtcatc accgaaacgc gcgaggcagc agatcaattc gcgcgcgaag gcgaagcggc 6840

atgcataatg tgcctgtcaa atggacgaag cagggattct gcaaacccta tgctactccg 6900

tcaagccgtc aattgtctga ttcgttacca attatgacaa cttgacggct acatcattca 6960

ctttttcttc acaaccggca cggaactcgc tcgggctggc cccggtgcat tttttaaata 7020

cccgcgagaa atagagttga tcgtcaaaac caacattgcg accgacggtg gcgataggca 7080

tccgggtggt gctcaaaagc agcttcgcct ggctgatacg ttggtcctcg cgccagctta 7140

agacgctaat ccctaactgc tggcggaaaa gatgtgacag acgcgacggc gacaagcaaa 7200

catgctgtgc gacgctggcg atatcaaaat tgctgtctgc caggtgatcg ctgatgtact 7260

gacaagcctc gcgtacccga ttatccatcg gtggatggag cgactcgtta atcgcttcca 7320

tgcgccgcag taacaattgc tcaagcagat ttatcgccag cagctccgaa tagcgccctt 7380

ccccttgccc ggcgttaatg atttgcccaa acaggtcgct gaaatgcggc tggtgcgctt 7440

catccgggcg aaagaacccc gtattggcaa atattgacgg ccagttaagc cattcatgcc 7500

agtaggcgcg cggacgaaag taaacccact ggtgatacca ttcgcgagcc tccggatgac 7560

gaccgtagtg atgaatctct cctggcggga acagcaaaat atcacccggt cggcaaacaa 7620

attctcgtcc ctgatttttc accaccccct gaccgcgaat ggtgagattg agaatataac 7680

ctttcattcc cagcggtcgg tcgataaaaa aatcgagata accgttggcc tcaatcggcg 7740

ttaaacccgc caccagatgg gcattaaacg agtatcccgg cagcagggga tcattttgcg 7800

cttcagccat acttttcata ctcccgccat tcagagaaga aaccaattgt ccatattgca 7860

tcagacattg ccgtcactgc gtcttttact ggctcttctc gctaaccaaa ccggtaaccc 7920

cgcttattaa aagcattctg taacaaagcg ggaccaaagc catgacaaaa acgcgtaaca 7980

aaagtgtcta taatcacggc agaaaagtcc acattgatta tttgcacggc gtcacacttt 8040

gctatgccat agcattttta tccataagat tagcggatcc tacctgacgc tttttatcgc 8100

aactctctac tgtttctcca tacccgtttt ttgggctaac aggaggaatt aac 8153

<210> 119

<211> 8204

<212> DNA

<213> 人工序列

<220>

<223> pRF238

<400> 119

catggggcat catcatcacc atcacggcgc cctgttctta ggccagctgg gcgccgcggg 60

atccacgatg ggtgcgccga agaaaaagcg caaagttgaa ttcgacaaga aatactccat 120

cggcctggac attggaacca actctgtcgg ctgggctgtc atcaccgacg agtacaaggt 180

gccctccaag aaattcaagg tcctcggaaa caccgatcga cactccatca agaaaaacct 240

cattggtgcc ctgttgttcg attctggcga gactgccgaa gctaccagac tcaagcgaac 300

tgctcggcga cgttacaccc gacggaagaa ccgaatctgc tacctgcagg agatcttttc 360

caacgagatg gccaaggtgg acgattcgtt ctttcatcga ctggaggaat ccttcctcgt 420

cgaggaagac aagaaacacg agcgtcatcc catctttggc aacattgtgg acgaggttgc 480

ttaccacgag aagtatccta ccatctacca cctgcgaaag aaactcgtcg attccaccga 540

caaggcggat ctcagactta tctacctcgc tctggcacac atgatcaagt ttcgaggtca 600

tttcctcatc gagggcgatc tcaatcccga caacagcgat gtggacaagc tgttcattca 660

gctcgttcag acctacaacc agctgttcga ggaaaacccc atcaatgcct ccggagtcga 720

tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga cgactggaga acctcattgc 780

ccaacttcct ggcgagaaaa agaacggact gtttggcaac ctcattgccc tttctcttgg 840

tctcacaccc aacttcaagt ccaacttcga tctggcggag gacgccaagc tccagctgtc 900

caaggacacc tacgacgatg acctcgacaa cctgcttgca cagattggcg atcagtacgc 960

cgacctgttt ctcgctgcca agaacctttc ggatgctatt ctcttgtctg acattctgcg 1020

agtcaacacc gagatcacaa aggctcccct ttctgcctcc atgatcaagc gatacgacga 1080

gcaccatcag gatctcacac tgctcaaggc tcttgtccga cagcaactgc ccgagaagta 1140

caaggagatc tttttcgatc agtcgaagaa cggctacgct ggatacatcg acggcggagc 1200

ctctcaggaa gagttctaca agttcatcaa gccaattctc gagaagatgg acggaaccga 1260

ggaactgctt gtcaagctca atcgagagga tctgcttcgg aagcaacgaa ccttcgacaa 1320

cggcagcatt cctcatcaga tccacctcgg tgagctgcac gccattcttc gacgtcagga 1380

agacttctac ccctttctca aggacaaccg agagaagatc gagaagattc ttacctttcg 1440

aatcccctac tatgttggtc ctcttgccag aggaaactct cgatttgctt ggatgactcg 1500

aaagtccgag gaaaccatca ctccctggaa cttcgaggaa gtcgtggaca agggtgcctc 1560

tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag aatctgccca acgagaaggt 1620

tcttcccaag cattcgctgc tctacgagta ctttacagtc tacaacgaac tcaccaaagt 1680

caagtacgtt accgagggaa tgcgaaagcc tgccttcttg tctggcgaac agaagaaagc 1740

cattgtcgat ctcctgttca agaccaaccg aaaggtcact gttaagcagc tcaaggagga 1800

ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt tccggagttg aggaccgatt 1860

caacgcctct ttgggcacct atcacgatct gctcaagatt atcaaggaca aggattttct 1920

cgacaacgag gaaaacgagg acattctgga ggacatcgtg ctcactctta ccctgttcga 1980

agatcgggag atgatcgagg aacgactcaa gacatacgct cacctgttcg acgacaaggt 2040

catgaaacaa ctcaagcgac gtagatacac cggctgggga agactttcgc gaaagctcat 2100

caacggcatc agagacaagc agtccggaaa gaccattctg gactttctca agtccgatgg 2160

ctttgccaac cgaaacttca tgcagctcat tcacgacgat tctcttacct tcaaggagga 2220

catccagaag gcacaagtgt ccggtcaggg cgacagcttg cacgaacata ttgccaacct 2280

ggctggttcg ccagccatca agaaaggcat tctccagact gtcaaggttg tcgacgagct 2340

ggtgaaggtc atgggacgtc acaagcccga gaacattgtg atcgagatgg ccagagagaa 2400

ccagacaact caaaagggtc agaaaaactc gcgagagcgg atgaagcgaa tcgaggaagg 2460

catcaaggag ctgggatccc agattctcaa ggagcatccc gtcgagaaca ctcaactgca 2520

gaacgagaag ctgtatctct actatctgca gaatggtcga gacatgtacg tggatcagga 2580

actggacatc aatcgtctca gcgactacga tgtggaccac attgtccctc aatcctttct 2640

caaggacgat tctatcgaca acaaggtcct tacacgatcc gacaagaaca gaggcaagtc 2700

ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag aactactggc gacagctgct 2760

caacgccaag ctcattaccc agcgaaagtt cgacaatctt accaaggccg agcgaggcgg 2820

tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa ctcgtcgaga ccagacagat 2880

cacaaagcac gtcgcacaga ttctcgattc tcggatgaac accaagtacg acgagaacga 2940

caagctcatc cgagaggtca aggtgattac tctcaagtcc aaactggtct ccgatttccg 3000

aaaggacttt cagttctaca aggtgcgaga gatcaacaat taccaccatg cccacgatgc 3060

ttacctcaac gccgtcgttg gcactgcgct catcaagaaa taccccaagc tcgaaagcga 3120

gttcgtttac ggcgattaca aggtctacga cgttcgaaag atgattgcca agtccgaaca 3180

ggagattggc aaggctactg ccaagtactt cttttactcc aacatcatga actttttcaa 3240

gaccgagatc accttggcca acggagagat tcgaaagaga ccacttatcg agaccaacgg 3300

cgaaactgga gagatcgtgt gggacaaggg tcgagacttt gcaaccgtgc gaaaggttct 3360

gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt cagactggcg gattctccaa 3420

ggagtcgatt ctgcccaagc gaaactccga caagctcatc gctcgaaaga aagactggga 3480

tcccaagaaa tacggtggct tcgattctcc taccgtcgcc tattccgtgc ttgtcgttgc 3540

gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc aaggagctgc tcggaattac 3600

catcatggag cgatcgagct tcgagaagaa tcccatcgac ttcttggaag ccaagggtta 3660

caaggaggtc aagaaagacc tcattatcaa gctgcccaag tactctctgt tcgaactgga 3720

gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg cagaagggaa acgagcttgc 3780

cttgccttcg aagtacgtca actttctcta tctggcttct cactacgaga agctcaaggg 3840

ttctcccgag gacaacgaac agaagcaact cttcgttgag cagcacaaac attacctcga 3900

cgagattatc gagcagattt ccgagttttc gaagcgagtc atcctggctg atgccaactt 3960

ggacaaggtg ctctctgcct acaacaagca tcgggacaaa cccattcgag aacaggcgga 4020

gaacatcatt cacctgttta ctcttaccaa cctgggtgct cctgcagctt tcaagtactt 4080

cgataccact atcgaccgaa agcggtacac atccaccaag gaggttctcg atgccaccct 4140

gattcaccag tccatcactg gcctgtacga gacccgaatc gacctgtctc agcttggtgg 4200

cgactccaga gccgatccca agaaaaagcg aaaggtctaa gcggccgcta agcttggctg 4260

ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 4320

tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 4380

gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt 4440

agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 4500

ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt 4560

tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca 4620

ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc 4680

ttttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 4740

taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 4800

cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 4860

aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 4920

aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 4980

tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg acgccgggca agagcaactc 5040

ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 5100

catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 5160

aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 5220

ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 5280

gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 5340

aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 5400

gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 5460

gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 5520

gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 5580

gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 5640

gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 5700

atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5760

ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5820

ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5880

ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5940

ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 6000

ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 6060

tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 6120

tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 6180

tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 6240

tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 6300

gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 6360

tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6420

ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6480

gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6540

gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt 6600

acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 6660

gccgcatagt taagccagta tacactccgc tatcgctacg tgactgggtc atggctgcgc 6720

cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6780

cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6840

caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa ggcgaagcgg catgcataat 6900

gtgcctgtca aatggacgaa gcagggattc tgcaaaccct atgctactcc gtcaagccgt 6960

caattgtctg attcgttacc aattatgaca acttgacggc tacatcattc actttttctt 7020

cacaaccggc acggaactcg ctcgggctgg ccccggtgca ttttttaaat acccgcgaga 7080

aatagagttg atcgtcaaaa ccaacattgc gaccgacggt ggcgataggc atccgggtgg 7140

tgctcaaaag cagcttcgcc tggctgatac gttggtcctc gcgccagctt aagacgctaa 7200

tccctaactg ctggcggaaa agatgtgaca gacgcgacgg cgacaagcaa acatgctgtg 7260

cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc gctgatgtac tgacaagcct 7320

cgcgtacccg attatccatc ggtggatgga gcgactcgtt aatcgcttcc atgcgccgca 7380

gtaacaattg ctcaagcaga tttatcgcca gcagctccga atagcgccct tccccttgcc 7440

cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg ctggtgcgct tcatccgggc 7500

gaaagaaccc cgtattggca aatattgacg gccagttaag ccattcatgc cagtaggcgc 7560

gcggacgaaa gtaaacccac tggtgatacc attcgcgagc ctccggatga cgaccgtagt 7620

gatgaatctc tcctggcggg aacagcaaaa tatcacccgg tcggcaaaca aattctcgtc 7680

cctgattttt caccaccccc tgaccgcgaa tggtgagatt gagaatataa cctttcattc 7740

ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc ctcaatcggc gttaaacccg 7800

ccaccagatg ggcattaaac gagtatcccg gcagcagggg atcattttgc gcttcagcca 7860

tacttttcat actcccgcca ttcagagaag aaaccaattg tccatattgc atcagacatt 7920

gccgtcactg cgtcttttac tggctcttct cgctaaccaa accggtaacc ccgcttatta 7980

aaagcattct gtaacaaagc gggaccaaag ccatgacaaa aacgcgtaac aaaagtgtct 8040

ataatcacgg cagaaaagtc cacattgatt atttgcacgg cgtcacactt tgctatgcca 8100

tagcattttt atccataaga ttagcggatc ctacctgacg ctttttatcg caactctcta 8160

ctgtttctcc atacccgttt tttgggctaa caggaggaat taac 8204

<210> 120

<211> 1149

<212> DNA

<213> 大肠杆菌

<220>

<221> 尚未归类的特征

<222> (1)..(1149)

<223> galK基因

<400> 120

atgagtctga aagaaaaaac acaatctctg tttgccaacg catttggcta ccctgccact 60

cacaccattc aggcgcctgg ccgcgtgaat ttgattggtg aacacaccga ctacaacgac 120

ggtttcgttc tgccctgcgc gattgattat caaaccgtga tcagttgtgc accacgcgat 180

gaccgtaaag ttcgcgtgat ggcagccgat tatgaaaatc agctcgacga gttttccctc 240

gatgcgccca ttgtcgcaca tgaaaactat caatgggcta actacgttcg tggcgtggtg 300

aaacatctgc aactgcgtaa caacagcttc ggcggcgtgg acatggtgat cagcggcaat 360

gtgccgcagg gtgccgggtt aagttcttcc gcttcactgg aagtcgcggt cggaaccgta 420

ttgcagcagc tttatcatct gccgctggac ggcgcacaaa tcgcgcttaa cggtcaggaa 480

gcagaaaacc agtttgtagg ctgtaactgc gggatcatgg atcagctaat ttccgcgctc 540

ggcaagaaag atcatgcctt gctgatcgat tgccgctcac tggggaccaa agcagtttcc 600

atgcccaaag gtgtggctgt cgtcatcatc aacagtaact tcaaacgtac cctggttggc 660

agcgaataca acacccgtcg tgaacagtgc gaaaccggtg cgcgtttctt ccagcagcca 720

gccctgcgtg atgtcaccat tgaagagttc aacgctgttg cgcatgaact ggacccgatc 780

gtggcaaaac gcgtgcgtca tatactgact gaaaacgccc gcaccgttga agctgccagc 840

gcgctggagc aaggcgacct gaaacgtatg ggcgagttga tggcggagtc tcatgcctct 900

atgcgcgatg atttcgaaat caccgtgccg caaattgaca ctctggtaga aatcgtcaaa 960

gctgtgattg gcgacaaagg tggcgtacgc atgaccggcg gcggatttgg cggctgtatc 1020

gtcgcgctga tcccggaaga gctggtgcct gccgtacagc aagctgtcgc tgaacaatat 1080

gaagcaaaaa caggtattaa agagactttt tacgtttgta aaccatcaca aggagcagga 1140

cagtgctga 1149

<210> 121

<211> 1017

<212> DNA

<213> 大肠杆菌

<400> 121

atgagagttc tggttaccgg tggtagcggt tacattggaa gtcatacctg tgtgcaatta 60

ctgcaaaacg gtcatgatgt catcattctt gataacctct gtaacagtaa gcgcagcgta 120

ctgcctgtta tcgagcgttt aggcggcaaa catccaacgt ttgttgaagg cgatattcgt 180

aacgaagcgt tgatgaccga gatcctgcac gatcacgcta tcgacaccgt gatccacttc 240

gccgggctga aagccgtggg cgaatcggta caaaaaccgc tggaatatta cgacaacaat 300

gtcaacggca ctctgcgcct gattagcgcc atgcgcgccg ctaacgtcaa aaactttatt 360

tttagctcct ccgccaccgt ttatggcgat cagcccaaaa ttccatacgt tgaaagcttc 420

ccgaccggca caccgcaaag cccttacggc aaaagcaagc tgatggtgga acagatcctc 480

accgatctgc aaaaagccca gccggactgg agcattgccc tgctgcgcta cttcaacccg 540

gttggcgcgc atccgtcggg cgatatgggc gaagatccgc aaggcattcc gaataacctg 600

atgccataca tcgcccaggt tgctgtaggc cgtcgcgact cgctggcgat ttttggtaac 660

gattatccga ccgaagatgg tactggcgta cgcgattaca tccacgtaat ggatctggcg 720

gacggtcacg tcgtggcgat ggaaaaactg gcgaacaagc caggcgtaca catctacaac 780

ctcggcgctg gcgtaggcaa cagcgtgctg gacgtggtta atgccttcag caaagcctgc 840

ggcaaaccgg ttaattatca ttttgcaccg cgtcgcgagg gcgaccttcc ggcctactgg 900

gcggacgcca gcaaagccga ccgtgaactg aactggcgcg taacgcgcac actcgatgaa 960

atggcgcagg acacctggca ctggcagtca cgccatccac agggatatcc cgattaa 1017

<210> 122

<211> 1047

<212> DNA

<213> 大肠杆菌

<400> 122

atgacgcaat ttaatcccgt tgatcatcca catcgccgct acaacccgct caccgggcaa 60

tggattctgg tttcaccgca ccgcgctaag cgcccctggc agggggcgca ggaaacgcca 120

gccaaacagg tgttacctgc gcacgatcca gattgcttcc tctgcgcagg taatgtgcgg 180

gtgacaggcg ataaaaaccc cgattacacc gggacttacg ttttcactaa tgactttgcg 240

gctttgatgt ctgacacgcc agatgcgcca gaaagtcacg atccgctgat gcgttgccag 300

agcgcgcgcg gcaccagccg ggtgatctgc ttttcaccgg atcacagtaa aacgctgcca 360

gagctcagcg ttgcagcatt gacggaaatc gtcaaaacct ggcaggagca aaccgcagaa 420

ctggggaaaa cgtacccatg ggtgcaggtt tttgaaaaca aaggcgcggc gatgggctgc 480

tctaacccgc atccgcacgg tcagatttgg gcaaatagct tcctgcctaa cgaagctgag 540

cgcgaagacc gcctgcaaaa agaatatttt gccgaacaga aatcaccaat gctggtggat 600

tatgttcagc gcgagctggc agacggtagc cgtaccgttg tcgaaaccga acactggtta 660

gccgtcgtgc cttactgggc tgcctggccg ttcgaaacgc tactgctgcc caaagcccac 720

gttttacgga tcaccgattt gaccgacgcc cagcgcagcg atctggcgct ggcgttgaaa 780

aagctgacca gtcgttatga caacctcttc cagtgctcct tcccctactc tatgggctgg 840

cacggcgcgc catttaatgg cgaagagaat caacactggc agctgcacgc gcacttttat 900

ccgcctctgc tgcgctccgc caccgtacgt aaatttatgg ttggttatga aatgctggca 960

gagacccagc gagacctgac cgcagaacag gcagcagagc gtttgcgcgc agtcagcgat 1020

atccattttc gcgaatccgg agtgtaa 1047

<210> 123

<211> 76

<212> RNA

<213> 人工序列

<220>

<223> CER结构域l

<400> 123

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugc 76

<210> 124

<211> 76

<212> DNA

<213> 人工序列

<220>

<223> 编码CER的DNA PCR

<400> 124

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgc 76

<210> 125

<211> 11714

<212> DNA

<213> 人工序列

<220>

<223> pRF291

<400> 125

cgataaaaaa caaaaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 60

tagccttatt ttaacttgct atttctagct ctaaaacgca ggtgtaaaaa taaaaaggcc 120

tgcgattacc agcaggcctg ttattaacct aagccttagg acgcttcacg ccatacttgg 180

aacgagcctg cttacggtct ttaacgccgg agcagtcaag cgcaccacgt acggtgtggt 240

aacgaacacc cgggaggtct ttaacacgac cgccacggat caggatcacg gagtgctcct 300

gcaggttgtg accttcacca ccgatgtagg aagtcacttc gaaaccgtta gtcagacgaa 360

cacggcatac tttacgcagc gcggagttcg gttttttagg agtggtagta tatacacgag 420

tacatacgcc acgtttttgc gggcatgctt ccagcgcagg cacgttgctt ttcgcaactt 480

tgcgagcacg tggtttgcgt accagctggt taactgttgc cattaaatag ctcctggttt 540

tagcttttgc ttcgtaaaca cgtaataaaa cgtcctcaca caatatgagg acgccgaatt 600

tagggcgatg ccgaaaaggt gtcaagaaat atacaacgat cccgccatca cctgcgtccc 660

attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg gaccatgccg 720

gccattattt tgcgttaagt ttctaatcat cacgaaatta tctatcaaaa ataactaggt 780

cccaccgaga ttcgaactcg ggaccttaag atttgcaatc tcacgcgcta ccgctgtgcc 840

ataggaccga agttaaaatt tggccaaaga aggacctggg caccctggac tgtgggttag 900

ggtaatattc cttatggaga caatgggcta gggtaaatta cctaaaatgg gtcgataaag 960

aggggtgttc ccagttggga agtgtaattg aagacggggt caaaaaagaa aatcaaaaaa 1020

aatttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt 1080

caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt 1140

ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg 1200

tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt 1260

taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca 1320

gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg 1380

ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt 1440

ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca 1500

gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg 1560

gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc 1620

tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc 1680

ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc 1740

tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg 1800

atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata 1860

tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg 1920

gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg 1980

cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc 2040

agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag 2100

gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga 2160

ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat 2220

atgttatggt aatagttacg agttagttga acttatagat agactggact atacggctat 2280

cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg 2340

tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc 2400

gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa 2460

gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg 2520

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 2580

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 2640

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 2700

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 2760

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 2820

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 2880

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 2940

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 3000

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 3060

accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 3120

gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 3180

cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 3240

gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 3300

tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 3360

cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 3420

ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccatctccga 3480

aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 3540

cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 3600

gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 3660

cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 3720

agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 3780

aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 3840

gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 3900

gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 3960

attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 4020

tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 4080

cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 4140

gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 4200

ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 4260

cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 4320

cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 4380

atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 4440

tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 4500

gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 4560

aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 4620

gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 4680

ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 4740

actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 4800

atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 4860

attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 4920

gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 4980

gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 5040

ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 5100

ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 5160

gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 5220

ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 5280

actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 5340

gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 5400

cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 5460

cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 5520

cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 5580

cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 5640

tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 5700

aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 5760

cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 5820

caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 5880

aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 5940

tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 6000

aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 6060

aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 6120

aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 6180

tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 6240

agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 6300

tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 6360

gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 6420

atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 6480

gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 6540

gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 6600

gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 6660

aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 6720

ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 6780

tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 6840

gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 6900

gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 6960

aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 7020

gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 7080

aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 7140

atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 7200

taagcggccg caagtgtgga tggggaagtg agtgcccggt tctgtgtgca caattggcaa 7260

tccaagatgg atggattcaa cacagggata tagcgagcta cgtggtggtg cgaggatata 7320

gcaacggata tttatgtttg acacttgaga atgtacgata caagcactgt ccaagtacaa 7380

tactaaacat actgtacata ctcatactcg tacccgggca acggtttcac ttgagtgcag 7440

tggctagtgc tcttactcgt acagtgtgca atactgcgta tcatagtctt tgatgtatat 7500

cgtattcatt catgttagtt gcgtacgagc cggaagcata aagtgtaaag cctggggtgc 7560

ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7620

aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 7680

tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7740

gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7800

cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7860

gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 7920

aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 7980

ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8040

cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8100

ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8160

cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8220

agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8280

gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 8340

gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8400

tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8460

agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8520

agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 8580

atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8640

cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8700

actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8760

aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8820

cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 8880

ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 8940

cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9000

ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9060

cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9120

ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9180

tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9240

ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9300

aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9360

gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9420

gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9480

ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9540

catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9600

atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 9660

ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 9720

tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 9780

gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 9840

gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 9900

ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 9960

ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10020

tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 10080

cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 10140

ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10200

ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 10260

ggcgaattgg gtaccgggcc ccccctcgag gtcgatggtg tcgataagct tgatatcgaa 10320

ttcatgtcac acaaaccgat cttcgcctca aggaaaccta attctacatc cgagagactg 10380

ccgagatcca gtctacactg attaattttc gggccaataa tttaaaaaaa tcgtgttata 10440

taatattata tgtattatat atatacatca tgatgatact gacagtcatg tcccattgct 10500

aaatagacag actccatctg ccgcctccaa ctgatgttct caatatttaa ggggtcatct 10560

cgcattgttt aataataaac agactccatc taccgcctcc aaatgatgtt ctcaaaatat 10620

attgtatgaa cttattttta ttacttagta ttattagaca acttacttgc tttatgaaaa 10680

acacttccta tttaggaaac aatttataat ggcagttcgt tcatttaaca atttatgtag 10740

aataaatgtt ataaatgcgt atgggaaatc ttaaatatgg atagcataaa tgatatctgc 10800

attgcctaat tcgaaatcaa cagcaacgaa aaaaatccct tgtacaacat aaatagtcat 10860

cgagaaatat caactatcaa agaacagcta ttcacacgtt actattgaga ttattattgg 10920

acgagaatca cacactcaac tgtctttctc tcttctagaa atacaggtac aagtatgtac 10980

tattctcatt gttcatactt ctagtcattt catcccacat attccttgga tttctctcca 11040

atgaatgaca ttctatcttg caaattcaac aattataata agatatacca aagtagcggt 11100

atagtggcaa tcaaaaagct tctctggtgt gcttctcgta tttattttta ttctaatgat 11160

ccattaaagg tatatattta tttcttgtta tataatcctt ttgtttatta catgggctgg 11220

atacataaag gtattttgat ttaatttttt gcttaaattc aatcccccct cgttcagtgt 11280

caactgtaat ggtaggaaat taccatactt ttgaagaagc aaaaaaaatg aaagaaaaaa 11340

aaaatcgtat ttccaggtta gacgttccgc agaatctaga atgcggtatg cggtacattg 11400

ttcttcgaac gtaaaagttg cgctccctga gatattgtac atttttgctt ttacaagtac 11460

aagtacatcg tacaactatg tactactgtt gatgcatcca caacagtttg ttttgttttt 11520

ttttgttttt tttttttcta atgattcatt accgctatgt atacctactt gtacttgtag 11580

taagccgggt tattggcgtt caattaatca tagacttatg aatctgcacg gtgtgcgctg 11640

cgagttactt ttagcttatg catgctactt gggtgtaata ttgggatctg ttcggaaatc 11700

aacggatgct caat 11714

<210> 126

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> CER正向

<400> 126

gttttagagc tagaaatagc 20

<210> 127

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 通用反向

<400> 127

gcaccgactc ggtgccactt 20

<210> 128

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 通用正向T7引物

<400> 128

taatacgact cactatag 18

<210> 129

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> galK2-1正向引物

<400> 129

taatacgact cactatagat cagcggcaat gtgc 34

<210> 130

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> galK2-1反向引物

<400> 130

ttctagctct aaaactgcgg cacattgccg ctga 34

<210> 131

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> galK2-1 sgRNA体外转录模板

<400> 131

taatacgact cactatagat cagcggcaat gtgccgcagt tttagagcta gaaatagcaa 60

gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgc 114

<210> 132

<211> 18

<212> DNA

<213> T7噬菌体

<400> 132

taatacgact cactatag 18

<210> 133

<211> 20

<212> DNA

<213> 大肠杆菌

<400> 133

atcagcggca atgtgccgca 20

<210> 134

<211> 23

<212> DNA

<213> 大肠杆菌

<400> 134

atcagcggca atgtgccgca ggg 23

<210> 135

<211> 96

<212> RNA

<213> 人工序列

<220>

<223> galK2-1 sgRNA

<400> 135

aucagcggca augugccgca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugc 96

<210> 136

<211> 262

<212> PRT

<213> 人工序列

<220>

<223> his-MPG1-dsREDexpress

<400> 136

Met Gly His His His His His His Gly Ala Leu Phe Leu Gly Gln Leu

1 5 10 15

Gly Ala Ala Gly Ser Thr Met Gly Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Glu Phe Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe

35 40 45

Met Arg Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe

50 55 60

Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr

65 70 75 80

Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp

85 90 95

Ile Leu Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His

100 105 110

Pro Ala Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe

115 120 125

Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val

130 135 140

Thr Gln Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys

145 150 155 160

Phe Ile Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys

165 170 175

Thr Met Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly

180 185 190

Val Leu Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly

195 200 205

His Tyr Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val

210 215 220

Gln Leu Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser

225 230 235 240

His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly

245 250 255

Arg His His Leu Phe Leu

260

<210> 137

<211> 256

<212> PRT

<213> 人工序列

<220>

<223> pVEC-dsREDexpress

<400> 137

Met Gly His His His His His His Leu Leu Ile Ile Leu Arg Arg Arg

1 5 10 15

Ile Arg Lys Gln Ala His Ala His Ser Lys Glu Phe Gly Gly Gly Gly

20 25 30

Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val Arg

35 40 45

Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly

50 55 60

Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr

65 70 75 80

Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe

85 90 95

Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro Asp

100 105 110

Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met

115 120 125

Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu

130 135 140

Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn Phe

145 150 155 160

Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala

165 170 175

Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu Ile

180 185 190

His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu Phe

195 200 205

Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr Tyr

210 215 220

Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr

225 230 235 240

Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe Leu

245 250 255

<210> 138

<211> 245

<212> PRT

<213> 人工序列

<220>

<223> CFFKDEL-dsREDexpress

<400> 138

Met Gly His His His His His His Cys Phe Phe Lys Asp Glu Leu Glu

1 5 10 15

Phe Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met

20 25 30

Arg Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu

35 40 45

Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala

50 55 60

Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile

65 70 75 80

Leu Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro

85 90 95

Ala Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys

100 105 110

Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr

115 120 125

Gln Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe

130 135 140

Ile Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr

145 150 155 160

Met Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val

165 170 175

Leu Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His

180 185 190

Tyr Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln

195 200 205

Leu Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His

210 215 220

Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg

225 230 235 240

His His Leu Phe Leu

245

<210> 139

<211> 257

<212> PRT

<213> 人工序列

<220>

<223> TLM-dsREDexpress

<400> 139

Met Gly His His His His His His Pro Leu Ser Ser Ile Phe Ser Arg

1 5 10 15

Ile Gly Asp Pro Pro Lys Lys Lys Arg Lys Val Glu Phe Gly Gly Gly

20 25 30

Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val

35 40 45

Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu

50 55 60

Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val

65 70 75 80

Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln

85 90 95

Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro

100 105 110

Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val

115 120 125

Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser

130 135 140

Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn

145 150 155 160

Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu

165 170 175

Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu

180 185 190

Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu

195 200 205

Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr

210 215 220

Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr

225 230 235 240

Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe

245 250 255

Leu

<210> 140

<211> 292

<212> PRT

<213> 人工序列

<220>

<223> Zebra-dsREDexpress

<400> 140

Met Gly His His His His His His Glu Cys Asp Ser Glu Leu Glu Ile

1 5 10 15

Lys Arg Tyr Lys Arg Val Arg Val Ala Ser Arg Lys Cys Arg Ala Lys

20 25 30

Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser

35 40 45

Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Glu Phe

50 55 60

Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg

65 70 75 80

Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile

85 90 95

Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys

100 105 110

Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu

115 120 125

Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala

130 135 140

Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp

145 150 155 160

Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln

165 170 175

Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile

180 185 190

Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met

195 200 205

Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu

210 215 220

Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr

225 230 235 240

Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu

245 250 255

Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn

260 265 270

Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His

275 280 285

His Leu Phe Leu

290

<210> 141

<211> 259

<212> PRT

<213> 人工序列

<220>

<223> pep1-dsREDexpress

<400> 141

Met Gly His His His His His His Lys Glu Thr Trp Trp Glu Thr Trp

1 5 10 15

Trp Thr Glu Trp Ser Gln Pro Lys Lys Lys Arg Lys Val Glu Phe Gly

20 25 30

Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe

35 40 45

Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu

50 55 60

Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu

65 70 75 80

Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser

85 90 95

Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp

100 105 110

Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu

115 120 125

Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp

130 135 140

Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly

145 150 155 160

Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly

165 170 175

Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys

180 185 190

Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu

195 200 205

Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro

210 215 220

Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu

225 230 235 240

Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His

245 250 255

Leu Phe Leu

<210> 142

<211> 259

<212> PRT

<213> 人工序列

<220>

<223> tp10-dsREDexpress

<400> 142

Met Gly His His His His His His Ala Gly Tyr Leu Leu Gly Lys Ile

1 5 10 15

Asn Leu Lys Ala Cys Ala Ala Cys Ala Lys Lys Ile Leu Glu Phe Gly

20 25 30

Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe

35 40 45

Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu

50 55 60

Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu

65 70 75 80

Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser

85 90 95

Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp

100 105 110

Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu

115 120 125

Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp

130 135 140

Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly

145 150 155 160

Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly

165 170 175

Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys

180 185 190

Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu

195 200 205

Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro

210 215 220

Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu

225 230 235 240

Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His

245 250 255

Leu Phe Leu

<210> 143

<211> 1442

<212> PRT

<213> 人工序列

<220>

<223> Zebra-Cas9

<400> 143

Met Gly His His His His His His Glu Cys Asp Ser Glu Leu Glu Ile

1 5 10 15

Lys Arg Tyr Lys Arg Val Arg Val Ala Ser Arg Lys Cys Arg Ala Lys

20 25 30

Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser

35 40 45

Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Glu Phe

50 55 60

Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

65 70 75 80

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

85 90 95

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

100 105 110

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

115 120 125

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

130 135 140

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

145 150 155 160

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

165 170 175

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

180 185 190

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

195 200 205

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

210 215 220

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

225 230 235 240

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

245 250 255

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

260 265 270

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

275 280 285

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

290 295 300

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

305 310 315 320

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

325 330 335

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

340 345 350

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

355 360 365

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

370 375 380

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

385 390 395 400

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

405 410 415

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

420 425 430

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

435 440 445

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys

450 455 460

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly

465 470 475 480

Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu

485 490 495

Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

500 505 510

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met

515 520 525

Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val

530 535 540

Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn

545 550 555 560

Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu

565 570 575

Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

580 585 590

Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys

595 600 605

Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val

610 615 620

Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

625 630 635 640

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr

645 650 655

Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn

660 665 670

Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

675 680 685

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His

690 695 700

Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr

705 710 715 720

Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys

725 730 735

Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala

740 745 750

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys

755 760 765

Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

770 775 780

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile

785 790 795 800

Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg

805 810 815

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

820 825 830

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

835 840 845

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

850 855 860

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

865 870 875 880

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

885 890 895

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp

900 905 910

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

915 920 925

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

930 935 940

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

945 950 955 960

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

965 970 975

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

980 985 990

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

995 1000 1005

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

1010 1015 1020

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val

1025 1030 1035

Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn

1040 1045 1050

Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1055 1060 1065

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys

1070 1075 1080

Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys

1085 1090 1095

Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile

1100 1105 1110

Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1115 1120 1125

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe

1130 1135 1140

Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val

1145 1150 1155

Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile

1160 1165 1170

Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1175 1180 1185

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala

1190 1195 1200

Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys

1205 1210 1215

Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu

1220 1225 1230

Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1235 1240 1245

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys

1250 1255 1260

Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala

1265 1270 1275

Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser

1280 1285 1290

Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1295 1300 1305

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu

1310 1315 1320

Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu

1325 1330 1335

Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val

1340 1345 1350

Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1355 1360 1365

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala

1370 1375 1380

Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg

1385 1390 1395

Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln

1400 1405 1410

Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1415 1420 1425

Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1430 1435 1440

<210> 144

<211> 1406

<212> PRT

<213> 人工序列

<220>

<223> pVEC-Cas9

<400> 144

Met Gly His His His His His His Leu Leu Ile Ile Leu Arg Arg Arg

1 5 10 15

Ile Arg Lys Gln Ala His Ala His Ser Lys Glu Phe Asp Lys Lys Tyr

20 25 30

Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile

35 40 45

Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn

50 55 60

Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe

65 70 75 80

Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg

85 90 95

Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile

100 105 110

Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu

115 120 125

Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro

130 135 140

Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro

145 150 155 160

Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala

165 170 175

Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg

180 185 190

Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val

195 200 205

Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu

210 215 220

Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser

225 230 235 240

Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu

245 250 255

Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser

260 265 270

Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp

275 280 285

Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn

290 295 300

Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala

305 310 315 320

Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn

325 330 335

Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr

340 345 350

Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln

355 360 365

Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn

370 375 380

Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr

385 390 395 400

Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu

405 410 415

Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe

420 425 430

Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala

435 440 445

Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg

450 455 460

Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly

465 470 475 480

Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser

485 490 495

Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly

500 505 510

Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn

515 520 525

Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr

530 535 540

Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly

545 550 555 560

Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val

565 570 575

Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys

580 585 590

Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser

595 600 605

Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu

610 615 620

Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu

625 630 635 640

Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg

645 650 655

Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp

660 665 670

Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg

675 680 685

Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys

690 695 700

Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe

705 710 715 720

Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln

725 730 735

Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala

740 745 750

Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val

755 760 765

Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu

770 775 780

Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly

785 790 795 800

Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys

805 810 815

Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln

820 825 830

Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp

835 840 845

Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp

850 855 860

Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp

865 870 875 880

Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn

885 890 895

Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln

900 905 910

Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr

915 920 925

Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

930 935 940

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln

945 950 955 960

Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu

965 970 975

Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp

980 985 990

Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

995 1000 1005

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala

1010 1015 1020

Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly

1025 1030 1035

Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu

1040 1045 1050

Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1055 1060 1065

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu

1070 1075 1080

Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu

1085 1090 1095

Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val

1100 1105 1110

Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1115 1120 1125

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser

1130 1135 1140

Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr

1145 1150 1155

Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val

1160 1165 1170

Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1175 1180 1185

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys

1190 1195 1200

Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys

1205 1210 1215

Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu

1220 1225 1230

Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1235 1240 1245

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu

1250 1255 1260

Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp

1265 1270 1275

Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu

1280 1285 1290

Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1295 1300 1305

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys

1310 1315 1320

His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His

1325 1330 1335

Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr

1340 1345 1350

Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1355 1360 1365

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr

1370 1375 1380

Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala

1385 1390 1395

Asp Pro Lys Lys Lys Arg Lys Val

1400 1405

Claims

1.一种组合物，该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，并且

其中所述RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

2.如权利要求1所述的组合物，其中该RGEN的蛋白组分与至少一种RNA组分缔合，该RNA组分包含与在该微生物细胞中的染色体或附加体上的靶位点序列互补的序列，其中该RGEN可以结合该靶位点序列，并且任选地在该靶位点序列处切割一条或两条DNA链。

3.如权利要求2所述的组合物，其中该RNA组分包含引导RNA(gRNA)，该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。

4.如权利要求2所述的组合物，其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。

5.如权利要求1所述的组合物，其中该RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。

6.如权利要求1所述的组合物，其中该RGEN蛋白组分和CPP共价地连接。

7.如权利要求1所述的组合物，其中该RGEN蛋白组分和CPP非共价地连接。

8.如权利要求1所述的组合物，其中该CPP是阳离子性或两亲性的。

9.如权利要求1所述的组合物，其中该CPP包含：

(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP，

(ii)具有6个或更多个连续精氨酸残基的CPP，

(iii)转运蛋白-10(TP10)CPP，或

(iv)来自血管内皮钙粘素蛋白的CPP。

10.如权利要求1所述的组合物，其中所述RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。

11.一种细胞，包含根据权利要求1所述的组合物。

12.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法，所述方法包括：

其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接，

其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜，从而进入该微生物细胞。

13.如权利要求12所述的方法，其中：

14.如权利要求13所述的方法，其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。

15.如权利要求14所述的方法，其中该微生物细胞进一步包含供体多核苷酸，该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列，并且其中该供体多核苷酸通过同源重组整合在该靶位点序列处或其附近。

16.一种多核苷酸序列，该多核苷酸序列包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列，该RGEN蛋白-CPP融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)，其中任选地，所述核苷酸序列可操作地连接到启动子序列。

17.一种产生RGEN蛋白-CPP融合蛋白的方法，该方法包括：

(a)提供如权利要求16所述的多核苷酸序列；

(b)从该多核苷酸序列表达RGEN蛋白-CPP融合蛋白，从而产生RGEN蛋白-CPP融合蛋白，其中所述表达任选地在细胞中进行；并且

(c)任选地，分离在步骤(b)中产生的RGEN蛋白-CPP融合蛋白。

18.一种组合物，该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)，其中所述蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中所述引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。

19.一种用于在细胞的基因组中修饰靶位点的方法，该方法包括向该细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶，其中所述引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接，并且其中所述引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。