CN107406838A - Rna引导的内切核酸酶向细胞中的肽介导的递送 - Google Patents

Rna引导的内切核酸酶向细胞中的肽介导的递送 Download PDF

Info

Publication number
CN107406838A
CN107406838A CN201580072629.XA CN201580072629A CN107406838A CN 107406838 A CN107406838 A CN 107406838A CN 201580072629 A CN201580072629 A CN 201580072629A CN 107406838 A CN107406838 A CN 107406838A
Authority
CN
China
Prior art keywords
cpp
rgen
cell
sequence
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580072629.XA
Other languages
English (en)
Inventor
R.L.弗里施
X.范
S-P.洪
E.N.贾克森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN107406838A publication Critical patent/CN107406838A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/10Fusion polypeptide containing a localisation/targetting motif containing a tag for extracellular membrane crossing, e.g. TAT or VP22
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

披露的是一种组合物,该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该RGEN蛋白组分和CPP在RGEN蛋白‑CPP复合物中彼此共价或非共价地连接。RGEN蛋白‑CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。在某些实施例中,RGEN蛋白‑CPP复合物的RGEN蛋白组分可以与合适的RNA组分缔合以提供能够进行特异性DNA靶向的RGEN。进一步披露的是包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种CPP的组合物,以及将RGEN蛋白递送到微生物细胞中的方法,以及用RGEN靶向DNA的方法。

Description

RNA引导的内切核酸酶向细胞中的肽介导的递送
本申请要求于2014年11月6日提交的美国临时申请号62/075999的权益,该申请通过引用以其全文结合在此。
发明领域
本发明属于分子生物学领域。具体地,本发明涉及使用细胞穿透肽,将RNA引导的内切核酸酶的蛋白组分递送到细胞中。
以电子方式提交的序列表的引用
该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为“20151013_CL6273PCT_SequenceListing_ST25.txt”,创建于2015年10月13日,且具有384千字节大小,并与本说明书同时提交。包括在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用结合在此。
背景
了解生物体内基因的功能的方法是抑制其表达。基因表达的抑制可以例如通过打断或缺失基因的DNA序列来实现,导致基因的“敲除”(Austin等人,Nat.Genetics[自然遗传学]36:921-924)。基因敲除主要通过适用于从细菌到哺乳动物的广泛的生物体的技术,即同源重组(HR)进行。研究基因功能的另一种方法可以是通过遗传“敲入”,其通常也通过HR进行。出于基因靶向(敲除或敲入)目的的HR可以利用与靶位点(“供体DNA”)具有同源性的外源提供的DNA的存在。
当靶向的DNA位点含有双链断裂时,已显示用于基因靶向的HR被增强(Rudin等人,Genettcs[遗传学]122:519-534;Smih等人,Nucl.Acids Res.[核酸研究]23:5012-5019)。因此已经开发了引入双链断裂来促进HR介导的DNA靶向的策略。例如,当存在供体DNA时,锌指核酸酶已经被工程化以切割特定的DNA位点,导致在该位点增加的HR水平(Bibikova等人,Science[科学]300:764;Bibikova等人,Mol.Cell.Biol.[分子细胞生物学]21:289-297)。类似地,人工大范围核酸酶(归巢内切核酸酶)和转录激活子样效应子(TALE)核酸酶也被开发用于HR介导的DNA靶向(Epinat等人,Nucleic Acids Res.[核酸研究]31:2952-2962;Miller等人,Nat.Biotech.[自然生物技术]29:143-148)。
编码CRISPR(成簇的规律间隔的短回文重复序列)DNA切割系统的基因座仅在约40%的细菌基因组和大多数古细菌基因组中被发现(Horvath和Barrangou,Science[科学]327:167-170;Karginov和Hannon,Mol.Cell[分子细胞]37:7-19)。特别地,已经开发了II型CRIPSR系统的CRISPR相关(Cas)RNA引导的内切核酸酶(RGEN)Cas9作为引入用供体DNA刺激HR的位点特异性DNA链断裂的手段(美国临时申请号61/868,706,提交于2013年8月22日)。可以设计Cas9的RNA组分的序列,这样使得Cas9识别并切割含有(i)与RNA组分的一部分互补的序列和(ii)前间区序列邻近基序(PAM)序列的DNA。
天然的Cas9/RNA复合物包含两个RNA序列,CRISPR RNA(crRNA)和反式激活CRISPRRNA(tracrRNA)。在5′至3′方向上,crRNA包含与靶DNA位点互补的唯一序列和由该crRNA所起源的CRISPR基因座的重复区编码的序列的一部分。在5′至3′方向上,tracrRNA包含与crRNA的重复区和含茎环的部分退火的序列。最近的工作已经获得指导RNA(gRNA)的开发,该指导RNA在5′至3′方向上含有与tracrRNA连接的crRNA的嵌合序列(美国临时申请号61/868,706,提交于2013年8月22日)。
已经通过重组DNA表达策略在一些研究中提供了用于在细胞中进行Cas9介导的DNA靶向的蛋白质和RNA组分。例如,Cas9蛋白已经使用基于核酸的表达系统在细胞中被表达。在某些细胞类型中表达RNA组分例如gRNA的方法包括使用RNA聚合酶III(Pol III)启动子,其允许具有精确定义的未修饰的5′-和3′-末端的RNA的转录(DiCarlo等人,NucleicAcids Res.[核酸研究]41:4336-4343;Ma等人,Mol.Ther.Nucleic Acids[分子疗法-核酸]3:e161)。这些蛋白质和RNA表达技术已经应用于包括玉米和大豆(美国临时申请号61/868,706,提交于2013年8月22日)以及人类、小鼠、斑马鱼、木霉属(Trichoderma)和酿酒酵母(Sacchromyces cerevisiae)在内的几种不同物种的细胞中。
尽管有这些进展,但是在细胞(例如微生物细胞)中提供蛋白质和RNA组分以介导Cas9介导的DNA靶向的其他方法是引人关注的。
发明概述
在一个实施例中,本发明涉及包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物,其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,并且其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
在第二个实施例中,RGEN的蛋白组分与至少一种RNA组分缔合,该RNA组分包含与微生物细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合靶位点序列,并且任选地在靶位点序列处切割一条或两条DNA链。在第三个实施例中,RNA组分包含引导RNA(gRNA),该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPRRNA(crRNA)。在第四个实施例中,RGEN可以在靶位点序列处切割一条或两条DNA链。
在第五个实施例中,RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。
在第六个实施例中,RGEN蛋白组分和CPP共价地连接。
在第七个实施例中,RGEN蛋白组分和CPP非共价地连接。
在第八个实施例中,CPP是阳离子性或两亲性的。
在第九个实施例中,CPP包括(i)来自爱泼斯坦-巴尔二氏(Epstein-Barr)病毒Zebra(斑马鱼)反式激活蛋白的CPP、(ii)具有6个或更多个连续精氨酸残基的CPP、(iii)转运蛋白-10(TP10)CPP、或(iv)来自血管内皮钙粘素蛋白的CPP。
在第十个实施例中,RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。
第十一个实施例涉及包含本文披露的组合物的微生物细胞。
第十二个实施例涉及将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法。该方法包括使微生物细胞与包含RGEN蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接。作为该接触步骤的结果,RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜,从而进入微生物细胞中。
在第十三个实施例中,关于该方法,(i)组合物进一步包含与RGEN的蛋白组分缔合的至少一种RNA组分,或(ii)微生物细胞包含RNA组分,其中在RGEN蛋白-CPP复合物进入微生物细胞中之后该RNA组分与RGEN的蛋白组分缔合;其中在(i)或(ii)中的RNA组分包含与微生物细胞中的染色体或附加体上的靶位点序列互补的序列,并且其中该RGEN可以结合靶位点序列,并且任选地在靶位点序列处切割一条或两条DNA链。在第十四个实施例中,该RGEN可以在靶位点序列处切割一条或两条DNA链。在第十五个实施例中,该微生物细胞进一步包含供体多核苷酸,该供体多核苷酸含有与靶位点序列处或其附近的序列同源的至少一个序列,其中该供体多核苷酸通过同源重组整合在靶位点序列处或其附近。
第十六个实施例涉及包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列,该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP),其中任选地,该核苷酸序列可操作地连接到启动子序列。
第十七个实施例涉及生产RGEN蛋白-CPP融合蛋白的方法。该方法包括:(a)提供包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列,该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP),其中任选地,该核苷酸序列可操作地连接到启动子序列;(b)从该多核苷酸序列表达该RGEN蛋白-CPP融合蛋白,从而产生该RGEN蛋白-CPP融合蛋白,其中该表达任选地在微生物细胞中进行;以及(c)任选地分离在步骤(b)中产生的RGEN蛋白-CPP融合蛋白。
第十八个实施例涉及包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物,其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
第十九个实施例涉及用于修饰微生物细胞的基因组中的靶位点的方法。该方法包括向微生物细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶,其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
附图和序列的简述
图1:pZUFCas9质粒(SEQ ID NO:6)含有在SEQ ID NO:5中阐述的耶氏酵母属(Yarrowia)密码子优化的Cas9表达盒。复制的起点(ARS 18、f1 ori、ColE1)为交叉阴影线,并且可选择标记(Ura3、Amp)为灰色。参考实例1。
图2A:用于在大肠杆菌(E.coli)中表达异源蛋白质的pBAD/HisB质粒(SEQ ID NO:10)。pBAD启动子为白色的。复制的起点为交叉阴影线。参考实例1。
图2B:用于在大肠杆菌中表达Cas9-NLS(图中的“Cas9”)的pRF48质粒(SEQ ID NO:11)。复制的起点为交叉阴影线。参考实例1。
图3A:用于在大肠杆菌中表达6xHis-Zebra CPP-Cas9-NLS融合物的pRF144质粒(SEQ ID NO:20)。复制的起点为交叉阴影线。参考实例1。
图3B:用于在大肠杆菌中表达6xHis-PolyR CPP-Cas9-NLS融合物的pRF145质粒(SEQ ID NO:21)复制的起点为交叉阴影线。参考实例1。
图3C:用于在大肠杆菌中表达6xHis-TP10 CPP-Cas9-NLS融合物的pRF146质粒(SEQ ID NO:22)。复制的起点为交叉阴影线。参考实例1。
图3D:用于在大肠杆菌中表达6xHis-pVEC CPP-Cas9-NLS融合物的pRF162质粒(SEQ ID NO:23)。复制的起点为交叉阴影线。参考实例1。
图4:6xHis-Zebra-Cas9-NLS纯化级分的SDS-PAGE分离。指出了裂解液、洗涤液、洗脱级分和分子量标准品。参考实例1。
图5:单引导多核苷酸例如单引导RNA(sgRNA)的结构模型。可变靶向(VT)结构域域显示为灰色。Cas9内切核酸酶识别(CER)结构域显示为黑色。
图6:源自质粒pRF46(SEQ ID NO:30)的模板的RGR sgRNA(靶向Can1-1基因座)的体外转录。孵育2、4、6和18小时的体外转录反应产生类似水平的sgRNA。还生产了核酶自催化的切割产物。参考实例2。
图7:使用与sgRNA(对Can1-1靶位点具有特异性)复合的Zebra CPP-Cas9的体外切割测定。在每个反应中包括含有Can1-1靶位点的DNA多核苷酸(982bp)。将每个反应在1.2%凝胶上进行电泳分解。“仅靶标”、“仅sgRNA”、“仅Zebra-Cas9”和“仅Zebra-Cas9(2xFT)”(FT,冻融)反应未切割靶多核苷酸。“Zebra-Cas9/sgRNA”、“Zebra-Cas9/sgRNA(2xFT)”和“Cas9/sgRNA”(野生型Cas9)反应如所得切割产物所指示的按特异性方式切割靶多核苷酸。参考实例3。
图8:测量Zebra CPP-Cas9(未与sgRNA缔合)和Zebra CPP-Cas9/gRNA复合物在其与解脂耶氏酵母(Yarrowia lipolytica)细胞接触后的基因组靶向效率。单独使用的Zebra-Cas9的终浓度为5μM,而在sgRNA复合物中使用不同终浓度(1-5μM)的Zebra CPP-Cas9。将突变频率报告为酵母菌落(在使细胞与Zebra CPP-Cas9或Zebra CPP-Cas9/gRNA接触之后在非选择性培养基上生长)的比例,其被记为在转移至含刀豆蛋白的培养基上时对刀豆氨酸的抗性。参考实例4。
图9:CPP-dsRED纯化的PAGE凝胶分析的实例。将12.5%PAGE凝胶用简单蓝(Simplyblue)染料染色。泳道1:分子量标准品,泳道2:澄清的细胞提取物tp10-dsREDexpress,泳道3:珠粒处理后澄清的细胞提取物tp10-dsREDexpress,泳道4:最终蛋白质溶液tp10-dsREDexpress,泳道5:澄清的细胞提取物MPG-dsREDexpress,泳道3:珠粒处理后澄清的细胞提取物MPG-dsREDexpress,泳道4:最终蛋白质溶液MPG-dsREDexpress。
表1
核酸和蛋白质SEQ ID号的总结
发明详细说明
所有引用的专利和非专利文献的披露内容通过引用以其全文结合在此。
如本文中所使用,术语“发明”或“披露的发明”不旨在是限制性的,而是广泛适用于在权利要求中限定的或本文所述的任何发明。这些术语在本文中可互换使用。
本文中的术语“细胞”是指任何类型的细胞,例如原核或真核细胞。真核细胞具有细胞核和其他膜封闭的结构(细胞器),而原核细胞缺乏细胞核。在某些实施例中的细胞可以是哺乳动物细胞或非哺乳动物细胞。非哺乳动物细胞可以是真核的或原核的。例如,本文中的非哺乳动物细胞可以是指微生物细胞或非哺乳动物多细胞生物体例如植物、昆虫、线虫、鸟类物种、两栖动物、爬行类或鱼类的细胞。
本文中的微生物细胞可以是指例如真菌细胞(例如酵母细胞)、原核细胞、原生生物细胞(例如,藻类细胞)、眼虫藻细胞、原生藻菌细胞或卵菌纲细胞。本文中的原核细胞可以是指例如细菌细胞或古细菌细胞。真菌细胞(例如,酵母细胞)、原生生物细胞(例如藻类细胞)、眼虫藻细胞、原生藻菌细胞和卵菌纲细胞代表真核微生物细胞的实例。真核微生物细胞具有细胞核和其他膜封闭的结构(细胞器),而原核细胞缺乏细胞核。
本文中的术语“酵母”是指主要以单细胞形式存在的真菌物种。可替代地,酵母可以被称为“酵母细胞”。本文中的酵母可以被表征为例如常规酵母或非常规酵母。
本文中术语“常规酵母”(“模式酵母”)通常是指酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)酵母物种。在某些实施例中,常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。
本文中术语“非常规酵母”是指不是酵母属或裂殖酵母属酵母物种的任何酵母。非常规酵母描述于Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer- Verlag,Berlin,Germany,2003)[遗传学、生物化学和生物技术中的非常规酵母菌:实践方 (K.Wolf、K.D.Breunig、G.Barth,编辑,德国柏林施普林格出版社,2003)]以及Spencer等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]58:147-156)中,其通过引用结合在此。在某些实施例中,非常规酵母可能另外地(或可替代地)是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。按照这些原则,非常规酵母的定义-偏好NHEJ超过HR-被Chen等人(PLoS ONE 8:e57952,其通过引用结合在此)进一步披露。本文中优选的非常规酵母是耶氏酵母属的那些(例如解脂耶氏酵母)。
本文中术语“植物”是指整株植物、植物器官、植物组织、植物细胞、种子及其子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物部分包括分化和未分化的组织,包括但不限于根、茎、芽、叶、花粉、种子、肿瘤组织和各种形式的细胞和培养物(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以是在植物中或在植物器官、组织或细胞培养物中的。术语“植物器官”是指植物组织或构成植物的形态上和功能上不同部分的一组组织。术语“基因组”是指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部补体(基因和非编码序列);和/或从一个亲本遗传为(单倍体)单位的完整染色体组。“子代”包括植物的任何后续世代。
转基因植物包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内,这样使得多核苷酸被传递给连续世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。异源多核苷酸可以包括起源于外来物种的序列,或者如果来自相同物种,可以是从其天然形式上进行实质改变的序列。转基因植物材料可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法,通过本文所述的不导致外源多核苷酸的插入的基因组编辑程序,或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的植物基因组(染色体或染色体外)的改变并不旨在被视为转基因。
可育的植物是产生有活力的雄性和雌性配子并且是自体受精的植物。这样的自体受精的植物可以产生子代植物,而没有来自任何其他植物的配子和其中所含的遗传物质的贡献。雄性不育植物包括不产生有活力的或以其他方式能够受精的雄性配子的植物。雌性不育植物包括不产生有活力的或以其他方式能够受精的雌性配子的植物。公认雄性不育和雌性不育植物可以分别是雌性可育的和雄性可育的。此外,公认当与雌性可育植物杂交时,雄性可育(但是雌性不育)植物可以产生有活力的后代,并且当与雄性可育植物交叉时,雌性可育(但是雄性不育)植物可以产生有活力的子代。
在本文中术语“RNA引导的内切核酸酶”(RGEN)是指包含至少一种CRISPR(成簇的规律间隔的短回文重复序列)相关(Cas)蛋白质和至少一种RNA组分的复合物。术语“RGEN的蛋白组分”和“RGEN蛋白组分”在本文中可互换使用,并且是指作为RGEN的内切核酸酶组分的Cas蛋白,或者形成其一部分的Cas蛋白。在某些实施例中蛋白组分可以是完整的内切核酸酶(例如Cas9);这样的蛋白组分可以可替代地被称为RGEN的“内切核酸酶组分”。鉴于其与至少一种RNA组分缔合,本文中的RGEN通常具有特异性DNA靶向活性。
简言之,RGEN的RNA组分含有与靶位点序列中的DNA序列互补的序列。基于这种互补性,RGEN可以特异地识别和切割特定的DNA靶位点序列。本文中RGEN可以包含四种已知的CRISPR系统(Horvath和Barrangou,Science[科学]327:167-170)(例如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的RNA组分。在优选的实施例中,RGEN包含Cas9内切核酸酶(CRISPR II系统)和至少一种RNA组分(例如,crRNA和tracrRNA、或gRNA)。
术语“CRISPR”(成簇的规律间隔的短回文重复序列)是指I类、II类或III类DNA切割系统的某些遗传基因座编码因子,例如被细菌和古细胞用来破坏外源DNA(Horvath和Barrangou,Science[科学]327:167-170)的那些。本文中以异源方式利用CRISPR系统的组分,用于细胞中的DNA靶向。
术语“II型CRISPR系统”和“II型CRISPR-Cas系统”在本文中可互换使用,并且是指利用与至少一种RNA组分复合的Cas9内切核酸酶的DNA切割系统。例如,Cas9可以与CRISPRRNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中,Cas9可以与引导RNA复合。因此,crRNA、tracrRNA和引导RNA是本文中RNA组分的非限制性实例。
本文中术语CRISPR相关(“Cas”)内切核酸酶是指由Cas基因编码的Cas蛋白。当与合适的RNA组分复合时,Cas内切核酸酶在某些实施例中能够切割全部或部分特异性DNA靶序列。例如,其能够在特异性DNA靶序列中引入单链或双链断裂;可替代地其可以被表征为能够切割特异性DNA靶序列的一条或两条链。Cas内切核酸酶可以在靶序列处解开DNA双链体并切割至少一条DNA链,如通过与Cas复合的crRNA或引导RNA识别靶序列所介导的。如果正确的前间区序列邻近基序(PAM)位于或相邻于DNA靶序列的3′末端,则通过Cas内切核酸酶对靶序列进行的此类识别和切割通常会发生。可替代地,本文中的Cas蛋白质可能缺乏DNA切割或切口活性,但是当与合适的RNA组分复合时,仍然可以特异性结合DNA靶序列。本文中优选的Cas蛋白是Cas9。
任何引导的内切核酸酶可以用于本文披露的方法中。这样的内切核酸酶包括但不限于Cas9和Cpf1内切核酸酶。迄今为止已经描述了许多内切核酸酶,它们可以识别特定的PAM序列(参见例如-于2015年5月15日提交的美国专利申请62/162377和于2015年5月15日提交的美国专利申请62/162353以及Zetsche B等人2015.Cell[细胞]163,1013)并且在特定位置处切割靶DNA。应当理解的是,基于本文所述的使用引导的Cas系统的方法和实施例,现在人们可以定制这些方法,使得它们可以利用任何引导的内切核酸酶系统。
本文中“Cas9”(以前称为Cas5、Csn1、或Csx12)是指与crRNA和tracrRNA或与引导RNA形成复合物的II型CRISPR系统的Cas内切核酸酶,用于特异性识别和切割全部或部分的DNA靶序列。Cas9蛋白包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域,其各自在靶序列上切割单个DNA链(两个结构域的协同作用导致DNA双链切割,而一个结构域的活性导致一个缺口)。通常,RuvC结构域包含亚结构域I、II和III,其中亚结构域I位于Cas9的N末端附近,并且亚结构域II和III位于蛋白质的中间,即位于HNH结构域的侧翼(Hsu等人,Cell[细胞]157:1262-1278)。“Apo-Cas9”是指不与RNA组分复合的Cas9。Apo-Cas9可以结合DNA,但以非特异性方式进行,且不能切割DNA(Sternberg等人,Nature[自然]507:62-67)。
本文中术语“RNA组分”是指RGEN的RNA组分,其含有与DNA靶序列的链互补的核糖核酸序列。该互补序列在本文中被称为“引导序列”或“可变靶向结构域”序列(图5)。本文中合适的RNA组分的实例包括crRNA和引导RNA。在某些实施例中的RNA组分(例如,仅引导RNA、crRNA+tracrRNA)可以使得RGEN组分能够进行特异性DNA靶向。
本文中术语“CRISPR RNA”(crRNA)是指可以与一种或多种Cas蛋白(例如Cas9)形成复合物的RNA序列,并且为复合物提供DNA结合特异性。crRNA提供DNA结合特异性,因为其含有与DNA靶序列的链互补的“引导序列”(“可变靶向结构域”[VT])。crRNA进一步包含由crRNA起源的CRISPR基因座的重复区编码的“重复序列”(“tracr RNA配对序列”)。crRNA的重复序列可以为在tracrRNA的5′-端的序列退火。在天然CRISPR系统中的crRNA源自于从CRISPR基因座转录的“前crRNA”。前crRNA包括间隔区和重复区;间隔区包含与DNA靶位点序列互补的独特序列。天然系统中的前crRNA被处理成多个不同的crRNA,每个沿着重复序列的一部分具有引导序列。例如为了DNA靶向特异性,CRISPR系统利用crRNA。
本文中术语“反式激活CRISPR RNA”(tracrRNA)是指在II型CRISPR系统中使用的非编码RNA,并且在5′至3′方向上包含(i)与CRISPR II型crRNA的重复区退火的序列和(ii)含茎环的部分(Deltcheva等人,Nature[自然]471:602-607)。
术语“引导RNA”(gRNA)和“单引导RNA”(sgRNA)在本文中可互换使用。本文中的gRNA可以是指含有与tracrRNA可操作地连接的crRNA的嵌合序列。可替代地,例如,gRNA可以是指crRNA和tracrRNA的合成融合物。还可以按照具有引导序列(可变靶向结构域)、随后是Cas内切核酸酶识别(CER)结构域来表征gRNA。CER结构域可以包含tracrRNA配对序列,随后是tracrRNA序列。
可以任选地使用“CRISPR DNA”(crDNA)而不是RNA组分。crDNA具有对应于如本文披露的crRNA的序列的DNA序列。crDNA可以与crDNA/tracrRNA复合物中的tracrRNA一起使用,其进而可以与RGEN蛋白组分缔合。美国申请号61/953,090披露了crDNA以及其用于RGEN介导的DNA靶向的方法。相应地,预期本文中关于crRNA的任何披露内容同样适用于使用crDNA。因此,在结合了crDNA的本文的实施例中,“RNA引导的内切核酸酶”(RGEN)可以反而被称为包含至少一种Cas蛋白和至少一种crDNA的复合物。
如本文中所使用,术语“引导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列,并且使得Cas内切核酸酶能够识别并任选地切割DNA靶位点。引导多核苷酸可以是单分子或双分子。引导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地,引导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2′-氟代A、2’-氟代U、2′-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。仅包含核糖核酸的引导多核苷酸也被称为“引导RNA”。
引导多核苷酸可以是双分子(也称为双链体引导多核苷酸),其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子引导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中,包含连接到CER结构域(“cr核苷酸”)的VT结构域的双链体引导多核苷酸的第一个分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在一些实施例中,包含CER结构域的双链体引导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。
引导多核苷酸还可以是单分子,其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单引导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中,单引导多核苷酸包含连接到tracr核苷酸(包含CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域),其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单引导多核苷酸可以被称为“单引导RNA”(当由RNA核苷酸的连续延伸构成时)或“单引导DNA”(当由DNA核苷酸的连续延伸构成时)或“单引导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。
因此,在某些实施例中,引导多核苷酸和II型Cas内切核酸酶可以彼此形成复合物(被称为“引导多核苷酸/Cas内切核酸酶复合物”或也被称为“引导多核苷酸/Cas内切核酸酶系统”),其中该引导多核苷酸/Cas内切核酸酶复合物可以指导Cas内切核酸酶靶向细胞(例如植物细胞)中的基因组靶位点,任选地使得Cas内切核酸酶在基因组靶位点引入单链或双链断裂。引导多核苷酸/Cas内切核酸酶复合物可以连接至至少一种CPP,其中这样的复合物能够结合到细胞(例如,植物细胞)的靶位点,并且任选地对其产生单链或双链断裂)。
术语“可变靶向结构域”或“VT结构域”在本文中可互换使用,并且是指与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一个核苷酸序列结构域(VT结构域)与靶序列之间的互补百分比可以为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可变靶标结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中,可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任意组合构成。
术语引导多核苷酸的“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换使用,并且涉及与Cas内切核酸酶多肽相互作用的核苷酸序列(例如引导多核苷酸的第二核苷酸序列结构域)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任意组合构成。
术语“靶位点”、“靶序列”、“靶DNA”、“DNA靶序列”、“靶基因座”、“前间区序列(protospacer)”等在本文中可互换使用。靶位点序列是指在本文的RGEN可以识别、结合并任选地产生切口或切割的细胞的基因组中的染色体、附加体或任何其他DNA分子上的多核苷酸序列。靶位点可以是(i)细胞中的内源/天然位点,(ii)与细胞异源,因此不是天然存在于基因组中的,或(iii)与其天然发生的位置相比在异源基因组位置中发现的。
本文中的靶位点序列长度为至少13个核苷酸,并且具有一条链,该链与(crRNA或gRNA的)引导序列具有足够互补性以便能够与该引导序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM在某些实施例中与靶序列相邻)。切割/切口位点(适用于内切核苷酸的或切口Cas)可以位于靶序列内(例如,使用Cas9)或切割/切口位点可能在靶序列之外(例如,使用与异源内切核酸酶结构域(例如源自于FokI酶的结构域)融合的Cas9)。靶位点序列也可能被缺乏切割或切口活性的RGEN结合。
本文中的“人工靶位点”或“人工靶序列”是指已经导入细胞基因组的靶序列。在一些实施例中,人工靶序列可以在序列上与细胞基因组中的天然靶序列相同,但是位于基因组中的不同位置(异源位置),或者如果位于细胞基因组中的相同位置其可以不同于天然靶序列。
本文中的“附加体”是指可以独立于细胞染色体自主存在于细胞中(可以复制并传递给子细胞)的DNA分子。附加体DNA对于细胞而言可以是天然的或异源的。本文中天然附加体的实例包括线粒体DNA(mtDNA)和叶绿体DNA。本文中异源性附加体的实例包括质粒和酵母人工染色体(YAC)。
本文中的“前间区序列邻近基序”(PAM)是指由本文中的RGEN识别的短序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同,但通常为例如2、3、4、5、6、7或8个核苷酸长。
术语“5′-帽”和“7-甲基鸟苷酸(m7G)帽”在本文中可互换使用。7-甲基鸟苷酸残基位于真核生物中由RNA聚合酶II(Pol II)转录的RNA的5′末端。本文中带帽的RNA具有5′-帽,而未带帽的RNA不具有这样的帽。
术语“未带帽”、“不具有5′-帽”等在本文中可互换使用,是指缺少5′-帽并任选地具有例如5′-羟基基团而不是5′-帽的RNA。因为5′-带帽的RNA有核输出的倾向,转录以后未带帽的RNA可以更好地积累在细胞核中。
术语“核酶”、“核糖核酸酶”和“自切割核酶”在本文中可互换使用。核酶是指形成二级、三级和/或四级结构的一个或多个RNA序列,其可以在特定部位、特别是在相对于核酶序列的顺式位点切割RNA(即自动催化、或自切割)。已经描述了核酶核溶解活性的一般性质(例如,Lilley,Biochem.Soc.Trans.[生化学会学报]39:641-646)。本文中的“锤头状核酶”(HHR)可以包含由三个碱基配对的茎组成的小的催化RNA基序和参与催化的高度保守的、非互补性核苷酸的核。Pley等人(Nature 372:68-74)和Hammann等人(RNA 18:871-885)(其通过引用结合在此)披露了锤头状核酶结构和活性。本文中的锤头状核酶可以包含如例如Scott等人(Cell[细胞]81:991-1002,通过引用结合在此)所披露的“最小锤头状”序列。
术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”在本文中可互换使用。本文中的DNA靶向可能是在特定的DNA序列(例如细胞的染色体或附加体)中特异性引入插入缺失(indel)、敲除或敲入。通常,DNA靶向可以通过在具有与合适的RNA组分缔合的Cas蛋白的细胞中的特异性DNA序列处切割一条或两条链来进行。这样的DNA切割,如果是双链断裂(DSB),可以促进NHEJ过程,这可能导致靶位点的插入缺失形成。而且,无论切割是单链断裂(SSB)还是DSB,如果在DNA切口或切割位点提供合适的供体DNA多核苷酸,则可以促进HR过程。取决于供体DNA多核苷酸的序列,这样的HR过程可以用于在靶位点引入敲除或敲入。可替代地,本文中DNA靶向可以是指本文中的Cas/RNA组分复合物与靶DNA序列的特异性缔合,其中Cas蛋白质切割或不切割DNA链(取决于Cas蛋白质的内切核酸结构域的状态)。
本文中术语“插入缺失(indel)”是指在染色体或附加体中的靶DNA序列中插入或缺失一个或多个核苷酸碱基。这样的插入或缺失可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中,插入缺失可以甚至更大,至少约20、30、40、50、60、70、80、90或100个碱基。如果在基因的开放阅读框(ORF)中引入插入缺失,通常该插入缺失会通过产生移码突变来破坏由ORF编码的蛋白质的野生型表达。
术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除代表通过用Cas蛋白靶向而部分或完全不起作用的本文中的细胞的DNA序列;敲除之前这样的DNA序列例如可以已经编码氨基酸序列或者可以具有调节功能(例如,启动子)。可以通过插入缺失(通过由Cas介导的切割促进的NHEJ)或通过特异性去除序列(当还使用合适的供体DNA多核苷酸时,通过由Cas介导的切割或切口促进的HR)来产生敲除,其减少或完全破坏靶向位点处、邻接位置处或附近的序列的功能。可替代地,本文中敲除的DNA多核苷酸序列可以被表征为例如被部分或完全破坏或下调。
术语“敲入”、“基因敲入”和“遗传敲入”在本文中可互换使用。敲入表示通过用Cas蛋白靶向在细胞中的特异性DNA序列处的DNA序列的替换或插入(当还使用合适的供体DNA多核苷酸时,通过由Cas介导的切割或切口促进的HR)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入,或转录调控元件在遗传基因座中的特异性插入。
术语“供体多核苷酸”、“供体DNA”、“靶向多核苷酸”和“靶向DNA”在本文中可互换使用。供体多核苷酸是指包含与在DNA靶位点(例如本文中由Cas蛋白特异性靶向的序列)处或附近的序列同源的至少一个序列的DNA序列。如果靶位点含有SSB或DSB(例如可以使用本文中与适当的RNA组分缔合的某些Cas蛋白质来引入),则合适的供体多核苷酸能够用DNA靶位点进行HR。本文中供体多核苷酸内的“同源序列”可以例如包含至少约25个核苷酸,例如与靶位点处或附近的序列具有100%同一性,或与靶位点处或附近的序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的序列或由其组成。
在某些实施例中,供体DNA多核苷酸可以具有两个同源序列,它们被与在靶位点处的序列同源的序列(或碱基对)分隔开。这样的供体多核苷酸的这两个同源序列可以被称为异源序列侧翼的“同源臂”。在靶位点和具有两个同源臂的供体多核苷酸之间的HR通常导致在靶位点处的序列被供体多核苷酸的异源序列替代(位于与供体多核苷酸的同源臂同源的DNA序列之间的靶位点序列被供体多核苷酸的异源序列替代)。在具有两个同源臂的供体多核苷酸中,臂可以被1个或多个核苷酸分隔开(即供体多核苷酸中的异源序列可以为至少1个核苷酸长度)。可以在本文中的细胞中进行的各种HR程序披露在例如DNA Recombination:Methods and Protocols:1st Edition(H.Tsubouchi,Ed.,Springer-Verlag,New York,2011)[DNA重组:方法与方案(第1版)(H.Tsubouchi,编辑,纽约施普林格出版社,2011)]中,其通过引用结合在此。
术语“细胞穿透肽”(CPP)和“蛋白质转导结构域”(PTD)在本文中可互换使用。CPP是指通常约5-60个氨基酸残基长度的肽,其可促进分子货物(molecular cargo),特别是本文的一种或多种RGEN蛋白组分(例如Cas9蛋白)的细胞摄取。这样的蛋白质货物可以通过共价或非共价的连接与一个或多个CPP缔合。在某些实施例中,CPP也可以表征为能够促进分子货物跨越/通过脂质双层、胶束、细胞膜、细胞器膜、囊泡膜或细胞壁中的一种或多种的移动或穿越。在某些实施例中,本文中的CPP可以是阳离子性、两亲性或疏水性的。在本文有用的CPP的实例以及一般性CPP的进一步描述披露于Schmidt等人(FEBS Lett.584:1806-1813)、Holm等人(Nature Protocols[自然实验手册]1:1001-1005)、Yandek等人(Biophys.J.[生物物理学杂志]92:2434-2444)、Morris等人(Nat.Biotechnol.[自然生物技术]19:1173-1176)、以及美国专利申请公开号2014/0068797中,所述文献都通过引用结合在此。
本文中的“阳离子性”或“聚阳离子性”CPP是指具有高相对丰度(至少60%)的带正电荷的氨基酸例如赖氨酸(K)、精氨酸(R)和/或组氨酸(H)的CPP。
“两亲性”(amphipathic或amphiphilic)CPP是指具有包含交替模式的极性/带电荷残基和非极性疏水残基的氨基酸序列的CPP。可替代地,两亲性CPP可以被表征为具有亲水和亲脂两种特性。
本文中的“疏水性”或“亲脂性”CPP主要含有或仅含有具有低净电荷和/或疏水氨基酸基团的非极性残基。
术语“共价连接的”(covalently linked)、“共价附接的”(covalentlyattached)、“共价缔合的”(covalently associated)、“共价连接”(covalent linkage)、“共价相互作用”(covalent interaction)等在本文中可互换使用。本文中的共价连接可以是经由例如一个或多个肽键或一个或多个化学交联。共价连接可以是直接的,例如其中直接在RGEN蛋白组分和CPP之间存在共价连接(直接连接)(例如,在RGEN蛋白组分的原子和CPP的原子之间存在化学键[电子共享])。可替代地,共价连接可以是间接的,例如,其中RGEN蛋白组分和CPP通过至少一个中间因子彼此连接。这样的中间因子或它们自己共同连接在一起的一组中间因子与RGEN蛋白组分和CPP共价连接。因此,中间因子或其组可以被表征为在RGEN蛋白组分和CPP之间的桥。
术语“融合蛋白”、“蛋白质融合物”、“嵌合蛋白”等在本文中可互换使用。本文中的融合蛋白包含在单个多肽内连接在一起的至少两个不同的(异源的)氨基酸序列。融合蛋白通常通过基因工程过程产生,其中编码不同氨基酸序列的DNA序列连接在一起以编码含有不同氨基酸序列的单个蛋白质。本文中融合蛋白的实例包括RGEN蛋白-CPP融合物(与一个或多个CPP氨基酸序列融合的RGEN蛋白氨基酸序列)。
术语“非共价连接的”、“非共价附接的”、“非共价缔合的”、“非共价连接”、“非共价相互作用”等在本文中可互换使用。本文中非共价连接是指在电子不共享的原子之间的相互作用。这类相互作用弱于共价连接。疏水相互作用代表可能在RGEN蛋白组分和一个或多个CPP之间发生的非共价连接的实例。可应用于本文的非共价连接的其他实例包括静电力(例如离子、氢键)和范德华力(伦敦色散力)。
如本文中所使用,“RGEN蛋白-CPP复合物”是指在RGEN的蛋白组分和至少一种CPP之间的复合物,其中RGEN和CPP经由共价或非共价连接相互作用。在该复合物中的RGEN和CPP组分通常都保留如本文披露的其各自的活性/功能的全部或一些(例如至少50%)。例如,在RGEN蛋白组分为Cas9的实施例中,在Cas9-CPP复合物中的Cas9能够与合适的RNA组分(例如,gRNA)缔合,并将Cas9-CPP复合物靶向于细胞中的DNA靶位点。
术语“穿过”(traverse)、“经过”(travel through)、“穿越”(cross through)、“横过”(goes across)等在本文中可互换使用。
术语“细胞膜”、“质膜”和“细胞质膜”在本文中可互换使用,并且是指将细胞内部与其外部分隔开的生物膜。细胞膜通常包含具有嵌入其中的蛋白质的磷脂双层。在其他若干功能中,细胞膜可以用作细胞外结构例如细胞壁或糖萼结构的附着表面。关于细胞膜脂质双层的详细信息提供于Molecular Biology of the Cell.4th Edition(B.Alberts等 人,Eds.,Garland Science,New York,2002)[细胞分子生物学(第4版)(B.Alberts等人,编辑,纽约加兰科学出版社,2002)],其通过引用结合在此。
本文中的术语“细胞壁”是指围绕一些类型的非哺乳动物细胞(例如细菌、植物、藻类、真菌例如酵母)的坚韧、柔韧的(但有时相当坚硬的)层。其位于细胞膜外部,并且为细胞提供结构支持和保护。在某些实施例中细胞壁的主要功能是帮助维持细胞渗透压。真菌细胞(例如,酵母细胞)壁通常包含几丁质,并且藻类细胞壁通常包含糖蛋白和多糖。植物细胞壁通常主要包含具有较少量的其他组分的多糖(例如酚酯、结构蛋白)。“初生细胞壁”和/或“次生细胞壁”可以用于表征植物细胞壁,其中次生壁位于初生壁内。木质素是次生壁的主要组分。细菌细胞壁通常包含肽聚糖作为主要成分。在某些方面,例如在细菌中,细胞壁可以在其外层进一步包含糖萼,其通常是多糖的包被。
本文中术语“亮氨酸拉链结构域”是指二聚体化结构域,其特征在于在约35个残基的延伸中每第七个残基存在一个亮氨酸残基。亮氨酸拉链结构域通过α-螺旋卷成的卷曲结合在一起形成二聚体。卷成的卷曲每个转角具有3.5个残基,这意味着每第七个残基相对于螺旋轴占据等同的位置。卷成的卷曲内的亮氨酸的规则排列通过疏水和范德华相互作用来稳定结构。
术语“百分比体积”(percent by volume)、“体积百分比”(volume percent)、“vol%”和“v/v%”在本文中可互换使用。在溶液中溶质的体积百分比可以使用以下公式确定:[(溶质体积)/(溶液体积)]×100%。
术语“重量百分比”、“重量百分率(wt%)”和“重量-重量百分率(%w/w)”在本文中可互换使用。重量百分比是指当包含在组合物、混合物或溶液中时,材料在质量基础上的百分数。
术语“多核苷酸”、“多核苷酸序列”和“核酸序列”在本文可互换地使用。这些术语涵盖核苷酸序列等。多核苷酸可以是单链或双链的DNA或RNA的聚合物,其任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可以由cDNA、基因组DNA、合成DNA或其混合物的一个或多个区段组成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以通过单字母名称表示如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸(分别用于RNA或DNA),“G”表示鸟苷酸或脱氧鸟苷酸(分别用于RNA或DNA),“U”表示尿苷酸(用于RNA),“T”表示脱氧胸苷酸(用于DNA),“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“W”表示A或T,并且“N”表示任何核苷酸(例如,如果提及DNA序列,N可以是A、C、T或G;如果提及RNA序列,N可以是A、C、U或G)。本文披露的任何RNA序列(例如,crRNA、tracrRNA、gRNA)可以由合适的DNA序列编码。
如本文中所使用,术语“分离的”是指已经从其天然来源完全或部分纯化的多核苷酸或多肽分子。在一些情况下,分离的多核苷酸或多肽分子是更大组合物、缓冲系统或试剂混合物的一部分。例如,分离的多核苷酸或多肽分子能以异源方式包含在细胞或生物体内。本文中包含RGEN的蛋白组分和细胞穿透肽的组合物可以被认为是分离的组合物。这些组合物包含异源组分,并且不在自然界中出现。
如本文中所使用,术语“基因”是指从编码区表达RNA(RNA从DNA多核苷酸序列转录)的DNA多核苷酸序列,该RNA可以是信使RNA(编码蛋白质)或非蛋白质编码RNA(例如本文中的crRNA、tracrRNA、或gRNA)。基因可以是指单独的编码区,或者可以包括编码区上游和/或下游的调控序列(例如启动子、5′-非翻译区、3′-转录终止子区)。可替代地,编码蛋白质的编码区可以在本文中被称为“开放阅读框”(ORF)。“天然的”或“内源的”基因是指如在自然界中发现的具有其自身调节序列的基因;这样的基因位于宿主细胞的基因组中的天然位置。“嵌合”基因是指不是天然基因的任何基因,该基因包括在自然界中未一起发现的调节序列和编码序列(即,调节区和编码区彼此是异源的)。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“外来”或“异源”的基因是指通过基因转移导入宿主生物体的基因。外来/异源基因可包括插入到非天然生物体内的天然基因、导入到天然宿主内的新位置的天然基因,或嵌合基因。在某些实施例中本文披露的多核苷酸序列是异源的。“转基因”是通过基因递送程序(例如,转化)已经引入基因组中的基因。“密码子优化的”开放阅读框的密码子使用频率被设计为模拟宿主细胞优选密码子使用的频率。
“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中,突变基因包含通过使用如本文披露的引导多核苷酸/Cas内切核酸酶系统进行的改变。突变的植物是包含至少一个突变基因的植物。
包含在本文的细胞或生物体中的“非天然”氨基酸序列或多核苷酸序列不会发生在这样的细胞或生物体的天然(自然)对应物中。
如本文中所使用,“调节序列”是指位于基因转录起始位点(例如启动子)上游的核苷酸序列、5′非翻译区和3′非编码区,并且该调节序列可以影响转录、加工或稳定性、或从该基因转录的RNA的翻译。本文中,调节序列可以包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎环结构以及涉及调节基因表达的其他元件。本文中一个或多个调节元件可以与本文的编码区异源。
如本文中所使用的“启动子”是指能够控制来自基因的RNA转录的DNA序列。通常,启动子序列位于基因的转录起始位点的上游。启动子可以全部来源于天然基因,或者由源自于在自然界存在的不同启动子的不同元件构成,或者甚至包含合成的DNA区段。在多数时候在所有情况下引起基因在细胞中表达的启动子通常称为“组成型启动子”。本文中一个或多个启动子可以与本文的编码区异源。
如本文中所使用的“强启动子”是指可以引导每单位时间相对大量的生产性启动的启动子,和/或是驱动比在细胞中基因的平均转录水平更高的基因转录水平的启动子。
植物启动子是能够在植物细胞中启动转录的启动子;关于植物启动子的综述,参见Potenza等人,(2004)In Vitro Cell Dev Biol[体外细胞与发育生物学]40:1-22。组成型启动子包括例如Rsyn7启动子的核心启动子以及披露于WO 99/43838和美国专利号6072050中的其他组成型启动子;核心CaMV35S启动子(Odell等人,(1985)Nature[自然]313:810-2);稻肌动蛋白(McElroy等人,(1990)Plant Cell[植物细胞]2:163-71);泛素(Christensen等人,(1989)Plant Mol Biol[植物分子生物学]12:619-32;Christensen等人,(1992)Plant MolBiol[植物分子生物学]18:675-89);pEMU(Last等人,(1991)TheorAppl Genet[理论与应用遗传学]81:581-8);MAS(Velten等人,(1984)EMBO J3:2723-30);ALS启动子(美国专利号5659026)等。其他组成型启动子被描述于例如美国专利号5608149;5608144;5604121;5569597;5466785;5399680;5268463;5608142和6177611中。在一些实例中,可以使用诱导型启动子。在被病原体感染后诱导的病原体诱导型启动子包括但不限于调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等的表达的启动子。
可以使用化学调节型启动子以通过应用外源化学调节剂来调节植物中的基因表达。在应用化学品诱导基因表达的情况下启动子可以是化学诱导型启动子,或者在应用化学品阻抑基因表达的情况下启动子可以是化学阻抑型启动子。化学品诱导型启动子包括但不限于:由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人,(1997)PlantCell Physiol[植物细胞生理学]38:568-77)、由用作出苗前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-11-27,WO 93/01294)、以及由水杨酸激活的烟草PR-1a启动子(Ono等人,(2004)Biosci Biotechnol Biochem[生物科学生物技术生物化学]68:803-7)。其他化学调节的启动子包括类固醇反应启动子(参见,例如,糖皮质激素诱导型启动子(Schena等人,(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:10421-5;McNellis等人,(1998)Plant J[植物学]14:247-257);四环素诱导型和四环素阻抑型启动子(Gatz等人,(1991)Mol Gen Genet[分子遗传和基因组学]227:229-37;美国专利号5814618和5789156)。
组织偏好性启动子可以用于靶向特定植物组织内的增强的表达。组织偏好性启动子包括,例如Kawamata等人,(1997)Plant Cell Physiol[植物细胞生理学]38:792-803;Hansen等人,(1997)Mol Gen Genet[分子遗传和基因组学]254:337-43;Russell等人,(1997)Transgenic Res[转基因研究]6:157-68;Rinehart等人,(1996)Plant Physiol[植物生理学]112:1331-41;Van Camp等人,(1996)Plant Physiol[植物生理学]112:525-35;Canevascini等人,(1996)Plant Physiol[植物生理学]112:513-524;Lam,(1994)ResultsProbl Cell Differ[细胞分化的结果和问题]20:181-96;以及Guevara-Garcia等人,(1993)Plant J[植物学]4:495-505。叶偏好性启动子包括,例如,Yamamoto等人,(1997)Plant J[植物学]12:255-65;Kwon等人,(1994)Plant Physiol[植物生理学]105:357-67;Yamamoto等人,(1994)Plant Cell Physiol[植物细胞生理学]35:773-8;Gotor等人,(1993)Plant J[植物学]3:509-18;Orozco等人,(1993)Plant Mol Biol[植物分子生物学]23:1129-38;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:9586-90;Simpson等人,(1958)EMBO J 4:2723-9;Timko等人,(1988)Nature[自然]318:57-8。根偏好性启动子包括,例如,Hire等人,(1992)Plant Mol Biol[植物分子生物学]20:207-18(soybean root-specific glutamine synthase gene[大豆根特异性谷氨酰胺合成酶基因]);Miao等人,(1991)Plant Cell[植物细胞]3:11-22(cytosolic glutaminesynthase(GS)[胞浆谷氨酰胺合成酶(GS)]);Keller和Baumgartner(1991)Plant Cell[植物细胞]3:1051-61(root-specific control element in the GRP 1.8 gene of Frenchbean[法国菜豆的GRP 1.8基因中的根特异性控制元件]);Sanger等人,(1990)Plant MolBiol[植物分子生物学]14:433-43(root-specific promoter of A.tumefaciensmannopine synthase(MAS)[根瘤土壤杆菌甘露碱合酶的根特异性启动子(MAS)]);Bogusz等人,(1990)Plant Cell[植物细胞]2:633-41(root-specific promoters isolated fromParasponia andersonii and Trema tomentosa[从Parasponia andersonii和山黄麻(Trema tomentosa)中分离的根特异性启动子]);Leach和Aoyagi,(1991)Plant Sci[植物科学]79:69-76(A.rhizogenes rolC and rolD root-inducing genes[毛根土壤杆菌(A.rhizogenes)rolC和rolD根诱导基因]);Teeri等人,(1989)EMBO J8:343-50(Agrobacterium wound-induced TR1′and TR2’genes[土壤杆菌伤口诱导的TR1′和TR2′基因]);VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol Biol[植物分子生物学]29:759-72);和rolB启动子(Capana等人,(1994)Plant Mol Biol[植物分子生物学]25:681-91;菜豆素基因(Murai等人,(1983)Science[科学]23:476-82;Sengopta-Gopalen等人,(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:3320-4)。还参见美国专利号5837876;5750386;5633363;5459252;5401836;5110732和5023179。
“种子偏好性”启动子包括在种子发育期间有活性的种子特异性启动子以及在种子发芽期间有活性的种子发芽性启动子两者。参见Thompson等人,(1989)BioEssays[生物学分析]10:108。种子偏好性启动子包括但不限于Cim1(细胞分裂素诱导的信号);cZ19B1(玉蜀黍19kDa玉米蛋白);和milps(肌醇-1-磷酸盐合酶);(WO 00/11177;以及美国专利6225529)。对于双子叶植物,种子偏好性启动子包括但不限于:菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物,种子偏好性启动子包括但不限于玉蜀黍15kDa玉米蛋白、22kDa玉米蛋白、27kDaγ玉米蛋白、蜡质、收缩素1、收缩素2、球蛋白1、油质蛋白和nucl。还参见WO 00/12733,其中披露了来自END1和END2基因的种子偏好性启动子。
如本文中所使用,术语“3’非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其它序列。
如本文中所使用,术语“盒”是指与编码蛋白质编码RNA或非蛋白质编码RNA的DNA序列可操作地连接的启动子。盒可以任选地可操作地连接到3′非编码序列。
如本文关于多核苷酸所使用的术语“上游”和“下游”分别是指“5’的”和“3’的”。
如本文中所使用,术语“表达”是指(i)来自编码区的RNA(例如,mRNA或非蛋白质编码RNA,例如crRNA、tracrRNA或gRNA)的转录,或(ii)多肽从mRNA的翻译。
当用于描述基因或多核苷酸序列的表达时,术语“下调”、“破坏”、“抑制”、“失活”和“沉默”在本文中可互换使用,是指当多核苷酸序列的转录被降低或消除时的情况。这导致来自多核苷酸序列的RNA转录物的减少或消除,其引起源自于多核苷酸序列的蛋白质表达的降低或消除(如果该基因包含ORF)。可替代地,下调可能是指从由多核苷酸序列产生的转录物的蛋白质翻译被减少或消除的情况。可替代地,下调可能是指由多核苷酸序列表达的蛋白质具有降低的活性的情况。在细胞中任何上述过程(转录、翻译、蛋白质活性)的减少可以是相对于合适的对照细胞的转录、翻译或蛋白质活性的约20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。下调可以是例如如本文所披露的靶向事件的结果(例如,添加缺失、敲除)。
术语“对照细胞”和“合适的对照细胞”在本文中可互换使用,并且可以关于已经进行了特定修饰(例如,多核苷酸的过表达、多核苷酸下调)的细胞(即,“实验细胞”)进行参比。对照细胞可以是不具有或不表达实验细胞的特定修饰的任何细胞。因此,对照细胞可以是未转化的野生型细胞,或者可以进行遗传转化但不表达遗传转化。例如,对照细胞可以是实验细胞的直接亲本,该直接亲本细胞不具有在实验细胞中的特定修饰。可替代地,对照细胞可以是通过一个或多个世代移除的实验细胞的亲本。仍可替代地,对照细胞可以是实验细胞的同胞,该同胞不包括存在于实验细胞中的特定修饰。
如本文中所使用,术语“增加”可以是指比该增加的量或活性与之进行比较的量或活性多至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、50%、100%、或200%的量或活性。术语“增加的”、“提高的”、“增强的”、“大于”和“改进的”在本文中可互换使用。术语“增加”可以用于表征编码蛋白质的多核苷酸的表达,例如,其中“增加的表达”也可以意指“过表达”。
如本文中所使用,术语“可操作地连接”是指两个或更多个核酸序列的缔合,这样使得其中一种核酸序列的功能受到另一种核酸序列的影响。例如,当启动子能够影响编码序列的表达时,它可操作地连接编码序列。即,编码序列处于启动子的转录控制下。例如,编码序列可以与调节序列可操作地连接。而且,例如,crRNA可以与本文中的tracrRNA可操作地连接(融合),这样使得crRNA的tracrRNA配对序列与tracrRNA的5′序列退火。这样的可操作的连接可以包含合适的形成环的序列,例如GAAA(SEQ ID NO:36)、CAAA(SEQ ID NO:37)或AAAG(SEQ ID NO:38)。而且,例如,RGEN可以与一个或多个CPP可操作地连接(融合)。
如本文中所使用,术语“重组”是指例如通过化学合成或者通过用基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。
用于制备本文中的重组构建体/载体(例如,编码本文中的RNA组分盒的DNA多核苷酸,或编码本文中的Cas蛋白或Cas-CPP融合蛋白的DNA多核苷酸)的方法可以遵循标准重组DNA和分子克隆技术,这些技术是如在以下参考文献中描述的:例如,J.Sambrook和D.Russell(Molecular Cloning:A Laboratory Manual,3rd Edition,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001)[J.Sambrook和D.Russell( 子克隆:实验手册,第3版,纽约冷泉港冷泉港实验室出版社,2001)];T.J.Silhavy等人(Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1984)[T.J.Silhavy等人(使用基因融合的实验,纽约冷泉港冷泉港实验室出版社,1984)];以及F.M.Ausubel等人(Short Protocols in Molecular Biology,5th Ed.Current Protocols,John Wiley and Sons,Inc.,NY,2002)[F.M.Ausubel等人( 明分子生物学试验方案,第5版,当前试验方案,纽约州约翰威利父子公司,2002)]。
如本文中所使用,术语“转化”是指通过任何方法将核酸分子转移到宿主生物体或宿主细胞中。已经转化到生物体/细胞中的核酸分子可以是在生物体/细胞中自主复制、或整合到生物体/细胞的基因组中、或瞬时存在于细胞中而不进行复制或整合的核酸分子。在本文中披露了适用于转化的核酸分子的非限制性实例,例如质粒和线性DNA分子。
本文中“转基因植物”包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内,这样使得多核苷酸被传递给连续世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。转基因植物材料可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法,通过不导致外源多核苷酸的插入的基因组编辑程序,或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的基因组(染色体或染色体外)的改变并不意图被视为转基因。
“表型标记”是可筛选或可选择的标记,其包括视觉标记和可选择标记,无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地,可选择或可筛选的标记包含允许人们通常在特定条件下鉴定或选择含有它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性,例如但不限于RNA、肽或蛋白质的产生,或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
可选择标记的实例包括但不限于包含限制酶位点的DNA区段;编码提供对包括抗生素在内的其他毒性化合物的抗性的产物的DNA区段,该抗生素例如是大观霉素、氨苄青霉素、卡那霉素、四环素、巴斯塔(Basta)、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外在受体细胞中缺少的产物的DNA区段(例如,tRNA基因、营养缺陷型标记);编码可以容易地鉴定的产物的DNA区段(例如,表型标记例如β-半乳糖苷酶、GUS;荧光蛋白,例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白);产生用于PCR的新引物位点(例如,以前未并列的两个DNA序列的并列),包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列;并且包含允许其鉴定的特异性修饰(例如,甲基化)所需的DNA序列。
另外的可选择标记包括赋予除草剂化合物(例如草胺磷、溴草腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因参见例如,Yarranton,(1992)Curr Opin Biotech[生物技术新见]3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:6314-8;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)MolMicrobiol[分子微生物学]6:2419-22;Hu等人,(1987)Cell[细胞]48:555-66;Brown等人,(1987)Cell[细胞]49:603-12;Figge等人,(1988)Cell[细胞]52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2549-53;Deuschle等人,(1990)Science[科学]248:480-3;Gossen,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:1917-21;Labow等人,(1990)Mol Cell Biol[分子细胞生物学]10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:5072-6;Wyborski等人,(1991)Nucleic Acids Res[核酸研究]19:4647-53;Hillen和Wissman,(1989)Topics Mol StrucBiol[热点分子结构生物学]10:143-62;Degenkolb等人,(1991)Antimicrob AgentsChemother[抗微生物剂]35:1591-5;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Gossen等人,(1992)Prroc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother[抗微生物剂]36:913-9;Hlavka等人,(1985)Handbook of Experimental Pharmacology[实验药理学手册],Vol.78(Springer-Verlag,Berlin[柏林施普林格出版社]);Gill等人,(1988)Nature[自然]334:721-4。
如本文中所使用,关于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在两个序列中的核酸残基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。如本文中所使用,“序列同一性百分比”或“百分比同一性”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将该结果乘以100以产生序列同一性百分比。应当理解的是,当计算DNA序列和RNA序列之间的序列同一性时,DNA序列的T残基与RNA序列的U残基比对,并且可以被认为与其“一致”。出于确定第一和第二多核苷酸的百分比互补性的目的,可以通过确定(i)第一多核苷酸和第二多核苷酸的补体序列之间的百分比同一性(或反之亦然),例如和/或(ii)将产生规范的沃森和克里克碱基对的第一和第二多核苷酸之间的碱基百分比来获得。
可以使用在美国国家生物技术信息中心(NCBI)网站上在线获得的基本局部比对搜索工具(BLAST),例如,来测量在两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的百分比同一性。可替代地,使用Clustal算法(例如,ClustalW或ClustalV)可以进行序列之间的百分比同一性比对。对于使用Clustal比对方法的多重比对,默认值可以对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTHPENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数可以是KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对话框(DIAGONALSSAVED)=5。对于核酸,这些参数可以是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对话框=4。仍可替代地,序列之间的百分比同一性可以使用BLOSUM矩阵(例如,BLOSUM62),使用具有参数例如空位开始(GAP OPEN)=10、空位延伸(GAP EXTEND)=0.5、最终空位罚分(ENDGAP PENALTY)=错误(false)、最终空位开始(END GAP OPEN)=10、最终空位延伸(END GAPEXTEND)=0.5的EMBOSS算法(例如,needle)来执行。
本文中,与第二序列“互补”的第一序列可替代地可以被称为处于第二序列的“反义”取向。
作为本披露的发明的某些实施例的特征,本文披露了各种多肽氨基酸序列和多核苷酸序列。可以使用与本文披露的序列具有至少约70%-85%、85%-90%、或90%-95%同一性的这些序列的变体。可替代地,变体氨基酸序列或多核苷酸序列可以与本文披露的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列具有所披露的序列的相同功能/活性,或具有所披露的序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的功能/活性。
在Cas9蛋白的每个氨基酸位置处本文披露的所有氨基酸残基都是实例。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即,保守的),Cas9中每个位置处的氨基酸可以是如所披露的序列提供的或被如下保守的氨基酸残基取代(“保守的氨基酸取代”):
1.以下小的脂肪族、非极性或轻微极性的残基可以互相取代:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.以下极性、带负电荷的残基和它们的氨基化合物可以互相取代:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.以下极性、带正电荷的残基可以互相取代:His(H)、Arg(R)、Lys(K);
4.以下脂肪族、非极性残基可以互相取代:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);并且
5.以下大的芳香族残基可以互相取代:Phe(F)、Tyr(Y)、Trp(W)。
已经取得了在细胞中表达蛋白质和RNA组分以于其中进行RGEN介导的DNA靶向的进展(例如,美国临时申请号61/868,706和62/036,652)。这样的策略通常需要在靶细胞中的重组DNA表达。在细胞中提供蛋白质和RNA组分以介导RGEN介导的DNA靶向的另外的方法是令人感兴趣的。
所披露的发明的实施例涉及包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP)的组合物,其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接。RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
有意义的是,所披露的发明的某些实施例可以用于将已经与RNA组分缔合(预先缔合)的RGEN递送到细胞中。这样的实施例可以避免将DNA构建体递送到用于表达RGEN RNA组分的细胞中的需要,从而避免将外源DNA引入细胞中的任何潜在的有害影响。然而,所披露的发明是灵活的,因为在某些其他实施例中,可以在正在递送RGEN蛋白-CPP复合物的细胞中提供(例如表达)RNA组分。以这种方式提供的RNA组分可以在RGEN蛋白-CPP复合物递送/进入细胞后与RGEN蛋白组分缔合。不管RNA组分递送的方式如何,本文中的RGEN蛋白-CPP复合物能够与RNA组分缔合,形成可以靶向细胞中特异性DNA序列的RGEN-CPP复合物。因此,所披露的发明提供了在细胞中提供RGEN以执行RGEN介导的DNA靶向的实质性灵活性。
在某些实施例中披露的组合物包含RGEN的至少一种蛋白组分。本文中的RGEN是指包含至少一种Cas蛋白和至少一种RNA组分的复合物。因此,RGEN蛋白组分可能是指Cas蛋白,例如Cas9。合适的Cas蛋白的实例包括I型、II型或III型CRISPR系统的一种或多种Cas内切核酸酶(Bhaya等人,Annu.Rev.Genet.[遗传学年度评论]45:273-297,通过引用结合在此)。例如,I型CRISPR Cas蛋白可以是Cas3或Cas4蛋白。例如,II型CRISPR Cas蛋白可以是Cas9蛋白。例如,III型CRISPR Cas蛋白可以是Cas10蛋白。在某些优选实施例中使用Cas9蛋白。在某些实施例中的Cas蛋白可以是细菌或古细菌蛋白质。例如,本文中的I-III型CRISPRCas蛋白通常起源于原核生物;I型和III型Cas蛋白可以源自于细菌或古细菌物种,而II型Cas蛋白(即Cas9)可以源自于细菌种类。在其他实施例中,合适的Cas蛋白包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4中的一种或多种,其同系物或其修改版本。
在所披露的发明的其他方面,本文中的Cas蛋白可以来自任何以下属:气火菌属(Aeropyrum)、火棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球状菌属(Archaeoglobus)、嗜盐小盒菌属(Haloarcula)、甲烷杆菌属(Methanobacteriumn)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、火球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、Thernioplasnia、棒状杆菌属(Corynebacterium)、分支杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产液菌属(Aquifrx)、卟啉单胞菌属(Porphvromonas)、绿菌属(Chlorobiumm)、Thermus、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、高温厌氧杆菌属(Thermoanaerobacter)、支原菌属(Mycoplasma)、梭形杆菌属(Fusobacterium)、Azarcus、色素杆菌属(Chromobacterium)、奈瑟氏菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、土杆菌属(Geobacter)、Myrococcus、弯曲杆菌属(Campylobacter)、沃林氏菌属(Wolinella)、不动细菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、军团杆菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德氏菌属(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞杆菌属(Xanthomonas)、耶尔森氏菌属(Yersinia)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、弗朗西斯氏菌属(Francisella)、或栖热孢菌属(Thermotoga)。可替代地,本文中的Cas蛋白可以例如由SEQID NO:462-465、467-472、474-477、479-487、489-492、494-497、499-503、505-508、510-516或517-521编码,如披露于美国申请公开号2010/0093617中,其通过引用结合在此。
例如,RGEN蛋白组分可以包含Cas9氨基酸序列。包含这种类型的蛋白组分的RGEN通常可以被表征为具有作为RGEN的内切核酸酶组分的Cas9。本文中Cas9蛋白的氨基酸序列,以及本文中某些其他Cas蛋白,可能源自于,例如,链球菌属(例如化脓性链球菌(S.pyogenes)、肺炎链球菌(S.pneumoniae)、嗜热链球菌(S.thermophilus)、无乳链球菌(S.agalactiae)、副血链球菌(S.parasanguinis)、口腔链球菌(S.oralis)、唾液链球菌(S.salivarius)、猕猴链球菌(S.macacae)、停乳链球菌(S.dysgalactiae)、咽峡炎链球菌(S.anginosus)、星座链球菌(S.constellatus)、假豕链球菌(S.pseudoporcinus)、变异链球菌(S.mutans))、李斯特菌属(Listeria)(例如,无害利斯特菌(L.innocua))、螺原体属(Spiroplasma)(例如,蜂螺旋原体(S.apis)、S.syrphidicola)、消化链球菌科(Peptostreptococcaceae)、奇异菌属(Atopobium)、卟啉单胞菌属(Porphyromonas)(例如,P.catoniae)、普雷沃菌属(Prevotella)(例如,中间普雷沃菌(P.intermedia))、韦荣球菌属(Veillonella)、密螺旋体属(Treponema)(例如,索氏密螺旋体(T.socranskii)、齿垢密螺旋体(T.denticola))、二氧化碳噬细胞菌属(Capnocytophaga)、芬戈尔德菌属(Finegoldia)(例如,大芬戈尔德菌(F.magna))、红蝽菌科(Coriobacteriaceae)(例如,C.bacterium)、Olsenella(例如,O.profusa)、嗜血杆菌属(Haemophilus)(例如,H.sputorum、H.pittmaniae)、巴斯德氏菌属(Pasteurella)(例如,贝氏巴斯德菌(P.bettyae))、Olivibacter(例如,O.sitiensis)、Epilithonimonas(例如,E.tenax)、Mesonia(例如,M.mobilis)、乳杆菌属(Lactobacillus)、芽孢杆菌属(Bacillus(例如,蜡样芽孢杆菌(B.cereus))、Aquimarina(例如,A.muelleri)、金黄杆菌属(Chryseobacterium)(例如,C.palustre)、多形杆状菌属(Bacteroides)(例如,B.graminisolvens)、奈瑟氏菌属(Neisseria)(例如,脑膜炎奈瑟氏菌(N.meningitidis))、弗朗西斯氏菌属(Francisella(例如,新凶手弗朗西斯菌(F.novicida))、或黄杆菌属(Flavobacterium)(例如,寒冷黄杆菌(f.frigidarium)、F.soli物种。本文中,在某些方面优选化脓性链球菌Cas9。作为另一个实例,Cas9蛋白可以是描述于Chylinski等人(RNA Biology[RNA生物学]10:726-737,其通过引用结合在此)中的任何Cas9蛋白。
因此,本文中Cas9蛋白的序列可以包含,例如,在以下各项中披露任何Cas9氨基酸序列:基因库(GenBank)登记号G3ECR1(嗜热链球菌(S.thermophilus))、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(嗜热链球菌)、EGP66723、EGS38969、EGV05092、EHI65578(假豕链球菌)、EIC75614(口腔链球菌)、EID22027(星座链球菌)、EIJ69711、EJP22331(口腔链球菌)、EJP26004(咽峡炎链球菌)、EJP30321、EPZ44001(化脓性链球菌)、EPZ46028(化脓性链球菌)、EQL78043(化脓性链球菌)、EQL78548(化脓性链球菌)、ERL10511、ERL12345、ERL19088(化脓性链球菌)、ESA57807(化脓性链球菌)、ESA59254(化脓性链球菌)、ESU85303(化脓性链球菌)、ETS96804、UC75522、EGR87316(停乳链球菌)、EGS33732、EGV01468(口腔链球菌)、EHJ52063(猕猴链球菌)、EID26207(口腔链球菌)、EID33364、EIG27013(副血链球菌)、EJF37476、EJO19166(链球菌属BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(无乳链球菌)、TS89875、ETS90967(链球菌属SR4)、ETS92439、EUB27844(链球菌属BS21)、AFJ08616、EUC82735(链球菌属CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1、或Q99ZW2(化脓性链球菌),其通过引用结合。可以使用任何这些Cas9蛋白序列的变体,但是当与本文中的RNA组分缔合时,它们应当具有针对DNA的特异性结合活性和任选地切割或切口活性。这样的变体可以包含与参比Cas9的氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。
可替代地,例如,本文中的Cas9蛋白可以由如披露于美国申请公开号2010/0093617中的(通过引用结合在此)SEQ ID NO:462(嗜热链球菌)、474(嗜热链球菌)、489(无乳链球菌)、494(无乳链球菌)、499(变异链球菌)、505(化脓性链球菌)、或518(化脓性链球菌)中的任何一个编码。仍可替代地,本文中的Cas9蛋白可以包含,例如,SEQ ID NO:3的氨基酸序列,或SEQ ID NO:3的残基1-1368、2-1368或2-1379。仍可替代地,Cas9蛋白可以包含例如,与任何前述氨基酸序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。当与本文中的RNA组分缔合时,这样的变体Cas9蛋白应当具有针对DNA的特异性结合活性,以及任选地切割或切口活性。
本文中使用的Cas蛋白(例如Cas9)的起源可以是与RNA组分所源自的相同物种,或者其可以来自不同的物种。例如,包含源自于链球菌属物种(例如,化脓性链球菌或嗜热链球菌)的Cas9蛋白的RGEN可以与具有源自于相同的链球菌属物种的序列(例如,crRNA重复序列、tracrRNA序列)的至少一种RNA组分复合。可替代地,本文中使用的Cas蛋白(例如Cas9)的起源可以来自RNA组分所源自的不同物种(Cas蛋白和RNA组分可以彼此异源);这样的异源Cas/RNA组分RGEN应当具有DNA靶向活性。
确定本文中的Cas蛋白针对特异性靶DNA序列的结合活性和/或内切核酸酶活性可以通过本领域已知的任何合适的测定法(例如在美国专利号8697359(其通过引用披露在此)中披露的)来评估。例如,可以通过在细胞中表达Cas蛋白和合适的RNA组分,然后检查预测的DNA靶位点是否存在插入缺失来进行确定(在该特定测定法中Cas蛋白通常具有完全的内切核酸酶活性[双链切割活性])。例如,在预测的靶位点处检查是否存在改变/修饰(例如,插入缺失)可以经由DNA测序方法进行,或通过测定靶序列的功能丧失来推断改变/修饰形成。在另一个实例中,可以通过在已经提供了包含与靶位点处或附近的序列同源的序列的供体DNA的细胞中表达Cas蛋白和合适的RNA组分来确定Cas蛋白活性。在靶位点处的供体DNA序列的存在(例如将通过供体和靶序列之间成功的HR来预测)将表明靶向发生。在又另一个实例中,可以使用将Cas蛋白和合适的RNA组分与含有合适的靶序列的DNA多核苷酸混合在一起的体外测定来确定Cas蛋白活性。该测定法可以用于检测通过缺乏切割活性的Cas蛋白的结合(例如凝胶转移)或通过具有内切核酸能力的Cas蛋白的切割。
在某些方面,本文中的Cas蛋白例如Cas9可以进一步包含异源核定位序列(NLS)。例如,本文中的异源NLS氨基酸序列可能具有足够的强度来驱动在本文的细胞核中可检测的量的Cas蛋白或Cas蛋白-CPP复合物的积累。NLS可以包含碱性、带正电荷的残基(例如赖氨酸和/或精氨酸)的一个(单份的)或更多个(例如,单份的)短序列(例如,2至20个残基),并且可以位于Cas氨基酸序列的任何地方,但使得其暴露在蛋白质表面上。例如,NLS可以可操作地连接到本文中的Cas蛋白的N末端或C末端。两个或更多个NLS序列可以连接到Cas蛋白,例如在Cas蛋白的N末端和C末端两者。本文中合适的NLS序列的非限制性实例包括在美国专利号6660830和7309576(例如,其中的表1)中披露的那些,其都通过引用结合在此。本文中有用的NLS的另一个实例包括SEQ ID NO:3的氨基酸残基1373-1379。例如,如本文中披露的Cas蛋白可以与CPP融合(Cas蛋白与CPP共价连接的实例)。应当理解的是,这样的Cas-CPP融合蛋白还可以包含如上所述的NLS。还应当理解的是,在Cas蛋白与靶向不同细胞器(例如线粒体)的氨基酸序列融合的实施例中,这样的Cas蛋白通常不含有NLS。
在某些实施例中,由Cas蛋白引导DNA特异性靶向的Cas蛋白及其各自的RNA组分(例如,crRNA)可以与细胞(特别是非原核细胞)异源。这些RGEN组分的异源性质是由于Cas蛋白及其各自的RNA组分仅被认为存在于原核生物(细菌和古细菌)中。
在一些实施例中,Cas蛋白是包含一个或多个异源蛋白质结构域(例如除Cas蛋白之外的1、2、3或更多个结构域)的融合蛋白的一部分。例如,这些实施例可以涵盖共价连接到CPP和一个或多个另外的异源氨基酸序列的Cas蛋白质。例如,其他实施例可以涵盖与不包括CPP的一种或多种另外的异源氨基酸序列共价连接的Cas蛋白(在这样的实施例中CPP将非共价连接到Cas融合蛋白)。包含Cas蛋白的融合蛋白可以包含任何另外的蛋白质序列,以及任选地在任何两个结构域之间(例如在Cas和第一异源结构域之间)的连接体序列。可以与本文中的Cas蛋白融合的蛋白质结构域的实例包括但不限于表位标签(例如,组氨酸[His,聚组氨酸]、V5、FLAG、流感血球凝集素[HA]、myc、VSV-G、硫氧还蛋白[Trx]);报道子(例如谷胱甘肽-5-转移酶[GST]、辣根过氧化物酶[HRP]、氯霉素乙酰转移酶[CAT]、β-半乳糖苷酶、β-葡萄糖醛酸酶[GUS]、荧光素酶、绿色荧光蛋白[GFP]、HcRed、DsRed、青色荧光蛋白[CFP]、黄色荧光蛋白[YFP]、蓝色荧光蛋白[BFP]);以及具有一个或多个以下活性的结构域:甲基化酶活性、脱甲基酶活性、转录激活活性(例如,VP16或VP64)、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。在其他实施例中的Cas蛋白可能与结合DNA分子或其他分子的蛋白质融合,例如麦芽糖结合蛋白(MBP)、S-标签、Lex ADNA结合结构域(DBD)、GAL4A DNA结合结构域和单纯疱疹病毒(HSV)VP16。可以是包含本文中的Cas蛋白的融合蛋白的一部分的其他结构域披露在美国专利申请公开号2011/0059502中,其通过引用结合在此。在Cas蛋白与异源蛋白(例如转录因子)融合的某些实施例中,Cas蛋白具有DNA识别和结合活性(当与本文中合适的RNA组分复合时),但没有DNA切口或切割活性。例如,如本文中披露的Cas蛋白可以与CPP融合(Cas蛋白与CPP共价连接的实例)。应当理解的是,必要时,这样的Cas-CPP融合蛋白还可以与一个或多个如上所述的异源结构域融合。
可以连接到本文中的Cas蛋白的异源结构域的其他实例包括将蛋白质靶向到特定细胞器中的氨基酸序列(即定位信号)。可以被靶向的细胞器的实例包括线粒体和叶绿体。通常,当靶向核外DNA位点时,使用这样的靶向结构域而不是NLS。例如,线粒体靶向序列(MTS)可以位于Cas蛋白的N末端或其附近。MTS实例被披露于美国专利申请公开号2007/0011759和2014/0135275中,其通过引用结合在此。例如,叶绿体靶向序列可以是如披露于美国专利申请公开号2010/0192262或2012/0042412中的,其通过引用结合在此。
例如,RGEN的蛋白组分可以与至少一种RNA组分缔合(从而构成完整的RGEN),所述RNA组分包括与细胞中的染色体或附加体上的靶位点序列互补的序列。在这样的实施例中的RGEN可以结合靶位点序列,并且任选地在靶位点序列处切割一条或两条DNA链。例如,RGEN可以切割DNA靶序列的一条或两条链。在另一个实例中,RGEN可以切割DNA靶序列的两条链。应当理解的是,在所有这些实施例中,RGEN蛋白组分可以与RGEN蛋白-CPP复合物中的至少一种CPP共价或非共价连接。RGEN蛋白-CPP复合物与本文中的RNA组分的缔合可以被表征为形成RGEN-CPP复合物。除非另有说明,本文关于RGEN的任何披露内容同样适用于RGEN-CPP复合物的RGEN组分。
本文中可以切割DNA靶序列的两条链的RGEN通常包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。因此,在Cas蛋白的每个内切核酸酶结构域中保留一些或全部活性的野生型Cas蛋白(例如,本文披露的Cas9蛋白)或其变体是可以切割DNA靶序列的两条链的RGEN的合适实例。包含功能性RuvC和HNH核酸酶结构域的Cas9蛋白是可以切割DNA靶序列的两条链的Cas蛋白的实例。本文中可以切割DNA靶序列的两条链的RGEN通常在相同位置切割两条链,这样使得在切割位点处形成钝端(即,没有核苷酸突出端)。
本文中可以切割DNA靶序列的一条链的RGEN可以在本文中表征为具有切口酶活性(例如,部分切割能力)。本文中的Cas切口酶(例如,Cas9切口酶)通常包含一个功能性内切核酸酶结构域,该结构域允许Cas仅切割DNA靶序列的一条链(即,形成切口)。例如,Cas9切口酶可以包含(i)突变体、功能失调的RuvC结构域和(ii)功能性HNH结构域(例如野生型HNH结构域)。作为另一个实例,Cas9切口酶可以包含(i)功能性RuvC结构域(例如野生型RuvC结构域)和(ii)突变的功能失调的HNH结构域。
适用于本文使用的Cas9切口酶的非限制性实例披露于以下文献中:Gasiunas等人(Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]109:E2579-E2586)、Jinek等人(Science[科学]337:816-821)、Sapranauskas等人(Nucleic Acids Res.[核酸研究]39:9275-9282)以及美国专利申请公开号2014/0189896,其通过引用结合在此。例如,本文中的Cas9切口酶可以包含嗜热链球菌Cas9,该嗜热链球菌Cas9具有Asp-31取代(例如,Asp-31-Ala)(突变的RuvC结构域的实例),或His-865取代(例如,His-865-Ala)、Asn-882取代(例如,Asn-882-Ala)或Asn-891取代(例如,Asn-891-Ala)(突变的HNH结构域的实例)。而且,例如,本文中的Cas9切口酶可以包含化脓性链球菌Cas9,该化脓性链球菌Cas9具有Asp-10取代(例如,Asp-10-Ala)、Glu-762取代(例如,Glu-762-Ala)或Asp-986取代(例如,Asp-986-Ala)(突变的RuvC结构域的实例),或His-840取代(例如,His-840-Ala)、Asn-854取代(例如,Asn-854-Ala)或Asn-863取代(例如,Asn-863-Ala)(突变的HNH结构域的实例)。关于化脓性链球菌Cas9,三个RuvC亚结构域通常分别位于氨基酸残基1-59、718-769和909-1098,并且HNH结构域位于氨基酸残基775-908(Nishimasu等人,Cell 156:935-949)。
必要时,本文中的Cas9缺口酶可以用于细胞中的各种目的。例如,Cas9切口酶可以用于在DNA靶位点序列处或其附近用合适的供体多核苷酸刺激HR。由于缺口DNA不是用于NHEJ过程的底物,而是由HR过程所识别的,特异性靶位点处的切口DNA应该使得位点更容易被用合适的供体多核苷酸进行的HR所接受。
作为另一个实例,可以使用一对Cas9切口酶来增加DNA靶向的特异性。一般来说,这可以通过提供两个Cas9切口酶来进行,这两个Cas9切口酶通过与具有不同引导序列的RNA组分缔合,在希望靶向的区域的相反链上在DNA序列附近进行靶向和切口。每个DNA链的这样的附近的切割产生DSB(即,具有单链突出端的DSB),其然后被识别为NHEJ的底物(导致插入缺失形成)或HR的底物(如果提供,导致与合适的供体多核苷酸重组)。在这些实施例中的每个切口可以,例如,彼此分离至少约5、10、15、20、30、40、50、60、70、80、90、或100(或在5与100之间的任何整数)个碱基。本文中的一个或两个Cas9切口酶蛋白可以用于如上所述的Cas9切口酶对。例如,可以使用具有突变的RuvC结构域但具有功能性HNH结构域的Cas9切口酶(即,Cas9HNH+/RuvC-)(例如,化脓性链球菌Cas9 HNH+/RuvC-)。通过使用本文中的合适的RNA组分(具有将每个切口酶靶向每个特异性DNA位点的引导RNA序列),将每个Cas9切口酶(例如,Cas9 HNH+/RuvC-)引导到彼此邻近(分离多达100个碱基对)的特定的DNA位点。
在某些实施例中的RGEN可以结合DNA靶位点序列,但不切割在靶位点序列处的任何链。这样的RGEN可以包含其中所有核酸酶结构域都是突变的、功能失调的Cas蛋白。例如,可以结合到DNA靶位点序列但在靶位点序列处不切割任何链的本文的Cas9蛋白可以包含突变的、功能失调的RuvC结构域和突变的、功能失调的HNH结构域。这样的Cas9蛋白的非限制性实例包括上文披露的任何RuvC和HNH核酸酶结构域突变(例如,具有Asp-10取代(例如Asp-10-Ala)和His-840取代(例如His-840-Ala)的化脓性链球菌Cas9)。结合但不切割靶DNA序列的本文中的Cas蛋白可以用于调节基因表达,例如,在该情况下,Cas蛋白可以与转录因子(或其部分)融合(例如抑制子或激活子,例如本文披露的那些中的任一种)。例如,可以将包含具有Asp-10取代(例如Asp-10-Ala)和His-840取代(例如His-840-Ala)的化脓性链球菌Cas9的Cas9融合到VP16或VP64转录激活子结构域。例如,在这样RGEN的RNA组分中使用的引导序列将与在基因启动子或其他调控元件(例如,内含子)中的DNA序列互补。
本文中的RGEN可以结合靶位点序列,并且任选地在染色体、附加体或细胞基因组中的任何其他DNA分子中切割靶位点序列的一条或两条链。鉴于RGEN的RNA组分包含与靶序列的链互补的序列(引导序列),靶序列的这种识别和结合是特异性的。在某些实施例中的靶位点可以是独特的(即,在受试者基因组中存在靶位点序列的单一出现)。
本文中靶序列的长度可以是至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;在13-30个核苷酸之间;在17-25个核苷酸之间;或在17-20个核苷酸之间。该长度可以包括或排除PAM序列。而且,本文中的靶序列的链与(crRNA或gRNA的)引导序列具有足够的互补性以便与引导序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM与靶序列相邻,参见下文)。在引导序列与其对应的DNA靶序列的链之间的互补程度为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。例如,本文中的靶位点可以位于编码基因产物(例如,蛋白质或RNA)的序列或非编码序列(例如调节序列或“垃圾”序列)中。
PAM(前间区序列邻近基序)序列可以与靶位点序列相邻。PAM序列是由本文中的RGEN识别的短DNA序列。缔合的PAM和DNA靶序列的前11个核苷酸可能对Cas9/gRNA靶向和切割很重要(Jiang等人,Nat.Biotech.[自然生物技术]31:233-239)。本文中的PAM序列的长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而变化,但通常为例如2、3、4、5、6、7或8个核苷酸长。例如,PAM序列紧邻靶位点序列下游或在其下游2个或3个核苷酸内,该靶位点序列与该靶位点中的链互补,该链反过来与RNA组分引导序列互补。在RGEN是与RNA组分复合的内切核酸活性的Cas9蛋白的本文中的实施例中,Cas9如通过RNA组分指导的结合靶序列,并且紧邻PAM序列上游的第三核苷酸位置的5′处切割两条链。考虑靶位点的以下实例:PAM序列:
5’-NNNNNNNNNNNNNNNNNNNNXGG-3’(SEQ ID NO:43)。
在该实例序列中N可以是A、C、T或G,并且X可以是A、C、T或G(X也可以被称为NPAM)。在该实例中的PAM序列是XGG(下划线)。合适的Cas9/RNA组分复合物将紧邻双下划线N的5′处切割该靶标。在SEQ ID NO:43中的N串表示例如与本文中的RNA组分中的引导序列具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的靶序列(其中DNA靶序列的任何T与RNA引导序列中的任何U匹配)。在该靶序列处(其代表本文中的靶位点)的识别和结合中的Cas9复合物的RNA组分的引导序列将与N串的互补序列退火;在引导序列与靶位点补体之间的互补性百分比为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。如果使用Cas9切口酶来靶向在基因组中的SEQ ID NO:43,切口酶将紧邻双下划线N的5′处或在互补链的相同位置处产生切口,这取决于该切口酶中哪个内切核酸酶结构域功能失调。如果使用没有溶核活性的Cas9(RuvC和HNH结构域两者都是功能失调的)靶向在基因组中的SEQ ID NO:43,那么它将识别并结合靶序列,但不对序列进行任何切割。
鉴于正在使用的RGEN的类型,通常选择本文中的PAM。本文中的PAM序列可以是由包含Cas(例如Cas9)的RGEN识别的PAM序列,该Cas9源自于例如可从其得到Cas的本文披露的任何物种。在某些实施例中,PAM序列可以是由包含Cas9的RGEN所识别的PAM序列,该Cas9源自于化脓性链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus)、无乳链球菌(S.agalactiae)、脑膜炎奈瑟氏球菌(N.meningitidis)、齿垢密螺旋体(T.denticola)或新凶手弗朗西斯菌(F.novicida)。例如,源自于化脓性链球菌的合适的Cas9可以用于靶向具有NGG的PAM序列(SEQ ID NO:44;N可以是A、C、T或G)的基因组序列。作为其他实例,当靶向具有以下PAM序列的DNA序列时,合适的Cas9可以源自于以下物种中的任一种:嗜热链球菌(NNAGAA[SEQ ID NO:45])、无乳链球菌(NGG[SEQ ID NO:44])、NNAGAAW[SEQ ID NO:46,W是A或T]、NGGNG[SEQ ID NO:47])、脑膜炎奈瑟氏菌(NNNNGATT[SEQ ID NO:48])、齿垢密螺旋体(NAAAAC[SEQ ID NO:49])、或新凶手弗朗西斯菌(NG[SEQ ID NO:50])(其中在所有这些具体的PAM序列中的N是A、C、T或G)。可用于本文中的Cas9/PAM的其他实例包括在Shah等人(RNA Biology[RNA生物学]10:891-899)以及Esvelt等人(Nature Methods[自然方法]10:1116-1121)(其通过引用结合在此)中披露的那些。本文中的靶序列的实例遵循SEQ ID NO:43,但是其中‘XGG’PAM被前述PAM中的任一种替代。
本文中的RNA组分可以包含与细胞中的染色体或附加体中的靶位点序列互补的序列。基于该序列互补性,RGEN可以特异性结合靶位点序列,并且任选地切割靶位点序列的一条或两条链。因此,在所披露的发明的某些实施例中,RNA组分的互补序列也可以被称为引导序列或可变靶向结构域。
例如,本文中RNA组分(例如,crRNA或gRNA)的引导序列可以是至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核糖核苷酸长度;在13-30个之间的核糖核苷酸长度;在17-25个之间的核糖核苷酸长度;或在17-20个之间的核糖核苷酸长度。通常,本文中的引导序列与靶DNA序列的链具有足够的互补性以便与靶序列杂交并且指导Cas蛋白或Cas蛋白复合物与靶序列的序列特异性结合(如果合适的PAM与靶序列相邻)。在引导序列与其对应的DNA靶序列之间的互补程度为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可以相应地设计引导序列以将RGEN靶向细胞中的DNA靶序列。
本文中的RNA组分可以包含crRNA,例如,其包含引导序列和重复(tracrRNA配对)序列。引导序列通常位于crRNA的5′末端或其附近(在1、2、3、4、5、6、7、8、9、10或更多个碱基之内)。在crRNA的引导序列的下游是与tracrRNA的5′末端处的序列互补并且可以与其杂交的“重复”或“tracrRNA配对”序列。引导和tracrRNA配对序列可以直接相邻,或者例如被1、2、3、4或更多个碱基分开。tracrRNA配对序列与tracrRNA的5’末端具有例如至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%序列互补性。通常,互补性程度可以是沿着两个序列中较短者的长度,参比tracrRNA配对序列和tracrRNA序列的5′末端的最佳比对。本文中的tracrRNA配对序列的长度可以是例如至少8、9、10、11、12、13、14、15、16、17或18个核糖核苷酸长度,并且与在tracrRNA的5′末端的相同或相似长度(例如加上或减去1、2、3、4或5个碱基)的序列杂交。本文中的tracrRNA配对序列的合适实例包含SEQ IDNO:51(guuuuuguacucucaagauuua)、SEQ ID NO:52(guuuuuguacucuca)、SEQ ID NO:53(guuuuagagcua)或SEQ ID NO:54(guuuuagagcuag)、或其变体,该变体(i)具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且(ii)可以与tracrRNA的5′-末端序列退火。本文中的crRNA的长度可以是例如,至少约18、20、22、24、26、28、30、32、34、36、38、40、42、44、46或48个核糖核苷酸;或约18-48个核糖核苷酸;或约25-50个核糖核苷酸。
在RGEN中包含II型CRISPR系统的Cas9蛋白的实施例中,tracrRNA可以与crRNA一起包含在内。在5′-至-3′方向,本文中的tracrRNA包含(i)与crRNA的重复区(tracrRNA配对序列)退火的序列和(ii)含茎环的部分。例如,(i)的序列的长度可以与上文所披露的任何tracrRNA配对序列长度相同或类似(例如,加上或减去1、2、3、4或5个碱基)。本文中的tracrRNA的总长度(即序列成分[i]和[ii])可以是例如,至少约30、35、40、45、50、55、60、65、70、75、80、85或90(或在30与90之间的任何整数)个核糖核苷酸。tracrRNA可以进一步包括在3′-末端的1、2、3、4、5或更多个尿嘧啶残基,其可以凭借用转录终止子序列表达tracrRNA而存在。
本文中的tracrRNA可以源自于例如上文所列出的从其可以得到Cas9序列的任何细菌物种。合适的tracrRNA序列的实例包括在美国专利号8697359和Chylinski等人(RNABiology[RNA生物学]10:726-737)(其通过引用结合在此)中披露的那些。本文中优选的tracrRNA可以源自于链球菌属(Streptococcus)物种tracrRNA(例如,化脓性链球菌、嗜热链球菌)。本文中的tracrRNA的其他合适的实例可以包括:
SEQ ID NO:55:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc,
SEQ ID NO:56:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagug,或
SEQ ID NO:57:
uagcaaguuaaaauaaggcuaguccguuauca,
其源自于化脓性链球菌tracrRNA。本文中的tracrRNA的其他合适的实例可以包括:
SEQ ID NO:58:
uaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa,
SEQ ID NO:59:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuua,或
SEQ ID NO:60:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu,
其源自于嗜热链球菌tracrRNA。
本文中tracrRNA的又其他实例是这些tracrRNA SEQ ID NO的变体,该变体(i)与其具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性以及(ii)可以作为tracrRNA起作用(例如,5′-末端序列可以退火到crRNA的tracrRNA配对序列,5′-末端序列下游的序列可以形成一个或多个发夹,变体tracrRNA可以与Cas9蛋白形成复合物)。
本文披露的RGEN的RNA组分(或所述另一种方式,可以与RGEN蛋白组分缔合的RNA组分)可以包含例如引导RNA(gRNA),该引导RNA包含与tracrRNA可操作地连接或融合的crRNA。在某些优选实施例中,gRNA的crRNA组分在tracrRNA组分的上游(即,这样的gRNA在5′-至-3′方向上包含与tracrRNA可操作地连接的crRNA)。例如,如本文(例如上述实施例)所披露的的任何crRNA和/或tracrRNA(和/或其部分,例如crRNA重复序列、tracrRNA配对序列或tracrRNA 5’-末端序列)可以包含在gRNA中。
本文中的gRNA的crRNA组分的tracrRNA配对序列应当能够与tracrRNA组分的5′-末端退火,从而形成发夹结构。例如,关于在(crRNA组分的)tracrRNA配对序列和(tracrRNA组分的)5′-末端序列之间的长度和百分比互补性的任何上述披露内容可以表征gRNA的crRNA组分和tracrRNA组分。为了促进该退火,crRNA和tracrRNA组分的可操作连接或融合优选包含合适的形成环的核糖核苷酸序列(即,形成环的序列可以将crRNA和tracrRNA组分连接在一起,形成gRNA)。形成RNA环的序列的合适实例包括GAAA(SEQ ID NO:36)、CAAA(SEQID NO:37)和AAAG(SEQ ID NO:38)。然而,也可以使用较长或较短的环序列,如可以是替代性环序列。环序列优选包含核糖核苷酸三联体(例如AAA)和在三联体的任一端的另外的核糖核苷酸(例如C或G)。
本文中的gRNA通过其(crRNA组分的)tracrRNA配对序列和tracrRNA5’-末端序列部分的退火形成发夹(“第一发夹”)。取决于gRNA的tracrRNA组分的序列,一个或多个(例如,1、2、3或4个)另外的发夹结构可以在该第一发夹下游形成。因此,gRNA可以具有例如多达五个发夹结构。在gRNA序列的末端后,gRNA可以进一步包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基,其可以凭借例如用转录终止子序列表达gRNA而存在。取决于终止子序列的选择,这些另外的残基可以是所有U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的U残基。
可用于所披露的发明的合适的gRNA的非限制性实例可以包括:
SEQ ID NO:61:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaagauuuaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa,
SEQ ID NO:62:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa,
SEQ ID NO:63:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu,
SEQ ID NO:64:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAA aggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc,
SEQ ID NO:65:
NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuaucaacuugaaaaagug,
SEQ ID NO:66:
NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuauca,或
SEQ ID NO:67:
NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。
在SEQ ID NO:61-67的每一个中,单下划线的序列代表gRNA的crRNA部分。每个“N”代表合适的引导序列的核糖核苷酸碱基(A、U、G或C)。小写字母的第一个嵌段代表tracrRNA配对序列。小写字母的第二个嵌段代表gRNA的tracrRNA部分。双下划线的序列近似于与tracrRNA配对序列退火以形成第一发夹的tracrRNA序列的部分。环序列(GAAA,SEQ ID NO:36)以大写字母显示,其可操作地连接每个gRNA的crRNA和tracrRNA部分。本文中的gRNA的其他实例包括前述gRNA的变体,该变体(i)与这些序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性(在这个计算中排除引导序列),以及(ii)可以作为gRNA起作用,该gRNA特异性靶向Cas9蛋白以与靶DNA序列结合并任选地切口或切割靶DNA序列。
还可以按照具有引导序列(VT结构域)、随后是Cas内切核酸酶识别(CER)结构域来表征本文中的gRNA。CER结构域包含tracrRNA配对序列、随后是tracrRNA序列。可用于本文中的CER结构域的实例包括以上SEQ ID NO:61-67(每个中的CER结构域是VT结构域的N后面的序列)中包含的那些。CER结构域的另一个合适的实例是SEQ ID NO:24(参见实例),其在5′-至-3′方向上包含SEQ ID NO:53的tracrRNA配对序列、SEQ ID NO:36(GAAA)环形成序列和SEQ ID NO:55的tracrRNA序列。
RGEN的RNA组分任选地不具有5′-帽(7-甲基鸟苷酸[m7G]帽)(即,这样的RNA组分在其5′-末端不具有m7G帽)。本文中的RNA组分可以具有例如5′-羟基基团而不是5′-帽。可替代地,本文中的RNA组分可以具有例如5′磷酸酯而不是5′-帽。据信,在这些实施例中的RNA组分可以更好地积累在细胞核中(例如在其细胞核内转录之后,或在其RGEN介导的进入细胞核后,取决于本文如何提供RNA组分),因为5’-带帽的RNA(即具有5′m7G帽的RNA)有核输出的倾向。本文中未带帽的RNA组分的优选实例包括合适的gRNA、crRNA和/或tracrRNA。在某些实施例中,由于通过RNA组分的前体的5′-末端处的核酶序列的RNA自动加工(即,包含RNA组分例如gRNA上游的核酶序列的前体RNA经历核酶介导的自动加工以除去核酶序列,从而留下没有5′-帽的下游RNA组分),本文中的RNA组分缺少5′-帽,并且任选地反而具有5′-羟基基团。在某些其他实施例中,本文中的RNA组分不是通过从RNA聚合酶III(Pol III)启动子的转录产生的。
本文中的细胞穿透肽(CPP)可以为例如约5-30、5-25、5-20、10-30、10-25或10-20个氨基酸残基长度。作为其他实例,CPP可以为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸残基长度。然而,在本文的另外的方面,CPP可以为多达约35、40、45、50、55或60个氨基酸残基长度。
本文披露的CPP可以是例如阳离子性或两亲性的。本文中的阳离子性CPP通常包含至少约60%的带正电荷的氨基酸,例如赖氨酸(K)、精氨酸(R)和/或组氨酸(H)。可替代地,阳离子性CPP可以包含例如至少60%、65%、70%、75%、80%、85%、90%或95%带正电荷的氨基酸(例如,R残基;K残基;K和R残基;K、R和H残基)。在某些实施例中,阳离子性CPP可以被表征为富含精氨酸(例如,包含至少70%或80%R残基)或富含赖氨酸(例如,包含至少70%或80%L残基)。可用于本文中的阳离子性CPP的实例披露于Schmidt等人(FEBS Lett.584:1806-1813)以及Wender等人(polylysine;Proc.Natl.Acad.Sci.USA[聚赖氨酸;美国国家科学院院刊]97:13003-13008)中,其通过引用结合在此。阳离子性CPP的其他实例包括最初源自于HIV Tat蛋白质的GRKKRRQRRR(SEQ ID NO:68)、RKKRRQRRR(SEQ ID NO:69)、或RKKRRQRR(SEQ ID NO:70),和穿膜肽(RQIKIWFQNRRMKWKK,SEQ ID NO:71),其最初源自于果蝇属(Drosophila)的触角足突变同源结构域蛋白。
阳离子性CPP的另一个实例包括具有足以指导CPP及其货物(例如,RGEN蛋白组分或RGEN)进入细胞的多个连续精氨酸的聚精氨酸序列。在这样的聚精氨酸序列中的连续精氨酸残基的数目可以是例如至少3、4、5、6、7、8、9、10或10-50个精氨酸。在本文中的某些方面,CPP可以具有6个或更多个连续精氨酸残基(例如6-7、6-8、6-9或6-10个精氨酸残基)。必要时,“PolyR”(GGGGRRRRRRRRRLLLL,SEQ ID NO:15)可以包含在聚精氨酸CPP中。其他聚精氨酸CPP实例包括THRLPRRRRRR(SEQ ID NO:72)或GGRRARRRRRR(SEQ ID NO:73)。在一些实施例中,CPP是可活化的CPP(“ACPP”)(Aguilera等人,Integr Biol.(Camb)1:371-381;通过引用结合在此)。ACPP通常包含经由可切割的连接体连接到匹配聚阴离子(例如九个连续谷氨酸盐)的聚阳离子性CPP(例如九个连续精氨酸),其将净电荷降低到几乎为零,从而抑制CPP粘附和摄取到细胞中。在切割连接体时,聚阴离子被释放,局部地暴露聚阳离子部分及其固有的粘合性,从而允许CPP细胞进入。本文中另一个实例是聚赖氨酸CPP;任何上述聚精氨酸的实施例(但是其中R被K替代)是本文中聚赖氨酸CPP的实例。
本文中两亲性CPP包含含有交替模式的极性/带电荷残基和非极性疏水残基的氨基酸序列。以下CPP被认为是两亲性的,并且在某些方面是有用的(无论两亲性术语是否完美适用):包含转运蛋白-10(TP10)肽(例如,AGYLLGKINLKACAACAKKIL,SEQ ID NO:14)的CPP;来自血管内皮钙粘素蛋白的CPP,例如包含pVEC肽(例如,LIILRRRIRKQAHAHSK,SEQ IDNO:74;LLIILRRRIRKQAHAHSK,SEQ ID NO:13)的CPP;来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,例如包含Zebra肽(例如,ECDSELEIKRYKRVRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMC,SEQ ID NO:12)的CPP;包含(KFF)3K肽(例如,KFFKFFKFFK,SEQ ID NO:75)的CPP;包含MAP肽(KLALKLALKALKAALKLA,SEQ ID NO:76)的CPP;包含RRQRRTSKLMKR(SEQ IDNO:77)的CPP;包含KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:78)的CPP。本文中适合的其他两亲性CPP包括富含脯氨酸的CPP,例如包含VHLPPP(SEQ ID NO:79)或VRLPPP(SEQID NO:80)的至少3、4、5、6、7或8个重复的那些。
作为其他实例,本文中的CPP可以包含MPG肽(例如,GALFLGFLGAAGSTMGAWSQPKSKRKV,SEQ ID NO:81);Pep-1肽(例如KETWWETWWTEWSQPKKKRKV,SEQ ID NO:82);或来自人降钙素蛋白(例如hCT肽(例如,LGTYTQDFNKFHTFPQTAIGVGAP,SEQ ID NO:83;CGNLSTCMLGTYTQDFNK,SEQ ID NO:84))的CPP。本文中的CPP的又其他实例包括披露在Regberg等人(Int.J.Pharm.464:111-116)中的那些,所述文献通过引用结合在此。
可替代地,本文中适合的CPP可以包含例如,与任何本文披露的CPP氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。这样的变体CPP蛋白应当具有CPP活性,例如介导细胞摄取分子货物(例如,包含一个或多个RGEN蛋白组分[例如Cas9]的氨基酸序列或包含一个或多个与RNA组分缔合的RGEN蛋白组分[例如Cas9]的氨基酸序列)的能力。测试变体CPP的活性能以任何数量的方式进行,例如通过将它与荧光蛋白(例如GFP)共价连接并测量从与CPP-荧光蛋白复合物接触的细胞发射的荧光的程度。
必要时,可以修改本文的CPP,使其甚至能够更加容易地将RGEN蛋白质货物从细胞外部携带到细胞内部。例如,可以将CPP修改为在其N-或C-末端具有脂质基团。合适的脂质基团包括酰基基团,例如硬脂基和肉豆蔻基基团。脂质基团的其他实例是具有8、9、10、11、12、13、14、15、16、17或18个碳的酰基基团。用脂质基团修饰肽的条件披露在例如Regberg等人(Int.J.Pharm.464:111-116)以及Anko等人(Biochim.Biophys.Acta-Biomembranes1818:915-924)中,其通过引用结合在此。
在本文中的某些方面,本文中的RGEN蛋白组分和至少一种CPP可以在RGEN蛋白-CPP复合物中彼此共价连接。例如,RGEN蛋白组分和至少一种CPP可以在单个氨基酸序列中融合在一起(即,RGEN蛋白组分和至少一种CPP可以包含在融合蛋白内)。因此,本文中的共价连接的实例可以经由肽键实现的,在该肽键中RGEN蛋白组分的氨基酸序列与CPP的氨基酸序列融合,这样使得这两个氨基酸序列都包含在单个氨基酸序列中。这样的融合蛋白(或“嵌合蛋白”)可以被表征为本文中的RGEN蛋白-CPP融合物。在RNA组分与RGEN蛋白组分缔合的那些实施例中,这样的融合蛋白可以被表征为RGEN-CPP融合物。
例如,一个或多个CPP可以位于RGEN蛋白-CPP融合物的N-末端或C-末端。可替代地,一个或多个CPP可以位于RGEN蛋白-CPP融合物的N-末端和C-末端两者。仍可替代地,一个或多个CPP可以位于RGEN蛋白-CPP融合物的氨基酸序列内。本文中包含多于一个CPP的实施例可以包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个CPP,或5-10、5-20或10-20个CPP。与RGEN蛋白组分融合的CPP可以相同或不同(例如,2、3、4或更多个不同类型的CPP)。一个或多个CPP可以直接融合到RGEN蛋白的氨基酸序列,和/或可以融合到一个或多个与RGEN蛋白融合的异源结构域(例如,NLS或其他靶向细胞器的序列,例如MTS)。
本文中的CPP和RGEN蛋白组分之间的融合可以是直接的(即,CPP氨基酸序列通过肽键直接连接到RGEN氨基酸序列)。可替代地,在CPP和RGEN蛋白组分之间的融合可以是经由中间氨基酸序列实现(这是间接连接的CPP和RGEN蛋白组分的实例)。中间氨基酸序列的实例包括合适的连接体序列,其包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100个氨基酸残基,例如甘氨酸、丝氨酸、丙氨酸和/或脯氨酸。合适的氨基酸连接体披露在例如美国专利号8828690、8580922和5990275中,其通过引用结合在此。中间氨基酸序列的其他实例可以包含一种或多种其他类型的蛋白质和/或结构域。例如,标记蛋白(例如荧光蛋白,例如本文披露的那些中的任一种)可以包含在中间氨基酸序列中。
包含RGEN蛋白组分和至少一种CPP的共价复合物(例如在融合蛋白中)的组合物可以与本文披露的任何细胞类型一起使用。然而,任选地,该组合物可以与非哺乳动物细胞例如酵母、真菌和植物一起使用,但排除在哺乳动物细胞上的使用。
本文中的RGEN蛋白-CPP融合蛋白的实例可以包含SEQ ID NO:39(Zebra CPP-Cas9-NLS融合蛋白)、40(PolyR CPP-Cas9-NLS融合蛋白)、41(TP10 CPP-Cas9-NLS融合蛋白)、或42(pVEC CPP-Cas9-NLS融合蛋白)。SEQ ID NO:39-42是Cas9-CPP融合蛋白的实例。RGEN蛋白-CPP融合蛋白的其他实例包括与SEQ ID NO:39-42中任一个具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。这样的变体融合蛋白应该具有(i)可以介导融合蛋白的细胞摄取的CPP结构域,和(ii)当与RNA组分缔合时针对DNA具有特异性结合活性以及任选地切割或切口活性的Cas9蛋白。SEQ ID NO:39、40、41和42分别包含Zebra CPP(SEQ ID NO:12)、PolyR CPP(SEQ ID NO:15)、TP10 CPP(SEQ ID NO:14)和pVEC CPP(SEQID NO:13),其可操作地连接到Cas9(化脓性链球菌)-NLS蛋白(SEQ ID NO:3的残基2-1379)。
在某些实施例中,引导多核苷酸/Cas内切核酸酶系统的蛋白组分可以与CPP融合,其中该CPP包含:
(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,
(ii)具有6个或更多个连续精氨酸残基的CPP,
(iii)转运蛋白-10(TP10)CPP,
(iv)来自血管内皮钙粘素蛋白的CPP,或
(vi)选自下组的CPP,该组由以下各项组成:合成的九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP。
合成的九精氨酸、富含组氨酸的九精氨酸和Pas九精氨酸CPP的实例披露在例如Liu等人(Advanced Studies in Biology[生物学高级研究]5(2):71-88,HIKARI公司),其通过引用结合在此。
RGEN蛋白组分和至少一种CPP可以如何共价连接的另一个实例是经由交联(化学交联)。因此,本文中的RGEN蛋白-CPP复合物的实例可以包含与至少一种CPP交联的RGEN蛋白。本文中的交联是指通过一个或多个共价键在化学上连接两个或更多个分子(在这种情况下为RGEN蛋白组分和至少一种CPP)的方法。可以使用本领域已知的任何数量的方法进行交联,例如披露于以下各项中的那些:美国专利申请公开号2011/0190813、美国专利号8642744、以及Bioconjugate Techniques,2nd Edition(G.T.Hermanson,Academic Press,2008)[生物共轭技术(第2版)(G.T.Hermanson,学术出版社,2008)],其全部都通过引用结合在此。
通常,出于将CPP交联到RGEN蛋白组分上的目的,CPP可以被修饰和/或合成以在其N-末端、C-末端和/或氨基酸侧基上含有合适的蛋白质连接基团。“蛋白质连接基团”是指能够在合适的条件(例如,水性条件)下,自发地或激活后(例如光)与RGEN蛋白组分的可接近的侧链官能团直接反应以产生CPP与RGEN蛋白的共价连接的基团。蛋白质连接基团可以与例如在RGEN蛋白质中的Lys、Cys、Ser、Thr、Tyr、His或Arg氨基酸残基的侧链官能团反应以产生与蛋白质的共价连接。例如,可以使用同源双功能(例如,能够连接胺与胺)或异源双功能(例如,能够连接胺与硫醇)蛋白质连接基团。在某些实施例中,CPP上的蛋白质连接基团也可以与RGEN蛋白质的末端基团(例如N-末端)反应。本文中合适的蛋白质连接基团包括氨基反应性(例如NHS酯或亚氨基酯)、硫醇(巯基)-反应性(例如,马来酰亚胺例如BMOE、BMB或BMH)、羟基反应性、咪唑基反应性、或胍基-反应性基团。示例性蛋白质连接基团包括活性酯(例如氨基反应性NHS酯)和硫醇反应性马来酰亚胺或碘乙酰胺基团。例如,在Bioconjugate Techniques,2nd Edition(G.T.Hermanson,Academic Press,2008)[生物共轭技术(第2版)(G.T.Hermanson,学术出版社,2008)]中描述了本文有用的另外的示例性蛋白质连接基团以及使用它们的方法。
本文中的蛋白质连接基团通常可以在CPP和长度为20个原子或更少的骨架的RGEN蛋白之间产生连接。例如,这样的连接可以是在1和20个原子长度之间,或约1、2、3、4、5、6、8、10、12、14、16、18或20个碳原子长度。在某些实施例中,连接可以是直链、支链、环状或单个原子。在某些情况下,连接体主链的一个、两个、三个、四个或五个或更多个碳原子可以被硫、氮或氧杂原子取代。骨架原子之间的键可以是饱和的或不饱和的(在连接体主链中通常不多于一个、两个或三个不饱和键)。连接体可以包括但不限于低聚(乙二醇);醚;硫醚;叔胺;或烷基基团,其可以是直链或支链的(例如甲基、乙基、正丙基、异丙基、正丁基、正戊基、叔丁基)。作为其他实例,连接体主链可以包括环状基团,例如芳基、杂环或环烷基基团,其中环状基团的2个或更多个原子(例如2、3或4个原子)包括在主链中。
在某些实施例中,多于一种类型的CPP(例如2、3、4或更多种不同类型的CPP)可以交联至RGEN蛋白组分。当交联时可以使用的一个或多个CPP与RGEN蛋白的比例(摩尔比)可以为例如,至少约1∶1、2∶1、3∶1、4∶1、5∶1、6∶1、7∶1、8∶1、9∶1、10∶1 15∶1、20∶1、30∶1、40∶1或50∶1。在其他方面,与RGEN蛋白交联的CPP的平均数目可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25,或至少5-10、5-15、5-20或5-25。
必要时,RGEN蛋白组分和至少一种CPP可以交联为复合物,该复合物进一步包含一个或多个其他蛋白质/肽/结构域。这样的其他元件可以任选地用于桥接RGEN蛋白组分与CPP,并且可以包含上述任何中间氨基酸序列。
在本文中的某些方面,本文中的RGEN蛋白组分和至少一种CPP可以在RGEN蛋白-CPP复合物中彼此非共价连接。虽然不意图被任何特定的理论或机制束缚,但是考虑了在RGEN蛋白组分和至少一种CPP之间的非共价连接可以归因于静电、范德华力和/或疏水力。在RNA组分与RGEN蛋白组分缔合的那些实施例中,这样的实施例可以被表征为包含在RGEN-CPP复合物中与至少一种CPP非共价连接的RGEN。包含非共价连接的RGEN蛋白组分和CPP的组合物可以任选地被表征为这些组分的混合物。
在某些实施例中,RGEN蛋白组分与至少一种CPP非共价连接,该CPP具有仅由CPP氨基酸序列组成的氨基酸序列。尽管没有任何“非CPP”氨基酸序列,这样的CPP可以任选地包含如本文披露的修饰例如脂质基团。
可替代地,与RGEN蛋白组分非共价连接的CPP可以包含在具有CPP氨基酸序列和一个或多个异源氨基酸序列(非RGEN蛋白序列)的融合蛋白中。在这样的实施例中,异源序列可以是结构域或蛋白质的异源序列(例如,荧光蛋白,例如本文披露的那些中任一种,或上述披露内容中关于Cas融合物所列出的任何结构域/蛋白质)。另一个实例是将二聚化结构域融合到CPP,该二聚化结构域能够结合与RGEN蛋白组分连接或融合的二聚化结构域。
亮氨酸拉链结构域是本文中的二聚化结构域的实例。亮氨酸拉链结构域可以代表已知含有这样的结构域的天然蛋白质的那些(例如转录因子),或可以合成设计。连接到CPP的亮氨酸拉链结构域可以与RGEN蛋白组分的亮氨酸拉链结构域缔合(“拉在一起”),从而在非共价复合物中连接CPP和RGEN蛋白组分。用于非共价连接CPP和RGEN蛋白组分的一对亮氨酸拉链结构域可以是相同的(这样的结构域对形成同型二聚体亮氨酸拉链)或不同的(这样的结构域对形成异质二聚体亮氨酸拉链)。亮氨酸拉链结构域的实例包括在美国专利申请公开号2003/0108869和2004/0147721中披露的那些。在某些方面,可以使用来自GCN4转录因子的亮氨酸拉链结构域形成同型二聚体亮氨酸拉链,然而在其他方面,可以分别使用来自fos和jun转录因子的亮氨酸拉链结构域形成异质二聚体亮氨酸拉链。
必要时,RGEN蛋白组分和至少一种CPP的非共价复合物可以进一步包含一个或多个其他蛋白质/肽/结构域。这样的其他元件可以任选地用于桥接RGEN蛋白组分与CPP,并且可以包含上述任何中间氨基酸序列。
在某些实施例中,多于一种类型的CPP(例如2、3、4或更多种不同类型的CPP)可以非共价连接到RGEN蛋白组分。可以用于制备这样的复合物的一个或多个CPP与RGEN蛋白的比率(摩尔比)可以为例如,至少约1∶1、2∶1、3∶1、4∶1、5∶1、6∶1、7∶1、8∶1、9∶1、10∶115∶1、20∶1、30∶1、40∶1或50∶1。在其他方面,与RGEN蛋白非共价连接的CPP的平均数目可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25,或至少5-10、5-15、5-20或5-25。
在某些实施例中,RGEN蛋白组分和至少一种CPP的非共价复合物可以通过在水性介质中将适量的每种组分进行混合(例如,以获得上文所披露的CPP与RGEN蛋白的比率)来制备。例如,合适的水性介质可以包含缓冲溶液例如PBS或无血清培养基,例如DMEM。例如,可以在约4℃至45℃的温度下将混合物孵育约30、60、90或120分钟,以允许形成非共价RGEN蛋白-CPP复合物。能以细胞类型适当的方式将包含复合物的该溶液的合适体积(例如,充分覆盖/浸渍正在处理的细胞的最小体积)应用于细胞。在RNA组分与RGEN蛋白组分缔合的实施例中,RGEN的这样的形成可以包括在将CPP与RGEN蛋白组分一起孵育之前、同时或之后添加RNA组分。
包含RGEN蛋白组分和至少一种CPP的非共价复合物的组合物可以与本文披露的任何细胞类型一起使用。然而,任选地,该组合物可以与非哺乳动物细胞例如酵母、真菌和植物一起使用,但排除在哺乳动物细胞上的使用。
在应用于细胞之前可以存在于组合物中的RGEN蛋白-CPP复合物可以是例如至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%纯度。在某些实施例中,这样的纯度可以是以蛋白质为基础的。作为实例,如果复合物的纯度至少为80%,这将意味着组合物中所有蛋白质的至少80%由复合物构成。可替代地,复合物纯度可以不仅考虑以蛋白质为基础的纯度,还可以考虑到其他生物分子(例如脂质、糖类和/或核酸)。作为实例,如果复合物的纯度至少为80%,这将意味着在本文的组合物中所有生物分子的至少80%由复合物构成。在某些实施例中,化合物例如碳水化合物、盐和/或脂质等不影响本文中纯度百分比的测定。关于纯度的所有这些披露内容也可以应用于RGEN-CPP复合物(即,复合物的RGEN蛋白组分与RNA组分缔合)。
本文中的组合物优选是水性的,其中溶解有RGEN蛋白-CPP复合物或RGEN-CPP复合物的溶剂为至少约70wt%、75wt%、80wt%、85wt%、90wt%、95wt%、98wt%或99wt%的水。例如,组合物中复合物的浓度可以为至少约0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0μM、或约0.5至5.0μM、0.5至2.5μM、1.0至5.0μM、1.0至2.5μM、或2.5至5.0μM。应当理解的是,这样的组合物可以是处于液体状态。
在某些实施例中,组合物的pH可以在约4.0至约10.0之间。可替代地,pH可以为约4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5或10.0。可以通过添加或掺入合适的缓冲液来调节或控制pH,该缓冲液包括但不限于:HEPES、磷酸盐(例如,PBS)、Tris、Tris-HCl、柠檬酸盐、或其组合。在本文的组合物中的缓冲液浓度可以为例如从0mM至约100mM、或约10mM、20mM或50mM。在某些方面,可以使用HEPES缓冲液(例如,约25mM HEPES,例如25mMHEPES/KOH pH 7.5、200mM KCl、20%甘油、1mM DTT)。
除了RGEN蛋白-CPP复合物或RGEN-CPP复合物之外,本文中的组合物可以任选地包含其他组分。例如,该组合物可以包含一种或多种盐,例如钠盐(例如NaCl、Na2SO4)。盐的其他非限制性实例包括具有(i)铝、铵、钡、钙、铬(II或III)、铜(I或II)、铁(II或III)、氢、铅(II)、锂、镁、锰(II或III)、汞(I或II)、钾、银、钠、锶、锡(II或IV)或锌阳离子,以及(ii)乙酸盐、硼酸盐、溴酸盐、溴化物、碳酸盐、氯酸盐、氯化物、亚氯酸盐、铬酸盐、重铬酸盐、磷酸二氢盐、铁氰化物、亚铁氰化物、氟化物、碳酸氢盐、磷酸氢盐、硫酸氢盐、硫化氢、亚硫酸氢盐、氢化物、氢氧化物、次氯酸盐、碘酸盐、碘化物、硝酸盐、氮化物、亚硝酸盐、草酸盐、氧化物、高氯酸盐、高锰酸盐、过氧化物、磷酸盐、磷化物、亚磷酸盐、硅酸盐、锡酸盐、亚锡酸盐、硫酸盐、硫化物、亚硫酸盐、酒石酸盐或硫氰酸盐阴离子的那些。因此,例如,具有上述(i)中的阳离子和上述(ii)中的阴离子的任何盐可以处于本文中的组合物中。例如,盐能以约0.01至约10.00(或在0.01至10.00之间的任何百分之一增量)的wt%存在。
本文中的RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。在RGEN蛋白组分与RNA组分缔合(从而构成完整的RGEN)的那些实施例中,RGEN-CPP复合物类似地具有穿过该细胞膜/细胞壁的能力。在本文的某些方面,RGEN蛋白-CPP复合物或RGEN-CPP复合物可以穿过细胞壁和细胞膜。
本文中的RGEN蛋白-CPP或RGEN-CPP复合物可以任选地穿过包含糖萼(被膜)的细胞壁。这些实施例通常涉及原核细胞(例如细菌),其中一些细胞可能具有糖萼,取决于物种类型和生长条件。
虽然不意图被任何特定的理论或机制束缚,但是据信本文中的CPP可以经由内吞过程将RGEN蛋白组分递送到细胞中。这样的过程的实例可能包括大胞饮作用、网格蛋白介导的内吞作用、细胞膜穴样内陷/脂质筏介导的内吞作用和/或受体介导的内吞作用机制(例如,清道夫受体介导的摄取、蛋白多糖介导的摄取)。
一旦RGEN蛋白-CPP或RGEN-CPP复合物在细胞内,它可以穿过例如细胞器膜,例如细胞核膜或线粒体膜。在某些实施例中,该能力取决包含有RGEN蛋白的至少一种细胞器靶向序列(例如,NLS、MTS)的存在。但是,在其他实施例中,穿过细胞器膜(例如细胞核膜或线粒体膜)的能力不取决于细胞器靶向序列的存在(即,在这样的实施例中,一个或多个CPP可能负责允许RGEN穿过细胞器例如细胞核或线粒体)。
本文中的细胞可以是哺乳动物细胞或非哺乳动物细胞,其中在某些优选实施例中使用后者。在某些其他方面,本文中的细胞可以如它(i)在生物体/体内组织中,(ii)在离体的组织或细胞组内,或(iii)处于体外状态中存在的。
本文中的微生物细胞可以是以分离状态(例如,体外细胞、培养细胞)或非分离状态原样存在。
在某些实施例中,微生物细胞是真菌细胞,例如酵母细胞。在某些方面,本文中的酵母可以是无性生殖(无性型)或有性(有性型)的酵母。虽然本文中的酵母通常以单细胞形式存在,但是某些类型的这些酵母可任选地能够形成假菌丝(连接的芽殖细胞的串)。在又另外的方面,酵母可以是单倍体或二倍体,和/或可以具有以这些倍性形式中的任一者存在的能力。
酵母的实例包括常规酵母和非常规酵母。在某些实施例中,常规酵母是偏爱同源重组(HR)DNA修复过程超过由非同源末端连接(NHEJ)介导的修复过程的酵母。本文中常规酵母的实例包括以下属的物种:酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae),其也被称为芽殖酵母、烘焙酵母、和/或啤酒酵母;贝酵母(S.bayanus);布拉酵母(S.boulardii);S.bulderi;S.cariocanus;S.cariocus;薛瓦酵母(S.chevalieri);S.dairenensis;葡萄酒酵母(S.ellipsoideus);真贝酵母(S.eubayanus);少孢酵母(S.exiguus);S.florentinus;克鲁弗酵母(S.kluyveri);S.martiniae;S.monacensis;S.norbensis;奇异酵母(S.paradoxus);巴氏酵母(S.pastorianus);S.spencerorum;S.turicensis;单孢酵母(S.unisporus);葡萄汁酵母(S..uvarum);S.zonatus)以及裂殖酵母属(Schizosaccharomyces)(例如,粟酒裂殖酵母(S.pombe),其也被称为裂殖酵母;S.cryophilus;S.japonicus;八孢裂殖酵母(S.octosporus))。
本文中的非常规酵母不是常规酵母,例如酵母属(例如酿酒酵母)或裂殖酵母属(例如粟酒裂殖酵母)物种。在某些实施例中,非常规酵母可以是偏爱NHEJ DNA修复过程超过由HR介导的修复过程的酵母。常规酵母例如酿酒酵母和粟酒裂殖酵母通常表现出具有短侧翼同源臂(30-50bp)的供体DNA的特异性整合,其效率通常超过70%,而非常规酵母例如巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichia stipitis)、多形汉逊酵母(Hansenula polymorpha)、解脂耶氏酵母(Yarrowia lipolytica)和乳酸克鲁维酵母(Kluyveromyces lactis)通常以低于1%的效率显示与类似结构的供体DNA的特异性整合(Chen等人,PLoS ONE 8:e57952)。因此,可以测量HR过程的偏好,例如通过用合适的供体DNA转化酵母并确定其与预测被供体DNA靶向的基因组位点的特异性重组的程度。例如,如果这样的测定产生供体DNA在酵母基因组中的高度随机整合,则证明偏好NHEJ(或低的HR偏好)。用于确定DNA在酵母中的特异性(HR介导的)和/或随机(NHEJ介导的)整合的比率的测定是本领域已知的(例如,Ferreira和Cooper,Genes Dev.[基因与发育]18:2249-2254;Corrigan等人,PLoS ONE 8:e69628;Weaver等人,Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]78:6354-6358;Keeney和Boeke,Genetics[遗传学]136:849-856)。
鉴于其低水平的HR活性,本文中的非常规酵母可以(i)表现出具有30-50bp侧翼同源臂的合适供体DNA的例如小于约1%、2%、3%、4%、5%,、6%、7%或8%的特异性靶向率,和/或(ii)表现出前述供体DNA的例如大于约65%、66%、67%、68%、69%、70%、71%、72%、73%、74%或75%的随机整合率。合适的供体DNA的这些(i)特异性靶向率和/或(ii)随机整合率可以表征非常规酵母,因为其在提供如本文所披露的RGEN之前存在。在某些实施例中向非常规酵母提供RGEN的目的是产生位点特异性DNA单链断裂(SSB)或双链断裂(DSB),用于使酵母偏向特异性位点的HR。因此,在非常规酵母中提供合适的RGEN通常应当允许酵母表现出与特定供体DNA的HR的增加比率。这样的增加比率可以比在合适的对照(例如,用相同的供体DNA转化的相同的非常规酵母,但缺少合适的RGEN)中的HR的比率高至少约2-、3-、4-、5-、6-、7-、8-、9-或10-倍。
本文中的非常规酵母可以按照本领域已知的任何手段进行培养,这些手段是例如在以下文献中所描述的:Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer-Verlag,Berlin,Germany,2003)[遗传学、生物化学和生物技术中的非常规酵母:实践方案(K.Wolf、K.D.Breunig、G.Barth,编辑,德国柏林施普林格出版社,2003)],Yeasts in Natural and Artificial Habitats(J.F.T.Spencer,D.M.Spencer,Eds.,Springer-Verlag,Berlin,Germany,1997)[在天然和人工栖息地的酵母(J.F.T.Spencer、D.M.Spencer,编辑,德国柏林施普林格出版社,1997)]和/或Yeast Biotechnology: Diversity and Applications(T.Satyanarayana,G.Kunze,Eds.,Springer,2009)[酵母生 物技术:多样性与应用(T.Satyanarayana、G.Kunze,编辑,施普林格出版社,2009)],其全部通过引用结合在此。
本文中的非常规酵母的非限制性实例包括以下属的酵母:耶氏酵母属(Yarrowia)、毕赤酵母属(Pichia)、许旺酵母属(Schwanniomyces)、克鲁维酵母属(Kluyveromyces)、Arxula、毛孢子菌属(Trichosporon)、假丝酵母属(Candida)、黑粉菌属(Ustilago)、球拟酵母属(Torulopsis)、接合酵母属(Zygosaccharomyces)、三角酵母属(Trigonopsis)、隐球菌属(Cryptococcus)、红酵母属(Rhodotorula)、法夫酵母属(Phaffia)、掷孢酵母属(Sporobolomyces)、管囊酵母属(Pachysolen)、和小丛梗孢属(Moniliella)。耶氏酵母属(Yarrowia)物种的合适的实例是解脂耶氏酵母(Y.lipolytica)。毕赤酵母属(Pichia)物种的合适的实例包括巴斯德毕赤酵母(P.pastoris)、甲醇毕赤酵母(P.methanolica)、树干毕赤酵母(P.stipitis)、异常毕赤酵母(P.anomala)和安格斯毕赤酵母(P.angusta)。许旺酵母属(Schwanniomyces)物种的合适的实例包括S.castellii、S.alluvius、S.hominis、S.occidentalis、S.capriottii、S.etchellsii、多形许旺酵母(S.polymorphus)、假多形许旺酵母(S.pseudopolymorphus)、S.vanrijiae和S.yamadae。克鲁维酵母属(Kluyveromyces)物种的合适的实例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆弱克鲁维酵母(K.fragilis)、K.drosophilarum、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、K.vanudenii、K.waltii、非洲克鲁维酵母(K.africanus)和多孔克鲁维酵母(K.polysporus)。Arxula物种的合适的实例包括A.adeninivorans和A.terrestre。毛孢子菌属(Trichosporon)物种的合适的实例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capitatum)、墨汁丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适的实例包括白念珠菌(C.albicans)、C.ascalaphidarum、C.amphixiae、南极洲假丝酵母(C.antarctica)、蜂生假丝酵母(C.apicola)、C.argentea、大西洋假丝酵母(C.atlantica)、大气假丝酵母(C.atmosphaerica)、C.blattae、C.bromeliacearum、C.carpophila、C.carvajalis、C.cerambycidarum、C.chauliodes、C.corydali、C.dosseyi、杜氏假丝酵母(C.dubliniensis)、C.ergatensis、果实假丝酵母(C.fructus)、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙念珠菌(C.guilliermondii)、希木龙假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中间假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、海洋假丝酵母(C.marina)、膜醭假丝酵母(C.membranifaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、C.oleophila、C.oregonensis、近平滑念珠菌(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶念珠菌(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.shehatea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带念珠菌(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、C.sojae、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和C.zemplinina。黑粉菌属(Ustilago)物种的合适的实例包括燕麦散黑粉菌(U.avenae)、茭白黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉蜀黍黑粉菌(U.maydis)、裸黑粉(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适的实例包括T.geochares、T.azyma、光滑球拟酵母(T.glabrata)和白色球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适的实例包括拜耳接合酵母(Z.bailii)、双孢接合酵母(Z.bisporus)、Z.cidri、发酵型结合酵母(Z.fermentati)、Z.florentinus、Z.kombuchaensis、Z.lentus、Z.mellis、Z.microellipsoides、Z.mrakii、Z.pseudorouxii和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适的实例包括变异三角酵母(T.variabilis)。隐球菌属(Cryptococcus)物种的合适的实例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球菌(C.neoformans)、格特隐球菌(C.gattii)、单咽隐球菌(C.uniguttulatus)、C.adeliensis、C.aerius、C.albidosimilis、C.antarcticus、C.aquaticus、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球菌(C.curvatus)、C.phenolicus、C.skinneri、地生隐球酵母(C.terreus)和C.vishniacci。红酵母属(Rhodotorula)物种的合适的实例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、北美红酵母(R.americana)、R.araucariae、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、R.auriculariae、高产酵母菌株(R.bacarum)、海洋红酵母(R.benthica)、R.biourgei、R.bogoriensis、支气管红酵母(R.bronchialis)、R.buffonii、R.calyptogenae、R.chungnamensis、R.cladiensis、珊瑚藻红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、分流红酵母(R.diffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、R.fujisanensis、R.futronensis、胶状红酵母(R.gelatinosa)、冰河红酵母(R.glacialis)、粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、牧草红酵母(R.graminis)、R.grinbergsii、R.himalayensis、R.hinnulea、落组织红酵母(R.histolytica)、袋唇兰红酵母(R.hylophila)、肉色红酵母(R.incarnata)、R.ingeniosa、R.javanica、R.koishikawensis、R.lactosa、R.lamellibrachiae、喉小囊红酵母(R.laryngis)、嗜木红酵母(R.lignophila)、R.lini、R.longissima、R.ludwigii、R.lysinophila、海洋红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、粘质红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、稻红酵母(R.oryzae)、太平洋红酵母(R.pacifica)、浅红酵母(R.pallida)、R.peneaus、R.philyla、R.phylloplana、R.pilatii、果蝇红酵母(R.pilimanae)、R.pinicola、褶皱红酵母(R.plicata)、多形红酵母(R.polymorpha)、R.psychrophenolica、嗜冷红酵母(R.psychrophila)、R.pustula、R.retinophila、R.rosacea、R.rosulata、发红红酵母(R.rubefaciens)、R.rubella、变红红酵母(R.rubescens)、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、血红色红酵母(R.sanguinea)、R.sanniei、R.sartoryi、R.silvestris、R.simplex、R.sinensis、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、土地红酵母(R.terrea)、R.texensis、东京红酵母(R.tokyoensis)、R.ulzamae、香草红酵母(R.vanillica)、R.vuilleminii、欧蓍草红酵母(R.yarrowii)、R.yunnanensis和R.zsoltii。法夫酵母属(Phaffia)物种的合适的实例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适的实例包括S.alborubescens、S.bannaensis、北京掷孢酵母(S.beijingensis)、S.bischofiae、S.clavatus、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、S.elongatus、S.gracilis、S.inositophilus、S.johnsonii、S.koalae、S.magnisporus、S.novozealandicus、香掷孢酵母(S.odorus)、S.patagonicus、长生蜿掷孢酵母(S.productus)、玫瑰掷孢酵母(S.roseus)、(S.sasicola)、S.shibatanus、S.singularis、(S.subbrunneus)、匀称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、S.tsugae、克桑托斯掷孢酵母(S.xanthus)和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)和小丛梗孢属(Moniliella)物种的合适的实例分别包括嗜鞣管囊酵母(P.tannophilus)和丛梗孢酵母(M.pollinis)。本文中的非常规酵母的其他实例还包括Pseudozyma属物种(例如,S.antarctica)、Thodotorula属物种(例如,T.bogoriensis)、Wickerhamiella属物种(例如,W.domercqiae)、和Starmerella属物种(例如,S.bombicola)。
在本文披露的某些实施例中,解脂耶氏酵母(Yarrowia lipolytica)是优选的。
合适的解脂耶氏酵母的实例包括可获得自美国典型培养物保藏中心(AmericanType Culture Collection)(ATCC,弗吉尼亚州马纳萨斯市)的以下分离株:菌株名称ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。
本文中的真菌细胞可以是酵母(例如,如上所述)或任何其他真菌类型例如丝状真菌。例如,本文中的真菌可以是担子菌纲(Basidiomycetes)、接合菌纲(Zygomycetes)、壶菌纲(Chytridiomycetes)或子囊菌纲(Ascomycetes)。本文中的丝状真菌的实例包括以下属的那些:木霉属(Trichoderma);金孢子菌属(Chrysosporium);梭孢壳属(Thielavia);脉孢菌属(Neurospora)(例如,粗糙脉孢菌(N.crassa)、好食脉孢霉(N.sitophila));丛赤壳属(Cryphonectria)(例如,栗丛赤壳菌(C.parasitica));短梗霉属(Aureobasidium)(例如,出芽短梗霉菌(A.pullulans));黑粉酵母属(Filibasidium);瘤胃壶菌属(Piromyces);隐球菌属(Cryplococcus);支顶孢属(Acremonium);弯颈霉属(Tolypocladium);柱顶孢霉(Scytalidium);裂褶菌属(Schizophyllum);侧孢霉属(Sporotrichum);青霉属(Penicillium)(例如,P.bilaiae、沙门柏干酪青霉(P.camemberti)、白青霉(P.candidum)、产黄青霉(P.chrysogenum)、扩展青霉(P.expansum)、绳状青霉(P.funiculosum)、灰绿青霉(P.glaucum)、马尔尼菲青霉(P.marneffei)、娄地青霉(P.roqueforti)、疣孢青霉(P.verrucosum)、鲜绿青霉(P.viridicatum));赤霉菌属(Gibberella)(例如,G.acuminata、燕麦赤霉菌(G.avenacea)、G.baccata、G.circinata、G.cyanogena、藤仓赤霉(G.fujikuroi)、错综赤霉(G.intricans)、虱状赤霉(G.pulicaris)、G.stilboides、G.tricincta、玉米赤霉(G.zeae));毁丝霉属(Myceliophthora);毛霉属(Mucor)(例如,鲁西氏毛霉菌(M.rouxii)、卷枝毛霉(M.circinelloides);曲霉属(Aspergillus)(例如,黑曲霉(A.niger)、米曲霉(A.oryzae)、构巢曲霉(A.nidulans)、黄曲霉(A.flavus)、A.lentulus、土曲霉(A.terreus)、棒曲霉(A.clavatus)、烟曲霉(A.fumigatus));镰刀菌属(Fusarium)(例如,禾谷镰刀菌(F.graminearum)、尖孢镰刀菌(F.oxysporum)、F.bubigenum、腐皮镰刀菌(F.solani)、尖孢镰刀菌(F.oxysporum)、轮枝镰刀菌(F.verticillioides)、层生镰刀菌(F.proliferatum)、镶片镰刀菌(F.venenatum));以及腐质霉属(Humicola),及其无性型和有性型。必要时,可以通过Barnett和Hunter(Illustrated Genera of Imperfect Fungi,3rd Edition,Burgess PublishingCompany,1972[不完全真菌的示例性属(第3版),伯吉斯出版公司,1972)]中披露通过形态来定义本文中的真菌的属和物种。在某些实施例中,真菌可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。
在某些方面,本文中的木霉属(Trichoderma)物种包括侵占木霉(T.aggressivum)、亚马逊木霉(T.amazonicum)、棘孢木霉(T.asperellum)、深绿木霉(T.atroviride)、黄绿木霉(T.aureoviride)、T.austrokoningii、T.brevicompactum、T.candidum、加勒比木霉(T.caribbaeum)、T.catoptron、T.cremeum、T.ceramicum、T.cerinum、T.chlorosporum、T.chromospermum、T.cinnamomeum、桔绿木霉(T.citrinoviride)、T.crassum、T.cremeum、T.dingleyeae、T.dorotheae、T.effusum、T.erinaceum、T.estonicum、可育木霉(T.fertile)、凝胶状木霉(T.gelatinosus)、T.ghanense、钩状木霉(T.hamatum)、哈茨木霉(T.harzianum)、T.helicum、T.intricatum、康长木霉(T.konilangbra)、康氏木霉(T.koningii)、T.koningiopsis、长柄木霉(T.longibrachiatum)、T.longipile、T.minutisporum、T.oblongisporum、T.ovalisporum、T.petersenii、T.phyllostahydis、T.piluliferum、侧耳木霉(T.pleuroticola)、T.pleurotum、多孢木霉(T.polysporum)、拟康氏木霉(T.pseudokoningii)、T.pubescens、里氏木霉(T.reesei)、T.rogersonii、T.rossicum、T.saturnisporum、T.sinensis、T.sinuosum、螺旋木霉(T.spirale)、T.stramineum、T.strigosum、T.stromaticum、T.surrotundum、台湾木霉(T.taiwanense)、泰国木霉(T.thailandicum)、T.thelephoricolum、T.theobromicola、T.tomentosum、T.velutinum、绿木霉(T.virens)、绿色木霉(T.viride)和淡绿色木霉(T.viridescens)。可以如在例如Trichoderma:Biology and Applications(P.K.Mukherjee等人,Eds.,CABI,Oxfordshire,UK,2013)[木霉属:生物 学与应用(P.K.Mukherjee等人,编辑,英国牛津郡CABI),2013](其通过引用结合在此)中所述的培养和/或操作本文中的木霉属物种。
在某些实施例中,微生物细胞是藻类细胞。例如,藻类细胞可以来自以下各项中的任一种:绿藻门(Chlorophyta)(绿藻)、红藻门(Rhodophyta)(红藻)、褐藻纲(Phaeophyceae)(褐藻)、硅藻纲(Bacillariophycaeae)(硅藻类)和涡鞭藻(Dinoflagellata)(鞭毛藻类)。在其他方面,藻类细胞可以是微藻类(例如,浮游植物、微小植物、或浮游藻类)或大型藻类(巨藻、海草)。作为另外的实例,本文中的藻类细胞可以是紫菜属(Porphyra)(紫菜);第三腕板属(Palmaria)物种例如掌叶树(P.palmata)(掌状红皮藻);节旋藻属(Arthrospira)物种例如钝顶节旋藻(A.platensis)(螺旋藻属(spirulina))、小球藻属(Chlorella)(例如,原始小球藻(C.protothecoides));角叉菜属(Chondrus)物种例如皱波角叉菜(C.crispus)(爱尔兰藓);丝囊藻属(Aphanizomenon);马尾藻属(Sargassum);Cochayuyo;葡萄藻属(Botryococcus)(例如,布朗葡萄藻(B.braunii));杜氏藻属(Dunaliella)(例如,盐生杜氏藻(D.tertiolecta));江蓠属(Gracilaria);Pleurochrysis(例如,P.carterae);纤维藻属(Ankistrodesmus);小环藻属(Cyclotella);菱板藻属(Hantzschia);微球藻属(Nannochloris);微拟球藻属(Nannochloropsis);菱形藻属(Nitzschia);褐指藻属(Phaeodactylum)(例如,三角褐指藻(P.tricornutum));栅列藻属(Scenedesmus);裂丝藻属(Stichococcus);扁藻属(Tetraselmis)(例如,T.suecica);海链藻属(Thalassiosira)(例如,假微型海链藻(T.pseudonana));隐甲藻属(Crypthecodinium)(例如,寇氏隐甲藻(C.cohnii));新绿藻属(Neochloris)(例如,富油新绿藻(N.oleoabundans));或Schiochytrium。可以如例如在Thompson(Algal Cell Culture.Encyclopedia of Life Support System(EOLSS), Biotechnology Vol 1[藻类细胞培养,生命支持系统百笠全书(EOLSS),生物技术第1卷],可获自eolss.net/sample-chapters internet site)(其通过引用结合在此)中所述来培养和/或操作藻类物种。
在一个实施例中,该方法包括将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法,所述方法包括:使微生物细胞与包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,由此进入微生物细胞。可用于本文所述方法和组合物的微生物细胞包括选自以下各项的细胞:疫霉属(Phytophthora)物种例如辣椒疫霉菌(Phytophtora capsici)(Lamour等人,2012.The oomycete broad-host-rangepathogenPhytophthora capsici.Mol.Plant Pathol.May 13(4):329-337[卵菌纲广谱宿主围病原体辣椒疫霉菌,分子植物病理学,5月,13(4):329-337]),Zymoseptoria物种例如小麦壳针孢(Septoria tritici)(Testa等人2015.Overview of genomic andbioinformatics resources for Zymoseptoria tritici.Fungal Genet.Biol.Jun.79:13-16[Zymoseptoria tritici.的基因组和生物信息学资源概述,真菌遗传与生物学,6月,79:13-16])以及葡萄孢属(Botrytis)物种例如灰葡萄孢菌(Botrytis cinerea)(HahnM.2014.The rising threat of fungicide resistance in plant pathogenic fungi:Botrytis as a case study.J.Chem.Biol 7:133-141[杀虫剂抗性在植物致病真菌中的威胁日益增加:以葡萄孢属为例,生物化学杂志,7:133-141])。
本文中的原生生物细胞可以选自例如,纤毛纲(Ciliata)(例如四膜虫属、草履虫属、豆形虫属、肾形虫属、瞬膜虫属(Glaucoma)、匙口虫属(Platyophrya)、钟虫属、波托虫属(Potomacus)、伪康纤虫属(Pseudocohnilembus)、游仆虫属(Euplotes)、Engelmaniella和Stylonichia);亚门鞭毛纲(Mastigophora)(鞭毛虫);植鞭毛纲(Phytomastigophorea)(例如眼虫属(Euglena)、变胞藻属(Astasia)、红球藻属(Haematococcus)和隐甲藻属(Crypthecodinium));动鞭毛虫纲(Zoomastigophorea);亚纲根足亚纲(Rhizopoda)、叶足纲(Lobosea)(例如,变形虫属(Amoeba))和真胶丝菌纲(Eumycetozoea)(例如网柄菌属(Dictyostelium)和绒胞菌属(Physarum))。可以如例如在 Protistology Culture Guide:tips and techniques for propagating protozoa and algae[ 原生生物 学培养指南:繁殖原生动物和藻类的技巧和技术](2013,可获自美国典型培养物保藏中心互联网网站)(其通过引用结合在此)中所述的来培养和/或操作本文中的某些原生生物物种。在某些实施例中,原生生物可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。
在某些实施例中,细菌细胞可以是球菌、杆菌、螺旋体、原生质球、原生质体等形式的细菌细胞。细菌的其他非限制性实例包括革兰氏阴性和革兰氏阳性的细菌。细菌的另外其他非限制性实例包括以下属中的那些:沙门氏菌属(Salmonella)(例如,伤寒沙门氏菌(S.typhi)、肠炎沙门氏菌(S.enteritidis))、志贺氏菌属(Shigella)(例如,痢疾志贺氏菌(S.dysenteriae))、埃希氏菌属(Escherichia)(例如,大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、沙雷氏菌属(Serratia)、变形杆菌属(Proteus)、耶尔森氏菌属(Yersinia)、柠檬酸杆菌属(Citrobacter)、爱德华菌属(Edwardsiella)、普罗维登斯菌属(Providencia)、克雷伯氏菌属(Klebsiella)、哈夫尼菌属(Hafnia)、爱文菌属(Ewingella)、克吕沃氏菌属(Kluyvera)、摩根氏菌属(Morganella)、动性球菌属(Planococcus)、口腔球菌属(Stomatococcus)、微球菌属(Micrococcus)、葡萄球菌属(Staphylococcus)(例如,金黄色葡萄球菌(S.aureus)、表皮葡萄球菌(S.epidermidis))、弧菌属(Vibrio)(例如,霍乱弧菌(V.cholerae))、气单胞菌属(Aeromonas)、Plessiomonas、嗜血杆菌属(Haemophilus)(例如,流感嗜血杆菌(H.influenzae))、放线杆菌属(Actinobacillus)、巴斯德氏菌属(Pasteurella)、支原菌属(Mycoplasma)(例如,肺炎支原体(M.pneumonia))、脲原体属(Ureaplasma)、立克次氏体(Rickettsia)、考克斯氏体属(Coxiella)、罗克利马体属(Rochalimaea)、埃利希氏体属(Ehrlichia)、链球菌属(Streptococcus)(例如,化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、肺炎链球菌(S.pneumoniae))、肠球菌属(Enterococcus)(例如,粪肠球菌(E.faecalis))、气球菌属(Aerococcus)、兼性双球菌属(Gemella)、乳球菌属(Lactococcus)(例如,乳酸乳球菌(L.lactis))、明串珠菌属(Leuconostoc(例如,肠膜明串珠菌(L.mesenteroides))、片球菌属(Pedicoccus)、芽孢杆菌属(Bacillus)(例如,蜡样芽孢杆菌(B.cereus)、枯草芽孢杆菌(B.subtilis)、苏云金芽孢杆菌(B.thuringiensis))、棒状杆菌属(Corynebacterium)(例如,白喉棒状杆菌(C.diphtheriae))、隐秘杆菌属(Arcanobacterium)、放线菌属(Actinomyces)、红球菌属(Rhodococcus)、李斯特菌属(Listeria)(例如,单核细胞增生李斯特菌(L.monocytogenes))、丹毒杆菌属(Erysipelothrix)、加德纳菌属(Gardnerella)、奈瑟氏菌属(Neisseria)(例如,脑膜炎奈瑟氏菌(N.meningitidis)、淋病奈瑟氏菌(N.gonorrhoeae))、弯曲杆菌属(Campylobacter)、弓形菌属(Arcobacter)、沃林氏菌属(Wolinella)、缠绕杆菌属(Helicobacter)(例如,幽门螺杆菌(H.pylori))、无色杆菌属(Achromobacter)、不动细菌属(Acinetobacter)、土壤杆菌(Agrobacterium)(例如,根癌土壤杆菌(A.tumefaciens))、产碱杆菌属(Alcaligenes)、华丽单胞菌属(Chryseomonas)、丛毛单胞菌属(Comamonas)、埃肯菌属(Eikenella)、黄色单胞菌(Flavimonas)、黄杆菌属(Flavobacterium)、摩拉克氏菌属(Moraxella)、寡源杆菌属(Oligella)、假单胞菌属(Pseudomonas)(例如,铜绿假单胞菌(P.aeruginosa))、希瓦氏菌属(Shewanella)、威克氏菌(Weeksella)、考单胞杆菌属(Xanthomonas)、博德特氏菌(Bordetella)、Franciesella、布氏杆菌属(Brucella)、军团杆菌属(Legionella)、阿菲波菌属(Afipia)、巴尔通氏体属(Bartonella)、荚膜菌属(Calymmatobacterium)、心杆菌属(Cardiobacterium)、链杆菌属(Streptobacillus)、螺旋状菌属(Spirillum)、消化链球菌属(Peptostreptococcus)、消化球菌(Peptococcus)、Sarcinia、粪球菌属(Coprococcus)、瘤胃球菌属(Ruminococcus)、丙酸杆菌属(Propionibacterium)、动弯杆菌属(Mobiluncus)、双歧杆菌属(Bifidobacterium)、真细菌属(Eubacterium)、乳杆菌属(Lactobacillus)(例如,乳酸乳杆菌(L.lactis)、嗜酸乳杆菌(L.acidophilus))、罗思氏菌属(Rothia)、梭菌属(Clostridium)(例如,肉毒梭菌(C.botulinum)、产气荚膜梭菌(C.perfringens))、多形杆状菌属(Bacteroides)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、梭形杆菌属(Fusobacterium)、嗜胆菌属(Bilophila)、纤毛菌属(Leptotrichia)、沃林氏菌属(Wolinella)、氨基酸球菌属(Acidaminococcus)、巨球型菌属(Megasphaera)、Veilonella、诺卡氏菌属(Norcardia)、马杜拉放线菌属(Actinomadura)、拟诺卡氏菌属(Norcardiopsis)、链霉菌属(Streptomyces)、小多孢菌属(Micropolysporas)、高温放线菌属(Thermoactinomycetes)、分枝杆菌(Mycobacterium)(例如,结核分枝杆菌(M.tuberculosis)、牛分枝杆菌(M.bovis)、麻风分枝杆菌(M.leprae))、密螺旋体属(Treponema)、包柔氏螺旋体属(Borrelia)(例如,伯氏包柔氏螺旋体(B.burgdorferi))、钩端螺旋体属(Leptospira)、以及衣原体(Chlamydiae)。在某些实施例中,细菌可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。在某些实施例中,细菌可以包含在混合的微生物群体中(例如,含有其他细菌,或含有酵母和/或其他细菌)。
在某些实施例中,古细胞可以来自任何古细菌门,例如广古菌门(Euryarchaeota)、泉古菌门(Crenarchaeota)、纳古菌门(Nanoarchaeota)、初古菌门(Korarchaeota)、曙古菌门(Aigarchaeota)或奇古菌门(Thaumarchaeota)。本文中的古细菌细胞可以是例如嗜极生物(extremophilic)(例如,能够在对大多数生命有害的物理或地球化学的极端条件下生长和/或茁壮成长)。嗜极生物古细菌的一些实例包括嗜热的(例如,可以在45℃-122℃之间的温度下生长)、超嗜热的(例如,可以在80℃-122℃的温度下生长)、嗜酸的(例如,可以在3或以下的pH水平下生长)、嗜碱性(例如,可以在9或以上的pH水平下生长)和/或嗜盐(例如,可以在高盐浓度[例如20%-30%NaCl]中生长)的那些。古细菌物种的实例包括以下属的那些:盐杆菌属(Halobacterium)(例如,沃氏富盐菌(H.volcanii))、硫化叶菌属(Sulfolobus)(例如,硫磺矿硫化叶菌(S.solfataricus))、酸热硫化叶菌(S.acidocaldarius))、热球菌属(Thermococcus)(例如,T.alcaliphilus、速生热球菌(T.celer)、T.chitonophagus、T.gammatolerans、T.hydrothermalis、超耐热菌(T.kodakarensis)、嗜热高温球菌(T.litoralis)、T.peptonophilus、深部热球菌(T.profundus)、T.stetteri)、甲烷暖球菌属(Methanocaldococcus)(例如,M.thermolithotrophicus、詹氏甲烷暖球菌(M.jannaschii))、产甲烷球菌属(Methanococcus)(例如,海沼甲烷球菌(M..maripaludis))、甲烷热杆菌属(Methanothermobacter)(例如,M.marburgensis、热自养甲烷热杆菌(M.thermautotrophicus))、古生球菌属(Archaeoglobus)(例如,闪烁古生球菌(A.fulgidus))、亚硝化侏儒菌属(Nitrosopumilus)(例如,海洋亚硝化侏儒菌(N.maritimus))、生金球菌属(Metallosphaera)(例如,勤奋金属球菌(M.sedula))、铁原体属(Ferroplasma)、热原体属(Thermoplasma)、甲烷短杆菌属(Methanobrevibacter)(例如,史密斯氏甲烷短杆菌(M.smithii))、以及甲烷球形菌属(Methanosphaera)(例如,M.stadtmanae)。
本文中的昆虫细胞的实例包括草地贪夜蛾(Spodoptera frugiperda)细胞、粉纹夜蛾(Trichoplusia ni)细胞、家蚕(Bombyx mori)细胞等。草地贪夜蛾(S.frugiperda)细胞包括例如Sf9和Sf21。粉纹夜蛾(T.ni)卵巢细胞包括例如HIGH FIVE细胞(别名BTI-TN-5B1-4,由英杰公司(Invitrogen)制造)。家蚕(B.mori)细胞包括例如N4。可以如在例如Growth and Maintenance of Insect cell lines[昆虫细胞系的生长和维护](2010,英杰公司(Invitrogen),手册编号(Manual part no.)25-0127,MAN0000030)(其通过引用结合在此)中所述的来培养和/或操作本文中的某些昆虫细胞。在其他方面,昆虫细胞可以是植物有害生物/病原体的细胞,例如粘虫、小地老虎、玉米穗蛾、玉米跳甲、玉米叶蚜、玉米根蚜、欧洲玉米蛀虫、秋粘虫、粒肤地老虎、日本甲虫、小玉米茎蛀虫、玉米象虫、普通梳爪叩头虫(melanotus communis)、种蝇、草地螟、高粱瘿蚊、高粱瘤蛾、南方玉米象虫、南方玉米根虫、南方玉米草螟、南方马铃薯铁线虫、六点黄蜘蛛、条螟、甘蔗甲虫,烟草金针虫、白蛴螬、棉子象鼻虫、螟蛉虫复合体、甘蓝尺蠖、牧草盲蝽、蓟马、二斑叶螨、黄纹粘虫、苜蓿象鼻虫、三叶草叶象甲、三叶草根象鼻虫、秋粘虫、蝗虫、牧场沫蝉、豌豆蚜、马铃薯叶蝉、草地螟、杂色夜蛾、小玉米茎蛀虫、烟蓟马、铁线虫、黑角负泥虫、麦长蝽、麦长管蚜、麦二叉蚜、麦廮蝇、豆叶甲、甜菜夜蛾、斑蝥、葡萄肖叶甲、三叶草绿夜蛾、墨西哥豆甲虫、大豆尺蠖、大豆茎蛀虫、椿象、三角苜蓿跳虫、毛豆毛虫、蚜虫、甘蓝尺蠖、夜蛾、绿色六月甲虫、绿色桃蚜、天蛾幼虫、马铃薯块茎蛾、南方蝼蛄、suckfly、烟草跳甲、蔬菜象鼻虫、或白缘象甲。可替代地,昆虫细胞可以是动物(例如人类)的有害生物/病原体的细胞。
例如,线虫细胞可以是来自以下任何属的线虫:根结线虫属(根结线虫)、短体线虫属(坏死线虫)、异皮线虫属(胞囊线虫)、胞囊线虫属(Globodera)(胞囊线虫)、茎线虫属(茎和球茎线虫)、小垫刃属(柑橘线虫)、剑线虫属(Xiphinema)(匕首线虫)、穿孔线虫属(Radopholus)(穿孔线虫)、肾状线虫属(Rotylenchulus)(肾形线虫)、螺旋线虫属(螺旋线虫)或刺线虫属(Belonolaimus)(刺线虫)。在某些实施例中,线虫可以任选地被表征为植物或动物(例如人类)的有害生物/病原体。在其他方面,线虫可以是雅致暗内孢(C.elegans)。
本文中的鱼细胞可以是以下各项中披露的那些,例如美国专利号7408095和7217564以及Tissue Culture of Fish Cell Lines(T.Ott,NWFHS LaboratoryProcedures Manual-Second Edition,Chapter 10,2004)[鱼细胞系的组织培养(T.Ott,NWFHS实验室程序手册-第二版,第10章,2004)],其通过引用结合在此。这些参考文献还披露了关于培养和/或操作鱼细胞的信息。鱼细胞的非限制性实例可以来自诸如斑马鱼、青鳉、巨斑马鱼(Giant rerio)或河豚鱼之类的硬骨鱼。
本文中的植物细胞可以是例如单子叶植物细胞或双子叶植物细胞。本文中的单子叶植物的实例包括玉米(玉蜀黍)、水稻(rice或Oryza sativa)、黑麦(rye或Secalecereale)、高粱(甜高粱(Sorghum bicolor)、高粱(Sorghum vulgare))、小米(例如,珍珠小米、御谷(Pennisetum glaucum))、黍稷(粟米(Panicum miliaceum))、粟(谷子(Setariaitalica))、穇子(龙爪稷(Eleusine coracana))、小麦(wheat或Triticum aestivum)、甘蔗(甘蔗属(Saccharum spp.))、燕麦(燕麦属(Avena))、大麦(大麦属(Hordeum)),柳枝稷(switchgrass或Panicum virgatum)、菠萝(pineapple或Ananas comosus)、香蕉(香蕉属(Musa spp.))、棕榈、观赏植物和草坪草。本文中的双子叶植物的实例包括大豆(soybean或Glycine max)、卡诺拉(欧洲油菜和芸苔(B.campestris))、苜蓿(紫花苜蓿(Medicagosativa))、烟草(tobacco或Nicotiana tabacum)、拟南芥(Arabidopsis或A.thaliana)、向日葵(sunflower或Helianthus annuus)、棉花(木本棉(Gossypium arboreum))、花生(peanut或Arachis hypogaea)、番茄(tomato或Solanum lycopersicum)和马铃薯(potato或Solanum tuberosum))。植物细胞可以来自植物的任何部分和/或来自植物发育的任何阶段。
本文中的植物细胞可以使用常规条件生长或再生成植物,参见例如,McCormick等人,(1986)Plant Cell Rep[植物细胞报告]5:81-4。然后可以使再生植物生长,并用相同的菌株或不同的菌株进行授粉,并且产生具有所希望的特征(例如,改变)和/或包含所鉴定的引入的多核苷酸或多肽的子代。可以生长两个或更多个世代,以确保改变的稳定维持和遗传,并收获种子。
在某些实施例中,哺乳动物细胞可以是人类、非人灵长类(例如猴、猿)、啮齿动物(例如小鼠、大鼠、仓鼠、豚鼠)、兔、狗、猫、牛、猪、马、山羊或绵羊细胞。本文中的哺乳动物细胞的其他实例包括原发性上皮细胞(例如角质细胞、宫颈上皮细胞、支气管上皮细胞、气管上皮细胞、肾上皮细胞、视网膜上皮细胞);已建立的细胞系(例如,293胚肾细胞、HeLa宫颈上皮细胞、PER-C6视网膜细胞、MDBK、CRFK、MDCK、CHO、BeWo、张氏(Chang)细胞、Detroit562、Hep-2、KB、LS 180、LS 174T、NCI-H-548、RPMI 2650、SW-13、T24、WI-28VA13、2RA、WISH、BS-C-I、LLC-MK2、克隆M-3、RAG、TCMK-1、LLC-PK1、PK-15、GH1、GH3、L2、LLC-RC 256、MH1C1、XC、MDOK、VSW、TH-I、B1细胞);来自任何组织或器官(例如皮肤、心脏、肝脏、肾脏、结肠、小肠、食管、胃、神经组织例如脑或脊髓;肺;血管组织;淋巴组织例如淋巴腺、腺样体、扁桃体、骨髓或血液;脾)中的任何上皮、间叶细胞(例如纤维原细胞)、神经或肌肉细胞;以及纤维原细胞或纤维原细胞样细胞系(例如TRG-2、IMR-33、Don细胞、GHK-21、瓜氨酸血症细胞、Dempsey细胞、Detroit 551、Detroit 510、Detroit 525、Detroit 529、Detroit 532、Detroit 539、Detroit 548、Detroit 573、HEL 299、IMR-90、MRC-5、WI-38、WI-26、MiCl1、CV-1、COS-1、COS-3、COS-7、Vero、DBS-FrhL-2、BALB/3T3、F9、SV-T2、M-MSV-BALB/3T3、K-BALB、BLO-11、NOR-10、C3H/IOTI/2、HSDM1C3、KLN205、McCov细胞、小鼠L细胞、SCC-PSA1、Swiss/3T3细胞、印度麂细胞、SIRC、Jensen细胞)。培养和操作哺乳动物细胞系的方法是本领域已知的。
在某些实施例中,微生物细胞可以是动物或植物的任何病原体和/或有害生物的细胞。这样的病原体/有害生物的实例包括各种类型的细菌、真菌、酵母、原生生物、线虫和昆虫。本领域技术人员将认识到上文披露的病原体/有害生物的实例。
如本文所述(参见实例10),细胞穿透肽能够将货物递送到不同的真核生物物种中,包括辣椒疫霉菌(Phytophthora capsici)、小麦壳针孢(Septoria tritici)和灰葡萄孢菌(Botrytis cinerea)。
在一个实施例中,本文所述方法是将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法,该微生物细胞选自下组,该组由以下各项组成:辣椒疫霉菌(Phytophthora capsici)、小麦壳针孢(Septoria tritici)和灰葡萄孢菌(Botrytiscinerea),所述方法包括:使微生物细胞与包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,由此进入微生物细胞。
在本文的某些实施例中的组合物可以包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该蛋白组分和CPP在多核苷酸/内切核酸酶蛋白-CPP复合物中彼此共价或非共价地连接,并且其中该多核苷酸/内切核酸酶蛋白-CPP复合物可以穿过细胞(例如微生物细胞)的(i)细胞膜或(ii)细胞壁和细胞膜。引导多核苷酸和Cas内切核酸酶能够形成称为“引导多核苷酸/Cas内切核酸酶复合物”的复合物,其使得Cas内切核酸酶能够在DNA靶位点处引入双链断裂。
所披露的发明还涉及将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到细胞(例如微生物细胞)中的方法。该方法包括使细胞与包含RGEN蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,其中该RGEN蛋白组分和CPP在RGEN蛋白-CPP复合物彼此中共价或非共价地连接。作为该接触步骤的结果,RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,从而进入细胞中。在RGEN蛋白组分与RNA组分缔合(从而形成RGEN)的某些实施例中,所披露的方法涉及将RGEN-CPP复合物递送到细胞中。另外,由于在某些实施例中RGEN可以用于RGEN介导的DNA靶向,所以该方法可以任选地被表征为靶向细胞中的DNA的方法。
可以使用关于每种方法特征(例如,细胞类型、RGEN蛋白组分、CPP、细胞器靶向序列等)的任何上述披露的实施例或下文实例来实施该方法。因此,可以适当地使用在上文或实例中披露的任何特征或这些特征的任意组合来表征本文的递送方法的实施例。以下递送方法特征是实例。
本文中的递送方法的实施例包括使细胞(例如微生物细胞)与包含RGEN蛋白-CPP复合物的组合物接触。据信这样的接触导致复合物与细胞的外表面(例如,细胞膜、细胞壁)的相互作用,从而允许复合物的CPP组分开始穿过(i)细胞膜或(ii)细胞壁和细胞膜。
将包含RGEN蛋白-CPP复合物的组合物与细胞(例如微生物细胞)接触可以在允许复合物进入细胞的温度下进行。这样的接触可以在例如约4℃和45℃之间的任何温度下进行。在非限制性实施例中,接触温度可以为约4℃、15℃、20℃、30℃、37℃或42℃。可以在接触步骤期间维持相同的温度或温度范围,或适当地修改(例如,两个或更多个不同的温度)。
可以将包含RGEN蛋白-CPP复合物的组合物与细胞的接触进行足以允许复合物进入细胞的时间量。例如,细胞可以与RGEN蛋白-CPP复合物一起孵育至少约15、30、45、60、75、90、105、120、135、150、165、180、240、300、360、420、480、540、600、660或720分钟。
进行接触的环境(例如,缓冲液、水和盐浓度、pH、RGEN蛋白-CPP复合物的纯度)可以是以上关于包含RGEN蛋白-CPP复合物的组合物所披露的的那些条件中的任一种。例如,可以将细胞与在HEPES缓冲液(例如,约25mM HEPES,例如25mM HEPES/KOH pH 7.5、200mMKCl、20%甘油、1mM DTT)或PBS(例如,1X PBS,pH 7)中的复合物一起孵育。
可以将一种或多种细胞(例如微生物细胞)与包含RGEN蛋白-CPP复合物的组合物接触。本文中的细胞可以可以如它(i)在生物体/体内组织中,(ii)在离体的组织或细胞组内,或(iii)处于体外状态(例如,培养细胞)中存在的。
RGEN蛋白-CPP复合物进入本文中的细胞通常是指当复合物已经完全穿过(i)细胞膜或(ii)细胞壁和细胞膜,并且包含在至少细胞质中时。虽然不意图被任何特定的理论或机制束缚,但是据信在RGEN蛋白-CPP复合物实现细胞进入后,通过非共价连接结合在一起的RGEN蛋白-CPP复合物保留在完全或部分复合物中,或者RGEN蛋白组分与复合物的一个或多个CPP组分分离。在任一情况下,RGEN蛋白组分能够与本文中合适的RNA组分缔合;这样的缔合可以发生在例如细胞质、细胞核或线粒体中。该能力同样适用于通过共价连接结合在一起的RGEN蛋白-CPP复合物。
在RGEN蛋白递送方法的某些实施例中,本文中的组合物进一步包含与RGEN蛋白-CPP复合物的RGEN蛋白组分缔合的至少一种RNA组分(即组合物包含RGEN-CPP复合物)。本实施例中的RNA组分可以如本文所披露的,包含与微生物细胞中染色体或附加体上的靶位点序列互补的序列。RGEN可以结合靶位点序列,并且任选地在靶位点序列处切割一条或两条DNA链。这样的实施例也可以被表征为将RGEN-CPP复合物递送到微生物细胞中的方法,或可替代地被表征为将RNA递送到微生物细胞中的方法。
可以使用本领域已知的任何数量的手段制备用于该实施例的RNA组分(例如,gRNA)。例如,可以使用体外转录过程来制备本文中的RNA组分。在某些非限制性实施例中,细菌RNA聚合酶(例如,T7、T3、SP6)可以用于从编码RNA组分的合适的DNA构建体转录RNA组分。必要时,RNA组分可以被加工至相对于其他生物分子(例如蛋白质、糖类、脂质)的至少约70%、80%、90%或95%的纯度。
为了制备包含RNA组分和RGEN蛋白-CPP复合物的组合物,可以将RNA组分溶解在其中已经溶解了RGEN蛋白-CPP复合物的组合物中,或反之亦然(或者这些组分可以同时溶解)。当将这些元素混合在一起时,可以使用例如,至少约0.5∶1、1.0∶1、1.5∶1、2.0∶1、2.5∶1、3.0∶1、3.5∶1或4.0∶1的RNA组分与RGEN蛋白-CPP复合物的摩尔比。在某些方面,RNA组分与RGEN蛋白-CPP复合物的摩尔比可以为约3.0∶1,或者可以在约2.5∶1至3.5∶1、2.75∶1至3.25∶1、或2.9∶1至3.1∶1的范围内。在这些和其他方面,与RNA组分混合的RGEN蛋白-CPP复合物的浓度可以为至少约0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0μM、或约0.5至5.0μM、0.5至2.5μM、1.0至5.0μM、1.0至2.5μM、或2.5至5.0μM。允许RNA与RGEN蛋白-CPP复合物缔合以形成RGEN-CPP复合物的时间量可以是例如至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、45或60分钟。RNA组分可以与RGEN蛋白-CPP复合物缔合的其他条件(例如,温度、缓冲液、水和盐浓度、pH、RGEN蛋白-CPP复合物的纯度)可以是上述关于(i)包含RGEN蛋白-CPP复合物的组合物,或(ii)将RGEN蛋白-CPP复合物与细胞接触所披露的那些条件中的任一种。例如,可以将RNA组分(例如gRNA)与在HEPES缓冲液(例如约25mMHEPES,例如25mM HEPES/KOH pH 7.5、200mM KCl、20%甘油、1mM DTT)或PBS(例如,1X PBS,pH 7)中的RGEN蛋白-CPP复合物在室温(例如约20℃-25℃)下接触约15分钟。在通过非共价连接结合在一起的RGEN蛋白-CPP复合物的那些实施例中,RNA组分与RGEN蛋白的缔合可以包括在将CPP与RGEN蛋白组分孵育之前、同时或之后添加RNA组分。
例如,在将RNA组分与RGEN蛋白-CPP复合物缔合后,可以将包含RGEN-CPP复合物(例如CPP-Cas9/gRNA)的所得组合物与细胞立即接触。例如,可以在RNA组分和RGEN蛋白-CPP复合物缔合的环境中进行接触(例如,参见上文)。必要时,包含RGEN-CPP复合物的组合物可以在约室温、4℃或冷冻(例如-20℃或-80℃)下储存以备后用。即使该复合物是处于已经通过一次、二次或更多次冻融循环的组合物中,RGEN-CPP复合物的稳定性和/或进入细胞并影响DNA靶向的能力可以保持不变,或可以分别具有至少约50%、60%、70%、80%、90%或95%的活性。
用于与细胞接触的、包含RGEN蛋白-CPP复合物或RGEN-CPP复合物的组合物可以任选地包含一种或多种体积排阻剂,其被考虑为增强在细胞和复合物之间的接触点。本文中的合适的体积排阻剂的实例包括甘油和聚乙二醇(PEG)。其他实例包括阴离子聚合物例如聚丙烯酸酯、聚甲基丙烯酸酯或阴离子多糖聚合物(例如硫酸葡聚糖)。体积排阻剂的又其他实例披露在美国专利4886741中,其通过引用结合在此。
在RGEN蛋白递送方法的某些实施例中,在RGEN蛋白-CPP复合物进入细胞后(即,从而在细胞中形成RGEN-CPP复合物),细胞(例如微生物细胞)包含与RGEN蛋白-CPP复合物的RGEN蛋白组分缔合的RNA组分。本实施例中的RNA组分可以如本文所披露的,包含与细胞中染色体或附加体上的靶位点序列互补的序列。RGEN可以结合靶位点序列,并且任选地在靶位点序列处切割一条或两条DNA链。
本文中的一种或多种RNA组分可以稳定或瞬时表达于例如引入RGEN蛋白-CPP复合物的细胞(例如微生物细胞)中。作为瞬时表达的实例,RGEN蛋白-CPP复合物可以(i)递送到先前已经被修饰以瞬时表达RNA组分的细胞中,(ii)与RNA组分一起共递送到细胞中,或(iii)递送到随后细胞被修饰用于瞬时RNA组分表达的细胞中。
包含(i)启动子和(ii)编码RNA组分的核苷酸序列((i)可操作地连接到(ii))的DNA多核苷酸序列通常可以用于本文中稳定和/或瞬时的RNA组分表达。这样的多核苷酸序列可以包含在例如质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒或线性DNA(例如,线性PCR产物)中,或包含在任何其他类型的用于将多核苷酸序列转移到细胞中的载体或构建体中。该多核苷酸序列能够在细胞中瞬时存在(即未整合到基因组中)或稳定存在(即整合到基因组中)。而且,该多核苷酸序列可以包含或缺少一个或多个合适的标记序列(例如选择或表型标记)。
包含在用于在表达本文中的RNA组分的多核苷酸序列中的合适的启动子可以是例如组成型的或可诱导的。在某些方面,启动子可以包含一个强启动子,该强启动子是每单位时间内可以指导相对大量的生产性启动的启动子,和/或是在包含该强启动子的细胞中驱动比基因的平均转录水平更高的转录水平的启动子。
用于本文的某些方面(例如真菌和/或酵母细胞)中的强启动子的实例包括在以下各项中披露的那些:美国专利申请公开号2012/0252079(DGAT2)、2012/0252093(EL1)、2013/0089910(ALK2)、2013/0089911(SPS19)、2006/0019297(GPD和GPM)、201I/0059496(GPD和GPM)、2005/0130280(FBA、FBAIN、FBAINm)、2006/0057690(GPAT)和2010/0068789(YAT1),其通过引用结合在此。强启动子的其他实例包括在表2中所列出的那些,其也可以用于例如真菌和/或酵母细胞中。
表2.强启动子
a该表中的每个参考文献通过引用结合在此。
用于本文的某些实施例的强启动子的其他实例包括PGK1、ADH1、TDH3、TEF1、PHO5、LEU2和GAL1启动子,以及在Velculescu等人(Cell[细胞]88:243-251,其通过引用结合在此)中披露的强酵母启动子。
用于本文中RNA组分的稳定和/或瞬时表达的启动子可以是例如RNA聚合酶II(PolII)启动子。据信所有上述强启动子都是合适的Pol II启动子的实例。例如,来自Pol II启动子的转录可以涉及形成至少约12种蛋白质(例如,RPB1-RPN12蛋白质)的RNA聚合酶II复合物。从本文的Pol II启动子转录的RNA通常为5′-带帽的(例如,在5′-末端含有m7G基团)和/或具有聚腺苷酸(polyA)尾。必要时,当从Pol II启动子表达RNA组分时,可以使用从RNA组分去除5′-帽和/或polyA尾的手段。用于有效地从本文的Pol II转录的RNA组分中去除5′-帽和/或polyA尾的合适的手段包括,例如,适当使用一种或多种核酶(参见下文)、第1组自剪接内含子和第2组自剪接内含子。
可替代地,用于本文中RNA组分的稳定和/或瞬时表达的启动子可以是例如RNA聚合酶III(Pol III)启动子。这样的启动子通常允许用限定的5′-和3′-末端表达RNA组分,因为可以控制用RNA聚合酶III进行的转录的起始和终止。用于本文的Pol III启动子的实例包括U6和H1启动子。其他合适的Pol III启动子披露在例如美国专利申请公开号2010/0160416中,其通过引用结合在此。
可以使用一个或多个核酶序列来产生定义的5′和/或3′转录物末端,例如在PolII启动子用于在细胞中表达RNA组分的那些实施例中。例如,本文中编码RNA组分的核苷酸序列可以进一步编码在编码RNA组分的序列上游的核酶。因此,在某些实施例中,细胞进一步包含DNA多核苷酸序列,该多核苷酸序列包含(i)一个启动子,(ii)在5′-至-3′方向编码核酶和RNA组分的核苷酸序列,其中(i)可操作地连接于(ii)。从这样的多核苷酸序列表达的转录物自动催化除去核酶序列以产生具有定义的5′-末端(不含5′-帽)但含有RNA组分序列的RNA。这种“自动加工的”RNA可以包含例如crRNA或gRNA,并且可以与RGEN蛋白组分例如Cas9复合,从而形成RGEN。
本文中的核酶可以是例如锤头状(HH)核酶、丁型肝炎病毒(HDV)核酶、第I组内含子核酶、RnaseP核酶或发夹核酶。本文中的核酶的其他非限制性实例包括Varkud卫星(VS)核酶、葡萄糖胺-6-磷酸激活的核酶(glmS)和CPEB3核酶。Lilley(Biochem.Soc.Trans.[生化学会学报]39:641-646)披露了有关核酶结构和活性的信息。应当适用于本文的核酶的实例包括在EP 0707638和美国专利号6063566、5580967、5616459、和5688670(其通过引用结合在此)中披露的核酶。关于使用核酶表达具有定义的5′和/或3′末端的RNA组分的进一步信息披露于美国专利申请号62/036,652(2014年8月13日提交)中。
在某些实施例中,包含用于表达RNA组分的盒的DNA多核苷酸包含RNA组分序列下游的合适的转录终止序列。用于本文的转录终止序列的实例披露于美国专利申请公开号2014/0186906中,其通过引用结合在此。这样的实施例通常包括在RNA组分序列末端后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基,取决于终止子序列的选择。取决于终止子序列的选择,这些另外的残基可以是所有U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的U残基。可替代地,核酶序列(例如锤头状或HDV核酶)可以是例如RNA组分序列的3′(例如下游的1、2、3、4、5、6、7、8、9、10或更多个核苷酸)。可以相应地定位3′核酶序列,这样使得其从RNA组分序列中切割其自身;这样的切割将使转录物完全结束于RNA组分序列的末端,或者在RNA组分序列的末端后具有例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个残基。
在其他实例中,RNA组分可以提供在递送RGEN蛋白-CPP复合物的细胞的细胞核和/或细胞质中。例如,可以预期不使用位于5’处的核酶序列的、由Pol II启动子表达的RNA组分存在于细胞核和细胞质两者中。在其他实施例中,可以预期从任何类型的启动子(例如Pol II或III启动子)并使用位于5’处的核酶序列表达的RNA组分主要存在于细胞核中。在某些方面,可以预期由Pol III启动子表达的RNA组分主要存在于细胞核中。在某些方面,RNA组分未带帽(例如,通过由Pol III启动子表达,和/或通过核酶自动加工),并且通常位于细胞核中,而在其他方面是带帽的并且位于细胞核和细胞质位置。通常,一旦递送到细胞中,RGEN蛋白-CPP复合物的RGEN蛋白组分可以与在细胞质和/或细胞核(取决于RNA组分位置)中的RNA组分缔合(从而形成RGEN)。在细胞核中的这样的缔合通常是由于本文中的RGEN蛋白组分按照NLS的指导定位于细胞核的能力。
本文中的RGEN可用于RGEN介导的DNA靶向。任何上述关于将RGEN蛋白组分递送到细胞中的实施例可以应用于DNA靶向方法中。例如,RGEN蛋白-CPP复合物可以与在微生物细胞外的至少一种RNA组分接触,以形成用于递送至细胞中以便在其中进行DNA靶向的RGEN-CPP复合物。作为另一个实例,RGEN蛋白-CPP复合物在其递送到微生物细胞后可以与微生物细胞内的至少一种RNA组分接触以在其中形成RGEN-CPP复合物,该复合物然后可以介导DNA靶向。关于靶向方法的以下披露内容涉及“RGEN”,而不是指“RGEN-CPP复合物”。应当理解的是,取决于在本文中的RGEN递送方法中是否使用共价或非共价RGEN-CPP复合物(并且取决于在使用非共价RGEN-CPP复合物的实施例中非共价连接的强度如何),下文对RGEN的提及相应地是指这样的RGEN-CPP复合物。
可以切割DNA靶序列的一条或两条DNA链的本文中的RGEN可以用于例如DNA靶向方法。如果在该方法中提供合适的供体DNA,则这样的DNA靶向方法可以涉及HR-介导的DNA靶向。因此,在某些实施例中,在本文的靶向方法中的微生物细胞可以包含供体多核苷酸,该多核苷酸包含与靶位点序列(由本文中的RGEN特异性靶向的序列)处或其附近的序列同源的至少一个序列。这样的实施例可以任选地被表征为该靶向方法进一步包括向微生物细胞提供合适的供体多核苷酸的步骤。
如果靶位点含有SSB或DSB(例如可以使用本文中的RGEN引入),则本文中的供体多核苷酸可以用在DNA靶位点处或其附近的序列进行HR。在本文的供体多核苷酸内的“同源序列”可以例如包含至少约25、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸、或约50-500、50-550、50-600、50-650个核苷酸或由其组成,其与在靶位点序列或其附近的序列具有100%同一性,或与在靶位点序列或其附近的序列具有例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
本文中的供体多核苷酸可以具有两个同源序列(同源臂),例如这两个同源序列被与在靶位点序列处或其附近的序列异源的序列分开。在供体多核苷酸和靶位点序列之间的HR通常导致在靶位点处的序列被供体多核苷酸的异源序列替代(即,位于与供体多核苷酸的同源臂同源的靶位点序列之间的靶位点序列被供体多核苷酸的异源序列替代)。在具有两个同源臂的供体多核苷酸中,臂可以分开例如至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸(即,在供体多核苷酸中的异源序列可以是至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸长度)。每个同源臂的长度(例如,上文针对同源序列披露的任何长度)可以相同或不同。在靶位点处或其附近具有相应同源序列的每个臂的百分比同一性(例如,上文针对同源序列披露的任何%同一性)可以相同或不同。
与供体多核苷酸中的相应同源序列同源的靶位点序列处或其附近(可替代地,处于其所在位置处或其近端)的DNA序列可以离在靶序列中预测的RGEN切割位点(DSB或切口)例如约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、450、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000或60000(或在1和60000之间的任何整数)个核苷酸(例如,约1-1000、100-1000、500-1000、1-500或100-500个核苷酸)以内。这些核苷酸距离可以以切割位点向上游或下游方向,从切割位点标记到同源序列的第一个核苷酸。例如,与供体多核苷酸中的相应序列同源的靶序列附近的序列可以从靶序列中预测的RGEN切割位点下游的500个核苷酸碱基对开始。在使用具有两个同源臂(例如,通过异源序列分离的第一和第二同源臂)的供体多核苷酸的本文的实施例中,例如,同源序列(对应于与供体的第一同源臂同源)可以在预测的RGEN切割位点的上游,并且同源序列(对应于与供体的第二同源臂同源)可以在预测的RGEN切割位点的下游。这些上游和下游同源序列中的每一个距预测的切割位点的核苷酸距离可以相同或不同,并且可以是例如以上披露的任何核苷酸距离。例如,同源序列(对应于与供体的第一同源臂同源)的3’末端可以位于预测的RGEN切割位点上游600个核苷酸碱基对处,并且同源序列(对应于与供体的第二同源臂同源)的5′末端可以位于预测的RGEN切割位点下游400个核苷酸碱基对处。
在不同方面,可以在当将RGEN蛋白-CPP复合物递送到细胞中时的时间或其附近(例如,在1、2、3或更多个小时内)将供体多核苷酸递送到细胞(例如微生物细胞)中。这样的递送可以经由本领域已知的适合于正在使用的特定类型的细胞的任何手段进行。这些技术包括例如转化(例如,乙酸锂转化[Methods in Enzymology[酶学方法],194:186-187])、转染、基因枪冲击、电穿孔和显微注射。例如,美国专利号4880741和5071764以及Chen等人(Appl.Microbiol.Biotechnol.[应用微生物与生物技术]48:232-235)(其通过引用结合在此)描述了解脂耶氏酵母的DNA转移技术。用于植物中的递送模式的实例包括土壤杆菌介导的转化和基因枪粒子轰击。
在本文的DNA靶向的其他非限制性实施例中,可以使用切割DNA靶序列的一条或两条DNA链的RGEN来产生插入缺失。可以如上文对HR介导的靶向所披露的那样进行在细胞中形成插入缺失的方法,但不再进一步提供可以在靶DNA位点处或其附近可能经历HR的供体DNA多核苷酸(即,在该方法中诱导NHEJ)。本文披露了可以产生插入缺失的实例。插入缺失的大小可以是例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施例中,插入缺失可以甚至更大,例如至少约20、30、40、50、60、70、80、90、100、110、120、130、140或150个碱基。在又其他实施例中,插入或缺失可以是至少约500、750、1000或1500个碱基。当在某些实施例中尝试产生插入缺失时,相反可以在靶位点序列中形成单个碱基取代。因此,例如,出于产生单个碱基取代的目的,可以进行本文的靶向方法。
在本文针对插入缺失形成的靶向方法的某些实施例中,在非常规酵母(例如,解脂耶氏酵母)中的插入缺失形成的频率显著高于在常规酵母例如酿酒酵母中使用相同或相似的靶向策略所观察到的频率。例如,虽然在常规酵母中插入缺失形成的频率可以为约0.0001至0.001(DiCarlo等人,Nucleic Acids Res.[核酸研究]41:4336-4343),但是在本文的非常规酵母中的频率可以是至少约0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75或0.80。因此,在本文的非常规酵母中插入缺失形成的频率可以比在常规酵母中使用相同或相似的RGEN介导的靶向策略所观察到的高例如至少约50、100、250、500、750、1000、2000、4000或8000倍。
在某些实施例中,可以进行靶向方法以破坏编码蛋白质或非编码RNA的一种或多种DNA多核苷酸序列。可以靶向破坏的、这样的序列的实例是编码标记(即标记基因)的序列。本文中的标记的非限制性实例包括可筛选标记和可选择标记。本文中的可筛选标记可以是在适当的条件下使细胞视觉上不同的标记。可筛选标记的实例包括编码β-葡萄糖醛酸酶(GUS)、β-半乳糖苷酶(1acZ)和荧光蛋白(例如,GFP、RFP、YFP、BFP)的多核苷酸。本文中的可选择标记可以是使细胞对选择性试剂或选择性环境有抗性的标记。可选择标记的实例是营养缺陷型标记例如HIS3、LEU2、TRP1、MET15或URA3,其允许例如酵母细胞的细胞分别在不存在外源提供的组氨酸、亮氨酸、色氨酸、甲硫氨酸或尿嘧啶的情况下存活。可选择标记的其他实例是抗生素或抗真菌抗性标记,例如使细胞对氨苄青霉素、氯霉素、潮霉素B、诺尔丝菌素、腐草霉素、嘌呤霉素或新霉素(例如G418)有抗性的那些。这些方法的实例可以任选地被表征为标记再循环方法(marker recycling method)。
在某些实施例中,破坏标记的至少一个目的可以是用于标记再循环。标记回收是一个过程,例如,包括(i)用标记和异源DNA序列转化细胞,(ii)选择包含该标记和异源DNA序列的转化细胞(其中标记可选择的细胞通常具有较高的含有异源DNA序列的机会),(iii)破坏标记,然后根据需要重复步骤(i)-(iii)多次(使用相同的[或不同的]标记,但每个循环使用不同的异源DNA序列)以便用多个异源DNA序列转化细胞。在该过程中的一个或多个异源序列可以包含处于供体多核苷酸形式的标记本身(例如,侧翼同源臂用于靶向特定基因座的标记)。本文中的标记再循环过程的实例包括使用URA3作为标记的那些,例如在使用酵母(例如,非常规酵母例如解脂耶氏酵母)的某些方法中。
可以结合DNA靶位点序列但不切割靶位点序列上的任何链的本文中的RGEN可以用于其他实施例中的DNA靶向方法。本文披露的仅具有功能失调的核酸酶结构域但保留特异性DNA结合活性的RGEN可以用于这种类型的靶向方法中。
在使用不具有功能性核酸酶结构域的RGEN的DNA靶向的某些实施例中,RGEN可以结合靶位点并调节多核苷酸序列的转录(即基因转录)。通常,将RGEN靶向调节序列例如启动子(例如,在转录起始位点上游1-1000、1-500、1-250、1-125或1-50个碱基内)、编码5′-非翻译RNA序列的序列、或内含子(例如,第一内含子)以实现多核苷酸序列的转录调节。
作为非限制性实例,可以将与抑制子转录因子或其抑制子结构域连接或融合的RGEN用于抑制或沉默一个或多个多核苷酸序列的表达。在某些替代性实施例中,RGEN本身(不具有抑制子或其结构域)可以抑制基因表达;这样的RGEN可以被靶向,这样使得其抑制转录所必需的RNA转录机器的结合和/或移动。掺入任何抑制性RGEN的方法可以任选地被表征为基因沉默或转录沉默方法。与应用抑制性RGEN之前的转录水平相比,在沉默方法中转录下调的水平可以是例如约100%(基因完全沉默)、或至少约30%(基因中度沉默)、40%、50%、60%、70%、80%、90%或95%(基因实质上沉默)。
与激活子转录因子或其激活子结构域连接或融合的RGEN可以用于上调一个或多个多核苷酸序列的表达。掺入这样的激活性RGEN的方法可以任选地被表征为转录上调或激活方法。与应用激活性RGEN之前的转录水平相比,在这样的方法中转录上调水平可以是例如至少约25%、50%、75%、100%、250%、500%或1000%。
在某些实施例中,可以结合DNA靶位点序列、但优选不切割靶位点序列的任何链的RGEN可以被用作诊断工具(例如用于检测DNA序列的探针)。在DNA探针中的RGEN蛋白组分可以与报道剂例如报道蛋白(例如荧光蛋白例如GFP)连接。可以利用报道剂的活性将RGEN-报道蛋白的特异性DNA结合(如通过RGEN的RNA组分所说明的)掺入相应的检测系统中。流式细胞术(例如,流式激活的细胞分选[FACS])和荧光原位杂交(FISH))是本文使用荧光报道子的合适的检测系统的实例。
本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶位点的这样的方式进行。这样的方法可以任选地被表征为多重方法。在某些实施例中可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶位点。多重方法通常通过本文的靶向方法进行,其中提供了多个不同的RNA组分,每一个被设计成将RGEN引导到唯一的DNA靶位点。例如,可以使用两种或更多种不同的RNA组分在体外制备RGEN-CPP复合物的混合物(例如,按照本文披露的用于将RNA组分与RGEN蛋白-CPP复合物缔合的程序),然后将该混合物与细胞接触。
本文中的多重靶向的另一方面可以包括在细胞中提供两种或更多种不同的RNA组分,该RNA组分与已经穿越到细胞中的RGEN蛋白-CPP复合物的RGEN蛋白组分缔合。这样的方法可以包括例如向细胞提供(i)各自的DNA多核苷酸,其每一个表达特定的RNA组分,和/或(ii)编码两种或更多种RNA组分的至少一个DNA多核苷酸(例如,参见下面关于串联核酶-RNA组分盒的披露内容)。
多重方法可以任选地靶向非常接近相同序列的DNA位点(例如,启动子或开放阅读框),和/或彼此远离的位点(例如,在不同的基因和/或染色体中)。在其他实施例中,取决于所希望的靶向结果(是否使用内切核酸酶或切口酶组分的RGEN),可以使用(对于HR)或不使用(对于导致插入缺失和/或碱基取代的NHEJ)合适的供体DNA多核苷酸进行多重方法。在又其他实施例中,可以使用如本文所披露的抑制性或激活性RGEN进行多重方法。例如,可以提供多种抑制性RGEN,其下调一组基因,例如涉及特定代谢途径的基因。
在某些实施例中,多重方法可以包括向细胞提供DNA多核苷酸,该DNA多核苷酸包含(i)启动子,(ii)包含多于一个核酶-RNA组分盒(即串联盒)的序列,其中(i)可操作地连接至(ii)。从这样的DNA多核苷酸表达的转录物可以具有例如2、3、4、5、6、7、8、9、10或更多个盒。可以任选地在所有或一些RNA组分序列之后包括3′核酶序列,以允许RNA组分从下游转录物序列的切割和分离(即,串联盒可以包含一个或多个核酶-RNA组分-核酶盒)。本文中用于表达串联核酶-RNA组分-核酶盒的DNA多核苷酸可以被设计成使得在每个盒之间存在约10、20、30、40、50、60、70、80、90、100或更多个核苷酸(例如,非编码间隔序列)。在每个盒之间的距离可以相同或不同。
包含编码本文所述的RNA组分的DNA多核苷酸的任何构建体或载体可以通过本领域已知的适用于正在使用的特定类型的细胞的任何手段引入细胞。例如,可以使用上文所披露的将供体DNA递送到细胞中的任何手段。
本文中的某些实施例涉及修饰或改变微生物细胞基因组中的靶位点的方法,其中该方法包括使该微生物细胞与引导多核苷酸和共价或非共价连接到CPP的Cas内切核酸酶接触,其中该引导多核苷酸和CPP-Cas内切核酸酶能够形成复合物,该复合物使得Cas内切核酸酶能够在微生物细胞基因组中的靶位点处引入双链断裂。靶位点的修饰或改变可以包括(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任意组合。
本文中的某些实施例涉及包含编码融合蛋白的核苷酸序列的多核苷酸序列,该融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)。例如,如本文所披露的任何融合蛋白可以由核苷酸序列编码。核苷酸序列可以任选地与启动子序列可操作地连接。某些实施例包括例如一种多核苷酸(例如,载体或构建体),该多核苷酸包含编码本文所披露的任何RGEN蛋白-CPP融合物的至少一个开放阅读框。这样的编码区可以任选地可操作地连接到适合于在例如细胞(例如,细菌细胞;真核细胞例如酵母、昆虫或哺乳动物细胞)中或在体外蛋白表达系统中表达RGEN蛋白-CPP融合物的启动子序列上。载体或构建体的实例包括环状(例如质粒)和非环状(例如线性DNA,例如扩增的DNA序列)多核苷酸分子。
本文中的某些实施例涉及产生RGEN蛋白-CPP融合蛋白的方法,该方法包括以下步骤:提供具有编码RGEN蛋白-CPP融合蛋白的核苷酸序列的多核苷酸序列,并且从该多核苷酸序列表达RGEN蛋白-CPP融合蛋白,从而产生RGEN蛋白-CPP融合蛋白。在这样的方法中的表达步骤可以任选地在细胞(例如细菌细胞例如大肠杆菌;真核细胞例如酵母[例如酿酒酵母]、昆虫或哺乳动物细胞)中进行。可替代地,可以在体外蛋白质表达系统(例如,无细胞的蛋白质表达系统,例如使用兔网织红细胞裂解物或小麦胚芽提取物的那些)中进行RGEN蛋白-CPP融合蛋白的表达。而且,可以任选地分离在表达步骤中产生的RGEN蛋白-CPP融合蛋白。例如,这样的分离能以产生具有任何上文所披露的特征(例如纯度、pH、缓冲液和/或盐水平))的组合物的方式进行。
本文披露的组合物和方法的非限制性实例包括:
1.一种组合物,该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,并且
其中该RGEN蛋白-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
2.如实施例1所述的组合物,其中该RGEN的蛋白组分与至少一种RNA组分缔合,该RNA组分包含与该细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
3.如实施例2所述的组合物,其中该RNA组分包含引导RNA(gRNA),该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。
4.如实施例2所述的组合物,其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。
5.如实施例1所述的组合物,其中该RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。
6.如实施例1所述的组合物,其中该RGEN蛋白组分和CPP共价地连接。
7.如实施例1所述的组合物,其中该RGEN蛋白组分和CPP非共价地连接。
8.如实施例1所述的组合物,其中该CPP是阳离子性或两亲性的。
9.如实施例1所述的组合物,其中该CPP包含:
(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,
(ii)具有6个或更多个连续精氨酸残基的CPP,
(iii)转运蛋白-10(TP10)CPP,或
(iv)来自血管内皮钙粘素蛋白的CPP。
10.如实施例1所述的组合物,其中该RGEN蛋白-CPP复合物可以穿过细胞的细胞壁和细胞膜。
11.一种细胞,包含根据实施例1所述的组合物。
12.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到细胞中的方法,该方法包括:
使该细胞与包含该RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,
其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,
其中该RGEN蛋白-CPP复合物穿过该细胞的(i)细胞膜或(ii)细胞壁和细胞膜,从而进入该细胞。
13.如实施例12所述的方法,其中:
(i)该组合物进一步包含与该RGEN的蛋白组分缔合的至少一种RNA组分;或
(ii)该细胞包含该RNA组分,其中在该RGEN蛋白-CPP复合物进入该细胞之后,该RNA组分与该RGEN的蛋白组分缔合;
其中该RNA组分包含与在该细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
14.如实施例13所述的方法,其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。
15.如实施例14所述的方法,其中该细胞进一步包含供体多核苷酸,该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列。
16.如实施例12所述的方法,其中该细胞是非哺乳动物细胞。
17.一种组合物,该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,其中该细胞任选地是植物细胞。
18.如实施例17所述的组合物,其中该Cas内切核酸酶是植物优化的Cas9内切核酸酶。
19.如实施例17所述的组合物,其中该引导多核苷酸包含
(i)与在靶DNA中的核苷酸序列互补的第一核苷酸序列结构域,以及
(ii)与Cas内切核酸酶相互作用的第二核苷酸序列结构域,
其中该第一核苷酸序列结构域和该第二核苷酸序列结构域由脱氧核糖核酸(DNA)、核糖核酸(RNA)或其组合构成。
20.如实施例17所述的组合物,其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过植物细胞的细胞壁。
21.如实施例17所述的组合物,其中该CPP包含:
(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,
(ii)具有6个或更多个连续精氨酸残基的CPP,
(iii)转运蛋白-10(TP10)CPP,
(iv)来自血管内皮钙粘素蛋白的CPP,或
(vi)选自下组的CPP,该组由以下各项组成:合成的九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP。
22.如实施例20所述的组合物,其中该植物细胞是单子叶植物细胞或双子叶植物细胞。
23.如实施例22所述的组合物,其中该单子叶植物选自下组,该组由以下各项组成:玉米、水稻、高粱、黑麦、大麦、小麦、小米、燕麦、甘蔗、草坪草和柳枝稷。
24.如实施例22所述的组合物,其中该双子叶植物选自下组,该组由以下各项组成:大豆、卡诺拉、苜蓿、向日葵、棉花、烟草、花生、马铃薯、烟草、拟南芥和红花。
25.一种用于在细胞的基因组中修饰靶位点的方法,该方法包括向该细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶,其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,其中该细胞任选地是植物细胞。
26.如实施例25所述的方法,进一步包括鉴定在该靶位点处具有修饰的至少一种植物细胞,其中在该靶位点处的该修饰选自下组,该组由以下各项组成:(i)至少一个核苷酸的替代,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,和(iv)(i)-(iii)的任意组合。
27.如实施例25所述的方法,其中该植物细胞是单子叶植物细胞或双子叶植物细胞。
28.一种组合物,该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,并且
其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
29.如实施例28所述的组合物,其中该RGEN的蛋白组分与至少一种RNA组分缔合,该RNA组分包含与该微生物细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
30.如实施例28所述的组合物,其中该RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。
31.一种微生物细胞,包含根据实施例28所述的组合物。
32.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法,该方法包括:
使该微生物细胞与包含该RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,
其中该蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,
其中该RGEN蛋白-CPP复合物穿过该微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜,从而进入该微生物细胞。
33.如实施例32所述的方法,其中:
(i)该组合物进一步包含与该RGEN的蛋白组分缔合的至少一种RNA组分;或
(ii)该微生物细胞包含该RNA组分,其中在该RGEN蛋白-CPP复合物进入该微生物细胞之后,该RNA组分与该RGEN的蛋白组分缔合;
其中该RNA组分包含与在该微生物细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
34.如实施例33所述的方法,其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。
34.如实施例34所述的方法,其中该微生物细胞进一步包含供体多核苷酸,该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列。
36.如实施例32所述的方法,其中该微生物细胞是酵母细胞。
37.一种组合物,该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中该蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
38.如实施例37所述的组合物,其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过该微生物细胞的细胞壁。
39.一种用于修饰微生物细胞的基因组中的靶位点的方法,该方法包括向该微生物细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶,其中该引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中该引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
23.如实施例39所述的方法,进一步包括鉴定在该靶位点处具有修饰的至少一种微生物细胞,其中在该靶位点处的该修饰选自下组,该组由以下各项组成:(i)至少一个核苷酸的替代,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,和(iv)(i)-(iii)的任意组合。
实例
将在以下的实例中进一步定义所披露的发明。应该理解,这些实例尽管说明了本发明的某些优选方面,但仅是以例证的方式给出的。通过上述论述和这些实施例,本领域的技术人员可确定本发明的必要特征,并且在不脱离本发明的精神和范围内的前提下,可对本发明进行各种变化和修改以使其适应多种用途和条件。
实例1
用于在大肠杆菌中表达Cas9-CPP(细胞穿透肽)融合蛋白的载体
在本实例中,产生被设计用于包含Cas9蛋白和细胞穿透肽(CPP)的翻译融合蛋白的可诱导表达的载体,并测试其在大肠杆菌中的表达。显示Cas9-CPP融合蛋白如预期在大肠杆菌中表达,并且随后被纯化。
来自化脓性链球菌M1 GAS(SF370)的Cas9基因的开放阅读框经密码子优化用于在耶氏酵母中按标准技术进行表达,产生SEQ ID NO:1。编码猿病毒40(SV40)单份的细胞核定位信号(NLS)加上短连接体(4个氨基酸)的DNA序列被掺入到SEQ ID NO:1的最后一个有义密码子之后以产生SEQ ID NO:2。SEQ ID NO:2编码在SEQ ID NO:3中所示的氨基酸序列。SEQ ID NO:3的最后7个氨基酸编码所添加的NLS,而SEQ ID NO:3的位置1369-1372处的残基编码所添加的连接体。通过标准分子生物学技术将耶氏酵母属密码子优化的Cas9-NLS序列(SEQ ID NO:2)与耶氏酵母属组成型启动子FBA1(SEQ ID NO:4)连接。包含组成型FBA1启动子、耶氏酵母属密码子优化的Cas9、和SV40NLS的耶氏酵母属密码子优化的Cas9表达盒在SEQ ID NO:5阐述。将该Cas9表达盒(SEQ ID NO:5)克隆到质粒pZUF,产生构建体pZUFCas9(图1,SEQ ID NO:6)。
使用标准分子生物学技术从pZUFCas9(SEQ ID NO:6)PCR扩增耶氏酵母属密码子优化的Cas9-NLS序列。用于PCR反应的引物是SEQ ID NO:7(正向)和SEQ ID NO:8(反向),其分别向扩增的DNA产物添加5’EcoRI位点和3’HindIII位点。在扩增产物中添加的5’EcoRI位点替代了Cas9-NLS开放阅读框(ORF)的ATG起始密码子。扩增产物(SEQ ID NO:9)用EcoRI和HindIII进行消化,然后使用ZymocleanTM和浓缩柱(Zymo研究公司,加利福尼亚州欧文市(Irvine,CA))进行纯化。将纯化的DNA片段克隆到来自生命科技公司(Life Technologies)(加利福尼亚州卡尔斯巴德)的质粒pBAD/HisB的EcoRI和HindIII位点(图2A,SEQ ID NO:10)中,以产生质粒构建体pRF48(图2B,SEQ ID NO:11)。质粒pRF48能够在大肠杆菌中表达在其N-末端包含六组氨酸(6xHis)标签的Cas9-NLS。
为了将细胞穿透肽(CPP)序列融合到Cas9-NLS,制备了各自的DNA多核苷酸序列,每个密码子被优化以用于在大肠杆菌中表达并且包含编码与以下特定CPP氨基酸序列连接的6xHis标签的序列:Zebra肽(ECDSELEIKRYKRVRVASRKCRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMC,SEQ ID NO:12),来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白;pVEC肽(LLIILRRRIRKQAHAHSK,SEQ ID NO:13),来自鼠内皮钙粘素蛋白;TP10肽(AGYLLGKINLKACAACAKKIL,SEQ ID NO:14),来自神经肽甘丙肽蛋白;以及合成的富精氨酸“PolyR”肽(GGGGRRRRRRRRRLLLL,SEQ ID NO:15)。每个DNA多核苷酸序列包含5′-末端NcoI限制位点和3′-末端EcoRI位点,以产生如下结构的克隆序列:NcoI-6xHis-CPP-EcoRI(SEQID NO:16-19)。将SEQ ID NO:16-19中的每一个单独克隆到pRF48的NcoI和EcoRI位点,从而产生能够在大肠杆菌中表达某些6xHis-CPP-Cas9-NLS融合蛋白的质粒构建体。具体地,制备用于表达6xHis-Zebra CPP-Cas9-NLS融合物的质粒构建体pRF144(图3A,SEQ ID NO:20);制备用于表达6xHis-PolyR CPP-Cas9-NLS融合物的质粒构建体pRF145(图3B,SEQ IDNO:21);制备用于表达6xHis-TP10 CPP-Cas9-NLS融合物的质粒构建体pRF146(图3C,SEQID NO:22);并且制备用于表达6xHis-pVEC CPP-Cas9-NLS融合物的质粒构建体pRF162(图3D,SEQ ID NO:23)。
将质粒pRF48、pRF144、pRF145、pRF146和pRF162中的每一个单独转化到TOP10感受态细胞(生命科技公司)中。细胞在含有0.4%(w/v)葡萄糖和100μg/mL氨苄青霉素的L肉汤(米勒公司(Miller))中在37℃下振摇(220rpm)生长过夜。每个预培养物在含有100μg/mL氨苄青霉素的2X YT培养基中以1∶100稀释,并在37℃下伴随振摇(220rpm)进一步生长。当培养物达到约0.5的OD600时,通过添加L-阿拉伯糖至0.2%(w/v)的终浓度来诱导来自每个质粒的蛋白质表达。培养物在18℃下振摇(200rpm)培养另外的18小时。细胞在4℃以5000x g沉淀15分钟。处理培养基,并且将细胞沉淀物在-80℃下冷冻至少4小时。将细胞沉淀在冰上解冻15分钟,并且重悬于15mL的裂解缓冲液(20mM tris pH 7.5、500mM NaCl、1mM MgCl2、10mM咪唑、120单位/mL DNaseI、1mM PMSF、1mM DTT)每升原始培养物中。通过两次通过16000psi的大弗细胞压力池(French pressure cell)来裂解细胞。细胞碎片在4℃下以20000x g沉淀30分钟。将上清液转移到50-mL圆锥管中,向其中添加2ml的含有Ni-NTA树脂(凯杰公司(Qiagen))的50%浆液以结合每个表达的融合蛋白的6xHis标签。将每个管在4℃下缓慢旋转1小时,然后应用到允许上清液流过的空的重力柱。取流出的样品(75μL),添加到25μL的4x还原的Laemmeli缓冲液中,并储存在冰上。用5ml的洗涤缓冲液(20mM tris pH7.5、500mM NaCl、10mM咪唑、1mM PMSF、1mM DTT)在每个柱中洗涤树脂四次。从每次洗涤中取出样品(75μL),添加到25μL的4x还原的Laemmeli缓冲液中,并储存在冰上。将洗脱缓冲液(20mM Tris pH 7.5、500mM NaCl、1mM MgCl2、500mM咪唑、1mM PMSF、1mM DTT)的1-ml等分试样应用到每个柱中的树脂上,并允许其孵育10分钟。通过在280nm处的吸光度监测蛋白质洗脱。从每个洗脱液中取出样品(75μL),添加到25μL的4x还原的Laemmeli缓冲液中,并储存在冰上。对于每个质粒表达实验,将含有来自柱的洗脱蛋白质的级分合并,加载到10000MWCO透析膜中,并针对透析缓冲液(25mM HEPES/KOH pH 7.5、200mM KCl、20%甘油、1mM DTT)在4℃下透析至少14小时。使用Bradford测定法和在565nm处的吸光度测定每种透析液的蛋白质浓度。将纯化的蛋白质分成两个等分试样,其中一份在-80℃下冷冻并且另一份在4℃下储存在冰上。对于每个质粒表达实验将在柱纯化过程期间取出的样品在95℃下加热5分钟,并且加载到具有4%(w/v)堆积凝胶的8%(w/v)tris-甘氨酸聚丙烯酰胺分离胶上。将蛋白质在200伏特下电泳分离30分钟,并用考马斯蓝染色。用于6xHis-Zebra-Cas9-NLS纯化过程的凝胶作为实例示于图4中。
因此,表达和分离了四种不同的CPP-Cas9融合蛋白。这些融合蛋白代表本文中RGEN蛋白-CPP复合物的实例。
实例2
通过体外转录表达短引导RNA(sgRNA)
在本实例中,设计了编码sgRNA的DNA序列,该sgRNA分别在核酶的5′-和3′-末端与其融合(称为“RGR”)。RGR序列允许具有精确定义的末端的sgRNA通过T7 RNA聚合酶进行体外转录。
图5示出了sgRNA分子,其是含有两个区域(可变靶向结构域(VT)(引导序列)和Cas内切核酸酶识别(CER)结构域)的单个RNA分子(SEQ ID NO:24代表CER的实例)。VT区域可以是例如与靶向的核酸分子具有同一性的20mer的RNA多核苷酸。VT结构域指定了位于PAM基序5′的靶位点中用于切割的靶位点。CER结构域与Cas9蛋白相互作用,并且允许VT结构域与Cas9蛋白相互作用和指导Cas9蛋白切割(Jinek等人,Science[科学]337:816-821)。VT和CER结构域两者都是sgRNA的功能所必需的。
向sgRNA序列添加5′锤头状(HH)和3′丁型肝炎病毒(HDV)核酶允许从任何启动子表达sgRNA,而不考虑一些RNA聚合酶的某些转录要求(例如,T7RNA聚合酶需要一个直接在转录起始后的转录的G残基,但具有三个转录的G残基时作用最佳)。当表达这样的sgRNA时,存在于前sgRNA转录物中的核酶自切割,从而与转录物分离,留下未修饰的sgRNA。
制备了编码在解脂耶氏酵母中靶向Can1-1基因座(SEQ ID NO:25)的sgRNA的DNA序列;该sgRNA包含SEQ ID NO:24作为其CER结构域。sgRNA编码序列在其5′-末端与编码HH核酶(SEQ ID NO:26)的序列连接,并在其3′-末端与编码HDV核酶(SEQ ID NO:27)的序列连接,这样使得HH核酶的前6个碱基与sgRNA的VT区域的前6个碱基反向互补。该特定RGRsgRNA由SEQ ID NO:28编码。然后将SEQ ID NO:28的RGR sgRNA经由标准分子生物学技术与T7RNA聚合酶启动子(SEQ ID NO:29)连接以产生质粒pRF46(SEQ ID NO:30)。
使用标准技术从质粒pRF46(SEQ ID NO:30)PCR扩增T7-RGR sgRNA编码序列。PCR反应的引物是SEQ ID NO:31(T7正向引物)和SEQ ID NO:32(gRNArev1反向引物)。PCR产物通过乙醇沉淀来纯化,并重悬于ddH2O中;将该DNA用作体外转录反应中的模板。在20-μL体外转录反应(MEGAshortscriptTM T7试剂盒,生命科技公司)中添加模板DNA至150nM的终浓度。允许反应进行不同的时间(2小时、4小时、6小时和过夜)以确定体外转录的合适条件(图6)。然后在37℃下用10个单位的DNaseI处理反应15分钟以除去模板DNA。使用乙醇和标准方案沉淀RNA。每个20-μl体外转录反应产生在60和100μg之间的RNA。
因此,在体外合成了具有定义的5′-和3′-末端的sgRNA。如在下面实例3中所示,体外转录的sgRNA可以与Cas9-CPP融合蛋白缔合以形成RGEN-CPP复合物。
实例3
使用与sgRNA复合的Cas9-CPP融合蛋白进行的靶DNA序列的特异性体外切割
在本实例中,测试与sgRNA复合的Zebra CPP-Cas9融合蛋白(包含SEQ ID NO:39)的靶向内切核酸酶功能,以证实与CPP的融合不阻碍Cas9内切核酸酶活性。
含有SEQ ID NO:25的Can1-1靶序列的体外Canl切割试验DNA多核苷酸(SEQ IDNO:35)从解脂耶氏酵母细胞(ATCC 20362)PCR扩增并且使用标准技术进行纯化。PCR反应的引物是SEQ ID NO:33(IV-上正向引物)和SEQ ID NO:34(IV-下反向引物)。
将纯化的Zebra CPP-Cas9融合蛋白(600ng,在实例1中制备)、靶向Canl-1靶位点的sgRNA(250ng,在实例2中制备)、NEBuffer 3.1(马萨诸塞州伊普斯维奇市新英格兰生物实验室(New England BioLabs,Ipswich,MA))和Can1切割试验DNA(150ng,SEQ ID NO:35)在10μL反应物(用ddH2O将体积调至最终体积)中混合。作为阴性对照,还制备了缺乏ZebraCPP-Cas9融合蛋白或缺乏sgRNA的反应。作为阳性对照,在反应中使用野生型Cas9蛋白(加利福尼亚州千橡市PNA生物公司(PNA Bio,Thousand Oaks,CA))而不是Zebra CPP-Cas9。将反应在37℃下孵育60分钟。然后,将RNaseI(4μg)添加到每个反应中,并且在37℃下孵育15分钟以降解sgRNA。添加终止溶液(1μL;30%[w/v]甘油、1.2%[w/v]SDS、250mM EDTA,pH8.0)以终止反应,然后在37℃下将该反应进一步孵育15分钟。将每个反应物加载到1.2%FlashGelTM(瑞士巴塞尔龙沙公司(Lonza,Basel,Switzerland))上,并在200伏特下电泳10分钟(图7)。由Zebra CPP-Cas9提供的靶DNA切割模式与由野生型Cas9提供的切割模式一致(图7),从而表明Zebra CPP-Cas9融合物在体外正常发挥功能。此外,使用已经进行了两次冻融循环的Zebra CPP-Cas9/sgRNA也没有抑制该活性。
因此,与合适的sgRNA复合的CPP-Cas9融合蛋白(即,RGEN-CPP复合物的实例)具有特异性DNA切割活性。已显示该活性与野生型Cas9-sgRNA复合物的活性相似,从而表明CPP融合物不抑制Cas9-sgRNA内切核酸的功能。虽然在本实例中的CPP-Cas9融合蛋白包含SEQID NO:39(Zebra CPP-Cas9),但是考虑了包含例如SEQ ID NO:40、41或42的CPP-Cas9融合蛋白,当与作为RNA组分的合适的sgRNA缔合时,也具有切割活性。
实例4
将CPP-Cas9/sgRNA复合物递送到酵母细胞中并在其中切割靶DNA
在本实例中,测试了与sgRNA复合的Zebra CPP-Cas9融合蛋白(包含SEQ ID NO:39)(Zebra CPP-Cas9/sgRNA)在与细胞接触之后进入酵母细胞的能力。对Can1-1特异的Zebra CPP-Cas9/sgRNA能够进入细胞并切割Canl基因,从而使细胞成为对刀豆氨酸有抗性的。
将解脂耶氏酵母酵母细胞(ATCC 20362)在30℃、振摇(220rpm)下、在YPD(2%葡萄糖、2%蛋白胨、1%酵母提取物)液体培养基中生长至OD600=0.5(约5x106个细胞/mL培养基)。将纯化的Zebra CPP-Cas9融合蛋白(在实例1中制备)和靶向Can1-1靶位点的sgRNA(在实例2中制备)分别以1:3的摩尔比混合在实例1中使用的透析缓冲液中,并且在室温下预孵育15分钟以允许sgRNA与Zebra CPP-Cas9缔合。将5x105解脂耶氏酵母细胞混合到ZebraCPP-Cas9/sgRNA制剂中,这样使得Zebra CPP-Cas9的终浓度为1μM、2.5μM或5μM。将细胞也与5μM终浓度的Zebra CPP-Cas9单独(不含sgRNA作为RNA组分)混合,作为阴性对照。将所有细胞-Cas9制剂在30℃、振摇(220rpm)下孵育2小时。然后将细胞连续稀释1000倍和10000倍。将每个连续稀释液(100μL)涂板到缺乏精氨酸(CM-Arg)的完全培养基上,并允许在30℃下回收48小时。
计数10-3稀释板的菌落以确定涂板的细胞的总数。经由重复涂板技术将菌落转移到具有刀豆氨酸(60μg/mL)的CM-Arg板上。允许菌落在30℃下生长48小时。将对刀豆氨酸有抗性的菌落的数量进行评分,并除以菌落的总数(来自不含刀豆氨酸的板)以确定每种情况的突变频率。使细胞与Zebra CPP-Cas9/sgRNA复合物接触产生了以总菌落的约2%至10%的频率对刀豆氨酸具有抗性的菌落(图8)。预期这种刀豆氨酸抗性是归因于在Can1基因编码序列中在预测的Cas9切割位点处/其附近的插入缺失形成导致的Can1基因功能的丧失。然而,使细胞与单独的Zebra CPP-Cas9(没有sgRNA)接触没有产生对刀豆氨酸有抗性的菌落(图8),表明实验细胞中的刀豆氨酸抗性依赖于给予至CPP-Cas9蛋白的基于sgRNA的特异性。鉴于酵母细胞的性质,CPP-Cas9/sgRNA复合物可能必须穿过细胞壁和细胞膜两个结构以介导特异性DNA靶向。
因此,与合适的sgRNA复合的CPP-Cas9融合蛋白(即,RGEN-CPP复合物的实例)能够进入酵母细胞(穿过细胞壁和细胞膜)并靶向其中的特异性DNA序列。虽然在本实例中的CPP-Cas9融合蛋白包含SEQ ID NO:39(Zebra CPP-Cas9),但是考虑了包含例如SEQ ID NO:40、41或42的CPP-Cas9融合蛋白,当与作为RNA组分的合适的sgRNA缔合时,也具有细胞进入活性且在细胞中具有特异的DNA靶向活性。
实例5
将CPP促进性Cas9/sgRNA复合物递送到植物细胞中并在其中切割靶DNA
可以通过将大豆愈伤组织细胞与融合到CPP的DS-RED荧光蛋白一起孵育来测试CPP促进性蛋白质向大豆细胞中的递送。预期荧光信号在CPP-DS-RED处理中产生,但不在仅与DS-RED蛋白质一起孵育的对照中产生。能以这种方式测试各种CPP,以帮助鉴定用于植物细胞穿透和蛋白质货物递送的最有效CPP。可以测试的CPP的一些实例包括:
(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,
(ii)具有6个或更多个连续精氨酸残基的CPP,
(iii)转运蛋白-10(TP10)CPP,
(iv)来自血管内皮钙粘素蛋白的CPP,或
(vi)选自下组的CPP,该组由以下各项组成:合成九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP。合成的九精氨酸CPP、富含组氨酸的九精氨酸CPP和Pas九精氨酸CPP的实例披露在例如Liu等人(Advanced Studies in Biology[生物学高级研究]5(2):71-88,HIKARI公司)。
体外翻译的Cas9蛋白和合成的sgRNA可以与CPP通过自身或融合(例如,上文中的CPP-DS-RED)来混合,并且与大豆愈伤组织一起孵育来测试Cas9/sgRNA是否可以转运到细胞中。一旦在细胞中,Cas9/sgRNA复合物可以识别由sgRNA靶向序列指定的基因组靶标来产生DNA双链断裂(DSB)。通过细胞机器自发修复DSB可能通过非同源末端连接(NHEJ)导致突变,或者如果存在适当的供体DNA,则可能通过同源重组导致基因整合。CPP也可以共价连接到Cas9蛋白上以获得潜在更好的效率。例如,可以通过PCR分析在特异性靶位点上检测突变或基因整合来验证CPP-Cas9/sgRNA递送到大豆细胞中以及CPP-Cas内切核酸酶复合物由此穿过植物细胞壁和植物细胞膜的转移的成功。
实例6
从大肠杆菌细胞表达和纯化CPP-dsREDexpress蛋白质。
为了快速评估给定的细胞穿透肽进入特定细胞类型的能力,产生了与dsREDexpress蛋白质(SEQ ID NO:85)的CPP融合物,将其在大肠杆菌细胞中表达,并纯化。CPP-dsREDexpress蛋白质融合物是一种允许通过给定的CPP快速评估货物递送到给定细胞类型中的工具。这允许选择物种、细胞类型或菌株特异的CPP分子,以便通过显微镜检查或流式细胞术分析评估细胞荧光来以快速和高通量方式最大化货物的递送。
合成了大肠杆菌密码子优化的dsREDexpress基因(SEQ ID NO:86)(IDT DNA)并将其克隆到的pBAD/HisB(SEQ ID NO:87)的NcoI/HinDIII位点,产生pRF161(SEQ ID NO:88)。大肠杆菌密码子优化的dsREDexpress包含内部EcoRI位点,这样使得用NcoI/EcoRI消化质粒将允许his标签被各种his标签-CPP序列替代以产生his标签-CPP-dsREDexpress融合表达质粒。各种his-标签-CPP融合物;TAT(SEQ ID NO:89)、TLM(SEQ ID NO:90)、MPG1(SEQ IDNO:91)、pep1(SEQ ID NO:92)和CFFKDEL(SEQ ID NO:93);是针对大肠杆菌进行了密码子优化的,并且其侧翼有框架内5’NcoI和3’EcoRI位点(分别为SEQ ID NO:94-98),并且使用标准技术将其克隆到pRF161的NcoI/EcoRI位点(SEQ ID NO:88),his标签序列用相应的his标签-CPP融合物替代并产生质粒pRF224(his-TAT-dsREDexpress SEQ ID NO:99)、pRF214(his-TLM-dsREDexpress SEQ ID NO:100)、pRF213(his-MPG1-dsREDexpress SEQ ID NO:101)、pRF217(his-pep1-dsREDexpress SEQ ID NO:102)、pRF216(his-CFFKDEL-dsREDexpress SEQ ID NO:103)。使用标准测序技术和oligo 36(SEQ ID NO:104)验证插入片段的序列。
通过标准PCR技术,使用oligo 36(SEQ ID NO:104)和oligo 153(SEQ ID NO:111),分别从pRF144(SEQ ID NO:108)、pRF162(SEQ ID NO:109)和pRF146(SEQ ID NO:110)PCR扩增大肠杆菌密码子优化的His-Zebra(SEQ ID NO:105)、His-tp10(SEQ ID NO:106)和His-pVEC(SEQ ID NO:107)。将PCR片段克隆到pRF161(SEQ ID NO:88)的NcoI/EcoRI位点,产生质粒pRF186(his-Zebra-dsREDexpress SEQ ID NO:112)、pRF192(his-tp10-dsREDexpress SEQ ID NO:113)和pRF190(his-pVEC-dsREDexpress SEQ ID NO:114)。使用oligo 36(SEQ ID NO:104)验证序列。
使用标准技术表达His标记的CPP-dsREDexpress融合蛋白。简言之,在37℃和220RPM下,在125ml烧瓶中,在10ml ZYM-505(1%N-Z胺、0.5%酵母提取物、5%甘油、1.0%右旋糖、25mM Na2HPO4、25mM KH2PO4、50mM NH4Cl、5mM Na2SO4、1x微量金属(泰克诺瓦公司(Teknova))、5x10-5%硫胺素、2mM MgCl2、100μg/ml氨苄青霉素)或溶原肉汤(lysogenybroth)(1%胰蛋白胨、0.5%酵母提取物、1%氯化钠、100μg/ml氨苄青霉素、0.4%右旋糖)中将细胞预孵育12-16小时。将预培养物以1∶1000(ZYM-505)在500ml ZYM-5052(1%N-Z胺、0.5%酵母提取物、5%甘油、0.5%右旋糖、2%L-阿拉伯糖、25mM Na2HPO4、25mM KH2PO4、50mM NH4Cl、5mM Na2SO4、1x微量金属(泰克诺瓦公司(Teknova))、5x10-5%硫胺素、2mMMgCl2、100μg/ml氨苄青霉素)中,或以1∶100(裂解肉汤)在500ml 2x YT(1.6%胰蛋白胨、1%酵母提取物、0.5%NaCl、100μg/ml氨苄青霉素)中稀释,并且在37℃220RPM下、在2.9LFernbach烧瓶中生长至OD600为约0.5。向2x YT培养物中添加L-阿拉伯糖至终浓度为0.1%,并且将所有培养物转移至18℃220RPM持续20-30小时以进行蛋白质表达。以5000RPM收集细胞10分钟,丢弃耗尽的培养基,并且在-80℃冷冻细胞沉淀。
将细胞沉淀解冻并重悬于变性裂解缓冲液(50mM Tris pH 8.0、150mM NaCl、8M尿素、20mM咪唑)中,并经由穿过在16,000PSI下的弗细胞压力池两次进行裂解。通过在10,000g、4℃下离心15分钟从上清液中除去固体沉淀物。将20μl澄清的提取物与20μl的2xLaemmli缓冲液(4%SDS、20%甘油、100mM DTT、0.004%溴酚蓝、125mM Tris pH 6.8)混合,加热至95℃持续5分钟并在-20℃下冷冻保存用于分析。将澄清的提取物与6ml 50%(v/v)镍-NTA-琼脂糖浆在室温下混合1小时。在2000RPM下将珠粒从混合物中沉淀5分钟。除去上清液,并且取出20μl样品作为澄清的提取物。将沉淀的珠粒重悬于10ml的变性裂解缓冲液中,并应用于重力流色谱柱。允许液体流出,留下一层塞满的珠粒。该层使用不同比率的洗涤缓冲液1(50mM Tris pH 8.0、150mM NaCl、8M尿素、20mM咪唑)和洗涤缓冲液2(50mM TrispH 8.0、500mM NaCl、20mM咪唑)以系列洗涤液来洗涤,以逐步降低变性剂(尿素)的浓度并逐步提高NaCl的浓度,并允许蛋白质在柱上重新折叠。简言之,该柱用以下缓冲液洗涤(缓冲液1:缓冲液2):10ml的1∶0(8M尿素、150mM NaCl)、10ml的7∶1(7M尿素、194mM NaCl)、10ml的3∶1(6M尿素、238mM NaCl)10ml的5∶3(5M尿素、281mM NaCl)、10ml的1∶1(4M尿素、325mMNaCl)、20ml的3∶5(3M尿素、369mM NaCl)、20ml的1∶3(2M尿素、413mM NaCl)、20ml的3∶13(1.5M尿素、434mM NaCl)、20ml的1∶5(1M尿素、456mM NaCl)、20ml的1∶15(0.5M尿素、478mMNaCl)、以及30ml的0∶1(0M尿素、500mM NaCl)。将蛋白质以10x1ml级分在天然洗脱缓冲液(50mM Tris pH 8.0、500mM NaCl、10%甘油、500mM咪唑)中洗脱。含有洗脱的dsREDexpress或CPP-dsREDexpress蛋白质的级分是红色的。将红色的级分合并,并且在室温下、在10,000MWCO再生纤维素透析膜中、用1000体积的透析缓冲液(50mM Tris pH 8.0、10%甘油)透析过夜。将蛋白质溶液从透析膜中除去并使用0.22μM膜进行过滤灭菌。处理20μl的蛋白质溶液作为澄清的细胞提取物。
将在Laemmli缓冲液中纯化期间取出的样品加热至95℃持续5分钟并加载到12.5%PAGE凝胶上。将凝胶在200伏特恒压下运行1小时,并使用简单蓝(Simply blue)染料染色。用于纯化CPP-dsREDexpress标记的蛋白质的代表性PAGE凝胶的实例示于图9中。使用牛血清白蛋白作为标准品,使用PierceTM Coomassie Plus测定法来确定每种纯化蛋白质的总蛋白质浓度。每种纯化的CPP-dsREDexpress融合物的浓度在表3中给出。
表3:纯化dsREDexpress蛋白融合物的浓度。
实例7
从大肠杆菌细胞表达和纯化另外的CPP-Cas9蛋白。
将Cas9递送到不同的细胞类型可能需要用不同的CPP分子标记的Cas9。为了分离各种CPP-Cas9融合蛋白,将不同的CPP与大肠杆菌表达载体中的Cas9融合。这些蛋白质从大肠杆菌细胞中表达和纯化,用于将Cas9/sgRNA核糖核蛋白复合物CPP介导递送至细胞。
为了制得His-CFFKDEL-Cas9(SEQ ID NO:115)和His-MPG1-Cas9(SEQ ID NO:116)融合表达盒,分别使用产生质粒pRF243(his-CFFKDEL-Cas9 SEQ ID NO:118)和pRF238(his-MPG1-Cas9,SEQ ID NO:119)的标准技术,将pRF216(CFFKDEL SEQ ID NO:103)或pRF213(MPG1 SEQ ID NO:101)的NcoI/EcoRI片段克隆到Cas9蛋白表达质粒pRF48(SEQ IDNO:117)的相同位点。使用oligo 36(SEQ ID NO:104)经由Sanger测序确认了MPG1-Cas9或CFFKDEL-Cas9融合盒的正确构建。
使用标准技术表达His标记的CPP-Cas9融合蛋白。简言之,在37℃和220RPM下,在125ml烧瓶中,在10ml ZYM-505(1%N-Z胺、0.5%酵母提取物、5%甘油、1.0%右旋糖、25mMNa2HPO4、25mM KH2PO4、50mM NH4Cl、5mM Na2SO4、1x微量金属(泰克诺瓦公司(Teknova))、5x10-5%硫胺素、2mM MgCl2、100μg/ml氨苄青霉素)或溶原肉汤(lysogeny broth)(1%胰蛋白胨、0.5%酵母提取物、1%氯化钠、100μg/ml氨苄青霉素、0.4%右旋糖)中将细胞预孵育12-16小时。将预培养物以1∶1000(ZYM-505)在500ml ZYM-5052(1%N-Z胺、0.5%酵母提取物、5%甘油、0.5%右旋糖、2%L-阿拉伯糖、25mM Na2HPO4、25mM KH2PO4、50mM NH4Cl、5mMNa2SO4、1x微量金属(泰克诺瓦公司(Teknova))、5x10-5%硫胺素、2mM MgCl2、100μg/ml氨苄青霉素)中,或以1∶100(裂解肉汤)在500ml 2x YT(1.6%胰蛋白胨、1%酵母提取物、0.5%NaCl、100μg/ml氨苄青霉素)中稀释,并且在37℃220RPM下、在2.9L Fernbach烧瓶中生长至OD600为约0.5。向2x YT培养物中添加L-阿拉伯糖至终浓度为0.1%,并且将所有培养物转移至18℃220RPM持续20-30小时以进行蛋白质表达。以5000RPM收集细胞10分钟,丢弃耗尽的培养基,并且在-80℃冷冻细胞沉淀。如实例1中所述来纯化蛋白质。如通过Coomasie Plus测定法(PierceTM)确定的纯化CPP-Cas9蛋白的终浓度在表4中列出。
表4:纯化的CPP-Cas9蛋白的浓度。
蛋白质 mg/ml μM
Zebra-Cas9(SEQ ID NO:758) 1.5 9
CFFKDEL-Cas9(SEQ ID NO:730) 4.6 28
MPG1-Cas9(SEQ ID NO:731) 3.8 23
pVEC-Cas9(SEQ ID NO:759) 2.5 15
实例8
在大肠杆菌细胞中CPP-Cas9/gRNA介导的基因靶向。
本实例显示用CPP-Cas9/sgRNA核糖核蛋白复合物处理大肠杆菌,其中sgRNA靶向大肠杆菌的galK基因。CPP-Cas9/sgRNA进入细胞中允许在galK基因内发生的靶向和切割,通过易错DNA修复机制导致基因失活,其在表型上可以被监测为对半乳糖的抗性。这种方法依赖于经由CPP介导的递送将Cas9/sgRNA货物递送到细胞中。
大肠杆菌的galK基因(SEQ ID NO:120)负责在糖半乳糖存在下在galE突变体中观察到的半乳糖敏感表型。当半乳糖进入细胞时,其被半乳糖激酶(galK基因(SEQ ID NO:120)的产物)磷酸化。半乳糖磷酸盐对细胞有毒性。在野生型细胞中,半乳糖磷酸盐被gale(SEQ ID NO:121)和galT(SEQ ID NO:122)基因的产物进一步代谢并用作碳源。在galE或galT功能丧失突变体中,半乳糖磷酸盐积累导致细胞死亡。因此,可以在galE突变体的背景中选择在galK基因中的功能丧失突变,因为在半乳糖存在下允许菌落形成。
为了生产在galK2-1靶位点(SEQ ID NO:134)靶向galK基因(SEQ ID NO:120)的sgRNA(SEQ ID NO:135),产生体外转录模板(SEQ ID NO:131)。首先,在标准PCR反应(SEQID NO:124)中,使用CER正向引物(SEQ ID NO:126)和通用反向引物(SEQ ID NO:127)从pRF291(SEQ ID NO:125)扩增编码CER结构域(SEQ ID NO:123)的DNA的PCR产物。使用25个柱的ZymoTM清洁和浓缩(ZymoTM clean and concentrate)来纯化编码CER的PCR产物(SEQID NO:124),并在35μl的ddH2O中洗脱。sgRNA体外转录模板的扩增使用了包含4个引物的多重PCR,这4个引物为:含有T7启动子的通用正向引物(SEQ ID NO:128)、含有某种T7启动子和某一靶位点的靶特异性正向引物(SEQ ID NO:129)、含有某一靶位点且与CER结构域重叠的靶反向引物(SEQ ID NO:130)、以及通用反向引物(SEQ ID NO:127)。使用Phusion flash预混物运行PCR反应,该预混物含有15nM CER结构域PCR产物(SEQ ID NO:124)、通用正向(SEQ ID NO:128)和反向引物(SEQ ID NO:127)各自1μM、以及靶正向(SEQ ID NO:129)和靶反向(SEQ ID NO:130)引物各自300nM。如标准反应那样进行PCR反应循环。使用25个柱的Zymo清洁和浓缩来纯化sgRNA体外转录模板(SEQ ID NO:131),并在35μl的ddH2O中洗脱。sgRNA体外转录模板(SEQ ID NO:131)含有T7启动子(SEQID NO:132)、编码galK2-1可变靶向结构域的DNA(SEQ ID NO:133)和编码CER结构域的DNA(SEQ ID NO:125)。如在实例2中所述进行产生galK2-1sgRNA(SEQ ID NO:135)的体外转录反应。
通过在37℃、220RPM下,在溶原肉汤(1%胰蛋白胨、0.5%酵母提取物、1%NAC1)中使缺失galE的大肠杆菌的菌株生长过夜,进行Cas9/sgRNA核蛋白复合物的CPP递送。培养物在新鲜的溶原肉汤中以1∶100稀释,并在37℃、220RPM下生长2小时以获得指数生长期的细胞。将CPP-Cas9(pvEC-Cas9(SEQ ID NO:144)、Zebra-Cas9(SEQ ID NO:143)、MPG1-Cas9(SEQ ID NO:116)、CFFKDEL-Cas9(SEQ ID NO:115))以10μM终浓度在10μM galK2-1sgRNA(SEQ ID NO:135)存在或不存在下,在50μl体积中在室温下孵育30分钟。对于该处理,将1.2ml的细胞以3000RPM沉淀3分钟,丢弃上清液,并且将细胞重悬于600μl的含有2x核酸酶缓冲液(200mM NaCl、100mM Tris-HCl、20mM MgCl2、200μg/ml BSA pH 7.9)的LB中。将50μl的细胞悬浮液与每个反应以及仅gRNA(对照且不处理)混合。在37℃、220RPM下将样品孵育4小时。将100μl的10-3、10-4、和10-5的样品稀释物涂板在溶原肉汤板上,以便在处理结束时获得活细胞计数,将反应的剩余物涂板在溶原肉汤板上并在37℃下孵育过夜。从10-5稀释物中计数活细胞,以确定在样本溶菌肉汤板上涂板的活菌落形成单位(CFU)的数目。将样品板经由标准技术重复涂板到用1.5%(w/v)Bacto琼脂固化、含有0.2%(w/v)甘油和0.2%(w/v)半乳糖作为碳源的最小A培养基(1g/L(NH4)2SO4、4.5g/L KH2PO4、10.5g/L K2HPO4、0.5g/L柠檬酸钠2H2O、1mM MgSO4·7H2O、5x10-5%硫胺素)上。将板在37℃下孵育24小时,然后为菌落形成打分。来自含有半乳糖的板上的galE菌株的每个CFU代表galK基因的基因失活事件。重复涂板的结果显示于表5中。
表5:在用CPP-Cas9/sgRNA处理的galE突变大肠杆菌细胞中galK基因失活的频率。
在一些情况下,用CPP-Cas9/sgRNA核糖核蛋白复合物处理大肠杆菌细胞超过未处理细胞的背景增强了galK失活的频率约4倍。仅用CPP-Cas9或仅用sgRNA处理的细胞中没有观察到这种增强,这表明galK基因失活的增加归因于CPP-Cas9/sgRNA核糖核蛋白进入细胞中并在galK基因内的galK2-1靶位点上产生DNA双链断裂。
实例9
将CPP-dsREDexpress蛋白递送到古细菌细胞中
为了测试使用细胞穿透肽将货物递送到古细菌细胞并确定穿过古细菌细胞壁的候选CPP,该古细菌细胞壁包含类似于细菌和真核细胞壁(例如磷脂)和膜的元件以及古细菌所特有的元件(例如S层),用CPP-dsREDexpress蛋白质融合物处理古细菌细胞。在该筛选中鉴定的CPP可以用于将其他货物(例如Cas9/sgRNA核糖核蛋白复合物)递送至古细菌细胞。
将古生菌(archeon)嗜盐菌(Halobacterium salinarum)ATCC19700在用1.5%Bacto琼脂固化的培养基213(250g/L NaCl、10g/L MgSO4·7H2O、5g/L KCl、0.2g/L CaCl2·6H2O、10g/L酵母提取物、2.5g/L胰蛋白胨)上,在37℃下生长直到菌落形成(4天)。在250ml烧瓶中,使用单个菌落接种50ml的培养基213。使培养物在37℃、220RPM下生长直到OD600达到约0.5(表明指数生长期)。在24孔块中,将100μl的细胞与无蛋白、5μM dsREDexpress(SEQID NO:85)、5μM MPGl-dsREDexpress(SEQ ID NO:136)、5μM pVEC-dsREDexpress(SEQ IDNO:137)、5μM CFFKDEL-dsREDexpress(SEQ ID NO:138)、5μM TLM-dsREDexpress(SEQ IDNO:139)、5μM pep1-dsREDexpress(SEQ ID NO:141)、或5μM tp10 dsRED-express(SEQ IDNO:142)混合。将混合物在37℃、220RPM下孵育4小时。将细胞用不含胰蛋白胨和酵母提取物的培养基213洗涤两次,并重悬于100μl的不含胰蛋白胨和酵母提取物的培养基213中。将细胞在Accuri C5流式细胞仪的红色通道中分析荧光,以确定哪些CPP标签已经将dsREDexpress货物递送到嗜盐菌(H.salinarum)细胞中。使用未处理的细胞来产生非红细胞和红细胞之间的流式细胞术数据的分析门控,这样使得门控产生落在红色门控中的未处理细胞的假阳性率为0.2%(表6)。
表6:CPP递送dsREDexpress至嗜盐菌。
1数据代表三个重复±标准偏差。
将dsREDexpress货物递送到古细菌细胞中证明,至少三种细胞穿透肽(pVEC、TLM、tp10)能够将蛋白质货物递送到古细菌细胞中,其效率高达单独递送dsREDexpress蛋白的50倍以上,表明这三种CPP基序可以用于将其他货物递送到古细菌细胞(例如Cas9核糖核蛋白复合物)中。另外,CPP基序将货物递送到整个细胞群体的多达16%,表明通过CPP将货物递送到古细菌细胞中是一个有效的过程。
实例10
将CPP-dsREDexpress蛋白递送到真核生物细胞中
为了测试细胞穿透肽将货物递送到不同真核生物物种中的能力,使用各种CPP-dsREDexpress融合物处理三种物种(辣椒疫霉菌(Phytophthora capsici)(卵菌纲)、Septori tritici(真实真菌)和灰葡萄孢菌(Botrytis cinerea)(真实真菌))的小组。通过FACS分析针对各种CPP部分监测dsREDexpress货物的递送以确定向其递送货物的细胞的百分比。能够将dsREDexpress货物递送到这些细胞的CPP表明CPP将能够将其他货物递送到这些类型的真核生物细胞(例如Cas9/sgRNA核糖核蛋白复合物)中。
在23℃下、在黑暗中,使辣椒疫霉菌(P.capsici)在用1.8%Bacto琼脂固化的V8培养基(20%V8果汁、4.5g/L CaCO3)上生长3天。然后将板放置在23℃下、在光下持续另外的7天。将板在4℃下冷却30分钟。将水置于板上以正好覆盖表面,并允许在室温下孵育30分钟。除去液体以收获游动孢子。经由显微镜检查分析确认了游动孢子。将等体积的2x胞囊形成培养基(40g/L胰蛋白胨、10g/L酵母提取物、200ml/L 10x SOC盐[5.84g/L NaCl、1.86g/LKCl、20.3g/L MgCl2·6H2O、24.6g/L MgSO4·7H2O、36g/L右旋糖]、36.4g/L山梨糖醇、1.47g/L CaCl2·2H2O)添加到游动孢子中并轻轻混合。将在胞囊形成培养基中的游动孢子在室温下孵育20分钟。显微镜检查确认了胞囊形成。将孢子沉淀并重悬于等体积的YMA培养基(2g/L酵母提取物、4g/L麦芽提取物)中,并使用血细胞计数器计数。在YMA中将游动孢子稀释至3x107孢子/ml。将100μl的在YMA中的游动孢子与各种dsREDexpress融合蛋白(新实例5,表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na2HPO4·2H2O、0.24g/L KH2PO4pH6.8)洗涤两次,并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacteriumsalinarium),使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例9)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比,这样使得0.1%的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表7。pVEC、pep1和tp10比单独的dsREDexpress处理的细胞产生5.8、5.5、和1.8倍更多的红细胞,表明这些CPP部分可能是将其他货物递送到卵菌纲的候选物(例如Cas9/sgRNA核糖核蛋白复合物)
表7:CPP递送dsREDexpress至辣椒疫霉菌(Phytophora capsici)。
1数据代表三个生物重复±标准偏差。
在黑暗中,使灰葡萄孢菌(B.cinerea)在用1.8%Bacto琼脂固化的PDA培养基(24g/L马铃薯右旋糖肉汤)上生长5至10天。使用无菌塑料涂布器将分生孢子收获在水中,并将其通过2层粗棉布过滤。将分生孢子在血细胞计数器上计数,并在YMA培养基中稀释至3x107个分生孢子/ml。将100μl的在YMA中的分生孢子与各种dsREDexpress融合蛋白(新实例5,表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na2HPO4·2H2O、0.24g/L KH2PO4pH6.8)洗涤两次,并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacteriumsalinarium),使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例8)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比,这样使得0.1%的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表8。
表8:CPP递送dsREDexpress至灰葡萄孢菌(Botrytis cinerea)
1数据代表三个生物重复±标准偏差。
在23℃、在光照下,使S.tritici在含有1.8%Bacto琼脂的YMA培养基上生长。在5至10天后,用无菌塑料涂布器和水收获分生孢子。将分生孢子在血细胞计数器上计数,并在YMA培养基中稀释至3x107个分生孢子。将100μl的在YMA中的分生孢子与各种dsREDexpress融合蛋白(新实例5,表N1)混合至5μM蛋白质的终浓度。将混合物在25℃、400RPM下孵育2小时。将细胞用磷酸盐缓冲盐水(PBS)(8g/L NaCl、0.2g/L KCl、1.44g/L Na2HPO4·2H2O、0.24g/L KH2PO4pH 6.8)洗涤两次,并重悬于200μl PBS的终体积中。关于嗜盐菌(Halobacterium salinarium),使用流式细胞术监测dsREDexpress融合蛋白的摄取(实例9)。通过在dsREDexpress处理的细胞中绘制任意的门控来确定向其成功递送货物的细胞的百分比,这样使得0.1%的群体得分为假阳性红色事件(1∶1000细胞)。该处理的结果可以参见表9。与单独的dsREDexpress相比,pVEC、TLM、pep1、和tp10分别增加了dsREDexpress递送25、4、3和5倍。这表明这些CPP将是递送其他货物至真实真菌的良好候选者(例如Cas9/sgRNA核糖核蛋白复合物)。
表9:CPP递送dsREDexpress至Septori tritici
1数据代表三个生物重复±标准偏差。
实例11
将七个CPP-dsRED和两个CPP-tagRFP递送到七种肠道细菌中
在本实例中,测试了CPP将两种货物蛋白质(dsRED和tag RFP)递送到7种肠道细菌物种(其对宿主生理学的有益效果已被证明)中的效率。
在厌氧帐篷(80%N2、15%CO2、和5%H2)中,在旋转振摇器中,以150rpm、在37℃下使细菌细胞在合适的培养基(参见表10)中生长过夜。对于该测定,在96孔板中将1x108个细菌细胞与终浓度为5μM的CPP-dsRED和CPP-tagRFP蛋白混合,随后在37℃下过生长2小时。为了测量细胞中的dsRED和RFP荧光信号,通过离心(3,500×g,4℃,20min)收集细菌细胞,并将其在磷酸盐缓冲盐水(100μl/孔)中洗涤两次。荧光强度用装备有554nm激发和586nm发射过滤器、具有10nm带宽的Tecan Spark 10M板读数器(瑞士门内多夫帝肯公司(Tecan,Switzerland))进行定量。原始荧光值从未处理的细胞(背景)中减去。将7000的荧光强度值视为递送CPP至细胞内部的最小截断值。
表10.7种细菌物种的培养基
如在表11中所示,这些结果表明,包含MPG、pVEC、TLM、ZEBRA和pep1的五种CPP被有效地递送到属于厚壁菌门和拟杆菌门的厌氧肠道细菌中,从而表明CPP可以穿过这些细菌的细胞膜(表9)。
表11.如通过高于截断值7000的荧光强度显示的CPP在不同细菌菌株中的差异递送效率
序列表
<110> E.I.内穆尔杜邦公司(E. I. du Pont de Nemours and Company)
Fan, Xiaochun
Frisch, Ryan
Hong, Seung-Pyo
Jackson, Ethel Noland
<120> RNA引导的内切核酸酶进入细胞中的肽介导的递送
<130> CL6273 PCT
<150> 62/075999
<151> 2014-11-06
<160> 144
<170> PatentIn版本3.5
<210> 1
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 化脓性链球菌Cas9
<400> 1
atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactaa 4107
<210> 2
<211> 4140
<212> DNA
<213> 人工序列
<220>
<223> 具有NLS的化脓性链球菌Cas9
<400> 2
atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140
<210> 3
<211> 1379
<212> PRT
<213> 人工序列
<220>
<223> 具有NLS的化脓性链球菌Cas9
<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 4
<211> 543
<212> DNA
<213> 解脂耶氏酵母
<400> 4
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
acc 543
<210> 5
<211> 4683
<212> DNA
<213> 人工序列
<220>
<223> Cas9-NLS表达盒(FBA1启动子和Cas9-NLS开放阅读框)
<400> 5
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600
gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660
cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720
gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780
tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840
cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900
ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960
aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020
cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080
gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140
cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200
agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260
aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320
gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380
gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440
attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500
tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560
cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620
gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680
ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740
cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800
cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860
atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920
tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980
gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040
aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100
gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160
ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 2220
actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280
atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340
attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400
gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460
gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520
ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580
ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640
gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700
ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760
actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820
gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880
cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940
cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000
cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060
cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120
tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180
aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240
cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300
caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360
aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420
tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480
aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540
aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600
aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660
tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720
agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780
tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840
gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900
atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960
gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020
gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080
gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140
aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200
ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260
tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320
gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380
gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440
aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500
gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560
aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620
atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680
taa 4683
<210> 6
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pZUFCas9质粒
<400> 6
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 7
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Cas9-NLS正向PCR引物
<400> 7
gggggaattc gacaagaaat actccatcgg cctgg 35
<210> 8
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> Cas9-NLS反向PCR引物
<400> 8
ccccaagctt agcggccgct tagacctttc g 31
<210> 9
<211> 4166
<212> DNA
<213> 人工序列
<220>
<223> EcoRI-Cas9-NLS-HinDIII PCR产物
<400> 9
gggggaattc gacaagaaat actccatcgg cctggacatt ggaaccaact ctgtcggctg 60
ggctgtcatc accgacgagt acaaggtgcc ctccaagaaa ttcaaggtcc tcggaaacac 120
cgatcgacac tccatcaaga aaaacctcat tggtgccctg ttgttcgatt ctggcgagac 180
tgccgaagct accagactca agcgaactgc tcggcgacgt tacacccgac ggaagaaccg 240
aatctgctac ctgcaggaga tcttttccaa cgagatggcc aaggtggacg attcgttctt 300
tcatcgactg gaggaatcct tcctcgtcga ggaagacaag aaacacgagc gtcatcccat 360
ctttggcaac attgtggacg aggttgctta ccacgagaag tatcctacca tctaccacct 420
gcgaaagaaa ctcgtcgatt ccaccgacaa ggcggatctc agacttatct acctcgctct 480
ggcacacatg atcaagtttc gaggtcattt cctcatcgag ggcgatctca atcccgacaa 540
cagcgatgtg gacaagctgt tcattcagct cgttcagacc tacaaccagc tgttcgagga 600
aaaccccatc aatgcctccg gagtcgatgc aaaggccatc ttgtctgctc gactctcgaa 660
gagcagacga ctggagaacc tcattgccca acttcctggc gagaaaaaga acggactgtt 720
tggcaacctc attgcccttt ctcttggtct cacacccaac ttcaagtcca acttcgatct 780
ggcggaggac gccaagctcc agctgtccaa ggacacctac gacgatgacc tcgacaacct 840
gcttgcacag attggcgatc agtacgccga cctgtttctc gctgccaaga acctttcgga 900
tgctattctc ttgtctgaca ttctgcgagt caacaccgag atcacaaagg ctcccctttc 960
tgcctccatg atcaagcgat acgacgagca ccatcaggat ctcacactgc tcaaggctct 1020
tgtccgacag caactgcccg agaagtacaa ggagatcttt ttcgatcagt cgaagaacgg 1080
ctacgctgga tacatcgacg gcggagcctc tcaggaagag ttctacaagt tcatcaagcc 1140
aattctcgag aagatggacg gaaccgagga actgcttgtc aagctcaatc gagaggatct 1200
gcttcggaag caacgaacct tcgacaacgg cagcattcct catcagatcc acctcggtga 1260
gctgcacgcc attcttcgac gtcaggaaga cttctacccc tttctcaagg acaaccgaga 1320
gaagatcgag aagattctta cctttcgaat cccctactat gttggtcctc ttgccagagg 1380
aaactctcga tttgcttgga tgactcgaaa gtccgaggaa accatcactc cctggaactt 1440
cgaggaagtc gtggacaagg gtgcctctgc acagtccttc atcgagcgaa tgaccaactt 1500
cgacaagaat ctgcccaacg agaaggttct tcccaagcat tcgctgctct acgagtactt 1560
tacagtctac aacgaactca ccaaagtcaa gtacgttacc gagggaatgc gaaagcctgc 1620
cttcttgtct ggcgaacaga agaaagccat tgtcgatctc ctgttcaaga ccaaccgaaa 1680
ggtcactgtt aagcagctca aggaggacta cttcaagaaa atcgagtgtt tcgacagcgt 1740
cgagatttcc ggagttgagg accgattcaa cgcctctttg ggcacctatc acgatctgct 1800
caagattatc aaggacaagg attttctcga caacgaggaa aacgaggaca ttctggagga 1860
catcgtgctc actcttaccc tgttcgaaga tcgggagatg atcgaggaac gactcaagac 1920
atacgctcac ctgttcgacg acaaggtcat gaaacaactc aagcgacgta gatacaccgg 1980
ctggggaaga ctttcgcgaa agctcatcaa cggcatcaga gacaagcagt ccggaaagac 2040
cattctggac tttctcaagt ccgatggctt tgccaaccga aacttcatgc agctcattca 2100
cgacgattct cttaccttca aggaggacat ccagaaggca caagtgtccg gtcagggcga 2160
cagcttgcac gaacatattg ccaacctggc tggttcgcca gccatcaaga aaggcattct 2220
ccagactgtc aaggttgtcg acgagctggt gaaggtcatg ggacgtcaca agcccgagaa 2280
cattgtgatc gagatggcca gagagaacca gacaactcaa aagggtcaga aaaactcgcg 2340
agagcggatg aagcgaatcg aggaaggcat caaggagctg ggatcccaga ttctcaagga 2400
gcatcccgtc gagaacactc aactgcagaa cgagaagctg tatctctact atctgcagaa 2460
tggtcgagac atgtacgtgg atcaggaact ggacatcaat cgtctcagcg actacgatgt 2520
ggaccacatt gtccctcaat cctttctcaa ggacgattct atcgacaaca aggtccttac 2580
acgatccgac aagaacagag gcaagtcgga caacgttccc agcgaagagg tggtcaaaaa 2640
gatgaagaac tactggcgac agctgctcaa cgccaagctc attacccagc gaaagttcga 2700
caatcttacc aaggccgagc gaggcggtct gtccgagctc gacaaggctg gcttcatcaa 2760
gcgtcaactc gtcgagacca gacagatcac aaagcacgtc gcacagattc tcgattctcg 2820
gatgaacacc aagtacgacg agaacgacaa gctcatccga gaggtcaagg tgattactct 2880
caagtccaaa ctggtctccg atttccgaaa ggactttcag ttctacaagg tgcgagagat 2940
caacaattac caccatgccc acgatgctta cctcaacgcc gtcgttggca ctgcgctcat 3000
caagaaatac cccaagctcg aaagcgagtt cgtttacggc gattacaagg tctacgacgt 3060
tcgaaagatg attgccaagt ccgaacagga gattggcaag gctactgcca agtacttctt 3120
ttactccaac atcatgaact ttttcaagac cgagatcacc ttggccaacg gagagattcg 3180
aaagagacca cttatcgaga ccaacggcga aactggagag atcgtgtggg acaagggtcg 3240
agactttgca accgtgcgaa aggttctgtc gatgcctcag gtcaacatcg tcaagaaaac 3300
cgaggttcag actggcggat tctccaagga gtcgattctg cccaagcgaa actccgacaa 3360
gctcatcgct cgaaagaaag actgggatcc caagaaatac ggtggcttcg attctcctac 3420
cgtcgcctat tccgtgcttg tcgttgcgaa ggtcgagaag ggcaagtcca aaaagctcaa 3480
gtccgtcaag gagctgctcg gaattaccat catggagcga tcgagcttcg agaagaatcc 3540
catcgacttc ttggaagcca agggttacaa ggaggtcaag aaagacctca ttatcaagct 3600
gcccaagtac tctctgttcg aactggagaa cggtcgaaag cgtatgctcg cctccgctgg 3660
cgagctgcag aagggaaacg agcttgcctt gccttcgaag tacgtcaact ttctctatct 3720
ggcttctcac tacgagaagc tcaagggttc tcccgaggac aacgaacaga agcaactctt 3780
cgttgagcag cacaaacatt acctcgacga gattatcgag cagatttccg agttttcgaa 3840
gcgagtcatc ctggctgatg ccaacttgga caaggtgctc tctgcctaca acaagcatcg 3900
ggacaaaccc attcgagaac aggcggagaa catcattcac ctgtttactc ttaccaacct 3960
gggtgctcct gcagctttca agtacttcga taccactatc gaccgaaagc ggtacacatc 4020
caccaaggag gttctcgatg ccaccctgat tcaccagtcc atcactggcc tgtacgagac 4080
ccgaatcgac ctgtctcagc ttggtggcga ctccagagcc gatcccaaga aaaagcgaaa 4140
ggtctaagcg gccgctaagc ttgggg 4166
<210> 10
<211> 4092
<212> DNA
<213> 人工序列
<220>
<223> pBAD/HisB质粒
<400> 10
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360
atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420
tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480
gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540
tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600
acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720
cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780
aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840
agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200
tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760
gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880
cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060
ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120
acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180
ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240
actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300
caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360
tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420
ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480
caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540
ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600
gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660
gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720
tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780
cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840
gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900
ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960
taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020
taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080
cgccattcag ag 4092
<210> 11
<211> 8237
<212> DNA
<213> 人工序列
<220>
<223> pRF48质粒
<400> 11
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160
acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220
agctggtacc atatggg 8237
<210> 12
<211> 54
<212> PRT
<213> 爱泼斯坦-巴尔二氏病毒
<400> 12
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Arg Val Arg Val
1 5 10 15
Ala Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr
20 25 30
Arg Glu Val Ala Ala Ala Lys Ser Ser Glu Asn Asp Arg Leu Arg Leu
35 40 45
Leu Leu Lys Gln Met Cys
50
<210> 13
<211> 18
<212> PRT
<213> 小家鼠
<400> 13
Leu Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His
1 5 10 15
Ser Lys
<210> 14
<211> 21
<212> PRT
<213> 未知
<220>
<223> TP10 CPP
<400> 14
Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu Lys Ala Cys Ala Ala Cys
1 5 10 15
Ala Lys Lys Ile Leu
20
<210> 15
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> PolyR CPP
<400> 15
Gly Gly Gly Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Leu Leu Leu
1 5 10 15
Leu
<210> 16
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> NcoI-6xHis-ZEBRA CPP-EcoRI
<400> 16
ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60
aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120
atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180
aaatgtgcga attc 194
<210> 17
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> NcoI-6xHis-pVEC CPP-EcoRI
<400> 17
ccatggggca tcaccaccat caccacttat tgattatctt gcgtcgtcgc atccgcaaac 60
aggcgcacgc acatagcaag gaattc 86
<210> 18
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> NcoI-6xHis-TP10 CPP-EcoRI
<400> 18
ccatggggca tcaccaccat caccacgcgg gttacctgct gggcaagatt aatcttaaag 60
cctgcgccgc gtgtgctaag aaaattttgg aattc 95
<210> 19
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> NcoI-6xHis-PolyR CPP-EcoRI
<400> 19
ccatggggca tcaccaccat caccacggcg ggggtggtcg tcgtcgccgt cgccgccgtc 60
gtcgcctcct gctgctggaa ttc 83
<210> 20
<211> 8294
<212> DNA
<213> 人工序列
<220>
<223> pRF144质粒
<400> 20
ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60
aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120
atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180
aaatgtgcga attcgacaag aaatactcca tcggcctgga cattggaacc aactctgtcg 240
gctgggctgt catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa 300
acaccgatcg acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg 360
agactgccga agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga 420
accgaatctg ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt 480
tctttcatcg actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc 540
ccatctttgg caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc 600
acctgcgaaa gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg 660
ctctggcaca catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg 720
acaacagcga tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg 780
aggaaaaccc catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct 840
cgaagagcag acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac 900
tgtttggcaa cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg 960
atctggcgga ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca 1020
acctgcttgc acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt 1080
cggatgctat tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc 1140
tttctgcctc catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg 1200
ctcttgtccg acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga 1260
acggctacgc tggatacatc gacggcggag cctctcagga agagttctac aagttcatca 1320
agccaattct cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg 1380
atctgcttcg gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg 1440
gtgagctgca cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc 1500
gagagaagat cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca 1560
gaggaaactc tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga 1620
acttcgagga agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca 1680
acttcgacaa gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt 1740
actttacagt ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc 1800
ctgccttctt gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc 1860
gaaaggtcac tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca 1920
gcgtcgagat ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc 1980
tgctcaagat tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg 2040
aggacatcgt gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca 2100
agacatacgc tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca 2160
ccggctgggg aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa 2220
agaccattct ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca 2280
ttcacgacga ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg 2340
gcgacagctt gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca 2400
ttctccagac tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg 2460
agaacattgt gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact 2520
cgcgagagcg gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca 2580
aggagcatcc cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc 2640
agaatggtcg agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg 2700
atgtggacca cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc 2760
ttacacgatc cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca 2820
aaaagatgaa gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt 2880
tcgacaatct taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca 2940
tcaagcgtca actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt 3000
ctcggatgaa caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta 3060
ctctcaagtc caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag 3120
agatcaacaa ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc 3180
tcatcaagaa ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg 3240
acgttcgaaa gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact 3300
tcttttactc caacatcatg aactttttca agaccgagat caccttggcc aacggagaga 3360
ttcgaaagag accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg 3420
gtcgagactt tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga 3480
aaaccgaggt tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg 3540
acaagctcat cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc 3600
ctaccgtcgc ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc 3660
tcaagtccgt caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga 3720
atcccatcga cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca 3780
agctgcccaa gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg 3840
ctggcgagct gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct 3900
atctggcttc tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac 3960
tcttcgttga gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt 4020
cgaagcgagt catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc 4080
atcgggacaa acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca 4140
acctgggtgc tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca 4200
catccaccaa ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg 4260
agacccgaat cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc 4320
gaaaggtcta agcggccgct aagcttggct gttttggcgg atgagagaag attttcagcc 4380
tgatacagat taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca 4440
gtagcgcggt ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg 4500
atggtagtgt ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga 4560
aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 4620
ctgagtagga caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg 4680
tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg 4740
acggatggcc tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa 4800
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 4860
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 4920
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 4980
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 5040
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 5100
atcccgtgtt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 5160
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 5220
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 5280
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 5340
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 5400
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 5460
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 5520
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 5580
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 5640
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 5700
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 5760
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 5820
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 5880
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 5940
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6000
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 6060
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6120
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6180
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6240
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 6300
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 6360
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 6420
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 6480
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 6540
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 6600
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 6660
ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 6720
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg 6780
ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg 6840
ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg 6900
agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat 6960
tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt 7020
ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac 7080
aacttgacgg ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg 7140
gccccggtgc attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg 7200
cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata 7260
cgttggtcct cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac 7320
agacgcgacg gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct 7380
gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg 7440
agcgactcgt taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc 7500
agcagctccg aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg 7560
ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac 7620
ggccagttaa gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac 7680
cattcgcgag cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa 7740
atatcacccg gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga 7800
atggtgagat tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga 7860
taaccgttgg cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc 7920
ggcagcaggg gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa 7980
gaaaccaatt gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc 8040
tcgctaacca aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa 8100
gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat 8160
tatttgcacg gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat 8220
cctacctgac gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta 8280
acaggaggaa ttaa 8294
<210> 21
<211> 8183
<212> DNA
<213> 人工序列
<220>
<223> pRF145质粒
<400> 21
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggcatcacc accatcacca cggcgggggt ggtcgtcgtc gccgtcgccg 8160
ccgtcgtcgc ctcctgctgc tgg 8183
<210> 22
<211> 8195
<212> DNA
<213> 人工序列
<220>
<223> pRF146质粒
<400> 22
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggcatcacc accatcacca cgcgggttac ctgctgggca agattaatct 8160
taaagcctgc gccgcgtgtg ctaagaaaat tttgg 8195
<210> 23
<211> 8186
<212> DNA
<213> 人工序列
<220>
<223> pRF162质粒
<400> 23
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggcatcacc accatcacca cttattgatt atcttgcgtc gtcgcatccg 8160
caaacaggcg cacgcacata gcaagg 8186
<210> 24
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> Cas9内切核酸酶识别(CER)结构域
<400> 24
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 25
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 25
tcaaacgatt acccaccctc 20
<210> 26
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 锤头状(HH)核糖酶
<220>
<221> 尚未归类的特征
<222> (1)..(6)
<223> n是a、c、g、或u
<400> 26
nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 43
<210> 27
<211> 68
<212> RNA
<213> 丁型肝炎病毒
<400> 27
ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60
aaugggac 68
<210> 28
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> HH-sgRNA-HDV (RGR) 前-sgRNA表达盒
<400> 28
gtttgactga tgagtccgtg aggacgaaac gagtaagctc gtctcaaacg attacccacc 60
ctcgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 120
agtggcaccg agtcggtgct tttggccggc atggtcccag cctcctcgct ggcgccggct 180
gggcaacatg cttcggcatg gcgaatggga c 211
<210> 29
<211> 20
<212> DNA
<213> 噬菌体T7
<400> 29
taatacgact cactataggg 20
<210> 30
<211> 2875
<212> DNA
<213> 人工序列
<220>
<223> pRF46质粒
<400> 30
agcttgtccc attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg 60
gaccatgccg gccaaaagca ccaccgactc ggtgccactt tttcaagttg ataacggact 120
agccttattt taacttgcta tttctagctc taaaacgagg gtgggtaatc gtttgagacg 180
agcttactcg tttcgtcctc acggactcat cagtcaaacc cctatagtga gtcgtattag 240
aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 300
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 360
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 420
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 480
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 540
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 600
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 660
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 720
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 780
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 840
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 900
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 960
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1020
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1080
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1140
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1200
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1260
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1320
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1380
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 1440
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 1500
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 1560
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 1620
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 1680
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 1740
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 1800
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 1860
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 1920
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 1980
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2040
aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 2100
cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 2160
cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 2220
aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 2280
ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 2340
tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 2400
ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 2460
acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 2520
ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 2580
ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag 2640
attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa 2700
taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 2760
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 2820
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgcca 2875
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> T7正向PCR引物
<400> 31
ccggctcgta tgttgtgtgg 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> gRNArev1反向引物
<400> 32
aaaagcaccg actcggtgcc 20
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> IV-上正向引物
<400> 33
ccacgaaacg acgtttcgac c 21
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> IV-下反向引物
<400> 34
gcaaagactc ggttgatggc 20
<210> 35
<211> 982
<212> DNA
<213> 解脂耶氏酵母
<400> 35
ccacgaaacg acgtttcgac cttaacgacc ctgccgtctc catccatccg accacaatgg 60
aaaagacatt ttcaaacgat tacccaccct ccgggactga ggcccacatc cacatcaacc 120
acacggccca ctcggatgac tcagaggagg tgccctcgca caaggaaaat tacaacacca 180
gtggccacga cctggaggag tccgacccgg ataaccatgt cggtgagacc ctcgaggtca 240
agcgaggtct caagatgcga cacatctcca tgatctcgct tggaggaacc attggtaccg 300
gtctcttcat tggtaccgga ggagctctcc agcaggccgg tccctgtggc gccctcgtcg 360
cctacgtgtt catggccacc attgtctact ctgttgccga gtctcttgga gaactggcta 420
cgtacattcc catcaccggc tcctttgccg tctttactac ccgatatctg tcacagtcgt 480
ttggtgcctc catgggctgg ctatactggt tctcgtgggc gatcaccttc gccatcgagc 540
tcaacaccat tggtcccgtg attgagtact ggactgacgc cgttcctact gctgcctgga 600
ttgccatctt cttcgtcatc ctcactacca tcaacttctt ccccgtgggc ttctatggcg 660
aagtcgagtt ctgggtggcc tccgtgaagg tcattgccat cattggatgg ctcatctacg 720
cgctctgcat gacgtgtgga gcaggtgtaa caggtcctgt gggattcaga tactggaacc 780
accccggacc catgggagac ggaatctgga ccgacggcgt gcccattgtg cgaaacgcgc 840
ccggtcgacg attcatggga tggctcaatt cgctcgttaa cgccgccttc acctaccagg 900
gctgtgagct ggtcggagtc actgccggtg aggcccagaa ccccagaaag tccgtccctc 960
gagccatcaa ccgagtcttt gc 982
<210> 36
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA环形成序列 (GAAA)
<400> 36
gaaa 4
<210> 37
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA环形成序列 (CAAA)
<400> 37
caaa 4
<210> 38
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA环形成序列 (AAAG)
<400> 38
aaag 4
<210> 39
<211> 1434
<212> PRT
<213> 人工序列
<220>
<223> Zebra CPP-Cas9-NLS融合蛋白
<400> 39
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Arg Val Arg Val
1 5 10 15
Ala Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr
20 25 30
Arg Glu Val Ala Ala Ala Lys Ser Ser Glu Asn Asp Arg Leu Arg Leu
35 40 45
Leu Leu Lys Gln Met Cys Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu
50 55 60
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
65 70 75 80
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
85 90 95
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
100 105 110
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
115 120 125
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
130 135 140
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
145 150 155 160
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
165 170 175
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
180 185 190
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
195 200 205
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
210 215 220
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
225 230 235 240
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
245 250 255
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
260 265 270
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
275 280 285
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
290 295 300
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
305 310 315 320
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
325 330 335
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
340 345 350
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
355 360 365
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
370 375 380
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
385 390 395 400
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
405 410 415
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
420 425 430
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
435 440 445
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
450 455 460
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
465 470 475 480
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
485 490 495
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
500 505 510
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
515 520 525
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
530 535 540
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
545 550 555 560
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
565 570 575
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
580 585 590
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
595 600 605
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
610 615 620
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
625 630 635 640
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
645 650 655
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
660 665 670
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
675 680 685
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
690 695 700
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
705 710 715 720
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
725 730 735
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
740 745 750
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
755 760 765
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
770 775 780
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
785 790 795 800
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
805 810 815
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
820 825 830
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
835 840 845
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
850 855 860
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
865 870 875 880
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
885 890 895
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
900 905 910
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
915 920 925
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
930 935 940
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
945 950 955 960
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
965 970 975
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
980 985 990
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
995 1000 1005
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1010 1015 1020
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1025 1030 1035
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1040 1045 1050
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1055 1060 1065
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1070 1075 1080
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1085 1090 1095
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1100 1105 1110
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1115 1120 1125
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1130 1135 1140
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1145 1150 1155
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1160 1165 1170
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1175 1180 1185
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1190 1195 1200
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1205 1210 1215
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1220 1225 1230
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1235 1240 1245
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1250 1255 1260
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1265 1270 1275
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1280 1285 1290
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1295 1300 1305
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1310 1315 1320
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1325 1330 1335
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1340 1345 1350
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1355 1360 1365
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1370 1375 1380
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1385 1390 1395
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1400 1405 1410
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro
1415 1420 1425
Lys Lys Lys Arg Lys Val
1430
<210> 40
<211> 1397
<212> PRT
<213> 人工序列
<220>
<223> PolyR CPP-Cas9-NLS融合蛋白
<400> 40
Gly Gly Gly Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg Leu Leu Leu
1 5 10 15
Leu Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1190 1195 1200
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1220 1225 1230
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1235 1240 1245
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1250 1255 1260
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1265 1270 1275
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1280 1285 1290
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1295 1300 1305
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1310 1315 1320
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1325 1330 1335
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1340 1345 1350
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1355 1360 1365
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1370 1375 1380
Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1385 1390 1395
<210> 41
<211> 1401
<212> PRT
<213> 人工序列
<220>
<223> TP10 CPP-Cas9-NLS融合蛋白
<400> 41
Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu Lys Ala Cys Ala Ala Cys
1 5 10 15
Ala Lys Lys Ile Leu Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp
20 25 30
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
35 40 45
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
50 55 60
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
65 70 75 80
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
85 90 95
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
100 105 110
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
115 120 125
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
130 135 140
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
145 150 155 160
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
165 170 175
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
180 185 190
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
195 200 205
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
210 215 220
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
225 230 235 240
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
245 250 255
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
260 265 270
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
275 280 285
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
290 295 300
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
305 310 315 320
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
325 330 335
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
340 345 350
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
355 360 365
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
370 375 380
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
385 390 395 400
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
405 410 415
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
420 425 430
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
435 440 445
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
450 455 460
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
465 470 475 480
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
485 490 495
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
500 505 510
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
515 520 525
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
530 535 540
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
545 550 555 560
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
565 570 575
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
580 585 590
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
595 600 605
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
610 615 620
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
625 630 635 640
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
645 650 655
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
660 665 670
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
675 680 685
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
690 695 700
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
705 710 715 720
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
725 730 735
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
740 745 750
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
755 760 765
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
770 775 780
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
785 790 795 800
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
805 810 815
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
820 825 830
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
835 840 845
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
850 855 860
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
865 870 875 880
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
885 890 895
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
900 905 910
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
915 920 925
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
930 935 940
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
945 950 955 960
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
965 970 975
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
980 985 990
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
995 1000 1005
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1010 1015 1020
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1025 1030 1035
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1040 1045 1050
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1055 1060 1065
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1070 1075 1080
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1085 1090 1095
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1100 1105 1110
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1115 1120 1125
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1130 1135 1140
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1145 1150 1155
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1160 1165 1170
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1175 1180 1185
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1190 1195 1200
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1205 1210 1215
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1220 1225 1230
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1235 1240 1245
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1250 1255 1260
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1265 1270 1275
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1280 1285 1290
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1295 1300 1305
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1310 1315 1320
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1325 1330 1335
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1340 1345 1350
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1355 1360 1365
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1370 1375 1380
Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1385 1390 1395
Arg Lys Val
1400
<210> 42
<211> 1398
<212> PRT
<213> 人工序列
<220>
<223> pVEC CPP-Cas9-NLS融合蛋白
<400> 42
Leu Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His
1 5 10 15
Ser Lys Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr
20 25 30
Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser
35 40 45
Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
50 55 60
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
65 70 75 80
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
85 90 95
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
100 105 110
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
115 120 125
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
130 135 140
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
145 150 155 160
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
165 170 175
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
180 185 190
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
195 200 205
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
210 215 220
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
225 230 235 240
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
245 250 255
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
260 265 270
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
275 280 285
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
290 295 300
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
305 310 315 320
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
325 330 335
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
340 345 350
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
355 360 365
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
370 375 380
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
385 390 395 400
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
405 410 415
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
420 425 430
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
435 440 445
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
450 455 460
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
465 470 475 480
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
485 490 495
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
500 505 510
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
515 520 525
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
530 535 540
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
545 550 555 560
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
565 570 575
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
580 585 590
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
595 600 605
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
610 615 620
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
625 630 635 640
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
645 650 655
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
660 665 670
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
675 680 685
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
690 695 700
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
705 710 715 720
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
725 730 735
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
740 745 750
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
755 760 765
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
770 775 780
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met
785 790 795 800
Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
805 810 815
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
820 825 830
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
835 840 845
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
850 855 860
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
865 870 875 880
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
885 890 895
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
900 905 910
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
915 920 925
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
930 935 940
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
945 950 955 960
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
965 970 975
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
980 985 990
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
995 1000 1005
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1010 1015 1020
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1025 1030 1035
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1040 1045 1050
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1055 1060 1065
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1070 1075 1080
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1085 1090 1095
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1100 1105 1110
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1115 1120 1125
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1130 1135 1140
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1145 1150 1155
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1160 1165 1170
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1175 1180 1185
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1190 1195 1200
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1205 1210 1215
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1220 1225 1230
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1235 1240 1245
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1250 1255 1260
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1265 1270 1275
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1280 1285 1290
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1295 1300 1305
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1310 1315 1320
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1325 1330 1335
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1340 1345 1350
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1355 1360 1365
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1370 1375 1380
Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1385 1390 1395
<210> 43
<211> 23
<212> DNA
<213> 未知
<220>
<223> Cas9靶位点的实例:PAM序列
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、T、或G
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> n = A、C、T、或G(在说明书中表示为“X”)
<400> 43
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 44
<211> 3
<212> DNA
<213> 未知
<220>
<223> PAM序列NGG
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> n = A、C、T、或G
<400> 44
ngg 3
<210> 45
<211> 6
<212> DNA
<213> 未知
<220>
<223> PAM序列NNAGAA
<220>
<221> 尚未归类的特征
<222> (1)..(2)
<223> n = A、C、T、或G
<400> 45
nnagaa 6
<210> 46
<211> 7
<212> DNA
<213> 未知
<220>
<223> PAM序列NNAGAAW
<220>
<221> 尚未归类的特征
<222> (1)..(2)
<223> n = A、C、T、或G
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> w = A或T
<400> 46
nnagaaw 7
<210> 47
<211> 5
<212> DNA
<213> 未知
<220>
<223> PAM序列NGGNG
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> n = A、C、T、或G
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> n = A、C、T、或G
<400> 47
nggng 5
<210> 48
<211> 8
<212> DNA
<213> 未知
<220>
<223> PAM序列NNNNGATT
<220>
<221> 尚未归类的特征
<222> (1)..(4)
<223> n = A、C、T、或G
<400> 48
nnnngatt 8
<210> 49
<211> 6
<212> DNA
<213> 未知
<220>
<223> PAM序列NAAAAC
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> n = A、C、T、或G
<400> 49
naaaac 6
<210> 50
<211> 2
<212> DNA
<213> 未知
<220>
<223> PAM序列NG
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> n = A、C、T、或G
<400> 50
ng 2
<210> 51
<211> 22
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列实例1
<400> 51
guuuuuguac ucucaagauu ua 22
<210> 52
<211> 15
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列实例2
<400> 52
guuuuuguac ucuca 15
<210> 53
<211> 12
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列实例3
<400> 53
guuuuagagc ua 12
<210> 54
<211> 13
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列实例4
<400> 54
guuuuagagc uag 13
<210> 55
<211> 60
<212> RNA
<213> 化脓性链球菌
<400> 55
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
<210> 56
<211> 45
<212> RNA
<213> 化脓性链球菌
<400> 56
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aagug 45
<210> 57
<211> 32
<212> RNA
<213> 化脓性链球菌
<400> 57
uagcaaguua aaauaaggcu aguccguuau ca 32
<210> 58
<211> 85
<212> RNA
<213> 嗜热链球菌
<400> 58
uaaaucuugc agaagcuaca aagauaaggc uucaugccga aaucaacacc cugucauuuu 60
auggcagggu guuuucguua uuuaa 85
<210> 59
<211> 77
<212> RNA
<213> 嗜热链球菌
<400> 59
ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60
gguguuuucg uuauuua 77
<210> 60
<211> 65
<212> RNA
<213> 嗜热链球菌
<400> 60
ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60
ggugu 65
<210> 61
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例1
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 61
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucaagauu uagaaauaaa ucuugcagaa 60
gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu cauuuuaugg caggguguuu 120
ucguuauuua a 131
<210> 62
<211> 117
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例2
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 62
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60
gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuuucgu uauuuaa 117
<210> 63
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例3
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 63
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60
gcuucaugcc gaaaucaaca cccugucauu uuauggcagg gugu 104
<210> 64
<211> 99
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例4
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 64
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau agcaaguuaa aauaaggcua 60
guccguuauc aacuugaaaa aguggcaccg agucggugc 99
<210> 65
<211> 81
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例5
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 65
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu g 81
<210> 66
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例6
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 66
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuauca 68
<210> 67
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> gRNA实例7
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n = A、C、U、或G
<400> 67
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 68
<211> 10
<212> PRT
<213> 人类免疫缺陷病毒
<400> 68
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 69
<211> 9
<212> PRT
<213> 人类免疫缺陷病毒
<400> 69
Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5
<210> 70
<211> 8
<212> PRT
<213> 人类免疫缺陷病毒
<400> 70
Arg Lys Lys Arg Arg Gln Arg Arg
1 5
<210> 71
<211> 16
<212> PRT
<213> 黑腹果蝇
<400> 71
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 72
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 聚精氨酸CPP实例2
<400> 72
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 73
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 聚精氨酸CPP实例3
<400> 73
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 74
<211> 17
<212> PRT
<213> 小家鼠
<400> 74
Leu Ile Ile Leu Arg Arg Arg Ile Arg Lys Gln Ala His Ala His Ser
1 5 10 15
Lys
<210> 75
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> (KFF)3K CPP
<400> 75
Lys Phe Phe Lys Phe Phe Lys Phe Phe Lys
1 5 10
<210> 76
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> MAP肽CPP
<400> 76
Lys Leu Ala Leu Lys Leu Ala Leu Lys Ala Leu Lys Ala Ala Leu Lys
1 5 10 15
Leu Ala
<210> 77
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> CPP (RRQRRTSKLMKR)
<400> 77
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 78
<211> 33
<212> PRT
<213> 人工序列
<220>
<223> CPP (KALAWEAKLAKALAKALAKHLAKALAKALKCEA)
<400> 78
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 79
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 富脯氨酸CPP重复实例1
<400> 79
Val His Leu Pro Pro Pro
1 5
<210> 80
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 富脯氨酸CPP重复实例2
<400> 80
Val His Arg Pro Pro Pro
1 5
<210> 81
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> MPG肽CPP
<400> 81
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Ser Lys Arg Lys Val
20 25
<210> 82
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> Pep-1肽CPP
<400> 82
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 83
<211> 24
<212> PRT
<213> 智人
<400> 83
Leu Gly Thr Tyr Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln
1 5 10 15
Thr Ala Ile Gly Val Gly Ala Pro
20
<210> 84
<211> 18
<212> PRT
<213> 智人
<400> 84
Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr Thr Gln Asp Phe
1 5 10 15
Asn Lys
<210> 85
<211> 240
<212> PRT
<213> 人工序列
<220>
<223> his标记的dsRED
<400> 85
Met Gly Ser Ser His His His His His His Glu Phe Gly Gly Gly Gly
1 5 10 15
Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val Arg
20 25 30
Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly
35 40 45
Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr
50 55 60
Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe
65 70 75 80
Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro Asp
85 90 95
Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met
100 105 110
Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu
115 120 125
Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn Phe
130 135 140
Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala
145 150 155 160
Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu Ile
165 170 175
His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu Phe
180 185 190
Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr Tyr
195 200 205
Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr
210 215 220
Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe Leu
225 230 235 240
<210> 86
<211> 731
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌密码子优化的dsRED
<400> 86
ccatgggctc cagccatcat catcaccatc atgaattcgg aggtggcggt gcatcctcgg 60
aggatgtgat taaagaattt atgcggttta aagtacgtat ggaaggatcg gtgaatggcc 120
atgaatttga gattgagggt gaaggcgaag gccgcccgta cgaaggaact caaacagcga 180
aattaaaagt tacaaaagga ggtcctctgc cgtttgcctg ggacatcttg agcccgcaat 240
tccagtacgg ttccaaagtg tatgtaaaac accctgcgga tattccggat tataaaaaac 300
tgagttttcc cgaggggttt aaatgggaac gggtgatgaa ttttgaggat ggtggagttg 360
tcaccgtgac ccaggactct agcttacaag acggtagttt catctacaaa gtaaaattta 420
tcggcgtaaa cttcccatcg gacggccccg tcatgcagaa aaagacgatg ggctgggaag 480
ccagcaccga acgtttgtac ccacgggacg gcgttttgaa aggggaaatc cataaggccc 540
ttaaactgaa agacggtggt cactatctcg tggagtttaa atcgatttat atggctaaaa 600
aaccagtaca gcttccgggt tattattacg ttgactccaa attggacatc acatcgcata 660
atgaagatta cacgattgtt gaacagtacg agcgcgccga gggccggcac catctgtttc 720
tgtaaaagct t 731
<210> 87
<211> 4092
<212> DNA
<213> 人工序列
<220>
<223> pBAD/HisB
<400> 87
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat ggggggttct catcatcatc atcatcatgg tatggctagc 360
atgactggtg gacagcaaat gggtcgggat ctgtacgacg atgacgataa ggatccgagc 420
tcgagatctg cagctggtac catatgggaa ttcgaagctt ggctgttttg gcggatgaga 480
gaagattttc agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa 540
tttgcctggc ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa 600
acgccgtagc gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc 660
atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt 720
cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc 780
aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc 840
agaaggccat cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc 900
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 960
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 1020
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 1080
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 1140
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 1200
tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 1260
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 1320
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 1380
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 1440
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 1500
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 1560
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 1620
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 1680
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 1740
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 1800
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 1860
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 1920
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 1980
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 2040
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 2100
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 2160
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 2220
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 2280
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 2340
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 2400
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 2460
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 2520
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 2580
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 2640
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 2700
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 2760
gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 2820
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2880
cagtatacac tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa 2940
cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 3000
tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 3060
ggcagcagat caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg 3120
acgaagcagg gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg 3180
ttaccaatta tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga 3240
actcgctcgg gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt 3300
caaaaccaac attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct 3360
tcgcctggct gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc 3420
ggaaaagatg tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat 3480
caaaattgct gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat 3540
ccatcggtgg atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa 3600
gcagatttat cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt 3660
gcccaaacag gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat 3720
tggcaaatat tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa 3780
cccactggtg ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg 3840
gcgggaacag caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca 3900
ccccctgacc gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga 3960
taaaaaaatc gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat 4020
taaacgagta tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc 4080
cgccattcag ag 4092
<210> 88
<211> 4679
<212> DNA
<213> 人工序列
<220>
<223> pRF161
<400> 88
catgggctcc agccatcatc atcaccatca tgaattcgga ggtggcggtg catcctcgga 60
ggatgtgatt aaagaattta tgcggtttaa agtacgtatg gaaggatcgg tgaatggcca 120
tgaatttgag attgagggtg aaggcgaagg ccgcccgtac gaaggaactc aaacagcgaa 180
attaaaagtt acaaaaggag gtcctctgcc gtttgcctgg gacatcttga gcccgcaatt 240
ccagtacggt tccaaagtgt atgtaaaaca ccctgcggat attccggatt ataaaaaact 300
gagttttccc gaggggttta aatgggaacg ggtgatgaat tttgaggatg gtggagttgt 360
caccgtgacc caggactcta gcttacaaga cggtagtttc atctacaaag taaaatttat 420
cggcgtaaac ttcccatcgg acggccccgt catgcagaaa aagacgatgg gctgggaagc 480
cagcaccgaa cgtttgtacc cacgggacgg cgttttgaaa ggggaaatcc ataaggccct 540
taaactgaaa gacggtggtc actatctcgt ggagtttaaa tcgatttata tggctaaaaa 600
accagtacag cttccgggtt attattacgt tgactccaaa ttggacatca catcgcataa 660
tgaagattac acgattgttg aacagtacga gcgcgccgag ggccggcacc atctgtttct 720
gtaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 780
agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 840
acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 900
tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 960
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 1020
cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 1080
cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 1140
cgtttctaca aactcttttg tttatttttc taaatacatt caaatatgta tccgctcatg 1200
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 1260
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 1320
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 1380
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 1440
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 1500
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 1560
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 1620
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1680
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1740
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1800
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1860
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1920
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 1980
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 2040
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 2100
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 2160
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 2220
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 2280
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 2340
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 2400
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 2460
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 2520
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 2580
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 2640
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 2700
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2760
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2820
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2880
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 2940
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 3000
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 3060
cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt 3120
acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact 3180
gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3240
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3300
ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat caattcgcgc gcgaaggcga 3360
agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa accctatgct 3420
actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg acggctacat 3480
cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg gtgcattttt 3540
taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg acggtggcga 3600
taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg tcctcgcgcc 3660
agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc gacggcgaca 3720
agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg tgatcgctga 3780
tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac tcgttaatcg 3840
cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc tccgaatagc 3900
gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa tgcggctggt 3960
gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag ttaagccatt 4020
catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg cgagcctccg 4080
gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca cccggtcggc 4140
aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg agattgagaa 4200
tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg ttggcctcaa 4260
tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc aggggatcat 4320
tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc aattgtccat 4380
attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta accaaaccgg 4440
taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg acaaaaacgc 4500
gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg cacggcgtca 4560
cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc tgacgctttt 4620
tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga ggaattaac 4679
<210> 89
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> TAT
<400> 89
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys
1 5 10 15
Lys Arg Lys Val
20
<210> 90
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> TLM
<400> 90
Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Lys Lys Lys Arg
1 5 10 15
Lys Val
<210> 91
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> MPG1
<400> 91
Ala Leu Phe Leu Gly Gln Leu Gly Ala Ala Gly Ser Thr Met Gly Ala
1 5 10 15
Pro Lys Lys Lys Arg Lys Val
20
<210> 92
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> pep1
<400> 92
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 93
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> CFFKDEL
<400> 93
Cys Phe Phe Lys Asp Glu Leu
1 5
<210> 94
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> his-TAT大肠杆菌优化的
<400> 94
ccatggggca tcaccatcat catcacggcc gcaaaaaacg tcgtcagcgc cggcgtccgc 60
cccagccgaa aaaacggaaa gtgggcggcg gcgaattc 98
<210> 95
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> his-TLM大肠杆菌优化的
<400> 95
ccatggggca tcaccatcat catcatccgt taagctcgat cttttctcgt atcggtgatc 60
cgccaaaaaa gaaacgcaaa gtagaattc 89
<210> 96
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> his-MPG1大肠杆菌优化的
<400> 96
ccatggggca tcatcatcac catcacggcg ccctgttctt aggccagctg ggcgccgcgg 60
gatccacgat gggtgcgccg aagaaaaagc gcaaagttga attc 104
<210> 97
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> his-pep1大肠杆菌优化的
<400> 97
ccatggggca ccatcaccat caccataaag aaacttggtg ggagacttgg tggaccgaat 60
ggtcccagcc gaagaaaaaa cgcaaggttg aattc 95
<210> 98
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> his-CFFKDEL大肠杆菌优化的
<400> 98
ccatggggca tcaccatcac caccattgtt ttttcaaaga cgaactggaa t 51
<210> 99
<211> 4739
<212> DNA
<213> 人工序列
<220>
<223> pRF224;
<400> 99
catggggcat caccatcatc atcacggccg caaaaaacgt cgtcagcgcc ggcgtccgcc 60
ccagccgaaa aaacggaaag tgggcggcgg cgaattcgga ggtggcggtg catcctcgga 120
ggatgtgatt aaagaattta tgcggtttaa agtacgtatg gaaggatcgg tgaatggcca 180
tgaatttgag attgagggtg aaggcgaagg ccgcccgtac gaaggaactc aaacagcgaa 240
attaaaagtt acaaaaggag gtcctctgcc gtttgcctgg gacatcttga gcccgcaatt 300
ccagtacggt tccaaagtgt atgtaaaaca ccctgcggat attccggatt ataaaaaact 360
gagttttccc gaggggttta aatgggaacg ggtgatgaat tttgaggatg gtggagttgt 420
caccgtgacc caggactcta gcttacaaga cggtagtttc atctacaaag taaaatttat 480
cggcgtaaac ttcccatcgg acggccccgt catgcagaaa aagacgatgg gctgggaagc 540
cagcaccgaa cgtttgtacc cacgggacgg cgttttgaaa ggggaaatcc ataaggccct 600
taaactgaaa gacggtggtc actatctcgt ggagtttaaa tcgatttata tggctaaaaa 660
accagtacag cttccgggtt attattacgt tgactccaaa ttggacatca catcgcataa 720
tgaagattac acgattgttg aacagtacga gcgcgccgag ggccggcacc atctgtttct 780
gtaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 840
agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 900
acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 960
tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 1020
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 1080
cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 1140
cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggcctttttg 1200
cgtttctaca aactcttttg tttatttttc taaatacatt caaatatgta tccgctcatg 1260
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 1320
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 1380
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 1440
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 1500
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 1560
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 1620
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 1680
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1740
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1800
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1860
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1920
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1980
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 2040
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 2100
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 2160
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 2220
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 2280
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 2340
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 2400
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 2460
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 2520
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 2580
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 2640
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 2700
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 2760
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2820
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2880
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2940
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 3000
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 3060
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 3120
cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt 3180
acaatctgct ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact 3240
gggtcatggc tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3300
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3360
ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat caattcgcgc gcgaaggcga 3420
agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg gattctgcaa accctatgct 3480
actccgtcaa gccgtcaatt gtctgattcg ttaccaatta tgacaacttg acggctacat 3540
cattcacttt ttcttcacaa ccggcacgga actcgctcgg gctggccccg gtgcattttt 3600
taaatacccg cgagaaatag agttgatcgt caaaaccaac attgcgaccg acggtggcga 3660
taggcatccg ggtggtgctc aaaagcagct tcgcctggct gatacgttgg tcctcgcgcc 3720
agcttaagac gctaatccct aactgctggc ggaaaagatg tgacagacgc gacggcgaca 3780
agcaaacatg ctgtgcgacg ctggcgatat caaaattgct gtctgccagg tgatcgctga 3840
tgtactgaca agcctcgcgt acccgattat ccatcggtgg atggagcgac tcgttaatcg 3900
cttccatgcg ccgcagtaac aattgctcaa gcagatttat cgccagcagc tccgaatagc 3960
gcccttcccc ttgcccggcg ttaatgattt gcccaaacag gtcgctgaaa tgcggctggt 4020
gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat tgacggccag ttaagccatt 4080
catgccagta ggcgcgcgga cgaaagtaaa cccactggtg ataccattcg cgagcctccg 4140
gatgacgacc gtagtgatga atctctcctg gcgggaacag caaaatatca cccggtcggc 4200
aaacaaattc tcgtccctga tttttcacca ccccctgacc gcgaatggtg agattgagaa 4260
tataaccttt cattcccagc ggtcggtcga taaaaaaatc gagataaccg ttggcctcaa 4320
tcggcgttaa acccgccacc agatgggcat taaacgagta tcccggcagc aggggatcat 4380
tttgcgcttc agccatactt ttcatactcc cgccattcag agaagaaacc aattgtccat 4440
attgcatcag acattgccgt cactgcgtct tttactggct cttctcgcta accaaaccgg 4500
taaccccgct tattaaaagc attctgtaac aaagcgggac caaagccatg acaaaaacgc 4560
gtaacaaaag tgtctataat cacggcagaa aagtccacat tgattatttg cacggcgtca 4620
cactttgcta tgccatagca tttttatcca taagattagc ggatcctacc tgacgctttt 4680
tatcgcaact ctctactgtt tctccatacc cgttttttgg gctaacagga ggaattaac 4739
<210> 100
<211> 4730
<212> DNA
<213> 人工序列
<220>
<223> pRF214
<400> 100
catggggcat caccatcatc atcatccgtt aagctcgatc ttttctcgta tcggtgatcc 60
gccaaaaaag aaacgcaaag tagaattcgg aggtggcggt gcatcctcgg aggatgtgat 120
taaagaattt atgcggttta aagtacgtat ggaaggatcg gtgaatggcc atgaatttga 180
gattgagggt gaaggcgaag gccgcccgta cgaaggaact caaacagcga aattaaaagt 240
tacaaaagga ggtcctctgc cgtttgcctg ggacatcttg agcccgcaat tccagtacgg 300
ttccaaagtg tatgtaaaac accctgcgga tattccggat tataaaaaac tgagttttcc 360
cgaggggttt aaatgggaac gggtgatgaa ttttgaggat ggtggagttg tcaccgtgac 420
ccaggactct agcttacaag acggtagttt catctacaaa gtaaaattta tcggcgtaaa 480
cttcccatcg gacggccccg tcatgcagaa aaagacgatg ggctgggaag ccagcaccga 540
acgtttgtac ccacgggacg gcgttttgaa aggggaaatc cataaggccc ttaaactgaa 600
agacggtggt cactatctcg tggagtttaa atcgatttat atggctaaaa aaccagtaca 660
gcttccgggt tattattacg ttgactccaa attggacatc acatcgcata atgaagatta 720
cacgattgtt gaacagtacg agcgcgccga gggccggcac catctgtttc tgtaaaagct 780
tggctgtttt ggcggatgag agaagatttt cagcctgata cagattaaat cagaacgcag 840
aagcggtctg ataaaacaga atttgcctgg cggcagtagc gcggtggtcc cacctgaccc 900
catgccgaac tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc 960
gagagtaggg aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct 1020
ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgggag 1080
cggatttgaa cgttgcgaag caacggcccg gagggtggcg ggcaggacgc ccgccataaa 1140
ctgccaggca tcaaattaag cagaaggcca tcctgacgga tggccttttt gcgtttctac 1200
aaactctttt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 1260
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 1320
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 1380
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 1440
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 1500
agcactttta aagttctgct atgtggcgcg gtattatccc gtgttgacgc cgggcaagag 1560
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 1620
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 1680
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 1740
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 1800
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 1860
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 1920
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 1980
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 2040
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 2100
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 2160
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 2220
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 2280
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 2340
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 2400
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 2460
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 2520
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 2580
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 2640
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 2700
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 2760
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 2820
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 2880
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 2940
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 3000
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 3060
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt 3120
ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc 3180
tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg 3240
ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 3300
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 3360
cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg cgcgaaggcg aagcggcatg 3420
cataatgtgc ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca 3480
agccgtcaat tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt 3540
tttcttcaca accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc 3600
gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc 3660
gggtggtgct caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga 3720
cgctaatccc taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat 3780
gctgtgcgac gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac 3840
aagcctcgcg tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc 3900
gccgcagtaa caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc 3960
cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat 4020
ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt 4080
aggcgcgcgg acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac 4140
cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt 4200
ctcgtccctg atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt 4260
tcattcccag cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta 4320
aacccgccac cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt 4380
cagccatact tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca 4440
gacattgccg tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc 4500
ttattaaaag cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa 4560
gtgtctataa tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct 4620
atgccatagc atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac 4680
tctctactgt ttctccatac ccgttttttg ggctaacagg aggaattaac 4730
<210> 101
<211> 4745
<212> DNA
<213> 人工序列
<220>
<223> pRF213
<400> 101
catggggcat catcatcacc atcacggcgc cctgttctta ggccagctgg gcgccgcggg 60
atccacgatg ggtgcgccga agaaaaagcg caaagttgaa ttcggaggtg gcggtgcatc 120
ctcggaggat gtgattaaag aatttatgcg gtttaaagta cgtatggaag gatcggtgaa 180
tggccatgaa tttgagattg agggtgaagg cgaaggccgc ccgtacgaag gaactcaaac 240
agcgaaatta aaagttacaa aaggaggtcc tctgccgttt gcctgggaca tcttgagccc 300
gcaattccag tacggttcca aagtgtatgt aaaacaccct gcggatattc cggattataa 360
aaaactgagt tttcccgagg ggtttaaatg ggaacgggtg atgaattttg aggatggtgg 420
agttgtcacc gtgacccagg actctagctt acaagacggt agtttcatct acaaagtaaa 480
atttatcggc gtaaacttcc catcggacgg ccccgtcatg cagaaaaaga cgatgggctg 540
ggaagccagc accgaacgtt tgtacccacg ggacggcgtt ttgaaagggg aaatccataa 600
ggcccttaaa ctgaaagacg gtggtcacta tctcgtggag tttaaatcga tttatatggc 660
taaaaaacca gtacagcttc cgggttatta ttacgttgac tccaaattgg acatcacatc 720
gcataatgaa gattacacga ttgttgaaca gtacgagcgc gccgagggcc ggcaccatct 780
gtttctgtaa aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat 840
taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt 900
ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt 960
ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt 1020
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga 1080
caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag 1140
gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc 1200
tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa tatgtatccg 1260
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 1320
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 1380
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 1440
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 1500
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt 1560
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1620
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1680
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1740
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 1800
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1860
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1920
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1980
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 2040
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 2100
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 2160
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 2220
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 2280
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 2340
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 2400
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 2460
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 2520
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 2580
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2640
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2700
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2760
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2820
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2880
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 2940
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 3000
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 3060
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 3120
ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 3180
ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac 3240
gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg 3300
cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt 3360
gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga 3420
aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc 3480
tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg 3540
ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc 3600
attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg 3660
tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct 3720
cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg 3780
gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat 3840
cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt 3900
taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg 3960
aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg 4020
gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa 4080
gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag 4140
cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg 4200
gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat 4260
tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg 4320
cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg 4380
gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt 4440
gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca 4500
aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa 4560
aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg 4620
gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac 4680
gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta acaggaggaa 4740
ttaac 4745
<210> 102
<211> 4736
<212> DNA
<213> 人工序列
<220>
<223> pRF217
<400> 102
catggggcac catcaccatc accataaaga aacttggtgg gagacttggt ggaccgaatg 60
gtcccagccg aagaaaaaac gcaaggttga attcggaggt ggcggtgcat cctcggagga 120
tgtgattaaa gaatttatgc ggtttaaagt acgtatggaa ggatcggtga atggccatga 180
atttgagatt gagggtgaag gcgaaggccg cccgtacgaa ggaactcaaa cagcgaaatt 240
aaaagttaca aaaggaggtc ctctgccgtt tgcctgggac atcttgagcc cgcaattcca 300
gtacggttcc aaagtgtatg taaaacaccc tgcggatatt ccggattata aaaaactgag 360
ttttcccgag gggtttaaat gggaacgggt gatgaatttt gaggatggtg gagttgtcac 420
cgtgacccag gactctagct tacaagacgg tagtttcatc tacaaagtaa aatttatcgg 480
cgtaaacttc ccatcggacg gccccgtcat gcagaaaaag acgatgggct gggaagccag 540
caccgaacgt ttgtacccac gggacggcgt tttgaaaggg gaaatccata aggcccttaa 600
actgaaagac ggtggtcact atctcgtgga gtttaaatcg atttatatgg ctaaaaaacc 660
agtacagctt ccgggttatt attacgttga ctccaaattg gacatcacat cgcataatga 720
agattacacg attgttgaac agtacgagcg cgccgagggc cggcaccatc tgtttctgta 780
aaagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga ttaaatcaga 840
acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg tggtcccacc 900
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggtctcc 960
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1020
gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc 1080
cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca ggacgcccgc 1140
cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc ctttttgcgt 1200
ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 1260
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 1320
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 1380
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 1440
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 1500
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg 1560
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 1620
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 1680
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 1740
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 1800
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 1860
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 1920
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 1980
ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 2040
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 2100
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 2160
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 2220
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 2280
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 2340
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 2400
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 2460
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 2520
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 2580
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 2640
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 2700
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 2760
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 2820
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 2880
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 2940
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 3000
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 3060
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg 3120
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca 3180
atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg 3240
tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc 3300
tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt 3360
tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg aaggcgaagc 3420
ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc ctatgctact 3480
ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg gctacatcat 3540
tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg cattttttaa 3600
atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg gtggcgatag 3660
gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc tcgcgccagc 3720
ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac ggcgacaagc 3780
aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga tcgctgatgt 3840
actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg ttaatcgctt 3900
ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc gaatagcgcc 3960
cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc ggctggtgcg 4020
cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta agccattcat 4080
gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga gcctccggat 4140
gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc ggtcggcaaa 4200
caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga ttgagaatat 4260
aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg gcctcaatcg 4320
gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg ggatcatttt 4380
gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat tgtccatatt 4440
gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc aaaccggtaa 4500
ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca aaaacgcgta 4560
acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac ggcgtcacac 4620
tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga cgctttttat 4680
cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga attaac 4736
<210> 103
<211> 4694
<212> DNA
<213> 人工序列
<220>
<223> pRF216
<400> 103
catggggcat caccatcacc accattgttt tttcaaagac gaactggaat tcggaggtgg 60
cggtgcatcc tcggaggatg tgattaaaga atttatgcgg tttaaagtac gtatggaagg 120
atcggtgaat ggccatgaat ttgagattga gggtgaaggc gaaggccgcc cgtacgaagg 180
aactcaaaca gcgaaattaa aagttacaaa aggaggtcct ctgccgtttg cctgggacat 240
cttgagcccg caattccagt acggttccaa agtgtatgta aaacaccctg cggatattcc 300
ggattataaa aaactgagtt ttcccgaggg gtttaaatgg gaacgggtga tgaattttga 360
ggatggtgga gttgtcaccg tgacccagga ctctagctta caagacggta gtttcatcta 420
caaagtaaaa tttatcggcg taaacttccc atcggacggc cccgtcatgc agaaaaagac 480
gatgggctgg gaagccagca ccgaacgttt gtacccacgg gacggcgttt tgaaagggga 540
aatccataag gcccttaaac tgaaagacgg tggtcactat ctcgtggagt ttaaatcgat 600
ttatatggct aaaaaaccag tacagcttcc gggttattat tacgttgact ccaaattgga 660
catcacatcg cataatgaag attacacgat tgttgaacag tacgagcgcg ccgagggccg 720
gcaccatctg tttctgtaaa agcttggctg ttttggcgga tgagagaaga ttttcagcct 780
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 840
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 900
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 960
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 1020
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 1080
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 1140
cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 1200
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 1260
agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 1320
cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 1380
gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 1440
cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 1500
tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 1560
ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 1620
ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 1680
atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 1740
cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 1800
atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 1860
gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 1920
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 1980
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 2040
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 2100
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 2160
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 2220
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 2280
atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 2340
aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 2400
aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 2460
ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 2520
ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 2580
tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 2640
ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 2700
acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 2760
gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 2820
cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 2880
aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 2940
atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 3000
gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 3060
gaagagcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata 3120
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 3180
tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 3240
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 3300
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt 3360
cgcgcgcgaa ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc 3420
tgcaaaccct atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca 3480
acttgacggc tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg 3540
ccccggtgca ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc 3600
gaccgacggt ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac 3660
gttggtcctc gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca 3720
gacgcgacgg cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg 3780
ccaggtgatc gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga 3840
gcgactcgtt aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca 3900
gcagctccga atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc 3960
tgaaatgcgg ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg 4020
gccagttaag ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc 4080
attcgcgagc ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa 4140
tatcacccgg tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa 4200
tggtgagatt gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat 4260
aaccgttggc ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg 4320
gcagcagggg atcattttgc gcttcagcca tacttttcat actcccgcca ttcagagaag 4380
aaaccaattg tccatattgc atcagacatt gccgtcactg cgtcttttac tggctcttct 4440
cgctaaccaa accggtaacc ccgcttatta aaagcattct gtaacaaagc gggaccaaag 4500
ccatgacaaa aacgcgtaac aaaagtgtct ataatcacgg cagaaaagtc cacattgatt 4560
atttgcacgg cgtcacactt tgctatgcca tagcattttt atccataaga ttagcggatc 4620
ctacctgacg ctttttatcg caactctcta ctgtttctcc atacccgttt tttgggctaa 4680
caggaggaat taac 4694
<210> 104
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> oligo 36
<400> 104
ccataagatt agcggatcct acc 23
<210> 105
<211> 331
<212> DNA
<213> 人工序列
<220>
<223> His-Zebra PCR
<400> 105
ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60
acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccacgaa 120
tgcgactcag aactggaaat caaacgctat aaacgtgtgc gtgtggcatc ccgtaaatgt 180
cgcgcaaagt ttaaacagct gctgcaacat tatcgtgaag tagcggctgc gaaaagctcc 240
gaaaacgacc gtttacgcct cctcctgaag caaatgtgcg aattcgacaa gaaatactcc 300
atcggcctgg acattggaac caactctgtc g 331
<210> 106
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> His-tp10 PCR
<400> 106
ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60
acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccacgcg 120
ggttacctgc tgggcaagat taatcttaaa gcctgcgccg cgtgtgctaa gaaaattttg 180
gaattcgaca agaaatactc catcggcctg gacattggaa ccaactctgt cg 232
<210> 107
<211> 223
<212> DNA
<213> 人工序列
<220>
<223> His-pVEC PCR
<400> 107
ccataagatt agcggatcct acctgacgct ttttatcgca actctctact gtttctccat 60
acccgttttt tgggctaaca ggaggaatta accatggggc atcaccacca tcaccactta 120
ttgattatct tgcgtcgtcg catccgcaaa caggcgcacg cacatagcaa ggaattcgac 180
aagaaatact ccatcggcct ggacattgga accaactctg tcg 223
<210> 108
<211> 8294
<212> DNA
<213> 人工序列
<220>
<223> pRF144
<400> 108
ccatggggca tcaccaccat caccacgaat gcgactcaga actggaaatc aaacgctata 60
aacgtgtgcg tgtggcatcc cgtaaatgtc gcgcaaagtt taaacagctg ctgcaacatt 120
atcgtgaagt agcggctgcg aaaagctccg aaaacgaccg tttacgcctc ctcctgaagc 180
aaatgtgcga attcgacaag aaatactcca tcggcctgga cattggaacc aactctgtcg 240
gctgggctgt catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa 300
acaccgatcg acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg 360
agactgccga agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga 420
accgaatctg ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt 480
tctttcatcg actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc 540
ccatctttgg caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc 600
acctgcgaaa gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg 660
ctctggcaca catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg 720
acaacagcga tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg 780
aggaaaaccc catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct 840
cgaagagcag acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac 900
tgtttggcaa cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg 960
atctggcgga ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca 1020
acctgcttgc acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt 1080
cggatgctat tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc 1140
tttctgcctc catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg 1200
ctcttgtccg acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga 1260
acggctacgc tggatacatc gacggcggag cctctcagga agagttctac aagttcatca 1320
agccaattct cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg 1380
atctgcttcg gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg 1440
gtgagctgca cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc 1500
gagagaagat cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca 1560
gaggaaactc tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga 1620
acttcgagga agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca 1680
acttcgacaa gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt 1740
actttacagt ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc 1800
ctgccttctt gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc 1860
gaaaggtcac tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca 1920
gcgtcgagat ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc 1980
tgctcaagat tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg 2040
aggacatcgt gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca 2100
agacatacgc tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca 2160
ccggctgggg aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa 2220
agaccattct ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca 2280
ttcacgacga ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg 2340
gcgacagctt gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca 2400
ttctccagac tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg 2460
agaacattgt gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact 2520
cgcgagagcg gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca 2580
aggagcatcc cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc 2640
agaatggtcg agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg 2700
atgtggacca cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc 2760
ttacacgatc cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca 2820
aaaagatgaa gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt 2880
tcgacaatct taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca 2940
tcaagcgtca actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt 3000
ctcggatgaa caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta 3060
ctctcaagtc caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag 3120
agatcaacaa ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc 3180
tcatcaagaa ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg 3240
acgttcgaaa gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact 3300
tcttttactc caacatcatg aactttttca agaccgagat caccttggcc aacggagaga 3360
ttcgaaagag accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg 3420
gtcgagactt tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga 3480
aaaccgaggt tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg 3540
acaagctcat cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc 3600
ctaccgtcgc ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc 3660
tcaagtccgt caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga 3720
atcccatcga cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca 3780
agctgcccaa gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg 3840
ctggcgagct gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct 3900
atctggcttc tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac 3960
tcttcgttga gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt 4020
cgaagcgagt catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc 4080
atcgggacaa acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca 4140
acctgggtgc tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca 4200
catccaccaa ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg 4260
agacccgaat cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc 4320
gaaaggtcta agcggccgct aagcttggct gttttggcgg atgagagaag attttcagcc 4380
tgatacagat taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca 4440
gtagcgcggt ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg 4500
atggtagtgt ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga 4560
aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 4620
ctgagtagga caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg 4680
tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg 4740
acggatggcc tttttgcgtt tctacaaact cttttgttta tttttctaaa tacattcaaa 4800
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 4860
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 4920
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 4980
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 5040
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 5100
atcccgtgtt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 5160
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 5220
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 5280
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 5340
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 5400
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 5460
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 5520
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 5580
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 5640
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 5700
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 5760
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 5820
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 5880
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 5940
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6000
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 6060
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6120
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6180
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6240
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 6300
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 6360
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 6420
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 6480
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 6540
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 6600
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 6660
ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 6720
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt atacactccg 6780
ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc cgctgacgcg 6840
ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg 6900
agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat 6960
tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc aaatggacga agcagggatt 7020
ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct gattcgttac caattatgac 7080
aacttgacgg ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg 7140
gccccggtgc attttttaaa tacccgcgag aaatagagtt gatcgtcaaa accaacattg 7200
cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata 7260
cgttggtcct cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac 7320
agacgcgacg gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct 7380
gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg 7440
agcgactcgt taatcgcttc catgcgccgc agtaacaatt gctcaagcag atttatcgcc 7500
agcagctccg aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg 7560
ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac 7620
ggccagttaa gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac 7680
cattcgcgag cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa 7740
atatcacccg gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga 7800
atggtgagat tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga 7860
taaccgttgg cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc 7920
ggcagcaggg gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa 7980
gaaaccaatt gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc 8040
tcgctaacca aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa 8100
gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat 8160
tatttgcacg gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat 8220
cctacctgac gctttttatc gcaactctct actgtttctc catacccgtt ttttgggcta 8280
acaggaggaa ttaa 8294
<210> 109
<211> 8195
<212> DNA
<213> 人工序列
<220>
<223> pRF162
<400> 109
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggcatcacc accatcacca cgcgggttac ctgctgggca agattaatct 8160
taaagcctgc gccgcgtgtg ctaagaaaat tttgg 8195
<210> 110
<211> 8186
<212> DNA
<213> 人工序列
<220>
<223> pRF146
<400> 110
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggcatcacc accatcacca cttattgatt atcttgcgtc gtcgcatccg 8160
caaacaggcg cacgcacata gcaagg 8186
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> oligo 153
<400> 111
cgacagagtt ggttccaatg 20
<210> 112
<211> 4835
<212> DNA
<213> 人工序列
<220>
<223> pRF186
<400> 112
catggggcat caccaccatc accacgaatg cgactcagaa ctggaaatca aacgctataa 60
acgtgtgcgt gtggcatccc gtaaatgtcg cgcaaagttt aaacagctgc tgcaacatta 120
tcgtgaagta gcggctgcga aaagctccga aaacgaccgt ttacgcctcc tcctgaagca 180
aatgtgcgaa ttcggaggtg gcggtgcatc ctcggaggat gtgattaaag aatttatgcg 240
gtttaaagta cgtatggaag gatcggtgaa tggccatgaa tttgagattg agggtgaagg 300
cgaaggccgc ccgtacgaag gaactcaaac agcgaaatta aaagttacaa aaggaggtcc 360
tctgccgttt gcctgggaca tcttgagccc gcaattccag tacggttcca aagtgtatgt 420
aaaacaccct gcggatattc cggattataa aaaactgagt tttcccgagg ggtttaaatg 480
ggaacgggtg atgaattttg aggatggtgg agttgtcacc gtgacccagg actctagctt 540
acaagacggt agtttcatct acaaagtaaa atttatcggc gtaaacttcc catcggacgg 600
ccccgtcatg cagaaaaaga cgatgggctg ggaagccagc accgaacgtt tgtacccacg 660
ggacggcgtt ttgaaagggg aaatccataa ggcccttaaa ctgaaagacg gtggtcacta 720
tctcgtggag tttaaatcga tttatatggc taaaaaacca gtacagcttc cgggttatta 780
ttacgttgac tccaaattgg acatcacatc gcataatgaa gattacacga ttgttgaaca 840
gtacgagcgc gccgagggcc ggcaccatct gtttctgtaa aagcttggct gttttggcgg 900
atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 960
acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 1020
agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 1080
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 1140
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 1200
cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 1260
ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact cttttgttta 1320
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 1380
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 1440
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 1500
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 1560
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 1620
ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact cggtcgccgc 1680
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 1740
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 1800
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 1860
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 1920
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 1980
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 2040
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 2100
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 2160
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 2220
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 2280
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 2340
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 2400
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 2460
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 2520
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 2580
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 2640
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 2700
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 2760
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 2820
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 2880
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 2940
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 3000
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 3060
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 3120
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 3180
gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg 3240
tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag 3300
ttaagccagt atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc 3360
cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 3420
aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 3480
gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg gcatgcataa tgtgcctgtc 3540
aaatggacga agcagggatt ctgcaaaccc tatgctactc cgtcaagccg tcaattgtct 3600
gattcgttac caattatgac aacttgacgg ctacatcatt cactttttct tcacaaccgg 3660
cacggaactc gctcgggctg gccccggtgc attttttaaa tacccgcgag aaatagagtt 3720
gatcgtcaaa accaacattg cgaccgacgg tggcgatagg catccgggtg gtgctcaaaa 3780
gcagcttcgc ctggctgata cgttggtcct cgcgccagct taagacgcta atccctaact 3840
gctggcggaa aagatgtgac agacgcgacg gcgacaagca aacatgctgt gcgacgctgg 3900
cgatatcaaa attgctgtct gccaggtgat cgctgatgta ctgacaagcc tcgcgtaccc 3960
gattatccat cggtggatgg agcgactcgt taatcgcttc catgcgccgc agtaacaatt 4020
gctcaagcag atttatcgcc agcagctccg aatagcgccc ttccccttgc ccggcgttaa 4080
tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc ttcatccggg cgaaagaacc 4140
ccgtattggc aaatattgac ggccagttaa gccattcatg ccagtaggcg cgcggacgaa 4200
agtaaaccca ctggtgatac cattcgcgag cctccggatg acgaccgtag tgatgaatct 4260
ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac aaattctcgt ccctgatttt 4320
tcaccacccc ctgaccgcga atggtgagat tgagaatata acctttcatt cccagcggtc 4380
ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg cgttaaaccc gccaccagat 4440
gggcattaaa cgagtatccc ggcagcaggg gatcattttg cgcttcagcc atacttttca 4500
tactcccgcc attcagagaa gaaaccaatt gtccatattg catcagacat tgccgtcact 4560
gcgtctttta ctggctcttc tcgctaacca aaccggtaac cccgcttatt aaaagcattc 4620
tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa caaaagtgtc tataatcacg 4680
gcagaaaagt ccacattgat tatttgcacg gcgtcacact ttgctatgcc atagcatttt 4740
tatccataag attagcggat cctacctgac gctttttatc gcaactctct actgtttctc 4800
catacccgtt ttttgggcta acaggaggaa ttaac 4835
<210> 113
<211> 4736
<212> DNA
<213> 人工序列
<220>
<223> pRF192
<400> 113
aattcggagg tggcggtgca tcctcggagg atgtgattaa agaatttatg cggtttaaag 60
tacgtatgga aggatcggtg aatggccatg aatttgagat tgagggtgaa ggcgaaggcc 120
gcccgtacga aggaactcaa acagcgaaat taaaagttac aaaaggaggt cctctgccgt 180
ttgcctggga catcttgagc ccgcaattcc agtacggttc caaagtgtat gtaaaacacc 240
ctgcggatat tccggattat aaaaaactga gttttcccga ggggtttaaa tgggaacggg 300
tgatgaattt tgaggatggt ggagttgtca ccgtgaccca ggactctagc ttacaagacg 360
gtagtttcat ctacaaagta aaatttatcg gcgtaaactt cccatcggac ggccccgtca 420
tgcagaaaaa gacgatgggc tgggaagcca gcaccgaacg tttgtaccca cgggacggcg 480
ttttgaaagg ggaaatccat aaggccctta aactgaaaga cggtggtcac tatctcgtgg 540
agtttaaatc gatttatatg gctaaaaaac cagtacagct tccgggttat tattacgttg 600
actccaaatt ggacatcaca tcgcataatg aagattacac gattgttgaa cagtacgagc 660
gcgccgaggg ccggcaccat ctgtttctgt aaaagcttgg ctgttttggc ggatgagaga 720
agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 780
tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 840
gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 900
caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 960
gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa 1020
cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag 1080
aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttttgtt tatttttcta 1140
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1200
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1260
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1320
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1380
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1440
tggcgcggta ttatcccgtg ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1500
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1560
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1620
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1680
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1740
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1800
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1860
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1920
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 1980
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2040
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2100
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2160
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2220
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2280
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2340
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 2400
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2460
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2520
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2580
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2640
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2700
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2760
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2820
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2880
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 2940
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3000
gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 3060
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 3120
gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 3180
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 3240
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 3300
cagcagatca attcgcgcgc gaaggcgaag cggcatgcat aatgtgcctg tcaaatggac 3360
gaagcaggga ttctgcaaac cctatgctac tccgtcaagc cgtcaattgt ctgattcgtt 3420
accaattatg acaacttgac ggctacatca ttcacttttt cttcacaacc ggcacggaac 3480
tcgctcgggc tggccccggt gcatttttta aatacccgcg agaaatagag ttgatcgtca 3540
aaaccaacat tgcgaccgac ggtggcgata ggcatccggg tggtgctcaa aagcagcttc 3600
gcctggctga tacgttggtc ctcgcgccag cttaagacgc taatccctaa ctgctggcgg 3660
aaaagatgtg acagacgcga cggcgacaag caaacatgct gtgcgacgct ggcgatatca 3720
aaattgctgt ctgccaggtg atcgctgatg tactgacaag cctcgcgtac ccgattatcc 3780
atcggtggat ggagcgactc gttaatcgct tccatgcgcc gcagtaacaa ttgctcaagc 3840
agatttatcg ccagcagctc cgaatagcgc ccttcccctt gcccggcgtt aatgatttgc 3900
ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg ggcgaaagaa ccccgtattg 3960
gcaaatattg acggccagtt aagccattca tgccagtagg cgcgcggacg aaagtaaacc 4020
cactggtgat accattcgcg agcctccgga tgacgaccgt agtgatgaat ctctcctggc 4080
gggaacagca aaatatcacc cggtcggcaa acaaattctc gtccctgatt tttcaccacc 4140
ccctgaccgc gaatggtgag attgagaata taacctttca ttcccagcgg tcggtcgata 4200
aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac ccgccaccag atgggcatta 4260
aacgagtatc ccggcagcag gggatcattt tgcgcttcag ccatactttt catactcccg 4320
ccattcagag aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt 4380
tactggctct tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa 4440
agcgggacca aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa 4500
gtccacattg attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata 4560
agattagcgg atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg 4620
ttttttgggc taacaggagg aattaaccat ggggcatcac caccatcacc acgcgggtta 4680
cctgctgggc aagattaatc ttaaagcctg cgccgcgtgt gctaagaaaa ttttgg 4736
<210> 114
<211> 4727
<212> DNA
<213> 人工序列
<220>
<223> pRF190
<400> 114
aattcggagg tggcggtgca tcctcggagg atgtgattaa agaatttatg cggtttaaag 60
tacgtatgga aggatcggtg aatggccatg aatttgagat tgagggtgaa ggcgaaggcc 120
gcccgtacga aggaactcaa acagcgaaat taaaagttac aaaaggaggt cctctgccgt 180
ttgcctggga catcttgagc ccgcaattcc agtacggttc caaagtgtat gtaaaacacc 240
ctgcggatat tccggattat aaaaaactga gttttcccga ggggtttaaa tgggaacggg 300
tgatgaattt tgaggatggt ggagttgtca ccgtgaccca ggactctagc ttacaagacg 360
gtagtttcat ctacaaagta aaatttatcg gcgtaaactt cccatcggac ggccccgtca 420
tgcagaaaaa gacgatgggc tgggaagcca gcaccgaacg tttgtaccca cgggacggcg 480
ttttgaaagg ggaaatccat aaggccctta aactgaaaga cggtggtcac tatctcgtgg 540
agtttaaatc gatttatatg gctaaaaaac cagtacagct tccgggttat tattacgttg 600
actccaaatt ggacatcaca tcgcataatg aagattacac gattgttgaa cagtacgagc 660
gcgccgaggg ccggcaccat ctgtttctgt aaaagcttgg ctgttttggc ggatgagaga 720
agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt 780
tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 840
gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 900
caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 960
gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa 1020
cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag 1080
aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctcttttgtt tatttttcta 1140
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1200
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1260
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1320
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1380
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1440
tggcgcggta ttatcccgtg ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1500
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1560
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1620
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1680
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1740
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1800
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1860
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1920
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 1980
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2040
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2100
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2160
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2220
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2280
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2340
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 2400
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2460
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2520
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2580
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2640
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2700
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2760
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2820
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2880
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 2940
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3000
gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 3060
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 3120
gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 3180
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 3240
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 3300
cagcagatca attcgcgcgc gaaggcgaag cggcatgcat aatgtgcctg tcaaatggac 3360
gaagcaggga ttctgcaaac cctatgctac tccgtcaagc cgtcaattgt ctgattcgtt 3420
accaattatg acaacttgac ggctacatca ttcacttttt cttcacaacc ggcacggaac 3480
tcgctcgggc tggccccggt gcatttttta aatacccgcg agaaatagag ttgatcgtca 3540
aaaccaacat tgcgaccgac ggtggcgata ggcatccggg tggtgctcaa aagcagcttc 3600
gcctggctga tacgttggtc ctcgcgccag cttaagacgc taatccctaa ctgctggcgg 3660
aaaagatgtg acagacgcga cggcgacaag caaacatgct gtgcgacgct ggcgatatca 3720
aaattgctgt ctgccaggtg atcgctgatg tactgacaag cctcgcgtac ccgattatcc 3780
atcggtggat ggagcgactc gttaatcgct tccatgcgcc gcagtaacaa ttgctcaagc 3840
agatttatcg ccagcagctc cgaatagcgc ccttcccctt gcccggcgtt aatgatttgc 3900
ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg ggcgaaagaa ccccgtattg 3960
gcaaatattg acggccagtt aagccattca tgccagtagg cgcgcggacg aaagtaaacc 4020
cactggtgat accattcgcg agcctccgga tgacgaccgt agtgatgaat ctctcctggc 4080
gggaacagca aaatatcacc cggtcggcaa acaaattctc gtccctgatt tttcaccacc 4140
ccctgaccgc gaatggtgag attgagaata taacctttca ttcccagcgg tcggtcgata 4200
aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac ccgccaccag atgggcatta 4260
aacgagtatc ccggcagcag gggatcattt tgcgcttcag ccatactttt catactcccg 4320
ccattcagag aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt 4380
tactggctct tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa 4440
agcgggacca aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa 4500
gtccacattg attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata 4560
agattagcgg atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg 4620
ttttttgggc taacaggagg aattaaccat ggggcatcac caccatcacc acttattgat 4680
tatcttgcgt cgtcgcatcc gcaaacaggc gcacgcacat agcaagg 4727
<210> 115
<211> 1395
<212> PRT
<213> 人工序列
<220>
<223> his-CFFKDEL-Cas9
<400> 115
Met Gly His His His His His His Cys Phe Phe Lys Asp Glu Leu Glu
1 5 10 15
Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1385 1390 1395
<210> 116
<211> 1412
<212> PRT
<213> 人工序列
<220>
<223> his-MPG1-Cas9
<400> 116
Met Gly His His His His His His Gly Ala Leu Phe Leu Gly Gln Leu
1 5 10 15
Gly Ala Ala Gly Ser Thr Met Gly Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Glu Phe Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser
35 40 45
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
50 55 60
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
65 70 75 80
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
85 90 95
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
100 105 110
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
115 120 125
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
130 135 140
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
145 150 155 160
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
165 170 175
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
180 185 190
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
195 200 205
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
210 215 220
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
225 230 235 240
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
245 250 255
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
260 265 270
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
275 280 285
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
290 295 300
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
305 310 315 320
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
325 330 335
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
340 345 350
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
355 360 365
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
370 375 380
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
385 390 395 400
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
405 410 415
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
420 425 430
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
435 440 445
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
450 455 460
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
465 470 475 480
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
485 490 495
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
500 505 510
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
515 520 525
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
530 535 540
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
545 550 555 560
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
565 570 575
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
580 585 590
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
595 600 605
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
610 615 620
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
625 630 635 640
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
645 650 655
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
660 665 670
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
675 680 685
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg
690 695 700
Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
705 710 715 720
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
725 730 735
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser
740 745 750
Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
755 760 765
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met
770 775 780
Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
785 790 795 800
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
805 810 815
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
820 825 830
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
835 840 845
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn
850 855 860
Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu
865 870 875 880
Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
885 890 895
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met
900 905 910
Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
915 920 925
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu
930 935 940
Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
945 950 955 960
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
965 970 975
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
980 985 990
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
995 1000 1005
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1010 1015 1020
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1025 1030 1035
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1040 1045 1050
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1055 1060 1065
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1070 1075 1080
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1085 1090 1095
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1100 1105 1110
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1115 1120 1125
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1130 1135 1140
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1145 1150 1155
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1160 1165 1170
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1175 1180 1185
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1190 1195 1200
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1205 1210 1215
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1220 1225 1230
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1235 1240 1245
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1250 1255 1260
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1265 1270 1275
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1280 1285 1290
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1295 1300 1305
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1310 1315 1320
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1325 1330 1335
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1340 1345 1350
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1355 1360 1365
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1370 1375 1380
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1385 1390 1395
Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1400 1405 1410
<210> 117
<211> 8237
<212> DNA
<213> 人工序列
<220>
<223> pRF48
<400> 117
aattcgacaa gaaatactcc atcggcctgg acattggaac caactctgtc ggctgggctg 60
tcatcaccga cgagtacaag gtgccctcca agaaattcaa ggtcctcgga aacaccgatc 120
gacactccat caagaaaaac ctcattggtg ccctgttgtt cgattctggc gagactgccg 180
aagctaccag actcaagcga actgctcggc gacgttacac ccgacggaag aaccgaatct 240
gctacctgca ggagatcttt tccaacgaga tggccaaggt ggacgattcg ttctttcatc 300
gactggagga atccttcctc gtcgaggaag acaagaaaca cgagcgtcat cccatctttg 360
gcaacattgt ggacgaggtt gcttaccacg agaagtatcc taccatctac cacctgcgaa 420
agaaactcgt cgattccacc gacaaggcgg atctcagact tatctacctc gctctggcac 480
acatgatcaa gtttcgaggt catttcctca tcgagggcga tctcaatccc gacaacagcg 540
atgtggacaa gctgttcatt cagctcgttc agacctacaa ccagctgttc gaggaaaacc 600
ccatcaatgc ctccggagtc gatgcaaagg ccatcttgtc tgctcgactc tcgaagagca 660
gacgactgga gaacctcatt gcccaacttc ctggcgagaa aaagaacgga ctgtttggca 720
acctcattgc cctttctctt ggtctcacac ccaacttcaa gtccaacttc gatctggcgg 780
aggacgccaa gctccagctg tccaaggaca cctacgacga tgacctcgac aacctgcttg 840
cacagattgg cgatcagtac gccgacctgt ttctcgctgc caagaacctt tcggatgcta 900
ttctcttgtc tgacattctg cgagtcaaca ccgagatcac aaaggctccc ctttctgcct 960
ccatgatcaa gcgatacgac gagcaccatc aggatctcac actgctcaag gctcttgtcc 1020
gacagcaact gcccgagaag tacaaggaga tctttttcga tcagtcgaag aacggctacg 1080
ctggatacat cgacggcgga gcctctcagg aagagttcta caagttcatc aagccaattc 1140
tcgagaagat ggacggaacc gaggaactgc ttgtcaagct caatcgagag gatctgcttc 1200
ggaagcaacg aaccttcgac aacggcagca ttcctcatca gatccacctc ggtgagctgc 1260
acgccattct tcgacgtcag gaagacttct acccctttct caaggacaac cgagagaaga 1320
tcgagaagat tcttaccttt cgaatcccct actatgttgg tcctcttgcc agaggaaact 1380
ctcgatttgc ttggatgact cgaaagtccg aggaaaccat cactccctgg aacttcgagg 1440
aagtcgtgga caagggtgcc tctgcacagt ccttcatcga gcgaatgacc aacttcgaca 1500
agaatctgcc caacgagaag gttcttccca agcattcgct gctctacgag tactttacag 1560
tctacaacga actcaccaaa gtcaagtacg ttaccgaggg aatgcgaaag cctgccttct 1620
tgtctggcga acagaagaaa gccattgtcg atctcctgtt caagaccaac cgaaaggtca 1680
ctgttaagca gctcaaggag gactacttca agaaaatcga gtgtttcgac agcgtcgaga 1740
tttccggagt tgaggaccga ttcaacgcct ctttgggcac ctatcacgat ctgctcaaga 1800
ttatcaagga caaggatttt ctcgacaacg aggaaaacga ggacattctg gaggacatcg 1860
tgctcactct taccctgttc gaagatcggg agatgatcga ggaacgactc aagacatacg 1920
ctcacctgtt cgacgacaag gtcatgaaac aactcaagcg acgtagatac accggctggg 1980
gaagactttc gcgaaagctc atcaacggca tcagagacaa gcagtccgga aagaccattc 2040
tggactttct caagtccgat ggctttgcca accgaaactt catgcagctc attcacgacg 2100
attctcttac cttcaaggag gacatccaga aggcacaagt gtccggtcag ggcgacagct 2160
tgcacgaaca tattgccaac ctggctggtt cgccagccat caagaaaggc attctccaga 2220
ctgtcaaggt tgtcgacgag ctggtgaagg tcatgggacg tcacaagccc gagaacattg 2280
tgatcgagat ggccagagag aaccagacaa ctcaaaaggg tcagaaaaac tcgcgagagc 2340
ggatgaagcg aatcgaggaa ggcatcaagg agctgggatc ccagattctc aaggagcatc 2400
ccgtcgagaa cactcaactg cagaacgaga agctgtatct ctactatctg cagaatggtc 2460
gagacatgta cgtggatcag gaactggaca tcaatcgtct cagcgactac gatgtggacc 2520
acattgtccc tcaatccttt ctcaaggacg attctatcga caacaaggtc cttacacgat 2580
ccgacaagaa cagaggcaag tcggacaacg ttcccagcga agaggtggtc aaaaagatga 2640
agaactactg gcgacagctg ctcaacgcca agctcattac ccagcgaaag ttcgacaatc 2700
ttaccaaggc cgagcgaggc ggtctgtccg agctcgacaa ggctggcttc atcaagcgtc 2760
aactcgtcga gaccagacag atcacaaagc acgtcgcaca gattctcgat tctcggatga 2820
acaccaagta cgacgagaac gacaagctca tccgagaggt caaggtgatt actctcaagt 2880
ccaaactggt ctccgatttc cgaaaggact ttcagttcta caaggtgcga gagatcaaca 2940
attaccacca tgcccacgat gcttacctca acgccgtcgt tggcactgcg ctcatcaaga 3000
aataccccaa gctcgaaagc gagttcgttt acggcgatta caaggtctac gacgttcgaa 3060
agatgattgc caagtccgaa caggagattg gcaaggctac tgccaagtac ttcttttact 3120
ccaacatcat gaactttttc aagaccgaga tcaccttggc caacggagag attcgaaaga 3180
gaccacttat cgagaccaac ggcgaaactg gagagatcgt gtgggacaag ggtcgagact 3240
ttgcaaccgt gcgaaaggtt ctgtcgatgc ctcaggtcaa catcgtcaag aaaaccgagg 3300
ttcagactgg cggattctcc aaggagtcga ttctgcccaa gcgaaactcc gacaagctca 3360
tcgctcgaaa gaaagactgg gatcccaaga aatacggtgg cttcgattct cctaccgtcg 3420
cctattccgt gcttgtcgtt gcgaaggtcg agaagggcaa gtccaaaaag ctcaagtccg 3480
tcaaggagct gctcggaatt accatcatgg agcgatcgag cttcgagaag aatcccatcg 3540
acttcttgga agccaagggt tacaaggagg tcaagaaaga cctcattatc aagctgccca 3600
agtactctct gttcgaactg gagaacggtc gaaagcgtat gctcgcctcc gctggcgagc 3660
tgcagaaggg aaacgagctt gccttgcctt cgaagtacgt caactttctc tatctggctt 3720
ctcactacga gaagctcaag ggttctcccg aggacaacga acagaagcaa ctcttcgttg 3780
agcagcacaa acattacctc gacgagatta tcgagcagat ttccgagttt tcgaagcgag 3840
tcatcctggc tgatgccaac ttggacaagg tgctctctgc ctacaacaag catcgggaca 3900
aacccattcg agaacaggcg gagaacatca ttcacctgtt tactcttacc aacctgggtg 3960
ctcctgcagc tttcaagtac ttcgatacca ctatcgaccg aaagcggtac acatccacca 4020
aggaggttct cgatgccacc ctgattcacc agtccatcac tggcctgtac gagacccgaa 4080
tcgacctgtc tcagcttggt ggcgactcca gagccgatcc caagaaaaag cgaaaggtct 4140
aagcggccgc taagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga 4200
ttaaatcaga acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg 4260
tggtcccacc tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg 4320
tggggtctcc ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag 4380
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 4440
acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca 4500
ggacgcccgc cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc 4560
ctttttgcgt ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc 4620
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 4680
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 4740
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 4800
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 4860
acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt 4920
tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 4980
gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 5040
tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 5100
accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 5160
ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 5220
agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 5280
gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 5340
ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 5400
tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 5460
ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 5520
gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 5580
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 5640
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 5700
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 5760
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 5820
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5880
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5940
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 6000
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 6060
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 6120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 6180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 6240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 6300
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 6360
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 6420
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 6480
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac 6540
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 6600
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 6660
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 6720
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agcagatcaa ttcgcgcgcg 6780
aaggcgaagc ggcatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc 6840
ctatgctact ccgtcaagcc gtcaattgtc tgattcgtta ccaattatga caacttgacg 6900
gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct ggccccggtg 6960
cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt gcgaccgacg 7020
gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat acgttggtcc 7080
tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga cagacgcgac 7140
ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc tgccaggtga 7200
tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg gagcgactcg 7260
ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc cagcagctcc 7320
gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc gctgaaatgc 7380
ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga cggccagtta 7440
agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata ccattcgcga 7500
gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa aatatcaccc 7560
ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg aatggtgaga 7620
ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag ataaccgttg 7680
gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc cggcagcagg 7740
ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga agaaaccaat 7800
tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt ctcgctaacc 7860
aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa agccatgaca 7920
aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga ttatttgcac 7980
ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga tcctacctga 8040
cgctttttat cgcaactctc tactgtttct ccatacccgt tttttgggct aacaggagga 8100
attaaccatg gggggttctc atcatcatca tcatcatggt atggctagca tgactggtgg 8160
acagcaaatg ggtcgggatc tgtacgacga tgacgataag gatccgagct cgagatctgc 8220
agctggtacc atatggg 8237
<210> 118
<211> 8153
<212> DNA
<213> 人工序列
<220>
<223> pRF243
<400> 118
catggggcat caccatcacc accattgttt tttcaaagac gaactggaat tcgacaagaa 60
atactccatc ggcctggaca ttggaaccaa ctctgtcggc tgggctgtca tcaccgacga 120
gtacaaggtg ccctccaaga aattcaaggt cctcggaaac accgatcgac actccatcaa 180
gaaaaacctc attggtgccc tgttgttcga ttctggcgag actgccgaag ctaccagact 240
caagcgaact gctcggcgac gttacacccg acggaagaac cgaatctgct acctgcagga 300
gatcttttcc aacgagatgg ccaaggtgga cgattcgttc tttcatcgac tggaggaatc 360
cttcctcgtc gaggaagaca agaaacacga gcgtcatccc atctttggca acattgtgga 420
cgaggttgct taccacgaga agtatcctac catctaccac ctgcgaaaga aactcgtcga 480
ttccaccgac aaggcggatc tcagacttat ctacctcgct ctggcacaca tgatcaagtt 540
tcgaggtcat ttcctcatcg agggcgatct caatcccgac aacagcgatg tggacaagct 600
gttcattcag ctcgttcaga cctacaacca gctgttcgag gaaaacccca tcaatgcctc 660
cggagtcgat gcaaaggcca tcttgtctgc tcgactctcg aagagcagac gactggagaa 720
cctcattgcc caacttcctg gcgagaaaaa gaacggactg tttggcaacc tcattgccct 780
ttctcttggt ctcacaccca acttcaagtc caacttcgat ctggcggagg acgccaagct 840
ccagctgtcc aaggacacct acgacgatga cctcgacaac ctgcttgcac agattggcga 900
tcagtacgcc gacctgtttc tcgctgccaa gaacctttcg gatgctattc tcttgtctga 960
cattctgcga gtcaacaccg agatcacaaa ggctcccctt tctgcctcca tgatcaagcg 1020
atacgacgag caccatcagg atctcacact gctcaaggct cttgtccgac agcaactgcc 1080
cgagaagtac aaggagatct ttttcgatca gtcgaagaac ggctacgctg gatacatcga 1140
cggcggagcc tctcaggaag agttctacaa gttcatcaag ccaattctcg agaagatgga 1200
cggaaccgag gaactgcttg tcaagctcaa tcgagaggat ctgcttcgga agcaacgaac 1260
cttcgacaac ggcagcattc ctcatcagat ccacctcggt gagctgcacg ccattcttcg 1320
acgtcaggaa gacttctacc cctttctcaa ggacaaccga gagaagatcg agaagattct 1380
tacctttcga atcccctact atgttggtcc tcttgccaga ggaaactctc gatttgcttg 1440
gatgactcga aagtccgagg aaaccatcac tccctggaac ttcgaggaag tcgtggacaa 1500
gggtgcctct gcacagtcct tcatcgagcg aatgaccaac ttcgacaaga atctgcccaa 1560
cgagaaggtt cttcccaagc attcgctgct ctacgagtac tttacagtct acaacgaact 1620
caccaaagtc aagtacgtta ccgagggaat gcgaaagcct gccttcttgt ctggcgaaca 1680
gaagaaagcc attgtcgatc tcctgttcaa gaccaaccga aaggtcactg ttaagcagct 1740
caaggaggac tacttcaaga aaatcgagtg tttcgacagc gtcgagattt ccggagttga 1800
ggaccgattc aacgcctctt tgggcaccta tcacgatctg ctcaagatta tcaaggacaa 1860
ggattttctc gacaacgagg aaaacgagga cattctggag gacatcgtgc tcactcttac 1920
cctgttcgaa gatcgggaga tgatcgagga acgactcaag acatacgctc acctgttcga 1980
cgacaaggtc atgaaacaac tcaagcgacg tagatacacc ggctggggaa gactttcgcg 2040
aaagctcatc aacggcatca gagacaagca gtccggaaag accattctgg actttctcaa 2100
gtccgatggc tttgccaacc gaaacttcat gcagctcatt cacgacgatt ctcttacctt 2160
caaggaggac atccagaagg cacaagtgtc cggtcagggc gacagcttgc acgaacatat 2220
tgccaacctg gctggttcgc cagccatcaa gaaaggcatt ctccagactg tcaaggttgt 2280
cgacgagctg gtgaaggtca tgggacgtca caagcccgag aacattgtga tcgagatggc 2340
cagagagaac cagacaactc aaaagggtca gaaaaactcg cgagagcgga tgaagcgaat 2400
cgaggaaggc atcaaggagc tgggatccca gattctcaag gagcatcccg tcgagaacac 2460
tcaactgcag aacgagaagc tgtatctcta ctatctgcag aatggtcgag acatgtacgt 2520
ggatcaggaa ctggacatca atcgtctcag cgactacgat gtggaccaca ttgtccctca 2580
atcctttctc aaggacgatt ctatcgacaa caaggtcctt acacgatccg acaagaacag 2640
aggcaagtcg gacaacgttc ccagcgaaga ggtggtcaaa aagatgaaga actactggcg 2700
acagctgctc aacgccaagc tcattaccca gcgaaagttc gacaatctta ccaaggccga 2760
gcgaggcggt ctgtccgagc tcgacaaggc tggcttcatc aagcgtcaac tcgtcgagac 2820
cagacagatc acaaagcacg tcgcacagat tctcgattct cggatgaaca ccaagtacga 2880
cgagaacgac aagctcatcc gagaggtcaa ggtgattact ctcaagtcca aactggtctc 2940
cgatttccga aaggactttc agttctacaa ggtgcgagag atcaacaatt accaccatgc 3000
ccacgatgct tacctcaacg ccgtcgttgg cactgcgctc atcaagaaat accccaagct 3060
cgaaagcgag ttcgtttacg gcgattacaa ggtctacgac gttcgaaaga tgattgccaa 3120
gtccgaacag gagattggca aggctactgc caagtacttc ttttactcca acatcatgaa 3180
ctttttcaag accgagatca ccttggccaa cggagagatt cgaaagagac cacttatcga 3240
gaccaacggc gaaactggag agatcgtgtg ggacaagggt cgagactttg caaccgtgcg 3300
aaaggttctg tcgatgcctc aggtcaacat cgtcaagaaa accgaggttc agactggcgg 3360
attctccaag gagtcgattc tgcccaagcg aaactccgac aagctcatcg ctcgaaagaa 3420
agactgggat cccaagaaat acggtggctt cgattctcct accgtcgcct attccgtgct 3480
tgtcgttgcg aaggtcgaga agggcaagtc caaaaagctc aagtccgtca aggagctgct 3540
cggaattacc atcatggagc gatcgagctt cgagaagaat cccatcgact tcttggaagc 3600
caagggttac aaggaggtca agaaagacct cattatcaag ctgcccaagt actctctgtt 3660
cgaactggag aacggtcgaa agcgtatgct cgcctccgct ggcgagctgc agaagggaaa 3720
cgagcttgcc ttgccttcga agtacgtcaa ctttctctat ctggcttctc actacgagaa 3780
gctcaagggt tctcccgagg acaacgaaca gaagcaactc ttcgttgagc agcacaaaca 3840
ttacctcgac gagattatcg agcagatttc cgagttttcg aagcgagtca tcctggctga 3900
tgccaacttg gacaaggtgc tctctgccta caacaagcat cgggacaaac ccattcgaga 3960
acaggcggag aacatcattc acctgtttac tcttaccaac ctgggtgctc ctgcagcttt 4020
caagtacttc gataccacta tcgaccgaaa gcggtacaca tccaccaagg aggttctcga 4080
tgccaccctg attcaccagt ccatcactgg cctgtacgag acccgaatcg acctgtctca 4140
gcttggtggc gactccagag ccgatcccaa gaaaaagcga aaggtctaag cggccgctaa 4200
gcttggctgt tttggcggat gagagaagat tttcagcctg atacagatta aatcagaacg 4260
cagaagcggt ctgataaaac agaatttgcc tggcggcagt agcgcggtgg tcccacctga 4320
ccccatgccg aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca 4380
tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg 4440
cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgg 4500
gagcggattt gaacgttgcg aagcaacggc ccggagggtg gcgggcagga cgcccgccat 4560
aaactgccag gcatcaaatt aagcagaagg ccatcctgac ggatggcctt tttgcgtttc 4620
tacaaactct tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 4680
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 4740
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 4800
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 4860
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 4920
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtgttga cgccgggcaa 4980
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 5040
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 5100
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 5160
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 5220
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 5280
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 5340
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 5400
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 5460
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 5520
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 5580
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 5640
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 5700
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 5760
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 5820
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 5880
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 5940
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 6000
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 6060
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 6120
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 6180
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 6240
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 6300
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 6360
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 6420
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 6480
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 6540
tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 6600
tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca 6660
tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 6720
cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 6780
caccgtcatc accgaaacgc gcgaggcagc agatcaattc gcgcgcgaag gcgaagcggc 6840
atgcataatg tgcctgtcaa atggacgaag cagggattct gcaaacccta tgctactccg 6900
tcaagccgtc aattgtctga ttcgttacca attatgacaa cttgacggct acatcattca 6960
ctttttcttc acaaccggca cggaactcgc tcgggctggc cccggtgcat tttttaaata 7020
cccgcgagaa atagagttga tcgtcaaaac caacattgcg accgacggtg gcgataggca 7080
tccgggtggt gctcaaaagc agcttcgcct ggctgatacg ttggtcctcg cgccagctta 7140
agacgctaat ccctaactgc tggcggaaaa gatgtgacag acgcgacggc gacaagcaaa 7200
catgctgtgc gacgctggcg atatcaaaat tgctgtctgc caggtgatcg ctgatgtact 7260
gacaagcctc gcgtacccga ttatccatcg gtggatggag cgactcgtta atcgcttcca 7320
tgcgccgcag taacaattgc tcaagcagat ttatcgccag cagctccgaa tagcgccctt 7380
ccccttgccc ggcgttaatg atttgcccaa acaggtcgct gaaatgcggc tggtgcgctt 7440
catccgggcg aaagaacccc gtattggcaa atattgacgg ccagttaagc cattcatgcc 7500
agtaggcgcg cggacgaaag taaacccact ggtgatacca ttcgcgagcc tccggatgac 7560
gaccgtagtg atgaatctct cctggcggga acagcaaaat atcacccggt cggcaaacaa 7620
attctcgtcc ctgatttttc accaccccct gaccgcgaat ggtgagattg agaatataac 7680
ctttcattcc cagcggtcgg tcgataaaaa aatcgagata accgttggcc tcaatcggcg 7740
ttaaacccgc caccagatgg gcattaaacg agtatcccgg cagcagggga tcattttgcg 7800
cttcagccat acttttcata ctcccgccat tcagagaaga aaccaattgt ccatattgca 7860
tcagacattg ccgtcactgc gtcttttact ggctcttctc gctaaccaaa ccggtaaccc 7920
cgcttattaa aagcattctg taacaaagcg ggaccaaagc catgacaaaa acgcgtaaca 7980
aaagtgtcta taatcacggc agaaaagtcc acattgatta tttgcacggc gtcacacttt 8040
gctatgccat agcattttta tccataagat tagcggatcc tacctgacgc tttttatcgc 8100
aactctctac tgtttctcca tacccgtttt ttgggctaac aggaggaatt aac 8153
<210> 119
<211> 8204
<212> DNA
<213> 人工序列
<220>
<223> pRF238
<400> 119
catggggcat catcatcacc atcacggcgc cctgttctta ggccagctgg gcgccgcggg 60
atccacgatg ggtgcgccga agaaaaagcg caaagttgaa ttcgacaaga aatactccat 120
cggcctggac attggaacca actctgtcgg ctgggctgtc atcaccgacg agtacaaggt 180
gccctccaag aaattcaagg tcctcggaaa caccgatcga cactccatca agaaaaacct 240
cattggtgcc ctgttgttcg attctggcga gactgccgaa gctaccagac tcaagcgaac 300
tgctcggcga cgttacaccc gacggaagaa ccgaatctgc tacctgcagg agatcttttc 360
caacgagatg gccaaggtgg acgattcgtt ctttcatcga ctggaggaat ccttcctcgt 420
cgaggaagac aagaaacacg agcgtcatcc catctttggc aacattgtgg acgaggttgc 480
ttaccacgag aagtatccta ccatctacca cctgcgaaag aaactcgtcg attccaccga 540
caaggcggat ctcagactta tctacctcgc tctggcacac atgatcaagt ttcgaggtca 600
tttcctcatc gagggcgatc tcaatcccga caacagcgat gtggacaagc tgttcattca 660
gctcgttcag acctacaacc agctgttcga ggaaaacccc atcaatgcct ccggagtcga 720
tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga cgactggaga acctcattgc 780
ccaacttcct ggcgagaaaa agaacggact gtttggcaac ctcattgccc tttctcttgg 840
tctcacaccc aacttcaagt ccaacttcga tctggcggag gacgccaagc tccagctgtc 900
caaggacacc tacgacgatg acctcgacaa cctgcttgca cagattggcg atcagtacgc 960
cgacctgttt ctcgctgcca agaacctttc ggatgctatt ctcttgtctg acattctgcg 1020
agtcaacacc gagatcacaa aggctcccct ttctgcctcc atgatcaagc gatacgacga 1080
gcaccatcag gatctcacac tgctcaaggc tcttgtccga cagcaactgc ccgagaagta 1140
caaggagatc tttttcgatc agtcgaagaa cggctacgct ggatacatcg acggcggagc 1200
ctctcaggaa gagttctaca agttcatcaa gccaattctc gagaagatgg acggaaccga 1260
ggaactgctt gtcaagctca atcgagagga tctgcttcgg aagcaacgaa ccttcgacaa 1320
cggcagcatt cctcatcaga tccacctcgg tgagctgcac gccattcttc gacgtcagga 1380
agacttctac ccctttctca aggacaaccg agagaagatc gagaagattc ttacctttcg 1440
aatcccctac tatgttggtc ctcttgccag aggaaactct cgatttgctt ggatgactcg 1500
aaagtccgag gaaaccatca ctccctggaa cttcgaggaa gtcgtggaca agggtgcctc 1560
tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag aatctgccca acgagaaggt 1620
tcttcccaag cattcgctgc tctacgagta ctttacagtc tacaacgaac tcaccaaagt 1680
caagtacgtt accgagggaa tgcgaaagcc tgccttcttg tctggcgaac agaagaaagc 1740
cattgtcgat ctcctgttca agaccaaccg aaaggtcact gttaagcagc tcaaggagga 1800
ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt tccggagttg aggaccgatt 1860
caacgcctct ttgggcacct atcacgatct gctcaagatt atcaaggaca aggattttct 1920
cgacaacgag gaaaacgagg acattctgga ggacatcgtg ctcactctta ccctgttcga 1980
agatcgggag atgatcgagg aacgactcaa gacatacgct cacctgttcg acgacaaggt 2040
catgaaacaa ctcaagcgac gtagatacac cggctgggga agactttcgc gaaagctcat 2100
caacggcatc agagacaagc agtccggaaa gaccattctg gactttctca agtccgatgg 2160
ctttgccaac cgaaacttca tgcagctcat tcacgacgat tctcttacct tcaaggagga 2220
catccagaag gcacaagtgt ccggtcaggg cgacagcttg cacgaacata ttgccaacct 2280
ggctggttcg ccagccatca agaaaggcat tctccagact gtcaaggttg tcgacgagct 2340
ggtgaaggtc atgggacgtc acaagcccga gaacattgtg atcgagatgg ccagagagaa 2400
ccagacaact caaaagggtc agaaaaactc gcgagagcgg atgaagcgaa tcgaggaagg 2460
catcaaggag ctgggatccc agattctcaa ggagcatccc gtcgagaaca ctcaactgca 2520
gaacgagaag ctgtatctct actatctgca gaatggtcga gacatgtacg tggatcagga 2580
actggacatc aatcgtctca gcgactacga tgtggaccac attgtccctc aatcctttct 2640
caaggacgat tctatcgaca acaaggtcct tacacgatcc gacaagaaca gaggcaagtc 2700
ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag aactactggc gacagctgct 2760
caacgccaag ctcattaccc agcgaaagtt cgacaatctt accaaggccg agcgaggcgg 2820
tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa ctcgtcgaga ccagacagat 2880
cacaaagcac gtcgcacaga ttctcgattc tcggatgaac accaagtacg acgagaacga 2940
caagctcatc cgagaggtca aggtgattac tctcaagtcc aaactggtct ccgatttccg 3000
aaaggacttt cagttctaca aggtgcgaga gatcaacaat taccaccatg cccacgatgc 3060
ttacctcaac gccgtcgttg gcactgcgct catcaagaaa taccccaagc tcgaaagcga 3120
gttcgtttac ggcgattaca aggtctacga cgttcgaaag atgattgcca agtccgaaca 3180
ggagattggc aaggctactg ccaagtactt cttttactcc aacatcatga actttttcaa 3240
gaccgagatc accttggcca acggagagat tcgaaagaga ccacttatcg agaccaacgg 3300
cgaaactgga gagatcgtgt gggacaaggg tcgagacttt gcaaccgtgc gaaaggttct 3360
gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt cagactggcg gattctccaa 3420
ggagtcgatt ctgcccaagc gaaactccga caagctcatc gctcgaaaga aagactggga 3480
tcccaagaaa tacggtggct tcgattctcc taccgtcgcc tattccgtgc ttgtcgttgc 3540
gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc aaggagctgc tcggaattac 3600
catcatggag cgatcgagct tcgagaagaa tcccatcgac ttcttggaag ccaagggtta 3660
caaggaggtc aagaaagacc tcattatcaa gctgcccaag tactctctgt tcgaactgga 3720
gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg cagaagggaa acgagcttgc 3780
cttgccttcg aagtacgtca actttctcta tctggcttct cactacgaga agctcaaggg 3840
ttctcccgag gacaacgaac agaagcaact cttcgttgag cagcacaaac attacctcga 3900
cgagattatc gagcagattt ccgagttttc gaagcgagtc atcctggctg atgccaactt 3960
ggacaaggtg ctctctgcct acaacaagca tcgggacaaa cccattcgag aacaggcgga 4020
gaacatcatt cacctgttta ctcttaccaa cctgggtgct cctgcagctt tcaagtactt 4080
cgataccact atcgaccgaa agcggtacac atccaccaag gaggttctcg atgccaccct 4140
gattcaccag tccatcactg gcctgtacga gacccgaatc gacctgtctc agcttggtgg 4200
cgactccaga gccgatccca agaaaaagcg aaaggtctaa gcggccgcta agcttggctg 4260
ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 4320
tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 4380
gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt 4440
agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 4500
ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt 4560
tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca 4620
ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc 4680
ttttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 4740
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 4800
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 4860
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 4920
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 4980
tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg acgccgggca agagcaactc 5040
ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 5100
catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 5160
aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 5220
ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 5280
gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 5340
aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 5400
gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 5460
gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 5520
gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 5580
gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 5640
gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 5700
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 5760
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5820
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5880
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5940
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 6000
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 6060
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 6120
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 6180
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 6240
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 6300
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 6360
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6420
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 6480
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 6540
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt 6600
acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 6660
gccgcatagt taagccagta tacactccgc tatcgctacg tgactgggtc atggctgcgc 6720
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg 6780
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat 6840
caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa ggcgaagcgg catgcataat 6900
gtgcctgtca aatggacgaa gcagggattc tgcaaaccct atgctactcc gtcaagccgt 6960
caattgtctg attcgttacc aattatgaca acttgacggc tacatcattc actttttctt 7020
cacaaccggc acggaactcg ctcgggctgg ccccggtgca ttttttaaat acccgcgaga 7080
aatagagttg atcgtcaaaa ccaacattgc gaccgacggt ggcgataggc atccgggtgg 7140
tgctcaaaag cagcttcgcc tggctgatac gttggtcctc gcgccagctt aagacgctaa 7200
tccctaactg ctggcggaaa agatgtgaca gacgcgacgg cgacaagcaa acatgctgtg 7260
cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc gctgatgtac tgacaagcct 7320
cgcgtacccg attatccatc ggtggatgga gcgactcgtt aatcgcttcc atgcgccgca 7380
gtaacaattg ctcaagcaga tttatcgcca gcagctccga atagcgccct tccccttgcc 7440
cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg ctggtgcgct tcatccgggc 7500
gaaagaaccc cgtattggca aatattgacg gccagttaag ccattcatgc cagtaggcgc 7560
gcggacgaaa gtaaacccac tggtgatacc attcgcgagc ctccggatga cgaccgtagt 7620
gatgaatctc tcctggcggg aacagcaaaa tatcacccgg tcggcaaaca aattctcgtc 7680
cctgattttt caccaccccc tgaccgcgaa tggtgagatt gagaatataa cctttcattc 7740
ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc ctcaatcggc gttaaacccg 7800
ccaccagatg ggcattaaac gagtatcccg gcagcagggg atcattttgc gcttcagcca 7860
tacttttcat actcccgcca ttcagagaag aaaccaattg tccatattgc atcagacatt 7920
gccgtcactg cgtcttttac tggctcttct cgctaaccaa accggtaacc ccgcttatta 7980
aaagcattct gtaacaaagc gggaccaaag ccatgacaaa aacgcgtaac aaaagtgtct 8040
ataatcacgg cagaaaagtc cacattgatt atttgcacgg cgtcacactt tgctatgcca 8100
tagcattttt atccataaga ttagcggatc ctacctgacg ctttttatcg caactctcta 8160
ctgtttctcc atacccgttt tttgggctaa caggaggaat taac 8204
<210> 120
<211> 1149
<212> DNA
<213> 大肠杆菌
<220>
<221> 尚未归类的特征
<222> (1)..(1149)
<223> galK基因
<400> 120
atgagtctga aagaaaaaac acaatctctg tttgccaacg catttggcta ccctgccact 60
cacaccattc aggcgcctgg ccgcgtgaat ttgattggtg aacacaccga ctacaacgac 120
ggtttcgttc tgccctgcgc gattgattat caaaccgtga tcagttgtgc accacgcgat 180
gaccgtaaag ttcgcgtgat ggcagccgat tatgaaaatc agctcgacga gttttccctc 240
gatgcgccca ttgtcgcaca tgaaaactat caatgggcta actacgttcg tggcgtggtg 300
aaacatctgc aactgcgtaa caacagcttc ggcggcgtgg acatggtgat cagcggcaat 360
gtgccgcagg gtgccgggtt aagttcttcc gcttcactgg aagtcgcggt cggaaccgta 420
ttgcagcagc tttatcatct gccgctggac ggcgcacaaa tcgcgcttaa cggtcaggaa 480
gcagaaaacc agtttgtagg ctgtaactgc gggatcatgg atcagctaat ttccgcgctc 540
ggcaagaaag atcatgcctt gctgatcgat tgccgctcac tggggaccaa agcagtttcc 600
atgcccaaag gtgtggctgt cgtcatcatc aacagtaact tcaaacgtac cctggttggc 660
agcgaataca acacccgtcg tgaacagtgc gaaaccggtg cgcgtttctt ccagcagcca 720
gccctgcgtg atgtcaccat tgaagagttc aacgctgttg cgcatgaact ggacccgatc 780
gtggcaaaac gcgtgcgtca tatactgact gaaaacgccc gcaccgttga agctgccagc 840
gcgctggagc aaggcgacct gaaacgtatg ggcgagttga tggcggagtc tcatgcctct 900
atgcgcgatg atttcgaaat caccgtgccg caaattgaca ctctggtaga aatcgtcaaa 960
gctgtgattg gcgacaaagg tggcgtacgc atgaccggcg gcggatttgg cggctgtatc 1020
gtcgcgctga tcccggaaga gctggtgcct gccgtacagc aagctgtcgc tgaacaatat 1080
gaagcaaaaa caggtattaa agagactttt tacgtttgta aaccatcaca aggagcagga 1140
cagtgctga 1149
<210> 121
<211> 1017
<212> DNA
<213> 大肠杆菌
<400> 121
atgagagttc tggttaccgg tggtagcggt tacattggaa gtcatacctg tgtgcaatta 60
ctgcaaaacg gtcatgatgt catcattctt gataacctct gtaacagtaa gcgcagcgta 120
ctgcctgtta tcgagcgttt aggcggcaaa catccaacgt ttgttgaagg cgatattcgt 180
aacgaagcgt tgatgaccga gatcctgcac gatcacgcta tcgacaccgt gatccacttc 240
gccgggctga aagccgtggg cgaatcggta caaaaaccgc tggaatatta cgacaacaat 300
gtcaacggca ctctgcgcct gattagcgcc atgcgcgccg ctaacgtcaa aaactttatt 360
tttagctcct ccgccaccgt ttatggcgat cagcccaaaa ttccatacgt tgaaagcttc 420
ccgaccggca caccgcaaag cccttacggc aaaagcaagc tgatggtgga acagatcctc 480
accgatctgc aaaaagccca gccggactgg agcattgccc tgctgcgcta cttcaacccg 540
gttggcgcgc atccgtcggg cgatatgggc gaagatccgc aaggcattcc gaataacctg 600
atgccataca tcgcccaggt tgctgtaggc cgtcgcgact cgctggcgat ttttggtaac 660
gattatccga ccgaagatgg tactggcgta cgcgattaca tccacgtaat ggatctggcg 720
gacggtcacg tcgtggcgat ggaaaaactg gcgaacaagc caggcgtaca catctacaac 780
ctcggcgctg gcgtaggcaa cagcgtgctg gacgtggtta atgccttcag caaagcctgc 840
ggcaaaccgg ttaattatca ttttgcaccg cgtcgcgagg gcgaccttcc ggcctactgg 900
gcggacgcca gcaaagccga ccgtgaactg aactggcgcg taacgcgcac actcgatgaa 960
atggcgcagg acacctggca ctggcagtca cgccatccac agggatatcc cgattaa 1017
<210> 122
<211> 1047
<212> DNA
<213> 大肠杆菌
<400> 122
atgacgcaat ttaatcccgt tgatcatcca catcgccgct acaacccgct caccgggcaa 60
tggattctgg tttcaccgca ccgcgctaag cgcccctggc agggggcgca ggaaacgcca 120
gccaaacagg tgttacctgc gcacgatcca gattgcttcc tctgcgcagg taatgtgcgg 180
gtgacaggcg ataaaaaccc cgattacacc gggacttacg ttttcactaa tgactttgcg 240
gctttgatgt ctgacacgcc agatgcgcca gaaagtcacg atccgctgat gcgttgccag 300
agcgcgcgcg gcaccagccg ggtgatctgc ttttcaccgg atcacagtaa aacgctgcca 360
gagctcagcg ttgcagcatt gacggaaatc gtcaaaacct ggcaggagca aaccgcagaa 420
ctggggaaaa cgtacccatg ggtgcaggtt tttgaaaaca aaggcgcggc gatgggctgc 480
tctaacccgc atccgcacgg tcagatttgg gcaaatagct tcctgcctaa cgaagctgag 540
cgcgaagacc gcctgcaaaa agaatatttt gccgaacaga aatcaccaat gctggtggat 600
tatgttcagc gcgagctggc agacggtagc cgtaccgttg tcgaaaccga acactggtta 660
gccgtcgtgc cttactgggc tgcctggccg ttcgaaacgc tactgctgcc caaagcccac 720
gttttacgga tcaccgattt gaccgacgcc cagcgcagcg atctggcgct ggcgttgaaa 780
aagctgacca gtcgttatga caacctcttc cagtgctcct tcccctactc tatgggctgg 840
cacggcgcgc catttaatgg cgaagagaat caacactggc agctgcacgc gcacttttat 900
ccgcctctgc tgcgctccgc caccgtacgt aaatttatgg ttggttatga aatgctggca 960
gagacccagc gagacctgac cgcagaacag gcagcagagc gtttgcgcgc agtcagcgat 1020
atccattttc gcgaatccgg agtgtaa 1047
<210> 123
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> CER结构域l
<400> 123
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 124
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 编码CER的DNA PCR
<400> 124
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 125
<211> 11714
<212> DNA
<213> 人工序列
<220>
<223> pRF291
<400> 125
cgataaaaaa caaaaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 60
tagccttatt ttaacttgct atttctagct ctaaaacgca ggtgtaaaaa taaaaaggcc 120
tgcgattacc agcaggcctg ttattaacct aagccttagg acgcttcacg ccatacttgg 180
aacgagcctg cttacggtct ttaacgccgg agcagtcaag cgcaccacgt acggtgtggt 240
aacgaacacc cgggaggtct ttaacacgac cgccacggat caggatcacg gagtgctcct 300
gcaggttgtg accttcacca ccgatgtagg aagtcacttc gaaaccgtta gtcagacgaa 360
cacggcatac tttacgcagc gcggagttcg gttttttagg agtggtagta tatacacgag 420
tacatacgcc acgtttttgc gggcatgctt ccagcgcagg cacgttgctt ttcgcaactt 480
tgcgagcacg tggtttgcgt accagctggt taactgttgc cattaaatag ctcctggttt 540
tagcttttgc ttcgtaaaca cgtaataaaa cgtcctcaca caatatgagg acgccgaatt 600
tagggcgatg ccgaaaaggt gtcaagaaat atacaacgat cccgccatca cctgcgtccc 660
attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg gaccatgccg 720
gccattattt tgcgttaagt ttctaatcat cacgaaatta tctatcaaaa ataactaggt 780
cccaccgaga ttcgaactcg ggaccttaag atttgcaatc tcacgcgcta ccgctgtgcc 840
ataggaccga agttaaaatt tggccaaaga aggacctggg caccctggac tgtgggttag 900
ggtaatattc cttatggaga caatgggcta gggtaaatta cctaaaatgg gtcgataaag 960
aggggtgttc ccagttggga agtgtaattg aagacggggt caaaaaagaa aatcaaaaaa 1020
aatttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt 1080
caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt 1140
ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg 1200
tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt 1260
taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca 1320
gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg 1380
ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt 1440
ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca 1500
gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg 1560
gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc 1620
tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc 1680
ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc 1740
tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg 1800
atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata 1860
tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg 1920
gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg 1980
cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc 2040
agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag 2100
gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga 2160
ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat 2220
atgttatggt aatagttacg agttagttga acttatagat agactggact atacggctat 2280
cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg 2340
tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc 2400
gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa 2460
gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg 2520
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 2580
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 2640
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 2700
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 2760
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 2820
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 2880
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 2940
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 3000
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 3060
accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 3120
gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 3180
cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 3240
gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 3300
tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 3360
cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 3420
ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccatctccga 3480
aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 3540
cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 3600
gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 3660
cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 3720
agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 3780
aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 3840
gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 3900
gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 3960
attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 4020
tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 4080
cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 4140
gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 4200
ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 4260
cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 4320
cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 4380
atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 4440
tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 4500
gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 4560
aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 4620
gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 4680
ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 4740
actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 4800
atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 4860
attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 4920
gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 4980
gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 5040
ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 5100
ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 5160
gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 5220
ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 5280
actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 5340
gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 5400
cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 5460
cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 5520
cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 5580
cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 5640
tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 5700
aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 5760
cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 5820
caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 5880
aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 5940
tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 6000
aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 6060
aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 6120
aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 6180
tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 6240
agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 6300
tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 6360
gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 6420
atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 6480
gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 6540
gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 6600
gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 6660
aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 6720
ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 6780
tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 6840
gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 6900
gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 6960
aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 7020
gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 7080
aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 7140
atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 7200
taagcggccg caagtgtgga tggggaagtg agtgcccggt tctgtgtgca caattggcaa 7260
tccaagatgg atggattcaa cacagggata tagcgagcta cgtggtggtg cgaggatata 7320
gcaacggata tttatgtttg acacttgaga atgtacgata caagcactgt ccaagtacaa 7380
tactaaacat actgtacata ctcatactcg tacccgggca acggtttcac ttgagtgcag 7440
tggctagtgc tcttactcgt acagtgtgca atactgcgta tcatagtctt tgatgtatat 7500
cgtattcatt catgttagtt gcgtacgagc cggaagcata aagtgtaaag cctggggtgc 7560
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7620
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 7680
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7740
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7800
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7860
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 7920
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 7980
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8040
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8100
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8160
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8220
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8280
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 8340
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8400
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8460
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8520
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 8580
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8640
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8700
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8760
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8820
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 8880
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 8940
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9000
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9060
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9120
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9180
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9240
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9300
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9360
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9420
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9480
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9540
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9600
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 9660
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 9720
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 9780
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 9840
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 9900
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 9960
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10020
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 10080
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 10140
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10200
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 10260
ggcgaattgg gtaccgggcc ccccctcgag gtcgatggtg tcgataagct tgatatcgaa 10320
ttcatgtcac acaaaccgat cttcgcctca aggaaaccta attctacatc cgagagactg 10380
ccgagatcca gtctacactg attaattttc gggccaataa tttaaaaaaa tcgtgttata 10440
taatattata tgtattatat atatacatca tgatgatact gacagtcatg tcccattgct 10500
aaatagacag actccatctg ccgcctccaa ctgatgttct caatatttaa ggggtcatct 10560
cgcattgttt aataataaac agactccatc taccgcctcc aaatgatgtt ctcaaaatat 10620
attgtatgaa cttattttta ttacttagta ttattagaca acttacttgc tttatgaaaa 10680
acacttccta tttaggaaac aatttataat ggcagttcgt tcatttaaca atttatgtag 10740
aataaatgtt ataaatgcgt atgggaaatc ttaaatatgg atagcataaa tgatatctgc 10800
attgcctaat tcgaaatcaa cagcaacgaa aaaaatccct tgtacaacat aaatagtcat 10860
cgagaaatat caactatcaa agaacagcta ttcacacgtt actattgaga ttattattgg 10920
acgagaatca cacactcaac tgtctttctc tcttctagaa atacaggtac aagtatgtac 10980
tattctcatt gttcatactt ctagtcattt catcccacat attccttgga tttctctcca 11040
atgaatgaca ttctatcttg caaattcaac aattataata agatatacca aagtagcggt 11100
atagtggcaa tcaaaaagct tctctggtgt gcttctcgta tttattttta ttctaatgat 11160
ccattaaagg tatatattta tttcttgtta tataatcctt ttgtttatta catgggctgg 11220
atacataaag gtattttgat ttaatttttt gcttaaattc aatcccccct cgttcagtgt 11280
caactgtaat ggtaggaaat taccatactt ttgaagaagc aaaaaaaatg aaagaaaaaa 11340
aaaatcgtat ttccaggtta gacgttccgc agaatctaga atgcggtatg cggtacattg 11400
ttcttcgaac gtaaaagttg cgctccctga gatattgtac atttttgctt ttacaagtac 11460
aagtacatcg tacaactatg tactactgtt gatgcatcca caacagtttg ttttgttttt 11520
ttttgttttt tttttttcta atgattcatt accgctatgt atacctactt gtacttgtag 11580
taagccgggt tattggcgtt caattaatca tagacttatg aatctgcacg gtgtgcgctg 11640
cgagttactt ttagcttatg catgctactt gggtgtaata ttgggatctg ttcggaaatc 11700
aacggatgct caat 11714
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CER正向
<400> 126
gttttagagc tagaaatagc 20
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 通用反向
<400> 127
gcaccgactc ggtgccactt 20
<210> 128
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 通用正向T7引物
<400> 128
taatacgact cactatag 18
<210> 129
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> galK2-1正向引物
<400> 129
taatacgact cactatagat cagcggcaat gtgc 34
<210> 130
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> galK2-1反向引物
<400> 130
ttctagctct aaaactgcgg cacattgccg ctga 34
<210> 131
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> galK2-1 sgRNA体外转录模板
<400> 131
taatacgact cactatagat cagcggcaat gtgccgcagt tttagagcta gaaatagcaa 60
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgc 114
<210> 132
<211> 18
<212> DNA
<213> T7噬菌体
<400> 132
taatacgact cactatag 18
<210> 133
<211> 20
<212> DNA
<213> 大肠杆菌
<400> 133
atcagcggca atgtgccgca 20
<210> 134
<211> 23
<212> DNA
<213> 大肠杆菌
<400> 134
atcagcggca atgtgccgca ggg 23
<210> 135
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> galK2-1 sgRNA
<400> 135
aucagcggca augugccgca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 136
<211> 262
<212> PRT
<213> 人工序列
<220>
<223> his-MPG1-dsREDexpress
<400> 136
Met Gly His His His His His His Gly Ala Leu Phe Leu Gly Gln Leu
1 5 10 15
Gly Ala Ala Gly Ser Thr Met Gly Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Glu Phe Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe
35 40 45
Met Arg Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe
50 55 60
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
65 70 75 80
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
85 90 95
Ile Leu Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His
100 105 110
Pro Ala Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe
115 120 125
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
130 135 140
Thr Gln Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys
145 150 155 160
Phe Ile Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
165 170 175
Thr Met Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly
180 185 190
Val Leu Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly
195 200 205
His Tyr Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val
210 215 220
Gln Leu Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser
225 230 235 240
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
245 250 255
Arg His His Leu Phe Leu
260
<210> 137
<211> 256
<212> PRT
<213> 人工序列
<220>
<223> pVEC-dsREDexpress
<400> 137
Met Gly His His His His His His Leu Leu Ile Ile Leu Arg Arg Arg
1 5 10 15
Ile Arg Lys Gln Ala His Ala His Ser Lys Glu Phe Gly Gly Gly Gly
20 25 30
Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val Arg
35 40 45
Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly
50 55 60
Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val Thr
65 70 75 80
Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln Phe
85 90 95
Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro Asp
100 105 110
Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val Met
115 120 125
Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser Leu
130 135 140
Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn Phe
145 150 155 160
Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu Ala
165 170 175
Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu Ile
180 185 190
His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu Phe
195 200 205
Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr Tyr
210 215 220
Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr
225 230 235 240
Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe Leu
245 250 255
<210> 138
<211> 245
<212> PRT
<213> 人工序列
<220>
<223> CFFKDEL-dsREDexpress
<400> 138
Met Gly His His His His His His Cys Phe Phe Lys Asp Glu Leu Glu
1 5 10 15
Phe Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met
20 25 30
Arg Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu
35 40 45
Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala
50 55 60
Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile
65 70 75 80
Leu Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro
85 90 95
Ala Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys
100 105 110
Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr
115 120 125
Gln Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe
130 135 140
Ile Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr
145 150 155 160
Met Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val
165 170 175
Leu Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His
180 185 190
Tyr Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln
195 200 205
Leu Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His
210 215 220
Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg
225 230 235 240
His His Leu Phe Leu
245
<210> 139
<211> 257
<212> PRT
<213> 人工序列
<220>
<223> TLM-dsREDexpress
<400> 139
Met Gly His His His His His His Pro Leu Ser Ser Ile Phe Ser Arg
1 5 10 15
Ile Gly Asp Pro Pro Lys Lys Lys Arg Lys Val Glu Phe Gly Gly Gly
20 25 30
Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe Lys Val
35 40 45
Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu
50 55 60
Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val
65 70 75 80
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln
85 90 95
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
100 105 110
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
115 120 125
Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser Ser
130 135 140
Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn
145 150 155 160
Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu
165 170 175
Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu
180 185 190
Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu
195 200 205
Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr
210 215 220
Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr
225 230 235 240
Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His Leu Phe
245 250 255
Leu
<210> 140
<211> 292
<212> PRT
<213> 人工序列
<220>
<223> Zebra-dsREDexpress
<400> 140
Met Gly His His His His His His Glu Cys Asp Ser Glu Leu Glu Ile
1 5 10 15
Lys Arg Tyr Lys Arg Val Arg Val Ala Ser Arg Lys Cys Arg Ala Lys
20 25 30
Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser
35 40 45
Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Glu Phe
50 55 60
Gly Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg
65 70 75 80
Phe Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile
85 90 95
Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys
100 105 110
Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu
115 120 125
Ser Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala
130 135 140
Asp Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp
145 150 155 160
Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln
165 170 175
Asp Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile
180 185 190
Gly Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met
195 200 205
Gly Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu
210 215 220
Lys Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr
225 230 235 240
Leu Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu
245 250 255
Pro Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn
260 265 270
Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His
275 280 285
His Leu Phe Leu
290
<210> 141
<211> 259
<212> PRT
<213> 人工序列
<220>
<223> pep1-dsREDexpress
<400> 141
Met Gly His His His His His His Lys Glu Thr Trp Trp Glu Thr Trp
1 5 10 15
Trp Thr Glu Trp Ser Gln Pro Lys Lys Lys Arg Lys Val Glu Phe Gly
20 25 30
Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe
35 40 45
Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu
50 55 60
Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu
65 70 75 80
Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser
85 90 95
Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp
100 105 110
Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu
115 120 125
Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp
130 135 140
Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly
145 150 155 160
Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly
165 170 175
Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys
180 185 190
Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu
195 200 205
Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro
210 215 220
Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu
225 230 235 240
Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His
245 250 255
Leu Phe Leu
<210> 142
<211> 259
<212> PRT
<213> 人工序列
<220>
<223> tp10-dsREDexpress
<400> 142
Met Gly His His His His His His Ala Gly Tyr Leu Leu Gly Lys Ile
1 5 10 15
Asn Leu Lys Ala Cys Ala Ala Cys Ala Lys Lys Ile Leu Glu Phe Gly
20 25 30
Gly Gly Gly Ala Ser Ser Glu Asp Val Ile Lys Glu Phe Met Arg Phe
35 40 45
Lys Val Arg Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu
50 55 60
Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu
65 70 75 80
Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser
85 90 95
Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp
100 105 110
Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu
115 120 125
Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp
130 135 140
Ser Ser Leu Gln Asp Gly Ser Phe Ile Tyr Lys Val Lys Phe Ile Gly
145 150 155 160
Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly
165 170 175
Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys
180 185 190
Gly Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu
195 200 205
Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro
210 215 220
Gly Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu
225 230 235 240
Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His His
245 250 255
Leu Phe Leu
<210> 143
<211> 1442
<212> PRT
<213> 人工序列
<220>
<223> Zebra-Cas9
<400> 143
Met Gly His His His His His His Glu Cys Asp Ser Glu Leu Glu Ile
1 5 10 15
Lys Arg Tyr Lys Arg Val Arg Val Ala Ser Arg Lys Cys Arg Ala Lys
20 25 30
Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser
35 40 45
Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Glu Phe
50 55 60
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
65 70 75 80
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
85 90 95
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
100 105 110
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
115 120 125
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
130 135 140
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
145 150 155 160
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
165 170 175
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
180 185 190
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
195 200 205
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
210 215 220
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
225 230 235 240
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
245 250 255
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
260 265 270
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
275 280 285
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
290 295 300
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
305 310 315 320
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
325 330 335
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
340 345 350
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
355 360 365
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
370 375 380
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
385 390 395 400
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
405 410 415
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
420 425 430
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
435 440 445
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
450 455 460
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
465 470 475 480
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
485 490 495
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
500 505 510
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
515 520 525
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
530 535 540
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
545 550 555 560
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
565 570 575
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
580 585 590
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
595 600 605
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
610 615 620
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
625 630 635 640
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
645 650 655
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
660 665 670
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
675 680 685
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
690 695 700
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
705 710 715 720
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
725 730 735
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
740 745 750
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
755 760 765
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
770 775 780
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
785 790 795 800
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
805 810 815
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
820 825 830
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
835 840 845
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
850 855 860
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
865 870 875 880
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
885 890 895
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
900 905 910
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
915 920 925
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
930 935 940
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
945 950 955 960
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
965 970 975
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
980 985 990
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
995 1000 1005
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1010 1015 1020
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1025 1030 1035
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1040 1045 1050
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1055 1060 1065
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1070 1075 1080
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1085 1090 1095
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1100 1105 1110
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1115 1120 1125
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1130 1135 1140
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1145 1150 1155
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1160 1165 1170
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1175 1180 1185
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1190 1195 1200
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1205 1210 1215
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1220 1225 1230
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1235 1240 1245
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1250 1255 1260
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1265 1270 1275
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1280 1285 1290
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1295 1300 1305
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1310 1315 1320
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1325 1330 1335
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1340 1345 1350
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1355 1360 1365
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1370 1375 1380
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1385 1390 1395
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1400 1405 1410
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1415 1420 1425
Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1430 1435 1440
<210> 144
<211> 1406
<212> PRT
<213> 人工序列
<220>
<223> pVEC-Cas9
<400> 144
Met Gly His His His His His His Leu Leu Ile Ile Leu Arg Arg Arg
1 5 10 15
Ile Arg Lys Gln Ala His Ala His Ser Lys Glu Phe Asp Lys Lys Tyr
20 25 30
Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
35 40 45
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
50 55 60
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
65 70 75 80
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
85 90 95
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
100 105 110
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
115 120 125
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
130 135 140
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
145 150 155 160
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
165 170 175
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
180 185 190
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
195 200 205
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
210 215 220
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
225 230 235 240
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
245 250 255
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser
260 265 270
Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp
275 280 285
Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn
290 295 300
Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
305 310 315 320
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn
325 330 335
Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr
340 345 350
Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln
355 360 365
Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn
370 375 380
Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr
385 390 395 400
Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu
405 410 415
Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe
420 425 430
Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala
435 440 445
Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg
450 455 460
Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly
465 470 475 480
Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
485 490 495
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly
500 505 510
Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn
515 520 525
Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr
530 535 540
Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
545 550 555 560
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val
565 570 575
Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
580 585 590
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser
595 600 605
Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu
610 615 620
Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
625 630 635 640
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg
645 650 655
Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp
660 665 670
Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg
675 680 685
Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
690 695 700
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe
705 710 715 720
Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
725 730 735
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala
740 745 750
Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val
755 760 765
Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu
770 775 780
Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
785 790 795 800
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys
805 810 815
Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
820 825 830
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp
835 840 845
Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
850 855 860
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
865 870 875 880
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
885 890 895
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
900 905 910
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
915 920 925
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
930 935 940
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
945 950 955 960
Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
965 970 975
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
980 985 990
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
995 1000 1005
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1010 1015 1020
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1025 1030 1035
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1040 1045 1050
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1055 1060 1065
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1070 1075 1080
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1085 1090 1095
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1100 1105 1110
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1115 1120 1125
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1130 1135 1140
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1145 1150 1155
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1160 1165 1170
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1175 1180 1185
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1190 1195 1200
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1205 1210 1215
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1220 1225 1230
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1235 1240 1245
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1250 1255 1260
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1265 1270 1275
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1280 1285 1290
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1295 1300 1305
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1310 1315 1320
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1325 1330 1335
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1340 1345 1350
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1355 1360 1365
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1370 1375 1380
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala
1385 1390 1395
Asp Pro Lys Lys Lys Arg Lys Val
1400 1405

Claims (19)

1.一种组合物,该组合物包含RNA引导的内切核酸酶(RGEN)的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,并且
其中所述RGEN蛋白-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
2.如权利要求1所述的组合物,其中该RGEN的蛋白组分与至少一种RNA组分缔合,该RNA组分包含与在该微生物细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
3.如权利要求2所述的组合物,其中该RNA组分包含引导RNA(gRNA),该引导RNA包含可操作地连接到反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。
4.如权利要求2所述的组合物,其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。
5.如权利要求1所述的组合物,其中该RGEN包含CRISPR相关(Cas)蛋白-9(Cas9)氨基酸序列。
6.如权利要求1所述的组合物,其中该RGEN蛋白组分和CPP共价地连接。
7.如权利要求1所述的组合物,其中该RGEN蛋白组分和CPP非共价地连接。
8.如权利要求1所述的组合物,其中该CPP是阳离子性或两亲性的。
9.如权利要求1所述的组合物,其中该CPP包含:
(i)来自爱泼斯坦-巴尔二氏病毒Zebra反式激活蛋白的CPP,
(ii)具有6个或更多个连续精氨酸残基的CPP,
(iii)转运蛋白-10(TP10)CPP,或
(iv)来自血管内皮钙粘素蛋白的CPP。
10.如权利要求1所述的组合物,其中所述RGEN蛋白-CPP复合物可以穿过微生物细胞的细胞壁和细胞膜。
11.一种细胞,包含根据权利要求1所述的组合物。
12.一种将RNA引导的内切核酸酶(RGEN)的蛋白组分递送到微生物细胞中的方法,所述方法包括:
使该微生物细胞与包含该RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP)的组合物接触,
其中所述蛋白组分和CPP在RGEN蛋白-CPP复合物中彼此共价或非共价地连接,
其中所述RGEN蛋白-CPP复合物穿过细胞的(i)细胞膜或(ii)细胞壁和细胞膜,从而进入该微生物细胞。
13.如权利要求12所述的方法,其中:
(i)该组合物进一步包含与该RGEN的蛋白组分缔合的至少一种RNA组分;或
(ii)该微生物细胞包含该RNA组分,其中在该RGEN蛋白-CPP复合物进入该微生物细胞之后,该RNA组分与该RGEN的蛋白组分缔合;
其中该RNA组分包含与在该细胞中的染色体或附加体上的靶位点序列互补的序列,其中该RGEN可以结合该靶位点序列,并且任选地在该靶位点序列处切割一条或两条DNA链。
14.如权利要求13所述的方法,其中该RGEN可以在该靶位点序列处切割一条或两条DNA链。
15.如权利要求14所述的方法,其中该微生物细胞进一步包含供体多核苷酸,该供体多核苷酸含有与该靶位点序列处或其附近的序列同源的至少一个序列,并且其中该供体多核苷酸通过同源重组整合在该靶位点序列处或其附近。
16.一种多核苷酸序列,该多核苷酸序列包含编码RGEN蛋白-CPP融合蛋白的核苷酸序列,该RGEN蛋白-CPP融合蛋白包含RNA引导的内切核酸酶(RGEN)的蛋白组分和至少一种细胞穿透肽(CPP),其中任选地,所述核苷酸序列可操作地连接到启动子序列。
17.一种产生RGEN蛋白-CPP融合蛋白的方法,该方法包括:
(a)提供如权利要求16所述的多核苷酸序列;
(b)从该多核苷酸序列表达RGEN蛋白-CPP融合蛋白,从而产生RGEN蛋白-CPP融合蛋白,其中所述表达任选地在细胞中进行;并且
(c)任选地,分离在步骤(b)中产生的RGEN蛋白-CPP融合蛋白。
18.一种组合物,该组合物包含引导多核苷酸/Cas内切核酸酶复合物的至少一种蛋白组分和至少一种细胞穿透肽(CPP),其中所述蛋白组分和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中所述引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
19.一种用于在细胞的基因组中修饰靶位点的方法,该方法包括向该细胞提供引导多核苷酸、细胞穿透肽(CPP)和Cas内切核酸酶,其中所述引导多核苷酸、Cas内切核酸酶和CPP在引导多核苷酸/Cas内切核酸酶-CPP复合物中彼此共价或非共价地连接,并且其中所述引导多核苷酸/Cas内切核酸酶-CPP复合物可以穿过微生物细胞的(i)细胞膜或(ii)细胞壁和细胞膜。
CN201580072629.XA 2014-11-06 2015-11-03 Rna引导的内切核酸酶向细胞中的肽介导的递送 Pending CN107406838A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462075999P 2014-11-06 2014-11-06
US62/075,999 2014-11-06
PCT/US2015/058760 WO2016073433A1 (en) 2014-11-06 2015-11-03 Peptide-mediated delivery of rna-guided endonuclease into cells

Publications (1)

Publication Number Publication Date
CN107406838A true CN107406838A (zh) 2017-11-28

Family

ID=54884364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580072629.XA Pending CN107406838A (zh) 2014-11-06 2015-11-03 Rna引导的内切核酸酶向细胞中的肽介导的递送

Country Status (10)

Country Link
US (3) US10208298B2 (zh)
EP (2) EP3215611B1 (zh)
JP (1) JP6823593B2 (zh)
KR (1) KR102424721B1 (zh)
CN (1) CN107406838A (zh)
AU (1) AU2015343307B2 (zh)
CA (1) CA2966731C (zh)
DK (2) DK3215611T3 (zh)
EA (1) EA038321B1 (zh)
WO (1) WO2016073433A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111235130A (zh) * 2019-11-15 2020-06-05 武汉大学 II类V型CRISPR蛋白CeCas12a及其在基因编辑的应用
CN112442512A (zh) * 2019-08-30 2021-03-05 华中农业大学 基于tRNA-gRNA-cRNA进行日本青鳉胚胎和细胞的基因编辑系统
CN112813049A (zh) * 2019-11-18 2021-05-18 中国科学院分子细胞科学卓越创新中心 用于活细胞rna标记的融合蛋白及应用
CN113462671A (zh) * 2018-11-15 2021-10-01 中国农业大学 CRISPR-Cas12j酶和系统
CN113811607A (zh) * 2019-03-07 2021-12-17 加利福尼亚大学董事会 CRISPR-Cas效应子多肽和其使用方法
CN114790225A (zh) * 2021-01-26 2022-07-26 清华大学 一种新型内体逃逸肽及其应用
CN115698041A (zh) * 2019-12-23 2023-02-03 加利福尼亚大学董事会 Crispr-cas效应多肽及其使用方法

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
WO2016182959A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
WO2016201047A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
WO2017068077A1 (en) 2015-10-20 2017-04-27 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods and products for genetic engineering
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
BR112018007796A2 (pt) 2015-11-06 2018-10-30 Du Pont plantas de soja, partes de plantas de soja ou sementes de soja, método para selecionar uma célula de soja, métodos de seleção de uma célula de soja e de produção de um locus e molécula de ácido nucleico
US20190211317A1 (en) * 2016-05-27 2019-07-11 Aadigen, Llc Peptides and nanoparticles for intracellular delivery of genome-editing molecules
ES2901215T3 (es) * 2016-05-27 2022-03-21 Aadigen Llc Péptidos y nanopartículas para la liberación intracelular de moléculas de edición del genoma
US11779657B2 (en) 2016-06-10 2023-10-10 City Of Hope Compositions and methods for mitochondrial genome editing
KR20190016970A (ko) 2016-06-14 2019-02-19 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도
ES2929047T3 (es) 2016-06-24 2022-11-24 Scripps Research Inst Transportador de nucleósido trifosfato novedoso y usos del mismo
CN109689856A (zh) * 2016-07-13 2019-04-26 帝斯曼知识产权资产管理有限公司 用于海藻宿主细胞的CRISPR-Cas系统
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018035388A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018062866A2 (en) * 2016-09-28 2018-04-05 Cellivery Therapeutics, Inc. CELL-PERMEABLE (CP)-Cas9 RECOMBINANT PROTEIN AND USES THEREOF
CA3037560A1 (en) 2016-10-13 2018-04-19 Pioneer Hi-Bred International, Inc. Generating northern leaf blight resistant maize
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11519009B2 (en) 2017-01-09 2022-12-06 University Of Massachusetts Complexes for gene deletion and editing
CN108384779A (zh) * 2017-02-03 2018-08-10 武汉臻智生物科技有限公司 微生物及其用途
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
EP3601579B1 (en) 2017-03-31 2023-10-04 Pioneer Hi-Bred International, Inc. Expression modulating elements and use thereof
US11591601B2 (en) 2017-05-05 2023-02-28 The Broad Institute, Inc. Methods for identification and modification of lncRNA associated with target genotypes and phenotypes
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
KR102151064B1 (ko) * 2017-05-24 2020-09-02 기초과학연구원 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
CN108977442B (zh) * 2017-06-05 2023-01-06 广州市锐博生物科技有限公司 用于dna编辑的系统及其应用
KR102007457B1 (ko) * 2017-06-30 2019-08-05 동국대학교 산학협력단 Cas9 단백질, 가이드 RNA 및 양친매성 펩타이드를 포함하는 나노복합체 및 이의 용도
SG11202000167SA (en) 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
CN111094573A (zh) * 2017-07-12 2020-05-01 梅约医学教育与研究基金会 有效靶向敲入或基因置换的材料和方法
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
WO2019089452A1 (en) * 2017-10-30 2019-05-09 The Penn State Research Foundation Targeting peptide to deliver a compound to oocytes
EP3720271A1 (en) * 2017-12-04 2020-10-14 University of Florida Research Foundation Genome editing by pollen-mediated transformation
EP3707253A1 (en) 2017-12-15 2020-09-16 Danisco US Inc. Cas9 variants and methods of use
CN111836825A (zh) * 2018-01-11 2020-10-27 科沃施种子欧洲股份两合公司 优化的植物crispr/cpf1系统
WO2019173125A1 (en) 2018-03-09 2019-09-12 Pioneer Hi-Bred International, Inc. Compositions and methods for modification of fatty acids in soybean
WO2019189814A1 (ja) * 2018-03-30 2019-10-03 国立研究開発法人国立国際医療研究センター 細胞のダイレクトリプログラミング方法
WO2019217336A2 (en) * 2018-05-06 2019-11-14 Massachusetts Institute Of Technology APPLICATIONS OF STREPTOCOCCUS-DERIVED Cas9 NUCLEASSES ON MINIMAL ADENINE-RICH PAM TARGETS
CN112204156A (zh) 2018-05-25 2021-01-08 先锋国际良种公司 用于通过调节重组率来改善育种的系统和方法
CN113286620A (zh) * 2018-08-24 2021-08-20 莱兰斯坦福初级大学评议会 用于多核苷酸空间组织的系统和方法
WO2020081173A1 (en) 2018-10-16 2020-04-23 Pioneer Hi-Bred International, Inc. Genome edited fine mapping and causal gene identification
WO2020123887A2 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CA3124395A1 (en) * 2018-12-20 2020-06-25 Basf Plant Science Company Gmbh Native delivery of biomolecules into plant cells using ionic complexes with cell-penetrating peptides
EP3942040A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
RU2707542C1 (ru) 2019-03-28 2019-11-27 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) Способ получения препарата рекомбинантной нуклеазы CAS, по существу, свободного от бактериальных эндотоксинов, полученный данным способом препарат и содержащий его набор для использования в системе CRISPR/Cas
US20220235340A1 (en) 2019-05-20 2022-07-28 The Broad Institute, Inc. Novel crispr-cas systems and uses thereof
CN114207129A (zh) 2019-06-14 2022-03-18 斯克利普斯研究所 用于在半合成生物体中复制、转录和翻译的试剂和方法
KR102176415B1 (ko) * 2019-08-02 2020-11-09 중앙대학교 산학협력단 원핵세포 투과성 재조합 단백질 및 이의 용도
WO2021041922A1 (en) 2019-08-30 2021-03-04 The Broad Institute, Inc. Crispr-associated mu transposase systems
CN115052980A (zh) * 2019-11-18 2022-09-13 上海蓝十字医学科学研究所 衍生自黄杆菌的基因编辑系统
CN111378612B (zh) * 2020-03-10 2023-05-09 山东大学 一种利用重组胞内rna支架固定重组酶促进细胞催化阿洛醇生产的方法
JP2023517992A (ja) 2020-03-12 2023-04-27 インスティチュート フォー ベーシック サイエンス ゲノム配列変異を有する細胞死滅誘導用組成物及び該組成物を用いた細胞死滅誘導方法
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
EP4165187A1 (en) 2020-06-12 2023-04-19 Pioneer Hi-Bred International, Inc. Alteration of seed composition in plants
WO2022040134A1 (en) 2020-08-18 2022-02-24 Pioneer Hi-Bred International, Inc. Multiple disease resistance genes and genomic stacks thereof
CN114213508B (zh) * 2020-09-03 2024-06-04 深圳厚存纳米药业有限公司 一种多肽及其多肽复合物纳米粒、核酸疫苗和应用
CN112226425B (zh) * 2020-09-03 2022-09-30 宁夏中微泰克生物技术有限责任公司 一种亚洲小车蝗胞外蛋白酶erk及其编码基因与应用
JPWO2022138507A1 (zh) * 2020-12-21 2022-06-30
WO2023279118A2 (en) * 2021-07-02 2023-01-05 University Of Maryland, College Park Cytidine deaminases and methods of genome editing using the same
WO2023102393A1 (en) 2021-11-30 2023-06-08 Pioneer Hi-Bred International, Inc. High efficiency large scale chromosomal genome manipulation
WO2023215837A2 (en) * 2022-05-04 2023-11-09 Ohio State Innovation Foundation Compositions for delivery of agents into plant cells
EP4303305A1 (en) * 2022-07-07 2024-01-10 Kutzner, Christoph Fusion polypeptides for cell penetration and cell targeting
WO2024023578A1 (en) 2022-07-28 2024-02-01 Institut Pasteur Hsc70-4 in host-induced and spray-induced gene silencing
WO2024036190A2 (en) 2022-08-09 2024-02-15 Pioneer Hi-Bred International, Inc. Guide polynucleotide multiplexing
WO2024123786A1 (en) 2022-12-06 2024-06-13 Pioneer Hi-Bred International, Inc. Methods and compositions for co-delivery of t-dnas expressing multiple guide polynucleotides into plants

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176772A1 (en) * 2012-05-25 2013-11-28 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
WO2014065596A1 (en) * 2012-10-23 2014-05-01 Toolgen Incorporated Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
WO2014089290A1 (en) * 2012-12-06 2014-06-12 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
WO2014165825A2 (en) * 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
CN104328138A (zh) * 2014-09-30 2015-02-04 上海缔达生物科技有限公司 基因组靶标目的基因的定向敲除的方法及试剂盒

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5071764A (en) 1983-10-06 1991-12-10 Pfizer Inc. Process for integrative transformation of yarrowia lipolytica
US4880741A (en) 1983-10-06 1989-11-14 Pfizer Inc. Process for transformation of Yarrowia lipolytica
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4886741A (en) 1987-12-09 1989-12-12 Microprobe Corporation Use of volume exclusion agents for the enhancement of in situ hybridization
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
ATE225853T1 (de) 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
AU651380B2 (en) 1990-07-16 1994-07-21 University Of Medicine And Dentistry Of New Jersey Selection of ribozymes that efficiently cleave target RNA
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
WO1993004177A1 (en) 1991-08-27 1993-03-04 Agricultural Genetics Company Limited Proteins with insecticidal properties against homopteran insects and their use in plant protection
AU682659B2 (en) 1991-10-04 1997-10-16 North Carolina State University Pathogen-resistant transgenic plants
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012520A1 (en) 1992-11-20 1994-06-09 Enzon, Inc. Linker for linked fusion polypeptides
WO1994013791A1 (en) 1992-12-04 1994-06-23 Innovir Laboratories, Inc. Regulatable nucleic acid therapeutic and methods of use thereof
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US6063566A (en) 1994-05-13 2000-05-16 The Scripps Research Institute Catalytic RNA molecules
US5580967A (en) 1994-05-13 1996-12-03 The Scripps Research Institute Optimized catalytic DNA-cleaving ribozymes
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5688670A (en) 1994-09-01 1997-11-18 The General Hospital Corporation Self-modifying RNA molecules and methods of making
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
ATE229977T1 (de) 1996-03-26 2003-01-15 Razvan T Radulescu Peptide mit antiproliferativen eigenschaften
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
US6828099B2 (en) 1998-02-02 2004-12-07 Odyssey Thera Inc. Protein fragment complementation assay (PCA) for the detection of protein-protein, protein-small molecule and protein nucleic acid interactions based on the E. coli TEM-1 β-Lactamase
AU762993C (en) 1998-02-26 2004-06-10 Pioneer Hi-Bred International, Inc. Constitutive maize promoters
EP1104469B1 (en) 1998-08-20 2005-11-09 Pioneer Hi-Bred International, Inc. Seed-preferred promoters
AU5788299A (en) 1998-08-28 2000-03-21 Pioneer Hi-Bred International, Inc. Seed-preferred promoters from (end) genes
ATE428928T1 (de) 1998-12-01 2009-05-15 Phylonix Pharmaceuticals Inc Verfahren zur einführung von heterologischen zellen in fische
GB0113798D0 (en) 2001-06-06 2001-07-25 Chiron Spa Antigens and vectors for vaccination
AU2002361649A1 (en) 2001-12-13 2003-06-30 University Of Virginia Patent Foundation Vector mediated organelle transfection
CN100399028C (zh) 2002-04-12 2008-07-02 布赖恩·F·奥当德 鉴定与跨膜蛋白相互作用的化合物的方法
US7132230B2 (en) 2002-06-28 2006-11-07 Fujikin Incorporated Cytotoxic assay and new established cell line of sturgeon origin
US20110059496A1 (en) 2003-06-25 2011-03-10 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
US7459546B2 (en) 2003-06-25 2008-12-02 E.I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast
WO2005049805A2 (en) 2003-11-14 2005-06-02 E.I. Dupont De Nemours And Company Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
US7264949B2 (en) 2004-09-15 2007-09-04 E.I. Du Pont De Nemours And Company Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast
US20060094102A1 (en) 2004-11-04 2006-05-04 Zhixiong Xue Ammonium transporter promoter for gene expression in oleaginous yeast
US10066233B2 (en) 2005-08-26 2018-09-04 Dupont Nutrition Biosciences Aps Method of modulating cell resistance
US9061058B2 (en) 2006-03-20 2015-06-23 Max-Delbrueck-Centrum Fuer Molekulare Medizin Use of Pol III promoters for controlled expression of therapeutic proteins
RU2517608C2 (ru) 2007-04-03 2014-05-27 Е.И.Дюпон Де Немур Энд Компани Мультизимы и их использование в получении полиненасыщенных жирных кислот
CA2700008A1 (en) 2007-08-01 2009-02-05 Bioglow Inc. Bioluminescent plants comprising bacterial lux operon and methods of making same
WO2009021287A1 (en) 2007-08-14 2009-02-19 Commonwealth Scientific And Industrial Research Organisation Photoactivated crosslinking of a protein or peptide
MX340736B (es) * 2007-09-25 2016-07-22 Pastoral Greenhouse Gas Res Ltd * Vacunas y componentes de vacunas para inhibicion de celulas microbianas.
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
BR112013003135A2 (pt) 2010-08-13 2017-11-07 Pioneer Hi Bred Int polinucletídeo e polipeptídeo isolado ou recombinante, construto de ácido nucleico, célula, planta, explante vegetal, semente transgênica, método para produção de célula vegetal para controle de plantas daninhas e para detecção de um polipeptídeo hppd e um polinucleotídeo.
US8642744B2 (en) 2010-10-28 2014-02-04 Agilent Technologies, Inc. Crosslinking reagent for analysis of protein-protein interaction
US8580922B2 (en) 2011-03-04 2013-11-12 Shire Human Genetic Therapies, Inc. Peptide linkers for polypeptide compositions and methods for using same
WO2012135773A1 (en) 2011-03-31 2012-10-04 E. I. Du Pont De Nemours And Company Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast
US8906650B2 (en) 2011-04-01 2014-12-09 E I Du Pont De Nemours And Company Yarrowia esterase/lipase promoter regions for gene expression in yeast
EP2694657A1 (en) 2011-04-05 2014-02-12 E. I. Du Pont de Nemours and Company Yarrowia n-alkane-hydroxylating cytochrome p450 promoter regions for gene expression in yeast
US8609369B2 (en) 2011-04-07 2013-12-17 E I Du Pont De Nemours And Company Yarrowia peroxisomal 2,4-dienoyl-CoA reductase promoter regions for gene expression in yeast
EP2750686B1 (en) 2011-06-17 2017-06-14 Shire Human Genetic Therapies, Inc. Polypeptide comprising frataxin and a c-terminal mitochondria penetrating peptide for use in the treatment of friedreich's ataxia
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
BR112015014781A2 (pt) 2012-12-21 2017-10-10 Du Pont célula microbiana recombinante e método de produção de um óleo microbiano
MX2016002118A (es) 2013-08-22 2016-06-28 Du Pont Modificacion del genoma de plantas por medio del uso de sistemas de ácido ribonucléico (arn) guía/ endonucleasa cas y metodos de uso.
US9737604B2 (en) * 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
EP3080256B1 (en) * 2013-12-13 2018-06-13 Cellectis Cas9 nuclease platform for microalgae genome engineering
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
AU2016263026A1 (en) 2015-05-15 2017-11-09 Pioneer Hi-Bred International, Inc. Guide RNA/Cas endonuclease systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176772A1 (en) * 2012-05-25 2013-11-28 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
WO2014065596A1 (en) * 2012-10-23 2014-05-01 Toolgen Incorporated Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
WO2014089290A1 (en) * 2012-12-06 2014-06-12 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
WO2014165825A2 (en) * 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
CN104328138A (zh) * 2014-09-30 2015-02-04 上海缔达生物科技有限公司 基因组靶标目的基因的定向敲除的方法及试剂盒

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DICARLO ET AL.,: "Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems.", 《NUCLEIC ACIDS RESEARCH》 *
NATALIA NEKHOTIAEVA ET AL.: "Cell entry and antimicrobial properties of eukaryotic cell-penetrating peptides.", 《FASEB J》 *
RAMAKRISHNA ET AL.,: "Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA.", 《GENOME RESEARCH》 *
ROBERTA MARCHIONE ET AL.: "ZEBRA cell-penetrating peptide as an efficient delivery system in Candida albicans.", 《BIOTECHNOL J》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113462671A (zh) * 2018-11-15 2021-10-01 中国农业大学 CRISPR-Cas12j酶和系统
CN113462671B (zh) * 2018-11-15 2023-09-12 中国农业大学 CRISPR-Cas12j酶和系统
CN113811607A (zh) * 2019-03-07 2021-12-17 加利福尼亚大学董事会 CRISPR-Cas效应子多肽和其使用方法
CN112442512A (zh) * 2019-08-30 2021-03-05 华中农业大学 基于tRNA-gRNA-cRNA进行日本青鳉胚胎和细胞的基因编辑系统
CN111235130A (zh) * 2019-11-15 2020-06-05 武汉大学 II类V型CRISPR蛋白CeCas12a及其在基因编辑的应用
CN112813049A (zh) * 2019-11-18 2021-05-18 中国科学院分子细胞科学卓越创新中心 用于活细胞rna标记的融合蛋白及应用
CN112813049B (zh) * 2019-11-18 2023-02-17 中国科学院分子细胞科学卓越创新中心 用于活细胞rna标记的融合蛋白及应用
CN115698041A (zh) * 2019-12-23 2023-02-03 加利福尼亚大学董事会 Crispr-cas效应多肽及其使用方法
CN114790225A (zh) * 2021-01-26 2022-07-26 清华大学 一种新型内体逃逸肽及其应用

Also Published As

Publication number Publication date
US20190100737A1 (en) 2019-04-04
EA038321B1 (ru) 2021-08-09
JP2017532979A (ja) 2017-11-09
DK3597740T3 (da) 2022-06-20
CA2966731A1 (en) 2016-05-12
DK3215611T3 (da) 2019-11-25
US10208298B2 (en) 2019-02-19
US10584322B2 (en) 2020-03-10
EP3215611A1 (en) 2017-09-13
EP3215611B1 (en) 2019-08-21
JP6823593B2 (ja) 2021-02-03
AU2015343307B2 (en) 2021-05-20
KR102424721B1 (ko) 2022-07-25
US20200157516A1 (en) 2020-05-21
KR20170077238A (ko) 2017-07-05
EP3597740B1 (en) 2022-03-23
EA201790968A1 (ru) 2018-01-31
US20170335300A1 (en) 2017-11-23
AU2015343307A1 (en) 2017-05-25
EP3597740A1 (en) 2020-01-22
WO2016073433A1 (en) 2016-05-12
CA2966731C (en) 2023-01-31

Similar Documents

Publication Publication Date Title
KR102424721B1 (ko) Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달
AU2019204429B2 (en) Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof
KR102622910B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
KR102386029B1 (ko) 게놈 편집 면역 효과기 세포
KR102135239B1 (ko) 세포 면역요법을 위한 방법 및 조성물
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
CN107250363B (zh) 在大肠杆菌中进行有效基因编辑的组合物和方法
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
CN107849583B (zh) 使用细胞分裂基因座控制细胞增殖的工具和方法
KR20180130603A (ko) 키메라 거미 실크 및 이의 용도
CN107635575A (zh) 重组glut1腺相关病毒载体构建体以及用于恢复glut1表达的相关方法
AU2018235957B2 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
KR20200098578A (ko) Cas9 변이체 및 사용 방법
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR20220041214A (ko) Il-1 수퍼패밀리의 사이토카인의 시공적 제한 활성으로 무장된 면역반응성 세포
CN111465689B (zh) Cas9变体和使用方法
RU2781083C2 (ru) Варианты, композиции и методы применения хоминг-эндонуклеазы pd-1
KR20240022552A (ko) 효소적 핵산 합성을 위한 조성물 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Delaware

Applicant after: International essence&Fragrance America Group Co.,Ltd.

Address before: Delaware

Applicant before: E. I. du Pont de Nemours and Co.