CN114630910A - 改善的同源依赖修复基因组编辑 - Google Patents

改善的同源依赖修复基因组编辑 Download PDF

Info

Publication number
CN114630910A
CN114630910A CN202080044833.1A CN202080044833A CN114630910A CN 114630910 A CN114630910 A CN 114630910A CN 202080044833 A CN202080044833 A CN 202080044833A CN 114630910 A CN114630910 A CN 114630910A
Authority
CN
China
Prior art keywords
protein
cell
exonuclease
sequence
stranded dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080044833.1A
Other languages
English (en)
Inventor
T·塞尔玛克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inari Agricultural Technology Co ltd
Original Assignee
Inari Agricultural Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inari Agricultural Technology Co ltd filed Critical Inari Agricultural Technology Co ltd
Publication of CN114630910A publication Critical patent/CN114630910A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了用于增加基因组编辑分子对靶编辑位点的同源定向修复(HDR)的频率的真核细胞和相关试剂、系统、方法和组合物。

Description

改善的同源依赖修复基因组编辑
相关申请的交叉引用
本申请要求于2019年6月25日提交的美国临时申请号62/866,317的优先权,出于所有目的,通过引用以其整体并入本文。
以ASCII文本文件提交序列表
以下以ASCII文本文件提交的内容是通过引用以其整体并入本文中:序列表的计算机可读形式(CRF)(文件名:165362000640SEQLIST.TXT,记录日期:2020年6月24日,大小:284KB)。
技术领域
本申请涉及用于基因编辑的方法、试剂盒和组合物。
背景技术
同源定向修复(HDR)是一种基因组编辑方法,其可用于将靶基因组DNA位点精确替换为来自提供的包含所期望替换序列的DNA模板的序列。虽然HDR的结果非常期望的,但由于多种原因,它的效果并不理想。最大的问题之一是其总体发生频率较低,尤其是与通常由切割基因组中的靶向编辑位点的基因组编辑分子触发的替代性非同源末端连接(NHEJ)修复机制相比。虽然大多数细胞可能有多种途径可以介导HDR,但其中一些在细胞周期中最为活跃,从而降低了HDR在典型细胞培养条件下的成功率。
在原核宿主如大肠杆菌中,同源基因替换可以通过噬菌体λRed同源重组系统实现,该系统包含噬菌体λ核酸外切酶、噬菌体λβ蛋白、单链DNA退火蛋白(SSAP)(其有助于互补DNA链和DNA模板的退火)(Murphy,2016)。噬菌体λRed同源重组系统已与原核生物中的CRISPR-Cas9系统相组合,以实现细菌基因组中靶序列的重组(Jiang等人,2013;Wang等人,2016)。
发明内容
本文披露了方法、系统、真核细胞(例如植物细胞或哺乳动物细胞)和组合物(例如细胞培养组合物、核酸、载体、试剂盒或细胞),与对照相比,这些可以通过同源定向修复(HDR)提供增加频率的供体模板多核苷酸对真核细胞基因组的靶编辑位点的修饰。可以提供这种增加的HDR频率的这样的方法、系统、真核细胞(例如,植物细胞或哺乳动物细胞)和组合物(例如,细胞培养组合物、核酸、载体、试剂盒或细胞)的特征包括提供HDR促进剂(其包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB))与基因组编辑分子(其包含至少一种切割真核细胞基因组中的靶编辑位点的序列特异性核酸内切酶和与靶编辑位点具有同源性的供体模板DNA分子)的组合。在某些实施例中,供体模板DNA分子的侧翼是核酸内切酶识别序列的拷贝。
本文提供的方法包括用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的方法,这些方法包括:向真核细胞提供基因组编辑分子和HDR促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。
本文提供的方法还包括制备具有基因组修饰的真核细胞的方法,这些方法包括:向真核细胞提供基因组编辑分子和同源定向修复(HDR)促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰;以及分离或繁殖包含该基因组修饰的真核细胞。
本文提供的系统包括用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的系统,这些系统包含:
(a)真核细胞;
(b)HDR促进剂,其包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);以及
(c)一种或多种基因组编辑分子,其包含至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;其中该真核细胞与以下相关联、与以下接触和/或含有以下:有效量的这些HDR促进剂和该一种或多种基因组编辑分子。
本文提供的方法还包括真核细胞的基因工程改造方法,所述方法包括向该真核细胞提供:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),其中该细胞的该靶编辑位点被该供体模板DNA分子修饰。
本文提供的方法还包括用于产生具有经基因修饰的靶编辑位点的真核细胞的方法,这些方法包括:(a)提供至少一种序列特异性核酸内切酶或编码所述至少一种序列特异性核酸内切酶的至少一种多核苷酸,该至少一种序列特异性核酸内切酶切割所述靶编辑位点中的至少一种核酸内切酶识别序列的DNA序列,以及(b)提供至少一种包含至少一种双链DNA序列的供体分子,其中(i)所述DNA序列在至少50个核苷酸的长度上与该靶编辑位点侧翼的序列具有至少90%的同源性和(ii)其中与所述靶编辑位点相比,所述供体序列包含至少一个修饰;以及(c)提供至少一种同源定向修复(HDR)促进剂,其包含(i)至少一种单链DNA退火蛋白(SSAP),和(ii)至少一种能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶,和(iii)至少一种单链DNA结合蛋白(SSB);并且由此该至少一种序列特异性核酸内切酶、该至少一种供体分子和该至少一种HDR促进剂将所述修饰引入所述真核细胞的所述靶编辑位点;以及(d)分离在所述靶编辑位点中包含修饰的真核细胞。
本文提供的组合物包括以下组合物,该组合物包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
本文提供的载体包括以下载体,该载体包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
本文提供的试剂盒包括以下试剂盒,该试剂盒包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)以及用于基因工程改造真核细胞的使用说明书。
本文提供的细胞包括以下细胞,该细胞包含i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
本文提供的细胞还包括用于在靶编辑位点进行基因工程改造的祖真核细胞或祖生物体,该祖真核细胞或祖生物体包含以下的子集:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),其中该细胞不包含i)-v)中的至少一种,其中向该细胞或生物体提供不包含在该祖细胞或祖生物体中的i)-v)中的该至少一种导致该供体模板分子对该靶编辑位点的修饰。
附图说明
图1显示了载体pRS08t的示意图,碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、Cas表达盒(番茄S1UBI10启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA表达盒(拟南芥U6启动子(AtU6)、编码指导RNA的序列和35S启动子)、mGFP6序列、豌豆rbcS E9终止子、ANT1供体模板和壮观霉素抗性标记(SpnR)。
图2显示了载体pRS045的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括氨苄青霉素抗性标记(AmpR)、HDR促进剂表达盒(PcUbi启动子、c2核定位序列(NLS)融合至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、豌豆3A终止子、番茄SlUBI10启动子、c2 NLS融合至SSAP编码序列(Red β CDS)、HSP终止子、2x 35S启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)和35S终止子)和pUC复制起点(pUC ori)。
图3显示了载体pAP046的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、Cas表达盒(番茄SlUBI10启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA和核酶表达盒(35S启动子、编码锤头(HH)核酶的序列、编码指导RNA的序列、编码丁型肝炎病毒(HDV)核酶的序列和35S终止子)、HDR促进剂表达盒(PcUbi启动子、c2 NLS融合至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、豌豆3A终止子、番茄SlUBI10启动子、c2 NLS融合至SSAP编码序列(Red β CDS)、HSP终止子、2x 35S启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)和35S终止子)、ANT1供体模板和壮观霉素抗性标记(SpnR)。
图4显示了载体pRS148的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、Cas表达盒(番茄S1UBI10启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA和核酶表达盒(35S启动子、编码锤头(HH)核酶的序列、编码指导RNA的序列、编码丁型肝炎病毒(HDV)核酶的序列和35S终止子)和壮观霉素抗性标记(SpnR)。
图5显示了载体pRS192的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、HDR促进剂表达盒(PcUbi启动子、c2NLS融合至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、豌豆3A终止子、番茄SlUBI10启动子、c2 NLS融合至SSAP编码序列(RedβCDS)、HSP终止子、2x 35S启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)和35S终止子)、ANT1供体模板和氨苄青霉素抗性标记(AmpR)。
图6显示了载体pTC801的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、Cas表达盒(玉蜀黍泛素(ZmUbi)启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA和核酶表达盒(35S启动子、编码锤头(HH)核酶的序列、编码指导RNA 1和2的序列、编码丁型肝炎病毒(HDV)核酶的序列、以及35S终止子)、HDR促进剂表达盒(水稻肌动蛋白(OsActin)启动子,c2 NLS融合至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、豌豆3A终止子、柳枝稷泛素(PvUbi1)启动子、c2NLS融合至SSAP编码序列(RedβCDS)、豌豆rbcS E9终止子、水稻泛素(OsUB1)启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)和烟草延伸蛋白(NtEXT)终止子)、SPX供体模板、和壮观霉素抗性标记(SpnR)。
图7显示了载体pAB156的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括卡那霉素抗性标记(KanR)、左T-DNA边界、潮霉素抗性盒(2x 35S启动子、潮霉素磷酸转移酶(hygR)编码序列和35S终止子)、Cas表达盒(番茄SlUBI10启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA和核酶表达盒(35S启动子、编码指导RNA的序列、编码锤头(HH)核酶的序列、编码丁型肝炎病毒(HDV)核酶的序列和35S终止子)、HDR促进剂表达盒(PcUbi4启动子,c2 NLS融合至大肠杆菌SSB编码序列(大肠杆菌SSBCDS)、豌豆3A终止子、AtUbi10启动子、c2 NLS融合至SSAP编码序列(Red β CDS)、豌豆rbcSE9终止子、HaUbiCh4启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)、以及Ext3’终止子)、GFP供体模板、右T-DNA边界和来自pVS1的STA区域。
图8显示了超级二元T-DNA载体pIN1757(下)和pIN1576(上)的设计插入区的示意图。pIN1757包括左T-DNA边界、NOS终止子、用于草铵膦选择的PAT、35S启动子、Cas表达盒(玉蜀黍泛素(ZmUbi)启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子)、指导RNA表达盒(小麦U6(TaU6)启动子、编码指导RNA的序列(Gln1-3 Pro-2)和Pol III终止子)、Gln1-3供体模板和右T-DNA边界。此外,载体pIN1756包括HDR促进剂表达盒(水稻肌动蛋白(OsActin启动子+内含子)启动子、大肠杆菌SSB编码序列(SSB)、豌豆3A终止子;柳枝稷泛素(PvUbi1启动子+内含子)启动子、SSAP编码序列(β)、豌豆rbcS E9终止子;水稻泛素(OsUB1)启动子、核酸外切酶编码序列(Exo)和烟草延伸蛋白(NtEXT)终止子。
图9A-9B显示了用于转化番茄子叶的载体和表达盒的示意图。图9A显示了载体pIN1705的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,载体包括卡那霉素抗性标记(KanR)、左T-DNA边界、5-烯醇丙酮酸莽草酸-3-磷酸(EPSPS)合酶表达盒(即,EPSPS编码序列(CDS),其受拟南芥泛素启动子(AtUbi10)和豌豆rbcS E9终止子控制)、Cas表达盒(番茄SlUBI10启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和HSP终止子),指导RNA和核酶表达盒(35S启动子、编码锤头(HH)核酶的序列、编码指导RNA的序列、编码丁型肝炎病毒(HDV)核酶的序列、35S终止子)、HDR促进剂表达盒(PcUbi启动子,c2 NLS融合至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、豌豆3A终止子、番茄SlUBI10启动子、c2 NLS融合至SSAP编码序列(Red βCDS)、HSP终止子、2x 35S启动子、c2 NLS融合至核酸外切酶编码序列(Red Exo CDS)和35S终止子)、ANT1供体模板、右T-DNA边界、来自pVS1的STA区域、pVS1复制起点(ori)和复制起点(ori)。图9B显示了用于染色体整合到番茄子叶基因组中的农杆菌T-DNA载体左右边界之间的区域的示意图。从上到下显示的是pIN1703、pIN1704和pIN1705载体的区域。CS表示切割位点,EPSPS表示EPSPS表达盒,CasS表示Cas表达盒,ANT1供体表示供体模板,HDR剂表示编码SSAP、SSB和核酸外切酶的HDR促进剂表达盒,GFP表示绿色荧光蛋白质编码序列。
图10显示了用于在人中表达的载体的示意图。碱基对的长度由载体外的标签指示。从碱基对1开始,该载体包括高拷贝数复制起点(高拷贝起点)、Cas表达盒(CAG启动子、Cas核酸酶编码序列(Cas核酸酶CDS)和兔β-珠蛋白(rb珠蛋白)终止子)、指导RNA表达盒(智人U6(HsU6)启动子、编码指导RNA的序列)、HDR促进剂表达盒(智人EF1a启动子、SV40 NLS连接至大肠杆菌SSB编码序列(大肠杆菌SSB CDS)、人生长激素(hGH)终止子、智人ACTB(hACTB)启动子、SV40 NLS连接至SSAP编码序列(Red β CDS)、牛生长激素(bGH)终止子、CMV启动子、SV40 NLS连接至核酸外切酶编码序列(Red Exo CDS)和SV40聚A信号)、EMX1 FRT供体模板和壮观霉素抗性标记(SpnR)。
具体实施方式
I.定义
除非另有说明,本说明书正文中的核酸序列在从左到右阅读时均按5’到3’方向给出。核酸序列可以以DNA或RNA的形式提供,如具体所述;如本领域普通技术人员已知的那样,一个的披露内容必然定义另一个,以及必然定义精确的补充。在术语以单数形式提供的情况下,发明人还考虑了由该术语的复数形式描述的实施例。
如本文所用,短语“等位基因变体”是指在给定生物的不同菌株、品种或分离株中出现的多核苷酸或多肽序列变体。
此外,在本文使用的情况下,术语“和/或”应当被视为具有或不具有彼此的两个指定特征或组分中的每一个的特定披露。因此,在本文如在诸如“A和/或B”等短语中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”(单独)以及“B”(单独)。类似地,如在诸如“A、B和/或C”等短语中使用的术语“和/或”旨在涵盖以下实施例中的每一个:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;A(单独);B(单独);以及C(单独)。
如本文所用,术语“Cpf1”和“Cas12a”在本文中可互换使用以指相同的RNA定向核酸酶。
如本文所用,短语“基因组编辑分子”是指一种或多种序列特异性核酸内切酶或编码该一种或多种序列特异性核酸内切酶的一种或多种多核苷酸,该一种或多种序列特异性核酸内切酶在核酸内切酶识别位点切割至少一个DNA序列。
如本文所用,“外源”药剂或分子是指来自外部来源的任何药剂或分子,其被提供或引入系统、组合物、真核或植物细胞培养物、反应系统或真核或植物细胞。在某些实施例中,来自外部来源的外源药剂(例如多核苷酸、蛋白质或化合物)可以是也存在于真核或植物细胞中的药剂。在某些实施例中,来自外部来源的外源药剂(例如多核苷酸、蛋白质或化合物)可以是与真核或植物细胞异源的药剂。
如本文所用,“异源”药剂或分子是指:(i)在野生型、未经处理或天然存在的组合物、真核细胞或植物细胞中未发现的任何药剂或分子;和/或(ii)位于例如基因组或载体中在不同于序列在自然界中出现的上下文中的多核苷酸或肽序列。例如,与启动子天然情况下可操作地连接的基因不同的基因可操作地连接的启动子是异源启动子。
如本文所用,术语“包括(include、includes和including)”应被解释为至少具有它们所指的特征而不排除任何另外的未指定特征。
如本文所用,术语“同源重组”是指两个DNA分子之间在同源位点的DNA片段的交换。同源重组的频率受多种因素影响。不同的生物体在同源重组的数量和同源与非同源重组的相对比例方面有所不同。通常,同源区域的长度影响同源重组事件的频率:同源区域越长,频率越大。观察同源重组所需的同源区域的长度也是物种可变的。在许多情况下,至少使用了5kb的同源性,但在少至25-50bp的同源性的情况下观察到同源重组。
如本文所用,同源定向修复(HDR)是指通过掺入提供的供体序列导致靶编辑位点的精确编辑的DNA修复方法。
如本文所用,诸如“HDR的频率”、“HDR频率”等短语是指与所分析的靶编辑位点总数相比,靶编辑位点处的HDR介导事件的数量。靶编辑位点的总数是:(a)具有NHEJ介导的事件的靶编辑位点;(b)没有变化的靶编辑位点;以及(c)具有HDR介导的事件的靶编辑位点。HDR介导的事件包括将异源序列精确插入靶编辑位点,在插入的异源序列、异源插入物侧翼的同源序列或位于异源序列和同源序列连接处的序列中不包含任何非预期的核苷酸插入、缺失或取代。
如本文所用,短语“真核细胞”是指包含细胞核的任何细胞,因此包括哺乳动物(例如人、家畜和伴侣动物细胞)、昆虫细胞、爬行动物细胞、植物细胞(例如,单子叶植物和双子叶植物细胞)、酵母细胞和真菌细胞(例如,丝状和非丝状真菌)。
“经修饰的核苷酸”或“经编辑的核苷酸”是指当与其未修饰的核苷酸序列相比时,包含至少一个改变的目的核苷酸序列。此类“改变”包括,例如:(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,或(iv)(i)-(iii)的任何组合。
如本文所用,短语“植物细胞”可指具有植物细胞壁的植物细胞或缺乏植物细胞壁的植物细胞原生质体。
本文使用的术语“多核苷酸”是包含两(2)个或更多个核苷酸残基的核酸分子。多核苷酸通常被描述为单链或双链。当多核苷酸包含通过分子内或分子间杂交形成的双链区时,每个双链区的长度方便地用碱基对的数量来描述。本文提供的系统、方法和组合物的实施例可以采用或包括:(i)一种或多种长度为2至25个残基的多核苷酸,一种或多种长度超过26个残基的多核苷酸,或两者的混合物。多核苷酸可包括单链或双链RNA、单链或双链DNA、双链DNA/RNA杂交体、其经化学修饰的类似物或其混合物。在某些实施例中,多核苷酸可以包括核糖核苷酸和脱氧核糖核苷酸的组合(例如,主要由核糖核苷酸组成但具有一个或多个末端脱氧核糖核苷酸的合成多核苷酸或主要由脱氧核糖核苷酸组成但具有一个或多个末端双脱氧核糖核苷酸的合成多核苷酸),或可以包括非规范核苷酸,例如肌苷、硫尿苷或假尿苷。在某些实施例中,多核苷酸包括经化学修饰的核苷酸(参见例如Verma和Eckstein(1998)Annu.Rev.Biochem.[生物化学年度综述],67:99-134)。可用于本文提供的多核苷酸中的经化学修饰的核苷酸包括:(i)磷酸二酯骨架的硫代磷酸酯、二硫代磷酸酯或甲基膦酸酯核苷酸间连接修饰;(ii)包含经修饰的碱基和/或经修饰的糖的核苷;和/或(iii)可检测标记,其包括荧光部分(例如荧光素或罗丹明或荧光共振能量转移或FRET发色团标记对)或其他标记(例如生物素或同位素)。本文提供或使用的多核苷酸还包括经修饰的核酸,特别是经修饰的RNA,其在美国专利9,464,124(通过引用以其整体并入本文)中披露。
“重组AAV载体(rAAV载体)”是指包含一个或多个异源序列(即,非AAV来源的核酸序列)的多核苷酸载体,该一个或多个异源序列侧翼有至少一个,并且在一些实施例中两个AAV反向末端重复序列(ITR)。当这种rAAV载体存在于已被合适的辅助病毒感染(或表达合适的辅助功能)并表达AAV rep和cap基因产物(即AAV Rep和Cap蛋白)的宿主细胞中时可以复制并包装进入感染性病毒颗粒。当rAAV载体被掺入更大的多核苷酸(例如,在染色体或另一个载体(例如用于克隆或转染的质粒)中)时,则rAAV载体可被称为“原-病毒”,在存在AAV包装功能和合适的辅助功能的情况下,原-病毒可以通过复制和衣壳化来“拯救”。rAAV载体可以是多种形式中的任何一种,包括但不限于质粒、线性人工染色体、与脂质复合、封装在脂质体中和封装在病毒颗粒中,特别是AAV颗粒。rAAV载体可以被包装到AAV病毒衣壳中以产生“重组腺相关病毒颗粒(rAAV颗粒)”。
“重组腺病毒载体”是指包含一个或多个异源序列(即,非腺病毒来源的核酸序列)的多核苷酸载体,所述一个或多个异源序列侧翼是至少一个腺病毒反向末端重复序列(ITR)。在一些实施例中,重组核酸的侧翼是两个反向末端重复序列(ITR)。当这些重组病毒载体存在于表达从重组病毒基因组中缺失的必需腺病毒基因(例如El基因、E2基因、E4基因等)的宿主细胞中时可以复制并且包装进入感染性病毒颗粒。当重组病毒载体被掺入更大的多核苷酸(例如,在染色体或另一个载体(例如用于克隆或转染的质粒)中)时,则重组病毒载体可被称为“原-病毒”,在存在腺病毒包装功能的情况下,原-病毒可以通过复制和衣壳化来“拯救”。重组病毒载体的可以是多种形式中的任何一种,包括但不限于质粒、线性人工染色体、与脂质复合、封装在脂质体中和封装在病毒颗粒中,例如腺病毒颗粒。可以将重组病毒载体包装到腺病毒病毒衣壳中,生成“重组腺病毒颗粒”。
“重组慢病毒载体”是指包含一个或多个异源序列(即,非慢病毒来源的核酸序列)的多核苷酸载体,所述一个或多个异源序列侧翼是至少一个慢病毒末端重复序列(LTR)。在一些实施例中,重组核酸的侧翼是两个慢病毒末端重复序列(LTR)。当这样的重组病毒载体存在于已被合适的辅助功能感染的宿主细胞中时可以复制并包装进入感染性病毒颗粒。可以将重组慢病毒载体包装进入慢病毒衣壳中,生成“重组慢病毒颗粒”。
“重组单纯疱疹载体(重组HSV载体)”是指包含一个或多个异源序列(即,非HSV来源的核酸序列)的多核苷酸载体,该一个或多个异源序列侧翼是HSV末端重复序列。当这样的重组病毒载体存在于已被合适的辅助功能感染的宿主细胞中时可以复制并包装进入感染性病毒颗粒。当重组病毒载体被掺入更大的多核苷酸(例如,在染色体或另一个载体(例如用于克隆或转染的质粒)中)时,则重组病毒载体可被称为“原-病毒”,在存在HSV包装功能的情况下,原-病毒可以通过复制和衣壳化来“拯救”。重组病毒载体的可以是多种形式中的任何一种,包括但不限于质粒、线性人工染色体、与脂质复合、封装在脂质体中和封装在病毒颗粒中,例如HSV颗粒。可以将重组病毒载体包装进入HSV衣壳中,生成“重组单纯疱疹病毒颗粒”。
如本文所用,短语“靶编辑位点”是指被供体核酸修饰的DNA序列。
如本文所用,短语“靶基因”可指位于基因组中的基因,其将被本文提供的系统、方法、组合物和/或真核细胞中提供的基因编辑分子修饰。靶基因的实施例包括(蛋白质)编码序列、非编码序列以及编码和非编码序列的组合。靶基因的修饰包括基因的一个或多个元件中的核苷酸取代、插入和/或缺失,这些元件包括转录增强子或启动子、5’或3’非翻译区、成熟或前体RNA编码序列、内含子、剪接供体和/或受体、蛋白编码序列、聚腺苷酸化位点和/或转录终止子。在某些实施例中,二倍体或多倍体植物细胞中给定靶基因的所有拷贝或所有等位基因被修饰以提供植物细胞中经修饰的靶基因的纯合性。在通过经由基因编辑引入靶基因的功能丧失性突变而赋予所期望性状的实施例中,植物细胞、植物细胞群体、植物或种子对于经修饰的具有功能丧失性突变的靶基因是纯合的。在其他实施例中,仅修饰给定靶基因的拷贝或等位基因的子集以提供植物细胞中经修饰的靶基因的杂合性。在通过经由基因编辑引入靶基因的显性突变而赋予所期望性状的某些实施例中,植物细胞、植物细胞群体、植物或种子对于经修饰的具有显性突变的靶基因是杂合的。对某些植物靶基因的这样的修饰赋予的性状包括提高产率、对昆虫、真菌、细菌病原体和/或线虫的抗性、除草剂耐受性、非生物胁迫耐受性(例如,干旱、寒冷、盐和/或热耐受性)、蛋白质数量和/或质量、淀粉数量和/或质量、脂质数量和/或质量、次生代谢物数量和/或质量等,所有这些都与缺乏该修饰的对照植物相比。具有由在通过本文提供的系统、方法、组合物和/或植物细胞中提供的基因编辑分子修饰的基因组的植物不同于具有通过传统育种(即,父本植物和母本植物的杂交)修饰的基因组的植物,其中基因组区域的不需要和随机交换以及基因组中随机有丝分裂或减数分裂产生的遗传和表观遗传变化通常发生在杂交期间,然后在后代植物中发现。因此,在具有经修饰的基因组的植物(或植物细胞)的实施例中,经修饰的基因组与原始(未经修饰)基因组的同一性超过99.9%。在实施例中,经修饰的基因组相对于原始(未经修饰的)基因组没有随机有丝分裂或减数分裂产生的遗传或表观遗传变化。在实施例中,经修饰的基因组包括相对于原始(未修饰的)基因组在小于0.01%的基因组中的表观遗传变化的差异。在实施例中,经修饰的基因组包括:(a)相对于原始(未修饰的)基因组,在小于0.01%的基因组中的DNA甲基化的差异;或(b)相对于原始(未修饰的)基因组,在小于0.005%的基因组中的DNA甲基化的差异;或(c)相对于原始(未修饰的)基因组,在小于0.001%的基因组中的DNA甲基化的差异。在实施例中,目的基因位于植物细胞中的染色体上,并且经修饰的基因组包括:(a)相对于原始(未修饰的)基因组,在包含目的基因的染色体内所含基因组中小于0.01%的部分中的DNA甲基化的差异;(b)相对于原始(未修饰的)基因组,在包含目的基因的染色体内所含基因组中小于0.005%的部分中的DNA甲基化的差异;或(c)相对于原始(未修饰的)基因组,在包含目的基因的染色体内所含基因组中小于0.001%的部分中的DNA甲基化的差异。在实施例中,与原始(未经修饰的)基因组相比,经修饰的基因组没有比1×10^-8个突变/碱基对/复制更多的意外变化。在某些实施例中,经修饰的基因组没有比在自然突变率下发生的更多的意外变化。自然突变率可以凭经验确定或如文献中所述(Lynch,M.,2010;Clark等人,2005)。
如本文所用,“载体”是指包含待体外或体内递送到宿主细胞中的核酸的重组质粒。
在任何前述定义与通过引用并入本文的任何专利或非专利参考文献、本文引用的任何专利或非专利参考文献或在别处找到的任何专利或非专利参考文献中提供的定义不一致的程度情况下,应当理解,在此将使用该前述定义。
II.方法和组合物
A.增加同源定向修复介导的基因组修饰的方法
本文提供了多种试剂、系统、方法和组合物,其包含HDR促进剂(SSAP、核酸外切酶和SSB)和基因组编辑分子并且与对照实验相比在真核细胞基因编辑实验中提供增加的同源依赖性修复(HDR)频率。在某些实施例中,与对照方法(其中对照真核细胞具有基因组编辑分子,但未暴露于至少一种HDR促进剂(SSAP、核酸外切酶和SSB))相比,HDR的频率增加至少2倍、3倍、5倍或10倍。在某些实施例中,与对照方法(其中对照真核细胞具有基因组编辑分子,但未暴露于至少一种HDR促进剂(SSAP、核酸外切酶和SSB))相比,HDR的频率增加至少2倍、3倍或5倍至约12倍、15倍、20倍、25倍或30倍。在一些实施例中,本方法可用于未经历有丝分裂或减数分裂的细胞。在一些实施例中,本方法不需要DNA复制。
i.核定位信号(NLS)
可指导本文提供的SSAP、核酸外切酶、SSB和/或基因编辑分子的核定位信号(NLS)包括单组分和两组分核定位信号(Kosugi等人,2009)。可以使用的单组分NLS的示例包括包含至少4个连续碱性氨基酸的NLS,例如SV40大T抗原NLS(PKKKRKV;SEQ ID NO:11)和仅具有三个碱性氨基酸的另一类(其具有K(K/R)X(K/R)共有序列(SEQ ID NO:12))。可用于本文提供的两组分NLS的示例包括(K/R)(K/R)X10-12(K/R)3/5(SEQ ID NO:13),其中(K/R)3/5代表五个连续氨基酸的赖氨酸或精氨酸的至少三个。NLS还可以包含具有共有序列LGKR(K/R)(W/F/Y)(SEQ ID NO:14)的植物特异性的类别5NLS。可以进一步使用的特定NLS的示例包括玉米opaque-2核定位信号(SEQ ID NO:10、bhendi黄脉花叶病毒(BYVMV)c2 NLS(SEQ ID NO:15、和延伸的SV40大T抗原)NLS(SEQ ID NO:16)。
在一些实施例中,NLS是哺乳动物(例如人NLS)。在一些实施例中,NLS是SV40 NLS。在一些实施例中,NLS是具有氨基酸接头的SV40 NLS。在一些实施例中,NLS具有氨基酸序列MAPKKKRKVGGSGS(SEQ ID NO:148)。
在某些实施例中,NLS元件或其他所期望元件(例如表位标签)可通过元件和结构域的直接共价连接或通过使用接头肽或柔性铰链多肽来可操作地连接至本文提供的SSAP、核酸外切酶、SSB和/或基因编辑分子。柔性铰链多肽包括富含甘氨酸或含有甘氨酸/丝氨酸的肽序列。这样的序列可包括但不限于(Gly4)n序列、(Gly4Ser)n序列、Ser(Gly4Ser)n序列、其组合及其变体,其中n是等于1、2、3、4、5、6、7、8、9或10的正整数。在某些实施例中,此类富含甘氨酸或含有甘氨酸/丝氨酸的铰链肽还可包含苏氨酰和/或丙氨酰残基(以提高灵活性)以及极性赖氨酰和/或谷氨酰残基。可以使用的铰链肽的其他示例包括免疫球蛋白铰链肽(Vidarsson等人,2014)。
多种细胞穿透肽(CPP)也可用于本文提供的SSAP、核酸外切酶、SSB和/或基因编辑分子。可以使用的CPP包括最小十一肽蛋白转导结构域(对应于包含YGRKKRRQRRR的、HIV-1TAT的残基47-57;SEQ ID NO:17);包含足以直接进入细胞的若干个精氨酸(例如、3、4、5、6、7、8、9、10或10-50个精氨酸)的聚精氨酸序列;VP22结构域(Zender等人(2002)Cancer GeneTher[癌症基因疗法].9(6):489-96);果蝇触角蛋白转导结构域(Noguchi等人(2003)Diabetes[糖尿病]52(7):1732-1737);截短的人降钙素肽(Trehin等人(2004)Pharm.Research[药物研究]21:1248-1256);聚赖氨酸(Wender等人(2000)Proc.Natl.Acad.Sci.USA[美国科学院院报]97:13003-13008);RRQRRTSKLMKR(SEQ ID NO:18);转运素(Transportan)(例如GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:19);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:20);和RQIKIWFQNRRMKWKK(SEQ ID NO:21)。示例性的CPP氨基酸序列还包括YGRKKRRQRRR(SEQ ID NO:22;RKKRRQRR(SEQ ID NO:23);YARAAARQARA(SEQ ID NO:24);THRLPRRRRRR(SEQ ID NO:25);和GGRRARRRRRR(SEQ ID NO:26)。
ii.单链DNA退火蛋白(SSAP)
在某些实施例中,本文提供的方法、系统、细胞和细胞培养组合物中使用的单链DNA退火蛋白(SSAP)包括促进或催化同源DNA分子的互补DNA链的DNA链交换和碱基配对的蛋白质。本文使用的SSAP的特征包括RecA依赖性和非依赖性途径的刺激、体外寡聚环和/或细丝形成、ssDNA结合活性和互补ssDNA链退火的非ATP酶依赖性刺激。Murphy,2016和Iyer等人,2002已经披露RecT/Redβ蛋白家族、ERF蛋白家族或RAD52蛋白家族中SSAP蛋白的特征。在某些实施例中,SSAP是RecT/Redβ蛋白家族的成员,该家族包括Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。某些RecT/Redβ蛋白家族的特征包括具有五个β链和五个α螺旋的核心的α+β结构域、Mg+2依赖性单链退火活性和大多数但不是所有成员中两个c末端酸性残基的保守性(Iyer等人,2002)。在某些实施例中,RecT/Redβ-家族蛋白包含以下蛋白质,该蛋白质与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性以及任选地具有保守α+β结构域(其具有五个β链和五个α螺旋的核心)、Mg+2依赖性单链退火活性和/或两个c末端酸性残基的保守性。在某些实施例中,SSAP是ERF家族蛋白。EFR蛋白家族的特征包括包含GuXXoYhp+YXhXXhh(SEQ ID NO:32)基序的约150个氨基酸残基的保守区域,其中G是甘氨酸、Y-酪氨酸,u是“微小”残基(甘氨酸、丝氨酸、丙氨酸)、h-疏水性(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、蛋氨酸),p是极性残基(赖氨酸、精氨酸、谷氨酸、天冬氨酸、天冬酰胺、苏氨酸、丝氨酸),o是含醇的氨基酸残基(丝氨酸或苏氨酸),+是碱性残基,X是任何残基(Iyer等人,2002)。ERF家族蛋白包括噬菌体P22 ERF蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白,并且可以任选地进一步包含GuXXoYhp+YXhXXhh(SEQID NO:32)基序。ERF家族中的SSAP还包括在万维网网站ncbi.nlm.nih.gov/protein上的NCBI数据库中在登录号(gi或基因标识符)9634188、9635694、16804357、12719409、458219、11497308、11497280、1497168、11527300、9634634、9635643、13491642、6015511、11138335、9627938、9628668以及15088753下列出的蛋白质。在某些实施例中,本文使用的SSAP包括来自酿酒酵母、粟酒裂殖酵母和乳酸克鲁维酵母的RAD52家族蛋白及其分别在SEQ ID NO:5、6和7的全长上具有至少85%、90%、95%、97%、98%或99%序列同一性的变体;或在SEQ IDNO:5、6或7中具有一个或多个保守和/或半保守氨基酸取代的变体。RAD52蛋白家族的特征包括具有DNA结合活性的保守螺旋-发夹-螺旋(HhH)基序(Iyer等人,2002)。本文使用的SSAP可进一步包括被鉴定为“重组酶”的蛋白质,其在美国专利申请序列号16/075,281(PCT/US 2017/016184的美国国家阶段,作为WO 2017/184227公布,通过引用以其整体并入本文)的至少表1、2、3、4、5和6中列出。在某些实施例中,SSAP可以包括任何上述SSAP的等位基因变体。在某些实施例中,可以通过编码SSAP的核酸(例如表达载体、mRNA或病毒表达载体)向细胞提供任何上述SSAP。在某些实施例中,任何前述SSAP可以作为蛋白质、融合蛋白(例如具有细胞穿透肽和/或核定位序列的)或作为包含蛋白酶识别位点的多聚蛋白或插入在SSAP和其他蛋白质之间的自加工蛋白序列(例如与SSB和/或核酸外切酶组合)提供给细胞。
iii.核酸外切酶
在某些实施例中,本文提供的方法、系统、细胞和细胞培养组合物中使用的核酸外切酶包括对双链DNA(dsDNA)底物具有5’至3’或3’至5’核酸外切酶活性的核酸外切酶,其可以产生包含分别具有暴露的3’末端或暴露的5’末端的至少部分单链DNA(ssDNA)的产物。在某些实施例中,核酸外切酶将识别具有平末端的dsDNA底物,包括具有5’磷酸基团的平末端。在某些实施例中,核酸外切酶将识别具有ssDNA突出端的dsDNA底物(例如,dsDNA分子末端的5’或3’ssDNA区域,包括由提供dsDNA底物中的交错切割的核酸内切酶产生的末端)。在某些实施例中,核酸外切酶将识别在一条链中具有内部断裂的dsDNA底物(例如,带切口的dsDNA)。可用于本文的具有5’至3’核酸外切酶活性的核酸外切酶包括噬菌体λexo蛋白(例如SEQ ID NO:8)、Rac原噬菌体RecE核酸外切酶蛋白(例如SEQ ID NO:9)、阿耳特弥斯蛋白(例如SEQ ID NO:136)、阿波罗蛋白(例如SEQ ID NO:137)、DNA2核酸外切酶蛋白(例如SEQID NO:138)、Exo1核酸外切酶蛋白(例如SEQ ID NO:139)、疱疹病毒SOX蛋白(例如SEQ IDNO:140)、UL12核酸外切酶蛋白(例如SEQ ID NO:141)、肠细菌核酸外切酶VIII蛋白(例如SEQ ID NO:142)、T7噬菌体核酸外切酶蛋白质(例如SEQ ID NO:143)或具有等效5’至3’核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142或143具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。在某些实施例中,本文提供的具有5’至3’核酸外切酶活性的核酸外切酶包括SEQ ID NO:8、9、136、137、138、139、140、141、142或143中列出的具有SEQ ID NO:8、9、136、137、138、139、140、141、142或143中的至少一个或多个保守和/或半保守氨基酸取代的蛋白质。可用于本文的具有3’至5’核酸外切酶活性的核酸外切酶包括大肠杆菌核酸外切酶III蛋白(例如SEQ ID NO:144)、哺乳动物Trex2核酸外切酶蛋白(例如SEQ ID NO:145)、具有等效的3’至5’核酸外切酶活性的相关蛋白质,或与SEQ ID NO:144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白质。在某些实施例中,本文提供的具有3’至5’核酸外切酶活性的核酸外切酶包括在SEQ ID NO:144或145中列出的具有SEQ ID NO:144或145中的至少一个或多个保守和/或半保守氨基酸取代的蛋白质。在某些实施例中,上述核酸外切酶将包含核酸外切酶的DEDD/DnaQ超家族特征的保守DEDD催化残基(Bernad等人,1989)。在某些实施例中,任何前述核酸外切酶可以作为蛋白质、融合蛋白(例如具有细胞穿透肽和/或核定位序列的)或作为包含蛋白酶识别位点的多聚蛋白或插入在核酸外切酶和其他蛋白质之间的自加工蛋白序列(例如与SSB和/或SSAP组合)提供给细胞。在某些实施例中,核酸外切酶可以包括任何上述核酸外切酶的等位基因变体。在某些实施例中,可以通过编码外切核酸酶的核酸(例如表达载体、mRNA或病毒表达载体)向细胞提供任何上述核酸外切酶。在一些实施例中,序列特异性核酸内切酶是切口酶。
iv.单链DNA结合蛋白(SSB)
各种单链DNA结合蛋白(SSB)可用于本文提供的方法、系统、细胞和细胞培养组合物。在某些实施例中,SSB包括细菌SSB或任选地肠杆菌科物种SSB。在某些实施例中,SSB是埃希氏菌属物种(Escherichia sp.)、志贺氏菌属物种(Shigella sp.)、肠杆菌属物种(Enterobacter sp.)、克雷伯氏菌属物种(Klebsiella sp.)、沙雷氏菌属物种(Serratiasp.)、泛菌属物种(Pantoea sp.)或耶尔森氏菌属物种(Yersinia sp.)。本文提供的SSB包括SEQ ID NO:31和SEQ ID NO:34-131和132中列出的,以及其在SEQ ID NO:31、SEQ ID NO:34-131或132的全长上具有至少85%、90%、95%、97%、98%或99%序列同一性的变体;或其在SEQ ID NO:31、或SEQ ID NO:34-131、或132中具有一个或多个保守和/或半保守氨基酸取代的变体。本文使用的SSB可包括在本披露内容和美国专利申请序列号16/075,281(PCT/US 2017/016184的美国国家阶段,作为WO 2017/184227公布,通过引用以其整体并入本文)的至少表7和8中列出的SSB蛋白。在某些实施例中,SSB可以包括任何上述SSB的等位基因变体。在某些实施例中,可以通过编码SSB的核酸(例如表达载体、mRNA或病毒表达载体)向细胞提供任何上述SSB。在某些实施例中,任何前述SSB可以作为蛋白质、融合蛋白(例如具有细胞穿透肽和/或核定位序列的)或作为包含蛋白酶识别位点的多聚蛋白或插入在SSB和其他蛋白质之间的自加工蛋白序列(例如与SSAP和/或核酸外切酶组合)提供给细胞。
在一些实施例中,本方法中使用的SSB和SSAP来自同一生物体或来自噬菌体和噬菌体的细菌宿主。
在一些实施例中,不需要SSB。在一些实施例中,SSAP与复制蛋白A(RPA)结合配偶体融合(Fanning等人,Nucleic acids research[核酸研究],34(15),4126-4137)。在一些实施例中,SSB是内源性SSB。在一些实施例中,提供了经修饰以结合内源性SSB的SSAP。
在一些实施例中,本文提供的方法中使用的组分作为融合蛋白提供。在一些实施例中,SSAP与SSB融合。在一些实施例中,SSAP与复制蛋白A(RPA)融合。
v.植物、植物组织和植物细胞
在某些实施例中,分离的植物细胞或植物原生质体中的HDR增加(即,不位于未分离或完整的植物组织、植物部分或整个植物中)。在某些实施例中,植物细胞获自任何植物部分或组织或愈伤组织。在某些实施例中,培养物包括从以下中获得的植物细胞:植物组织、培养的植物组织外植体、整个植物、完整的节芽、茎尖或茎尖分生组织、根尖或根尖分生组织、侧生组织、居间分生组织、幼苗、整个种子、对半种子或其他种子片段、合子胚、体细胞胚、未成熟胚、胚珠、花粉、小孢子、花药、下胚轴、子叶、叶、叶柄、茎、块茎、根、愈伤组织或植物细胞悬浮液。在某些实施例中,植物细胞源自单子叶植物(例如玉蜀黍、小麦、高粱或稻)的未成熟胚或成熟胚的L1或L2层。
在某些实施例中,位于未分离或完整植物组织、植物部分、植物外植体或整个植物中的植物细胞中的HDR增加。在某些实施例中,植物细胞可以位于以下中:完整的节芽、培养的植物组织外植体、茎尖或茎尖分生组织、根尖或根尖分生组织、侧生组织、居间分生组织、幼苗、整个种子、对半种子或其他种子片段、合子胚、体细胞胚、未成熟胚、胚珠、花粉、小孢子、花药、下胚轴、子叶、叶、叶柄、茎、块茎、根或愈伤组织。在某些实施例中,所使用的外植体包括未成熟胚。未成熟胚(例如未成熟玉米胚)包括1.8-2.2mm胚、1-7mm胚和3-7mm胚。在某些实施例中,上述胚获得自成熟雌穗来源的种子、叶基、来自成熟植物的叶、叶尖、未成熟的花序、雄穗、未成熟的雌穗、和花丝。在各个方面,植物来源的用于转化的外植体包括未成熟胚、1.8-2.2mm胚、1-7mm胚和3.5-7mm胚。在一方面,用于所披露方法中的胚可以衍生自成熟雌穗来源的种子、叶基、来自成熟植物的叶、叶尖、未成熟的花序、雄穗、未成熟的雌穗和花丝。在某些实施例中,植物细胞是多能植物细胞(例如,干细胞或分生组织细胞)。在某些实施例中,植物细胞位于单子叶植物(例如玉蜀黍、小麦、高粱或稻)的未成熟胚或成熟胚的L1或L2层中。在某些实施例中,WO 2018085693(通过引用以其整体并入本文)中公开的对整个植物、种子、胚、外植体或分生组织的基因组进行编辑的方法可以适用于本文提供的植物细胞和相关系统、方法、组合物或培养物。
在某些实施例中,植物细胞可包含单倍体、二倍体或多倍体植物细胞或植物原生质体,例如从单倍体、二倍体或多倍体植物、植物部分或组织或愈伤组织获得的那些。在某些实施例中,培养中的植物细胞(或再生植物、后代种子和后代植物)是单倍体或可以被诱导成为单倍体;用于制造和使用单倍体植物和植物细胞的技术是本领域已知的,参见例如,通过将野生型株系与表达改变形式的着丝粒特异性组蛋白CENH3的单倍体诱导株系杂交在拟南芥中产生单倍体的方法,如以下所述:Maruthachalam和Chan在“How to make haploidArabidopsis thaliana[如何制作单倍体拟南芥]”中,在www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf可用的方案;(Ravi等人(2014)Nature Communications[自然通讯],5:5334,doi:10.1038/ncomms6334)。单倍体也可以在广泛多种单子叶植物(例如玉蜀黍、小麦、稻、高粱、大麦)或双子叶植物(例如大豆、芸苔属物种(Brassica sp.),包括卡诺拉油菜、棉花、番茄)中通过将包含突变的CENH3基因的植物与野生型二倍体植物杂交以产生单倍体后代来获得,如美国专利号9,215,849(其通过引用以其整体并入本文)中披露。可用于获得单倍体玉蜀黍植物和/或细胞的单倍体诱导玉蜀黍品系包括Stock 6、MHI(摩尔多瓦单倍体诱导者(Moldovian Haploid Inducer))、不确定的配子体(ig)突变、KEMS、RWK、ZEM、ZMS、KMS和美国专利号9,677,082(其通过引用以其整体并入本文)中披露的转基因单倍体诱导者品系。单倍体细胞的示例包括但不限于从单倍体植物获得的植物细胞和从生殖组织获得的植物细胞,例如,来自花、发育中的花或花芽、子房、胚珠、大孢子、花药、花粉、大配子体和小孢子。在植物细胞或植物原生质体是单倍体的某些实施例中,可以通过在植物细胞或植物原生质体中进行染色体加倍(例如通过减数分裂未减数的自发染色体加倍,或通过使用染色体加倍剂,例如秋水仙碱、安磺灵、氟乐灵、拿草特、一氧化二氮气体、抗微管除草剂、抗微管剂和有丝分裂抑制剂)来使遗传互补物加倍以产生加倍的单倍体植物细胞或植物原生质体,其中基因或等位基因的互补物是纯合的;又其他实施例包括从双单倍体植物细胞或植物原生质体再生双单倍体植物。另一个实施例涉及具有至少一个亲本植物的杂种植物,该亲本植物是由该方法提供的双单倍体植物。双单倍体植物的产生在一代内提供纯合性,而不需要几代自交以获得纯合植物。在希望在尽可能短的时间内建立遗传纯度(即纯合性)的任何情况下,使用双单倍体都是有利的。双单倍体产生在生长缓慢的植物中特别有利,例如水果和其他树木,或特别有利用于产生作为至少一个双单倍体植物的后代的杂种植物。
在植物细胞中HDR增加的某些实施例中,以及本文提供的相关方法、系统、组合物或反应混合物可包括获自以下或位于以下中的植物细胞:任何目的单子叶植物或双子叶植物物种,例如大田作物植物、水果植物和树木、蔬菜、树木、和观赏植物,包括观赏花卉、灌木、树木、地被植物和草坪草。在某些非限制性实施例中,这些植物包获得自以下或位于以下中:苜蓿(紫花苜蓿(Medicago sativa))、杏仁(扁桃(Prunus dulcis))、苹果(apples)(苹果(Malus x domestica))、杏(大扁杏(Prunus armeniaca)、P.brigantine、东北杏(P.mandshurica)、梅(P.mume)、山杏(P.sibirica)、龙须菜(芦笋(Asparagusofficinalis))、香蕉(芭蕉属物种(Musa spp.))、大麦(barley)(大麦(Hordeumvulgare))、豆类(菜豆属物种(Phaseolus spp.))、蓝莓和蔓越莓(越桔属物种(Vacciniumspp.))、可可(可可树(Theobroma cacao))、卡诺拉和菜籽或油菜籽、(欧洲油菜(Brassicanapus))、康乃馨(香石竹(Dianthus caryophyllus))、胡萝卜(胡萝卜栽培种(Daucuscarota sativus))、木薯(树薯(Manihot esculentum))、樱桃(欧洲甜樱桃(Prunusavium))、鹰嘴豆(Cider arietinum)、苣荬菜(菊苣(Cichorium intybus))、红辣椒和其他辣椒属辣椒(番椒(Capsicum annuum)、观赏辣椒(C.frutescens)、中华辣椒(C.chinense)、绒毛辣椒(C.pubescens)、风铃辣椒(C.baccatum))、菊花(菊属物种(Chrysanthemumspp.))、椰子(可可椰子(Cocos nucifera))、咖啡(咖啡属物种(Coffea spp.),包括小果咖啡(Coffea arabica)和中果咖啡(Coffea canephora))、棉花(陆地棉(Gossypiumhirsutum L.))、豇豆(紫皮豇豆(Vigna unguiculata))、黄瓜(胡瓜(Cucumis sativus))、黑醋栗和鹅莓(酷栗属物种(Ribes spp.))、茄瓜(eggplant)或茄子(aubergine)(茄(Solanum melongena))、桉树(桉属物种(Eucalyptus spp.))、亚麻(flax)(亚麻(Linumusitatissumum L.))、天竺葵(天竺葵属物种(Pelargonium spp.))、西柚(葡萄柚(Citrusx paradisi))、葡萄属物种(Vitus spp.)(包括酿酒葡萄(Vitus yinifera))、番石榴(guava)(番石榴(Psidium guajava))、麻类植物(hemp)和大麻属(cannabis)(例如大麻(Cannabis sativa)和大麻属物种(Cannabis spp.))、啤酒花(蛇麻草(Humuluslupulus))、鸢尾(鸢尾属物种(Iris spp.))、柠檬(lemon)(柠檬(Citrus limon))、莴苣菜(莴苣(Lactuca sativa))、酸橙(柑橘属物种(Citrus spp.)))、玉米(玉蜀黍(Zea maysL.))、芒果(杧果(Mangifera indica))、莽吉柿(山竹(Garcinia mangostana))、甜瓜(香瓜(Cucumis melo))、粟(狗尾草属物种(Setaria spp)、稗属物种(Echinochloa spp)、糁属物种(Eleusine spp)、稷属物种(Panicum spp.)、狼尾草属物种(Pennisetum spp.))、燕麦(oats)(燕麦(Avena sativa))、油棕(Ellis quineensis)、橄榄(油橄榄(Oleaeuropaea))、洋葱(玉葱(Allium cepa))、橙(甜橙(Citrus sinensis))、木瓜(番木瓜(Carica papaya))、桃子和油桃(碧桃(Prunus persica))、梨(梨属物种(Pyrus spp.))、豌豆(普通豌豆(Pisa sativum))、花生(落花生(Arachis hypogaea))、牡丹(芍药属物种(Paeonia spp.))、喇叭花(矮牵牛属物种(Petunia spp.))、菠萝(凤梨(Ananascomosus))、大蕉(芭蕉属物种(Musa spp.))、李子(欧洲李(Prunus domestica))、圣诞红(一品红(Euphorbia pulcherrima))、波兰油菜(Polish canola)(芜菁(Brassica rapa))、杨树(杨属物种(Populus spp.))、土豆(马铃薯(Solanum tuberosum))、南瓜(美洲南瓜(Cucurbita pepo))、稻(水稻(Oryza sativa L.))、玫瑰(蔷薇属物种(Rosa spp.))、橡胶(巴西橡胶树(Hevea brasiliensis))、黑麦(rye)(黑麦(Secale cereale))、红花(safflower)(红花(Carthamus tinctorius L))、芝麻(sesame seed)(芝麻(Sesameindium))、高粱(两色高粱(Sorghum bicolor))、大豆(黄豆(Glycine max L.))、倭瓜(美洲南瓜(Cucurbita pepo))、草莓(草莓属物种(Fragaria spp.)、荷兰草莓(Fragaria xananassa))、糖甜菜(甜菜(Beta vulgaris))、甘蔗(甘蔗属物种(Saccharum spp.))、太阳花(向日葵(Helianthus annus))、甘薯(番薯(Ipomoea batatas))、橘子(大红桔(Citrustangerina))、茶(野茶树(Camellia sinensis))、烟草(普通烟草(Nicotiana tabacumL.))、西红柿(番茄(Lycopersicon esculentum))、郁金香(郁金香属物种(Tulipa spp.))、萝卜(Brassica rapa rapa)、核桃(核桃属物种(Juglans spp.L.))、西瓜(watermelon)(西瓜(Citrulus lanatus))、小麦(普通小麦(Tritium aestivum))、或山药(薯蓣属物种(Discorea spp.))。
vi.真核细胞
在某些实施例中,其中HDR增加的真核细胞(例如植物细胞)可以是以下细胞,这些细胞(a)封装或封闭在以下中或附着至以下:聚合物(例如果胶、琼脂糖或其他多糖)或其他支持物(固体或半固体表面或基质,或颗粒或纳米颗粒);(b)封装或封闭在以下中或附着至以下:囊泡或脂质体或其他流体隔室;(c)未封装、封闭或附着。在某些实施例中,细胞可以在液体或悬浮培养物中,或在半固体或固体培养基中或上培养,或在液体和固体或半固体培养基的组合中培养(例如,植物细胞或原生质体在具有液体培养基覆盖层的固体培养基上培养,或植物细胞或原生质体附着至固体珠或基质上并在液体培养基中生长)。在某些实施例中,细胞被封装在聚合物(例如、果胶、琼脂糖或其他多糖)或其他封装材料中,封装在囊泡或脂质体中,悬浮在混合相培养基(例如乳液或反相乳液)中,或嵌入或附着至基质或其他固体支持物(例如、珠或微珠、膜或固体表面)。
在相关方面,本披露内容提供了在本文描述的系统、方法和组合物中具有改善的HDR频率的真核细胞(例如植物细胞)的安排,例如细胞的安排以便于筛选目的或用于高通量和/或多重转化或基因编辑实验。在一个实施例中,本披露内容提供了多个细胞的安排,包括:(a)HDR促进剂;和任选的(b)基因组编辑分子。在某些实施例中,细胞的安排可进一步包含至少一种化学、酶促或物理递送剂。在另一个实施例中,本披露内容提供了包括多个容器的阵列,每个容器包括具有增加的HDR介导的基因组修饰频率的至少一个细胞。在一个实施例中,本披露内容提供了具有HDR促进剂和任选的基因组编辑分子的细胞的安排,其中细胞呈阵列形式(例如,在多孔板中),封装或封闭在囊泡、脂质体或液滴中(可用的,(例如,在微流体装置中),或离散地附着到基质或离散的颗粒或珠上;一个具体的实施例是以阵列形式提供的具有增加的HDR介导的基因组修饰频率的多个细胞的这种安排,进一步包括至少一种基因组编辑分子(例如RNA指导的DNA核酸酶,至少一种指导RNA,或包括RNA指导的DNA核酸酶和至少一种指导RNA两者的核糖核蛋白)(其对于阵列上的至少一些位置或甚至对于阵列上的每个位置可以是不同的),以及任选地至少一种化学、酶促或物理递送试剂。
在本文提供的系统和方法中,真核细胞(例如植物细胞)可以以任何时间顺序暴露于一种或多种HDR促进剂和/或一种或多种基因编辑分子。在某些实施例中,同时提供HDR促进剂和基因编辑分子。在其他实施例中,在提供HDR促进剂之后提供基因组编辑分子。在其他实施例中,在提供HDR促进剂之前提供基因编辑分子。总之,可以在将细胞暴露于基因编辑分子之前、同时或之后将HDR促进剂提供给真核细胞(例如植物细胞)。
本文提供了具有由HDR促进剂(例如,SSAP、核酸外切酶和SSB)和/或经修饰的DNA供体模板赋予的同源定向修复(HDR)介导的基因组修饰频率增加的真核细胞(例如,植物细胞)。本披露内容还提供了源自或生长自具有由本文披露的系统和方法提供的HDR介导的基因组修饰频率增加的植物细胞或植物原生质体的组合物;这样的组合物包括多个原生质体或细胞、愈伤组织、体细胞胚、体细胞分生组织、胚发生愈伤组织,或从具有增加的HDR介导的基因组修饰频率的植物细胞或植物原生质体生长的再生植物。可以通过多种技术评估经受HDR促进剂和/或经修饰的DNA供体模板的细胞中增加的HDR介导的基因组修饰频率。在某些实施例中,这样的技术可以比较在经受HDR促进剂的细胞中观察到的HDR频率与未经受HDR促进剂(例如SSAP、核酸外切酶、和SSB)和/或经修饰的DNA供体模板的对照细胞中的HDR频率。
在某些实施例中,本文提供的系统、方法和组合物中使用的真核细胞(例如植物细胞)可包括非分裂细胞。这样的非分裂细胞可包括植物细胞原生质体、经受一种或多种遗传和/或药物诱导的细胞周期阻断等的真核细胞。在某些实施例中,在用HDR促进剂(例如,SSAP、核酸外切酶和SSB)和/或基因编辑分子(其可以任选地包括本文提供的经修饰的DNA供体模板)处理后,可以诱导非分裂细胞分裂(例如,通过逆转或消除遗传或药物细胞周期阻断)。
在某些实施例中,本文提供的系统、方法和组合物中使用的真核细胞(例如植物细胞)可包括分裂细胞。分裂细胞可以包括在包括叶、分生组织和胚在内的各种植物组织中发现的那些细胞。这些组织包括但不限于来自玉蜀黍幼叶、分生组织和盾片组织(来自授粉后(DAP)约8或10至约12或14天的胚)的分裂细胞。玉蜀黍胚的分离已在一些出版物中进行了描述(Brettschneider,Becker,和
Figure BDA0003417860190000251
1997;Leduc等人1996;Frame等人2011;K.Wang和Frame 2009)。在某些实施例中,基部叶组织(例如,位于距玉蜀黍植物的叶舌约0至3cm处的叶组织;Kirienko,Luo,和Sylvester 2012)被靶向进行HDR介导的基因编辑。用于从本文提供的HDR介导的植物细胞基因编辑获得可再生植物结构和再生植物的方法可以改编自美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)中披露的方法。在某些实施例中,经受HDR介导的基因编辑的单个植物细胞将产生单个可再生植物结构。在某些实施例中,单个可再生植物细胞结构可以由已经进行HDR介导的基因编辑的外植体上或内的单个细胞形成。
vii.植物再生
在一些实施例中,本文提供的方法可以包括从已经进行改进的HDR介导的基因编辑的植物细胞或从获得自该植物细胞的可再生植物结构生长或再生植物的另外步骤。在某些实施例中,植物可进一步包含由本文披露的方法和组合物提供的插入的转基因、靶基因编辑或基因组编辑。在某些实施例中,愈伤组织由植物细胞产生,小植物和植物由这样的愈伤组织产生。在其他实施例中,整个幼苗或植物直接从植物细胞生长而没有愈伤组织阶段。因此,另外的相关方面涉及从具有靶基因编辑或基因组编辑的植物细胞或植物原生质体生长或再生的整个幼苗和植物,以及这样的植物的种子。在其中植物细胞或植物原生质体经受基因修饰(例如,通过例如RNA指导的DNA核酸酶进行基因组编辑)的某些实施例中,生长或再生的植物表现出与基因修饰相关的表型。在某些实施例中,生长或再生的植物在其基因组中包括两个或更多个遗传或表观遗传修饰,它们组合地提供至少一个目的表型。在某些实施例中,具有靶基因编辑或基因组编辑的异质植物细胞群(其中至少一些包括至少一个遗传或表观遗传修饰)由该方法提供;相关方面包括具有与基因修饰或表观遗传修饰相关的目的表型的植物,其通过以下来提供:从植物细胞或植物原生质体再生具有目的表型的植物(该植物细胞或植物原生质体选自具有靶基因或基因组编辑的异质植物细胞群),或从生长或再生自具有靶基因编辑或基因组编辑的植物细胞群的异质植物群中选择具有目的表型的植物。目的表型的示例包括除草剂抗性、对非生物胁迫(例如,对极端温度、干旱或盐的耐受性)或生物胁迫(例如,对线虫、细菌或真菌病原体的抗性)的改善的耐受性,改善营养物质或水的利用,经修饰的脂质、碳水化合物或蛋白质组成,改善的风味或外观,改善的储存特性(例如,对碰伤(bruising)、褐变或软化的抗性),增加的产率,改变的形态(例如,花卉结构或颜色,植物高度,分枝,根结构)。在一个实施例中,具有靶基因编辑或基因组编辑的异质植物细胞群(或从中生长或再生的幼苗或植物)暴露于允许目的表型表达的条件;例如,对除草剂抗性的选择可以包括将具有靶基因编辑或基因组编辑的植物细胞群(或从中生长或再生的幼苗或植物)暴露于一定量的除草剂或其他抑制生长或有毒的物质,允许鉴定和选择那些在处理后存活的抗性植物细胞(或幼苗或植物)。获得可再生植物结构和从植物细胞或可再生植物结构再生植物的方法可以改编自已公开的程序(Roest和Gilissen,Acta Bot.Neerl.[荷兰植物学报],1989,38(1),1-23;Bhaskaran和Smith,CropSci.[作物科学]30(6):1328-1337;Ikeuchi等人,Development[发育],2016,143:1442-1451)。用于获得可再生植物结构和从植物细胞或可再生植物结构再生植物的方法也可以改编自美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)。还提供了这样的植物的异质群、阵列或文库、从具有靶基因编辑或基因组编辑的植物细胞或植物原生质体生长或再生的这样的植物的后代或种子、植物的部分(包括用作接穗或砧木进行嫁接的植物部分)、由植物或其种子制成的产品(例如,水果或其他可食用植物部分、干净的谷物或种子、食用油、面粉或淀粉、蛋白质和其他加工产品)。实施例包括从具有靶基因编辑或基因组编辑的植物细胞生长或再生的植物,其中这些植物包含不具有遗传或表观遗传修饰的细胞或组织,例如,其中接穗或砧木含有遗传或表观遗传修饰的嫁接植物,或其中一些但不是所有细胞或组织含有遗传或表观遗传修饰的嵌合植物。嫁接通常有用的植物包括许多果树和植物,例如许多柑橘树、苹果、核果(例如、桃、杏、樱桃和李子)、鳄梨、西红柿、茄子、黄瓜、瓜类植物、西瓜、葡萄以及各种观赏植物,例如玫瑰。嫁接植物可以是相同或不同(通常相关)物种之间的嫁接。其他相关方面包括通过将从具有靶基因编辑或基因组编辑并具有至少一个遗传或表观遗传修饰的植物细胞或植物原生质体生长或再生的第一植物与第二植物杂交而提供的杂种植物,其中该杂种植物包含遗传或表观遗传修饰;还考虑由杂种植物产生的种子。还预想相关方面是后代种子和后代植物,包括具有再生植物作为亲本或祖先的杂种种子和杂种植物。本文披露的植物细胞和衍生植物和种子可用于对消费者或种植者有用的各种目的。完整的植物本身可能是期望的,例如,作为覆盖作物或观赏植物种植的植物。在其他实施例中,加工产品由植物或其种子制成,例如提取的蛋白质、油、糖和淀粉、发酵产品、动物饲料或人食品、木材和木制品、药物和各种工业产品。
viii.向真核细胞提供HDR促进剂
可以通过任何合适的技术向真核细胞(例如植物细胞或植物原生质体)提供增加HDR频率的SSAP、核酸外切酶和/或SSB。在某些实施例中,通过将细胞与SSAP、核酸外切酶和/或SSB或编码SSAP、核酸外切酶和/或SSB的多核苷酸直接接触来提供SSAP、核酸外切酶和/或SSB。在某些实施例中,通过使用化学、酶促或物理试剂将SSAP、核酸外切酶和/或SSB或编码SSAP、核酸外切酶和/或SSB的多核苷酸转运到细胞中来提供SSAP、核酸外切酶和/或SSB。在某些实施例中,SSAP、核酸外切酶和/或SSB是通过用编码SSAP、核酸外切酶和/或SSB的多核苷酸对植物细胞或植物原生质体进行细菌(例如,农杆菌属物种(Agrobacteriumsp.)、根瘤菌属物种(Rhizobium sp.)、中华根瘤菌属物种(Sinorhizobium sp.)、中生根瘤菌属物种(Mesorhizobium sp.,)、慢生根瘤菌属物种(Bradyrhizobium sp.)、固氮菌属物种(Azobacter sp.,)、叶杆菌属物种(Phyllobacterium sp.))介导的转染而提供的;参见例如Broothaerts等人(2005)Nature[自然],433:629-633。在一个实施例中,SSAP、核酸外切酶和/或SSB通过在植物细胞或植物原生质体中转录编码SSAP、核酸外切酶和/或SSB并稳定整合到植物细胞基因组中的DNA来提供,或以编码SSAP、核酸外切酶和/或SSB的质粒或表达载体(例如病毒载体)的形式提供给植物细胞或植物原生质体。在某些实施例中,SSAP、核酸外切酶和/或SSB作为编码SSAP、核酸外切酶和/或SSB的多核苷酸(例如以编码SSAP、核酸外切酶和/或SSB的RNA形式(例如,含有内部核糖体进入位点(IRES)的mRNA或RNA))提供给植物细胞或植物原生质体。在某些实施例中,将SSAP、核酸外切酶和/或SSB作为多核苷酸提供给植物细胞或植物原生质体,该多核苷酸编码以任何顺序包含SSAP、核酸外切酶和/或SSB的多聚蛋白,其氨基酸序列包含插入在编码的SSAP、核酸外切酶和/或SSB之间的蛋白酶识别位点或自加工蛋白序列。这种蛋白酶识别序列的示例包括植物金属硫蛋白样蛋白(PsMTa)的间隔区(其可以被内源性植物蛋白酶切割(Unwin等人,1998))或特定蛋白酶的识别序列(例如,TVMV Nia蛋白酶;Dasgupta等人,1998)(其也提供在细胞中)。这样的自加工蛋白序列的示例包括口蹄疫病毒(FMDV)2A序列(SEQ ID NO:33;Halpin,C.等人,1999年)。基因组编辑分子也可以通过类似的技术引入植物细胞。
ix.HDR促进剂的瞬时表达
在本文提供的方法、系统、细胞和组合物的某些实施例中,使用了HDR促进剂和/或基因组编辑分子的瞬时表达。可以通过多种技术实现SSAP、核酸外切酶和/或SSB(其增加HDR频率)或基因组编辑分子的瞬时表达。在一些实施例中,HDR促进剂的表达是可诱导的。在某些实施例中,SSAP、核酸外切酶、SSB和/或基因组编辑分子作为分离的分子、作为无细胞合成过程(例如,体外翻译)的分离产物或半纯化产物,或作为基于细胞的合成过程中的分离产物或半纯化产物(例如,比如在细菌或其他细胞裂解物中)直接提供给细胞、系统、方法和组合物。在某些实施例中,SSAP、核酸外切酶、SSB和/或基因组编辑分子以确保瞬时表达的方式靶向细胞或细胞核(例如,通过改编自Gao等人2016;或Li等人2009的方法)。在某些实施例中,在不存在任何编码SSAP、核酸外切酶、SSB和/或基因组编辑分子的多核苷酸的情况下,通过递送SSAP、核酸外切酶、SSB和/或基因组编辑分子将SSAP、核酸外切酶、SSB和/或基因组编辑分子递送到细胞中。可以在不存在任何编码多核苷酸的情况下递送的外源药剂的示例包括SSAP、核酸外切酶、SSB、序列特异性核酸内切酶和RNA指导物。RNA指导的DNA结合多肽/RNA指导物可以分开递送和/或作为RNP复合物递送。在某些实施例中,SSAP、核酸外切酶和/或SSB蛋白可以在异源系统中产生,纯化并通过粒子轰击递送至植物细胞(例如,通过改编自Martin-Ortigosa和Wang 2014的方法)。在不存在任何编码多核苷酸的情况下递送SSAP、核酸外切酶和/或SSB的实施例中,预期递送的药剂在不存在任何引入的编码多核苷酸的持续表达的情况下随时间降解以导致瞬时表达。在某些实施例中,通过递送编码SSAP、核酸外切酶和/或SSB的多核苷酸将SSAP、核酸外切酶和/或SSB递送到细胞中。在某些实施例中,SSAP、核酸外切酶和/或SSB可以在细菌质粒上编码并通过粒子轰击递送至植物组织(例如,通过改编自Hamada等人2018;或Kirienko,Luo,和Sylvester 2012的方法)。在某些实施例中,SSAP、核酸外切酶和/或SSB可以在T-DNA上编码,并使用农杆菌瞬时转移到植物细胞中(例如,通过改编自Leonelli等人2016;或Wu等人2014的方法)。在某些实施例中,SSAP、核酸外切酶和/或SSB可以在病毒基因组中编码并递送至植物(例如,通过改编自Honig等人2015的方法)。在某些实施例中,SSAP、核酸外切酶和/或SSB可以在包含IRES的mRNA或RNA中编码并递送至靶细胞。在SSAP、核酸外切酶和/或SSB包含RNA指导的DNA结合多肽和RNA指导物的某些实施例中,多肽或指导物可以通过以下组合递送:(i)多肽或指导物的编码多核苷酸;以及(ii)在不存在编码多核苷酸的情况下多肽或指导物本身。在某些实施例中,通过递送编码HDR促进剂的多核苷酸将SSAP、核酸外切酶和/或SSB递送到植物细胞中。在某些实施例中,编码SSAP、核酸外切酶和/或SSB的多核苷酸没有整合到植物细胞基因组中(例如,作为缺少提供整合的序列的多核苷酸,对整合缺陷型T-DNA载体或系统的农杆菌浸润,或在病毒载体中),未与提供自主复制的多核苷酸可操作连接,和/或仅具有提供自主复制的因子(例如,病毒复制蛋白)。用于瞬时表达的合适技术(包括多核苷酸的生物射弹和其他递送、农杆菌浸润和使用由Canto,2016和其他人披露的病毒载体)可适用于本文提供的SSAP、核酸外切酶和/或SSB的瞬时表达。由非整合多核苷酸编码的药剂的瞬时表达通过多核苷酸的切除和/或药剂的受调节表达来实现。在某些实施例中,将编码SSAP、核酸外切酶和/或SSB的多核苷酸整合到真核细胞基因组(例如植物核或质体基因组)中,并通过切除多核苷酸和/或SSAP、核酸外切酶和/或SSB的受调节表达来实现药剂的瞬时表达。可以通过使用位点特异性重组系统(例如,Cre-Lox,FLP-FRT)来切除编码该药剂的多核苷酸。可以通过包括以下的方法来实现药剂的受调节表达:(i)编码药剂的多核苷酸与发育调节型、去阻遏型和/或诱导型启动子的可操作连接;和/或(ii)引入可诱导siRNA介导的药剂抑制的多核苷酸(例如dsRNA或miRNA)。合适的位点特异性重组系统以及发育调节型、去阻遏型和/或诱导型启动子包括美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)中披露的那些。
可用于实现SSAP、核酸外切酶、SSB和/或基因组编辑分子(例如,编码SSAP、核酸外切酶、SSB、序列特异性核酸内切酶、RNA指导的核酸内切酶和/或指导RNA的多核苷酸)的瞬时表达的多核苷酸包括:(a)双链RNA;(b)单链RNA;(c)经化学修饰的RNA;(d)双链DNA;(e)单链DNA;(f)经化学修饰的DNA;或(g)(a)-(f)的组合。多核苷酸的某些实施例进一步包括提供有用功能的另外核苷酸序列;这样的另外核苷酸序列的非限制性示例包括适体或核糖开关序列、提供二级结构(例如茎环)或提供酶的序列特异性位点(例如,序列特异性重组酶或核酸内切酶位点)的核苷酸序列、T-DNA(例如,编码SSAP、核酸外切酶和/或SSB的DNA序列被包围在来自农杆菌属物种或来自其他感染或诱导植物肿瘤的细菌的左右T-DNA边界之间)、DNA核靶向序列、调控序列(例如启动子序列)和转录物稳定或去稳定序列。多核苷酸的某些实施例包括以下那些,其中多核苷酸与非核酸元件(例如载剂分子、抗体、抗原、病毒运动蛋白、细胞渗透肽或成孔肽、聚合物、可检测标记、量子点或微粒或纳米微粒)复合或共价或非共价结合。在一些实施例中,本文提供的一种或多种组分通过诱导型启动子的诱导而瞬时表达。
x.HDR促进剂的递送
各种处理可用于将基因编辑分子和/或增加HDR频率的SSAP、核酸外切酶和/或SSB递送至真核细胞(例如植物细胞)。在某些实施例中,采用一种或多种处理将HDR促进剂(例如,包含多核苷酸、多肽或其组合)递送到真核或植物细胞中,例如通过屏障,例如细胞壁、质膜、核被膜和/或其他脂质双层。在某些实施例中,例如通过将组合物与真核细胞直接接触,直接递送包含一种或多种药剂的含多核苷酸、多肽或RNP的组合物。上述组合物可以以液体、溶液、悬浮液、乳液、反相乳液、胶体、分散体、凝胶、脂质体、胶束、可注射材料、气雾剂、固体、粉末、微粒、纳米颗粒或它们的组合的形式提供,其可以直接应用于真核细胞、真核组织、真核器官、真核生物体、植物、植物部分、植物细胞或植物外植体(例如,通过擦破或刺破或以其他方式破坏细胞壁或细胞膜,通过喷洒或浸渍或浸泡或以其他方式直接接触,通过显微注射)。例如,将植物细胞或植物原生质体浸泡在含有液体SSAP、核酸外切酶和/或SSB的组合物中,从而将药剂递送至植物细胞。在某些实施例中,使用负压或正压,例如使用真空渗透或应用流体力学或流体压力来递送含药剂的组合物。在某些实施例中,将含药剂的组合物引入植物细胞或植物原生质体,例如,通过显微注射或通过细胞壁或细胞膜的破裂或变形,例如通过物理处理,例如通过施加负压或正压、剪切力,或用化学或物理递送剂(例如表面活性剂)、脂质体或纳米颗粒处理;参见,例如,如美国公开专利申请2014/0287509(通过引用以其整体并入本文)中所述,使用微流体流通过细胞变形收缩将材料递送至细胞。用于将含药剂的组合物递送至真核细胞、植物细胞或植物原生质体的其他技术包括:超声波或声波处理;振动、摩擦、剪切应力、涡流、空化;离心或施加机械力;机械细胞壁或细胞膜变形或破裂;酶促细胞壁或细胞膜破裂或透化;磨损或机械划痕(例如,用金刚砂或其他颗粒磨料磨损或用锉刀或砂纸划痕)或化学划痕(例如,用酸或苛性剂处理);和电穿孔。在某些实施例中,含药剂的组合物通过用编码药剂(例如,SSAP、外切核酸酶、SSB、序列特异性核酸内切酶和/或指导RNA)的多核苷酸对植物细胞或植物原生质体进行细菌(例如,农杆菌属物种、根瘤菌属物种、中华根瘤菌属物种、中生根瘤菌属物种、慢生根瘤菌属物种、固氮菌属物种、叶杆菌属物种)介导的转染而提供;参见例如Broothaerts等人(2005)Nature[自然],433:629-633。这些技术中的任何一种或其组合可替代地用于随后任选地从中获得或分离植物细胞的植物外植体、植物部分或组织或完整植物(或种子);在某些实施例中,在分离植物细胞之后在单独的步骤中递送含药剂的组合物。在某些实施例中,上述方法还可用于将基因组编辑分子引入真核细胞(例如植物细胞)。
在实施例中,在将增加HDR频率的SSAP、核酸外切酶和/或SSB递送至真核细胞(例如植物细胞)中所采用的处理在特定热方案下进行,其可涉及一个或多个合适的温度,例如寒冷或冷胁迫(暴露于低于正常植物生长发生的温度),或加热或热胁迫(暴露于高于正常植物生长发生的温度),或在不同温度的组合下处理。在某些实施例中,在与药剂递送分开的一个或多个步骤中,对随后从中获得或分离植物细胞或植物原生质体的植物细胞或植物、植物外植体或植物部分进行特定的热方案。在某些实施例中,上述方法还可用于将基因组编辑分子引入真核细胞。
在本文提供的植物部分、系统、方法和组合物的某些实施例中,整个植物或植物部分或种子、或分离的植物细胞、植物外植体、或植物细胞或植物原生质体来自的植物或植物部分被获得或分离,用一种或多种递送剂处理,这些递送剂可包括至少一种化学、酶促或物理试剂,或其组合。在某些实施例中,增加HDR频率的SSAP、核酸外切酶和/或SSB进一步包括一种或多于一种用于递送的化学、酶促或物理试剂。用化学、酶促或物理试剂的处理可以与药剂递送同时进行,或者在药剂递送之前或之后的一个或多个单独步骤中进行。在某些实施例中,化学、酶促或物理试剂或这些的组合与多核苷酸组合物、供体模板多核苷酸、SSAP、核酸外切酶和/或SSB相缔合或复合;这样的缔合或复合的示例包括涉及非共价相互作用(例如离子或静电相互作用,疏水或亲水相互作用,脂质体、胶束或其他异质组合物的形成)和共价相互作用(例如肽键、使用交联剂形成的键)的那些。在非限制性实例中,SSAP、核酸外切酶和/或SSB作为与阳离子脂质的脂质体复合物提供;SSAP、核酸外切酶和/或SSB作为与碳纳米管的复合物提供;和/或SSAP、核酸外切酶和/或SSB作为药剂和细胞穿透肽之间的融合蛋白提供。用于递送SSAP、核酸外切酶和/或SSB的试剂的示例包括由Zhang等人(2007)J.Controlled Release[控释杂志],123:1-10综述的各种阳离子脂质体和聚合物纳米颗粒,以及美国专利申请公开2014/0356414 A1(通过引用以其整体并入本文)中描述的交联多层脂质体。在任何前述实施例中,进一步预期上述方法还可用于将基因组编辑分子引入真核细胞(例如植物细胞)。
在某些实施例中,用于递送可增加HDR频率的SSAP、核酸外切酶和/或SSB蛋白或编码其的多核苷酸的化学试剂可包括:
(a)溶剂(例如水、二甲亚砜、二甲基甲酰胺、乙腈、N-吡咯烷、吡啶、六甲基磷酰胺、醇类、烷烃、烯烃、二噁烷、聚乙二醇和与水混溶或可乳化的其他溶剂,或将磷酸核苷酸溶解在非水系统中的其他溶剂);
(b)碳氟化合物(例如全氟萘烷、全氟甲基萘烷);
(c)二醇或多元醇(例如丙二醇、聚乙二醇);
(d)表面活性剂,包括阳离子表面活性剂、阴离子表面活性剂、非离子表面活性剂和两亲性表面活性剂,例如烷基或芳基硫酸盐、磷酸盐、磺酸盐或羧酸盐;伯胺、仲胺或叔胺;季铵盐;甜菜碱(sultaines),苄菜碱(betaines);阳离子脂质;磷脂;牛脂基伯胺;胆汁酸,例如胆酸;长链醇;有机硅表面活性剂,包括非离子有机硅表面活性剂(例如三硅氧烷乙氧基化物表面活性剂)或硅酮聚醚共聚物,例如聚环氧烷改性的七甲基三硅氧烷和烯丙基氧基聚丙二醇甲基醚的共聚物(市售为SILWET L-77TM牌表面活性剂,具有CAS编号27306-78-1和EPA编号CAL.REG.NO.5905-50073-AA,迈图高性能材料公司(MomentivePerformance Materials,Inc.),奥尔巴尼,纽约州);有用的表面活性剂的具体示例包括十二烷基硫酸钠、吐温系列表面活性剂、Triton-X100、Triton-X114、CHAPS和CHAPSO、Tergitol型NP-40、Nonidet P-40;
(e)脂质、脂蛋白、脂多糖;
(f)酸、碱、苛性剂;
(g)肽、蛋白质或酶(例如纤维素酶、果胶酶、maceroenzyme、果胶酶),包括细胞穿透肽或成孔肽(例如(BO100)2K8,金斯瑞公司(Genscript);聚赖氨酸、聚精氨酸或聚高精氨酸肽;γ玉米醇溶蛋白,参见美国专利申请公开2011/0247100,通过引用以其整体并入本文;人免疫缺陷病毒1型(“HIV-1Tat”)和其他Tat蛋白的转录激活剂,参见例如www[dot]lifetein[dot]com/Cell_Penetrating_Peptides[dot]html和
Figure BDA0003417860190000331
(2012)Mol.Therapy-Nucleic Acids[分子疗法-核酸],1:e27,1-17);八精氨酸或九精氨酸;聚高精氨酸(参见Unnamalai等人(2004)FEBS Letters[欧洲生化学会联合会快报],566:307-310);还参见细胞穿透肽CPPsite 2.0数据库,其可在crdd[dot]osdd[dot]net/raghava/cppsite/公开获得
(h)RNA酶抑制剂;
(i)阳离子支化或线性聚合物,例如壳聚糖、聚赖氨酸、DEAE-葡聚糖、聚乙烯吡咯烷酮(“PVP”)或聚乙烯亚胺(“PEI”,例如,PEI,支化,MW 25,000,CAS#9002-98-6;PEI,线性,MW 5000,CAS#9002-98-6;PEI线性,MW 2500,CAS#9002-98-6);
(j)树枝状聚合物(参见,例如,美国专利申请公开2011/0093982,通过引用以其整体并入本文);
(k)反离子、胺或多胺(例如精胺、亚精胺、腐胺)、渗压剂、缓冲剂和盐(例如磷酸钙、磷酸铵);
(1)多核苷酸(例如,非特异性双链DNA,鲑鱼精子DNA);
(m)转染剂(例如、
Figure BDA0003417860190000341
Figure BDA0003417860190000342
以及
Figure BDA0003417860190000343
(均来自赛默飞世尔科技公司(Thermo Fisher Scientific),沃尔瑟姆,马萨诸塞州)、PepFect(参见Ezzat等人(2011)Nucleic Acids Res.[核酸研究],39:5284-5298)、
Figure BDA0003417860190000344
转染试剂(米纳斯生物有限责任公司(Mires Bio,LLC),麦迪逊,威斯康星州)和聚赖氨酸、聚高精氨酸和聚精氨酸分子,包括八精氨酸和九精氨酸,如Lu等人(2010)J.Agric.Food Chem.[农业与食品化学杂志],58:2288-2294所述;
(n)抗生素,包括非特异性DNA双链断裂诱导剂(例如、腐草霉素、博来霉素、他利霉素);和/或
(o)抗氧化剂(例如谷胱甘肽、二硫苏糖醇、抗坏血酸)。
在任何前述实施例中,进一步预期上述化学试剂还可用于将基因组编辑分子引入真核细胞(例如植物细胞)。
在某些实施例中,化学试剂与增加HDR频率的SSAP、核酸外切酶和/或SSB同时提供。在某些实施例中,SSAP、核酸外切酶和/或SSB与一种或多种化学试剂共价或非共价连接或复合;例如,SSAP、核酸外切酶、SSB和/或序列特异性核酸内切酶可以共价连接至肽或蛋白质(例如细胞穿透肽或成孔肽)或非共价连接地与阳离子脂质、聚阳离子(例如,多胺)或阳离子聚合物(例如,PEI)复合。在某些实施例中,SSAP、核酸外切酶和/或SSB与一种或多种化学试剂复合以形成,例如溶液、脂质体、胶束、乳液、反相乳液、悬浮液、胶体或凝胶。在任何上述实施例中,进一步考虑还可以如上所述递送包含多核苷酸和/或多肽的基因组编辑分子。
在某些实施例中,用于递送SSAP、核酸外切酶和/或SSB(它们增加HDR频率)的物理试剂是选自由以下组成的组中的至少一种:各种尺寸范围和形状的颗粒或纳米颗粒(例如,由碳、硅、碳化硅、金、钨、聚合物或陶瓷等材料制成的颗粒或纳米颗粒)、磁性颗粒或纳米颗粒(例如,silenceMag MagnetotransfectionTM试剂、OZ生物科学公司(OZ Bioscience),圣地亚哥,加利福尼亚州)、磨料或划痕剂、针或微针、基质和载网。在某些实施例中,微粒和纳米微粒可用于递送SSAP、核酸外切酶和/或SSB。有用的微粒和纳米颗粒包括由以下制备的那些:金属(例如金、银、钨、铁、铈)、陶瓷(例如氧化铝、碳化硅、氮化硅、碳化钨)、聚合物(例如聚苯乙烯、聚二乙炔和聚(3,4-乙撑基二氧基噻吩)水合物)、半导体(例如量子点)、硅(例如碳化硅)、碳(例如石墨、石墨烯、氧化石墨烯或碳纳米片、纳米复合物或纳米管)和复合材料(例如、聚乙烯基咔唑/石墨烯、聚苯乙烯/石墨烯、铂/石墨烯、钯/石墨烯纳米复合材料)。在某些实施例中,此类微粒和纳米微粒进一步共价或非共价官能化,或进一步包括改性剂或交联材料,例如聚合物(例如线性或支化聚乙烯亚胺、聚赖氨酸)、多核苷酸(例如、DNA或RNA)、多糖、脂质、聚二醇(例如聚乙二醇、硫醇化聚乙二醇)、多肽或蛋白质和可检测标记(例如荧光团、抗原、抗体或量子点)。在各种实施例中,这样的微粒和纳米颗粒是中性的,或带有正电荷,或带有负电荷。包括微粒的组合物的实施例包括配制为以下的那些,例如液体、胶体、分散体、悬浮液、气溶胶、凝胶和固体。实施例包括固定到表面或支持物的纳米颗粒,例如,在硅或铜晶片基底上垂直排列的碳纳米管阵列。实施例包括多核苷酸组合物,其包括通过生物射弹型技术或利用磁力递送的微粒(例如金或钨或磁性颗粒)。生物射弹中使用的颗粒大小通常在“微颗粒”范围内,例如,0.6、1.0和1.6微米大小范围内的金微载体(参见例如,
Figure BDA0003417860190000351
基因枪系统,伯乐公司(Bio-Rad),赫拉克勒斯(Hercules),加利福尼亚州的使用手册;Randolph-Anderson等人(2015)“Sub-micron gold particles are superiorto larger particles for efficient
Figure BDA0003417860190000352
transformation of organelles andsome cell types[对于细胞器和某些细胞类型的高效
Figure BDA0003417860190000353
转化,亚微米金颗粒优于较大颗粒]”,伯乐公司US/EG简报2015),但已经在培养的动物细胞中报道了使用更大(40纳米)纳米颗粒进行的生物射弹成功递送;参见O’Brian和Lummis(2011)BMC Biotechnol.[BMC生物技术],11:66-71。有用颗粒的其他实施例是纳米颗粒,其通常在纳米(nm)大小范围内或小于1微米,例如,直径小于约1nm、小于约3nm、小于约5nm、小于约10nm、小于约20nm、小于约40nm、小于约60nm、小于约80nm以及小于约100nm。可商购的纳米颗粒(均来自西格玛奥德里奇公司(Sigma-Aldrich Corp.),圣路易斯,密苏里州)的具体、非限制性实施例包括直径为5、10或15nm的金纳米颗粒;粒径为10、20、40、60或100nm的银纳米颗粒;粒径小于25nm的钯“纳米粉”;单壁、双壁和多壁碳纳米管,例如,直径为0.7-1.1、1.3-2.3、0.7-0.9或0.7-1.3nm,或纳米管束尺寸为2-10nm x 1-5微米、6-9nm x 5微米、7-15nm x 0.5-10微米、7-12nm x 0.5-10微米、110-170nm x 5-9微米、6-13nm x 2.5-20微米。在某些实施例中,用于递送SSAP、核酸外切酶和/或SSB的物理试剂可包括材料,例如金、硅、铈或碳(例如金或镀金纳米颗粒)、碳化硅晶须、金刚砂、多孔二氧化硅纳米颗粒、明胶/二氧化硅纳米颗粒、二氧化铈纳米颗粒(nanoceria)或氧化铈纳米颗粒(CNP)、碳纳米管(CNT)(例如单、双或多壁碳纳米管及其化学官能化形式(例如,用酰胺、氨基、羧酸、磺酸或聚乙二醇部分官能化的碳纳米管))、以及石墨烯或氧化石墨烯或石墨烯复合物。可适用于递送SSAP、核酸外切酶和/或SSB的这样的物理试剂包括以下中披露的那些:Wong等人(2016)Nano Lett.[纳米快报],16:1161-1172;Giraldo等人(2014)Nature Materials[自然材料],13:400-409;Shen等人(2012)Theranostics[治疗诊断学],2:283-294;Kim等人(2011)Bioconjugate Chem.[生物缀合物化学],22:2558-2567;Wang等人(2010)J.Am.Chem.Soc.Comm.[美国化学学会杂志通讯],132:9274-9276;Zhao等人(2016)Nanoscale Res.Lett.[纳米尺度研究快报],11:195-203;以及Choi等人(2016)J.Controlled Release[控释杂志],235:222-235。还参见,例如,各种类型的颗粒和纳米颗粒、它们的制备及其使用方法(例如,在将多核苷酸和多肽递送至细胞中)披露于美国专利申请公开2010/0311168、2012/0023619、2012/0244569、2013/0145488、2013/0185823、2014/0096284、2015/0040268、2015/0047074和2015/0208663,所有这些通过引用以其整体并入本文。在任何上述实施例中,进一步考虑还可以如上所述递送包含多核苷酸和/或多肽的基因组编辑分子。
在一些实施例中,如本文所用,“提供”包括将细胞核中的组分聚集在一起。在一些实施例中,一种或多种组分的提供是以多肽的递送形式。在一些实施例中,一种或多种组分的递送是以多核苷酸复合的多肽形式。在一些实施例中,一种或多种组分的递送是以核糖核蛋白(RNP)的形式。在一些实施例中,Cas和指导RNA作为核糖核蛋白递送。在一些实施例中,使用脂质转染或电穿孔将RNP递送至细胞。在一些实施例中,多肽或RNP通过生物射弹递送至细胞。在一些实施例中,多肽或RNP通过PEG介导的转染递送至细胞。在一些实施例中,组分通过有性杂交递送。
在一些实施例中,组分作为RNA或DNA的形式提供。例如,在一些实施例中,一种或多种组分作为mRNA提供。在一些实施例中,mRNA编码作为组分之一的蛋白质。在一些实施例中,mRNA在细胞中被翻译以产生一种或多种组分。
在一些实施例中,一种或多种组分作为整合到染色体中的核酸提供。
在一些实施例中,i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)中的一种或多种通过包含i)-v)中的一种或多种的祖细胞来提供。在一些实施例中,祖细胞是本文所述的任何一种细胞,例如,植物、动物、真菌或其他真核细胞。在一些实施例中,祖细胞不包含序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB蛋白中的至少一种。在一些实施例中,祖细胞不包含的序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB蛋白中的至少一种随后通过递送多肽、DNA、或mRNA至祖细胞和/或祖细胞的有性杂交来提供。在一些实施例中,提供如下表A中所示的组分。
表A:由祖细胞或通过祖细胞的递送和/或有性杂交提供的组分的组合
Figure BDA0003417860190000371
Figure BDA0003417860190000381
Figure BDA0003417860190000391
Figure BDA0003417860190000401
Figure BDA0003417860190000411
xi.基因编辑分子
在其中基因编辑分子包含在组合物中提供的gRNA(或编码gRNA的多核苷酸)的某些实施例中,该组合物进一步包含核酸酶活性缺陷的受RNA指导的DNA结合多肽(或编码其的多核苷酸),可以类似地使用一种或多种化学、酶促或物理试剂。在某些实施例中,RNA指导物和核酸酶活性缺陷的受RNA指导的DNA结合多肽(ndRGDBP)或编码其的多核苷酸分开提供,例如,在分开的组合物中。此类组合物可包括其他化学或物理试剂(例如溶剂、表面活性剂、蛋白质或酶、转染剂、微粒或纳米微粒),例如上文描述的可用于多核苷酸组合物中的那些。例如,多孔二氧化硅纳米颗粒可用于将DNA重组酶传递到玉蜀黍细胞中;参见,例如Martin-Ortigosa等人(2015)Plant Physiol.[植物生理学],164:537-547,并且可以适用于将ndRGDBP或编码它的多核苷酸提供到玉蜀黍或其他植物细胞中。在一个实施例中,多核苷酸组合物包括gRNA和ndRGDBP,并且进一步包括表面活性剂和可以与ndRGDBP可操作地连接的细胞穿透肽(CPP)。在一个实施例中,多核苷酸组合物包括编码gRNA和ndRGDBP的质粒或病毒载体,并且进一步包括表面活性剂和碳纳米管。在一个实施例中,多核苷酸组合物包括多个gRNA和编码ndRGDBP的mRNA,并且进一步包括颗粒(例如金或钨颗粒),并且多核苷酸组合物通过生物射弹递送至植物细胞或植物原生质体。在任何上述实施例中,进一步预期包括基因组编辑分子的其他目的多核苷酸还可以在gRNA和ndRGDBP的递送之前、期间或之后递送。
在某些实施例中,在获得、分离或处理植物细胞的过程中,用一种或多种化学、酶或物理试剂处理从中获得或分离植物细胞的植物、植物外植体或植物部分。在某些实施例中,植物细胞、植物、植物外植体或植物部分用磨料、苛性剂、表面活性剂(例如Silwet L-77)或阳离子脂质或酶(例如纤维素酶)处理。在任何上述实施例中,进一步预期包括基因组编辑分子的其他目的多核苷酸还可以在HDR促进剂的递送之前、期间或之后递送。
在某些实施例中,一种或多于一种化学、酶促或物理试剂单独地或与编码增加HDR频率的SSAP、核酸外切酶和/或SSB的多核苷酸组合物组合地提供/应用在与处理、获得或分离植物细胞的植物位置、部分或组织不同的植物或植物部分的位置。在某些实施例中,多核苷酸组合物被施用于相邻或远端的细胞或组织,并被转运(例如,通过脉管系统或通过细胞间运动)到分生组织,随后植物细胞从该分生组织分离。在某些实施例中,通过将种子或种子片段或合子或体细胞胚浸泡在含多核苷酸的组合物中来施用含多核苷酸的组合物,由此将多核苷酸递送至植物细胞。在某些实施例中,使花蕾或茎尖与含多核苷酸的组合物接触,从而将多核苷酸递送至花蕾或茎尖中的细胞,从中获得所期望的植物细胞。在某些实施例中,将含多核苷酸的组合物施用于植物或植物部分的表面(例如,叶表面),由此将一种或多种多核苷酸递送至植物的组织,从中获得所期望的植物细胞。在某些实施例中,对整个植物或植物组织进行含有多核苷酸的组合物的颗粒或纳米颗粒介导的递送(例如生物射弹或碳纳米管或纳米颗粒递送),由此将一种或多种多核苷酸递送到细胞或组织,随后从中获得植物细胞。在任何上述实施例中,进一步预期包括基因组编辑分子的其他目的多核苷酸还可以在HDR促进剂的递送之前、期间或之后递送。
基因组编辑分子包括用于在具有本文提供的增加的HDR介导的基因组修饰频率的植物细胞中诱导基因修饰的基因编辑分子。在某些实施例中,这样的基因组编辑分子可包括:(i)多核苷酸,其选自由针对受RNA指导的核酸酶的RNA指导物、编码针对受RNA指导的核酸酶的RNA指导物的DNA组成的组;(ii)选自由以下组成的组的核酸酶:RNA指导的核酸酶、RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9、nCas9、V型Cas核酸酶、Cas12a、nCas12a、CasY、CasX、Cas12b、Cas12c、Cas12i、Cas14、工程改造的核酸酶、密码子优化的核酸酶、锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶;(iii)编码一种或多种核酸酶的多核苷酸,该一种或多种核酸酶能够实现靶核苷酸序列的位点特异性切割;和/或(iv)供体模板DNA分子。在某些实施例中,至少一种递送剂选自由以下组成的组:溶剂、碳氟化合物、二醇或多元醇、表面活性剂;伯胺、仲胺或叔胺和季铵盐;有机硅表面活性剂;脂质、脂蛋白、脂多糖;酸、碱、苛性剂;肽、蛋白质或酶;细胞穿透肽;RNA酶抑制剂;阳离子支化或线性聚合物;树枝状聚合物;反离子、胺或多胺、渗压剂、缓冲剂和盐;多核苷酸;转染剂;抗生素;螯合剂,例如草酸铵、EDTA、EGTA、环己烷二胺四乙酸,非特异性DNA双链断裂诱导剂;和抗氧化剂;颗粒或纳米颗粒、磁性颗粒或纳米颗粒、磨料或划痕剂、针或微针、基质和载网。在某些实施例中,包含本文提供的细胞的真核细胞(例如植物细胞)、系统、方法或组合物进一步包括(a)至少一个细胞,其具有至少一个Cas9、nCas9、Cas12a、nCas12a、CasY、CasX、Cas12b、Cas12c或Cas12i核酸酶或切口酶;(b)至少一种指导RNA;以及(c)任选地,至少一种化学、酶促或物理递送剂。
在本文提供的细胞、系统、方法、组合物和反应混合物中使用的基因编辑分子包括能够在双链DNA中(例如在基因组DNA中或在位于基因组DNA内的靶基因中)引入双链断裂(“DSB”)的分子以及伴随的指导RNA或供体模板多核苷酸。此类基因编辑分子的示例包括:(a)选自由以下组成的组的核酸酶:RNA指导的核酸酶、RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9、nCas9切口酶、V型Cas核酸酶、Cas12a核酸酶、nCas12a切口酶、CasY、CasX、Cas12b、Cas12c、Cas12i、Cas14、工程改造的核酸酶、密码子优化的核酸酶、锌指核酸酶(ZFN)或切口酶、转录激活子样效应子核酸酶(TAL效应子核酸酶)或切口酶、Argonaute和大范围核酸酶或工程改造的大范围核酸酶;(b)编码一种或多种核酸酶的多核苷酸,该一种或多种核酸酶能够实现靶编辑位点的位点特异性改变(例如引入DSB);(c)针对受RNA指导的核酸酶的指导RNA(gRNA),或编码针对受RNA指导的核酸酶的gRNA的DNA;以及(d)供体模板多核苷酸。
CRISPR型基因组编辑可适用于本文以多种方式提供的真核细胞(例如植物细胞)、系统、方法和组合物。CRISPR元件,即包含CRISPR核酸内切酶和CRISPR单指导RNA或编码其的多核苷酸的基因编辑分子,可用于实现基因组编辑,而没有CRISPR元件的残余物或后代中出现的选择性遗传标记。在某些实施例中,CRISPR元件作为分离的分子、作为无细胞合成过程(例如,体外翻译)的分离产物或半纯化产物,或作为基于细胞的合成过程中的分离产物或半纯化产物(例如,比如在细菌或其他细胞裂解物中)直接提供给真核细胞(例如植物包)、系统、方法和组合物。在某些实施例中,基因组插入的CRISPR元件可用于适用于本文提供的系统、方法和组合物的植物品系。在某些实施例中,本文提供的系统、方法和组合物中使用的植物或植物细胞可包含表达CRISPR核酸内切酶(例如,Cas9、Cpf1型或其他CRISPR核酸内切酶)的转基因。在某些实施例中,可以使用一种或多种具有独特PAM识别位点的CRISPR核酸内切酶。指导RNA(sgRNA或crRNA和tracrRNA)形成RNA指导的核酸内切酶/指导RNA复合物,该复合物可以特异性结合gDNA靶编辑位点中与前间隔子相邻基序(PAM)序列相邻的序列。RNA指导的核酸内切酶的类型通常会告知合适的PAM位点的位置以及crRNA或sgRNA的设计。富含G的PAM位点,例如5’-NGG通常被靶向用于设计与Cas9蛋白一起使用的crRNA或sgRNA。富含T的PAM位点(例如5’-TTTV[1],其中“V”是A、C或G)通常被靶向用于设计与Casl2a蛋白一起使用的crRNA或sgRNA(例如,SEQ ID NO:27、28、29和30)。Cpfl核酸内切酶和相应的指导RNA和PAM位点在美国专利申请公开2016/0208243 A1(针对其中编码Cpfl核酸内切酶的DNA和指导RNA和PAM位点的披露内容将其通过引用并入本文)中披露。引入与整合到植物基因组中或以其他方式提供给植物的CRISPR核酸内切酶相互作用的广泛多种CRISPR指导RNA中的一种或多种可用于基因编辑用于提供所期望的表型或性状、性状筛选或基因编辑介导的性状渗入(例如,用于将性状引入新基因型而不与轮回亲本回交或与轮回亲本有限回交)。可以在带有适当启动子的表达盒中提供多种核酸内切酶,以允许在染色体DNA或附加体DNA中以空间或时间分开的方式进行多重基因组编辑。
在美国专利申请公开2016/0138008 A1和US 2015/0344912 A1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物的基因的CRISPR技术。Cpf1核酸内切酶和相应的指导RNA和PAM位点在美国专利申请公开2016/0208243 A1中披露。其他可用于编辑基因组的CRISPR核酸酶包括Cas12b和Cas12c(参见Shmakov等人(2015)Mol.Cell[分子细胞],60:385-397)以及CasX和CasY(参见Burstein等人(2016)Nature[自然],doi:10.1038/nature21059)。用于表达CRISPR指导RNA和植物密码子优化的CRISPR Cas9核酸内切酶的植物RNA启动子在国际专利申请PCT/US 2015/018104(公开为WO 2015/131101并要求美国临时专利申请61/945,700的优先权)中披露。在植物中使用CRISPR技术进行基因组编辑的方法披露于美国专利申请公开US 2015/0082478A1和US 2015/0059010 A1以及国际专利申请PCT/US 2015/038767 A1(公开为WO 2016/007347并要求美国临时专利申请62/023,246的优先权)。本段中引用的所有专利出版物均通过引用以其整体并入本文。在某些实施例中,使用在核酸内切酶识别序列处切割靶编辑位点后留下平末端的受RNA指导的核酸内切酶。平末端切割型的受RNA指导的核酸内切酶包括Cas9、Cas12c和Cas12h(Yan等人,2019)。在某些实施例中,使用了在核酸内切酶识别序列切割后留下交错单链DNA突出端的受RNA指导的核酸内切酶。交错末端切割型的受RNA指导的核酸内切酶包括Cas12a、Cas12b和Cas12e。
方法、系统、组合物、真核细胞(例如植物细胞)也可以使用序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在dsDNA中在靶编辑位点内的核酸内切酶识别序列处切割单DNA链。dsDNA靶编辑位点中单DNA链的这种切割在本文和其他地方也称为“切口”,并且可以通过各种“切口酶”或提供切口的系统来实现。可以使用的切口酶包括nCas9(包含D10A氨基酸取代的Cas9)、nCas12a(例如包含R1226A氨基酸取代的Cas12a;Yamano等人,2016)、Cas12i(Yan等人2019)、锌指切口酶(例如Kim等人,2012中披露)、TALE切口酶(例如Wu等人,2014中披露),或其组合。在某些实施例中,提供切口的系统可包含Cas核酸酶(例如Cas9和/或Cas12a)和与靶编辑位点中的DNA序列至少有一个碱基错配的指导RNA分子(Fu等人,2019)。在某些实施例中,可以通过在相隔不超过约10、20、30、40、50、60、80、100、150或200个DNA碱基对的基因组位置创建单链断裂(即“缺口”)将基因组修饰引入靶编辑位点。在某些说明性和非限制性实施例中,两种切口酶(即引入单链DNA断裂的CAS核酸酶,包括nCas9、nCas12a、Cas12i、锌指切口酶、TALE切口酶、它们的组合等)或切口酶系统可以引导切割附近的位点,这些位点相隔不超过约10、20、30、40、50、60、80或100个DNA碱基对。在使用RNA指导的切口酶和RNA指导物的情况下,RNA指导物与足够接近(即相隔不超过约10、20、30、40、50、60、80、100、150或200个DNA碱基对)的PAM序列相邻。在使用切口酶或切口酶系统的任何前述实施例中,可以使用具有5’至3’或3’至5’核酸外切酶活性的核酸外切酶,其可以识别在一条链中具有内部断裂的dsDNA底物。在某些实施例中,T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白质或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白质可以与切口酶或切口酶系统、SSAP和SSB结合使用。
出于基因编辑的目的,可以设计CRISPR阵列以含有对应于希望的靶DNA序列的一个或多个指导RNA序列;参见例如,Cong等人(2013)Science[科学],339:819-823;Ran等人(2013)Nature Protocols[自然实验手册],8:2281-2308。为了发生DNA裂解,Cas9需要gRNA序列的至少16或17个核苷酸;对于Cpf1,需要gRNA序列的至少16个核苷酸才能实现可检测的DNA切割,并且据报道对于体外进行有效的DNA切割,需要gRNA序列的至少18个核苷酸;参见Zetsche等人(2015)Cell[细胞],163:759-771。在实践中,指导RNA序列通常被设计为具有17-24个核苷酸的长度(通常为19、20或21个核苷酸)以及与靶向的基因或核酸序列的精确互补性(即,完全碱基配对);可以使用与靶序列互补性小于100%的指导RNA(例如,长度为20个核苷酸且与靶序列有1-4个错配的gRNA),但其可以增加脱靶效应的可能性。用于植物基因组编辑的有效指导RNA的设计在美国专利申请公开2015/0082478 A1(其整个说明书通过引用并入本文)中披露。最近,使用嵌合的“单指导RNA”(“sgRNA”)(一种模拟天然存在的crRNA-tracrRNA复合物并包含tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶指导至被靶向进行编辑的序列)的工程化(合成)单RNA分子)已经实现有效基因编辑;参见例如,Cong等人(2013)Science[科学],339:819-823;Xing等人(2014)BMC Plant Biol.[BMC植物生物学],14:327-340。已经证明,在基因组编辑中,经化学修饰的sgRNA是有效的;参见例如,Hendel等人(2015)Nature Biotechnol.[自然生物技术],985-991。用于植物基因组编辑的有效gRNA的设计在美国专利申请公开2015/0082478 A1(其整个说明书通过引用并入本文)中披露。
能够在本文提供的系统、方法和组合物中实现靶核苷酸序列的位点特异性修饰的其他序列特异性核酸内切酶包括锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶或TALEN)、Argonaute蛋白和大范围核酸酶或工程改造的大范围核酸酶。锌指核酸酶(ZFN)是工程改造的蛋白质,包含与核酸切割结构域(例如核酸酶)融合的锌指DNA结合结构域。锌指结合结构域提供了特异性,并且可以被工程改造为特异性识别任何所期望的靶DNA序列。有关ZFN在植物和其他生物体中的构建和使用的综述,参见例如Umov等人(2010)Nature Rev.Genet.[自然综述遗传学],11:636-646。锌指DNA结合结构域源自一大类真核转录因子(称为锌指蛋白(ZFP))的DNA结合结构域。ZFP的DNA结合结构域通常包含至少三个锌“指”的串联阵列,每个锌“指”识别特定的DNA三联体。许多策略可用于设计锌指结合结构域的结合特异性。一种称为“模块化组装”的方法依赖于单个锌指与DNA的功能自主性。在这种方法中,通过鉴定序列中每个组分三联体的锌指并将它们连接到多指肽中来靶向给定序列。还开发了几种用于设计锌指DNA结合结构域的替代策略。这些方法旨在调节锌指接触相邻指及其靶三联体之外的核苷酸碱基的能力。通常,与天然存在的锌指蛋白相比,工程改造的锌指DNA结合结构域具有新颖的结合特异性。工程改造方法包括,例如,合理的设计和各种类型的选择。合理的设计包括,例如,使用三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的一个或多个锌指氨基酸序列相关联。参见例如,美国专利6,453,242和6,534,261,均通过引用以其整体并入本文。示例性选择方法(例如噬菌体展示和酵母双杂交系统)是众所周知的并且在文献中有描述。此外,在美国专利6,794,136(通过引用以其整体并入本文)中描述了对锌指结合结构域的结合特异性的增强。此外,可以使用任何合适的接头序列将单独的锌指结构域连接在一起。接头序列的示例是公知的,例如,参见美国专利6,479,626;6,903,185;和7,153,949,通过引用以其整体并入本文。核酸切割结构域是非特异性的并且通常是限制性核酸内切酶,例如Fokl。这种核酸内切酶必须二聚化才能切割DNA。因此,作为ZFN一部分的Fokl切割需要两个相邻且独立的结合事件,它们必须以正确的取向和适当的间距发生以允许二聚体形成。对两个DNA结合事件的要求使得能够更特异地靶向长且可能独特的识别位点。已经描述了具有增强的活性的Fokl变体;参见例如,Guo等人(2010)J.Mol.Biol.[分子生物学杂志],400:96-107。
转录激活子样效应子(TALE)是某些黄单胞菌属(Xanthomonas)物种分泌的蛋白质,用于调节宿主植物中的基因表达并促进细菌的定植和存活。TALE充当转录因子并调节植物中抗性基因的表达。最近对TALE的研究揭示了将TALE的重复区域与其靶DNA结合位点连接起来的密码。TALE包含高度保守和重复的区域,其由大部分为33或34个氨基酸的片段的串联重复组成。重复单体主要在氨基酸位置12和13处彼此不同。已发现位置12和13处的独特氨基酸对与TALE结合位点中的相应核苷酸之间存在很强的相关性。氨基酸序列与TALE结合结构域的DNA识别之间的简单关系允许设计具有任何所期望特异性的DNA结合结构域。TALE可以连接到非特异性DNA切割结构域以制备序列特异性核酸内切酶,称为TAL效应子核酸酶或TALEN。与ZFN的情况一样,可以方便地使用限制性核酸内切酶,例如Fokl。有关TALEN在植物中使用的说明,参见Mahfouz等人(2011)Proc.Natl.Acad.Sci.USA[美国科学院院报],108:2623-2628和Mahfouz(2011)GM Crops[GM作物],2:99-103。
Argonaute是蛋白质,其可作为序列特异性核酸内切酶通过结合多核苷酸(例如,包括与靶核苷酸序列互补的序列的单链DNA或单链RNA)来起功能,该多核苷酸指导Argonaut靶向核苷酸序列并实现靶核苷酸序列的位点特异性改变;参见,例如,美国专利申请公开2015/0089681,通过引用以其整体并入本文。
在一些实施例中,核酸内切酶结合核酸内切酶识别序列。在一些实施例中,核酸内切酶切割核酸内切酶识别序列。在一些实施例中,术语“核酸内切酶识别序列”与核酸内切酶切割位点序列可互换使用。
在一些实施例中,不需要核酸内切酶。在一些实施例中,通过提供非特异性引入双链断裂的化合物来实施该方法。示例性的诱导双链断裂的化合物(包括氢醌(HQ)、苯醌(BQ)、苯三酚(BT)、过氧化氢(H2O2)、博来霉素(BLM)或抗坏血酸钠(Vit C))用于引入双链断裂。
本文提供的方法、系统、真核细胞(例如植物细胞)和组合物中使用的供体模板DNA分子包括DNA分子,其从5’到3’包含第一同源臂、替换DNA和第二同源臂,其中该同源臂包含与gDNA中核酸内切酶识别序列侧翼的基因组DNA(gDNA)序列部分或完全同源的序列,并且其中该替换DNA可以包含相对于靶gDNA的1个或更多个DNA碱基对的插入、缺失或取代。在某些实施例中,供体DNA模板同源臂的长度可为约20、50、100、200、400或600至约800或1000个碱基对。在某些实施例中,可以将供体模板DNA分子以环状(例如质粒或包括双生病毒载体的病毒载体)或线性DNA分子递送至真核细胞(例如植物细胞)。在某些实施例中,使用的环状或线性DNA分子可以包含经修饰的供体模板DNA分子,该分子从5’到3’包含核酸内切酶识别序列的第一拷贝、第一同源臂、替换DNA、第二同源臂和核酸内切酶识别序列的第二拷贝。不受理论的限制,这样的经修饰的DNA供体模板分子可以被跟用于切割真核细胞的靶标编辑位点基因组DNA内的核酸内切酶识别序列的序列特异性核酸内切酶相同的序列特异性核酸内切酶切割以释放供体模板DNA分子(其可以参与真核细胞基因组中靶编辑位点的HDR介导的基因组修饰)。在某些实施例中,供体DNA模板可包含线性DNA分子,其从5’到3’包含切割的核酸内切酶识别序列、第一同源臂、替换DNA、第二同源臂和切割的核酸内切酶识别序列。在某些实施例中,切割的核酸内切酶序列可包含以下:平DNA末端或可任选地包含5’磷酸基团的平DNA末端。在某些实施例中,切割的核酸内切酶序列包含具有单链5’或3’DNA突出端的DNA末端。这样的切割的核酸内切酶识别序列可以通过切割完整的靶序列或通过对切割的靶序列特异性核酸内切酶识别序列的拷贝进行合成来产生。供体DNA模板可以化学合成或酶促合成(例如在聚合酶链反应(PCR)中)。
还考虑使用除双链DNA之外的供体模板。例如,在一些实施例中,提供了双链DNA的前体。在一些实施例中,提供了逆转录酶的RNA模板。在一些实施例中,除了RNA之外还提供了逆转录酶。在一些实施例中,该方法包括使用单链DNA供体模板。在一些实施例中,使用单链或双链RNA模板。在一些实施例中,该方法包括使用DNA/RNA杂交体。在一些实施例中,使用PNA来生成供体模板。
在一些实施例中,提供了多于一种供体模板。在一些实施例中,提供了2、3、4、5、6、7、8、9、10或更多种供体模板。在一些实施例中,供体模板靶向相同的基因。在一些实施例中,供体模板靶向相同途径中的不同基因。在一些实施例中,供体模板靶向执行相同功能的多个基因。
用于植物细胞和本文提供的方法的其他基因组编辑分子可用于具有转基因或包含其的载体的植物或细胞。这样的转基因可赋予有用的性状,包括除草剂耐受性,有害生物耐受性(例如,对昆虫、线虫或植物病原真菌和细菌的耐受性),改善的产量,增加和/或质量改善的油、淀粉和/或蛋白质含量,改善的非生物胁迫耐受性(例如,改善或增强的水分利用效率或干旱耐受性、渗透胁迫耐受性、高盐胁迫耐受性、热胁迫耐受性、增强的寒冷耐受性,包括冷萌发耐受性),等等。这样的转基因包括通过外源蛋白表达而赋予性状的转基因以及通过抑制内源植物基因(例如通过诱导抑制内源植物基因表达的siRNA应答)表达而赋予性状的转基因。美国专利申请公开号20170121722和20170275636(通过引用以其整体并且特别地关于这样的披露内容并入本文)中披露了可以提供这样的性状的转基因。
在一些实施例中,将一种或多种多核苷酸或载体(其驱动一种或多种编码任何上述SSAP、核酸外切酶和/或SSB和/或基因组编辑分子的多核苷酸的表达)引入真核细胞(例如,植物细胞)中。在某些实施例中,多核苷酸载体包含调控元件,例如与一种或多种编码SSAP、核酸外切酶和/或SSB或基因组编辑分子的多核苷酸可操作地连接的启动子。在这样的实施例中,这些多核苷酸的表达可以通过选择合适的启动子来控制,特别是在真核细胞(例如植物细胞)中有功能的启动子;有用的启动子包括组成型、条件型、诱导型和时间或空间特异性启动子(例如组织特异性启动子、发育调节型启动子或细胞周期调节型启动子)。可用于植物细胞的发育调节型启动子包括磷脂转移蛋白(PLTP)、果糖-1,6-双磷酸酶蛋白、NAD(P)结合的罗斯曼折叠(Rossmann-Fold)蛋白、脂肪细胞质膜相关蛋白样蛋白、Rieske[2Fe-2S]铁硫结构域蛋白、叶绿体呼吸(chlororespiratory)还原6蛋白、D-甘油酸3-激酶、叶绿体样蛋白、叶绿素a-b结合蛋白7、叶绿体样蛋白、紫外线B抑制蛋白、索尔(Soul)血红素结合家族蛋白、光系统I反应中心亚基psi-N蛋白和短链脱氢酶/还原酶蛋白,披露于美国专利申请公开号20170121722(通过引用以其整体并且特别地关于这样的披露内容并入本文)中。在某些实施例中,启动子与编码多个指导RNA的核苷酸序列可操作地连接,其中编码指导RNA的序列被切割位点(例如编码微小RNA识别/切割位点或自切割核酶的核苷酸序列)隔开(参见,例如Ferré-D′Amaré和Scott(2014)Cold Spring Harbor Perspectives Biol.[生物学中的冷泉港观点],2:a003574)。在某些实施例中,启动子是与编码一种或多种指导RNA的核苷酸序列可操作地连接的RNA聚合酶III启动子。在某些实施例中,与一种或多种多核苷酸可操作地连接的启动子是驱动真核细胞(例如植物细胞)中基因表达的组成型启动子。在某些实施例中,启动子驱动细胞核或细胞器(例如叶绿体或线粒体)中的基因表达。用于植物的组成型启动子的示例包括美国专利5,858,742和5,322,938中披露的CaMV 35S启动子、美国专利5,641,876中披露的稻肌动蛋白启动子、美国专利7,151,204中披露的玉蜀黍叶绿体醛缩酶启动子,以及来自根癌农杆菌的胭脂碱合酶(NOS)和章鱼碱合酶(OCS)启动子。在某些实施例中,与编码基因组编辑系统的元件的一种或多种多核苷酸可操作地连接的启动子是来自无花果花叶病毒(FMV)的启动子、RUBISCO启动子或丙酮酸磷酸双激酶(PPDK)启动子(其在光合组织中有活性)。其他考虑的启动子包括细胞特异性或组织特异性或发育调节型启动子,例如,将核酸靶向系统的表达限制于种系细胞或生殖细胞的启动子(例如,编码DNA连接酶、重组酶、复制酶的基因或其他在种系细胞或生殖细胞中特异性表达的基因的启动子)。在某些实施例中,基因组改变仅限于在后代中从其遗传DNA的那些细胞,这在希望限制基因组编辑系统的表达以避免基因毒性或其他不想要的影响的情况下是有利的。本段中引用的所有专利出版物均通过引用以其整体并入本文。
本文提供的表达载体或多核苷酸可包含靠近表达盒3′末端的DNA片段,其充当终止转录的信号并指导所得mRNA的聚腺苷酸化,并且还可支持启动子活性。这种3’元件通常称为“3′-非翻译区”或“3′-UTR”或“聚腺苷酸化信号”。在某些情况下,基于植物基因的3’元件(或终止子)由3’-UTR和下游非转录序列组成(Nuccio等人,2015)。有用的3′元件包括:披露于美国专利号6,090,627(通过引用并入本文)中的根癌农杆菌nos 3′、tml 3′、tmr 3′、tms 3′、ocs 3′和tr73′元件,以及披露于美国专利申请公开2002/0192813 A1(通过引用并入本文)中的来自植物基因(例如来自小麦(Triticum aestivum)的热休克蛋白17、泛素和果糖-1,6-二磷酸酶基因,以及来自水稻(Oryza sativa)的谷蛋白、乳酸脱氢酶和β-微管蛋白基因)的3′元件。
在某些实施例中,包含表达盒的载体或多核苷酸包括另外的组分,例如,编码抗药性或除草剂基因的多核苷酸或编码可检测标记的多核苷酸,例如绿色荧光蛋白(GFP)或β-葡糖醛酸酶(gus),以方便筛选或选择表达该载体或多核苷酸的细胞。选择标记包括赋予对除草化合物(例如草甘膦、磺酰脲、草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因。这样的选择标记基因和选择剂包括玉蜀黍HRA基因(Lee等人,1988,EMBOJ[欧洲分子生物学学会杂志]7:1241-1248),其赋予对磺酰脲类和咪唑啉酮类的抗性;CP4基因,其赋予对草甘膦的抗性(美国再颁发专利RE039247,特别是通过引用以其整体以及关于这样的基因和相关选择方法并入本文);GAT基因,其赋予对草甘膦的抗性(Castle等人,2004,Science[科学]304:1151-1154);赋予对壮观霉素的抗性的基因,例如aadA基因(Svab等人,1990,Plant Mol Biol.[植物分子生物学]14:197-205);和bar基因,其赋予对草铵膦的抗性(White等人,1990,Nucl.Acids Res.[核酸研究]25:1062);和PAT(或用于玉米的moPAT,参见Rasco-Gaunt等人,2003,Plant Cell Rep.[植物细胞报道]21:569-76;另参见Sivamani等人,2019);和PMI基因,其允许在含甘露糖的培养基上生长(Negrotto等人,2000,Plant Cell Rep.[植物细胞报道]22:684-690)。
在某些实施例中,可在本文提供的真核细胞(例如植物)、方法、系统和组合物中使用反选择标记。在某些实施例中,这样的反选择标记可并入任何不旨在插入宿主细胞基因组中的靶编辑位点处的DNA。在这样的实施例中,具有反选择标记的DNA的非限制性示例包括与编码HDR促进剂(例如SSB、SSAP和/或核酸外切酶)、基因编辑分子和/或供体模板DNA分子的DNA连接的任何DNA分子。包含供体模板DNA分子的载体或DNA分子,其中反选择标记与供体模板DNA连接并且任选地与供体模板DNA被靶编辑位点序列分开。可用于植物中的反选择标记的示例包括胞嘧啶脱氨酶基因(例如与5-氟胞嘧啶结合使用;Schlaman和Hooykaas,1997)、膦酸酯水解酶(例如,与草甘膦(包括甘油草甘膦)的膦酸酯结合使用;Dotson等人1996)、硝酸盐还原酶(例如,在含有氨作为唯一氮源的培养基上与氯酸盐结合使用;Nussaume等人1991)。
在某些实施例中,通过由HDR促进剂(即SSAP、核酸外切酶和/或SSB)和/或经修饰的模板DNA分子提供的HDR频率增加而避免使用选择标记。在这样的实施例中,选择标记和/或反选择标记可以从以下的任何中省略:供体模板DNA分子、用于递送供体模板或其他DNA分子的质粒或任何其他载体(例如病毒载体)或用于本文提供的细胞、系统、方法或组合物中的多核苷酸。
B.基因工程改造方法
在一方面,本披露内容提供了一种真核细胞的基因工程改造方法。在一些实施例中,该方法包括提供i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,该方法包括递送编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
在另一方面,本披露内容提供了一种真核细胞的基因工程改造方法。在一些实施例中,该方法包括i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),以及iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物。
在另一方面,该方法包括i)诱导双链断裂的化合物,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),以及iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物。
i.基因修饰
基因工程改造可能是基因功能(即编码的基因产物中的活性)的降低。这可能需要相应的修复模板,如本文所讨论的,以提供有缺陷的序列,或者它可以通过诱导DSB。特别地,基因扰动是基因敲低。在一些实施例中,细胞是植物或动物细胞。在一些实施例中,基因工程改造是在基因内引入终止密码子。在一些实施例中,基因工程改造是启动子或起始密码子中的突变。
可替代地,基因工程改造可以是基因功能(即编码的基因产物中的活性)的增加。这可能需要相应的修复模板,如本文所讨论的,以提供校正的序列。在一些实施例中,基因工程改造是蛋白质编码基因中一个或多个核苷酸的替代。
在一些实施例中,靶编辑位点位于启动子区域中。在一个实施例中,核苷酸序列可以是启动子,其中启动子的编辑导致任何以下之一或以下的任何一种组合:启动子活性增加、启动子组织特异性增加、启动子活性降低、启动子组织特异性降低、DNA结合元件的突变和/或DNA结合元件的缺失或添加。
在一个实施例中,核苷酸序列可以是细胞基因组中的调控序列。调控序列是核酸分子的片段,其能够增加或减少生物体内特定基因的表达。调控序列的示例包括但不限于转录激活子、转录阻遏物和翻译阻遏物、剪接因子、miRNA、siRNA、人工miRNA、CAAT盒、CCAAT盒、Pribnow盒、TATA盒、SECIS元件和聚腺苷酸化信号。在一些实施例中,调控元件的编辑导致改变的蛋白质翻译、RNA切割、RNA剪接或转录终止。
在一个实施例中,指导多核苷酸/Cas核酸内切酶系统可用于将TET操纵基因阻遏物/操纵基因/诱导物系统的组分或磺脲(Su)阻遏物/操纵基因/诱导物系统的组分插入植物基因组中以产生或控制诱导表达系统。
在另一个实施例中,指导多核苷酸/Cas核酸内切酶系统可用于允许启动子或启动子元件的缺失,其中启动子缺失(或启动子元件缺失)导致以下任一或以下的任一组合:基因座永久灭活、启动子活性增加(启动子强度增加)、启动子组织特异性增加、启动子活性降低、启动子组织特异性降低、新的启动子活性、诱导型启动子活性、基因表达窗口扩展,基因表达时间或发展进程的改变、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的启动子元件可以是但不限于启动子核心元件、启动子增强子元件或35S增强子元件。待缺失的启动子或启动子片段对于正在编辑的细胞而言可以是内源的、人工的、预先存在的或转基因的。
在一个实施例中,待修饰的核苷酸序列可以是终止子,其中终止子的编辑包括用不同的终止子(也称为替换终止子)或终止子片段(也称为替换终止子片段)替换终止子(也称为“终止子交换”或“终止子替换”)或终止子片段,其中终止子替换导致以下中任一个或以下的任一组合:终止子活性增加、终止子组织特异性增加、终止子活性降低、终止子组织特异性降低、DNA结合元件的突变和/或DNA结合元件的缺失或添加。待修饰的终止子(或终止子片段)可以是对于正在编辑的细胞而言内源的、人工的、预先存在的或转基因的终止子(或终止子片段)。替换终止子(或替换终止子片段)可以是对于正在编辑的细胞而言内源的、人工的、预先存在的或转基因的终止子(或终止子片段)。
待插入的终止子(或终止子元件)可以是对于正在编辑的细胞而言内源的、人工的、预先存在的或转基因的终止子(或终止子元件)。
在另一个实施例中,指导多核苷酸/Cas核酸内切酶系统可用于允许终止子或终止子元件的缺失,其中终止子缺失(或终止子元件缺失)导致以下任一或以下的任一组合:终止子活性增加(终止子强度增加)、终止子组织特异性增加、终止子活性降低、终止子组织特异性降低、DNA结合元件的突变和/或DNA结合元件的添加。待缺失的终止子或终止子片段对于正在编辑的细胞而言可以是内源的、人工的、预先存在的或转基因的。
修饰包括5′帽、3′聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2′-氟代A核苷酸、2′-氟代U核苷酸;2′-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18分子的连接、5′至3′共价连接、或其任何组合。这些修饰可产生至少一个另外的有益特征,其中该另外的有益特征选自下组:经修饰的或调节的稳定性、亚细胞靶向、追踪、荧光标记、蛋白质或蛋白质复合物的结合位点、经修饰的与互补靶编辑位点的结合亲和力、经修饰的对细胞降解的抵抗力以及增加细胞通透性。
在一些实施例中,待修饰的目的基因组序列是多泛素化位点,其中多泛素化位点的修饰导致蛋白质降解速率的改变。泛素标签宣告蛋白质要被蛋白酶体或自噬降解。已知蛋白酶体抑制剂会导致蛋白质过量产生。对编码目的蛋白质的DNA序列进行的修饰可以导致目的蛋白质的至少一个氨基酸修饰,其中所述修饰允许蛋白质的多泛素化(翻译后修饰),这导致蛋白质降解的修饰。
在一些实施例中,靶编辑位点位于基因编码区中。在一些实施例中,靶序列位于基因内区域中。在一些实施例中,靶序列位于端粒中。
在一些实施例中,本文提供的方法导致在靶编辑位点处一个或多个核苷酸的修饰。
在一些实施例中,对靶编辑位点的修饰是一个或多个核苷酸的取代。在一些实施例中,对靶编辑位点的修饰是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的取代。
在一些实施例中,对靶编辑位点的修饰是一个或多个核苷酸的缺失。在一些实施例中,对靶编辑位点的修饰是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的取代。
在一些实施例中,对靶编辑位点的修饰是一个或多个核苷酸的插入。在一些实施例中,对靶编辑位点的修饰是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的取代。
在一些实施例中,靶编辑位点被供体序列修饰,该供体序列与靶编辑位点相比具有一个或多个插入、缺失或取代。在一些实施例中,靶编辑位点被供体序列替换。
对于操纵靶序列,申请人还意指靶编辑位点的表观遗传操纵。这可以是针对靶序列的染色质状态的,诸如通过对靶编辑位点的甲基化状态的修饰(即甲基化或甲基化图案或CpG岛的添加或移除)、组蛋白修饰、增加或降低靶编辑位点的可及性,或通过促进3D折叠。
还提供了探查一种或多种动物或植物细胞中一种或多种基因的功能的方法,该方法包括使用本文提供的方法引入遗传扰动并确定改变的细胞中一种或多种基因的表达变化,从而探查一种或多种基因的功能。在一些实施例中,遗传扰动是功能丧失性突变。
在一些实施例中,该方法包括使用对同一靶具有不同修饰(即插入、缺失或取代)的多个供体DNA。在一些实施例中,多个供体DNA靶向启动子区域或编码序列。在一些实施例中,可以随后针对特定表型筛选具有不同修饰的细胞。
ii.哺乳动物的基因工程改造
本文还提供了哺乳动物细胞的基因编辑方法。在一些实施例中,基因编辑是涉及基因病症或疾病的基因座。在一些实施例中,疾病或障碍由酶中的突变引起。在一些实施例中,基因病症是代谢障碍。
示例性病症和基因是淀粉样变性神经病(TTR、PALB);淀粉样变性(APOA1、APP、AAA、CVAP、AD1、GSN、FGA、LYZ、TTR、PALB);肝硬化(KRT18、KRT8、CIRH1A、NAIC、TEX292、KIAA1988);囊性纤维化(CFTR、ABCC7、CF、MRP7);糖原贮积病(SLC2A2、GLUT2、G6PC、G6PT、G6PT1、GAA、LAMP2、LAMPB、AGL、GDE、GBE1、GYS2、PYGL、PFKM);肝腺瘤、142330(TCF1、HNF1A、MODY3)、肝衰竭、早发型和神经系统病症(SCOD1、SCO1)、肝脂酶缺乏症(LIPC)、肝母细胞癌、癌症和癌(CTNNB1、PDGFRL、PDGRL、PRLTS、AXIN1、AXIN、CTNNB1、TP53、P53、LFS1、IGF2R、MPRI、MET、CASP8、MCH5;髓质囊性肾病(UMOD、HNFJ、FJHN、MCKD2、ADMCKD2);苯丙酮尿症(PAH、PKU1、QDPR、DHPR、PTS);多囊肾和肝脏疾病(FCYT、PKHD1、ARPKD、PKD1、PKD2、PKD4、PKDTS、PRKCSH、G19P1、PCLD、SEC63)。其他优选靶包括以下中的任何一个或多个,包括以下中的一个或多个:PCSK9;Hmgcr;SERPINA1;ApoB;LDL;亨廷顿病(亨廷顿蛋白(Huntington))、血色素沉着病(HEF)、杜氏肌营养不良(肌营养不良蛋白)、镰状细胞性贫血(β球蛋白)和Tay-Sachs(氨基己糖苷酶A)
应了解的是,在提及一种通过操纵目的基因组基因座中的靶编辑位点来修饰生物体或包括人的哺乳动物或非人哺乳动物或生物体的方法的情况下,这可适用于作为整体的生物体(哺乳动物)或仅来自该生物体的单个细胞或细胞群体(如果生物体是多细胞的)。在人的情况下,例如,申请人尤其设想了单个细胞或细胞群体并且这些可以优选地进行离体修饰并且接着重新引入。在此情况下,活组织检查或其他组织或生物流体样品可能是必需的。就这一点而言,干细胞也是特别优选的。但是,当然,也设想了体内实施例。
该方法可以是离体或体外,例如在细胞培养物中或在离体或体外模型中(例如类器官或‘芯片上的动物或植物细胞’)。可替代地,该方法可以是体内的,在这种情况下,它也可以包括从受试者中分离第一细胞群,并将第二细胞群(返回)移植到受试者中。基因扰动可以针对一种或多种、或两种或更多种、或三种或更多种、或四种或更多种基因。
在本发明的一些实施例中,可以产生敲除模型。
在一些实施例中,递送是以载体形式,该载体可以是病毒载体,例如慢病毒载体或杆状病毒载体,或优选腺病毒/腺相关病毒载体,但已知并提供其他递送手段(例如酵母系统、微泡、基因枪/将载体连接到金纳米颗粒的手段)。载体不仅可以指病毒或酵母系统(例如,其中目的核酸可以可操作地连接至启动子并受其控制(就表达而言,例如最终提供经加工的RNA)),还可以将核酸直接递送到宿主细胞中。虽然在本文的方法中载体可以是病毒载体并且这有利地是AAV,但是可以使用本文讨论的其他病毒载体,例如慢病毒。例如,杆状病毒可用于在昆虫细胞中表达。这些昆虫细胞又可用于产生大量其他载体,例如适用于递送本发明的AAV或慢病毒载体。
iii.植物的基因工程改造
在一些实施例中,本文提供了一种对植物进行基因工程改造的方法。目的多核苷酸/多肽包括但不限于除草剂耐受性编码序列、杀昆虫编码序列、杀线虫编码序列、抗微生物编码序列、抗真菌编码序列、抗病毒编码序列、非生物和生物胁迫耐受性编码序列或修饰植物性状(例如产量、谷物质量、营养成分含量、淀粉质量和数量、氮固定和/或利用、脂肪酸和油含量和/或组成)的序列。更具体的目的多核苷酸包括但不限于改善作物产量的基因、改善作物合意性的多肽、编码赋予非生物胁迫(例如干旱、氮、温度、盐度、有毒金属或微量元素)抗性的蛋白质的基因,或赋予对毒素(如杀有害生物剂和除草剂)或生物胁迫(例如真菌、病毒、细菌、昆虫和线虫的攻击)以及与这些生物相关的疾病发展的抗性的那些。目的基因的一般类别包括,例如涉及信息的那些基因(例如锌指),涉及通讯的那些基因(例如激酶),以及涉及管家的那些基因(例如热休克蛋白)。例如,更具体的转基因类别包括编码重要农艺性状、抗昆虫、抗病、抗除草剂、生育力或不育性、谷物特性和商业产物的基因。目的基因通常包括那些涉及油、淀粉、碳水化合物或营养代谢的基因以及那些影响籽粒大小、蔗糖负荷等的基因,这些基因可以与其他性状叠加或组合使用。
除了使用传统的育种方法外,还可以通过遗传改变重要的农艺性状,例如油、淀粉和蛋白质含量。修饰包括增加油酸、饱和和不饱和油的含量、增加赖氨酸和硫的水平、提供必需氨基酸以及淀粉的改性。在美国专利号5,703,049、5,885,801、5,885,802和5,990,389(通过引用并入本文)中描述了戈多硫蛋白(hordothionin)的蛋白修饰。另一个示例是大豆2S白蛋白编码的富含赖氨酸和/或硫的种子蛋白(描述于美国专利号5,850,016)和来自大麦的胰凝乳蛋白酶抑制剂(描述于Williamson,等人,(1987)Eur.J.Biochem[欧洲生物化学杂志]165:99-106),其披露内容通过引用并入本文。
商业性状也可以编码在目的多核苷酸上,其可以例如增加用于乙醇生产的淀粉,或提供蛋白质的表达。转化植物的另一个重要的商业用途是生产聚合物和生物塑料,例如在美国专利号5,602,321中所述。β-酮硫解酶、PHB酶(聚羟基丁酸合酶)和乙酰乙酰辅酶A还原酶等基因(参见Schubert等人(1988)J.Bacteriol.[细菌学杂志]170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达。
编码序列的衍生物可以通过定点诱变制备,以增加编码的多肽中预选氨基酸的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因来源于大麦胰凝乳蛋白酶抑制剂,1996年11月1日提交的美国申请序列号08/740,682,和WO 98/20133,其披露内容通过引用并入本文。其他蛋白质包括富含甲硫氨酸的植物蛋白质,例如来自葵花籽的蛋白质(Lilley等人(1989)Proceedings of the World Congress on Vegetable Protein Utilization inHuman Foods and Animal Feedstuffs[人食品和动物饲料中植物蛋白质利用世界大会的会刊],编辑Applewhite(美国石油化学家协会(American Oil Chemists Society),香槟市,伊利诺伊州),第497-502页;通过引用并入本文);玉米(Pedersen等人(1986)J.Biol.Chem.[生物化学杂志]261:6279;Kirihara等人(1988)Gene[基因]71:359;两者均通过引用并入本文);和稻(Musumura等人(1989)Plant Mol.Biol.[植物分子生物学]12:123,通过引用并入本文)。其他农艺学上重要的基因编码乳液(latex)、Floury 2、生长因子、种子储存因子和转录因子。
改善作物产量的多核苷酸包括矮化基因,例如Rhtl和Rht2(Peng等人(1999)Nature[自然]400:256-261),以及那些促进植物生长的基因,例如铵诱导型谷氨酸脱氢酶。改善作物合意性的多核苷酸包括,例如,使植物具有降低的饱和脂肪含量的那些、提高植物营养价值的那些以及增加谷物蛋白质的那些。改善耐盐性的多核苷酸是在比已引入一种或多种耐盐基因的植物的天然环境更高盐度的环境中增加或允许植物生长的那些。
影响氨基酸生物合成的多核苷酸/多肽包括例如邻氨基苯甲酸合酶(AS;EC4.1.3.27),其催化植物、真菌和细菌中从芳香族氨基酸途径分支到色氨酸生物合成的第一个反应。在植物中,色氨酸生物合成的化学过程被划分在叶绿体中。例如,参见美国公开20080050506,通过引用并入本文。其他目的序列包括分支酸丙酮酸裂解酶(CPL),它是指编码酶的基因,该酶催化分支酸转化为丙酮酸和pHBA。最充分表征的CPL基因已从大肠杆菌中分离,并具有GenBank登录号M96268。参见美国专利号7,361,811,其通过引用并入本文。
这些目的多核苷酸序列可以编码参与提供疾病或有害生物抗性的蛋白质。“抗病”或“抗有害生物”是指植物避免作为植物-病原体相互作用结果的有害症状。抗有害生物基因可以编码对严重影响产量的有害生物的抗性,这些有害生物例如根虫、切根虫、欧洲玉蜀黍螟等。抗病和抗昆虫基因,例如用于抗细菌保护的溶菌酶或天蚕素,或用于抗真菌保护的防御素、葡聚糖酶或几丁质酶等蛋白质,或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶都是有用的基因产物的示例。编码抗病性状的基因包括解毒基因,例如针对伏马菌素(美国专利号5,792,931);无毒(avr)和抗病(R)基因(Jones等人(1994)Science[科学]266:789;Martin等人(1993)Science[科学]262:1432;和Mindrinos等人(1994)Cell[细胞]78:1089));等等。抗昆虫基因可以编码对严重影响产量的有害生物的抗性,这些有害生物例如根虫、切根虫、欧洲玉蜀黍螟等。这样的基因包括,例如,苏云金芽孢杆菌毒性蛋白基因(美国专利号5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;和Geiser等人(1986)Gene[基因]48:109);等等。
“除草剂抗性蛋白”或由“编码除草剂抗性的核酸分子”表达产生的蛋白包括赋予细胞比不表达该蛋白的细胞耐受更高浓度除草剂的能力的蛋白质,或与不表达该蛋白的细胞相比耐受一定浓度的除草剂的时间更长。除草剂抗性性状可通过如下基因引入进植物中:编码对起到抑制乙酰乳酸合酶(ALS)的作用的除草剂(特别是磺酰脲(sulfonylurea)类除草剂)的抗性的基因、编码对起到抑制谷氨酰胺合酶的作用的除草剂(例如草丁膦或basta)的抗性的基因(例如bar基因)、编码对草甘膦的抗性的基因(例如EPSP合酶基因和GAT基因)、编码对HPPD抑制剂的抗性的基因(例如HPPD基因)或本领域已知的其他此类基因。参见,例如,美国专利号7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970、6,867,293和美国临时申请号61/401,456,其各自通过引用并入本文。bar基因编码对除草剂basast的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性,并且ALS基因突变体编码对除草剂氯磺隆的抗性。
另外的选择标记包括赋予对除草化合物(例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因。例如,参见Yarranton,(1992)Curr Opin Biotech[生物技术当前观点]3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:6314-8;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)MolMicrobiol[分子微生物学]6:2419-22;Hu等人,(1987)Cell[细胞]48:555-66;Brown等人,(1987)Cell[细胞]49:603-12;Figge等人,(1988)Cell[细胞]52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:2549-53;Deuschle等人,(1990)Science[科学]248:480-3;Gossen,(1993)Ph.D.Thesis[博士学位论文],University ofHeidelberg[德国海德堡大学];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90:1917-21;Labow等人,(1990)Mol Cell Biol[分子细胞生物学]10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88:5072-6;Wyborski等人,(1991)Nucleic Acids Res[核酸研究]19:4647-53;Hillen and Wissman,(1989)Topics MolStruc Biol[分子与结构生物学专题]10:143-62;Degenkolb等人,(1991)AntimicrobAgents Chemother[抗微生物制剂与化疗]35:1591-5;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-104;Bonin,(1993)Ph.D.Thesis[博士学位论文]University of Heidelberg[德国海德堡大学];Gossen等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:5547-51;Oliva等人,(1992)AntimicrobAgents Chemother[抗微生物制剂与化疗]36:913-9;Hlavka等人,(1985)Handbook ofExperimental Pharmacology[实验药理学手册],第78卷(施普林格(Springer-Verlag),柏林);Gill等人,(1988)Nature[自然]334:721-4。商业性状也可以编码在一个或多个基因上,其可以例如增加用于乙醇生产的淀粉,或提供蛋白质的表达。转化植物的另一个重要的商业用途是生产聚合物和生物塑料,例如在美国专利号5,602,321中所述。β-酮硫解酶、PHB酶(聚羟基丁酸合酶)和乙酰乙酰辅酶A还原酶等基因(参见Schubert等人(1988)J.Bacteriol.[细菌学杂志]170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达。
外源产物包括植物酶和产物以及来自其他来源(包括原核生物和其他真核生物)的产物。此类产物包括酶、辅因子、激素等。可以增加蛋白质的水平,特别是具有改善的氨基酸分布以改善植物营养价值的经修饰蛋白质的水平。这是通过表达具有增强的氨基酸含量的这样的蛋白质来实现的。
在一些实施例中,真核细胞被工程改造以在生物合成途径中产生一种或多种外源蛋白质。在一些实施例中,生物合成途径用于生物燃料生产。在一些实施例中,生物合成途径针对醇。在一些实施例中,生物合成途径针对乙醇。在一些实施例中,生物合成途径用于生产小分子。在一些实施例中,生物合成途径用于生产药物。在一些实施例中,生物合成途径用于产生甾醇。在一些实施例中,生物合成途径针对激素。在一些实施例中,生物合成途径针对肽生产。在一些实施例中,生物合成途径针对萜烯。
在一些实施例中,真核细胞被工程改造为使其后代不再复制。在一些实施例中,真核细胞是病原细胞。
转基因、重组DNA分子、目的DNA序列和目的多核苷酸可以包含一种或多种用于基因沉默的DNA序列。涉及植物中的DNA序列表达的基因沉默方法是本领域已知的,包括但不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默和微小RNA(miRNA)干扰。
iv.检测
本领域普通技术人员将理解,可以通过多种方式检测靶编辑位点的基因修饰。在一些实施例中,该方法进一步包括对细胞进行测序。在一些实施例中,该方法包括检测报告基因。在一些实施例中,该方法包括使用选择标记选择细胞。
选择标记的示例包括但不限于包含限制酶位点的DNA片段;编码对在其他方面具有毒性的化合物(包括抗生素,例如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT))提供抗性的产物的DNA区段;编码在其他方面在受体细胞中缺少的产物的DNA区段(例如,tRNA基因、营养缺陷型标记);编码易于鉴定的产物的DNA区段(例如,表型标记如β-半乳糖苷酶,GUS;荧光蛋白如绿色荧光蛋白(GFP)、青色(CFP)、黄色(YFP)、红色(RFP)和细胞表面蛋白);产生用于PCR的新引物位点(例如,以前未并列的两个DNA序列的并列),包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列;并且包含允许其鉴定的特异性修饰(例如,甲基化)所需的DNA序列。
另外的选择标记包括赋予对除草化合物(例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因。例如,参见Yarranton,(1992)Curr Opin Biotech[生物技术当前观点]3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:6314-8;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)MolMicrobiol[分子微生物学]6:2419-22;Hu等人,(1987)Cell[细胞]48:555-66;Brown等人,(1987)Cell[细胞]49:603-12;Figge等人,(1988)Cell[细胞]52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:2549-53;Deuschle等人,(1990)Science[科学]248:480-3;Gossen,(1993)Ph.D.Thesis[博士学位论文],University ofHeidelberg[德国海德堡大学];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国科学院院报]90:1917-21;Labow等人,(1990)Mol Cell Biol[分子细胞生物学]10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国科学院院报]88:5072-6;Wyborski等人,(1991)Nucleic Acids Res[核酸研究]19:4647-53;Hillen and Wissman,(1989)Topics MolStruc Biol[分子与结构生物学专题]10:143-62;Degenkolb等人,(1991)AntimicrobAgents Chemother[抗微生物制剂与化疗]35:1591-5;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-104;Bonin,(1993)Ph.D.Thesis[博士学位论文]University of Heidelberg[德国海德堡大学];Gossen等人,(1992)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:5547-51;Oliva等人,(1992)AntimicrobAgents Chemother[抗微生物制剂与化疗]36:913-9;Hlavka等人,(1985)Handbook ofExperimental Pharmacology[实验药理学手册],第78卷(施普林格(Springer-Verlag),柏林);Gill等人,(1988)Nature[自然]334:721-4。
C.核酸
在一方面,本披露内容提供了编码HDR促进剂的核酸。在一些实施例中,本文提供了一种组合物,该组合物包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,核酸位于一种或多种载体中。在一些实施例中,核酸在一个载体中。
在一些实施例中,核酸编码至少一种序列特异性核酸内切酶。在一些实施例中,核酸包含与靶编辑位点具有同源性的供体模板DNA分子。在一些实施例中,核酸编码HDR促进剂。在一些实施例中,核酸编码单链DNA退火蛋白(SSAP)。在一些实施例中,核酸编码能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶。在一些实施例中,核酸编码单链DNA结合蛋白(SSB)。在一些实施例中,核酸是表达构建体或载体。在一些实施例中,表达构建体或载体包含核酸。
在一些实施例中,核酸编码基因编辑分子。在一些实施例中,核酸编码序列特异性核酸内切酶。在一些实施例中,编码序列特异性核酸内切酶的核酸包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。在一些实施例中,核酸编码RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。在一些实施例中,核酸编码锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。在一些实施例中,核酸编码一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在靶编辑位点的两个不同DNA序列处切割单DNA链。在一些实施例中,核酸编码序列特异性核酸内切酶,其包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。在一些实施例中,核酸编码包含Cas9和/或Cas12a的序列特异性核酸内切酶,并且指导RNA分子与靶编辑位点中的DNA序列具有至少一个碱基错配。
在一些实施例中,核酸包含供体DNA分子。在一些实施例中,核酸包含供体模板DNA。在一些实施例中,供体DNA分子在环状DNA载体、双生病毒复制子上提供或作为线性DNA片段提供。在一些实施例中,供体DNA分子的侧翼是核酸内切酶识别序列。
在一些实施例中,供体DNA分子包含基因组DNA靶编辑位点的经修饰序列。在一些实施例中,供体DNA分子与靶编辑位点相比包含一个或多个核苷酸的取代。在一些实施例中,供体DNA分子包含1、2、3、4、5、6、7、8、9、10或更多个核苷酸的取代。
在一些实施例中,与基因组靶编辑位点相比,供体DNA分子包含一个或多个核苷酸的缺失。在一些实施例中,供体DNA分子包含1、2、3、4、5、6、7、8、9、10或更多个核苷酸的缺失。
在一些实施例中,与基因组靶编辑位点相比,供体DNA分子包含一个或多个核苷酸的插入。在一些实施例中,插入是1、2、3、4、5、6、7、8、9、10或更多个核苷酸。
在一些实施例中,编码序列特异性核酸内切酶的核酸包含RNA指导的核酸酶,并且靶编辑位点包含PAM序列和与指导RNA互补并紧邻前间隔子相邻基序(PAM)序列的序列。在一些实施例中,核酸编码序列特异性核酸内切酶,其在切割后在靶编辑位点提供5’突出端。在一些实施例中,核酸编码SSAP,SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。在一些实施例中,核酸编码包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白的SSAP。在一些实施例中,核酸编码RecT/Redβ家族蛋白,其包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白、具有等效SSAP活性的相关蛋白或与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。在一些实施例中,核酸编码ERF家族蛋白,其包含噬菌体P22 ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。在一些实施例中,核酸编码RAD52家族蛋白,其包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
在一些实施例中,核酸编码核酸外切酶。在一些实施例中,核酸编码核酸外切酶,其中线性dsDNA分子是核酸外切酶的优选底物。在一些实施例中,包含磷酸化5’末端的线性dsDNA分子是核酸外切酶的优选底物。在一些实施例中,核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。在一些实施例中,核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。在一些实施例中,核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯(Artemis)蛋白、阿波罗(Apollo)蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、核酸外切酶III、Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。在一些实施例中,核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
在一些实施例中,核酸编码单链DNA结合蛋白(SSB)。在一些实施例中,核酸编码SSB和SSAP。在一些实施例中,核酸编码从相同宿主生物体获得的单链DNA结合蛋白(SSB)和SSAP。在一些实施例中,单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。在一些实施例中,SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。在一些实施例中,SSB包含与SEQ IDNO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
在一些实施例中,核酸编码进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)的SSAP、核酸外切酶和/或SSB蛋白。在一些实施例中,核酸编码用于在植物细胞中表达的蛋白。在一些实施例中,SSAP、核酸外切酶和/或单链DNA结合蛋白进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
在一些实施例中,本文提供的编码i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)的核酸各自与启动子可操作地连接。在一些实施例中,启动子是组成型活性启动子。在一些实施例中,启动子是诱导型启动子。在一些实施例中,启动子是植物特异性启动子。在一些实施例中,启动子是哺乳动物启动子。在一些实施例中,启动子是病毒启动子。在一些实施例中,启动子是35S启动子。在一些实施例中,启动子是泛素启动子。在一些实施例中,启动子是肌动蛋白启动子。在一些实施例中,启动子是哺乳动物启动子。在一些实施例中,启动子是CAG启动子。在一些实施例中,启动子是U6启动子。在一些实施例中,启动子是EF1a启动子。在一些实施例中,启动子是人ACTB启动子。在一些实施例中,启动子是CMV启动子。在一些实施例中,启动子是U6启动子。在一些实施例中,启动子是T7启动子。在一些实施例中,位点特异性核酸酶和/或其针对基于CRISPR/Cas的核酸酶的指导RNA在诱导型启动子的控制下表达。在这种配置中,当系统的其他组分的浓度不受速率限制时,可以诱导基因组编辑过程的开始。
在一些实施例中,本文提供的核酸在一个或多个载体中提供。在一些实施例中,本文提供的核酸在一个载体中提供。在一些实施例中,本文提供的核酸在两个载体中提供。在一些实施例中,本文提供的核酸在三个载体中提供。在一些实施例中,本文提供的核酸在四个载体中提供。在一些实施例中,本文提供的核酸在五个载体中提供。
在一些实施例中,本文提供了载体,该载体编码i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,本文提供了编码HDR促进元件的载体。在一些实施例中,本文提供了编码以下的载体:单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB)。在一些实施例中,本文提供编码至少一种序列特异性核酸内切酶和供体模板的载体。
本文还提供了第一载体和第二载体,该第一载体包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB),该第二载体包含供体模板DNA和指导RNA。
在一些实施例中,优化核酸以在特定细胞类型中表达。在一些实施例中,优化核酸以在特定物种中表达。在一些实施例中,优化核酸以在植物细胞中表达。在一些实施例中,优化核酸以在哺乳动物细胞中表达。在一些实施例中,核酸包含蛋白编码序列,例如核酸外切酶、SSB蛋白质和/或SSAP。在一些实施例中,蛋白编码序列针对在植物细胞中的翻译进行密码子优化。在一些实施例中,蛋白编码序列针对在哺乳动物细胞中的翻译进行密码子优化。
在某些实施例中,供体DNA模板同源臂的长度可为约20、50、100、200、400或600至约800或1000个碱基对。例如,供体DNA模板同源臂的长度可为约20至约1000、约50至约1000、约100至约1000、约200至约1000或约600至约1000个碱基对。在一些实施例中,供体DNA模板同源臂的长度在约400至约800个碱基对之间。在一些实施例中,供体DNA模板同源臂的长度小于250个碱基对。在一些实施例中,供体DNA模板同源臂的长度小于100个碱基对。
在某些实施例中,改变了供体DNA模板同源臂的GC含量。在一些实施例中,GC含量被最大化。
在一些实施例中,本文提供的核酸被修饰以在某种细胞类型中表达。在一些实施例中,本文提供的核酸被修饰以在真核细胞中表达。在一些实施例中,核酸被修饰以在植物或动物细胞中表达。在一些实施例中,针对哺乳动物细胞修饰核酸。在一些实施例中,针对鼠或灵长类细胞修饰核酸。在一些实施例中,针对人细胞修饰核酸。在一些实施例中,针对小鼠细胞修饰核酸。
用于在特定细胞类型中表达的核酸组合物的修饰方法是本领域公知的。在一些实施例中,本文提供的核苷酸的GC(鸟嘌呤-胞嘧啶)含量被改变。在一些实施例中,本文提供的核酸针对特定细胞类型例如真核细胞进行密码子优化。
i.病毒载体
在一方面,本披露内容提供包含本文披露的用于在哺乳动物细胞中表达的任何核酸的载体。在一些实施例中,载体包含表达构建体。在一些实施例中,载体包含编码HDR促进剂(例如、SSAP、核酸外切酶和/或SSB蛋白)、序列特异性核酸内切酶和/或供体模板DNA分子的核酸。
在一些实施例中,本文提供了一种载体,该载体包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,和/或v)单链DNA结合蛋白(SSB)。
在一些实施例中,第一载体编码以下中的一种或多种:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,第二载体编码以下中的一种或多种:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,第一载体不编码序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB蛋白中的至少一种。在一些实施例中,未被第一载体编码的序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB蛋白中的至少一种由第二载体编码。在一些实施例中,组分由如下文表B中所示的第一和第二载体编码。
表B:由第一和第二载体编码的组分的组合
Figure BDA0003417860190000701
Figure BDA0003417860190000711
Figure BDA0003417860190000721
Figure BDA0003417860190000731
Figure BDA0003417860190000741
在一些实施例中,序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB以各种组合在三个载体中提供。例如,包含序列特异性核酸内切酶的第一载体、包含供体模板DNA的第二载体以及包含SSAP、核酸外切酶和SSB的第三载体或包含序列特异性核酸内切酶、供体模板DNA和SSAP的第一载体、包含核酸外切酶的第二载体、以及包含SSB的第三载体。
在一些实施例中,序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB以各种组合在四个载体中提供。例如包含序列特异性核酸内切酶的第一载体、包含供体模板DNA的第二载体、包含SSAP的第三载体和包含核酸外切酶和SSB的第四载体或包含序列特异性核酸内切酶和供体模板DNA的第一载体、包含SSAP的第二载体、包含核酸外切酶的第三载体,以及包含SSB的第四载体。
在一些实施例中,序列特异性核酸内切酶、供体模板DNA分子、SSAP、核酸外切酶和SSB在五个载体中提供
在一些实施例中,载体是病毒载体。在一些实施例中,载体是细小病毒载体。在一些实施例中,载体是腺相关病毒(AAV)载体。在一些实施例中,载体是重组AAV(rAAV)载体。在一些实施例中,载体是腺病毒载体。在一些实施例中,载体是逆转录病毒载体。在一些实施例中,载体是慢病毒载体。在一些实施例中,载体是疱疹病毒载体。在一些实施例中,载体是杆状病毒载体。
在一些实施例中,重组腺病毒载体源自腺病毒血清型2、1、5、6、19、3、11、7、14、16、21、12、18、31、8、9、10、13、15、17、19、20、22、23、24-30、37、40、41、AdHu2、AdHu 3、AdHu4、AdHu24、AdHu26、AdHu34、AdHu35、AdHu36、AdHu37、AdHu41、AdHu48、AdHu49、AdHuSO、AdC6、AdC7、AdC69、牛Ad 3型、犬Ad 2型、绵羊Ad或猪Ad 3型。在一些实施例中,重组腺病毒载体源自腺病毒血清型2或腺病毒血清型5的变体。在一些实施例中,载体是重组慢病毒载体。在一些实施例中,重组慢病毒载体源自用水疱性口炎病毒(VSV)、淋巴细胞脉络丛脑膜炎病毒(LCMV)、罗斯河病毒(RRV)(Ross river virus)、埃博拉病毒、马尔堡病毒(Marburgvirus)、莫卡拉病毒(Mokala virus)、狂犬病病毒、RD 114或其中的变体进行假型化的慢病毒。在一些实施例中,载体是rHSV载体。在一些实施例中,rHSV载体源自rHSV-1或rHSV-2。
在上述方法的一些实施例中,载体是rAAV载体。在一些实施例中,编码HDR促进剂(例如SSAP、核酸外切酶和/或SSB蛋白)、序列特异性核酸内切酶和/或供体模板DNA分子的表达构建体侧翼是一个或多个AAV反向末端重复(ITR)序列。在一些实施例中,表达构建体的侧翼是两个AAV ITR。在一些实施例中,AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV DJ、山羊AAV、牛AAV或小鼠AAV血清型ITR。在一些实施例中,AAV ITR是AAV2 ITR。在一些实施例中,载体进一步包含填充核酸。在一些实施例中,填充核酸位于启动子和编码表达构建体的核酸之间。在一些实施例中,载体是自我互补的rAAV载体。在一些实施例中,载体包含第一核酸和第二核酸,该第一核酸编码HDR促进剂(例如SSAP、核酸外切酶和/或SSB蛋白)、序列特异性核酸内切酶和/或供体模板DNA分子,该第二核酸编码HDR促进剂(例如SSAP、核酸外切酶和/或SSB蛋白)、序列特异性核酸内切酶和/或供体模板DNA分子。在一些实施例中,第一核酸序列和第二核酸序列通过突变的AAV ITR连接,其中突变的AAV ITR包含D区的缺失并且包含末端解析序列的突变。在一些实施例中,本发明提供包含本文所述的任何载体(例如rAAV载体)的细胞。
在上述方法的一些实施例中,编码HDR促进剂(例如SSAP、核酸外切酶和/或SSB)、序列特异性核酸内切酶和/或供体模板DNA分子的载体在病毒颗粒中,其中病毒颗粒是封装rAAV载体的AAV颗粒、封装重组腺病毒载体的腺病毒颗粒、封装重组慢病毒载体的慢病毒颗粒或封装重组HSV载体的HSV颗粒。在一些实施例中,病毒颗粒是封装重组腺病毒载体的腺病毒颗粒。在一些实施例中,腺病毒颗粒包含来自以下的衣壳:腺病毒血清型2、1、5、6、19、3、11、7、14、16、21、12、18、31、8、9、10、13、15、17、19、20、22、23、24-30、37、40、41、AdHu2、AdHu3、AdHu4、AdHu24、AdHu26、AdHu34、AdHu35、AdHu36、AdHu37、AdHu41、AdHu48、AdHu49、AdHuSO、AdC6、AdC7、AdC69、牛Ad 3型、犬Ad 2型、绵羊Ad或猪Ad 3型。在一些实施例中,腺病毒颗粒包含腺病毒血清型2衣壳、或腺病毒血清型S衣壳的变体。在一些实施例中,病毒颗粒是封装重组慢病毒载体的慢病毒颗粒。在一些实施例中,慢病毒颗粒包含用水疱性口炎病毒(VSV)、淋巴细胞脉络丛脑膜炎病毒(LCMV)、罗斯河病毒(RRV)、埃博拉病毒、马尔堡病毒、莫卡拉病毒、狂犬病病毒、RD114或其中的变体进行假型化的衣壳。在一些实施例中,病毒颗粒是HSV颗粒。在一些实施例中,HSV颗粒是rHSV-1颗粒或rHSV-2颗粒。
在上述方法的一些实施例中,本发明提供了包含本文所述的任何rAAV载体的重组AAV颗粒。在一些实施例中,AAV病毒颗粒包含AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV 10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAVDJ、AAV2 N587A、AAV2 E548A、AAV2 N708A、AAV V708K、山羊AAV、AAV1/AAV2嵌合体、牛AAV或小鼠AAV衣壳rAAV2/HBoVl血清型衣壳。在一些实施例中,ITR和rAAV病毒颗粒的衣壳源自相同的AAV血清型。在一些实施例中,ITR和rAAV病毒颗粒的衣壳源自不同的AAV血清型。在一些实施例中,ITR源自AAV2并且rAAV颗粒的衣壳源自AAV1。本发明提供了一种载体,其包含本文所述的任一实施例的表达构建体。在一些实施例中,表达构建体编码HDR促进剂(例如、SSAP、核酸外切酶和/或SSB)、序列特异性核酸内切酶和/或供体模板DNA分子。在一些实施例中,载体是重组腺相关病毒(rAAV)载体、重组腺病毒载体、重组慢病毒载体或重组单纯疱疹病毒(HSV)载体。在一些实施例中,载体是重组腺病毒载体。在一些实施例中,重组腺病毒载体源自腺病毒血清型2、1、5、6、19、3、11、7、14、16、21、12、18、31、8、9、10、13、15、17、19、20、22、23、24-30、37、40、41、AdHu2、AdHu 3、AdHu4、AdHu24、AdHu26、AdHu34、AdHu35、AdHu36、AdHu37、AdHu41、AdHu48、AdHu49、AdHu50、AdC6、AdC7、AdC69、牛Ad 3型、犬Ad 2型、绵羊Ad或猪Ad3型。在一些实施例中,重组腺病毒载体源自腺病毒血清型2、或腺病毒血清型S的变体。在一些实施例中,载体是重组慢病毒载体。在一些实施例中,重组慢病毒载体源自用水疱性口炎病毒(VSV)、淋巴细胞脉络丛脑膜炎病毒(LCMV)、罗斯河病毒(RRV)、埃博拉病毒、马尔堡病毒、莫卡拉病毒、狂犬病病毒、RD114或其中的变体进行假型化的慢病毒。在一些实施例中,载体是rHSV载体。在一些实施例中,rHSV载体源自rHSV-1或rHSV-2。
在一些实施例中,载体包含选择标记。
在上述方法的一些实施例中,病毒颗粒在组合物(例如,药物组合物)中。在一些实施例中,组合物进一步包含药学上可接受的载剂。
ii.其他载体
在一些实施例中,载体是非病毒载体。在一些实施例中,载体是质粒。在一些实施例中,载体是植物转化载体。在一些实施例中,载体是用于农杆菌介导的在组织培养物或植物组织中的瞬时表达或稳定转化的载体。
使用与本发明相容的重组质粒载体的示例性系统包括但不限于“共整合”和“二元”系统。在“共整合”系统中,包含目的基因的穿梭载体通过基因重组插入到非致癌质粒中,该质粒包含植物细胞转化所需的顺式和反式作用元件,例如,在pMLJ1穿梭载体和非致癌质粒pGV3850中。第二系统称为“二元”系统,其中使用两个质粒;将目的基因插入到含有植物转化所需顺式作用元件的穿梭载体中。其他必要的功能由非致癌质粒提供,例如pBIN19穿梭载体和非致癌质粒PAL4404。可用于这些系统的这些和其他载体是可商购的。
D.细胞
在一方面,本披露内容提供了包含HDR促进剂的真核细胞。在一些实施例中,真核细胞包含基因组编辑分子和HDR促进剂。在一些实施例中,细胞是宿主细胞。在一些实施例中,细胞是根据本方法被修饰的细胞。在一些实施例中,基因组编辑分子包含(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子。在一些实施例中,HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和、单链DNA结合蛋白(SSB)。
在另一方面,本披露内容提供了通过本文提供的方法产生的真核细胞。在一些实施例中,真核细胞基因组的靶编辑位点的修饰包括向真核细胞提供基因组编辑分子和HDR促进剂,其中该基因组编辑分子包含(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子;并且其中该HDR促进剂包含SSAP、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和SSB蛋白。在一些实施例中,细胞具有通过根据本方法的修饰产生的基因组特征。在一些实施例中,去除核酸酶切割位点。在一些实施例中,核酸序列标签是有益的。
在一些实施例中,本文提供包含一种或多种载体的宿主细胞,该一种或多种载体包含i)编码以下的核酸:至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)编码以下的核酸:单链DNA退火蛋白(SSAP),iv)编码以下的核酸:能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶,和v)编码以下的核酸:单链DNA结合蛋白(SSB)。在一些实施例中,宿主细胞包含一种载体,该载体编码i)编码以下的核酸:至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)编码以下的核酸:单链DNA退火蛋白(SSAP),iv)编码以下的核酸:能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶,和v)编码以下的核酸:单链DNA结合蛋白(SSB)。在一些实施例中,细胞包含第一载体和第二载体,该第一载体包含i)编码以下的核酸:至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,该第二载体包含iii)编码以下的核酸:单链DNA退火蛋白(SSAP),iv)编码以下的核酸:能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶,和v)编码以下的核酸:单链DNA结合蛋白(SSB)。
此外,本披露内容的方法可用于增加真核细胞中HDR介导的基因组修饰,制造具有基因组修饰的真核细胞,和/或如本文所述对真核细胞进行基因工程改造。
在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞处于细胞培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞获自活生物体,并维持在细胞培养物中。在一些实施例中,细胞是单细胞生物。在一些实施例中,细胞在生物体内部。在一些实施例中,细胞是生物体。在一些实施例中,细胞是单细胞真核生物的细胞、原生动物细胞、来自植物的细胞、藻类细胞、(例如,布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、微劳马尾藻(C.agardh)、等等)、海藻(例如昆布)真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物的细胞(例如,果蝇、刺胞动物、棘皮动物、线虫、等等)、来自脊椎动物的细胞(例如,鱼、两栖动物、爬行动物、鸟、哺乳动物)、来自哺乳动物的细胞(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠,小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬科动物(例如,狗);等)等。在一些实施例中,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制造的细胞;也称为人工细胞)。在一些实施例中,细胞在细胞培养物中(例如,体外细胞培养物)。在一些实施例中,细胞是细胞集合中之一。在一些实施例中,细胞是真核细胞或源自真核细胞。在一些实施例中,细胞是植物细胞或源自植物细胞。在一些实施例中,细胞是动物细胞或源自动物细胞。在一些实施例中,细胞是无脊椎动物细胞或源自无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或源自脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或源自哺乳动物细胞。在一些实施例中,细胞是啮齿动物细胞或源自啮齿动物细胞。在一些实施例中,细胞是人细胞或源自人细胞。在一些实施例中,细胞是非人动物细胞或源自非人动物细胞。在一些实施例中,细胞是非人哺乳动物细胞或源自非人哺乳动物细胞。在一些实施例中,细胞是真菌细胞或源自真菌细胞。在一些实施例中,细胞是昆虫细胞。在一些实施例中,细胞是节肢动物细胞。在一些实施例中,细胞是原生动物细胞。在一些实施例中,细胞是蠕虫细胞。在一些实施例中,细胞是非哺乳动物细胞。在一些实施例中,细胞是鱼细胞。在一些实施例中,细胞是昆虫细胞。在一些实施例中,细胞是果蝇细胞。在一些实施例中,细胞是黑腹果蝇(Drosophila melanogaster)细胞。在一些实施例中,细胞是线虫细胞。在一些实施例中,细胞是秀丽隐杆线虫(Caenorhabditis elegans)细胞。在一些实施例中,细胞是蛔虫细胞。
在一些实施例中,细胞是祖细胞,其包含以下中的一种或多种:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),其中祖细胞不包含i)-v)中的至少一种,并且其中祖细胞不包含的i)-v)中的至少一种随后通过递送多肽、DNA、或mRNA至祖细胞和/或祖细胞的有性杂交来提供。例如,在一些实施例中,祖细胞缺少i)-v)的一种或多种组分并且用缺少的组分转化。
i.植物细胞
在一些实施例中,真核细胞是植物细胞。在一些实施例中,包含HDR促进剂的真核细胞是植物细胞。此外,本披露内容的方法可用于增加植物细胞中HDR介导的基因组修饰,制造具有基因组修饰的植物细胞,和/或对植物细胞进行基因工程改造。在一些实施例中,本文披露的方法包括编辑植物细胞。在一些实施例中,本文披露的方法包括在植物细胞中进行基因组修饰。在一些实施例中,本文披露的方法包括修饰植物细胞基因组中的靶基因座。在一些实施例中,本文披露的方法包括增加植物细胞中HDR介导的基因组修饰。
在某些实施例中,细胞是分离的植物细胞或植物原生质体(即,不位于未分离或完整的植物组织、植物部分或整个植物中)。在某些实施例中,植物细胞获自任何植物部分或组织或愈伤组织。在某些实施例中,培养物包括从以下中获得的植物细胞:植物组织、培养的植物组织外植体、整个植物、完整的节芽、茎尖或茎尖分生组织、根尖或根尖分生组织、侧生组织、居间分生组织、幼苗、整个种子、对半种子或其他种子片段、合子胚、体细胞胚、未成熟胚、胚珠、花粉、小孢子、花药、下胚轴、子叶、叶、叶柄、茎、块茎、根、愈伤组织或植物细胞悬浮液。在某些实施例中,植物细胞源自单子叶植物(例如玉蜀黍、小麦、高粱或稻)的未成熟胚或成熟胚的L1或L2层。
在某些实施例中,植物细胞位于未分离或完整植物组织、植物部分、植物外植体或整个植物中。在某些实施例中,植物细胞可以位于以下中:完整的节芽、培养的植物组织外植体、茎尖或茎尖分生组织、根尖或根尖分生组织、侧生组织、居间分生组织、幼苗、整个种子、对半种子或其他种子片段、合子胚、体细胞胚、未成熟胚、胚珠、花粉、小孢子、花药、下胚轴、子叶、叶、叶柄、茎、块茎、根或愈伤组织。在某些实施例中,所使用的外植体包括未成熟胚。未成熟胚(例如未成熟玉米胚)包括1.8-2.2mm胚、1-7mm胚和3-7mm胚。在某些实施例中,上述胚获得自成熟雌穗来源的种子、叶基、来自成熟植物的叶、叶尖、未成熟的花序、雄穗、未成熟的雌穗、和花丝。在各个方面,植物来源的用于转化的外植体包括未成熟胚、1.8-2.2mm胚、1-7mm胚和3.5-7mm胚。在一方面,胚可以衍生自成熟雌穗来源的种子、叶基、来自成熟植物的叶、叶尖、未成熟的花序、雄穗、未成熟的雌穗和花丝。在某些实施例中,植物细胞是多能植物细胞(例如,干细胞或分生组织细胞)。在某些实施例中,植物细胞位于单子叶植物(例如玉蜀黍、小麦、高粱或稻)的未成熟胚或成熟胚的L1或L2层中。
在某些实施例中,植物细胞是单倍体、二倍体或多倍体植物细胞或植物原生质体,例如从单倍体、二倍体或多倍体植物、植物部分或组织或愈伤组织获得的那些。在某些实施例中,培养中的植物细胞(或再生植物、后代种子和后代植物)是单倍体或可以被诱导成为单倍体;用于制造和使用单倍体植物和植物细胞的技术是本领域已知的,参见例如,通过将野生型株系与表达改变形式的着丝粒特异性组蛋白CENH3的单倍体诱导株系杂交在拟南芥中产生单倍体的方法,如以下所述:Maruthachalam和Chan在“How to make haploidArabidopsis thaliana[如何制作单倍体拟南芥]”中,在www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf可用的方案;(Ravi等人(2014)Nature Communications[自然通讯],5:5334,doi:10.1038/ncomms6334)。单倍体也可以在广泛多种单子叶植物(例如玉蜀黍、小麦、稻、高粱、大麦)或双子叶植物(例如大豆、芸苔属物种(Brassica sp.),包括卡诺拉油菜、棉花、番茄)中通过将包含突变的CENH3基因的植物与野生型二倍体植物杂交以产生单倍体后代来获得,如美国专利号9,215,849(其通过引用以其整体并入本文)中披露。可用于获得单倍体玉蜀黍植物和/或细胞的单倍体诱导玉蜀黍品系包括Stock 6、MHI(摩尔多瓦单倍体诱导者(Moldovian Haploid Inducer))、不确定的配子体(ig)突变、KEMS、RWK、ZEM、ZMS、KMS和美国专利号9,677,082(其通过引用以其整体并入本文)中披露的转基因单倍体诱导者品系。单倍体细胞的示例包括但不限于从单倍体植物获得的植物细胞和从生殖组织获得的植物细胞,例如,来自花、发育中的花或花芽、子房、胚珠、大孢子、花药、花粉、大配子体和小孢子。在植物细胞或植物原生质体是单倍体的某些实施例中,可以通过在植物细胞或植物原生质体中进行染色体加倍(例如通过减数分裂未减数的自发染色体加倍,或通过使用染色体加倍剂,例如秋水仙碱、安磺灵、氟乐灵、拿草特、一氧化二氮气体、抗微管除草剂、抗微管剂和有丝分裂抑制剂)来使遗传互补物加倍以产生加倍的单倍体植物细胞或植物原生质体,其中基因或等位基因的互补物是纯合的;又其他实施例包括从双单倍体植物细胞或植物原生质体再生双单倍体植物。另一个实施例涉及具有至少一个亲本植物的杂种植物,该亲本植物是由该方法提供的双单倍体植物。双单倍体植物的产生在一代内提供纯合性,而不需要几代自交以获得纯合植物。在希望在尽可能短的时间内建立遗传纯度(即纯合性)的任何情况下,使用双单倍体都是有利的。双单倍体产生在生长缓慢的植物中特别有利,例如水果和其他树木,或特别有利用于产生作为至少一个双单倍体植物的后代的杂种植物。
在某些实施例中,植物细胞获自以下或位于以下中:任何目的单子叶植物或双子叶植物物种,例如大田作物植物、水果植物和树木、蔬菜、树木、和观赏植物,包括观赏花卉、灌木、树木、地被植物和草坪草。在某些非限制性实施例中,这些植物包获得自以下或位于以下中:苜蓿(紫花苜蓿(Medicago sativa))、杏仁(扁桃(Prunus dulcis))、苹果(apples)(苹果(Malus x domestica))、杏(大扁杏(Prunus armeniaca)、P.brigantine、东北杏(P.mandshurica)、梅(P.mume)、山杏(P.sibirica)、龙须菜(芦笋(Asparagusofficinalis))、香蕉(芭蕉属物种(Musa spp.))、大麦(barley)(大麦(Hordeumvulgare))、豆类(菜豆属物种(Phaseolus spp.))、蓝莓和蔓越莓(越桔属物种(Vacciniumspp.))、可可(可可树(Theobroma cacao))、卡诺拉和菜籽或油菜籽、(欧洲油菜(Brassicanapus))、康乃馨(香石竹(Dianthus caryophyllus))、胡萝卜(胡萝卜栽培种(Daucuscarota sativus))、木薯(树薯(Manihot esculentum))、樱桃(欧洲甜樱桃(Prunusavium))、鹰嘴豆(Cider arietinum)、苣荬菜(菊苣(Cichorium intybus))、红辣椒和其他辣椒属辣椒(番椒(Capsicum annuum)、观赏辣椒(C.frutescens)、中华辣椒(C.chinense)、绒毛辣椒(C.pubescens)、风铃辣椒(C.baccatum))、菊花(菊属物种(Chrysanthemumspp.))、椰子(可可椰子(Cocos nucifera))、咖啡(咖啡属物种(Coffea spp.),包括小果咖啡(Coffea arabica)和中果咖啡(Coffea canephora))、棉花(陆地棉(Gossypiumhirsutum L.))、豇豆(紫皮豇豆(Vigna unguiculata))、黄瓜(胡瓜(Cucumis sativus))、黑醋栗和鹅莓(酷栗属物种(Ribes spp.))、茄瓜(eggplant)或茄子(aubergine)(茄(Solanum melongena))、桉树(桉属物种(Eucalyptus spp.))、亚麻(flax)(亚麻(Linumusitatissumum L.))、天竺葵(天竺葵属物种(Pelargonium spp.))、西柚(葡萄柚(Citrusx paradisi))、葡萄属物种(Vitus spp.)(包括酿酒葡萄(Vitus vinifera))、番石榴(guava)(番石榴(Psidium guajava))、麻类植物(hemp)和大麻属(cannabis)(例如大麻(Cannabis sativa)和大麻属物种(Cannabis spp.))、啤酒花(蛇麻草(Humuluslupulus))、鸢尾(鸢尾属物种(Iris spp.))、柠檬(lemon)(柠檬(Citrus limon))、莴苣菜(莴苣(Lactuca sativa))、酸橙(柑橘属物种(Citrus spp.)))、玉米(玉蜀黍(Zea maysL.))、芒果(杧果(Mangifera indica))、莽吉柿(山竹(Garcinia mangostana))、甜瓜(香瓜(Cucumis melo))、粟(狗尾草属物种(Setaria spp)、稗属物种(Echinochloa spp)、糁属物种(Eleusine spp)、稷属物种(Panicum spp.)、狼尾草属物种(Pennisetum spp.))、燕麦(oats)(燕麦(Avena sativa))、油棕(Ellis quineensis)、橄榄(油橄榄(Oleaeuropaea))、洋葱(玉葱(Allium cepa))、橙(甜橙(Citrus sinensis))、木瓜(番木瓜(Carica papaya))、桃子和油桃(碧桃(Prunus persica))、梨(梨属物种(Pyrus spp.))、豌豆(普通豌豆(Pisa sativum))、花生(落花生(Arachis hypogaea))、牡丹(芍药属物种(Paeonia spp.))、喇叭花(矮牵牛属物种(Petunia spp.))、菠萝(凤梨(Ananascomosus))、大蕉(芭蕉属物种(Musa spp.))、李子(欧洲李(Prunus domestica))、圣诞红(一品红(Euphorbia pulcherrima))、波兰油菜(Polish canola)(芜菁(Brassica rapa))、杨树(杨属物种(Populus spp.))、土豆(马铃薯(Solanum tuberosum))、南瓜(美洲南瓜(Cucurbita pepo))、稻(水稻(Oryza sativa L.))、玫瑰(蔷薇属物种(Rosa spp.))、橡胶(巴西橡胶树(Hevea brasiliensis))、黑麦(rye)(黑麦(Secale cereale))、红花(safflower)(红花(Carthamus tinctorius L))、芝麻(sesame seed)(芝麻(Sesameindium))、高粱(两色高粱(Sorghum bicolor))、大豆(黄豆(Glycine max L.))、倭瓜(美洲南瓜(Cucurbita pepo))、草莓(草莓属物种(Fragaria spp.)、荷兰草莓(Fragaria xananassa))、糖甜菜(甜菜(Beta vulgaris))、甘蔗(甘蔗属物种(Saccharum spp.))、太阳花(向日葵(Helianthus annus))、甘薯(番薯(Ipomoea batatas))、橘子(大红桔(Citrustangerina))、茶(野茶树(Camellia sinensis))、烟草(普通烟草(Nicotiana tabacumL.))、西红柿(番茄(Lycopersicon esculentum))、郁金香(郁金香属物种(Tulipa spp.))、萝卜(Brassica rapa rapa)、核桃(核桃属物种(Juglans spp.L.))、西瓜(watermelon)(西瓜(Citrulus lanatus))、小麦(普通小麦(Tritium aestivum))、或山药(薯蓣属物种(Discorea spp.))。
ii.哺乳动物细胞
在一些实施例中,包含HDR促进剂的真核细胞是动物细胞。在一些实施例中,动物细胞是哺乳动物细胞。此外,本披露内容的方法可用于增加动物细胞中HDR介导的基因组修饰,制造具有基因组修饰的动物细胞,和/或对动物细胞进行基因工程改造。在一些实施例中,这些方法可用于增加HDR介导的基因组修饰、制造具有基因组修饰的细胞和/或对哺乳动物细胞进行基因工程改造。在一些实施例中,本文披露的方法包括编辑动物细胞,例如,哺乳动物细胞。在一些实施例中,本文披露的方法包括在动物细胞(例如,哺乳动物细胞)中进行基因组修饰。在一些实施例中,本文披露的方法包括修饰动物细胞中的靶基因座,例如,哺乳动物细胞。在一些实施例中,本文披露的方法包括增加动物细胞(例如,哺乳动物细胞)中HDR介导的基因组修饰。
在一些实施例中,细胞是来自任何多细胞脊椎动物或无脊椎动物的动物细胞。在一些实施例中,动物是用于生物学、生理学或遗传学研究的模式生物。因此,在一些实施例中,动物选自:小鼠(小家鼠(Mus musculus))、斑马鱼(zebrafish,Danio rerio),果蝇(黑腹果蝇(Drosophila melanogaster)),猫(家猫(Felis sylvestris catus)),鸡(原鸡(Gallus gallus))、狗(家犬(Canis lupus familiaris))、天竺鼠(豚鼠(Caviaporcellus))、大鼠(褐家鼠(Rattus norvegicus))和线虫(秀丽隐杆线虫)。在一些实施例中,动物是驯养或养殖的动物。因此,在一些实施例中,动物选自:山羊(家山羊(Capraaegagrus hircus))、猪(家猪(Sus scrofadomesticus))、绵羊(家绵羊(Ovis aries))、牛(家牛(Bos taurus))、猫(家猫(Felis catus))、驴(努比亚野驴(Equus africanusasinus))、鸭(家鸭(Anas platyrhynchos domesticus)、水牛(包括Bubalus bubalisbubalis和Bubalus bubalis carabenesis)、西方蜜蜂(意蜂(Apis mellifera))(包括意大利蜜蜂亚种(意大利蜂(A.mellifera ligustica)、欧洲黑蜂(欧洲黑蜂(A.melliferamellifera)、卡尼鄂拉蜜蜂(卡尼鄂拉蜂(A.mellifera carnica)、高加索蜜蜂(高加索蜂(A.mellifera caucasia)、和希腊蜜蜂(马其顿蜜蜂(A.mellifera cecropia))、单峰骆驼(单峰驼(Camelus dromedarius))、马(家马(Equus ferns caballus))、蚕(家蚕(Bombyxmori))、鸽子(原鸽(Columba livia))、鹅(家鹅(Anser domesticus)和亚洲家鹅(Ansercygnoides domesticus))、牦牛(家耗牛(Bos grunniens))、双峰骆驼(双峰驼(Camelusbactrianus))、美洲驼(家羊驼(Lama glama))、羊驼(南美羊驼(Vicugna pacos))、珍珠鸡(盔珠鸡(Numida meleagris))、雪貂(蒙眼貂(Mustela putorius furo))、火鸡(吐绶鸡(Meleagris gallopavo)草鱼、鲢鱼、鲤鱼、尼罗罗非鱼、鳙鱼、喀拉鲃(印度鲤)、鲫鱼、大西洋鲑、露斯塔野鲮(roho labeo)、遮目鱼、虹鳟鱼、武昌鳊、黑鱼、北部蛇头鱼和花鲶。
在一些实施例中,细胞源自细胞系,例如,哺乳动物细胞系或人细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的示例包括但不限于A549、HEK-293、293T、MF7、K562、Caco-2、HeLa细胞及其转基因品种。在一些实施例中,细胞是HEK-293细胞。在一些实施例中,细胞是中国仓鼠卵巢(CHO)细胞。细胞系可从本领域技术人员已知的多种来源获得(参见例如,美国典型培养物保藏中心(ATCC)(马纳苏斯(Manassus),弗吉尼亚州))。在一些实施例中,用如本文所述的一种或多种核酸(例如编码HDR促进剂的载体)转染的细胞用于建立包含一种或多种载体衍生序列的新细胞系以建立包含对靶核酸的修饰的新细胞系。
在一些实施例中,细胞是原代细胞,例如,哺乳动物原代细胞或人原代细胞。例如,原代细胞的培养物可以传代0次、1次、2次、4次、5次、10次、15次或更多。在一些实施例中,通过任何已知方法从个体收获原代细胞。例如,可通过单采、白细胞单采、密度梯度分离等收获白细胞。可通过活组织检查收获来自诸如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等组织的细胞。可以使用合适的溶液来分散或悬浮收获的细胞。这样的溶液通常可以是平衡盐溶液(例如生理盐水,磷酸盐缓冲盐水(PBS),汉克平衡盐溶液,等),方便地补充有胎牛血清或其他自然发生的因子,与可接受的低浓度缓冲液结合。缓冲液可以包括HEPES、磷酸盐缓冲液、乳酸缓冲液,等。细胞可以立即使用,也可以储存(例如,通过冷冻)。冷冻的细胞可以解冻并且能够重复使用。细胞可以在DMSO、血清、培养基缓冲液(例如10%DMSO、50%血清、40%缓冲培养基)和/或其他一些这样的用于在冷冻温度下保存细胞的常用溶液中冷冻。
在一些实施例中,细胞是人细胞。在一些实施例中,细胞是种系细胞。在一些实施例中,细胞是体细胞。在一些实施例中,细胞是有丝分裂后细胞。在一些实施例中,细胞是免疫细胞,例如T细胞、自然杀伤(NK)细胞或巨噬细胞。在一些实施例中,细胞是从患者或供体获得的人T细胞。本文提供的方法可用于修饰原代T细胞中的靶核酸以用于免疫疗法。在一些实施例中,本文提供的方法用于产生CAR-T细胞,例如,通过编辑T细胞的基因组以引入表达嵌合抗原受体(CAR)的表达构建体。在一些实施例中,本文提供的方法用于离体修饰免疫细胞。在一些实施例中,本文提供的方法用于离体产生CAR-T细胞。在一些实施例中,本文披露的方法包括编辑人细胞。在一些实施例中,本文披露的方法包括在人细胞中进行基因组修饰。在一些实施例中,本文披露的方法包括修饰人细胞中的靶基因座。在一些实施例中,本文披露的方法包括增加人细胞中HDR介导的基因组修饰。
在一些实施例中,细胞是干细胞或祖细胞。在一些实施例中,细胞是未分化的细胞。在一些实施例中,细胞是人干细胞或祖细胞。在一些实施例中,细胞是哺乳动物干细胞或祖细胞。在一些实施例中,细胞是成体干细胞、胚干细胞、诱导多能(iPS)细胞或祖细胞(例如心脏祖细胞、神经祖细胞等)。在一些实施例中,细胞是造血干细胞(HSC)。在一些实施例中,细胞是间充质干细胞(MSC)。在一些实施例中,细胞是神经干细胞。在一些实施例中,细胞是上皮干细胞。细胞可以包括哺乳动物干细胞和祖细胞,包括啮齿动物干细胞、啮齿动物祖细胞、人干细胞、人祖细胞,等。
在一些实施例中,细胞是患病细胞,例如,患病的哺乳动物细胞或患病的人细胞。患病细胞可能具有改变的代谢、基因表达和/或形态特征。在一些实施例中,细胞具有带有与疾病相关的遗传变异的基因组。在一些实施例中,细胞具有与疾病相关的SNP。在一些实施例中,细胞的基因组具有与疾病相关的遗传标记。在一些实施例中,细胞具有有害突变。在一些实施例中,细胞具有引起疾病的突变。在一些实施例中,细胞具有与疾病相关的突变等位基因。在一些实施例中,细胞具有功能丧失性突变。在一些实施例中,细胞具有疾病基因型。在一些实施例中,细胞具有疾病表型。在一些实施例中,细胞具有遗传缺陷。在一些实施例中,细胞具有致癌突变。在一些实施例中,细胞具有整合的和/或稳定维持的病毒。在一些实施例中,逆转录病毒整合到细胞的基因组中。在一些实施例中,慢病毒整合到细胞的基因组中。在一些实施例中,细胞具有持续的病毒感染。在一些实施例中,细胞具有HIV。在一些实施例中,细胞具有HIV基因组的整合拷贝。在一些实施例中,细胞被病毒感染。在一些实施例中,细胞具有潜在的病毒感染。在一些实施例中,细胞被疱疹病毒感染。在一些实施例中,细胞被人疱疹病毒6或7感染。在一些实施例中,细胞被1型或2型单纯疱疹病毒感染。在一些实施例中,细胞被水痘-带状疱疹病毒感染。在一些实施例中,细胞被人乳多空病毒感染。在一些实施例中,细胞被爱泼斯坦-巴尔(Epstein-Barr)病毒感染。患病细胞可以是癌细胞、糖尿病细胞或凋亡细胞。患病细胞可以是来自患病受试者的细胞。示例性的疾病可以包括遗传障碍、传染病、血液障碍、癌症、代谢障碍、眼障碍、器官障碍、肌肉骨骼障碍、心脏病,等。在一些实施例中,细胞源自患者。在一些实施例中,细胞被离体修饰。在一些实施例中,细胞是癌细胞。在一些实施例中,细胞是胚细胞。在一些实施例中,细胞是胚干细胞。
在一些实施例中,本文提供的方法用于对患病细胞进行基因修饰,例如,患病的哺乳动物细胞或患病的人细胞。在一些实施例中,本文提供的方法用于对患病细胞进行基因修饰。在一些实施例中,本文提供的方法用于将基因的野生型等位基因插入患病细胞中。在一些实施例中,本文提供的方法用于纠正患病细胞中的有害突变。在一些实施例中,本文提供的方法用于对癌基因进行基因修饰。在一些实施例中,本文提供的方法用于对与疾病相关的基因的等位基因进行基因修饰。在一些实施例中,本文提供的方法用于插入基因的健康等位基因。在一些实施例中,本文提供的方法用于插入与疾病无关的基因的等位基因。在一些实施例中,本文提供的方法用于从细胞基因组去除整合的或稳定维持的病毒,例如慢病毒、逆转录病毒或疱疹病毒。
iii.真菌细胞
在一些实施例中,真核细胞是真菌细胞。在一些实施例中,包含HDR促进剂的真核细胞是真菌细胞。此外,本披露内容的方法可用于增加真菌细胞中HDR介导的基因组修饰,制造具有基因组修饰的真菌细胞,和/或对真菌细胞进行基因工程改造。在一些实施例中,本文披露的方法包括编辑真菌细胞。在一些实施例中,本文披露的方法包括在真菌细胞中进行基因组修饰。在一些实施例中,本文披露的方法包括修饰真菌细胞中的靶基因座。在一些实施例中,本文披露的方法包括在真菌细胞中增加HDR介导的基因组修饰。
在一些实施例中,真菌细胞是源自多细胞真菌的细胞。在一些实施例中,细胞是子囊菌纲细胞。在一些实施例中,细胞是单细胞真菌。在一些实施例中,细胞是酵母细胞。在一些实施例中,该细胞是以下属的真菌细胞:曲霉属、假丝酵母属、旋孢腔菌属、丛赤壳属、隐球菌属、表皮癣菌属、镰孢菌属、克鲁维酵母菌属、Lachancea、毛霉菌属、脉孢菌属、蛇口壳属、青霉菌属、毕赤酵母属、肺囊虫属、芽霉菌属、酵母属、裂殖酵母属、弯颈霉属、木霉属、红酵母属、或耶氏酵母属。在一些实施例中,该细胞是念珠菌属物种细胞,例如白色念珠菌、耳念珠菌、都柏林念珠菌、光滑念珠菌、吉利蒙念珠菌、或热带念珠菌细胞。在一些实施例中,该细胞是壶菌真菌细胞,即壶菌门细胞。在一些实施例中,该细胞是Batrachochytrium sp.细胞,例如蛙壶菌细胞。在一些实施例中,该细胞是微孢子目细胞,例如格留虫属物种或小孢子虫属物种细胞。在一些实施例中,真菌细胞是寄生物。在一些实施例中,该细胞是毛癣菌属物种或小孢霉属物种细胞,即真菌的属的成员,包括引起癣的寄生变种。在一些实施例中,细胞是丝状真菌细胞,即,来自丝状真菌的细胞。在一些实施例中,该细胞是隐球菌属物种细胞,例如新型隐球菌细胞。在一些实施例中,该细胞是葡萄孢属物种细胞,比如灰葡萄孢、大葱葡萄孢、喜花葡萄孢、椭圆葡萄孢、蚕豆葡萄孢、葱鳞葡萄孢、或Botrytistracheiphila细胞。
iv.其他真核细胞
在一些实施例中,包含HDR促进剂的真核细胞是微生物真核细胞。此外,本披露内容的方法可用于增加微生物真核细胞中HDR介导的基因组修饰,制造具有基因组修饰的微生物真核细胞,和/或对微生物真核细胞进行基因工程改造。在一些实施例中,本文披露的方法包括编辑微生物真核细胞。在一些实施例中,本文披露的方法包括在微生物真核细胞中进行基因组修饰。在一些实施例中,本文披露的方法包括修饰微生物真核细胞中的靶基因座。在一些实施例中,本文披露的方法包括增加微生物真核细胞中HDR介导的基因组修饰。在一些实施例中,细胞是微生物真核细胞。在一些实施例中,细胞是单细胞真核生物的细胞。在一些实施例中,细胞是原生动物细胞。在一些实施例中,细胞是原生生物。在一些实施例中,细胞是感染性微生物真核细胞。在一些实施例中,细胞是寄生微生物真核细胞。在一些实施例中,该细胞是贾弟虫属物种细胞,例如兰伯氏贾第虫、鼠贾第虫、苍鹭贾第虫、鹦鹉贾第虫、敏捷贾第虫或微小贾第虫细胞。在一些实施例中,该细胞是疟原虫属物种细胞,例如间日疟原虫、恶性疟原虫、三日疟原虫、卵形疟原虫、或诺氏疟原虫细胞。在一些实施例中,细胞是动质体(kinetoplastid)细胞。在一些实施例中,该细胞是锥体虫属物种细胞,例如克鲁斯氏锥体虫或布氏锥体虫细胞。
在一些实施例中,细胞是藻类细胞。在一些实施例中,藻类细胞属于以下的物种:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、Bolidomonas、包特氏菌属(Borodinella)、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、Bracteococcus、角毛藻属(Chaetoceros)、卡特藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、球钙板藻属(Cricosphaera)、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、杜氏藻属(Dunaliella)、Ellipsoidon、球石藻属(Emiliania)、独球藻属(Eremosphaera)、Ernodesmius、眼虫藻属(Euglena)、真眼点藻属(Eustigmatos)、伏氏藻属(Franceia)、脆杆藻属(Fragilaria)、拟脆杆藻属(Fragilaropsis)、Gloeothamnion、红球藻属(Haematococcus)、Halocafeteria、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微星藻属(Micractinium)、单针藻属(Monoraphidium)、微绿球藻(Nannochloris)、微拟球藻(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、鸵球藻属(Ostreococcus)、巴夫藻属(Pavlova)、拟小球藻属(Parachlorella)、帕氏藻属(Pascheria)、Pelagomonas、褐指藻属(Phaeodactylum)、噬菌体属(Phagus)、Picochlorum、扁藻属(Platymonas)、Pleurochrysis、宽球藻属(Pleurococcus)、原壁菌属(Prototheca)、Pseudochlorella、Pseudoneochloris、Pseudostaurastrum、塔胞藻属(Pyramimonas)、桑葚藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、骨条藻属(Skeletonema)、Spyrogyra、裂丝藻属(Stichococcus)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、Viridiella、魏氏藻属(Vischeria)、或团藻属(Volvox)。在一些实施例中,细胞是硅藻。硅藻包括以下属的成员:曲壳藻属(Achnanthes)、双眉藻属(Amphora)、角毛藻属(Chaetoceros)、圆筛藻属(Coscinodiscus)、细柱藻属(Cylindrotheca)、小环藻属(Cyclotella)、桥弯藻属(Cymbella)、脆杆藻属(Fragilaria)、拟脆杆藻属(Fragilaropsis)、菱板藻属(Hantzschia)、舟形藻属(Navicula)、菱形藻属(Nitzschia)、拟菱形藻属(Pseudo-Nitzschia)、褐指藻属(Phaeodactylum)、斜纹藻属(Psammodictyon)、骨条藻属(Skeletonema)、海线藻属(Thalassionema)、和海链藻属(Thalassiosira)。在一些实施例中,该细胞是真眼点藻门(eustigmatophyte),例如微拟球藻属(Nannochloropsis)物种或以下的物种:蒜头藻属、Pseudostaurastrum、魏氏藻属(Vischeria)、和真眼点藻属(Eustigmatos)。在一些实施例中,该细胞是一种微拟球藻属的藻类细胞,例如但不限于,海洋富油微拟球藻(N.gaditana)、颗粒微拟球藻(N.granulata)、湖泊微拟球藻(N.limnetica)、海洋微拟球藻((N.oceanica)、眼点微拟绿藻(N.oculata)、和盐沼微拟绿藻(N.salina)。
在一些实施例中,细胞是长短鞭毛体。例如,长短鞭毛体不仅包括上面列出的真眼点藻门和硅藻,还包括壶菌物种,包括拉普利门(labrinthulids)和破囊壶菌门(thraustochytrids)。在一些实施例中,该细胞属于长短鞭毛体,包括但不限于硅藻类门(Bacillariophytes)、真眼点藻门、Labrinthulids、和破囊壶菌门。在一些实施例中,该细胞属于以下的物种:网粘菌属(Labryinthula)、类网粘菌属(Labryinthuloides)、破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium)、不动壶菌属(Aplanochytrium)、Aurantiochytrium、日本壶菌属(Japonochytrium)、两孔壳虫属(Diplophrys)、或吾肯氏壶菌属(Ulkenia)。例如,该菌株可以是以下的物种:破囊壶菌属、裂殖壶菌属、椭圆壶菌属(Oblongichytrium)、或Aurantiochytrium。在一些实施例中,细胞是后鞭毛生物(opisthokont)。在一些实施例中,细胞是领鞭毛虫。在一些实施例中,细胞是中粘菌门(Mesomycetozoea)(例如Sphaeroforma)。在一些实施例中,细胞是单鞭毛生物(unikont)。在一些实施例中,细胞是变形虫门(amoebozoa)。在一些实施例中,该细胞属于以下属:棘阿米巴属(Acanthamoeba)、变形虫属(Amoeba)、Chaos、网柄菌属(Dictyostelium)内变形虫属(Entamoeba)、或多核变形虫属(Pelomyxa)。
v.细胞的组合物
本文提供了细胞的组合物。在一方面,本文提供的方法可用于产生真核细胞的组合物。在一些实施例中,真核细胞的组合物可由本文所述的任何细胞构成,例如植物、动物、真菌或其他真核细胞。在一些实施例中,本文披露的方法包括编辑细胞群。在一些实施例中,本文披露的方法包括产生经编辑的细胞群。在一些实施例中,本文披露的方法包括产生经编辑的细胞群,其中该群中经编辑细胞的比例比在没有HDR促进剂的情况下经编辑的细胞群中经编辑细胞的比例高大约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25、30倍中的任一个,包括这些值之间的任何值或范围。在一些实施例中,本文披露的方法包括产生经编辑的细胞群,其中该群中经编辑细胞的比例比在没有HDR促进剂的情况下经编辑的细胞群中经编辑细胞的比例高10倍。
在一些实施例中,本文提供了本文提供的方法中使用的细胞的组合物克隆亚群。在一些实施例中,克隆亚群是细胞系的亚群。在一些实施例中,克隆亚群是源自个体的细胞亚群。在一些实施例中,克隆细胞亚群是源自单个细胞的细胞群。在一些实施例中,克隆细胞亚群具有相同的遗传谱和表观遗传谱。
在一些实施例中,本文披露的方法包括在细胞群中进行基因组修饰。在一些实施例中,本文披露的方法包括产生具有基因组修饰的细胞的组合物。在一些实施例中,本文披露的方法包括产生具有基因组修饰的细胞的组合物,其中该群中具有基因组修饰的细胞的比例比在没有HDR促进剂的情况下经修饰的细胞群中具有基因组修饰的细胞的比例高大约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25、30倍中的任一个,包括这些值之间的任何值或范围。在一些实施例中,本文披露的方法包括修饰细胞群中的靶基因座。在一些实施例中,本文披露的方法包括产生具有经修饰的靶基因座的细胞群。在一些实施例中,本文披露的方法包括产生具有经修饰的靶基因座的细胞群,其中该群中具有经修饰的靶基因座的细胞的比例比在没有HDR促进剂的情况下经修饰的细胞群中具有经修饰的靶基因座的细胞的比例高大约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、25、30倍中的任一个,包括这些值之间的任何值或范围。
E.试剂盒
本发明的方法可以试剂盒的形式提供。在一些实施例中,试剂盒包含编码HDR促进剂的核酸。在一些实施例中,试剂盒包含编码以下核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)以及使用说明书。在一些实施例中,试剂盒提供包含核酸的载体。在一些实施例中,试剂盒用于使用供体模板DNA分子修饰细胞的靶编辑位点。在一些实施例中,试剂盒包含本文所述的任何载体。在一些实施例中,试剂盒包含用于增加真核细胞基因组(例如植物或哺乳动物细胞基因组)的靶编辑位点的HDR介导的基因组修饰的载体。在一些实施例中,试剂盒包含用于增加植物细胞中靶编辑位点的HDR介导的基因组修饰的载体。在一些实施例中,试剂盒包含用于增加哺乳动物细胞中靶编辑位点的HDR介导的基因组修饰的载体。
在一些实施例中,试剂盒包括说明书。在一些实施例中,说明书包括用核酸转化细胞的说明书。在一些实施例中,说明书包括关于检测细胞中核酸的存在的说明书。在一些实施例中,说明书包括关于评估核酸在细胞中的作用的说明书。
在一些实施例中,试剂盒包含用于检测基因工程改造的细胞的试剂。在一些实施例中,试剂盒包含使用试剂检测基因工程改造细胞的说明书。在一些实施例中,用于检测基因工程改造的细胞的试剂是评估细胞基因组的测定,例如PCR测定、RT-qPCR测定、蛋白质印迹或测序测定。在一些实施例中,用于检测基因工程改造的细胞的试剂是一组寡核苷酸引物,其中某些引物对特异性扩增基因修饰或野生型靶基因座。在一些实施例中,使用报告子,例如荧光报告子、转录报告子、比色报告子或化学发光报告子进行基因工程改造的细胞的检测。因此,在一些实施例中,用于检测基因工程改造的细胞的试剂是用于检测报道分子的手段。
在一些实施例中,本文提供了用于增加真核细胞基因组(例如植物或哺乳动物细胞基因组)的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的试剂盒。在一些实施例中,试剂盒包含编码基因组编辑分子和HDR促进剂的核酸。在一些实施例中,基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子。在一些实施例中,HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和、单链DNA结合蛋白(SSB)。在一些实施例中,由此基因组编辑分子和HDR促进剂通过HDR以与对照相比增加的频率提供供体模板多核苷酸对真核细胞基因组的靶编辑位点的修饰。在一些实施例中,试剂盒包含用于测量靶编辑位点的HDR介导的基因组修饰水平的试剂。
在一些实施例中,本文提供用于制备具有基因组修饰的真核细胞的试剂盒。在一些实施例中,试剂盒包含编码基因组编辑分子和同源定向修复(HDR)促进剂的核酸,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。在一些实施例中,试剂盒提供了分离或繁殖包含基因组修饰的真核细胞的手段,从而制备具有基因组修饰的真核细胞。在一些实施例中,试剂盒包含用于检测靶编辑位点的基因组修饰的存在的试剂。
在一些实施例中,本文提供了用于真核细胞基因工程改造方法的试剂盒。在一些实施例中,试剂盒包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。在一些实施例中,试剂盒包含用于检测靶编辑位点的基因工程改造情况的试剂。
实施例
本文提供的真核细胞(例如植物细胞和哺乳动物细胞)、系统和方法的各种实施例包括在以下实施例非限制性列表中。
1.一种用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的方法,该方法包括:
向真核细胞提供基因组编辑分子和HDR促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);
由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。
2.如实施例1所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
3.如实施例2所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
4.如实施例1所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
5.如实施例1所述的方法,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
6.如实施例5所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
7.如实施例5所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
8.如实施例1所述的方法,其中该供体DNA分子在环状DNA载体、双生病毒复制子上提供或作为线性DNA片段提供。
9.如实施例1至8中任一项所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列的拷贝。
10.如实施例1至9中任一项所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻前间隔子相邻基序(PAM)序列的序列。
11.如实施例1至10中任一项所述的方法,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
12.如实施例1至11中任一项所述的方法,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
13.如实施例1至12中任一项所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
14.如实施例13所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白、具有等效SSAP活性的相关蛋白或与SEQ IDNO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
15.如实施例13所述的方法,其中该ERF家族蛋白包含噬菌体P22 ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
16.如实施例13所述的方法,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
17.如实施例1至16中任一项所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
18.如实施例17所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
19.如实施例1至16中任一项所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
20.如实施例1至16中任一项所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
21.如实施例1至16中任一项所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、核酸外切酶III、Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ IDNO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
22.如实施例1、5或6中任一项所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
23.如实施例1至22中任一项所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
24.如实施例1至23中任一项所述的方法,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
25.如实施例24所述的方法,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
26.如实施例1至23中任一项所述的方法,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
27.如实施例1至26中任一项所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,HDR的频率增加至少2倍。
28.如实施例1至26中任一项所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
29.如实施例1至28中任一项所述的方法,其中该SSAP、该核酸外切酶和/或该SSB蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
30.如实施例1至29中任一项所述的方法,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
31.如实施例1至30中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
32.如实施例31所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
33.如实施例32所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
34.如实施例31-33中任一项所述的方法,其中该细胞是植物细胞并且该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
35.如实施例31至34中任一项所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
36.一种用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的系统,该系统包含:
(a)真核细胞;
(b)HDR促进剂,其包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);以及
(c)一种或多种基因组编辑分子,其包含至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;
其中该真核细胞与以下相关联、与以下接触和/或含有以下:有效量的这些HDR促进剂和该一种或多种基因组编辑分子。
37.如实施例36所述的系统,其中这些基因组编辑分子和/或序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
38.如实施例37所述的系统,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
39.如实施例36所述的系统,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
40.如实施例36所述的系统,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
41.如实施例40所述的系统,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
42.如实施例40所述的系统,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
43.如实施例36所述的系统,其中该供体DNA分子提供于质粒或双生病毒基因组上。
44.如实施例36至43中任一项所述的系统,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
45.如实施例36至44中任一项所述的系统,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻该PAM序列的序列。
46.如实施例36至45中任一项所述的系统,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
47.如实施例36至46中任一项所述的系统,由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加至少2倍的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。
48.如实施例36至47中任一项所述的系统,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
49.如实施例36或48所述的系统,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
50.如实施例49所述的系统,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
51.如实施例49所述的系统,其中该RecT/Redβ家族蛋白包含噬菌体λβ蛋白、噬菌体SPP1 35蛋白、Rac细菌原噬菌体RecT蛋白或具有等效SSAP活性的相关蛋白。
52.如实施例49所述的系统,其中该RecT/Redβ家族蛋白包含与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
53.如实施例49所述的系统,其中该ERF家族蛋白包含噬菌体P22 ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
54.如实施例49所述的系统,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
55.如实施例36至54中任一项所述的系统,其中线性dsDNA分子是该核酸外切酶的优选底物。
56.如实施例36至54中任一项所述的系统,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
57.如实施例36至54中任一项所述的系统,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
58.如实施例36至54中任一项所述的系统,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
59.如实施例36至58中任一项所述的系统,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
60.如实施例36、40或41中任一项所述的系统,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ IDNO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
61.如实施例36至60中任一项所述的系统,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
62.如实施例36至61中任一项所述的系统,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
63.如实施例62所述的系统,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
64.如实施例36至63中任一项所述的系统,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
65.如实施例36至64中任一项所述的系统,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照系统相比,HDR的频率增加至少2倍。
66.如实施例36至64中任一项所述的系统,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照系统相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
67.如实施例36至66中任一项所述的系统,其中该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
68.如实施例36至64中任一项所述的系统,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
69.如实施例36至68中任一项所述的系统,其中该真核细胞是哺乳动物细胞或植物细胞。
70.如实施例69所述的系统,其中该植物细胞是单倍体、二倍体或多倍体。
71.如实施例69或70所述的系统,其中该植物细胞在培养基中、植物中或植物组织中。
72.如实施例69、70或71所述的系统,其中该细胞是植物细胞并且该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含选自由SEQID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
73.如实施例69至72中任一项所述的系统,其中该系统提供分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物,并且其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
74.一种制备具有基因组修饰的真核细胞的方法,该方法包括:
(a)向真核细胞提供基因组编辑分子和同源定向修复(HDR)促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰;以及
(b)分离或繁殖包含该基因组修饰的真核细胞,从而制备该具有基因组修饰的真核细胞。
75.如实施例74所述的方法,其中这些基因组编辑分子和/或序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
76.如实施例75所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
77.如实施例74所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
78.如实施例74所述的方法,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
79.如实施例78所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
80.如实施例78所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
81.如实施例74所述的方法,其中该供体DNA分子提供于质粒或双生病毒基因组中。
82.如实施例74至81中任一项所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
83.如实施例74至82中任一项所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻该PAM序列的序列。
84.如实施例74至83中任一项所述的方法,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
85.如实施例74至84中任一项所述的方法,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
86.如实施例74至85中任一项所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
87.如实施例86所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
88.如实施例86所述的方法,其中该RecT/Redβ家族蛋白包含与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
89.如实施例86所述的方法,其中该ERF家族蛋白包含噬菌体P22ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
90.如实施例86所述的方法,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
91.如实施例74至90中任一项所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
92.如实施例74至91中任一项所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
93.如实施例74至92中任一项所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
94.如实施例74至92中任一项所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
95.如实施例74至90中任一项所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
96.如实施例74、78或79所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
97.如实施例74至96中任一项所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
98.如实施例74至97中任一项所述的方法,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
99.如实施例98所述的方法,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
100.如实施例74至99中任一项所述的方法,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
101.如实施例74至100中任一项所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,HDR的频率增加至少2倍。
102.如实施例74至100中任一项所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
103.如实施例74至102中任一项所述的方法,其中该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
104.如实施例74至103中任一项所述的系统,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
105.如实施例74至104中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
106.如实施例105所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
107.如实施例105或106所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
108.如实施例105、106或107所述的方法,其中该SSAP、该核酸外切酶和/或该SSB进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
109.如实施例105至108中任一项所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
110.如实施例1至30中任一项所述的方法、如实施例36至68中任一项的系统或如实施例74至104中任一项所述的方法,其中这些HDR促进剂、基因组编辑分子和真核细胞或包含该基因组修饰的真核细胞以包含多个容器、隔室或位置的阵列提供,并且其中每个容器、隔室或位置包括这些HDR促进剂,基因组编辑分子和真核细胞或包含该基因组修饰的真核细胞。
111.一种真核细胞的基因工程改造方法,该方法包括向该真核细胞提供:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),
其中该细胞的该靶编辑位点被该供体模板DNA分子修饰。
112.如实施例111所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
113.如实施例112所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶、Cas12i、Cas14或工程改造的核酸酶。
114.如实施例111所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
115.如实施例111所述的方法,该方法进一步包括指导RNA,其中这些序列特异性核酸内切酶和指导RNA在该靶编辑位点的两个不同DNA序列处切割单DNA链。
116.如实施例115所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、锌指切口酶、TALE切口酶或其组合,其中该序列特异性核酸内切酶对该靶编辑位点中的核酸内切酶识别序列具有特异性。
117.如实施例115所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
118.如实施例111所述的方法,其中该供体DNA分子提供于质粒或双生病毒基因组中。
119.如实施例111所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
120.如实施例111所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
121.如实施例120所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
122.如实施例111所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
123.如实施例111所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
124.如实施例111所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
125.如实施例111所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
126.如实施例111所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
127.如实施例111所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
128.如实施例111所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
129.如实施例111至128中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
130.如实施例129所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
131.如实施例130所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
132.如实施例131所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
133.如实施例111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种在一个或多个载体中提供。
135.如实施例133所述的方法,其中该载体是农杆菌载体。
136.如实施例111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种在染色体中提供。
137.如实施例111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种通过引入多肽、DNA、mRNA和/或有性杂交来提供。
138.如实施例111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种由包含i)-v)中的一种或多种的祖细胞提供。
其中该祖细胞不包含i)-v)中的至少一种,
其中该祖细胞不包含的i)-v)中的该至少一种随后通过递送多肽、DNA、或mRNA至该祖细胞和/或该祖细胞的有性杂交来提供。
139.如实施例111-138中任一项所述的方法,该方法进一步包括检测该修饰。
140.如实施例139所述的方法,其中检测该修饰包括扩增子测序。
141.如实施例111-140中任一项所述的方法,其中该靶编辑位点在蛋白编码序列或启动子中。
142.如实施例111-141中任一项所述的方法,其中该靶编辑位点的该修饰是插入、缺失或取代。
143.如实施例111-142中任一项所述的方法,其中该靶编辑位点是编码重要农艺性状的基因或涉及哺乳动物疾病的基因。
144.一种用于产生具有经基因修饰的靶编辑位点的真核细胞的方法,该方法包括:
(a)提供至少一种序列特异性核酸内切酶或编码所述至少一种序列特异性核酸内切酶的至少一种多核苷酸,该至少一种序列特异性核酸内切酶切割所述靶编辑位点中的至少一种核酸内切酶识别序列的DNA序列,以及
(b)提供至少一种包含至少一种双链DNA序列的供体分子,其中(i)所述DNA序列在至少50个核苷酸的长度上与该靶编辑位点侧翼的序列具有至少90%的同源性和(ii)其中与所述靶编辑位点相比,所述供体序列包含至少一个修饰;以及
(c)提供至少一种同源定向修复(HDR)促进剂,其包含
(i)至少一种单链DNA退火蛋白(SSAP),和
(ii)至少一种核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,和
(iii)至少一种单链DNA结合蛋白(SSB);
并且由此该至少一种序列特异性核酸内切酶、该至少一种供体分子和该至少一种HDR促进剂将所述修饰引入所述真核细胞的所述靶编辑位点;以及
(d)分离在所述靶编辑位点中包含修饰的真核细胞。
145.如实施例144所述的方法,其中该修饰选自由以下组成的组:一个或多个核苷酸的插入、一个或多个核苷酸的缺失或一个或多个核苷酸的取代。
146.如实施例144所述的方法,其中该靶编辑位点的一部分通过在所述靶编辑位点中使用两个序列特异性切割来缺失,并由该供体分子提供的序列替换。
147.如实施例144-146中任一项所述的方法,其中所述供体序列在载体中侧翼为核酸内切酶识别序列。
148.如实施例144-147中任一项所述的方法,该方法进一步包括繁殖包含该修饰的该真核细胞。
149.一种产生经基因修饰的生物体的方法,该方法包括以下步骤
(i)通过如实施例144-148中任一项所述产生经基因修饰的真核细胞,以及
(ii)将所述细胞再生为生物体。
150.如实施例149的生物体,其中该生物体选自由以下组成的组:植物和非人动物。
151.一种组合物,该组合物含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
152.如实施例151所述的组合物,其中这些核酸位于一个或多个载体中。
153.一种载体,该载体包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
154.如实施例153所述的载体,其中该载体包含该供体模板DNA、该序列特异性核酸内切酶和该编码指导RNA的多核苷酸。
155.如实施例153所述的载体,其中该载体包含该单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和该单链DNA结合蛋白(SSB)。
156.如实施例153所述的载体,其中该载体包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
157.一种试剂盒,该试剂盒包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)以及用于对真核细胞进行基因工程改造的使用说明书。
158.如实施例157所述的试剂盒,其中该试剂盒包含第一载体和第二载体,其中
i)该第一载体包含含有该供体模板DNA和该序列特异性核酸内切酶的核酸,其中该序列特异性核酸内切酶包含编码RNA指导的核酸酶的多核苷酸和编码指导RNA的多核苷酸;以及
ii)该第二载体包含该单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和该单链DNA结合蛋白(SSB)。
159.如实施例157-158中任一项所述的试剂盒,该试剂盒进一步包含用于检测经基因工程改造的细胞的试剂。
160.一种细胞,该细胞包含i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
161.一种细胞,该细胞包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
162.如实施例160或161所述的细胞,其中该细胞是植物或哺乳动物细胞。
163.如实施例160-162中任一项所述的细胞,其中该细胞是宿主细胞。
164.一种经基因工程改造的细胞,其通过如实施例1-35或74-149中任一项所述的方法产生。
165.一种用于在靶编辑位点进行基因工程改造的祖真核细胞或祖生物体,该祖真核细胞或祖生物体包含以下的子集:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),其中该细胞不包含i)-v)中的至少一种,其中向该细胞或生物体提供不包含在该祖细胞或祖生物体中的i)-v)中的该至少一种导致该供体模板分子对该靶编辑位点的修饰。
166.如实施例165所述的祖真核细胞或祖生物体,其中该供体模板是双链DNA分子。
167.如实施例165所述的祖细胞,其中该细胞是种系细胞。
168.如实施例165所述的祖真核细胞或祖生物体,其中该祖真核细胞是祖植物细胞,并且该祖植物细胞或植物不包含的i)-v)中的至少一种通过转化来提供。
169.如实施例165所述的祖生物体,其中该生物体是植物,并且其中祖植物不包含的i)-v)中的至少一种通过与包含该祖植物不包含的i)-v)中的至少一种的第二植物的有性杂交来提供。
170.如实施例165所述的祖真核细胞,其中该祖真核细胞是动物细胞,并且其中祖细胞不包含的i)-v)中的至少一种通过转染来提供。
171.如实施例165所述的祖生物体,其中该祖生物体是非人动物,并且该非人动物不包含的i)-v)中的至少一种通过与包含该非人动物不包含的i)-v)中的至少一种的非人动物的有性杂交来提供。
172.如实施例153所述的载体,其中该序列特异性核酸酶与诱导型启动子可操作地连接。
173.如实施例111所述的方法,其中该序列特异性核酸内切酶是切口酶。
实例
以下实例旨在纯粹作为本发明的示例,因此不应认为以任何方式限制本发明。以下实例和详细描述是作为说明而并不是作为限制而提供的。
实例1.核酸外切酶、SSAP和SSB表达载体和供体DNA模板序列
本实例描述了用于表达噬菌体λ核酸外切酶(SEQ ID NO:8)、噬菌体λβ SSAP蛋白(SEQ ID NO:1)和大肠杆菌SSB(SEQ ID NO:31)的植物表达载体的构建。
构建用于表达噬菌体λ核酸外切酶(SEQ ID NO:8)、噬菌体λβ SSAP蛋白(SEQ IDNO:1)和大肠杆菌SSB(SEQ ID NO:31)的植物表达构建体。将编码SEQ ID NO:15的烟草c2核定位信号(NLS)的DNA序列与编码核酸外切酶、噬菌体λβ SSAP蛋白和大肠杆菌SSB的DNA序列可操作地连接以提供编码分别在SEQ ID NO:135、SEQ ID NO:134和SEQ ID NO:133中列出的c2 NLS-Exo(也称为Red-Exo)、c2 NLSλβ SSAP(也称为Red-β)和c2 NLS-SSB融合蛋白的DNA序列。编码c2 NLS-Exo、c2 NLSλβ SSAP和c2NLSf-SSB融合蛋白的DNA序列分别与2x35S、SlUBI10、PcUBI4启动子和35S、AtHSP、pea3A聚腺苷酸化位点可操作地连接,以提供核酸外切酶、SSAP、和SSB植物细胞基因表达盒(参见图2)。
构建了靶向番茄Ant1基因的启动子区域以通过HDR插入42个碱基对异源序列的DNA供体模板质粒(图1)。环状DNA供体质粒包括替换模板,该模板具有所期望的插入区(42个碱基对长),其侧翼是约600-800bp长的同源臂。同源臂与靶gDNA插入位点侧翼的gDNA(基因组DNA)区域匹配(即同源)。包含供体DNA的替换模板区域在每一末端的侧翼是与由RNA指导的核酸酶识别的靶gDNA序列相同的DNA序列。还构建了用于表达RNA指导的序列特异性核酸内切酶和与插入位点相邻的序列互补的指导RNA的植物表达盒(图1)。
实例2.番茄原生质体的基因组编辑实验
本实例描述了在存在和不存在核酸外切酶、SSB和SSAP的情况下,使用平末端和交错末端切割型CAS核酸酶在番茄原生质体中进行基因编辑。
基本上根据已发表的程序(
Figure BDA0003417860190001141
等人2017)番茄原生质体的分离、培养和PEG介导的转染。转染的材料包括具有实例1中描述的供体DNA模板区域的质粒,以及如所示表达gRNA和Cas多核苷酸(图1)。Cas多核苷酸与核定位信号融合。gRNA使双链断裂靶向进入预期的基因组DNA靶,并且从供体质粒释放替换模板(参见图1)。一些实验用以下Cas核酸酶进行,该Cas核酸酶代表在切割核酸内切酶识别序列后留下平末端的CAS核酸酶,并且在本文中称为CasB核酸酶。其他实验用以下Cas核酸酶进行,该Cas核酸酶代表在切割核酸内切酶识别序列后留下交错单链DNA突出末端的CAS核酸酶,在本文中称为CasS核酸酶。
转染后原生质体孵育48小时后,从转染样品中提取gDNA,并使用与引入的替换序列侧翼的基因组序列和替换模板的同源臂互补的引物扩增靶基因座,并通过扩增子测序进行分析。
使用双端Illumina测序对扩增子进行测序。由于扩增子的大小,双端读段中只有一个读段端(读段1)覆盖了包含靶向的序列插入的目的位点。对目的读段(读段1)进行质量修整并与参考扩增子比对。这些读段有独特的分子标识符(UMI)标签,以将它们与某些类型的PCR重复区分开来,并且这些读段从比对中去重复。然后检查映射到未编辑基因组序列的读段(读段2)是否正确映射到基因组。使用CrispRVariants分析从读段1生成的比对,CrispRVariants描述并记录了在以切割位点为中心的100bp窗口内不同的所有序列等位基因(Lindsay,H.等人Nature Biotechnology[自然生物技术]201634:701-702)。CrispRVariants以总比对的读段数量表示报告了每个等位基因的读段频率。不同的序列等位基因被分类为1)野生型序列、SNP或测序伪像,2)插入缺失突变,或3)精确插入事件。CrispRVariants根据突变类型及其与定义的切割位点的距离自动检测SNP,使用另外的过滤步骤去除不涉及预测的切割位点任一侧5bp内碱基的任何其他序列异常。这些等位基因被归入类别1。所有测序等位基因(其具有涉及切割位点任一侧5bp内的任何碱基的插入或缺失突变)均被确定为插入缺失并归入类别2。成功的精确基因靶向产生了单个CrispRVariants序列等位基因,该等位基因可通过插入预期大小和序列进行鉴定。在下面的表1-2中,报告的%indel频率是确定为indel的所有测序等位基因的所有频率的总和。针对%精确度报告的频率是单个精确插入测序等位基因的频率。两个频率的分母是与参考扩增子比对的所有读段的总和。
平均测量的结果总结在下面的表1中。CasS(1)和CasS(2)是类似的处理,不同的是与(1)相比,(2)中使用了增加2倍的指导RNA。“λRED”是指所有三种HDR促进剂(核酸外切酶、λβ SSAP蛋白和SSB)。SD=标准偏差。
表1
Figure BDA0003417860190001151
Figure BDA0003417860190001161
对于CasB平末端核酸酶实验和CasS交错末端切割型核酸酶而言,所有三种HDR促进剂(即SSB、核酸外切酶和SSAP)的转染大大增强(约10倍)HDR发生。基线是在没有所有三种HDR促进剂的情况下测量的,此时供体模板(HDR)仅并入0.1-0.22%的基因组编辑的编辑中。如表1所示,不含HDR促进剂的样品用作基线对照。
消除三种HDR促进剂中的任何一种或两种都显著减少了HDR发生,尽管在所有情况下它仍然可以被测量到高于基线(表2)。
表2
Figure BDA0003417860190001162
Figure BDA0003417860190001171
CasS核酸酶介导的编辑(在靶编辑位点具有交错末端)比CasB核酸酶介导的编辑(在靶编辑位点具有平末端)产生更高比例的精确编辑事件(HDR)。因此,与NHEJ事件相比,大约80%的CasS核酸酶介导的编辑事件和30%的CasB核酸酶介导的编辑事件是精确的HDR事件。HDR促进剂的存在显著降低了NHEJ事件的发生率。
实例3.玉蜀黍原生质体的基因组编辑实验
本实例描述了在存在和不存在核酸外切酶、SSB和SSAP的情况下在玉蜀黍原生质体中进行基因编辑,其中使用平末端切割型CAS核酸酶诱导两条紧邻的双链断裂,以诱导序列替换而不是插入。
构建DNA供体模板质粒,其靶向玉蜀黍PYL-E基因的编码区,用于HDR介导的110个碱基对序列替换,以引入7个碱基编辑(导致同义突变和由两个gRNA靶向的两个PAM位点的破坏)和1个碱基编辑(导致氨基酸变化)。环状DNA供体质粒包括具有所期望修饰(110个碱基对长的区域和8个碱基修饰)的替换模板,其两侧翼是约500bp长的同源臂。同源臂与位于两个gRNA靶位点侧翼的gDNA(基因组DNA)区域匹配(即同源)。包含替换模板区域的供体DNA在每一末端的侧翼是与由RNA指导的核酸酶识别的两个靶gDNA序列之一相同的DNA序列。
玉蜀黍原生质体被分离、培养并进行PEG介导的转染。转染材料包括表达c2 NLS-Exo、c2 NLSλβ SSAP和c2 NLS-SSB融合蛋白(其在SEQ ID NO:135、SEQ ID NO:134和SEQ IDNO:133中列出,并且分别与2x35S、ZmUBI1、OsACT1启动子和35S、AtHSP、pea3A聚腺苷酸化位点可操作地连接)的质粒。质粒还具有上述供体DNA模板区域,并如所示表达两个gRNA和Cas多核苷酸。Cas多核苷酸与核定位信号融合。这两个gRNA中的每一个使双链断裂靶向进入预期基因组DNA靶和位于替换模板一端侧翼的序列,以便从供体质粒中释放替换模板。使用在切割核酸内切酶识别序列后留下平末端且在本文中称为CasB核酸酶的Cas核酸酶进行实验。
转染后原生质体孵育48小时后,从转染样品中提取gDNA,并使用与引入的碱基修饰侧翼的基因组序列和替换模板的同源臂互补的引物扩增靶基因座,并通过扩增子测序进行分析。与仅用gRNA和编码Cas核酸酶的多核苷酸转染的对照相比,在用表达c2 NLS-Exo、c2 NLSλβ SSAP和c2 NLS-SSB融合蛋白、gRNA和编码Cas核酸酶的多核苷酸的质粒转染的原生质体中,观察到HDR水平增加。
实例4.生物序列
本实例提供了本文提及的蛋白质和核酸序列的非限制性实施例。表3中列出了生物序列和它们的SEQ ID NO。
表3:生物序列
Figure BDA0003417860190001181
Figure BDA0003417860190001191
Figure BDA0003417860190001201
Figure BDA0003417860190001211
Figure BDA0003417860190001221
Figure BDA0003417860190001231
Figure BDA0003417860190001241
Figure BDA0003417860190001251
Figure BDA0003417860190001261
Figure BDA0003417860190001271
Figure BDA0003417860190001281
Figure BDA0003417860190001291
Figure BDA0003417860190001301
Figure BDA0003417860190001311
Figure BDA0003417860190001321
Figure BDA0003417860190001331
Figure BDA0003417860190001341
实例5.番茄原生质体中的基因组编辑
以下实例描述了在存在和不存在HDR促进剂(即核酸外切酶、SSB蛋白和SSAP)的情况下评估番茄原生质体中使用Cas核酸酶的基因编辑的实验。具体而言,进行了测试改变模板供体DNA、HDR促进剂和核酸酶试剂的形式和递送方法对基因组编辑的影响的实验。
材料和方法
如实例2中所述分离、培养和转染番茄原生质体。如实例2所述,使用扩增子测序评估基因组编辑。
用于转染的质粒的设计
质粒被构建为包含作为单个载体的一部分的所有组分(质粒,参见图3),或者包含在用于共转染的两个不同质粒上分开的组分(参见图4-5)。特别地,第一载体编码CasS核酸酶及其相应的指导RNA,第二载体编码所有三种HDR促进剂(即SSB蛋白、核酸外切酶和SSAP)。此外,侧翼是核酸内切酶识别序列的供体模板存在于第一或第二载体中。
构建了靶向番茄Ant1基因启动子区域的DNA供体模板,用于通过HDR插入42个碱基对的异源序列并缺失3个碱基对。
线性化的供体DNA
供体模板DNA可以作为线性双链DNA分子添加,也可以作为侧翼为特定核酸酶识别序列的环状载体的一部分添加。
DNA模板上存在gRNA识别位点
通过将位于供体DNA模板侧翼的gRNA识别切割位点从转染载体中去除,测试了它们的存在的影响。
结果
在存在和不存在HDR促进剂(即核酸外切酶、SSB蛋白和SSAP)的情况下,用一个或两个编码Cas核酸酶、指导RNA和供体DNA的质粒载体转化番茄原生质体(参见图3-5)。下面的表4A-4C提供了番茄原生质体基因编辑实验的数据汇总。
如下面表4A所示,两个载体的共转化一致显示出由于HDR导致的精确基因组编辑显著增加,以及由于非同源末端连接(NHEJ)导致的插入和缺失(indel)编辑减少。在HDR促进剂(即SSB、核酸外切酶和SSAP)存在的情况下,精确indel编辑的比例很高(例如约70%-80%)。当供体模板DNA和Cas核酸酶在分开的载体上共转化时(图4-5),在不存在HDR促进剂的情况下包含供体模板显著减少了NHEJ编辑,而没有显著促进精确编辑。当供体模板DNA和Cas核酸酶在单个载体上时(图3),HDR促进剂的存在将NHEJ编辑减少到更低程度。当去除供体模板DNA侧翼的gRNA识别切割位点时,HDR促进剂的存在不减少NHEJ编辑的水平。与实例2中描述的效率相比,不同载体上组分的共转化并未显著改善HDR效率。
表4A:用一个载体相比于两个载体情况下的番茄原生质体基因编辑(实验LR-16)
Figure BDA0003417860190001361
线性模板DNA在促进精确(HDR)编辑和减少indel(NHEJ)编辑方面与侧翼为特定核酸酶识别序列的环状载体(如实例2中所用)一样有效(表4B)。
表4B:使用线性相比于环状供体DNA模板情况下的番茄原生质体基因编辑(实验LR-18)
Figure BDA0003417860190001371
通过从转染载体中去除DNA模板侧翼切割位点来测试的它们的效果。精确编辑的数量和百分比高于没有HDR促进剂的阴性对照,但低于具有DNA模板侧翼切割位点(如实例2中)的阳性对照(表4C)。类似地,indel频率低于阴性对照,并且略高于阳性对照。
表4C:使用带有或不带有侧翼切割位点(FCS)的供体模板情况下的番茄原生质体基因编辑(实验LR-21)
Figure BDA0003417860190001381
实例6.玉蜀黍中SPX的基因组替换
以下实例描述了使用HDR促进剂(即核酸外切酶、λβ SSAP和大肠杆菌SSB蛋白)编辑玉蜀黍原生质体中SPX基因座处的miRNA结合位点。
材料和方法
质粒构建体的设计
两个gRNA用于靶向玉蜀黍中SPX基因座处的miRNA结合位点周围的区域,用于CasS介导的切割,从而介导该位点的替换。供体DNA片段用作模板,用于由HDR促进剂介导的HDR修复/编辑。
质粒构建体旨在用miRNA结合位点内每三个碱基对包含SNP的片段替换玉蜀黍中SPX基因座处的miRNA结合位点及其侧翼区域。此外,引入了SNP来突变两个PAM位点,从而防止发生编辑后的基因座切割。引入miRNA结合位点的SNP之一充当miRNA结合位点和PAM序列之一的SNP。
使用系统,该系统包含CasS核酸酶、两个特异于靶的gRNA、HDR促进剂(核酸外切酶、λβ SSAP和大肠杆菌SSB蛋白)、以及带有替换片段和与靶编辑位点同源的约700个碱基对同源臂的供体模板。如实例6中所述设计表达Cas9和HDR促进剂的载体。同源臂被设计为约700个碱基对,因为之前的实验表明约500-750个碱基对的臂是有功能的(参见实例6)。此外,还考虑并最大化了同源臂的GC含量,不希望受理论束缚,这可能有助于退火和促进精确编辑。两个gRNA靶序列中的每一个也存在于供体的末端,以便供体被切割并从质粒中释放出来,用于随后由HDR促进剂介导的编辑。单个质粒表达编辑所需的所有组分(参见图6)。每个表达的组分由其自身的启动子驱动。
玉蜀黍培养和转染,以及扩增子测序
每个单独的质粒以四个分开的重复转染到玉蜀黍原生质体中。细胞孵育48小时。然后提取基因组DNA,并制备扩增子测序文库。插入和缺失(indel)频率和替换效率从扩增子测序数据中量化,如上文实例2中所述。
结果
在存在或不存在HDR促进剂的情况下,使用由两个gRNA靶向的CasS核酸酶编辑玉蜀黍中SPX基因座处的miRNA结合位点。除了这个实验样品之外,实验中还包括基线对照以及其他几个对照。如表5所示,编码CasS连同两个gRNA和供体、CasS连同两个gRNA、CasS连同单个gRNA、和仅供体(用作对照)的载体。
表5:玉蜀黍原生质体SPX基因座编辑实验中的样品汇总
转染组分
CasS+λRed+2gRNAs+供体DNA
CasS+2个gRNA+供体DNA
CasS+2个gRNA
CasS+1个gRNA
CasS+1个gRNA
供体DNA
CasS+2个gRNA+λRed
CasS+第1gRNA+λRed+供体
CasS+第2gRNA+λRed+供体
CasS+第1gRNA
CasS+第2gRNA
仅有λRed的对照
GFP对照
无转染对照
精确的编辑和indel是通过测序测量的,并在不同样品之间进行比较。
实例7.本氏烟(Nicotiana benthamiana)中增强的HDR
以下实例描述了本氏烟叶中的基因组编辑。特别是,植物原位编辑的效率是通过以下来测量:在存在或不存在HDR促进剂(即核酸外切酶、λβ SSAP和大肠杆菌SSB蛋白)的情况下,修复带有GFP突变等位基因的本氏烟报告系中GFP的编码序列。
材料和方法
本氏烟培养和转染
具有GFP功能丧失性等位基因的本氏烟的种子在卡那霉素选择培养基(50mg/mL)上萌发两周,然后转移到土壤中并在康威龙(Conviron)生长室(12h/12h/75μmol/m2s-1,白天:夜晚:光)中生长两周。用注射器将表达T-DNA载体(其中包含CasS和HDR促进剂表达盒,以及具有GFP修复模板的供体模板(参见图7))的根癌农杆菌(菌株GV3101)浸润本氏烟叶。然后采集叶样品进行基因分型,以通过PCR确认报告转基因的存在。在评估和收获之前,植物在生长盖上孵育3天。将处理过的叶转移到组织培养,并从组织培养再生整个植物。所有样品一式三份进行测试。
GFP编码序列修复的评估
GFP编码序列的修复使用多种方法之一进行评估。含有靶向插入的叶细胞的比例和数量通过在浸润后3天使用荧光显微镜可视化GFP信号进行量化。
使用右基因组/供体边界的扩增子测序(如实例2所述)来量化浸润的叶内靶插入的频率,以评估精确编辑的整体效率。
通过使用荧光显微镜可视化GFP信号,对再生的整个植物进行定性比较,以确认靶向插入的稳定表达。
再生的整个植物内靶向插入的频率通过右侧基因组/供体边界的桑格测序进行量化,以评估精确编辑的整体效率。
结果
本氏烟叶被转化以表达CasS系统,用于在使用和不使用HDR促进剂情况下对突变GFP基因进行基因修饰。下表6提供了转化进入本氏烟叶的组分的汇总。“λRED”是指所有三种HDR促进剂(核酸外切酶、λβ SSAP蛋白和SSB)。
表6:本氏烟GFP报告基因编辑实验中的样品汇总
转染组分
CasS+λRed+gRNA+供体DNA
CasS+gRNA+供体DNA
CasS+gRNA
GFP(阳性浸润对照)
GUS(阴性浸润对照)
无处理
测量突变GFP的修复并在样品之间进行比较。
实例8.分裂的番茄和玉蜀黍组织中增强的HDR
以下实例描述了在分裂的植物组织中测试由HDR促进剂介导的基因编辑的实验。特别是,番茄子叶外植体在存在和不存在HDR促进剂的情况下使用Cas核酸酶进行编辑。此外,在存在和不存在HDR促进剂的情况下,使用Cas核酸酶编辑玉蜀黍胚外植体。
玉蜀黍外植体转化
材料和方法
用于玉蜀黍转化的质粒的设计
本实例描述了用于农杆菌介导的玉蜀黍转化的植物表达载体的构建。制备了两种植物基因表达载体。构建用于表达噬菌体λ核酸外切酶(SEQ ID NO:8)、噬菌体λβ SSAP蛋白(SEQ ID NO:1)和大肠杆菌SSB(SEQ ID NO:31)的植物表达盒。将编码SEQ ID NO:15的烟草c2核定位信号(NLS)的DNA序列与编码核酸外切酶、噬菌体λβ SSAP蛋白和大肠杆菌SSB的DNA序列融合以提供编码分别在SEQ ID NO:135、SEQ ID NO:134和SEQ ID NO:133中列出的c2 NLS-Exo、c2 NLSλβ SSAP和c2NLS-SSB融合蛋白的DNA序列。编码c2 NLS-Exo、c2 NLSλβSSAP和c2NLS-SSB融合蛋白的DNA序列分别与OsUBI1、SlUBI1、OsACT启动子和pea3A、豌豆rbcs E9、NtEXT聚腺苷酸化位点可操作地连接,以提供核酸外切酶、SSAP、和SSB植物表达盒。
构建了靶向玉蜀黍gln1-3基因的启动子区域以通过HDR插入36个碱基对异源序列的DNA供体序列。DNA供体序列包括替换模板,该模板具有所期望的插入区(36个碱基对长),其侧翼是约500-635bp长的同源臂。同源臂与靶gDNA插入位点侧翼的gDNA(基因组DNA)区域匹配(即同源)。包含供体DNA的替换模板区域在每一末端的侧翼是与由RNA指导的核酸酶识别的gln1-3基因序列相同的DNA序列。
构建了提供RNA指导的序列特异性(CasB切割类型)核酸内切酶的表达的植物表达盒。构建了提供与插入位点相邻序列互补的指导RNA的表达的植物表达盒。构建了农杆菌超级二元质粒转化载体,该载体包含提供草丁膦N-乙酰转移酶合酶(PAT)蛋白表达的盒。一旦构建了盒、供体序列和农杆菌超级二元质粒转化载体,将它们组合以产生两个玉蜀黍转化质粒。
玉蜀黍转化质粒pIN1757用以下来构建:使PAT盒、RNA指导的序列特异性核酸内切酶盒、指导RNA盒和gln1-3DNA供体序列进入农杆菌超级二元质粒转化载体中(图8)。
玉蜀黍转化质粒pIN1756用以下来构建:使PAT盒、RNA指导的序列特异性核酸内切酶盒、指导RNA盒、SSB盒、λβSSAP盒、Exo盒和gln1-3DNA供体序列进入农杆菌超级二元质粒转化载体中(图8)。
玉蜀黍转化
所有构建体均从农杆菌菌株LBA4404中的超级二元载体递送。
玉蜀黍转化是根据已公开的方法进行的(Ishida等人,Nature Protocols[自然方案]2007;2,1614-1621)。简而言之,在授粉后10-14天从表面消毒的雌穗分离自近交系GIBE0104的未成熟胚,大小约为1.8-2.2mm。将胚置于用感染培养基制成的农杆菌悬浮液(浓度为OD600=1.0)中。使用时将乙酰丁香酮(200μM)添加到感染培养基中。将胚和农杆菌置于摇杆振荡器上,以低速搅拌15分钟。然后将胚倒在共培养基板的表面上。通过倾斜板并用移液管吸出所有液体来去除过量的液体培养基。根据需要翻转胚以保持小盾片向上的取向。将共培养板置于带盖的盒子中,22℃在黑暗中培养3天。然后将胚转移到静止培养基中,保持小盾片向上的取向。胚在27℃-28℃保持在静止培养基上7天。将产生愈伤组织的胚转移到含有7.5mg/L草丁膦(PPT)的选择1培养基并再培养7天。将愈伤组织化的胚置于含有10mg/L PPT的选择2培养基上,并在27℃-28℃培养14天。将对选择剂具有抗性的生长愈伤组织转移至具有10mg/L PPT的再生前培养基以启动芽发育。愈伤组织在再生前培养基上保留7天。将开始出芽的愈伤组织转移到Phytatrays中含有7.5mg/L PPT的再生培养基中,并在27℃-28℃在光照下培养。在移植到土壤中并逐渐适应温室条件之前,将到达Phytatray顶部的芽连同完整根分离到芽伸长培养基中。
结果
每个实验条件下的外植体数量提供在表7A中,如下。对再生的芽进行取样,并从16个胚(“事件”)(对于pIN1757)的45个再生植物中以及从53个胚(对于pIN1756)的201个再生植物中提取gDNA。使用设计以产生约835个碱基对的扩增子的引物,从gDNA中扩增ZmGln1.3基因座;正向引物是核酸内切酶切割位点5′约130bp,反向引物在3′同源臂之外,因此仅扩增内源基因座。珠清理后,扩增子通过下一代测序进行分析。
表7A、#Indel和#HDR列中报告的数字代表具有针对靶序列的至少5,000个映射读段和针对扩增子至少50%完全对齐的样品。在筛选具有至少5,000个读段映射到靶序列和至少50%完全对齐到扩增子的样品后,当存在HDR促进剂时,从53个事件(201个植物)中鉴定出2个独立事件(5个植物)具有靶向插入(3.77%),相比之下,当不存在HDR促进剂时,从16个事件中鉴定出0个具有靶向插入。
表7A:转化的玉蜀黍胚的汇总
构建体 #处理的胚 回收的芽/事件 #Indel #HDR
pIN1757 397 45/16 40/43 0/43
pIN1756 472 201/53 112/137 105/137
番茄外植体转化
材料和方法
用于番茄转化的质粒的设计
构建用于表达噬菌体λ核酸外切酶(SEQ ID NO:8)、噬菌体λβ SSAP蛋白(SEQ IDNO:1)和大肠杆菌SSB(SEQ ID NO:31)的植物表达盒。将编码SEQ ID NO:15的烟草c2核定位信号(NLS)的DNA序列与编码核酸外切酶、噬菌体λβ SSAP蛋白和大肠杆菌SSB的DNA序列可操作地连接以提供编码分别在SEQ ID NO:135、SEQ ID NO:134和SEQ ID NO:133中列出的c2 NLS-Exo、c2 NLSλβ SSAP和c2 NLS-SSB融合蛋白的DNA序列。编码c2 NLS-Exo、c2 NLSλβSSAP和c2NLS-SSB融合蛋白的DNA序列分别与2x35S、SlUBI10、PcUBI4启动子和35S、AtHSP、pea3A聚腺苷酸化位点可操作地连接,以提供核酸外切酶、SSAP、和SSB植物表达盒。
此外,构建了靶向番茄Ant1基因(SlAnt1)启动子区域以通过HDR插入42个碱基对异源序列的DNA供体序列。DNA供体序列包括替换模板,该模板具有所期望的插入区(42个碱基对长),其侧翼是约600-800bp长的同源臂。同源臂与靶gDNA插入位点侧翼的内源DNA区域匹配(即同源)。包含供体DNA的替换模板区域在每一末端的侧翼是与由RNA指导的核酸酶识别的内源靶编辑位点序列相同的DNA序列。
此外,构建了提供RNA指导的序列特异性核酸内切酶的表达的植物表达盒。构建了提供与插入位点相邻序列互补的指导RNA的表达的植物表达盒。构建了提供绿色荧光蛋白(GFP)的表达的植物表达盒。构建了农杆菌二元质粒转化载体,该载体包含提供5-烯醇丙酮酸莽草酸-3-磷酸(EPSPS)合酶的表达的盒。
一旦构建颗盒、供体序列和农杆菌转化质粒载体,将它们组合以产生三个番茄转化质粒。
番茄转化质粒pIN1703用以下来构建:将RNA指导的序列特异性核酸内切酶盒、指导RNA盒和GFP盒克隆进入农杆菌转化质粒载体中(图9B)。番茄转化质粒pIN1704用以下来构建:将RNA指导的序列特异性核酸内切酶盒、指导RNA盒和Ant1 DNA供体序列克隆进入农杆菌转化质粒载体中(图9B)。番茄转化质粒pIN1705用以下来构建:将RNA指导的序列特异性核酸内切酶盒、指导RNA盒、SSB盒、λβSSAP盒、核酸外切酶盒和Ant1 DNA供体序列克隆进入农杆菌转化质粒载体中(图9A-9B)。
使用农杆菌菌株EHA105将所有载体递送至番茄。
番茄外植体转化
上述载体用于转化番茄(栽培品种Moneymaker)外植体以再生具有上述组分的稳定转化的转基因芽。番茄转化是基于先前公开的方法(Van Eck J.,Keen P.,Tjahjadi M.(2019)Agrobacterium tumefaciens-Mediated Transformation of Tomato[根癌农杆菌介导的番茄转化].在以下中:Kumar S.,Barone P.,Smith M.(编辑)Transgenic Plants[转基因植物].Methods in Molecular Biology[分子生物学方法],第1864卷.哈门那出版社(HumanaPress),纽约,纽约州)进行的。简而言之,番茄种子用50%商业漂白剂消毒10分钟,然后在1/2强度MSO培养基上萌发。在真叶出现之前,解剖子叶以收集叶的中间3-5mm区段。这些叶用农杆菌转化,然后置于静止再生培养基上两周。两周后,将外植体移至补充有2mg/L草甘膦作为选择剂的再生培养基中。每两周对外植体进行传代培养。在约6-7周后,芽开始从这些外植体再生。
从伸长良好的芽收集样品,并将芽移至补充有2mg/L草甘膦的生根培养基中。对于小芽,收集整个芽块(即,破坏性采样)用于分子分析。
番茄外植体转化的评估
再生的芽首先通过TaqMan qPCR测定检测核酸酶序列的存在被鉴定为转基因阳性。此外,qPCR测定用于估计转基因插入是否以低(1-2个拷贝)或高(>2个拷贝)拷贝数发生,如下面表7B所示。为了评估HDR介导的编辑事件的水平,从先前确认的核酸酶序列阳性外植体中提取的相同gDNA来源扩增SlAnt1基因座,并通过下一代测序进行分析。
结果
系统设计有CRISPR核酸内切酶(CasS)、用于位点特异性切割的指导RNA和HDR促进剂(核酸外切酶、λβ SSAP蛋白和大肠杆菌SSB),如上所述。还包括供体DNA分子,其特征是要整合的序列侧翼是与靶基因组位点匹配的同源臂。供体DNA在任一侧的侧翼是与指导RNA匹配的切割位点,以便供体分子可以被切除并从插入转基因的基因组插入位点释放。为了测试该系统在改善靶向整合进入分裂的植物组织的基因组中的有效性,将上述完整系统通过农杆菌递送至番茄外植体。
与仅由CasS核酸酶、指导RNA和DNA供体组成的基线实验条件(参见图9B中的piN1704)相比,通过比较来自HDR促进剂系统的精确靶向整合的效率(图9A),测量系统的有效性。基于从转化的外植体再生的芽的DNA测序计算精确靶向整合的效率。对于每个构建体,包含整合的供体序列的番茄芽占再生芽总数的百分比显示在下表7B中。由于番茄转化系统的性质,采样的组织是嵌合的而不是在基因方面一致的,测序结果反映了多个单独植物内的一些独立编辑事件。在表7B中,indel是指SlAnt1启动子中靶位置处的NHEJ型和HDR型突变。当来自单独样品的超过30%的测序读段是精确编辑(即模板DNA的插入)时,HDR突变被认为可能是可遗传的。精确编辑的水平与转基因拷贝数无关。在用编码HDR促进剂的载体(pIN1705)转化的芽中,可遗传的HDR介导的编辑事件的百分比最高。一些经编辑的植物通过长读段测序进一步表征。在六个经pIN1704转化的植物样品中,仅在一个中检测到一些无疤痕编辑。在十五个经pIN1705转化的植物样品中,在十个中检测到一些无疤痕编辑,其中至少有四个具有双等位基因100%无疤痕编辑。由于靶向的序列插入,经编辑的植物表现出不同水平的花青素积累。总之,编码HDR促进剂的载体显著改善了HDR介导的精确编辑。
表7B:番茄外植体中基因编辑的汇总
Figure BDA0003417860190001471
重复上述番茄编辑实验,结果示于表7C中。同样,在用编码HDR促进剂的载体(pIN1705)转化的芽中,可遗传的HDR介导的编辑事件的百分比最高;观察到了相同的趋势。
表7C:番茄外植体中基因编辑的汇总
Figure BDA0003417860190001472
实例9.哺乳动物细胞中增强的HDR
以下实例描述了在存在或不存在HDR促进剂的情况下对人胚肾293(HEK-293)细胞中基因座的精确编辑。FRT位点和最小的AAVS1位点分别插入到EMX1和GRIN2b基因中。将表达编辑机制的质粒转染到细胞系中,以在这些基因的特定靶编辑位点诱导靶向插入。
材料和方法
用于转染的质粒的设计
生成的单个质粒,其编码CasS核酸酶连同特异于EMX1或GRIN2b靶基因座的gRNA、HDR促进剂(核酸外切酶、λβ SSAP和大肠杆菌SSB蛋白)和带有插入序列和与靶编辑位点同源的约700个碱基对同源臂的供体模板。每个组分都由单独的启动子驱动。基因盒首先在称为模块A、B和C的三个单独中间质粒中合成,然后组装成单个表达质粒。
除了HDR促进剂的NLS之外,CasS和HDR促进剂的氨基酸序列如实例1中所述。特别地,HDR促进剂通过氨基酸接头(SEQ ID NO:148,MAPKKKRKVGGSGS)与SV40 NLS融合。所有编码序列都针对在人中的表达进行了密码子优化。如图10所示,CasB受CAG启动子和兔β-珠蛋白终止子控制(CAGp-CasS-rb_珠蛋白_t),gRNA受智人U6启动子控制(HsU6p-gRNA),SSB蛋白受智人EF1a启动子和人生长激素(hGH)终止子控制(HsEF1ap-SSB-hGHt),SSAP受智人ACTB启动子和牛生长激素(bGH)终止子(HsACTB-β-bGHt)控制,并且核酸外切酶受CMV启动子和SV40终止子控制(CMVp-Exo-SV40t)。
此外,供体的侧翼还有与基因组靶中存在的序列相同的gRNA靶序列,从而导致供体从递送的质粒中释放,以及由HDR促进剂介导的随后编辑(参见图10)。
为以下表8中所示的每个样品构建单独的质粒。
HEK-293细胞的转染
将质粒转染到HEK-293细胞中。每个质粒三个单独的转染作为重复。
转染后,将细胞孵育48-72小时,然后从所有样品中提取基因组DNA,用于后续制备扩增子测序文库。
扩增子测序
使用与插入位点直接相邻的序列退火的引物和与供体中存在的同源区之外的基因组序列退火的引物(以防止供体从质粒扩增)来扩增靶。然后使用来自与插入序列相邻的引物的读段的扩增子测序数据量化靶基因座的插入效率。
在存在或不存在HDR促进剂的情况下编辑HEK-293细胞。特别是,使用上述质粒将34个碱基对的FRT位点插入到EMX1基因座中,并将33个碱基对的最小AAVS1位点插入到GRIN2b基因座中。
除了包含CasS、所有三种HDR促进剂(“λRed”)、gRNA和供体DNA的样品外,还包括几个对照,以便将具有HDR促进剂的样品的编辑效率与基线对照进行比较,如表8所示。“λRED”是指所有三种HDR促进剂(核酸外切酶、λβ SSAP蛋白和SSB)。
表8:HEK-293细胞基因编辑实验中样品的汇总
转染组分
CasS+λRed+gRNA+供体DNA
CasS+gRNA+供体DNA
CasS+gRNA
供体DNA
无转染
特别是,将样品(含有CasS与gRNA和供体(不含HDR促进剂的基线对照),含有λRed基因和供体(无核酸酶对照以确认核酸酶介导的靶DNA切割很重要),含有仅供体,以及含有CasS与gRNA(切割对照以确保我们获得靶的有效切割)作为对照单独转染。含有CasS与gRNA和供体的样品是基线样品,具有HDR促进剂的样品与其进行比较。此外,还评估无转染对照。
本披露的广度和范围不应受任何上述实例限制,而应仅根据前述实施例、所附权利要求及其等同物来定义。
参考文献
Bernad A,Blanco L,Lázaro JM,Martín G,Salas M.A conserved 3′-5′exonuclease active site in prokaryotic and eukaryotic DNApolymerases.Cell.1989Oct 6;59(1):219-28.
Brettschneider,R.,D.Becker,and H.
Figure BDA0003417860190001501
1997.“Efficient Transformationof Scutellar Tissue of Immature Maize Embryos.”Theoretical and AppliedGenetics 94(6-7):737-48.doi:10.1007/s001220050473.
Cermák,
Figure BDA0003417860190001503
Shaun J.Curtin,Javier Gil-Humanes,Radim
Figure BDA0003417860190001502
ThomasJ.Y.Kono,Eva
Figure BDA0003417860190001504
Joseph J.Belanto,et al.2017.“A Multipurpose Toolkit toEnable Advanced Genome Engineering in Plants.”The Plant Cell Online 29(6):1196-1217.doi:10.1105/tpc.16.00922.
Dotson SB,Lanahan MB,Smith AG,Kishore GM.A phosphonate monoesterhydrolase from Burkholderia caryophilli PG2982is useful as a conditionallethal gene in plants.Plant J.1996Aug;10(2):383-92.
Clark,R.M.,Tavaré,S.,Doebley,J.Estimating a Nucleotide SubstitutionRate for Maize from Polymorphism at a Major Domestication Locus,MolecularBiology and Evolution,Volume 22,Issue 11,November 2005,Pages 2304-2312,doi:10.1093/molbev/msi228.
Dasgupta S,Collins GB,Hunt AG.Co-ordinated expression of multipleenzymes in different subcellular compartments in plants.Plant J.1998Oct;16(1):107-16.
Frame,Bronwyn,Marcy Main,Rosemarie Schick,and Kan Wang.2011.“GeneticTransformation Using Maize Immature Zygotic Embryos.”Methoads in MolecularBiology(Clifton,N.J.)710:327-41.https://doi.org/10.1007/978-1-61737-988-8_22.
Fu BXH,Smith JD,Fuchs RT,Mabuchi M,Curcuru J,Robb GB,Fire AZ.Target-dependent nickase activities of the CRISPR-Cas nucleases Cpf1 and Cas9.NatMicrobiol.2019May;4(5):888-897.doi:10.1038/s41564-019-0382-0.Mar 4.PubMedPMID:30833733;PubMed Central PMCID:PMC6512873.
Gao,Caixia,Jin-Long Qiu,Jinxing Liu,Kunling Chen,Yanpeng Wang,YiZhang,Yuan Zong,and Zhen Liang.2016.“Efficient and Transgene-Free GenomeEditing in Wheat through Trahsient Expression of CRISPR/Cas9 DNA or RNA.”Nature Communications 7(August):12617.doi:10.1038/ncomms12617.
Halpin C,Cooke SE,Barakate A,El Amrani A,Ryan MD.Self-processing 2A-polyproteins--a system for co-ordinate expression of multiple proteins intransgenic plants.Plant J.1999Feb;17(4):453-9.
Hamada,Haruyasu,Yuelin Liu,Yozo Nagira,Ryuji Miki,Naoaki Taoka,andRyozo Imai.2018.“Biolistic-Delivery-Based Trahsient CRISPR/Cas9ExpressionEnables in Planta Genome Editing in Wheat.”Scientiftc Reports 8(1):14422.\doi:10.1038/s41598-018-32714-6.
Honig,Arik,Ira Marton,Michal Rosenthal,J.Jeff Smith,MichaelG.Nicholson,Derek Jantz,Amir Zuker,and Alexander Vainstein.2015.“TransientExpression of Virally Delivered Meganuclease In Planta Generates InheritedGenomic Deletions.”Molecular Plant 8(8):1292-94.doi:10.1016/j.molp.2015.04.001.
Ishida Y.,Hiei Y.,Komari T.2007.Agrobacterium-mediated Transformationof Maize.Nature Protocols 2,1614-1621.
Iyer LM,Koonin EV,Aravind L.2002.Classification and evolutionaryhistory of the single-strand annealing proteins,RecT,Redbeta,ERF andRAD52.BMC Genomics 3:8.doi:10.1186/1471-2164-3-8.
Jiang W,Bikard D,Cox D,Zhang F,Marraffini LA.RNA-guided editing ofbacterial genomes using CRISPR-Cas systems.NatBiotechnol.2013Mar;31(3):233-9.doi:10.1038/nbt.2508.
Jinek M,Chylinski K,Fonfara I,Hauer M,Doudna JA,Charpentier E.Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.Science.2012Aug 17;337(6096):816-21.doi:10.1126/scienee.1225829.
Kim E,Kim S,Kim DH,Choi BS,Choi IY,Kim JS.PFecision genomeengineering with programmable DNA-nicking enzymes.Genome Res.2012Jul;22(7):1327-33.doi:10.1101/gr.138792.112.
Kirienko DR,Luo A,Sylvester AW.Reliable transient transformation ofintact maize leaf cells for functional genomics and experimental study.PlantPhysiol.2012Aug;159(4):1309-18.doi:10.1104/pp.112.199737.
Kosugi S,Hasebe M,Matsumura N,Takashima H,Miyamoto-Sato E,Tomita M,Yanagawa H.Six classes of nuclear localization signals specific to differentbinding grooves of importin alpha.J Biol Chem.2009Jan 2;284(1):478-85.doi:10.1074/jbc.M807017200.
Lindsay,H.et al.2016.CrispRVariants Charts the Mutation Spectrum ofGenome Engineering Experiments.Nature Biotechnology 34:701-702.doi:10.1038/nbt.3628.
Liu,Wusheng,Joshua S.Yuan,and C.Neal Stewart.2013.“Advanced GeneticTools for Plant Biotechnology.”Nature Reviews.Genetics 14(11):781-93.doi:10.1038/nrg3583.
Long L,Guo DD,Gao W,Yang WW,Hou LP,Ma XN,Miao YC,Botella JR,SongCP.Optimization of CRISPR/Cas9 genome editing in cotton by improved sgRNAexpression.Plant Methods.2018Oct 3;14:85.doi:10.1186/s13007-018-0353-0.
Lynch M.Evolution of the mutation rate.Trends Genet.2010Aug;26(8):345-52.doi:10.1016/j.tig.2010.05.003
Martin-Ortigosa,Susana,and Kan Wang.2014.“Proteolistics:A BiolisticMethod for Intracellular Delivery of Proteins.”Transgenic Research 23(5):743-56.doi:10.1007/s11248-014-9807-y.
Murphy,K.2016.λRecombination and Recombineering,EcoSal Plus 2016.doi:10.1128/ecosalplus.
Nagle M,Déjardin A,Pilate G,Strauss SH.Opportunities for Innovationin Genetic Transformation of Forest Trees.Front Plant Sci.2018Oct 2;9:1443.doi:10.3389/fpls.2018.01443.
Nussaume,L.Vincentz,M.,and Caboche,M.1991.Constitutive NitrateReductase:a dominant conditional marker for plant genetics.The PlantJ .1(2):267-274.
Nuccio M.,Chen X.,Conville J.,Zhou A.,Liu X.(2015)Plant Trait GeneExpression Cassette Design.In:Azhakanandam K.,Silverstone A.,Daniell H.,DaveyM.(eds)Recent Advancements in Gene Expression and Enabling Technologies inCrop Plants.Springer,New York,NY.
O′Reilly D,Kartje ZJ,Ageely EA,Malek-Adamian E,Habibian M,SchofieldA,Barkau CL,Rohilla KJ,DeRossett LB,Weigle AT,Damha MJ,Gagnon KT.ExtensiveCRISPR RNA modification reveals chemical compatibility and structure-activityrelatiohships for Cas9 biochemical activity.Nucleic Acids Res.2019Jan 25;47(2):546-558.doi:10.1093/nar/gky1214.
Sivamani,E.,Nalapalli,S.,Prairie,A.et al.Mol Biol Rep(2019).https://doi.org/10.1007/s11033-019-04737-3.
Schindele P,Wolter F,Puchta H.Trahsforming plant biology and breedingwith CRISPR/Cas9,Cas12 and Cas13.FEBS Lett.2018Jun;592(12):1954-1967.doi:10.1002/1873-3468.13073.
Schlaman,H.R.M.,and Hooykaas,P.J.J.(1997)Effectivehess of thebacterial gene codA encoding cytosine deaminase as a negative selectablemarker in Agrobacterium-mediated plant transformation.Plant Journal 11(6):1377-1385.
Soda,Neelam,Lokesh Verma,and Jitender Giri.2017.“CRISPR-Cas9 BasedPlant Genome Editing:Significance,Opportunities and Recent Advances.”PlantPhysiology and Biochemistry,October.doi:10.1016/j.plaphy.2017.10.024.
Urnov,Fyodor D.,Edward J.Rebar,Michael C.Holmes,H.Steve Zhang,andPhilip D.Gregory.2010.“Genome Editing with Engineered Zinc Finger Nucleases.”Nature Reviews.Genetics 11(9):636-46.doi:10.1038/nrg2842.
Urwin PE,McPherson MJ,Atkinson HJ.Enhanced transgenic plantresistance to nematodes by dual proteinase inhibitorconstructs.Planta.1998Apr;204(4):472-9.
Van Eck J.,Keen P.,Tjahjadi M.(2019)Agrobacterium tumefaciens-Mediated Transformation of Tomato.In:Kumar S.,Barone P.,Smith M.(eds)Transgeenic Plants.Methods in Molecular Biology,vol 1864.Humana Press,NewYork,NY.
Vidarsson G,Dekkers G,Rispens T.IgG subclasses and allotypes:fromstructure to effector functions.Front Immunol.2014Oct 20;5:520.doi:10.3389/fimmu.2014.00520.
Wang K,Fredens J,Brunner SF,Kim SH,Chia T,Chin JW.Defining synonymouscodon compression schemes by genome recoding.Nature.2016Nov 3;539(7627):59-64.doi:10.1038/nature20124.
Wang,Kan,and Bronwyn Frame.2009.“Biolistic Gun-Mediated Maize GeneticTransformation.”Methods in Molecular Biology(Clifton,N.J.)526:29-45.doi:10.1007/978-1-59745-494-0_3.
Wang,Wei,Qianli Pan,Fei He,Alina Akhunova,Shiaoman Chao,Harold Trick,and Eduard Akhunov.2018.“Transgenerational CRISPR-Cas9 Activity FacilitatesMultiplex Gene Editing in AllopolyPloid Wheat.”The CRISPR Journal 1(1):65-74.doi:10.1089/crispr.2017.0010.
Wu Y,Gao T,Wang X,Hu Y,Hu X,Hu Z,Pang J,Li Z,Xue J,Feng M,Wu L,LiangD.TALE nickase mediates high efficient targeted transgene integration at thehuman multi-copy ribosomal DNA locus.Biochem Biophys Res Commun.2014Mar 28;446(1):261-6.doi:10.1016/j.bbrc.2014.02.099.
Yamano T,Nishimasu H,Zetsche B,Hirano H,Slaymaker IM,Li Y,Fedorova I,Nakabe T,Makarova KS,Koonin EV,Ishitani R,Zhang F,Nureki O.Crystal Structureof Cpfl in Complex with Guide RNA and Target DNA.Cell.2016May 5;165(4):949-62.doi:10.1016/j.cell.2016.04.003.
Yan WX,Hunnewell P,Alfonse LE,Carte JM,Keston-Smith E,Sothiselvam S,Garrity AJ,Chong S,Makarova KS,Koonin EV,Cheng DR,Scott DA.Functionallydiverse type V CRISPR-Cas systems.Science.2019Jan 4;363(6422):88-91.doi:10.1126/science.aav7271.
Yin H,Song CQ,Suresh S,Wu Q,Walsh S,Rhym LH,Mintzer E,Bolukbasi MF,Zhu LJ,Kauffman K,Mou H,Oberholzer A,Ding J,Kwan SY,Bogorad RL,Zatsepin T,Koteliansky V,Wolfe SA,Xue W,Langer R,Anderson DG.Structure-guided chemicalmodification of guide RNA enables potent non-viral in vivo genomeediting.Nat.Biotechnol.2017Dec;35(12):1179-1187.doi:10.1038/nbt.4005.
Zhang,Yi,Zhen Liang,Yuan Zong,Yanpeng Wang,Jinxing Liu,Kunling Chen,Jin-Long Qiu,and Caixia Gao.2016.“Efficient and Transgene-Free Genome Editingin Wheat through Transient Expression of CRISPR/Cas9 DNA or RNA.”NatureCommunications 7(August):12617.doi:10.1038/ncomms12617.
序列表
<110> 伊纳瑞农业技术有限公司
<120>改善的同源依赖修复基因组编辑
<130> 16536-20006.40
<140> 尚未指定
<141> 一并同时提交
<150> US 62/866,317
<151> 2019-06-25
<160> 149
<170>Windows用FastSEQ 4.0版
<210> 1
<211> 261
<212> PRT
<213> 未知
<220>
<223>细菌(真细菌)
<400> 1
Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val
1 5 10 15
Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln
20 25 30
Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu
35 40 45
Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr
50 55 60
Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp
65 70 75 80
Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp
85 90 95
Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp
100 105 110
Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg
115 120 125
Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln
130 135 140
Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala
145 150 155 160
Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu
165 170 175
Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg
180 185 190
Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu
195 200 205
Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys
210 215 220
Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln
225 230 235 240
Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu
245 250 255
Gln Lys Val Ala Ala
260
<210> 2
<211> 269
<212>PRT
<213>大肠杆菌株系K-12亚株系 MG1655
<400> 2
Met Thr Lys Gln Pro Pro Ile Ala Lys Ala Asp Leu Gln Lys Thr Gln
1 5 10 15
Gly Asn Arg Ala Pro Ala Ala Val Lys Asn Ser Asp Val Ile Ser Phe
20 25 30
Ile Asn Gln Pro Ser Met Lys Glu Gln Leu Ala Ala Ala Leu Pro Arg
35 40 45
His Met Thr Ala Glu Arg Met Ile Arg Ile Ala Thr Thr Glu Ile Arg
50 55 60
Lys Val Pro Ala Leu Gly Asn Cys Asp Thr Met Ser Phe Val Ser Ala
65 70 75 80
Ile Val Gln Cys Ser Gln Leu Gly Leu Glu Pro Gly Ser Ala Leu Gly
85 90 95
His Ala Tyr Leu Leu Pro Phe Gly Asn Lys Asn Glu Lys Ser Gly Lys
100 105 110
Lys Asn Val Gln Leu Ile Ile Gly Tyr Arg Gly Met Ile Asp Leu Ala
115 120 125
Arg Arg Ser Gly Gln Ile Ala Ser Leu Ser Ala Arg Val Val Arg Glu
130 135 140
Gly Asp Glu Phe Ser Phe Glu Phe Gly Leu Asp Glu Lys Leu Ile His
145 150 155 160
Arg Pro Gly Glu Asn Glu Asp Ala Pro Val Thr His Val Tyr Ala Val
165 170 175
Ala Arg Leu Lys Asp Gly Gly Thr Gln Phe Glu Val Met Thr Arg Lys
180 185 190
Gln Ile Glu Leu Val Arg Ser Leu Ser Lys Ala Gly Asn Asn Gly Pro
195 200 205
Trp Val Thr His Trp Glu Glu Met Ala Lys Lys Thr Ala Ile Arg Arg
210 215 220
Leu Phe Lys Tyr Leu Pro Val Ser Ile Glu Ile Gln Arg Ala Val Ser
225 230 235 240
Met Asp Glu Lys Glu Pro Leu Thr Ile Asp Pro Ala Asp Ser Ser Val
245 250 255
Leu Thr Gly Glu Tyr Ser Val Ile Asp Asn Ser Glu Glu
260 265
<210> 3
<211> 287
<212>PRT
<213> 未知
<220>
<223> 噬菌体SPP1 35蛋白
<400> 3
Met Ala Thr Lys Lys Gln Glu Glu Leu Lys Asn Ala Leu Ala Gln Gln
1 5 10 15
Asn Gly Ala Val Pro Gln Thr Pro Val Lys Pro Gln Asp Lys Val Lys
20 25 30
Gly Tyr Leu Glu Arg Met Met Pro Ala Ile Lys Asp Val Leu Pro Lys
35 40 45
His Leu Asp Ala Asp Arg Leu Ser Arg Ile Ala Met Asn Val Ile Arg
50 55 60
Thr Asn Pro Lys Leu Leu Glu Cys Asp Thr Ala Ser Leu Met Gly Ala
65 70 75 80
Val Leu Glu Ser Ala Lys Leu Gly Val Glu Pro Gly Leu Leu Gly Gln
85 90 95
Ala Tyr Ile Leu Pro Tyr Thr Asn Tyr Lys Lys Lys Thr Val Glu Ala
100 105 110
Gln Phe Ile Leu Gly Tyr Lys Gly Leu Leu Asp Leu Val Arg Arg Ser
115 120 125
Gly His Val Ser Thr Ile Ser Ala Gln Thr Val Tyr Lys Asn Asp Thr
130 135 140
Phe Glu Tyr Glu Tyr Gly Leu Asp Asp Lys Leu Val His Arg Pro Ala
145 150 155 160
Pro Phe Gly Thr Asp Arg Gly Glu Pro Val Gly Tyr Tyr Ala Val Ala
165 170 175
Lys Met Lys Asp Gly Gly Tyr Asn Phe Leu Val Met Ser Lys Gln Asp
180 185 190
Val Glu Lys His Arg Asp Ala Phe Ser Lys Ser Lys Asn Arg Glu Gly
195 200 205
Val Val Tyr Gly Pro Trp Ala Asp His Phe Asp Ala Met Ala Lys Lys
210 215 220
Thr Val Leu Arg Gln Leu Ile Asn Tyr Leu Pro Ile Ser Val Glu Gln
225 230 235 240
Leu Ser Gly Val Ala Ala Asp Glu Arg Thr Gly Ser Glu Leu His Asn
245 250 255
Gln Phe Ala Asp Asp Asp Asn Ile Ile Asn Val Asp Ile Asn Thr Gly
260 265 270
Glu Ile Ile Asp His Gln Glu Lys Leu Gly Gly Glu Thr Asn Glu
275 280 285
<210> 4
<211> 205
<212>PRT
<213>沙门氏菌病毒P22
<400> 4
Met Ser Lys Glu Phe Tyr Ala Arg Leu Ala Glu Ile Gln Glu His Leu
1 5 10 15
Asn Ala Pro Lys Asn Gln Tyr Asn Ser Phe Gly Lys Tyr Lys Tyr Arg
20 25 30
Ser Cys Glu Asp Ile Leu Glu Gly Val Lys Pro Leu Leu Lys Gly Leu
35 40 45
Phe Leu Ser Ile Ser Asp Glu Ile Val Leu Ile Gly Asp Arg Tyr Tyr
50 55 60
Val Lys Ala Thr Ala Thr Ile Thr Asp Gly Glu Asn Ser His Ser Ala
65 70 75 80
Ser Ala Ile Ala Arg Glu Glu Glu Asn Lys Lys Gly Met Asp Ala Ala
85 90 95
Gln Val Thr Gly Ala Thr Ser Ser Tyr Ala Arg Lys Tyr Cys Leu Asn
100 105 110
Gly Leu Phe Gly Ile Asp Asp Ala Lys Asp Ala Asp Thr Glu Glu His
115 120 125
Lys Gln Gln Gln Asn Ala Ala Pro Ala Lys Gln Thr Lys Ser Ser Pro
130 135 140
Ser Ser Pro Ala Pro Glu Gln Val Leu Lys Ala Phe Ser Glu Tyr Ala
145 150 155 160
Ala Thr Glu Thr Asp Lys Lys Lys Leu Ile Glu Arg Tyr Gln His Asp
165 170 175
Trp Gln Leu Leu Thr Gly His Asp Asp Glu Gln Thr Lys Cys Val Gln
180 185 190
Val Met Asn Ile Arg Ile Asn Glu Leu Lys Gln Val Ala
195 200 205
<210> 5
<211> 471
<212>PRT
<213>酿酒酵母S288C
<400> 5
Met Asn Glu Ile Met Asp Met Asp Glu Lys Lys Pro Val Phe Gly Asn
1 5 10 15
His Ser Glu Asp Ile Gln Thr Lys Leu Asp Lys Lys Leu Gly Pro Glu
20 25 30
Tyr Ile Ser Lys Arg Val Gly Phe Gly Thr Ser Arg Ile Ala Tyr Ile
35 40 45
Glu Gly Trp Arg Val Ile Asn Leu Ala Asn Gln Ile Phe Gly Tyr Asn
50 55 60
Gly Trp Ser Thr Glu Val Lys Ser Val Val Ile Asp Phe Leu Asp Glu
65 70 75 80
Arg Gln Gly Lys Phe Ser Ile Gly Cys Thr Ala Ile Val Arg Val Thr
85 90 95
Leu Thr Ser Gly Thr Tyr Arg Glu Asp Ile Gly Tyr Gly Thr Val Glu
100 105 110
Asn Glu Arg Arg Lys Pro Ala Ala Phe Glu Arg Ala Lys Lys Ser Ala
115 120 125
Val Thr Asp Ala Leu Lys Arg Ser Leu Arg Gly Phe Gly Asn Ala Leu
130 135 140
Gly Asn Cys Leu Tyr Asp Lys Asp Phe Leu Ala Lys Ile Asp Lys Val
145 150 155 160
Lys Phe Asp Pro Pro Asp Phe Asp Glu Asn Asn Leu Phe Arg Pro Thr
165 170 175
Asp Glu Ile Ser Glu Ser Ser Arg Thr Asn Thr Leu His Glu Asn Gln
180 185 190
Glu Gln Gln Gln Tyr Pro Asn Lys Arg Arg Gln Leu Thr Lys Val Thr
195 200 205
Asn Thr Asn Pro Asp Ser Thr Lys Asn Leu Val Lys Ile Glu Asn Thr
210 215 220
Val Ser Arg Gly Thr Pro Met Met Ala Ala Pro Ala Glu Ala Asn Ser
225 230 235 240
Lys Asn Ser Ser Asn Lys Asp Thr Asp Leu Lys Ser Leu Asp Ala Ser
245 250 255
Lys Gln Asp Gln Asp Asp Leu Leu Asp Asp Ser Leu Met Phe Ser Asp
260 265 270
Asp Phe Gln Asp Asp Asp Leu Ile Asn Met Gly Asn Thr Asn Ser Asn
275 280 285
Val Leu Thr Thr Glu Lys Asp Pro Val Val Ala Lys Gln Ser Pro Thr
290 295 300
Ala Ser Ser Asn Pro Glu Ala Glu Gln Ile Thr Phe Val Thr Ala Lys
305 310 315 320
Ala Ala Thr Ser Val Gln Asn Glu Arg Tyr Ile Gly Glu Glu Ser Ile
325 330 335
Phe Asp Pro Lys Tyr Gln Ala Gln Ser Ile Arg His Thr Val Asp Gln
340 345 350
Thr Thr Ser Lys His Ile Pro Ala Ser Val Leu Lys Asp Lys Thr Met
355 360 365
Thr Thr Ala Arg Asp Ser Val Tyr Glu Lys Phe Ala Pro Lys Gly Lys
370 375 380
Gln Leu Ser Met Lys Asn Asn Asp Lys Glu Leu Gly Pro His Met Leu
385 390 395 400
Glu Gly Ala Gly Asn Gln Val Pro Arg Glu Thr Thr Pro Ile Lys Thr
405 410 415
Asn Ala Thr Ala Phe Pro Pro Ala Ala Ala Pro Arg Phe Ala Pro Pro
420 425 430
Ser Lys Val Val His Pro Asn Gly Asn Gly Ala Val Pro Ala Val Pro
435 440 445
Gln Gln Arg Ser Thr Arg Arg Glu Val Gly Arg Pro Lys Ile Asn Pro
450 455 460
Leu His Ala Arg Lys Pro Thr
465 470
<210> 6
<211> 469
<212>PRT
<213>粟酒裂殖酵母
<400> 6
Met Ser Phe Glu Gln Lys Gln His Val Ala Ser Glu Asp Gln Gly His
1 5 10 15
Phe Asn Thr Ala Tyr Ser His Glu Glu Phe Asn Phe Leu Gln Ser Ser
20 25 30
Leu Thr Arg Lys Leu Gly Pro Glu Tyr Val Ser Arg Arg Ser Gly Pro
35 40 45
Gly Gly Phe Ser Val Ser Tyr Ile Glu Ser Trp Lys Ala Ile Glu Leu
50 55 60
Ala Asn Glu Ile Phe Gly Phe Asn Gly Trp Ser Ser Ser Ile Arg Ser
65 70 75 80
Ile Asn Val Asp Phe Met Asp Glu Asn Lys Glu Asn Gly Arg Ile Ser
85 90 95
Leu Gly Leu Ser Val Ile Val Arg Val Thr Ile Lys Asp Gly Ala Tyr
100 105 110
His Glu Asp Ile Gly Tyr Gly Ser Ile Asp Asn Cys Arg Gly Lys Ala
115 120 125
Ser Ala Phe Glu Lys Cys Lys Lys Glu Gly Thr Thr Asp Ala Leu Lys
130 135 140
Arg Ala Leu Arg Asn Phe Gly Asn Ser Leu Gly Asn Cys Met Tyr Asp
145 150 155 160
Lys Tyr Tyr Leu Arg Glu Val Gly Lys Met Lys Pro Pro Thr Tyr His
165 170 175
Phe Asp Ser Gly Asp Leu Phe Arg Lys Thr Asp Pro Ala Ala Arg Glu
180 185 190
Ser Phe Ile Lys Lys Gln Lys Thr Leu Asn Ser Thr Arg Thr Val Asn
195 200 205
Asn Gln Pro Leu Val Asn Lys Gly Glu Gln Leu Ala Pro Arg Arg Ala
210 215 220
Ala Glu Leu Asn Asp Glu Gln Thr Arg Glu Ile Glu Met Tyr Ala Asp
225 230 235 240
Glu Glu Leu Asp Asn Ile Phe Val Glu Asp Asp Ile Ile Ala His Leu
245 250 255
Ala Val Ala Glu Asp Thr Ala His Pro Ala Ala Asn Asn His His Ser
260 265 270
Glu Lys Ala Gly Thr Gln Ile Asn Asn Lys Asp Lys Gly Ser His Asn
275 280 285
Ser Ala Lys Pro Val Gln Arg Ser His Thr Tyr Pro Val Ala Val Pro
290 295 300
Gln Asn Thr Ser Asp Ser Val Gly Asn Ala Val Thr Asp Thr Ser Pro
305 310 315 320
Lys Thr Leu Phe Asp Pro Leu Lys Pro Asn Thr Gly Thr Pro Ser Pro
325 330 335
Lys Phe Ile Ser Ala Arg Ala Ala Ala Ala Ala Glu Gly Val Val Ser
340 345 350
Ala Pro Phe Thr Asn Asn Phe Asn Pro Arg Leu Asp Ser Pro Ser Ile
355 360 365
Arg Lys Thr Ser Ile Ile Asp His Ser Lys Ser Leu Pro Val Gln Arg
370 375 380
Ala Ser Val Leu Pro Ile Ile Lys Gln Ser Ser Gln Thr Ser Pro Val
385 390 395 400
Ser Asn Asn Ser Met Ile Arg Asp Ser Glu Ser Ile Ile Asn Glu Arg
405 410 415
Lys Glu Asn Ile Gly Leu Ile Gly Val Lys Arg Ser Leu His Asp Ser
420 425 430
Thr Thr Ser His Asn Lys Ser Asp Leu Met Arg Thr Asn Ser Asp Pro
435 440 445
Gln Ser Ala Met Arg Ser Arg Glu Asn Tyr Asp Ala Thr Val Asp Lys
450 455 460
Lys Ala Lys Lys Gly
465
<210> 7
<211> 436
<212>PRT
<213>乳酸克鲁维酵母
<400> 7
Met Glu Asp Thr Gly Ser Gly Lys Asn Gly Lys Asp Asp Ile Gln Thr
1 5 10 15
Lys Leu Asp Lys Lys Leu Gly Pro Glu Tyr Ile Ser Lys Arg Val Gly
20 25 30
Phe Gly Ser Ser Arg Val Ala Tyr Ile Glu Gly Trp Lys Ala Ile Asn
35 40 45
Leu Ala Asn Gln Ile Phe Gly Tyr Asp Gly Trp Ser Thr Glu Val Lys
50 55 60
Asn Val Thr Ile Asp Phe Leu Asp Glu Arg Gln Gly Arg Phe Ser Ile
65 70 75 80
Gly Cys Thr Ala Ile Val Arg Val Ser Leu Ala Asp Gly Thr Phe Arg
85 90 95
Glu Asp Ile Gly Tyr Gly Thr Val Glu Asn Glu Arg Arg Lys Ala Ser
100 105 110
Ala Phe Glu Arg Ala Lys Lys Ser Ala Val Thr Asp Ala Leu Lys Arg
115 120 125
Ser Leu Arg Gly Phe Gly Asn Ala Leu Gly Asn Cys Leu Tyr Asp Lys
130 135 140
Asp Phe Leu Ala Lys Ile Asp Lys Val Lys Phe Asp Pro Pro Asp Phe
145 150 155 160
Asp Glu Gly Asn Leu Phe Arg Pro Ala Asp Glu Leu Ser Glu Met Ser
165 170 175
Arg Ser Asn Met Val Gly Asp Ala His Thr Glu Gly Pro Ser Leu Lys
180 185 190
Lys Arg Ser Leu Thr Asn Glu Asp Arg Asn Ala Val Pro Ser Ala Pro
195 200 205
Ala Gln Gln Thr Tyr Arg Ser Asn Asn His Thr Thr Gln Lys Arg Ala
210 215 220
Pro Lys Ala Gln Ala Val Thr Ala Ser Ala Ser Pro Asn Glu Glu Thr
225 230 235 240
Ser Asn Gln Gln Gln Asp Pro Asp Asp Leu Leu Asp Asp Ser Phe Met
245 250 255
Phe Ser Asp Glu Ile Gln Asp Asp Asp Leu Leu Asn Met Asn Thr Thr
260 265 270
Thr Asn Asn Lys Asn Ser Thr Asn Ser Ser Thr Thr Thr Thr Thr Ile
275 280 285
Ser Asp Glu Ala Thr Gly Ile Ile Ser Pro Val Thr Phe Val Thr Ala
290 295 300
Lys Ala Ala Thr Ser Leu Gln His Lys Asp Pro Ile Pro Ser Gly Ser
305 310 315 320
Met Phe Asp Pro Lys Phe Gln Ala Gln Ser Ile Arg His Thr Val Asp
325 330 335
Gln Ser Val Ser Thr Pro Val Arg Ala Thr Ile Leu Lys Glu Lys Gly
340 345 350
Leu Asp Ser Asp Arg Ser Ser Ile Tyr Ser Lys Phe Ala Pro Lys Gly
355 360 365
Lys Glu Leu Ser Gly Thr Thr Thr Asn Ser Glu Pro Tyr Val Ala Ala
370 375 380
Pro Gln Thr Ser Ala Thr Glu Ser Asn Arg Ser Thr Pro Thr Arg Ser
385 390 395 400
Asn Ala Gln Leu Ala Gly Pro Gln Pro Ala Pro Gln Leu Gln Gly Pro
405 410 415
Gln Arg Thr Gln Leu Gly Arg Pro Arg Met Leu Gln Gln Pro Asn Arg
420 425 430
Arg Asn Val Ser
435
<210> 8
<211> 226
<212>PRT
<213> 未知
<220>
<223>细菌(真细菌)
<400> 8
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 9
<211> 866
<212>PRT
<213> 未知
<220>
<223> Rac细菌原噬菌体RecE核酸外切酶
<400> 9
Met Ser Thr Lys Pro Leu Phe Leu Leu Arg Lys Ala Lys Lys Ser Ser
1 5 10 15
Gly Glu Pro Asp Val Val Leu Trp Ala Ser Asn Asp Phe Glu Ser Thr
20 25 30
Cys Ala Thr Leu Asp Tyr Leu Ile Val Lys Ser Gly Lys Lys Leu Ser
35 40 45
Ser Tyr Phe Lys Ala Val Ala Thr Asn Phe Pro Val Val Asn Asp Leu
50 55 60
Pro Ala Glu Gly Glu Ile Asp Phe Thr Trp Ser Glu Arg Tyr Gln Leu
65 70 75 80
Ser Lys Asp Ser Met Thr Trp Glu Leu Lys Pro Gly Ala Ala Pro Asp
85 90 95
Asn Ala His Tyr Gln Gly Asn Thr Asn Val Asn Gly Glu Asp Met Thr
100 105 110
Glu Ile Glu Glu Asn Met Leu Leu Pro Ile Ser Gly Gln Glu Leu Pro
115 120 125
Ile Arg Trp Leu Ala Gln His Gly Ser Glu Lys Pro Val Thr His Val
130 135 140
Ser Arg Asp Gly Leu Gln Ala Leu His Ile Ala Arg Ala Glu Glu Leu
145 150 155 160
Pro Ala Val Thr Ala Leu Ala Val Ser His Lys Thr Ser Leu Leu Asp
165 170 175
Pro Leu Glu Ile Arg Glu Leu His Lys Leu Val Arg Asp Thr Asp Lys
180 185 190
Val Phe Pro Asn Pro Gly Asn Ser Asn Leu Gly Leu Ile Thr Ala Phe
195 200 205
Phe Glu Ala Tyr Leu Asn Ala Asp Tyr Thr Asp Arg Gly Leu Leu Thr
210 215 220
Lys Glu Trp Met Lys Gly Asn Arg Val Ser His Ile Thr Arg Thr Ala
225 230 235 240
Ser Gly Ala Asn Ala Gly Gly Gly Asn Leu Thr Asp Arg Gly Glu Gly
245 250 255
Phe Val His Asp Leu Thr Ser Leu Ala Arg Asp Val Ala Thr Gly Val
260 265 270
Leu Ala Arg Ser Met Asp Leu Asp Ile Tyr Asn Leu His Pro Ala His
275 280 285
Ala Lys Arg Ile Glu Glu Ile Ile Ala Glu Asn Lys Pro Pro Phe Ser
290 295 300
Val Phe Arg Asp Lys Phe Ile Thr Met Pro Gly Gly Leu Asp Tyr Ser
305 310 315 320
Arg Ala Ile Val Val Ala Ser Val Lys Glu Ala Pro Ile Gly Ile Glu
325 330 335
Val Ile Pro Ala His Val Thr Glu Tyr Leu Asn Lys Val Leu Thr Glu
340 345 350
Thr Asp His Ala Asn Pro Asp Pro Glu Ile Val Asp Ile Ala Cys Gly
355 360 365
Arg Ser Ser Ala Pro Met Pro Gln Arg Val Thr Glu Glu Gly Lys Gln
370 375 380
Asp Asp Glu Glu Lys Pro Gln Pro Ser Gly Thr Thr Ala Val Glu Gln
385 390 395 400
Gly Glu Ala Glu Thr Met Glu Pro Asp Ala Thr Glu His His Gln Asp
405 410 415
Thr Gln Pro Leu Asp Ala Gln Ser Gln Val Asn Ser Val Asp Ala Lys
420 425 430
Tyr Gln Glu Leu Arg Ala Glu Leu His Glu Ala Arg Lys Asn Ile Pro
435 440 445
Ser Lys Asn Pro Val Asp Asp Asp Lys Leu Leu Ala Ala Ser Arg Gly
450 455 460
Glu Phe Val Asp Gly Ile Ser Asp Pro Asn Asp Pro Lys Trp Val Lys
465 470 475 480
Gly Ile Gln Thr Arg Asp Cys Val Tyr Gln Asn Gln Pro Glu Thr Glu
485 490 495
Lys Thr Ser Pro Asp Met Asn Gln Pro Glu Pro Val Val Gln Gln Glu
500 505 510
Pro Glu Ile Ala Cys Asn Ala Cys Gly Gln Thr Gly Gly Asp Asn Cys
515 520 525
Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu Thr Phe
530 535 540
Asp Glu Glu Ser Gln Val Glu Ala Lys Glu Asn Asp Pro Glu Glu Met
545 550 555 560
Glu Gly Ala Glu His Pro His Asn Glu Asn Ala Gly Ser Asp Pro His
565 570 575
Arg Asp Cys Ser Asp Glu Thr Gly Glu Val Ala Asp Pro Val Ile Val
580 585 590
Glu Asp Ile Glu Pro Gly Ile Tyr Tyr Gly Ile Ser Asn Glu Asn Tyr
595 600 605
His Ala Gly Pro Gly Ile Ser Lys Ser Gln Leu Asp Asp Ile Ala Asp
610 615 620
Thr Pro Ala Leu Tyr Leu Trp Arg Lys Asn Ala Pro Val Asp Thr Thr
625 630 635 640
Lys Thr Lys Thr Leu Asp Leu Gly Thr Ala Phe His Cys Arg Val Leu
645 650 655
Glu Pro Glu Glu Phe Ser Asn Arg Phe Ile Val Ala Pro Glu Phe Asn
660 665 670
Arg Arg Thr Asn Ala Gly Lys Glu Glu Glu Lys Ala Phe Leu Met Glu
675 680 685
Cys Ala Ser Thr Gly Lys Thr Val Ile Thr Ala Glu Glu Gly Arg Lys
690 695 700
Ile Glu Leu Met Tyr Gln Ser Val Met Ala Leu Pro Leu Gly Gln Trp
705 710 715 720
Leu Val Glu Ser Ala Gly His Ala Glu Ser Ser Ile Tyr Trp Glu Asp
725 730 735
Pro Glu Thr Gly Ile Leu Cys Arg Cys Arg Pro Asp Lys Ile Ile Pro
740 745 750
Glu Phe His Trp Ile Met Asp Val Lys Thr Thr Ala Asp Ile Gln Arg
755 760 765
Phe Lys Thr Ala Tyr Tyr Asp Tyr Arg Tyr His Val Gln Asp Ala Phe
770 775 780
Tyr Ser Asp Gly Tyr Glu Ala Gln Phe Gly Val Gln Pro Thr Phe Val
785 790 795 800
Phe Leu Val Ala Ser Thr Thr Ile Glu Cys Gly Arg Tyr Pro Val Glu
805 810 815
Ile Phe Met Met Gly Glu Glu Ala Lys Leu Ala Gly Gln Gln Glu Tyr
820 825 830
His Arg Asn Leu Arg Thr Leu Ser Asp Cys Leu Asn Thr Asp Glu Trp
835 840 845
Pro Ala Ile Lys Thr Leu Ser Leu Pro Arg Trp Ala Lys Glu Tyr Ala
850 855 860
Asn Asp
865
<210> 10
<211> 23
<212>PRT
<213> 未知
<220>
<223> 玉蜀黍不透明-2核定位信号
<400> 10
Arg Lys Arg Lys Glu Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Arg
1 5 10 15
Ser Arg Tyr Arg Lys Lys Val
20
<210> 11
<211> 7
<212>PRT
<213> 未知
<220>
<223> SV40大T抗原NLS
<400> 11
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 12
<211> 4
<212>PRT
<213> 人工序列
<220>
<223> 类别II单组分NLS共有
<220>
<221> 变体
<222> 2, 4
<223>Xaa = Lys或Arg
<220>
<221> 变体
<222> 3
<223>Xaa = 任何氨基酸
<400> 12
Lys Xaa Xaa Xaa
1
<210> 13
<211> 19
<212>PRT
<213> 人工序列
<220>
<223> 两组分NLS共有
<220>
<221> 变体
<222>1, 2
<223>Xaa = Lys或Arg
<220>
<221> 变体
<222> 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14
<223>Xaa = 任何氨基酸, 并且多达两个
可以存在或不存在
<220>
<221> 变体
<222> 15, 16, 17, 18, 19
<223>Xaa = 任何氨基酸, 并且至少三个
是Lys或Arg
<400> 13
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa
<210> 14
<211> 6
<212>PRT
<213> 未知
<220>
<223>类别5植物NLS
<220>
<221> 变体
<222>5
<223>Xaa = Lys或Arg
<220>
<221> 变体
<222>6
<223>Xaa = Trp, Phe,或Tyr
<400> 14
Leu Gly Lys Arg Xaa Xaa
1 5
<210> 15
<211> 15
<212>PRT
<213> 未知
<220>
<223>烟草c2 NLS
<400> 15
Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
<210> 16
<211> 14
<212>PRT
<213> 未知
<220>
<223>扩展的SV40核定位结构域
<400> 16
Ala Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser
1 5 10
<210> 17
<211> 11
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 17
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 18
<211> 12
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 18
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 19
<211> 27
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 19
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 20
<211> 33
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 20
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 21
<211> 16
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 21
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 22
<211> 11
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 22
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 23
<211> 8
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 23
Arg Lys Lys Arg Arg Gln Arg Arg
1 5
<210> 24
<211> 11
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 24
Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala
1 5 10
<210> 25
<211> 11
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 25
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 26
<211> 11
<212>PRT
<213> 未知
<220>
<223> 细胞穿透肽(CPP)
<400> 26
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 27
<211> 1307
<212>PRT
<213> 未知
<220>
<223> 氨基酸球菌属物种
<400> 27
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 28
<211> 1228
<212>PRT
<213> 未知
<220>
<223>毛螺菌科细菌
<400> 28
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser
1010 1015 1020
Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu
1025 1030 1035 1040
Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1045 1050 1055
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile
1060 1065 1070
Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu
1075 1080 1085
Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile
1090 1095 1100
Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1105 1110 1115 1120
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln
1125 1130 1135
Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser
1140 1145 1150
Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu
1155 1160 1165
Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala
1170 1175 1180
Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys
1185 1190 1195 1200
Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys
1205 1210 1215
Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 29
<211> 1300
<212>PRT
<213>新凶手弗朗西丝氏菌
<400> 29
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1010 1015 1020
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe
1025 1030 1035 1040
Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln
1045 1050 1055
Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly
1060 1065 1070
Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val
1075 1080 1085
Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys
1090 1095 1100
Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp
1105 1110 1115 1120
Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp Lys
1125 1130 1135
Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg Leu Ile
1140 1145 1150
Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr Arg Glu Val
1155 1160 1165
Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu
1170 1175 1180
Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp
1185 1190 1195 1200
Lys Lys Phe Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln
1205 1210 1215
Met Arg Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro
1220 1225 1230
Val Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1250 1255 1260
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys
1265 1270 1275 1280
Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln
1285 1290 1295
Asn Arg Asn Asn
1300
<210> 30
<211> 1320
<212>PRT
<213> 未知
<220>
<223> CasJ (野生型)
<400> 30
Met Gln Gln Tyr Gln Val Ser Lys Thr Val Arg Phe Gly Leu Thr Leu
1 5 10 15
Lys Asn Ser Glu Lys Lys His Ala Thr His Leu Leu Leu Lys Asp Leu
20 25 30
Val Asn Val Ser Glu Glu Arg Ile Lys Asn Glu Ile Thr Lys Asp Asp
35 40 45
Lys Asn Gln Ser Glu Leu Ser Phe Phe Asn Glu Val Ile Glu Thr Leu
50 55 60
Asp Leu Met Asp Lys Tyr Ile Lys Asp Trp Glu Asn Cys Phe Tyr Arg
65 70 75 80
Thr Asp Gln Ile Gln Leu Thr Lys Glu Tyr Tyr Lys Val Ile Ala Lys
85 90 95
Lys Ala Cys Phe Asp Trp Phe Trp Thr Asn Asp Arg Gly Met Lys Phe
100 105 110
Pro Thr Ser Ser Ile Ile Ser Phe Asn Ser Leu Lys Ser Ser Asp Lys
115 120 125
Ser Lys Thr Ser Asp Asn Leu Asp Arg Lys Lys Lys Ile Leu Asp Tyr
130 135 140
Trp Lys Gly Asn Ile Phe Lys Thr Gln Lys Ala Ile Lys Asp Val Leu
145 150 155 160
Asp Ile Thr Glu Asp Ile Gln Lys Ala Ile Glu Glu Lys Lys Ser His
165 170 175
Arg Glu Ile Asn Arg Val Asn His Arg Lys Met Gly Ile His Leu Ile
180 185 190
His Leu Ile Asn Asp Thr Leu Val Pro Leu Cys Asn Gly Ser Ile Phe
195 200 205
Phe Gly Asn Ile Ser Lys Leu Asp Phe Cys Glu Ser Glu Asn Glu Lys
210 215 220
Leu Ile Asp Phe Ala Ser Thr Glu Lys Gln Asp Glu Arg Lys Phe Leu
225 230 235 240
Leu Ser Lys Ile Asn Glu Ile Lys Gln Tyr Phe Glu Asp Asn Gly Gly
245 250 255
Asn Val Pro Phe Ala Arg Ala Thr Leu Asn Arg His Thr Ala Asn Gln
260 265 270
Lys Pro Asp Arg Tyr Asn Glu Glu Ile Lys Lys Leu Val Asn Glu Leu
275 280 285
Gly Val Asn Ser Leu Val Arg Ser Leu Lys Ser Lys Thr Ile Glu Glu
290 295 300
Ile Lys Thr His Phe Glu Phe Glu Asn Lys Asn Lys Ile Asn Glu Leu
305 310 315 320
Lys Asn Ser Phe Val Leu Ser Ile Val Glu Lys Ile Gln Leu Phe Lys
325 330 335
Tyr Lys Thr Ile Pro Ala Ser Val Arg Phe Leu Leu Ala Asp Tyr Phe
340 345 350
Glu Glu Gln Lys Leu Ser Thr Lys Glu Glu Ala Leu Thr Ile Phe Glu
355 360 365
Glu Ile Gly Lys Pro Gln Asn Ile Gly Phe Asp Tyr Ile Gln Leu Lys
370 375 380
Glu Lys Asp Asn Phe Thr Leu Lys Lys Tyr Pro Leu Lys Gln Ala Phe
385 390 395 400
Asp Tyr Ala Trp Glu Asn Leu Ala Arg Leu Asp Gln Asn Pro Lys Ala
405 410 415
Asn Gln Phe Ser Val Asp Glu Cys Lys Arg Phe Phe Lys Glu Val Phe
420 425 430
Ser Met Glu Met Asp Asn Ile Asn Phe Lys Thr Tyr Ala Leu Leu Leu
435 440 445
Ala Leu Lys Glu Lys Thr Thr Ala Phe Asp Lys Lys Gly Glu Gly Ala
450 455 460
Ala Lys Asn Lys Ser Glu Ile Ile Glu Gln Ile Lys Gly Val Phe Glu
465 470 475 480
Glu Leu Asp Gln Pro Phe Lys Ile Ile Ala Asn Thr Leu Arg Glu Glu
485 490 495
Val Ile Lys Lys Glu Asp Glu Leu Asn Val Leu Lys Arg Gln Tyr Arg
500 505 510
Glu Thr Asp Arg Lys Ile Lys Thr Leu Gln Asn Glu Ile Lys Lys Ile
515 520 525
Lys Asn Gln Ile Lys Asn Leu Glu Asn Ser Lys Lys Tyr Ser Phe Pro
530 535 540
Glu Ile Ile Lys Trp Ile Asp Leu Thr Glu Gln Glu Gln Leu Leu Asp
545 550 555 560
Lys Asn Lys Gln Ala Lys Ser Asn Tyr Gln Lys Ala Lys Gly Asp Leu
565 570 575
Gly Leu Ile Arg Gly Ser Gln Lys Thr Ser Ile Asn Asp Tyr Phe Tyr
580 585 590
Leu Thr Asp Lys Val Tyr Arg Lys Leu Ala Gln Asp Phe Gly Lys Lys
595 600 605
Met Ala Asp Leu Arg Glu Lys Leu Leu Asp Lys Asn Asp Val Asn Lys
610 615 620
Ile Lys Tyr Leu Ser Tyr Ile Val Lys Asp Asn Gln Gly Tyr Gln Tyr
625 630 635 640
Thr Leu Leu Lys Pro Leu Glu Asp Lys Asn Ala Glu Ile Ile Glu Leu
645 650 655
Lys Ser Glu Pro Asn Gly Asp Leu Lys Leu Phe Glu Ile Lys Ser Leu
660 665 670
Thr Ser Lys Thr Leu Asn Lys Phe Ile Lys Asn Lys Gly Ala Tyr Lys
675 680 685
Glu Phe His Ser Ala Glu Phe Glu His Lys Lys Ile Lys Glu Asp Trp
690 695 700
Lys Asn Tyr Lys Tyr Asn Ser Asp Phe Ile Val Lys Leu Lys Lys Cys
705 710 715 720
Leu Ser His Ser Asp Met Ala Asn Thr Gln Asn Trp Lys Ala Phe Gly
725 730 735
Trp Asp Leu Asp Lys Cys Lys Ser Tyr Glu Thr Ile Glu Lys Glu Ile
740 745 750
Asp Gln Lys Ser Tyr Gln Leu Val Glu Ile Lys Leu Ser Lys Thr Thr
755 760 765
Ile Glu Lys Trp Val Lys Glu Asn Asn Tyr Leu Leu Leu Pro Ile Val
770 775 780
Asn Gln Asp Ile Thr Ala Glu Lys Leu Lys Val Asn Thr Asn Gln Phe
785 790 795 800
Thr Lys Asp Trp Gln His Ile Phe Glu Lys Asn Pro Asn His Arg Leu
805 810 815
His Pro Glu Phe Asn Ile Ala Tyr Arg Gln Pro Thr Lys Asp Tyr Ala
820 825 830
Lys Glu Gly Glu Lys Arg Tyr Ser Arg Phe Gln Leu Thr Gly Gln Phe
835 840 845
Met Tyr Glu Tyr Ile Pro Gln Asp Ala Asn Tyr Ile Ser Arg Lys Glu
850 855 860
Gln Ile Thr Leu Phe Asn Asp Lys Glu Glu Gln Lys Ile Gln Val Glu
865 870 875 880
Thr Phe Asn Asn Gln Ile Ala Lys Ile Leu Asn Ala Glu Asp Phe Tyr
885 890 895
Val Ile Gly Ile Asp Arg Gly Ile Thr Gln Leu Ala Thr Leu Cys Val
900 905 910
Leu Asn Lys Asn Gly Val Ile Gln Gly Gly Phe Glu Ile Phe Thr Arg
915 920 925
Glu Phe Asp Tyr Thr Asn Lys Gln Trp Lys His Thr Lys Leu Lys Glu
930 935 940
Asn Arg Asn Ile Leu Asp Ile Ser Asn Leu Lys Val Glu Thr Thr Val
945 950 955 960
Asn Gly Glu Lys Val Leu Val Asp Leu Ser Glu Val Lys Thr Tyr Leu
965 970 975
Arg Asp Glu Asn Gly Glu Pro Met Lys Asn Glu Lys Gly Val Ile Leu
980 985 990
Thr Lys Asp Asn Leu Gln Lys Ile Lys Leu Lys Gln Leu Ala Tyr Asp
995 1000 1005
Arg Lys Leu Gln Tyr Lys Met Gln His Glu Pro Glu Leu Val Leu Ser
1010 1015 1020
Phe Leu Asp Arg Leu Glu Asn Lys Glu Gln Ile Pro Asn Leu Leu Ala
1025 1030 1035 1040
Ser Thr Lys Leu Ile Ser Ala Tyr Lys Glu Gly Thr Ala Tyr Ala Asp
1045 1050 1055
Ile Asp Ile Glu Gln Phe Trp Asn Ile Leu Gln Thr Phe Gln Thr Ile
1060 1065 1070
Val Asp Lys Phe Gly Gly Ile Glu Asn Ala Lys Lys Thr Met Glu Phe
1075 1080 1085
Arg Gln Tyr Thr Glu Leu Asp Ala Ser Phe Asp Leu Lys Asn Gly Val
1090 1095 1100
Val Ala Asn Met Val Gly Val Val Lys Phe Ile Met Glu Lys Tyr Asn
1105 1110 1115 1120
Tyr Lys Thr Phe Ile Ala Leu Glu Asp Leu Thr Phe Ala Phe Gly Gln
1125 1130 1135
Ser Ile Asp Gly Ile Asn Gly Glu Arg Leu Arg Ser Thr Lys Glu Asp
1140 1145 1150
Lys Glu Val Asp Phe Lys Glu Gln Glu Asn Ser Thr Leu Ala Gly Leu
1155 1160 1165
Gly Thr Tyr His Phe Phe Glu Met Gln Leu Leu Lys Lys Leu Ser Lys
1170 1175 1180
Thr Gln Ile Gly Asn Glu Ile Lys His Phe Val Pro Ala Phe Arg Ser
1185 1190 1195 1200
Thr Glu Asn Tyr Glu Lys Ile Val Arg Lys Asp Lys Asn Val Lys Ala
1205 1210 1215
Lys Ile Val Ser Tyr Pro Phe Gly Ile Val Ser Phe Val Asn Pro Arg
1220 1225 1230
Asn Thr Ser Ile Ser Cys Pro Asn Cys Lys Asn Ala Asn Lys Ser Asn
1235 1240 1245
Arg Ile Lys Lys Glu Asn Asp Arg Ile Leu Cys Lys His Asn Ile Glu
1250 1255 1260
Lys Thr Lys Gly Asn Cys Gly Phe Asp Thr Ala Asn Phe Asp Glu Asn
1265 1270 1275 1280
Lys Leu Arg Ala Glu Asn Lys Gly Lys Asn Phe Lys Tyr Ile Ser Ser
1285 1290 1295
Gly Asp Ala Asn Ala Ala Tyr Asn Ile Ala Val Lys Leu Leu Glu Asp
1300 1305 1310
Lys Ile Phe Glu Ile Asn Lys Lys
1315 1320
<210> 31
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 31
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 32
<211> 16
<212>PRT
<213> 人工序列
<220>
<223> ERF蛋白基序
<220>
<221> 变体
<222>2
<223>Xaa = Gly, Ser,或Ala
<220>
<221> 变体
<222>3, 4
<223>Xaa = 任何氨基酸
<220>
<221> 变体
<222>5
<223>Xaa = Ser或Thr
<220>
<221> 变体
<222>7
<223>Xaa = Ala, Val, Leu, Ile, Met,或Phe
<220>
<221> 变体
<222>8
<223>Xaa = Lys, Arg, Glu, Asp, Asn, Thr,或Ser
<220>
<221> 变体
<222>9
<223>Xaa = Lys或Arg
<220>
<221> 变体
<222>11
<223>Xaa = 任何氨基酸
<220>
<221> 变体
<222>12
<223>Xaa = Ala, Val, Leu, Ile, Met,或Phe
<220>
<221> 变体
<222>13, 14
<223>Xaa = 任何氨基酸
<220>
<221> 变体
<222>15, 16
<223>Xaa = Ala, Val, Leu, Ile, Met,或Phe
<400> 32
Gly Xaa Xaa Xaa Xaa Tyr Xaa Xaa Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
<210> 33
<211> 20
<212>PRT
<213> 未知
<220>
<223> FMDV 2A自加工肽序列
<400> 33
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 34
<211> 178
<212>PRT
<213>大肠杆菌APEC Ol
<400> 34
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 35
<211> 178
<212>PRT
<213>大肠杆菌UTI89
<400> 35
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 36
<211> 178
<212>PRT
<213> 未知
<220>
<223>变形菌门
<400> 36
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 37
<211> 178
<212>PRT
<213> 未知
<220>
<223> 埃希氏菌属
<400> 37
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Val Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 38
<211> 178
<212>PRT
<213>福氏志贺氏菌
<400> 38
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Lys Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 39
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 39
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 40
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 40
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Leu
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 41
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 41
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Ala Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 42
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 42
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ala Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 43
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 43
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
His Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 44
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 44
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 45
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 45
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Ser Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 46
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 46
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Ser Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 47
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 47
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Ser Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 48
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 48
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Ser Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 49
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 49
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Ser Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 50
<211> 178
<212>PRT
<213> 未知
<220>
<223> 埃希氏菌属
<400> 50
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 51
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 51
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 52
<211> 177
<212>PRT
<213> 大肠杆菌
<400> 52
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gln Pro Gln Gly Gly Trp Gly Gln Ser Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
145 150 155 160
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 53
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 53
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Cys Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 54
<211> 178
<212>PRT
<213> 大肠杆菌
<220>
<221> 变体
<222>111
<223>Xaa = 任何氨基酸
<400> 54
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Xaa Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 55
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 55
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Val Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 56
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 56
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Val Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 57
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 57
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Asp Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 58
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 58
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Asp
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 59
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 59
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 60
<211> 178
<212>PRT
<213>痢疾志贺氏菌1617
<400> 60
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 61
<211> 178
<212>PRT
<213>艾伯特埃希氏菌
<400> 61
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Leu Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 62
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 62
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Cys Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 63
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 63
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Leu Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 64
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 64
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Pro Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 65
<211> 178
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 65
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 66
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 66
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Asp Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 67
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 67
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 68
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 68
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Leu Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 69
<211> 178
<212>PRT
<213> 未知
<220>
<223> 埃希氏菌属
<400> 69
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Thr Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 70
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 70
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Gly Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 71
<211> 178
<212>PRT
<213> 大肠杆菌
<400> 71
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Gly Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 72
<211> 178
<212>PRT
<213>艾伯特埃希氏菌
<400> 72
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Leu Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 73
<211> 178
<212>PRT
<213>艾伯特埃希氏菌
<400> 73
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Phe Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 74
<211> 188
<212>PRT
<213> 大肠杆菌
<400> 74
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly
145 150 155 160
Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn
165 170 175
Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
180 185
<210> 75
<211> 177
<212>PRT
<213> 未知
<220>
<223> 柠檬酸杆菌属
<400> 75
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ala Gly
115 120 125
Gly Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
145 150 155 160
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 76
<211> 178
<212>PRT
<213>克氏柠檬酸杆菌
<400> 76
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 77
<211> 171
<212>PRT
<213>大肠杆菌ECC-1470
<400> 77
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp
165 170
<210> 78
<211> 178
<212>PRT
<213>克氏柠檬酸杆菌
<400> 78
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Val Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 79
<211> 178
<212>PRT
<213>克氏柠檬酸杆菌
<400> 79
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 80
<211> 171
<212>PRT
<213> 未知
<220>
<223>志贺氏菌属
<400> 80
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
130 135 140
Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu
145 150 155 160
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 81
<211> 174
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 81
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 82
<211> 174
<212>PRT
<213>弗氏柠檬酸杆菌复合菌
<400> 82
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Gly Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 83
<211> 174
<212>PRT
<213> 未知
<220>
<223> 柠檬酸杆菌属
<400> 83
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Glu Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 84
<211> 174
<212>PRT
<213>杨氏柠檬酸杆菌
<400> 84
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 85
<211> 174
<212>PRT
<213>乌克曼柠檬酸杆菌
<400> 85
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Ser Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 86
<211> 174
<212>PRT
<213>柠檬酸杆菌属物种MGH109
<400> 86
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 87
<211> 175
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 87
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 88
<211> 174
<212>PRT
<213> 未知
<220>
<223> 柠檬酸杆菌属
<400> 88
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 89
<211> 174
<212>PRT
<213> 未知
<220>
<223>变形菌门
<400> 89
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 90
<211> 155
<212>PRT
<213>大肠杆菌PA5
<400> 90
Met Pro Asn Gly Gly Ala Val Ala Asn Ile Thr Leu Ala Thr Ser Glu
1 5 10 15
Ser Trp Arg Asp Lys Ala Thr Gly Glu Met Lys Glu Gln Thr Glu Trp
20 25 30
His Arg Val Val Leu Phe Gly Lys Leu Ala Glu Val Ala Ser Glu Tyr
35 40 45
Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu Arg Thr Arg
50 55 60
Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg Tyr Thr Thr Glu Val Val
65 70 75 80
Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg Gln Gly Gly
85 90 95
Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly Gly Gln Pro Gln Gly Gly
100 105 110
Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
115 120 125
Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu
130 135 140
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
145 150 155
<210> 91
<211> 174
<212>PRT
<213>产气肠杆菌
<400> 91
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ser Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 92
<211> 176
<212>PRT
<213>阴沟肠杆菌
<400> 92
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Thr Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Arg His Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Leu Asp Asp Asp Ile Pro Phe
165 170 175
<210> 93
<211> 174
<212>PRT
<213>阴沟肠杆菌
<400> 93
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 94
<211> 178
<212>PRT
<213>克雷伯氏菌属物种G5
<400> 94
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 95
<211> 175
<212>PRT
<213>产酸克雷伯氏菌
<400> 95
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Ser Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 96
<211> 178
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 96
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln
130 135 140
Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 97
<211> 178
<212>PRT
<213>木素溶解肠杆菌
<400> 97
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Ser Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 98
<211> 176
<212>PRT
<213> 粘质沙雷氏菌
<400> 98
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 99
<211> 174
<212>PRT
<213>阴沟肠杆菌复合菌
<400> 99
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Ser Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 100
<211> 176
<212>PRT
<213>阴沟肠杆菌复合菌
<400> 100
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 101
<211> 175
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 101
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 102
<211> 175
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 102
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 103
<211> 176
<212>PRT
<213>阴沟肠杆菌
<400> 103
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Ser Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 104
<211> 175
<212>PRT
<213>产酸克雷伯氏菌
<400> 104
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Tyr Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 105
<211> 175
<212>PRT
<213>产酸克雷伯氏菌
<400> 105
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Thr Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 106
<211> 184
<212>PRT
<213> 未知
<220>
<223> 泛菌属
<400> 106
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Asn Lys Glu Ile Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Gly Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Gly Ala Ser Ala Gly Gly Ala Pro Met
115 120 125
Gly Gly Gly Gln Gln Ser Gly Gly Asn Asn Asn Gly Trp Gly Gln Pro
130 135 140
Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg
145 150 155 160
Pro Gln Pro Gln Ser Ala Pro Ala Ser Asn Asn Asn Glu Pro Pro Met
165 170 175
Asp Phe Asp Asp Asp Ile Pro Phe
180
<210> 107
<211> 175
<212>PRT
<213>产酸克雷伯氏菌
<400> 107
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 108
<211> 176
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 108
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Ser Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 109
<211> 174
<212>PRT
<213>肺炎克雷伯氏菌
<400> 109
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys His Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 110
<211> 171
<212>PRT
<213>肺炎克雷伯氏菌
<400> 110
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
130 135 140
Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu
145 150 155 160
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 111
<211> 173
<212>PRT
<213> 未知
<220>
<223> 肠杆菌科
<400> 111
Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
1 5 10 15
Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe
20 25 30
Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met
35 40 45
Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala
50 55 60
Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu
65 70 75 80
Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys
85 90 95
Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu
100 105 110
Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln
115 120 125
Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser
130 135 140
Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser
145 150 155 160
Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 112
<211> 174
<212>PRT
<213>肺炎克雷伯氏菌
<400> 112
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 113
<211> 175
<212>PRT
<213> 未知
<220>
<223> γ-变形菌纲
<400> 113
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 114
<211> 173
<212>PRT
<213>产气肠杆菌
<400> 114
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser
130 135 140
Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser
145 150 155 160
Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 115
<211> 174
<212>PRT
<213>产气肠杆菌
<400> 115
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 116
<211> 177
<212>PRT
<213> 未知
<220>
<223> 沙雷氏菌属
<400> 116
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 117
<211> 174
<212>PRT
<213>雷金斯堡约克氏菌
<400> 117
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 118
<211> 178
<212>PRT
<213>土生拉乌尔菌
<400> 118
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 119
<211> 174
<212>PRT
<213>肺炎克雷伯氏菌
<400> 119
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ser Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 120
<211> 181
<212>PRT
<213> 未知
<220>
<223>耶尔森氏菌属
<400> 120
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ala Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Glu
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln
115 120 125
Asp Gly Gly Ala Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Gln Thr Ser Arg Pro Ala Gln Ser Ala
145 150 155 160
Pro Ala Ala Gln Pro Gln Gly Gly Asn Glu Pro Pro Met Asp Phe Asp
165 170 175
Asp Asp Ile Pro Phe
180
<210> 121
<211> 174
<212>PRT
<213>肺炎克雷伯氏菌
<400> 121
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Ser Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 122
<211> 180
<212>PRT
<213> Cronobacter condimenti
<400> 122
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Leu Arg Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Val Thr Glu Trp His Ser Val Val Leu Tyr Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Ile Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Ser Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln
130 135 140
Gln Ser Gly Gly Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln
145 150 155 160
Gln Gln Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp
165 170 175
Asp Ile Pro Phe
180
<210> 123
<211> 174
<212>PRT
<213>克雷伯氏菌属物种10982
<400> 123
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ser Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 124
<211> 458
<212>PRT
<213>肺炎克雷伯氏菌
<400> 124
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Met Ala
165 170 175
Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln Asp
180 185 190
Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe Thr
195 200 205
Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met Lys
210 215 220
Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala Glu
225 230 235 240
Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly
245 250 255
Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr
260 265 270
Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly
275 280 285
Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly
290 295 300
Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly
305 310 315 320
Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn
325 330 335
Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Ala Glu Val Ala
340 345 350
Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu
355 360 365
Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr Thr Thr
370 375 380
Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg
385 390 395 400
Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly Gly Trp
405 410 415
Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala
420 425 430
Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu Thr
435 440 445
Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
450 455
<210> 125
<211> 176
<212>PRT
<213>关岛特拉布斯菌
<400> 125
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ala
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 126
<211> 176
<212>PRT
<213>阴沟肠杆菌
<400> 126
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Ile Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Ser
115 120 125
Gln Gln His Gly Gly Trp Gly Gln Tyr Gln His Pro Gln Val Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 127
<211> 177
<212>PRT
<213> Trabulsiella odontotermitis
<400> 127
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Pro Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala
145 150 155 160
Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 128
<211> 177
<212>PRT
<213>Trabulsiella odontotermitis
<400> 128
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Gly Gly
130 135 140
Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala
145 150 155 160
Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 129
<211> 174
<212>PRT
<213> Kosakonia radicincitans
<400> 129
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 130
<211> 177
<212>PRT
<213> 粘质沙雷氏菌
<400> 130
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Thr Asp Gln Ala Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 131
<211> 175
<212>PRT
<213> 未知
<220>
<223>克鲁维菌属
<400> 131
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 132
<211> 175
<212>PRT
<213>阿氏肠杆菌
<400> 132
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Thr Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 133
<211> 193
<212>PRT
<213> 人工序列
<220>
<223>c2 NLS-SSB融合蛋白
<400> 133
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
20 25 30
Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn Ile
35 40 45
Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu Met
50 55 60
Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala
65 70 75 80
Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu
85 90 95
Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg
100 105 110
Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu
115 120 125
Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly
130 135 140
Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
145 150 155 160
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
165 170 175
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
180 185 190
Phe
<210> 134
<211> 277
<212>PRT
<213> 人工序列
<220>
<223> c2 NLS- 噬菌体λ Red β SSAP-融合蛋白
<400> 134
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val
20 25 30
Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln
35 40 45
Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu
50 55 60
Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr
65 70 75 80
Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp
85 90 95
Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp
100 105 110
Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp
115 120 125
Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg
130 135 140
Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln
145 150 155 160
Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala
165 170 175
Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu
180 185 190
Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg
195 200 205
Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu
210 215 220
Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys
225 230 235 240
Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln
245 250 255
Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu
260 265 270
Gln Lys Val Ala Ala
275
<210> 135
<211> 241
<212>PRT
<213> 人工序列
<220>
<223> c2 NLS- 噬菌体λ Red 核酸外切酶-融合
蛋白
<400> 135
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala Val
20 25 30
Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile Thr
35 40 45
Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys Lys
50 55 60
Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu Val
65 70 75 80
Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp Gly
85 90 95
Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser Gly
100 105 110
Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met Arg
115 120 125
Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu Glu
130 135 140
Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu Gly
145 150 155 160
Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr Ser
165 170 175
Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp Pro
180 185 190
Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp Glu
195 200 205
Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu Lys
210 215 220
Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln Trp
225 230 235 240
Arg
<210> 136
<211> 692
<212>PRT
<213> 智人
<400> 136
Met Ser Ser Phe Glu Gly Gln Met Ala Glu Tyr Pro Thr Ile Ser Ile
1 5 10 15
Asp Arg Phe Asp Arg Glu Asn Leu Arg Ala Arg Ala Tyr Phe Leu Ser
20 25 30
His Cys His Lys Asp His Met Lys Gly Leu Arg Ala Pro Thr Leu Lys
35 40 45
Arg Arg Leu Glu Cys Ser Leu Lys Val Tyr Leu Tyr Cys Ser Pro Val
50 55 60
Thr Lys Glu Leu Leu Leu Thr Ser Pro Lys Tyr Arg Phe Trp Lys Lys
65 70 75 80
Arg Ile Ile Ser Ile Glu Ile Glu Thr Pro Thr Gln Ile Ser Leu Val
85 90 95
Asp Glu Ala Ser Gly Glu Lys Glu Glu Ile Val Val Thr Leu Leu Pro
100 105 110
Ala Gly His Cys Pro Gly Ser Val Met Phe Leu Phe Gln Gly Asn Asn
115 120 125
Gly Thr Val Leu Tyr Thr Gly Asp Phe Arg Leu Ala Gln Gly Glu Ala
130 135 140
Ala Arg Met Glu Leu Leu His Ser Gly Gly Arg Val Lys Asp Ile Gln
145 150 155 160
Ser Val Tyr Leu Asp Thr Thr Phe Cys Asp Pro Arg Phe Tyr Gln Ile
165 170 175
Pro Ser Arg Glu Glu Cys Leu Ser Gly Val Leu Glu Leu Val Arg Ser
180 185 190
Trp Ile Thr Arg Ser Pro Tyr His Val Val Trp Leu Asn Cys Lys Ala
195 200 205
Ala Tyr Gly Tyr Glu Tyr Leu Phe Thr Asn Leu Ser Glu Glu Leu Gly
210 215 220
Val Gln Val His Val Asn Lys Leu Asp Met Phe Arg Asn Met Pro Glu
225 230 235 240
Ile Leu His His Leu Thr Thr Asp Arg Asn Thr Gln Ile His Ala Cys
245 250 255
Arg His Pro Lys Ala Glu Glu Tyr Phe Gln Trp Ser Lys Leu Pro Cys
260 265 270
Gly Ile Thr Ser Arg Asn Arg Ile Pro Leu His Ile Ile Ser Ile Lys
275 280 285
Pro Ser Thr Met Trp Phe Gly Glu Arg Ser Arg Lys Thr Asn Val Ile
290 295 300
Val Arg Thr Gly Glu Ser Ser Tyr Arg Ala Cys Phe Ser Phe His Ser
305 310 315 320
Ser Tyr Ser Glu Ile Lys Asp Phe Leu Ser Tyr Leu Cys Pro Val Asn
325 330 335
Ala Tyr Pro Asn Val Ile Pro Val Gly Thr Thr Met Asp Lys Val Val
340 345 350
Glu Ile Leu Lys Pro Leu Cys Arg Ser Ser Gln Ser Thr Glu Pro Lys
355 360 365
Tyr Lys Pro Leu Gly Lys Leu Lys Arg Ala Arg Thr Val His Arg Asp
370 375 380
Ser Glu Glu Glu Asp Asp Tyr Leu Phe Asp Asp Pro Leu Pro Ile Pro
385 390 395 400
Leu Arg His Lys Val Pro Tyr Pro Glu Thr Phe His Pro Glu Val Phe
405 410 415
Ser Met Thr Ala Val Ser Glu Lys Gln Pro Glu Lys Leu Arg Gln Thr
420 425 430
Pro Gly Cys Cys Arg Ala Glu Cys Met Gln Ser Ser Arg Phe Thr Asn
435 440 445
Phe Val Asp Cys Glu Glu Ser Asn Ser Glu Ser Glu Glu Glu Val Gly
450 455 460
Ile Pro Ala Ser Leu Gln Gly Asp Leu Gly Ser Val Leu His Leu Gln
465 470 475 480
Lys Ala Asp Gly Asp Val Pro Gln Trp Glu Val Phe Phe Lys Arg Asn
485 490 495
Asp Glu Ile Thr Asp Glu Ser Leu Glu Asn Phe Pro Ser Ser Thr Val
500 505 510
Ala Gly Gly Ser Gln Ser Pro Lys Leu Phe Ser Asp Ser Asp Gly Glu
515 520 525
Ser Thr His Ile Ser Ser Gln Asn Ser Ser Gln Ser Thr His Ile Thr
530 535 540
Glu Gln Gly Ser Gln Gly Trp Asp Ser Gln Ser Asp Thr Val Leu Leu
545 550 555 560
Ser Ser Gln Glu Arg Asn Ser Gly Asp Ile Thr Ser Leu Asp Lys Ala
565 570 575
Asp Tyr Arg Pro Thr Ile Lys Glu Asn Ile Pro Ala Ser Leu Met Glu
580 585 590
Gln Asn Val Ile Cys Pro Lys Asp Thr Tyr Ser Asp Leu Lys Ser Arg
595 600 605
Asp Lys Asp Val Thr Ile Val Pro Ser Thr Gly Glu Pro Thr Thr Leu
610 615 620
Ser Ser Glu Thr His Ile Pro Glu Glu Lys Ser Leu Leu Asn Leu Ser
625 630 635 640
Thr Asn Ala Asp Ser Gln Ser Ser Ser Asp Phe Glu Val Pro Ser Thr
645 650 655
Pro Glu Ala Glu Leu Pro Lys Arg Glu His Leu Gln Tyr Leu Tyr Glu
660 665 670
Lys Leu Ala Thr Gly Glu Ser Ile Ala Val Lys Lys Arg Lys Cys Ser
675 680 685
Leu Leu Asp Thr
690
<210> 137
<211> 708
<212>PRT
<213> 中华猕猴桃
<400> 137
Met Gly Ile Gln Gly Leu Leu Pro Leu Leu Lys Ser Ile Met Val Pro
1 5 10 15
Ile His Ile Lys Asp Leu Glu Asp Cys Cys Val Ala Ile Asp Thr Tyr
20 25 30
Ser Trp Leu His Lys Gly Ala Leu Ser Cys Ser Lys Asp Leu Cys Lys
35 40 45
Gly Gln Ser Thr Ser Lys His Ile Asp Tyr Cys Met Asn Arg Val Asn
50 55 60
Leu Leu Gln His Tyr Gly Ile Arg Pro Ile Leu Val Phe Asp Gly Gly
65 70 75 80
Pro Leu Pro Met Lys Ser Glu Gln Glu Ser Lys Arg Ala Arg Ser Arg
85 90 95
Lys Glu Asn Leu Ala Cys Ala Ile Glu Asn Glu Ser Asn Gly Asn Asn
100 105 110
Ala Ser Ala Tyr Lys Cys Tyr Gln Lys Ala Val Val Ile Ser Pro Ser
115 120 125
Val Ala Tyr Glu Leu Ile Gln Val Leu Lys Lys Glu Asn Val Tyr Tyr
130 135 140
Val Val Ala Pro Tyr Glu Ala Asp Ala Gln Met Thr Phe Leu Ala Val
145 150 155 160
Ser Lys Gln Val Asp Ala Val Ile Thr Glu Asp Ser Asp Leu Ile Ala
165 170 175
Phe Gly Cys Pro Arg Ile Ile Tyr Lys Met Asp Lys Leu Glu Gln Gly
180 185 190
Val Glu Phe Arg Tyr Ser Met Leu Gln Gln Asn Lys Glu Leu Asn Phe
195 200 205
Thr Gly Phe Thr Lys Arg Met Leu Leu Glu Met Cys Ile Leu Ser Gly
210 215 220
Cys Asp Tyr Leu Gln Ser Leu Pro Gly Ile Gly Leu Lys Lys Ala His
225 230 235 240
Ala Leu Val Lys Lys Phe Lys Ser Tyr Asp Lys Val Ile Lys His Leu
245 250 255
Lys Tyr Ser Thr Ala Ser Val Ser Ser Ser Tyr Glu Glu Ser Phe Arg
260 265 270
Lys Ala Ile Met Thr Phe Gln His Gln Arg Val Tyr Asp Pro Thr Ile
275 280 285
Glu Asp Ile Val His Leu Ser Asp Leu Pro Gln Tyr Val Gly Asp Asp
290 295 300
Leu Asp Phe Leu Gly Pro Ala Ile Leu Gln His Ile Ala Lys Gly Ile
305 310 315 320
Ala Arg Gly Asp Leu Asp Pro Phe Thr Lys Met Pro Ile Gln Gly Val
325 330 335
Asn Asn Gly Ala Gly Leu Val Asp Glu Gly Met Tyr Lys Leu Asn Asn
340 345 350
Phe Lys Ser Glu Gly Phe Ala Ser Leu Glu Ala Lys Arg Arg Phe Met
355 360 365
Ala Pro Arg Ser Thr Pro Lys His Arg Asn Pro Ile Thr Glu Thr Cys
370 375 380
Ser Thr Val Glu His Ile Thr Glu Asp Ala Asp Ala Cys Lys Thr Asn
385 390 395 400
Cys Ser Leu Glu Ser Leu Leu Asp Ser Arg Tyr Phe Asp Val Ala Ser
405 410 415
Pro Ser Glu Gly Tyr Val Lys His Gly Val Ala Ala Lys Ser Pro Glu
420 425 430
Ser Lys Ser Pro Ser His Gly Ser His Asp Lys Glu Glu Ile Leu Gly
435 440 445
Glu Gly Asp Asn Arg Ser Pro Gln Asp Pro Leu Leu Gln Gln Phe Lys
450 455 460
His Ser Ile Pro Lys Leu Cys Met Thr Leu Gln Lys Glu Arg Ala Lys
465 470 475 480
Ser Val Ala Asp Ser Gly Gln Asp Lys Thr Arg Lys Glu Asn Thr Lys
485 490 495
Val Ile Val Arg Ser Ser Tyr Phe Gln His Lys Leu Val Lys Glu Asn
500 505 510
Asp Lys Glu Asn Ile Lys Glu Asp Val Thr Thr Asp Lys Gly Glu Asn
515 520 525
Ile Asn Pro Lys Arg Glu His Lys Ser Ala Ser Asp Gly Gly Glu Ala
530 535 540
Lys Thr Arg Ile Lys Asn Arg Lys Thr Ile Val Arg Ser Ser Tyr Phe
545 550 555 560
Leu His Lys Ser Val Asn Glu Asn Asp Gln Asp Asn Arg His Glu Lys
565 570 575
Leu Ile Ile Asn Asp Asp Phe Thr Thr His Thr His Glu Asn Gly Ile
580 585 590
Pro Glu Ser Ala Ser Gly Asp Gly Tyr Phe Asn Asn Ser Ile Val Lys
595 600 605
Arg Lys Val Ser Pro Val Asp Ser Val Gln Met Glu Lys Thr Asn Tyr
610 615 620
Lys Cys Met Arg Met Asp Ala Ser Leu Pro Ile Glu Ser Ser Ser Ile
625 630 635 640
Ser Thr Leu Asn Asn Thr Thr Met Glu Thr Lys Ala Glu Gly Gly Lys
645 650 655
Phe Gly Ser Asn Ile Ser His Leu Lys Asn Tyr Ser Asp Ile Ala Glu
660 665 670
Lys Ser Ile Glu Arg Phe Val Ser Val Ile Ser Ser Phe Lys Cys Ser
675 680 685
Ser Ser Gly Ser Ser Ala Ser Gly Leu Arg Ala Pro Leu Arg Asn Thr
690 695 700
Glu His Met Tyr
705
<210> 138
<211> 1062
<212>PRT
<213> 小家鼠
<400> 138
Met Glu Pro Leu Asp Glu Leu Asp Leu Leu Leu Leu Glu Glu Asp Gly
1 5 10 15
Gly Ala Glu Ala Val Pro Arg Val Glu Leu Leu Arg Lys Lys Ala Asp
20 25 30
Ala Leu Phe Pro Glu Thr Val Leu Ser Arg Gly Val Asp Asn Arg Tyr
35 40 45
Leu Val Leu Ala Val Glu Thr Ser Gln Asn Glu Arg Gly Ala Glu Glu
50 55 60
Lys Arg Leu His Val Thr Ala Ser Gln Asp Arg Glu His Glu Val Leu
65 70 75 80
Cys Ile Leu Arg Asn Gly Trp Ser Ser Val Pro Val Glu Pro Gly Asp
85 90 95
Ile Val His Leu Glu Gly Asp Cys Thr Ser Glu Pro Trp Ile Ile Asp
100 105 110
Asp Asp Phe Gly Tyr Phe Ile Leu Tyr Pro Asp Met Met Ile Ser Gly
115 120 125
Thr Ser Val Ala Ser Ser Ile Arg Cys Leu Arg Arg Ala Val Leu Ser
130 135 140
Glu Thr Phe Arg Gly Ser Asp Pro Ala Thr Arg Gln Met Leu Ile Gly
145 150 155 160
Thr Ile Leu His Glu Val Phe Gln Lys Ala Ile Ser Glu Ser Phe Ala
165 170 175
Pro Glu Arg Leu Gln Glu Leu Ala Leu Gln Thr Leu Arg Glu Val Arg
180 185 190
His Leu Lys Glu Met Tyr Arg Leu Asn Leu Ser Gln Asp Glu Ile Leu
195 200 205
Cys Glu Val Glu Glu Tyr Leu Pro Ser Phe Ser Lys Trp Ala Glu Asp
210 215 220
Phe Met Arg Lys Gly Pro Ser Ser Glu Phe Pro Gln Met Gln Leu Ser
225 230 235 240
Leu Pro Ser Asp Gly Ser Asn Arg Ser Ser Pro Cys Asn Ile Glu Val
245 250 255
Val Lys Ser Leu Asp Ile Glu Glu Ser Ile Trp Ser Pro Arg Phe Gly
260 265 270
Leu Lys Gly Lys Ile Asp Val Thr Val Gly Val Lys Ile His Arg Asp
275 280 285
Cys Lys Met Lys Tyr Lys Val Met Pro Leu Glu Leu Lys Thr Gly Lys
290 295 300
Glu Ser Asn Ser Ile Glu His Arg Ser Gln Val Val Leu Tyr Thr Leu
305 310 315 320
Leu Ser Gln Glu Arg Arg Glu Asp Pro Glu Ala Gly Trp Leu Leu Tyr
325 330 335
Leu Lys Thr Gly Gln Met Tyr Pro Val Pro Ala Asn His Leu Asp Lys
340 345 350
Arg Glu Leu Leu Lys Leu Arg Asn Trp Leu Ala Ala Ser Leu Leu His
355 360 365
Arg Val Ser Arg Ala Ala Pro Gly Glu Glu Ala Arg Leu Ser Ala Leu
370 375 380
Pro Gln Ile Ile Glu Glu Glu Lys Thr Cys Lys Tyr Cys Ser Gln Ile
385 390 395 400
Gly Asn Cys Ala Leu Tyr Ser Arg Ala Val Glu Glu Gln Gly Asp Asp
405 410 415
Ala Ser Ile Pro Glu Ala Met Leu Ser Lys Ile Gln Glu Glu Thr Arg
420 425 430
His Leu Gln Leu Ala His Leu Lys Tyr Phe Ser Leu Trp Cys Leu Met
435 440 445
Leu Thr Leu Glu Ser Gln Ser Lys Asp Asn Arg Lys Thr His Gln Ser
450 455 460
Ile Trp Leu Thr Pro Ala Ser Glu Leu Glu Glu Ser Gly Asn Cys Val
465 470 475 480
Gly Asn Leu Val Arg Thr Glu Pro Val Ser Arg Val Cys Asp Gly Gln
485 490 495
Tyr Leu His Asn Phe Gln Arg Lys Asn Gly Pro Met Pro Ala Thr Asn
500 505 510
Leu Met Ala Gly Asp Arg Ile Ile Leu Ser Gly Glu Glu Arg Lys Leu
515 520 525
Phe Ala Leu Ser Lys Gly Tyr Val Lys Lys Met Asn Lys Ala Ala Val
530 535 540
Thr Cys Leu Leu Asp Arg Asn Leu Ser Thr Leu Pro Ala Thr Thr Val
545 550 555 560
Phe Arg Leu Asp Arg Glu Glu Arg His Gly Asp Ile Ser Thr Pro Leu
565 570 575
Gly Asn Leu Ser Lys Leu Met Glu Ser Thr Asp Pro Ser Lys Arg Leu
580 585 590
Arg Glu Leu Ile Ile Asp Phe Arg Glu Pro Gln Phe Ile Ala Tyr Leu
595 600 605
Ser Ser Val Leu Pro His Asp Ala Lys Asp Thr Val Ala Asn Ile Leu
610 615 620
Lys Gly Leu Asn Lys Pro Gln Arg Gln Ala Met Lys Arg Val Leu Leu
625 630 635 640
Ser Lys Asp Tyr Thr Leu Ile Val Gly Met Pro Gly Thr Gly Lys Thr
645 650 655
Thr Thr Ile Cys Ala Leu Val Arg Ile Leu Ser Ala Cys Gly Phe Ser
660 665 670
Val Leu Leu Thr Ser Tyr Thr His Ser Ala Val Asp Asn Ile Leu Leu
675 680 685
Lys Leu Ala Lys Phe Lys Val Gly Phe Leu Arg Leu Gly Gln Ser His
690 695 700
Lys Val His Pro Asp Ile Gln Lys Phe Thr Glu Glu Glu Ile Cys Arg
705 710 715 720
Ser Arg Ser Ile Ala Ser Leu Ala His Leu Glu Glu Leu Tyr Asn Ser
725 730 735
His Pro Ile Val Ala Thr Thr Cys Met Gly Ile Asn His Pro Ile Phe
740 745 750
Ser Arg Lys Thr Phe Asp Phe Cys Ile Val Asp Glu Ala Ser Gln Ile
755 760 765
Ser Gln Pro Val Cys Leu Gly Pro Leu Phe Phe Ser Arg Arg Phe Val
770 775 780
Leu Val Gly Asp His Gln Gln Leu Pro Pro Leu Val Val Asn Arg Glu
785 790 795 800
Ala Arg Ala Leu Gly Met Ser Glu Ser Leu Phe Lys Arg Leu Glu Arg
805 810 815
Asn Glu Ser Ala Val Val Gln Leu Thr Val Gln Tyr Arg Met Asn Arg
820 825 830
Lys Ile Met Ser Leu Ser Asn Lys Leu Thr Tyr Ala Gly Lys Leu Glu
835 840 845
Cys Gly Ser Asp Arg Val Ala Asn Ala Val Leu Ala Leu Pro Asn Leu
850 855 860
Lys Asp Ala Arg Leu Ser Leu Gln Leu Tyr Ala Asp Tyr Ser Asp Ser
865 870 875 880
Pro Trp Leu Ala Gly Val Leu Glu Pro Asp Asn Pro Val Cys Phe Leu
885 890 895
Asn Thr Asp Lys Val Pro Ala Pro Glu Gln Val Glu Asn Gly Gly Val
900 905 910
Ser Asn Val Thr Glu Ala Arg Leu Ile Val Phe Leu Thr Ser Thr Phe
915 920 925
Ile Lys Ala Gly Cys Ser Pro Ser Asp Ile Gly Val Ile Ala Pro Tyr
930 935 940
Arg Gln Gln Leu Arg Ile Ile Ser Asp Leu Leu Ala Arg Ser Ser Val
945 950 955 960
Gly Met Val Glu Val Asn Thr Val Asp Lys Tyr Gln Gly Arg Asp Lys
965 970 975
Ser Leu Ile Leu Val Ser Phe Val Arg Ser Asn Glu Asp Gly Thr Leu
980 985 990
Gly Glu Leu Leu Lys Asp Trp Arg Arg Leu Asn Val Ala Leu Thr Arg
995 1000 1005
Ala Lys His Lys Leu Ile Leu Leu Gly Ser Val Ser Ser Leu Lys Arg
1010 1015 1020
Phe Pro Pro Leu Gly Thr Leu Phe Asp His Leu Asn Ala Glu Gln Leu
1025 1030 1035 1040
Ile Leu Asp Leu Pro Ser Arg Glu His Glu Ser Leu Ser His Ile Leu
1045 1050 1055
Gly Asp Cys Gln Arg Asp
1060
<210> 139
<211> 702
<212>PRT
<213> 酿酒酵母
<400> 139
Met Gly Ile Gln Gly Leu Leu Pro Gln Leu Lys Pro Ile Gln Asn Ala
1 5 10 15
Val Ser Leu Arg Arg Tyr Glu Gly Glu Val Leu Ala Ile Asp Gly Tyr
20 25 30
Ala Trp Leu His Arg Ala Ala Cys Ser Cys Ala Tyr Glu Leu Ala Met
35 40 45
Gly Lys Pro Thr Asp Lys Tyr Leu Gln Phe Phe Ile Lys Arg Phe Ser
50 55 60
Leu Leu Lys Thr Phe Lys Val Glu Pro Tyr Leu Val Phe Asp Gly Asp
65 70 75 80
Ala Ile Pro Val Lys Lys Ser Thr Glu Ser Lys Arg Arg Asp Lys Arg
85 90 95
Lys Glu Asn Lys Ala Ile Ala Glu Arg Leu Trp Ala Cys Gly Glu Lys
100 105 110
Lys Asn Ala Met Asp Tyr Phe Gln Lys Cys Val Asp Ile Thr Pro Glu
115 120 125
Met Ala Lys Cys Ile Ile Cys Tyr Cys Lys Leu Asn Gly Ile Arg Tyr
130 135 140
Ile Val Ala Pro Phe Glu Ala Asp Ser Gln Met Val Tyr Leu Glu Gln
145 150 155 160
Lys Asn Ile Val Gln Gly Ile Ile Ser Glu Asp Ser Asp Leu Leu Val
165 170 175
Phe Gly Cys Arg Arg Leu Ile Thr Lys Leu Asn Asp Tyr Gly Glu Cys
180 185 190
Leu Glu Ile Cys Arg Asp Asn Phe Ile Lys Leu Pro Lys Lys Phe Pro
195 200 205
Leu Gly Ser Leu Thr Asn Glu Glu Ile Ile Thr Met Val Cys Leu Ser
210 215 220
Gly Cys Asp Tyr Thr Asn Gly Ile Pro Lys Val Gly Leu Ile Thr Ala
225 230 235 240
Met Lys Leu Val Arg Arg Phe Asn Thr Ile Glu Arg Ile Ile Leu Ser
245 250 255
Ile Gln Arg Glu Gly Lys Leu Met Ile Pro Asp Thr Tyr Ile Asn Glu
260 265 270
Tyr Glu Ala Ala Val Leu Ala Phe Gln Phe Gln Arg Val Phe Cys Pro
275 280 285
Ile Arg Lys Lys Ile Val Ser Leu Asn Glu Ile Pro Leu Tyr Leu Lys
290 295 300
Asp Thr Glu Ser Lys Arg Lys Arg Leu Tyr Ala Cys Ile Gly Phe Val
305 310 315 320
Ile His Arg Glu Thr Gln Lys Lys Gln Ile Val His Phe Asp Asp Asp
325 330 335
Ile Asp His His Leu His Leu Lys Ile Ala Gln Gly Asp Leu Asn Pro
340 345 350
Tyr Asp Phe His Gln Pro Leu Ala Asn Arg Glu His Lys Leu Gln Leu
355 360 365
Ala Ser Lys Ser Asn Ile Glu Phe Gly Lys Thr Asn Ser Thr Asn Ser
370 375 380
Glu Ala Lys Val Lys Pro Ile Glu Ser Phe Phe Gln Lys Met Thr Lys
385 390 395 400
Leu Asp His Tyr Pro Lys Val Ala Asn Asn Ile His Ser Leu Arg Gln
405 410 415
Ala Glu Asp Lys Leu Thr Met Ala Ile Lys Arg Arg Lys Leu Ser Asn
420 425 430
Ala Asn Val Val Gln Glu Thr Leu Lys Asp Thr Arg Ser Lys Phe Phe
435 440 445
Asn Lys Pro Ser Met Thr Val Val Glu Asn Phe Lys Glu Lys Gly Asp
450 455 460
Ser Thr Gln Asp Phe Lys Glu Asp Thr Asn Ser Gln Ser Leu Glu Glu
465 470 475 480
Pro Val Ser Glu Ser Gln Leu Ser Thr Gln Ile Pro Ser Ser Phe Ile
485 490 495
Thr Thr Asn Leu Glu Asp Asp Asp Asn Leu Ser Glu Glu Val Ser Glu
500 505 510
Val Val Ser Asp Thr Glu Glu Asp Arg Lys Asn Ser Glu Gly Lys Ile
515 520 525
Ile Gly Asn Glu Ile Tyr Asn Thr Asp Asp Asp Gly Asp Gly Asp Thr
530 535 540
Ser Glu Asp Tyr Ser Glu Thr Ala Glu Ser Arg Val Pro Thr Ser Ser
545 550 555 560
Thr Thr Ser Phe Pro Gly Ser Ser Gln Arg Ser Ile Ser Gly Cys Thr
565 570 575
Lys Val Leu Gln Lys Phe Arg Tyr Ser Ser Ser Phe Ser Gly Val Asn
580 585 590
Ala Asn Arg Gln Pro Leu Phe Pro Arg His Val Asn Gln Lys Ser Arg
595 600 605
Gly Met Val Tyr Val Asn Gln Asn Arg Asp Asp Asp Cys Asp Asp Asn
610 615 620
Asp Gly Lys Asn Gln Ile Met Gln Arg Pro Leu Leu Arg Lys Ser Leu
625 630 635 640
Ile Gly Ala Arg Ser Gln Arg Ile Val Ile Asp Met Lys Ser Val Asp
645 650 655
Glu Arg Lys Ser Phe Asn Ser Ser Pro Ile Leu His Glu Glu Ser Lys
660 665 670
Lys Arg Asp Ile Glu Thr Thr Lys Ser Ser Gln Ala Arg Pro Ala Val
675 680 685
Arg Ser Ile Ser Leu Leu Ser Gln Phe Val Tyr Lys Gly Lys
690 695 700
<210> 140
<211> 486
<212>PRT
<213> 未知
<220>
<223>疱疹病毒
<400> 140
Met Glu Ala Thr Pro Thr Pro Ala Asp Leu Phe Ser Glu Asp Tyr Leu
1 5 10 15
Val Asp Thr Leu Asp Gly Leu Thr Val Asp Asp Gln Gln Ala Val Leu
20 25 30
Ala Ser Leu Ser Phe Ser Lys Phe Leu Lys His Ala Lys Val Arg Asp
35 40 45
Trp Cys Ala Gln Ala Lys Ile Gln Pro Ser Met Pro Ala Leu Arg Met
50 55 60
Ala Tyr Asn Tyr Phe Leu Phe Ser Lys Val Gly Glu Phe Ile Gly Ser
65 70 75 80
Glu Asp Val Cys Asn Phe Phe Val Asp Arg Val Phe Gly Gly Val Arg
85 90 95
Leu Leu Asp Val Ala Ser Val Tyr Ala Ala Cys Ser Gln Met Asn Ala
100 105 110
His Gln Arg His His Ile Cys Cys Leu Val Glu Arg Ala Thr Ser Ser
115 120 125
Gln Ser Leu Asn Pro Val Trp Asp Ala Leu Arg Asp Gly Ile Ile Ser
130 135 140
Ser Ser Lys Phe His Trp Ala Val Lys Gln Gln Asn Thr Ser Lys Lys
145 150 155 160
Ile Phe Ser Pro Trp Pro Ile Thr Asn Asn His Phe Val Ala Gly Pro
165 170 175
Leu Ala Phe Gly Leu Arg Cys Glu Glu Val Val Lys Thr Leu Leu Ala
180 185 190
Thr Leu Leu His Pro Asp Glu Ala Asn Cys Leu Asp Tyr Gly Phe Met
195 200 205
Gln Ser Pro Gln Asn Gly Ile Phe Gly Val Ser Leu Asp Phe Ala Ala
210 215 220
Asn Val Lys Thr Asp Thr Glu Gly Arg Leu Gln Phe Asp Pro Asn Cys
225 230 235 240
Lys Val Tyr Glu Ile Lys Cys Arg Phe Lys Tyr Thr Phe Ala Lys Met
245 250 255
Glu Cys Asp Pro Ile Tyr Ala Ala Tyr Gln Arg Leu Tyr Glu Ala Pro
260 265 270
Gly Lys Leu Ala Leu Lys Asp Phe Phe Tyr Ser Ile Ser Lys Pro Ala
275 280 285
Val Glu Tyr Val Gly Leu Gly Lys Leu Pro Ser Glu Ser Asp Tyr Leu
290 295 300
Val Ala Tyr Asp Gln Glu Trp Glu Ala Cys Pro Arg Lys Lys Arg Lys
305 310 315 320
Leu Thr Pro Leu His Asn Leu Ile Arg Glu Cys Ile Leu His Asn Ser
325 330 335
Thr Thr Glu Ser Asp Val Tyr Val Leu Thr Asp Pro Gln Asp Thr Arg
340 345 350
Gly Gln Ile Ser Ile Lys Ala Arg Phe Lys Ala Asn Leu Phe Val Asn
355 360 365
Val Arg His Ser Tyr Phe Tyr Gln Val Leu Leu Gln Ser Ser Ile Val
370 375 380
Glu Glu Tyr Ile Gly Leu Asp Ser Gly Ile Pro Arg Leu Gly Ser Pro
385 390 395 400
Lys Tyr Tyr Ile Ala Thr Gly Phe Phe Arg Lys Arg Gly Tyr Gln Asp
405 410 415
Pro Val Asn Cys Thr Ile Gly Gly Asp Ala Leu Asp Pro His Val Glu
420 425 430
Ile Pro Thr Leu Leu Ile Val Thr Pro Val Tyr Phe Pro Arg Gly Ala
435 440 445
Lys His Arg Leu Leu His Gln Ala Ala Asn Phe Trp Ser Arg Ser Ala
450 455 460
Lys Asp Thr Phe Pro Tyr Ile Lys Trp Asp Phe Ser Tyr Leu Ser Ala
465 470 475 480
Asn Val Pro His Ser Pro
485
<210> 141
<211> 521
<212>PRT
<213> 未知
<220>
<223> UL12核酸外切酶
<400> 141
Met Glu Leu Glu Pro Val Gly Lys Lys Tyr Arg Pro Glu Arg Glu Asp
1 5 10 15
Ser Ser Lys Gly Arg Lys Ile Leu Thr Val Ser Val Asn Ser Gln Leu
20 25 30
Gln Gly Ala Ser Pro Thr Leu Gly Thr Arg Ala His Pro Pro His Ser
35 40 45
Glu Leu Thr Asp Tyr Thr Phe Ser Arg Tyr Ile Leu Tyr His Leu Ala
50 55 60
Pro Ser Glu Leu Lys Glu Ala Ile His Pro Leu Tyr His Arg Leu Asn
65 70 75 80
Tyr Ile Ala Asp Val Ile Lys Arg Gly Thr Ser Glu Gly Arg Trp Leu
85 90 95
Gly Tyr Pro Tyr Ser Cys Ile Leu Asp Thr Glu Asp Glu Leu Arg Asn
100 105 110
Glu Ser Arg Arg Asn Thr Ser Ser Pro Ser Asp His Ala Leu Arg Trp
115 120 125
Cys Leu Leu Val Glu Ser Phe Thr Ile Glu Gln Ala Asn Cys Asp Leu
130 135 140
Trp His Ile Phe Arg Gln Ser Leu Leu Thr Ala Ser Ser Val Lys Trp
145 150 155 160
Thr Asp Asp Gly Lys Leu Asp Thr Val Gly Ile Met Ser Asp Asn Ser
165 170 175
Thr Ala Tyr Val Glu Thr Cys Ser Val Ala Phe Gly Lys His Asn Glu
180 185 190
Pro Leu Ala Lys Ser Leu Val Thr Met Phe Cys Leu Asn His Ser Arg
195 200 205
His Val His Asn Thr Ser Pro Arg Arg Glu Asn Val Phe Val Phe Glu
210 215 220
Asp Val Ser Asp Arg Thr Ile Gln Ser Glu Ser Asp Tyr Ser Cys Gly
225 230 235 240
Leu Met Ile Asp Thr Arg Thr Gly Met Val Gly Ala Ser Leu Asp Met
245 250 255
Leu Val Cys Glu Arg Asp Pro Phe Gly Leu Leu Gln Pro Asp Ser Glu
260 265 270
Asn Gln Ala Ile Glu Thr Tyr Glu Ile Lys Cys Arg Ala Lys Tyr Ala
275 280 285
Phe Cys Pro Asp Lys Arg Ser Glu Leu Ser Gln Cys Tyr Glu Arg Leu
290 295 300
Leu Asn Val Arg Thr Met Gly Ser Leu Arg Leu Phe Ile Ser Ala Ile
305 310 315 320
Gln Arg Pro Cys Val Asp Tyr Phe Gln Pro Gly Asn Val Pro Arg Ser
325 330 335
Lys Glu Ala Leu Ile Thr Ser Asn Glu Glu Trp Lys Val Gly Asn Ser
340 345 350
Ala Tyr His Ala Ala Gln Ser Arg Ile Arg Cys Asn Ala Phe Asp Lys
355 360 365
Cys His Leu Glu Leu Asn Ser Asn Val Gln Ser Arg Val Trp Leu Phe
370 375 380
Gly Glu Pro Asp Leu Glu Thr Asp Thr Ile Tyr Pro Leu Pro Trp Asp
385 390 395 400
Thr Gly Lys Leu Ser Leu Asp Val Pro Ile Phe Ser Asn Pro Arg His
405 410 415
Pro Asn Phe Lys Gln Ile Tyr Leu Gln Thr Tyr Val Ala Ala Gly Tyr
420 425 430
Phe Gly Glu Arg Arg Thr Thr Pro Phe Leu Val Thr Phe Ile Gly Arg
435 440 445
Trp Arg Lys Arg Arg Glu Phe Gly Lys Lys Phe Ser Leu Ile Ala Asp
450 455 460
Ser Gly Leu Gly Lys Pro Ile Ser Thr Val His Ala Asp Gln Ala Ile
465 470 475 480
Pro Val Leu Leu Ile Val Thr Pro Val Ile Val Asp Glu Ala Phe Tyr
485 490 495
Gly Glu Ile Glu Ser Ala Gly Cys Arg Ala Phe Gly Glu Leu Val Lys
500 505 510
Gln Leu Trp Ala Lys Gln Pro His Thr
515 520
<210> 142
<211> 664
<212>PRT
<213> 大肠杆菌
<400> 142
Met Ser Lys Val Phe Ile Cys Ala Ala Ile Pro Asp Glu Leu Ala Thr
1 5 10 15
Arg Glu Glu Gly Ala Val Ala Val Ala Thr Ala Ile Glu Ala Gly Asp
20 25 30
Glu Arg Arg Ala Arg Ala Lys Phe His Trp Gln Phe Leu Glu His Tyr
35 40 45
Pro Ala Ala Gln Asp Cys Ala Tyr Lys Phe Ile Val Cys Glu Asp Lys
50 55 60
Pro Gly Ile Pro Arg Pro Ala Leu Asp Ser Trp Asp Ala Glu Tyr Met
65 70 75 80
Gln Glu Asn Arg Trp Asp Glu Glu Ser Ala Ser Phe Val Pro Val Glu
85 90 95
Thr Glu Ser Asp Pro Met Asn Val Thr Phe Asp Lys Leu Ala Pro Glu
100 105 110
Val Gln Asn Ala Val Met Val Lys Phe Asp Thr Cys Glu Asn Ile Thr
115 120 125
Val Asp Met Val Ile Ser Ala Gln Glu Leu Leu Gln Glu Asp Met Ala
130 135 140
Thr Phe Asp Gly His Ile Val Glu Ala Leu Met Lys Met Pro Glu Val
145 150 155 160
Asn Ala Met Tyr Pro Glu Leu Lys Leu His Ala Ile Gly Trp Val Lys
165 170 175
His Lys Cys Ile Pro Gly Ala Lys Trp Pro Glu Ile Gln Ala Glu Met
180 185 190
Arg Ile Trp Lys Lys Arg Arg Glu Gly Glu Arg Lys Glu Thr Gly Lys
195 200 205
Tyr Thr Ser Val Val Asp Leu Ala Arg Ala Arg Ala Asn Gln Gln Tyr
210 215 220
Thr Glu Asn Ser Thr Gly Lys Ile Ser Pro Val Ile Ala Ala Ile His
225 230 235 240
Arg Glu Tyr Lys Gln Thr Trp Lys Thr Leu Asp Asp Glu Leu Ala Tyr
245 250 255
Ala Leu Trp Pro Gly Asp Val Asp Ala Gly Asn Ile Asp Gly Ser Ile
260 265 270
His Arg Trp Ala Lys Lys Glu Val Ile Asp Asn Asp Arg Glu Asp Trp
275 280 285
Lys Arg Ile Ser Ala Ser Met Arg Lys Gln Pro Asp Ala Leu Arg Tyr
290 295 300
Asp Arg Gln Thr Ile Phe Gly Leu Val Arg Glu Arg Pro Ile Asp Ile
305 310 315 320
His Lys Asp Pro Ile Ala Leu Asn Lys Tyr Ile Cys Glu Tyr Leu Thr
325 330 335
Thr Lys Gly Val Phe Glu Asn Glu Glu Thr Asp Leu Gly Thr Val Asp
340 345 350
Val Leu Gln Ser Ser Glu Thr Gln Thr Asp Ala Val Glu Thr Glu Val
355 360 365
Ser Asp Ile Pro Lys Asn Glu Thr Ala Pro Glu Ala Glu Pro Ser Val
370 375 380
Glu Arg Glu Gly Pro Phe Tyr Phe Leu Phe Ala Asp Lys Asp Gly Glu
385 390 395 400
Lys Tyr Gly Arg Ala Asn Lys Leu Ser Gly Leu Asp Lys Ala Leu Ala
405 410 415
Ala Gly Ala Thr Glu Ile Thr Lys Glu Glu Tyr Phe Ala Arg Lys Asn
420 425 430
Gly Thr Tyr Thr Gly Leu Pro Gln Asn Val Asp Thr Ala Glu Asp Ser
435 440 445
Glu Gln Pro Glu Pro Ile Lys Val Thr Ala Asp Glu Val Asn Lys Ile
450 455 460
Met Gln Ala Ala Asn Ile Ser Gln Pro Asp Ala Asp Lys Leu Leu Ala
465 470 475 480
Ala Ser Arg Gly Glu Phe Val Glu Glu Ile Ser Asp Pro Asn Asp Pro
485 490 495
Lys Trp Val Lys Gly Ile Gln Thr Arg Asp Ser Val Asn Gln Asn Gln
500 505 510
His Glu Ser Glu Arg Asn Tyr Gln Lys Ala Glu Gln Asn Ser Thr Asn
515 520 525
Ala Leu Gln Asn Glu Pro Glu Thr Lys Gln Pro Glu Pro Val Ala Gln
530 535 540
Gln Glu Val Glu Lys Val Cys Thr Ala Cys Gly Gln Thr Gly Gly Gly
545 550 555 560
Asn Cys Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu
565 570 575
Thr Phe Asp Glu Glu Tyr Gln Val Glu Val Gln Glu Asp Asp Pro Glu
580 585 590
Glu Met Glu Gly Ala Glu His Pro His Lys Glu Asn Thr Gly Gly Asn
595 600 605
Gln His His Asn Ser Asp Asn Glu Thr Gly Glu Thr Ala Asp His Ser
610 615 620
Ile Lys Val Asn Gly His His Glu Ile Thr Ser Thr Ser Arg Ala Gly
625 630 635 640
Ile His Leu Met Ile Asp Leu Glu Thr Met Gly Lys Asn Pro Asp Ala
645 650 655
Pro Ile Ile Cys Asn Arg Leu Ile
660
<210> 143
<211> 300
<212>PRT
<213> 未知
<220>
<223>肠杆菌噬菌体T7
<400> 143
Met Ala Leu Leu Asp Leu Lys Gln Phe Tyr Glu Leu Arg Glu Gly Cys
1 5 10 15
Asp Asp Lys Gly Ile Leu Val Met Asp Gly Asp Trp Leu Val Phe Gln
20 25 30
Ala Met Ser Ala Ala Glu Phe Asp Ala Ser Trp Glu Glu Glu Ile Trp
35 40 45
His Arg Cys Cys Asp His Ala Lys Ala Arg Gln Ile Leu Glu Asp Ser
50 55 60
Ile Lys Ser Tyr Glu Thr Arg Lys Lys Ala Trp Ala Gly Ala Pro Ile
65 70 75 80
Val Leu Ala Phe Thr Asp Ser Val Asn Trp Arg Lys Glu Leu Val Asp
85 90 95
Pro Asn Tyr Lys Ala Asn Arg Lys Ala Val Lys Lys Pro Val Gly Tyr
100 105 110
Phe Glu Phe Leu Asp Ala Leu Phe Glu Arg Glu Glu Phe Tyr Cys Ile
115 120 125
Arg Glu Pro Met Leu Glu Gly Asp Asp Val Met Gly Val Ile Ala Ser
130 135 140
Asn Pro Ser Ala Phe Gly Ala Arg Lys Ala Val Ile Ile Ser Cys Asp
145 150 155 160
Lys Asp Phe Lys Thr Ile Pro Asn Cys Asp Phe Leu Trp Cys Thr Thr
165 170 175
Gly Asn Ile Leu Thr Gln Thr Glu Glu Ser Ala Asp Trp Trp His Leu
180 185 190
Phe Gln Thr Ile Lys Gly Asp Ile Thr Asp Gly Tyr Ser Gly Ile Ala
195 200 205
Gly Trp Gly Asp Thr Ala Glu Asp Phe Leu Asn Asn Pro Phe Ile Thr
210 215 220
Glu Pro Lys Thr Ser Val Leu Lys Ser Gly Lys Asn Lys Gly Gln Glu
225 230 235 240
Val Thr Lys Trp Val Lys Arg Asp Pro Glu Pro His Glu Thr Leu Trp
245 250 255
Asp Cys Ile Lys Ser Ile Gly Ala Lys Ala Gly Met Thr Glu Glu Asp
260 265 270
Ile Ile Lys Gln Gly Gln Met Ala Arg Ile Leu Arg Phe Asn Glu Tyr
275 280 285
Asn Phe Ile Asp Lys Glu Ile Tyr Leu Trp Arg Pro
290 295 300
<210> 144
<211> 267
<212>PRT
<213> 大肠杆菌
<400> 144
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro Ser
245 250 255
Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 145
<211> 236
<212>PRT
<213> 小家鼠
<400> 145
Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser
35 40 45
Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Thr Glu Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe
165 170 175
His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala
225 230 235
<210> 146
<211> 43
<212> DNA
<213> 未知
<220>
<223> 锤头核酶
<400> 146
aaattactga tgagtccgtg aggacgaaac gagtaagctc gtc 43
<210> 147
<211> 68
<212>DNA
<213> 未知
<220>
<223> 丁型肝炎病毒(HDV)核酶
<400> 147
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggac 68
<210> 148
<211> 14
<212>PRT
<213> 人工序列
<220>
<223> 氨基酸接头
<400> 148
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Ser
1 5 10
<210> 149
<211> 2243
<212>DNA
<213>番茄
<400> 149
atcgtatcca gtgcaccata ttttttggcg attaccactc atattattgt gtttagtaga 60
tattttaggt gcataattga tctcttcttt aaaactaggg gcacttatta ttatacatcc 120
acttgacact tgctttagtt ggctattttt tttatttttt attttttgtc aactacccca 180
atttaaattt tatttgatta agatattttt atggacctac tttataatta aaaatatttt 240
ctatttgaaa aggaaggaca aaaatcatac aattttggtc caactactcc tctctttttt 300
tttttggctt tataaaaaag gaaagtgatt agtaataaat aattaaataa tgaaaaaagg 360
aggaaataaa attttcgaat taaaatgtaa aagagaaaaa ggagagggag taatcattgt 420
ttaactttat ctaaagtacc ccaattcgat tttacatgta tatcaaatta tacaaatatt 480
ttattaaaat atagatattg aataatttta ttattcttga acatgtaaat aaaaattatc 540
tattatttca atttttatat aaactattat ttgaaatctc aattatgatt ttttaatatc 600
actttctatc catgataatt tcagcttaaa aagttttgtc aataattaca ttaattttgt 660
tgatgaggat gacaagattt cggtcatcaa ttacatatac acaaattgaa atagtaagca 720
acttgatttt ttttctcata atgataatga caaagacacg aaaagacaat tcaatattca 780
cattgattta tttttatatg ataataatta caataataat attcttataa agaaagagat 840
caattttgac tgatccaaaa atttatttat ttttactata ccaacgtcac taattatatc 900
taataatgta aaacaattca atcttactta aatattaatt tgaaataaac tatttttata 960
acgaaattac taaatttatc caataacaaa aaggtcttaa gaagacataa attctttttt 1020
tgtaatgctc aaataaattt gagtaaaaaa gaatgaaatt gagtgatttt tttttaatca 1080
taagaaaata aataattaat ttcaatataa taaaacagta atataatttc ataaatggaa 1140
ttcaatactt acctcttaga tataaaaaat aaatataaaa ataaagtgtt tctaataaac 1200
ccgcaattta aataaaatat ttaatatttt caatcaaatt taaataatta tattaaaata 1260
tcgtagaaaa agagcaatat ataatacaag aaagaagatt taagtacaat tatcaactat 1320
tattatactc taattttgtt atatttaatt tcttacggtt aaggtcatgt tcacgataaa 1380
ctcaaaatac gctgtatgag gacatatttt aaattttaac caataataaa actaagttat 1440
ttttagtata tttttttgtt taacgtgact taatttttct tttctagagg agcgtgtaag 1500
tgtcaacctc attctcctaa ttttcccaac cacataaaaa aaaaataaag gtagcttttg 1560
cgtgttgatt tggtacacta cacgtcatta ttacacgtgt tttcgtatga ttggttaatc 1620
catgaggcgg tttcctctag agtcggccat accatctata aaataaagct ttctgcagct 1680
cattttttca tcttctatct gatttctatt ataatttctc tgaattgcct tcaaatttct 1740
ctttcaaggt tagaattttt ctctattttt tggtttttgt ttgtttagat tctgagttta 1800
gttaatcagg tgctgttaaa gccctaaatt ttgagttttt ttcggttgtt ttgatggaaa 1860
atacctaaca attgagtttt ttcatgttgt tttgtcggag aatgcctaca attggagttc 1920
ctttcgttgt tttgatgaga aagcccctaa tttgagtgtt tttccgtcga tttgatttta 1980
aaggtttata ttcgagtttt tttcgtcggt ttaatgagaa ggcctaaaat aggagttttt 2040
ctggttgatt tgactaaaaa agccatggaa ttttgtgttt ttgatgtcgc tttggttctc 2100
aaggcctaag atctgagttt ctccggttgt tttgatgaaa aagccctaaa attggagttt 2160
ttatcttgtg ttttaggttg ttttaatcct tataatttga gttttttcgt tgttctgatt 2220
gttgttttta tgaatttcct gca 2243

Claims (172)

1.一种用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的方法,该方法包括:
向真核细胞提供基因组编辑分子和HDR促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;以及(ii)与该靶编辑位点具有同源性的供体模板DNA分子;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);
由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。
2.如权利要求1所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
3.如权利要求2所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
4.如权利要求1所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
5.如权利要求1所述的方法,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
6.如权利要求5所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
7.如权利要求5所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
8.如权利要求1所述的方法,其中该供体DNA分子在环状DNA载体、双生病毒复制子上提供或作为线性DNA片段提供。
9.如权利要求1所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列的拷贝。
10.如权利要求1所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻前间隔子相邻基序(PAM)序列的序列。
11.如权利要求1所述的方法,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
12.如权利要求1所述的方法,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
13.如权利要求1所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
14.如权利要求13所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白、具有等效SSAP活性的相关蛋白或与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
15.如权利要求13所述的方法,其中该ERF家族蛋白包含噬菌体P22ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
16.如权利要求13所述的方法,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
17.如权利要求1所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
18.如权利要求1所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
19.如权利要求1所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
20.如权利要求1所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
21.如权利要求1所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、核酸外切酶III、Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ ID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
22.如权利要求5所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
23.如权利要求1所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
24.如权利要求1所述的方法,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
25.如权利要求1所述的方法,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
26.如权利要求1所述的方法,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
27.如权利要求1所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,HDR的频率增加至少2倍。
28.如权利要求1所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
29.如权利要求1所述的方法,其中该SSAP、该核酸外切酶和/或该SSB蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
30.如权利要求1所述的方法,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
31.如权利要求1至30中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
32.如权利要求31所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
33.如权利要求32所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
34.如权利要求31所述的方法,其中该细胞是植物细胞并且该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
35.如权利要求31所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
36.一种用于增加真核细胞基因组的靶编辑位点的同源定向修复(HDR)介导的基因组修饰的系统,该系统包含:
(a)真核细胞;
(b)HDR促进剂,其包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);以及
(c)一种或多种基因组编辑分子,其包含至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与该靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;
其中该真核细胞与以下相关联、与以下接触和/或含有以下:有效量的这些HDR促进剂和该一种或多种基因组编辑分子。
37.如权利要求36所述的系统,其中这些基因组编辑分子和/或序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
38.如权利要求37所述的系统,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
39.如权利要求36所述的系统,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
40.如权利要求36所述的系统,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
41.如权利要求40所述的系统,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
42.如权利要求40所述的系统,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
43.如权利要求36所述的系统,其中该供体DNA分子提供于质粒或双生病毒基因组上。
44.如权利要求36所述的系统,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
45.如权利要求36所述的系统,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻该PAM序列的序列。
46.如权利要求36所述的系统,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
47.如权利要求36所述的系统,由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加至少2倍的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰。
48.如权利要求36所述的系统,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
49.如权利要求36所述的系统,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
50.如权利要求49所述的系统,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
51.如权利要求49所述的系统,其中该RecT/Redβ家族蛋白包含噬菌体λβ蛋白、噬菌体SPP1 35蛋白、Rac细菌原噬菌体RecT蛋白或具有等效SSAP活性的相关蛋白。
52.如权利要求49所述的系统,其中该RecT/Redβ家族蛋白包含与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
53.如权利要求49所述的系统,其中该ERF家族蛋白包含噬菌体P22ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
54.如权利要求49所述的系统,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
55.如权利要求36所述的系统,其中线性dsDNA分子是该核酸外切酶的优选底物。
56.如权利要求36所述的系统,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
57.如权利要求36所述的系统,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
58.如权利要求36所述的系统,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
59.如权利要求36所述的系统,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ IDNO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
60.如权利要求40所述的系统,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
61.如权利要求36所述的系统,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
62.如权利要求36所述的系统,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
63.如权利要求62所述的系统,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
64.如权利要求36所述的系统,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
65.如权利要求36所述的系统,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照系统相比,HDR的频率增加至少2倍。
66.如权利要求36所述的系统,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照系统相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
67.如权利要求36所述的系统,其中该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
68.如权利要求36所述的系统,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
69.如权利要求36至68中任一项所述的系统,其中该真核细胞是哺乳动物细胞或植物细胞。
70.如权利要求69所述的系统,其中该植物细胞是单倍体、二倍体或多倍体。
71.如权利要求69所述的系统,其中该植物细胞在培养基中、植物中或植物组织中。
72.如权利要求69所述的系统,其中该细胞是植物细胞并且该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
73.如权利要求69所述的系统,其中该系统提供分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物,并且其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
74.一种制备具有基因组修饰的真核细胞的方法,该方法包括:
(a)向真核细胞提供基因组编辑分子和同源定向修复(HDR)促进剂,其中这些基因组编辑分子包含:(i)至少一种序列特异性核酸内切酶或至少一种编码该序列特异性核酸内切酶的多核苷酸以及与靶编辑位点具有同源性的供体模板DNA分子,该至少一种序列特异性核酸内切酶在该靶编辑位点切割DNA序列;并且其中这些HDR促进剂包含单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和单链DNA结合蛋白(SSB);由此这些基因组编辑分子和这些HDR促进剂通过HDR以与对照相比增加的频率提供该供体模板多核苷酸对该真核细胞基因组的该靶编辑位点的修饰;以及
(b)分离或繁殖包含该基因组修饰的真核细胞,从而制备该具有基因组修饰的真核细胞。
75.如权利要求74所述的方法,其中这些基因组编辑分子和/或序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
76.如权利要求75所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶或工程改造的核酸酶。
77.如权利要求74所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
78.如权利要求74所述的方法,其中这些基因组编辑分子包含一种或多种序列特异性核酸内切酶或序列特异性核酸内切酶和指导RNA,其在该靶编辑位点的两个不同DNA序列处切割单DNA链。
79.如权利要求78所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、Cas12i、锌指切口酶、TALE切口酶或其组合。
80.如权利要求78所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
81.如权利要求74所述的方法,其中该供体DNA分子提供于质粒或双生病毒基因组中。
82.如权利要求74所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
83.如权利要求74所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶,并且该靶编辑位点包含PAM序列和与该指导RNA互补并紧邻该PAM序列的序列。
84.如权利要求74所述的方法,其中该序列特异性核酸内切酶在切割后在该靶编辑位点提供5’突出端。
85.如权利要求74所述的方法,其中该SSAP提供同源DNA分子的互补DNA链的DNA链交换和碱基配对。
86.如权利要求74所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
87.如权利要求86所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
88.如权利要求86所述的方法,其中该RecT/Redβ家族蛋白包含与SEQ ID NO:1、2或3具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
89.如权利要求86所述的方法,其中该ERF家族蛋白包含噬菌体P22ERF蛋白、功能相关蛋白或与SEQ ID NO:4具有至少70%、75%、80%、85%、90%、95%、或99%序列同一性的蛋白。
90.如权利要求86所述的方法,其中该RAD52家族蛋白包含酿酒酵母Rad52蛋白、粟酒裂殖酵母Rad22蛋白、乳酸克鲁维酵母Rad52蛋白、功能相关蛋白、或与SEQ ID NO:5、6或7具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
91.如权利要求74所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
92.如权利要求74所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
93.如权利要求74所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
94.如权利要求74所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
95.如权利要求74所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQ IDNO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
96.如权利要求78所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
97.如权利要求74所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
98.如权利要求74所述的方法,其中该单链DNA结合蛋白(SSB)是细菌SSB或任选地肠杆菌科物种SSB。
99.如权利要求98所述的方法,其中该SSB是埃希氏菌属物种、志贺氏菌属物种、肠杆菌属物种、克雷伯氏菌属物种、沙雷氏菌属物种、泛菌属物种或耶尔森氏菌属物种SSB。
100.如权利要求74所述的方法,其中该SSB包含与SEQ ID NO:31、34-131或132具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
101.如权利要求74所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,HDR的频率增加至少2倍。
102.如权利要求74所述的方法,其中与其中对照真核细胞具有这些基因组编辑分子但未暴露于至少一种所述HDR促进剂的对照方法相比,非同源末端连接(NHEJ)的频率保持或降低至少2倍。
103.如权利要求74所述的方法,其中该SSAP、该核酸外切酶和/或该单链DNA结合蛋白进一步包含可操作地连接的核定位信号(NLS)和/或细胞穿透肽(CPP)。
104.如权利要求74所述的系统,其中该SSAP、该核酸外切酶和/或该SSB作为包含插入该SSAP、该核酸外切酶和/或该SSB之间的蛋白酶识别位点或自加工蛋白序列的多聚蛋白提供给该细胞。
105.如权利要求74至104中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
106.如权利要求105所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
107.如权利要求105所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
108.如权利要求105所述的方法,其中该SSAP、该核酸外切酶和/或该SSB进一步包含选自由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15和SEQ ID NO:16组成的组的可操作地连接的核定位信号(NLS)。
109.如权利要求105所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
110.如权利要求1-30中任一项所述的方法、如权利要求36-68中任一项所述的系统、或如权利要求74-104中任一项所述的方法,其中这些HDR促进剂、基因组编辑分子和真核细胞或包含该基因组修饰的真核细胞以包含多个容器、隔室或位置的阵列提供,并且其中每个容器、隔室或位置包括这些HDR促进剂,基因组编辑分子和真核细胞或包含该基因组修饰的真核细胞。
111.一种真核细胞的基因工程改造方法,该方法包括向该真核细胞提供:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),
其中该细胞的该靶编辑位点被该供体模板DNA分子修饰。
112.如权利要求111所述的方法,其中该序列特异性核酸内切酶包含RNA指导的核酸酶或编码RNA指导的核酸酶的多核苷酸和指导RNA或编码指导RNA的多核苷酸。
113.如权利要求112所述的方法,其中该RNA指导的核酸酶包含RNA指导的DNA核酸内切酶、II型Cas核酸酶、Cas9核酸酶、V型Cas核酸酶、Cas12a核酸酶、Cas12b核酸酶、Cas12c核酸酶、CasY核酸酶、CasX核酸酶、Cas12i、Cas14或工程改造的核酸酶。
114.如权利要求111所述的方法,其中该序列特异性核酸内切酶包含锌指核酸酶(ZFN)、转录激活子样效应子核酸酶(TAL-效应子核酸酶)、Argonaute、大范围核酸酶或工程改造的大范围核酸酶。
115.如权利要求111所述的方法,该方法进一步包括指导RNA,其中这些序列特异性核酸内切酶和指导RNA在该靶编辑位点的两个不同DNA序列处切割单DNA链。
116.如权利要求115所述的方法,其中这些序列特异性核酸内切酶包含至少一种Cas9切口酶、Cas12a切口酶、锌指切口酶、TALE切口酶或其组合,其中该序列特异性核酸内切酶对该靶编辑位点中的核酸内切酶识别序列具有特异性。
117.如权利要求115所述的方法,其中这些序列特异性核酸内切酶包含Cas9和/或Cas12a,并且这些指导RNA分子与该靶编辑位点中的DNA序列具有至少一个碱基错配。
118.如权利要求111所述的方法,其中该供体DNA分子提供于质粒或双生病毒基因组中。
119.如权利要求111所述的方法,其中该供体DNA分子的侧翼是核酸内切酶识别序列。
120.如权利要求111所述的方法,其中该SSAP包含RecT/Redβ家族蛋白、ERF家族蛋白或RAD52家族蛋白。
121.如权利要求120所述的方法,其中该RecT/Redβ家族蛋白包含Rac细菌原噬菌体RecT蛋白、噬菌体λβ蛋白、噬菌体SPP1 35蛋白或具有等效SSAP活性的相关蛋白。
122.如权利要求111所述的方法,其中线性dsDNA分子是该核酸外切酶的优选底物。
123.如权利要求111所述的方法,其中包含磷酸化5’末端的线性dsDNA分子是该核酸外切酶的优选底物。
124.如权利要求111所述的方法,其中该核酸外切酶具有5’到3’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
125.如权利要求111所述的方法,其中该核酸外切酶具有3’到5’核酸外切酶活性并且可以识别平末端dsDNA底物、在一条链中具有内部断裂的dsDNA底物、具有5’突出端的dsDNA底物和/或具有3’突出端的dsDNA底物。
126.如权利要求111所述的方法,其中该核酸外切酶包含噬菌体λexo蛋白、Rac原噬菌体RecE核酸外切酶、阿耳特弥斯蛋白、阿波罗蛋白、DNA2核酸外切酶、Exo1核酸外切酶、疱疹病毒SOX蛋白、UL12核酸外切酶、肠细菌核酸外切酶VIII、T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、哺乳动物Trex2核酸外切酶、具有等效核酸外切酶活性的相关蛋白,或与SEQID NO:8、9、136、137、138、139、140、141、142、143、144或145具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
127.如权利要求111所述的方法,其中该核酸外切酶包含T7噬菌体核酸外切酶、大肠杆菌核酸外切酶III、具有等效核酸外切酶活性的相关蛋白、或与SEQ ID NO:143或144具有至少70%、75%、80%、85%、90%、95%或99%序列同一性的蛋白。
128.如权利要求111所述的方法,其中该单链DNA结合蛋白(SSB)和该SSAP获得自相同宿主生物体。
129.如权利要求111至128中任一项所述的方法,其中该真核细胞是哺乳动物细胞或植物细胞。
130.如权利要求129所述的方法,其中该植物细胞是单倍体、二倍体或多倍体。
131.如权利要求130所述的方法,其中该植物细胞在培养基中、植物中或植物组织中。
132.如权利要求131所述的方法,该方法进一步包括分离和/或生长从包含该基因组修饰的植物细胞获得的植物细胞、繁殖体或植物的步骤,其中该植物细胞、繁殖体或植物的基因组包含该基因组修饰。
133.如权利要求111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种在一个或多个载体中提供。
134.如权利要求133所述的方法,其中该载体是农杆菌载体。
135.如权利要求111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种在染色体中提供。
136.如权利要求111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种通过引入多肽、DNA、mRNA和/或有性杂交来提供。
137.如权利要求111-132中任一项所述的方法,其中该i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的该供体模板DNA分子,iii)该单链DNA退火蛋白(SSAP),iv)该核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)该单链DNA结合蛋白(SSB)中的一种或多种由包含i)-v)中的一种或多种的祖细胞提供,
其中该祖细胞不包含i)-v)中的至少一种,
其中该祖细胞不包含的i)-v)中的该至少一种随后通过递送多肽、DNA、或mRNA至该祖细胞和/或该祖细胞的有性杂交来提供。
138.如权利要求111-138中任一项所述的方法,该方法进一步包括检测该修饰。
139.如权利要求139所述的方法,其中检测该修饰包括扩增子测序。
140.如权利要求111-140中任一项所述的方法,其中该靶编辑位点位于蛋白编码序列或启动子中。
141.如权利要求111-141中任一项所述的方法,其中该靶编辑位点的该修饰是插入、缺失或取代。
142.如权利要求111-142中任一项所述的方法,其中该靶编辑位点是编码重要农艺性状的基因或涉及哺乳动物疾病的基因。
143.一种用于产生具有经基因修饰的靶编辑位点的真核细胞的方法,该方法包括:
(a)提供至少一种序列特异性核酸内切酶或编码所述至少一种序列特异性核酸内切酶的至少一种多核苷酸,该至少一种序列特异性核酸内切酶切割所述靶编辑位点中的至少一种核酸内切酶识别序列的DNA序列,以及
(b)提供至少一种包含至少一种双链DNA序列的供体分子,其中(i)所述DNA序列在至少50个核苷酸的长度上与该靶编辑位点侧翼的序列具有至少90%的同源性和(ii)其中与所述靶编辑位点相比,所述供体序列包含至少一个修饰;以及
(c)提供至少一种同源定向修复(HDR)促进剂,其包含
(i)至少一种单链DNA退火蛋白(SSAP),和
(ii)至少一种核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,和
(iii)至少一种单链DNA结合蛋白(SSB);
并且由此该至少一种序列特异性核酸内切酶、该至少一种供体分子和该至少一种HDR促进剂将所述修饰引入所述真核细胞的所述靶编辑位点;以及
(d)分离在所述靶编辑位点中包含修饰的真核细胞。
144.如权利要求144所述的方法,其中该修饰选自由以下组成的组:一个或多个核苷酸的插入、一个或多个核苷酸的缺失或一个或多个核苷酸的取代。
145.如权利要求144所述的方法,其中该靶编辑位点的一部分通过在所述靶编辑位点中使用两个序列特异性切割来缺失,并由该供体分子提供的序列替换。
146.如权利要求144-146中任一项所述的方法,其中所述供体序列在载体中侧翼为核酸内切酶识别序列。
147.如权利要求144-147中任一项所述的方法,该方法进一步包括繁殖包含该修饰的该真核细胞。
148.一种产生经基因修饰的生物体的方法,该方法包括以下步骤
(i)通过如权利要求144-148中任一项所述产生经基因修饰的真核细胞,以及
(ii)将所述细胞再生为生物体。
149.如权利要求149所述的生物体,其中该生物体选自由以下组成的组:植物和非人动物。
150.一种组合物,该组合物包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
151.如权利要求151所述的组合物,其中这些核酸位于一个或多个载体中。
152.一种载体,该载体包含编码以下中的一种或多种的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
153.如权利要求153所述的载体,其中该载体包含该供体模板DNA、该序列特异性核酸内切酶和该编码指导RNA的多核苷酸。
154.如153所述的载体,其中该载体包含该单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和该单链DNA结合蛋白(SSB)。
155.如153所述的载体,其中该载体包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
156.一种试剂盒,该试剂盒包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB);以及用于对真核细胞进行基因工程改造的使用说明书。
157.如权利要求157所述的试剂盒,其中该试剂盒包含第一载体和第二载体,其中
i)该第一载体包含含有该供体模板DNA和该序列特异性核酸内切酶的核酸,其中该序列特异性核酸内切酶包含编码RNA指导的核酸酶的多核苷酸和编码指导RNA的多核苷酸;以及
ii)该第二载体包含该单链DNA退火蛋白(SSAP)、能至少部分地将双链DNA底物转化为单链DNA产物的核酸外切酶和该单链DNA结合蛋白(SSB)。
158.如权利要求157-158中任一项所述的试剂盒,该试剂盒进一步包含用于检测经基因工程改造的细胞的试剂。
159.一种细胞,该细胞包含i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
160.一种细胞,该细胞包含编码以下的核酸:i)至少一种序列特异性核酸内切酶,ii)与真核细胞中的靶编辑位点具有同源性的供体模板DNA分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB)。
161.如权利要求160或161所述的细胞,其中该细胞是植物或哺乳动物细胞。
162.如权利要求160-162中任一项所述的细胞,其中该细胞是宿主细胞。
163.一种经基因工程改造的细胞,其通过如权利要求1-35或74-149中任一项所述的方法产生。
164.一种用于在靶编辑位点进行基因工程改造的祖真核细胞或祖生物体,该祖真核细胞或祖生物体包含以下的子集:i)至少一种序列特异性核酸内切酶,ii)与该真核细胞中的靶编辑位点具有同源性的供体模板分子,iii)单链DNA退火蛋白(SSAP),iv)核酸外切酶,其能至少部分地将双链DNA底物转化为单链DNA产物,以及v)单链DNA结合蛋白(SSB),其中该细胞不包含i)-v)中的至少一种,其中向该细胞或生物体提供不包含在该祖细胞或祖生物体中的i)-v)中的该至少一种导致该供体模板分子对该靶编辑位点的修饰。
165.如权利要求165所述的祖真核细胞或祖生物体,其中该供体模板是双链DNA分子。
166.如权利要求165所述的祖细胞,其中该细胞是种系细胞。
167.如权利要求165所述的祖真核细胞或祖生物体,其中该祖真核细胞是祖植物细胞,并且该祖植物细胞或植物不包含的i)-v)中的至少一种通过转化来提供。
168.如权利要求165所述的祖生物体,其中该生物体是植物,并且其中祖植物不包含的i)-v)中的至少一种通过与包含该祖植物不包含的i)-v)中的至少一种的第二植物的有性杂交来提供。
169.如权利要求165所述的祖真核细胞,其中该祖真核细胞是动物细胞,并且其中祖细胞不包含的i)-v)中的至少一种通过转染来提供。
170.如权利要求165所述的祖生物体,其中该祖生物体是非人动物,并且该非人动物不包含的i)-v)中的至少一种通过与包含该非人动物不包含的i)-v)中的至少一种的非人动物的有性杂交来提供。
171.如权利要求153所述的载体,其中该序列特异性核酸酶与诱导型启动子可操作地连接。
172.如权利要求111所述的方法,其中该序列特异性核酸内切酶是切口酶。
CN202080044833.1A 2019-06-25 2020-06-24 改善的同源依赖修复基因组编辑 Pending CN114630910A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962866317P 2019-06-25 2019-06-25
US62/866,317 2019-06-25
PCT/US2020/039410 WO2020264016A1 (en) 2019-06-25 2020-06-24 Improved homology dependent repair genome editing

Publications (1)

Publication Number Publication Date
CN114630910A true CN114630910A (zh) 2022-06-14

Family

ID=71579688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080044833.1A Pending CN114630910A (zh) 2019-06-25 2020-06-24 改善的同源依赖修复基因组编辑

Country Status (13)

Country Link
US (2) US11041172B2 (zh)
EP (1) EP3990633A1 (zh)
JP (1) JP2022539338A (zh)
KR (1) KR20220052905A (zh)
CN (1) CN114630910A (zh)
AR (1) AR123323A1 (zh)
AU (1) AU2020301236A1 (zh)
BR (1) BR112021026220A2 (zh)
CA (1) CA3138663A1 (zh)
IL (1) IL289106A (zh)
MX (1) MX2021014861A (zh)
SG (1) SG11202112092TA (zh)
WO (1) WO2020264016A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109666693A (zh) * 2018-12-29 2019-04-23 北京市农林科学院 Mg132在碱基编辑系统编辑受体基因组中的应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3545096A4 (en) * 2016-12-21 2020-07-01 Hsu, Ethan COMPOSITION FOR EDITING A NUCLEIC ACID SEQUENCE AND METHOD FOR USE THEREOF
US20240011042A1 (en) * 2020-07-31 2024-01-11 Inari Agriculture Technology, Inc. Excisable plant transgenic loci with signature protospacer adjacent motifs or signature guide rna recognition sites
US11242534B1 (en) 2020-07-31 2022-02-08 Inari Agriculture Technology, Inc. INHT31 transgenic soybean
WO2023122625A2 (en) * 2021-12-20 2023-06-29 Intergalactic Therapeutics, Inc. Production of gene therapy vector in engineered bacteria
WO2023156585A1 (en) * 2022-02-18 2023-08-24 Pulmobiotics, S.L. Systems, tools, and methods for engineering bacteria
WO2023165613A1 (zh) * 2022-03-03 2023-09-07 清华大学 5'→3'核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法
CN115960733B (zh) * 2022-09-19 2023-11-24 苏州泓迅生物科技股份有限公司 一种用于大片段dna组装的基因工程酵母菌、构建方法及其应用
CN115976086B (zh) * 2023-01-19 2023-08-08 河南农业大学 一种细菌CRISPR-Cas9基因编辑的方法和应用
CN116555346B (zh) * 2023-07-05 2023-09-01 中山大学 一种采用碳纳米管基因载体递送系统促进草鱼生长的方法
CN117487959B (zh) * 2024-01-02 2024-03-22 东北农业大学 一种与印度南瓜侧枝数量相关基因连锁的分子标记及应用

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US39247A (en) 1863-07-14 Improvement in skates
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
US5310667A (en) 1989-07-17 1994-05-10 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
ES2171391T3 (es) 1990-04-26 2002-09-16 Aventis Cropscience Nv Nueva cepa de bacillus thuringiensis y su gen de codificado de toxina insecticida.
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5277905A (en) 1991-01-16 1994-01-11 Mycogen Corporation Coleopteran-active bacillus thuringiensis isolate
KR100241117B1 (ko) 1991-08-02 2000-02-01 코헤이 미쯔이 신규한 미생물 및 살충제
WO1994012014A1 (en) 1992-11-20 1994-06-09 Agracetus, Inc. Transgenic cotton plants producing heterologous bioplastic
DE69428290T2 (de) 1993-01-13 2002-04-18 Pioneer Hi Bred Int Derivate von alpha-hordothionin mit höherem behalt an lysin
SK282153B6 (sk) 1994-02-04 2001-11-06 Basf Aktiengesellschaft Deriváty kyseliny fenyloctovej, spôsob a medziprodukty ich výroby, ich použitie a prostriedok proti živočíšnym škodcom alebo škodlivým hubám s ich obsahom
US5593881A (en) 1994-05-06 1997-01-14 Mycogen Corporation Bacillus thuringiensis delta-endotoxin
US5792931A (en) 1994-08-12 1998-08-11 Pioneer Hi-Bred International, Inc. Fumonisin detoxification compositions and methods
US5736514A (en) 1994-10-14 1998-04-07 Nissan Chemical Industries, Ltd. Bacillus strain and harmful organism controlling agents
PL323641A1 (en) 1995-06-02 1998-04-14 Pioneer Hi Bred Int Derivatives of alpha-hordothionine of high threonine content
AR004938A1 (es) 1995-06-02 1999-04-07 Pioneer Hi Bred Internacional Inc Proteina derivada de alfa-hordotionina de alto contenido en metionina, secuencias de nucleotidos, arn y adn, cassete de expresion, vector detransformacion bacteriana, celulas bacterianas y vegetales transformadas, celula o cultivo de tejidos de maiz y metodo para potenciar el contenido de
US5703049A (en) 1996-02-29 1997-12-30 Pioneer Hi-Bred Int'l, Inc. High methionine derivatives of α-hordothionin for pathogen-control
US5850016A (en) 1996-03-20 1998-12-15 Pioneer Hi-Bred International, Inc. Alteration of amino acid compositions in seeds
HUP0000810A3 (en) 1996-11-01 2002-02-28 Pioneer Hi Bred Int Proteins with enhanced levels of essential amino acids
JP4309051B2 (ja) 1998-03-02 2009-08-05 マサチューセッツ インスティテュート オブ テクノロジー 改善したリンカーを有するポリジンクフィンガータンパク質
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
ES2262514T3 (es) 1999-04-29 2006-12-01 Syngenta Limited Plantas resistentes a herbicidas.
US20020192813A1 (en) 1999-08-18 2002-12-19 Timothy W. Conner Plant expression vectors
US6683231B2 (en) 2000-06-02 2004-01-27 E. I. Du Pont De Nemours And Company High level production of p-hydroxybenzoic acid in green plants
CN100558897C (zh) 2000-09-29 2009-11-11 辛根塔有限公司 抗除草剂植物
US7151204B2 (en) 2001-01-09 2006-12-19 Monsanto Technology Llc Maize chloroplast aldolase promoter compositions and methods for use thereof
US7045684B1 (en) 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
CN101522902B (zh) 2006-08-11 2015-08-26 孟山都技术有限公司 通过邻氨基苯甲酸合酶的叶绿体靶向表达产生高色氨酸玉蜀黍
EP2300617B1 (en) 2008-07-16 2016-03-23 Monsanto Technology LLC Methods and vectors for producing transgenic plants
DK2417262T3 (da) 2009-04-07 2015-06-22 Dow Agrosciences Llc Nanopartikelmedieret tilførsel af sekvensspecifikke nukleaser
MX2012003981A (es) 2009-10-06 2012-06-12 Univ California Generacion de plantas haploides y cruza de plantas mejorada.
IN2012DN02333A (zh) 2009-10-16 2015-08-21 Dow Agrosciences Llc
CN102933073B (zh) 2010-03-31 2015-11-25 陶氏益农公司 用于将生物分子递送入植物细胞中的植物肽gamma-玉米醇溶蛋白
GB201009732D0 (en) 2010-06-10 2010-07-21 Gene Bridges Gmbh Direct cloning
BR112013000434A2 (pt) 2010-07-07 2016-05-17 Dow Agrosciences Llc entrega de molécula de dna linear usando pontos quânticos pegilados para transformação estável em plantas.
JP6067671B2 (ja) 2011-03-23 2017-01-25 ダウ アグロサイエンシィズ エルエルシー 植物におけるイメージングおよび送達適用に適した量子ドット担体ペプチドコンジュゲート体
US9464124B2 (en) 2011-09-12 2016-10-11 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
ES2764105T3 (es) 2011-10-17 2020-06-02 Massachusetts Inst Technology Administración intracelular
US20130145488A1 (en) 2011-12-06 2013-06-06 Iowa State University Research Foundation, Inc. Mesoporous silica nanoparticles suitable for co-delivery
US20130185823A1 (en) 2012-01-16 2013-07-18 Academia Sinica Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
US20140096284A1 (en) 2012-10-01 2014-04-03 Iowa State University Research Foundation, Inc. Method for the delivery of molecules lyophilized onto microparticles to plant tissues
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP4279588A3 (en) 2012-12-12 2024-01-17 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
SG10201912327SA (en) 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
EP2951295B1 (en) 2013-02-01 2018-08-01 Cellectis Tevi chimeric endonucleases and their preferential cleavage sites
US9677082B2 (en) 2013-03-15 2017-06-13 Syngenta Participations Ag Haploid induction compositions and methods for use therefor
US9902973B2 (en) 2013-04-11 2018-02-27 Caribou Biosciences, Inc. Methods of modifying a target nucleic acid with an argonaute
US20150040268A1 (en) 2013-04-25 2015-02-05 Morflora Israel Ltd Methods and compositions for the delivery of nucleic acids to seeds
US20140356414A1 (en) 2013-06-03 2014-12-04 University Of Southern California Targeted Crosslinked Multilamellar Liposomes
AU2014279694B2 (en) 2013-06-14 2020-07-23 Cellectis Methods for non-transgenic genome editing in plants
ES2915377T3 (es) 2013-08-02 2022-06-22 Enevolv Inc Procedimientos y células huésped para ingeniería genómica, de vías y biomolécular
US11208628B2 (en) 2013-08-09 2021-12-28 Massachusetts Institute Of Technology Nanobionic engineering of organelles and photosynthetic organisms
MX2016002118A (es) 2013-08-22 2016-06-28 Du Pont Modificacion del genoma de plantas por medio del uso de sistemas de ácido ribonucléico (arn) guía/ endonucleasa cas y metodos de uso.
US9675078B2 (en) 2013-10-15 2017-06-13 Board Of Trustees Of The University Of Arkansas Method of delivery of bio-active agents to plant cells by using nano-sized materials as carriers
WO2015131101A1 (en) 2014-02-27 2015-09-03 Monsanto Technology Llc Compositions and methods for site directed genomic modification
PT3155099T (pt) 2014-06-23 2018-04-20 Regeneron Pharma Montagem de dna mediada por nuclease
AU2015288157A1 (en) 2014-07-11 2017-01-19 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
WO2016025759A1 (en) 2014-08-14 2016-02-18 Shen Yuelei Dna knock-in system
WO2016054326A1 (en) 2014-10-01 2016-04-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
US11680268B2 (en) * 2014-11-07 2023-06-20 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
US11330776B2 (en) 2015-10-30 2022-05-17 Pioneer Hi-Bred International, Inc. Methods and compositions for rapid plant transformation
US20170175140A1 (en) 2015-12-16 2017-06-22 Regents Of The University Of Minnesota Methods for using a 5'-exonuclease to increase homologous recombination in eukaryotic cells
US20210332350A1 (en) 2016-02-04 2021-10-28 President And Fellows Of Harvard College Recombinase Genome Editing
WO2018067846A1 (en) 2016-10-05 2018-04-12 President And Fellows Of Harvard College Methods of crispr mediated genome modulation in v. natriegens
WO2018085693A1 (en) 2016-11-04 2018-05-11 Inari Agriculture, Inc. Novel plant cells, plants, and seeds
CN108085328B (zh) * 2016-11-21 2021-06-22 中国科学院分子植物科学卓越创新中心 一种dna序列编辑的方法
CA3085914A1 (en) 2017-12-22 2019-06-27 G+Flas Life Sciences Chimeric genome engineering molecules and methods
WO2020003311A1 (en) 2018-06-25 2020-01-02 Yeda Research And Development Co. Ltd. Systems and methods for increasing efficiency of genome editing
WO2020041172A1 (en) 2018-08-21 2020-02-27 The Jackson Laboratory Methods and compositions for recruiting dna repair proteins

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109666693A (zh) * 2018-12-29 2019-04-23 北京市农林科学院 Mg132在碱基编辑系统编辑受体基因组中的应用
CN109666693B (zh) * 2018-12-29 2022-08-16 北京市农林科学院 Mg132在碱基编辑系统编辑受体基因组中的应用

Also Published As

Publication number Publication date
WO2020264016A1 (en) 2020-12-30
EP3990633A1 (en) 2022-05-04
US20210277422A1 (en) 2021-09-09
AU2020301236A1 (en) 2021-11-25
JP2022539338A (ja) 2022-09-08
BR112021026220A2 (pt) 2022-02-15
MX2021014861A (es) 2022-06-22
US11041172B2 (en) 2021-06-22
SG11202112092TA (en) 2021-11-29
KR20220052905A (ko) 2022-04-28
AR123323A1 (es) 2022-11-23
US20200407754A1 (en) 2020-12-31
CA3138663A1 (en) 2020-12-30
IL289106A (en) 2022-02-01

Similar Documents

Publication Publication Date Title
US11041172B2 (en) Homology dependent repair genome editing
US20230242927A1 (en) Novel plant cells, plants, and seeds
AU2017355507B2 (en) Novel plant cells, plants, and seeds
US11634722B2 (en) Plant gene editing systems, methods, and compositions
EP3036333B1 (en) Methods for producing genetic modifications in a plant genome without incorporating a selectable transgene marker, and compositions thereof
US11220694B1 (en) Rice cells and rice plants
US20230235349A1 (en) Novel maize cells and maize plants
WO2018187347A1 (en) Compositions and methods for transferring cytoplasmic or nuclear traits or components
US11976291B2 (en) Genetically enhanced maize plants
WO2019150200A2 (en) Dna free crispr plant transformation
US11319547B1 (en) Plant transformation
US11802288B1 (en) Methods for efficient soybean genome editing
US11859219B1 (en) Methods of altering a target nucleotide sequence with an RNA-guided nuclease and a single guide RNA
WO2023244269A1 (en) Genetically enhanced maize plants
WO2021016043A1 (en) Improved homology dependent repair genome editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination