CN111886336A - Casz组合物和使用方法 - Google Patents

Casz组合物和使用方法 Download PDF

Info

Publication number
CN111886336A
CN111886336A CN201880084919.XA CN201880084919A CN111886336A CN 111886336 A CN111886336 A CN 111886336A CN 201880084919 A CN201880084919 A CN 201880084919A CN 111886336 A CN111886336 A CN 111886336A
Authority
CN
China
Prior art keywords
casz
sequence
protein
nucleic acid
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880084919.XA
Other languages
English (en)
Inventor
J·A·都纳
D·博尔斯泰因
J·S·陈
L·B·哈灵顿
D·帕埃斯-艾斯皮诺
J·F·班菲尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Priority to CN202310721532.3A priority Critical patent/CN117487776A/zh
Publication of CN111886336A publication Critical patent/CN111886336A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码所述CasZ蛋白的核酸和/或包含所述CasZ蛋白(和/或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与所述CasZ蛋白结合并提供针对所述CasZ蛋白的序列特异性的CasZ指导RNA、编码所述CasZ指导RNA的核酸和/或包含所述CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)、编码所述CasZ trancRNA的核酸和/或包含所述CasZ trancRNA(和/或编码所述CasZ trancRNA的核酸)的修饰的宿主细胞。

Description

CASZ组合物和使用方法
交叉引用
本申请要求2017年11月1日提交的美国临时专利申请号 62/580,395的权益,所述申请以引用方式整体并入本文。
以引用方式并入以文本文件提供的序列表
特此提供呈文本文件“BERK-374WO_SEQ_LISTING_ST25.txt”的序列表,所述序列表于2018年10月30日创建并且大小为536KB。文本文件的内容以引用方式整体并入本文。
引言
CRISPR-Cas系统是DNA测序时代之前科学界未知的路径的一个实例,现已被认为赋予细菌和古细菌对噬菌体和病毒的获得性免疫力。深入研究已揭示了此系统的生物化学性。CRISPR-Cas系统由Cas 蛋白和CRISPR阵列组成,所述Cas蛋白参与外源DNA或RNA的获取、靶向和切割,所述CRISPR阵列包括将Cas蛋白引导至其靶标的侧接短间隔序列的正向重复序列。2类CRISPR-Cas是精简型式,其中与RNA结合的单个Cas蛋白负责结合和切割靶向序列。这些最小系统的可编程性质有利于它们用作一种多功能技术,这种技术正在彻底变革基因组操纵领域。
发明内容
本公开提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码CasZ蛋白的核酸和/或包含CasZ蛋白(和 /或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性的CasZ指导RNA、编码CasZ 指导RNA的核酸和/或包含CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码 RNA(trancRNA)(在本文中称为“CasZtrancRNA”)、编码CasZ trancRNA的核酸和/或包含CasZ trancRNA(和/或编码所述CasZtrancRNA的核酸)的修饰的宿主细胞。
附图说明
图1描绘天然存在的CasZ蛋白序列的实例。
图2描绘CasZ基因座的示意图,所述CasZ基因座除CasZ蛋白之外还包括Cas1蛋白。
图3描绘与其他2类CRISPR/Cas效应蛋白序列有关的CasZ序列的系统发育树。
图4描绘与来自其他2类CRISPR/Cas基因座的Cas1序列有关的来自CasZ基因座的Cas1序列的系统发育树。
图5描绘转录组学RNA作图数据,该数据证明了来自CasZ基因座的trancRNA的表达。trancRNA与CasZ重复序列阵列相邻,但不包含重复序列且不与重复序列互补。显示的是以下基因座的RNA 作图数据:CasZa3、CasZb4、CasZc5、CasZd1和CasZe3。小重复对齐箭头表示CRISPR阵列的重复序列(指示存在编码指导RNA的序列);重复阵列外部和附近的峰表示高度转录的trancRNA。图5(续 1)核苷酸序列(从上到下:SEQIDNO.:312-331)。图5(续3)核苷酸序列 (从上到下:SEQIDNo.:161-177)。
图6描绘如使用PAM消耗测定对CasZc(顶部)和CasZb(底部) 进行测定的PAM偏好结果。
图7描绘本文所述的Cas14蛋白的序列。
图8,图A-图D描绘CRISPR-Cas14基因组基因座的架构和系统发育。
图9描绘Cas14直系同源物的系统发育分析。
图10描绘来自已知CRISPR系统的Cas1的最大似然树。
图11,图A-图B描绘CRISPR-Cas14系统的新间隔序列的获取。
图12,图A-图D描绘CRISPR-Cas14a主动适应并编码tracrRNA。
图13,图A-图B描绘CRISPR-Cas14基因座的宏转录组学。
图14,图A-图B描绘CRISPR-Cas14的RNA加工和异源表达。
图15,图A-图D描绘Cas14a1和SpCas9的质粒消耗。
图16,图A-图D描绘CRISPR-Cas14a是RNA指导的DNA内切核酸酶。
图17,图A-图E描绘Cas14a1对ssDNA的降解。
图18描绘在各种指导RNA组分下Cas14a1切割ssDNA的动力学。
图19,图A-图F描绘Cas14a1指导RNA组分的优化。
图20,图A-E描绘通过CRISPR-Cas14a进行的高保真ssDNADNP 检测。图20,图C提供核苷酸序列(从上到下:SEQIDNO:367-370)。
图21,图A-图F描绘各种激活剂对Cas14a1切割速率的影响。
图22,图A-图B描绘CRISPR-Cas14系统的多样性。
图23,图A-图C描绘异源宿主中Cas14a1介导的干扰的测试。 Cas14a1和LbCas12a构建体的图,用于测试大肠杆菌中的干扰。
图24描绘本发明中使用的质粒的Cas14核苷酸序列。
图25,图A-图E描绘图24中公开的每个质粒的序列图谱。
定义
如本文所用,“异源的”意指分别不存在于天然核酸或蛋白质中的核苷酸或多肽序列。例如,相对于CasZ多肽,异源多肽包含来自除 CasZ多肽之外的蛋白质的氨基酸序列。在一些情况下,将来自一个物种的CasZ蛋白的一部分与来自不同物种的CasZ蛋白的一部分融合。因此,可认为来自每个物种的CasZ序列相对于彼此是异源的。作为另一个实例,CasZ蛋白(例如,dCasZ蛋白)可与来自非CasZ蛋白(例如,组蛋白脱乙酰酶)的活性结构域融合,并且所述活性结构域的序列可被认为是异源多肽(它对CasZ蛋白是异源的)。
在本文中可互换使用的术语“多核苷酸”和“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核苷酸)的聚合形式。因此,此术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、 DNA-RNA杂交体或包含嘌呤碱基和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。术语“多核苷酸”和“核酸”应理解为包括如可适用于所描述的实施方案的单链 (诸如有义链或反义链)和双链多核苷酸。
在本文中可互换使用的术语“多肽”、“肽”和“蛋白质”是指具有任何长度的氨基酸的聚合形式,其可包括遗传编码和非遗传编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸以及具有修饰的肽骨架的多肽。所述术语包括:融合蛋白,其包括但不限于具有异源氨基酸序列的融合蛋白;具有异源和同源前导序列、具有或不具有N末端甲硫氨酸残基的融合体;免疫标记蛋白;等。
如本文所用,适用于核酸、蛋白质、细胞或生物体的术语“天然存在的”是指存在于自然界中的核酸、细胞、蛋白质或生物体。
如本文所用,术语“分离的”意在描述处于与多核苷酸、多肽或细胞天然存在的环境不同的环境中的多核苷酸、多肽或细胞。分离的遗传修饰的宿主细胞可存在于遗传修饰的宿主细胞的混合群体中。
如本文所用,术语“外源核酸”是指在自然界中不是正常或天然存在的核酸和/或不是由给定细菌、生物体或细胞产生的核酸。如本文所用,术语“内源核酸”是指在自然界中正常存在的核酸和/或由给定细菌、生物体或细胞产生的核酸。“内源核酸”也称为“天然核酸”或对于给定细菌、生物体或细胞“天然”的核酸。
如本文所用,“重组”意指特定核酸(DNA或RNA)是克隆、限制和/或连接步骤的各种组合的产物,所述步骤产生具有可与天然系统中存在的内源核酸区别开的结构编码序列或非编码序列的构建体。一般来讲,编码结构编码序列的DNA序列可由cDNA片段和短寡核苷酸接头或由一系列合成寡核苷酸组装,以提供能够由包含在细胞中或无细胞转录和翻译系统中的重组转录单元表达的合成核酸。此类序列可以不被内部非翻译序列或内含子中断的开放阅读框形式提供,所述内部非翻译序列或内含子通常存在于真核基因中。包含相关序列的基因组DNA还可用于形成重组基因或转录单元。非翻译DNA的序列可存在于开放读码框的5'端或3'端,其中此类序列不干扰编码区的操纵或表达,并且实际上可通过各种机制起到调节所需产物的产生的作用(参见下文的“DNA调控序列”)。
因此,例如术语“重组”多核苷酸或“重组”核酸是指非天然存在的多核苷酸或核酸,例如通过人干预由序列的两个另外分开的区段的人工组合制成的多核苷酸或核酸。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。通常进行这种操作以用编码相同或保守氨基酸的冗余密码子替换密码子,同时通常引入或移除序列识别位点。可替代地,执行这种操作以将具有所需功能的核酸区段连接在一起以产生所需的功能组合。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。
类似地,术语“重组”多肽是指非天然存在的多肽,例如通过人干预由氨基酸序列的两个另外分开的区段的人工组合制成的多肽。因此,例如,包含异源氨基酸序列的多肽是重组的。
“构建体”或“载体”意指重组核酸,一般是重组DNA,其是出于表达和/或增殖一个或多个特定核苷酸序列的目的而生成的,或者用于构建其他重组核苷酸序列。
在本文中可互换使用的术语“DNA调控序列”、“控制元件”和“调控元件”是指转录和翻译控制序列,诸如启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号等,所述转录和翻译控制序列在宿主细胞中提供和/或调控编码序列的表达和/或编码的多肽的产生。
术语“转化”与“遗传修饰”在本文中可互换使用,并且是指在向细胞中引入新核酸(即,对于所述细胞外源的DNA)之后,在所述细胞中诱导的永久或瞬时的遗传变化。遗传变化(“修饰”)可通过向宿主细胞的基因组中引入新核酸或者通过作为游离基因元件的新核酸的瞬时的或稳定的维持来完成。当细胞为真核细胞时,永久的遗传变化一般通过向所述细胞的基因组中引入新DNA来完成。在原核细胞中,可将永久的变化引入染色体中或经由染色体外元件(诸如质粒和表达载体)引入染色体中,所述染色体外元件可含有一种或多种可选择标记物以帮助它们在重组宿主细胞中的维持。遗传修饰的合适方法包括病毒感染、转染、缀合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接微注射等。方法的选择一般取决于被转化的细胞类型和发生转化所在的环境(即体外、离体或体内)。这些方法的一般讨论可见于Ausubel等人,Short Protocols in Molecular Biology,第3版,Wiley &Sons,1995中。
“可操作地连接”是指其中所述组分处于允许它们以其预期的方式起作用的关系的并置。例如,如果启动子影响编码序列的转录或表达,则启动子可操作地连接至所述编码序列。如本文所用,术语“异源启动子”和“异源控制区”是指通常与自然界中的特定核酸不相关的启动子和其他控制区。例如,“对编码区异源的转录控制区”是通常与自然界中的编码区不相关的转录控制区。
如本文所用,“宿主细胞”指代体内或体外真核细胞、原核细胞或作为单细胞实体培养的来自多细胞生物体的细胞(例如,细胞系),所述真核细胞或原核细胞可用作或已用作核酸(例如,表达载体)的受体,并且包括已通过核酸遗传修饰的原始细胞的子代。应理解由于天然、偶然或有意突变,单细胞的子代可不必在形态或在基因组或总DNA 互补序列方面与原始亲本完全相同。“重组宿主细胞”(也称为“遗传修饰的宿主细胞”)是已向其中引入异源核酸(例如,表达载体)的宿主细胞。例如,主题原核宿主细胞是通过将异源核酸引入合适的原核宿主细胞中的遗传修饰的原核宿主细胞(例如,细菌),所述异源核酸是例如对原核宿主细胞外源(通常在自然界中不存在)的外源核酸或通常在原核宿主细胞中不存在的重组核酸;并且主题真核宿主细胞是通过将异源核酸引入合适的真核宿主细胞中的遗传修饰的真核宿主细胞,所述异源核酸是例如对真核宿主细胞外源的外源核酸或通常在真核宿主细胞中不存在的重组核酸。
术语“保守氨基酸取代”是指蛋白质中具有相似侧链的氨基酸残基的可互换性。例如,具有脂肪族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;具有脂肪族-羟基侧链的一组氨基酸由丝氨酸和苏氨酸组成;具有含酰胺侧链的一组氨基酸由天冬酰胺和谷氨酰胺组成;具有芳香族侧链的一组氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;具有碱性侧链的一组氨基酸由赖氨酸、精氨酸和组氨酸组成;并且具有含硫侧链的一组氨基酸由半胱氨酸和甲硫氨酸组成。示例性保守氨基酸取代基团是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一种多核苷酸或多肽具有一定的“序列同一性”百分比,这意味着当比对时碱基或氨基酸的百分数为相同的,并且当比较两个序列时所述碱基或氨基酸处于相同的相对位置上。可以许多不同方式确定序列相似性。为了确定序列同一性,可使用包括可通过万维网ncbi.nlm.nih.gov/BLAST获得的BLAST在内的方法和计算机程序来比对序列。参见例如Altschul等人(1990),J. Mol.Biol.215:403-10.另一种比对算法是FASTA,可从Madison, Wisconsin,USA的一家Oxford Molecular Group,Inc.的全资子公司的遗传计算组(GCG)程序包中获得。用于比对的其他技术描述于 Methods in Enzymology,第266卷:Computer Methods for Macromolecular Sequence Analysis(1996),Doolittle编,Academic Press, Inc.,a division of Harcourt Brace&Co.的一个部门,San Diego,California,USA。特别感兴趣的是允许序列中存在空位的比对程序。 Smith-Waterman是允许序列比对中存在空位的一种算法类型。参见 Meth.Mol.Biol.70:173-187(1997)。另外,使用Needleman和Wunsch 比对方法的GAP程序可用于比对序列。参见J.Mol.Biol.48:443-453 (1970)。
如本文所用,术语“治疗(treatment)、治疗(treating)”等是指获得所需的药理学和/或生理学效果。就完全或部分预防疾病或其症状而言,所述效果可以是预防性的,并且/或者就部分或完全治愈疾病和/或可归因于所述疾病的副作用而言,所述效果可以是治疗性的。如本文所用,“治疗”涵盖对哺乳动物(例如,人)的疾病的任何治疗,并且包括: (a)在可能易患疾病但还未诊断患有所述疾病的受试者中预防疾病发生;(b)抑制疾病,即阻止其发展;以及(c)缓解疾病,即引起疾病消退。
在本文中可互换使用的术语“个体”、“受试者”、“宿主”和“患者”是指个体生物体,例如哺乳动物,包括但不限于鼠类、猿、非人灵长类动物、人、哺乳类农场动物、哺乳类运动动物和哺乳动物宠物。
在进一步描述本发明之前,应理解本发明不限于所述的具体实施方案,因此,当然也可有所变化。还应理解,本文所用的术语仅出于描述具体实施方案的目的,并且不意图具有限制性,因为本发明的范围将仅受所附权利要求限制。
在提供值的范围的情况下,应理解此范围的上限与下限之间的各介入值(除非上下文另外清楚地指出,否则准确到下限的单位的十分之一),以及此所述范围内的任何其他所述值或介入值涵盖在本发明内。这些较小范围的上限和下限可独立地包括在较小的范围内,并且也涵盖在本发明内,从属于所述范围内的任何特定排除的限值。在所述范围包括所述限值中的一个或两个的情况下,排除那些所包括的限值中的任一个或两个的范围也包括在本发明内。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域中的普通技术人员通常所理解相同的含义。虽然与本文所述的那些相似或等同的任何方法和材料也可用于实践或测试本发明中,但是现在描述优选的方法和材料。本文提及的所有出版物以引用方式并入本文,以结合所引用的出版物公开并描述方法和/或材料。
必须指出,如在本文和所附权利要求中所用,单数形式“一个(a)/ 一种(an)”和“所述(the)”包括复数指示物,除非上下文另外清楚地指出。因此,例如,提及“CasZ多肽”包括多个此类多肽,并且提及“指导RNA”包括提及本领域的技术人员已知的一种或多种指导RNA及其等效物,等。还应注意,权利要求可拟订成排除任何任选的要素。因而,这种陈述意图充当结合权利要求要素的叙述来使用诸如“仅仅”、“仅”等排他性术语或使用“否定”限制的前提基础。
应理解,出于清晰目的而在单独的实施方案的上下文中描述的本发明的某些特征也可在单个实施方案中组合提供。相反,为了简明而在单个实施方案的上下文中描述的本发明的各种特征也可分开地或以任一合适的子组合来提供。属于本发明的实施方案的所有组合确切地涵盖在本发明中并且在本文中公开如同每个和每一种组合均单独地且明确地公开一样。另外,各种实施方案及其要素的所有子组合也确切地涵盖在本发明中并且在本文中公开如同每个和每一种此类子组合均单独地且明确地在本文中公开一样。
本文中讨论的出版物仅仅提供它们在本申请的提交日期之前的公开内容。本文中的任何内容均不应解释为承认本发明无权借助在先发明而先于此类出版物。此外,所提供的出版日可能不同于可能需要独立确认的实际出版日期。
具体实施方式
本公开提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码CasZ蛋白的核酸和/或包含CasZ蛋白(和 /或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性的CasZ指导RNA、编码CasZ 指导RNA的核酸和/或包含CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码 RNA(trancRNA)(在本文中称为“CasZtrancRNA”)、编码CasZ trancRNA的核酸和/或包含CasZ trancRNA(和/或编码所述CasZtrancRNA的核酸)的修饰的宿主细胞。
组合物
CRISPR/CASZ蛋白、指导RNA和TRANCRNA
2类CRISPR-Cas系统的特征在于包括单个多结构域蛋白的效应模块。在CasZ系统中,CRISPR/Cas内切核酸酶(例如,CasZ蛋白) 与对应的指导RNA(例如,CasZ指导RNA)相互作用(结合)以形成核糖核蛋白(RNP)复合物,所述复合物通过指导RNA与靶核酸分子内的靶序列之间的碱基配对被靶向至靶核酸中的特定位点。指导RNA 包括与靶核酸的序列(靶位点)互补的核苷酸序列(指导序列)。因此,CasZ蛋白与CasZ指导RNA形成复合物,并且指导RNA通过指导序列为RNP复合物提供序列特异性。复合物的CasZ蛋白提供位点特异性活性。换句话讲,CasZ蛋白由于其与指导RNA的缔合而被导向至靶核酸(例如靶染色体核酸内的靶核苷酸序列;或靶染色体外核酸内的靶核苷酸序列,例如游离型核酸、微环核酸、线粒体核酸、叶绿体核酸等)内的靶位点(例如,稳定在靶位点)。
本公开提供包含CasZ多肽(和/或编码CasZ多肽的核酸)的组合物 (例如,其中CasZ多肽可以是天然存在的CasZ蛋白、切口酶CasZ 蛋白、dCasZ蛋白、嵌合CasZ蛋白等)(CasZa、CasZb、CasZc、CasZd、 CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白)。本公开提供包含CasZ指导RNA(和/或编码CasZ指导RNA的核酸) 的组合物。例如,本公开提供包含(a)CasZ多肽(和/或编码CasZ多肽的核酸)和(b)CasZ指导RNA(和/或编码CasZ指导RNA的核酸)的组合物。本公开提供一种核酸/蛋白质复合物(RNP复合物),所述核酸/蛋白质复合物包含:(a)CasZ多肽;和(b)CasZ指导RNA。本公开提供包含CasZ trancRNA的组合物。本公开提供包含CasZ trancRNA和以下一项或多项的组合物:(a)CasZ蛋白和(b)CasZ指导RNA(例如,包含CasZ trancRNA和CasZ蛋白,CasZ trancRNA和CasZ指导RNA,或CasZtrancRNA和CasZ蛋白和CasZ指导RNA。本公开提供一种核酸/蛋白质复合物(RNP复合物),所述核酸/蛋白质复合物包含:(a) CasZ多肽;(b)CasZ指导RNA;和(c)CasZ trancRNA。本公开提供包含CasZ蛋白和以下一项或多项的组合物:(a)CasZ trancRNA和(b) CasZ指导RNA。
CasZ蛋白
CasZ多肽(此术语与术语“CasZ蛋白”、“Cas14”、“Cas14多肽”或“Cas14蛋白”可互换使用)可结合和/或修饰(例如,切割、切口、甲基化、脱甲基化等)靶核酸和/或与靶核酸相关联的多肽(例如,组蛋白尾的甲基化或乙酰化)(例如,在一些情况下,CasZ蛋白包括具有活性的融合配偶体,并且在一些情况下,CasZ蛋白提供核酸酶活性)。在一些情况下,CasZ蛋白是天然存在的蛋白质(例如,天然存在于原核细胞中)。在其他情况下,CasZ蛋白不是天然存在的多肽(例如, CasZ蛋白是变体CasZ蛋白、嵌合蛋白等)。CasZ蛋白包括3个部分 RuvC结构域(RuvC-I、RuvC-II和RuvC-III,在本文中也称为亚结构域),它们相对于CasZ蛋白的一级氨基酸序列是不连续的,但一旦蛋白质产生并折叠,就形成RuvC结构域。天然存在的CasZ蛋白起内切核酸酶的作用,其在所靶向核酸(例如,双链dsDNA)中的特定序列处催化切割。序列特异性由相关联的指导RNA提供,所述指导RNA 与靶DNA内的靶序列杂交。天然存在的CasZ指导RNA是crRNA,其中crRNA包括(i)与靶DNA中的靶序列杂交的指导序列和(ii)与CasZ蛋白结合的蛋白结合区段。
在一些实施方案中,主题方法和/或组合物的CasZ蛋白是(或衍生自)天然存在的(野生型)蛋白。天然存在的CasZ蛋白的实例(例如, CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、 CasZj、CasZk、CasZl)描绘于图1中。在一些情况下,主题CasZ蛋白是CasZa蛋白。在一些情况下,主题CasZ蛋白是CasZb蛋白。在一些情况下,主题CasZ蛋白是CasZc蛋白。在一些情况下,主题CasZ 蛋白是CasZd蛋白。在一些情况下,主题CasZ蛋白是CasZe蛋白。在一些情况下,主题CasZ蛋白是CasZf蛋白。在一些情况下,主题 CasZ蛋白是CasZg蛋白。在一些情况下,主题CasZ蛋白是CasZh 蛋白。在一些情况下,主题CasZ蛋白是CasZi蛋白。在一些情况下,主题CasZ蛋白是CasZj蛋白。在一些情况下,主题CasZ蛋白是CasZk 蛋白。在一些情况下,主题CasZ蛋白是CasZl蛋白。在一些情况下,主题CasZ蛋白是CasZe、CasZf、CasZg或CasZh蛋白。在一些情况下,主题CasZ蛋白是CasZj、CasZk或CasZl蛋白。
重要的是要注意,与先前鉴定的CRISPR-Cas内切核酸酶相比,这种新发现的蛋白质(CasZ)较短,并且因此使用此蛋白质作为替代方案提供了编码蛋白质的核苷酸序列相对较短的优点。例如,在其中需要编码CasZ蛋白的核酸的情况下,例如在采用病毒载体(例如,AAV 载体)的情况下,这可用于递送至诸如真核细胞的细胞(例如,哺乳动物细胞、人细胞、小鼠细胞、体外、离体、体内)用于研究和/或临床应用。另外,在其自然环境中,编码CasZ的DNA序列存在于也具有Cas1蛋白的基因座中。
在一些情况下,主题CasZ蛋白具有900个氨基酸或更少(例如, 850个氨基酸或更少、800个氨基酸或更少、750个氨基酸或更少,或700个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有 850个氨基酸或更少(例如,850个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有800个氨基酸或更少(例如,750个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有700个氨基酸或更少的长度。在一些情况下,主题CasZ蛋白具有650个氨基酸或更少的长度。
在一些情况下,主题CasZ蛋白具有在350-900个氨基酸(例如, 350-850个、350-800个、350-750个、350-700个、400-900个、400-850 个、400-800个、400-750个或400-700个氨基酸)的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-750个氨基酸(例如,350-700个、350-550个、450-550个、450-750个、450-650 个或450-550个氨基酸)的范围内的长度。在一些情况下,主题CasZ 蛋白(例如,CasZa)具有在450-750个氨基酸(例如,500-700个氨基酸) 的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-700个氨基酸(例如,350-650个、350-600个或350-550个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa) 具有在500-700个氨基酸的范围内的长度。在一些情况下,主题CasZ 蛋白(例如,CasZa)具有在450-550个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-550个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZb)具有在350-700个氨基酸(例如,350-650个或350-620个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZb)具有在450-700个氨基酸(例如,450-650个、500-650个或500-620个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZb)具有在500-650个氨基酸(例如,500-620个氨基酸)的范围内的长度。在一些情况下,主题 CasZ蛋白(例如,CasZb)具有在500-620个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZc)具有在600-800个氨基酸(例如,600-650个或700-800个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZc)具有在600-650个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZc)具有在700-800个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZd)具有在400-650个氨基酸(例如,400-600个、400-550个、500-650个、500-600个或500-550 个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如, CasZd)具有在500-600个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZd)具有在500-550个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZd)具有在400-550个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZe)具有在450-700个氨基酸(例如,450--650个、450-615个、475-700个、475-650个或 475-615个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZe)具有在450-675个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZe)具有在475-675个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZf)具有在400-550个氨基酸(例如,400-520个、400-500个、400-475个、415-550个、415-520 个、415-500个或415-475个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZf)具有在400-475个氨基酸(例如,400-450 个氨基酸)的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZg)具有在500-750个氨基酸(例如,550-750个或500-700个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZg)具有在700-750个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZg)具有在550-600个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZh)具有在380-450个氨基酸(例如,380-420个、400-450个或400-420个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZh)具有在400-420 个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZi)具有在700-800个氨基酸(例如,700-750个、720-800个或720-750个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZi)具有在720-780 个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZj)具有在600-750个氨基酸(例如,600-700个或650-700个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZj)具有在400-420个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZk)具有在450-600个氨基酸(例如,450-580个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZk) 具有在480-580个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZl)具有在350-500个氨基酸(例如,350-450个、380-450个、350-420个或380-420个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZl) 具有在380-420个氨基酸的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZa蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZa蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZa氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZa氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的一个或多个氨基酸取代 (例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-800个氨基酸(例如,350-800个、350-750个、350-700个、350-550个、450-550 个、450-750个、450-650个或450-550个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZb蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZb蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZb氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZb氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZb蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-700个氨基酸(例如,350-650 个或350-620个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZc蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZc蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZc氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZc氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZc蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在600-800个氨基酸(例如,600-650 个或700-800个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZd蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZd蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZd氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZd氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZd蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在400-650个氨基酸(例如,400-600 个、400-550个、500-650个、500-600个或500-550个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZe蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZe蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZe氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZe氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZe蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-700个氨基酸(例如,450--650 个、450-615个、475-700个、475-650个或475-615个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZf蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZf蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZf氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZf氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZf蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在400-750个氨基酸(例如,400-700 个、700-650个、400-620个、400-600个、400-550个、400-520个、 400-500个、400-475个、415-550个、415-520个、415-500个或415-475 个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZg蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZg蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZg氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZg氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZg蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在500-750个氨基酸(例如,500-750 个氨基酸(例如,550-750个氨基酸))的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZh蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZh蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZh氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZh氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在380-450个氨基酸(例如,380-420 个、400-450个或400-420个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZi蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZi蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZi氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZi氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZi蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在700-800个氨基酸(例如,700-750 个、720-800个或720-750个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZj蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZj氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZj氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZj蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在600-750个氨基酸(例如,600-700 个或650-700个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZk蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZk蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZk氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZk氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZk蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-600个氨基酸(例如,450-580 个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZl蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含与图1或图7的CasZl蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题 CasZ蛋白包含图1或图7的CasZl氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZl氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2 或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-600个氨基酸(例如,450-580 个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图 7的CasZe、CasZf、CasZg或CasZh蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、 CasZg或CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的 CasZe、CasZf、CasZg或CasZh蛋白序列的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的CasZe、CasZf、CasZg或CasZh蛋白序列的氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)。在一些情况下,主题CasZ 蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有 90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在 350-900个氨基酸(例如,350-850个、350-800个、400-900个、400-850 个或400-800个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、 CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、 CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、 97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、 CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、 CasZK或CasZl蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、 CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ 蛋白包含具有图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、 CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白序列的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的 CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、 CasZj、CasZK或CasZl蛋白序列的氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、 CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl 蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、 98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-900个氨基酸(例如,350-850个、350-800个、400-900个、 400-850个或400-800个氨基酸)的范围内的长度。
CasZ变体
当与对应的野生型CasZ蛋白的氨基酸序列相比时,变体CasZ 蛋白具有至少一个氨基酸不同的氨基酸序列(例如,具有缺失、插入、取代、融合)。切割双链靶核酸的一条链但不切割另一条链的CasZ蛋白在本文中被称为“切口酶”(例如,“切口酶CasZ”)。基本上不具有核酸酶活性的CasZ蛋白在本文中被称为死CasZ蛋白(“dCasZ”)(需要注意的是,核酸酶活性可由异源多肽(融合配偶体)在嵌合CasZ蛋白的情况下提供,这在下文更详细地描述)。对于本文所述的任何CasZ变体蛋白(例如,切口酶CasZ、dCasZ、嵌合CasZ),CasZ变体可包括具有上述相同参数(例如,存在的结构域、同一性百分比等)的CasZ 蛋白序列。
变体–催化活性
在一些情况下,CasZ蛋白是变体CasZ蛋白,例如相对于天然存在的催化活性序列突变的蛋白,并且在与对应的天然存在的序列相比时,表现出降低的切割活性(例如,表现出90%或更低、80%或更低、 70%或更低、60%或更低、50%或更低、40%或更低,或30%或更低的切割活性)。在一些情况下,这种变体CasZ蛋白是催化‘死’蛋白(基本上没有切割活性)并且可被称为‘dCasZ’。在一些情况下,变体CasZ 蛋白是切口酶(仅切割双链靶核酸(例如,双链靶DNA)的一条链)。如本文更详细描述的,在一些情况下,CasZ蛋白(在一些情况下,是具有野生型切割活性的CasZ蛋白并且在一些情况下,是具有降低的切割活性的变体CasZ,例如dCasZ或切口酶CasZ)与具有目标活性(例如,目标催化活性)的异源多肽融合(缀合)以形成融合蛋白(嵌合CasZ 蛋白)。
当根据CasZi.1编号时,CasZ的催化残基包括D405、E586和 D684(例如,参见图1)。因此,在一些情况下,CasZ蛋白具有降低的活性,并且一种或多种上述氨基酸(或任何CasZ蛋白的一种或多种对应的氨基酸)发生突变(例如,被丙氨酸取代)。在一些情况下,变体CasZ蛋白是催化‘死’蛋白(无催化活性)并且被称为‘dCasZ’。dCasZ蛋白可与提供活性的融合配偶体融合,并且在一些情况下,dCasZ(例如,没有提供催化活性的融合配偶体,但在真核细胞中表达时可具有 NLS的dCasZ)可结合靶DNA并且可用于成像(例如,可给蛋白质加标签/进行标记),并且/或者可阻止RNA聚合酶从靶DNA转录。在一些情况下,变体CasZ蛋白是切口酶(仅切割双链靶核酸(例如,双链靶DNA)的一条链)。
变体–嵌合CasZ(即,融合蛋白)
如上所指出,在一些情况下,CasZ蛋白(在一些情况下,是具有野生型切割活性的CasZ蛋白并且在一些情况下,是具有降低的切割活性的变体CasZ,例如dCasZ或切口酶CasZ)与具有目标活性(例如,目标催化活性)的异源多肽融合(缀合)以形成融合蛋白(嵌合CasZ蛋白)。CasZ蛋白可与之融合的异源多肽在本文中被称为‘融合配偶体’。
在一些情况下,融合配偶体可调节靶DNA的转录(例如,抑制转录、增加转录)。例如,在一些情况下,融合配偶体是抑制转录的蛋白质(或来自蛋白质的结构域)(例如,转录阻遏物,一种通过转录抑制蛋白的募集、靶DNA的修饰诸如甲基化、DNA修饰物的募集、与靶DNA相关联的组蛋白的调节、组蛋白修饰物(诸如修饰组蛋白的乙酰化和/或甲基化的那些组蛋白修饰物)的募集等起作用的蛋白质)。在一些情况下,融合配偶体是增加转录的蛋白质(或来自蛋白质的结构域)(例如,转录激活因子,一种通过转录激活蛋白的募集、靶DNA的修饰诸如甲基化、DNA修饰物的募集、与靶DNA相关联的组蛋白的调节、组蛋白修饰物(诸如修饰组蛋白的乙酰化和/或甲基化的那些组蛋白修饰物)的募集等起作用的蛋白质)。
在一些情况下,嵌合CasZ蛋白包括具有修饰靶核酸的酶活性(例如,核酸酶活性(诸如FokI核酸酶活性)、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖基化酶活性)的异源多肽。
在一些情况下,嵌合CasZ蛋白包括具有修饰与靶核酸相关联的多肽(例如,组蛋白)的酶活性(例如,甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性)的异源多肽。
可用于增加转录的蛋白质(或其片段)的实例包括但不限于:转录激活因子,诸如VP16、VP64、VP48、VP160、p65亚结构域(例如,来自NFkB)以及EDLL的激活结构域和/或TAL激活结构域(例如,针对植物中的活性);组蛋白赖氨酸甲基转移酶,诸如SET1A、SET1B、 MLL1至5、ASH1、SYMD2、NSD1等;组蛋白赖氨酸脱甲基酶,诸如JHDM2a/b、UTX、JMJD3等;组蛋白乙酰转移酶,诸如GCN5、 PCAF、CBP、p300、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、 SRC1、ACTR、P160、CLOCK等;以及DNA脱甲基酶,诸如10-11 易位(TET)双加氧酶1(TET1CD)、TET1、DME、DML1、DML2、ROS1 等。
可用于减少转录的蛋白质(或其片段)的实例包括但不限于:转录阻遏物,诸如Krüppel相关盒(KRAB或SKD);KOX1阻遏结构域; Mad mSIN3相互作用结构域(SID);ERF阻遏物结构域(ERD)、SRDX 阻遏结构域(例如,针对植物中的阻遏)等;组蛋白赖氨酸甲基转移酶,诸如Pr-SET7/8、SUV4-20H1、RIZ1等;组蛋白赖氨酸脱甲基酶,诸如JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、 JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY 等;组蛋白赖氨酸脱乙酰酶,诸如HDAC1、HDAC2、HDAC3、HDAC8、 HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等; DNA甲基化酶,诸如HhaIDNA m5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2 (植物)等;以及外周募集元件,诸如核纤层蛋白A、核纤层蛋白B等。
在一些情况下,融合配偶体具有修饰靶核酸(例如,ssRNA、 dsRNA、ssDNA、dsDNA)的酶活性。可由融合配偶体提供的酶活性的实例包括但不限于:核酸酶活性,诸如由限制性酶(例如,FokI核酸酶)提供的活性;甲基转移酶活性,诸如由甲基转移酶(例如, HhaIDNAm5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、 DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、 METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等)提供的活性;脱甲基酶活性,诸如由脱甲基酶(例如;10-11易位(TET)双加氧酶1 (TET1CD)、TET1、DME、DML1、DML2、ROS1等)提供的活性; DNA修复活性;DNA损伤活性;脱氨基活性,诸如由脱氨酶(例如,胞嘧啶脱氨酶,诸如大鼠APOBEC1)提供的活性;歧化酶活性;烷基化活性;脱嘌呤活性;氧化活性;嘧啶二聚体形成活性;整合酶活性,诸如由整合酶和/或解离酶(例如,Gin转化酶诸如Gin转化酶的过度活跃突变体GinH106Y、人免疫缺陷病毒1型整合酶(IN)、Tn3解离酶等)提供的活性;转座酶活性;重组酶活性,诸如由重组酶(例如, Gin重组酶的催化结构域)提供的活性;聚合酶活性;连接酶活性;解旋酶活性;光裂合酶活性和糖基化酶活性)。
在一些情况下,融合配偶体具有修饰与靶核酸(例如,ssRNA、 dsRNA、ssDNA、dsDNA)相关联的蛋白质(例如,组蛋白、RNA结合蛋白、DNA结合蛋白等)的酶活性。可由融合配偶体提供的酶活性(修饰与靶核酸相关联的蛋白质)的实例包括但不限于:甲基转移酶活性,诸如由组蛋白甲基转移酶(HMT)(例如,花斑抑制因子3-9同源物1 (SUV39H1,也称为KMT1A)、常染色体组蛋白赖氨酸甲基转移酶2 (G9A,也称为KMT1C和EHMT2)、SUV39H2、ESET/SETDB1等、 SET1A、SET1B、MLL1至5、ASH1、SYMD2、NSD1、DOT1L、Pr-SET7/8、 SUV4-20H1、EZH2、RIZ1)提供的活性;脱甲基酶活性,诸如由组蛋白脱甲基酶(例如,赖氨酸脱甲基酶1A(KDM1A,也称为LSD1)、 JHDM2a/b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY、 UTX、JMJD3等)提供的活性;乙酰转移酶活性,诸如由组蛋白乙酰转移酶(例如,人乙酰转移酶p300、GCN5、PCAF、CBP、TAF1、 TIP60/PLIP、MOZ/MYST3、MORF/MYST4、HBO1/MYST2、 HMOF/MYST1、SRC1、ACTR、P160、CLOCK等的催化核心/片段) 提供的活性;脱乙酰酶活性,诸如由组蛋白脱乙酰酶(例如,HDAC1、 HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、 SIRT1、SIRT2、HDAC11等)提供的活性;激酶活性;磷酸酶活性;泛素连接酶活性;去泛素化活性;腺苷酸化活性;脱腺苷酸化活性; SUMO化活性;脱SUMO化活性;核糖基化活性;脱核糖基化活性;豆蔻酰化活性和脱豆蔻酰化活性。
合适的融合配偶体的另外的实例是二氢叶酸还原酶(DHFR)去稳定化结构域(例如,以产生化学可控的嵌合CasZ蛋白)和叶绿体转运肽。合适的叶绿体转运肽包括但不限于:
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKV NTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA
(SEQIDNO:101);
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKV NTDITSITSNGGRVKS(SEQIDNO:102);
MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANN DITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC (SEQIDNO:103);
MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAY PISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQIDNO:104);
MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRA YPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQIDNO:105);
MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(SEQIDNO:106);
MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(SEQIDNO:107);
MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAG GDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(SEQIDNO: 108);
MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQ NLDITSIASNGGRVQC(SEQIDNO:109);
MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTS GVKCSAAVTPQASPVISRSAAAA(SEQIDNO:110);和
MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(SEQIDNO:111)。
在一些情况下,本公开的CasZ融合多肽包含:a)本公开的CasZ 多肽;和b)叶绿体转运肽。因此,例如,CRISPR-CasZ复合物可被靶向至叶绿体。在一些情况下,这种靶向可通过N末端延伸的存在来实现,所述N末端延伸称为叶绿体转运肽(CTP)或质体转运肽。如果表达的多肽要在植物质体(例如,叶绿体)中区室化,则来自细菌来源的染色体转基因必须具有编码CTP序列的序列,所述CTP序列与编码表达的多肽的序列融合。因此,外源多肽到叶绿体的定位通常1 通过将编码CTP序列的多核苷酸序列与编码外源多肽的多核苷酸的 5'区可操作地连接来实现。在易位到质体的过程中,在加工步骤中去除CTP。然而,加工效率可能受到CTP的氨基酸序列和肽的NH2末端附近的序列的影响。已经描述的用于靶向叶绿体的其他选择是玉米 cab-m7信号序列(美国专利号7,022,896、WO97/41228)、豌豆谷胱甘肽还原酶信号序列(WO97/41228)和US2009029861中描述的CTP。
在一些情况下,本公开的CasZ融合多肽可包含:a)本公开的CasZ 多肽;和b)内体逃逸肽。在一些情况下,内体逃逸多肽包含氨基酸序列GLFXALLXLLXSLWXLLLXA(SEQIDNO:112),其中每个X独立地选自赖氨酸、组氨酸和精氨酸。在一些情况下,内体逃逸多肽包含氨基酸序列GLFHALLHLLHSLWHLLLHA(SEQIDNO:113)。
对于在与Cas9蛋白、锌指蛋白和/或TALE蛋白融合的情况(用于位点特异性靶核酸修饰、转录调节和/或靶蛋白修饰,例如组蛋白修饰)中使用的一些上述融合配偶体(和更多)的实例,参见例如:Nomura 等人,JAm Chem Soc.2007年7月18日;129(28):8676-7;Rivenbark等人,Epigenetics.2012年4月;7(4):350-60;Nucleic Acids Res.2016年7 月8日;44(12):5615-28;Gilbert等人,Cell.2013年7月18 日;154(2):442-51;Kearns等人,Nat Methods.2015年5月;12(5):401-3; Mendenhall等人,Nat Biotechnol.2013年12月;31(12):1133-6;Hilton 等人,Nat Biotechnol.2015年5月;33(5):510-7;Gordley等人,Proc Natl Acad Sci USA.2009年3月31日;106(13):5053-8;Akopian等人,Proc NatlAcad Sci USA.2003年7月22日;100(15):8688-91;Tan等人, JVirol.2006年2月;80(4):1939-48;Tan等人,Proc Natl Acad Sci USA. 2003年10月14日;100(21):11997-2002;Papworth等人,Proc Natl Acad Sci USA.2003年2月18日;100(4):1621-6;Sanjana等人,Nat Protoc.2012年1月5日;7(1):171-92;Beerli等人,Proc Natl Acad Sci USA.1998年12月8日;95(25):14628-33;Snowden等人,Curr Biol.2002 年12月23日;12(24):2159-66;Xu等人,Xu等人,Cell Discov.2016年 5月3日;2:16009;Komor等人,Nature.2016年4月20日;533(7603):420-4;Chaikind等人,Nucleic Acids Res.2016年8月11 日;Choudhury等人,Oncotarget.2016年6月23日;Du等人,Cold Spring Harb Protoc.2016年1月4日;Pham等人,Methods Mol Biol.2016;1358:43-57;Balboa等人,Stem Cell Reports.2015年9月8日;5(3):448-59;Hara等人,Sci Rep.2015年6月9日;5:11221;Piatek 等人,PlantBiotechnol J.2015年5月;13(4):578-89;Hu等人,Nucleic Acids Res.2014年4月;42(7):4375-90;Cheng等人,Cell Res.2013年10 月;23(10):1163-71;以及Maeder等人,NatMethods.2013年10 月;10(10):977-9。
另外适合的异源多肽包括但不限于直接和/或间接提供靶核酸的增加的转录和/或翻译的多肽(例如,转录激活因子或其片段、募集转录激活因子的蛋白质或其片段、小分子/药物响应性转录和/或翻译调控因子、翻译调控蛋白等)。实现增加或降低的转录的异源多肽的非限制性实例包括转录激活因子结构域和转录阻遏物结构域。在一些此类情况下,嵌合CasZ多肽通过指导核酸(指导RNA)被靶向靶核酸中的特定位置(即,序列)并且发挥基因座特异性调控的作用,诸如阻断 RNA聚合酶与启动子(所述启动子选择性抑制转录激活因子功能)的结合和/或修饰局部染色质状态(例如,在使用融合序列时,修饰靶核酸或修饰与靶核酸相关联的多肽)。在一些情况下,变化是瞬时的(例如,转录阻遏或激活)。在一些情况下,变化是可遗传的(例如,在对靶核酸或与靶核酸相关联的蛋白质(例如,核小体组蛋白)进行表观遗传修饰时)。
当靶向ssRNA靶核酸时,使用的异源多肽的非限制性实例包括 (但不限于):剪接因子(例如,RS结构域);蛋白质翻译组分(例如,翻译起始因子、延伸因子和/或释放因子;例如,eIF4G);RNA甲基化酶;RNA编辑酶(例如,RNA脱氨酶,例如作用于RNA的腺苷脱氨酶(ADAR),包括A至I和/或C至U编辑酶);解旋酶;RNA结合蛋白等。应理解,异源多肽可包括整个蛋白质,或者在一些情况下,可包括蛋白质的片段(例如,功能结构域)。
主题嵌合CasZ多肽的异源多肽可以是能够与ssRNA(出于本公开的目的,其包括分子内和/或分子间二级结构,例如双链RNA双链体,诸如发夹、茎环等)相互作用的任何结构域,无论是瞬时的还是不可逆的,直接的还是间接的,所述结构域包括但不限于选自由以下组成的组的效应结构域;内切核酸酶(例如RNA酶III、CRR22DYW 结构域、来自诸如SMG5和SMG6的蛋白质的Dicer和PIN(PilTN 末端)结构域);负责刺激RNA切割的蛋白质和蛋白质结构域(例如 CPSF、CstF、CFIm和CFIIm);外切核酸酶(例如XRN-1或外切核酸酶T);脱腺苷酶(例如HNT3);负责无义介导的RNA衰变的蛋白质和蛋白质结构域(例如UPF1、UPF2、UPF3、UPF3b、RNPS1、Y14、 DEK、REF2和SRm160);负责稳定RNA的蛋白质和蛋白质结构域(例如PABP);负责阻遏翻译的蛋白质和蛋白质结构域(例如Ago2和 Ago4);负责刺激翻译的蛋白质和蛋白质结构域(例如Staufen);负责 (例如能够)调节翻译的蛋白质和蛋白质结构域(例如翻译因子,诸如起始因子、延伸因子、释放因子等,例如eIF4G);负责RNA的聚腺苷酸化的蛋白质和蛋白质结构域(例如PAP1、GLD-2和Star-PAP);负责RNA的聚尿苷酸化的蛋白质和蛋白质结构域(例如CID1和末端尿苷酸转移酶);负责RNA定位的蛋白质和蛋白质结构域(例如来自 IMP1、ZBP1、She2p、She3p和Bicaudal-D);负责RNA的核保留的蛋白质和蛋白质结构域(例如Rrp6);负责RNA的核输出的蛋白质和蛋白质结构域(例如TAP、NXF1、THO、TREX、REF和Aly);负责阻遏RNA剪接的蛋白质和蛋白质结构域(例如PTB、Sam68和hnRNPA1);负责刺激RNA剪接的蛋白质和蛋白质结构域(例如富含丝氨酸/精氨酸(SR)结构域);负责降低转录效率的蛋白质和蛋白质结构域(例如FUS(TLS));以及负责刺激转录的蛋白质和蛋白质结构域 (例如CDK7和HIVTat)。可替代地,效应结构域可选自包括以下的组:内切核酸酶;能够刺激RNA切割的蛋白质和蛋白质结构域;外切核酸酶;脱腺苷酶;具有无义介导的RNA衰变活性的蛋白质和蛋白质结构域;能够稳定RNA的蛋白质和蛋白质结构域;能够阻遏翻译的蛋白质和蛋白质结构域;能够刺激翻译的蛋白质和蛋白质结构域;能够调节翻译的蛋白质和蛋白质结构域(例如,翻译因子,诸如起始因子、延伸因子、释放因子等,例如eIF4G);能够进行RNA的聚腺苷酸化的蛋白质和蛋白质结构域;能够进行RNA的聚尿苷酸化的蛋白质和蛋白质结构域;具有RNA定位活性的蛋白质和蛋白质结构域;能够进行RNA的核保留的蛋白质和蛋白质结构域;具有RNA核输出活性的蛋白质和蛋白质结构域;能够阻遏RNA剪接的蛋白质和蛋白质结构域;能够刺激RNA剪接的蛋白质和蛋白质结构域;能够降低转录效率的蛋白质和蛋白质结构域;以及能够刺激转录的蛋白质和蛋白质结构域。另一种合适的异源多肽是PUFRNA结合结构域,其在WO2012068627中更详细地描述,所述文献以引用方式整体并入本文。
可作为嵌合CasZ多肽的异源多肽(整体或作为其片段)使用的一些RNA剪接因子具有模块化结构,具有分开的序列特异性RNA结合模块和剪接效应结构域。例如,富含丝氨酸/精氨酸(SR)的蛋白质家族的成员含有N末端RNA识别基序(RRM),其结合前mRNA和C 末端RS结构域中的外显子剪接增强子(ESE),所述外显子剪接增强子促进外显子包含。作为另一个实例,hnRNP蛋白hnRNPAl通过其RRM 结构域与外显子剪接沉默子(ESS)结合,并通过C末端富含甘氨酸的结构域抑制外显子包含。一些剪接因子可通过结合两个替代位点之间的调控序列来调控剪接位点(ss)的替代使用。例如,ASF/SF2可识别 ESE并有助于使用内含子近侧位点,而hnRNPAl可结合ESS并将剪接转到使用内含子远侧位点。此类因子的一个应用是生成调节内源基因(特别是疾病相关基因)的替代剪接的ESF。例如,Bcl-x前mRNA 产生两种剪接同种型,这两种剪接同种型具有两个替代的5'剪接位点以编码具有相反功能的蛋白质。长剪接同种型Bcl-xL是在长寿命的有丝分裂后细胞中表达的有效凋亡抑制因子,并且在许多癌细胞中上调,从而保护细胞免于凋亡信号。短同种型Bcl-xS是促凋亡同种型,并且在具有高周转率的细胞(例如,发育中的淋巴细胞)中以高水平表达。两种Bcl-x剪接同种型之比由位于核心外显子区或外显子延伸区 (即,两个替代5'剪接位点之间)中的多个
Figure BDA0002562709270000381
元件调控。对于更多实例,参见WO2010075303,其特此以引用方式整体并入。
另外的合适的融合配偶体包括但不限于作为边界元件(例如,CTCF)的蛋白质(或其片段)、提供外周募集的蛋白质及其片段(例如,核纤层蛋白A、核纤层蛋白B等)、蛋白质对接元件(例如,FKBP/FRB、 Pil1/Aby1等)。
用于主题嵌合CasZ多肽的各种另外的合适的异源多肽(或其片段)的实例包括但不限于在以下申请中描述的那些(所述公布涉及其他 CRISPR内切核酸酶(诸如Cas9),但是描述的融合配偶体也可与CasZ 一起使用):PCT专利申请:WO2010075303、WO2012068627和WO2013155555,并且可见于例如以下美国专利和专利申请:8,906,616; 8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965; 8,771,945;8,697,359;20140068797;20140170753;20140179006; 20140179770;20140186843;20140186919;20140186958;20140189896; 20140227787;20140234972;20140242664;20140242699;20140242700;20140242702;20140248702;20140256046;20140273037;20140273226; 20140273230;20140273231;20140273232;20140273233;20140273234; 20140273235;20140287938;20140295556;20140295557;20140298547; 20140304853;20140309487;20140310828;20140310830;20140315985; 20140335063;20140335620;20140342456;20140342457;20140342458; 20140349400;20140349405;20140356867;20140356956;20140356958;20140356959;20140357523;20140357530;20140364333;和 20140377868;所述专利全部特此以引用方式整体并入。
在一些情况下,异源多肽(融合配偶体)提供亚细胞定位,即异源多肽含有亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS)、用于将融合蛋白保持在细胞核外的序列(例如核输出序列(NES))、用于将融合蛋白保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。在一些实施方案中,CasZ融合多肽不包含NLS,使得蛋白质不靶向细胞核(这可能是有利的,例如,在靶核酸是存在于胞质溶胶中的RNA时)。在一些实施方案中,异源多肽可提供便于追踪和/或纯化的标签(即,异源多肽是可检测标记)(例如,荧光蛋白,例如绿色荧光蛋白(GFP)、 YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标签,例如6XHis 标签;血凝素(HA)标签;FLAG标签;Myc标签等)。
在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ 蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)核定位信号(NLS)(例如,在一些情况下,2个或更多个、3 个或更多个、4个或更多个或者5个或更多个NLS)。因此,在一些情况下,CasZ多肽包含一个或多个NLS(例如,2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5 个或更多个NLS)定位在N末端和/或C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端和C末端二者处或附近(例如,在50个氨基酸内)。在一些情况下,NLS定位在N末端,并且NLS定位在C末端。
在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ 蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)1与10个之间的NLS(例如,1-9个、1-8个、1-7个、1-6 个、1-5个、2-10个、2-9个、2-8个、2-7个、2-6个或2-5个NLS)。在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)2与5个之间的NLS(例如,2-4个或2-3个NLS)。
NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大 T抗原的NLS,具有氨基酸序列PKKKRKV(SEQIDNO:114);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQI DNO:115)的核质蛋白二分NLS);c-myc NLS,具有氨基酸序列PA AKRVKLD(SEQIDNO:116)或RQRRNELKRSP(SEQIDNO:117); hRNPA1M9NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGG QYFAKPRNQGGY(SEQIDNO:118);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILK RRNV(SEQIDNO:119);肌瘤T蛋白的序列VSRKRPRP(SEQIDN O:120)和PPKKARED(SEQIDNO:121);人p53的序列PQPKKKP L(SEQIDNO:122);小鼠c-abl IV的序列SALIKKKKKMAP(SEQI DNO:123);流感病毒NS1的序列DRLRR(SEQIDNO:124)和PKQ KKRK(SEQIDNO:125);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQIDNO:126);小鼠Mx1蛋白的序列REKKKFLKRR(SEQIDNO: 127);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSK K(SEQIDNO:128);以及类固醇激素受体(人)糖皮质激素的序列RK CLQAGMNLEARKTKK(SEQIDNO:129)。一般来讲,NLS(或多个 NLS)具有足够的强度来驱动CasZ蛋白在真核细胞的细胞核中以可检测的量积累。可通过任何合适的技术执行细胞核中的积累的检测。例如,可检测标记物可与CasZ蛋白融合,使得细胞内的位置可被可视化。也可从细胞中分离细胞核,然后可通过任何合适的检测蛋白质的方法(诸如免疫组织化学、蛋白质印迹或酶活性测定)分析细胞核的内容物。也可间接确定细胞核中的积累。
在一些情况下,CasZ融合多肽包含“蛋白转导结构域”或PTD(又称为CPP–细胞穿透肽),其是指促进横穿脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机化合物或无机化合物。连接至另一个分子(所述分子可在小极性分子至大的高分子和/或纳米颗粒的范围内)的PTD促进分子横穿膜,例如从细胞外空间进入细胞内空间或从胞质溶胶进入细胞器内。在一些实施方案中, PTD与多肽的氨基末端共价连接(例如,与野生型CasZ连接以生成融合蛋白,或与变体CasZ蛋白(诸如dCasZ、切口酶CasZ或嵌合CasX 蛋白)连接以生成融合蛋白)。在一些实施方案中,PTD与多肽的羧基末端共价连接(例如,与野生型CasZ连接以生成融合蛋白,或与变体 CasZ蛋白(诸如dCasZ、切口酶CasZ或嵌合CasZ蛋白)连接以生成融合蛋白)。在一些情况下,PTD在合适的插入位点处内插在CasZ融合多肽中(即,不在CasZ融合多肽的N末端或C末端)。在一些情况下,主题CasZ融合多肽包含(缀合至、融合至)一个或多个PTD(例如,两个或更多个、三个或更多个、四个或更多个PTD)。在一些情况下, PTD包含核定位信号(NLS)(例如,在一些情况下,2个或更多个、3 个或更多个、4个或更多个或者5个或更多个NLS)。因此,在一些情况下,CasZ融合多肽包含一个或多个NLS(例如,2个或更多个、 3个或更多个、4个或更多个或者5个或更多个NLS)。在一些情况下, PTD与核酸(例如,CasZ指导核酸、编码CasZ指导核酸的多核苷酸、编码CasZ融合多肽的多核苷酸、供体多核苷酸等)共价连接。PTD的实例包括但不限于最小十一氨基酸多肽蛋白转导结构域(对应于包含 YGRKKRRQRRR;SEQIDNO:130的HIV-1TAT的残基47-57);包含足以直接进入细胞中的数量的精氨酸(例如,3个、4个、5个、6 个、7个、8个、9个、10个或10-50个精氨酸)的聚精氨酸序列;VP22 结构域(Zender等人(2002)Cancer Gene Ther.9(6):489-96);果蝇触角足基因(Antennapedia)蛋白转导结构域(Noguchi等人(2003) Diabetes52(7):1732-1737);截短的人降钙素肽(Trehin等人 (2004)Pharm.Research21:1248-1256);聚赖氨酸(Wender等人 (2000)Proc.Natl.Acad.Sci.USA97:13003-13008);RRQRRTSKLMKR(SEQIDNO:131);运输蛋白(Transportan) GWTLNSAGYLLGKINLKALAALAKKIL(SEQIDNO:132);KALAWEAKLAKALAKALAKHLAKALAKALKCEA (SEQIDNO:133);和RQIKIWFQNRRMKWKK(SEQIDNO:134)。示例性PTD包括但不限于:YGRKKRRQRRR(SEQIDNO:130); RKKRRQRRR(SEQIDNO:135);具有3个精氨酸残基至50个精氨酸残基的精氨酸均聚物;示例性PTD结构域氨基酸序列包括但不限于以下序列中的任一个:YGRKKRRQRRR(SEQIDNO:130); RKKRRQRR(SEQIDNO:136);YARAAARQARA(SEQIDNO:137); THRLPRRRRRR(SEQIDNO:138);和GGRRARRRRRR(SEQIDNO:139)。在一些实施方案中,PTD是可激活的CPP(ACPP)(Aguilera等人(2009)Integr Biol(Camb)6月;1(5-6):371-381)。ACPP包括经由可切割接头连接至匹配聚阴离子(例如,Glu9或“E9”)的聚阳离子CPP (例如,Arg9或“R9”),这使净电荷减小至接近零并由此抑制粘附和吸收到细胞中。当切割接头时,释放聚阴离子,局部暴露聚精氨酸和其固有的粘附性,从而“激活”ACPP以横穿膜。
接头(例如,用于融合配偶体)
在一些情况下,主题CasZ蛋白经由接头多肽(例如,一个或多个接头多肽)与融合配偶体融合。接头多肽可具有多种氨基酸序列中的任一种。蛋白质可通过间隔肽连接,间隔肽通常具有柔性性质,但不排除其他化学键。合适的接头包括长度在4个氨基酸与40个氨基酸之间或者长度在4个氨基酸与25个氨基酸之间的多肽。这些接头可通过使用合成的编码接头的寡核苷酸来产生以偶联蛋白质,或者可由编码融合蛋白的核酸序列编码。可使用具有一定程度柔性的肽接头。连接肽实际上可具有任何氨基酸序列,应记住优选的接头将具有产生总体上柔性的肽的序列。小氨基酸(诸如甘氨酸和丙氨酸)的用途用于产生柔性肽。对于本领域技术人员来说,产生此类序列是常规的。多种不同的接头是可商购获得的并且被认为是适合使用的。
接头多肽的实例包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物 (包括例如(GS)n、GSGGSn(SEQIDNO:140)、GGSGGSn(SEQIDNO: 141)和GGGSn(SEQIDNO:142),其中n是至少为1的整数)、甘氨酸 -丙氨酸聚合物、丙氨酸-丝氨酸聚合物。示例性接头可包含氨基酸序列,所述氨基酸序列包括但不限于GGSG(SEQIDNO:143)、GGSGG (SEQIDNO:144)、GSGSG(SEQIDNO:145)、GSGGG(SEQIDNO:146)、 GGGSG(SEQIDNO:147)、GSSSG(SEQIDNO:148)等。普通技术人员将认识到,与任何所需元件缀合的肽的设计可包括全部或部分柔性的接头,使得接头可包括柔性接头以及赋予较少柔性结构的一个或多个部分。
可检测标记
在一些情况下,本公开的CasZ多肽包含(例如,可连接/融合至) 可检测标记。可提供可检测信号的合适的可检测标记和/或部分可包括但不限于酶、放射性同位素、特异性结合对的成员、荧光团、荧光蛋白、量子点等。
合适的荧光蛋白包括但不限于绿色荧光蛋白(GFP)或其变体、 GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强型GFP(EGFP)、增强型CFP(ECFP)、增强型 YFP(EYFP)、GFPS65T、Emerald、Topaz(TYFP)、Venus、Citrine、mCitrine、GFPuv、去稳定化EGFP(dEGFP)、去稳定化ECFP(dECFP)、去稳定化EYFP(dEYFP)、mCFPm、Cerulean、T-Sapphire、CyPet、 YPet、mKO、HcRed、t-HcRed、DsRed、DsRed2、DsRed-单体、J-Red、二聚体2、t-二聚体2(12)、mRFP1、pocilloporin、海肾GFP(Renilla GFP)、MonsterGFP、paGFP、Kaede蛋白和点燃蛋白(kindling protein)、藻胆蛋白和藻胆蛋白缀合物(包括B-藻红蛋白、R-藻红蛋白和别藻蓝蛋白)。荧光蛋白的其他实例包括mHoneydew、mBanana、mOrange、dTomato、 tdTomato、mTangerine、mStrawberry、mCherry、mGrape1、mRaspberry、 mGrape2、mPlum(Shaner等人(2005)Nat.Methods2:905-909)等。如在例如Matz等人(1999)Nature Biotechnol.17:969-973中所述的来自珊瑚虫物种的多种荧光蛋白和有色蛋白中的任一种是适合使用的。
合适的酶包括但不限于辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、β-半乳糖苷酶(GAL)、葡萄糖-6-磷酸脱氢酶、β-N-乙酰氨基葡糖苷酶、β-葡糖醛酸糖苷酶、转化酶、黄嘌呤氧化酶、萤火虫荧光素酶、葡萄糖氧化酶(GO)等。
原间隔序列相邻基序(PAM)
天然CasZ蛋白在由靶向DNA的RNA与靶DNA之间的互补性区域限定的靶序列处与靶DNA结合。与许多CRISPR内切核酸酶的情况一样,双链靶DNA的位点特异性结合(和/或切割)发生在由以下二者确定的位置处:(i)指导RNA与靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序[称为原间隔序列相邻基序(PAM)]。
在一些情况下,CasZ蛋白的PAM直接位于靶DNA的非互补链的靶序列的5'端(也称为非靶链;互补链与指导RNA的指导序列杂交,而非互补链不直接与指导RNA杂交并且是非互补链的反向互补物)。在一些情况下(例如,对于CasZc),非互补链的PAM序列为5'-TTA-3'。在一些情况下(例如,对于CasZb),非互补链的PAM序列为5'-TTTN-3'。在一些情况下(例如,对于CasZb),非互补链的PAM序列为5'-TTTA-3'。
在一些情况下,不同的CasZ蛋白(即,来自各种物种的CasZ蛋白)可有利地用于各种所提供的方法中以便利用不同的CasZ蛋白的各种酶特征(例如,用于不同PAM序列偏好;用于增加的或降低的酶活性;用于增加的或降低的细胞毒性水平;用于改变NHEJ、同源定向修复、单链断裂、双链断裂等之间的平衡;利用短的总序列等)。来自不同物种的CasZ蛋白可能需要靶DNA中的不同的PAM序列。因此,对于所选择的具体CasZ蛋白,PAM序列偏好可与上述一个或多个序列不同。用于鉴定适当的PAM序列的各种方法(包括计算机模拟方法和/或湿实验室方法(wet lab methods))是本领域已知且常规的,并且可使用任何便利的方法。
CasZ指导RNA
与CasZ蛋白结合形成核糖核蛋白复合物(RNP)并将复合物靶向靶核酸(例如,靶DNA)内的特定位置的核酸分子在本文中称为“CasZ 指导RNA”或者简称为“指导RNA”。应理解,在一些情况下,可制备杂交体DNA/RNA,使得CasZ指导RNA除RNA碱基外还包含DNA 碱基,但术语“CasZ指导RNA”仍然用于涵盖本文的这种分子。
可以说CasZ指导RNA包含两个区段,即靶向区段和蛋白质结合区段。CasZ指导RNA的靶向区段包含与靶核酸(例如,靶ssRNA、靶ssDNA、双链靶DNA的互补链等)内的特定序列(靶位点)互补(并因此杂交)的核苷酸序列(指导序列)。蛋白质结合区段(或“蛋白质结合序列”)与CasZ多肽相互作用(结合)。主题CasZ指导RNA的蛋白质结合区段包含彼此杂交以形成双链RNA双链体(dsRNA双链体)的两段互补核苷酸。靶核酸(例如,基因组DNA)的位点特异性结合和/或切割可发生在由CasZ指导RNA(CasZ指导RNA的指导序列)与靶核酸之间的碱基配对互补性确定的位置(例如,靶基因座的靶序列)处。
CasZ指导RNA和CasZ蛋白(例如,融合CasZ多肽)形成复合物 (例如,通过非共价相互作用结合)。CasZ指导RNA通过包含靶向区段为复合物提供靶特异性,所述靶向区段包含指导序列(与靶核酸序列互补的核苷酸序列)。复合物的CasZ蛋白提供位点特异性活性(例如,由CasZ蛋白提供的切割活性和/或在嵌合CasZ蛋白的情况下由融合配偶体提供的活性)。换句话讲,CasZ蛋白由于其与CasZ指导RNA的缔合而被导向至靶核酸序列(例如,靶序列)。
可修饰“指导序列”,也称为CasZ指导RNA的“靶向序列”,使得 CasZ指导RNA可将CasZ蛋白(例如,天然存在的CasZ蛋白、融合 CasZ多肽(嵌合CasZ)等)靶向任何所需的靶核酸的任何所需序列,除了(例如,如本文所述)可考虑PAM序列之外。因此,例如,CasZ指导RNA可具有与真核细胞中的核酸中的序列互补(例如,可与其杂交) 的指导序列,所述核酸例如是病毒核酸、真核核酸(例如,真核染色体、染色体序列、真核RNA等)等。
在一些情况下,CasZ指导RNA具有30个核苷酸(nt)或更多个(例如,35个nt或更多个、40个nt或更多个、45个nt或更多个、50个 nt或更多个、55个nt或更多个或者60个nt或更多个)的长度。在一些实施方案中,CasZ指导RNA具有40个核苷酸(nt)或更多个(例如, 45个nt或更多个、50个nt或更多个、55个nt或更多个或者60个 nt或更多个)的长度。在一些情况下,CasZ指导RNA具有30个核苷酸(nt)至100个nt(例如,30-90个、30-80个、30-75个、30-70个、 30-65个、40-100个、40-90个、40-80个、40-75个、40-70个或40-65 个nt)的长度。在一些情况下,CasZ指导RNA具有40个核苷酸(nt) 至100个nt(例如,40-90个、40-80个、40-75个、40-70个或40-65 个nt)的长度。
CasZ指导RNA的指导序列
主题CasZ指导RNA包含指导序列(即,靶向序列),其是与靶核酸中的序列(靶位点)互补的核苷酸序列。换句话讲,CasZ指导RNA 的指导序列可通过杂交(即,碱基配对)以序列特异性方式与靶核酸(例如,双链DNA(dsDNA)、单链DNA(ssDNA)、单链RNA(ssRNA)或双链RNA(dsRNA))相互作用。CasZ指导RNA的指导序列可被修饰 (例如,通过遗传工程)/设计成与靶核酸(例如,真核靶核酸,诸如基因组DNA)内的任何所需靶序列杂交(例如,当考虑PAM时,例如,当靶向dsDNA靶时)。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为60%或更高(例如,65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在靶核酸的靶位点最3'端的七个连续核苷酸上为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、 95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17 个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、 21个或更多个、22个或更多个)连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、 80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、 21个或更多个、22个或更多个)连续核苷酸上为80%或更高(例如, 85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为90%或更高(例如,95%或更高、 97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为 100%。
在一些实施方案中,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为 90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为100%。
在一些实施方案中,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为 90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为100%。
在一些情况下,指导序列具有在17-30个核苷酸(nt)(例如,17-25 个、17-22个、17-20个、19-30个、19-25个、19-22个、19-20个、 20-30个、20-25个或20-22个nt)的范围内的长度。在一些情况下,指导序列具有在17-25个核苷酸(nt)(例如,17-22个、17-20个、19-25 个、19-22个、19-20个、20-25个或20-22个nt)的范围内的长度。在一些情况下,指导序列具有17或更多个nt(例如,18个或更多个、19 个或更多个、20个或更多个、21个或更多个或者22个或更多个nt; 19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt 等)的长度。在一些情况下,指导序列具有19个或更多个nt(例如, 20个或更多个、21个或更多个或者22个或更多个nt;19个nt、20 个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些情况下,指导序列具有17个nt的长度。在一些情况下,指导序列具有18个nt的长度。在一些情况下,指导序列具有19个nt的长度。在一些情况下,指导序列具有20个nt的长度。在一些情况下,指导序列具有21个nt的长度。在一些情况下,指导序列具有22个 nt的长度。在一些情况下,指导序列具有23个nt的长度。
CasZ指导RNA的蛋白质结合区段
主题CasZ指导RNA的蛋白质结合区段与CasZ蛋白相互作用。 CasZ指导RNA通过上文提及的指导序列将结合的CasZ蛋白导向至靶核酸内的特定核苷酸序列。CasZ指导RNA的蛋白质结合区段包含两段核苷酸,它们彼此互补并杂交形成双链RNA双链体(dsRNA双链体)。因此,蛋白质结合区段包含dsRNA双链体。
在一些情况下,dsRNA双链体区包含5-25个碱基对(bp)的范围 (例如,5-22个、5-20个、5-18个、5-15个、5-12个、5-10个、5-8 个、8-25个、8-22个、8-18个、8-15个、8-12个、12-25个、12-22 个、12-18个、12-15个、13-25个、13-22个、13-18个、13-15个、 14-25个、14-22个、14-18个、14-15个、15-25个、15-22个、15-18 个、17-25个、17-22个或17-18个bp,例如5个bp、6个bp、7个 bp、8个bp、9个bp、10个bp等)。在一些情况下,dsRNA双链体区包含6-15个碱基对(bp)的范围(例如,6-12个、6-10个或6-8个bp,例如6个bp、7个bp、8个bp、9个bp、10个bp等)。在一些情况下,双链体区包含5个或更多个bp(例如,6个或更多个、7个或更多个或者8个或更多个bp)。在一些情况下,双链体区包含6个或更多个bp(例如,7个或更多个或者8个或更多个bp)。在一些情况下,并非双链体区的所有核苷酸都是配对的,并且因此双链体形成区域可包含凸起。本文中的术语“凸起”用于意指一段核苷酸(其可以是一个核苷酸或多个核苷酸),这段核苷酸对双链双链体没有贡献,但是在 5'端和3'端被有贡献的核苷酸围绕,并且因此凸起被认为是双链体区的一部分。在一些情况下,dsRNA包含1个或更多个凸起(例如,2 个或更多个、3个或更多个、4个或更多个凸起)。在一些情况下,dsRNA 双链体包含2个或更多个凸起(例如,3个或更多个、4个或更多个凸起)。在一些情况下,dsRNA双链体包含1-5个凸起(例如,1-4个、 1-3个、2-5个、2-4个或2-3个凸起)。
因此,在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-100%的互补性(例如,75%-100%、80%-10%、85%-100%、 90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-100%的互补性(例如, 75%-100%、80%-10%、85%-100%、90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有 85%-100%的互补性(例如,90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-95%的互补性(例如,75%-95%、80%-95%、85%-95%、90%-95%的互补性)。
换句话讲,在一些实施方案中,dsRNA双链体包含彼此具有 70%-100%的互补性(例如,75%-100%、80%-10%、85%-100%、 90%-100%、95%-100%的互补性)的两段核苷酸。在一些情况下, dsRNA双链体包含彼此具有85%-100%的互补性(例如,90%-100%、95%-100%的互补性)的两段核苷酸。在一些情况下,dsRNA双链体包含彼此具有70%-95%的互补性(例如,75%-95%、80%-95%、85%-95%、 90%-95%的互补性)的两段核苷酸。
相对于天然存在的双链体区,主题CasZ指导RNA的双链体区可包含一个或多个(1个、2个、3个、4个、5个等)突变。例如,在一些情况下,可维持碱基对,同时对每个区段的碱基对有贡献的核苷酸可以是不同的。在一些情况下,与(天然存在的CasZ指导RNA的) 天然存在的双链体区相比,主题CasZ指导RNA的双链体区包含更多配对的碱基、更少配对的碱基、更小的凸起、更大的凸起、更少的凸起、更多的凸起或它们的任何方便的组合。
各种Cas9指导RNA和cpf1指导RNA的实例可在本领域中找到,并且在一些情况下,与引入Cas9指导RNA中的那些相似的变型也可引入本公开的CasZ指导RNA中(例如,dsRNA双链体区的突变、5' 或3'末端的延伸以用于增加稳定性以提供与另一种蛋白质的相互作用,等)。例如,参见Jinek等人,Science.2012年8月17 日;337(6096):816-21;Chylinski等人,RNABiol.2013年5 月;10(5):726-37;Ma等人,Biomed Res Int.2013;2013:270805;Hou等人,Proc Natl Acad Sci USA.2013年9月24日;110(39):15644-9;Jinek 等人,Elife.2013;2:e00471;Pattanayak等人,Nat Biotechnol.2013年9 月;31(9):839-43;Qi等人,Cell.2013年2月28日;152(5):1173-83;Wang 等人,Cell.2013年5月9日;153(4):910-8;Auer等人,Genome Res.2013 年10月31日;Chen等人,Nucleic Acids Res.2013年11月1 日;41(20):e19;Cheng等人,Cell Res.2013年10月;23(10):1163-71;Cho 等人,Genetics.2013年11月;195(3):1177-80;DiCarlo等人,Nucleic Acids Res.2013年4月;41(7):4336-43;Dickinson等人,Nat Methods.2013年10月;10(10):1028-34;Ebina等人,SciRep.2013;3:2510; Fujii等人,Nucleic Acids Res.2013年11月1日;41(20):e187;Hu等人, Cell Res.2013年11月;23(11):1322-5;Jiang等人,Nucleic Acids Res.2013年11月1日;41(20):e188;Larson等人,Nat Protoc.2013年 11月;8(11):2180-96;Mali等人,NatMethods.2013年10 月;10(10):957-63;Nakayama等人,Genesis.2013年12月;51(12):835-43; Ran等人,Nat Protoc.2013年11月;8(11):2281-308;Ran等人,Cell.2013 年9月12日;154(6):1380-9;Upadhyay等人,G3(Bethesda).2013年12 月9日;3(12):2233-8;Walsh等人,Proc Natl Acad Sci USA.2013年9 月24日;110(39):15514-5;Xie等人,MolPlant.2013年10月9日;Yang 等人,Cell.2013年9月12日;154(6):1370-9;Briner等人,MolCell.2014 年10月23日;56(2):333-9;以及以下美国专利和专利申请:8,906,616; 8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965; 8,771,945;8,697,359;20140068797;20140170753;20140179006; 20140179770;20140186843;20140186919;20140186958;20140189896; 20140227787;20140234972;20140242664;20140242699;20140242700; 20140242702;20140248702;20140256046;20140273037;20140273226;20140273230;20140273231;20140273232;20140273233;20140273234; 20140273235;20140287938;20140295556;20140295557;20140298547; 20140304853;20140309487;20140310828;20140310830;20140315985; 20140335063;20140335620;20140342456;20140342457;20140342458; 20140349400;20140349405;20140356867;20140356956;20140356958;20140356959;20140357523;20140357530;20140364333;和 20140377868;所述文献全部特此以引用方式整体并入。
CasZ指导RNA包含指导序列和杂交形成蛋白质结合区段的 dsRNA双链体的两段核苷酸(“双链体形成区段”)。给定的CasZ指导 RNA的特定序列可以是其中发现crRNA的物种的特征。本文提供合适的CasZ指导RNA的实例。
示例性指导RNA序列
表1和表3中显示天然存在的CasZ蛋白的crRNA的重复序列 (CasZ指导RNA的非指导序列部分)(例如,参见图1和图7)。
表1.CasZ蛋白的crRNA重复序列
Figure BDA0002562709270000531
Figure BDA0002562709270000541
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA 包含与表1或表3的crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ 指导RNA包含与表1或表3的crRNA序列具有90%或更高的同一性 (例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZa、CasZb、 CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa、 CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA 序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ 指导RNA包含与表1或表3的CasZa、CasZb、CasZc、CasZd、CasZe、 CasZf、CasZg、CasZh或CasZi crRNA序列具有80%或更高的同一性 (例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa、CasZb、CasZc、 CasZd、CasZe、CasZf、CasZg、CasZh或CasZicrRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZa crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZa crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZb crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZb crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZb crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZb crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZc crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZc crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZc crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZc crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZd crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZd crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZd crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZd crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZe crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZe crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZe crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZe crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZf crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZf crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZf crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZf crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZg crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZg crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZg crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZg crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZh crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZh crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZh crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZh crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZi crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZi crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZi crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZi crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZj crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZj crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZk crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZk crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题 CasZ指导RNA包含与表1或表3的CasZk crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZk crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZl crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA 序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZj、CasZl或 CasZk crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1 或表3的CasZj、CasZl或CasZk crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3 的CasZj、CasZl或CasZk crRNA序列具有80%或更高的同一性(例如, 85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ 指导RNA包含与表1或表3的CasZj、CasZl或CasZkcrRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、 98%或更高或100%的同一性)的核苷酸序列。
CasZ反式激活非编码RNA(trancRNA)
本公开的组合物和方法包括CasZ反式激活非编码RNA (“trancRNA”;在本文中也称为“CasZ trancRNA”)。在一些情况下, trancRNA与本公开的CasZ多肽和CasZ指导RNA形成复合物。可将trancRNA鉴定为由CasZ基因座中存在的核苷酸序列编码的高度转录的RNA。编码trancRNA的序列通常位于cas基因与CasZ基因座的阵列(重复序列)之间(例如,可位于重复序列附近)。以下实例说明了CasZ trancRNA的检测。在一些情况下,CasZ trancRNA与CasZ 多肽共免疫沉淀(形成复合物)。在一些情况下,系统功能需要CasZ trancRNA的存在。与trancRNA相关的数据(例如,trancRNA的表达及其在天然存在的阵列上的位置)在下面的实施例部分中提供。
在一些情况下,CasZ trancRNA具有60个核苷酸(nt)至270个nt (例如,60-260个、70-270个、70-260个或75-255个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZatrancRNA)具有60-150个 nt(例如,60-140个、60-130个、65-150个、65-140个、65-130个、70-150个、70-140个或70-130个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZatrancRNA)具有70-130个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA)具有约80个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA)具有约 90个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA) 具有约120个nt的长度。
在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有 85-240个nt(例如,85-230个、85-220个、85-150个、85-130个、95-240 个、95-230个、95-220个、95-150个或95-130个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有95-120个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约105个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约115个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约215个nt的长度。
在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有 80-275个nt(例如85-260个nt)的长度。在一些情况下,CasZ trancRNA (例如,CasZc trancRNA)具有80-110个nt(例如85-105个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有235-270 个nt(例如240-260个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZctrancRNA)具有约95个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有约250个nt的长度。
示例性trancRNA序列
表2中显示天然存在的CasZ蛋白的trancRNA序列的实例。
表2.CasZ trancRNA序列
Figure BDA0002562709270000621
Figure BDA0002562709270000631
在一些情况下,主题CasZ trancRNA包含以上CasZa trancRNA 序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、 97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有60-150 个nt(例如,60-140个、60-130个、65-150个、65-140个、65-130个、 70-150个、70-140个或70-130个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZb trancRNA 序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、 97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有85-240 个nt(例如,85-230个、85-220个、85-150个、85-130个、95-240个、 95-230个、95-220个、95-150个或95-130个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZc trancRNA 序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、 97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有80-110 个nt(例如,85-105个nt)或235-270个nt(例如,240-260个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZa、CasZb或 CasZc trancRNA序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa、CasZb或CasZc trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、 95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa、CasZb 或CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、 90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或 100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA 包含与以上CasZa、CasZb或CasZc trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或 100%的同一性)的核苷酸序列。在一些情况下,主题CasZtrancRNA 包含与以上CasZa、CasZb或CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、 97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有 60个核苷酸(nt)至270个nt(例如,60-260个、70-270个、70-260个或75-255个nt)的长度。
在一些情况下,CasZ trancRNA包含修饰的核苷酸(例如,甲基化的核苷酸)。在一些情况下,CasZ trancRNA包含以下一项或多项:i) 碱基修饰或取代;ii)骨架修饰;iii)修饰的核苷间键;和iv)修饰的糖部分。下文描述可能的核酸修饰。
CASZ系统
本公开提供一种CasZ系统。本公开的CasZ系统可包含以下一项或多项:(1)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)或编码CasZ trancRNA的核酸(例如表达载体);(2) CasZ蛋白(例如,野生型蛋白、变体、催化受损的变体、CasZ融合蛋白等)或编码CasZ蛋白的核酸(例如,RNA、表达载体等);以及(3)CasZ 指导RNA(其与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性,例如可与真核基因组的靶序列结合的指导RNA)或编码CasZ指导 RNA的核酸)(例如,表达载体)。CasZ系统可包含宿主细胞(例如,真核细胞、植物细胞、哺乳动物细胞、人细胞),所述宿主细胞包含(1)、 (2)和(3)中的一者或多者(任意组合),例如,在一些情况下,宿主细胞包含trancRNA和/或编码trancRNA的核酸。在一些情况下,CasZ系统包含(例如,除以上项之外)供体模板核酸。在一些情况下,CasZ系统是一种或多种核酸(例如,一种或多种编码以上项的任何组合的表达载体)的系统。
核酸
本公开提供一种或多种核酸,所述一种或多种核酸包含以下一项或多项:CasZtrancRNA序列、编码CasZ trancRNA的核苷酸序列、编码CasZ多肽(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ 蛋白、嵌合CasZ蛋白/CasZ融合蛋白等)的核苷酸序列、CasZ指导RNA序列、编码CasZ指导RNA的核苷酸序列和供体多核苷酸(供体模板、供体DNA)序列。在一些情况下,主题核酸(例如,一种或多种核酸)是重组表达载体(例如,质粒、病毒载体、微环DNA等)。在一些情况下,编码CasZ trancRNA的核苷酸序列、编码CasZ蛋白的核苷酸序列和/或编码CasZ指导RNA的核苷酸序列可操作地连接至启动子(例如,诱导型启动子),例如可在选择的细胞类型(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、灵长类动物细胞、啮齿动物细胞、人细胞等)中操作的启动子。
在一些情况下,编码本公开的CasZ多肽的核苷酸序列是密码子优化的。这种类型的优化可能需要编码CasZ的核苷酸序列的突变以模拟预期的宿主生物体或细胞同时编码相同蛋白质时的密码子偏好。因此,密码子可改变,但编码的蛋白质保持不变。例如,如果预期的靶细胞是人细胞,可使用人密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是小鼠细胞,则可生成小鼠密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是植物细胞,则可生成植物密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是昆虫细胞,则可生成昆虫密码子优化的编码CasZ的核苷酸序列。
本公开提供一种或多种重组表达载体,所述一种或多种重组表达载体包含(在一些情况下在不同的重组表达载体中,并且在一些情况下在相同的重组表达载体中):CasZtrancRNA序列、编码CasZ trancRNA的核苷酸序列、编码CasZ多肽(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白/CasZ融合蛋白等) 的核苷酸序列、CasZ指导RNA序列、编码CasZ指导RNA的核苷酸序列和供体多核苷酸(供体模板、供体DNA)序列。在一些情况下,主题核酸(例如,一种或多种核酸)是重组表达载体(例如,质粒、病毒载体、微环DNA等)。在一些情况下,编码CasZ trancRNA的核苷酸序列、编码CasZ蛋白的核苷酸序列和/或编码CasZ指导RNA的核苷酸序列可操作地连接至启动子(例如,诱导型启动子),例如可在选择的细胞类型(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、灵长类动物细胞、啮齿动物细胞、人细胞等)中操作的启动子。
合适的表达载体包括病毒表达载体(例如,基于以下病毒的病毒载体:牛痘病毒;脊髓灰质炎病毒;腺病毒(参见例如Li等人,Invest Opthalmol Vis Sci 35:25432549,1994;Borras等人,Gene Ther 6:515524, 1999;Li和Davidson,PNAS92:77007704,1995;Sakamoto等人,HGene Ther 5:10881097,1999;WO94/12649、WO93/03769;WO93/19191;WO94/28938;WO95/11984和WO95/00655);腺相关病毒(AAV)(参见例如Ali等人,Hum GeneTher 9:8186,1998;Flannery等人, PNAS94:69166921,1997;Bennett等人,InvestOpthalmol Vis Sci 38:28572863,1997;Jomary等人,Gene Ther 4:683690,1997;Rolling等人,Hum Gene Ther 10:641648,1999;Ali等人,Hum Mol Genet 5:591594,1996;Srivastava的WO93/09239;Samulski等人,J.Vir.(1989) 63:3822-3828;Mendelson等人,Virol.(1988)166:154-165;以及Flotte 等人,PNAS(1993)90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见例如,Miyoshi等人,PNAS94:1031923,1997;Takahashi 等人,JVirol 73:78127816,1999);逆转录病毒载体(例如,鼠白血病病毒、脾坏死病毒和源自诸如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人免疫缺陷病毒、骨髓增生肉瘤病毒以及乳腺肿瘤病毒的逆转录病毒的载体)等。在一些情况下,本公开的重组表达载体是重组腺相关病毒(AAV)载体。在一些情况下,本公开的重组表达载体是重组慢病毒载体。在一些情况下,本公开的重组表达载体是重组逆转录病毒载体。
根据所用的宿主/载体系统,可在表达载体中使用多种合适的转录和翻译控制元件中的任一种,包括组成型启动子和诱导型启动子、转录增强子元件、转录终止子等。
在一些实施方案中,编码CasZ指导RNA的核苷酸序列可操作地连接至控制元件,例如转录控制元件,诸如启动子。在一些实施方案中,编码CasZ蛋白或CasZ融合多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,诸如启动子。
转录控制元件可以是启动子。在一些情况下,启动子是组成型活性启动子。在一些情况下,启动子是可调控启动子。在一些情况下,启动子是诱导型启动子。在一些情况下,启动子是组织特异性启动子。在一些情况下,启动子是细胞类型特异性启动子。在一些情况下,转录控制元件(例如,启动子)在所靶向细胞类型或所靶向细胞群中是功能性的。例如,在一些情况下,转录控制元件在真核细胞(例如,造血干细胞(例如,动员的外周血(mPB)CD34(+)细胞、骨髓(BM)CD34(+) 细胞等))中可以是功能性的。
真核启动子(在真核细胞中是功能性的启动子)的非限制性实例包括EF1α,来自巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、逆转录病毒的长末端重复序列(LTR)以及小鼠金属硫蛋白-I的那些启动子。选择适当的载体和启动子完全在本领域普通技术人员的水平之内。表达载体还可含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可包含用于扩增表达的适当序列。表达载体还可包含编码蛋白质标签(例如,6xHis标签、血凝素标签、荧光蛋白等)的核苷酸序列,所述蛋白质标签可融合至CasZ蛋白,从而产生嵌合CasZ多肽。
在一些情况下,编码CasZ指导RNA和/或CasZ融合多肽的核苷酸序列可操作地连接至诱导型启动子。在一些实施方案中,编码CasZ 指导RNA和/或CasZ融合蛋白的核苷酸序列可操作地连接至组成型启动子。
启动子可以是组成型活性启动子(即,组成性地处于活性/“ON”状态的启动子),它可以是诱导型启动子(即,通过外界刺激例如特定温度、化合物或蛋白质的存在控制其状态(活性/“ON”或非活性/“OFF”) 的启动子),它可以是空间限制的启动子(即,转录控制元件、增强子等)(例如,组织特异性启动子、细胞类型特异性启动子等),并且它可以是时间限制的启动子(即,启动子在胚胎发育的特定阶段过程中或在生物过程的特定阶段(例如,小鼠体内的毛囊周期)过程中处于“ON”状态或“OFF”状态)。
合适的启动子可衍生自病毒并且可因此称为病毒启动子,或者它们可衍生自任何生物,包括原核生物或真核生物。合适的启动子可用来通过任何RNA聚合酶(例如,pol I、pol II、pol III)驱动表达。示例性启动子包括但不限于SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复序列(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子诸如CMV立即早期启动子区(CMVIE)、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6) (Miyagishi等人,Nature Biotechnology 20,497-500(2002))、增强的 U6启动子(例如,Xia等人,Nucleic Acids Res.2003年9月1日;31(17))、人H1启动子(H1)等。
在一些情况下,编码CasZ指导RNA的核苷酸序列可操作地连接至(受控制于)在真核细胞中可操作的启动子(例如,U6启动子、增强的U6启动子、H1启动子等)。如本领域的普通技术人员所理解的,当使用U6启动子(例如,在真核细胞中)或另一种PolIII启动子由核酸(例如,表达载体)表达RNA(例如,指导RNA)时,如果连续存在若干个T(在RNA中编码U),则可能需要对RNA进行突变。这是因为DNA中的一串T(例如,5个T)可充当聚合酶III(PolIII)的终止子。因此,为了确保指导RNA在真核细胞中的转录,有时可能需要修饰编码指导RNA的序列以消除T的作用。在一些情况下,编码CasZ 蛋白(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白等)的核苷酸序列可操作地连接至在真核细胞中可操作的启动子(例如,CMV启动子、EF1α启动子、雌激素受体调控的启动子等)。
诱导型启动子的实例包括但不限于T7RNA聚合酶启动子、 T3RNA聚合酶启动子、异丙基-β-D-硫代半乳糖苷(IPTG)调控的启动子、乳糖诱导的启动子、热休克启动子、四环素调控的启动子、类固醇调控的启动子、金属调控的启动子、雌激素受体调控的启动子等。因此,诱导型启动子可通过分子调控,所述分子包括但不限于强力霉素;雌激素和/或雌激素类似物;IPTG等。
适合使用的诱导型启动子包括本文所述或本领域的普通技术人员已知的任何诱导型启动子。诱导型启动子的实例包括但不限于化学 /生物化学调控的启动子和物理调控的启动子,诸如醇调控的启动子、四环素调控的启动子(例如,无水四环素(aTc)-响应性启动子和其他四环素响应性启动子系统,其包括四环素阻遏蛋白(tetR)、四环素操作序列(tetO)和四环素反式激活因子融合蛋白(tTA))、类固醇调控的启动子(例如,基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子以及来自类固醇/类视黄醇/甲状腺受体超家族的启动子)、金属调控的启动子(例如,衍生自来自酵母、小鼠和人的金属硫蛋白(结合并螯合金属离子的蛋白质)基因的启动子)、发病原调控的启动子(例如,由水杨酸、乙烯或苯并噻二唑(BTH)诱导的启动子)、温度/热诱导型启动子(例如,热休克启动子)和光调控的启动子(例如,来自植物细胞的光响应性启动子)。
在一些情况下,启动子是空间限制的启动子(即,细胞类型特异性启动子、组织特异性启动子等),使得在多细胞生物体中,启动子在特定细胞子组中是活性的(即,“ON”)。空间限制的启动子也可称为增强子、转录控制元件、控制序列等。可使用任何方便的空间限制的启动子,只要启动子在靶向宿主细胞(例如,真核细胞;原核细胞)中是功能性的即可。
在一些情况下,启动子是可逆启动子。合适的可逆启动子,包括可逆诱导型启动子,在本领域中是已知的。此类可逆启动子可分离自并衍生自许多生物体,例如真核生物和原核生物。用于第二生物体的衍生自第一生物体(例如,第一原核生物和第二真核生物、第一真核生物和第二原核生物等)的可逆启动子的修饰在本领域中是众所周知的。此类可逆启动子和基于此类可逆启动子但还包含另外的控制蛋白的系统包括但不限于醇调控的启动子(例如,醇脱氢酶I(alcA)基因启动子、响应于醇反式激活因子蛋白(AlcR)的启动子等)、四环素调控的启动子(例如,包括Tet激活因子、TetON、TetOFF等的启动子系统)、类固醇调控的启动子(例如,大鼠糖皮质激素受体启动子系统、人雌激素受体启动子系统、类视黄醇启动子系统、甲状腺启动子系统、蜕皮激素启动子系统、米非司酮启动子系统等)、金属调控的启动子(例如,金属硫蛋白启动子系统等)、发病原相关的调控启动子(例如,水杨酸调控的启动子、乙烯调控的启动子、苯并噻二唑调控的启动子等)、温度调控的启动子(例如,热休克诱导型启动子(例如,HSP-70、HSP-90、大豆热休克启动子等))、光调控的启动子、合成诱导型启动子等。
将核酸(例如,DNA或RNA)(例如,包含供体多核苷酸序列的核酸、一种或多种编码CasZ蛋白和/或CasZ指导RNA和/或CasZ trancRNA的核酸等)引入宿主细胞中的方法在本领域中是已知的,并且可使用任何方便的方法来将核酸(例如,表达构建体)引入细胞中。合适的方法包括例如病毒感染、转染、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送等。
将重组表达载体引入细胞中可在促进细胞存活的任何培养基中和任何培养条件下发生。将重组表达载体引入靶细胞中可在体内或离体进行。将重组表达载体引入靶细胞中可在体外进行。
在一些情况下,CasZ蛋白可作为RNA提供。RNA可通过直接化学合成提供,或者可在体外从DNA(例如,编码CasZ蛋白的DNA) 转录。一旦合成,可通过用于将核酸引入细胞中的任何众所周知的技术(例如,微注射、电穿孔、转染等)将RNA引入细胞中。
可使用开发良好的转染技术(参见例如Angel和Yanik(2010) PLoSONE5(7):e11756);以及可从Qiagen商购获得的
Figure BDA0002562709270000721
试剂、可从Stemgent商购获得的StemfectTMRNA转染试剂盒和可从Mirus Bio LLC商购获得的
Figure BDA0002562709270000722
-mRNA转染试剂盒向细胞提供核酸。还参见Beumer等人(2008) PNAS105(50):19821-19826。
可直接向靶宿主细胞提供载体。换句话讲,使细胞与包含主题核酸的载体(例如,具有供体模板序列并编码CasZ指导RNA的重组表达载体;编码CasZ蛋白的重组表达载体等)接触,使得载体被细胞吸收。用于使细胞与作为质粒的核酸载体接触的方法(包括电穿孔、氯化钙转染、微注射和脂质体转染)在本领域中是众所周知的。对于病毒载体递送,可使细胞与包含主题病毒表达载体的病毒颗粒接触。
逆转录病毒,例如慢病毒,适用于本公开的方法。通常使用的逆转录病毒载体是“缺陷型的”,即不能产生生产性感染所需要的病毒蛋白质。而且载体的复制需要在包装细胞系中生长。为了生成包含目标核酸的病毒颗粒,通过包装细胞系将包含核酸的逆转录病毒核酸包装到病毒衣壳中。不同的包装细胞系提供待并入衣壳中的不同包膜蛋白 (嗜亲性、双嗜性或嗜异性),此包膜蛋白决定病毒颗粒对细胞的特异性(对鼠和大鼠的嗜亲性;对包括人、狗和小鼠的大多数哺乳动物细胞类型的双嗜性;以及对除了鼠细胞之外的大多数哺乳动物细胞类型的嗜异性)。适当的包装细胞系可用来确保细胞被包装的病毒颗粒靶向。将主题载体表达载体引入包装细胞系中以及采集由包装细胞系生成的病毒颗粒的方法在本领域中是众所周知的。还可通过直接微注射引入核酸(例如,RNA的注射)。
用于向靶宿主细胞提供编码CasZ指导RNA和/或CasZ多肽的核酸的载体可包括用于驱动目标核酸的表达(即,转录激活)的合适的启动子。换句话讲,在一些情况下,目标核酸将可操作地连接至启动子。所述启动子可包括遍在活化型启动子,例如CMV-β-肌动蛋白启动子;或诱导型启动子,诸如在特定细胞群中有活性或对药物(诸如四环素的)存在有响应的启动子。通过转录激活,预期转录将在靶细胞中与基础水平相比增加10倍、100倍、更通常地1000倍。另外,用于向细胞提供编码CasZ指导RNA和/或CasZ蛋白的核酸的载体可包含如下核酸序列,其在靶细胞中编码可选择标记以便鉴定已经吸收CasZ 指导RNA和/或CasZ蛋白的细胞。
包含编码CasZ多肽或CasZ融合多肽的核苷酸序列的核酸在一些情况下是RNA。因此,可将CasZ融合蛋白以RNA的形式引入细胞中。将RNA引入细胞中的方法在本领域中是已知的并且可包括例如直接注射、转染或用于引入DNA的任何其他方法。CasZ蛋白可替代地以多肽的形式向细胞提供。这种多肽可任选地融合至增加产物溶解度的多肽结构域。所述结构域可通过限定的蛋白酶切割位点(例如,通过TEV蛋白酶切割的TEV序列)连接至多肽。接头还可包括一个或多个柔性序列,例如1至10个甘氨酸残基。在一些实施方案中,融合蛋白的切割在维持产物溶解度的缓冲液中进行,例如在0.5至2M 尿素存在下、在增加溶解度的多肽和/或多核苷酸的存在下等进行。目标结构域包括核内体溶解结构域,例如流感HA结构域;和有助于产生的其他多肽,例如IF2结构域、GST结构域、GRPE结构域等。多肽可配制用于改进的稳定性。例如,肽可以是PEG化的,其中聚乙烯氧基提供在血流中的增加的寿命。
另外或可替代地,本公开的CasZ多肽可融合至多肽穿透结构域以促进被细胞吸收。许多穿透结构域在本领域中是已知的并且可用于本公开的非整合多肽,包括肽、肽模拟物和非肽运载体。例如,穿透肽可衍生自黑腹果蝇转录因子触角足基因(称为穿透蛋白)的第三α螺旋,所述第三α螺旋包含氨基酸序列RQIKIWFQNRRMKWKK (SEQIDNO:134)。作为另一个实例,穿透肽包含HIV-1tat碱性区氨基酸序列,所述氨基酸序列可包括例如天然存在的tat蛋白的氨基酸 49-57。其他穿透结构域包括聚精氨酸基序,例如HIV-1rev蛋白的氨基酸34-56的区域、九精氨酸、八精氨酸等。(参见例如Futaki等人(2003) Curr Protein PeptSci.2003年4月;4(2):87-9和446;以及Wender等人(2000)Proc.Natl.Acad.Sci.U.S.A2000年11月21日; 97(24):13003-8;公布的美国专利申请20030220334;20030083256;20030032593;和20030022831,在此以引用方式明确地并入易位肽和类肽的教导内容中)。九精氨酸(R9)序列是已表征的更有效的PTD 之一(Wender等人2000;Uemura等人2002)。可选择进行融合的位点以便优化多肽的生物活性、分泌或结合特征。将通过常规实验确定最佳位点。
本公开的CasZ多肽可在体外或通过真核细胞或通过原核细胞产生,并且它可通过解折叠(例如热变性、二硫苏糖醇还原等)进一步加工,并且可使用本领域已知的方法进一步再折叠。
不改变一级序列的目标修饰包括多肽的化学衍生化,例如酰化、乙酰化、羧化、酰胺化等。还包括糖基化的修饰,例如通过在多肽的合成和加工过程中或在进一步加工步骤中修饰多肽的糖基化形式而进行的那些修饰;例如通过将多肽暴露于影响糖基化的酶(诸如哺乳动物糖基化酶或脱糖基化酶)而进行的那些修饰。还涵盖具有磷酸化氨基酸残基例如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸的序列。
还适合包括在本公开的实施方案中的是核酸(例如,编码CasZ指导RNA、编码CasZ融合蛋白等的核酸)和蛋白质(例如,衍生自野生型蛋白质或变体蛋白质的CasZ融合蛋白),所述核酸和蛋白质已使用普通分子生物学技术和合成化学进行修饰,以便改进它们对蛋白水解降解的抗性,改变靶序列特异性,优化溶解特性,改变蛋白质活性(例如,转录调节活性、酶活性等)或使它们更合适。此类多肽的类似物包括含有除了天然存在的L-氨基酸之外的残基(例如,D-氨基酸或非天然存在的合成氨基酸)的那些多肽。D-氨基酸可取代一些或所有氨基酸残基。
可使用如本领域已知的常规方法,通过体外合成制备本公开的 CasZ多肽。可使用各种商业合成装置,例如Applied Biosystems,Inc.、 Beckman等的自动合成仪。通过使用合成仪,天然存在的氨基酸可被非天然氨基酸取代。制备的具体顺序和方式将通过方便性、经济性、所需纯度等来确定。
如果需要,可在合成过程中或在表达过程中将各种基团引入肽中,这允许连接至其他分子或表面。因此半胱氨酸可用来制备硫醚、组氨酸用于连接至金属离子络合物,羧基用于形成酰胺或酯,氨基用于形成酰胺等。
还可根据常规重组合成方法分离和纯化本公开的CasZ多肽。可由表达宿主制备裂解液,并且使用高效液相色谱法(HPLC)、排阻色谱法、凝胶电泳、亲和色谱法或其他纯化技术来纯化裂解液。大多数情况下,相对于与产物制备及其纯化的方法相关的污染物,所使用的组合物将占所需产物的20重量%或更多、更通常地75重量%或更多、优选地95重量%或更多,并且出于治疗目的通常为99.5重量%或更多。通常,百分数将基于总蛋白。因此,在一些情况下,本公开的 CasZ多肽或CasZ融合多肽具有至少80%纯度、至少85%纯度、至少90%纯度、至少95%纯度、至少98%纯度或至少99%纯度(例如,不含污染物、非CasZ蛋白质或其他大分子等)。
为了诱导对靶核酸(例如,基因组DNA)的切割或任何所需的修饰,或对与靶核酸相关联的多肽的任何所需的修饰,可向细胞提供CasZ 指导RNA和/或CasZ多肽和/或CasZtrancRNA和/或供体模板序列 (无论它们作为核酸还是多肽引入)持续约30分钟至约24小时,例如1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、 5小时、6小时、7小时、8小时、12小时、16小时、18小时、20小时或约30分钟至约24小时的任何其他时间段,这可以约每天至约每 4天的频率来重复,例如以每1.5天、每2天、每3天或约每天至约每四天的任何其他频率来重复。可一次或多次(例如一次、两次、三次或多于三次)向主题细胞提供一种或多种剂,并且在每次接触事件之后允许将细胞与所述一种或多种剂孵育持续一定时间量,例如 16-24小时,在所述时间之后用新鲜培养基替代培养基并且进一步培养细胞。
在其中向细胞提供两种或更多种不同靶向复合物(例如,与相同或不同靶核酸内的不同序列互补的两种不同CasZ指导RNA)的情况下,可同时提供(例如,作为两种多肽和/或核酸)或同时递送所述复合物。可替代地,可连续提供复合物,例如首先提供靶向复合物,接着提供第二靶向复合物等,或反之亦然。
为了改进DNA载体向靶细胞的递送,可例如通过使用脂质复合物(lipoplex)和聚合复合物(polyplex)保护DNA免受损伤,并且促进 DNA进入细胞中。因此,在一些情况下,本公开的核酸(例如,本公开的重组表达载体)可用有组织的结构(像胶束或脂质体)中的脂质覆盖。当有组织的结构与DNA复合时,它被称为脂质复合物。存在三种类型的脂质,阴离子脂质(带负电)、中性脂质或阳离子脂质(带正电)。利用阳离子脂质的脂质复合物已被证明可用于基因转移。阳离子脂质由于其正电荷,与带负电的DNA天然复合。同样由于它们的电荷,它们与细胞膜相互作用。然后发生脂质复合物的内吞作用,并且将 DNA释放到细胞质中。阳离子脂质还可防止细胞对DNA的降解。
聚合物与DNA的复合物称为聚合复合物。大多数聚合复合物由阳离子聚合物组成,并且它们的产生由离子相互作用调控。聚合复合物与脂质复合物的作用方法之间的一个巨大差异是聚合复合物不能将其DNA负载释放到细胞质中,为此,必须发生与内体溶解剂(溶解内吞作用期间产生的内体)诸如灭活的腺病毒共转染。然而,并非总是如此;诸如聚乙烯亚胺的聚合物与壳聚糖和三甲基壳聚糖一样,都有自己的内体破坏方法。
树枝状聚合物,一种球形的高度支化的大分子,也可用于遗传修饰干细胞。树枝状聚合物颗粒的表面可被官能化以改变其特性。具体地,可能构建阳离子树枝状聚合物(即,具有正表面电荷的树枝状聚合物)。当存在遗传物质(诸如DNA质粒)时,电荷互补性导致核酸与阳离子树枝状聚合物的暂时缔合。树枝状聚合物-核酸复合物在到达其目的地时,可通过内吞作用被吸收到细胞中。
在一些情况下,本公开的核酸(例如,表达载体)包含目标指导序列的插入位点。例如,核酸可包含目标指导序列的插入位点,其中所述插入位点紧邻编码CasZ指导RNA的部分的核苷酸序列,当指导序列被改变而与所需靶序列(例如,有助于指导RNA的CasZ结合方面的序列,例如,有助于CasZ指导RNA的一个或多个dsRNA双链体的序列-指导RNA的这个部分也可称为指导RNA的‘支架’或‘恒定区’)杂交时,CasZ指导RNA的所述部分不会改变。因此,在一些情况下,主题核酸(例如,表达载体)包含编码CasZ指导RNA的核苷酸序列,不同的是编码指导RNA的指导序列部分的部分是插入序列(插入位点)。插入位点是用于插入所需序列的任何核苷酸序列。用于各种技术的“插入位点”是本领域的普通技术人员已知的,并且可使用任何方便的插入位点。插入位点可用于操纵核酸序列的任何方法。例如,在一些情况下,插入位点是多克隆位点(MCS)(例如,包含一个或多个限制性酶识别序列的位点),用于不依赖于连接的克隆的位点,用于基于重组的克隆(例如,基于att位点的重组)的位点,由基于CRISPR/Cas(例如Cas9)的技术识别的核苷酸序列等。
插入位点可以是任何期望的长度,并且可取决于插入位点的类型 (例如,可取决于位点是否包含一个或多个限制性酶识别序列(以及包含多少限制性酶识别序列),位点是否包括CRISPR/Cas蛋白的靶位点等)。在一些情况下,主题核酸的插入位点的长度为3个或更多个核苷酸(nt)(例如,长度为5个或更多个、8个或更多个、10个或更多个、 15个或更多个、17个或更多个、18个或更多个、19个或更多个、20 个或更多个、或者25个或更多个、或者30个或更多个nt)。在一些情况下,主题核酸的插入位点的长度具有在2至50个核苷酸(nt)的范围内(例如,2至40个nt、2至30个nt、2至25个nt、2至20个nt、 5至50个nt、5至40个nt、5至30个nt、5至25个nt、5至20个 nt、10至50个nt、10至40个nt、10至30个nt、10至25个nt、10至20个nt、17至50个nt、17至40个nt、17至30个nt、17至25 个nt)的长度。在一些情况下,主题核酸的插入位点的长度具有在5 至40个nt的范围内的长度。
核酸修饰
在一些实施方案中,主题核酸(例如,CasZ指导RNA或trancRNA) 具有一个或多个修饰(例如,碱基修饰、骨架修饰等)以对核酸提供新的或增强的特征(例如,改进的稳定性)。核苷是碱基-糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基的两个最常见类别是嘌呤和嘧啶。核苷酸是还包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷,磷酸酯基团可连接至糖的2'、3'或5' 羟基部分。在形成寡核苷酸中,磷酸酯基团共价连接彼此相邻的核苷以形成线性聚合化合物。继而,此线性聚合化合物的各端可进一步连接以形成环状化合物,然而,线性化合物是合适的。另外,线性化合物可具有内部核苷酸碱基互补性并且因此可以为了产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸酯基团通常被称为形成寡核苷酸的核苷间骨架。RNA和DNA的正常键或骨架是3'到5'的磷酸二酯键。
合适的核酸修饰包括但不限于:2'O甲基修饰的核苷酸、2'氟修饰的核苷酸、锁核酸(LNA)修饰的核苷酸、肽核酸(PNA)修饰的核苷酸、具有硫代磷酸酯键的核苷酸和5'帽(例如,7-甲基鸟苷酸帽(m7G))。下文描述另外的细节和另外的修饰。
2'-O-甲基修饰的核苷酸(也称为2'-O-甲基RNA)是在tRNA和其他小RNA中发现的天然存在的RNA修饰,其作为转录后修饰而出现。可直接合成含有2'-O-甲基RNA的寡核苷酸。这种修饰增加 RNA:RNA双链体的Tm,但仅导致RNA:DNA稳定性的微小变化。它对于单链核糖核酸酶的攻击是稳定的,并且对DNA酶的易感性通常是DNA的5至10倍低。它通常用于反义寡核苷酸中,作为增加稳定性和对于靶信使的结合亲和力的手段。
2'氟修饰的核苷酸(例如,2'氟碱基)具有氟修饰的核糖,其增加结合亲和力(Tm)并且与天然RNA相比还赋予一定程度的相对核酸酶抗性。这些修饰通常用于核酶和siRNA中以改进在血清或其他生物体液中的稳定性。
LNA碱基具有对核糖骨架的修饰,其将碱基锁定在C3'-内部位置,这有利于RNAA型螺旋双链体几何结构。这种修饰显著增加Tm 并且还具有非常强的核酸酶抗性。可将多个LNA插入置于寡核苷酸中的除了3'末端之外的任何位置。已经描述了从反义寡核苷酸到杂交探针到SNP检测和等位基因特异性PCR的应用。由于LNA赋予Tm 的大量增加,它们还可引起引物二聚体形成以及自发夹的形成的增加。在一些情况下,并入单个寡核苷酸中的LNA的数量是10个碱基或更少。
硫代磷酸酯(PS)键(即,硫代磷酸酯键联)用硫原子取代核酸(例如,寡核苷酸)的磷酸酯骨架中的非桥接氧。这种修饰使得核苷酸间键对核酸酶降解具有抗性。可在寡核苷酸的5'或3'末端的最后3-5个核苷酸之间引入硫代磷酸酯键以抑制外切核酸酶降解。在寡核苷酸内(例如,在整个寡核苷酸中)包含硫代磷酸酯键也可帮助减少内切核酸酶的攻击。
在一些实施方案中,主题核酸具有一个或多个核苷酸,所述一个或多个核苷酸是2'-O-甲基修饰的核苷酸。在一些实施方案中,主题核酸(例如,指导RNA、tranc RNA等)具有一个或多个2'氟修饰的核苷酸。在一些实施方案中,主题核酸(例如,dsRNA、siNA等)具有一个或多个LNA碱基。在一些实施方案中,主题核酸(例如,dsRNA、 siNA等)具有通过硫代磷酸酯键连接的一个或多个核苷酸(即,主题核酸具有一个或多个硫代磷酸酯键联)。在一些实施方案中,主题核酸(例如,dsRNA、siNA等)具有5'帽(例如,7-甲基鸟苷酸帽(m7G))。在一些实施方案中,主题核酸(例如,指导RNA、tranc RNA等)具有修饰的核苷酸的组合。例如,除具有一个或多个具有其他修饰的核苷酸(例如,2'-O-甲基核苷酸和/或2'氟修饰的核苷酸和/或LNA碱基和/或硫代磷酸酯键联)之外,主题核酸(例如,指导RNA、tranc RNA等)可具有5'帽(例如,7-甲基鸟苷酸帽(m7G))。
修饰的骨架和修饰的核苷间键联
含有修饰的合适的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)的实例包括含有修饰的骨架或非天然的核苷间键联的核酸。具有修饰的骨架的核酸包括在骨架中保留磷原子的那些核酸和在骨架中不具有磷原子的那些核酸。
其中含有磷原子的合适的修饰的寡核苷酸骨架包括例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基磷酸酯(包括3'-亚烷基磷酸酯、5'-亚烷基磷酸酯和手性磷酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫羰氨基磷酸酯、硫羰烷基磷酸酯、硫羰烷基磷酸三酯,具有正常3'-5'键联的硒代磷酸酯和硼代磷酸酯、这些物质的2'-5'连接类似物以及具有反极性的那些寡核苷酸骨架,其中一个或多个核苷酸间键联为3'至3'、5'至5'或2'至2'键联。具有反极性的合适的寡核苷酸在最3'核苷酸间键处包含单个3'至3' 键联,即可为碱性(核碱基丢失或其被羟基替代)的单个反核苷残基。还包括各种盐(例如像钾或钠)、混合盐和游离酸形式。
在一些实施方案中,主题核酸包含一个或多个硫代磷酸酯和/或杂原子核苷间键联,具体地是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2- (称为亚甲基(甲基亚氨基)或MMI骨架)、-CH2-O-N(CH3)-CH2-、 -CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键联表示为-O-P(=O)(OH)-O-CH2-)。MMI型核苷间键联公开于上文提及的美国专利号5,489,677中,所述专利的公开内容以引用方式整体并入本文。合适的酰胺核苷间键联公开于美国专利号 5,602,240中,所述专利的公开内容以引用方式整体并入本文。
还合适的是具有吗啉代骨架结构的核酸,如例如美国专利号 5,034,506中所述。例如,在一些实施方案中,主题核酸包含替代核糖环的6元吗啉代环。在这些实施方案的一些实施方案中,二氨基磷酸酯或其他非磷酸二酯核苷间键联替代磷酸二酯键联。
其中不包含磷原子的合适的修饰的多核苷酸骨架具有通过短链烷基或环烷基核苷间键联、混合杂原子和烷基或环烷基核苷间键联或一个或多个短链杂原子或杂环核苷间键联形成的骨架。这些包括:具有吗啉代键联(部分地由核苷的糖部分形成)的那些骨架;硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核糖乙酰基(riboacetyl)骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰氨骨架;以及具有混合的N、O、S和CH2组成部分的其他骨架。
模拟物
主题核酸可以是核酸模拟物。当对多核苷酸应用术语“模拟物”时意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环替代在本领域中也称为糖替代。维持杂环碱基部分或修饰的杂环碱基部分用于与适当的靶核酸的杂交。一种这样的核酸(已显示出具有优良杂交特性的多核苷酸模拟物) 称为肽核酸(PNA)。在PNA中,多核苷酸的糖骨架被含酰胺的骨架替代,具体地被氨基乙基甘氨酸骨架替代。核苷酸被保留下来并且直接或间接键合至骨架的酰胺部分的氮杂氮原子。
已报道具有优良杂交特性的一种多核苷酸模拟物是肽核酸(PNA)。 PNA化合物中的骨架是给予PNA含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分直接或间接键合至骨架的酰胺部分的氮杂氮原子。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利号5,539,082;5,714,331;和5,719,262,所述专利的公开内容以引用方式整体并入本文。
已研究的另一类多核苷酸模拟物基于具有连接至吗啉代环的杂环碱基的连接吗啉代单元(吗啉代核酸)。已报道连接吗啉代核酸中的吗啉代单体单元的许多连接基团。已选择一类连接基团来得到非离子型低聚化合物。基于非离子型吗啉代的低聚化合物不太可能与细胞蛋白质有不期望的相互作用。基于吗啉代的多核苷酸是不太可能与细胞蛋白质形成不期望的相互作用的寡核苷酸的非离子型模拟物(Dwaine A.Braasch和David R.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉代的多核苷酸公开于美国专利号5,034,506中,所述专利的公开内容以引用方式整体并入本文。已制备了吗啉代类多核苷酸内的多种化合物,所述化合物具有连接单体亚单元的多种不同的连接基团。
另一类多核苷酸模拟物称为环己烯基核酸(CeNA)。通常存在于 DNA/RNA分子中的呋喃糖环被环己烯基环替代。已制备了 CeNADMT保护的亚磷酰胺单体并且用于根据经典亚磷酰胺化学性质的低聚化合物合成。已制备并且研究了完全修饰的CeNA低聚化合物和具有用CeNA修饰的特异性位置的寡核苷酸(参见Wang等人,J. Am.Chem.Soc.,2000,122,8595-8602,其公开内容以引用方式整体并入本文)。一般来讲,CeNA单体并入DNA链中增加了DNA/RNA杂交体的稳定性。CeNA寡腺苷酸与RNA和DNA互补序列形成具有与天然复合物相似的稳定性的复合物。通过NMR和圆二色性示出将 CeNA结构并入天然核酸结构中的研究以继续进行简单的构象调整。
另一种修饰包括锁核酸(LNA),其中2'-羟基连接至糖环的4'碳原子从而形成2'-C、4'-C-氧基亚甲基键联,从而形成双环糖部分。所述键可以是亚甲基(-CH2-),即桥接2’氧原子和4'碳原子的基团,其中n 为1或2(Singh等人,Chem.Commun.,1998,4,455-456,其公开内容以引用方式整体并入本文)。LNA和LNA类似物显现出与互补DNA和 RNA具有非常高的双链体热稳定性(Tm=+3℃至+10℃)、朝向3'-核酸外切降解的稳定性和良好的溶解特性。已经描述了含有LNA的有效且无毒的反义寡核苷酸(例如Wahlestedt等人,Proc.Natl.Acad.Sci. U.S.A.,2000,97,5633-5638,其公开内容以引用方式整体并入本文)。
已描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基-胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备连同其低聚化以及核酸识别特性(例如,Koshkin等人,Tetrahedron,1998,54,3607-3630,其公开内容以引用方式整体并入本文)。LNA及其制备也描述于WO98/39352和WO99/14226以及美国申请20120165514、20100216983、20090041809、 20060117410、20040014959、20020094555和20020086998中,所述专利的公开内容以引用方式整体并入本文。
修饰的糖部分
主题核酸还可包含一个或多个取代的糖部分。合适的多核苷酸包含选自以下的糖取代基团:OH;F;O-、S-或N-烷基;O-、S-或N- 烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是:O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、 O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其他合适的多核苷酸包含选自以下的糖取代基团:C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、 ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷氨基、聚烷氨基、取代的硅烷基、RNA切割基团、报告基团、嵌入剂、改进寡核苷酸的药物代谢动力学特性的基团、或改进寡核苷酸的药效动力学特性的基团,以及其他具有相似特性的取代基。合适的修饰包括2'- 甲氧基乙氧基(2'-O-CH2CH2OCH3,又称为2'-O-(2-甲氧基乙基)或 2'-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504,其公开内容以引用方式整体并入本文),即烷氧基烷氧基。另外合适的修饰包括 2'-二甲基氨基氧基乙氧基,即O(CH2)2ON(CH3)2基团,又称为 2'-DMAOE,如在下文的实施例中所述;和2'-二甲基氨基乙氧基乙氧基(在本领域中又称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE),即2'-O-CH2-O-CH2-N(CH3)2
其他合适的糖取代基团包括甲氧基(-O-CH3)、氨基丙氧基 (--OCH2CH2CH2NH2)、烯丙基(-CH2-CH=CH2)、-O-烯丙基 (--O--CH2—CH=CH2)和氟(F)。2'-糖取代基团可处于阿拉伯糖(上)位或核糖(下)位。合适的2'-阿拉伯糖修饰是2'-F。还可在低聚化合物上的其他位置上做出相似的修饰,具体地在糖的3'末端核苷上或在2'-5' 连接的寡核苷酸中的3'位置以及5'末端核苷酸的5'位置。低聚化合物还可具有替代呋喃戊糖的糖模拟物,诸如环丁基部分。
碱基修饰和取代
主题核酸还可包括核碱基(在本领域中常常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然”核碱基包括嘌呤碱基腺嘌呤 (A)和鸟嘌呤(G)以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成和天然的核碱基,诸如5-甲基胞嘧啶 (5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的 2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代基、8-氨基、8-巯基、 8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代基(具体为 5-溴代基)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3- 脱氮腺嘌呤。另外的修饰的核碱基包括三环嘧啶,诸如吩噁嗪胞苷 (1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并 (5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹诸如取代的吩噁嗪胞苷(例如 9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括其中嘌呤或嘧啶碱基被其他杂环替代的那些碱基,例如7-脱氮腺嘌呤、7-脱氮鸟苷、2-氨基吡啶和2-吡啶酮。另外的核碱基包括公开于美国专利号3,687,808中的那些、公开于The Concise Encyclopedia Of Polymer Science AndEngineering,第858-859 页,Kroschwitz,J.I.编John Wiley&Sons,1990中的那些、由Englisch 等人,Angewandte Chemie,International Edition,1991,30,613公开的那些以及由Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.编,CRCPress, 1993公开的那些,这些文献的公开内容以引用方式整体并入本文。这些核碱基中的某些可用于增加低聚化合物的结合亲和力。这些包括 5-取代的嘧啶,6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤,包括 2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示出使核酸双链体稳定性增加0.6℃-1.2℃(Sanghvi等人编Antisense Research and Applications,CRCPress,Boca Raton,1993, 第276-278页;其公开内容以引用方式整体并入本文)并且例如当与 2'-O-甲氧基乙基糖修饰组合时是适合的碱基取代。
缀合物
主题核酸的另一种可能的修饰涉及将增强寡核苷酸的活性、细胞分布或细胞吸收的一个或多个部分或缀合物化学连接至多核苷酸。这些部分或缀合物可包括共价键合至诸如伯羟基或仲羟基的官能团的缀合物基团。缀合物基团包括但不限于嵌入剂、报告分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物的药效动力学特性的基团以及增强低聚物的药物代谢动力学特性的基团。合适的缀合物基团包括但不限于胆固醇、脂质、磷脂、生物素、吩嗪、叶酸酯、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素以及染料。增强药效动力学特性的基团包括改进吸收、增强对降解的抗性和/或加强与靶核酸的序列特异性杂交的基团。增强药物代谢动力学特性的基团包括改进主题核酸的吸收、分布、代谢或排泄的基团。
缀合物部分包括但不限于脂质部分,诸如胆固醇部分(Letsinger 等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556)、胆酸(Manoharan 等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060)、硫醚例如己基-S- 三苯甲基硫醇(Manoharan等人,Ann.N.Y.Acad.Sci.,1992,660, 306-309;Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770)、巯基胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538)、脂族链例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人, EMBOJ.,1991,10,1111-1118;Kabanov等人,FEBSLett.,1990,259, 327-330;Svinarchuk等人,Biochimie,1993,75,49-54)、磷脂例如二- 十六烷基-外消旋-甘油或三乙铵1,2-二-O-十六烷基-外消旋-甘油-3-H- 磷酸酯(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654;Shea 等人,Nucl.Acids Res.,1990,18,3777-3783)、多胺或聚乙二醇链 (Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973),或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654),棕榈基部分(Mishra等人,Biochim.Biophys.Acta,1995,1264,229-237),或十八烷基胺或己基氨基-羰基-羟基胆固醇部分(Crooke等人,J. Pharmacol.Exp.Ther.,1996,277,923-937)。
缀合物可包括“蛋白转导结构域”或PTD(又称为CPP–细胞穿透肽),其可指促进横穿脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机化合物或无机化合物。连接至另一个分子(所述分子可在小极性分子至大的高分子和/或纳米颗粒的范围内)的PTD促进分子横穿膜,例如从细胞外空间进入细胞内空间或从胞质溶胶进入细胞器(例如,细胞核)内。在一些实施方案中,PTD 与外源多核苷酸的3'末端共价连接。在一些实施方案中,PTD与外源多核苷酸的5'末端共价连接。示例性PTD包括但不限于最小十一氨基酸多肽蛋白转导结构域(对应于包含YGRKKRRQRRR;SEQIDNO: 130的HIV-1TAT的残基47-57);包含足以直接进入细胞中的数量的精氨酸(例如,3个、4个、5个、6个、7个、8个、9个、10个或10-50 个精氨酸)的聚精氨酸序列;VP22结构域(Zender等人(2002)Cancer GeneTher.9(6):489-96);果蝇触角足基因蛋白转导结构域(Noguchi等人(2003)Diabetes52(7):1732-1737);截短的人降钙素肽(Trehin等人 (2004)Pharm.Research21:1248-1256);聚赖氨酸(Wender等人 (2000)Proc.Natl.Acad.Sci.USA97:13003-13008);RRQRRTSKLMKRSEQIDNO:131);运输蛋白 GWTLNSAGYLLGKINLKALAALAKKILSEQIDNO:132); KALAWEAKLAKALAKALAKHLAKALAKALKCEASEQIDNO: 133);和RQIKIWFQNRRMKWKKSEQIDNO:134)。示例性PTD包括但不限于:YGRKKRRQRRRSEQIDNO:130); RKKRRQRRRSEQIDNO:135);具有3个精氨酸残基至50个精氨酸残基的精氨酸均聚物;示例性PTD结构域氨基酸序列包括但不限于以下序列中的任一个:YGRKKRRQRRRSEQIDNO:130); RKKRRQRRSEQIDNO:136);YARAAARQARASEQIDNO:137); THRLPRRRRRRSEQIDNO:138);和GGRRARRRRRRSEQIDNO: 139)。在一些情况下,PTD是可激活的CPP(ACPP)(Aguilera等人 (2009)Integr Biol(Camb)6月;1(5-6):371-381)。ACPP包括经由可切割接头连接至匹配聚阴离子(例如,Glu9或“E9”)的聚阳离子CPP(例如,Arg9或“R9”),这使净电荷减小至接近零并由此抑制粘附和吸收到细胞中。当切割接头时,释放聚阴离子,局部暴露聚精氨酸和其固有的粘附性,从而“激活”ACPP以横穿膜。
将组分引入靶细胞中
CasZ指导RNA(或包含编码CasZ指导RNA的核苷酸序列的核酸)和/或CasZ多肽(或包含编码CasZ多肽的核苷酸序列的核酸)和/或 CasZ trancRNA(或包含编码CasZtrancRNA的核苷酸序列的核酸)和/ 或供体多核苷酸(供体模板)可通过多种众所周知的方法的任一种方法引入宿主细胞中。
可使用多种化合物和方法中的任一种化合物和方法将本公开的 CasZ系统递送至靶细胞。作为非限制性实例,本公开的CasZ系统可与脂质组合。作为另一个非限制性实例,本公开的CasZ系统可与颗粒组合或配制成颗粒。
将核酸引入宿主细胞中的方法在本领域中是已知的,并且可使用任何方便的方法来将主题核酸(例如,表达构建体/载体)引入靶细胞 (例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、人细胞等)中。合适的方法包括例如病毒感染、转染、缀合、原生质体融合、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送(参见例如, Panyam等人Adv Drug Deliv Rev.2012年9月13日.pii: S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。
在一些情况下,本公开的CasZ多肽(例如,野生型蛋白、变体蛋白、嵌合/融合蛋白、dCasZ等)作为编码CasZ多肽的核酸(例如,mRNA、 DNA、质粒、表达载体、病毒载体等)提供。在一些情况下,本公开的CasZ多肽直接作为蛋白质(例如,不与相关联的指导RNA一起或与相关联的指导RNA一起,即作为核糖核蛋白复合物)提供。可通过任何方便的方法将本公开的CasZ多肽引入细胞中(提供至细胞);此类方法是本领域的普通技术人员已知的。作为说明性实例,可将本公开的CasZ融合多肽直接注射到细胞中(例如,与或不与CasZ指导 RNA或编码CasZ指导RNA的核酸一起,并且与或不与供体多核苷酸一起,并且与或不与CasZtrancRNA一起)。作为另一个实例,可将本公开的CasZ多肽和CasZ指导RNA的预先形成的复合物(RNP) 引入细胞(例如,真核细胞)中(例如,通过注射、通过核转染;通过缀合至一种或多种组分的蛋白转导结构域(PTD),例如缀合至CasZ蛋白、缀合至指导RNA、缀合至CasZtrancRNA、缀合至本公开的CasZ多肽和指导RNA;等)。
在一些情况下,将核酸(例如,CasZ指导RNA和/或编码CasZ 指导RNA的核酸、编码CasZ蛋白的核酸、CasZ trancRNA和/或编码CasZ trancRNA的核酸等)和/或多肽(例如,CasZ多肽;CasZ融合多肽)递送至颗粒中的或与颗粒缔合的细胞(例如,靶宿主细胞)。在一些情况下,将本公开的CasZ系统递送至颗粒中的或与颗粒缔合的细胞。术语“颗粒”和“纳米颗粒”可适当地互换使用。例如,包含编码本公开的CasZ多肽的核苷酸序列和/或CasZ指导RNA的重组表达载体、包含编码本公开的CasZ多肽的核苷酸序列的mRNA以及指导RNA 可使用颗粒或脂质包膜同时递送;例如,CasZ多肽和CasZ指导RNA 和/或trancRNA,例如作为复合物(例如,核糖核蛋白(RNP)复合物) 可通过颗粒递送,例如通过包含脂质或类脂质以及亲水性聚合物(例如,阳离子脂质和亲水聚合物)的递送颗粒递送,例如,其中阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四烷酰基-sn-甘油基-3-磷酸胆碱(DMPC)并且/或者其中亲水性聚合物包括乙二醇或聚乙二醇(PEG);并且/或者其中颗粒还包含胆固醇(例如,来自制剂1的颗粒=DOTAP100、DMPC0、PEG0、胆固醇0;制剂编号2 =DOTAP90、DMPC0、PEG10、胆固醇0;制剂编号3=DOTAP90、 DMPC0、PEG5、胆固醇5)。例如,可使用多步骤方法形成颗粒,其中将CasZ多肽和CasZ指导RNA例如以1:1的摩尔比、例如在室温下、例如持续30分钟、例如在无菌无核酸酶的1x磷酸盐缓冲盐水(PBS) 中混合在一起;并且将适用于制剂的DOTAP、DMPC、PEG和胆固醇单独地溶于醇(例如,100%乙醇),并且将两种溶液混合在一起以形成含有复合物的颗粒)。
本公开的CasZ多肽(或包含编码本公开的CasZ多肽的核苷酸序列的mRNA;或包含编码本公开的CasZ多肽的核苷酸序列的重组表达载体)和/或CasZ指导RNA(或核酸,诸如一种或多种编码CasZ指导RNA的表达载体)可使用颗粒或脂质包膜同时递送。例如,可使用具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核的可生物降解的核壳结构的纳米颗粒。在一些情况下,使用基于自组装生物粘附聚合物的颗粒/纳米颗粒;此类颗粒/纳米颗粒可应用于肽的口服递送、肽的静脉内递送和肽的鼻内递送,例如递送至脑。还考虑了其他实施方案,诸如疏水性药物的口服吸收和眼部递送。可使用分子包膜技术,其涉及受保护并递送至疾病部位的工程化聚合物包膜。可以单剂量或多剂量使用约5mg/kg的剂量,这取决于各种因素,例如靶组织。
类脂质化合物(例如,如美国专利申请20110293703中所述)也可用于多核苷酸的施用,并且可用于递送本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ 系统。在一方面,将氨基醇类脂质化合物与待递送至细胞或受试者的剂组合以形成微颗粒、纳米颗粒、脂质体或胶束。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合以形成颗粒。然后可任选地将这些颗粒与药物赋形剂组合以形成药物组合物。
聚(β-氨基醇)(PBAA)可用于将本公开的CasZ多肽、本公开的 CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA 和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。美国专利公开号20130302401涉及使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。
可使用基于糖的颗粒,例如,如参考WO2014118272(以引用方式并入本文)和Nair,JK等人,2014,Journal of the American Chemical Society 136(49),16958-16961)所述的GalNAc可用于将本公开的CasZ 多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ系统递送至靶细胞。
在一些情况下,使用脂质纳米颗粒(LNP)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ 指导RNA和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。带负电的聚合物(诸如RNA)可在低pH值(例如,pH4)下装载到LNP中,其中可电离的脂质显示正电荷。然而,在生理pH值下,LNP表现出与较长的循环时间相容的低表面电荷。已经关注了四种可电离的阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。LNP的制备描述于例如Rosin等人(2011)Molecular Therapy19:1286-2200)中。可使用阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N- 二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2”-(甲氧基聚乙二醇2000) 琥珀酰基]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG),以及R-3-[(.ω.- 甲氧基-聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻酰氧基丙基-3-胺 (PEG-C-DOMG)。核酸(例如,CasZ指导RNA;本公开的核酸等)可包封在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的摩尔比为 40:10:40:10)的LNP中。在一些情况下,并入0.2%SP-DiOC18。
球形核酸(SNATM)构建体和其他纳米颗粒(特别是金纳米颗粒)可用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。参见例如Cutler等人,J.Am.Chem.Soc. 2011133:9254-9257;Hao等人,Small.20117:3158-3162;Zhang等人,ACSNano.20115:6962-6970;Cutler等人,J.Am.Chem.Soc. 2012134:1376-1391;Young等人,Nano Lett.201212:3867-71;Zheng 等人,Proc.Natl.Acad.Sci.USA.2012109:11975-80;Mirkin, Nanomedicine 20127:635-638;Zhang等人,J.Am.Chem.Soc. 2012134:16488-1691;Weintraub,Nature 2013495:S14-S16;Choi等人,Proc.Natl.Acad.Sci.USA.2013110(19):7625-7630;Jensen等人,Sci. Transl.Med.5,209ra152(2013)和Mirkin,等人,Small,10:186-192。
具有RNA的自组装纳米颗粒可用聚乙烯亚胺(PEI)构建,所述聚乙烯亚胺(PEI)用连接在聚乙二醇(PEG)远端处的Arg-Gly-Asp(RGD) 肽配体PEG化。
一般来讲,“纳米颗粒”是指具有小于1000nm的直径的任何颗粒。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或 CasZ trancRNA)或本公开的CasZ系统递送至靶细胞的纳米颗粒具有500nm或更小,例如,25nm至35nm、35nm至50nm、50nm至 75nm、75nm至100nm、100nm至150nm、150nm至200nm、200 nm至300nm、300nm至400nm或400nm至500nm的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ系统递送至靶细胞的纳米颗粒具有25nm至200nm的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ系统递送至靶细胞的纳米颗粒具有100nm 或更小的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ 系统递送至靶细胞的纳米颗粒具有35nm至60nm的直径。
适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA) 或本公开的CasZ系统递送至靶细胞的纳米颗粒可以不同的形式提供,例如,作为固体纳米颗粒(例如,金属(诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、纳米颗粒的悬浮液或它们的组合提供。可制备金属、介电和半导体纳米颗粒,以及混合结构(例如,核壳纳米颗粒)。如果由半导体材料制成的纳米颗粒足够小(通常低于10nm) 以致发生电子能级的量子化,则也可将它们标记量子点。此类纳米级颗粒在生物医学应用中用作药物运载体或成像剂,并且可适用于本公开中的相似目的。
半固体和软纳米颗粒也适用于将本公开的CasZ多肽、本公开的 CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA 和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。具有半固体性质的原型纳米颗粒是脂质体。
在一些情况下,使用外泌体将本公开的CasZ多肽、本公开的CasZ 融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/ 或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。外泌体是内源性纳米囊泡,其运输RNA和蛋白质,并且可将RNA递送至脑和其他靶器官。
在一些情况下,使用脂质体将本公开的CasZ多肽、本公开的CasZ 融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/ 或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。脂质体是球形囊泡结构,其由围绕内部水性隔室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可由若干种不同类型的脂质制成;然而,磷脂最常用于生成脂质体。尽管当脂质膜与水性溶液混合时,脂质体形成是自发的,但是也可通过使用匀化器、超声波破碎仪或挤出装置以摇动的形式施加力来加速脂质体的形成。可将若干种其他添加剂添加到脂质体中以便改变它们的结构和特性。例如,可将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定脂质体结构并防止脂质体内容物(innercargo)的泄漏。脂质体制剂可主要由以下组成:天然磷脂和脂质,诸如1,2-二硬脂酰基-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂。
可使用稳定的核酸-脂质颗粒(SNALP)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ 指导RNA和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。 SNALP制剂可含有2:40:10:48摩尔百分比的脂质3-N-[(甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基-丙胺(PEG-C-DMA)、1,2- 二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰基 -sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇。可通过使用25:1的脂质 /siRNA比和48/40/10/2摩尔比的胆固醇 /D-Lin-DMA/DSPC/PEG-C-DMA来配制D-Lin-DMA和PEG-C-DMA 以及二硬脂酰基磷脂酰胆碱(DSPC)、胆固醇和siRNA来制备SNALP 脂质体。所得的SNALP脂质体的尺寸可以是约80-100nm。SNALP 可包含合成胆固醇(Sigma-Aldrich,St Louis,Mo.,USA)、二棕榈酰磷脂酰胆碱(AvantiPolar Lipids,Alabaster,Ala.,USA)、3-N-[(w-甲氧基聚 (乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基丙胺和阳离子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷。SNALP可以包含合成胆固醇 (Sigma-Aldrich)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC;AvantiPolar Lipids Inc.)、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基) 氨基丙烷(DLinDMA)。
可使用其他阳离子脂质诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。可考虑具有以下脂质组成的预成形的囊泡:摩尔比分别为40/10/40/10 的并且FVIIsiRNA/总脂质比为大约0.05(w/w)的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基氨基甲酸酯(PEG-脂质)。为了确保在70-90nm 范围内的窄粒径分布和0.11.+-.0.04(n=56)的低多分散指数,可在添加指导RNA之前将颗粒通过80nm膜挤出最高达三次。可使用含有高效氨基脂质16的颗粒,其中四种脂质组分16、DSPC、胆固醇和 PEG-脂质的摩尔比(50/10/38.5/1.5)可进一步优化以增强体内活性。
脂质可用本公开的CasZ系统或其一种或多种组分或编码其的核酸配制以形成脂质纳米颗粒(LNP)。合适的脂质包括但不限于 DLin-KC2-DMA4、C12-200和辅脂质(colipid)二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG可用本公开的CasZ系统或其组分使用自发的囊泡形成程序配制。组分摩尔比可以是约50/10/38.5/1.5 (DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇 /PEG-DMG)。
本公开的CasZ系统或其组分可包封在PLGA微球中递送,所述微球诸如在美国公布申请20130252281和20130245107和 20130244279中进一步描述的微球。
可使用超电荷蛋白将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或 CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。超电荷蛋白是一类工程化或天然存在的蛋白质,其具有异常高的正或负净理论电荷。超负电荷蛋白和超正电荷蛋白均表现出耐受热或化学诱导的聚集的能力。超正电荷蛋白也能够穿透哺乳动物细胞。使货物与这些蛋白质 (诸如质粒DNA、RNA或其他蛋白质)缔合可实现这些大分子在体外和体内向哺乳动物细胞的功能性递送。
可使用细胞穿透肽(CPP)将本公开的CasZ多肽、本公开的CasZ 融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/ 或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞。CPP通常具有以下氨基酸组成,其含有高相对丰度的带正电荷的氨基酸(诸如赖氨酸或精氨酸),或者具有含有极性/带电荷氨基酸和非极性疏水氨基酸的交替模式的序列。
可使用可植入装置将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或 CasZ trancRNA)(例如,CasZ指导RNA、编码CasZ指导RNA的核酸、编码CasZ多肽的核酸、供体模板等)或本公开的CasZ系统递送至靶细胞(例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)。适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ 指导RNA和/或CasZ trancRNA)或本公开的CasZ系统递送至靶细胞 (例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)的可植入装置可包括容器(例如,储库、基质等),所述容器包含CasZ多肽、CasZ融合多肽、RNP或CasZ系统(或其组分,例如本公开的核酸)。
合适的可植入装置可包括例如用作装置主体的聚合物基底(诸如基质),并且在一些情况下包括另外的支架材料(诸如金属或另外的聚合物),以及增强可见性和成像的材料。可植入递送装置可有利于在局部和长时间内提供释放,其中待递送的多肽和/或核酸直接释放至靶位点,例如细胞外基质(ECM)、肿瘤周围的脉管系统、病变组织等。合适的可植入递送装置包括适用于递送至腔(诸如腹腔)和/或其中药物递送系统未锚定或附接的任何其他类型的施用的装置,所述装置包括生物稳定的和/或可降解的和/或生物可吸收的聚合物基底,其可以例如任选地是基质。在一些情况下,合适的可植入药物递送装置包含可降解聚合物,其中主要释放机制是整体侵蚀(bulk erosion)。在一些情况下,合适的可植入药物递送装置包含不可降解或缓慢降解的聚合物,其中主要释放机制是扩散而不是整体侵蚀,使得外部部分用作膜并且其内部部分用作药物储库,实际上,所述药物储库长时间内(例如约一周至约几个月)不会受到周围环境的影响。也可任选地使用具有不同释放机制的不同聚合物的组合。在总释放期的有效期内,浓度梯度可保持有效恒定,并且因此扩散速率是有效恒定的(称为“零模式”扩散)。术语“恒定”意指扩散速率维持高于治疗有效性的下阈值,但其仍然任选地以初始突发为特征并且/或者可波动,例如增加和降低到某一程度。扩散速率可长时间这样维持,并且可认为扩散速率恒定到某一水平以优化治疗有效期,例如有效的沉默期。
在一些情况下,可植入递送系统被设计成保护基于核苷酸的治疗剂免于降解,无论是化学性质还是由于受试者体内酶和其他因素的攻击而引起的降解。
可选择装置的植入位点或靶位点,用于获得最大的治疗功效。例如,递送装置可植入在肿瘤环境内或附近,或者与肿瘤相关联的血液供给内或附近。靶位置可以是,例如:1)大脑退化位点,如在帕金森病或阿尔茨海默病中在基底神经节、白质和灰质处;2)脊柱,如就肌萎缩侧索硬化症(ALS)而言;3)子宫颈;4)活动性和慢性炎症关节; 5)真皮,如就牛皮癣而言;7)交感神经和感觉神经位点,用于镇痛作用;7)骨;8)急性或慢性感染位点;9)阴道内;10)内耳-听觉系统、内耳迷路、前庭系统;11)气管内;12)心内;冠状动脉、心外膜;13)泌尿道或膀胱;14)胆系统;15)实质组织,包括但不限于肾、肝、脾; 16)淋巴结;17)唾液腺;18)牙龈;19)关节内(到关节中);20)眼内; 21)脑组织;22)脑室;23)腔,包括腹腔(例如但不限于卵巢癌);24) 食管内;和25)直肠内;和26)到脉管系统中。
插入方法(诸如植入)可任选地已经用于其他类型的组织植入和/ 或用于插入和/或用于组织取样,任选地无需修改,或者可替代地仅在此类方法中任选地进行非主要修改。此类方法任选地包括但不限于近距离放射治疗方法、活组织检查、使用和/或不使用超声的内窥镜检查(诸如进入脑组织的立体定位方法)、腹腔镜检查(包括用腹腔镜植入关节、腹部器官、膀胱壁和体腔中)。
修饰的宿主细胞
本公开提供一种修饰的细胞,所述修饰的细胞包含本公开的 CasZ多肽和/或包含编码本公开的CasZ多肽的核苷酸序列的核酸。本公开提供一种修饰的细胞,所述修饰的细胞包含本公开的CasZ多肽,其中所述修饰的细胞是通常不包含本公开的CasZ多肽的细胞。本公开提供一种修饰的细胞(例如,遗传修饰的细胞),所述修饰的细胞包含核酸,所述核酸包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用mRNA遗传修饰的遗传修饰的细胞,所述mRNA 包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰的细胞,所述重组表达载体包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰细胞,所述重组表达载体包含:a)编码本公开的 CasZ多肽的核苷酸序列;和b)编码本公开的CasZ指导RNA的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰的细胞,所述重组表达载体包含:a)编码本公开的CasZ多肽的核苷酸序列; b)编码本公开的CasZ指导RNA的核苷酸序列;和c)编码供体模板的核苷酸序列。
用作本公开的CasZ多肽和/或包含编码本公开的CasZ多肽和/或本公开的CasZ指导RNA(或编码它的核酸)和/或CasZ trancRNA(或编码它的核酸)的核苷酸序列的核酸的受体的细胞可以是多种细胞中的任一种,这些细胞包括例如体外细胞;体内细胞;离体细胞;原代细胞;癌细胞;动物细胞;植物细胞;藻类细胞;真菌细胞等。用作本公开的CasZ多肽和/或包含编码本公开的CasZ多肽和/或本公开的 CasZ指导RNA的核苷酸序列的核酸的受体的细胞被称为“宿主细胞”或“靶细胞”。宿主细胞或靶细胞可以是本公开的CasZ系统的受体。宿主细胞或靶细胞可以是本公开的CasZRNP的受体。宿主细胞或靶细胞可以是本公开的CasZ系统的单一组分的受体。
细胞(靶细胞)的非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如,来自植物作物、水果、蔬菜、谷物、大豆、玉米(corn)、玉米(maize)、小麦、种子、番茄、大米、木薯、甘蔗、南瓜、干草、马铃薯、棉花、大麻、烟草、开花植物、针叶树、裸子植物、被子植物、蕨类植物、石松类、角苔类、苔类、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、海洋富油微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、羽藻(C.agardh)等)、海藻(例如巨藻 (kelp))、真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物) 的细胞、来自哺乳动物(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物 (例如,猫);犬(例如,狗)等)的细胞等。在一些情况下,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制得的细胞;也称为人造细胞)。
细胞可以是体外细胞(例如,培养物中的细胞,例如建立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞可以是生物体内部的细胞。细胞可以是生物体。细胞可以是细胞培养物(例如,体外细胞培养物)中的细胞。细胞可以是细胞集合中的一者。细胞可以是原核细胞或衍生自原核细胞。细胞可以是细菌细胞或可衍生自细菌细胞。细胞可以是古细菌细胞或衍生自古细菌细胞。细胞可以是真核细胞或衍生自真核细胞。细胞可以是植物细胞或衍生自植物细胞。细胞可以是动物细胞或衍生自动物细胞。细胞可以是无脊椎动物细胞或衍生自无脊椎动物细胞。细胞可以是脊椎动物细胞或衍生自脊椎动物细胞。细胞可以是哺乳动物细胞或衍生自哺乳动物细胞。细胞可以是啮齿动物细胞或衍生自啮齿动物细胞。细胞可以是人细胞或衍生自人细胞。细胞可以是微生物细胞或衍生自微生物细胞。细胞可以是真菌细胞或衍生自真菌细胞。细胞可以是昆虫细胞。细胞可以是节肢动物细胞。细胞可以是原生动物细胞。细胞可以是蠕虫细胞。
合适的细胞包括干细胞(例如胚胎干(ES)细胞、诱导多能干(iPS) 细胞;生殖细胞(例如,卵母细胞、精子、卵原细胞、精原细胞等);体细胞,例如成纤维细胞、少突胶质细胞、神经胶质细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰腺细胞等。
合适的细胞包括人胚胎干细胞、胚胎心肌细胞、肌成纤维细胞、间充质干细胞、自体移植的扩增的心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓衍生祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
在一些情况下,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些情况下,免疫细胞是T细胞、B细胞、单核细胞、天然杀伤细胞、树突状细胞或巨噬细胞。在一些情况下,免疫细胞是细胞毒性T细胞。在一些情况下,免疫细胞是辅助性T细胞。在一些情况下,免疫细胞是调节性T细胞(Treg)。
在一些情况下,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为体细胞干细胞。
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是干细胞所存在于的组织中的典型细胞类型。体细胞干细胞的许多实例是本领域的技术人员已知的,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞等。
目标干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指被分类为哺乳动物的任何动物,包括人;非人灵长类动物;家畜和农场动物;以及动物园、实验室、运动或宠物动物,诸如狗、马、猫、牛、小鼠、大鼠、兔等。在一些情况下,干细胞是人干细胞。在一些情况下,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些情况下,干细胞是非人灵长类动物干细胞。
干细胞可表达一种或多种干细胞标志物,例如SOX9、KRT19、 KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、 OLFM4、CDH17和PPARGC1A。
在一些情况下,干细胞是造血干细胞(HSC)。HSC是中胚层衍生的细胞,其可从骨髓、血液、脐带血、胎儿肝脏和卵黄囊中分离。 HSC的特征在于CD34+和CD3-。HSC可在体内重新生成红系细胞、中性粒细胞-巨噬细胞、巨核细胞和淋巴样造血细胞谱系。在体外,可诱导HSC经历至少一些自我更新的细胞分裂,并且可诱导HSC分化成与体内所见相同的谱系。因此,可诱导HSC分化成红系细胞、巨核细胞、中性粒细胞、巨噬细胞和淋巴细胞中的一种或多种。
在其他情况下,干细胞是神经干细胞(NSC)。神经干细胞(NSC) 能够分化成神经元和神经胶质细胞(包括少突胶质细胞和星形胶质细胞)。神经干细胞是能够进行多次分裂的多能干细胞,并且在特定条件下可产生作为神经干细胞的子细胞,或可作为成神经细胞或成胶质细胞的神经祖细胞,例如,分别致力于成为一种或多种类型的神经元和神经胶质细胞的细胞。获得NSC的方法在本领域中是已知的。
在其他情况下,干细胞是间充质干细胞(MSC)。MSC最初衍生自胚胎中胚层并从成人骨髓中分离,可分化形成肌肉、骨、软骨、脂肪、骨髓基质和肌腱。分离MSC的方法在本领域中是已知的;并且可使用任何已知的方法来获得MSC。参见例如美国专利号5,736,396,其描述了人MSC的分离。
在一些情况下,细胞是植物细胞。植物细胞可以是单子叶植物的细胞。细胞可以是双子叶植物的细胞。
在一些情况下,细胞是植物细胞。例如,细胞可以是主要农业植物的细胞,例如大麦、豆类(干食用)、油菜、玉米、棉花(皮玛棉)、棉花(陆地棉)、亚麻籽、干草(苜蓿)、干草(非苜蓿)、燕麦、花生、大米、高粱、大豆、甜菜、甘蔗、向日葵(油)、向日葵(非油)、甘薯、烟草(白肋烟)、烟草(烤烟)、番茄、小麦(硬质小麦)、小麦(春小麦)、小麦(冬小麦)等。作为另一个实例,细胞是蔬菜作物的细胞,所述蔬菜作物包括但不限于例如,苜蓿芽、芦荟叶、葛根(arrowroot)、慈菇 (arrowhead)、朝鲜蓟、芦笋、竹笋、香蕉花、豆芽、豆类、甜菜叶、甜菜、苦瓜、白菜、西兰花、球花甘蓝(芜菁)、球芽甘蓝、卷心菜、卷心菜芽、仙人掌叶(仙人掌果)、笋瓜、刺棘蓟、胡萝卜、花椰菜、芹菜、佛手瓜、中国洋蓟(crosne)、大白菜、中国芹菜、中国韭菜、菜心、菊花叶(茼蒿(tung ho))、羽衣甘蓝、玉米秸秆、甜玉米、黄瓜、白萝卜(daikon)、蒲公英嫩叶、芋头(dasheen)、dau mue(豌豆尖)、donqua (冬瓜)、茄子、菊苣(endive)、莴苣、琴头蕨、田地水芹、苦苣、盖菜 (芥菜)、gailon、良姜(暹罗、泰国姜)、大蒜、姜根、牛蒡(gobo)、嫩叶、汉诺威沙拉用绿叶(hanover salad green)、huauzontle、洋姜(jerusalemartichoke)、豆薯、羽衣甘蓝(kale)嫩叶、大头菜(kohlrabi)、羊腿藜(quilete)、生菜(贝比生菜(bibb))、生菜(波士顿生菜(boston))、生菜(波士顿红生菜(boston red))、生菜(绿叶)、生菜(冰山生菜(iceberg))、生菜(红毛菜(lolla rossa))、生菜(绿橡树叶)、生菜(红橡树叶)、生菜(加工生菜)、生菜(红叶)、生菜(罗马生菜(romaine))、生菜(红罗马生菜(ruby romaine))、生菜(俄罗斯红芥末)、linkok、白萝卜(lo bok)、长豆、莲藕、野苣(mache)、龙舌兰(龙舌兰(agave))叶、黄肉芋(malanga)、混和生菜(mesculin mix)、京水菜(mizuna)、moap(光滑丝瓜)、moo、moqua (有绒毛的南瓜)、蘑菇、芥末、山药(nagaimo)、秋葵、通菜、洋葱嫩叶、opo(长南瓜)、观赏玉米、观赏葫芦、欧芹、欧洲防风草、豌豆、辣椒(铃铛型)、辣椒、南瓜(pumpkin)、菊苣(radicchio)、萝卜芽、萝卜(radish)、青芸苔、青芸苔、大黄、罗马生菜(baby red)、芜菁甘蓝 (rutabaga)、盐角草(海豆)、丝瓜(角形/脊状丝瓜)、菠菜、南瓜(squash)、稻草捆、甘蔗、甘薯、唐莴苣、罗望子、芋艿(taro)、芋艿叶、芋艿芽、塌棵菜、tepeguaje(葫芦(guaje))、红瓜(tindora)、粘果酸浆(tomatillo)、番茄、番茄(樱桃型)、番茄(葡萄型)、番茄(李子型)、姜黄、芜菁茎嫩叶、芜菁(turnip)、荸荠、薯蓣(yampi)、山药(名称)、油菜(yu choy)、木薯(yuca)(木薯)等。
在一些情况下,细胞是节肢动物细胞。例如,细胞可以是以下的亚目、家族、亚家族、群体、亚群或物种的细胞:例如,有螯肢亚门 (Chelicerata)、多足亚门(Myriapodia)、Hexipodia、蛛形纲(Arachnida)、昆虫纲(Insecta)、石蛃目(Archaeognatha)、缨尾目(Thysanura)、古翅下纲(Palaeoptera)、蜉蝣目(Ephemeroptera)、蜻蜓目(Odonata)、差翅亚目(Anisoptera)、束翅亚目(Zygoptera)、新翅亚纲(Neoptera)、外翅总目(Exopterygota)、襀翅目(Plecoptera)、纺足目(Embioptera)、直翅目(Orthoptera)、缺翅目(Zoraptera)、革翅目(Dermaptera)、网翅目 (Dictyoptera)、蛩蠊目(Notoptera)、蛩蠊科(Grylloblattidae)、螳科 (Mantophasmatidae)、竹节虫目(Phasmatodea)、蜚蠊目(Blattaria)、等翅目(Isoptera)、螳螂目(Mantodea)、Parapneuroptera、啮虫目(Psocoptera)、缨翅目(Thysanoptera)、虱毛目(Phthiraptera)、半翅目 (Hemiptera)、内翅类(Endopterygota)或全变态类(Holometabola)、膜翅目(Hymenoptera)、鞘翅目(Coleoptera)、捻翅目(Strepsiptera)、蛇蛉目 (Raphidioptera)、广翅目(Megaloptera)、脉翅目(Neuroptera)、长翅目 (Mecoptera)、蚤目(Siphonaptera)、双翅目(Diptera)、毛翅目(Trichoptera) 或鳞翅目(Lepidoptera)。
在一些情况下,细胞是昆虫细胞。例如,在一些情况下,细胞是蚊子、蚱蜢、半翅目昆虫、苍蝇、跳蚤、蜜蜂、黄蜂、蚂蚁、虱子、蛾或甲虫的细胞。
试剂盒
本公开提供一种试剂盒,所述试剂盒包含本公开的CasZ系统或本公开的CasZ系统的组分。
本公开的试剂盒可包含如对于CasZ系统所列的任何组合(例如,参见上文)。本公开的试剂盒可包含:a)如上所述的本公开的CasZ系统的组分,或者可包含本公开的CasZ系统;和b)一种或多种另外的试剂,例如,i)缓冲剂;ii)蛋白酶抑制剂;iii)核酸酶抑制剂;iv)显影或可视化可检测标记所需的试剂;v)阳性和/或阴性对照靶DNA;vi) 阳性和/或阴性对照CasZ指导RNA;vii)CasZ trancRNA等。本公开的试剂盒可包含:a)如上所述的本公开的CasZ系统的组分,或者可包含本公开的CasZ系统;和b)治疗剂。
本公开的试剂盒可包含重组表达载体,所述重组表达载体包含: a)用于插入核酸的插入位点,所述核酸包含编码CasZ指导RNA的一部分的核苷酸序列,所述CasZ指导RNA的一部分与靶核酸中的靶核苷酸序列杂交;和b)编码CasZ指导RNA的CasZ结合部分的核苷酸序列。本公开的试剂盒可包含重组表达载体,所述重组表达载体包含:a)用于插入核酸的插入位点,所述核酸包含编码CasZ指导RNA 的一部分的核苷酸序列,所述CasZ指导RNA的一部分与靶核酸中的靶核苷酸序列杂交;b)编码CasZ指导RNA的CasZ结合部分的核苷酸序列;和c)编码本公开的CasZ多肽的核苷酸序列。本公开的试剂盒可包含重组表达载体,所述重组表达载体包含编码CasZ trancRNA的核苷酸序列。
SSDNA的检测
本公开的CasZ(Cas14)多肽一旦通过检测靶DNA(双链或单链) 而被激活,就会混杂地切割非靶向单链DNA(ssDNA)。一旦CasZ (Cas14)被指导RNA激活(在指导RNA与靶DNA的靶序列杂交(即,样品包括靶DNA,例如靶ssDNA)时发生),该蛋白质就会成为混杂地切割ssDNA的核酸酶(即,核酸酶切割非靶ssDNA,即,指导RNA 的指导序列未与之杂交的ssDNA)。因此,当样品中存在靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA的切割,这可使用任何方便的检测方法(例如,使用标记的单链检测剂DNA)加以检测。在一些情况下,除了CasZ指导RNA之外,CasZ多肽还需要tranc RNA 进行激活。
提供了用于检测样品中的靶DNA(双链或单链)的组合物和方法。在一些情况下,使用为单链(ssDNA)并且不与指导RNA的指导序列杂交的检测剂DNA(即,检测剂ssDNA是非靶ssDNA)。此类方法可包括(a)使样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列;和(iii)为单链的且不与指导RNA的指导序列杂交的检测剂DNA;以及(b)测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。在一些情况下,所述方法可包括(a)使样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ 多肽结合的区域和与靶DNA杂交的指导序列;(iii)CasZ tranc RNA;和(iv)为单链的且不与指导RNA的指导序列杂交的检测剂DNA;以及(b)测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。如上所指出,一旦主题CasZ多肽蛋白被指导RNA 激活(在样品中包含与指导RNA杂交的靶DNA(即,样品中包含靶向靶DNA)时发生),CasZ多肽就会被激活并且充当内切核糖核酸酶来非特异性地切割样品中存在的ssDNA(包括非靶ssDNA)。因此,当样品中存在所靶向的靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA(包括非靶ssDNA)的切割,这可使用任何方便的检测方法(例如,使用标记的检测剂ssDNA)加以检测。
还提供了用于切割单链DNA(ssDNA)(例如,非靶ssDNA)的组合物和方法。此类方法可包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)CasZ多肽;和(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列,其中CasZ多肽切割所述多个非靶ssDNA。此类方法可包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶 ssDNA:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ 多肽结合的区域和与靶DNA杂交的指导序列;和(iii)CasZ tranc RNA,其中CasZ多肽切割所述多个非靶ssDNA。可使用此类方法,例如,在细胞中切割外源ssDNA(例如,病毒DNA)。
主题方法的接触步骤可在包含二价金属离子的组合物中进行。接触步骤可在无细胞环境中,例如在细胞外部进行。接触步骤可在细胞内部进行。接触步骤可在体外细胞中进行。接触步骤可在离体细胞中进行。接触步骤可在体内细胞中进行。
指导RNA可以RNA的形式或以编码指导RNA的核酸(例如, DNA,诸如重组表达载体)的形式提供。tranc RNA可作以RNA的形式或以编码指导RNA的核酸(例如,DNA,诸如重组表达载体)的形式提供。CasZ多肽可以蛋白质本身或以编码蛋白质的核酸(例如, mRNA、DNA诸如重组表达载体)的形式提供。在一些情况下,可提供两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个或者6个或更多个)指导RNA。在一些情况下,使用单分子RNA,所述单分子RNA包含:i)CasZ指导RNA;和ii)tranc RNA(或包含编码单分子RNA的核苷酸序列的核酸)。
在一些情况下(例如,当使样品与指导RNA和CasZ多肽接触时;或者当使样品与指导RNA、CasZ多肽和tranc RNA接触时),在测量步骤之前使样品接触2小时或更短时间(例如,1.5小时或更短时间、 1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间)。例如,在一些情况下,在测量步骤之前使样品接触 40分钟或更短时间。在一些情况下,在测量步骤之前使样品接触20 分钟或更短时间。在一些情况下,在测量步骤之前使样品接触10分钟或更短时间。在一些情况下,在测量步骤之前使样品接触5分钟或更短时间。在一些情况下,在测量步骤之前使样品接触1分钟或更短时间。在一些情况下,在测量步骤之前使样品接触50秒至60秒。在一些情况下,在测量步骤之前使样品接触40秒至50秒。在一些情况下,在测量步骤之前使样品接触30秒至40秒。在一些情况下,在测量步骤之前使样品接触20秒至30秒。在一些情况下,在测量步骤之前使样品接触10秒至20秒。
在一些情况下,本公开的用于检测靶DNA的方法包括:a)在提供检测剂DNA的反式切割的条件下,使样品与指导RNA、CasZ多肽和检测剂DNA接触,其中使样品接触2小时或更短时间(例如,1.5 小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间);b)在不提供检测剂RNA的反式切割的条件下,将来自步骤(a)的样品保持一段时间;以及c)在步骤(b) 的时间段之后,测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。提供检测剂DNA的反式切割的条件包括温度条件,诸如从17℃至约39℃(例如,约37℃)。不提供检测剂 DNA的反式切割的条件包括10℃或更低、5℃或更低、4℃或更低或0℃的温度。
在一些情况下,本公开的用于检测靶DNA的方法包括:a)在提供检测剂DNA的反式切割的条件下,使样品与指导RNA、tranc RNA、 CasZ多肽和检测剂DNA接触(或使样品与以下物质接触:i)包含指导 RNA和tranc RNA的单分子RNA;i)CasZ多肽;和iii)检测剂DNA),其中使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间);b)在不提供检测剂RNA的反式切割的条件下,将来自步骤(a)的样品保持一段时间;以及c)在步骤(b)的时间段之后,测量由 CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶 DNA。提供检测剂DNA的反式切割的条件包括温度条件,诸如从17℃至约39℃(例如,约37℃)。不提供检测剂DNA的反式切割的条件包括10℃或更低、5℃或更低、4℃或更低或0℃的温度。
在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间不超过60分钟。例如,在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间不超过60分钟、不超过45分钟、不超过30分钟、不超过15分钟、不超过10分钟或不超过5分钟。例如,在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间段为1分钟至60分钟,例如1分钟至5分钟、5分钟至10分钟、10分钟至15分钟、15分钟至30分钟、30分钟至45 分钟或45分钟至60分钟。在一些情况下,在产生可检测信号后(例如,产生时间不超过60分钟),可通过以下方式停止检测信号的产生,例如,降低样品的温度(例如,将温度降低至10℃或更低、5℃或更低、 4℃或更低或0℃),向样品中添加抑制剂,冻干样品,将样品加热至40℃以上等。测量步骤可在已停止可检测信号产生之后的任何时间进行。例如,测量步骤可在已停止可检测信号产生之后的5分钟至48 小时进行。例如,测量步骤可在已停止可检测信号产生之后的5分钟至15分钟、15分钟至30分钟、30分钟至60分钟、1小时至4小时、 4小时至8小时、8小时至12小时、12小时至24小时、24小时至36小时或36小时至48小时进行。测量步骤可在已停止可检测信号产生之后超过48小时进行。
本公开的用于检测样品中的靶DNA(单链或双链)的方法可以高灵敏度检测靶DNA。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个或多个拷贝(例如,每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每 104个非靶DNA一个或多个拷贝、每103个非靶DNA一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10个非靶DNA 一个或多个拷贝、或每5个非靶DNA一个或多个拷贝)存在。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每1018个非靶 DNA一个或多个拷贝(例如,每1015个非靶DNA一个或多个拷贝、每1012个非靶DNA一个或多个拷贝、每109个非靶DNA一个或多个拷贝、每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每104个非靶DNA一个或多个拷贝、每103个非靶DNA 一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶 DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10 个非靶DNA一个或多个拷贝、或每5个非靶DNA一个或多个拷贝) 存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每107个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每107个非靶DNA1 个拷贝至每105个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每106个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每10个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每102个非靶DNA1 个拷贝、每106个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每105个非靶DNA1个拷贝、每105个非靶DNA1 个拷贝至每10个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、或每105个非靶DNA1个拷贝至每104个非靶 DNA1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每1018个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每1018个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每1015个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每 1012个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每109个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每107个非靶DNA1 个拷贝至每102个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每105个非靶DNA1 个拷贝、每107个非靶DNA1个拷贝至每106个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每10个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每106个非靶DNA1 个拷贝至每103个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每105个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每10个非靶DNA1 个拷贝、每105个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、或每105个非靶DNA1个拷贝至每104个非靶DNA1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每100个非靶DNA一个拷贝(例如,每107个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每107个非靶DNA1 个拷贝至每105个非靶DNA1个拷贝、每107个非靶DNA1个拷贝至每106个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每100个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每102个非靶DNA1 个拷贝、每106个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每104个非靶DNA1个拷贝、每106个非靶DNA1个拷贝至每105个非靶DNA1个拷贝、每105个非靶DNA1 个拷贝至每100个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每102个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA1个拷贝、或每105个非靶DNA1个拷贝至每104个非靶 DNA1个拷贝)存在。
在一些情况下,对于检测样品中的靶DNA的主题方法,检测阈值为10nM或更小。因此,例如,靶DNA可以10nM或更低的浓度存在于样品中。术语“检测阈值”在本文用于描述要发生检测样品中必须存在的最小靶DNA量。因此,作为说明性实例,当检测阈值为10nM 时,则当靶DNA以10nM或更高的浓度存在于样品中时,可检测到信号。在一些情况下,本公开的方法的检测阈值为5nM或更小。在一些情况下,本公开的方法的检测阈值为1nM或更小。在一些情况下,本公开的方法的检测阈值为0.5nM或更小。在一些情况下,本公开的方法的检测阈值为0.1nM或更小。在一些情况下,本公开的方法的检测阈值为0.05nM或更小。在一些情况下,本公开的方法的检测阈值为0.01nM或更小。在一些情况下,本公开的方法的检测阈值为 0.005nM或更小。在一些情况下,本公开的方法的检测阈值为0.001nM 或更小。在一些情况下,本公开的方法的检测阈值为0.0005nM或更小。在一些情况下,本公开的方法的检测阈值为0.0001nM或更小。在一些情况下,本公开的方法的检测阈值为0.00005nM或更小。在一些情况下,本公开的方法的检测阈值为0.00001nM或更小。在一些情况下,本公开的方法的检测阈值为10pM或更小。在一些情况下,本公开的方法的检测阈值为1pM或更小。在一些情况下,本公开的方法的检测阈值为500fM或更小。在一些情况下,本公开的方法的检测阈值为250fM或更小。在一些情况下,本公开的方法的检测阈值为100fM或更小。在一些情况下,本公开的方法的检测阈值为50fM 或更小。在一些情况下,本公开的方法的检测阈值为500aM(渺摩尔) 或更小。在一些情况下,本公开的方法的检测阈值为250aM或更小。在一些情况下,本公开的方法的检测阈值为100aM或更小。在一些情况下,本公开的方法的检测阈值为50aM或更小。在一些情况下,本公开的方法的检测阈值为10aM或更小。在一些情况下,本公开的方法的检测阈值为1aM或更小。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在500fM 至1nM(例如,500fM至500pM、500fM至200pM、500fM至100 pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至 500pM、800fM至200pM、800fM至100pM、800fM至10pM、 800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、 1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在800fM至100pM的范围内。在一些情况下,本公开的方法的检测阈值在1pM至10pM的范围内。在一些情况下,本公开的方法的检测阈值在10fM至500fM,例如10fM至50fM、50fM至100fM、 100fM至250fM、或250fM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在500fM 至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、 500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、 800fM至200pM、800fM至100pM、800fM至10pM、800fM至 1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100 pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在800fM至100pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1pM至10pM的范围内。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在1aM 至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1 aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至 1pM、250aM至1nM、250aM至500pM、250aM至200pM、250 aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、 500aM至500pM、500aM至200pM、500aM至100pM、500aM 至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、 1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1 fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、 500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、 800fM至500pM、800fM至200pM、800fM至100pM、800fM至 10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至 200pM、1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在1aM至800aM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至1pM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至500fM的范围内。
在一些情况下,样品中存在的靶DNA在1aM至1nM(例如,1aM 至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM 至1pM、100aM至1nM、100aM至500pM、100aM至200pM、 100aM至100pM、100aM至10pM、100aM至1pM、250aM至1 nM、250aM至500pM、250aM至200pM、250aM至100pM、250 aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、 500aM至200pM、500aM至100pM、500aM至10pM、500aM至 1pM、750aM至1nM、750aM至500pM、750aM至200pM、750 aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1 fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1 fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、 500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、 800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100 pM、或1pM至10pM)的范围内。在一些情况下,样品中存在的靶 DNA在1aM至800aM的范围内。在一些情况下,样品中存在的靶 DNA在50aM至1pM的范围内。在一些情况下,样品中存在的靶 DNA在50aM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至 1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM 至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、 250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM 至500pM、500aM至200pM、500aM至100pM、500aM至10pM、 500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM 至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM 至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500 fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、 800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至 200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至500pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在100aM 至500pM的范围内。
在一些情况下,样品中存在的靶DNA在1aM至1nM(例如,1aM 至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM 至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1 nM、250aM至500pM、250aM至200pM、250aM至100pM、250 aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、 500aM至200pM、500aM至100pM、500aM至10pM、500aM至 1pM、750aM至1nM、750aM至500pM、750aM至200pM、750 aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1 fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1 fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、 500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、 800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100 pM、或1pM至10pM)的范围内。在一些情况下,样品中存在的靶 DNA在1aM至500pM的范围内。在一些情况下,样品中存在的靶 DNA在100aM至500pM的范围内。
在一些情况下,主题组合物或方法表现出渺摩尔级(aM)的检测灵敏度。在一些情况下,主题组合物或方法表现出飞摩尔级(fM)的检测灵敏度。在一些情况下,主题组合物或方法表现出皮摩尔级(pM)的检测灵敏度。在一些情况下,主题组合物或方法表现出纳摩尔级(nM) 的检测灵敏度。
靶DNA
靶DNA可以是单链的(ssDNA)或双链的(dsDNA)。当靶DNA是单链的时,对靶DNA中的PAM序列没有偏好或要求。但是,当靶 DNA是dsDNA时,PAM通常邻近靶DNA的靶序列存在(例如,参见本文其他地方对PAM的论述)。靶DNA的来源可与样品的来源相同,例如,如下文所述。
靶DNA的来源可以是任何来源。在一些情况下,靶DNA是病毒DNA(例如,DNA病毒的基因组DNA)。因而,主题方法可用于检测核酸群体中(例如,样品中)病毒DNA的存在。主题方法还可用于在靶DNA存在下切割非靶ssDNA。例如,如果方法发生在细胞中,则当细胞中存在特定靶DNA时,主题方法可用于混杂地切割细胞中的非靶ssDNA(不与指导RNA的指导序列杂交的ssDNA)(例如,当细胞被病毒感染并检测到病毒靶DNA时)。
可能的靶DNA的实例包括但不限于病毒DNA,诸如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(Epstein-Barr virus,EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒(ichtadenovirus)、美洲白鲟腺病毒(mastadenovirus)、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒 (MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4G1);双生病毒科;矮化病毒科;藻类 DNA病毒科(Phycodnaviridae)等。在一些情况下,靶DNA是寄生虫DNA。在一些情况下,靶DNA是细菌DNA,例如病原性细菌的DNA。
样品
主题样品包括核酸(例如,多个核酸)。术语“多个”在本文中用于意指两个或更多个。因此,在一些情况下,样品包含两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或者5,000个或更多个)核酸(例如,DNA)。主题方法可用作检测样品中(例如,诸如DNA的核酸的复杂混合物中)存在的靶DNA的非常灵敏的方法。在一些情况下,样品包含序列彼此不同的5个或更多个DNA(例如,10个或更多个、20个或更多个、50个或更多个、100 个或更多个、500个或更多个、1,000个或更多个、或者5,000个或更多个DNA)。在一些情况下,样品包含10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、103个或更多个、5x 103个或更多个、104个或更多个、5x 104个或更多个、105个或更多个、5x 105个或更多个、106个或更多个、5x 106个或更多个、或者107个或更多个DNA。在一些情况下,样品包含10至20 个、20至50个、50至100个、100至500个、500至103个、103至 5x 103个、5x 103至104个、104至5x 104个、5x 104至105个、105至5x 105个、5x 105至106个、106至5x 106个、或5x 106至107个、或超过107个DNA。在一些情况下,样品包含5至107个DNA(例如,序列彼此不同)(例如,5至106个、5至105个、5至50,000个、5至 30,000个、10至106个、10至105个、10至50,000个、10至30,000 个、20至106个、20至105个、20至50,000个、或20至30,000个 DNA)。在一些情况下,样品包含20个或更多个序列彼此不同的DNA。在一些情况下,样品包含来自细胞裂解液(例如,真核细胞裂解液、哺乳动物细胞裂解液、人细胞裂解液、原核细胞裂解液、植物细胞裂解液等)的DNA。例如,在一些情况下,样品包含来自细胞诸如真核细胞,例如哺乳动物细胞诸如人细胞的DNA。
术语“样品”在本文中用于意指包含DNA的任何样品(例如,以便确定在DNA群体中是否存在靶DNA)。样品可衍生自任何来源,例如,样品可以是纯化DNA的合成组合;样品可以是细胞裂解液、富含DNA的细胞裂解液,或从细胞裂解液中分离和/或纯化的DNA。样品可来自患者(例如,出于诊断目的)。样品可来自透化细胞。样品可来自交联细胞。样品可在组织切片中。样品可来自通过交联,之后进行脱脂和调整以形成均匀折射率而制备的组织。通过交联,之后进行脱脂和调整以形成均匀折射率的组织制备的实例描述于例如Shah 等人,Development(2016)143,2862-2867doi:10.1242/dev.138560中。
“样品”可包含靶DNA和多个非靶DNA。在一些情况下,靶DNA 在样品中以每10个非靶DNA一个拷贝、每20个非靶DNA一个拷贝、每25个非靶DNA一个拷贝、每50个非靶DNA一个拷贝、每100个非靶DNA一个拷贝、每500个非靶DNA一个拷贝、每103个非靶DNA一个拷贝、每5x103个非靶DNA一个拷贝、每104个非靶DNA一个拷贝、每5x 104个非靶DNA一个拷贝、每105个非靶 DNA一个拷贝、每5x 105个非靶DNA一个拷贝、每106个非靶DNA 一个拷贝、或小于每106个非靶DNA一个拷贝存在。在一些情况下,靶DNA在样品中以每10个非靶DNA一个拷贝至每20个非靶DNA1 个拷贝、每20个非靶DNA1个拷贝至每50个非靶DNA1个拷贝、每50个非靶DNA1个拷贝至每100个非靶DNA1个拷贝、每100个非靶DNA1个拷贝至每500个非靶DNA1个拷贝、每500个非靶DNA1 个拷贝至每103个非靶DNA1个拷贝、每103个非靶DNA1个拷贝至每5x 103个非靶DNA1个拷贝、每5x 103个非靶DNA1个拷贝至每 104个非靶DNA1个拷贝、每104个非靶DNA1个拷贝至每105个非靶DNA1个拷贝、每105个非靶DNA1个拷贝至每106个非靶DNA1 个拷贝、或每106个非靶DNA1个拷贝至每107个非靶DNA1个拷贝存在。
合适的样品包括但不限于唾液、血液、血清、血浆、尿液、抽吸物和活检样品。因此,关于患者的术语“样品”涵盖生物来源的血液和其他液体样品、实体组织样品诸如活检样本或组织培养物或来源于其的细胞及其后代。该定义还包括在获得后采用以下任何方式操作过的样品:诸如用试剂处理;洗涤;或针对某些细胞群体诸如癌细胞进行富集。该定义还包括已经富集了特定类型的分子(例如,DNA)的样品。术语“样品”涵盖生物样品,诸如临床样品,诸如血液、血浆、血清、抽吸物、脑脊髓液(CSF),并且还包括通过手术切除获得的组织、通过活检获得的组织、培养物中的细胞、细胞上清液、细胞裂解液、组织样品、器官、骨髓等。“生物样品”包括来源于其的生物流体(例如,癌细胞、感染细胞等),例如包含从此类细胞获得的DNA的样品(例如,细胞裂解液或其他包含DNA的细胞提取物)。
样品可包含或可从多种细胞、组织、器官或无细胞流体中的任一种获得。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物体和多细胞生物体。合适的样品来源包括单细胞真核生物体;植物或植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞、组织或器官;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫、昆虫、蛛形纲动物等)的细胞、组织或器官;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、组织、体液或器官;来自哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛;绵羊;山羊等)的细胞、组织、体液或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生虫,诸如蠕虫、疟疾寄生虫等。
合适的样品来源包括例如以下六个界中任何一个界的细胞、组织或生物体:细菌界(例如,真细菌界);古细菌界;原生生物界;真菌界;植物界;和动物界。合适的样品来源包括原生生物界的植物样成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界的真菌样成员,例如粘液菌、水霉菌等;原生生物界的动物样成员,例如鞭毛虫类(例如,眼虫藻)、变形虫类(amoeboids)(例如,变形虫)、孢子虫类(例如,顶复门(Apicomplexa)、粘体动物门(Myxozoa)、微孢子虫纲(Microsporidia))和纤毛虫类(例如,草履虫)。合适的样品来源包括包括真菌界的成员,包括但不限于以下门中的任何门的成员:担子菌门(担子菌类;例如,伞菌属、鹅膏菌属、牛肝菌属、鸡油菌属等成员);子囊菌门(子囊菌类,包括例如酵母菌);菌藻门(地衣);接合菌门(接合真菌);以及不完全菌门。合适的样品来源包括包括植物界的成员,包括但不限于以下分类中的任何分类的成员:苔藓植物门(例如,藓类)、角苔植物门(例如,角苔类)、苔类植物门 (Hepaticophyta)(例如,苔类)、石松植物门(例如,石松类)、楔叶植物门(例如,木贼类)、裸蕨植物门(例如,松叶蕨类)、瓶尔小草门、蕨门(例如,蕨类)、苏铁门、银杏门、松柏门、买麻藤门和木兰门(例如,开花植物)。合适的样品来源包括包括动物界的成员,包括但不限于以下门中的任何门的成员:多孔动物门(海绵动物);扁盘动物门;直泳虫门(海洋无脊椎动物的寄生物);菱形虫门;刺胞动物门(珊瑚、海葵、海蜇、海笔、海肾、立方水母);栉水母门(栉水母类);扁虫动物门(扁虫类);纽形动物门(纽虫类);颚胃动物门(Ngathostomulida)(有颚蠕虫)p腹毛动物门;轮虫动物门;曳鳃动物门;动吻动物门;铠甲动物门;棘头动物门;内肛动物门;线虫动物门;线形动物门;环口动物门;软体动物门(软体动物);星虫动物门(方格星虫(peanutworms));环节动物门(环节蠕虫);缓步动物门(缓步动物);有爪动物门(栉蚕);节肢动物门(包括以下亚门:有螯肢亚门、多足亚门、六足亚门和甲壳亚门,其中有螯肢亚门包括例如蛛形纲、肢口纲和海蜘蛛纲,其中多足亚门包括例如唇足纲(唇足类)、倍足纲(多足类)、少足纲(Paropoda)和综合纲,其中六足亚门包括昆虫纲,并且其中甲壳亚门包括虾、磷虾、藤壶等;帚虫动物门;外肛动物门(苔藓动物);腕足动物门;棘皮动物门(例如,海星、海雏菊、毛头星、海胆、海参、海蛇尾、脆篮(brittle baskets)等);毛颚动物门(箭虫);半索动物门(玉钩虫);和脊索动物门。合适的脊索动物门成员包括以下亚门的任何成员:尾索动物亚门(海鞘纲;包括海鞘目、樽海鞘目和幼形目);头索亚门(文昌鱼);盲鳗纲(盲鳗);和脊椎动物亚门,其中脊椎动物亚门成员包括例如以下纲的成员:鳃鳗纲(七鳃类)、软骨鱼纲(软骨鱼)、辐鳍鱼纲(辐鳍鱼)、腔棘焦纲(腔棘鱼)、肺鱼纲(肺鱼)、爬行纲(爬行动物,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(鸟类);和哺乳纲(哺乳动物)。合适的植物包括任何单子叶植物和任何双子叶植物。
合适的样品来源包括取自生物体;从生物体分离的特定细胞或细胞群的细胞、流体、组织或器官等。例如,在生物体是植物的情况下,合适的来源包括木质部、韧皮部、形成层、叶、根等。在生物体是动物的情况下,合适的来源包括特定组织(例如,肺、肝、心脏、肾、脑、脾、皮肤、胎儿组织等)、或特定细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、神经胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)。
在一些情况下,样品来源是病变的(或疑似病变的细胞、流体、组织或器官。在一些情况下,样品来源是正常(非病变的)细胞、流体、组织或器官。在一些情况下,样品来源是(或疑似是病原体感染的细胞、组织或器官。例如,样品来源可以是可能被感染或可能未被感染的个体-并且样品可以是从个体收集的任何生物样品(例如血液、唾液、活检物、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,颊拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻分泌物、眼泪、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮擦物)等)。在一些情况下,样品是无细胞液体样品。在一些情况下,样品是可包含细胞的液体样品。病原体包括病毒、真菌、蠕虫、原生动物、疟疾寄生虫、疟原虫寄生虫、弓形虫寄生虫、血吸虫寄生虫等。“蠕虫”包括蛔虫、犬恶丝虫和植食性线虫(线虫纲)、吸虫(吸虫纲)、棘头虫纲和绦虫(绦虫纲)。原生动物感染包括来自贾第虫属种、毛滴虫属种、非洲锥虫病、阿米巴痢疾、巴贝虫病、小袋虫性痢疾、查加斯病(Chaga's disease)、球虫病、疟疾和弓形体病的感染。病原体(诸如寄生/原生动物病原体)的实例包括但不限于:恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、克氏锥虫(Trypanosomacruzi)和刚地弓形虫(Toxoplasma gondii)。真菌病原体包括但不限于:新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、粗球孢菌(Coccidioides immitis)、皮炎芽生菌(Blastomyces dermatitidis)、沙眼衣原体(Chlamydia trachomatis) 和白色念珠菌(Candida albicans)。病原性病毒包括例如免疫缺陷病毒 (例如,HIV);流感病毒;登革热病毒;西尼罗河病毒;疱疹病毒;黄热病毒;丙型肝炎病毒;甲型肝炎病毒;乙型肝炎病毒;乳头瘤病毒等。病原性病毒可包括DNA病毒,诸如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒 (VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4G1);双生病毒科;矮化病毒科;藻科等。病原体可包括,例如DNA病毒[例如:乳多空病毒(例如,人乳头瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;传染性软疣病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4G1);双生病毒科;矮化病毒科;藻科等]、结核分枝杆菌(Mycobacterium tuberculosis)、无乳链球菌(Streptococcus agalactiae)、耐甲氧西林金黄色葡萄球菌 (methicillin-resistantStaphylococcus aureus)、嗜肺军团菌(Legionella pneumophila)、酿脓链球菌(Streptococcus pyogenes)、大肠杆菌 (Escherichia coli)、淋病奈瑟氏菌(Neisseriagonorrhoeae)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、肺炎球菌(Pneumococcus)、新型隐球菌 (Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、流感嗜血杆菌B(Hemophilus influenzae B)、梅毒密螺旋体(Treponema pallidum)、莱姆病螺旋体(Lyme disease spirochetes)、铜绿假单胞菌 (Pseudomonas aeruginosa)、麻风分枝杆菌(Mycobacterium leprae)、流产布鲁氏菌(Brucella abortus)、狂犬病病毒、流感病毒、巨细胞病毒、单纯疱疹病毒I、单纯疱疹病毒II、人血清细小样病毒(human serumparvo-like virus)、呼吸道合胞体病毒、水痘-带状疱疹病毒、乙型肝炎病毒、丙型肝炎病毒、麻疹病毒、腺病毒、人T细胞白血病病毒、爱泼斯坦-巴尔病毒、鼠白血病病毒、腮腺炎病毒、水疱性口炎病毒、辛德毕斯病毒(Sindbis virus)、淋巴细胞性脉络丛脑膜炎病毒、疣病毒、蓝舌病毒、仙台病毒(Sendai virus)、猫白血病病毒、呼肠孤病毒、脊髓灰质炎病毒、猿猴病毒40、小鼠乳腺肿瘤病毒、登革热病毒、风疹病毒、西尼罗河病毒、恶性疟原虫、间日疟原虫、刚地弓形虫、蓝氏锥虫(Trypanosoma rangeli)、克氏锥虫、罗氏锥虫(Trypanosomarhodesiense)、布氏锥虫(Trypanosoma brucei)、曼氏血吸虫(Schistosoma mansoni)、日本血吸虫(Schistosoma japonicum)、巴贝斯虫(Babesia bovis)、柔嫩艾美球虫(Eimeriatenella)、盘尾丝虫(Onchocerca volvulus)、利什曼原虫(Leishmania tropica)、结核分枝杆菌、旋毛虫(Trichinella spiralis)、泰勒原虫(Theileria parva)、胞状绦虫(Taeniahydatigena)、羊绦虫(Taenia ovis)、牛肉绦虫(Taenia saginata)、细粒棘球绦虫(Echinococcus granulosus)、柯氏中殖孔绦虫(Mesocestoides corti)、关节炎支原体(Mycoplasma arthritidis)、猪鼻支原体(M.hyorhinis)、口腔支原体(M.orale)、精氨酸支原体(M.arginini)、莱氏无胆甾原体 (Acholeplasma laidlawii)、唾窦支原体(M.salivarium)和肺炎支原体(M. pneumoniae)。
测量可检测信号
在一些情况下,主题方法包括测量步骤(例如,测量由CasZ介导的ssDNA切割产生的可检测信号)。因为CasZ多肽一旦被激活就切割非靶向ssDNA(所述激活在存在CasZ多肽(并且在一些情况下还包括tranc RNA)的情况下指导RNA与靶DNA杂交时发生),所以可检测信号可以是当ssRNA被切割时产生的任何信号。例如,在一些情况下,测量步骤可包括以下一项或多项:基于金纳米颗粒的检测(例如,参见Xu等人,Angew Chem Int Ed Engl.2007;46(19):3468-70;和 Xia等人,Proc Natl Acad Sci USA.2010年6月15日;107(24):10837-41)、荧光偏振、胶体相变/分散(例如,Baksh等人,Nature.2004年1月8 日;427(6970):139-41)、电化学检测、基于半导体的感测(例如,Rothberg 等人,Nature.2011年7月20日;475(7356):348-52;例如,可以在ssDNA 切割反应后使用磷酸酶以通过打开2'-3'环状磷酸酯并通过将无机磷酸盐释放到溶液中而产生pH变化),以及检测经标记的检测剂 ssDNA(更多细节参见本文其他地方)。此类检测方法的读出可以是任何方便的读出。可能的读出的实例包括但不限于:所测量的可检测荧光信号的量;对凝胶上条带(例如,表示切割产物对比未切割底物的条带)的视觉分析、基于视觉或传感器的对颜色存在或不存在的检测 (即,颜色检测方法),以及电信号的存在或不存在(或电信号的特定量)。
在一些情况下,例如在检测到的信号量可用于确定样品中存在的靶DNA的量的意义上,测量可以是定量的。在一些情况下,例如在可检测信号的存在或不存在可以指示靶DNA(例如,病毒、SNP等) 的存在或不存在的意义上,测量可以是定性的。在一些情况下,除非靶DNA(例如,病毒、SNP等)以高于特定阈值浓度存在,否则可检测信号将不存在(例如,高于给定阈值水平)。在一些情况下,可通过修改CasZ多肽、指导RNA、样品体积和/或检测剂ssDNA(如果使用的话)的量来滴定检测阈值。因此,例如,如本领域的普通技术人员应当理解的,如果需要的话,可使用许多对照以建立一个或多个反应,每个反应设置用于检测靶DNA的不同阈值水平,并且因此可使用这样的一系列反应来确定样品中存在的靶DNA的量(例如,可使用这样的一系列反应来确定靶DNA‘以至少X的浓度’存在于样品中)。本公开的组合物和方法的应用/用途的非限制性实例包括单核苷酸多态性 (SNP)检测、癌症筛查、细菌感染检测、抗生素抗性检测、病毒感染检测等。本公开的组合物和方法可用于检测任何DNA靶标。例如,可检测将核酸物质整合到基因组中的任何病毒,因为受试样品可包含细胞基因组DNA–并且指导RNA可被设计成检测整合的核苷酸序列。在一些情况下,本公开的方法不包括扩增步骤。在一些情况下,本公开的方法包括扩增步骤。
在一些情况下,可使用本公开方法确定样品(例如,包含靶DNA 和多个非靶DNA的样品)中靶DNA的量。确定样品中靶DNA的量可包括将由测试样品产生的可检测信号的量与由参考样品产生的可检测信号的量进行比较。确定样品中靶DNA的量可包括:测量可检测信号以生成测试测量值;测量由参考样品产生的可检测信号以生成参考测量值;以及将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
例如,在一些情况下,本公开的用于确定样品中靶DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA的样品)与以下物质接触:i)与靶DNA杂交的指导RNA;(ii)切割样品中存在的 DNA的CasZ多肽;和(iii)检测剂ssDNA;b)测量由CasZ多肽介导的 ssDNA切割(例如,检测剂ssDNA的切割)产生的可检测信号,生成测试测量值;c)测量由参考样品产生的可检测信号以生成参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶 DNA的量。
作为另一个实例,在一些情况下,本公开的用于确定样品中靶 DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA 的样品)与以下物质接触:i)与靶DNA杂交的指导RNA;(ii)切割样品中存在的DNA的CasZ多肽;(iii)tranc RNA;(iv)检测剂ssDNA; b)测量由CasZ多肽介导的ssDNA切割(例如,检测剂ssDNA的切割) 产生的可检测信号,生成测试测量值;c)测量由参考样品产生的可检测信号以生成参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
样品中核酸的扩增
在一些实施方案中,可通过将检测与核酸扩增结合来提高主题组合物和/或方法(例如,用于检测细胞基因组DNA中靶DNA(诸如病毒DNA或SNP)的存在)的灵敏度。在一些情况下,在与切割ssDNA 的CasZ多肽接触之前扩增样品中的核酸(例如,样品中核酸的扩增可在与CasZ多肽接触之前开始)。在一些情况下,在与CasZ多肽接触的同时扩增样品中的核酸。例如,在一些情况下,主题方法包括扩增样品的核酸(例如,通过使样品与扩增组分接触),之后使扩增的样品与CasZ多肽接触。在一些情况下,主题方法包括在使样品与CasZ 多肽接触的同一时间(同时)使样品与扩增组分接触。如果同时添加所有组分(扩增组分和检测组分,诸如CasZ多肽、指导RNA和检测剂 DNA),则CasZ多肽的反式切割活性可能会在样品的核酸经历扩增的同时开始降解核酸。但是,即使是这种情况,与不进行扩增的方法相比,同时进行扩增和检测仍然可提高灵敏度。
在一些情况下,例如使用引物从样品中扩增特定序列(例如,病毒的序列,包括目标SNP的序列)。因此,可扩增将与指导RNA杂交的序列以提高主题检测方法的灵敏度–这可实现所需序列的有偏扩增,从而增加样品中存在的目标序列相对于样品中存在的其他序列的拷贝数。作为一个说明性实例,如果使用主题方法来确定给定样品是否包含特定病毒(或特定SNP),则可扩增病毒序列(或非病毒基因组序列)的所需区域,并且如果实际上样品中存在病毒序列(或SNP),则扩增的区域将包括与指导RNA杂交的序列。
如所指出的,在一些情况下,扩增核酸(例如,通过与扩增组分接触),之后使扩增的核酸与CasZ多肽接触。在一些情况下,在与酶活性CasZ多肽接触之前,扩增持续10秒或更长时间(例如,30秒或更长时间、45秒或更长时间、1分钟或更长时间、2分钟或更长时间、 3分钟或更长时间、4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,在与活性CasZ 多肽接触之前,扩增持续2分钟或更长时间(例如,3分钟或更长时间、 4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,扩增持续时间段范围为10秒至60 分钟(例如,10秒至40分钟、10秒至30分钟、10秒至20分钟、10 秒至15分钟、10秒至10分钟、10秒至5分钟、30秒至40分钟、30秒至30分钟、30秒至20分钟、30秒至15分钟、30秒至10分钟、 30秒至5分钟、1分钟至40分钟、1分钟至30分钟、1分钟至20分钟、1分钟至15分钟、1分钟至10分钟、1分钟至5分钟、2分钟至 40分钟、2分钟至30分钟、2分钟至20分钟、2分钟至15分钟、2 分钟至10分钟、2分钟至5分钟、5分钟至40分钟、5分钟至30分钟、5分钟至20分钟、5分钟至15分钟、或5分钟至10分钟)。在一些情况下,扩增持续时间段范围为5分钟至15分钟。在一些情况下,扩增持续时间段范围为7分钟至12分钟。
在一些情况下,使样品在与CasZ多肽接触的同时与扩增组分接触。在一些此类情况下,CasZ多肽在接触时是无活性的,并且一旦样品中的核酸被扩增就被激活。
各种扩增方法和组分将是本领域的普通技术人员已知的,并且可使用任何方便的方法(参见例如Zanoli和Spoto,Biosensors(Basel). 2013年3月;3(1):18–43;Gill和Ghaemi,Nucleosides,Nucleotides,and Nucleic Acids,2008,27:224-243;Craw和Balachandrana,Lab Chip, 2012,12,2469-2486;所述文献以引用方式整体并入本文)。核酸扩增可包括聚合酶链式反应(PCR)、逆转录PCR(RT-PCR)、定量PCR (qPCR)、逆转录qPCR(RT-qPCR)、巢式PCR、多重PCR、不对称 PCR、降落式PCR、随机引物PCR、半巢式PCR、聚合酶循环组装(PCA)、菌落PCR、连接酶链式反应(LCR)、数字PCR、甲基化特异性PCR (MSP)、较低变性温度下的共扩增-PCR(COLD-PCR)、等位基因特异性PCR、序列间特异性PCR(ISS-PCR)、全基因组扩增(WGA)、反向 PCR和热不对称交错PCR(TAIL-PCR)。
在一些情况下,扩增是等温扩增。术语“等温扩增”指示核酸(例如,DNA)扩增的一种方法(例如,使用酶链式反应),该方法可使用单一温度孵育,由此不需要热循环仪。等温扩增是核酸扩增的一种形式,其在扩增反应期间不依赖于靶核酸的热变性,因此可能不需要温度的多次快速变化。因此,等温核酸扩增方法可在实验室环境内部或外部进行。通过与逆转录步骤结合,这些扩增方法可用于等温扩增RNA。
等温扩增方法的实例包括但不限于:环介导等温扩增(LAMP)、解旋酶依赖性扩增(HDA)、重组酶聚合酶扩增(RPA)、链置换扩增 (SDA)、基于核酸序列的扩增(NASBA)、转录介导扩增(TMA)、切口酶扩增反应(NEAR)、滚环扩增(RCA)、多置换扩增(MDA)、分枝(RAM)、环状解旋酶依赖性扩增(cHDA)、单引物等温扩增(SPIA)、信号介导 RNA扩增技术(SMART)、自我持续序列复制(3SR)、基因组指数扩增反应(GEAR)和等温多置换扩增(IMDA)。
在一些情况下,扩增是重组酶聚合酶扩增(RPA)(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;和9,663,820,所述专利特此以引用方式整体并入)。重组酶聚合酶扩增(RPA)使用两个相对的引物(非常类似于PCR),并且采用三种酶-重组酶、单链DNA 结合蛋白(SSB)和链置换聚合酶。重组酶将双链体DNA中具有同源序列的寡核苷酸引物配对,SSB结合DNA的置换链以防止引物被置换,并且链置换聚合酶开始DNA合成,其中引物已与靶DNA结合。在 RPA反应中添加逆转录酶可促进RNA以及DNA的检测,而无需单独的步骤来生产cDNA。RPA反应的组分的一个实例如下(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;9,663,820): 50mMTris pH8.4、80mM乙酸钾、10mM乙酸镁、2mMDTT、5%PEG 化合物(Carbowax-20M)、3mMATP、30mM磷酸肌酸、100ng/μl肌酸激酶、420ng/μl gp32、140ng/μl UvsX、35ng/μl UvsY、2000M dNTP、 300nM各寡核苷酸、35ng/μlBsu聚合酶和含核酸样品)。
在转录介导扩增(TMA)中,使用RNA聚合酶从引物区中工程化的启动子制备RNA,然后逆转录酶从引物合成cDNA。然后可使用第三种酶,例如RNA酶H,从cDNA降解RNA靶标,而无需进行热变性步骤。这种扩增技术类似于自我持续序列复制(3SR)和基于核酸序列的扩增(NASBA),但所用的酶有所不同。再例如,解旋酶依赖性扩增(HDA)利用热稳定解旋酶(Tte-UvrD)而非热量来解链dsDNA 而产生单链,然后将单链用于通过聚合酶进行杂交和引物延伸。又例如,环介导扩增(LAMP)采用具有链置换能力的热稳定聚合酶和一组四个或更多个特异性设计的引物。每个引物均被设计成具有发夹末端,一旦移位,这些发夹末端便会卡入发夹中,以促进自动引发和进一步的聚合酶延伸。在LAMP反应中,尽管反应在等温条件下进行,但是对于双链靶标来说,需要初始的热变性步骤。另外,扩增产生各种长度产物的梯形图。又例如,链置换扩增(SDA)结合了限制性内切核酸酶对其靶DNA的未修饰链进行切口的能力和外切核酸酶缺陷型 DNA聚合酶延伸切口处的3’末端并置换下游DNA链的能力。
检测剂DNA
在一些情况下,主题方法包括使样品(例如,包含靶DNA和多个非靶ssDNA的样品)与以下物质接触:i)CasZ多肽;ii)指导RNA;iii) 为单链且不与指导RNA的指导序列杂交的检测剂DNA。
合适的单链检测剂DNA具有7个核苷酸至25个核苷酸的长度。例如,合适的单链检测剂DNA具有7个核苷酸至10个核苷酸、11 个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、或20个核苷酸至25个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有10个核苷酸至15个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有10个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有11个核苷酸的长度。在一些情况下,合适的单链检测剂 DNA具有12个核苷酸的长度。在一些情况下,合适的单链检测剂 DNA具有13个核苷酸的长度。在一些情况下,合适的单链检测剂 DNA具有14个核苷酸的长度。在一些情况下,合适的单链检测剂 DNA具有15个核苷酸的长度。
在一些情况下,主题方法包括:a)使样品与以下物质接触:经标记的单链检测剂DNA(检测剂ssDNA),所述经标记的单链检测剂 DNA包含荧光发射染料对;CasZ多肽,所述CasZ多肽在被激活后会切割经标记的检测剂ssDNA(通过在与靶DNA杂交的指导RNA的情形下与指导RNA结合);以及b)测量由荧光发射染料对产生的可检测信号。例如,在一些情况下,主题方法包括使样品与经标记的检测剂ssDNA接触,所述经标记的检测剂ssDNA包含荧光共振能量转移 (FRET)对或猝灭剂/荧光剂对,或两者。在一些情况下,主题方法包括使样品与包含FRET对的经标记的检测剂ssDNA接触。在一些情况下,主题方法包括使样品与包含荧光剂/猝灭剂对的经标记的检测剂ssDNA接触。
荧光发射染料对包含FRET对或猝灭剂/荧光剂对。在FRET对和猝灭剂/荧光剂对的两种情况下,染料中的一种染料的发射光谱与所述对中的另一种染料的吸收光谱的某一区域重叠。如本文所用,术语“荧光发射染料对”是用于涵盖“荧光共振能量转移(FRET)对”和“猝灭剂/荧光剂对”两者的通用术语,这两个术语将在下文更详细地论述。术语“荧光发射染料对”与短语“FRET对和/或猝灭剂/荧光剂对”可互换使用。
在一些情况下(例如,当检测剂ssDNA包括FRET对时),经标记的检测剂ssDNA在被切割之前产生一定量的可检测信号,并且当经标记的检测剂ssDNA被切割时所测量到的可检测信号的量减少。在一些情况下,经标记的检测剂ssDNA在被切割之前产生第一可检测信号(例如,来自FRET对),并且当经标记的检测剂ssDNA被切割时产生第二可检测信号(例如,来自猝灭剂/荧光剂对)。因此,在一些情况下,经标记的检测剂ssDNA包含FRET对和猝灭剂/荧光剂对。
在一些情况下,经标记的检测剂ssDNA包含FRET对。FRET是这样的过程,通过所述过程,能量的无辐射转移发生为从激发态荧光团到紧邻的第二发色团。能量转移可以发生的范围限制在大约10纳米(100埃),并且转移效率对荧光团之间的分开距离非常敏感。因此,如本文所使用,术语“FRET”(“荧光共振能量转移”;也称为“萤光共振能量转移(
Figure BDA0002562709270001301
resonance energy transfer)”)是指这样的物理现象,所述物理现象涉及供体荧光团和匹配的受体荧光团被选择为使得供体的发射光谱与受体的激发光谱重叠,并且被进一步选择为使得当供体和受体彼此非常接近(通常为10nm或更短距离)时,供体的激发将引起来自受体的激发和发射,这是因为一些能量经由量子耦合效应从供体传递到受体。因此,FRET信号用作供体和受体的接近度尺度;只有当它们彼此非常接近时才会产生信号。FRET供体部分(例如,供体荧光团)和FRET受体部分(例如,受体荧光团)在本文中统称为“FRET 对”。
供体-受体对(FRET供体部分和FRET受体部分)在本文中被称为“FRET对”或“信号FRET对”。因此,在一些情况下,主题经标记的检测剂ssDNA包含两个信号配偶体(信号对),当一个信号配偶体是 FRET供体部分时,另一个信号配偶体是FRET受体部分。因此,当信号配偶体非常接近时(例如,在相同的RNA分子上时),包含这种 FRET对(FRET供体部分和FRET受体部分)的主题经标记的检测剂 ssDNA将显示可检测信号(FRET信号),但是当所述配偶体分开时(例如,在CasZ多肽切割RNA分子后),信号将减少(或不存在)。
FRET供体和受体部分(FRET对)将是本领域的普通技术人员已知的,并且可以使用任何方便的FRET对(例如,任何方便的供体和受体部分对)。合适的FRET对的实例包括但不限于表1中所示的那些。还参见:Bajar等人Sensors(Basel).2016年9月14日;16(9);和Abraham等人PLoSOne.2015年8月3日;10(8):e0134436。
表6.FRET对的实例(供体和受体FRET部分)
Figure BDA0002562709270001311
Figure BDA0002562709270001321
(1)5-(2-碘乙酰基氨基乙基)氨基萘-1-磺酸
(2)N-(4-二甲基氨基-3,5-二硝基苯基)马来酰亚胺
(3)羧基荧光素琥珀酰亚胺酯
(4)4,4-二氟-4-硼杂-3a,4a-二氮杂-s-吲哒省
在一些情况下,当经标记的检测剂ssDNA被切割时产生可检测信号(例如,在一些情况下,经标记的检测剂ssDNA包含猝灭剂/荧光剂对)。信号猝灭对的一个信号配偶体产生可检测信号,而另一个信号配偶体是猝灭剂部分,所述猝灭剂部分猝灭第一信号配偶体的可检测信号(即,猝灭剂部分猝灭信号部分的信号,使得当信号配偶体彼此接近时(例如,当信号对的信号配偶体非常接近时),来自信号部分的信号减少(被猝灭))。
例如,在一些情况下,当经标记的检测剂ssDNA被切割时,可检测信号的量增加。例如,在一些情况下,由一个信号配偶体(信号部分)显示的信号被另一个信号配偶体(猝灭剂信号部分)猝灭,例如当在由CasZ多肽进行切割之前两者存在于相同的ssDNA分子上时。这种信号对在本文中称为“猝灭剂/荧光剂对”、“猝灭对”或“信号猝灭对”。例如,在一些情况下,一个信号配偶体(例如,第一信号配偶体)是产生可检测信号的信号部分,所述可检测信号由第二信号配偶体(例如,猝灭剂部分)猝灭。因此,当配偶体被分开时(例如,在由CasZ多肽切割检测剂ssDNA之后),这种猝灭剂/荧光剂对的信号配偶体将产生可检测信号,但是当配偶体非常接近(例如,在由CasZ多肽切割检测剂ssDNA之前)时,所述信号将被猝灭。
猝灭剂部分可以将来自信号部分的信号(例如,在由CasZ多肽切割检测剂ssDNA之前)猝灭至不同程度。在一些情况下,猝灭剂部分猝灭来自信号部分的信号,其中在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号是在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号的95%或更少。例如,在一些情况下,在存在猝灭剂部分的情况下检测到的信号可以是在不存在猝灭剂部分的情况下检测到的信号的90%或更少、80%或更少、70%或更少、 60%或更少、50%或更少、40%或更少、30%或更少、20%或更少、15%或更少、10%或更少、或者5%或更少。在一些情况下,在存在猝灭剂部分的情况下未检测到信号(例如,高于背景)。
在一些情况下,在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号是在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号的至少1.2倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍)。
在一些情况下,信号部分是荧光标记。在一些此类情况下,猝灭剂部分猝灭来自荧光标记的信号(光信号)(例如,通过吸收标记的发射光谱中的能量)。因此,当猝灭剂部分不与信号部分接近时,来自荧光标记的发射(信号)是可检测的,因为信号不被猝灭剂部分吸收。可以使用任何方便的供体受体对(信号部分/猝灭剂部分对),并且许多合适的对在本领域中是已知的。
在一些情况下,猝灭剂部分从信号部分(在本文中也称为“可检测标记”)吸收能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,猝灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而猝灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些此类情况下,所述对也可以是FRET对。在一些情况下,猝灭剂部分是暗猝灭剂。暗猝灭剂可以吸收激发能量并以不同方式(例如,作为热量)耗散能量。因此,暗猝灭剂本身具有极小荧光至没有荧光(不发射荧光)。暗猝灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利公布20140378330、20140349295和20140194611;以及国际专利申请:WO200142505和WO200186001中,所有这些专利特此以引用方式整体并入。
荧光标记的实例包括但不限于:Alexa
Figure BDA0002562709270001343
染料、ATTO染料 (例如,ATTO390、ATTO425、ATTO465、ATTO488、ATTO495、 ATTO514、ATTO520、ATTO532、ATTORho6G、ATTO542、ATTO550、ATTO565、ATTORho3B、ATTORho11、ATTORho12、ATTOThio12、 ATTORho101、ATTO590、ATTO594、ATTORho13、ATTO610、 ATTO620、ATTORho14、ATTO633、ATTO647、ATTO647N、ATTO655、 ATTOOxa12、ATTO665、ATTO680、ATTO700、ATTO725、ATTO740)、 DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、 Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、 SeTau染料、SRfluor染料、Square染料、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白(tethered fluorescent protein)。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa
Figure BDA0002562709270001341
染料、ATTO染料(例如,ATTO390、ATTO425、ATTO465、ATTO488、 ATTO495、ATTO514、ATTO520、ATTO532、ATTORho6G、ATTO542、 ATTO550、ATTO565、ATTORho3B、ATTORho11、ATTORho12、 ATTOThio12、ATTORho101、ATTO590、ATTO594、ATTORho13、 ATTO610、ATTO620、ATTORho14、ATTO633、ATTO647、ATTO647N、 ATTO655、ATTOOxa12、ATTO665、ATTO680、ATTO700、ATTO725、ATTO740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、 Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta 染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素 (FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿和太平洋橙。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa
Figure BDA0002562709270001342
染料、ATTO染料(例如,ATTO390、ATTO425、ATTO465、ATTO488、 ATTO495、ATTO514、ATTO520、ATTO532、ATTORho6G、ATTO542、 ATTO550、ATTO565、ATTORho3B、ATTORho11、ATTORho12、 ATTOThio12、ATTORho101、ATTO590、ATTO594、ATTORho13、 ATTO610、ATTO620、ATTORho14、ATTO633、ATTO647、ATTO647N、 ATTO655、ATTOOxa12、ATTO665、ATTO680、ATTO700、ATTO725、ATTO740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、 Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta 染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素 (FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白。
ATTO染料的实例包括但不限于:ATTO390、ATTO425、 ATTO465、ATTO488、ATTO495、ATTO514、ATTO520、ATTO532、 ATTORho6G、ATTO542、ATTO550、ATTO565、ATTORho3B、ATTORho11、ATTORho12、ATTOThio12、ATTORho101、ATTO590、 ATTO594、ATTORho13、ATTO610、ATTO620、ATTORho14、 ATTO633、ATTO647、ATTO647N、ATTO655、ATTOOxa12、ATTO665、ATTO680、ATTO700、ATTO725和ATTO740。
AlexaFluor染料的实例包括但不限于:Alexa
Figure BDA0002562709270001351
350、Alexa
Figure BDA0002562709270001352
405、Alexa
Figure BDA0002562709270001353
430、Alexa
Figure BDA0002562709270001354
488、Alexa
Figure BDA0002562709270001355
500、 Alexa
Figure BDA0002562709270001356
514、Alexa
Figure BDA0002562709270001357
532、Alexa
Figure BDA0002562709270001358
546、Alexa
Figure BDA0002562709270001359
555、Alexa
Figure BDA00025627092700013510
568、Alexa
Figure BDA00025627092700013511
594、Alexa
Figure BDA00025627092700013512
610、Alexa
Figure BDA00025627092700013513
633、Alexa
Figure BDA00025627092700013514
635、Alexa
Figure BDA00025627092700013515
647、Alexa
Figure BDA00025627092700013516
660、 Alexa
Figure BDA00025627092700013517
680、Alexa
Figure BDA00025627092700013518
700、Alexa
Figure BDA00025627092700013519
750、Alexa
Figure BDA00025627092700013520
790等。
猝灭剂部分的实例包括但不限于:暗猝灭剂、
Figure BDA00025627092700013521
Figure BDA00025627092700013522
(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl 猝灭剂、ATTO猝灭剂(例如,ATTO540Q、ATTO580Q和ATTO612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、IowaBlack FQ、IRDye QC-1、QSY染料(例如,QSY7、QSY9、QSY21)、AbsoluteQuencher、 Eclipse和金属簇(诸如金纳米颗粒)等。
在一些情况下,猝灭剂部分选自:暗猝灭剂、
Figure BDA0002562709270001361
Figure BDA0002562709270001362
(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl 猝灭剂、ATTO猝灭剂(例如,ATTO540Q、ATTO580Q和ATTO612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY7、QSY9、QSY21)、AbsoluteQuencher、 Eclipse和金属簇。
ATTO猝灭剂的实例包括但不限于:ATTO540Q、ATTO580Q和 ATTO612Q。
Figure BDA0002562709270001363
的实例包括但不限于: BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
对于一些可检测标记(例如,荧光染料)和/或猝灭剂部分的实例,参见例如Bao等人,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利公布20140378330、 20140349295、20140194611、20130323851、20130224871、20110223677、 20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些文献特此以引用方式整体并入。
在一些情况下,可以通过测量比色读出来检测对经标记的检测剂 ssDNA的切割。例如,荧光团的释放(例如,从FRET对释放、从猝灭剂/荧光剂对释放等)可导致可检测信号的波长偏移(并因此色移)。因此,在一些情况下,可以通过色移检测主题经标记的检测剂ssDNA 的切割。这种偏移可以表示为一种颜色(波长)信号的量的损失、另一种颜色的量的增益、一种颜色与另一种颜色的比率的变化等。
用于检测靶DNA的试剂盒
本公开提供一种用于例如在包含多个DNA的样品中检测靶DNA的试剂盒。在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/ 荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;和ii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码指导RNA的核酸包括供用户插入指导序列的序列插入位点。
在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)指导RNA,和/ 或编码所述指导RNA的核酸;ii)tranc RNA和/或编码所述指导RNA的核酸;和iii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码指导RNA的核酸包括供用户插入指导序列的序列插入位点。
在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)包含指导RNA 和tranc RNA的单分子RNA,和/或编码单分子RNA的核酸;和iii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码单分子RNA的核酸包含供用户插入指导序列的序列插入位点。
在一些情况下,主题试剂盒包含:(a)经标记的检测剂ssDNA,所述经标记的检测剂ssDNA包含荧光发射染料对,例如FRET对和/ 或猝灭剂/荧光剂对;以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;和/或i)CasZ多肽。
阳性对照
本公开的试剂盒(例如,包含经标记的检测剂ssDNA和CasZ多肽的试剂盒)还可以包含阳性对照靶DNA。在一些情况下,试剂盒还包含阳性对照指导RNA,所述阳性对照指导RNA包含与对照靶DNA 杂交的核苷酸序列。在一些情况下,将阳性对照靶DNA以各种量提供在分开的容器中。在一些情况下,将阳性对照靶DNA以各种已知浓度与对照非靶DNA一起提供在分开的容器中。
核酸
虽然本公开的RNA(例如,指导RNA、tranc RNA、包含指导RNA 和tranc RNA的单分子RNA)可以使用任何方便的方法合成(例如,使用RNA聚合酶(例如,T7聚合酶、T3聚合酶、SP6聚合酶)在体外化学合成等),但是也设想了编码此类RNA的核酸。另外,虽然可以蛋白质形式提供本公开的CasZ多肽(例如,作为试剂盒的一部分),但是也可以提供编码所述CasZ多肽的核酸(诸如mRNA和/或DNA)。
在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码单分子RNA的核苷酸序列,所述单分子RNA包含:i)指导RNA;和ii)tranc RNA。在一些情况下,核苷酸序列编码没有指导序列的单分子RNA的指导RNA部分。例如,在一些情况下,核酸包含编码以下的核苷酸序列:i)指导RNA(没有指导序列的指导RNA)的恒定区,并且包含编码指导序列的核酸的插入位点;和ii)tranc RNA。
例如,在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码指导RNA的核苷酸序列。在一些情况下,核苷酸序列编码没有指导序列的指导RNA。例如,在一些情况下,核酸包含编码指导RNA(没有指导序列的指导RNA)的恒定区的核苷酸序列,并且包含编码指导序列的核酸的插入位点。在一些情况下,本公开的试剂盒包含核酸(例如,mRNA、DNA,例如重组表达载体),所述核酸包含编码CasZ多肽的核苷酸序列。
在一些情况下,编码指导RNA的核苷酸序列与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子等。在一些情况下,编码CasZ多肽的核苷酸序列与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子、细胞类型特异性启动子、可调控启动子、组织特异性启动子等。
实用性
CasZ组合物(例如,表达载体、试剂盒、组合物、核酸等)可用于多种方法。例如,本公开的CasZ组合物可用于(i)修饰(例如切割,例如切口;甲基化等)靶核酸(DNA或RNA;单链或双链);(ii)调节靶核酸的转录;(iii)标记靶核酸;(iv)结合靶核酸(例如,用于分离、标记、成像、追踪等的目的);(v)修饰与靶核酸相关联的多肽(例如,组蛋白) 等。因此,本公开提供一种修饰靶核酸的方法。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)本公开的CasZ多肽;和b)一种或多种(例如,两种)CasZ指导RNA。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)CasZ多肽;和b)一种或多种(例如,两种)CasZ指导RNA;和c)CasZ trancRNA。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)本公开的CasZ多肽;b)CasZ指导RNA;和c)供体核酸(例如,供体模板)。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)CasZ多肽; b)CasZ指导RNA;c)CasZ trancRNA;和d)供体核酸(例如,供体模板)。在一些情况下,接触步骤在体外细胞中进行。在一些情况下,接触步骤在体内细胞中进行。在一些情况下,接触步骤在离体细胞中进行。
因为使用CasZ多肽的方法包括将CasZ多肽与靶核酸中的特定区域结合(通过相关联的CasZ指导RNA靶向靶核酸中的特定区域),所述方法在本文中一般称为结合方法(例如,结合靶核酸的方法)。然而,应理解在一些情况下,虽然结合方法可能无非是导致靶核酸的结合,但在其他情况下,所述方法可具有不同的最终结果(例如,所述方法可导致靶核酸的修饰(例如,切割/甲基化等);从靶核酸转录的调节;靶核酸翻译的调节;基因组编辑;与靶核酸相关联的蛋白质的调节;靶核酸的分离等)。
对于合适方法的实例(例如,与CRISPR/Cas9系统一起使用的方法),参见例如Jinek等人,Science.2012年8月17日;337(6096):816-21; Chylinski等人,RNABiol.2013年5月;10(5):726-37;Ma等人,Biomed Res Int.2013;2013:270805;Hou等人,Proc NatlAcad Sci USA.2013 年9月24日;110(39):15644-9;Jinek等人,Elife.2013;2:e00471;Pattanayak等人,Nat Biotechnol.2013年9月;31(9):839-43;Qi等人, Cell.2013年2月28日;152(5):1173-83;Wang等人,Cell.2013年5月 9日;153(4):910-8;Auer等人,GenomeRes.2013年10月31日;Chen 等人,Nucleic Acids Res.2013年11月1日;41(20):e19;Cheng等人,Cell Res.2013年10月;23(10):1163-71;Cho等人,Genetics.2013年11 月;195(3):1177-80;DiCarlo等人,Nucleic Acids Res.2013年4 月;41(7):4336-43;Dickinson等人,Nat Methods.2013年10 月;10(10):1028-34;Ebina等人,Sci Rep.2013;3:2510;Fujii等人,Nucleic Acids Res.2013年11月1日;41(20):e187;Hu等人,Cell Res.2013年 11月;23(11):1322-5;Jiang等人,Nucleic Acids Res.2013年11月1 日;41(20):e188;Larson等人,Nat Protoc.2013年11月;8(11):2180-96; Mali等人,Nat Methods.2013年10月;10(10):957-63;Nakayama等人, Genesis.2013年12月;51(12):835-43;Ran等人,NatProtoc.2013年11 月;8(11):2281-308;Ran等人,Cell.2013年9月12日;154(6):1380-9;Upadhyay等人,G3(Bethesda).2013年12月9日;3(12):2233-8;Walsh 等人,Proc NatlAcad Sci USA.2013年9月24日;110(39):15514-5;Xie 等人,Mol Plant.2013年10月9日;Yang等人,Cell.2013年9月12 日;154(6):1370-9;以及以下美国专利和专利申请:8,906,616;8,895,308; 8,889,418;8,889,356;8,871,445;8,865,406;8,795,965;8,771,945;8,697,359;20140068797;20140170753;20140179006;20140179770; 20140186843;20140186919;20140186958;20140189896;20140227787; 20140234972;20140242664;20140242699;20140242700;20140242702; 20140248702;20140256046;20140273037;20140273226;20140273230; 20140273231;20140273232;20140273233;20140273234;20140273235; 20140287938;20140295556;20140295557;20140298547;20140304853;20140309487;20140310828;20140310830;20140315985;20140335063; 20140335620;20140342456;20140342457;20140342458;20140349400; 20140349405;20140356867;20140356956;20140356958;20140356959; 20140357523;20140357530;20140364333;和20140377868;所述文献各自特此以引用方式整体并入。
例如,本公开提供(但不限于)切割靶核酸的方法;编辑靶核酸的方法;调节靶从核酸转录的方法;分离靶核酸的方法、结合靶核酸的方法、对靶核酸成像的方法、修饰靶核酸的方法等。
如本文所用,术语/短语“使靶核酸,例如,与CasZ多肽或与CasZ 融合多肽等接触”,涵盖用于接触靶核酸的所有方法。例如,可将CasZ 多肽作为蛋白质、RNA(编码CasZ多肽)或DNA(编码CasZ多肽)提供给细胞;而可将CasZ指导RNA作为指导RNA或编码指导RNA 的核酸提供,并且可将CasZ trancRNA作为trancRNA或编码 trancRNA的核酸提供。因此,当例如在细胞中(例如,在体外细胞内部、在体内细胞内部、在离体细胞内部)执行方法时,包括接触靶核酸的方法涵盖将处于活性/最终状态的任何或所有组分(例如,呈CasZ 多肽的一种或多种蛋白质形式;呈CasZ融合多肽的蛋白质形式;在一些情况下呈指导RNA的RNA形式)引入细胞中,并且还涵盖将编码一种或多种组分的一种或多种核酸(例如,一种或多种包含编码 CasZ多肽或CasZ融合多肽的一种或多种核苷酸序列的核酸、一种或多种包含编码一种或多种指导RNA的一种或多种核苷酸序列的核酸、包含编码供体模板的核苷酸序列的核酸等)引入细胞中。因为所述方法也可在体外在细胞外部执行,所以包括接触靶核酸的方法(除非另外指明)涵盖在体外在细胞外部、在体外在细胞内部、在体内在细胞内部、离体在细胞内部接触等。
在一些情况下,本公开的用于修饰靶核酸的方法包括向靶细胞中引入CasZ基因座,例如来自包含CasZ基因座的细胞(例如,在一些情况下,处于天然状态(天然存在的状态)包含CasZ基因座的细胞)的核酸,所述核酸包含编码CasZ多肽的核苷酸序列以及长度为约1千碱基(kb)至5kb的在编码CasZ的核苷酸序列周围的核苷酸序列,其中靶细胞通常(在天然状态下)不包含CasZ基因座(例如,在一些情况下,基因座包含CasZ trancRNA)。然而,可以修饰一个或多个间隔序列,一个或多个编码crRNA的编码指导序列,使得靶向一个或多个目标靶序列。因此,例如,在一些情况下,本公开的用于修饰靶核酸的方法包括向靶细胞中引入CasZ基因座,例如,从源细胞(例如,在一些情况下,处于天然状态(天然存在的状态)包含CasZ基因座的细胞)获得的核酸,其中核酸具有100个核苷酸(nt)至5kb(例如,100nt至500nt、500nt至1kb、1kb至1.5kb、1.5kb至2kb、2kb至2.5kb、 2.5kb至3kb、3kb至3.5kb、3.5kb至4kb、或4kb至5kb)的长度并且包含编码CasZ多肽的核苷酸序列。如上所述,在一些此类情况下,可以修饰一个或多个间隔序列,一个或多个编码crRNA的编码指导序列,使得靶向一个或多个目标靶序列。在一些情况下,所述方法包括向靶细胞中引入:i)CasZ基因座;和ii)供体DNA模板。在一些情况下,靶核酸在体外无细胞组合物中。在一些情况下,靶核酸存在于靶细胞中。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是原核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是真核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是哺乳动物细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是植物细胞。
在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与本公开的CasZ多肽或本公开的CasZ融合多肽接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与CasZ多肽和CasZ 指导RNA接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与CasZ多肽、CasZ指导RNA和CasZ trancRNA接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与 CasZ多肽、第一CasZ指导RNA和第二CasZ指导RNA(以及在一些情况下,CasZ trancRNA)接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:本公开的CasZ多肽,和 CasZ指导RNA,和供体DNA模板。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:本公开的CasZ多肽,和CasZ指导RNA,和CasZ trancRNA,和供体DNA模板。
在一些情况下,靶核酸在体外无细胞组合物中。在一些情况下,靶核酸存在于靶细胞中。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是原核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是真核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是哺乳动物细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是植物细胞。
目标靶核酸和靶细胞
靶核酸可以是任何核酸(例如,DNA、RNA),可以是双链或单链的,可以是任何类型的核酸(例如,染色体(基因组DNA)、衍生自染色体、染色体DNA、质粒、病毒、细胞外、细胞内、线粒体、叶绿体、线性、环状等)并且可来自任何生物体(例如,只要CasZ指导RNA 包含与靶核酸中的靶序列杂交的核苷酸序列,使得靶核酸可被靶向即可)。
靶核酸可以是DNA或RNA。靶核酸可以是双链的(例如,dsDNA、dsRNA)或单链的(例如,ssRNA、ssDNA)。在一些情况下,靶核酸是单链的。在一些情况下,靶核酸是单链RNA(ssRNA)。在一些情况下,靶ssRNA(例如,靶细胞ssRNA、病毒ssRNA等)选自:mRNA、rRNA、tRNA、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和微小RNA (miRNA)。在一些情况下,靶核酸是单链DNA(ssDNA)(例如,病毒 DNA)。如上所指出,在一些情况下,靶核酸是单链的。
靶核酸可位于任何地方,例如,体外细胞外部、体外细胞内部、体内细胞内部、离体细胞内部。合适的靶细胞(其可包含靶核酸,诸如基因组DNA)包括但不限于:细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞 (例如,酵母细胞);动物细胞;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;昆虫(例如,蚊子;蜜蜂;农业害虫等)的细胞;蛛形纲动物(例如,蜘蛛;蜱等)的细胞;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;来自哺乳动物的细胞(例如,来自啮齿动物的细胞;来自人类的细胞;非人哺乳动物的细胞;啮齿动物(例如,小鼠、大鼠)的细胞;兔形目动物(例如,兔)的细胞;有蹄类动物(例如,牛、马、骆驼、美洲驼、骆马、绵羊、山羊等)的细胞;海洋哺乳动物(例如,鲸鱼、海豹、象海豹、海豚、海狮等)的细胞等。任何类型的细胞都可以是感兴趣的(例如干细胞,例如胚胎干(ES)细胞、诱导多能干(iPS)细胞、生殖细胞(例如,卵母细胞、精子、卵原细胞、精原细胞等)、成体干细胞、体细胞(例如,成纤维细胞)、造血细胞、神经元、肌肉细胞、骨细胞、肝细胞、胰腺细胞;在任何阶段下胚胎的体外或体内胚胎细胞(例如,1个细胞、 2个细胞、4个细胞、8个细胞等阶段斑马鱼胚胎)等)。
细胞可来自已建立的细胞系或者它们可以是原代细胞,其中“原代细胞”、“原代细胞系”和“原代培养物”在本文中可互换使用,是指衍生自受试者并且允许培养物在体外生长有限次数的传代(即,分裂) 的细胞和细胞培养物。例如,原代培养物是可能已传代0次、1次、 2次、4次、5次、10次或15次但不足以通过转折期的次数的培养物。通常,原代细胞系在体外维持少于10代。靶细胞可以是单细胞生物体并且/或者可在培养物中生长。如果细胞是原代细胞,它们可通过任何方便的方法从个体收获。例如,白细胞可通过血浆分离置换法、白细胞血浆分离置换法、密度梯度分离等方便地收获,而来自组织(诸如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等)的细胞可通过活组织检查方便地收获。
在上述申请的一些申请中,主题方法可用于在体内和/或离体和/ 或体外的有丝分裂细胞或有丝分裂后细胞中诱导靶核酸切割、靶核酸修饰和/或结合靶核酸(例如,用于可视化,用于采集和/或分析等)(例如,以破坏由靶向mRNA编码的蛋白质的产生,以切割或以其他方式修饰靶DNA,以遗传修饰靶细胞等)。因为指导RNA通过与靶核酸杂交来提供特异性,所以在公开的方法中目标有丝分裂细胞和/或有丝分裂后细胞可包括来自任何生物体的细胞(例如,细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;来自哺乳动物的细胞;来自啮齿动物的细胞;来自人的细胞等)。在一些情况下,可将主题CasZ蛋白(和/或编码蛋白质的核酸,诸如DNA 和/或RNA)和/或CasZ指导RNA(和/或编码指导RNA的DNA)和/或供体模板和/或RNP引入个体(即,靶细胞可在体内)(例如,哺乳动物、大鼠、小鼠、猪、灵长类动物、非人灵长类动物、人等)中。在一些情况下,这种施用可例如通过编辑靶向细胞的基因组用于治疗和/或预防疾病的目的。
植物细胞包括单子叶植物细胞和双子叶植物细胞。细胞可以是根细胞、叶细胞、木质部细胞、韧皮部细胞、形成层细胞、顶端分生组织细胞、实质细胞、厚角组织细胞、厚壁组织细胞等。植物细胞包括农作物的细胞,诸如小麦、玉米、大米、高粱、小米、大豆等的细胞。植物细胞包括农业水果和坚果植物的细胞,例如生产杏、橙子、柠檬、苹果、李子、梨、杏仁等的植物的细胞。
靶细胞的其他实例在上文标题为“修饰的细胞”的部分中列出。细胞(靶细胞)的非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如,来自植物作物、水果、蔬菜、谷物、大豆、玉米(corn)、玉米(maize)、小麦、种子、番茄、大米、木薯、甘蔗、南瓜、干草、马铃薯、棉花、大麻、烟草、开花植物、针叶树、裸子植物、被子植物、蕨类植物、石松类、角苔类、苔类、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等)、海藻(例如巨藻)、真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬(例如,狗)等)的细胞等。在一些情况下,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制得的细胞;也称为人造细胞)。
细胞可以是体外细胞(例如,建立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞可以是生物体内部的细胞。细胞可以是生物体。细胞可以是细胞培养物(例如,体外细胞培养物)中的细胞。细胞可以是细胞集合中的一者。细胞可以是原核细胞或衍生自原核细胞。细胞可以是细菌细胞或可衍生自细菌细胞。细胞可以是古细菌细胞或衍生自古细菌细胞。细胞可以是真核细胞或衍生自真核细胞。细胞可以是植物细胞或衍生自植物细胞。细胞可以是动物细胞或衍生自动物细胞。细胞可以是无脊椎动物细胞或衍生自无脊椎动物细胞。细胞可以是脊椎动物细胞或衍生自脊椎动物细胞。细胞可以是哺乳动物细胞或衍生自哺乳动物细胞。细胞可以是啮齿动物细胞或衍生自啮齿动物细胞。细胞可以是人细胞或衍生自人细胞。细胞可以是微生物细胞或衍生自微生物细胞。细胞可以是真菌细胞或衍生自真菌细胞。细胞可以是昆虫细胞。细胞可以是节肢动物细胞。细胞可以是原生动物细胞。细胞可以是蠕虫细胞。
合适的细胞包括干细胞(例如胚胎干(ES)细胞、诱导多能干(iPS) 细胞;生殖细胞(例如,卵母细胞、精子、卵原细胞、精原细胞等);体细胞,例如成纤维细胞、少突胶质细胞、神经胶质细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰腺细胞等。
合适的细胞包括人胚胎干细胞、胚胎心肌细胞、肌成纤维细胞、间充质干细胞、自体移植的扩增的心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓衍生祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
在一些情况下,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些情况下,免疫细胞是T细胞、B细胞、单核细胞、天然杀伤细胞、树突状细胞或巨噬细胞。在一些情况下,免疫细胞是细胞毒性T细胞。在一些情况下,免疫细胞是辅助性T细胞。在一些情况下,免疫细胞是调节性T细胞(Treg)。
在一些情况下,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为体细胞干细胞。
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是干细胞所存在于的组织中的典型细胞类型。体细胞干细胞的许多实例是本领域的技术人员已知的,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞等。
目标干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指被分类为哺乳动物的任何动物,包括人;非人灵长类动物;家畜和农场动物;以及动物园、实验室、运动或宠物动物,诸如狗、马、猫、牛、小鼠、大鼠、兔等。在一些情况下,干细胞是人干细胞。在一些情况下,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些情况下,干细胞是非人灵长类动物干细胞。
干细胞可表达一种或多种干细胞标志物,例如SOX9、KRT19、 KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、 OLFM4、CDH17和PPARGC1A。
在一些情况下,干细胞是造血干细胞(HSC)。HSC是中胚层衍生的细胞,其可从骨髓、血液、脐带血、胎儿肝脏和卵黄囊中分离。 HSC的特征在于CD34+和CD3-。HSC可在体内重新生成红系细胞、中性粒细胞-巨噬细胞、巨核细胞和淋巴样造血细胞谱系。在体外,可诱导HSC经历至少一些自我更新的细胞分裂,并且可诱导HSC分化成与体内所见相同的谱系。因此,可诱导HSC分化成红系细胞、巨核细胞、中性粒细胞、巨噬细胞和淋巴细胞中的一种或多种。
在其他情况下,干细胞是神经干细胞(NSC)。神经干细胞(NSC) 能够分化成神经元和神经胶质细胞(包括少突胶质细胞和星形胶质细胞)。神经干细胞是能够进行多次分裂的多能干细胞,并且在特定条件下可产生作为神经干细胞的子细胞,或可作为成神经细胞或成胶质细胞的神经祖细胞,例如,分别致力于成为一种或多种类型的神经元和神经胶质细胞的细胞。获得NSC的方法在本领域中是已知的。
在其他情况下,干细胞是间充质干细胞(MSC)。MSC最初衍生自胚胎中胚层并从成人骨髓中分离,可分化形成肌肉、骨、软骨、脂肪、骨髓基质和肌腱。分离MSC的方法在本领域中是已知的;并且可使用任何已知的方法来获得MSC。参见例如美国专利号5,736,396,其描述了人MSC的分离。
在一些情况下,细胞是植物细胞。植物细胞可以是单子叶植物的细胞。细胞可以是双子叶植物的细胞。
在一些情况下,细胞是植物细胞。例如,细胞可以是主要农业植物的细胞,例如大麦、豆类(干食用)、油菜、玉米、棉花(皮玛棉)、棉花(陆地棉)、亚麻籽、干草(苜蓿)、干草(非苜蓿)、燕麦、花生、大米、高粱、大豆、甜菜、甘蔗、向日葵(油)、向日葵(非油)、甘薯、烟草(白肋烟)、烟草(烤烟)、番茄、小麦(硬质小麦)、小麦(春小麦)、小麦(冬小麦)等。作为另一个实例,细胞是蔬菜作物的细胞,所述蔬菜作物包括但不限于例如,苜蓿芽、芦荟叶、葛根、慈菇、朝鲜蓟、芦笋、竹笋、香蕉花、豆芽、豆类、甜菜叶、甜菜、苦瓜、白菜、西兰花、球花甘蓝(芜菁)、球芽甘蓝、卷心菜、卷心菜芽、仙人掌叶(仙人掌果)、笋瓜、刺棘蓟、胡萝卜、花椰菜、芹菜、佛手瓜、中国洋蓟、大白菜、中国芹菜、中国韭菜、菜心、菊花叶(茼蒿)、羽衣甘蓝、玉米秸秆、甜玉米、黄瓜、白萝卜、蒲公英嫩叶、芋头、dau mue、 donqua(冬瓜)、茄子、菊苣、莴苣、琴头蕨、田地水芹、苦苣、盖菜 (芥菜)、gailon、良姜(暹罗、泰国姜)、大蒜、姜根、牛蒡、嫩叶、汉诺威沙拉用绿叶、huauzontle、洋姜、豆薯、羽衣甘蓝嫩叶、大头菜、羊腿藜、生菜(贝比生菜)、生菜(波士顿生菜)、生菜(波士顿红生菜)、生菜(绿叶)、生菜(冰山生菜)、生菜(红毛菜)、生菜(绿橡树叶)、生菜(红橡树叶)、生菜(加工生菜)、生菜(红叶)、生菜(罗马生菜)、生菜(红罗马生菜)、生菜(俄罗斯红芥末)、linkok、白萝卜、长豆、莲藕、野苣、龙舌兰(龙舌兰)叶、黄肉芋、混和生菜、京水菜、moap(光滑丝瓜)、 moo、moqua(有绒毛的南瓜)、蘑菇、芥末、山药、秋葵、通菜、洋葱嫩叶、opo(长南瓜)、观赏玉米、观赏葫芦、欧芹、欧洲防风草、豌豆、辣椒(铃铛型)、辣椒、南瓜、菊苣、萝卜芽、萝卜、青芸苔、青芸苔、大黄、罗马生菜、芜菁甘蓝、盐角草(海豆)、丝瓜(角形/脊状丝瓜)、菠菜、南瓜、稻草捆、甘蔗、甘薯、唐莴苣、罗望子、芋艿、芋艿叶、芋艿芽、塌棵菜、tepeguaje(葫芦)、红瓜、粘果酸浆、番茄、番茄(樱桃型)、番茄(葡萄型)、番茄(李子型)、姜黄、芜菁茎嫩叶、芜菁、荸荠、薯蓣、山药(名称)、油菜、木薯(木薯)等。
在一些情况下,细胞是节肢动物细胞。例如,细胞可以是以下的亚目、家族、亚家族、群体、亚群或物种的细胞:例如,有螯肢亚门 (Chelicerata)、多足亚门(Myriapodia)、Hexipodia、蛛形纲(Arachnida)、昆虫纲(Insecta)、石蛃目(Archaeognatha)、缨尾目(Thysanura)、古翅下纲(Palaeoptera)、蜉蝣目(Ephemeroptera)、蜻蜓目(Odonata)、差翅亚目(Anisoptera)、束翅亚目(Zygoptera)、新翅亚纲(Neoptera)、外翅总目(Exopterygota)、襀翅目(Plecoptera)、纺足目(Embioptera)、直翅目(Orthoptera)、缺翅目(Zoraptera)、革翅目(Dermaptera)、网翅目 (Dictyoptera)、蛩蠊目(Notoptera)、蛩蠊科(Grylloblattidae)、螳科 (Mantophasmatidae)、竹节虫目(Phasmatodea)、蜚蠊目(Blattaria)、等翅目(Isoptera)、螳螂目(Mantodea)、Parapneuroptera、啮虫目(Psocoptera)、缨翅目(Thysanoptera)、虱毛目(Phthiraptera)、半翅目 (Hemiptera)、内翅类(Endopterygota)或全变态类(Holometabola)、膜翅目(Hymenoptera)、鞘翅目(Coleoptera)、捻翅目(Strepsiptera)、蛇蛉目 (Raphidioptera)、广翅目(Megaloptera)、脉翅目(Neuroptera)、长翅目 (Mecoptera)、蚤目(Siphonaptera)、双翅目(Diptera)、毛翅目 (Trichoptera)或鳞翅目(Lepidoptera)。
在一些情况下,细胞是昆虫细胞。例如,在一些情况下,细胞是蚊子、蚱蜢、半翅目昆虫、苍蝇、跳蚤、蜜蜂、黄蜂、蚂蚁、虱子、蛾或甲虫的细胞。
供体多核苷酸(供体模板)
在CasZ指导RNA的指导下,CasZ蛋白在一些情况下在双链 DNA(dsDNA)靶核酸内生成位点特异性双链断裂(DSB)或单链断裂 (SSB)(例如,当CasZ蛋白是切口酶变体时),这些断裂通过非同源末端连接(NHEJ)或同源定向重组(HDR)修复。
在一些情况下,使靶DNA(与CasZ蛋白和CasZ指导RNA)接触在允许非同源末端连接或同源定向修复的条件下发生。因此,在一些情况下,主题方法包括使靶DNA与供体多核苷酸接触(例如,通过将供体多核苷酸引入细胞中),其中将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合到靶DNA中。在一些情况下,所述方法不包括使细胞与供体多核苷酸接触,并且修饰靶DNA使得靶DNA内的核苷酸缺失。
在一些情况下,CasZ trancRNA(或编码CasZ trancRNA的核酸)、 CasZ指导RNA(或编码CasZ指导RNA的核酸)和/或CasZ蛋白(或编码CasZ蛋白的核酸,诸如RNA或DNA,例如一种或多种表达载体) 与供体多核苷酸序列共同施用(例如,与靶核酸接触、向细胞施用等),所述供体多核苷酸序列包括与靶DNA序列同源的至少一个区段,主题方法可用于将核酸物质添加(即插入或替代)到靶DNA序列(例如以“敲入”核酸,例如编码蛋白质、siRNA、miRNA的核酸等),添加标签(例如,6xHis、荧光蛋白(例如,绿色荧光蛋白;黄色荧光蛋白等)、血凝素(HA)、FLAG等),将调控序列添加到基因(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等),修饰核酸序列(例如,引入突变、通过引入正确的序列去除致病突变)等。因此,包含CasZ指导RNA 和CasZ蛋白(或CasZ指导RNA和CasZ trancRNA和CasZ蛋白)的复合物可用于任何体外或体内应用中,在所述应用中希望以位点特异性 (即“靶向的”)方式修饰DNA,例如基因敲除、基因敲入、基因编辑、基因标签等,例如,如在例如治疗疾病或作为抗病毒、抗病原体或抗癌治疗剂的基因疗法,农业中遗传修饰的生物体的生产,出于治疗、诊断或研究目的通过细胞进行的大规模蛋白质生产,iPS细胞诱导,生物研究,用于缺失或替代的病原体基因的靶向等中所使用的。
在其中希望将多核苷酸序列插入靶序列被切割的基因组中的应用中,还可向细胞提供供体多核苷酸(包含供体序列的核酸)。“供体序列”或“供体多核苷酸”或“供体模板”意指待在CasZ蛋白切割的位点处插入的核酸序列(例如,在dsDNA切割之后、对靶DNA进行切口之后、对靶DNA进行双切口之后等)。供体多核苷酸可含有与靶位点处的基因组序列足够的同源性(例如与侧接靶位点,例如在靶位点的约 50个或更少的碱基内(例如约30个碱基内、约15个碱基内、约10 个碱基内、约5个碱基内)的核苷酸序列或直接侧接靶位点的核苷酸序列,具有70%、80%、85%、90%、95%或100%的同源性),以支持所述供体多核苷酸与和其具有同源性的基因组序列之间的同源定向修复。在供体与基因组序列之间具有序列同源性的大约25个、50 个、100个或200个核苷酸或多于200个核苷酸(或10与200之间任何整数值的核苷酸或更多)可支持同源定向修复。供体多核苷酸可具有任何长度,例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。
供体序列通常不与它替代的基因组序列相同。而且,供体序列相对于基因组序列可含有至少一个或多个单个碱基变化、插入、缺失、反转或重排,只要存在足够同源性以支持同源定向修复即可(例如,用于基因校正,例如,以转化致病碱基对或非致病碱基对)。在一些实施方案中,供体序列包含侧接两个同源区的非同源序列,以使得靶 DNA区域与两个侧接序列之间的同源定向修复导致在靶区域处插入非同源序列。供体序列还可包含载体骨架,所述载体骨架含有不与目标DNA区域同源并且不意图插入到目标DNA区域中的序列。通常,供体序列的一个或多个同源区将与希望与其重组的基因组序列具有至少50%的序列同一性。在某些实施方案中,存在60%、70%、80%、 90%、95%、98%、99%或99.9%的序列同一性。根据供体多核苷酸的长度,可存在1%与100%之间的任何值的序列同一性。
供体序列与基因组序列相比可包含某些序列差异,例如限制位点、核苷酸多态性、可选择标记(例如,抗药基因、荧光蛋白、酶等)等,所述序列差异可用来评估供体序列在切割位点处的成功插入或在一些情况下可用于其他目的(例如,表示靶向基因组基因座处的表达)。在一些情况下,如果位于编码区中,此类核苷酸序列差异将不会改变氨基酸序列,或将产生沉默氨基酸变化(即,不影响蛋白质结构或功能的变化)。可替代地,这些序列差异可包括侧接重组序列,诸如FLP、 loxP序列等,所述侧接重组序列可在去除标记序列之后的时间里激活。
在一些情况下,供体序列作为单链DNA提供给细胞。在一些情况下,供体序列作为双链DNA提供给细胞。它可以线性或环状形式引入细胞中。如果以线性形式引入,供体序列的末端可通过任何方便的方法来保护(例如,免受核酸外切降解),并且此类方法是本领域的技术人员已知的。例如,可将一个或多个双脱氧核苷酸残基添加到线性分子的3’末端,并且/或者可将自身互补寡核苷酸连接至一个或两个末端。参见例如Chang等人(1987)Proc.Natl.Acad Sci USA84:4959-4963;Nehls等人(1996)Science 272:886-889。用于保护外源多核苷酸免受降解的另外方法包括但不限于添加一个或多个末端氨基以及使用修饰的核苷酸间键联,例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。作为保护线性供体序列的末端的替代方案,可在同源区外部包括额外长度的序列,所述序列可在不影响重组的情况下降解。可将供体序列作为载体分子的一部分引入细胞中,所述载体分子具有另外的序列,例如像复制起点、启动子和编码抗生素耐药性的基因。此外,供体序列可作为裸核酸、作为与剂(诸如脂质体或泊洛沙姆)复合的核酸引入,或者可通过病毒(例如,腺病毒AAV)来递送,如本文其他地方对于编码CasZ指导RNA和/或CasZ 融合多肽和/或供体多核苷酸的核酸所述。
转基因非人生物体
如上所述,在一些情况下,本公开的核酸(例如,重组表达载体) (例如,包含编码CasZ多肽的核苷酸序列的核酸;包含编码CasZ融合多肽的核苷酸序列的核酸等)用作转基因以生成转基因非人生物体,所述转基因非人生物体产生本公开的CasZ多肽或CasZ融合多肽。本公开提供一种转基因非人生物体,所述转基因非人生物体包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列。
转基因非人动物
本公开提供一种转基因非人动物,所述动物包含转基因,所述转基因包含含有编码CasZ多肽或CasZ融合多肽的核苷酸序列的核酸。在一些实施方案中,转基因非人动物的基因组包含编码本公开的 CasZ多肽或CasZ融合多肽的核苷酸序列。在一些情况下,转基因非人动物对于遗传修饰是纯合的。在一些情况下,转基因非人动物对于遗传修饰是杂合的。在一些实施方案中,转基因非人动物是脊椎动物,例如鱼类(例如,鲑鱼、鳟鱼、斑马鱼、金鱼、河豚、洞穴鱼等)、两栖动物(青蛙、蝾螈、火蜥蜴等)、鸟类(例如,鸡、火鸡等)、爬行动物(例如,蛇、蜥蜴等)、非人哺乳动物(例如,有蹄类动物,例如猪、牛、山羊、绵羊等;兔形目动物(例如,兔);啮齿动物(例如,大鼠、小鼠);非人灵长类动物等)等。在一些情况下,转基因非人动物是无脊椎动物。在一些情况下,转基因非人动物是昆虫(例如,蚊子;农业害虫等)。在一些情况下,转基因非人动物是蛛形纲动物。
编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列可在未知启动子(例如,当核酸随机整合到宿主细胞基因组中时)的控制之下 (即,可操作地连接至未知启动子)或可在已知启动子的控制之下(即,可操作地连接至已知启动子)。合适的已知启动子可以是任何已知启动子并且包括组成型活性启动子(例如,CMV启动子)、诱导型启动子(例如,热休克启动子、四环素调控的启动子、类固醇调控的启动子、金属调控的启动子、雌激素受体调控的启动子等)、空间限制的和/或时间限制的启动子(例如,组织特异性启动子、细胞类型特异性启动子等)等。
转基因植物
如上所述,在一些情况下,本公开的核酸(例如,重组表达载体) (例如,包含编码本公开的CasZ多肽的核苷酸序列的核酸;包含编码本公开的CasZ融合多肽的核苷酸序列的核酸等)用作转基因以生成转基因植物,所述转基因植物产生本公开的CasZ多肽或CasZ融合多肽。本公开提供一种转基因植物,所述转基因植物包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列。在一些实施方案中,转基因植物的基因组包含主题核酸。在一些实施方案中,转基因植物对于遗传修饰是纯合的。在一些实施方案中,转基因植物对于遗传修饰是杂合的。
将外源核酸引入植物细胞中的方法在本领域中是众所周知的。如上所定义,此类植物细胞被认为是“转化的”。合适的方法包括病毒感染(诸如双链DNA病毒)、转染、缀合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接微注射、碳化硅晶须技术、土壤杆菌属介导的转化等。方法的选择一般取决于待转化的细胞类型和发生转化所在的环境(即体外、离体或体内)。
基于土壤细菌根瘤土壤杆菌(Agrobacterium tumefaciens)的转化方法特别可用于将外源核酸分子引入维管植物中。土壤杆菌属 (Agrobacterium)的野生型形式含有Ti(肿瘤诱导)质粒,该质粒引导在宿主植物上生长的致瘤冠瘿的产生。Ti质粒的肿瘤诱导T-DNA区向植物基因组的转移需要Ti质粒编码的毒力基因以及T-DNA边缘序列,所述T-DNA边缘序列是描绘待转移区域的一组正向DNA重复序列。基于土壤杆菌属的载体是Ti质粒的修饰形式,其中肿瘤诱导功能被待引入植物宿主中的目标核酸序列替代。
土壤杆菌属介导的转化一般采用共合体载体或二元载体系统,其中Ti质粒的组分在辅助载体(所述辅助载体永久驻留在土壤杆菌属宿主中并且携带毒力基因)与穿梭载体(所述穿梭载体含有被T-DNA序列界定的目标基因)之间分配。多种二元载体在本领域中是众所周知的并且可例如从Clontech(Palo Alto,Calif.)商购获得。例如用培养的植物细胞或创伤组织诸如叶组织、根外植体、下胚轴体、茎块或块茎共同培养土壤杆菌属的方法在本领域中也是众所周知的。参见例如Glick和Thompson(编),Methods in Plant MolecularBiology and Biotechnology,Boca Raton,Fla.:CRCPress(1993)。
微粒介导的转化还可用来产生主题转基因植物。首先由Klein等人(Nature 327:70-73(1987))描述的这种方法依赖于微粒(诸如金或钨),所述微粒通过用氯化钙、亚精胺或聚乙二醇沉淀包被有所需的核酸分子。微粒颗粒使用诸如BIOLISTICPD-1000(Biorad;Hercules Calif.) 的装置在高速下被加速到被子植物组织中。
可将本公开的核酸(例如,包含编码本公开的CasZ多肽或CasZ 融合多肽的核苷酸序列的核酸(例如,重组表达载体))以使得核酸能够例如通过体内或离体方案进入一种或多种植物细胞的方式引入植物中。“体内”意指向植物的活体施用核酸,例如渗透。“离体”意指在植物外部修饰细胞或外植体,然后使此类细胞或器官再生为植物。已描述了适用于稳定转化植物细胞或建立转基因植物的多种载体,包括描述于Weissbach和Weissbach,(1989)Methods for Plant Molecular Biology Academic Press以及Gelvin等人,(1990)Plant Molecular Biology Manual,Kluwer Academic Publishers中的那些载体。具体实例包括衍生自根瘤土壤杆菌的Ti质粒的那些,以及由Herrera-Estrella 等人(1983)Nature 303:209,Bevan(1984)Nucl Acid Res.12:8711-8721, Klee(1985)Bio/Technolo3:637-642公开的那些。可替代地,非Ti载体可用来通过使用游离DNA递送技术将DNA转移到植物和细胞中。通过使用这些方法,可产生转基因植物,诸如小麦、大米(Christou (1991)Bio/Technology 9:957-9and 4462)和玉米(Gordon-Kamm(1990) Plant Cell 2:603-618)。未成熟胚也可以是通过使用粒子枪的直接 DNA递送技术(Weeks等人(1993)PlantPhysiol 102:1077-1084;Vasil (1993)Bio/Technolo 10:667-674;Wan和Lemeaux(1994)Plant Physiol 104:37-48)和土壤杆菌属介导的DNA转移(Ishida等人(1996)NatureBiotech 14:745-750)的单子叶植物的良好靶组织。用于将DNA引入叶绿体中的示例性方法是生物弹轰击、原生质体的聚乙二醇转化和微注射(Danieli等人Nat.Biotechnol 16:345-348,1998;Staub等人Nat. Biotechnol 18:333-338,2000;O’Neill等人Plant J.3:729-738,1993; Knoblauch等人Nat.Biotechnol 17:906-909;美国专利号5,451,513、 5,545,817、5,545,818和5,576,198;国际申请号WO95/16783;以及 Boynton等人,Methods inEnzymology 217:510-536(1993);Svab等人, Proc.Natl.Acad.Sci.USA 90:913-917(1993);和McBride等人, Proc.Natl.Acad.Sci.USA 91:7301-7305(1994))。适用于生物弹轰击、原生质体的聚乙二醇转化以及微注射的方法的任何载体将适用作用于叶绿体转化的靶向载体。任何双链DNA载体可用作转化载体,尤其当引入方法没有使用土壤杆菌属时。
可遗传修饰的植物包括谷物、饲料作物、水果、蔬菜、油籽作物、棕榈植物、林业植物和藤本植物。可修饰的植物的具体实例如下:玉米、香蕉、花生、红豌豆、向日葵、番茄、芸苔、烟草、小麦、大麦、燕麦、土豆、大豆、棉花、康乃馨、高粱、羽扇豆和大米。
本公开提供转化的植物细胞,含有转化的植物细胞的组织、植物和产品。主题转化细胞以及包含所述转化细胞的组织和产品的特征是存在整合到基因组中的主题核酸,和通过本公开的CasZ多肽或CasZ 融合多肽的植物细胞来产生。本发明的重组植物细胞可作为重组细胞群或作为组织、种子、全株植物、茎、果实、叶、根、花、茎、块茎、谷物、动物饲料、植田等使用。
编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列可在未知启动子(例如,当核酸随机整合到宿主细胞基因组中时)的控制之下 (即,可操作地连接至未知启动子)或可在已知启动子的控制之下(即,可操作地连接至已知启动子)。合适的已知启动子可以是任何已知的启动子并且包括组成型活性启动子、诱导型启动子、空间限制的和/ 或时间限制的启动子等。
本公开的非限制性方面的实例
上文所述的本发明主题的方面(包括实施方案)可单独有益或与一个或多个其他方面或实施方案组合地有益。在不限制前述描述的情况下,下文提供本公开的某些非限制性方面,其编号为1-36。对本领域技术人员在阅读本公开后将显而易见的是,每个单独编号的方面都可与之前或之后单独编号的方面中的任一个一起使用或组合。这意图为所有此类方面的组合提供支持,并且不限于下文明确提供的方面的组合:
方面
方面1.一种将CasZ多肽导向至靶核酸的靶序列的方法,所述方法包括使所述靶核酸与工程化的和/或非天然存在的复合物接触,所述复合物包含:(a)CasZ多肽;和(b)CasZ指导RNA,所述CasZ指导RNA包含与所述靶核酸的靶序列杂交的指导序列,并且包含与所述CasZ多肽结合的区域。
方面2.如方面1所述的方法,其中所述方法导致所述靶核酸的修饰,从所述靶核酸的转录的调节,或与靶核酸相关联的多肽的修饰。
方面3.如方面2所述的方法,其中所述靶核酸通过被切割而被修饰。
方面4.如方面1-3中任一项所述的方法,其中所述靶核酸选自:双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。
方面5.如方面1-4中任一项所述的方法,其中所述指导序列和所述与所述CasZ多肽结合的区域彼此异源。
方面6.如方面1-5中任一项所述的方法,其中所述接触导致基因组编辑。
方面7.如方面1-5中任一项所述的方法,其中所述接触在细菌细胞外部和古细菌细胞外部发生。
方面8.如方面1-5中任一项所述的方法,其中所述接触在体外在细胞外部发生。
方面9.如方面1-7中任一项所述的方法,其中所述接触在靶细胞内部发生。
方面10.如方面9所述的方法,其中所述接触包括:将以下至少一项引入所述靶细胞中:(a)所述CasZ多肽或编码所述CasZ多肽的核酸;和(b)所述CasZ指导RNA或编码所述CasZ指导RNA的核酸。
方面11.如方面10所述的方法,其中所述编码所述CasZ多肽的核酸是经密码子优化以在所述靶细胞中表达的非天然序列。
方面12.如方面9-11中任一项所述的方法,其中所述靶细胞是真核细胞。
方面13.如方面9-12中任一项所述的方法,其中所述靶细胞在体外在培养物中。
方面14.如方面9-12中任一项所述的方法,其中所述靶细胞在体内。
方面15.如方面9-12中任一项所述的方法,其中所述靶细胞是离体的。
方面16.如方面12所述的方法,其中所述真核细胞选自由以下组成的组:植物细胞、真菌细胞、单细胞真核生物体、哺乳动物细胞、爬行动物细胞、昆虫细胞、禽细胞、鱼细胞、寄生虫细胞、节肢动物细胞、蛛形纲动物细胞、无脊椎动物细胞、脊椎动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人细胞。
方面17.如方面9-16中任一项所述的方法,其中所述接触还包括:将DNA供体模板引入所述靶细胞中。
方面18.如方面1-17中任一项所述的方法,其中所述方法包括使所述靶核酸与CasZ反式激活非编码RNA(trancRNA)接触。
方面19.如方面9-17中任一项所述的方法,其中所述接触包括:将CasZ反式激活非编码RNA(trancRNA)和/或编码所述CasZ trancRNA的核酸引入所述靶细胞中。
方面20.如方面18或方面19所述的方法,其中所述trancRNA 包含与表2的trancRNA序列具有70%或更高(至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的核苷酸序列同一性的核苷酸序列。
方面21.一种包含工程化的和/或非天然存在的复合物的组合物,所述复合物包含:(a)CasZ多肽或编码所述CasZ多肽的核酸;和(b) CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ 指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
方面22.如方面21所述的组合物,所述组合物还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
方面23.一种包含工程化的和/或非天然存在的复合物的试剂盒,所述复合物包含:(a)CasZ多肽或编码所述CasZ多肽的核酸;(b)CasZ 指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导 RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ 多肽结合的区域。
方面24.如方面23所述的试剂盒,所述试剂盒还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
方面25.一种遗传修饰的真核细胞,所述遗传修饰的真核细胞包含以下至少一项:(a)CasZ多肽或编码所述CasZ多肽的核酸;(b)CasZ 指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导 RNA包含与靶核酸的靶序列互补的指导序列,并且包含可与所述CasZ多肽结合的区域;和(c)CasZ反式激活非编码RNA(trancRNA) 或编码所述CasZtrancRNA的核酸。
方面26.如前述方面中任一项所述的组合物、试剂盒或真核细胞,所述组合物、试剂盒或真核细胞的特征在于以下至少一项:(a)编码所述CasZ多肽的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i) 编码所述CasZ多肽,并且(ii)与异源启动子可操作地连接;(b)编码所述CasZ指导RNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ指导RNA,并且(ii)与异源启动子可操作地连接;和(c)编码所述CasZ trancRNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ trancRNA,并且(ii)与异源启动子可操作地连接。
方面27.如前述方面中任一项所述的组合物、试剂盒或真核细胞,所述组合物、试剂盒或真核细胞用于治疗性治疗患者的方法中。
方面28.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项是重组表达载体:编码所述CasZ多肽的所述核酸、编码所述CasZ指导RNA的所述核酸和编码所述CasZ trancRNA的所述核酸。
方面29.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ指导RNA和/或所述CasZ trancRNA包含以下一项或多项:修饰的核碱基、修饰的骨架或非天然核苷间键联、修饰的糖部分、锁核酸、肽核酸和脱氧核糖核苷酸。
方面30.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽是与相应的野生型CasZ蛋白相比具有降低的核酸酶活性的变体CasZ多肽。
方面31.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项与异源部分缀合:所述CasZ多肽、编码所述CasZ多肽的所述核酸、所述CasZ指导RNA、编码所述CasZ 指导RNA的所述核酸、所述CasZ trancRNA和编码所述CasZ trancRNA的所述核酸。
方面32.如方面31所述的方法、组合物、试剂盒或真核细胞,其中所述异源部分是异源多肽。
方面33.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽与相应的野生型CasZ蛋白相比具有降低的核酸酶活性,并且与异源多肽融合。
方面34.如方面33所述的方法、组合物、试剂盒或真核细胞,其中所述异源多肽:(i)具有DNA修饰活性,(ii)表现出增加或减少转录的能力,并且/或者(iii)具有修饰与DNA相关联的多肽的酶活性。
方面35.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽包含与图1或图7的CasZ蛋白具有70%或更高(至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸序列。
方面36.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述指导序列和与所述CasZ多肽结合的所述区域彼此异源。
方面37.一种检测样品中的靶DNA的方法,所述方法包括:(a) 使所述样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导 RNA包含与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列;和(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及(b)测量由所述CasZ切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
方面38.如方面37所述的方法,其中所述靶DNA是单链的。
方面39.如方面37或38所述的方法,其中所述靶DNA是双链的。
方面40.如方面37-39中任一项所述的方法,其中所述靶DNA 是病毒DNA。
方面41.如方面37-40中任一项所述的方法,其中所述靶DNA 是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
方面42.如方面37-41中任一项所述的方法,其中所述CasZ多肽包含与图1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
方面43.如方面37-41中任一项所述的方法,其中所述CasZ多肽是Cas14a多肽。
方面44.根据方面37-43中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
方面45.根据方面37-44中任一项所述的方法,其中所述样品包含细胞。
方面46.根据方面37-45中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
方面47.根据方面46所述的方法,其中所述细胞是真核细胞。
方面48.根据方面37-47中任一项所述的方法,其中所述靶DNA 能够以低至10aM的浓度被检测到。
方面49.根据方面37-48中任一项所述的方法,所述方法包括确定所述样品中存在的所述靶DNA的量。
方面50.根据方面49所述的方法,其中所述确定包括:测量所述可检测信号以生成测试测量值;测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
方面51.根据方面37-50中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
方面52.根据方面37-51中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
方面53.根据方面52所述的方法,其中在所述单链检测剂DNA 被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
方面54.根据方面52所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
方面55.根据方面52-54中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
方面56.根据方面18所述的方法,其中在所述单链检测剂DNA 被切割之后,可检测信号的量增加。
方面57.根据方面52或方面56所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
方面58.根据方面52-57中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
方面59.根据方面58所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
方面60.根据方面37-59中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
方面61.根据方面37-60中任一项所述的方法,其中所述方法包括扩增所述样品中的核酸。
方面62.根据方面61所述的方法,其中所述扩增包括等温扩增。
方面63.根据方面62所述的方法,其中所述等温扩增包括重组酶聚合酶扩增(RPA)。
方面64.根据方面61-63中任一项所述的方法,其中所述扩增在所述步骤(a)的接触之前开始。
方面65.根据方面61-63中任一项所述的方法,其中所述扩增与所述步骤(a)的接触一起开始。
方面66.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:(a)指导RNA或编码所述指导RNA的核酸;其中所述指导RNA 包含:与CasZ多肽结合的区域和与靶DNA互补的指导序列;和(b) 为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
方面67.如方面66所述的试剂盒,所述试剂盒还包含CasZ多肽。
方面68.如方面67所述的试剂盒,其中所述CasZ多肽包含与图 1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
方面69.如方面67所述的试剂盒,其中所述CasZ多肽是Cas14a 多肽。
方面70.如方面66-69中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
方面71.如方面70所述的试剂盒,其中所述荧光发射染料对是 FRET对。
方面72.如方面70所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
方面73.如方面70-72中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
方面74.如方面73所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
方面75.如方面66-74中任一项所述的试剂盒,所述试剂盒还包含核酸扩增组分。
方面76.如方面75所述的试剂盒,其中所述核酸扩增组分是用于重组酶聚合酶扩增(RPA)的组分。
方面77.一种切割单链DNA(ssDNA)的方法,所述方法包括:使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶 ssDNA:(i)CasZ多肽;和(ii)指导RNA,所述指导RNA包含与所述 CasZ多肽结合的区域和与所述靶DNA杂交的指导序列,其中所述 CasZ多肽切割所述多个非靶ssDNA。
方面78.如方面77所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
方面79.如方面78所述的方法,其中所述细胞是真核细胞。
方面80.如方面79所述的方法,其中所述真核细胞是植物细胞。
方面81.如方面78-80中任一项所述的方法,其中所述非靶 ssDNA对于所述细胞是外源的。
方面82.如方面81所述的方法,其中所述非靶ssDNA是病毒 DNA。
方面83.如方面77-82中任一项所述的方法,其中所述靶DNA 是单链的。
方面84.如方面77-82中任一项所述的方法,其中所述靶DNA 是双链的。
方面85.如方面77-84中任一项所述的方法,其中所述靶DNA 是病毒DNA。
方面86.如方面77-84中任一项所述的方法,其中所述靶DNA 是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
实施例
提出以下实施例以便向本领域的普通技术人员提供如何制备和使用本发明的完全公开和描述,并且并非意图限制本发明人看待其发明的范围,也非意图表示以下实验是执行的全部或仅有的实验。已经努力确保关于所用数值(例如量、温度等)的精确性,但一些实验误差和偏差应加以说明。除非另外指示,否则份为重量份,分子量为重均分子量,温度以摄氏度计,并且压力在大气压下或接近大气压。可使用标准缩写,例如,bp,碱基对;kb,千碱基;pl,皮升;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;i.m.,肌内的(肌内地);i.p.,腹膜内的(腹膜内地); s.c.,皮下的(皮下地)等。
材料和方法
除非另外指出,否则以下材料和方法一般适用于本文所述实施例中给出的结果。
宏基因组学和宏转录组学
对来自以下两个地点的先前组装和框并的基因组进行初始分析:毗邻ColoradoRiver near Rifle,Colorado的Rifle Integrated Field Research(IFRC)地点;以及位于Colorado Plateau in Utah的Crystal Geyser,a cold,CO2-driven geyser。来自IFRC地点的宏转录组学数据用于检测自然界中非编码元件的转录。然后对来自IMG/M的公共宏基因组进行CRISPR-Cas14系统的进一步挖掘。
CRISPR-Cas计算分析
使用隐马尔可夫模型(HMM)序型,用HMMer套件扫描来自各种样品的组装重叠群的已知Cas蛋白。基于推定V型效应子的MAFFT 比对为Cas14蛋白构建另外的HMM,所述推定V型效应子含有少于 800个氨基酸,并且与获取cas基因和CRISPR阵列相邻。通过使用手动选择的新推定Cas14序列增强这些HMM来迭代地完善这些 HMM,所述新推定Cas14序列是通过使用现有Cas14HMM模型发现的。Cas14重复序列的序列提供于表3中。使用CrisprFinder软件和 CRISPRDetect的本地版本鉴定CRISPR阵列。使用以 PROTGAMMALG作为替代模型的RAxML和100个自举取样构建 Cas1和V型效应蛋白的系统发育树。使用FigTree 1.4.1 (http://tree.bio.ed.ac.uk/software/figtree/)对树进行可视化。使用Bowtie2 将宏转录组学读段定位到组装的重叠群。RNA酶存在分析是基于由从KEGG数据库下载的KEGG直系同源组(KO)的比对建立的HMM。
表3.表3中显示本文使用的所有Cas14蛋白的重复序列(Cas14 指导RNA的非指导序列部分)(例如,参见图7)。
Figure BDA0002562709270001691
Figure BDA0002562709270001701
Figure BDA0002562709270001711
表达质粒、RNA和DNA底物的生成
通过去除获取蛋白并使用单个间隔序列生成最小阵列来设计用于推定系统的最小CRISPR基因座。将这些最小基因座按gBlocks (IDT)排列,并组装到具有驱动基因座表达的四环素诱导型启动子的质粒中。质粒图谱可在Addgene和附图中获得。使用T7聚合酶和PCR 产物作为dsDNA模板体外转录所有RNA。对所得IVT进行凝胶提取,并进行乙醇沉淀。DNA底物获自IDT,并且其序列可见于表4。对于放射性标记的切割测定,在进行放射性标记之前,从PAGE凝胶中凝胶提取DNA低聚物。对于FQ测定,无需进一步纯化即可使用DNA 底物。
大肠杆菌RNAseq
如先前Harrington等人(2017)中所述,经过修改进行小RNA测序。用表达Cas14a1系统的在Cas14a1ORF上游具有四环素诱导型启动子的质粒或具有与Cas14融合的N末端10x-组氨酸标签的相同质粒转化大肠杆菌NEBStable3。使引子(Starter)在SOB中生长过夜,在5mL 含214nM脱水四环素的新鲜SOB中以1:100稀释,并在25℃下生长过夜。为了对用Cas14a提取的RNA进行测序,将含有与Cas14a1融合的N末端His标签的质粒在18℃下生长,然后如“蛋白质纯化”中所述进行裂解和纯化,在Ni-NTA洗脱后停止。如先前所述,沉淀细胞并使用热酚提取RNA。用TURBODNA酶处理总核酸,并进行酚提取。用rSAP处理所得RNA,将其加热灭活之后添加T4PNK。使用NEBnext小RNA试剂盒将衔接子连接到小RNA上,并在8%天然PAGE凝胶上进行凝胶提取。在MiSeq上对RNA进行测序,其中单端为300bp读段。对于分析,使用Cutadapt修剪所得读段,丢弃<8nt 的序列,并使用Bowtie2将其定位到质粒参考。
PAM消耗测定
如先前Burstein等人(2017)所述进行PAM缺失测定。使用含有与靶序列相邻的随机化PAM区的引物生成随机化质粒文库。将随机化引物和与引物3'末端互补的引物杂交,并使用Klenow Fragment (NEB)延伸双链体。将含有靶标的dsDNA用EcoRI和NcoI消化,连接到pUC19骨架中并转化到大大肠杆菌DH5α中,并且收获>107个细胞。接着,用CRISPR质粒或空载体对照转化大肠杆菌NEBstable,然后通过用10%甘油反复洗涤使这些转化的大肠杆菌呈电感受态。将这些电感受态细胞用200ng的靶文库转化,并铺板在含有针对靶标 (羧苄西林,100mg l-1)和CRISPR质粒(氯霉素,30mg l-1)选择的物质的生物测定皿中。收获细胞并准备在Illumina MiSeq上进行扩增子测序。使用Cutadapt提取PAM区域,并在python中计算消耗值。使用 WebLogo对PAM可视化。
转录组RNA作图
使用Invitrogen TRIzol试剂从0.2mm滤膜中提取RNA,之后使用Qiagen RNase-Free DNase Set试剂盒和Qiagen Mini RNeasy试剂盒去除基因组DNA并进行清洁。使用Agilent 2100Bioanalyzer(Agilent Technologies)评估RNA样品的完整性。使用AppliedBiosystems SOLiDTotal RNA-Seq试剂盒生成cDNA模板文库。使用 SOLiDEZBead系统(LifeTechnologies)进行乳液克隆珠粒扩增,以生成珠粒模板供SOLiD平台测序。在PacificNorthwest National Laboratory在5500XLSOLiD平台上对样品进行测序。使用如Brown 等人(2015)的Sickle修剪50bp的单读段。
蛋白质纯化
如先前所述,经过修改对Cas14a1进行纯化。将大肠杆菌 BL21(DE3)RIL用10xHis-MBP-Cas14a1表达质粒转化,并在Terrific Broth(TB)中生长至OD600=0.5,并用0.5mMIPTG诱导。使细胞在 18℃下生长过夜,通过离心收集,重悬于裂解缓冲液(50mMTris-HCl pH7.5、20mM咪唑、0.5mMTCEP、500mMNaCl)中,并通过超声进行破碎。将裂解液分批装载到Ni-NTA树脂上,用上述缓冲液洗涤,然后用洗脱缓冲液(50mMTris-HCl pH7.5、300mM咪唑、0.5 mMTCEP、500mMNaCl)洗脱。通过在4℃下与TEV一起孵育过夜,去除MBP和His标签。将所得蛋白质交换到缓冲液A(20mMHEPES pH7.5、0.5mMTCEP、150mMNaCl)中,并装载到串联MBP肝素柱 (GE,Hi-Trap)上,并以线性梯度从缓冲液A到缓冲液B洗脱(20 mMHEPES pH7.5、0.5mMTCEP、1250mMNaCl)。将所得的含有 Cas14a1的级分装载到S200凝胶过滤柱上,快速冷冻并在-80℃下储存直至使用。
体外切割测定
放射性标记的
在1×切割缓冲液(25mMNaCl、20mMHEPES pH7.5、1mMDTT、 5%甘油)中进行放射性标记的切割测定。在室温下,使100nMCas14a1 与125nM crRNA和125nM tracrRNA复合10分钟。添加约1nM放射性标记的DNA或RNA底物,并使其在37℃下反应30分钟。通过添加2x猝灭缓冲液(90%甲酰胺、25mMEDTA和痕量溴酚蓝)来终止反应,加热至95℃保持2分钟,然后在含有7M尿素和0.5×TBE的 10%聚丙烯酰胺凝胶上电泳。通过磷光成像使产物可视化。
M13DNA切割
在100mMNaCl、20mMHEPES pH7.5、1mMDTT、5%甘油中进行M13DNA切割测定。使250nMCas14a1与250nM crRNA和250nM tracrRNA和250nM ssDNA激活剂复合。通过添加5nMM13 ssDNA 质粒来引发反应,并通过添加补充有10mMEDTA的上样缓冲液来猝灭反应。在用SYBR金(Thermofisher)预染的1.5%琼脂糖TAE凝胶上分离产物。
反式切割的FQ检测
如先前Chen等人(2018)所述,经过修改进行FQ检测。使100 nMCas14a1与125nMcrRNA、125nM tracrRNA、50nMFQ探针和2 nM ssDNA激活剂在1×切割缓冲液中于37℃混合10分钟。对于所有反应,通过添加激活剂DNA来引发反应,但RNA优化实验除外,该实验中使用可变RNA组分来引发反应。在荧光酶标仪上于37℃下监测反应达120分钟,每1分钟进行一次荧光测量(λex:485nm;λem: 535nm)。将所得数据使用在不存在激活剂的情况下获得的读数减去背景,并使用单指数衰减曲线进行拟合。
数据可用性
本文使用的质粒可在Addgene上获得(质粒编号112500、112501、 112502、112503、112504、112505、112506)。本文使用的寡核苷酸提供于表4和表5中。本文使用的质粒提供于图24中。本文使用的 Cas14蛋白序列提供于图7中。
表4.本文使用的寡核苷酸和质粒。
Figure BDA0002562709270001751
Figure BDA0002562709270001761
Figure BDA0002562709270001771
Figure BDA0002562709270001781
表5.RNA寡核苷酸。
Figure BDA0002562709270001782
Figure BDA0002562709270001791
Figure BDA0002562709270001801
Figure BDA0002562709270001811
实施例1
图1描绘天然存在的CasZ蛋白序列的实例。
图2描绘CasZ基因座的示意图,所述CasZ基因座除CasZ蛋白之外还包括Cas1蛋白。
图3描绘与其他2类CRISPR/Cas效应蛋白序列有关的CasZ序列的系统发育树。
图4描绘与来自其他2类CRISPR/Cas基因座的Cas1序列有关的来自CasZ基因座的Cas1序列的系统发育树。
图5描绘转录组学RNA作图数据,该数据证明了来自CasZ基因座的trancRNA的表达。trancRNA与CasZ重复序列阵列相邻,但不包含重复序列且不与重复序列互补。显示的是以下基因座的RNA 作图数据:CasZa3、CasZb4、CasZc5、CasZd1和CasZe3。小重复对齐箭头表示CRISPR阵列的重复序列(指示存在编码指导RNA的序列);重复阵列外部和附近的峰表示高度转录的trancRNA。
此宏转录组学数据是非16S消耗的,因此大部分数据被定位到 16S,例如,在这些读段中几乎根本没有显示mRNA。然而,观察到RNA定位到预测的trancRNA区域。
实施例2
本文公开一组来自未经培养的古细菌的CRISPR-Cas系统,所述系统含有Cas14,这是一个只有400-700个氨基酸的异常紧凑的RNA 指导的核酸酶家族,包括Cas1和Cas2蛋白,它们负责将DNA整合到CRISPR基因组基因座中,并且显示了积极使他们的CRISPR阵列适应新感染的证据。尽管它们的尺寸很小,但Cas14蛋白能够进行 RNA指导的单链DNA(ssDNA)切割,而无限制性序列要求。此外, Cas14的靶标识别触发了ssDNA分子的非特异性切割。宏基因组学数据显示,多个CRISPR-Cas14系统独立进化,并表明了基于单效应子CRISPR的适应性免疫的潜在进化起源。
微生物与病毒之间的竞争刺激了基于CRISPR的适应性免疫的进化,从而提供了针对传染剂的保护。在2类CRISPR-Cas系统中,具有多个功能结构域的单个100-200千道尔顿(kD)CRISPR相关(Cas) 蛋白进行RNA指导的DNA或RNA底物结合和切割。要确定自然界中是否存在更简单、更小的RNA指导蛋白,查询terabase级宏基因组数据集,以查找与CRISPR阵列和cas1(编码通用CRISPR整合酶的基因)接近的未表征基因。此分析鉴定了本文所述的编码40-70kD 多肽的CRISPR-Cas系统的多样化家族,该家族含有cas1、cas2、cas4 和cas14(图8,图A)。基于比较序列分析,已经鉴定出二十四(24)个不同的cas14基因变体,这些变体聚类成三个亚组(Cas14a-c)(图8,图A-图B;图9、图10)。Cas14蛋白为约400-700个氨基酸(aa),约为先前已知的2类CRISPRRNA指导的酶的尺寸的一半(图8,图C- 图D)。虽然所鉴定的Cas14蛋白表现出可观的序列多样性,但所有这些蛋白质都是通过预测的RuvC核酸酶结构域的存在而结合在一起,所述结构域的组织的特征是靶向V型CRISPR-Cas DNA酶(图8,图D)。
所鉴定的Cas14蛋白几乎全部出现在DPANN内,DPANN是共生古细菌的超门,以小细胞和基因组尺寸为特征。系统发育比较显示, Cas14蛋白与C2c10和C2c9(含细菌RuvC结构域的蛋白家族,有时在CRISPR阵列中发现,但从未与其他cas基因一起出现)的相似性存在广泛多样性(图8,图B;和图9)。此观察结果以及c2c10和cas14 基因的小尺寸使得这些系统无法用作独立的CRISPR效应子。
图8,图A-图D描绘CRISPR-Cas14基因组基因座的架构和系统发育。图8,图A描绘V型CRISPR系统的系统发育树。新识别的微型CRISPR系统以橙色突出显示。图8,图B描绘C2c10和 CRISPR-Cas14系统的代表性基因座架构。图8,图C描绘Cas14a-c 系统与Cas12a-e和Cas9相比的长度分布。图8,图D描绘Cas14a 与Cas9和Cas12a相比的结构域组织。蛋白质长度按比例绘制。
图9描绘已知V型CRISPR效应子和含有RuvC结构域的2类候选物的最大似然树。插图显示每个新鉴定的亚型的单个直系同源物。图10描绘来自已知CRISPR系统的Cas1的最大似然树。
实施例3
基于CRISPR-Cas14系统与负责创建感染遗传记忆的保守基因 (cas1、cas2、cas4)的接近性(图11,图A),我们研究了CRISPR-Cas14 系统是否主动将DNA序列获取到其CRISPR阵列中。多个 CRISPR-Cas14基因座的组装宏基因组学连续DNA序列(重叠群)揭示,以其他方式相同的CRISPR系统在其CRISPR阵列中显示出多样性,这表明对新感染具有主动适应性(图11,图B;和图12,图A)。无意受任何特定理论的束缚,提出对新DNA序列的主动获取指示这些 CRISPR-Cas14基因座编码的功能酶尽管具有小尺寸,但具有核酸靶向活性。为了测试这种可能性,研究是否从CRISPR-Cas14基因座产生RNA成分。分析环境宏转录组学测序数据中是否存在来自含有 CRISPR-Cas14a的原生古细菌宿主的RNA(图12,图B;和图13,图A)。除CRISPRRNA(crRNA)外,还将高度丰富的非编码RNA定位到位于cas14a与相邻CRISPR阵列之间的约130个碱基对的序列。此转录物的3′末端的20个核苷酸(nt)与crRNA的重复区段大部分互补(图12,图C;和图13,图B),如针对与Cas9、Cas12b和Cas12e CRISPR系统相关发现的反式激活CRISPRRNA(tracrRNA)所观察到的。在这些先前研究的系统中,双链RNA切割酶核糖核酸酶III(RNA 酶III)生成成熟的tracrRNA和crRNA,但在含cas14的重建基因组中不存在编码RNA酶III的基因(图14,图A)。此观察结果暗示在这些宿主中存在CRISPR相关RNA加工的替代机制。
为了测试Cas14a蛋白和相关RNA组分是否可在异源生物体中组装,将质粒引入到含有最小CRISPR-Cas14a基因座的大肠杆菌中,所述基因座包含Cas14基因、CRISPR阵列和含有推定tracrRNA的基因间区域。从细胞裂解液中亲和纯化Cas14a蛋白以及对共纯化RNA进行测序揭示了高度丰富的成熟crRNA以及推定的tracrRNA,这表明Cas14与crRNA和tracrRNA两者都相关(图14,图B)。组装的 Cas14a蛋白-tracrRNA-crRNA颗粒的计算质量按重量计为48%RNA,相较之下酿脓链球菌Cas9(SpCas9)仅为17%(图12,图D),而新泽西弗朗西斯菌(F.novicida)Cas12a(FnCas12a)为8%,暗示了RNA在 Cas14a复合体架构中的核心作用。已知的2类CRISPR系统需要称为原间隔序列相邻基序(PAM)的短序列来靶向双链DNA(dsDNA)。为了测试Cas14a是否需要PAM并能进行dsDNA干扰,将大肠杆菌用 dsDNA质粒转化,表达最小Cas14a基因座,所述dsDNA质粒含有随机化PAM区,所述随机化PAM区邻近Cas14阵列中与编码靶标的序列(间隔序列)匹配的序列。在大肠杆菌转化体中未检测到PAM 序列的消耗,表明CRISPR-Cas14a系统要么无法靶向dsDNA,不需要PAM就能靶向,要么在此异源宿主中没有活性(图15,图A-图D)。
图11,图A-图B描绘CRISPR-Cas14系统的新间隔序列获取。图11,图A描绘Cas14Cas1直系同源物的比对。扩展显示了以红色方框突出显示的先前涉及的活性位点残基的保护。图11,图B描绘针对各种CRISPR-Cas14系统组装的多个CRISPR阵列,揭示了这些CRISPR系统的间隔序列多样性。橙色箭头指示重复序列,而各种颜色的方框表示独特的间隔序列。
图12,图A-图D描绘CRISPR-Cas14a主动适应并编码tracrRNA。图12,图A描绘Cas14a和Cas14b的间隔序列多样性,其中CRISPR 重复序列以橙色图示,而独特的间隔序列以不同颜色显示。图12,图B描绘定位到Cas14a1和Cas14a3的宏转录组学读段。插图显示最丰富的重复序列和间隔序列的伸展。图12,图C描绘Cas14a1 crRNA 和tracrRNA的计算机模拟预测结构。在宿主基因组中未鉴定到RNA 酶III直系同源物(图14,图A)。图12,图D描绘由RNA和蛋白质组成的各种CRISPR复合物的质量分数。
图13,图A-图B描绘CRISPR-Cas14基因座的宏转录组学。图 13,图A描绘Cas14a直系同源物的环境RNA测序读段。Cas14和 CRISPR阵列的位置如下所示。右侧的RNA结构显示从宏转录组学鉴定的tracrRNA的计算机模拟预测结构。图13,图B描绘Cas14a1 crRNA:tracrRNA双链体的预测杂交。
图14,图A-图B描绘CRISPR-Cas14的RNA加工和异源表达。图14,图A描绘在含Cas14的基因组中常见的RNA酶直系同源物的存在。浅紫色表示明显短于给定RNA酶的预期长度的命中。需注意,在所有研究的基因组中都不存在RNA酶III。图14,图B描绘来自大肠杆菌中Cas14a1基因座的异源表达的小RNAseq读段(图14,图 B,底部两个图)与相比的宏转录组学读段(图14,图B,顶部图)。下拉是指与Ni-NTA亲和纯化的Cas14a1共纯化的RNA。
图15,图A-图D描绘Cas14a1和SpCas9的质粒消耗。图15,图A描绘概述PAM发现实验的图。用含有位于靶标侧翼的随机化 PAM序列的质粒攻击表达目标CRISPR系统的大肠杆菌。收获存活的(转化的)细胞并与带有空载体的对照一起测序。然后对消耗的序列进行测序,消耗超过PAM消耗值阈值(PDVT)的PAM用于生成 Weblogo。图15,图B-图D描绘被异源表达的Cas14a1消耗的PAM 序列,所述Cas14a1用含有靶标的随机化PAM序列5’端(图15,图 B)或3'端(图15,图C)的靶质粒转化。“无序列”指示在给定的PDVT 处或之上未发现序列被消耗。
实施例4
测试纯化的Cas14a-tracrRNA-crRNA复合物是否能够体外进行 RNA指导的核酸切割。所有当前重构的靶向DNA的2类干扰复合物均能够识别dsDNA和ssDNA底物。将纯化的Cas14a-tracrRNA-crRNA 复合物与带有与crRNA指导序列互补的20个核苷酸的序列的放射性标记的靶寡核苷酸(ssDNA、dsDNA和ssRNA)或非互补的ssDNA一起孵育,并分析这些底物的Cas14a介导的切割。仅在存在互补的 ssDNA底物的情况下,才检测到任何切割产物(图16,图A;和图17,图A-图C),并且切割取决于tracrRNA和crRNA的存在,tracrRNA 和crRNA也可组合成单指导RNA(sgRNA)(图16,图B;和图18)。缺乏可检测的dsDNA切割表明Cas14a选择性地靶向ssDNA,尽管可能有其他因素或序列要求可实现天然宿主中的dsDNA识别。 Cas14aRuvC结构域中保守活性位点残基的突变消除了切割活性(图 17,图A),暗示RuvC是负责DNA切割的结构域。此外,Cas14a DNA 切割对将RNA组分截短至短于天然产生的序列的长度敏感(图16,图B;和图19,图A-图D)。这些结果使Cas14a成为经证明可进行可编程的RNA指导的DNA切割的最小的2类CRISPR效应子。
通过在ssDNA底物上平铺Cas14a指导序列,测试Cas14a是否需要PAM进行体外ssDNA切割(图16,图C)。尽管邻近这些不同指导序列的靶标存在序列变异,但观察到所有四个序列的切割。切割位点出现在ssDNA的指导序列互补区之外,并响应于指导序列结合位置而偏移(图16,图C)。这些数据证明,Cas14a是靶向ssDNA的 CRISPR内切核酸酶,其不需要PAM进行激活。
基于Cas14a切割靶向crRNA/DNA的异源双链体的外部的观测结果,提出Cas14a可能具有靶标激活的非特异性ssDNA切割活性,类似于含RuvC的酶Cas12a。为了测试这种可能性,将 Cas14a-tracrRNA-crRNA与互补的激活剂DNA和等份的与Cas14a crRNA或激活剂没有序列互补性的M13噬菌体ssDNA一起孵育(图 16,图D)。M13 ssDNA迅速降解为小片段,所述活性通过保守Cas14a RuvC活性位点突变而消除,表明Cas14a的激活导致非特异性ssDNA降解。
为了研究Cas14a对靶标依赖性非特异性DNA切割活性的特异性,对荧光团-猝灭剂(FQ)测定进行调整,其中经染料标记的ssDNA的切割生成荧光信号(图20,图A)。当将Cas14a与各种指导RNA-靶ssDNA 对一起孵育时,仅在同源靶标存在下才观察到荧光信号,并且显示出对较长的含FQ底物的强烈偏好(图19,图F;和图20,图A)。通过在各种ssDNA底物中的靶区域上平铺2-nt错配来测试Cas14a错配耐受性。靠近ssDNA靶标中间的错配会强烈抑制Cas14a活性,揭示了内部种子序列与针对靶向dsDNA的CRISPR-Cas系统所观察到的 PAM邻近种子区不同(图20,图B;和图21,图A-图D)。此外,含有强二级结构的DNA底物导致Cas14a的激活降低(图21,图E)。截短ssDNA底物也导致反式切割减少或无法检测到(图21,图F)。这些结果表明了不同于靶向dsDNA的2类CRISPR系统的保真机制,这种机制类似于靶向RNA的Cas13a酶,可能利用crRNA的前序区域来门控切割活性。
在宏基因组学数据中对紧凑型V型系统的进一步研究揭示,如同Cas14a-c,多种多样的系统包括与获取相关cas基因相邻的编码含 RuvC的短蛋白的基因和CRISPR阵列。还发现了二十(20)个这样的系统,它们聚类成五个主要家族(Cas14d-h)。这些家族似乎是从TnpB 的独立驯化事件演化而来的,TnpB是与V型CRISPR效应子的进化亲本有关的转座酶相关蛋白。不包括与cas12b相关的cas14g,类似 cas14的基因在V型效应子系统发育上形成单独的进化枝(图22,图A-图B),并且它们的cas1基因具有不同的起源(图10,图A)。总共鉴定出属于八个家族(Cas14a-h)的38个CRISPR-Cas14系统,以及八个无法经过分析进行聚类的其他系统(称为Cas14u,表3)。
本文所述的Cas14蛋白的小尺寸及其与V型效应蛋白的相似性表明,RNA指导的ssDNA切割可能已作为祖传2类CRISPR系统存在。在这种情形下,小型的驯化的类似TnpB的ssDNA干扰复合物可能会随时间推移获得更多的结构域,从而逐渐改善dsDNA的识别和切割。较小的Cas9直系同源物相比其较大对应物表现出较弱的靶向dsDNA的活性,但保留了稳健切割ssDNA的能力。除进化方面的意义外,Cas14特异性地靶向ssDNA的能力还表明了其对ssDNA病毒或通过ssDNA中间体传播的移动遗传元件(MGE)的防御作用。无意受任何特定理论的束缚,靶向ssDNA的CRISPR系统在ssDNA病毒构成了绝大部分病毒丰度的某些海洋环境中可能特别有利。
图16,图A-图D描绘作为RNA指导的DNA内切核酸酶的 CRISPR-Cas14a。图16,图A描绘靶向ssDNA、dsDNA、ssRNA和脱靶ssDNA的Cas14a1的切割动力学。图16,图B描绘与靶ssDNA结合的Cas14a RNP和在各种RNA组分存在的情况下Cas14a1切割放射性标记的ssDNA的动力学的示意图。图16,图C描绘Cas14a1 指导序列对ssDNA底物的平铺。图16,图D描绘激活的Cas14a1对 ssDNA病毒M13基因组的切割。
图17,图A-图E描绘Cas14a1对ssDNA的降解。图17,图A 描绘纯化的Cas14a1和Cas14a1点突变体的SDS-PAGE。图17,图B 描绘Cas14a1切割ssDNA靶标的盐、阳离子和温度的优化。图17,图C描绘各种长度的间隔序列下Cas14a1对ssDNA进行的放射性标记的切割。图17,图D描绘Cas14与先前研究的Cas12蛋白的比对,以鉴定RuvC活性位点残基;且图17,图E描绘纯化的Cas14a1RuvC 点突变体对ssDNA的切割。
图18描绘各种指导RNA组分下Cas14a1切割ssDNA的动力学。
图19,图A-图F描绘Cas14a1指导RNA组分的优化。图19,图A描绘靶向ssDNA的Cas14a1的图。通过改变间隔序列长度(图 19,图B),改变重复序列长度(图19,图C),改变tracrRNA(图19,图D)以及将crRNA和tracrRNA融合在一起(图19,图E),研究对 Cas14a1切割FQ ssDNA底物的影响。图19,图F描绘热图,其显示在存在各种指导序列和靶标组合的情况下,由于ssDNAFQ报告基因切割产生的减去背景的荧光。
图20,图A-图E描绘通过CRISPR-Cas14a进行的高保真 ssDNASNP检测。图20,图A描绘用于通过Cas14a1检测ssDNA的荧光猝灭剂(FQ)测定以及各种长度的FQ底物的切割动力学。图20,图B描绘在底物上平铺错配的情况下Cas14a1的切割动力学(各个点表示重复测量值)。图20,图C描绘Cas14-DETECTR策略和HERC2 眼睛颜色SNP的图。图20,图D描绘T7外切核酸酶的滴定和对 Cas14a-DETECTR的影响。图20,图E描绘与使用Cas12a的ssDNA 检测相比,使用Cas14a-DETECTR与用于蓝眼和棕眼唾液样品的蓝眼靶向指导序列的SNP检测。
图21,图A-图F描绘各种激活剂对Cas14a1切割速率的影响图 21,图A描绘ssDNA的Cas14a1靶向(图A-图D中使用了错配位置) 和靶标1的错配(MM)位置的代表性重复的原始比率的图。在于三个不同底物上平铺突变的情况下,靶向底物的Cas14a的切割率(图21,图B-图D)。图21,图E描绘具有增加的二级结构量的底物的反式切割率。图21,图F描绘使用截短的底物的反式切割率。点表示单个测量值。
图22,图A-图B描绘CRISPR-Cas14系统的多样性。图22,图A描绘指示的Cas14系统的代表性基因座架构。蛋白质长度按比例绘制。图22,图B块描绘V型效应子的最大似然树,其中包括Cas14 的所有八个已鉴定亚型。
图23,图A-图C描绘异源宿主中Cas14a1介导的干扰的测试。 Cas14a1和LbCas12a构建体的图,用于测试大肠杆菌中的干扰。(B) 在大肠杆菌上发现的ΦX174斑点揭示了Cas12a介导的而非Cas14a1 介导的干扰。每个斑点表示ΦX174储备液的10倍稀释液。(C)感染ΦX174的表达Cas14a1或LbCas12a的大肠杆菌的生长曲线(T,靶向; NT,非靶向)。图19,图F显示热图,其显示在存在各种指导序列和靶标组合的情况下在30分钟孵育之后,由于ssDNAFQ报告基因切割产生的减去背景的荧光。
虽然本发明已经参考其特定实施方案进行描述,但是本领域技术人员应理解,可在不脱离本发明的真实精神和范围的情况下进行各种改变并且可进行等同物替换。另外,为了使特定情况、材料、物质组成、方法、一个或多个方法步骤适应本发明的目的、精神和范围,可进行许多修改。所有此类修改意图处于所附权利要求的范围内。
参考文献
1.R.Barrangou et al.,CRISPR provides acquired resistance againstviruses in prokaryotes.Science. 315,1709-12(2007).
2.S.A.Jackson et al.,CRISPR-Cas:Adapting to change.Science.356(6333),pp.1-9(2017).
3.S.Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cassystems.Nat.Rev.Microbiol. 15,169-182(2017).
4J.S.Chen,J.A.Doudna,The chemistry of Cas9 and its CRISPRcolleagues.Nat.Rev.Chem.1, 0078(2017).
5.C.T.Brown et al.,Unusual biology across agroup comprising more than15%of domam Bacteria.Nature.523,208-211(2015).
6.K.Anantharaman et al..Thousands of microbial genomes shed light oninterconnected biogeochemical processes in an aquifer system.Nat.Commun.7,13219(2016)
7.V.M.Markowitz et al.,IMG/M 4 version of the integrated metagenomecomparative analysis system.Nucleic Acids Res.42,568-573(2014).
8.V.M.Markowitz et al.,IMG:The integrated microbial genomes databaseand comparative analysis system.Nucleic Acids Res.40,115-122(2012).
9.A.J.Probst et al.,Genomic resolution of a cold subsurface aquifercommunity provides metabolic insights for novel microbes adapted to high CO2concentrations.Environ.Microbiol. 19,459-474(2017).
10.I.Yosef,M.G.Goren,U.Qimron,Proteins and DNA elements essential forthe CRISPR adaptation process in Escherichia coli.Nucleic Acids Res.40,5569-5576(2012).
11.J.K.
Figure BDA0002562709270001911
A.S.Y.Lee,A.Engelman,J.a.Doudna,Integrase-mediated spaceracqquisition during CRISPR-Cas adaptive immunity.Nature.519,193-198(2015).
12.S.Shmakov et al.,Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems.Mol.Cell.60,385-397(2015).
13.D.Burstein et al.,New CRISPR-Cas systems from uncultivatedmicrobes.Nature.542,237-241 (2017).
14.C.Rinke et al.,Insights into the phylogeny and coding potential ofmicrobial dark matter.Nature. 499,431-437(2013).
15.C.J.Castelle et al.,Genomic expansion of domain archaea highlightsroles for organisms from new phyla in anaerobic carbon cycling.Curr.Biol.25,690-701(2015).
16.E.Deltcheva et al.,CRISPR RNA maturation by trans-encoded smallRNA and host factor RNase III.Nature.471,602-607(2011).
17.K.E.Savell,J.J.Day,Applications of CRISPR/CAS9 in the mammaliancentral nervous system. Yale J.Biol.Med.90(2017),pp.567-581.
18.F.J.M.Mojica,C.Díez-
Figure BDA0002562709270001912
J.García-Martínez,C.Almendros,Shortmotif sequences determine the targets of the prokaryotic CRISPR defencesystem.Microbiology.155,733-740 (2009).
19.Y.Zhang,R.Raian,H.S.Seifert,A.Mondragón,E.J.Sontheimer,DNase HActivity of Neisseria meningitidis Cas9.Mol.Cell.60,242-255(2015).
20.E.Ma,L.B.Harrington,M.R.O’Connell,K.Zhou,J.A.Doudna,Single-Stranded DNA Cleavage by Divergent CRISPR-Cas9 Enzymes.Mol.Cell.60,398-407(2015).
21.J.S.Chen et al.,CRISPR-Cas12a target binding unleashesindiscriminate single-stranded DNase activity.Science.360,436-439(2018).
22.B.Zetsche et al.,Cpf1 Is a Single RNA-Guided Endonuclease of aClass 2 CRISPR-Cas System. Cell.163,759-771(2015).
23.A.East-Seletsky et al.,Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection.Nature.538.270-273(2016).
24.L.Liu et al.,The Molecular Architecture for RNA-Guided RNACleavage by Cas 13a.Cell.170, 714-726.e10(2017).
25.O.O.Abudayyeh et al.,C2c2 is a single-component pregrammable RNA-guided RNA-targeting CRISPR effector.Science(80-.).353,1-9(2016).
26.G.J.Knott et al.,Guide-bound structures of an RNA-targeting A-cleaving CRISPR-Cas13a enzyme.Nat.Struct.Mol.Biol.24,825-833(2017).
27.S.Y.Li et al.,CRISPR-Cas12a has both cis-and trans-cleavageactivities on single-stranded DNA.Cell Res.28,491-493(2018).
28.H.Eiberg et al.,Blue eye color in humans may be caused by aperrectly associated founder mutation in a regulatory element located withinthe HERC2 gene inhibiting OCA2 expression. Hum.Genet.123,177-187(2008).
29.S.Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cassystems.Nat.Rev.Microbiol. 15,169-182(2017).
30.E.V Koonin,K.S.Makarova,F.Zhang,Diversity,classification andevolution of CRISPR-Cas systems.Curr.Opin.Microbiol.37,67-78(2017).
31.K.S.Makarova et al.,An updated evolutionary classification ofCRISPR-Cas systems.Nat Rev Microbiol,1-15(2015).
32.O.Barabas et al.,Mechanism of IS 200/IS 605 Family DNATransposases:Activation and Transposon-Directed Target Site Selection,208-220(2008).
33.M.Yoshida et al.,Quantitative viral community DNA analysis revealsthe dominance of singlc- stranded DNA viruses in offshore upper bathyalsediment from Tohoku,Japan.Front.Microbiol. 9,1-10(2018).
34.C.T.Brown et al.,Unusual biology across a group comprising morethan 15%of domain Bacteria.Nature.523,208-211(2015).
35.K.Anantharaman et al.,Thousands of microbial genomes shed light oninterconnected biogeochemical processes in an aquifer system.Nat.Commun.7,13219(2016).
36.A.J.Probst et al.,Genomic resolution of a cold subsurface aquifercommunity provides metabolic insights for novel microbes adapted to high CO2concentrations.Environ.Microbiol. 19,459-474(2017).
37.V.M.Markowitz et al.,IMG/M 4vetsion of the integrated metagenomecomparative analysis system.Nucleic Acids Res.42,568-573(2014).
38.V.M.Markowitz et al.,IMG:The integrated microbial genomes databaseand comparative analysis system.Nucleic AcidsRes.40,115-122(2012).
39.R.D.Finn,J.Clements,S.R.Eddy,HMMER web server:interactive sequencesimilarity searching.Nucleic Acids Res.39,W29-W37(2011).
40.D.Burstein et al.,New CRISPR-Cas systems from uncultivatedmicrobes.Nature.542,237-241 (2017).
41.I.Grissa,G.Vergnaud,C.Pourcel,CRISPRFinder:a web tool to identifyclustered regularly interspaced short palindromic repeats.Nucleic AcidsRes.35,W52-W57(2007).
42.A.Biswas,R.H.J.Staals,S.E.Morales,P.C.Fineran,C.M.Brown,CRISPRDetect:A flexible algorithm to define CRISPR arrays.BMC Genomics.17,1-14(2016).
43.A.Stamatakis,RAxML version 8:A tool for phylogenetic anialysis andpost-analysis of large phylogenies.Bioinformatics.30,1312-1313(2014).
44.B.Langmead,S.L.Salzberg,Fast gapped-read alignment with Bowtie2.Nat Methods.9,357- 359(2012).
45.H.Ogata et al.,KEGG:Kyoto encyclopcdia of genes andgenomes.Nucleic Acids Res.27,29-34 (1999).
46.L.B.Harrington et al.,Athermostable Cas9 with increased lifetimein human plasma.Nat. Commun.8,1-7(2017).
47.G.Crooks,G.Hon,J.Chandonia,S.Brenner,NCBI GenBank FTP Site\nWebLogo:a sequence logo generator.GenomeRes.14,1188-1190(2004).
48.L.B.Harrington et al.,A Broad-Spectrum Inhibitor of CRISPR-Cas9.Cell.170,1224-1233.e15 (2017).
49.J.S.Chen et al.,CRISPR-Cas12a target binding unleashesindiscriminate single-stranded DNase activity.Science.360,436-439(2018).
50.Brown et al.,Unusual biology across a group comprising more than15%of domain Bacteria. Nature.523,208-211(2015),doi:10.1038/nature14486.
序列表
<110> 加利福尼亚大学董事会(The Regents of the University of California)
詹尼弗·A·多德纳(Doudna, Jennifer A)
大卫·伯斯坦(Burstein, David)
贾尼斯·S·陈(Chen, Janice S)
卢卡斯·B·哈林顿(Harrington, Lucas B)
大卫·帕兹-埃斯皮诺(Paez-Espino, David)
吉莉安·F·班菲尔德(Banfield, Jillian F)
<120> CASZ组合物和使用方法
<130> BERK-374WO
<150> US 62/580,395
<151> 2017-11-01
<160> 373
<170> PatentIn version 3.5
<210> 1
<211> 500
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 1
Met Glu Val Gln Lys Thr Val Met Lys Thr Leu Ser Leu Arg Ile Leu
1 5 10 15
Arg Pro Leu Tyr Ser Gln Glu Ile Glu Lys Glu Ile Lys Glu Glu Lys
20 25 30
Glu Arg Arg Lys Gln Ala Gly Gly Thr Gly Glu Leu Asp Gly Gly Phe
35 40 45
Tyr Lys Lys Leu Glu Lys Lys His Ser Glu Met Phe Ser Phe Asp Arg
50 55 60
Leu Asn Leu Leu Leu Asn Gln Leu Gln Arg Glu Ile Ala Lys Val Tyr
65 70 75 80
Asn His Ala Ile Ser Glu Leu Tyr Ile Ala Thr Ile Ala Gln Gly Asn
85 90 95
Lys Ser Asn Lys His Tyr Ile Ser Ser Ile Val Tyr Asn Arg Ala Tyr
100 105 110
Gly Tyr Phe Tyr Asn Ala Tyr Ile Ala Leu Gly Ile Cys Ser Lys Val
115 120 125
Glu Ala Asn Phe Arg Ser Asn Glu Leu Leu Thr Gln Gln Ser Ala Leu
130 135 140
Pro Thr Ala Lys Ser Asp Asn Phe Pro Ile Val Leu His Lys Gln Lys
145 150 155 160
Gly Ala Glu Gly Glu Asp Gly Gly Phe Arg Ile Ser Thr Glu Gly Ser
165 170 175
Asp Leu Ile Phe Glu Ile Pro Ile Pro Phe Tyr Glu Tyr Asn Gly Glu
180 185 190
Asn Arg Lys Glu Pro Tyr Lys Trp Val Lys Lys Gly Gly Gln Lys Pro
195 200 205
Val Leu Lys Leu Ile Leu Ser Thr Phe Arg Arg Gln Arg Asn Lys Gly
210 215 220
Trp Ala Lys Asp Glu Gly Thr Asp Ala Glu Ile Arg Lys Val Thr Glu
225 230 235 240
Gly Lys Tyr Gln Val Ser Gln Ile Glu Ile Asn Arg Gly Lys Lys Leu
245 250 255
Gly Glu His Gln Lys Trp Phe Ala Asn Phe Ser Ile Glu Gln Pro Ile
260 265 270
Tyr Glu Arg Lys Pro Asn Arg Ser Ile Val Gly Gly Leu Asp Val Gly
275 280 285
Ile Arg Ser Pro Leu Val Cys Ala Ile Asn Asn Ser Phe Ser Arg Tyr
290 295 300
Ser Val Asp Ser Asn Asp Val Phe Lys Phe Ser Lys Gln Val Phe Ala
305 310 315 320
Phe Arg Arg Arg Leu Leu Ser Lys Asn Ser Leu Lys Arg Lys Gly His
325 330 335
Gly Ala Ala His Lys Leu Glu Pro Ile Thr Glu Met Thr Glu Lys Asn
340 345 350
Asp Lys Phe Arg Lys Lys Ile Ile Glu Arg Trp Ala Lys Glu Val Thr
355 360 365
Asn Phe Phe Val Lys Asn Gln Val Gly Ile Val Gln Ile Glu Asp Leu
370 375 380
Ser Thr Met Lys Asp Arg Glu Asp His Phe Phe Asn Gln Tyr Leu Arg
385 390 395 400
Gly Phe Trp Pro Tyr Tyr Gln Met Gln Thr Leu Ile Glu Asn Lys Leu
405 410 415
Lys Glu Tyr Gly Ile Glu Val Lys Arg Val Gln Ala Lys Tyr Thr Ser
420 425 430
Gln Leu Cys Ser Asn Pro Asn Cys Arg Tyr Trp Asn Asn Tyr Phe Asn
435 440 445
Phe Glu Tyr Arg Lys Val Asn Lys Phe Pro Lys Phe Lys Cys Glu Lys
450 455 460
Cys Asn Leu Glu Ile Ser Ala Asp Tyr Asn Ala Ala Arg Asn Leu Ser
465 470 475 480
Thr Pro Asp Ile Glu Lys Phe Val Ala Lys Ala Thr Lys Gly Ile Asn
485 490 495
Leu Pro Glu Lys
500
<210> 2
<211> 507
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 2
Met Glu Glu Ala Lys Thr Val Ser Lys Thr Leu Ser Leu Arg Ile Leu
1 5 10 15
Arg Pro Leu Tyr Ser Ala Glu Ile Glu Lys Glu Ile Lys Glu Glu Lys
20 25 30
Glu Arg Arg Lys Gln Gly Gly Lys Ser Gly Glu Leu Asp Ser Gly Phe
35 40 45
Tyr Lys Lys Leu Glu Lys Lys His Thr Gln Met Phe Gly Trp Asp Lys
50 55 60
Leu Asn Leu Met Leu Ser Gln Leu Gln Arg Gln Ile Ala Arg Val Phe
65 70 75 80
Asn Gln Ser Ile Ser Glu Leu Tyr Ile Glu Thr Val Ile Gln Gly Lys
85 90 95
Lys Ser Asn Lys His Tyr Thr Ser Lys Ile Val Tyr Asn Arg Ala Tyr
100 105 110
Ser Val Phe Tyr Asn Ala Tyr Leu Ala Leu Gly Ile Thr Ser Lys Val
115 120 125
Glu Ala Asn Phe Arg Ser Thr Glu Leu Leu Met Gln Lys Ser Ser Leu
130 135 140
Pro Thr Ala Lys Ser Asp Asn Phe Pro Ile Leu Leu His Lys Gln Lys
145 150 155 160
Gly Val Glu Gly Glu Glu Gly Gly Phe Lys Ile Ser Ala Asp Gly Asn
165 170 175
Asp Leu Ile Phe Glu Ile Pro Ile Pro Phe Tyr Glu Tyr Asp Ser Ala
180 185 190
Asn Lys Lys Glu Pro Phe Lys Trp Ile Lys Lys Gly Gly Gln Lys Pro
195 200 205
Thr Ile Lys Leu Ile Leu Ser Thr Phe Arg Arg Gln Arg Asn Lys Gly
210 215 220
Trp Ala Lys Asp Glu Gly Thr Asp Ala Glu Ile Arg Lys Val Ile Glu
225 230 235 240
Gly Lys Tyr Gln Val Ser His Ile Glu Ile Asn Arg Gly Lys Lys Leu
245 250 255
Gly Asp His Gln Lys Trp Phe Val Asn Phe Thr Ile Glu Gln Pro Ile
260 265 270
Tyr Glu Arg Lys Leu Asp Lys Asn Ile Ile Gly Gly Ile Asp Val Gly
275 280 285
Ile Lys Ser Pro Leu Val Cys Ala Val Asn Asn Ser Phe Ala Arg Tyr
290 295 300
Ser Val Asp Ser Asn Asp Val Leu Lys Phe Ser Lys Gln Ala Phe Ala
305 310 315 320
Phe Arg Arg Arg Leu Leu Ser Lys Asn Ser Leu Lys Arg Ser Gly His
325 330 335
Gly Ser Lys Asn Lys Leu Asp Pro Ile Thr Arg Met Thr Glu Lys Asn
340 345 350
Asp Arg Phe Arg Lys Lys Ile Ile Glu Arg Trp Ala Lys Glu Val Thr
355 360 365
Asn Phe Phe Ile Lys Asn Gln Val Gly Thr Val Gln Ile Glu Asp Leu
370 375 380
Ser Thr Met Lys Asp Arg Gln Asp Asn Phe Phe Asn Gln Tyr Leu Arg
385 390 395 400
Gly Phe Trp Pro Tyr Tyr Gln Met Gln Asn Leu Ile Glu Asn Lys Leu
405 410 415
Lys Glu Tyr Gly Ile Glu Thr Lys Arg Ile Lys Ala Arg Tyr Thr Ser
420 425 430
Gln Leu Cys Ser Asn Pro Ser Cys Arg His Trp Asn Ser Tyr Phe Ser
435 440 445
Phe Asp His Arg Lys Thr Asn Asn Phe Pro Lys Phe Lys Cys Glu Lys
450 455 460
Cys Ala Leu Glu Ile Ser Ala Asp Tyr Asn Ala Ala Arg Asn Ile Ser
465 470 475 480
Thr Pro Asp Ile Glu Lys Phe Val Ala Lys Ala Thr Lys Gly Ile Asn
485 490 495
Leu Pro Asp Lys Asn Glu Asn Val Ile Leu Glu
500 505
<210> 3
<211> 529
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 3
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 4
<211> 726
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 4
Met Glu Arg Gln Lys Val Pro Gln Ile Arg Lys Ile Val Arg Val Val
1 5 10 15
Pro Leu Arg Ile Leu Arg Pro Lys Tyr Ser Asp Val Ile Glu Asn Ala
20 25 30
Leu Lys Lys Phe Lys Glu Lys Gly Asp Asp Thr Asn Thr Asn Asp Phe
35 40 45
Trp Arg Ala Ile Arg Asp Arg Asp Thr Glu Phe Phe Arg Lys Glu Leu
50 55 60
Asn Phe Ser Glu Asp Glu Ile Asn Gln Leu Glu Arg Asp Thr Leu Phe
65 70 75 80
Arg Val Gly Leu Asp Asn Arg Val Leu Phe Ser Tyr Phe Asp Phe Leu
85 90 95
Gln Glu Lys Leu Met Lys Asp Tyr Asn Lys Ile Ile Ser Lys Leu Phe
100 105 110
Ile Asn Arg Gln Ser Lys Ser Ser Phe Glu Asn Asp Leu Thr Asp Glu
115 120 125
Glu Val Glu Glu Leu Ile Glu Lys Asp Val Thr Pro Phe Tyr Gly Ala
130 135 140
Tyr Ile Gly Lys Gly Ile Lys Ser Val Ile Lys Ser Asn Leu Gly Gly
145 150 155 160
Lys Phe Ile Lys Ser Val Lys Ile Asp Arg Glu Thr Lys Lys Val Thr
165 170 175
Lys Leu Thr Ala Ile Asn Ile Gly Leu Met Gly Leu Pro Val Ala Lys
180 185 190
Ser Asp Thr Phe Pro Ile Lys Ile Ile Lys Thr Asn Pro Asp Tyr Ile
195 200 205
Thr Phe Gln Lys Ser Thr Lys Glu Asn Leu Gln Lys Ile Glu Asp Tyr
210 215 220
Glu Thr Gly Ile Glu Tyr Gly Asp Leu Leu Val Gln Ile Thr Ile Pro
225 230 235 240
Trp Phe Lys Asn Glu Asn Lys Asp Phe Ser Leu Ile Lys Thr Lys Glu
245 250 255
Ala Ile Glu Tyr Tyr Lys Leu Asn Gly Val Gly Lys Lys Asp Leu Leu
260 265 270
Asn Ile Asn Leu Val Leu Thr Thr Tyr His Ile Arg Lys Lys Lys Ser
275 280 285
Trp Gln Ile Asp Gly Ser Ser Gln Ser Leu Val Arg Glu Met Ala Asn
290 295 300
Gly Glu Leu Glu Glu Lys Trp Lys Ser Phe Phe Asp Thr Phe Ile Lys
305 310 315 320
Lys Tyr Gly Asp Glu Gly Lys Ser Ala Leu Val Lys Arg Arg Val Asn
325 330 335
Lys Lys Ser Arg Ala Lys Gly Glu Lys Gly Arg Glu Leu Asn Leu Asp
340 345 350
Glu Arg Ile Lys Arg Leu Tyr Asp Ser Ile Lys Ala Lys Ser Phe Pro
355 360 365
Ser Glu Ile Asn Leu Ile Pro Glu Asn Tyr Lys Trp Lys Leu His Phe
370 375 380
Ser Ile Glu Ile Pro Pro Met Val Asn Asp Ile Asp Ser Asn Leu Tyr
385 390 395 400
Gly Gly Ile Asp Phe Gly Glu Gln Asn Ile Ala Thr Leu Cys Val Lys
405 410 415
Asn Ile Glu Lys Asp Asp Tyr Asp Phe Leu Thr Ile Tyr Gly Asn Asp
420 425 430
Leu Leu Lys His Ala Gln Ala Ser Tyr Ala Arg Arg Arg Ile Met Arg
435 440 445
Val Gln Asp Glu Tyr Lys Ala Arg Gly His Gly Lys Ser Arg Lys Thr
450 455 460
Lys Ala Gln Glu Asp Tyr Ser Glu Arg Met Gln Lys Leu Arg Gln Lys
465 470 475 480
Ile Thr Glu Arg Leu Val Lys Gln Ile Ser Asp Phe Phe Leu Trp Arg
485 490 495
Asn Lys Phe His Met Ala Val Cys Ser Leu Arg Tyr Glu Asp Leu Asn
500 505 510
Thr Leu Tyr Lys Gly Glu Ser Val Lys Ala Lys Arg Met Arg Gln Phe
515 520 525
Ile Asn Lys Gln Gln Leu Phe Asn Gly Ile Glu Arg Lys Leu Lys Asp
530 535 540
Tyr Asn Ser Glu Ile Tyr Val Asn Ser Arg Tyr Pro His Tyr Thr Ser
545 550 555 560
Arg Leu Cys Ser Lys Cys Gly Lys Leu Asn Leu Tyr Phe Asp Phe Leu
565 570 575
Lys Phe Arg Thr Lys Asn Ile Ile Ile Arg Lys Asn Pro Asp Gly Ser
580 585 590
Glu Ile Lys Tyr Met Pro Phe Phe Ile Cys Glu Phe Cys Gly Trp Lys
595 600 605
Gln Ala Gly Asp Lys Asn Ala Ser Ala Asn Ile Ala Asp Lys Asp Tyr
610 615 620
Gln Asp Lys Leu Asn Lys Glu Lys Glu Phe Cys Asn Ile Arg Lys Pro
625 630 635 640
Lys Ser Lys Lys Glu Asp Ile Gly Glu Glu Asn Glu Glu Glu Arg Asp
645 650 655
Tyr Ser Arg Arg Phe Asn Arg Asn Ser Phe Ile Tyr Asn Ser Leu Lys
660 665 670
Lys Asp Asn Lys Leu Asn Gln Glu Lys Leu Phe Asp Glu Trp Lys Asn
675 680 685
Gln Leu Lys Arg Lys Ile Asp Gly Arg Asn Lys Phe Glu Pro Lys Glu
690 695 700
Tyr Lys Asp Arg Phe Ser Tyr Leu Phe Ala Tyr Tyr Gln Glu Ile Ile
705 710 715 720
Lys Asn Glu Ser Glu Ser
725
<210> 5
<211> 517
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 5
Met Val Pro Thr Glu Leu Ile Thr Lys Thr Leu Gln Leu Arg Val Ile
1 5 10 15
Arg Pro Leu Tyr Phe Glu Glu Ile Glu Lys Glu Leu Ala Glu Leu Lys
20 25 30
Glu Gln Lys Glu Lys Glu Phe Glu Glu Thr Asn Ser Leu Leu Leu Glu
35 40 45
Ser Lys Lys Ile Asp Ala Lys Ser Leu Lys Lys Leu Lys Arg Lys Ala
50 55 60
Arg Ser Ser Ala Ala Val Glu Phe Trp Lys Ile Ala Lys Glu Lys Tyr
65 70 75 80
Pro Asp Ile Leu Thr Lys Pro Glu Met Glu Phe Ile Phe Ser Glu Met
85 90 95
Gln Lys Met Met Ala Arg Phe Tyr Asn Lys Ser Met Thr Asn Ile Phe
100 105 110
Ile Glu Met Asn Asn Asp Glu Lys Val Asn Pro Leu Ser Leu Ile Ser
115 120 125
Lys Ala Ser Thr Glu Ala Asn Gln Val Ile Lys Cys Ser Ser Ile Ser
130 135 140
Ser Gly Leu Asn Arg Lys Ile Ala Gly Ser Ile Asn Lys Thr Lys Phe
145 150 155 160
Lys Gln Val Arg Asp Gly Leu Ile Ser Leu Pro Thr Ala Arg Thr Glu
165 170 175
Thr Phe Pro Ile Ser Phe Tyr Lys Ser Thr Ala Asn Lys Asp Glu Ile
180 185 190
Pro Ile Ser Lys Ile Asn Leu Pro Ser Glu Glu Glu Ala Asp Leu Thr
195 200 205
Ile Thr Leu Pro Phe Pro Phe Phe Glu Ile Lys Lys Glu Lys Lys Gly
210 215 220
Gln Lys Ala Tyr Ser Tyr Phe Asn Ile Ile Glu Lys Ser Gly Arg Ser
225 230 235 240
Asn Asn Lys Ile Asp Leu Leu Leu Ser Thr His Arg Arg Gln Arg Arg
245 250 255
Lys Gly Trp Lys Glu Glu Gly Gly Thr Ser Ala Glu Ile Arg Arg Leu
260 265 270
Met Glu Gly Glu Phe Asp Lys Glu Trp Glu Ile Tyr Leu Gly Glu Ala
275 280 285
Glu Lys Ser Glu Lys Ala Lys Asn Asp Leu Ile Lys Asn Met Thr Arg
290 295 300
Gly Lys Leu Ser Lys Asp Ile Lys Glu Gln Leu Glu Asp Ile Gln Val
305 310 315 320
Lys Tyr Phe Ser Asp Asn Asn Val Glu Ser Trp Asn Asp Leu Ser Lys
325 330 335
Glu Gln Lys Gln Glu Leu Ser Lys Leu Arg Lys Lys Lys Val Glu Glu
340 345 350
Leu Lys Asp Trp Lys His Val Lys Glu Ile Leu Lys Thr Arg Ala Lys
355 360 365
Ile Gly Trp Val Glu Leu Lys Arg Gly Lys Arg Gln Arg Asp Arg Asn
370 375 380
Lys Trp Phe Val Asn Ile Thr Ile Thr Arg Pro Pro Phe Ile Asn Lys
385 390 395 400
Glu Leu Asp Asp Thr Lys Phe Gly Gly Ile Asp Leu Gly Val Lys Val
405 410 415
Pro Phe Val Cys Ala Val His Gly Ser Pro Ala Arg Leu Ile Ile Lys
420 425 430
Glu Asn Glu Ile Leu Gln Phe Asn Lys Met Val Ser Ala Arg Asn Arg
435 440 445
Gln Ile Thr Lys Asp Ser Glu Gln Arg Lys Gly Arg Gly Lys Lys Asn
450 455 460
Lys Phe Ile Lys Lys Glu Ile Phe Asn Glu Arg Asn Glu Leu Phe Arg
465 470 475 480
Lys Lys Ile Ile Glu Arg Trp Ala Asn Gln Ile Val Lys Phe Phe Glu
485 490 495
Asp Gln Lys Cys Ala Thr Val Gln Ile Glu Asn Leu Glu Ser Phe Asp
500 505 510
Arg Thr Ser Tyr Lys
515
<210> 6
<211> 481
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 6
Met Lys Ser Asp Thr Lys Asp Lys Lys Ile Ile Ile His Gln Thr Lys
1 5 10 15
Thr Leu Ser Leu Arg Ile Val Lys Pro Gln Ser Ile Pro Met Glu Glu
20 25 30
Phe Thr Asp Leu Val Arg Tyr His Gln Met Ile Ile Phe Pro Val Tyr
35 40 45
Asn Asn Gly Ala Ile Asp Leu Tyr Lys Lys Leu Phe Lys Ala Lys Ile
50 55 60
Gln Lys Gly Asn Glu Ala Arg Ala Ile Lys Tyr Phe Met Asn Lys Ile
65 70 75 80
Val Tyr Ala Pro Ile Ala Asn Thr Val Lys Asn Ser Tyr Ile Ala Leu
85 90 95
Gly Tyr Ser Thr Lys Met Gln Ser Ser Phe Ser Gly Lys Arg Leu Trp
100 105 110
Asp Leu Arg Phe Gly Glu Ala Thr Pro Pro Thr Ile Lys Ala Asp Phe
115 120 125
Pro Leu Pro Phe Tyr Asn Gln Ser Gly Phe Lys Val Ser Ser Glu Asn
130 135 140
Gly Glu Phe Ile Ile Gly Ile Pro Phe Gly Gln Tyr Thr Lys Lys Thr
145 150 155 160
Val Ser Asp Ile Glu Lys Lys Thr Ser Phe Ala Trp Asp Lys Phe Thr
165 170 175
Leu Glu Asp Thr Thr Lys Lys Thr Leu Ile Glu Leu Leu Leu Ser Thr
180 185 190
Lys Thr Arg Lys Met Asn Glu Gly Trp Lys Asn Asn Glu Gly Thr Glu
195 200 205
Ala Glu Ile Lys Arg Val Met Asp Gly Thr Tyr Gln Val Thr Ser Leu
210 215 220
Glu Ile Leu Gln Arg Asp Asp Ser Trp Phe Val Asn Phe Asn Ile Ala
225 230 235 240
Tyr Asp Ser Leu Lys Lys Gln Pro Asp Arg Asp Lys Ile Ala Gly Ile
245 250 255
His Met Gly Ile Thr Arg Pro Leu Thr Ala Val Ile Tyr Asn Asn Lys
260 265 270
Tyr Arg Ala Leu Ser Ile Tyr Pro Asn Thr Val Met His Leu Thr Gln
275 280 285
Lys Gln Leu Ala Arg Ile Lys Glu Gln Arg Thr Asn Ser Lys Tyr Ala
290 295 300
Thr Gly Gly His Gly Arg Asn Ala Lys Val Thr Gly Thr Asp Thr Leu
305 310 315 320
Ser Glu Ala Tyr Arg Gln Arg Arg Lys Lys Ile Ile Glu Asp Trp Ile
325 330 335
Ala Ser Ile Val Lys Phe Ala Ile Asn Asn Glu Ile Gly Thr Ile Tyr
340 345 350
Leu Glu Asp Ile Ser Asn Thr Asn Ser Phe Phe Ala Ala Arg Glu Gln
355 360 365
Lys Leu Ile Tyr Leu Glu Asp Ile Ser Asn Thr Asn Ser Phe Leu Ser
370 375 380
Thr Tyr Lys Tyr Pro Ile Ser Ala Ile Ser Asp Thr Leu Gln His Lys
385 390 395 400
Leu Glu Glu Lys Ala Ile Gln Val Ile Arg Lys Lys Ala Tyr Tyr Val
405 410 415
Asn Gln Ile Cys Ser Leu Cys Gly His Tyr Asn Lys Gly Phe Thr Tyr
420 425 430
Gln Phe Arg Arg Lys Asn Lys Phe Pro Lys Met Lys Cys Gln Gly Cys
435 440 445
Leu Glu Ala Thr Ser Thr Glu Phe Asn Ala Ala Ala Asn Val Ala Asn
450 455 460
Pro Asp Tyr Glu Lys Leu Leu Ile Lys His Gly Leu Leu Gln Leu Lys
465 470 475 480
Lys
<210> 7
<211> 358
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 7
Met Ser Thr Ile Thr Arg Gln Val Arg Leu Ser Pro Thr Pro Glu Gln
1 5 10 15
Ser Arg Leu Leu Met Ala His Cys Gln Gln Tyr Ile Ser Thr Val Asn
20 25 30
Val Leu Val Ala Ala Phe Asp Ser Glu Val Leu Thr Gly Lys Val Ser
35 40 45
Thr Lys Asp Phe Arg Ala Ala Leu Pro Ser Ala Val Lys Asn Gln Ala
50 55 60
Leu Arg Asp Ala Gln Ser Val Phe Lys Arg Ser Val Glu Leu Gly Cys
65 70 75 80
Leu Pro Val Leu Lys Lys Pro His Cys Gln Trp Asn Asn Gln Asn Trp
85 90 95
Arg Val Glu Gly Asp Gln Leu Ile Leu Pro Ile Cys Lys Asp Gly Lys
100 105 110
Thr Gln Gln Glu Arg Phe Arg Cys Ala Ala Val Ala Leu Glu Gly Lys
115 120 125
Ala Gly Ile Leu Arg Ile Lys Lys Lys Arg Gly Lys Trp Ile Ala Asp
130 135 140
Leu Thr Val Thr Gln Glu Asp Ala Pro Glu Ser Ser Gly Ser Ala Ile
145 150 155 160
Met Gly Val Asp Leu Gly Ile Lys Val Pro Ala Val Ala His Ile Gly
165 170 175
Gly Lys Gly Thr Arg Phe Phe Gly Asn Gly Arg Ser Gln Arg Ser Met
180 185 190
Arg Arg Arg Phe Tyr Ala Arg Arg Lys Thr Leu Gln Lys Ala Lys Lys
195 200 205
Leu Arg Ala Val Arg Lys Ser Lys Gly Lys Glu Ala Arg Trp Met Lys
210 215 220
Thr Ile Asn His Gln Leu Ser Arg Gln Ile Val Asn His Ala His Ala
225 230 235 240
Leu Gly Val Gly Thr Ile Lys Ile Glu Ala Leu Gln Gly Ile Arg Lys
245 250 255
Gly Thr Thr Arg Lys Ser Arg Gly Ala Ala Ala Arg Lys Asn Asn Arg
260 265 270
Met Thr Asn Thr Trp Ser Phe Ser Gln Leu Thr Leu Phe Ile Thr Tyr
275 280 285
Lys Ala Gln Arg Gln Gly Ile Thr Val Glu Gln Val Asp Pro Ala Tyr
290 295 300
Thr Ser Gln Asp Cys Pro Ala Cys Arg Ala Arg Asn Gly Ala Gln Asp
305 310 315 320
Arg Thr Tyr Val Cys Ser Glu Cys Gly Trp Arg Gly His Arg Asp Thr
325 330 335
Val Gly Ala Ile Asn Ile Ser Arg Arg Ala Gly Leu Ser Gly His Arg
340 345 350
Arg Gly Ala Thr Gly Ala
355
<210> 8
<211> 507
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 8
Met Ile Ala Gln Lys Thr Ile Lys Ile Lys Leu Asn Pro Thr Lys Glu
1 5 10 15
Gln Ile Ile Lys Leu Asn Ser Ile Ile Glu Glu Tyr Ile Lys Val Ser
20 25 30
Asn Phe Thr Ala Lys Lys Ile Ala Glu Ile Gln Glu Ser Phe Thr Asp
35 40 45
Ser Gly Leu Thr Gln Gly Thr Cys Ser Glu Cys Gly Lys Glu Lys Thr
50 55 60
Tyr Arg Lys Tyr His Leu Leu Lys Lys Asp Asn Lys Leu Phe Cys Ile
65 70 75 80
Thr Cys Tyr Lys Arg Lys Tyr Ser Gln Phe Thr Leu Gln Lys Val Glu
85 90 95
Phe Gln Asn Lys Thr Gly Leu Arg Asn Val Ala Lys Leu Pro Lys Thr
100 105 110
Tyr Tyr Thr Asn Ala Ile Arg Phe Ala Ser Asp Thr Phe Ser Gly Phe
115 120 125
Asp Glu Ile Ile Lys Lys Lys Gln Asn Arg Leu Asn Ser Ile Gln Asn
130 135 140
Arg Leu Asn Phe Trp Lys Glu Leu Leu Tyr Asn Pro Ser Asn Arg Asn
145 150 155 160
Glu Ile Lys Ile Lys Val Val Lys Tyr Ala Pro Lys Thr Asp Thr Arg
165 170 175
Glu His Pro His Tyr Tyr Ser Glu Ala Glu Ile Lys Gly Arg Ile Lys
180 185 190
Arg Leu Glu Lys Gln Leu Lys Lys Phe Lys Met Pro Lys Tyr Pro Glu
195 200 205
Phe Thr Ser Glu Thr Ile Ser Leu Gln Arg Glu Leu Tyr Ser Trp Lys
210 215 220
Asn Pro Asp Glu Leu Lys Ile Ser Ser Ile Thr Asp Lys Asn Glu Ser
225 230 235 240
Met Asn Tyr Tyr Gly Lys Glu Tyr Leu Lys Arg Tyr Ile Asp Leu Ile
245 250 255
Asn Ser Gln Thr Pro Gln Ile Leu Leu Glu Lys Glu Asn Asn Ser Phe
260 265 270
Tyr Leu Cys Phe Pro Ile Thr Lys Asn Ile Glu Met Pro Lys Ile Asp
275 280 285
Asp Thr Phe Glu Pro Val Gly Ile Asp Trp Gly Ile Thr Arg Asn Ile
290 295 300
Ala Val Val Ser Ile Leu Asp Ser Lys Thr Lys Lys Pro Lys Phe Val
305 310 315 320
Lys Phe Tyr Ser Ala Gly Tyr Ile Leu Gly Lys Arg Lys His Tyr Lys
325 330 335
Ser Leu Arg Lys His Phe Gly Gln Lys Lys Arg Gln Asp Lys Ile Asn
340 345 350
Lys Leu Gly Thr Lys Glu Asp Arg Phe Ile Asp Ser Asn Ile His Lys
355 360 365
Leu Ala Phe Leu Ile Val Lys Glu Ile Arg Asn His Ser Asn Lys Pro
370 375 380
Ile Ile Leu Met Glu Asn Ile Thr Asp Asn Arg Glu Glu Ala Glu Lys
385 390 395 400
Ser Met Arg Gln Asn Ile Leu Leu His Ser Val Lys Ser Arg Leu Gln
405 410 415
Asn Tyr Ile Ala Tyr Lys Ala Leu Trp Asn Asn Ile Pro Thr Asn Leu
420 425 430
Val Lys Pro Glu His Thr Ser Gln Ile Cys Asn Arg Cys Gly His Gln
435 440 445
Asp Arg Glu Asn Arg Pro Lys Gly Ser Lys Leu Phe Lys Cys Val Lys
450 455 460
Cys Asn Tyr Met Ser Asn Ala Asp Phe Asn Ala Ser Ile Asn Ile Ala
465 470 475 480
Arg Lys Phe Tyr Ile Gly Glu Tyr Glu Pro Phe Tyr Lys Asp Asn Glu
485 490 495
Lys Met Lys Ser Gly Val Asn Ser Ile Ser Met
500 505
<210> 9
<211> 534
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 9
Leu Lys Leu Ser Glu Gln Glu Asn Ile Thr Thr Gly Val Lys Phe Lys
1 5 10 15
Leu Lys Leu Asp Lys Glu Thr Ser Glu Gly Leu Asn Asp Tyr Phe Asp
20 25 30
Glu Tyr Gly Lys Ala Ile Asn Phe Ala Ile Lys Val Ile Gln Lys Glu
35 40 45
Leu Ala Glu Asp Arg Phe Ala Gly Lys Val Arg Leu Asp Glu Asn Lys
50 55 60
Lys Pro Leu Leu Asn Glu Asp Gly Lys Lys Ile Trp Asp Phe Pro Asn
65 70 75 80
Glu Phe Cys Ser Cys Gly Lys Gln Val Asn Arg Tyr Val Asn Gly Lys
85 90 95
Ser Leu Cys Gln Glu Cys Tyr Lys Asn Lys Phe Thr Glu Tyr Gly Ile
100 105 110
Arg Lys Arg Met Tyr Ser Ala Lys Gly Arg Lys Ala Glu Gln Asp Ile
115 120 125
Asn Ile Lys Asn Ser Thr Asn Lys Ile Ser Lys Thr His Phe Asn Tyr
130 135 140
Ala Ile Arg Glu Ala Phe Ile Leu Asp Lys Ser Ile Lys Lys Gln Arg
145 150 155 160
Lys Glu Arg Phe Arg Arg Leu Arg Glu Met Lys Lys Lys Leu Gln Glu
165 170 175
Phe Ile Glu Ile Arg Asp Gly Asn Lys Ile Leu Cys Pro Lys Ile Glu
180 185 190
Lys Gln Arg Val Glu Arg Tyr Ile His Pro Ser Trp Ile Asn Lys Glu
195 200 205
Lys Lys Leu Glu Asp Phe Arg Gly Tyr Ser Met Ser Asn Val Leu Gly
210 215 220
Lys Ile Lys Ile Leu Asp Arg Asn Ile Lys Arg Glu Glu Lys Ser Leu
225 230 235 240
Lys Glu Lys Gly Gln Ile Asn Phe Lys Ala Arg Arg Leu Met Leu Asp
245 250 255
Lys Ser Val Lys Phe Leu Asn Asp Asn Lys Ile Ser Phe Thr Ile Ser
260 265 270
Lys Asn Leu Pro Lys Glu Tyr Glu Leu Asp Leu Pro Glu Lys Glu Lys
275 280 285
Arg Leu Asn Trp Leu Lys Glu Lys Ile Lys Ile Ile Lys Asn Gln Lys
290 295 300
Pro Lys Tyr Ala Tyr Leu Leu Arg Lys Asp Asp Asn Phe Tyr Leu Gln
305 310 315 320
Tyr Thr Leu Glu Thr Glu Phe Asn Leu Lys Glu Asp Tyr Ser Gly Ile
325 330 335
Val Gly Ile Asp Arg Gly Val Ser His Ile Ala Val Tyr Thr Phe Val
340 345 350
His Asn Asn Gly Lys Asn Glu Arg Pro Leu Phe Leu Asn Ser Ser Glu
355 360 365
Ile Leu Arg Leu Lys Asn Leu Gln Lys Glu Arg Asp Arg Phe Leu Arg
370 375 380
Arg Lys His Asn Lys Lys Arg Lys Lys Ser Asn Met Arg Asn Ile Glu
385 390 395 400
Lys Lys Ile Gln Leu Ile Leu His Asn Tyr Ser Lys Gln Ile Val Asp
405 410 415
Phe Ala Lys Asn Lys Asn Ala Phe Ile Val Phe Glu Lys Leu Glu Lys
420 425 430
Pro Lys Lys Asn Arg Ser Lys Met Ser Lys Lys Ser Gln Tyr Lys Leu
435 440 445
Ser Gln Phe Thr Phe Lys Lys Leu Ser Asp Leu Val Asp Tyr Lys Ala
450 455 460
Lys Arg Glu Gly Ile Lys Val Leu Tyr Ile Ser Pro Glu Tyr Thr Ser
465 470 475 480
Lys Glu Cys Ser His Cys Gly Glu Lys Val Asn Thr Gln Arg Pro Phe
485 490 495
Asn Gly Asn Ser Ser Leu Phe Lys Cys Asn Lys Cys Gly Val Glu Leu
500 505 510
Asn Ala Asp Tyr Asn Ala Ser Ile Asn Ile Ala Lys Lys Gly Leu Asn
515 520 525
Ile Leu Asn Ser Thr Asn
530
<210> 10
<211> 537
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 10
Met Glu Glu Ser Ile Ile Thr Gly Val Lys Phe Lys Leu Arg Ile Asp
1 5 10 15
Lys Glu Thr Thr Lys Lys Leu Asn Glu Tyr Phe Asp Glu Tyr Gly Lys
20 25 30
Ala Ile Asn Phe Ala Val Lys Ile Ile Gln Lys Glu Leu Ala Asp Asp
35 40 45
Arg Phe Ala Gly Lys Ala Lys Leu Asp Gln Asn Lys Asn Pro Ile Leu
50 55 60
Asp Glu Asn Gly Lys Lys Ile Tyr Glu Phe Pro Asp Glu Phe Cys Ser
65 70 75 80
Cys Gly Lys Gln Val Asn Lys Tyr Val Asn Asn Lys Pro Phe Cys Gln
85 90 95
Glu Cys Tyr Lys Ile Arg Phe Thr Glu Asn Gly Ile Arg Lys Arg Met
100 105 110
Tyr Ser Ala Lys Gly Arg Lys Ala Glu His Lys Ile Asn Ile Leu Asn
115 120 125
Ser Thr Asn Lys Ile Ser Lys Thr His Phe Asn Tyr Ala Ile Arg Glu
130 135 140
Ala Phe Ile Leu Asp Lys Ser Ile Lys Lys Gln Arg Lys Lys Arg Asn
145 150 155 160
Glu Arg Leu Arg Glu Ser Lys Lys Arg Leu Gln Gln Phe Ile Asp Met
165 170 175
Arg Asp Gly Lys Arg Glu Ile Cys Pro Thr Ile Lys Gly Gln Lys Val
180 185 190
Asp Arg Phe Ile His Pro Ser Trp Ile Thr Lys Asp Lys Lys Leu Glu
195 200 205
Asp Phe Arg Gly Tyr Thr Leu Ser Ile Ile Asn Ser Lys Ile Lys Ile
210 215 220
Leu Asp Arg Asn Ile Lys Arg Glu Glu Lys Ser Leu Lys Glu Lys Gly
225 230 235 240
Gln Ile Ile Phe Lys Ala Lys Arg Leu Met Leu Asp Lys Ser Ile Arg
245 250 255
Phe Val Gly Asp Arg Lys Val Leu Phe Thr Ile Ser Lys Thr Leu Pro
260 265 270
Lys Glu Tyr Glu Leu Asp Leu Pro Ser Lys Glu Lys Arg Leu Asn Trp
275 280 285
Leu Lys Glu Lys Ile Glu Ile Ile Lys Asn Gln Lys Pro Lys Tyr Ala
290 295 300
Tyr Leu Leu Arg Lys Asn Ile Glu Ser Glu Lys Lys Pro Asn Tyr Glu
305 310 315 320
Tyr Tyr Leu Gln Tyr Thr Leu Glu Ile Lys Pro Glu Leu Lys Asp Phe
325 330 335
Tyr Asp Gly Ala Ile Gly Ile Asp Arg Gly Ile Asn His Ile Ala Val
340 345 350
Cys Thr Phe Ile Ser Asn Asp Gly Lys Val Thr Pro Pro Lys Phe Phe
355 360 365
Ser Ser Gly Glu Ile Leu Arg Leu Lys Asn Leu Gln Lys Glu Arg Asp
370 375 380
Arg Phe Leu Leu Arg Lys His Asn Lys Asn Arg Lys Lys Gly Asn Met
385 390 395 400
Arg Val Ile Glu Asn Lys Ile Asn Leu Ile Leu His Arg Tyr Ser Lys
405 410 415
Gln Ile Val Asp Met Ala Lys Lys Leu Asn Ala Ser Ile Val Phe Glu
420 425 430
Glu Leu Gly Arg Ile Gly Lys Ser Arg Thr Lys Met Lys Lys Ser Gln
435 440 445
Arg Tyr Lys Leu Ser Leu Phe Ile Phe Lys Lys Leu Ser Asp Leu Val
450 455 460
Asp Tyr Lys Ser Arg Arg Glu Gly Ile Arg Val Thr Tyr Val Pro Pro
465 470 475 480
Glu Tyr Thr Ser Lys Glu Cys Ser His Cys Gly Glu Lys Val Asn Thr
485 490 495
Gln Arg Pro Phe Asn Gly Asn Tyr Ser Leu Phe Lys Cys Asn Lys Cys
500 505 510
Gly Ile Gln Leu Asn Ser Asp Tyr Asn Ala Ser Ile Asn Ile Ala Lys
515 520 525
Lys Gly Leu Lys Ile Pro Asn Ser Thr
530 535
<210> 11
<211> 540
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 11
Leu Trp Thr Ile Val Ile Gly Asp Phe Ile Glu Met Pro Lys Gln Asp
1 5 10 15
Leu Val Thr Thr Gly Ile Lys Phe Lys Leu Asp Val Asp Lys Glu Thr
20 25 30
Arg Lys Lys Leu Asp Asp Tyr Phe Asp Glu Tyr Gly Lys Ala Ile Asn
35 40 45
Phe Ala Val Lys Ile Ile Gln Lys Asn Leu Lys Glu Asp Arg Phe Ala
50 55 60
Gly Lys Ile Ala Leu Gly Glu Asp Lys Lys Pro Leu Leu Asp Lys Asp
65 70 75 80
Gly Lys Lys Ile Tyr Asn Tyr Pro Asn Glu Ser Cys Ser Cys Gly Asn
85 90 95
Gln Val Arg Arg Tyr Val Asn Ala Lys Pro Phe Cys Val Asp Cys Tyr
100 105 110
Lys Leu Lys Phe Thr Glu Asn Gly Ile Arg Lys Arg Met Tyr Ser Ala
115 120 125
Arg Gly Arg Lys Ala Asp Ser Asp Ile Asn Ile Lys Asn Ser Thr Asn
130 135 140
Lys Ile Ser Lys Thr His Phe Asn Tyr Ala Ile Arg Glu Gly Phe Ile
145 150 155 160
Leu Asp Lys Ser Leu Lys Lys Gln Arg Ser Lys Arg Ile Lys Lys Leu
165 170 175
Leu Glu Leu Lys Arg Lys Leu Gln Glu Phe Ile Asp Ile Arg Gln Gly
180 185 190
Gln Met Val Leu Cys Pro Lys Ile Lys Asn Gln Arg Val Asp Lys Phe
195 200 205
Ile His Pro Ser Trp Leu Lys Arg Asp Lys Lys Leu Glu Glu Phe Arg
210 215 220
Gly Tyr Ser Leu Ser Val Val Glu Gly Lys Ile Lys Ile Phe Asn Arg
225 230 235 240
Asn Ile Leu Arg Glu Glu Asp Ser Leu Arg Gln Arg Gly His Val Asn
245 250 255
Phe Lys Ala Asn Arg Ile Met Leu Asp Lys Ser Val Arg Phe Leu Asp
260 265 270
Gly Gly Lys Val Asn Phe Asn Leu Asn Lys Gly Leu Pro Lys Glu Tyr
275 280 285
Leu Leu Asp Leu Pro Lys Lys Glu Asn Lys Leu Ser Trp Leu Asn Glu
290 295 300
Lys Ile Ser Leu Ile Lys Leu Gln Lys Pro Lys Tyr Ala Tyr Leu Leu
305 310 315 320
Arg Arg Glu Gly Ser Phe Phe Ile Gln Tyr Thr Ile Glu Asn Val Pro
325 330 335
Lys Thr Phe Ser Asp Tyr Leu Gly Ala Ile Gly Ile Asp Arg Gly Ile
340 345 350
Ser His Ile Ala Val Cys Thr Phe Val Ser Lys Asn Gly Val Asn Lys
355 360 365
Ala Pro Val Phe Phe Ser Ser Gly Glu Ile Leu Lys Leu Lys Ser Leu
370 375 380
Gln Lys Gln Arg Asp Leu Phe Leu Arg Gly Lys His Asn Lys Ile Arg
385 390 395 400
Lys Lys Ser Asn Met Arg Asn Ile Asp Asn Lys Ile Asn Leu Ile Leu
405 410 415
His Lys Tyr Ser Arg Asn Ile Val Asn Leu Ala Lys Ser Glu Lys Ala
420 425 430
Phe Ile Val Phe Glu Lys Leu Glu Lys Ile Lys Lys Ser Arg Phe Lys
435 440 445
Met Ser Lys Ser Leu Gln Tyr Lys Leu Ser Gln Phe Thr Phe Lys Lys
450 455 460
Leu Ser Asp Leu Val Glu Tyr Lys Ala Lys Ile Glu Gly Ile Lys Val
465 470 475 480
Asp Tyr Val Pro Pro Glu Tyr Thr Ser Lys Glu Cys Ser His Cys Gly
485 490 495
Glu Lys Val Asp Thr Gln Arg Pro Phe Asn Gly Asn Ser Ser Leu Phe
500 505 510
Lys Cys Asn Lys Cys Arg Val Gln Leu Asn Ala Asp Tyr Asn Ala Ser
515 520 525
Ile Asn Ile Ala Lys Lys Ser Leu Asn Ile Ser Asn
530 535 540
<210> 12
<211> 542
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 12
Met Ser Lys Thr Thr Ile Ser Val Lys Leu Lys Ile Ile Asp Leu Ser
1 5 10 15
Ser Glu Lys Lys Glu Phe Leu Asp Asn Tyr Phe Asn Glu Tyr Ala Lys
20 25 30
Ala Thr Thr Phe Cys Gln Leu Arg Ile Arg Arg Leu Leu Arg Asn Thr
35 40 45
His Trp Leu Gly Lys Lys Glu Lys Ser Ser Lys Lys Trp Ile Phe Glu
50 55 60
Ser Gly Ile Cys Asp Leu Cys Gly Glu Asn Lys Glu Leu Val Asn Glu
65 70 75 80
Asp Arg Asn Ser Gly Glu Pro Ala Lys Ile Cys Lys Arg Cys Tyr Asn
85 90 95
Gly Arg Tyr Gly Asn Gln Met Ile Arg Lys Leu Phe Val Ser Thr Lys
100 105 110
Lys Arg Glu Val Gln Glu Asn Met Asp Ile Arg Arg Val Ala Lys Leu
115 120 125
Asn Asn Thr His Tyr His Arg Ile Pro Glu Glu Ala Phe Asp Met Ile
130 135 140
Lys Ala Ala Asp Thr Ala Glu Lys Arg Arg Lys Lys Asn Val Glu Tyr
145 150 155 160
Asp Lys Lys Arg Gln Met Glu Phe Ile Glu Met Phe Asn Asp Glu Lys
165 170 175
Lys Arg Ala Ala Arg Pro Lys Lys Pro Asn Glu Arg Glu Thr Arg Tyr
180 185 190
Val His Ile Ser Lys Leu Glu Ser Pro Ser Lys Gly Tyr Thr Leu Asn
195 200 205
Gly Ile Lys Arg Lys Ile Asp Gly Met Gly Lys Lys Ile Glu Arg Ala
210 215 220
Glu Lys Gly Leu Ser Arg Lys Lys Ile Phe Gly Tyr Gln Gly Asn Arg
225 230 235 240
Ile Lys Leu Asp Ser Asn Trp Val Arg Phe Asp Leu Ala Glu Ser Glu
245 250 255
Ile Thr Ile Pro Ser Leu Phe Lys Glu Met Lys Leu Arg Ile Thr Gly
260 265 270
Pro Thr Asn Val His Ser Lys Ser Gly Gln Ile Tyr Phe Ala Glu Trp
275 280 285
Phe Glu Arg Ile Asn Lys Gln Pro Asn Asn Tyr Cys Tyr Leu Ile Arg
290 295 300
Lys Thr Ser Ser Asn Gly Lys Tyr Glu Tyr Tyr Leu Gln Tyr Thr Tyr
305 310 315 320
Glu Ala Glu Val Glu Ala Asn Lys Glu Tyr Ala Gly Cys Leu Gly Val
325 330 335
Asp Ile Gly Cys Ser Lys Leu Ala Ala Ala Val Tyr Tyr Asp Ser Lys
340 345 350
Asn Lys Lys Ala Gln Lys Pro Ile Glu Ile Phe Thr Asn Pro Ile Lys
355 360 365
Lys Ile Lys Met Arg Arg Glu Lys Leu Ile Lys Leu Leu Ser Arg Val
370 375 380
Lys Val Arg His Arg Arg Arg Lys Leu Met Gln Leu Ser Lys Thr Glu
385 390 395 400
Pro Ile Ile Asp Tyr Thr Cys His Lys Thr Ala Arg Lys Ile Val Glu
405 410 415
Met Ala Asn Thr Ala Lys Ala Phe Ile Ser Met Glu Asn Leu Glu Thr
420 425 430
Gly Ile Lys Gln Lys Gln Gln Ala Arg Glu Thr Lys Lys Gln Lys Phe
435 440 445
Tyr Arg Asn Met Phe Leu Phe Arg Lys Leu Ser Lys Leu Ile Glu Tyr
450 455 460
Lys Ala Leu Leu Lys Gly Ile Lys Ile Val Tyr Val Lys Pro Asp Tyr
465 470 475 480
Thr Ser Gln Thr Cys Ser Ser Cys Gly Ala Asp Lys Glu Lys Thr Glu
485 490 495
Arg Pro Ser Gln Ala Ile Phe Arg Cys Leu Asn Pro Thr Cys Arg Tyr
500 505 510
Tyr Gln Arg Asp Ile Asn Ala Asp Phe Asn Ala Ala Val Asn Ile Ala
515 520 525
Lys Lys Ala Leu Asn Asn Thr Glu Val Val Thr Thr Leu Leu
530 535 540
<210> 13
<211> 564
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 13
Met Ala Arg Ala Lys Asn Gln Pro Tyr Gln Lys Leu Thr Thr Thr Thr
1 5 10 15
Gly Ile Lys Phe Lys Leu Asp Leu Ser Glu Glu Glu Gly Lys Arg Phe
20 25 30
Asp Glu Tyr Phe Ser Glu Tyr Ala Lys Ala Val Asn Phe Cys Ala Lys
35 40 45
Val Ile Tyr Gln Leu Arg Lys Asn Leu Lys Phe Ala Gly Lys Lys Glu
50 55 60
Leu Ala Ala Lys Glu Trp Lys Phe Glu Ile Ser Asn Cys Asp Phe Cys
65 70 75 80
Asn Lys Gln Lys Glu Ile Tyr Tyr Lys Asn Ile Ala Asn Gly Gln Lys
85 90 95
Val Cys Lys Gly Cys His Arg Thr Asn Phe Ser Asp Asn Ala Ile Arg
100 105 110
Lys Lys Met Ile Pro Val Lys Gly Arg Lys Val Glu Ser Lys Phe Asn
115 120 125
Ile His Asn Thr Thr Lys Lys Ile Ser Gly Thr His Arg His Trp Ala
130 135 140
Phe Glu Asp Ala Ala Asp Ile Ile Glu Ser Met Asp Lys Gln Arg Lys
145 150 155 160
Glu Lys Gln Lys Arg Leu Arg Arg Glu Lys Arg Lys Leu Ser Tyr Phe
165 170 175
Phe Glu Leu Phe Gly Asp Pro Ala Lys Arg Tyr Glu Leu Pro Lys Val
180 185 190
Gly Lys Gln Arg Val Pro Arg Tyr Leu His Lys Ile Ile Asp Lys Asp
195 200 205
Ser Leu Thr Lys Lys Arg Gly Tyr Ser Leu Ser Tyr Ile Lys Asn Lys
210 215 220
Ile Lys Ile Ser Glu Arg Asn Ile Glu Arg Asp Glu Lys Ser Leu Arg
225 230 235 240
Lys Ala Ser Pro Ile Ala Phe Gly Ala Arg Lys Ile Lys Met Ser Lys
245 250 255
Leu Asp Pro Lys Arg Ala Phe Asp Leu Glu Asn Asn Val Phe Lys Ile
260 265 270
Pro Gly Lys Val Ile Lys Gly Gln Tyr Lys Phe Phe Gly Thr Asn Val
275 280 285
Ala Asn Glu His Gly Lys Lys Phe Tyr Lys Asp Arg Ile Ser Lys Ile
290 295 300
Leu Ala Gly Lys Pro Lys Tyr Phe Tyr Leu Leu Arg Lys Lys Val Ala
305 310 315 320
Glu Ser Asp Gly Asn Pro Ile Phe Glu Tyr Tyr Val Gln Trp Ser Ile
325 330 335
Asp Thr Glu Thr Pro Ala Ile Thr Ser Tyr Asp Asn Ile Leu Gly Ile
340 345 350
Asp Ala Gly Ile Thr Asn Leu Ala Thr Thr Val Leu Ile Pro Lys Asn
355 360 365
Leu Ser Ala Glu His Cys Ser His Cys Gly Asn Asn His Val Lys Pro
370 375 380
Ile Phe Thr Lys Phe Phe Ser Gly Lys Glu Leu Lys Ala Ile Lys Ile
385 390 395 400
Lys Ser Arg Lys Gln Lys Tyr Phe Leu Arg Gly Lys His Asn Lys Leu
405 410 415
Val Lys Ile Lys Arg Ile Arg Pro Ile Glu Gln Lys Val Asp Gly Tyr
420 425 430
Cys His Val Val Ser Lys Gln Ile Val Glu Met Ala Lys Glu Arg Asn
435 440 445
Ser Cys Ile Ala Leu Glu Lys Leu Glu Lys Pro Lys Lys Ser Lys Phe
450 455 460
Arg Gln Arg Arg Arg Glu Lys Tyr Ala Val Ser Met Phe Val Phe Lys
465 470 475 480
Lys Leu Ala Thr Phe Ile Lys Tyr Lys Ala Ala Arg Glu Gly Ile Glu
485 490 495
Ile Ile Pro Val Glu Pro Glu Gly Thr Ser Tyr Thr Cys Ser His Cys
500 505 510
Lys Asn Ala Gln Asn Asn Gln Arg Pro Tyr Phe Lys Pro Asn Ser Lys
515 520 525
Lys Ser Trp Thr Ser Met Phe Lys Cys Gly Lys Cys Gly Ile Glu Leu
530 535 540
Asn Ser Asp Tyr Asn Ala Ala Phe Asn Ile Ala Gln Lys Ala Leu Asn
545 550 555 560
Met Thr Ser Ala
<210> 14
<211> 610
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 14
Met Asp Glu Lys His Phe Phe Cys Ser Tyr Cys Asn Lys Glu Leu Lys
1 5 10 15
Ile Ser Lys Asn Leu Ile Asn Lys Ile Ser Lys Gly Ser Ile Arg Glu
20 25 30
Asp Glu Ala Val Ser Lys Ala Ile Ser Ile His Asn Lys Lys Glu His
35 40 45
Ser Leu Ile Leu Gly Ile Lys Phe Lys Leu Phe Ile Glu Asn Lys Leu
50 55 60
Asp Lys Lys Lys Leu Asn Glu Tyr Phe Asp Asn Tyr Ser Lys Ala Val
65 70 75 80
Thr Phe Ala Ala Arg Ile Phe Asp Lys Ile Arg Ser Pro Tyr Lys Phe
85 90 95
Ile Gly Leu Lys Asp Lys Asn Thr Lys Lys Trp Thr Phe Pro Lys Ala
100 105 110
Lys Cys Val Phe Cys Leu Glu Glu Lys Glu Val Ala Tyr Ala Asn Glu
115 120 125
Lys Asp Asn Ser Lys Ile Cys Thr Glu Cys Tyr Leu Lys Glu Phe Gly
130 135 140
Glu Asn Gly Ile Arg Lys Lys Ile Tyr Ser Thr Arg Gly Arg Lys Val
145 150 155 160
Glu Pro Lys Tyr Asn Ile Phe Asn Ser Thr Lys Glu Leu Ser Ser Thr
165 170 175
His Tyr Asn Tyr Ala Ile Arg Asp Ala Phe Gln Leu Leu Asp Ala Leu
180 185 190
Lys Lys Gln Arg Gln Lys Lys Leu Lys Ser Ile Phe Asn Gln Lys Leu
195 200 205
Arg Leu Lys Glu Phe Glu Asp Ile Phe Ser Asp Pro Gln Lys Arg Ile
210 215 220
Glu Leu Ser Leu Lys Pro His Gln Arg Glu Lys Arg Tyr Ile His Leu
225 230 235 240
Ser Lys Ser Gly Gln Glu Ser Ile Asn Arg Gly Tyr Thr Leu Arg Phe
245 250 255
Val Arg Gly Lys Ile Lys Ser Leu Thr Arg Asn Ile Glu Arg Glu Glu
260 265 270
Lys Ser Leu Arg Lys Lys Thr Pro Ile His Phe Lys Gly Asn Arg Leu
275 280 285
Met Ile Phe Pro Ala Gly Ile Lys Phe Asp Phe Ala Ser Asn Lys Val
290 295 300
Lys Ile Ser Ile Ser Lys Asn Leu Pro Asn Glu Phe Asn Phe Ser Gly
305 310 315 320
Thr Asn Val Lys Asn Glu His Gly Lys Ser Phe Phe Lys Ser Arg Ile
325 330 335
Glu Leu Ile Lys Thr Gln Lys Pro Lys Tyr Ala Tyr Val Leu Arg Lys
340 345 350
Ile Lys Arg Glu Tyr Ser Lys Leu Arg Asn Tyr Glu Ile Glu Lys Ile
355 360 365
Arg Leu Glu Asn Pro Asn Ala Asp Leu Cys Asp Phe Tyr Leu Gln Tyr
370 375 380
Thr Ile Glu Thr Glu Ser Arg Asn Asn Glu Glu Ile Asn Gly Ile Ile
385 390 395 400
Gly Ile Asp Arg Gly Ile Thr Asn Leu Ala Cys Leu Val Leu Leu Lys
405 410 415
Lys Gly Asp Lys Lys Pro Ser Gly Val Lys Phe Tyr Lys Gly Asn Lys
420 425 430
Ile Leu Gly Met Lys Ile Ala Tyr Arg Lys His Leu Tyr Leu Leu Lys
435 440 445
Gly Lys Arg Asn Lys Leu Arg Lys Gln Arg Gln Ile Arg Ala Ile Glu
450 455 460
Pro Lys Ile Asn Leu Ile Leu His Gln Ile Ser Lys Asp Ile Val Lys
465 470 475 480
Ile Ala Lys Glu Lys Asn Phe Ala Ile Ala Leu Glu Gln Leu Glu Lys
485 490 495
Pro Lys Lys Ala Arg Phe Ala Gln Arg Lys Lys Glu Lys Tyr Lys Leu
500 505 510
Ala Leu Phe Thr Phe Lys Asn Leu Ser Thr Leu Ile Glu Tyr Lys Ser
515 520 525
Lys Arg Glu Gly Ile Pro Val Ile Tyr Val Pro Pro Glu Lys Thr Ser
530 535 540
Gln Met Cys Ser His Cys Ala Ile Asn Gly Asp Glu His Val Asp Thr
545 550 555 560
Gln Arg Pro Tyr Lys Lys Pro Asn Ala Gln Lys Pro Ser Tyr Ser Leu
565 570 575
Phe Lys Cys Asn Lys Cys Gly Ile Glu Leu Asn Ala Asp Tyr Asn Ala
580 585 590
Ala Phe Asn Ile Ala Gln Lys Gly Leu Lys Thr Leu Met Leu Asn His
595 600 605
Ser His
610
<210> 15
<211> 369
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 15
Met Leu Gln Thr Leu Leu Val Lys Leu Asp Pro Ser Lys Glu Gln Tyr
1 5 10 15
Lys Met Leu Tyr Glu Thr Met Glu Arg Phe Asn Glu Ala Cys Asn Gln
20 25 30
Ile Ala Glu Thr Val Phe Ala Ile His Ser Ala Asn Lys Ile Glu Val
35 40 45
Gln Lys Thr Val Tyr Tyr Pro Ile Arg Glu Lys Phe Gly Leu Ser Ala
50 55 60
Gln Leu Thr Ile Leu Ala Ile Arg Lys Val Cys Glu Ala Tyr Lys Arg
65 70 75 80
Asp Lys Ser Ile Lys Pro Glu Phe Arg Leu Asp Gly Ala Leu Val Tyr
85 90 95
Asp Gln Arg Val Leu Ser Trp Lys Gly Leu Asp Lys Val Ser Leu Val
100 105 110
Thr Leu Gln Gly Arg Gln Ile Ile Pro Ile Lys Phe Gly Asp Tyr Gln
115 120 125
Lys Ala Arg Met Asp Arg Ile Arg Gly Gln Ala Asp Leu Ile Leu Val
130 135 140
Lys Gly Val Phe Tyr Leu Cys Val Val Val Glu Val Ser Glu Glu Ser
145 150 155 160
Pro Tyr Asp Pro Lys Gly Val Leu Gly Val Asp Leu Gly Ile Lys Asn
165 170 175
Leu Ala Val Asp Ser Asp Gly Glu Val His Ser Gly Glu Gln Thr Thr
180 185 190
Asn Thr Arg Glu Arg Leu Asp Ser Leu Lys Ala Arg Leu Gln Ser Lys
195 200 205
Gly Thr Lys Ser Ala Lys Arg His Leu Lys Lys Leu Ser Gly Arg Met
210 215 220
Ala Lys Phe Ser Lys Asp Val Asn His Cys Ile Ser Lys Lys Leu Val
225 230 235 240
Ala Lys Ala Lys Gly Thr Leu Met Ser Ile Ala Leu Glu Asp Leu Gln
245 250 255
Gly Ile Arg Asp Arg Val Thr Val Arg Lys Ala Gln Arg Arg Asn Leu
260 265 270
His Thr Trp Asn Phe Gly Leu Leu Arg Met Phe Val Asp Tyr Lys Ala
275 280 285
Lys Ile Ala Gly Val Pro Leu Val Phe Val Asp Pro Arg Asn Thr Ser
290 295 300
Arg Thr Cys Pro Ser Cys Gly His Val Ala Lys Ala Asn Arg Pro Thr
305 310 315 320
Arg Asp Glu Phe Arg Cys Val Ser Cys Gly Phe Ala Gly Ala Ala Asp
325 330 335
His Ile Ala Ala Met Asn Ile Ala Phe Arg Ala Glu Val Ser Gln Pro
340 345 350
Ile Val Thr Arg Phe Phe Val Gln Ser Gln Ala Pro Ser Phe Arg Val
355 360 365
Gly
<210> 16
<211> 552
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 16
Met Asp Glu Glu Pro Asp Ser Ala Glu Pro Asn Leu Ala Pro Ile Ser
1 5 10 15
Val Lys Leu Lys Leu Val Lys Leu Asp Gly Glu Lys Leu Ala Ala Leu
20 25 30
Asn Asp Tyr Phe Asn Glu Tyr Ala Lys Ala Val Asn Phe Cys Glu Leu
35 40 45
Lys Met Gln Lys Ile Arg Lys Asn Leu Val Asn Ile Arg Gly Thr Tyr
50 55 60
Leu Lys Glu Lys Lys Ala Trp Ile Asn Gln Thr Gly Glu Cys Cys Ile
65 70 75 80
Cys Lys Lys Ile Asp Glu Leu Arg Cys Glu Asp Lys Asn Pro Asp Ile
85 90 95
Asn Gly Lys Ile Cys Lys Lys Cys Tyr Asn Gly Arg Tyr Gly Asn Gln
100 105 110
Met Ile Arg Lys Leu Phe Val Ser Thr Asn Lys Arg Ala Val Pro Lys
115 120 125
Ser Leu Asp Ile Arg Lys Val Ala Arg Leu His Asn Thr His Tyr His
130 135 140
Arg Ile Pro Pro Glu Ala Ala Asp Ile Ile Lys Ala Ile Glu Thr Ala
145 150 155 160
Glu Arg Lys Arg Arg Asn Arg Ile Leu Phe Asp Glu Arg Arg Tyr Asn
165 170 175
Glu Leu Lys Asp Ala Leu Glu Asn Glu Glu Lys Arg Val Ala Arg Pro
180 185 190
Lys Lys Pro Lys Glu Arg Glu Val Arg Tyr Val Pro Ile Ser Lys Lys
195 200 205
Asp Thr Pro Ser Lys Gly Tyr Thr Met Asn Ala Leu Val Arg Lys Val
210 215 220
Ser Gly Met Ala Lys Lys Ile Glu Arg Ala Lys Arg Asn Leu Asn Lys
225 230 235 240
Arg Lys Lys Ile Glu Tyr Leu Gly Arg Arg Ile Leu Leu Asp Lys Asn
245 250 255
Trp Val Arg Phe Asp Phe Asp Lys Ser Glu Ile Ser Ile Pro Thr Met
260 265 270
Lys Glu Phe Phe Gly Glu Met Arg Phe Glu Ile Thr Gly Pro Ser Asn
275 280 285
Val Met Ser Pro Asn Gly Arg Glu Tyr Phe Thr Lys Trp Phe Asp Arg
290 295 300
Ile Lys Ala Gln Pro Asp Asn Tyr Cys Tyr Leu Leu Arg Lys Glu Ser
305 310 315 320
Glu Asp Glu Thr Asp Phe Tyr Leu Gln Tyr Thr Trp Arg Pro Asp Ala
325 330 335
His Pro Lys Lys Asp Tyr Thr Gly Cys Leu Gly Ile Asp Ile Gly Gly
340 345 350
Ser Lys Leu Ala Ser Ala Val Tyr Phe Asp Ala Asp Lys Asn Arg Ala
355 360 365
Lys Gln Pro Ile Gln Ile Phe Ser Asn Pro Ile Gly Lys Trp Lys Thr
370 375 380
Lys Arg Gln Lys Val Ile Lys Val Leu Ser Lys Ala Ala Val Arg His
385 390 395 400
Lys Thr Lys Lys Leu Glu Ser Leu Arg Asn Ile Glu Pro Arg Ile Asp
405 410 415
Val His Cys His Arg Ile Ala Arg Lys Ile Val Gly Met Ala Leu Ala
420 425 430
Ala Asn Ala Phe Ile Ser Met Glu Asn Leu Glu Gly Gly Ile Arg Glu
435 440 445
Lys Gln Lys Ala Lys Glu Thr Lys Lys Gln Lys Phe Ser Arg Asn Met
450 455 460
Phe Val Phe Arg Lys Leu Ser Lys Leu Ile Glu Tyr Lys Ala Leu Met
465 470 475 480
Glu Gly Val Lys Val Val Tyr Ile Val Pro Asp Tyr Thr Ser Gln Leu
485 490 495
Cys Ser Ser Cys Gly Thr Asn Asn Thr Lys Arg Pro Lys Gln Ala Ile
500 505 510
Phe Met Cys Gln Asn Thr Glu Cys Arg Tyr Phe Gly Lys Asn Ile Asn
515 520 525
Ala Asp Phe Asn Ala Ala Ile Asn Ile Ala Lys Lys Ala Leu Asn Arg
530 535 540
Lys Asp Ile Val Arg Glu Leu Ser
545 550
<210> 17
<211> 534
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 17
Met Glu Lys Asn Asn Ser Glu Gln Thr Ser Ile Thr Thr Gly Ile Lys
1 5 10 15
Phe Lys Leu Lys Leu Asp Lys Glu Thr Lys Glu Lys Leu Asn Asn Tyr
20 25 30
Phe Asp Glu Tyr Gly Lys Ala Ile Asn Phe Ala Val Arg Ile Ile Gln
35 40 45
Met Gln Leu Asn Asp Asp Arg Leu Ala Gly Lys Tyr Lys Arg Asp Glu
50 55 60
Lys Gly Lys Pro Ile Leu Gly Glu Asp Gly Lys Lys Ile Leu Glu Ile
65 70 75 80
Pro Asn Asp Phe Cys Ser Cys Gly Asn Gln Val Asn His Tyr Val Asn
85 90 95
Gly Val Ser Phe Cys Gln Glu Cys Tyr Lys Lys Arg Phe Ser Glu Asn
100 105 110
Gly Ile Arg Lys Arg Met Tyr Ser Ala Lys Gly Arg Lys Ala Glu Gln
115 120 125
Asp Ile Asn Ile Lys Asn Ser Thr Asn Lys Ile Ser Lys Thr His Phe
130 135 140
Asn Tyr Ala Ile Arg Glu Ala Phe Asn Leu Asp Lys Ser Ile Lys Lys
145 150 155 160
Gln Arg Glu Lys Arg Phe Lys Lys Leu Lys Asp Met Lys Arg Lys Leu
165 170 175
Gln Glu Phe Leu Glu Ile Arg Asp Gly Lys Arg Val Ile Cys Pro Lys
180 185 190
Ile Glu Lys Gln Lys Val Glu Arg Tyr Ile His Pro Ser Trp Ile Asn
195 200 205
Lys Glu Lys Lys Leu Glu Glu Phe Arg Gly Tyr Ser Leu Ser Ile Val
210 215 220
Asn Ser Lys Ile Lys Ser Phe Asp Arg Asn Ile Gln Arg Glu Glu Lys
225 230 235 240
Ser Leu Lys Glu Lys Gly Gln Ile Asn Phe Lys Ala Gln Arg Leu Met
245 250 255
Leu Asp Lys Ser Val Lys Phe Leu Lys Asp Asn Lys Val Ser Phe Thr
260 265 270
Ile Ser Lys Glu Leu Pro Lys Thr Phe Glu Leu Asp Leu Pro Lys Lys
275 280 285
Glu Lys Lys Leu Asn Trp Leu Asn Glu Lys Leu Glu Ile Ile Lys Asn
290 295 300
Gln Lys Pro Lys Tyr Ala Tyr Leu Leu Arg Lys Glu Asn Asn Ile Phe
305 310 315 320
Leu Gln Tyr Thr Leu Asp Ser Ile Pro Glu Ile His Ser Glu Tyr Ser
325 330 335
Gly Ala Val Gly Ile Asp Arg Gly Val Ser His Ile Ala Val Tyr Thr
340 345 350
Phe Leu Asp Lys Asp Gly Lys Asn Glu Arg Pro Phe Phe Leu Ser Ser
355 360 365
Ser Gly Ile Leu Arg Leu Lys Asn Leu Gln Lys Glu Arg Asp Lys Phe
370 375 380
Leu Arg Lys Lys His Asn Lys Ile Arg Lys Lys Gly Asn Met Arg Asn
385 390 395 400
Ile Glu Gln Lys Ile Asn Leu Ile Leu His Glu Tyr Ser Lys Gln Ile
405 410 415
Val Asn Phe Ala Lys Asp Lys Asn Ala Phe Ile Val Phe Glu Leu Leu
420 425 430
Glu Lys Pro Lys Lys Ser Arg Glu Arg Met Ser Lys Lys Ile Gln Tyr
435 440 445
Lys Leu Ser Gln Phe Thr Phe Lys Lys Leu Ser Asp Leu Val Asp Tyr
450 455 460
Lys Ala Lys Arg Glu Gly Ile Lys Val Ile Tyr Val Glu Pro Ala Tyr
465 470 475 480
Thr Ser Lys Asp Cys Ser His Cys Gly Glu Arg Val Asn Thr Gln Arg
485 490 495
Pro Phe Asn Gly Asn Phe Ser Leu Phe Lys Cys Asn Lys Cys Gly Ile
500 505 510
Val Leu Asn Ser Asp Tyr Asn Ala Ser Leu Asn Ile Ala Arg Lys Gly
515 520 525
Leu Asn Ile Ser Ala Asn
530
<210> 18
<211> 577
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 18
Met Ala Glu Glu Lys Phe Phe Phe Cys Glu Lys Cys Asn Lys Asp Ile
1 5 10 15
Lys Ile Pro Lys Asn Tyr Ile Asn Lys Gln Gly Ala Glu Glu Lys Ala
20 25 30
Arg Ala Lys His Glu His Arg Val His Ala Leu Ile Leu Gly Ile Lys
35 40 45
Phe Lys Ile Tyr Pro Lys Lys Glu Asp Ile Ser Lys Leu Asn Asp Tyr
50 55 60
Phe Asp Glu Tyr Ala Lys Ala Val Thr Phe Thr Ala Lys Ile Val Asp
65 70 75 80
Lys Leu Lys Ala Pro Phe Leu Phe Ala Gly Lys Arg Asp Lys Asp Thr
85 90 95
Ser Lys Lys Lys Trp Val Phe Pro Val Asp Lys Cys Ser Phe Cys Lys
100 105 110
Glu Lys Thr Glu Ile Asn Tyr Arg Thr Lys Gln Gly Lys Asn Ile Cys
115 120 125
Asn Ser Cys Tyr Leu Thr Glu Phe Gly Glu Gln Gly Leu Leu Glu Lys
130 135 140
Ile Tyr Ala Thr Lys Gly Arg Lys Val Ser Ser Ser Phe Asn Leu Phe
145 150 155 160
Asn Ser Thr Lys Lys Leu Thr Gly Thr His Asn Asn Tyr Val Val Lys
165 170 175
Glu Ser Leu Gln Leu Leu Asp Ala Leu Lys Lys Gln Arg Ser Lys Arg
180 185 190
Leu Lys Lys Leu Ser Asn Thr Arg Arg Lys Leu Lys Gln Phe Glu Glu
195 200 205
Met Phe Glu Lys Glu Asp Lys Arg Phe Gln Leu Pro Leu Lys Glu Lys
210 215 220
Gln Arg Glu Leu Arg Phe Ile His Val Ser Gln Lys Asp Arg Ala Thr
225 230 235 240
Glu Phe Lys Gly Tyr Thr Met Asn Lys Ile Lys Ser Lys Ile Lys Val
245 250 255
Leu Arg Arg Asn Ile Glu Arg Glu Gln Arg Ser Leu Asn Arg Lys Ser
260 265 270
Pro Val Phe Phe Arg Gly Thr Arg Ile Arg Leu Ser Pro Ser Val Gln
275 280 285
Phe Asp Asp Lys Asp Asn Lys Ile Lys Leu Thr Leu Ser Lys Glu Leu
290 295 300
Pro Lys Glu Tyr Ser Phe Ser Gly Leu Asn Val Ala Asn Glu His Gly
305 310 315 320
Arg Lys Phe Phe Ala Glu Lys Leu Lys Leu Ile Lys Glu Asn Lys Ser
325 330 335
Lys Tyr Ala Tyr Leu Leu Arg Arg Gln Val Asn Lys Asn Asn Lys Lys
340 345 350
Pro Ile Tyr Asp Tyr Tyr Leu Gln Tyr Thr Val Glu Phe Leu Pro Asn
355 360 365
Ile Ile Thr Asn Tyr Asn Gly Ile Leu Gly Ile Asp Arg Gly Ile Asn
370 375 380
Thr Leu Ala Cys Ile Val Leu Leu Glu Asn Lys Lys Glu Lys Pro Ser
385 390 395 400
Phe Val Lys Phe Phe Ser Gly Lys Gly Ile Leu Asn Leu Lys Asn Lys
405 410 415
Arg Arg Lys Gln Leu Tyr Phe Leu Lys Gly Val His Asn Lys Tyr Arg
420 425 430
Lys Gln Gln Lys Ile Arg Pro Ile Glu Pro Arg Ile Asp Gln Ile Leu
435 440 445
His Asp Ile Ser Lys Gln Ile Ile Asp Leu Ala Lys Glu Lys Arg Val
450 455 460
Ala Ile Ser Leu Glu Gln Leu Glu Lys Pro Gln Lys Pro Lys Phe Arg
465 470 475 480
Gln Ser Arg Lys Ala Lys Tyr Lys Leu Ser Gln Phe Asn Phe Lys Thr
485 490 495
Leu Ser Asn Tyr Ile Asp Tyr Lys Ala Lys Lys Glu Gly Ile Arg Val
500 505 510
Ile Tyr Ile Ala Pro Glu Met Thr Ser Gln Asn Cys Ser Arg Cys Ala
515 520 525
Met Lys Asn Asp Leu His Val Asn Thr Gln Arg Pro Tyr Lys Asn Thr
530 535 540
Ser Ser Leu Phe Lys Cys Asn Lys Cys Gly Val Glu Leu Asn Ala Asp
545 550 555 560
Tyr Asn Ala Ala Phe Asn Ile Ala Gln Lys Gly Leu Lys Ile Leu Asn
565 570 575
Ser
<210> 19
<211> 613
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 19
Met Ile Ser Leu Lys Leu Lys Leu Leu Pro Asp Glu Glu Gln Lys Lys
1 5 10 15
Leu Leu Asp Glu Met Phe Trp Lys Trp Ala Ser Ile Cys Thr Arg Val
20 25 30
Gly Phe Gly Arg Ala Asp Lys Glu Asp Leu Lys Pro Pro Lys Asp Ala
35 40 45
Glu Gly Val Trp Phe Ser Leu Thr Gln Leu Asn Gln Ala Asn Thr Asp
50 55 60
Ile Asn Asp Leu Arg Glu Ala Met Lys His Gln Lys His Arg Leu Glu
65 70 75 80
Tyr Glu Lys Asn Arg Leu Glu Ala Gln Arg Asp Asp Thr Gln Asp Ala
85 90 95
Leu Lys Asn Pro Asp Arg Arg Glu Ile Ser Thr Lys Arg Lys Asp Leu
100 105 110
Phe Arg Pro Lys Ala Ser Val Glu Lys Gly Phe Leu Lys Leu Lys Tyr
115 120 125
His Gln Glu Arg Tyr Trp Val Arg Arg Leu Lys Glu Ile Asn Lys Leu
130 135 140
Ile Glu Arg Lys Thr Lys Thr Leu Ile Lys Ile Glu Lys Gly Arg Ile
145 150 155 160
Lys Phe Lys Ala Thr Arg Ile Thr Leu His Gln Gly Ser Phe Lys Ile
165 170 175
Arg Phe Gly Asp Lys Pro Ala Phe Leu Ile Lys Ala Leu Ser Gly Lys
180 185 190
Asn Gln Ile Asp Ala Pro Phe Val Val Val Pro Glu Gln Pro Ile Cys
195 200 205
Gly Ser Val Val Asn Ser Lys Lys Tyr Leu Asp Glu Ile Thr Thr Asn
210 215 220
Phe Leu Ala Tyr Ser Val Asn Ala Met Leu Phe Gly Leu Ser Arg Ser
225 230 235 240
Glu Glu Met Leu Leu Lys Ala Lys Arg Pro Glu Lys Ile Lys Lys Lys
245 250 255
Glu Glu Lys Leu Ala Lys Lys Gln Ser Ala Phe Glu Asn Lys Lys Lys
260 265 270
Glu Leu Gln Lys Leu Leu Gly Arg Glu Leu Thr Gln Gln Glu Glu Ala
275 280 285
Ile Ile Glu Glu Thr Arg Asn Gln Phe Phe Gln Asp Phe Glu Val Lys
290 295 300
Ile Thr Lys Gln Tyr Ser Glu Leu Leu Ser Lys Ile Ala Asn Glu Leu
305 310 315 320
Lys Gln Lys Asn Asp Phe Leu Lys Val Asn Lys Tyr Pro Ile Leu Leu
325 330 335
Arg Lys Pro Leu Lys Lys Ala Lys Ser Lys Lys Ile Asn Asn Leu Ser
340 345 350
Pro Ser Glu Trp Lys Tyr Tyr Leu Gln Phe Gly Val Lys Pro Leu Leu
355 360 365
Lys Gln Lys Ser Arg Arg Lys Ser Arg Asn Val Leu Gly Ile Asp Arg
370 375 380
Gly Leu Lys His Leu Leu Ala Val Thr Val Leu Glu Pro Asp Lys Lys
385 390 395 400
Thr Phe Val Trp Asn Lys Leu Tyr Pro Asn Pro Ile Thr Gly Trp Lys
405 410 415
Trp Arg Arg Arg Lys Leu Leu Arg Ser Leu Lys Arg Leu Lys Arg Arg
420 425 430
Ile Lys Ser Gln Lys His Glu Thr Ile His Glu Asn Gln Thr Arg Lys
435 440 445
Lys Leu Lys Ser Leu Gln Gly Arg Ile Asp Asp Leu Leu His Asn Ile
450 455 460
Ser Arg Lys Ile Val Glu Thr Ala Lys Glu Tyr Asp Ala Val Ile Val
465 470 475 480
Val Glu Asp Leu Gln Ser Met Arg Gln His Gly Arg Ser Lys Gly Asn
485 490 495
Arg Leu Lys Thr Leu Asn Tyr Ala Leu Ser Leu Phe Asp Tyr Ala Asn
500 505 510
Val Met Gln Leu Ile Lys Tyr Lys Ala Gly Ile Glu Gly Ile Gln Ile
515 520 525
Tyr Asp Val Lys Pro Ala Gly Thr Ser Gln Asn Cys Ala Tyr Cys Leu
530 535 540
Leu Ala Gln Arg Asp Ser His Glu Tyr Lys Arg Ser Gln Glu Asn Ser
545 550 555 560
Lys Ile Gly Val Cys Leu Asn Pro Asn Cys Gln Asn His Lys Lys Gln
565 570 575
Ile Asp Ala Asp Leu Asn Ala Ala Arg Val Ile Ala Ser Cys Tyr Ala
580 585 590
Leu Lys Ile Asn Asp Ser Gln Pro Phe Gly Thr Arg Lys Arg Phe Lys
595 600 605
Lys Arg Thr Thr Asn
610
<210> 20
<211> 615
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 20
Met Glu Thr Leu Ser Leu Lys Leu Lys Leu Asn Pro Ser Lys Glu Gln
1 5 10 15
Leu Leu Val Leu Asp Lys Met Phe Trp Lys Trp Ala Ser Ile Cys Thr
20 25 30
Arg Leu Gly Leu Lys Lys Ala Glu Met Ser Asp Leu Glu Pro Pro Lys
35 40 45
Asp Ala Glu Gly Val Trp Phe Ser Lys Thr Gln Leu Asn Gln Ala Asn
50 55 60
Thr Asp Val Asn Asp Leu Arg Lys Ala Met Gln His Gln Gly Lys Arg
65 70 75 80
Ile Glu Tyr Glu Leu Asp Lys Val Glu Asn Arg Arg Asn Glu Ile Gln
85 90 95
Glu Met Leu Glu Lys Pro Asp Arg Arg Asp Ile Ser Pro Asn Arg Lys
100 105 110
Asp Leu Phe Arg Pro Lys Ala Ala Val Glu Lys Gly Tyr Leu Lys Leu
115 120 125
Lys Tyr His Lys Leu Gly Tyr Trp Ser Lys Glu Leu Lys Thr Ala Asn
130 135 140
Lys Leu Ile Glu Arg Lys Arg Lys Thr Leu Ala Lys Ile Asp Ala Gly
145 150 155 160
Lys Met Lys Phe Lys Pro Thr Arg Ile Ser Leu His Thr Asn Ser Phe
165 170 175
Arg Ile Lys Phe Gly Glu Glu Pro Lys Ile Ala Leu Ser Thr Thr Ser
180 185 190
Lys His Glu Lys Ile Glu Leu Pro Leu Ile Thr Ser Leu Gln Arg Pro
195 200 205
Leu Lys Thr Ser Cys Ala Lys Lys Ser Lys Thr Tyr Leu Asp Ala Ala
210 215 220
Ile Leu Asn Phe Leu Ala Tyr Ser Thr Asn Ala Ala Leu Phe Gly Leu
225 230 235 240
Ser Arg Ser Glu Glu Met Leu Leu Lys Ala Lys Lys Pro Glu Lys Ile
245 250 255
Glu Lys Arg Asp Arg Lys Leu Ala Thr Lys Arg Glu Ser Phe Asp Lys
260 265 270
Lys Leu Lys Thr Leu Glu Lys Leu Leu Glu Arg Lys Leu Ser Glu Lys
275 280 285
Glu Lys Ser Val Phe Lys Arg Lys Gln Thr Glu Phe Phe Asp Lys Phe
290 295 300
Cys Ile Thr Leu Asp Glu Thr Tyr Val Glu Ala Leu His Arg Ile Ala
305 310 315 320
Glu Glu Leu Val Ser Lys Asn Lys Tyr Leu Glu Ile Lys Lys Tyr Pro
325 330 335
Val Leu Leu Arg Lys Pro Glu Ser Arg Leu Arg Ser Lys Lys Leu Lys
340 345 350
Asn Leu Lys Pro Glu Asp Trp Thr Tyr Tyr Ile Gln Phe Gly Phe Gln
355 360 365
Pro Leu Leu Asp Thr Pro Lys Pro Ile Lys Thr Lys Thr Val Leu Gly
370 375 380
Ile Asp Arg Gly Val Arg His Leu Leu Ala Val Ser Ile Phe Asp Pro
385 390 395 400
Arg Thr Lys Thr Phe Thr Phe Asn Arg Leu Tyr Ser Asn Pro Ile Val
405 410 415
Asp Trp Lys Trp Arg Arg Arg Lys Leu Leu Arg Ser Ile Lys Arg Leu
420 425 430
Lys Arg Arg Leu Lys Ser Glu Lys His Val His Leu His Glu Asn Gln
435 440 445
Phe Lys Ala Lys Leu Arg Ser Leu Glu Gly Arg Ile Glu Asp His Phe
450 455 460
His Asn Leu Ser Lys Glu Ile Val Asp Leu Ala Lys Glu Asn Asn Ser
465 470 475 480
Val Ile Val Val Glu Asn Leu Gly Gly Met Arg Gln His Gly Arg Gly
485 490 495
Arg Gly Lys Trp Leu Lys Ala Leu Asn Tyr Ala Leu Ser His Phe Asp
500 505 510
Tyr Ala Lys Val Met Gln Leu Ile Lys Tyr Lys Ala Glu Leu Ala Gly
515 520 525
Val Phe Val Tyr Asp Val Ala Pro Ala Gly Thr Ser Ile Asn Cys Ala
530 535 540
Tyr Cys Leu Leu Asn Asp Lys Asp Ala Ser Asn Tyr Thr Arg Gly Lys
545 550 555 560
Val Ile Asn Gly Lys Lys Asn Thr Lys Ile Gly Glu Cys Lys Thr Cys
565 570 575
Lys Lys Glu Phe Asp Ala Asp Leu Asn Ala Ala Arg Val Ile Ala Leu
580 585 590
Cys Tyr Glu Lys Arg Leu Asn Asp Pro Gln Pro Phe Gly Thr Arg Lys
595 600 605
Gln Phe Lys Pro Lys Lys Pro
610 615
<210> 21
<211> 775
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 21
Met Lys Ala Leu Lys Leu Gln Leu Ile Pro Thr Arg Lys Gln Tyr Lys
1 5 10 15
Ile Leu Asp Glu Met Phe Trp Lys Trp Ala Ser Leu Ala Asn Arg Val
20 25 30
Ser Gln Lys Gly Glu Ser Lys Glu Thr Leu Ala Pro Lys Lys Asp Ile
35 40 45
Gln Lys Ile Gln Phe Asn Ala Thr Gln Leu Asn Gln Ile Glu Lys Asp
50 55 60
Ile Lys Asp Leu Arg Gly Ala Met Lys Glu Gln Gln Lys Gln Lys Glu
65 70 75 80
Arg Leu Leu Leu Gln Ile Gln Glu Arg Arg Ser Thr Ile Ser Glu Met
85 90 95
Leu Asn Asp Asp Asn Asn Lys Glu Arg Asp Pro His Arg Pro Leu Asn
100 105 110
Phe Arg Pro Lys Gly Trp Arg Lys Phe His Thr Ser Lys His Trp Val
115 120 125
Gly Glu Leu Ser Lys Ile Leu Arg Gln Glu Asp Arg Val Lys Lys Thr
130 135 140
Ile Glu Arg Ile Val Ala Gly Lys Ile Ser Phe Lys Pro Lys Arg Ile
145 150 155 160
Gly Ile Trp Ser Ser Asn Tyr Lys Ile Asn Phe Phe Lys Arg Lys Ile
165 170 175
Ser Ile Asn Pro Leu Asn Ser Lys Gly Phe Glu Leu Thr Leu Met Thr
180 185 190
Glu Pro Thr Gln Asp Leu Ile Gly Lys Asn Gly Gly Lys Ser Val Leu
195 200 205
Asn Asn Lys Arg Tyr Leu Asp Asp Ser Ile Lys Ser Leu Leu Met Phe
210 215 220
Ala Leu His Ser Arg Phe Phe Gly Leu Asn Asn Thr Asp Thr Tyr Leu
225 230 235 240
Leu Gly Gly Lys Ile Asn Pro Ser Leu Val Lys Tyr Tyr Lys Lys Asn
245 250 255
Gln Asp Met Gly Glu Phe Gly Arg Glu Ile Val Glu Lys Phe Glu Arg
260 265 270
Lys Leu Lys Gln Glu Ile Asn Glu Gln Gln Lys Lys Ile Ile Met Ser
275 280 285
Gln Ile Lys Glu Gln Tyr Ser Asn Arg Asp Ser Ala Phe Asn Lys Asp
290 295 300
Tyr Leu Gly Leu Ile Asn Glu Phe Ser Glu Val Phe Asn Gln Arg Lys
305 310 315 320
Ser Glu Arg Ala Glu Tyr Leu Leu Asp Ser Phe Glu Asp Lys Ile Lys
325 330 335
Gln Ile Lys Gln Glu Ile Gly Glu Ser Leu Asn Ile Ser Asp Trp Asp
340 345 350
Phe Leu Ile Asp Glu Ala Lys Lys Ala Tyr Gly Tyr Glu Glu Gly Phe
355 360 365
Thr Glu Tyr Val Tyr Ser Lys Arg Tyr Leu Glu Ile Leu Asn Lys Ile
370 375 380
Val Lys Ala Val Leu Ile Thr Asp Ile Tyr Phe Asp Leu Arg Lys Tyr
385 390 395 400
Pro Ile Leu Leu Arg Lys Pro Leu Asp Lys Ile Lys Lys Ile Ser Asn
405 410 415
Leu Lys Pro Asp Glu Trp Ser Tyr Tyr Ile Gln Phe Gly Tyr Asp Ser
420 425 430
Ile Asn Pro Val Gln Leu Met Ser Thr Asp Lys Phe Leu Gly Ile Asp
435 440 445
Arg Gly Leu Thr His Leu Leu Ala Tyr Ser Val Phe Asp Lys Glu Lys
450 455 460
Lys Glu Phe Ile Ile Asn Gln Leu Glu Pro Asn Pro Ile Met Gly Trp
465 470 475 480
Lys Trp Lys Leu Arg Lys Val Lys Arg Ser Leu Gln His Leu Glu Arg
485 490 495
Arg Ile Arg Ala Gln Lys Met Val Lys Leu Pro Glu Asn Gln Met Lys
500 505 510
Lys Lys Leu Lys Ser Ile Glu Pro Lys Ile Glu Val His Tyr His Asn
515 520 525
Ile Ser Arg Lys Ile Val Asn Leu Ala Lys Asp Tyr Asn Ala Ser Ile
530 535 540
Val Val Glu Ser Leu Glu Gly Gly Gly Leu Lys Gln His Gly Arg Lys
545 550 555 560
Lys Asn Ala Arg Asn Arg Ser Leu Asn Tyr Ala Leu Ser Leu Phe Asp
565 570 575
Tyr Gly Lys Ile Ala Ser Leu Ile Lys Tyr Lys Ala Asp Leu Glu Gly
580 585 590
Val Pro Met Tyr Glu Val Leu Pro Ala Tyr Thr Ser Gln Gln Cys Ala
595 600 605
Lys Cys Val Leu Glu Lys Gly Ser Phe Val Asp Pro Glu Ile Ile Gly
610 615 620
Tyr Val Glu Asp Ile Gly Ile Lys Gly Ser Leu Leu Asp Ser Leu Phe
625 630 635 640
Glu Gly Thr Glu Leu Ser Ser Ile Gln Val Leu Lys Lys Ile Lys Asn
645 650 655
Lys Ile Glu Leu Ser Ala Arg Asp Asn His Asn Lys Glu Ile Asn Leu
660 665 670
Ile Leu Lys Tyr Asn Phe Lys Gly Leu Val Ile Val Arg Gly Gln Asp
675 680 685
Lys Glu Glu Ile Ala Glu His Pro Ile Lys Glu Ile Asn Gly Lys Phe
690 695 700
Ala Ile Leu Asp Phe Val Tyr Lys Arg Gly Lys Glu Lys Val Gly Lys
705 710 715 720
Lys Gly Asn Gln Lys Val Arg Tyr Thr Gly Asn Lys Lys Val Gly Tyr
725 730 735
Cys Ser Lys His Gly Gln Val Asp Ala Asp Leu Asn Ala Ser Arg Val
740 745 750
Ile Ala Leu Cys Lys Tyr Leu Asp Ile Asn Asp Pro Ile Leu Phe Gly
755 760 765
Glu Gln Arg Lys Ser Phe Lys
770 775
<210> 22
<211> 777
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 22
Met Val Thr Arg Ala Ile Lys Leu Lys Leu Asp Pro Thr Lys Asn Gln
1 5 10 15
Tyr Lys Leu Leu Asn Glu Met Phe Trp Lys Trp Ala Ser Leu Ala Asn
20 25 30
Arg Phe Ser Gln Lys Gly Ala Ser Lys Glu Thr Leu Ala Pro Lys Asp
35 40 45
Gly Thr Gln Lys Ile Gln Phe Asn Ala Thr Gln Leu Asn Gln Ile Lys
50 55 60
Lys Asp Val Asp Asp Leu Arg Gly Ala Met Glu Lys Gln Gly Lys Gln
65 70 75 80
Lys Glu Arg Leu Leu Ile Gln Ile Gln Glu Arg Leu Leu Thr Ile Ser
85 90 95
Glu Ile Leu Arg Asp Asp Ser Lys Lys Glu Lys Asp Pro His Arg Pro
100 105 110
Gln Asn Phe Arg Pro Phe Gly Trp Arg Arg Phe His Thr Ser Ala Tyr
115 120 125
Trp Ser Ser Glu Ala Ser Lys Leu Thr Arg Gln Val Asp Arg Val Arg
130 135 140
Arg Thr Ile Glu Arg Ile Lys Ala Gly Lys Ile Asn Phe Lys Pro Lys
145 150 155 160
Arg Ile Gly Leu Trp Ser Ser Thr Tyr Lys Ile Asn Phe Leu Lys Lys
165 170 175
Lys Ile Asn Ile Ser Pro Leu Lys Ser Lys Ser Phe Glu Leu Asp Leu
180 185 190
Ile Thr Glu Pro Gln Gln Lys Ile Ile Gly Lys Glu Gly Gly Lys Ser
195 200 205
Val Ala Asn Ser Lys Lys Tyr Leu Asp Asp Ser Ile Lys Ser Leu Leu
210 215 220
Ile Phe Ala Ile Lys Ser Arg Leu Phe Gly Leu Asn Asn Lys Asp Lys
225 230 235 240
Pro Leu Phe Glu Asn Ile Ile Thr Pro Asn Leu Val Arg Tyr His Lys
245 250 255
Lys Gly Gln Glu Gln Glu Asn Phe Lys Lys Glu Val Ile Lys Lys Phe
260 265 270
Glu Asn Lys Leu Lys Lys Glu Ile Ser Gln Lys Gln Lys Glu Ile Ile
275 280 285
Phe Ser Gln Ile Glu Arg Gln Tyr Glu Asn Arg Asp Ala Thr Phe Ser
290 295 300
Glu Asp Tyr Leu Arg Ala Ile Ser Glu Phe Ser Glu Ile Phe Asn Gln
305 310 315 320
Arg Lys Lys Glu Arg Ala Lys Glu Leu Leu Asn Ser Phe Asn Glu Lys
325 330 335
Ile Arg Gln Leu Lys Lys Glu Val Asn Gly Asn Ile Ser Glu Glu Asp
340 345 350
Leu Lys Ile Leu Glu Val Glu Ala Glu Lys Ala Tyr Asn Tyr Glu Asn
355 360 365
Gly Phe Ile Glu Trp Glu Tyr Ser Glu Gln Phe Leu Gly Val Leu Glu
370 375 380
Lys Ile Ala Arg Ala Val Leu Ile Ser Asp Asn Tyr Phe Asp Leu Lys
385 390 395 400
Lys Tyr Pro Ile Leu Ile Arg Lys Pro Thr Asn Lys Ser Lys Lys Ile
405 410 415
Thr Asn Leu Lys Pro Glu Glu Trp Asp Tyr Tyr Ile Gln Phe Gly Tyr
420 425 430
Gly Leu Ile Asn Ser Pro Met Lys Ile Glu Thr Lys Asn Phe Met Gly
435 440 445
Ile Asp Arg Gly Leu Thr His Leu Leu Ala Tyr Ser Ile Phe Asp Arg
450 455 460
Asp Ser Glu Lys Phe Thr Ile Asn Gln Leu Glu Leu Asn Pro Ile Lys
465 470 475 480
Gly Trp Lys Trp Lys Leu Arg Lys Val Lys Arg Ser Leu Gln His Leu
485 490 495
Glu Arg Arg Met Arg Ala Gln Lys Gly Val Lys Leu Pro Glu Asn Gln
500 505 510
Met Lys Lys Arg Leu Lys Ser Ile Glu Pro Lys Ile Glu Ser Tyr Tyr
515 520 525
His Asn Leu Ser Arg Lys Ile Val Asn Leu Ala Lys Ala Asn Asn Ala
530 535 540
Ser Ile Val Val Glu Ser Leu Glu Gly Gly Gly Leu Lys Gln His Gly
545 550 555 560
Arg Lys Lys Asn Ser Arg His Arg Ala Leu Asn Tyr Ala Leu Ser Leu
565 570 575
Phe Asp Tyr Gly Lys Ile Ala Ser Leu Ile Lys Tyr Lys Ser Asp Leu
580 585 590
Glu Gly Val Pro Met Tyr Glu Val Leu Pro Ala Tyr Thr Ser Gln Gln
595 600 605
Cys Ala Lys Cys Val Leu Lys Lys Gly Ser Phe Val Glu Pro Glu Ile
610 615 620
Ile Gly Tyr Ile Glu Glu Ile Gly Phe Lys Glu Asn Leu Leu Thr Leu
625 630 635 640
Leu Phe Glu Asp Thr Gly Leu Ser Ser Val Gln Val Leu Lys Lys Ser
645 650 655
Lys Asn Lys Met Thr Leu Ser Ala Arg Asp Lys Glu Gly Lys Met Val
660 665 670
Asp Leu Val Leu Lys Tyr Asn Phe Lys Gly Leu Val Ile Ser Gln Glu
675 680 685
Lys Lys Lys Glu Glu Ile Val Glu Phe Pro Ile Lys Glu Ile Asp Gly
690 695 700
Lys Phe Ala Val Leu Asp Ser Ala Tyr Lys Arg Gly Lys Glu Arg Ile
705 710 715 720
Ser Lys Lys Gly Asn Gln Lys Leu Val Tyr Thr Gly Asn Lys Lys Val
725 730 735
Gly Tyr Cys Ser Val His Gly Gln Val Asp Ala Asp Leu Asn Ala Ser
740 745 750
Arg Val Ile Ala Leu Cys Lys Tyr Leu Gly Ile Asn Glu Pro Ile Val
755 760 765
Phe Gly Glu Gln Arg Lys Ser Phe Lys
770 775
<210> 23
<211> 610
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 23
Leu Asp Leu Ile Thr Glu Pro Ile Gln Pro His Lys Ser Ser Ser Leu
1 5 10 15
Arg Ser Lys Glu Phe Leu Glu Tyr Gln Ile Ser Asp Phe Leu Asn Phe
20 25 30
Ser Leu His Ser Leu Phe Phe Gly Leu Ala Ser Asn Glu Gly Pro Leu
35 40 45
Val Asp Phe Lys Ile Tyr Asp Lys Ile Val Ile Pro Lys Pro Glu Glu
50 55 60
Arg Phe Pro Lys Lys Glu Ser Glu Glu Gly Lys Lys Leu Asp Ser Phe
65 70 75 80
Asp Lys Arg Val Glu Glu Tyr Tyr Ser Asp Lys Leu Glu Lys Lys Ile
85 90 95
Glu Arg Lys Leu Asn Thr Glu Glu Lys Asn Val Ile Asp Arg Glu Lys
100 105 110
Thr Arg Ile Trp Gly Glu Val Asn Lys Leu Glu Glu Ile Arg Ser Ile
115 120 125
Ile Asp Glu Ile Asn Glu Ile Lys Lys Gln Lys His Ile Ser Glu Lys
130 135 140
Ser Lys Leu Leu Gly Glu Lys Trp Lys Lys Val Asn Asn Ile Gln Glu
145 150 155 160
Thr Leu Leu Ser Gln Glu Tyr Val Ser Leu Ile Ser Asn Leu Ser Asp
165 170 175
Glu Leu Thr Asn Lys Lys Lys Glu Leu Leu Ala Lys Lys Tyr Ser Lys
180 185 190
Phe Asp Asp Lys Ile Lys Lys Ile Lys Glu Asp Tyr Gly Leu Glu Phe
195 200 205
Asp Glu Asn Thr Ile Lys Lys Glu Gly Glu Lys Ala Phe Leu Asn Pro
210 215 220
Asp Lys Phe Ser Lys Tyr Gln Phe Ser Ser Ser Tyr Leu Lys Leu Ile
225 230 235 240
Gly Glu Ile Ala Arg Ser Leu Ile Thr Tyr Lys Gly Phe Leu Asp Leu
245 250 255
Asn Lys Tyr Pro Ile Ile Phe Arg Lys Pro Ile Asn Lys Val Lys Lys
260 265 270
Ile His Asn Leu Glu Pro Asp Glu Trp Lys Tyr Tyr Ile Gln Phe Gly
275 280 285
Tyr Glu Gln Ile Asn Asn Pro Lys Leu Glu Thr Glu Asn Ile Leu Gly
290 295 300
Ile Asp Arg Gly Leu Thr His Ile Leu Ala Tyr Ser Val Phe Glu Pro
305 310 315 320
Arg Ser Ser Lys Phe Ile Leu Asn Lys Leu Glu Pro Asn Pro Ile Glu
325 330 335
Gly Trp Lys Trp Lys Leu Arg Lys Leu Arg Arg Ser Ile Gln Asn Leu
340 345 350
Glu Arg Arg Trp Arg Ala Gln Asp Asn Val Lys Leu Pro Glu Asn Gln
355 360 365
Met Lys Lys Asn Leu Arg Ser Ile Glu Asp Lys Val Glu Asn Leu Tyr
370 375 380
His Asn Leu Ser Arg Lys Ile Val Asp Leu Ala Lys Glu Lys Asn Ala
385 390 395 400
Cys Ile Val Phe Glu Lys Leu Glu Gly Gln Gly Met Lys Gln His Gly
405 410 415
Arg Lys Lys Ser Asp Arg Leu Arg Gly Leu Asn Tyr Lys Leu Ser Leu
420 425 430
Phe Asp Tyr Gly Lys Ile Ala Lys Leu Ile Lys Tyr Lys Ala Glu Ile
435 440 445
Glu Gly Ile Pro Ile Tyr Arg Ile Asp Ser Ala Tyr Thr Ser Gln Asn
450 455 460
Cys Ala Lys Cys Val Leu Glu Ser Arg Arg Phe Ala Gln Pro Glu Glu
465 470 475 480
Ile Ser Cys Leu Asp Asp Phe Lys Glu Gly Asp Asn Leu Asp Lys Arg
485 490 495
Ile Leu Glu Gly Thr Gly Leu Val Glu Ala Lys Ile Tyr Lys Lys Leu
500 505 510
Leu Lys Glu Lys Lys Glu Asp Phe Glu Ile Glu Glu Asp Ile Ala Met
515 520 525
Phe Asp Thr Lys Lys Val Ile Lys Glu Asn Lys Glu Lys Thr Val Ile
530 535 540
Leu Asp Tyr Val Tyr Thr Arg Arg Lys Glu Ile Ile Gly Thr Asn His
545 550 555 560
Lys Lys Asn Ile Lys Gly Ile Ala Lys Tyr Thr Gly Asn Thr Lys Ile
565 570 575
Gly Tyr Cys Met Lys His Gly Gln Val Asp Ala Asp Leu Asn Ala Ser
580 585 590
Arg Thr Ile Ala Leu Cys Lys Asn Phe Asp Ile Asn Asn Pro Glu Ile
595 600 605
Trp Lys
610
<210> 24
<211> 632
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 24
Met Ser Asp Glu Ser Leu Val Ser Ser Glu Asp Lys Leu Ala Ile Lys
1 5 10 15
Ile Lys Ile Val Pro Asn Ala Glu Gln Ala Lys Met Leu Asp Glu Met
20 25 30
Phe Lys Lys Trp Ser Ser Ile Cys Asn Arg Ile Ser Arg Gly Lys Glu
35 40 45
Asp Ile Glu Thr Leu Arg Pro Asp Glu Gly Lys Glu Leu Gln Phe Asn
50 55 60
Ser Thr Gln Leu Asn Ser Ala Thr Met Asp Val Ser Asp Leu Lys Lys
65 70 75 80
Ala Met Ala Arg Gln Gly Glu Arg Leu Glu Ala Glu Val Ser Lys Leu
85 90 95
Arg Gly Arg Tyr Glu Thr Ile Asp Ala Ser Leu Arg Asp Pro Ser Arg
100 105 110
Arg His Thr Asn Pro Gln Lys Pro Ser Ser Phe Tyr Pro Ser Asp Trp
115 120 125
Asp Ile Ser Gly Arg Leu Thr Pro Arg Phe His Thr Ala Arg His Tyr
130 135 140
Ser Thr Glu Leu Arg Lys Leu Lys Ala Lys Glu Asp Lys Met Leu Lys
145 150 155 160
Thr Ile Asn Lys Ile Lys Asn Gly Lys Ile Val Phe Lys Pro Lys Arg
165 170 175
Ile Thr Leu Trp Pro Ser Ser Val Asn Met Ala Phe Lys Gly Ser Arg
180 185 190
Leu Leu Leu Lys Pro Phe Ala Asn Gly Phe Glu Met Glu Leu Pro Ile
195 200 205
Val Ile Ser Pro Gln Lys Thr Ala Asp Gly Lys Ser Gln Lys Ala Ser
210 215 220
Ala Glu Tyr Met Arg Asn Ala Leu Leu Gly Leu Ala Gly Tyr Ser Ile
225 230 235 240
Asn Gln Leu Leu Phe Gly Met Asn Arg Ser Gln Lys Met Leu Ala Asn
245 250 255
Ala Lys Lys Pro Glu Lys Val Glu Lys Phe Leu Glu Gln Met Lys Asn
260 265 270
Lys Asp Ala Asn Phe Asp Lys Lys Ile Lys Ala Leu Glu Gly Lys Trp
275 280 285
Leu Leu Asp Arg Lys Leu Lys Glu Ser Glu Lys Ser Ser Ile Ala Val
290 295 300
Val Arg Thr Lys Phe Phe Lys Ser Gly Lys Val Glu Leu Asn Glu Asp
305 310 315 320
Tyr Leu Lys Leu Leu Lys His Met Ala Asn Glu Ile Leu Glu Arg Asp
325 330 335
Gly Phe Val Asn Leu Asn Lys Tyr Pro Ile Leu Ser Arg Lys Pro Met
340 345 350
Lys Arg Tyr Lys Gln Lys Asn Ile Asp Asn Leu Lys Pro Asn Met Trp
355 360 365
Lys Tyr Tyr Ile Gln Phe Gly Tyr Glu Pro Ile Phe Glu Arg Lys Ala
370 375 380
Ser Gly Lys Pro Lys Asn Ile Met Gly Ile Asp Arg Gly Leu Thr His
385 390 395 400
Leu Leu Ala Val Ala Val Phe Ser Pro Asp Gln Gln Lys Phe Leu Phe
405 410 415
Asn His Leu Glu Ser Asn Pro Ile Met His Trp Lys Trp Lys Leu Arg
420 425 430
Lys Ile Arg Arg Ser Ile Gln His Met Glu Arg Arg Ile Arg Ala Glu
435 440 445
Lys Asn Lys His Ile His Glu Ala Gln Leu Lys Lys Arg Leu Gly Ser
450 455 460
Ile Glu Glu Lys Thr Glu Gln His Tyr His Ile Val Ser Ser Lys Ile
465 470 475 480
Ile Asn Trp Ala Ile Glu Tyr Glu Ala Ala Ile Val Leu Glu Ser Leu
485 490 495
Ser His Met Lys Gln Arg Gly Gly Lys Lys Ser Val Arg Thr Arg Ala
500 505 510
Leu Asn Tyr Ala Leu Ser Leu Phe Asp Tyr Glu Lys Val Ala Arg Leu
515 520 525
Ile Thr Tyr Lys Ala Arg Ile Arg Gly Ile Pro Val Tyr Asp Val Leu
530 535 540
Pro Gly Met Thr Ser Lys Thr Cys Ala Thr Cys Leu Leu Asn Gly Ser
545 550 555 560
Gln Gly Ala Tyr Val Arg Gly Leu Glu Thr Thr Lys Ala Ala Gly Lys
565 570 575
Ala Thr Lys Arg Lys Asn Met Lys Ile Gly Lys Cys Met Val Cys Asn
580 585 590
Ser Ser Glu Asn Ser Met Ile Asp Ala Asp Leu Asn Ala Ala Arg Val
595 600 605
Ile Ala Ile Cys Lys Tyr Lys Asn Leu Asn Asp Pro Gln Pro Ala Gly
610 615 620
Ser Arg Lys Val Phe Lys Arg Phe
625 630
<210> 25
<211> 625
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 25
Met Leu Ala Leu Lys Leu Lys Ile Met Pro Thr Glu Lys Gln Ala Glu
1 5 10 15
Ile Leu Asp Ala Met Phe Trp Lys Trp Ala Ser Ile Cys Ser Arg Ile
20 25 30
Ala Lys Met Lys Lys Lys Val Ser Val Lys Glu Asn Lys Lys Glu Leu
35 40 45
Ser Lys Lys Ile Pro Ser Asn Ser Asp Ile Trp Phe Ser Lys Thr Gln
50 55 60
Leu Cys Gln Ala Glu Val Asp Val Gly Asp His Lys Lys Ala Leu Lys
65 70 75 80
Asn Phe Glu Lys Arg Gln Glu Ser Leu Leu Asp Glu Leu Lys Tyr Lys
85 90 95
Val Lys Ala Ile Asn Glu Val Ile Asn Asp Glu Ser Lys Arg Glu Ile
100 105 110
Asp Pro Asn Asn Pro Ser Lys Phe Arg Ile Lys Asp Ser Thr Lys Lys
115 120 125
Gly Asn Leu Asn Ser Pro Lys Phe Phe Thr Leu Lys Lys Trp Gln Lys
130 135 140
Ile Leu Gln Glu Asn Glu Lys Arg Ile Lys Lys Lys Glu Ser Thr Ile
145 150 155 160
Glu Lys Leu Lys Arg Gly Asn Ile Phe Phe Asn Pro Thr Lys Ile Ser
165 170 175
Leu His Glu Glu Glu Tyr Ser Ile Asn Phe Gly Ser Ser Lys Leu Leu
180 185 190
Leu Asn Cys Phe Tyr Lys Tyr Asn Lys Lys Ser Gly Ile Asn Ser Asp
195 200 205
Gln Leu Glu Asn Lys Phe Asn Glu Phe Gln Asn Gly Leu Asn Ile Ile
210 215 220
Cys Ser Pro Leu Gln Pro Ile Arg Gly Ser Ser Lys Arg Ser Phe Glu
225 230 235 240
Phe Ile Arg Asn Ser Ile Ile Asn Phe Leu Met Tyr Ser Leu Tyr Ala
245 250 255
Lys Leu Phe Gly Ile Pro Arg Ser Val Lys Ala Leu Met Lys Ser Asn
260 265 270
Lys Asp Glu Asn Lys Leu Lys Leu Glu Glu Lys Leu Lys Lys Lys Lys
275 280 285
Ser Ser Phe Asn Lys Thr Val Lys Glu Phe Glu Lys Met Ile Gly Arg
290 295 300
Lys Leu Ser Asp Asn Glu Ser Lys Ile Leu Asn Asp Glu Ser Lys Lys
305 310 315 320
Phe Phe Glu Ile Ile Lys Ser Asn Asn Lys Tyr Ile Pro Ser Glu Glu
325 330 335
Tyr Leu Lys Leu Leu Lys Asp Ile Ser Glu Glu Ile Tyr Asn Ser Asn
340 345 350
Ile Asp Phe Lys Pro Tyr Lys Tyr Ser Ile Leu Ile Arg Lys Pro Leu
355 360 365
Ser Lys Phe Lys Ser Lys Lys Leu Tyr Asn Leu Lys Pro Thr Asp Tyr
370 375 380
Lys Tyr Tyr Leu Gln Leu Ser Tyr Glu Pro Phe Ser Lys Gln Leu Ile
385 390 395 400
Ala Thr Lys Thr Ile Leu Gly Ile Asp Arg Gly Leu Lys His Leu Leu
405 410 415
Ala Val Ser Val Phe Asp Pro Ser Gln Asn Lys Phe Val Tyr Asn Lys
420 425 430
Leu Ile Lys Asn Pro Val Phe Lys Trp Lys Lys Arg Tyr His Asp Leu
435 440 445
Lys Arg Ser Ile Arg Asn Arg Glu Arg Arg Ile Arg Ala Leu Thr Gly
450 455 460
Val His Ile His Glu Asn Gln Leu Ile Lys Lys Leu Lys Ser Met Lys
465 470 475 480
Asn Lys Ile Asn Val Leu Tyr His Asn Val Ser Lys Asn Ile Val Asp
485 490 495
Leu Ala Lys Lys Tyr Glu Ser Thr Ile Val Leu Glu Arg Leu Glu Asn
500 505 510
Leu Lys Gln His Gly Arg Ser Lys Gly Lys Arg Tyr Lys Lys Leu Asn
515 520 525
Tyr Val Leu Ser Asn Phe Asp Tyr Lys Lys Ile Glu Ser Leu Ile Ser
530 535 540
Tyr Lys Ala Lys Lys Glu Gly Val Pro Val Ser Asn Ile Asn Pro Lys
545 550 555 560
Tyr Thr Ser Lys Thr Cys Ala Lys Cys Leu Leu Glu Val Asn Gln Leu
565 570 575
Ser Glu Leu Lys Asn Glu Tyr Asn Arg Asp Ser Lys Asn Ser Lys Ile
580 585 590
Gly Ile Cys Asn Ile His Gly Gln Ile Asp Ala Asp Leu Asn Ala Ala
595 600 605
Arg Val Ile Ala Leu Cys Tyr Ser Lys Asn Leu Asn Glu Pro His Phe
610 615 620
Lys
625
<210> 26
<211> 517
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 26
Val Ile Asn Leu Phe Gly Tyr Lys Phe Ala Leu Tyr Pro Asn Lys Thr
1 5 10 15
Gln Glu Glu Leu Leu Asn Lys His Leu Gly Glu Cys Gly Trp Leu Tyr
20 25 30
Asn Lys Ala Ile Glu Gln Asn Glu Tyr Tyr Lys Ala Asp Ser Asn Ile
35 40 45
Glu Glu Ala Gln Lys Lys Phe Glu Leu Leu Pro Asp Lys Asn Ser Asp
50 55 60
Glu Ala Lys Val Leu Arg Gly Asn Ile Ser Lys Asp Asn Tyr Val Tyr
65 70 75 80
Arg Thr Leu Val Lys Lys Lys Lys Ser Glu Ile Asn Val Gln Ile Arg
85 90 95
Lys Ala Val Val Leu Arg Pro Ala Glu Thr Ile Arg Asn Leu Ala Lys
100 105 110
Val Lys Lys Lys Gly Leu Ser Val Gly Arg Leu Lys Phe Ile Pro Ile
115 120 125
Arg Glu Trp Asp Val Leu Pro Phe Lys Gln Ser Asp Gln Ile Arg Leu
130 135 140
Glu Glu Asn Tyr Leu Ile Leu Glu Pro Tyr Gly Arg Leu Lys Phe Lys
145 150 155 160
Met His Arg Pro Leu Leu Gly Lys Pro Lys Thr Phe Cys Ile Lys Arg
165 170 175
Thr Ala Thr Asp Arg Trp Thr Ile Ser Phe Ser Thr Glu Tyr Asp Asp
180 185 190
Ser Asn Met Arg Lys Asn Asp Gly Gly Gln Val Gly Ile Asp Val Gly
195 200 205
Leu Lys Thr His Leu Arg Leu Ser Asn Glu Asn Pro Asp Glu Asp Pro
210 215 220
Arg Tyr Pro Asn Pro Lys Ile Trp Lys Arg Tyr Asp Arg Arg Leu Thr
225 230 235 240
Ile Leu Gln Arg Arg Ile Ser Lys Ser Lys Lys Leu Gly Lys Asn Arg
245 250 255
Thr Arg Leu Arg Leu Arg Leu Ser Arg Leu Trp Glu Lys Ile Arg Asn
260 265 270
Ser Arg Ala Asp Leu Ile Gln Asn Glu Thr Tyr Glu Ile Leu Ser Glu
275 280 285
Asn Lys Leu Ile Ala Ile Glu Asp Leu Asn Val Lys Gly Met Gln Glu
290 295 300
Lys Lys Asp Lys Lys Gly Arg Lys Gly Arg Thr Arg Ala Gln Glu Lys
305 310 315 320
Gly Leu His Arg Ser Ile Ser Asp Ala Ala Phe Ser Glu Phe Arg Arg
325 330 335
Val Leu Glu Tyr Lys Ala Lys Arg Phe Gly Ser Glu Val Lys Pro Val
340 345 350
Ser Ala Ile Asp Ser Ser Lys Glu Cys His Asn Cys Gly Asn Lys Lys
355 360 365
Gly Met Pro Leu Glu Ser Arg Ile Tyr Glu Cys Pro Lys Cys Gly Leu
370 375 380
Lys Ile Asp Arg Asp Leu Asn Ser Ala Lys Val Ile Leu Ala Arg Ala
385 390 395 400
Thr Gly Val Arg Pro Gly Ser Asn Ala Arg Ala Asp Thr Lys Ile Ser
405 410 415
Ala Thr Ala Gly Ala Ser Val Gln Thr Glu Gly Thr Val Ser Glu Asp
420 425 430
Phe Arg Gln Gln Met Glu Thr Ser Asp Gln Lys Pro Met Gln Gly Glu
435 440 445
Gly Ser Lys Glu Pro Pro Met Asn Pro Glu His Lys Ser Ser Gly Arg
450 455 460
Gly Ser Lys His Val Asn Ile Gly Cys Lys Asn Lys Val Gly Leu Tyr
465 470 475 480
Asn Glu Asp Glu Asn Ser Arg Ser Thr Glu Lys Gln Ile Met Asp Glu
485 490 495
Asn Arg Ser Thr Thr Glu Asp Met Val Glu Ile Gly Ala Leu His Ser
500 505 510
Pro Val Leu Thr Thr
515
<210> 27
<211> 410
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 27
Met Ile Ala Ser Ile Asp Tyr Glu Ala Val Ser Gln Ala Leu Ile Val
1 5 10 15
Phe Glu Phe Lys Ala Lys Gly Lys Asp Ser Gln Tyr Gln Ala Ile Asp
20 25 30
Glu Ala Ile Arg Ser Tyr Arg Phe Ile Arg Asn Ser Cys Leu Arg Tyr
35 40 45
Trp Met Asp Asn Lys Lys Val Gly Lys Tyr Asp Leu Asn Lys Tyr Cys
50 55 60
Lys Val Leu Ala Lys Gln Tyr Pro Phe Ala Asn Lys Leu Asn Ser Gln
65 70 75 80
Ala Arg Gln Ser Ala Ala Glu Cys Ser Trp Ser Ala Ile Ser Arg Phe
85 90 95
Tyr Asp Asn Cys Lys Arg Lys Val Ser Gly Lys Lys Gly Phe Pro Lys
100 105 110
Phe Lys Lys His Ala Arg Ser Val Glu Tyr Lys Thr Ser Gly Trp Lys
115 120 125
Leu Ser Glu Asn Arg Lys Ala Ile Thr Phe Thr Asp Lys Asn Gly Ile
130 135 140
Gly Lys Leu Lys Leu Lys Gly Thr Tyr Asp Leu His Phe Ser Gln Leu
145 150 155 160
Glu Asp Met Lys Arg Val Arg Leu Val Arg Arg Ala Asp Gly Tyr Tyr
165 170 175
Val Gln Phe Cys Ile Ser Val Asp Val Lys Val Glu Thr Glu Pro Thr
180 185 190
Gly Lys Ala Ile Gly Leu Asp Val Gly Ile Lys Tyr Phe Leu Ala Asp
195 200 205
Ser Ser Gly Asn Thr Ile Glu Asn Pro Gln Phe Tyr Arg Lys Ala Glu
210 215 220
Lys Lys Leu Asn Arg Ala Asn Arg Arg Lys Ser Lys Lys Tyr Ile Arg
225 230 235 240
Gly Val Lys Pro Gln Ser Lys Asn Tyr His Lys Ala Arg Cys Arg Tyr
245 250 255
Ala Arg Lys His Leu Arg Val Ser Arg Gln Arg Lys Glu Tyr Cys Lys
260 265 270
Arg Val Ala Tyr Cys Val Ile His Ser Asn Asp Val Val Ala Tyr Glu
275 280 285
Asp Leu Asn Val Lys Gly Met Val Lys Asn Arg His Leu Ala Lys Ser
290 295 300
Ile Ser Asp Val Ala Trp Ser Thr Phe Arg His Trp Leu Glu Tyr Phe
305 310 315 320
Ala Ile Lys Tyr Gly Lys Leu Thr Ile Pro Val Ala Pro His Asn Thr
325 330 335
Ser Gln Asn Cys Ser Asn Cys Asp Lys Lys Val Pro Lys Ser Leu Ser
340 345 350
Thr Arg Thr His Ile Cys His His Cys Gly Tyr Ser Glu Asp Arg Asp
355 360 365
Val Asn Ala Ala Lys Asn Ile Leu Lys Lys Ala Leu Ser Thr Val Gly
370 375 380
Gln Thr Gly Ser Leu Lys Leu Gly Glu Ile Glu Pro Leu Leu Val Leu
385 390 395 400
Glu Gln Ser Cys Thr Arg Lys Phe Asp Leu
405 410
<210> 28
<211> 486
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 28
Leu Ala Glu Glu Asn Thr Leu His Leu Thr Leu Ala Met Ser Leu Pro
1 5 10 15
Leu Asn Asp Leu Pro Glu Asn Arg Thr Arg Ser Glu Leu Trp Arg Arg
20 25 30
Gln Trp Leu Pro Gln Lys Lys Leu Ser Leu Leu Leu Gly Val Asn Gln
35 40 45
Ser Val Arg Lys Ala Ala Ala Asp Cys Leu Arg Trp Phe Glu Pro Tyr
50 55 60
Gln Glu Leu Leu Trp Trp Glu Pro Thr Asp Pro Asp Gly Lys Lys Leu
65 70 75 80
Leu Asp Lys Glu Gly Arg Pro Ile Lys Arg Thr Ala Gly His Met Arg
85 90 95
Val Leu Arg Lys Leu Glu Glu Ile Ala Pro Phe Arg Gly Tyr Gln Leu
100 105 110
Gly Ser Ala Val Lys Asn Gly Leu Arg His Lys Val Ala Asp Leu Leu
115 120 125
Leu Ser Tyr Ala Lys Arg Lys Leu Asp Pro Gln Phe Thr Asp Lys Thr
130 135 140
Ser Tyr Pro Ser Ile Gly Asp Gln Phe Pro Ile Val Trp Thr Gly Ala
145 150 155 160
Phe Val Cys Tyr Glu Gln Ser Ile Thr Gly Gln Leu Tyr Leu Tyr Leu
165 170 175
Pro Leu Phe Pro Arg Gly Ser His Gln Glu Asp Ile Thr Asn Asn Tyr
180 185 190
Asp Pro Asp Arg Gly Pro Ala Leu Gln Val Phe Gly Glu Lys Glu Ile
195 200 205
Ala Arg Leu Ser Arg Ser Thr Ser Gly Leu Leu Leu Pro Leu Gln Phe
210 215 220
Asp Lys Trp Gly Glu Ala Thr Phe Ile Arg Gly Glu Asn Asn Pro Pro
225 230 235 240
Thr Trp Lys Ala Thr His Arg Arg Ser Asp Lys Lys Trp Leu Ser Glu
245 250 255
Val Leu Leu Arg Glu Lys Asp Phe Gln Pro Lys Arg Val Glu Leu Leu
260 265 270
Val Arg Asn Gly Arg Ile Phe Val Asn Val Ala Cys Glu Ile Pro Thr
275 280 285
Lys Pro Leu Leu Glu Val Glu Asn Phe Met Gly Val Ser Phe Gly Leu
290 295 300
Glu His Leu Val Thr Val Val Val Ile Asn Arg Asp Gly Asn Val Val
305 310 315 320
His Gln Arg Gln Glu Pro Ala Arg Arg Tyr Glu Lys Thr Tyr Phe Ala
325 330 335
Arg Leu Glu Arg Leu Arg Arg Arg Gly Gly Pro Phe Ser Gln Glu Leu
340 345 350
Glu Thr Phe His Tyr Arg Gln Val Ala Gln Ile Val Glu Glu Ala Leu
355 360 365
Arg Phe Lys Ser Val Pro Ala Val Glu Gln Val Gly Asn Ile Pro Lys
370 375 380
Gly Arg Tyr Asn Pro Arg Leu Asn Leu Arg Leu Ser Tyr Trp Pro Phe
385 390 395 400
Gly Lys Leu Ala Asp Leu Thr Ser Tyr Lys Ala Val Lys Glu Gly Leu
405 410 415
Pro Lys Pro Tyr Ser Val Tyr Ser Ala Thr Ala Lys Met Leu Cys Ser
420 425 430
Thr Cys Gly Ala Ala Asn Lys Glu Gly Asp Gln Pro Ile Ser Leu Lys
435 440 445
Gly Pro Thr Val Tyr Cys Gly Asn Cys Gly Thr Arg His Asn Thr Gly
450 455 460
Phe Asn Thr Ala Leu Asn Leu Ala Arg Arg Ala Gln Glu Leu Phe Val
465 470 475 480
Lys Gly Val Val Ala Arg
485
<210> 29
<211> 602
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 29
Met Ser Gln Ser Leu Leu Lys Trp His Asp Met Ala Gly Arg Asp Lys
1 5 10 15
Asp Ala Ser Arg Ser Leu Gln Lys Ser Ala Val Glu Gly Val Leu Leu
20 25 30
His Leu Thr Ala Ser His Arg Val Ala Leu Glu Met Leu Glu Lys Ser
35 40 45
Val Ser Gln Thr Val Ala Val Thr Met Glu Ala Ala Gln Gln Arg Leu
50 55 60
Val Ile Val Leu Glu Asp Asp Pro Thr Lys Ala Thr Ser Arg Lys Arg
65 70 75 80
Val Ile Ser Ala Asp Leu Gln Phe Thr Arg Glu Glu Phe Gly Ser Leu
85 90 95
Pro Asn Trp Ala Gln Lys Leu Ala Ser Thr Cys Pro Glu Ile Ala Thr
100 105 110
Lys Tyr Ala Asp Lys His Ile Asn Ser Ile Arg Ile Ala Trp Gly Val
115 120 125
Ala Lys Glu Ser Thr Asn Gly Asp Ala Val Glu Gln Lys Leu Gln Trp
130 135 140
Gln Ile Arg Leu Leu Asp Val Thr Met Phe Leu Gln Gln Leu Val Leu
145 150 155 160
Gln Leu Ala Asp Lys Ala Leu Leu Glu Gln Ile Pro Ser Ser Ile Arg
165 170 175
Gly Gly Ile Gly Gln Glu Val Ala Gln Gln Val Thr Ser His Ile Gln
180 185 190
Leu Leu Asp Ser Gly Thr Val Leu Lys Ala Glu Leu Pro Thr Ile Ser
195 200 205
Asp Arg Asn Ser Glu Leu Ala Arg Lys Gln Trp Glu Asp Ala Ile Gln
210 215 220
Thr Val Cys Thr Tyr Ala Leu Pro Phe Ser Arg Glu Arg Ala Arg Ile
225 230 235 240
Leu Asp Pro Gly Lys Tyr Ala Ala Glu Asp Pro Arg Gly Asp Arg Leu
245 250 255
Ile Asn Ile Asp Pro Met Trp Ala Arg Val Leu Lys Gly Pro Thr Val
260 265 270
Lys Ser Leu Pro Leu Leu Phe Val Ser Gly Ser Ser Ile Arg Ile Val
275 280 285
Lys Leu Thr Leu Pro Arg Lys His Ala Ala Gly His Lys His Thr Phe
290 295 300
Thr Ala Thr Tyr Leu Val Leu Pro Val Ser Arg Glu Trp Ile Asn Ser
305 310 315 320
Leu Pro Gly Thr Val Gln Glu Lys Val Gln Trp Trp Lys Lys Pro Asp
325 330 335
Val Leu Ala Thr Gln Glu Leu Leu Val Gly Lys Gly Ala Leu Lys Lys
340 345 350
Ser Ala Asn Thr Leu Val Ile Pro Ile Ser Ala Gly Lys Lys Arg Phe
355 360 365
Phe Asn His Ile Leu Pro Ala Leu Gln Arg Gly Phe Pro Leu Gln Trp
370 375 380
Gln Arg Ile Val Gly Arg Ser Tyr Arg Arg Pro Ala Thr His Arg Lys
385 390 395 400
Trp Phe Ala Gln Leu Thr Ile Gly Tyr Thr Asn Pro Ser Ser Leu Pro
405 410 415
Glu Met Ala Leu Gly Ile His Phe Gly Met Lys Asp Ile Leu Trp Trp
420 425 430
Ala Leu Ala Asp Lys Gln Gly Asn Ile Leu Lys Asp Gly Ser Ile Pro
435 440 445
Gly Asn Ser Ile Leu Asp Phe Ser Leu Gln Glu Lys Gly Lys Ile Glu
450 455 460
Arg Gln Gln Lys Ala Gly Lys Asn Val Ala Gly Lys Lys Tyr Gly Lys
465 470 475 480
Ser Leu Leu Asn Ala Thr Tyr Arg Val Val Asn Gly Val Leu Glu Phe
485 490 495
Ser Lys Gly Ile Ser Ala Glu His Ala Ser Gln Pro Ile Gly Leu Gly
500 505 510
Leu Glu Thr Ile Arg Phe Val Asp Lys Ala Ser Gly Ser Ser Pro Val
515 520 525
Asn Ala Arg His Ser Asn Trp Asn Tyr Gly Gln Leu Ser Gly Ile Phe
530 535 540
Ala Asn Lys Ala Gly Pro Ala Gly Phe Ser Val Thr Glu Ile Thr Leu
545 550 555 560
Lys Lys Ala Gln Arg Asp Leu Ser Asp Ala Glu Gln Ala Arg Val Leu
565 570 575
Ala Ile Glu Ala Thr Lys Arg Phe Ala Ser Arg Ile Lys Arg Leu Ala
580 585 590
Thr Lys Arg Lys Asp Asp Thr Leu Phe Val
595 600
<210> 30
<211> 494
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 30
Val Glu Pro Val Glu Lys Glu Arg Phe Tyr Tyr Arg Thr Tyr Thr Phe
1 5 10 15
Arg Leu Asp Gly Gln Pro Arg Thr Gln Asn Leu Thr Thr Gln Ser Gly
20 25 30
Trp Gly Leu Leu Thr Lys Ala Val Leu Asp Asn Thr Lys His Tyr Trp
35 40 45
Glu Ile Val His His Ala Arg Ile Ala Asn Gln Pro Ile Val Phe Glu
50 55 60
Asn Pro Val Ile Asp Glu Gln Gly Asn Pro Lys Leu Asn Lys Leu Gly
65 70 75 80
Gln Pro Arg Phe Trp Lys Arg Pro Ile Ser Asp Ile Val Asn Gln Leu
85 90 95
Arg Ala Leu Phe Glu Asn Gln Asn Pro Tyr Gln Leu Gly Ser Ser Leu
100 105 110
Ile Gln Gly Thr Tyr Trp Asp Val Ala Glu Asn Leu Ala Ser Trp Tyr
115 120 125
Ala Leu Asn Lys Glu Tyr Leu Ala Gly Thr Ala Thr Trp Gly Glu Pro
130 135 140
Ser Phe Pro Glu Pro His Pro Leu Thr Glu Ile Asn Gln Trp Met Pro
145 150 155 160
Leu Thr Phe Ser Ser Gly Lys Val Val Arg Leu Leu Lys Asn Ala Ser
165 170 175
Gly Arg Tyr Phe Ile Gly Leu Pro Ile Leu Gly Glu Asn Asn Pro Cys
180 185 190
Tyr Arg Met Arg Thr Ile Glu Lys Leu Ile Pro Cys Asp Gly Lys Gly
195 200 205
Arg Val Thr Ser Gly Ser Leu Ile Leu Phe Pro Leu Val Gly Ile Tyr
210 215 220
Ala Gln Gln His Arg Arg Met Thr Asp Ile Cys Glu Ser Ile Arg Thr
225 230 235 240
Glu Lys Gly Lys Leu Ala Trp Ala Gln Val Ser Ile Asp Tyr Val Arg
245 250 255
Glu Val Asp Lys Arg Arg Arg Met Arg Arg Thr Arg Lys Ser Gln Gly
260 265 270
Trp Ile Gln Gly Pro Trp Gln Glu Val Phe Ile Leu Arg Leu Val Leu
275 280 285
Ala His Lys Ala Pro Lys Leu Tyr Lys Pro Arg Cys Phe Ala Gly Ile
290 295 300
Ser Leu Gly Pro Lys Thr Leu Ala Ser Cys Val Ile Leu Asp Gln Asp
305 310 315 320
Glu Arg Val Val Glu Lys Gln Gln Trp Ser Gly Ser Glu Leu Leu Ser
325 330 335
Leu Ile His Gln Gly Glu Glu Arg Leu Arg Ser Leu Arg Glu Gln Ser
340 345 350
Lys Pro Thr Trp Asn Ala Ala Tyr Arg Lys Gln Leu Lys Ser Leu Ile
355 360 365
Asn Thr Gln Val Phe Thr Ile Val Thr Phe Leu Arg Glu Arg Gly Ala
370 375 380
Ala Val Arg Leu Glu Ser Ile Ala Arg Val Arg Lys Ser Thr Pro Ala
385 390 395 400
Pro Pro Val Asn Phe Leu Leu Ser His Trp Ala Tyr Arg Gln Ile Thr
405 410 415
Glu Arg Leu Lys Asp Leu Ala Ile Arg Asn Gly Met Pro Leu Thr His
420 425 430
Ser Asn Gly Ser Tyr Gly Val Arg Phe Thr Cys Ser Gln Cys Gly Ala
435 440 445
Thr Asn Gln Gly Ile Lys Asp Pro Thr Lys Tyr Lys Val Asp Ile Glu
450 455 460
Ser Glu Thr Phe Leu Cys Ser Ile Cys Ser His Arg Glu Ile Ala Ala
465 470 475 480
Val Asn Thr Ala Thr Asn Leu Ala Lys Gln Leu Leu Asp Glu
485 490
<210> 31
<211> 526
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 31
Met Asn Asp Thr Glu Thr Ser Glu Thr Leu Thr Ser His Arg Thr Val
1 5 10 15
Cys Ala His Leu His Val Val Gly Glu Thr Gly Ser Leu Pro Arg Leu
20 25 30
Val Glu Ala Ala Leu Ala Glu Leu Ile Thr Leu Asn Gly Arg Ala Thr
35 40 45
Gln Ala Leu Leu Ser Leu Ala Lys Asn Gly Leu Val Leu Arg Arg Asp
50 55 60
Lys Glu Glu Asn Leu Ile Ala Ala Glu Leu Thr Leu Pro Cys Arg Lys
65 70 75 80
Asn Lys Tyr Ala Asp Val Ala Ala Lys Ala Gly Glu Pro Ile Leu Ala
85 90 95
Thr Arg Ile Asn Asn Lys Gly Lys Leu Val Thr Lys Lys Trp Tyr Gly
100 105 110
Glu Gly Asn Ser Tyr His Ile Val Arg Phe Thr Pro Glu Thr Gly Met
115 120 125
Phe Thr Val Arg Val Phe Asp Arg Tyr Ala Phe Asp Glu Glu Leu Leu
130 135 140
His Leu His Ser Glu Val Val Phe Gly Ser Asp Leu Pro Lys Gly Ile
145 150 155 160
Lys Ala Lys Thr Asp Ser Leu Pro Ala Asn Phe Leu Gln Ala Val Phe
165 170 175
Thr Ser Phe Leu Glu Leu Pro Phe Gln Gly Phe Pro Asp Ile Val Val
180 185 190
Lys Pro Ala Met Lys Gln Ala Ala Glu Gln Leu Leu Ser Tyr Val Gln
195 200 205
Leu Glu Ala Gly Glu Asn Gln Gln Ala Glu Tyr Pro Asp Thr Asn Glu
210 215 220
Arg Asp Pro Glu Leu Arg Leu Val Glu Trp Gln Lys Ser Leu His Glu
225 230 235 240
Leu Ser Val Arg Thr Glu Pro Phe Glu Phe Val Arg Ala Arg Asp Ile
245 250 255
Asp Tyr Tyr Ala Glu Thr Asp Arg Arg Gly Asn Arg Phe Val Asn Ile
260 265 270
Thr Pro Glu Trp Thr Lys Phe Ala Glu Ser Pro Phe Ala Arg Arg Leu
275 280 285
Pro Leu Lys Ile Pro Pro Glu Phe Cys Ile Leu Leu Arg Arg Lys Thr
290 295 300
Glu Gly His Ala Lys Ile Pro Asn Arg Ile Tyr Leu Gly Leu Gln Ile
305 310 315 320
Phe Asp Gly Val Thr Pro Asp Ser Thr Leu Gly Val Leu Ala Thr Ala
325 330 335
Glu Asp Gly Lys Leu Phe Trp Trp His Asp His Leu Asp Glu Phe Ser
340 345 350
Asn Leu Glu Gly Lys Pro Glu Pro Lys Leu Lys Asn Lys Pro Gln Leu
355 360 365
Leu Met Val Ser Leu Glu Tyr Asp Arg Glu Gln Arg Phe Glu Glu Ser
370 375 380
Val Gly Gly Asp Arg Lys Ile Cys Leu Val Thr Leu Lys Glu Thr Arg
385 390 395 400
Asn Phe Arg Arg Gly Trp Asn Gly Arg Ile Leu Gly Ile His Phe Gln
405 410 415
His Asn Pro Val Ile Thr Trp Ala Leu Met Asp His Asp Ala Glu Val
420 425 430
Leu Glu Lys Gly Phe Ile Glu Gly Asn Ala Phe Leu Gly Lys Ala Leu
435 440 445
Asp Lys Gln Ala Leu Asn Glu Tyr Leu Gln Lys Gly Gly Lys Trp Val
450 455 460
Gly Asp Arg Ser Phe Gly Asn Lys Leu Lys Gly Ile Thr His Thr Leu
465 470 475 480
Ala Ser Leu Ile Val Arg Leu Ala Arg Glu Lys Asp Ala Trp Ile Ala
485 490 495
Leu Glu Glu Ile Ser Trp Val Gln Lys Gln Ser Ala Asp Ser Val Ala
500 505 510
Asn His Glu Ile Val Glu Gln Pro His His Ser Leu Thr Arg
515 520 525
<210> 32
<211> 649
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 32
Met Asn Asp Thr Glu Thr Ser Glu Thr Leu Thr Ser His Arg Thr Val
1 5 10 15
Cys Ala His Leu His Val Val Gly Glu Thr Gly Ser Leu Pro Arg Leu
20 25 30
Val Glu Ala Ala Leu Ala Glu Leu Ile Thr Leu Asn Gly Arg Ala Thr
35 40 45
Gln Ala Leu Leu Ser Leu Ala Lys Asn Gly Leu Val Leu Arg Arg Asp
50 55 60
Lys Glu Glu Asn Leu Ile Ala Ala Glu Leu Thr Leu Pro Cys Arg Lys
65 70 75 80
Asn Lys Tyr Ala Asp Val Ala Ala Lys Ala Gly Glu Pro Ile Leu Ala
85 90 95
Thr Arg Ile Asn Asn Lys Gly Lys Leu Val Thr Lys Lys Trp Tyr Gly
100 105 110
Glu Gly Asn Ser Tyr His Ile Val Arg Phe Thr Pro Glu Thr Gly Met
115 120 125
Phe Thr Val Arg Val Phe Asp Arg Tyr Ala Phe Asp Glu Glu Leu Leu
130 135 140
His Leu His Ser Glu Val Val Phe Gly Ser Asp Leu Pro Lys Gly Ile
145 150 155 160
Lys Ala Lys Thr Asp Ser Leu Pro Ala Asn Phe Leu Gln Ala Val Phe
165 170 175
Thr Ser Phe Leu Glu Leu Pro Phe Gln Gly Phe Pro Asp Ile Val Val
180 185 190
Lys Pro Ala Met Lys Gln Ala Ala Glu Gln Leu Leu Ser Tyr Val Gln
195 200 205
Leu Glu Ala Gly Glu Asn Gln Gln Ala Glu Tyr Pro Asp Thr Asn Glu
210 215 220
Arg Asp Pro Glu Leu Arg Leu Val Glu Trp Gln Lys Ser Leu His Glu
225 230 235 240
Leu Ser Val Arg Thr Glu Pro Phe Glu Phe Val Arg Ala Arg Asp Ile
245 250 255
Asp Tyr Tyr Ala Glu Thr Asp Arg Arg Gly Asn Arg Phe Val Asn Ile
260 265 270
Thr Pro Glu Trp Thr Lys Phe Ala Glu Ser Pro Phe Ala Arg Arg Leu
275 280 285
Pro Leu Lys Ile Pro Pro Glu Phe Cys Ile Leu Leu Arg Arg Lys Thr
290 295 300
Glu Gly His Ala Lys Ile Pro Asn Arg Ile Tyr Leu Gly Leu Gln Ile
305 310 315 320
Phe Asp Gly Val Thr Pro Asp Ser Thr Leu Gly Val Leu Ala Thr Ala
325 330 335
Glu Asp Gly Lys Leu Phe Trp Trp His Asp His Leu Asp Glu Phe Ser
340 345 350
Asn Leu Glu Gly Lys Pro Glu Pro Lys Leu Lys Asn Lys Pro Gln Leu
355 360 365
Leu Met Val Ser Leu Glu Tyr Asp Arg Glu Gln Arg Phe Glu Glu Ser
370 375 380
Val Gly Gly Asp Arg Lys Ile Cys Leu Val Thr Leu Lys Glu Thr Arg
385 390 395 400
Asn Phe Arg Arg Gly Arg His Gly His Thr Arg Thr Asp Arg Leu Pro
405 410 415
Ala Gly Asn Thr Leu Trp Arg Ala Asp Phe Ala Thr Ser Ala Glu Val
420 425 430
Ala Ala Pro Lys Trp Asn Gly Arg Ile Leu Gly Ile His Phe Gln His
435 440 445
Asn Pro Val Ile Thr Trp Ala Leu Met Asp His Asp Ala Glu Val Leu
450 455 460
Glu Lys Gly Phe Ile Glu Gly Asn Ala Phe Leu Gly Lys Ala Leu Asp
465 470 475 480
Lys Gln Ala Leu Asn Glu Tyr Leu Gln Lys Gly Gly Lys Trp Val Gly
485 490 495
Asp Arg Ser Phe Gly Asn Lys Leu Lys Gly Ile Thr His Thr Leu Ala
500 505 510
Ser Leu Ile Val Arg Leu Ala Arg Glu Lys Asp Ala Trp Ile Ala Leu
515 520 525
Glu Glu Ile Ser Trp Val Gln Lys Gln Ser Ala Asp Ser Val Ala Asn
530 535 540
Arg Arg Phe Ser Met Trp Asn Tyr Ser Arg Leu Ala Thr Leu Ile Glu
545 550 555 560
Trp Leu Gly Thr Asp Ile Ala Thr Arg Asp Cys Gly Thr Ala Ala Pro
565 570 575
Leu Ala His Lys Val Ser Asp Tyr Leu Thr His Phe Thr Cys Pro Glu
580 585 590
Cys Gly Ala Cys Arg Lys Ala Gly Gln Lys Lys Glu Ile Ala Asp Thr
595 600 605
Val Arg Ala Gly Asp Ile Leu Thr Cys Arg Lys Cys Gly Phe Ser Gly
610 615 620
Pro Ile Pro Asp Asn Phe Ile Ala Glu Phe Val Ala Lys Lys Ala Leu
625 630 635 640
Glu Arg Met Leu Lys Lys Lys Pro Val
645
<210> 33
<211> 414
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 33
Met Ala Lys Arg Asn Phe Gly Glu Lys Ser Glu Ala Leu Tyr Arg Ala
1 5 10 15
Val Arg Phe Glu Val Arg Pro Ser Lys Glu Glu Leu Ser Ile Leu Leu
20 25 30
Ala Val Ser Glu Val Leu Arg Met Leu Phe Asn Ser Ala Leu Ala Glu
35 40 45
Arg Gln Gln Val Phe Thr Glu Phe Ile Ala Ser Leu Tyr Ala Glu Leu
50 55 60
Lys Ser Ala Ser Val Pro Glu Glu Ile Ser Glu Ile Arg Lys Lys Leu
65 70 75 80
Arg Glu Ala Tyr Lys Glu His Ser Ile Ser Leu Phe Asp Gln Ile Asn
85 90 95
Ala Leu Thr Ala Arg Arg Val Glu Asp Glu Ala Phe Ala Ser Val Thr
100 105 110
Arg Asn Trp Gln Glu Glu Thr Leu Asp Ala Leu Asp Gly Ala Tyr Lys
115 120 125
Ser Phe Leu Ser Leu Arg Arg Lys Gly Asp Tyr Asp Ala His Ser Pro
130 135 140
Arg Ser Arg Asp Ser Gly Phe Phe Gln Lys Ile Pro Gly Arg Ser Gly
145 150 155 160
Phe Lys Ile Gly Glu Gly Arg Ile Ala Leu Ser Cys Gly Ala Gly Arg
165 170 175
Lys Leu Ser Phe Pro Ile Pro Asp Tyr Gln Gln Gly Arg Leu Ala Glu
180 185 190
Thr Thr Lys Leu Lys Lys Phe Glu Leu Tyr Arg Asp Gln Pro Asn Leu
195 200 205
Ala Lys Ser Gly Arg Phe Trp Ile Ser Val Val Tyr Glu Leu Pro Lys
210 215 220
Pro Glu Ala Thr Thr Cys Gln Ser Glu Gln Val Ala Phe Val Ala Leu
225 230 235 240
Gly Ala Ser Ser Ile Gly Val Val Ser Gln Arg Gly Glu Glu Val Ile
245 250 255
Ala Leu Trp Arg Ser Asp Lys His Trp Val Pro Lys Ile Glu Ala Val
260 265 270
Glu Glu Arg Met Lys Arg Arg Val Lys Gly Ser Arg Gly Trp Leu Arg
275 280 285
Leu Leu Asn Ser Gly Lys Arg Arg Met His Met Ile Ser Ser Arg Gln
290 295 300
His Val Gln Asp Glu Arg Glu Ile Val Asp Tyr Leu Val Arg Asn His
305 310 315 320
Gly Ser His Phe Val Val Thr Glu Leu Val Val Arg Ser Lys Glu Gly
325 330 335
Lys Leu Ala Asp Ser Ser Lys Pro Glu Arg Gly Gly Ser Leu Gly Leu
340 345 350
Asn Trp Ala Ala Gln Asn Thr Gly Ser Leu Ser Arg Leu Val Arg Gln
355 360 365
Leu Glu Glu Lys Val Lys Glu His Gly Gly Ser Val Arg Lys His Lys
370 375 380
Leu Thr Leu Thr Glu Ala Pro Pro Ala Arg Gly Ala Glu Asn Lys Leu
385 390 395 400
Trp Met Ala Arg Lys Leu Arg Glu Ser Phe Leu Lys Glu Val
405 410
<210> 34
<211> 413
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 34
Leu Ala Lys Asn Asp Glu Lys Glu Leu Leu Tyr Gln Ser Val Lys Phe
1 5 10 15
Glu Ile Tyr Pro Asp Glu Ser Lys Ile Arg Val Leu Thr Arg Val Ser
20 25 30
Asn Ile Leu Val Leu Val Trp Asn Ser Ala Leu Gly Glu Arg Arg Ala
35 40 45
Arg Phe Glu Leu Tyr Ile Ala Pro Leu Tyr Glu Glu Leu Lys Lys Phe
50 55 60
Pro Arg Lys Ser Ala Glu Ser Asn Ala Leu Arg Gln Lys Ile Arg Glu
65 70 75 80
Gly Tyr Lys Glu His Ile Pro Thr Phe Phe Asp Gln Leu Lys Lys Leu
85 90 95
Leu Thr Pro Met Arg Lys Glu Asp Pro Ala Leu Leu Gly Ser Val Pro
100 105 110
Arg Ala Tyr Gln Glu Glu Thr Leu Asn Thr Leu Asn Gly Ser Phe Val
115 120 125
Ser Phe Met Thr Leu Arg Arg Asn Asn Asp Met Asp Ala Lys Pro Pro
130 135 140
Lys Gly Arg Ala Glu Asp Arg Phe His Glu Ile Ser Gly Arg Ser Gly
145 150 155 160
Phe Lys Ile Asp Gly Ser Glu Phe Val Leu Ser Thr Lys Glu Gln Lys
165 170 175
Leu Arg Phe Pro Ile Pro Asn Tyr Gln Leu Glu Lys Leu Lys Glu Ala
180 185 190
Lys Gln Ile Lys Lys Phe Thr Leu Tyr Gln Ser Arg Asp Arg Arg Phe
195 200 205
Trp Ile Ser Ile Ala Tyr Glu Ile Glu Leu Pro Asp Gln Arg Pro Phe
210 215 220
Asn Pro Glu Glu Val Ile Tyr Ile Ala Phe Gly Ala Ser Ser Ile Gly
225 230 235 240
Val Ile Ser Pro Glu Gly Glu Lys Val Ile Asp Phe Trp Arg Pro Asp
245 250 255
Lys His Trp Lys Pro Lys Ile Lys Glu Val Glu Asn Arg Met Arg Ser
260 265 270
Cys Lys Lys Gly Ser Arg Ala Trp Lys Lys Arg Ala Ala Ala Arg Arg
275 280 285
Lys Met Tyr Ala Met Thr Gln Arg Gln Gln Lys Leu Asn His Arg Glu
290 295 300
Ile Val Ala Ser Leu Leu Arg Leu Gly Phe His Phe Val Val Thr Glu
305 310 315 320
Tyr Thr Val Arg Ser Lys Pro Gly Lys Leu Ala Asp Gly Ser Asn Pro
325 330 335
Lys Arg Gly Gly Ala Pro Gln Gly Phe Asn Trp Ser Ala Gln Asn Thr
340 345 350
Gly Ser Phe Gly Glu Phe Ile Leu Trp Leu Lys Gln Lys Val Lys Glu
355 360 365
Gln Gly Gly Thr Val Gln Thr Phe Arg Leu Val Leu Gly Gln Ser Glu
370 375 380
Arg Pro Glu Lys Arg Gly Arg Asp Asn Lys Ile Glu Met Val Arg Leu
385 390 395 400
Leu Arg Glu Lys Tyr Leu Glu Ser Gln Thr Ile Val Val
405 410
<210> 35
<211> 449
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 35
Met Ala Lys Gly Lys Lys Lys Glu Gly Lys Pro Leu Tyr Arg Ala Val
1 5 10 15
Arg Phe Glu Ile Phe Pro Thr Ser Asp Gln Ile Thr Leu Phe Leu Arg
20 25 30
Val Ser Lys Asn Leu Gln Gln Val Trp Asn Glu Ala Trp Gln Glu Arg
35 40 45
Gln Ser Cys Tyr Glu Gln Phe Phe Gly Ser Ile Tyr Glu Arg Ile Gly
50 55 60
Gln Ala Lys Lys Arg Ala Gln Glu Ala Gly Phe Ser Glu Val Trp Glu
65 70 75 80
Asn Glu Ala Lys Lys Gly Leu Asn Lys Lys Leu Arg Gln Gln Glu Ile
85 90 95
Ser Met Gln Leu Val Ser Glu Lys Glu Ser Leu Leu Gln Glu Leu Ser
100 105 110
Ile Ala Phe Gln Glu His Gly Val Thr Leu Tyr Asp Gln Ile Asn Gly
115 120 125
Leu Thr Ala Arg Arg Ile Ile Gly Glu Phe Ala Leu Ile Pro Arg Asn
130 135 140
Trp Gln Glu Glu Thr Leu Asp Ser Leu Asp Gly Ser Phe Lys Ser Phe
145 150 155 160
Leu Ala Leu Arg Lys Asn Gly Asp Pro Asp Ala Lys Pro Pro Arg Gln
165 170 175
Arg Val Ser Glu Asn Ser Phe Tyr Lys Ile Pro Gly Arg Ser Gly Phe
180 185 190
Lys Val Ser Asn Gly Gln Ile Tyr Leu Ser Phe Gly Lys Ile Gly Gln
195 200 205
Thr Leu Thr Ser Val Ile Pro Glu Phe Gln Leu Lys Arg Leu Glu Thr
210 215 220
Ala Ile Lys Leu Lys Lys Phe Glu Leu Cys Arg Asp Glu Arg Asp Met
225 230 235 240
Ala Lys Pro Gly Arg Phe Trp Ile Ser Val Ala Tyr Glu Ile Pro Lys
245 250 255
Pro Glu Lys Val Pro Val Val Ser Lys Gln Ile Thr Tyr Leu Ala Ile
260 265 270
Gly Ala Ser Arg Leu Gly Val Val Ser Pro Lys Gly Glu Phe Cys Leu
275 280 285
Asn Leu Pro Arg Ser Asp Tyr His Trp Lys Pro Gln Ile Asn Ala Leu
290 295 300
Gln Glu Arg Leu Glu Gly Val Val Lys Gly Ser Arg Lys Trp Lys Lys
305 310 315 320
Arg Met Ala Ala Cys Thr Arg Met Phe Ala Lys Leu Gly His Gln Gln
325 330 335
Lys Gln His Gly Gln Tyr Glu Val Val Lys Lys Leu Leu Arg His Gly
340 345 350
Val His Phe Val Val Thr Glu Leu Lys Val Arg Ser Lys Pro Gly Ala
355 360 365
Leu Ala Asp Ala Ser Lys Ser Asp Arg Lys Gly Ser Pro Thr Gly Pro
370 375 380
Asn Trp Ser Ala Gln Asn Thr Gly Asn Ile Ala Arg Leu Ile Gln Lys
385 390 395 400
Leu Thr Asp Lys Ala Ser Glu His Gly Gly Thr Val Ile Lys Arg Asn
405 410 415
Pro Pro Leu Leu Ser Leu Glu Glu Arg Gln Leu Pro Asp Ala Gln Arg
420 425 430
Lys Ile Phe Ile Ala Lys Lys Leu Arg Glu Glu Phe Leu Ala Asp Gln
435 440 445
Lys
<210> 36
<211> 711
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 36
Met Ala Lys Arg Glu Lys Lys Asp Asp Val Val Leu Arg Gly Thr Lys
1 5 10 15
Met Arg Ile Tyr Pro Thr Asp Arg Gln Val Thr Leu Met Asp Met Trp
20 25 30
Arg Arg Arg Cys Ile Ser Leu Trp Asn Leu Leu Leu Asn Leu Glu Thr
35 40 45
Ala Ala Tyr Gly Ala Lys Asn Thr Arg Ser Lys Leu Gly Trp Arg Ser
50 55 60
Ile Trp Ala Arg Val Val Glu Glu Asn His Ala Lys Ala Leu Ile Val
65 70 75 80
Tyr Gln His Gly Lys Cys Lys Lys Asp Gly Ser Phe Val Leu Lys Arg
85 90 95
Asp Gly Thr Val Lys His Pro Pro Arg Glu Arg Phe Pro Gly Asp Arg
100 105 110
Lys Ile Leu Leu Gly Leu Phe Asp Ala Leu Arg His Thr Leu Asp Lys
115 120 125
Gly Ala Lys Cys Lys Cys Asn Val Asn Gln Pro Tyr Ala Leu Thr Arg
130 135 140
Ala Trp Leu Asp Glu Thr Gly His Gly Ala Arg Thr Ala Asp Ile Ile
145 150 155 160
Ala Trp Leu Lys Asp Phe Lys Gly Glu Cys Asp Cys Thr Ala Ile Ser
165 170 175
Thr Ala Ala Lys Tyr Cys Pro Ala Pro Pro Thr Ala Glu Leu Leu Thr
180 185 190
Lys Ile Lys Arg Ala Ala Pro Ala Asp Asp Leu Pro Val Asp Gln Ala
195 200 205
Ile Leu Leu Asp Leu Phe Gly Ala Leu Arg Gly Gly Leu Lys Gln Lys
210 215 220
Glu Cys Asp His Thr His Ala Arg Thr Val Ala Tyr Phe Glu Lys His
225 230 235 240
Glu Leu Ala Gly Arg Ala Glu Asp Ile Leu Ala Trp Leu Ile Ala His
245 250 255
Gly Gly Thr Cys Asp Cys Lys Ile Val Glu Glu Ala Ala Asn His Cys
260 265 270
Pro Gly Pro Arg Leu Phe Ile Trp Glu His Glu Leu Ala Met Ile Met
275 280 285
Ala Arg Leu Lys Ala Glu Pro Arg Thr Glu Trp Ile Gly Asp Leu Pro
290 295 300
Ser His Ala Ala Gln Thr Val Val Lys Asp Leu Val Lys Ala Leu Gln
305 310 315 320
Thr Met Leu Lys Glu Arg Ala Lys Ala Ala Ala Gly Asp Glu Ser Ala
325 330 335
Arg Lys Thr Gly Phe Pro Lys Phe Lys Lys Gln Ala Tyr Ala Ala Gly
340 345 350
Ser Val Tyr Phe Pro Asn Thr Thr Met Phe Phe Asp Val Ala Ala Gly
355 360 365
Arg Val Gln Leu Pro Asn Gly Cys Gly Ser Met Arg Cys Glu Ile Pro
370 375 380
Arg Gln Leu Val Ala Glu Leu Leu Glu Arg Asn Leu Lys Pro Gly Leu
385 390 395 400
Val Ile Gly Ala Gln Leu Gly Leu Leu Gly Gly Arg Ile Trp Arg Gln
405 410 415
Gly Asp Arg Trp Tyr Leu Ser Cys Gln Trp Glu Arg Pro Gln Pro Thr
420 425 430
Leu Leu Pro Lys Thr Gly Arg Thr Ala Gly Val Lys Ile Ala Ala Ser
435 440 445
Ile Val Phe Thr Thr Tyr Asp Asn Arg Gly Gln Thr Lys Glu Tyr Pro
450 455 460
Met Pro Pro Ala Asp Lys Lys Leu Thr Ala Val His Leu Val Ala Gly
465 470 475 480
Lys Gln Asn Ser Arg Ala Leu Glu Ala Gln Lys Glu Lys Glu Lys Lys
485 490 495
Leu Lys Ala Arg Lys Glu Arg Leu Arg Leu Gly Lys Leu Glu Lys Gly
500 505 510
His Asp Pro Asn Ala Leu Lys Pro Leu Lys Arg Pro Arg Val Arg Arg
515 520 525
Ser Lys Leu Phe Tyr Lys Ser Ala Ala Arg Leu Ala Ala Cys Glu Ala
530 535 540
Ile Glu Arg Asp Arg Arg Asp Gly Phe Leu His Arg Val Thr Asn Glu
545 550 555 560
Ile Val His Lys Phe Asp Ala Val Ser Val Gln Lys Met Ser Val Ala
565 570 575
Pro Met Met Arg Arg Gln Lys Gln Lys Glu Lys Gln Ile Glu Ser Lys
580 585 590
Lys Asn Glu Ala Lys Lys Glu Asp Asn Gly Ala Ala Lys Lys Pro Arg
595 600 605
Asn Leu Lys Pro Val Arg Lys Leu Leu Arg His Val Ala Met Ala Arg
610 615 620
Gly Arg Gln Phe Leu Glu Tyr Lys Tyr Asn Asp Leu Arg Gly Pro Gly
625 630 635 640
Ser Val Leu Ile Ala Asp Arg Leu Glu Pro Glu Val Gln Glu Cys Ser
645 650 655
Arg Cys Gly Thr Lys Asn Pro Gln Met Lys Asp Gly Arg Arg Leu Leu
660 665 670
Arg Cys Ile Gly Val Leu Pro Asp Gly Thr Asp Cys Asp Ala Val Leu
675 680 685
Pro Arg Asn Arg Asn Ala Ala Arg Asn Ala Glu Lys Arg Leu Arg Lys
690 695 700
His Arg Glu Ala His Asn Ala
705 710
<210> 37
<211> 574
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 37
Met Asn Glu Val Leu Pro Ile Pro Ala Val Gly Glu Asp Ala Ala Asp
1 5 10 15
Thr Ile Met Arg Gly Ser Lys Met Arg Ile Tyr Pro Ser Val Arg Gln
20 25 30
Ala Ala Thr Met Asp Leu Trp Arg Arg Arg Cys Ile Gln Leu Trp Asn
35 40 45
Leu Leu Leu Glu Leu Glu Gln Ala Ala Tyr Ser Gly Glu Asn Arg Arg
50 55 60
Thr Gln Ile Gly Trp Arg Ser Ile Trp Ala Thr Val Val Glu Asp Ser
65 70 75 80
His Ala Glu Ala Val Arg Val Ala Arg Glu Gly Lys Lys Arg Lys Asp
85 90 95
Gly Thr Phe Arg Lys Ala Pro Ser Gly Lys Glu Ile Pro Pro Leu Asp
100 105 110
Pro Ala Met Leu Ala Lys Ile Gln Arg Gln Met Asn Gly Ala Val Asp
115 120 125
Val Asp Pro Lys Thr Gly Glu Val Thr Pro Ala Gln Pro Arg Leu Phe
130 135 140
Met Trp Glu His Glu Leu Gln Lys Ile Met Ala Arg Leu Lys Gln Ala
145 150 155 160
Pro Arg Thr His Trp Ile Asp Asp Leu Pro Ser His Ala Ala Gln Ser
165 170 175
Val Val Lys Asp Leu Ile Lys Ala Leu Gln Ala Met Leu Arg Glu Arg
180 185 190
Lys Lys Arg Ala Ser Gly Ile Gly Gly Arg Asp Thr Gly Phe Pro Lys
195 200 205
Phe Lys Lys Asn Arg Tyr Ala Ala Gly Ser Val Tyr Phe Ala Asn Thr
210 215 220
Gln Leu Arg Phe Glu Ala Lys Arg Gly Lys Ala Gly Asp Pro Asp Ala
225 230 235 240
Val Arg Gly Glu Phe Ala Arg Val Lys Leu Pro Asn Gly Val Gly Trp
245 250 255
Met Glu Cys Arg Met Pro Arg His Ile Asn Ala Ala His Ala Tyr Ala
260 265 270
Gln Ala Thr Leu Met Gly Gly Arg Ile Trp Arg Gln Gly Glu Asn Trp
275 280 285
Tyr Leu Ser Cys Gln Trp Lys Met Pro Lys Pro Ala Pro Leu Pro Arg
290 295 300
Ala Gly Arg Thr Ala Ala Ile Lys Ile Ala Ala Ala Ile Pro Ile Thr
305 310 315 320
Thr Val Asp Asn Arg Gly Gln Thr Arg Glu Tyr Ala Met Pro Pro Ile
325 330 335
Asp Arg Glu Arg Ile Ala Ala His Ala Ala Ala Gly Arg Ala Gln Ser
340 345 350
Arg Ala Leu Glu Ala Arg Lys Arg Arg Ala Lys Lys Arg Glu Ala Tyr
355 360 365
Ala Lys Lys Arg His Ala Lys Lys Leu Glu Arg Gly Ile Ala Ala Lys
370 375 380
Pro Pro Gly Arg Ala Arg Ile Lys Leu Ser Pro Gly Phe Tyr Ala Ala
385 390 395 400
Ala Ala Lys Leu Ala Lys Leu Glu Ala Glu Asp Ala Asn Ala Arg Glu
405 410 415
Ala Trp Leu His Glu Ile Thr Thr Gln Ile Val Arg Asn Phe Asp Val
420 425 430
Ile Ala Val Pro Arg Met Glu Val Ala Lys Leu Met Lys Lys Pro Glu
435 440 445
Pro Pro Glu Glu Lys Glu Glu Gln Val Lys Ala Pro Trp Gln Gly Lys
450 455 460
Arg Arg Ser Leu Lys Ala Ala Arg Val Met Met Arg Arg Thr Ala Met
465 470 475 480
Ala Leu Ile Gln Thr Thr Leu Lys Tyr Lys Ala Val Asp Leu Arg Gly
485 490 495
Pro Gln Ala Tyr Glu Glu Ile Ala Pro Leu Asp Val Thr Ala Ala Ala
500 505 510
Cys Ser Gly Cys Gly Val Leu Lys Pro Glu Trp Lys Met Ala Arg Ala
515 520 525
Lys Gly Arg Glu Ile Met Arg Cys Gln Glu Pro Leu Pro Gly Gly Lys
530 535 540
Thr Cys Asn Thr Val Leu Thr Tyr Thr Arg Asn Ser Ala Arg Val Ile
545 550 555 560
Gly Arg Glu Leu Ala Val Arg Leu Ala Glu Arg Gln Lys Ala
565 570
<210> 38
<211> 400
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 38
Met Thr Thr Gln Lys Thr Tyr Asn Phe Cys Phe Tyr Asp Gln Arg Phe
1 5 10 15
Phe Glu Leu Ser Lys Glu Ala Gly Glu Val Tyr Ser Arg Ser Leu Glu
20 25 30
Glu Phe Trp Lys Ile Tyr Asp Glu Thr Gly Val Trp Leu Ser Lys Phe
35 40 45
Asp Leu Gln Lys His Met Arg Asn Lys Leu Glu Arg Lys Leu Leu His
50 55 60
Ser Asp Ser Phe Leu Gly Ala Met Gln Gln Val His Ala Asn Leu Ala
65 70 75 80
Ser Trp Lys Gln Ala Lys Lys Val Val Pro Asp Ala Cys Pro Pro Arg
85 90 95
Lys Pro Lys Phe Leu Gln Ala Ile Leu Phe Lys Lys Ser Gln Ile Lys
100 105 110
Tyr Lys Asn Gly Phe Leu Arg Leu Thr Leu Gly Thr Glu Lys Glu Phe
115 120 125
Leu Tyr Leu Lys Trp Asp Ile Asn Ile Pro Leu Pro Ile Tyr Gly Ser
130 135 140
Val Thr Tyr Ser Lys Thr Arg Gly Trp Lys Ile Asn Leu Cys Leu Glu
145 150 155 160
Thr Glu Val Glu Gln Lys Asn Leu Ser Glu Asn Lys Tyr Leu Ser Ile
165 170 175
Asp Leu Gly Val Lys Arg Val Ala Thr Ile Phe Asp Gly Glu Asn Thr
180 185 190
Ile Thr Leu Ser Gly Lys Lys Phe Met Gly Leu Met His Tyr Arg Asn
195 200 205
Lys Leu Asn Gly Lys Thr Gln Ser Arg Leu Ser His Lys Lys Lys Gly
210 215 220
Ser Asn Asn Tyr Lys Lys Ile Gln Arg Ala Lys Arg Lys Thr Thr Asp
225 230 235 240
Arg Leu Leu Asn Ile Gln Lys Glu Met Leu His Lys Tyr Ser Ser Phe
245 250 255
Ile Val Asn Tyr Ala Ile Arg Asn Asp Ile Gly Asn Ile Ile Ile Gly
260 265 270
Asp Asn Ser Ser Thr His Asp Ser Pro Asn Met Arg Gly Lys Thr Asn
275 280 285
Gln Lys Ile Ser Gln Asn Pro Glu Gln Lys Leu Lys Asn Tyr Ile Lys
290 295 300
Tyr Lys Phe Glu Ser Ile Ser Gly Arg Val Asp Ile Val Pro Glu Pro
305 310 315 320
Tyr Thr Ser Arg Lys Cys Pro His Cys Lys Asn Ile Lys Lys Ser Ser
325 330 335
Pro Lys Gly Arg Thr Tyr Lys Cys Lys Lys Cys Gly Phe Ile Phe Asp
340 345 350
Arg Asp Gly Val Gly Ala Ile Asn Ile Tyr Asn Glu Asn Val Ser Phe
355 360 365
Gly Gln Ile Ile Ser Pro Gly Arg Ile Arg Ser Leu Thr Glu Pro Ile
370 375 380
Gly Met Lys Phe His Asn Glu Ile Tyr Phe Lys Ser Tyr Val Ala Ala
385 390 395 400
<210> 39
<211> 743
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 39
Met Ser Val Arg Ser Phe Gln Ala Arg Val Glu Cys Asp Lys Gln Thr
1 5 10 15
Met Glu His Leu Trp Arg Thr His Lys Val Phe Asn Glu Arg Leu Pro
20 25 30
Glu Ile Ile Lys Ile Leu Phe Lys Met Lys Arg Gly Glu Cys Gly Gln
35 40 45
Asn Asp Lys Gln Lys Ser Leu Tyr Lys Ser Ile Ser Gln Ser Ile Leu
50 55 60
Glu Ala Asn Ala Gln Asn Ala Asp Tyr Leu Leu Asn Ser Val Ser Ile
65 70 75 80
Lys Gly Trp Lys Pro Gly Thr Ala Lys Lys Tyr Arg Asn Ala Ser Phe
85 90 95
Thr Trp Ala Asp Asp Ala Ala Lys Leu Ser Ser Gln Gly Ile His Val
100 105 110
Tyr Asp Lys Lys Gln Val Leu Gly Asp Leu Pro Gly Met Met Ser Gln
115 120 125
Met Val Cys Arg Gln Ser Val Glu Ala Ile Ser Gly His Ile Glu Leu
130 135 140
Thr Lys Lys Trp Glu Lys Glu His Asn Glu Trp Leu Lys Glu Lys Glu
145 150 155 160
Lys Trp Glu Ser Glu Asp Glu His Lys Lys Tyr Leu Asp Leu Arg Glu
165 170 175
Lys Phe Glu Gln Phe Glu Gln Ser Ile Gly Gly Lys Ile Thr Lys Arg
180 185 190
Arg Gly Arg Trp His Leu Tyr Leu Lys Trp Leu Ser Asp Asn Pro Asp
195 200 205
Phe Ala Ala Trp Arg Gly Asn Lys Ala Val Ile Asn Pro Leu Ser Glu
210 215 220
Lys Ala Gln Ile Arg Ile Asn Lys Ala Lys Pro Asn Lys Lys Asn Ser
225 230 235 240
Val Glu Arg Asp Glu Phe Phe Lys Ala Asn Pro Glu Met Lys Ala Leu
245 250 255
Asp Asn Leu His Gly Tyr Tyr Glu Arg Asn Phe Val Arg Arg Arg Lys
260 265 270
Thr Lys Lys Asn Pro Asp Gly Phe Asp His Lys Pro Thr Phe Thr Leu
275 280 285
Pro His Pro Thr Ile His Pro Arg Trp Phe Val Phe Asn Lys Pro Lys
290 295 300
Thr Asn Pro Glu Gly Tyr Arg Lys Leu Ile Leu Pro Lys Lys Ala Gly
305 310 315 320
Asp Leu Gly Ser Leu Glu Met Arg Leu Leu Thr Gly Glu Lys Asn Lys
325 330 335
Gly Asn Tyr Pro Asp Asp Trp Ile Ser Val Lys Phe Lys Ala Asp Pro
340 345 350
Arg Leu Ser Leu Ile Arg Pro Val Lys Gly Arg Arg Val Val Arg Lys
355 360 365
Gly Lys Glu Gln Gly Gln Thr Lys Glu Thr Asp Ser Tyr Glu Phe Phe
370 375 380
Asp Lys His Leu Lys Lys Trp Arg Pro Ala Lys Leu Ser Gly Val Lys
385 390 395 400
Leu Ile Phe Pro Asp Lys Thr Pro Lys Ala Ala Tyr Leu Tyr Phe Thr
405 410 415
Cys Asp Ile Pro Asp Glu Pro Leu Thr Glu Thr Ala Lys Lys Ile Gln
420 425 430
Trp Leu Glu Thr Gly Asp Val Thr Lys Lys Gly Lys Lys Arg Lys Lys
435 440 445
Lys Val Leu Pro His Gly Leu Val Ser Cys Ala Val Asp Leu Ser Met
450 455 460
Arg Arg Gly Thr Thr Gly Phe Ala Thr Leu Cys Arg Tyr Glu Asn Gly
465 470 475 480
Lys Ile His Ile Leu Arg Ser Arg Asn Leu Trp Val Gly Tyr Lys Glu
485 490 495
Gly Lys Gly Cys His Pro Tyr Arg Trp Thr Glu Gly Pro Asp Leu Gly
500 505 510
His Ile Ala Lys His Lys Arg Glu Ile Arg Ile Leu Arg Ser Lys Arg
515 520 525
Gly Lys Pro Val Lys Gly Glu Glu Ser His Ile Asp Leu Gln Lys His
530 535 540
Ile Asp Tyr Met Gly Glu Asp Arg Phe Lys Lys Ala Ala Arg Thr Ile
545 550 555 560
Val Asn Phe Ala Leu Asn Thr Glu Asn Ala Ala Ser Lys Asn Gly Phe
565 570 575
Tyr Pro Arg Ala Asp Val Leu Leu Leu Glu Asn Leu Glu Gly Leu Ile
580 585 590
Pro Asp Ala Glu Lys Glu Arg Gly Ile Asn Arg Ala Leu Ala Gly Trp
595 600 605
Asn Arg Arg His Leu Val Glu Arg Val Ile Glu Met Ala Lys Asp Ala
610 615 620
Gly Phe Lys Arg Arg Val Phe Glu Ile Pro Pro Tyr Gly Thr Ser Gln
625 630 635 640
Val Cys Ser Lys Cys Gly Ala Leu Gly Arg Arg Tyr Ser Ile Ile Arg
645 650 655
Glu Asn Asn Arg Arg Glu Ile Arg Phe Gly Tyr Val Glu Lys Leu Phe
660 665 670
Ala Cys Pro Asn Cys Gly Tyr Cys Ala Asn Ala Asp His Asn Ala Ser
675 680 685
Val Asn Leu Asn Arg Arg Phe Leu Ile Glu Asp Ser Phe Lys Ser Tyr
690 695 700
Tyr Asp Trp Lys Arg Leu Ser Glu Lys Lys Gln Lys Glu Glu Ile Glu
705 710 715 720
Thr Ile Glu Ser Lys Leu Met Asp Lys Leu Cys Ala Met His Lys Ile
725 730 735
Ser Arg Gly Ser Ile Ser Lys
740
<210> 40
<211> 769
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 40
Met His Leu Trp Arg Thr His Cys Val Phe Asn Gln Arg Leu Pro Ala
1 5 10 15
Leu Leu Lys Arg Leu Phe Ala Met Arg Arg Gly Glu Val Gly Gly Asn
20 25 30
Glu Ala Gln Arg Gln Val Tyr Gln Arg Val Ala Gln Phe Val Leu Ala
35 40 45
Arg Asp Ala Lys Asp Ser Val Asp Leu Leu Asn Ala Val Ser Leu Arg
50 55 60
Lys Arg Ser Ala Asn Ser Ala Phe Lys Lys Lys Ala Thr Ile Ser Cys
65 70 75 80
Asn Gly Gln Ala Arg Glu Val Thr Gly Glu Glu Val Phe Ala Glu Ala
85 90 95
Val Ala Leu Ala Ser Lys Gly Val Phe Ala Tyr Asp Lys Asp Asp Met
100 105 110
Arg Ala Gly Leu Pro Asp Ser Leu Phe Gln Pro Leu Thr Arg Asp Ala
115 120 125
Val Ala Cys Met Arg Ser His Glu Glu Leu Val Ala Thr Trp Lys Lys
130 135 140
Glu Tyr Arg Glu Trp Arg Asp Arg Lys Ser Glu Trp Glu Ala Glu Pro
145 150 155 160
Glu His Ala Leu Tyr Leu Asn Leu Arg Pro Lys Phe Glu Glu Gly Glu
165 170 175
Ala Ala Arg Gly Gly Arg Phe Arg Lys Arg Ala Glu Arg Asp His Ala
180 185 190
Tyr Leu Asp Trp Leu Glu Ala Asn Pro Gln Leu Ala Ala Trp Arg Arg
195 200 205
Lys Ala Pro Pro Ala Val Val Pro Ile Asp Glu Ala Gly Lys Arg Arg
210 215 220
Ile Ala Arg Ala Lys Ala Trp Lys Gln Ala Ser Val Arg Ala Glu Glu
225 230 235 240
Phe Trp Lys Arg Asn Pro Glu Leu His Ala Leu His Lys Ile His Val
245 250 255
Gln Tyr Leu Arg Glu Phe Val Arg Pro Arg Arg Thr Arg Arg Asn Lys
260 265 270
Arg Arg Glu Gly Phe Lys Gln Arg Pro Thr Phe Thr Met Pro Asp Pro
275 280 285
Val Arg His Pro Arg Trp Cys Leu Phe Asn Ala Pro Gln Thr Ser Pro
290 295 300
Gln Gly Tyr Arg Leu Leu Arg Leu Pro Gln Ser Arg Arg Thr Val Gly
305 310 315 320
Ser Val Glu Leu Arg Leu Leu Thr Gly Pro Ser Asp Gly Ala Gly Phe
325 330 335
Pro Asp Ala Trp Val Asn Val Arg Phe Lys Ala Asp Pro Arg Leu Ala
340 345 350
Gln Leu Arg Pro Val Lys Val Pro Arg Thr Val Thr Arg Gly Lys Asn
355 360 365
Lys Gly Ala Lys Val Glu Ala Asp Gly Phe Arg Tyr Tyr Asp Asp Gln
370 375 380
Leu Leu Ile Glu Arg Asp Ala Gln Val Ser Gly Val Lys Leu Leu Phe
385 390 395 400
Arg Asp Ile Arg Met Ala Pro Phe Ala Asp Lys Pro Ile Glu Asp Arg
405 410 415
Leu Leu Ser Ala Thr Pro Tyr Leu Val Phe Ala Val Glu Ile Lys Asp
420 425 430
Glu Ala Arg Thr Glu Arg Ala Lys Ala Ile Arg Phe Asp Glu Thr Ser
435 440 445
Glu Leu Thr Lys Ser Gly Lys Lys Arg Lys Thr Leu Pro Ala Gly Leu
450 455 460
Val Ser Val Ala Val Asp Leu Asp Thr Arg Gly Val Gly Phe Leu Thr
465 470 475 480
Arg Ala Val Ile Gly Val Pro Glu Ile Gln Gln Thr His His Gly Val
485 490 495
Arg Leu Leu Gln Ser Arg Tyr Val Ala Val Gly Gln Val Glu Ala Arg
500 505 510
Ala Ser Gly Glu Ala Glu Trp Ser Pro Gly Pro Asp Leu Ala His Ile
515 520 525
Ala Arg His Lys Arg Glu Ile Arg Arg Leu Arg Gln Leu Arg Gly Lys
530 535 540
Pro Val Lys Gly Glu Arg Ser His Val Arg Leu Gln Ala His Ile Asp
545 550 555 560
Arg Met Gly Glu Asp Arg Phe Lys Lys Ala Ala Arg Lys Ile Val Asn
565 570 575
Glu Ala Leu Arg Gly Ser Asn Pro Ala Ala Gly Asp Pro Tyr Thr Arg
580 585 590
Ala Asp Val Leu Leu Tyr Glu Ser Leu Glu Thr Leu Leu Pro Asp Ala
595 600 605
Glu Arg Glu Arg Gly Ile Asn Arg Ala Leu Leu Arg Trp Asn Arg Ala
610 615 620
Lys Leu Ile Glu His Leu Lys Arg Met Cys Asp Asp Ala Gly Ile Arg
625 630 635 640
His Phe Pro Val Ser Pro Phe Gly Thr Ser Gln Val Cys Ser Lys Cys
645 650 655
Gly Ala Leu Gly Arg Arg Tyr Ser Leu Ala Arg Glu Asn Gly Arg Ala
660 665 670
Val Ile Arg Phe Gly Trp Val Glu Arg Leu Phe Ala Cys Pro Asn Pro
675 680 685
Glu Cys Pro Gly Arg Arg Pro Asp Arg Pro Asp Arg Pro Phe Thr Cys
690 695 700
Asn Ser Asp His Asn Ala Ser Val Asn Leu His Arg Val Phe Ala Leu
705 710 715 720
Gly Asp Gln Ala Val Ala Ala Phe Arg Ala Leu Ala Pro Arg Asp Ser
725 730 735
Pro Ala Arg Thr Leu Ala Val Lys Arg Val Glu Asp Thr Leu Arg Pro
740 745 750
Gln Leu Met Arg Val His Lys Leu Ala Asp Ala Gly Val Asp Ser Pro
755 760 765
Phe
<210> 41
<211> 666
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 41
Met Ala Thr Leu Val Tyr Arg Tyr Gly Val Arg Ala His Gly Ser Ala
1 5 10 15
Arg Gln Gln Asp Ala Val Val Ser Asp Pro Ala Met Leu Glu Gln Leu
20 25 30
Arg Leu Gly His Glu Leu Arg Asn Ala Leu Val Gly Val Gln His Arg
35 40 45
Tyr Glu Asp Gly Lys Arg Ala Val Trp Ser Gly Phe Ala Ser Val Ala
50 55 60
Ala Ala Asp His Arg Val Thr Thr Gly Glu Thr Ala Val Ala Glu Leu
65 70 75 80
Glu Lys Gln Ala Arg Ala Glu His Ser Ala Asp Arg Thr Ala Ala Thr
85 90 95
Arg Gln Gly Thr Ala Glu Ser Leu Lys Ala Ala Arg Ala Ala Val Lys
100 105 110
Gln Ala Arg Ala Asp Arg Lys Ala Ala Met Ala Ala Val Ala Glu Gln
115 120 125
Ala Lys Pro Lys Ile Gln Ala Leu Gly Asp Asp Arg Asp Ala Glu Ile
130 135 140
Lys Asp Leu Tyr Arg Arg Phe Cys Gln Asp Gly Val Leu Leu Pro Arg
145 150 155 160
Cys Gly Arg Cys Ala Gly Asp Leu Arg Ser Asp Gly Asp Cys Thr Asp
165 170 175
Cys Gly Ala Ala His Glu Pro Arg Lys Leu Tyr Trp Ala Thr Tyr Asn
180 185 190
Ala Ile Arg Glu Asp His Gln Thr Ala Val Lys Leu Val Glu Ala Lys
195 200 205
Arg Lys Ala Gly Gln Pro Ala Arg Leu Arg Phe Arg Arg Trp Thr Gly
210 215 220
Asp Gly Thr Leu Thr Val Gln Leu Gln Arg Met His Gly Pro Ala Cys
225 230 235 240
Arg Cys Val Thr Cys Ala Glu Lys Leu Thr Arg Arg Ala Arg Lys Thr
245 250 255
Asp Pro Gln Ala Pro Ala Val Ala Ala Asp Pro Ala Tyr Pro Pro Thr
260 265 270
Asp Pro Pro Arg Asp Pro Ala Leu Leu Ala Ser Gly Gln Gly Lys Trp
275 280 285
Arg Asn Val Leu Gln Leu Gly Thr Trp Ile Pro Pro Gly Glu Trp Ser
290 295 300
Ala Met Ser Arg Ala Glu Arg Arg Arg Val Gly Arg Ser His Ile Gly
305 310 315 320
Trp Gln Leu Gly Gly Gly Arg Gln Leu Thr Leu Pro Val Gln Leu His
325 330 335
Arg Gln Met Pro Ala Asp Ala Asp Val Ala Met Ala Gln Leu Thr Arg
340 345 350
Val Arg Val Gly Gly Arg His Arg Met Ser Val Ala Leu Thr Ala Lys
355 360 365
Leu Pro Asp Pro Pro Gln Val Gln Gly Leu Pro Pro Val Ala Leu His
370 375 380
Leu Gly Trp Arg Gln Arg Pro Asp Gly Ser Leu Arg Val Ala Thr Trp
385 390 395 400
Ala Cys Pro Gln Pro Leu Asp Leu Pro Pro Ala Val Ala Asp Val Val
405 410 415
Val Ser His Gly Gly Arg Trp Gly Glu Val Ile Met Pro Ala Arg Trp
420 425 430
Leu Ala Asp Ala Glu Val Pro Pro Arg Leu Leu Gly Arg Arg Asp Lys
435 440 445
Ala Met Glu Pro Val Leu Glu Ala Leu Ala Asp Trp Leu Glu Ala His
450 455 460
Thr Glu Ala Cys Thr Ala Arg Met Thr Pro Ala Leu Val Arg Arg Trp
465 470 475 480
Arg Ser Gln Gly Arg Leu Ala Gly Leu Thr Asn Arg Trp Arg Gly Gln
485 490 495
Pro Pro Thr Gly Ser Ala Glu Ile Leu Thr Tyr Leu Glu Ala Trp Arg
500 505 510
Ile Gln Asp Lys Leu Leu Trp Glu Arg Glu Ser His Leu Arg Arg Arg
515 520 525
Leu Ala Ala Arg Arg Asp Asp Ala Trp Arg Arg Val Ala Ser Trp Leu
530 535 540
Ala Arg His Ala Gly Val Leu Val Val Asp Asp Ala Asp Ile Ala Glu
545 550 555 560
Leu Arg Arg Arg Asp Asp Pro Ala Asp Thr Asp Pro Thr Met Pro Ala
565 570 575
Ser Ala Ala Gln Ala Ala Arg Ala Arg Ala Ala Leu Ala Ala Pro Gly
580 585 590
Arg Leu Arg His Leu Ala Thr Ile Thr Ala Thr Arg Asp Gly Leu Gly
595 600 605
Val His Thr Val Ala Ser Ala Gly Leu Thr Arg Leu His Arg Lys Cys
610 615 620
Gly His Gln Ala Gln Pro Asp Pro Arg Tyr Ala Ala Ser Ala Val Val
625 630 635 640
Thr Cys Pro Gly Cys Gly Asn Gly Tyr Asp Gln Asp Tyr Asn Ala Ala
645 650 655
Met Leu Met Leu Asp Arg Gln Gln Gln Pro
660 665
<210> 42
<211> 564
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 42
Met Ser Arg Val Glu Leu His Arg Ala Tyr Lys Phe Arg Leu Tyr Pro
1 5 10 15
Thr Pro Ala Gln Val Ala Glu Leu Ala Glu Trp Glu Arg Gln Leu Arg
20 25 30
Arg Leu Tyr Asn Leu Ala His Ser Gln Arg Leu Ala Ala Met Gln Arg
35 40 45
His Val Arg Pro Lys Ser Pro Gly Val Leu Lys Ser Glu Cys Leu Ser
50 55 60
Cys Gly Ala Val Ala Val Ala Glu Ile Gly Thr Asp Gly Lys Ala Lys
65 70 75 80
Lys Thr Val Lys His Ala Val Gly Cys Ser Val Leu Glu Cys Arg Ser
85 90 95
Cys Gly Gly Ser Pro Asp Ala Glu Gly Arg Thr Ala His Thr Ala Ala
100 105 110
Cys Ser Phe Val Asp Tyr Tyr Arg Gln Gly Arg Glu Met Thr Gln Leu
115 120 125
Leu Glu Glu Asp Asp Gln Leu Ala Arg Val Val Cys Ser Ala Arg Gln
130 135 140
Glu Thr Leu Arg Asp Leu Glu Lys Ala Trp Gln Arg Trp His Lys Met
145 150 155 160
Pro Gly Phe Gly Lys Pro His Phe Lys Lys Arg Ile Asp Ser Cys Arg
165 170 175
Ile Tyr Phe Ser Thr Pro Lys Ser Trp Ala Val Asp Leu Gly Tyr Leu
180 185 190
Ser Phe Thr Gly Val Ala Ser Ser Val Gly Arg Ile Lys Ile Arg Gln
195 200 205
Asp Arg Val Trp Pro Gly Asp Ala Lys Phe Ser Ser Cys His Val Val
210 215 220
Arg Asp Val Asp Glu Trp Tyr Ala Val Phe Pro Leu Thr Phe Thr Lys
225 230 235 240
Glu Ile Glu Lys Pro Lys Gly Gly Ala Val Gly Ile Asn Arg Gly Ala
245 250 255
Val His Ala Ile Ala Asp Ser Thr Gly Arg Val Val Asp Ser Pro Lys
260 265 270
Phe Tyr Ala Arg Ser Leu Gly Val Ile Arg His Arg Ala Arg Leu Leu
275 280 285
Asp Arg Lys Val Pro Phe Gly Arg Ala Val Lys Pro Ser Pro Thr Lys
290 295 300
Tyr His Gly Leu Pro Lys Ala Asp Ile Asp Ala Ala Ala Ala Arg Val
305 310 315 320
Asn Ala Ser Pro Gly Arg Leu Val Tyr Glu Ala Arg Ala Arg Gly Ser
325 330 335
Ile Ala Ala Ala Glu Ala His Leu Ala Ala Leu Val Leu Pro Ala Pro
340 345 350
Arg Gln Thr Ser Gln Leu Pro Ser Glu Gly Arg Asn Arg Glu Arg Ala
355 360 365
Arg Arg Phe Leu Ala Leu Ala His Gln Arg Val Arg Arg Gln Arg Glu
370 375 380
Trp Phe Leu His Asn Glu Ser Ala His Tyr Ala Gln Ser Tyr Thr Lys
385 390 395 400
Ile Ala Ile Glu Asp Trp Ser Thr Lys Glu Met Thr Ser Ser Glu Pro
405 410 415
Arg Asp Ala Glu Glu Met Lys Arg Val Thr Arg Ala Arg Asn Arg Ser
420 425 430
Ile Leu Asp Val Gly Trp Tyr Glu Leu Gly Arg Gln Ile Ala Tyr Lys
435 440 445
Ser Glu Ala Thr Gly Ala Glu Phe Ala Lys Val Asp Pro Gly Leu Arg
450 455 460
Glu Thr Glu Thr His Val Pro Glu Ala Ile Val Arg Glu Arg Asp Val
465 470 475 480
Asp Val Ser Gly Met Leu Arg Gly Glu Ala Gly Ile Ser Gly Thr Cys
485 490 495
Ser Arg Cys Gly Gly Leu Leu Arg Ala Ser Ala Ser Gly His Ala Asp
500 505 510
Ala Glu Cys Glu Val Cys Leu His Val Glu Val Gly Asp Val Asn Ala
515 520 525
Ala Val Asn Val Leu Lys Arg Ala Met Phe Pro Gly Ala Ala Pro Pro
530 535 540
Ser Lys Glu Lys Ala Lys Val Thr Ile Gly Ile Lys Gly Arg Lys Lys
545 550 555 560
Lys Arg Ala Ala
<210> 43
<211> 565
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 43
Met Ser Arg Val Glu Leu His Arg Ala Tyr Lys Phe Arg Leu Tyr Pro
1 5 10 15
Thr Pro Val Gln Val Ala Glu Leu Ser Glu Trp Glu Arg Gln Leu Arg
20 25 30
Arg Leu Tyr Asn Leu Gly His Glu Gln Arg Leu Leu Thr Leu Thr Arg
35 40 45
His Leu Arg Pro Lys Ser Pro Gly Val Leu Lys Gly Glu Cys Leu Ser
50 55 60
Cys Asp Ser Thr Gln Val Gln Glu Val Gly Ala Asp Gly Arg Pro Lys
65 70 75 80
Thr Thr Val Arg His Ala Glu Gln Cys Pro Thr Leu Ala Cys Arg Ser
85 90 95
Cys Gly Ala Leu Arg Asp Ala Glu Gly Arg Thr Ala His Thr Val Ala
100 105 110
Cys Ala Phe Val Asp Tyr Tyr Arg Gln Gly Arg Glu Met Thr Glu Leu
115 120 125
Leu Ala Ala Asp Asp Gln Leu Ala Arg Val Val Cys Ser Ala Arg Gln
130 135 140
Glu Val Leu Arg Asp Leu Asp Lys Ala Trp Gln Arg Trp Arg Lys Met
145 150 155 160
Pro Gly Phe Gly Lys Pro Arg Phe Lys Arg Arg Thr Asp Ser Cys Arg
165 170 175
Ile Tyr Phe Ser Thr Pro Lys Ala Trp Lys Leu Glu Gly Gly His Leu
180 185 190
Ser Phe Thr Gly Ala Ala Thr Thr Val Gly Ala Ile Lys Met Arg Gln
195 200 205
Asp Arg Asn Trp Pro Ala Ser Val Gln Phe Ser Ser Cys His Val Val
210 215 220
Arg Asp Val Asp Glu Trp Tyr Ala Val Phe Pro Leu Thr Phe Val Ala
225 230 235 240
Glu Val Ala Arg Pro Lys Gly Gly Ala Val Gly Ile Asn Arg Gly Ala
245 250 255
Val His Ala Ile Ala Asp Ser Thr Gly Arg Val Val Asp Ser Pro Arg
260 265 270
Tyr Tyr Ala Arg Ala Leu Gly Val Ile Arg His Arg Ala Arg Leu Phe
275 280 285
Asp Arg Lys Val Pro Ser Gly His Ala Val Lys Pro Ser Pro Thr Lys
290 295 300
Tyr Arg Gly Leu Ser Ala Ile Glu Val Asp Arg Val Ala Arg Ala Thr
305 310 315 320
Gly Phe Thr Pro Gly Arg Val Val Thr Glu Ala Leu Asn Arg Gly Gly
325 330 335
Val Ala Tyr Ala Glu Cys Ala Leu Ala Ala Ile Ala Val Leu Gly His
340 345 350
Gly Pro Glu Arg Pro Leu Thr Ser Asp Gly Arg Asn Arg Glu Lys Ala
355 360 365
Arg Lys Phe Leu Ala Leu Ala His Gln Arg Val Arg Arg Gln Arg Glu
370 375 380
Trp Phe Leu His Asn Glu Ser Ala His Tyr Ala Arg Thr Tyr Ser Lys
385 390 395 400
Ile Ala Ile Glu Asp Trp Ser Thr Lys Glu Met Thr Ala Ser Glu Pro
405 410 415
Gln Gly Glu Glu Thr Arg Arg Val Thr Arg Ser Arg Asn Arg Ser Ile
420 425 430
Leu Asp Val Gly Trp Tyr Glu Leu Gly Arg Gln Leu Ala Tyr Lys Thr
435 440 445
Glu Ala Thr Gly Ala Glu Phe Ala Gln Val Asp Pro Gly Leu Lys Glu
450 455 460
Thr Glu Thr Asn Val Pro Lys Ala Ile Ala Asp Ala Arg Asp Val Asp
465 470 475 480
Val Ser Gly Met Leu Arg Gly Glu Ala Gly Ile Ser Gly Thr Cys Ser
485 490 495
Lys Cys Gly Gly Leu Leu Arg Ala Pro Ala Ser Gly His Ala Asp Ala
500 505 510
Glu Cys Glu Ile Cys Leu Asn Val Glu Val Gly Asp Val Asn Ala Ala
515 520 525
Val Asn Val Leu Lys Arg Ala Met Phe Pro Gly Asp Ala Pro Pro Ala
530 535 540
Ser Gly Glu Lys Pro Lys Val Ser Ile Gly Ile Lys Gly Arg Gln Lys
545 550 555 560
Lys Lys Lys Ala Ala
565
<210> 44
<211> 499
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 44
Met Glu Ala Ile Ala Thr Gly Met Ser Pro Glu Arg Arg Val Glu Leu
1 5 10 15
Gly Ile Leu Pro Gly Ser Val Glu Leu Lys Arg Ala Tyr Lys Phe Arg
20 25 30
Leu Tyr Pro Met Lys Val Gln Gln Ala Glu Leu Ser Glu Trp Glu Arg
35 40 45
Gln Leu Arg Arg Leu Tyr Asn Leu Ala His Glu Gln Arg Leu Ala Ala
50 55 60
Leu Leu Arg Tyr Arg Asp Trp Asp Phe Gln Lys Gly Ala Cys Pro Ser
65 70 75 80
Cys Arg Val Ala Val Pro Gly Val His Thr Ala Ala Cys Asp His Val
85 90 95
Asp Tyr Phe Arg Gln Ala Arg Glu Met Thr Gln Leu Leu Glu Val Asp
100 105 110
Ala Gln Leu Ser Arg Val Ile Cys Cys Ala Arg Gln Glu Val Leu Arg
115 120 125
Asp Leu Asp Lys Ala Trp Gln Arg Trp Arg Lys Lys Leu Gly Gly Arg
130 135 140
Pro Arg Phe Lys Arg Arg Thr Asp Ser Cys Arg Ile Tyr Leu Ser Thr
145 150 155 160
Pro Lys His Trp Glu Ile Ala Gly Arg Tyr Leu Arg Leu Ser Gly Leu
165 170 175
Ala Ser Ser Val Gly Glu Ile Arg Ile Glu Gln Asp Arg Ala Phe Pro
180 185 190
Glu Gly Ala Leu Leu Ser Ser Cys Ser Ile Val Arg Asp Val Asp Glu
195 200 205
Trp Tyr Ala Cys Leu Pro Leu Thr Phe Thr Gln Pro Ile Glu Arg Ala
210 215 220
Pro His Arg Ser Val Gly Leu Asn Arg Gly Val Val His Ala Leu Ala
225 230 235 240
Asp Ser Asp Gly Arg Val Val Asp Ser Pro Lys Phe Phe Glu Arg Ala
245 250 255
Leu Ala Thr Val Gln Lys Arg Ser Arg Asp Leu Ala Arg Lys Val Ser
260 265 270
Gly Ser Arg Asn Ala His Lys Ala Arg Ile Lys Leu Ala Lys Ala His
275 280 285
Gln Arg Val Arg Arg Gln Arg Ala Ala Phe Leu His Gln Glu Ser Ala
290 295 300
Tyr Tyr Ser Lys Gly Phe Asp Leu Val Ala Leu Glu Asp Met Ser Val
305 310 315 320
Arg Lys Met Thr Ala Thr Ala Gly Glu Ala Pro Glu Met Gly Arg Gly
325 330 335
Ala Gln Arg Asp Leu Asn Arg Gly Ile Leu Asp Val Gly Trp Tyr Glu
340 345 350
Leu Ala Arg Gln Ile Asp Tyr Lys Arg Leu Ala His Gly Gly Glu Leu
355 360 365
Leu Arg Val Asp Pro Gly Gln Thr Thr Pro Leu Ala Cys Val Thr Glu
370 375 380
Glu Gln Pro Ala Arg Gly Ile Ser Ser Ala Cys Ala Val Cys Gly Ile
385 390 395 400
Pro Leu Ala Arg Pro Ala Ser Gly Asn Ala Arg Met Arg Cys Thr Ala
405 410 415
Cys Gly Ser Ser Gln Val Gly Asp Val Asn Ala Ala Glu Asn Val Leu
420 425 430
Thr Arg Ala Leu Ser Ser Ala Pro Ser Gly Pro Lys Ser Pro Lys Ala
435 440 445
Ser Ile Lys Ile Lys Gly Arg Gln Lys Arg Leu Gly Thr Pro Ala Asn
450 455 460
Arg Ala Gly Glu Ala Ser Gly Gly Asp Pro Pro Val Arg Gly Pro Val
465 470 475 480
Glu Gly Gly Thr Leu Ala Tyr Val Val Glu Pro Val Ser Glu Ser Gln
485 490 495
Ser Asp Thr
<210> 45
<211> 560
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 45
Met Thr Val Arg Thr Tyr Lys Tyr Arg Ala Tyr Pro Thr Pro Glu Gln
1 5 10 15
Ala Glu Ala Leu Thr Ser Trp Leu Arg Phe Ala Ser Gln Leu Tyr Asn
20 25 30
Ala Ala Leu Glu His Arg Lys Asn Ala Trp Gly Arg His Asp Ala His
35 40 45
Gly Arg Gly Phe Arg Phe Trp Asp Gly Asp Ala Ala Pro Arg Lys Lys
50 55 60
Ser Asp Pro Pro Gly Arg Trp Val Tyr Arg Gly Gly Gly Gly Ala His
65 70 75 80
Ile Ser Lys Asn Asp Gln Gly Lys Leu Leu Thr Glu Phe Arg Arg Glu
85 90 95
His Ala Glu Leu Leu Pro Pro Gly Met Pro Ala Leu Val Gln His Glu
100 105 110
Val Leu Ala Arg Leu Glu Arg Ser Met Ala Ala Phe Phe Gln Arg Ala
115 120 125
Thr Lys Gly Gln Lys Ala Gly Tyr Pro Arg Trp Arg Ser Glu His Arg
130 135 140
Tyr Asp Ser Leu Thr Phe Gly Leu Thr Ser Pro Ser Lys Glu Arg Phe
145 150 155 160
Asp Pro Glu Thr Gly Glu Ser Leu Gly Arg Gly Lys Thr Val Gly Ala
165 170 175
Gly Thr Tyr His Asn Gly Asp Leu Arg Leu Thr Gly Leu Gly Glu Leu
180 185 190
Arg Ile Leu Glu His Arg Arg Ile Pro Met Gly Ala Ile Pro Lys Ser
195 200 205
Val Ile Val Arg Arg Ser Gly Lys Arg Trp Phe Val Ser Ile Ala Met
210 215 220
Glu Met Pro Ser Val Glu Pro Ala Ala Ser Gly Arg Pro Ala Val Gly
225 230 235 240
Leu Asp Met Gly Val Val Thr Trp Gly Thr Ala Phe Thr Ala Asp Thr
245 250 255
Ser Ala Ala Ala Ala Leu Val Ala Asp Leu Arg Arg Met Ala Thr Asp
260 265 270
Pro Ser Asp Cys Arg Arg Leu Glu Glu Leu Glu Arg Glu Ala Ala Gln
275 280 285
Leu Ser Glu Val Leu Ala His Cys Arg Ala Arg Gly Leu Asp Pro Ala
290 295 300
Arg Pro Arg Arg Cys Pro Lys Glu Leu Thr Lys Leu Tyr Arg Arg Ser
305 310 315 320
Leu His Arg Leu Gly Glu Leu Asp Arg Ala Cys Ala Arg Ile Arg Arg
325 330 335
Arg Leu Gln Ala Ala His Asp Ile Ala Glu Pro Val Pro Asp Glu Ala
340 345 350
Gly Ser Ala Val Leu Ile Glu Gly Ser Asn Ala Gly Met Arg His Ala
355 360 365
Arg Arg Val Ala Arg Thr Gln Arg Arg Val Ala Arg Arg Thr Arg Ala
370 375 380
Gly His Ala His Ser Asn Arg Arg Lys Lys Ala Val Gln Ala Tyr Ala
385 390 395 400
Arg Ala Lys Glu Arg Glu Arg Ser Ala Arg Gly Asp His Arg His Lys
405 410 415
Val Ser Arg Ala Leu Val Arg Gln Phe Glu Glu Ile Ser Val Glu Ala
420 425 430
Leu Asp Ile Lys Gln Leu Thr Val Ala Pro Glu His Asn Pro Asp Pro
435 440 445
Gln Pro Asp Leu Pro Ala His Val Gln Arg Arg Arg Asn Arg Gly Glu
450 455 460
Leu Asp Ala Ala Trp Gly Ala Phe Phe Ala Ala Leu Asp Tyr Lys Ala
465 470 475 480
Ala Asp Ala Gly Gly Arg Val Ala Arg Lys Pro Ala Pro His Thr Thr
485 490 495
Gln Glu Cys Ala Arg Cys Gly Thr Leu Val Pro Lys Pro Ile Ser Leu
500 505 510
Arg Val His Arg Cys Pro Ala Cys Gly Tyr Thr Ala Pro Arg Thr Val
515 520 525
Asn Ser Ala Arg Asn Val Leu Gln Arg Pro Leu Glu Glu Pro Gly Arg
530 535 540
Ala Gly Pro Ser Gly Ala Asn Gly Arg Gly Val Pro His Ala Val Ala
545 550 555 560
<210> 46
<211> 404
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 46
Met Asn Cys Arg Tyr Arg Tyr Arg Ile Tyr Pro Thr Pro Gly Gln Arg
1 5 10 15
Gln Ser Leu Ala Arg Leu Phe Gly Cys Val Arg Val Val Trp Asn Asp
20 25 30
Ala Leu Phe Leu Cys Arg Gln Ser Glu Lys Leu Pro Lys Asn Ser Glu
35 40 45
Leu Gln Lys Leu Cys Ile Thr Gln Ala Lys Lys Thr Glu Ala Arg Gly
50 55 60
Trp Leu Gly Gln Val Ser Ala Ile Pro Leu Gln Gln Ser Val Ala Asp
65 70 75 80
Leu Gly Val Ala Phe Lys Asn Phe Phe Gln Ser Arg Ser Gly Lys Arg
85 90 95
Lys Gly Lys Lys Val Asn Pro Pro Arg Val Lys Arg Arg Asn Asn Arg
100 105 110
Gln Gly Ala Arg Phe Thr Arg Gly Gly Phe Lys Val Lys Thr Ser Lys
115 120 125
Val Tyr Leu Ala Arg Ile Gly Asp Ile Lys Ile Lys Trp Ser Arg Pro
130 135 140
Leu Pro Ser Glu Pro Ser Ser Val Thr Val Ile Lys Asp Cys Ala Gly
145 150 155 160
Gln Tyr Phe Leu Ser Phe Val Val Glu Val Lys Pro Glu Ile Lys Pro
165 170 175
Pro Lys Asn Pro Ser Ile Gly Ile Asp Leu Gly Leu Lys Thr Phe Ala
180 185 190
Ser Cys Ser Asn Gly Glu Lys Ile Asp Ser Pro Asp Tyr Ser Arg Leu
195 200 205
Tyr Arg Lys Leu Lys Arg Cys Gln Arg Arg Leu Ala Lys Arg Gln Arg
210 215 220
Gly Ser Lys Arg Arg Glu Arg Met Arg Val Lys Val Ala Lys Leu Asn
225 230 235 240
Ala Gln Ile Arg Asp Lys Arg Lys Asp Phe Leu His Lys Leu Ser Thr
245 250 255
Lys Val Val Asn Glu Asn Gln Val Ile Ala Leu Glu Asp Leu Asn Val
260 265 270
Gly Gly Met Leu Lys Asn Arg Lys Leu Ser Arg Ala Ile Ser Gln Ala
275 280 285
Gly Trp Tyr Glu Phe Arg Ser Leu Cys Glu Gly Lys Ala Glu Lys His
290 295 300
Asn Arg Asp Phe Arg Val Ile Ser Arg Trp Glu Pro Thr Ser Gln Val
305 310 315 320
Cys Ser Glu Cys Gly Tyr Arg Trp Gly Lys Ile Asp Leu Ser Val Arg
325 330 335
Ser Ile Val Cys Ile Asn Cys Gly Val Glu His Asp Arg Asp Asp Asn
340 345 350
Ala Ser Val Asn Ile Glu Gln Ala Gly Leu Lys Val Gly Val Gly His
355 360 365
Thr His Asp Ser Lys Arg Thr Gly Ser Ala Cys Lys Thr Ser Asn Gly
370 375 380
Ala Val Cys Val Glu Pro Ser Thr His Arg Glu Tyr Val Gln Leu Thr
385 390 395 400
Leu Phe Asp Trp
<210> 47
<211> 392
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 47
Met Lys Ser Arg Trp Thr Phe Arg Cys Tyr Pro Thr Pro Glu Gln Glu
1 5 10 15
Gln His Leu Ala Arg Thr Phe Gly Cys Val Arg Phe Val Trp Asn Trp
20 25 30
Ala Leu Arg Ala Arg Thr Asp Ala Phe Arg Ala Gly Glu Arg Ile Gly
35 40 45
Tyr Pro Ala Thr Asp Lys Ala Leu Thr Leu Leu Lys Gln Gln Pro Glu
50 55 60
Thr Val Trp Leu Asn Glu Val Ser Ser Val Cys Leu Gln Gln Ala Leu
65 70 75 80
Arg Asp Leu Gln Val Ala Phe Ser Asn Phe Phe Asp Lys Arg Ala Ala
85 90 95
His Pro Ser Phe Lys Arg Lys Glu Ala Arg Gln Ser Ala Asn Tyr Thr
100 105 110
Glu Arg Gly Phe Ser Phe Asp His Glu Arg Arg Ile Leu Lys Leu Ala
115 120 125
Lys Ile Gly Ala Ile Lys Val Lys Trp Ser Arg Lys Ala Ile Pro His
130 135 140
Pro Ser Ser Ile Arg Leu Ile Arg Thr Ala Ser Gly Lys Tyr Phe Val
145 150 155 160
Ser Leu Val Val Glu Thr Gln Pro Ala Pro Met Pro Glu Thr Gly Glu
165 170 175
Ser Val Gly Val Asp Phe Gly Val Ala Arg Leu Ala Thr Leu Ser Asn
180 185 190
Gly Glu Arg Ile Ser Asn Pro Lys His Gly Ala Lys Trp Gln Arg Arg
195 200 205
Leu Ala Phe Tyr Gln Lys Arg Leu Ala Arg Ala Thr Lys Gly Ser Lys
210 215 220
Arg Arg Met Arg Ile Lys Arg His Val Ala Arg Ile His Glu Lys Ile
225 230 235 240
Gly Asn Ser Arg Ser Asp Thr Leu His Lys Leu Ser Thr Asp Leu Val
245 250 255
Thr Arg Phe Asp Leu Ile Cys Val Glu Asp Leu Asn Leu Arg Gly Met
260 265 270
Val Lys Asn His Ser Leu Ala Arg Ser Leu His Asp Ala Ser Ile Gly
275 280 285
Ser Ala Ile Arg Met Ile Glu Glu Lys Ala Glu Arg Tyr Gly Lys Asn
290 295 300
Val Val Lys Ile Asp Arg Trp Phe Pro Ser Ser Lys Thr Cys Ser Asp
305 310 315 320
Cys Gly His Ile Val Glu Gln Leu Pro Leu Asn Val Arg Glu Trp Thr
325 330 335
Cys Pro Glu Cys Gly Thr Thr His Asp Arg Asp Ala Asn Ala Ala Ala
340 345 350
Asn Ile Leu Ala Val Gly Gln Thr Val Ser Ala His Gly Gly Thr Val
355 360 365
Arg Arg Ser Arg Ala Lys Ala Ser Glu Arg Lys Ser Gln Arg Ser Ala
370 375 380
Asn Arg Gln Gly Val Asn Arg Ala
385 390
<210> 48
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 48
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 49
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 49
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 50
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 50
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 51
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 51
gttgcattcc ttcattcgtc tattcgggtt ctgcaac 37
<210> 52
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 52
gttgcattcc ttcattcgtc tatccgggtt ctgcaag 37
<210> 53
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 53
gttgcagaac ccgaatagac gaatgaagga atgcaac 37
<210> 54
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 54
ctatcatatt cagaacaaag ggattaagga atgcaac 37
<210> 55
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 55
ctttcatact cagaacaaag ggattaagga atgcaac 37
<210> 56
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 56
gtctacaact cattgataga aatcaatgag ttagaca 37
<210> 57
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 57
gttataaagg cggggatcgc gaccgagcga ttgaaag 37
<210> 58
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 58
gttgcattcc ttaattcatt ttctcaatat cggaaac 37
<210> 59
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 59
gttgcagaaa tagaataaag gaattaagga atgcaac 37
<210> 60
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 60
ctttcatact cagaacaaag ggattaagga atgcaac 37
<210> 61
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 61
atttcatact cagaacaaag ggattaagga atgcaac 37
<210> 62
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 62
gtttcagcgc acgaattaac gagatgagag atgcaact 38
<210> 63
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 63
cttgcagaag ctgaatagac gaatcaagga atgcaac 37
<210> 64
<211> 39
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 64
cacttgcagg ccttgaatag aggagttaag gaatgcaac 39
<210> 65
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 65
gtctccatga ctgaaaagtc gtggccgaat tgaaac 36
<210> 66
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 66
gttgcagcgc ccgaactgac gagacgagag atgcaac 37
<210> 67
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 67
gttgcgcgaa tagaataaag gaattaagga atgcaac 37
<210> 68
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 68
agttgcattc cttaatccct ctgttcagtt tgtgcaat 38
<210> 69
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 69
gttgcattcc tagtttctct aattagcact gtgcaac 37
<210> 70
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 70
gttgcggcgc gcgaataaac gagactagga atgcaac 37
<210> 71
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 71
actagttgca ttccttaatc cctttgttct gaatatgcta g 41
<210> 72
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 72
ctttcatatt cagaacaaag ggattaagga atgcaac 37
<210> 73
<211> 39
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 73
gttgcagtcc ttaaccccta gtttctgaat atgaaagat 39
<210> 74
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 74
gttgcagccc ccgaactaac gagatgagag atgcaac 37
<210> 75
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 75
cttgcagaac aatcatatat gactaatcag actgcaac 38
<210> 76
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 76
gttgcactca ccggtgctca cgacgtaggg atgcaac 37
<210> 77
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 77
gtccctactc gctagggaaa ctaattgaat ggaaac 36
<210> 78
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 78
gttgcattcg ggtgcaaaac agggagtaga gtgtaac 37
<210> 79
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 79
cttccaaact cgagccagtg gggagagaag tggca 35
<210> 80
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 80
cctgtagacc ggtctcattc tgagaggggt atgcaact 38
<210> 81
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 81
gtctcgagac cctacagatt ttggagaggg gtgggac 37
<210> 82
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 82
gtcccacccc tctccaaaat ctgtagggtc tcgagac 37
<210> 83
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 83
gtagcaggac tctcctcgag agaaacaggg gtatgct 37
<210> 84
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 84
gtacaatacc tctcctttaa gagagggagg ggtacgctac 40
<210> 85
<211> 31
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 85
ccccctcgtt tccttcaggg gattcctttc c 31
<210> 86
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 86
ggttcccccg ggcgcgggtg gggtggcg 28
<210> 87
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 87
ggctgctccg ggtgcgcgtg gagcgagg 28
<210> 88
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 88
gttttatacc ctttagaatt taaactgtct aaaag 35
<210> 89
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 89
attgcaccgg ccaacgcaaa tctgattgat ggacac 36
<210> 90
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 90
gccgcagcgg ccgacgcggc cctgatcgat ggacac 36
<210> 91
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 91
gtcgaaatgc ccgcgcgggg gcgtcgtacc cgcgac 36
<210> 92
<211> 29
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 92
ggctagcccg tgcgcgcagg gacgagtgg 29
<210> 93
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 93
gcccgtgcgc gcagggacga gtgg 24
<210> 94
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 94
gttgcagcgg ccgacggagc gcgagcgtgg atgccac 37
<210> 95
<211> 29
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 95
ccatcgcccc gcgcgcacgt ggatgagcc 29
<210> 96
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 96
ctttagactt ctccggaagt cgaattaatg gaaac 35
<210> 97
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 97
gggcgccccg cgcgagcggg ggttgaag 28
<210> 98
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 98
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 99
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 99
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 100
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 100
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10
<210> 101
<211> 84
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 101
Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala
1 5 10 15
Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser
20 25 30
Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile
35 40 45
Thr Ser Asn Gly Gly Arg Val Lys Cys Met Gln Val Trp Pro Pro Ile
50 55 60
Gly Lys Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Thr Arg
65 70 75 80
Asp Ser Arg Ala
<210> 102
<211> 57
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 102
Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala
1 5 10 15
Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser
20 25 30
Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile
35 40 45
Thr Ser Asn Gly Gly Arg Val Lys Ser
50 55
<210> 103
<211> 85
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 103
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
1 5 10 15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
20 25 30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
35 40 45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys
50 55 60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65 70 75 80
Gly Arg Val Asn Cys
85
<210> 104
<211> 76
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 104
Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Gln Asn Pro Ser Leu
1 5 10 15
Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val
20 25 30
Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser
35 40 45
Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg
50 55 60
Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys
65 70 75
<210> 105
<211> 76
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 105
Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Trp Asn Pro Ser Leu
1 5 10 15
Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val
20 25 30
Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser
35 40 45
Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg
50 55 60
Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys
65 70 75
<210> 106
<211> 72
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 106
Met Ala Gln Ile Asn Asn Met Ala Gln Gly Ile Gln Thr Leu Asn Pro
1 5 10 15
Asn Ser Asn Phe His Lys Pro Gln Val Pro Lys Ser Ser Ser Phe Leu
20 25 30
Val Phe Gly Ser Lys Lys Leu Lys Asn Ser Ala Asn Ser Met Leu Val
35 40 45
Leu Lys Lys Asp Ser Ile Phe Met Gln Leu Phe Cys Ser Phe Arg Ile
50 55 60
Ser Ala Ser Val Ala Thr Ala Cys
65 70
<210> 107
<211> 69
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 107
Met Ala Ala Leu Val Thr Ser Gln Leu Ala Thr Ser Gly Thr Val Leu
1 5 10 15
Ser Val Thr Asp Arg Phe Arg Arg Pro Gly Phe Gln Gly Leu Arg Pro
20 25 30
Arg Asn Pro Ala Asp Ala Ala Leu Gly Met Arg Thr Val Gly Ala Ser
35 40 45
Ala Ala Pro Lys Gln Ser Arg Lys Pro His Arg Phe Asp Arg Arg Cys
50 55 60
Leu Ser Met Val Val
65
<210> 108
<211> 77
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 108
Met Ala Ala Leu Thr Thr Ser Gln Leu Ala Thr Ser Ala Thr Gly Phe
1 5 10 15
Gly Ile Ala Asp Arg Ser Ala Pro Ser Ser Leu Leu Arg His Gly Phe
20 25 30
Gln Gly Leu Lys Pro Arg Ser Pro Ala Gly Gly Asp Ala Thr Ser Leu
35 40 45
Ser Val Thr Thr Ser Ala Arg Ala Thr Pro Lys Gln Gln Arg Ser Val
50 55 60
Gln Arg Gly Ser Arg Arg Phe Pro Ser Val Val Val Cys
65 70 75
<210> 109
<211> 57
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 109
Met Ala Ser Ser Val Leu Ser Ser Ala Ala Val Ala Thr Arg Ser Asn
1 5 10 15
Val Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ala
20 25 30
Ala Ser Phe Pro Val Ser Arg Lys Gln Asn Leu Asp Ile Thr Ser Ile
35 40 45
Ala Ser Asn Gly Gly Arg Val Gln Cys
50 55
<210> 110
<211> 65
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 110
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
1 5 10 15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
20 25 30
Arg Arg Thr Ser Ser Thr Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
35 40 45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
50 55 60
Ala
65
<210> 111
<211> 72
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 111
Met Gly Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg
1 5 10 15
Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr
20 25 30
Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys
35 40 45
Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr
50 55 60
Asn Gly Ala Ser Ala Ala Ser Ser
65 70
<210> 112
<211> 20
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa可以是任何天然存在的氨基酸
<400> 112
Gly Leu Phe Xaa Ala Leu Leu Xaa Leu Leu Xaa Ser Leu Trp Xaa Leu
1 5 10 15
Leu Leu Xaa Ala
20
<210> 113
<211> 20
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 113
Gly Leu Phe His Ala Leu Leu His Leu Leu His Ser Leu Trp His Leu
1 5 10 15
Leu Leu His Ala
20
<210> 114
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 114
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 115
<211> 16
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 115
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 116
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 116
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 117
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 117
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 118
<211> 38
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 118
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 119
<211> 42
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 119
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 120
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 120
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 121
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 121
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 122
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 122
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 123
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 123
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 124
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 124
Asp Arg Leu Arg Arg
1 5
<210> 125
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 125
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 126
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 126
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 127
<211> 10
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 127
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 128
<211> 20
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 128
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 129
<211> 17
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 129
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 130
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 130
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 131
<211> 12
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 131
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 132
<211> 27
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 132
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 133
<211> 33
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 133
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 134
<211> 16
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 134
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 135
<211> 9
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 135
Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5
<210> 136
<211> 8
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 136
Arg Lys Lys Arg Arg Gln Arg Arg
1 5
<210> 137
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 137
Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala
1 5 10
<210> 138
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 138
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 139
<211> 11
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 139
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 140
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 140
Gly Ser Gly Gly Ser
1 5
<210> 141
<211> 6
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 141
Gly Gly Ser Gly Gly Ser
1 5
<210> 142
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 142
Gly Gly Gly Ser
1
<210> 143
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 143
Gly Gly Ser Gly
1
<210> 144
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 144
Gly Gly Ser Gly Gly
1 5
<210> 145
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 145
Gly Ser Gly Ser Gly
1 5
<210> 146
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 146
Gly Ser Gly Gly Gly
1 5
<210> 147
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 147
Gly Gly Gly Ser Gly
1 5
<210> 148
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 148
Gly Ser Ser Ser Gly
1 5
<210> 149
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 149
Ala Ala Ala Ala
1
<210> 150
<211> 4
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 150
Ala Ala Ala Ala
1
<210> 151
<211> 80
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 151
cgattcctcc ctacagtagt taggtatagc cgaaaggtag agactaaatc tgtagttgga 60
gtgggccgct tgcatcggcc 80
<210> 152
<211> 122
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 152
tcgtctcgag ggttaccaaa attggcactt ctcgacttta ggccgatgca agcggcccac 60
tccactacag atttagtctc taccttgcgg ctatacctaa cttactgtag ggaggaatcg 120
tg 122
<210> 153
<211> 91
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 153
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta a 91
<210> 154
<211> 114
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 154
cagaataata ctgacttact aagatatctt gagggtatac ccgaaaagat tggcgttgtt 60
gcaacgcaat aagatgtaaa tctgaaaagg tttggaatca tataaataat ttta 114
<210> 155
<211> 104
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 155
aagccaagat atggaatgcc attgtaatat tatggtgttg acttagttta gatttaaaca 60
atcttcgatg gctatatgcg gaaggtttgg cgtcgttgta acgc 104
<210> 156
<211> 213
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 156
cagtgtgcat agctataaca ctacgcaaag actgctaaag agcgatgtgc tctatcgcag 60
tctcaccttt aatggactta cggatctttt ggagcactaa gctccgctgc ggtgcaacac 120
cgcccttttc ttgcctctgc ttgccctttc cggttattat agccgggaga gtgcggaaga 180
ttaccgctct agctcgcagc atgttactga gtc 213
<210> 157
<211> 94
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 157
gcaagtcatt cggggacact ttttgttatt taaagtgttt tagataaatc agtgtcatgc 60
tgaataacga cccgacctat aaataacata atcc 94
<210> 158
<211> 252
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 158
gtccttaagg tactacacat tacatgtgaa cgtggagcta ataatagaaa tattattaga 60
ctacacctta ttaataacgg taggagatct atatggtctt gaatggaata gtaattgtga 120
aattataatt tctgttctta gctacttaag atggctcgtt gcaagccact cgggggctct 180
cttgaagtca aagagcttta gacaaatcag tgtcaaactg aataacgacc cgaccatgac 240
ttcataatcc cg 252
<210> 159
<211> 152
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 159
ctcgaggcta tttcatactc agaacaaagg gattaaggaa tgcaacccat ttcaaaatct 60
gtggaattat cacaaccatt aacatttcat actcagaaca aagggattaa ggaatgcaac 120
ggacaccttg ctatgtcctt ttgatgtatg tg 152
<210> 160
<211> 61
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 160
ctcgaggcta tttcatactc agaacaaagc tcagaacaaa gggaataagg aatgcaacgg 60
a 61
<210> 161
<211> 101
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 161
ctcagaaaca aagggattaa ggaatgcaac ccatttcaaa atctgtggaa actcagaaca 60
aagggattaa ggaatgcaac ggacaccttg ctatgtcctt c 101
<210> 162
<211> 86
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 162
ctcagaacaa agggattaag gaatgcaacc catttcctca gaacaaaggg attaaggaat 60
gcaacggaca ccttgctatg tccttc 86
<210> 163
<211> 76
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 163
ctcagaacaa agggattaag gaatgcaacc catttctcag aacaaaggga ttaaggaatg 60
caacggacac cttgct 76
<210> 164
<211> 82
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 164
ctcagaacaa agggattaag gaatgcaacc catttcaaaa ctcagaacaa agggattaag 60
gaatgcaacg gacaccttgc ta 82
<210> 165
<211> 72
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 165
ctcagaacaa agggattaag gaatgcaacc catttcctca gaacaaaggg attaaggaat 60
gcaacggaca cc 72
<210> 166
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 166
ctcagaacaa agggattaag gaatgcaacc cgggattaag gaatgcaacg gacaccttg 59
<210> 167
<211> 50
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 167
ctcagaacaa agggattaag gaatgcaacc aacggacacc ttgctatgtc 50
<210> 168
<211> 45
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 168
ctcagaacaa agggattaag gaatgcaacc catttcaaaa tctgt 45
<210> 169
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 169
ctcagaacaa agggattaag gaatgcaacc catttcaaaa t 41
<210> 170
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 170
ctcagaacaa agggattaag gaatgcaacc catttc 36
<210> 171
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 171
ctcagaacaa agggattaag gaatgcaacc catttc 36
<210> 172
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 172
ctcagaacaa agggattaag gaatgcaacc catttc 36
<210> 173
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 173
ctcagaacaa agggattaag gaatgcaacc catttca 37
<210> 174
<211> 38
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 174
ctcagaacaa agggattaag gaatgcaacc catttcaa 38
<210> 175
<211> 46
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 175
ctcagaacaa agggattaag gaatgcaacc catttcaaaa tctgtg 46
<210> 176
<211> 46
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 176
ctcagaacaa agggattaag gaatgcaacc catttcaaaa tctgtg 46
<210> 177
<211> 44
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 177
ctcagaacaa agggattaag gaatgcaacc catttcaaaa tctg 44
<210> 178
<211> 726
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 178
Ser Glu Ser Glu Asn Lys Ile Ile Glu Gln Tyr Tyr Ala Phe Leu Tyr
1 5 10 15
Ser Phe Arg Asp Lys Tyr Glu Lys Pro Glu Phe Lys Asn Arg Gly Asp
20 25 30
Ile Lys Arg Lys Leu Gln Asn Lys Trp Glu Asp Phe Leu Lys Glu Gln
35 40 45
Asn Leu Lys Asn Asp Lys Lys Leu Ser Asn Tyr Ile Phe Ser Asn Arg
50 55 60
Asn Phe Arg Arg Ser Tyr Asp Arg Glu Glu Glu Asn Glu Glu Gly Ile
65 70 75 80
Asp Glu Lys Lys Ser Lys Pro Lys Arg Ile Asn Cys Phe Glu Lys Glu
85 90 95
Lys Asn Leu Lys Asp Gln Tyr Asp Lys Asp Ala Ile Asn Ala Ser Ala
100 105 110
Asn Lys Asp Gly Ala Gln Lys Trp Gly Cys Phe Glu Cys Ile Phe Phe
115 120 125
Pro Met Tyr Lys Ile Glu Ser Gly Asp Pro Asn Lys Arg Ile Ile Ile
130 135 140
Asn Lys Thr Arg Phe Lys Leu Phe Asp Phe Tyr Leu Asn Leu Lys Gly
145 150 155 160
Cys Lys Ser Cys Leu Arg Ser Thr Tyr His Pro Tyr Arg Ser Asn Val
165 170 175
Tyr Ile Glu Ser Asn Tyr Asp Lys Leu Lys Arg Glu Ile Gly Asn Phe
180 185 190
Leu Gln Gln Lys Asn Ile Phe Gln Arg Met Arg Lys Ala Lys Val Ser
195 200 205
Glu Gly Lys Tyr Leu Thr Asn Leu Asp Glu Tyr Arg Leu Ser Cys Val
210 215 220
Ala Met His Phe Lys Asn Arg Trp Leu Phe Phe Asp Ser Ile Gln Lys
225 230 235 240
Val Leu Arg Glu Thr Ile Lys Gln Arg Leu Lys Gln Met Arg Glu Ser
245 250 255
Tyr Asp Glu Gln Ala Lys Thr Lys Arg Ser Lys Gly His Gly Arg Ala
260 265 270
Lys Tyr Glu Asp Gln Val Arg Met Ile Arg Arg Arg Ala Tyr Ser Ala
275 280 285
Gln Ala His Lys Leu Leu Asp Asn Gly Tyr Ile Thr Leu Phe Asp Tyr
290 295 300
Asp Asp Lys Glu Ile Asn Lys Val Cys Leu Thr Ala Ile Asn Gln Glu
305 310 315 320
Gly Phe Asp Ile Gly Gly Tyr Leu Asn Ser Asp Ile Asp Asn Val Met
325 330 335
Pro Pro Ile Glu Ile Ser Phe His Leu Lys Trp Lys Tyr Asn Glu Pro
340 345 350
Ile Leu Asn Ile Glu Ser Pro Phe Ser Lys Ala Lys Ile Ser Asp Tyr
355 360 365
Leu Arg Lys Ile Arg Glu Asp Leu Asn Leu Glu Arg Gly Lys Glu Gly
370 375 380
Lys Ala Arg Ser Lys Lys Asn Val Arg Arg Lys Val Leu Ala Ser Lys
385 390 395 400
Gly Glu Asp Gly Tyr Lys Lys Ile Phe Thr Asp Phe Phe Ser Lys Trp
405 410 415
Lys Glu Glu Leu Glu Gly Asn Ala Met Glu Arg Val Leu Ser Gln Ser
420 425 430
Ser Gly Asp Ile Gln Trp Ser Lys Lys Lys Arg Ile His Tyr Thr Thr
435 440 445
Leu Val Leu Asn Ile Asn Leu Leu Asp Lys Lys Gly Val Gly Asn Leu
450 455 460
Lys Tyr Tyr Glu Ile Ala Glu Lys Thr Lys Ile Leu Ser Phe Asp Lys
465 470 475 480
Asn Glu Asn Lys Phe Trp Pro Ile Thr Ile Gln Val Leu Leu Asp Gly
485 490 495
Tyr Glu Ile Gly Thr Glu Tyr Asp Glu Ile Lys Gln Leu Asn Glu Lys
500 505 510
Thr Ser Lys Gln Phe Thr Ile Tyr Asp Pro Asn Thr Lys Ile Ile Lys
515 520 525
Ile Pro Phe Thr Asp Ser Lys Ala Val Pro Leu Gly Met Leu Gly Ile
530 535 540
Asn Ile Ala Thr Leu Lys Thr Val Lys Lys Thr Glu Arg Asp Ile Lys
545 550 555 560
Val Ser Lys Ile Phe Lys Gly Gly Leu Asn Ser Lys Ile Val Ser Lys
565 570 575
Ile Gly Lys Gly Ile Tyr Ala Gly Tyr Phe Pro Thr Val Asp Lys Glu
580 585 590
Ile Leu Glu Glu Val Glu Glu Asp Thr Leu Asp Asn Glu Phe Ser Ser
595 600 605
Lys Ser Gln Arg Asn Ile Phe Leu Lys Ser Ile Ile Lys Asn Tyr Asp
610 615 620
Lys Met Leu Lys Glu Gln Leu Phe Asp Phe Tyr Ser Phe Leu Val Arg
625 630 635 640
Asn Asp Leu Gly Val Arg Phe Leu Thr Asp Arg Glu Leu Gln Asn Ile
645 650 655
Glu Asp Glu Ser Phe Asn Leu Glu Lys Arg Phe Phe Glu Thr Asp Arg
660 665 670
Asp Arg Ile Ala Arg Trp Phe Asp Asn Thr Asn Thr Asp Asp Gly Lys
675 680 685
Glu Lys Phe Lys Lys Leu Ala Asn Glu Ile Val Asp Ser Tyr Lys Pro
690 695 700
Arg Leu Ile Arg Leu Pro Val Val Arg Val Ile Lys Arg Ile Gln Pro
705 710 715 720
Val Lys Gln Arg Glu Met
725
<210> 179
<211> 517
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 179
Lys Tyr Ser Thr Arg Asp Phe Ser Glu Leu Asn Glu Ile Gln Val Thr
1 5 10 15
Ala Cys Lys Gln Asp Glu Phe Phe Lys Val Ile Gln Asn Ala Trp Arg
20 25 30
Glu Ile Ile Lys Lys Arg Phe Leu Glu Asn Arg Glu Asn Phe Ile Glu
35 40 45
Lys Lys Ile Phe Lys Asn Lys Lys Gly Arg Gly Lys Arg Gln Glu Ser
50 55 60
Asp Lys Thr Ile Gln Arg Asn Arg Ala Ser Val Met Lys Asn Phe Gln
65 70 75 80
Leu Ile Glu Asn Glu Lys Ile Ile Leu Arg Ala Pro Ser Gly His Val
85 90 95
Ala Cys Val Phe Pro Val Lys Val Gly Leu Asp Ile Gly Gly Phe Lys
100 105 110
Thr Asp Asp Leu Glu Lys Asn Ile Phe Pro Pro Arg Thr Ile Thr Ile
115 120 125
Asn Val Phe Trp Lys Asn Arg Asp Arg Gln Arg Lys Gly Arg Lys Leu
130 135 140
Glu Val Trp Gly Ile Lys Ala Arg Thr Lys Leu Ile Glu Lys Val His
145 150 155 160
Lys Trp Asp Lys Leu Glu Glu Val Lys Lys Lys Arg Leu Lys Ser Leu
165 170 175
Glu Gln Lys Gln Glu Lys Ser Leu Asp Asn Trp Ser Glu Val Asn Asn
180 185 190
Asp Ser Phe Tyr Lys Val Gln Ile Asp Glu Leu Gln Glu Lys Ile Asp
195 200 205
Lys Ser Leu Lys Gly Arg Thr Met Asn Lys Ile Leu Asp Asn Lys Ala
210 215 220
Lys Glu Ser Lys Glu Ala Glu Gly Leu Tyr Ile Glu Trp Glu Lys Asp
225 230 235 240
Phe Glu Gly Glu Met Leu Arg Arg Ile Glu Ala Ser Thr Gly Gly Glu
245 250 255
Glu Lys Trp Gly Lys Arg Arg Gln Arg Arg His Thr Ser Leu Leu Leu
260 265 270
Asp Ile Lys Asn Asn Ser Arg Gly Ser Lys Glu Ile Ile Asn Phe Tyr
275 280 285
Ser Tyr Ala Lys Gln Gly Lys Lys Glu Lys Lys Ile Glu Phe Phe Pro
290 295 300
Phe Pro Leu Thr Ile Thr Leu Asp Ala Glu Glu Glu Ser Pro Leu Asn
305 310 315 320
Ile Lys Ser Ile Pro Ile Glu Asp Lys Asn Ala Thr Ser Lys Tyr Phe
325 330 335
Ser Ile Pro Phe Thr Glu Thr Arg Ala Thr Pro Leu Ser Ile Leu Gly
340 345 350
Asp Arg Val Gln Lys Phe Lys Thr Lys Asn Ile Ser Gly Ala Ile Lys
355 360 365
Arg Asn Leu Gly Ser Ser Ile Ser Ser Cys Lys Ile Val Gln Asn Ala
370 375 380
Glu Thr Ser Ala Lys Ser Ile Leu Ser Leu Pro Asn Val Lys Glu Asp
385 390 395 400
Asn Asn Met Glu Ile Phe Ile Asn Thr Met Ser Lys Asn Tyr Phe Arg
405 410 415
Ala Met Met Lys Gln Met Glu Ser Phe Ile Phe Glu Met Glu Pro Lys
420 425 430
Thr Leu Ile Asp Pro Tyr Lys Glu Lys Ala Ile Lys Trp Phe Glu Val
435 440 445
Ala Ala Ser Ser Arg Ala Lys Arg Lys Leu Lys Lys Leu Ser Lys Ala
450 455 460
Asp Ile Lys Lys Ser Glu Leu Leu Leu Ser Asn Thr Glu Glu Phe Glu
465 470 475 480
Lys Glu Lys Gln Glu Lys Leu Glu Ala Leu Glu Lys Glu Ile Glu Glu
485 490 495
Phe Tyr Leu Pro Arg Ile Val Arg Leu Gln Leu Thr Lys Thr Ile Leu
500 505 510
Glu Thr Pro Val Met
515
<210> 180
<211> 481
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 180
Lys Lys Leu Gln Leu Leu Gly His Lys Ile Leu Leu Lys Glu Tyr Asp
1 5 10 15
Pro Asn Ala Val Asn Ala Ala Ala Asn Phe Glu Thr Ser Thr Ala Glu
20 25 30
Leu Cys Gly Gln Cys Lys Met Lys Pro Phe Lys Asn Lys Arg Arg Phe
35 40 45
Gln Tyr Thr Phe Gly Lys Asn Tyr His Gly Cys Leu Ser Cys Ile Gln
50 55 60
Asn Val Tyr Tyr Ala Lys Lys Arg Ile Val Gln Ile Ala Lys Glu Glu
65 70 75 80
Leu Lys His Gln Leu Thr Asp Ser Ile Ala Ser Ile Pro Tyr Lys Tyr
85 90 95
Thr Ser Leu Phe Ser Asn Thr Asn Ser Ile Asp Glu Leu Tyr Ile Leu
100 105 110
Lys Gln Glu Arg Ala Ala Phe Phe Ser Asn Thr Asn Ser Ile Asp Glu
115 120 125
Leu Tyr Ile Thr Gly Ile Glu Asn Asn Ile Ala Phe Lys Val Ile Ser
130 135 140
Ala Ile Trp Asp Glu Ile Ile Lys Lys Arg Arg Gln Arg Tyr Ala Glu
145 150 155 160
Ser Leu Thr Asp Thr Gly Thr Val Lys Ala Asn Arg Gly His Gly Gly
165 170 175
Thr Ala Tyr Lys Ser Asn Thr Arg Gln Glu Lys Ile Arg Ala Leu Gln
180 185 190
Lys Gln Thr Leu His Met Val Thr Asn Pro Tyr Ile Ser Leu Ala Arg
195 200 205
Tyr Lys Asn Asn Tyr Ile Val Ala Thr Leu Pro Arg Thr Ile Gly Met
210 215 220
His Ile Gly Ala Ile Lys Asp Arg Asp Pro Gln Lys Lys Leu Ser Asp
225 230 235 240
Tyr Ala Ile Asn Phe Asn Val Phe Trp Ser Asp Asp Arg Gln Leu Ile
245 250 255
Glu Leu Ser Thr Val Gln Tyr Thr Gly Asp Met Val Arg Lys Ile Glu
260 265 270
Ala Glu Thr Gly Glu Asn Asn Lys Trp Gly Glu Asn Met Lys Arg Thr
275 280 285
Lys Thr Ser Leu Leu Leu Glu Ile Leu Thr Lys Lys Thr Thr Asp Glu
290 295 300
Leu Thr Phe Lys Asp Trp Ala Phe Ser Thr Lys Lys Glu Ile Asp Ser
305 310 315 320
Val Thr Lys Lys Thr Tyr Gln Gly Phe Pro Ile Gly Ile Ile Phe Glu
325 330 335
Gly Asn Glu Ser Ser Val Lys Phe Gly Ser Gln Asn Tyr Phe Pro Leu
340 345 350
Pro Phe Asp Ala Lys Ile Thr Pro Pro Thr Ala Glu Gly Phe Arg Leu
355 360 365
Asp Trp Leu Arg Lys Gly Ser Phe Ser Ser Gln Met Lys Thr Ser Tyr
370 375 380
Gly Leu Ala Ile Tyr Ser Asn Lys Val Thr Asn Ala Ile Pro Ala Tyr
385 390 395 400
Val Ile Lys Asn Met Phe Tyr Lys Ile Ala Arg Ala Glu Asn Gly Lys
405 410 415
Gln Ile Lys Ala Lys Phe Leu Lys Lys Tyr Leu Asp Ile Ala Gly Asn
420 425 430
Asn Tyr Val Pro Phe Ile Ile Met Gln His Tyr Arg Val Leu Asp Thr
435 440 445
Phe Glu Glu Met Pro Ile Ser Gln Pro Lys Val Ile Arg Leu Ser Leu
450 455 460
Thr Lys Thr Gln His Ile Ile Ile Lys Lys Asp Lys Thr Asp Ser Lys
465 470 475 480
Met
<210> 181
<211> 534
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 181
Asn Thr Ser Asn Leu Ile Asn Leu Gly Lys Lys Ala Ile Asn Ile Ser
1 5 10 15
Ala Asn Tyr Asp Ala Asn Leu Glu Val Gly Cys Lys Asn Cys Lys Phe
20 25 30
Leu Ser Ser Asn Gly Asn Phe Pro Arg Gln Thr Asn Val Lys Glu Gly
35 40 45
Cys His Ser Cys Glu Lys Ser Thr Tyr Glu Pro Ser Ile Tyr Leu Val
50 55 60
Lys Ile Gly Glu Arg Lys Ala Lys Tyr Asp Val Leu Asp Ser Leu Lys
65 70 75 80
Lys Phe Thr Phe Gln Ser Leu Lys Tyr Gln Ser Lys Lys Ser Met Lys
85 90 95
Ser Arg Asn Lys Lys Pro Lys Glu Leu Lys Glu Phe Val Ile Phe Ala
100 105 110
Asn Lys Asn Lys Ala Phe Asp Val Ile Gln Lys Ser Tyr Asn His Leu
115 120 125
Ile Leu Gln Ile Lys Lys Glu Ile Asn Arg Met Asn Ser Lys Lys Arg
130 135 140
Lys Lys Asn His Lys Arg Arg Leu Phe Arg Asp Arg Glu Lys Gln Leu
145 150 155 160
Asn Lys Leu Arg Leu Ile Glu Ser Ser Asn Leu Phe Leu Pro Arg Glu
165 170 175
Asn Lys Gly Asn Asn His Val Phe Thr Tyr Val Ala Ile His Ser Val
180 185 190
Gly Arg Asp Ile Gly Val Ile Gly Ser Tyr Asp Glu Lys Leu Asn Phe
195 200 205
Glu Thr Glu Leu Thr Tyr Gln Leu Tyr Phe Asn Asp Asp Lys Arg Leu
210 215 220
Leu Tyr Ala Tyr Lys Pro Lys Gln Asn Lys Ile Ile Lys Ile Lys Glu
225 230 235 240
Lys Leu Trp Asn Leu Arg Lys Glu Lys Glu Pro Leu Asp Leu Glu Tyr
245 250 255
Glu Lys Pro Leu Asn Lys Ser Ile Thr Phe Ser Ile Lys Asn Asp Asn
260 265 270
Leu Phe Lys Val Ser Lys Asp Leu Met Leu Arg Arg Ala Lys Phe Asn
275 280 285
Ile Gln Gly Lys Glu Lys Leu Ser Lys Glu Glu Arg Lys Ile Asn Arg
290 295 300
Asp Leu Ile Lys Ile Lys Gly Leu Val Asn Ser Met Ser Tyr Gly Arg
305 310 315 320
Phe Asp Glu Leu Lys Lys Glu Lys Asn Ile Trp Ser Pro His Ile Tyr
325 330 335
Arg Glu Val Arg Gln Lys Glu Ile Lys Pro Cys Leu Ile Lys Asn Gly
340 345 350
Asp Arg Ile Glu Ile Phe Glu Gln Leu Lys Lys Lys Met Glu Arg Leu
355 360 365
Arg Arg Phe Arg Glu Lys Arg Gln Lys Lys Ile Ser Lys Asp Leu Ile
370 375 380
Phe Ala Glu Arg Ile Ala Tyr Asn Phe His Thr Lys Ser Ile Lys Asn
385 390 395 400
Thr Ser Asn Lys Ile Asn Ile Asp Gln Glu Ala Lys Arg Gly Lys Ala
405 410 415
Ser Tyr Met Arg Lys Arg Ile Gly Tyr Glu Thr Phe Lys Asn Lys Tyr
420 425 430
Cys Glu Gln Cys Leu Ser Lys Gly Asn Val Tyr Arg Asn Val Gln Lys
435 440 445
Gly Cys Ser Cys Phe Glu Asn Pro Phe Asp Trp Ile Lys Lys Gly Asp
450 455 460
Glu Asn Leu Leu Pro Lys Lys Asn Glu Asp Leu Arg Val Lys Gly Ala
465 470 475 480
Phe Arg Asp Glu Ala Leu Glu Lys Gln Ile Val Lys Ile Ala Phe Asn
485 490 495
Ile Ala Lys Gly Tyr Glu Asp Phe Tyr Asp Asn Leu Gly Glu Ser Thr
500 505 510
Glu Lys Asp Leu Lys Leu Lys Phe Lys Val Gly Thr Thr Ile Asn Glu
515 520 525
Gln Glu Ser Leu Lys Leu
530
<210> 182
<211> 537
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 182
Thr Ser Asn Pro Ile Lys Leu Gly Lys Lys Ala Ile Asn Ile Ser Ala
1 5 10 15
Asn Tyr Asp Ser Asn Leu Gln Ile Gly Cys Lys Asn Cys Lys Phe Leu
20 25 30
Ser Tyr Asn Gly Asn Phe Pro Arg Gln Thr Asn Val Lys Glu Gly Cys
35 40 45
His Ser Cys Glu Lys Ser Thr Tyr Glu Pro Pro Val Tyr Thr Val Arg
50 55 60
Ile Gly Glu Arg Arg Ser Lys Tyr Asp Val Leu Asp Ser Leu Lys Lys
65 70 75 80
Phe Ile Phe Leu Ser Leu Lys Tyr Arg Gln Ser Lys Lys Met Lys Thr
85 90 95
Arg Ser Lys Gly Ile Arg Gly Leu Glu Glu Phe Val Ile Ser Ala Asn
100 105 110
Leu Lys Lys Ala Met Asp Val Ile Gln Lys Ser Tyr Arg His Leu Ile
115 120 125
Leu Asn Ile Lys Asn Glu Ile Val Arg Met Asn Gly Lys Lys Arg Asn
130 135 140
Lys Asn His Lys Arg Leu Leu Phe Arg Asp Arg Glu Lys Gln Leu Asn
145 150 155 160
Lys Leu Arg Leu Ile Glu Gly Ser Ser Phe Phe Lys Pro Pro Thr Val
165 170 175
Lys Gly Asp Asn Ser Ile Phe Thr Cys Val Ala Ile His Asn Ile Gly
180 185 190
Arg Asp Ile Gly Ile Ala Gly Asp Tyr Phe Asp Lys Leu Glu Pro Lys
195 200 205
Ile Glu Leu Thr Tyr Gln Leu Tyr Tyr Glu Tyr Asn Pro Lys Lys Glu
210 215 220
Ser Glu Ile Asn Lys Arg Leu Leu Tyr Ala Tyr Lys Pro Lys Gln Asn
225 230 235 240
Lys Ile Ile Glu Ile Lys Glu Lys Leu Trp Asn Leu Arg Lys Glu Lys
245 250 255
Ser Pro Leu Asp Leu Glu Tyr Glu Lys Pro Leu Thr Lys Ser Ile Thr
260 265 270
Phe Leu Val Lys Arg Asp Gly Val Phe Arg Ile Ser Lys Asp Leu Met
275 280 285
Leu Arg Lys Ala Lys Phe Ile Ile Gln Gly Lys Glu Lys Leu Ser Lys
290 295 300
Glu Glu Arg Lys Ile Asn Arg Asp Leu Ile Lys Ile Lys Ser Asn Ile
305 310 315 320
Ile Ser Leu Thr Tyr Gly Arg Phe Asp Glu Leu Lys Lys Asp Lys Thr
325 330 335
Ile Trp Ser Pro His Ile Phe Arg Asp Val Lys Gln Gly Lys Ile Thr
340 345 350
Pro Cys Ile Glu Arg Lys Gly Asp Arg Met Asp Ile Phe Gln Gln Leu
355 360 365
Arg Lys Lys Ser Glu Arg Leu Arg Glu Asn Arg Lys Lys Arg Gln Lys
370 375 380
Lys Ile Ser Lys Asp Leu Ile Phe Ala Glu Arg Ile Ala Tyr Asn Phe
385 390 395 400
His Thr Lys Ser Ile Lys Asn Thr Ser Asn Leu Ile Asn Ile Lys His
405 410 415
Glu Ala Lys Arg Gly Lys Ala Ser Tyr Met Arg Lys Arg Ile Gly Asn
420 425 430
Glu Thr Phe Arg Ile Lys Tyr Cys Glu Gln Cys Phe Pro Lys Asn Asn
435 440 445
Val Tyr Lys Asn Val Gln Lys Gly Cys Ser Cys Phe Glu Asp Pro Phe
450 455 460
Glu Tyr Ile Lys Lys Gly Asn Glu Asp Leu Ile Pro Asn Lys Asn Gln
465 470 475 480
Asp Leu Lys Ala Lys Gly Ala Phe Arg Asp Asp Ala Leu Glu Lys Gln
485 490 495
Ile Ile Lys Val Ala Phe Asn Ile Ala Lys Gly Tyr Glu Asp Phe Tyr
500 505 510
Glu Asn Leu Lys Lys Thr Thr Glu Lys Asp Ile Arg Leu Lys Phe Lys
515 520 525
Val Gly Thr Ile Ile Ser Glu Glu Met
530 535
<210> 183
<211> 541
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 183
Asn Asn Ser Ile Asn Leu Ser Lys Lys Ala Ile Asn Ile Ser Ala Asn
1 5 10 15
Tyr Asp Ala Asn Leu Gln Val Arg Cys Lys Asn Cys Lys Phe Leu Ser
20 25 30
Ser Asn Gly Asn Phe Pro Arg Gln Thr Asp Val Lys Glu Gly Cys His
35 40 45
Ser Cys Glu Lys Ser Thr Tyr Glu Pro Pro Val Tyr Asp Val Lys Ile
50 55 60
Gly Glu Ile Lys Ala Lys Tyr Glu Val Leu Asp Ser Leu Lys Lys Phe
65 70 75 80
Thr Phe Gln Ser Leu Lys Tyr Gln Leu Ser Lys Ser Met Lys Phe Arg
85 90 95
Ser Lys Lys Ile Lys Glu Leu Lys Glu Phe Val Ile Phe Ala Lys Glu
100 105 110
Ser Lys Ala Leu Asn Val Ile Asn Arg Ser Tyr Lys His Leu Ile Leu
115 120 125
Asn Ile Lys Asn Asp Ile Asn Arg Met Asn Ser Lys Lys Arg Ile Lys
130 135 140
Asn His Lys Gly Arg Leu Phe Leu Asp Arg Gln Lys Gln Leu Ser Lys
145 150 155 160
Leu Lys Leu Ile Glu Gly Ser Ser Phe Phe Val Pro Ala Lys Asn Val
165 170 175
Gly Asn Lys Ser Val Phe Thr Cys Val Ala Ile His Ser Ile Gly Arg
180 185 190
Asp Ile Gly Ile Ala Gly Leu Tyr Asp Ser Phe Thr Lys Pro Val Asn
195 200 205
Glu Ile Thr Tyr Gln Ile Phe Phe Ser Gly Glu Arg Arg Leu Leu Tyr
210 215 220
Ala Tyr Lys Pro Lys Gln Leu Lys Ile Leu Ser Ile Lys Glu Asn Leu
225 230 235 240
Trp Ser Leu Lys Asn Glu Lys Lys Pro Leu Asp Leu Leu Tyr Glu Lys
245 250 255
Pro Leu Gly Lys Asn Leu Asn Phe Asn Val Lys Gly Gly Asp Leu Phe
260 265 270
Arg Val Ser Lys Asp Leu Met Ile Arg Asn Ala Lys Phe Asn Val His
275 280 285
Gly Arg Gln Arg Leu Ser Asp Glu Glu Arg Leu Ile Asn Arg Asn Phe
290 295 300
Ile Lys Ile Lys Gly Glu Val Val Ser Leu Ser Tyr Gly Arg Phe Glu
305 310 315 320
Glu Leu Lys Lys Asp Arg Lys Leu Trp Ser Pro His Ile Phe Lys Asp
325 330 335
Val Arg Gln Asn Lys Ile Lys Pro Cys Leu Val Met Gln Gly Gln Arg
340 345 350
Ile Asp Ile Phe Glu Gln Leu Lys Arg Lys Leu Glu Leu Leu Lys Lys
355 360 365
Ile Arg Lys Ser Arg Gln Lys Lys Leu Ser Lys Asp Leu Ile Phe Gly
370 375 380
Glu Arg Ile Ala Tyr Asn Phe His Thr Lys Ser Ile Lys Asn Thr Ser
385 390 395 400
Asn Lys Ile Asn Ile Asp Ser Asp Ala Lys Arg Gly Arg Ala Ser Tyr
405 410 415
Met Arg Lys Arg Ile Gly Asn Glu Thr Phe Lys Leu Lys Tyr Cys Asp
420 425 430
Val Cys Phe Pro Lys Ala Asn Val Tyr Arg Arg Val Gln Asn Gly Cys
435 440 445
Ser Cys Ser Glu Asn Pro Tyr Asn Tyr Ile Lys Lys Gly Asp Lys Asp
450 455 460
Leu Leu Pro Lys Lys Asp Glu Gly Leu Ala Ile Lys Gly Ala Phe Arg
465 470 475 480
Asp Glu Lys Leu Asn Lys Gln Ile Ile Lys Val Ala Phe Asn Ile Ala
485 490 495
Lys Gly Tyr Glu Asp Phe Tyr Asp Asp Leu Lys Lys Arg Thr Glu Lys
500 505 510
Asp Val Asp Leu Lys Phe Lys Ile Gly Thr Thr Val Leu Asp Gln Lys
515 520 525
Pro Met Glu Ile Phe Asp Gly Ile Val Ile Thr Trp Leu
530 535 540
<210> 184
<211> 542
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 184
Leu Leu Thr Thr Val Val Glu Thr Asn Asn Leu Ala Lys Lys Ala Ile
1 5 10 15
Asn Val Ala Ala Asn Phe Asp Ala Asn Ile Asp Arg Gln Tyr Tyr Arg
20 25 30
Cys Thr Pro Asn Leu Cys Arg Phe Ile Ala Gln Ser Pro Arg Glu Thr
35 40 45
Lys Glu Lys Asp Ala Gly Cys Ser Ser Cys Thr Gln Ser Thr Tyr Asp
50 55 60
Pro Lys Val Tyr Val Ile Lys Ile Gly Lys Leu Leu Ala Lys Tyr Glu
65 70 75 80
Ile Leu Lys Ser Leu Lys Arg Phe Leu Phe Met Asn Arg Tyr Phe Lys
85 90 95
Gln Lys Lys Thr Glu Arg Ala Gln Gln Lys Gln Lys Ile Gly Thr Glu
100 105 110
Leu Asn Glu Met Ser Ile Phe Ala Lys Ala Thr Asn Ala Met Glu Val
115 120 125
Ile Lys Arg Ala Thr Lys His Cys Thr Tyr Asp Ile Ile Pro Glu Thr
130 135 140
Lys Ser Leu Gln Met Leu Lys Arg Arg Arg His Arg Val Lys Val Arg
145 150 155 160
Ser Leu Leu Lys Ile Leu Lys Glu Arg Arg Met Lys Ile Lys Lys Ile
165 170 175
Pro Asn Thr Phe Ile Glu Ile Pro Lys Gln Ala Lys Lys Asn Lys Ser
180 185 190
Asp Tyr Tyr Val Ala Ala Ala Leu Lys Ser Cys Gly Ile Asp Val Gly
195 200 205
Leu Cys Gly Ala Tyr Glu Lys Asn Ala Glu Val Glu Ala Glu Tyr Thr
210 215 220
Tyr Gln Leu Tyr Tyr Glu Tyr Lys Gly Asn Ser Ser Thr Lys Arg Ile
225 230 235 240
Leu Tyr Cys Tyr Asn Asn Pro Gln Lys Asn Ile Arg Glu Phe Trp Glu
245 250 255
Ala Phe Tyr Ile Gln Gly Ser Lys Ser His Val Asn Thr Pro Gly Thr
260 265 270
Ile Arg Leu Lys Met Glu Lys Phe Leu Ser Pro Ile Thr Ile Glu Ser
275 280 285
Glu Ala Leu Asp Phe Arg Val Trp Asn Ser Asp Leu Lys Ile Arg Asn
290 295 300
Gly Gln Tyr Gly Phe Ile Lys Lys Arg Ser Leu Gly Lys Glu Ala Arg
305 310 315 320
Glu Ile Lys Lys Gly Met Gly Asp Ile Lys Arg Lys Ile Gly Asn Leu
325 330 335
Thr Tyr Gly Lys Ser Pro Ser Glu Leu Lys Ser Ile His Val Tyr Arg
340 345 350
Thr Glu Arg Glu Asn Pro Lys Lys Pro Arg Ala Ala Arg Lys Lys Glu
355 360 365
Asp Asn Phe Met Glu Ile Phe Glu Met Gln Arg Lys Lys Asp Tyr Glu
370 375 380
Val Asn Lys Lys Arg Arg Lys Glu Ala Thr Asp Ala Ala Lys Ile Met
385 390 395 400
Asp Phe Ala Glu Glu Pro Ile Arg His Tyr His Thr Asn Asn Leu Lys
405 410 415
Ala Val Arg Arg Ile Asp Met Asn Glu Gln Val Glu Arg Lys Lys Thr
420 425 430
Ser Val Phe Leu Lys Arg Ile Met Gln Asn Gly Tyr Arg Gly Asn Tyr
435 440 445
Cys Arg Lys Cys Ile Lys Ala Pro Glu Gly Ser Asn Arg Asp Glu Asn
450 455 460
Val Leu Glu Lys Asn Glu Gly Cys Leu Asp Cys Ile Gly Ser Glu Phe
465 470 475 480
Ile Trp Lys Lys Ser Ser Lys Glu Lys Lys Gly Leu Trp His Thr Asn
485 490 495
Arg Leu Leu Arg Arg Ile Arg Leu Gln Cys Phe Thr Thr Ala Lys Ala
500 505 510
Tyr Glu Asn Phe Tyr Asn Asp Leu Phe Glu Lys Lys Glu Ser Ser Leu
515 520 525
Asp Ile Ile Lys Leu Lys Val Ser Ile Thr Thr Lys Ser Met
530 535 540
<210> 185
<211> 564
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 185
Ala Ser Thr Met Asn Leu Ala Lys Gln Ala Ile Asn Phe Ala Ala Asn
1 5 10 15
Tyr Asp Ser Asn Leu Glu Ile Gly Cys Lys Gly Cys Lys Phe Met Ser
20 25 30
Thr Trp Ser Lys Lys Ser Asn Pro Lys Phe Tyr Pro Arg Gln Asn Asn
35 40 45
Gln Ala Asn Lys Cys His Ser Cys Thr Tyr Ser Thr Gly Glu Pro Glu
50 55 60
Val Pro Ile Ile Glu Ile Gly Glu Arg Ala Ala Lys Tyr Lys Ile Phe
65 70 75 80
Thr Ala Leu Lys Lys Phe Val Phe Met Ser Val Ala Tyr Lys Glu Arg
85 90 95
Arg Arg Gln Arg Phe Lys Ser Lys Lys Pro Lys Glu Leu Lys Glu Leu
100 105 110
Ala Ile Cys Ser Asn Arg Glu Lys Ala Met Glu Val Ile Gln Lys Ser
115 120 125
Val Val His Cys Tyr Gly Asp Val Lys Gln Glu Ile Pro Arg Ile Arg
130 135 140
Lys Ile Lys Val Leu Lys Asn His Lys Gly Arg Leu Phe Tyr Lys Gln
145 150 155 160
Lys Arg Ser Lys Ile Lys Ile Ala Lys Leu Glu Lys Gly Ser Phe Phe
165 170 175
Lys Thr Phe Ile Pro Lys Val His Asn Asn Gly Cys His Ser Cys His
180 185 190
Glu Ala Ser Leu Asn Lys Pro Ile Leu Val Thr Thr Ala Leu Asn Thr
195 200 205
Ile Gly Ala Asp Ile Gly Leu Ile Asn Asp Tyr Ser Thr Ile Ala Pro
210 215 220
Thr Glu Thr Asp Ile Ser Trp Gln Val Tyr Tyr Glu Phe Ile Pro Asn
225 230 235 240
Gly Asp Ser Glu Ala Val Lys Lys Arg Leu Leu Tyr Phe Tyr Lys Pro
245 250 255
Lys Gly Ala Leu Ile Lys Ser Ile Arg Asp Lys Tyr Phe Lys Lys Gly
260 265 270
His Glu Asn Ala Val Asn Thr Gly Phe Phe Lys Tyr Gln Gly Lys Ile
275 280 285
Val Lys Gly Pro Ile Lys Phe Val Asn Asn Glu Leu Asp Phe Ala Arg
290 295 300
Lys Pro Asp Leu Lys Ser Met Lys Ile Lys Arg Ala Gly Phe Ala Ile
305 310 315 320
Pro Ser Ala Lys Arg Leu Ser Lys Glu Asp Arg Glu Ile Asn Arg Glu
325 330 335
Ser Ile Lys Ile Lys Asn Lys Ile Tyr Ser Leu Ser Tyr Gly Arg Lys
340 345 350
Lys Thr Leu Ser Asp Lys Asp Ile Ile Lys His Leu Tyr Arg Pro Val
355 360 365
Arg Gln Lys Gly Val Lys Pro Leu Glu Tyr Arg Lys Ala Pro Asp Gly
370 375 380
Phe Leu Glu Phe Phe Tyr Ser Leu Lys Arg Lys Glu Arg Arg Leu Arg
385 390 395 400
Lys Gln Lys Glu Lys Arg Gln Lys Asp Met Ser Glu Ile Ile Asp Ala
405 410 415
Ala Asp Glu Phe Ala Trp His Arg His Thr Gly Ser Ile Lys Lys Thr
420 425 430
Thr Asn His Ile Asn Phe Lys Ser Glu Val Lys Arg Gly Lys Val Pro
435 440 445
Ile Met Lys Lys Arg Ile Ala Asn Asp Ser Phe Asn Thr Arg His Cys
450 455 460
Gly Lys Cys Val Lys Gln Gly Asn Ala Ile Asn Lys Tyr Tyr Ile Glu
465 470 475 480
Lys Gln Lys Asn Cys Phe Asp Cys Asn Ser Ile Glu Phe Lys Trp Glu
485 490 495
Lys Ala Ala Leu Glu Lys Lys Gly Ala Phe Lys Leu Asn Lys Arg Leu
500 505 510
Gln Tyr Ile Val Lys Ala Cys Phe Asn Val Ala Lys Ala Tyr Glu Ser
515 520 525
Phe Tyr Glu Asp Phe Arg Lys Gly Glu Glu Glu Ser Leu Asp Leu Lys
530 535 540
Phe Lys Ile Gly Thr Thr Thr Thr Leu Lys Gln Tyr Pro Gln Asn Lys
545 550 555 560
Ala Arg Ala Met
<210> 186
<211> 610
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 186
His Ser His Asn Leu Met Leu Thr Lys Leu Gly Lys Gln Ala Ile Asn
1 5 10 15
Phe Ala Ala Asn Tyr Asp Ala Asn Leu Glu Ile Gly Cys Lys Asn Cys
20 25 30
Lys Phe Leu Ser Tyr Ser Pro Lys Gln Ala Asn Pro Lys Lys Tyr Pro
35 40 45
Arg Gln Thr Asp Val His Glu Asp Gly Asn Ile Ala Cys His Ser Cys
50 55 60
Met Gln Ser Thr Lys Glu Pro Pro Val Tyr Ile Val Pro Ile Gly Glu
65 70 75 80
Arg Lys Ser Lys Tyr Glu Ile Leu Thr Ser Leu Asn Lys Phe Thr Phe
85 90 95
Leu Ala Leu Lys Tyr Lys Glu Lys Lys Arg Gln Ala Phe Arg Ala Lys
100 105 110
Lys Pro Lys Glu Leu Gln Glu Leu Ala Ile Ala Phe Asn Lys Glu Lys
115 120 125
Ala Ile Lys Val Ile Asp Lys Ser Ile Gln His Leu Ile Leu Asn Ile
130 135 140
Lys Pro Glu Ile Ala Arg Ile Gln Arg Gln Lys Arg Leu Lys Asn Arg
145 150 155 160
Lys Gly Lys Leu Leu Tyr Leu His Lys Arg Tyr Ala Ile Lys Met Gly
165 170 175
Leu Ile Lys Asn Gly Lys Tyr Phe Lys Val Gly Ser Pro Lys Lys Asp
180 185 190
Gly Lys Lys Leu Leu Val Leu Cys Ala Leu Asn Thr Ile Gly Arg Asp
195 200 205
Ile Gly Ile Ile Gly Asn Ile Glu Glu Asn Asn Arg Ser Glu Thr Glu
210 215 220
Ile Thr Tyr Gln Leu Tyr Phe Asp Cys Leu Asp Ala Asn Pro Asn Glu
225 230 235 240
Leu Arg Ile Lys Glu Ile Glu Tyr Asn Arg Leu Lys Ser Tyr Glu Arg
245 250 255
Lys Ile Lys Arg Leu Val Tyr Ala Tyr Lys Pro Lys Gln Thr Lys Ile
260 265 270
Leu Glu Ile Arg Ser Lys Phe Phe Ser Lys Gly His Glu Asn Lys Val
275 280 285
Asn Thr Gly Ser Phe Asn Phe Glu Asn Pro Leu Asn Lys Ser Ile Ser
290 295 300
Ile Lys Val Lys Asn Ser Ala Phe Asp Phe Lys Ile Gly Ala Pro Phe
305 310 315 320
Ile Met Leu Arg Asn Gly Lys Phe His Ile Pro Thr Lys Lys Arg Leu
325 330 335
Ser Lys Glu Glu Arg Glu Ile Asn Arg Thr Leu Ser Lys Ile Lys Gly
340 345 350
Arg Val Phe Arg Leu Thr Tyr Gly Arg Asn Ile Ser Glu Gln Gly Ser
355 360 365
Lys Ser Leu His Ile Tyr Arg Lys Glu Arg Gln His Pro Lys Leu Ser
370 375 380
Leu Glu Ile Arg Lys Gln Pro Asp Ser Phe Ile Asp Glu Phe Glu Lys
385 390 395 400
Leu Arg Leu Lys Gln Asn Phe Ile Ser Lys Leu Lys Lys Gln Arg Gln
405 410 415
Lys Lys Leu Ala Asp Leu Leu Gln Phe Ala Asp Arg Ile Ala Tyr Asn
420 425 430
Tyr His Thr Ser Ser Leu Glu Lys Thr Ser Asn Phe Ile Asn Tyr Lys
435 440 445
Pro Glu Val Lys Arg Gly Arg Thr Ser Tyr Ile Lys Lys Arg Ile Gly
450 455 460
Asn Glu Gly Phe Glu Lys Leu Tyr Cys Glu Thr Cys Ile Lys Ser Asn
465 470 475 480
Asp Lys Glu Asn Ala Tyr Ala Val Glu Lys Glu Glu Leu Cys Phe Val
485 490 495
Cys Lys Ala Lys Pro Phe Thr Trp Lys Lys Thr Asn Lys Asp Lys Leu
500 505 510
Gly Ile Phe Lys Tyr Pro Ser Arg Ile Lys Asp Phe Ile Arg Ala Ala
515 520 525
Phe Thr Val Ala Lys Ser Tyr Asn Asp Phe Tyr Glu Asn Leu Lys Lys
530 535 540
Lys Asp Leu Lys Asn Glu Ile Phe Leu Lys Phe Lys Ile Gly Leu Ile
545 550 555 560
Leu Ser His Glu Lys Lys Asn His Ile Ser Ile Ala Lys Ser Val Ala
565 570 575
Glu Asp Glu Arg Ile Ser Gly Lys Ser Ile Lys Asn Ile Leu Asn Lys
580 585 590
Ser Ile Lys Leu Glu Lys Asn Cys Tyr Ser Cys Phe Phe His Lys Glu
595 600 605
Asp Met
610
<210> 187
<211> 552
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 187
Ser Leu Glu Arg Val Ile Asp Lys Arg Asn Leu Ala Lys Lys Ala Ile
1 5 10 15
Asn Ile Ala Ala Asn Phe Asp Ala Asn Ile Asn Lys Gly Phe Tyr Arg
20 25 30
Cys Glu Thr Asn Gln Cys Met Phe Ile Ala Gln Lys Pro Arg Lys Thr
35 40 45
Asn Asn Thr Gly Cys Ser Ser Cys Leu Gln Ser Thr Tyr Asp Pro Val
50 55 60
Ile Tyr Val Val Lys Val Gly Glu Met Leu Ala Lys Tyr Glu Ile Leu
65 70 75 80
Lys Ser Leu Lys Arg Phe Val Phe Met Asn Arg Ser Phe Lys Gln Lys
85 90 95
Lys Thr Glu Lys Ala Lys Gln Lys Glu Arg Ile Gly Gly Glu Leu Asn
100 105 110
Glu Met Ser Ile Phe Ala Asn Ala Ala Leu Ala Met Gly Val Ile Lys
115 120 125
Arg Ala Ile Arg His Cys His Val Asp Ile Arg Pro Glu Ile Asn Arg
130 135 140
Leu Ser Glu Leu Lys Lys Thr Lys His Arg Val Ala Ala Lys Ser Leu
145 150 155 160
Val Lys Ile Val Lys Gln Arg Lys Thr Lys Trp Lys Gly Ile Pro Asn
165 170 175
Ser Phe Ile Gln Ile Pro Gln Lys Ala Arg Asn Lys Asp Ala Asp Phe
180 185 190
Tyr Val Ala Ser Ala Leu Lys Ser Gly Gly Ile Asp Ile Gly Leu Cys
195 200 205
Gly Thr Tyr Asp Lys Lys Pro His Ala Asp Pro Arg Trp Thr Tyr Gln
210 215 220
Leu Tyr Phe Asp Thr Glu Asp Glu Ser Glu Lys Arg Leu Leu Tyr Cys
225 230 235 240
Tyr Asn Asp Pro Gln Ala Lys Ile Arg Asp Phe Trp Lys Thr Phe Tyr
245 250 255
Glu Arg Gly Asn Pro Ser Met Val Asn Ser Pro Gly Thr Ile Glu Phe
260 265 270
Arg Met Glu Gly Phe Phe Glu Lys Met Thr Pro Ile Ser Ile Glu Ser
275 280 285
Lys Asp Phe Asp Phe Arg Val Trp Asn Lys Asp Leu Leu Ile Arg Arg
290 295 300
Gly Leu Tyr Glu Ile Lys Lys Arg Lys Asn Leu Asn Arg Lys Ala Arg
305 310 315 320
Glu Ile Lys Lys Ala Met Gly Ser Val Lys Arg Val Leu Ala Asn Met
325 330 335
Thr Tyr Gly Lys Ser Pro Thr Asp Lys Lys Ser Ile Pro Val Tyr Arg
340 345 350
Val Glu Arg Glu Lys Pro Lys Lys Pro Arg Ala Val Arg Lys Glu Glu
355 360 365
Asn Glu Leu Ala Asp Lys Leu Glu Asn Tyr Arg Arg Glu Asp Phe Leu
370 375 380
Ile Arg Asn Arg Arg Lys Arg Glu Ala Thr Glu Ile Ala Lys Ile Ile
385 390 395 400
Asp Ala Ala Glu Pro Pro Ile Arg His Tyr His Thr Asn His Leu Arg
405 410 415
Ala Val Lys Arg Ile Asp Leu Ser Lys Pro Val Ala Arg Lys Asn Thr
420 425 430
Ser Val Phe Leu Lys Arg Ile Met Gln Asn Gly Tyr Arg Gly Asn Tyr
435 440 445
Cys Lys Lys Cys Ile Lys Gly Asn Ile Asp Pro Asn Lys Asp Glu Cys
450 455 460
Arg Leu Glu Asp Ile Lys Lys Cys Ile Cys Cys Glu Gly Thr Gln Asn
465 470 475 480
Ile Trp Ala Lys Lys Glu Lys Leu Tyr Thr Gly Arg Ile Asn Val Leu
485 490 495
Asn Lys Arg Ile Lys Gln Met Lys Leu Glu Cys Phe Asn Val Ala Lys
500 505 510
Ala Tyr Glu Asn Phe Tyr Asp Asn Leu Ala Ala Leu Lys Glu Gly Asp
515 520 525
Leu Lys Val Leu Lys Leu Lys Val Ser Ile Pro Ala Leu Asn Pro Glu
530 535 540
Ala Ser Asp Pro Glu Glu Asp Met
545 550
<210> 188
<211> 534
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 188
Asn Ala Ser Ile Asn Leu Gly Lys Arg Ala Ile Asn Leu Ser Ala Asn
1 5 10 15
Tyr Asp Ser Asn Leu Val Ile Gly Cys Lys Asn Cys Lys Phe Leu Ser
20 25 30
Phe Asn Gly Asn Phe Pro Arg Gln Thr Asn Val Arg Glu Gly Cys His
35 40 45
Ser Cys Asp Lys Ser Thr Tyr Ala Pro Glu Val Tyr Ile Val Lys Ile
50 55 60
Gly Glu Arg Lys Ala Lys Tyr Asp Val Leu Asp Ser Leu Lys Lys Phe
65 70 75 80
Thr Phe Gln Ser Leu Lys Tyr Gln Ile Lys Lys Ser Met Arg Glu Arg
85 90 95
Ser Lys Lys Pro Lys Glu Leu Leu Glu Phe Val Ile Phe Ala Asn Lys
100 105 110
Asp Lys Ala Phe Asn Val Ile Gln Lys Ser Tyr Glu His Leu Ile Leu
115 120 125
Asn Ile Lys Gln Glu Ile Asn Arg Met Asn Gly Lys Lys Arg Ile Lys
130 135 140
Asn His Lys Lys Arg Leu Phe Lys Asp Arg Glu Lys Gln Leu Asn Lys
145 150 155 160
Leu Arg Leu Ile Gly Ser Ser Ser Leu Phe Phe Pro Arg Glu Asn Lys
165 170 175
Gly Asp Lys Asp Leu Phe Thr Tyr Val Ala Ile His Ser Val Gly Arg
180 185 190
Asp Ile Gly Val Ala Gly Ser Tyr Glu Ser His Ile Glu Pro Ile Ser
195 200 205
Asp Leu Thr Tyr Gln Leu Phe Ile Asn Asn Glu Lys Arg Leu Leu Tyr
210 215 220
Ala Tyr Lys Pro Lys Gln Asn Lys Ile Ile Glu Leu Lys Glu Asn Leu
225 230 235 240
Trp Asn Leu Lys Lys Glu Lys Lys Pro Leu Asp Leu Glu Phe Thr Lys
245 250 255
Pro Leu Glu Lys Ser Ile Thr Phe Ser Val Lys Asn Asp Lys Leu Phe
260 265 270
Lys Val Ser Lys Asp Leu Met Leu Arg Gln Ala Lys Phe Asn Ile Gln
275 280 285
Gly Lys Glu Lys Leu Ser Lys Glu Glu Arg Gln Ile Asn Arg Asp Phe
290 295 300
Ser Lys Ile Lys Ser Asn Val Ile Ser Leu Ser Tyr Gly Arg Phe Glu
305 310 315 320
Glu Leu Lys Lys Glu Lys Asn Ile Trp Ser Pro His Ile Tyr Arg Glu
325 330 335
Val Lys Gln Lys Glu Ile Lys Pro Cys Ile Val Arg Lys Gly Asp Arg
340 345 350
Ile Glu Leu Phe Glu Gln Leu Lys Arg Lys Met Asp Lys Leu Lys Lys
355 360 365
Phe Arg Lys Glu Arg Gln Lys Lys Ile Ser Lys Asp Leu Asn Phe Ala
370 375 380
Glu Arg Ile Ala Tyr Asn Phe His Thr Lys Ser Ile Lys Asn Thr Ser
385 390 395 400
Asn Lys Ile Asn Ile Asp Gln Glu Ala Lys Arg Gly Lys Ala Ser Tyr
405 410 415
Met Arg Lys Arg Ile Gly Asn Glu Ser Phe Arg Lys Lys Tyr Cys Glu
420 425 430
Gln Cys Phe Ser Val Gly Asn Val Tyr His Asn Val Gln Asn Gly Cys
435 440 445
Ser Cys Phe Asp Asn Pro Ile Glu Leu Ile Lys Lys Gly Asp Glu Gly
450 455 460
Leu Ile Pro Lys Gly Lys Glu Asp Arg Lys Tyr Lys Gly Ala Leu Arg
465 470 475 480
Asp Asp Asn Leu Gln Met Gln Ile Ile Arg Val Ala Phe Asn Ile Ala
485 490 495
Lys Gly Tyr Glu Asp Phe Tyr Asn Asn Leu Lys Glu Lys Thr Glu Lys
500 505 510
Asp Leu Lys Leu Lys Phe Lys Ile Gly Thr Thr Ile Ser Thr Gln Glu
515 520 525
Ser Asn Asn Lys Glu Met
530
<210> 189
<211> 577
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 189
Ser Asn Leu Ile Lys Leu Gly Lys Gln Ala Ile Asn Phe Ala Ala Asn
1 5 10 15
Tyr Asp Ala Asn Leu Glu Val Gly Cys Lys Asn Cys Lys Phe Leu Ser
20 25 30
Ser Thr Asn Lys Tyr Pro Arg Gln Thr Asn Val His Leu Asp Asn Lys
35 40 45
Met Ala Cys Arg Ser Cys Asn Gln Ser Thr Met Glu Pro Ala Ile Tyr
50 55 60
Ile Val Arg Ile Gly Glu Lys Lys Ala Lys Tyr Asp Ile Tyr Asn Ser
65 70 75 80
Leu Thr Lys Phe Asn Phe Gln Ser Leu Lys Tyr Lys Ala Lys Arg Ser
85 90 95
Gln Arg Phe Lys Pro Lys Gln Pro Lys Glu Leu Gln Glu Leu Ser Ile
100 105 110
Ala Val Arg Lys Glu Lys Ala Leu Asp Ile Ile Gln Lys Ser Ile Asp
115 120 125
His Leu Ile Gln Asp Ile Arg Pro Glu Ile Pro Arg Ile Lys Gln Gln
130 135 140
Lys Arg Tyr Lys Asn His Val Gly Lys Leu Phe Tyr Leu Gln Lys Arg
145 150 155 160
Arg Lys Asn Lys Leu Asn Leu Ile Gly Lys Gly Ser Phe Phe Lys Val
165 170 175
Phe Ser Pro Lys Glu Lys Lys Asn Glu Leu Leu Val Ile Cys Ala Leu
180 185 190
Thr Asn Ile Gly Arg Asp Ile Gly Leu Ile Gly Asn Tyr Asn Thr Ile
195 200 205
Ile Asn Pro Leu Phe Glu Val Thr Tyr Gln Leu Tyr Tyr Asp Tyr Ile
210 215 220
Pro Lys Lys Asn Asn Lys Asn Val Gln Arg Arg Leu Leu Tyr Ala Tyr
225 230 235 240
Lys Ser Lys Asn Glu Lys Ile Leu Lys Leu Lys Glu Ala Phe Phe Lys
245 250 255
Arg Gly His Glu Asn Ala Val Asn Leu Gly Ser Phe Ser Tyr Glu Lys
260 265 270
Pro Leu Glu Lys Ser Leu Thr Leu Lys Ile Lys Asn Asp Lys Asp Asp
275 280 285
Phe Gln Val Ser Pro Ser Leu Arg Ile Arg Thr Gly Arg Phe Phe Val
290 295 300
Pro Ser Lys Arg Asn Leu Ser Arg Gln Glu Arg Glu Ile Asn Arg Arg
305 310 315 320
Leu Val Lys Ile Lys Ser Lys Ile Lys Asn Met Thr Tyr Gly Lys Phe
325 330 335
Glu Thr Ala Arg Asp Lys Gln Ser Val His Ile Phe Arg Leu Glu Arg
340 345 350
Gln Lys Glu Lys Leu Pro Leu Gln Phe Arg Lys Asp Glu Lys Glu Phe
355 360 365
Met Glu Glu Phe Gln Lys Leu Lys Arg Arg Thr Asn Ser Leu Lys Lys
370 375 380
Leu Arg Lys Ser Arg Gln Lys Lys Leu Ala Asp Leu Leu Gln Leu Ser
385 390 395 400
Glu Lys Val Val Tyr Asn Asn His Thr Gly Thr Leu Lys Lys Thr Ser
405 410 415
Asn Phe Leu Asn Phe Ser Ser Ser Val Lys Arg Gly Lys Thr Ala Tyr
420 425 430
Ile Lys Glu Leu Leu Gly Gln Glu Gly Phe Glu Thr Leu Tyr Cys Ser
435 440 445
Asn Cys Ile Asn Lys Gly Gln Lys Thr Arg Tyr Asn Ile Glu Thr Lys
450 455 460
Glu Lys Cys Phe Ser Cys Lys Asp Val Pro Phe Val Trp Lys Lys Lys
465 470 475 480
Ser Thr Asp Lys Asp Arg Lys Gly Ala Phe Leu Phe Pro Ala Lys Leu
485 490 495
Lys Asp Val Ile Lys Ala Thr Phe Thr Val Ala Lys Ala Tyr Glu Asp
500 505 510
Phe Tyr Asp Asn Leu Lys Ser Ile Asp Glu Lys Lys Pro Tyr Ile Lys
515 520 525
Phe Lys Ile Gly Leu Ile Leu Ala His Val Arg His Glu His Lys Ala
530 535 540
Arg Ala Lys Glu Glu Ala Gly Gln Lys Asn Ile Tyr Asn Lys Pro Ile
545 550 555 560
Lys Ile Asp Lys Asn Cys Lys Glu Cys Phe Phe Phe Lys Glu Glu Ala
565 570 575
Met
<210> 190
<211> 613
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 190
Asn Thr Thr Arg Lys Lys Phe Arg Lys Arg Thr Gly Phe Pro Gln Ser
1 5 10 15
Asp Asn Ile Lys Leu Ala Tyr Cys Ser Ala Ile Val Arg Ala Ala Asn
20 25 30
Leu Asp Ala Asp Ile Gln Lys Lys His Asn Gln Cys Asn Pro Asn Leu
35 40 45
Cys Val Gly Ile Lys Ser Asn Glu Gln Ser Arg Lys Tyr Glu His Ser
50 55 60
Asp Arg Gln Ala Leu Leu Cys Tyr Ala Cys Asn Gln Ser Thr Gly Ala
65 70 75 80
Pro Lys Val Asp Tyr Ile Gln Ile Gly Glu Ile Gly Ala Lys Tyr Lys
85 90 95
Ile Leu Gln Met Val Asn Ala Tyr Asp Phe Leu Ser Leu Ala Tyr Asn
100 105 110
Leu Thr Lys Leu Arg Asn Gly Lys Ser Arg Gly His Gln Arg Met Ser
115 120 125
Gln Leu Asp Glu Val Val Ile Val Ala Asp Tyr Glu Lys Ala Thr Glu
130 135 140
Val Ile Lys Arg Ser Ile Asn His Leu Leu Asp Asp Ile Arg Gly Gln
145 150 155 160
Leu Ser Lys Leu Lys Lys Arg Thr Gln Asn Glu His Ile Thr Glu His
165 170 175
Lys Gln Ser Lys Ile Arg Arg Lys Leu Arg Lys Leu Ser Arg Leu Leu
180 185 190
Lys Arg Arg Arg Trp Lys Trp Gly Thr Ile Pro Asn Pro Tyr Leu Lys
195 200 205
Asn Trp Val Phe Thr Lys Lys Asp Pro Glu Leu Val Thr Val Ala Leu
210 215 220
Leu His Lys Leu Gly Arg Asp Ile Gly Leu Val Asn Arg Ser Lys Arg
225 230 235 240
Arg Ser Lys Gln Lys Leu Leu Pro Lys Val Gly Phe Gln Leu Tyr Tyr
245 250 255
Lys Trp Glu Ser Pro Ser Leu Asn Asn Ile Lys Lys Ser Lys Ala Lys
260 265 270
Lys Leu Pro Lys Arg Leu Leu Ile Pro Tyr Lys Asn Val Lys Leu Phe
275 280 285
Asp Asn Lys Gln Lys Leu Glu Asn Ala Ile Lys Ser Leu Leu Glu Ser
290 295 300
Tyr Gln Lys Thr Ile Lys Val Glu Phe Asp Gln Phe Phe Gln Asn Arg
305 310 315 320
Thr Glu Glu Ile Ile Ala Glu Glu Gln Gln Thr Leu Glu Arg Gly Leu
325 330 335
Leu Lys Gln Leu Glu Lys Lys Lys Asn Glu Phe Ala Ser Gln Lys Lys
340 345 350
Ala Leu Lys Glu Glu Lys Lys Lys Ile Lys Glu Pro Arg Lys Ala Lys
355 360 365
Leu Leu Met Glu Glu Ser Arg Ser Leu Gly Phe Leu Met Ala Asn Val
370 375 380
Ser Tyr Ala Leu Phe Asn Thr Thr Ile Glu Asp Leu Tyr Lys Lys Ser
385 390 395 400
Asn Val Val Ser Gly Cys Ile Pro Gln Glu Pro Val Val Val Phe Pro
405 410 415
Ala Asp Ile Gln Asn Lys Gly Ser Leu Ala Lys Ile Leu Phe Ala Pro
420 425 430
Lys Asp Gly Phe Arg Ile Lys Phe Ser Gly Gln His Leu Thr Ile Arg
435 440 445
Thr Ala Lys Phe Lys Ile Arg Gly Lys Glu Ile Lys Ile Leu Thr Lys
450 455 460
Thr Lys Arg Glu Ile Leu Lys Asn Ile Glu Lys Leu Arg Arg Val Trp
465 470 475 480
Tyr Arg Glu Gln His Tyr Lys Leu Lys Leu Phe Gly Lys Glu Val Ser
485 490 495
Ala Lys Pro Arg Phe Leu Asp Lys Arg Lys Thr Ser Ile Glu Arg Arg
500 505 510
Asp Pro Asn Lys Leu Ala Asp Gln Thr Asp Asp Arg Gln Ala Glu Leu
515 520 525
Arg Asn Lys Glu Tyr Glu Leu Arg His Lys Gln His Lys Met Ala Glu
530 535 540
Arg Leu Asp Asn Ile Asp Thr Asn Ala Gln Asn Leu Gln Thr Leu Ser
545 550 555 560
Phe Trp Val Gly Glu Ala Asp Lys Pro Pro Lys Leu Asp Glu Lys Asp
565 570 575
Ala Arg Gly Phe Gly Val Arg Thr Cys Ile Ser Ala Trp Lys Trp Phe
580 585 590
Met Glu Asp Leu Leu Lys Lys Gln Glu Glu Asp Pro Leu Leu Lys Leu
595 600 605
Lys Leu Ser Ile Met
610
<210> 191
<211> 615
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 191
Pro Lys Lys Pro Lys Phe Gln Lys Arg Thr Gly Phe Pro Gln Pro Asp
1 5 10 15
Asn Leu Arg Lys Glu Tyr Cys Leu Ala Ile Val Arg Ala Ala Asn Leu
20 25 30
Asp Ala Asp Phe Glu Lys Lys Cys Thr Lys Cys Glu Gly Ile Lys Thr
35 40 45
Asn Lys Lys Gly Asn Ile Val Lys Gly Arg Thr Tyr Asn Ser Ala Asp
50 55 60
Lys Asp Asn Leu Leu Cys Tyr Ala Cys Asn Ile Ser Thr Gly Ala Pro
65 70 75 80
Ala Val Asp Tyr Val Phe Val Gly Ala Leu Glu Ala Lys Tyr Lys Ile
85 90 95
Leu Gln Met Val Lys Ala Tyr Asp Phe His Ser Leu Ala Tyr Asn Leu
100 105 110
Ala Lys Leu Trp Lys Gly Arg Gly Arg Gly His Gln Arg Met Gly Gly
115 120 125
Leu Asn Glu Val Val Ile Val Ser Asn Asn Glu Lys Ala Leu Asp Val
130 135 140
Ile Glu Lys Ser Leu Asn His Phe His Asp Glu Ile Arg Gly Glu Leu
145 150 155 160
Ser Arg Leu Lys Ala Lys Phe Gln Asn Glu His Leu His Val His Lys
165 170 175
Glu Ser Lys Leu Arg Arg Lys Leu Arg Lys Ile Ser Arg Leu Leu Lys
180 185 190
Arg Arg Arg Trp Lys Trp Asp Val Ile Pro Asn Ser Tyr Leu Arg Asn
195 200 205
Phe Thr Phe Thr Lys Thr Arg Pro Asp Phe Ile Ser Val Ala Leu Leu
210 215 220
His Arg Val Gly Arg Asp Ile Gly Leu Val Thr Lys Thr Lys Ile Pro
225 230 235 240
Lys Pro Thr Asp Leu Leu Pro Gln Phe Gly Phe Gln Ile Tyr Tyr Thr
245 250 255
Trp Asp Glu Pro Lys Leu Asn Lys Leu Lys Lys Ser Arg Leu Arg Ser
260 265 270
Glu Pro Lys Arg Leu Leu Val Pro Tyr Lys Lys Ile Glu Leu Tyr Lys
275 280 285
Asn Lys Ser Val Leu Glu Glu Ala Ile Arg His Leu Ala Glu Val Tyr
290 295 300
Thr Glu Asp Leu Thr Ile Cys Phe Lys Asp Phe Phe Glu Thr Gln Lys
305 310 315 320
Arg Lys Phe Val Ser Lys Glu Lys Glu Ser Leu Lys Arg Glu Leu Leu
325 330 335
Lys Glu Leu Thr Lys Leu Lys Lys Asp Phe Ser Glu Arg Lys Thr Ala
340 345 350
Leu Lys Arg Asp Arg Lys Glu Ile Lys Glu Pro Lys Lys Ala Lys Leu
355 360 365
Leu Met Glu Glu Ser Arg Ser Leu Gly Phe Leu Ala Ala Asn Thr Ser
370 375 380
Tyr Ala Leu Phe Asn Leu Ile Ala Ala Asp Leu Tyr Thr Lys Ser Lys
385 390 395 400
Lys Ala Cys Ser Thr Lys Leu Pro Arg Gln Leu Ser Thr Ile Leu Pro
405 410 415
Leu Glu Ile Lys Glu His Lys Ser Thr Thr Ser Leu Ala Ile Lys Pro
420 425 430
Glu Glu Gly Phe Lys Ile Arg Phe Ser Asn Thr His Leu Ser Ile Arg
435 440 445
Thr Pro Lys Phe Lys Met Lys Gly Ala Asp Ile Lys Ala Leu Thr Lys
450 455 460
Arg Lys Arg Glu Ile Leu Lys Asn Ala Thr Lys Leu Glu Lys Ser Trp
465 470 475 480
Tyr Gly Leu Lys His Tyr Lys Leu Lys Leu Tyr Gly Lys Glu Val Ala
485 490 495
Ala Lys Pro Arg Phe Leu Asp Lys Arg Asn Pro Ser Ile Asp Arg Arg
500 505 510
Asp Pro Lys Glu Leu Met Glu Gln Ile Glu Asn Arg Arg Asn Glu Val
515 520 525
Lys Asp Leu Glu Tyr Glu Ile Arg Lys Gly Gln His Gln Met Ala Lys
530 535 540
Arg Leu Asp Asn Val Asp Thr Asn Ala Gln Asn Leu Gln Thr Lys Ser
545 550 555 560
Phe Trp Val Gly Glu Ala Asp Lys Pro Pro Glu Leu Asp Ser Met Glu
565 570 575
Ala Lys Lys Leu Gly Leu Arg Thr Cys Ile Ser Ala Trp Lys Trp Phe
580 585 590
Met Lys Asp Leu Val Leu Leu Gln Glu Lys Ser Pro Asn Leu Lys Leu
595 600 605
Lys Leu Ser Leu Thr Glu Met
610 615
<210> 192
<211> 775
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 192
Lys Phe Ser Lys Arg Gln Glu Gly Phe Leu Ile Pro Asp Asn Ile Asp
1 5 10 15
Leu Tyr Lys Cys Leu Ala Ile Val Arg Ser Ala Asn Leu Asp Ala Asp
20 25 30
Val Gln Gly His Lys Ser Cys Tyr Gly Val Lys Lys Asn Gly Thr Tyr
35 40 45
Arg Val Lys Gln Asn Gly Lys Lys Gly Val Lys Glu Lys Gly Arg Lys
50 55 60
Tyr Val Phe Asp Leu Ile Ala Phe Lys Gly Asn Ile Glu Lys Ile Pro
65 70 75 80
His Glu Ala Ile Glu Glu Lys Asp Gln Gly Arg Val Ile Val Leu Gly
85 90 95
Lys Phe Asn Tyr Lys Leu Ile Leu Asn Ile Glu Lys Asn His Asn Asp
100 105 110
Arg Ala Ser Leu Glu Ile Lys Asn Lys Ile Lys Lys Leu Val Gln Ile
115 120 125
Ser Ser Leu Glu Thr Gly Glu Phe Leu Ser Asp Leu Leu Ser Gly Lys
130 135 140
Ile Gly Ile Asp Glu Val Tyr Gly Ile Ile Glu Pro Asp Val Phe Ser
145 150 155 160
Gly Lys Glu Leu Val Cys Lys Ala Cys Gln Gln Ser Thr Tyr Ala Pro
165 170 175
Leu Val Glu Tyr Met Pro Val Gly Glu Leu Asp Ala Lys Tyr Lys Ile
180 185 190
Leu Ser Ala Ile Lys Gly Tyr Asp Phe Leu Ser Leu Ala Tyr Asn Leu
195 200 205
Ser Arg Asn Arg Ala Asn Lys Lys Arg Gly His Gln Lys Leu Gly Gly
210 215 220
Gly Glu Leu Ser Glu Val Val Ile Ser Ala Asn Tyr Asp Lys Ala Leu
225 230 235 240
Asn Val Ile Lys Arg Ser Ile Asn His Tyr His Val Glu Ile Lys Pro
245 250 255
Glu Ile Ser Lys Leu Lys Lys Lys Met Gln Asn Glu Pro Leu Lys Val
260 265 270
Met Lys Gln Ala Arg Ile Arg Arg Glu Leu His Gln Leu Ser Arg Lys
275 280 285
Val Lys Arg Leu Lys Trp Lys Trp Gly Met Ile Pro Asn Pro Glu Leu
290 295 300
Gln Asn Ile Ile Phe Glu Lys Lys Glu Lys Asp Phe Val Ser Tyr Ala
305 310 315 320
Leu Leu His Thr Leu Gly Arg Asp Ile Gly Leu Phe Lys Asp Thr Ser
325 330 335
Met Leu Gln Val Pro Asn Ile Ser Asp Tyr Gly Phe Gln Ile Tyr Tyr
340 345 350
Ser Trp Glu Asp Pro Lys Leu Asn Ser Ile Lys Lys Ile Lys Asp Leu
355 360 365
Pro Lys Arg Leu Leu Ile Pro Tyr Lys Arg Leu Asp Phe Tyr Ile Asp
370 375 380
Thr Ile Leu Val Ala Lys Val Ile Lys Asn Leu Ile Glu Leu Tyr Arg
385 390 395 400
Lys Ser Tyr Val Tyr Glu Thr Phe Gly Glu Glu Tyr Gly Tyr Ala Lys
405 410 415
Lys Ala Glu Asp Ile Leu Phe Asp Trp Asp Ser Ile Asn Leu Ser Glu
420 425 430
Gly Ile Glu Gln Lys Ile Gln Lys Ile Lys Asp Glu Phe Ser Asp Leu
435 440 445
Leu Tyr Glu Ala Arg Glu Ser Lys Arg Gln Asn Phe Val Glu Ser Phe
450 455 460
Glu Asn Ile Leu Gly Leu Tyr Asp Lys Asn Phe Ala Ser Asp Arg Asn
465 470 475 480
Ser Tyr Gln Glu Lys Ile Gln Ser Met Ile Ile Lys Lys Gln Gln Glu
485 490 495
Asn Ile Glu Gln Lys Leu Lys Arg Glu Phe Lys Glu Val Ile Glu Arg
500 505 510
Gly Phe Glu Gly Met Asp Gln Asn Lys Lys Tyr Tyr Lys Val Leu Ser
515 520 525
Pro Asn Ile Lys Gly Gly Leu Leu Tyr Thr Asp Thr Asn Asn Leu Gly
530 535 540
Phe Phe Arg Ser His Leu Ala Phe Met Leu Leu Ser Lys Ile Ser Asp
545 550 555 560
Asp Leu Tyr Arg Lys Asn Asn Leu Val Ser Lys Gly Gly Asn Lys Gly
565 570 575
Ile Leu Asp Gln Thr Pro Glu Thr Met Leu Thr Leu Glu Phe Gly Lys
580 585 590
Ser Asn Leu Pro Asn Ile Ser Ile Lys Arg Lys Phe Phe Asn Ile Lys
595 600 605
Tyr Asn Ser Ser Trp Ile Gly Ile Arg Lys Pro Lys Phe Ser Ile Lys
610 615 620
Gly Ala Val Ile Arg Glu Ile Thr Lys Lys Val Arg Asp Glu Gln Arg
625 630 635 640
Leu Ile Lys Ser Leu Glu Gly Val Trp His Lys Ser Thr His Phe Lys
645 650 655
Arg Trp Gly Lys Pro Arg Phe Asn Leu Pro Arg His Pro Asp Arg Glu
660 665 670
Lys Asn Asn Asp Asp Asn Leu Met Glu Ser Ile Thr Ser Arg Arg Glu
675 680 685
Gln Ile Gln Leu Leu Leu Arg Glu Lys Gln Lys Gln Gln Glu Lys Met
690 695 700
Ala Gly Arg Leu Asp Lys Ile Asp Lys Glu Ile Gln Asn Leu Gln Thr
705 710 715 720
Ala Asn Phe Gln Ile Lys Gln Ile Asp Lys Lys Pro Ala Leu Thr Glu
725 730 735
Lys Ser Glu Gly Lys Gln Ser Val Arg Asn Ala Leu Ser Ala Trp Lys
740 745 750
Trp Phe Met Glu Asp Leu Ile Lys Tyr Gln Lys Arg Thr Pro Ile Leu
755 760 765
Gln Leu Lys Leu Ala Lys Met
770 775
<210> 193
<211> 777
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 193
Lys Phe Ser Lys Arg Gln Glu Gly Phe Val Ile Pro Glu Asn Ile Gly
1 5 10 15
Leu Tyr Lys Cys Leu Ala Ile Val Arg Ser Ala Asn Leu Asp Ala Asp
20 25 30
Val Gln Gly His Val Ser Cys Tyr Gly Val Lys Lys Asn Gly Thr Tyr
35 40 45
Val Leu Lys Gln Asn Gly Lys Lys Ser Ile Arg Glu Lys Gly Arg Lys
50 55 60
Tyr Ala Ser Asp Leu Val Ala Phe Lys Gly Asp Ile Glu Lys Ile Pro
65 70 75 80
Phe Glu Val Ile Glu Glu Lys Lys Lys Glu Gln Ser Ile Val Leu Gly
85 90 95
Lys Phe Asn Tyr Lys Leu Val Leu Asp Val Met Lys Gly Glu Lys Asp
100 105 110
Arg Ala Ser Leu Thr Met Lys Asn Lys Ser Lys Lys Leu Val Gln Val
115 120 125
Ser Ser Leu Gly Thr Asp Glu Phe Leu Leu Thr Leu Leu Asn Glu Lys
130 135 140
Phe Gly Ile Glu Glu Ile Tyr Gly Ile Ile Glu Pro Glu Val Phe Ser
145 150 155 160
Gly Lys Lys Leu Val Cys Lys Ala Cys Gln Gln Ser Thr Tyr Ala Pro
165 170 175
Leu Val Glu Tyr Met Pro Val Gly Glu Leu Asp Ser Lys Tyr Lys Ile
180 185 190
Leu Ser Ala Ile Lys Gly Tyr Asp Phe Leu Ser Leu Ala Tyr Asn Leu
195 200 205
Ala Arg His Arg Ser Asn Lys Lys Arg Gly His Gln Lys Leu Gly Gly
210 215 220
Gly Glu Leu Ser Glu Val Val Ile Ser Ala Asn Asn Ala Lys Ala Leu
225 230 235 240
Asn Val Ile Lys Arg Ser Leu Asn His Tyr Tyr Ser Glu Ile Lys Pro
245 250 255
Glu Ile Ser Lys Leu Arg Lys Lys Met Gln Asn Glu Pro Leu Lys Val
260 265 270
Gly Lys Gln Ala Arg Met Arg Arg Glu Leu His Gln Leu Ser Arg Lys
275 280 285
Val Lys Arg Leu Lys Trp Lys Trp Gly Lys Ile Pro Asn Leu Glu Leu
290 295 300
Gln Asn Ile Thr Phe Lys Glu Ser Asp Arg Asp Phe Ile Ser Tyr Ala
305 310 315 320
Leu Leu His Thr Leu Gly Arg Asp Ile Gly Met Phe Asn Lys Thr Glu
325 330 335
Ile Lys Met Pro Ser Asn Ile Leu Gly Tyr Gly Phe Gln Ile Tyr Tyr
340 345 350
Asp Trp Glu Glu Pro Lys Leu Asn Thr Ile Lys Lys Ser Lys Asn Thr
355 360 365
Pro Lys Arg Ile Leu Ile Pro Tyr Lys Lys Leu Asp Phe Tyr Asn Asp
370 375 380
Ser Ile Leu Val Ala Arg Ala Ile Lys Glu Leu Val Gly Leu Phe Gln
385 390 395 400
Glu Ser Tyr Glu Trp Glu Ile Phe Gly Asn Glu Tyr Asn Tyr Ala Lys
405 410 415
Glu Ala Glu Val Glu Leu Ile Lys Leu Asp Glu Glu Ser Ile Asn Gly
420 425 430
Asn Val Glu Lys Lys Leu Gln Arg Ile Lys Glu Asn Phe Ser Asn Leu
435 440 445
Leu Glu Lys Ala Arg Glu Lys Lys Arg Gln Asn Phe Ile Glu Ser Phe
450 455 460
Glu Ser Ile Ala Arg Leu Tyr Asp Glu Ser Phe Thr Ala Asp Arg Asn
465 470 475 480
Glu Tyr Gln Arg Glu Ile Gln Ser Phe Ile Ile Glu Lys Gln Lys Gln
485 490 495
Ser Ile Glu Lys Lys Leu Lys Asn Glu Phe Lys Lys Ile Val Glu Lys
500 505 510
Lys Phe Asn Glu Gln Glu Gln Gly Lys Lys His Tyr Arg Val Leu Asn
515 520 525
Pro Thr Ile Ile Asn Glu Phe Leu Pro Lys Asp Lys Asn Asn Leu Gly
530 535 540
Phe Leu Arg Ser Lys Ile Ala Phe Ile Leu Leu Ser Lys Ile Ser Asp
545 550 555 560
Asp Leu Tyr Lys Lys Ser Asn Ala Val Ser Lys Gly Gly Glu Lys Gly
565 570 575
Ile Ile Lys Gln Gln Pro Glu Thr Ile Leu Asp Leu Glu Phe Ser Lys
580 585 590
Ser Lys Leu Pro Ser Ile Asn Ile Lys Lys Lys Leu Phe Asn Ile Lys
595 600 605
Tyr Thr Ser Ser Trp Leu Gly Ile Arg Lys Pro Lys Phe Asn Ile Lys
610 615 620
Gly Ala Lys Ile Arg Glu Ile Thr Arg Arg Val Arg Asp Val Gln Arg
625 630 635 640
Thr Leu Lys Ser Ala Glu Ser Ser Trp Tyr Ala Ser Thr His Phe Arg
645 650 655
Arg Trp Gly Phe Pro Arg Phe Asn Gln Pro Arg His Pro Asp Lys Glu
660 665 670
Lys Lys Ser Asp Asp Arg Leu Ile Glu Ser Ile Thr Leu Leu Arg Glu
675 680 685
Gln Ile Gln Ile Leu Leu Arg Glu Lys Gln Lys Gly Gln Lys Glu Met
690 695 700
Ala Gly Arg Leu Asp Asp Val Asp Lys Lys Ile Gln Asn Leu Gln Thr
705 710 715 720
Ala Asn Phe Gln Ile Lys Gln Thr Gly Asp Lys Pro Ala Leu Thr Glu
725 730 735
Lys Ser Ala Gly Lys Gln Ser Phe Arg Asn Ala Leu Ser Ala Trp Lys
740 745 750
Trp Phe Met Glu Asn Leu Leu Lys Tyr Gln Asn Lys Thr Pro Asp Leu
755 760 765
Lys Leu Lys Ile Ala Arg Thr Val Met
770 775
<210> 194
<211> 610
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 194
Lys Trp Ile Glu Pro Asn Asn Ile Asp Phe Asn Lys Cys Leu Ala Ile
1 5 10 15
Thr Arg Ser Ala Asn Leu Asp Ala Asp Val Gln Gly His Lys Met Cys
20 25 30
Tyr Gly Ile Lys Thr Asn Gly Thr Tyr Lys Ala Ile Gly Lys Ile Asn
35 40 45
Lys Lys His Asn Thr Gly Ile Ile Glu Lys Arg Arg Thr Tyr Val Tyr
50 55 60
Asp Leu Ile Val Thr Lys Glu Lys Asn Glu Lys Ile Val Lys Lys Thr
65 70 75 80
Asp Phe Met Ala Ile Asp Glu Glu Ile Glu Phe Asp Glu Lys Lys Glu
85 90 95
Lys Leu Leu Lys Lys Tyr Ile Lys Ala Glu Val Leu Gly Thr Gly Glu
100 105 110
Leu Ile Arg Lys Asp Leu Asn Asp Gly Glu Lys Phe Asp Asp Leu Cys
115 120 125
Ser Ile Glu Glu Pro Gln Ala Phe Arg Arg Ser Glu Leu Val Cys Lys
130 135 140
Ala Cys Asn Gln Ser Thr Tyr Ala Ser Asp Ile Arg Tyr Ile Pro Ile
145 150 155 160
Gly Glu Ile Glu Ala Lys Tyr Lys Ile Leu Lys Ala Ile Lys Gly Tyr
165 170 175
Asp Phe Leu Ser Leu Lys Tyr Asn Leu Gly Arg Leu Arg Asp Ser Lys
180 185 190
Lys Arg Gly His Gln Lys Met Gly Gln Gly Glu Leu Lys Glu Phe Val
195 200 205
Ile Cys Ala Asn Lys Glu Lys Ala Leu Asp Val Ile Lys Arg Ser Leu
210 215 220
Asn His Tyr Leu Asn Glu Val Lys Asp Glu Ile Ser Arg Leu Asn Lys
225 230 235 240
Lys Met Gln Asn Glu Pro Leu Lys Val Asn Asp Gln Ala Arg Trp Arg
245 250 255
Arg Glu Leu Asn Gln Ile Ser Arg Arg Leu Lys Arg Leu Lys Trp Lys
260 265 270
Trp Gly Glu Ile Pro Asn Pro Glu Leu Lys Asn Leu Ile Phe Lys Ser
275 280 285
Ser Arg Pro Glu Phe Val Ser Tyr Ala Leu Ile His Thr Leu Gly Arg
290 295 300
Asp Ile Gly Leu Ile Asn Glu Thr Glu Leu Lys Pro Asn Asn Ile Gln
305 310 315 320
Glu Tyr Gly Phe Gln Ile Tyr Tyr Lys Trp Glu Asp Pro Glu Leu Asn
325 330 335
His Ile Lys Lys Val Lys Asn Ile Pro Lys Arg Phe Ile Ile Pro Tyr
340 345 350
Lys Asn Leu Asp Leu Phe Gly Lys Tyr Thr Ile Leu Ser Arg Ala Ile
355 360 365
Glu Gly Ile Leu Lys Leu Tyr Ser Ser Ser Phe Gln Tyr Lys Ser Phe
370 375 380
Lys Asp Pro Asn Leu Phe Ala Lys Glu Gly Glu Lys Lys Ile Thr Asn
385 390 395 400
Glu Asp Phe Glu Leu Gly Tyr Asp Glu Lys Ile Lys Lys Ile Lys Asp
405 410 415
Asp Phe Lys Ser Tyr Lys Lys Ala Leu Leu Glu Lys Lys Lys Asn Thr
420 425 430
Leu Glu Asp Ser Leu Asn Ser Ile Leu Ser Val Tyr Glu Gln Ser Leu
435 440 445
Leu Thr Glu Gln Ile Asn Asn Val Lys Lys Trp Lys Glu Gly Leu Leu
450 455 460
Lys Ser Lys Glu Ser Ile His Lys Gln Lys Lys Ile Glu Asn Ile Glu
465 470 475 480
Asp Ile Ile Ser Arg Ile Glu Glu Leu Lys Asn Val Glu Gly Trp Ile
485 490 495
Arg Thr Lys Glu Arg Asp Ile Val Asn Lys Glu Glu Thr Asn Leu Lys
500 505 510
Arg Glu Ile Lys Lys Glu Leu Lys Asp Ser Tyr Tyr Glu Glu Val Arg
515 520 525
Lys Asp Phe Ser Asp Leu Lys Lys Gly Glu Glu Ser Glu Lys Lys Pro
530 535 540
Phe Arg Glu Glu Pro Lys Pro Ile Val Ile Lys Asp Tyr Ile Lys Phe
545 550 555 560
Asp Val Leu Pro Gly Glu Asn Ser Ala Leu Gly Phe Phe Leu Ser His
565 570 575
Leu Ser Phe Asn Leu Phe Asp Ser Ile Gln Tyr Glu Leu Phe Glu Lys
580 585 590
Ser Arg Leu Ser Ser Ser Lys His Pro Gln Ile Pro Glu Thr Ile Leu
595 600 605
Asp Leu
610
<210> 195
<211> 632
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 195
Phe Arg Lys Phe Val Lys Arg Ser Gly Ala Pro Gln Pro Asp Asn Leu
1 5 10 15
Asn Lys Tyr Lys Cys Ile Ala Ile Val Arg Ala Ala Asn Leu Asp Ala
20 25 30
Asp Ile Met Ser Asn Glu Ser Ser Asn Cys Val Met Cys Lys Gly Ile
35 40 45
Lys Met Asn Lys Arg Lys Thr Ala Lys Gly Ala Ala Lys Thr Thr Glu
50 55 60
Leu Gly Arg Val Tyr Ala Gly Gln Ser Gly Asn Leu Leu Cys Thr Ala
65 70 75 80
Cys Thr Lys Ser Thr Met Gly Pro Leu Val Asp Tyr Val Pro Ile Gly
85 90 95
Arg Ile Arg Ala Lys Tyr Thr Ile Leu Arg Ala Val Lys Glu Tyr Asp
100 105 110
Phe Leu Ser Leu Ala Tyr Asn Leu Ala Arg Thr Arg Val Ser Lys Lys
115 120 125
Gly Gly Arg Gln Lys Met His Ser Leu Ser Glu Leu Val Ile Ala Ala
130 135 140
Glu Tyr Glu Ile Ala Trp Asn Ile Ile Lys Ser Ser Val Ile His Tyr
145 150 155 160
His Gln Glu Thr Lys Glu Glu Ile Ser Gly Leu Arg Lys Lys Leu Gln
165 170 175
Ala Glu His Ile His Lys Asn Lys Glu Ala Arg Ile Arg Arg Glu Met
180 185 190
His Gln Ile Ser Arg Arg Ile Lys Arg Leu Lys Trp Lys Trp His Met
195 200 205
Ile Pro Asn Ser Glu Leu His Asn Phe Leu Phe Lys Gln Gln Asp Pro
210 215 220
Ser Phe Val Ala Val Ala Leu Leu His Thr Leu Gly Arg Asp Ile Gly
225 230 235 240
Met Ile Asn Lys Pro Lys Gly Ser Ala Lys Arg Glu Phe Ile Pro Glu
245 250 255
Tyr Gly Phe Gln Ile Tyr Tyr Lys Trp Met Asn Pro Lys Leu Asn Asp
260 265 270
Ile Asn Lys Gln Lys Tyr Arg Lys Met Pro Lys Arg Ser Leu Ile Pro
275 280 285
Tyr Lys Asn Leu Asn Val Phe Gly Asp Arg Glu Leu Ile Glu Asn Ala
290 295 300
Met His Lys Leu Leu Lys Leu Tyr Asp Glu Asn Leu Glu Val Lys Gly
305 310 315 320
Ser Lys Phe Phe Lys Thr Arg Val Val Ala Ile Ser Ser Lys Glu Ser
325 330 335
Glu Lys Leu Lys Arg Asp Leu Leu Trp Lys Gly Glu Leu Ala Lys Ile
340 345 350
Lys Lys Asp Phe Asn Ala Asp Lys Asn Lys Met Gln Glu Leu Phe Lys
355 360 365
Glu Val Lys Glu Pro Lys Lys Ala Asn Ala Leu Met Lys Gln Ser Arg
370 375 380
Asn Met Gly Phe Leu Leu Gln Asn Ile Ser Tyr Gly Ala Leu Gly Leu
385 390 395 400
Leu Ala Asn Arg Met Tyr Glu Ala Ser Ala Lys Gln Ser Lys Gly Asp
405 410 415
Ala Thr Lys Gln Pro Ser Ile Val Ile Pro Leu Glu Met Glu Phe Gly
420 425 430
Asn Ala Phe Pro Lys Leu Leu Leu Arg Ser Gly Lys Phe Ala Met Asn
435 440 445
Val Ser Ser Pro Trp Leu Thr Ile Arg Lys Pro Lys Phe Val Ile Lys
450 455 460
Gly Asn Lys Ile Lys Asn Ile Thr Lys Leu Met Lys Asp Glu Lys Ala
465 470 475 480
Lys Leu Lys Arg Leu Glu Thr Ser Tyr His Arg Ala Thr His Phe Arg
485 490 495
Pro Thr Leu Arg Gly Ser Ile Asp Trp Asp Ser Pro Tyr Phe Ser Ser
500 505 510
Pro Lys Gln Pro Asn Thr His Arg Arg Ser Pro Asp Arg Leu Ser Ala
515 520 525
Asp Ile Thr Glu Tyr Arg Gly Arg Leu Lys Ser Val Glu Ala Glu Leu
530 535 540
Arg Glu Gly Gln Arg Ala Met Ala Lys Lys Leu Asp Ser Val Asp Met
545 550 555 560
Thr Ala Ser Asn Leu Gln Thr Ser Asn Phe Gln Leu Glu Lys Gly Glu
565 570 575
Asp Pro Arg Leu Thr Glu Ile Asp Glu Lys Gly Arg Ser Ile Arg Asn
580 585 590
Cys Ile Ser Ser Trp Lys Lys Phe Met Glu Asp Leu Met Lys Ala Gln
595 600 605
Glu Ala Asn Pro Val Ile Lys Ile Lys Ile Ala Leu Lys Asp Glu Ser
610 615 620
Ser Val Leu Ser Glu Asp Ser Met
625 630
<210> 196
<211> 625
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 196
Lys Phe His Pro Glu Asn Leu Asn Lys Ser Tyr Cys Leu Ala Ile Val
1 5 10 15
Arg Ala Ala Asn Leu Asp Ala Asp Ile Gln Gly His Ile Asn Cys Ile
20 25 30
Gly Ile Lys Ser Asn Lys Ser Asp Arg Asn Tyr Glu Asn Lys Leu Glu
35 40 45
Ser Leu Gln Asn Val Glu Leu Leu Cys Lys Ala Cys Thr Lys Ser Thr
50 55 60
Tyr Lys Pro Asn Ile Asn Ser Val Pro Val Gly Glu Lys Lys Ala Lys
65 70 75 80
Tyr Ser Ile Leu Ser Glu Ile Lys Lys Tyr Asp Phe Asn Ser Leu Val
85 90 95
Tyr Asn Leu Lys Lys Tyr Arg Lys Gly Lys Ser Arg Gly His Gln Lys
100 105 110
Leu Asn Glu Leu Arg Glu Leu Val Ile Thr Ser Glu Tyr Lys Lys Ala
115 120 125
Leu Asp Val Ile Asn Lys Ser Val Asn His Tyr Leu Val Asn Ile Lys
130 135 140
Asn Lys Met Ser Lys Leu Lys Lys Ile Leu Gln Asn Glu His Ile His
145 150 155 160
Val Gly Thr Leu Ala Arg Ile Arg Arg Glu Arg Asn Arg Ile Ser Arg
165 170 175
Lys Leu Asp His Tyr Arg Lys Lys Trp Lys Phe Val Pro Asn Lys Ile
180 185 190
Leu Lys Asn Tyr Val Phe Lys Asn Gln Ser Pro Asp Phe Val Ser Val
195 200 205
Ala Leu Leu His Lys Leu Gly Arg Asp Ile Gly Leu Ile Thr Lys Thr
210 215 220
Ala Ile Leu Gln Lys Ser Phe Pro Glu Tyr Ser Leu Gln Leu Tyr Tyr
225 230 235 240
Lys Tyr Asp Thr Pro Lys Leu Asn Tyr Leu Lys Lys Ser Lys Phe Lys
245 250 255
Ser Leu Pro Lys Arg Ile Leu Ile Ser Tyr Lys Tyr Pro Lys Phe Asp
260 265 270
Ile Asn Ser Asn Tyr Ile Glu Glu Ser Ile Asp Lys Leu Leu Lys Leu
275 280 285
Tyr Glu Glu Ser Pro Ile Tyr Lys Asn Asn Ser Lys Ile Ile Glu Phe
290 295 300
Phe Lys Lys Ser Glu Asp Asn Leu Ile Lys Ser Glu Asn Asp Ser Leu
305 310 315 320
Lys Arg Gly Ile Met Lys Glu Phe Glu Lys Val Thr Lys Asn Phe Ser
325 330 335
Ser Lys Lys Lys Lys Leu Lys Glu Glu Leu Lys Leu Lys Asn Glu Asp
340 345 350
Lys Asn Ser Lys Met Leu Ala Lys Val Ser Arg Pro Ile Gly Phe Leu
355 360 365
Lys Ala Tyr Leu Ser Tyr Met Leu Phe Asn Ile Ile Ser Asn Arg Ile
370 375 380
Phe Glu Phe Ser Arg Lys Ser Ser Gly Arg Ile Pro Gln Leu Pro Ser
385 390 395 400
Cys Ile Ile Asn Leu Gly Asn Gln Phe Glu Asn Phe Lys Asn Glu Leu
405 410 415
Gln Asp Ser Asn Ile Gly Ser Lys Lys Asn Tyr Lys Tyr Phe Cys Asn
420 425 430
Leu Leu Leu Lys Ser Ser Gly Phe Asn Ile Ser Tyr Glu Glu Glu His
435 440 445
Leu Ser Ile Lys Thr Pro Asn Phe Phe Ile Asn Gly Arg Lys Leu Lys
450 455 460
Glu Ile Thr Ser Glu Lys Lys Lys Ile Arg Lys Glu Asn Glu Gln Leu
465 470 475 480
Ile Lys Gln Trp Lys Lys Leu Thr Phe Phe Lys Pro Ser Asn Leu Asn
485 490 495
Gly Lys Lys Thr Ser Asp Lys Ile Arg Phe Lys Ser Pro Asn Asn Pro
500 505 510
Asp Ile Glu Arg Lys Ser Glu Asp Asn Ile Val Glu Asn Ile Ala Lys
515 520 525
Val Lys Tyr Lys Leu Glu Asp Leu Leu Ser Glu Gln Arg Lys Glu Phe
530 535 540
Asn Lys Leu Ala Lys Lys His Asp Gly Val Asp Val Glu Ala Gln Cys
545 550 555 560
Leu Gln Thr Lys Ser Phe Trp Ile Asp Ser Asn Ser Pro Ile Lys Lys
565 570 575
Ser Leu Glu Lys Lys Asn Glu Lys Val Ser Val Lys Lys Lys Met Lys
580 585 590
Ala Ile Arg Ser Cys Ile Ser Ala Trp Lys Trp Phe Met Ala Asp Leu
595 600 605
Ile Glu Ala Gln Lys Glu Thr Pro Met Ile Lys Leu Lys Leu Ala Leu
610 615 620
Met
625
<210> 197
<211> 517
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 197
Thr Thr Leu Val Pro Ser His Leu Ala Gly Ile Glu Val Met Asp Glu
1 5 10 15
Thr Thr Ser Arg Asn Glu Asp Met Ile Gln Lys Glu Thr Ser Arg Ser
20 25 30
Asn Glu Asp Glu Asn Tyr Leu Gly Val Lys Asn Lys Cys Gly Ile Asn
35 40 45
Val His Lys Ser Gly Arg Gly Ser Ser Lys His Glu Pro Asn Met Pro
50 55 60
Pro Glu Lys Ser Gly Glu Gly Gln Met Pro Lys Gln Asp Ser Thr Glu
65 70 75 80
Met Gln Gln Arg Phe Asp Glu Ser Val Thr Gly Glu Thr Gln Val Ser
85 90 95
Ala Gly Ala Thr Ala Ser Ile Lys Thr Asp Ala Arg Ala Asn Ser Gly
100 105 110
Pro Arg Val Gly Thr Ala Arg Ala Leu Ile Val Lys Ala Ser Asn Leu
115 120 125
Asp Arg Asp Ile Lys Leu Gly Cys Lys Pro Cys Glu Tyr Ile Arg Ser
130 135 140
Glu Leu Pro Met Gly Lys Lys Asn Gly Cys Asn His Cys Glu Lys Ser
145 150 155 160
Ser Asp Ile Ala Ser Val Pro Lys Val Glu Ser Gly Phe Arg Lys Ala
165 170 175
Lys Tyr Glu Leu Val Arg Arg Phe Glu Ser Phe Ala Ala Asp Ser Ile
180 185 190
Ser Arg His Leu Gly Lys Glu Gln Ala Arg Thr Arg Gly Lys Arg Gly
195 200 205
Lys Lys Asp Lys Lys Glu Gln Met Gly Lys Val Asn Leu Asp Glu Ile
210 215 220
Ala Ile Leu Lys Asn Glu Ser Leu Ile Glu Tyr Thr Glu Asn Gln Ile
225 230 235 240
Leu Asp Ala Arg Ser Asn Arg Ile Lys Glu Trp Leu Arg Ser Leu Arg
245 250 255
Leu Arg Leu Arg Thr Arg Asn Lys Gly Leu Lys Lys Ser Lys Ser Ile
260 265 270
Arg Arg Gln Leu Ile Thr Leu Arg Arg Asp Tyr Arg Lys Trp Ile Lys
275 280 285
Pro Asn Pro Tyr Arg Pro Asp Glu Asp Pro Asn Glu Asn Ser Leu Arg
290 295 300
Leu His Thr Lys Leu Gly Val Asp Ile Gly Val Gln Gly Gly Asp Asn
305 310 315 320
Lys Arg Met Asn Ser Asp Asp Tyr Glu Thr Ser Phe Ser Ile Thr Trp
325 330 335
Arg Asp Thr Ala Thr Arg Lys Ile Cys Phe Thr Lys Pro Lys Gly Leu
340 345 350
Leu Pro Arg His Met Lys Phe Lys Leu Arg Gly Tyr Pro Glu Leu Ile
355 360 365
Leu Tyr Asn Glu Glu Leu Arg Ile Gln Asp Ser Gln Lys Phe Pro Leu
370 375 380
Val Asp Trp Glu Arg Ile Pro Ile Phe Lys Leu Arg Gly Val Ser Leu
385 390 395 400
Gly Lys Lys Lys Val Lys Ala Leu Asn Arg Ile Thr Glu Ala Pro Arg
405 410 415
Leu Val Val Ala Lys Arg Ile Gln Val Asn Ile Glu Ser Lys Lys Lys
420 425 430
Lys Val Leu Thr Arg Tyr Val Tyr Asn Asp Lys Ser Ile Asn Gly Arg
435 440 445
Leu Val Lys Ala Glu Asp Ser Asn Lys Asp Pro Leu Leu Glu Phe Lys
450 455 460
Lys Gln Ala Glu Glu Ile Asn Ser Asp Ala Lys Tyr Tyr Glu Asn Gln
465 470 475 480
Glu Ile Ala Lys Asn Tyr Leu Trp Gly Cys Glu Gly Leu His Lys Asn
485 490 495
Leu Leu Glu Glu Gln Thr Lys Asn Pro Tyr Leu Ala Phe Lys Tyr Gly
500 505 510
Phe Leu Asn Ile Val
515
<210> 198
<211> 410
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 198
Leu Asp Phe Lys Arg Thr Cys Ser Gln Glu Leu Val Leu Leu Pro Glu
1 5 10 15
Ile Glu Gly Leu Lys Leu Ser Gly Thr Gln Gly Val Thr Ser Leu Ala
20 25 30
Lys Lys Leu Ile Asn Lys Ala Ala Asn Val Asp Arg Asp Glu Ser Tyr
35 40 45
Gly Cys His His Cys Ile His Thr Arg Thr Ser Leu Ser Lys Pro Val
50 55 60
Lys Lys Asp Cys Asn Ser Cys Asn Gln Ser Thr Asn His Pro Ala Val
65 70 75 80
Pro Ile Thr Leu Lys Gly Tyr Lys Ile Ala Phe Tyr Glu Leu Trp His
85 90 95
Arg Phe Thr Ser Trp Ala Val Asp Ser Ile Ser Lys Ala Leu His Arg
100 105 110
Asn Lys Val Met Gly Lys Val Asn Leu Asp Glu Tyr Ala Val Val Asp
115 120 125
Asn Ser His Ile Val Cys Tyr Ala Val Arg Lys Cys Tyr Glu Lys Arg
130 135 140
Gln Arg Ser Val Arg Leu His Lys Arg Ala Tyr Arg Cys Arg Ala Lys
145 150 155 160
His Tyr Asn Lys Ser Gln Pro Lys Val Gly Arg Ile Tyr Lys Lys Ser
165 170 175
Lys Arg Arg Asn Ala Arg Asn Leu Lys Lys Glu Ala Lys Arg Tyr Phe
180 185 190
Gln Pro Asn Glu Ile Thr Asn Gly Ser Ser Asp Ala Leu Phe Tyr Lys
195 200 205
Ile Gly Val Asp Leu Gly Ile Ala Lys Gly Thr Pro Glu Thr Glu Val
210 215 220
Lys Val Asp Val Ser Ile Cys Phe Gln Val Tyr Tyr Gly Asp Ala Arg
225 230 235 240
Arg Val Leu Arg Val Arg Lys Met Asp Glu Leu Gln Ser Phe His Leu
245 250 255
Asp Tyr Thr Gly Lys Leu Lys Leu Lys Gly Ile Gly Asn Lys Asp Thr
260 265 270
Phe Thr Ile Ala Lys Arg Asn Glu Ser Leu Lys Trp Gly Ser Thr Lys
275 280 285
Tyr Glu Val Ser Arg Ala His Lys Lys Phe Lys Pro Phe Gly Lys Lys
290 295 300
Gly Ser Val Lys Arg Lys Cys Asn Asp Tyr Phe Arg Ser Ile Ala Ser
305 310 315 320
Trp Ser Cys Glu Ala Ala Ser Gln Arg Ala Gln Ser Asn Leu Lys Asn
325 330 335
Ala Phe Pro Tyr Gln Lys Ala Leu Val Lys Cys Tyr Lys Asn Leu Asp
340 345 350
Tyr Lys Gly Val Lys Lys Asn Asp Met Trp Tyr Arg Leu Cys Ser Asn
355 360 365
Arg Ile Phe Arg Tyr Ser Arg Ile Ala Glu Asp Ile Ala Gln Tyr Gln
370 375 380
Ser Asp Lys Gly Lys Ala Lys Phe Glu Phe Val Ile Leu Ala Gln Ser
385 390 395 400
Val Ala Glu Tyr Asp Ile Ser Ala Ile Met
405 410
<210> 199
<211> 602
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 199
Val Phe Leu Thr Asp Asp Lys Arg Lys Thr Ala Leu Arg Lys Ile Arg
1 5 10 15
Ser Ala Phe Arg Lys Thr Ala Glu Ile Ala Leu Val Arg Ala Gln Glu
20 25 30
Ala Asp Ser Leu Asp Arg Gln Ala Lys Lys Leu Thr Ile Glu Thr Val
35 40 45
Ser Phe Gly Ala Pro Gly Ala Lys Asn Ala Phe Ile Gly Ser Leu Gln
50 55 60
Gly Tyr Asn Trp Asn Ser His Arg Ala Asn Val Pro Ser Ser Gly Ser
65 70 75 80
Ala Lys Asp Val Phe Arg Ile Thr Glu Leu Gly Leu Gly Ile Pro Gln
85 90 95
Ser Ala His Glu Ala Ser Ile Gly Lys Ser Phe Glu Leu Val Gly Asn
100 105 110
Val Val Arg Tyr Thr Ala Asn Leu Leu Ser Lys Gly Tyr Lys Lys Gly
115 120 125
Ala Val Asn Lys Gly Ala Lys Gln Gln Arg Glu Ile Lys Gly Lys Glu
130 135 140
Gln Leu Ser Phe Asp Leu Ile Ser Asn Gly Pro Ile Ser Gly Asp Lys
145 150 155 160
Leu Ile Asn Gly Gln Lys Asp Ala Leu Ala Trp Trp Leu Ile Asp Lys
165 170 175
Met Gly Phe His Ile Gly Leu Ala Met Glu Pro Leu Ser Ser Pro Asn
180 185 190
Thr Tyr Gly Ile Thr Leu Gln Ala Phe Trp Lys Arg His Thr Ala Pro
195 200 205
Arg Arg Tyr Ser Arg Gly Val Ile Arg Gln Trp Gln Leu Pro Phe Gly
210 215 220
Arg Gln Leu Ala Pro Leu Ile His Asn Phe Phe Arg Lys Lys Gly Ala
225 230 235 240
Ser Ile Pro Ile Val Leu Thr Asn Ala Ser Lys Lys Leu Ala Gly Lys
245 250 255
Gly Val Leu Leu Glu Gln Thr Ala Leu Val Asp Pro Lys Lys Trp Trp
260 265 270
Gln Val Lys Glu Gln Val Thr Gly Pro Leu Ser Asn Ile Trp Glu Arg
275 280 285
Ser Val Pro Leu Val Leu Tyr Thr Ala Thr Phe Thr His Lys His Gly
290 295 300
Ala Ala His Lys Arg Pro Leu Thr Leu Lys Val Ile Arg Ile Ser Ser
305 310 315 320
Gly Ser Val Phe Leu Leu Pro Leu Ser Lys Val Thr Pro Gly Lys Leu
325 330 335
Val Arg Ala Trp Met Pro Asp Ile Asn Ile Leu Arg Asp Gly Arg Pro
340 345 350
Asp Glu Ala Ala Tyr Lys Gly Pro Asp Leu Ile Arg Ala Arg Glu Arg
355 360 365
Ser Phe Pro Leu Ala Tyr Thr Cys Val Thr Gln Ile Ala Asp Glu Trp
370 375 380
Gln Lys Arg Ala Leu Glu Ser Asn Arg Asp Ser Ile Thr Pro Leu Glu
385 390 395 400
Ala Lys Leu Val Thr Gly Ser Asp Leu Leu Gln Ile His Ser Thr Val
405 410 415
Gln Gln Ala Val Glu Gln Gly Ile Gly Gly Arg Ile Ser Ser Pro Ile
420 425 430
Gln Glu Leu Leu Ala Lys Asp Ala Leu Gln Leu Val Leu Gln Gln Leu
435 440 445
Phe Met Thr Val Asp Leu Leu Arg Ile Gln Trp Gln Leu Lys Gln Glu
450 455 460
Val Ala Asp Gly Asn Thr Ser Glu Lys Ala Val Gly Trp Ala Ile Arg
465 470 475 480
Ile Ser Asn Ile His Lys Asp Ala Tyr Lys Thr Ala Ile Glu Pro Cys
485 490 495
Thr Ser Ala Leu Lys Gln Ala Trp Asn Pro Leu Ser Gly Phe Glu Glu
500 505 510
Arg Thr Phe Gln Leu Asp Ala Ser Ile Val Arg Lys Arg Ser Thr Ala
515 520 525
Lys Thr Pro Asp Asp Glu Leu Val Ile Val Leu Arg Gln Gln Ala Ala
530 535 540
Glu Met Thr Val Ala Val Thr Gln Ser Val Ser Lys Glu Leu Met Glu
545 550 555 560
Leu Ala Val Arg His Ser Ala Thr Leu His Leu Leu Val Gly Glu Val
565 570 575
Ala Ser Lys Gln Leu Ser Arg Ser Ala Asp Lys Asp Arg Gly Ala Met
580 585 590
Asp His Trp Lys Leu Leu Ser Gln Ser Met
595 600
<210> 200
<211> 494
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 200
Glu Asp Leu Leu Gln Lys Ala Leu Asn Thr Ala Thr Asn Val Ala Ala
1 5 10 15
Ile Glu Arg His Ser Cys Ile Ser Cys Leu Phe Thr Glu Ser Glu Ile
20 25 30
Asp Val Lys Tyr Lys Thr Pro Asp Lys Ile Gly Gln Asn Thr Ala Gly
35 40 45
Cys Gln Ser Cys Thr Phe Arg Val Gly Tyr Ser Gly Asn Ser His Thr
50 55 60
Leu Pro Met Gly Asn Arg Ile Ala Leu Asp Lys Leu Arg Glu Thr Ile
65 70 75 80
Gln Arg Tyr Ala Trp His Ser Leu Leu Phe Asn Val Pro Pro Ala Pro
85 90 95
Thr Ser Lys Arg Val Arg Ala Ile Ser Glu Leu Arg Val Ala Ala Gly
100 105 110
Arg Glu Arg Leu Phe Thr Val Ile Thr Phe Val Gln Thr Asn Ile Leu
115 120 125
Ser Lys Leu Gln Lys Arg Tyr Ala Ala Asn Trp Thr Pro Lys Ser Gln
130 135 140
Glu Arg Leu Ser Arg Leu Arg Glu Glu Gly Gln His Ile Leu Ser Leu
145 150 155 160
Leu Glu Ser Gly Ser Trp Gln Gln Lys Glu Val Val Arg Glu Asp Gln
165 170 175
Asp Leu Ile Val Cys Ser Ala Leu Thr Lys Pro Gly Leu Ser Ile Gly
180 185 190
Ala Phe Cys Arg Pro Lys Tyr Leu Lys Pro Ala Lys His Ala Leu Val
195 200 205
Leu Arg Leu Ile Phe Val Glu Gln Trp Pro Gly Gln Ile Trp Gly Gln
210 215 220
Ser Lys Arg Thr Arg Arg Met Arg Arg Arg Lys Asp Val Glu Arg Val
225 230 235 240
Tyr Asp Ile Ser Val Gln Ala Trp Ala Leu Lys Gly Lys Glu Thr Arg
245 250 255
Ile Ser Glu Cys Ile Asp Thr Met Arg Arg His Gln Gln Ala Tyr Ile
260 265 270
Gly Val Leu Pro Phe Leu Ile Leu Ser Gly Ser Thr Val Arg Gly Lys
275 280 285
Gly Asp Cys Pro Ile Leu Lys Glu Ile Thr Arg Met Arg Tyr Cys Pro
290 295 300
Asn Asn Glu Gly Leu Ile Pro Leu Gly Ile Phe Tyr Arg Gly Ser Ala
305 310 315 320
Asn Lys Leu Leu Arg Val Val Lys Gly Ser Ser Phe Thr Leu Pro Met
325 330 335
Trp Gln Asn Ile Glu Thr Leu Pro His Pro Glu Pro Phe Ser Pro Glu
340 345 350
Gly Trp Thr Ala Thr Gly Ala Leu Tyr Glu Lys Asn Leu Ala Tyr Trp
355 360 365
Ser Ala Leu Asn Glu Ala Val Asp Trp Tyr Thr Gly Gln Ile Leu Ser
370 375 380
Ser Gly Leu Gln Tyr Pro Asn Gln Asn Glu Phe Leu Ala Arg Leu Gln
385 390 395 400
Asn Val Ile Asp Ser Ile Pro Arg Lys Trp Phe Arg Pro Gln Gly Leu
405 410 415
Lys Asn Leu Lys Pro Asn Gly Gln Glu Asp Ile Val Pro Asn Glu Phe
420 425 430
Val Ile Pro Gln Asn Ala Ile Arg Ala His His Val Ile Glu Trp Tyr
435 440 445
His Lys Thr Asn Asp Leu Val Ala Lys Thr Leu Leu Gly Trp Gly Ser
450 455 460
Gln Thr Thr Leu Asn Gln Thr Arg Pro Gln Gly Asp Leu Arg Phe Thr
465 470 475 480
Tyr Thr Arg Tyr Tyr Phe Arg Glu Lys Glu Val Pro Glu Val
485 490
<210> 201
<211> 649
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 201
Val Pro Lys Lys Lys Leu Met Arg Glu Leu Ala Lys Lys Ala Val Phe
1 5 10 15
Glu Ala Ile Phe Asn Asp Pro Ile Pro Gly Ser Phe Gly Cys Lys Arg
20 25 30
Cys Thr Leu Ile Asp Gly Ala Arg Val Thr Asp Ala Ile Glu Lys Lys
35 40 45
Gln Gly Ala Lys Arg Cys Ala Gly Cys Glu Pro Cys Thr Phe His Thr
50 55 60
Leu Tyr Asp Ser Val Lys His Ala Leu Pro Ala Ala Thr Gly Cys Asp
65 70 75 80
Arg Thr Ala Ile Asp Thr Gly Leu Trp Glu Ile Leu Thr Ala Leu Arg
85 90 95
Ser Tyr Asn Trp Met Ser Phe Arg Arg Asn Ala Val Ser Asp Ala Ser
100 105 110
Gln Lys Gln Val Trp Ser Ile Glu Glu Leu Ala Ile Trp Ala Asp Lys
115 120 125
Glu Arg Ala Leu Arg Val Ile Leu Ser Ala Leu Thr His Thr Ile Gly
130 135 140
Lys Leu Lys Asn Gly Phe Ser Arg Asp Gly Val Trp Lys Gly Gly Lys
145 150 155 160
Gln Leu Tyr Glu Asn Leu Ala Gln Lys Asp Leu Ala Lys Gly Leu Phe
165 170 175
Ala Asn Gly Glu Ile Phe Gly Lys Glu Leu Val Glu Ala Asp His Asp
180 185 190
Met Leu Ala Trp Thr Ile Val Pro Asn His Gln Phe His Ile Gly Leu
195 200 205
Ile Arg Gly Asn Trp Lys Pro Ala Ala Val Glu Ala Ser Thr Ala Phe
210 215 220
Asp Ala Arg Trp Leu Thr Asn Gly Ala Pro Leu Arg Asp Thr Arg Thr
225 230 235 240
His Gly His Arg Gly Arg Arg Phe Asn Arg Thr Glu Lys Leu Thr Val
245 250 255
Leu Cys Ile Lys Arg Asp Gly Gly Val Ser Glu Glu Phe Arg Gln Glu
260 265 270
Arg Asp Tyr Glu Leu Ser Val Met Leu Leu Gln Pro Lys Asn Lys Leu
275 280 285
Lys Pro Glu Pro Lys Gly Glu Leu Asn Ser Phe Glu Asp Leu His Asp
290 295 300
His Trp Trp Phe Leu Lys Gly Asp Glu Ala Thr Ala Leu Val Gly Leu
305 310 315 320
Thr Ser Asp Pro Thr Val Gly Asp Phe Ile Gln Leu Gly Leu Tyr Ile
325 330 335
Arg Asn Pro Ile Lys Ala His Gly Glu Thr Lys Arg Arg Leu Leu Ile
340 345 350
Cys Phe Glu Pro Pro Ile Lys Leu Pro Leu Arg Arg Ala Phe Pro Ser
355 360 365
Glu Ala Phe Lys Thr Trp Glu Pro Thr Ile Asn Val Phe Arg Asn Gly
370 375 380
Arg Arg Asp Thr Glu Ala Tyr Tyr Asp Ile Asp Arg Ala Arg Val Phe
385 390 395 400
Glu Phe Pro Glu Thr Arg Val Ser Leu Glu His Leu Ser Lys Gln Trp
405 410 415
Glu Val Leu Arg Leu Glu Pro Asp Arg Glu Asn Thr Asp Pro Tyr Glu
420 425 430
Ala Gln Gln Asn Glu Gly Ala Glu Leu Gln Val Tyr Ser Leu Leu Gln
435 440 445
Glu Ala Ala Gln Lys Met Ala Pro Lys Val Val Ile Asp Pro Phe Gly
450 455 460
Gln Phe Pro Leu Glu Leu Phe Ser Thr Phe Val Ala Gln Leu Phe Asn
465 470 475 480
Ala Pro Leu Ser Asp Thr Lys Ala Lys Ile Gly Lys Pro Leu Asp Ser
485 490 495
Gly Phe Val Val Glu Ser His Leu His Leu Leu Glu Glu Asp Phe Ala
500 505 510
Tyr Arg Asp Phe Val Arg Val Thr Phe Met Gly Thr Glu Pro Thr Phe
515 520 525
Arg Val Ile His Tyr Ser Asn Gly Glu Gly Tyr Trp Lys Lys Thr Val
530 535 540
Leu Lys Gly Lys Asn Asn Ile Arg Thr Ala Leu Ile Pro Glu Gly Ala
545 550 555 560
Lys Ala Ala Val Asp Ala Tyr Lys Asn Lys Arg Cys Pro Leu Thr Leu
565 570 575
Glu Ala Ala Ile Leu Asn Glu Glu Lys Asp Arg Arg Leu Val Leu Gly
580 585 590
Asn Lys Ala Leu Ser Leu Leu Ala Gln Thr Ala Arg Gly Asn Leu Thr
595 600 605
Ile Leu Glu Ala Leu Ala Ala Glu Val Leu Arg Pro Leu Ser Gly Thr
610 615 620
Glu Gly Val Val His Leu His Ala Cys Val Thr Arg His Ser Thr Leu
625 630 635 640
Thr Glu Ser Thr Glu Thr Asp Asn Met
645
<210> 202
<211> 414
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 202
Val Glu Lys Leu Phe Ser Glu Arg Leu Lys Arg Ala Met Trp Leu Lys
1 5 10 15
Asn Glu Ala Gly Arg Ala Pro Pro Ala Glu Thr Leu Thr Leu Lys His
20 25 30
Lys Arg Val Ser Gly Gly His Glu Lys Val Lys Glu Glu Leu Gln Arg
35 40 45
Val Leu Arg Ser Leu Ser Gly Thr Asn Gln Ala Ala Trp Asn Leu Gly
50 55 60
Leu Ser Gly Gly Arg Glu Pro Lys Ser Ser Asp Ala Leu Lys Gly Glu
65 70 75 80
Lys Ser Arg Val Val Leu Glu Thr Val Val Phe His Ser Gly His Asn
85 90 95
Arg Val Leu Tyr Asp Val Ile Glu Arg Glu Asp Gln Val His Gln Arg
100 105 110
Ser Ser Ile Met His Met Arg Arg Lys Gly Ser Asn Leu Leu Arg Leu
115 120 125
Trp Gly Arg Ser Gly Lys Val Arg Arg Lys Met Arg Glu Glu Val Ala
130 135 140
Glu Ile Lys Pro Val Trp His Lys Asp Ser Arg Trp Leu Ala Ile Val
145 150 155 160
Glu Glu Gly Arg Gln Ser Val Val Gly Ile Ser Ser Ala Gly Leu Ala
165 170 175
Val Phe Ala Val Gln Glu Ser Gln Cys Thr Thr Ala Glu Pro Lys Pro
180 185 190
Leu Glu Tyr Val Val Ser Ile Trp Phe Arg Gly Ser Lys Ala Leu Asn
195 200 205
Pro Gln Asp Arg Tyr Leu Glu Phe Lys Lys Leu Lys Thr Thr Glu Ala
210 215 220
Leu Arg Gly Gln Gln Tyr Asp Pro Ile Pro Phe Ser Leu Lys Arg Gly
225 230 235 240
Ala Gly Cys Ser Leu Ala Ile Arg Gly Glu Gly Ile Lys Phe Gly Ser
245 250 255
Arg Gly Pro Ile Lys Gln Phe Phe Gly Ser Asp Arg Ser Arg Pro Ser
260 265 270
His Ala Asp Tyr Asp Gly Lys Arg Arg Leu Ser Leu Phe Ser Lys Tyr
275 280 285
Ala Gly Asp Leu Ala Asp Leu Thr Glu Glu Gln Trp Asn Arg Thr Val
290 295 300
Ser Ala Phe Ala Glu Asp Glu Val Arg Arg Ala Thr Leu Ala Asn Ile
305 310 315 320
Gln Asp Phe Leu Ser Ile Ser His Glu Lys Tyr Ala Glu Arg Leu Lys
325 330 335
Lys Arg Ile Glu Ser Ile Glu Glu Pro Val Ser Ala Ser Lys Leu Glu
340 345 350
Ala Tyr Leu Ser Ala Ile Phe Glu Thr Phe Val Gln Gln Arg Glu Ala
355 360 365
Leu Ala Ser Asn Phe Leu Met Arg Leu Val Glu Ser Val Ala Leu Leu
370 375 380
Ile Ser Leu Glu Glu Lys Ser Pro Arg Val Glu Phe Arg Val Ala Arg
385 390 395 400
Tyr Leu Ala Glu Ser Lys Glu Gly Phe Asn Arg Lys Ala Met
405 410
<210> 203
<211> 413
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 203
Val Val Ile Thr Gln Ser Glu Leu Tyr Lys Glu Arg Leu Leu Arg Val
1 5 10 15
Met Glu Ile Lys Asn Asp Arg Gly Arg Lys Glu Pro Arg Glu Ser Gln
20 25 30
Gly Leu Val Leu Arg Phe Thr Gln Val Thr Gly Gly Gln Glu Lys Val
35 40 45
Lys Gln Lys Leu Trp Leu Ile Phe Glu Gly Phe Ser Gly Thr Asn Gln
50 55 60
Ala Ser Trp Asn Phe Gly Gln Pro Ala Gly Gly Arg Lys Pro Asn Ser
65 70 75 80
Gly Asp Ala Leu Lys Gly Pro Lys Ser Arg Val Thr Tyr Glu Thr Val
85 90 95
Val Phe His Phe Gly Leu Arg Leu Leu Ser Ala Val Ile Glu Arg His
100 105 110
Asn Leu Lys Gln Gln Arg Gln Thr Met Ala Tyr Met Lys Arg Arg Ala
115 120 125
Ala Ala Arg Lys Lys Trp Ala Arg Ser Gly Lys Lys Cys Ser Arg Met
130 135 140
Arg Asn Glu Val Glu Lys Ile Lys Pro Lys Trp His Lys Asp Pro Arg
145 150 155 160
Trp Phe Asp Ile Val Lys Glu Gly Glu Pro Ser Ile Val Gly Ile Ser
165 170 175
Ser Ala Gly Phe Ala Ile Tyr Ile Val Glu Glu Pro Asn Phe Pro Arg
180 185 190
Gln Asp Pro Leu Glu Ile Glu Tyr Ala Ile Ser Ile Trp Phe Arg Arg
195 200 205
Asp Arg Ser Gln Tyr Leu Thr Phe Lys Lys Ile Gln Lys Ala Glu Lys
210 215 220
Leu Lys Glu Leu Gln Tyr Asn Pro Ile Pro Phe Arg Leu Lys Gln Glu
225 230 235 240
Lys Thr Ser Leu Val Phe Glu Ser Gly Asp Ile Lys Phe Gly Ser Arg
245 250 255
Gly Ser Ile Glu His Phe Arg Asp Glu Ala Arg Gly Lys Pro Pro Lys
260 265 270
Ala Asp Met Asp Asn Asn Arg Arg Leu Thr Met Phe Ser Val Phe Ser
275 280 285
Gly Asn Leu Thr Asn Leu Thr Glu Glu Gln Tyr Ala Arg Pro Val Ser
290 295 300
Gly Leu Leu Ala Pro Asp Glu Lys Arg Met Pro Thr Leu Leu Lys Lys
305 310 315 320
Leu Gln Asp Phe Phe Thr Pro Ile His Glu Lys Tyr Gly Glu Arg Ile
325 330 335
Lys Gln Arg Leu Ala Asn Ser Glu Ala Ser Lys Arg Pro Phe Lys Lys
340 345 350
Leu Glu Glu Tyr Leu Pro Ala Ile Tyr Leu Glu Phe Arg Ala Arg Arg
355 360 365
Glu Gly Leu Ala Ser Asn Trp Val Leu Val Leu Ile Asn Ser Val Arg
370 375 380
Thr Leu Val Arg Ile Lys Ser Glu Asp Pro Tyr Ile Glu Phe Lys Val
385 390 395 400
Ser Gln Tyr Leu Leu Glu Lys Glu Asp Asn Lys Ala Leu
405 410
<210> 204
<211> 449
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 204
Lys Gln Asp Ala Leu Phe Glu Glu Arg Leu Lys Lys Ala Ile Phe Ile
1 5 10 15
Lys Arg Gln Ala Asp Pro Leu Gln Arg Glu Glu Leu Ser Leu Leu Pro
20 25 30
Pro Asn Arg Lys Ile Val Thr Gly Gly His Glu Ser Ala Lys Asp Thr
35 40 45
Leu Lys Gln Ile Leu Arg Ala Ile Asn Gly Thr Asn Gln Ala Ser Trp
50 55 60
Asn Pro Gly Thr Pro Ser Gly Lys Arg Asp Ser Lys Ser Ala Asp Ala
65 70 75 80
Leu Ala Gly Pro Lys Ser Arg Val Lys Leu Glu Thr Val Val Phe His
85 90 95
Val Gly His Arg Leu Leu Lys Lys Val Val Glu Tyr Gln Gly His Gln
100 105 110
Lys Gln Gln His Gly Leu Lys Ala Phe Met Arg Thr Cys Ala Ala Met
115 120 125
Arg Lys Lys Trp Lys Arg Ser Gly Lys Val Val Gly Glu Leu Arg Glu
130 135 140
Gln Leu Ala Asn Ile Gln Pro Lys Trp His Tyr Asp Ser Arg Pro Leu
145 150 155 160
Asn Leu Cys Phe Glu Gly Lys Pro Ser Val Val Gly Leu Arg Ser Ala
165 170 175
Gly Ile Ala Leu Tyr Thr Ile Gln Lys Ser Val Val Pro Val Lys Glu
180 185 190
Pro Lys Pro Ile Glu Tyr Ala Val Ser Ile Trp Phe Arg Gly Pro Lys
195 200 205
Ala Met Asp Arg Glu Asp Arg Cys Leu Glu Phe Lys Lys Leu Lys Ile
210 215 220
Ala Thr Glu Leu Arg Lys Leu Gln Phe Glu Pro Ile Val Ser Thr Leu
225 230 235 240
Thr Gln Gly Ile Lys Gly Phe Ser Leu Tyr Ile Gln Gly Asn Ser Val
245 250 255
Lys Phe Gly Ser Arg Gly Pro Ile Lys Tyr Phe Ser Asn Glu Ser Val
260 265 270
Arg Gln Arg Pro Pro Lys Ala Asp Pro Asp Gly Asn Lys Arg Leu Ala
275 280 285
Leu Phe Ser Lys Phe Ser Gly Asp Leu Ser Asp Leu Thr Glu Glu Gln
290 295 300
Trp Asn Arg Pro Ile Leu Ala Phe Glu Gly Ile Ile Arg Arg Ala Thr
305 310 315 320
Leu Gly Asn Ile Gln Asp Tyr Leu Thr Val Gly His Glu Gln Phe Ala
325 330 335
Ile Ser Leu Glu Gln Leu Leu Ser Glu Lys Glu Ser Val Leu Gln Met
340 345 350
Ser Ile Glu Gln Gln Arg Leu Lys Lys Asn Leu Gly Lys Lys Ala Glu
355 360 365
Asn Glu Trp Val Glu Ser Phe Gly Ala Glu Gln Ala Arg Lys Lys Ala
370 375 380
Gln Gly Ile Arg Glu Tyr Ile Ser Gly Phe Phe Gln Glu Tyr Cys Ser
385 390 395 400
Gln Arg Glu Gln Trp Ala Glu Asn Trp Val Gln Gln Leu Asn Lys Ser
405 410 415
Val Arg Leu Phe Leu Thr Ile Gln Asp Ser Thr Pro Phe Ile Glu Phe
420 425 430
Arg Val Ala Arg Tyr Leu Pro Lys Gly Glu Lys Lys Lys Gly Lys Ala
435 440 445
Met
<210> 205
<211> 711
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 205
Ala Asn His Ala Glu Arg His Lys Arg Leu Arg Lys Glu Ala Asn Arg
1 5 10 15
Ala Ala Asn Arg Asn Arg Pro Leu Val Ala Asp Cys Asp Thr Gly Asp
20 25 30
Pro Leu Val Gly Ile Cys Arg Leu Leu Arg Arg Gly Asp Lys Met Gln
35 40 45
Pro Asn Lys Thr Gly Cys Arg Ser Cys Glu Gln Val Glu Pro Glu Leu
50 55 60
Arg Asp Ala Ile Leu Val Ser Gly Pro Gly Arg Leu Asp Asn Tyr Lys
65 70 75 80
Tyr Glu Leu Phe Gln Arg Gly Arg Ala Met Ala Val His Arg Leu Leu
85 90 95
Lys Arg Val Pro Lys Leu Asn Arg Pro Lys Lys Ala Ala Gly Asn Asp
100 105 110
Glu Lys Lys Ala Glu Asn Lys Lys Ser Glu Ile Gln Lys Glu Lys Gln
115 120 125
Lys Gln Arg Arg Met Met Pro Ala Val Ser Met Lys Gln Val Ser Val
130 135 140
Ala Asp Phe Lys His Val Ile Glu Asn Thr Val Arg His Leu Phe Gly
145 150 155 160
Asp Arg Arg Asp Arg Glu Ile Ala Glu Cys Ala Ala Leu Arg Ala Ala
165 170 175
Ser Lys Tyr Phe Leu Lys Ser Arg Arg Val Arg Pro Arg Lys Leu Pro
180 185 190
Lys Leu Ala Asn Pro Asp His Gly Lys Glu Leu Lys Gly Leu Arg Leu
195 200 205
Arg Glu Lys Arg Ala Lys Leu Lys Lys Glu Lys Glu Lys Gln Ala Glu
210 215 220
Leu Ala Arg Ser Asn Gln Lys Gly Ala Val Leu His Val Ala Thr Leu
225 230 235 240
Lys Lys Asp Ala Pro Pro Met Pro Tyr Glu Lys Thr Gln Gly Arg Asn
245 250 255
Asp Tyr Thr Thr Phe Val Ile Ser Ala Ala Ile Lys Val Gly Ala Thr
260 265 270
Arg Gly Thr Lys Pro Leu Leu Thr Pro Gln Pro Arg Glu Trp Gln Cys
275 280 285
Ser Leu Tyr Trp Arg Asp Gly Gln Arg Trp Ile Arg Gly Gly Leu Leu
290 295 300
Gly Leu Gln Ala Gly Ile Val Leu Gly Pro Lys Leu Asn Arg Glu Leu
305 310 315 320
Leu Glu Ala Val Leu Gln Arg Pro Ile Glu Cys Arg Met Ser Gly Cys
325 330 335
Gly Asn Pro Leu Gln Val Arg Gly Ala Ala Val Asp Phe Phe Met Thr
340 345 350
Thr Asn Pro Phe Tyr Val Ser Gly Ala Ala Tyr Ala Gln Lys Lys Phe
355 360 365
Lys Pro Phe Gly Thr Lys Arg Ala Ser Glu Asp Gly Ala Ala Ala Lys
370 375 380
Ala Arg Glu Lys Leu Met Thr Gln Leu Ala Lys Val Leu Asp Lys Val
385 390 395 400
Val Thr Gln Ala Ala His Ser Pro Leu Asp Gly Ile Trp Glu Thr Arg
405 410 415
Pro Glu Ala Lys Leu Arg Ala Met Ile Met Ala Leu Glu His Glu Trp
420 425 430
Ile Phe Leu Arg Pro Gly Pro Cys His Asn Ala Ala Glu Glu Val Ile
435 440 445
Lys Cys Asp Cys Thr Gly Gly His Ala Ile Leu Trp Ala Leu Ile Asp
450 455 460
Glu Ala Arg Gly Ala Leu Glu His Lys Glu Phe Tyr Ala Val Thr Arg
465 470 475 480
Ala His Thr His Asp Cys Glu Lys Gln Lys Leu Gly Gly Arg Leu Ala
485 490 495
Gly Phe Leu Asp Leu Leu Ile Ala Gln Asp Val Pro Leu Asp Asp Ala
500 505 510
Pro Ala Ala Arg Lys Ile Lys Thr Leu Leu Glu Ala Thr Pro Pro Ala
515 520 525
Pro Cys Tyr Lys Ala Ala Thr Ser Ile Ala Thr Cys Asp Cys Glu Gly
530 535 540
Lys Phe Asp Lys Leu Trp Ala Ile Ile Asp Ala Thr Arg Ala Gly His
545 550 555 560
Gly Thr Glu Asp Leu Trp Ala Arg Thr Leu Ala Tyr Pro Gln Asn Val
565 570 575
Asn Cys Lys Cys Lys Ala Gly Lys Asp Leu Thr His Arg Leu Ala Asp
580 585 590
Phe Leu Gly Leu Leu Ile Lys Arg Asp Gly Pro Phe Arg Glu Arg Pro
595 600 605
Pro His Lys Val Thr Gly Asp Arg Lys Leu Val Phe Ser Gly Asp Lys
610 615 620
Lys Cys Lys Gly His Gln Tyr Val Ile Leu Ala Lys Ala His Asn Glu
625 630 635 640
Glu Val Val Arg Ala Trp Ile Ser Arg Trp Gly Leu Lys Ser Arg Thr
645 650 655
Asn Lys Ala Gly Tyr Ala Ala Thr Glu Leu Asn Leu Leu Leu Asn Trp
660 665 670
Leu Ser Ile Cys Arg Arg Arg Trp Met Asp Met Leu Thr Val Gln Arg
675 680 685
Asp Thr Pro Tyr Ile Arg Met Lys Thr Gly Arg Leu Val Val Asp Asp
690 695 700
Lys Lys Glu Arg Lys Ala Met
705 710
<210> 206
<211> 574
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 206
Ala Lys Gln Arg Glu Ala Leu Arg Val Ala Leu Glu Arg Gly Ile Val
1 5 10 15
Arg Ala Ser Asn Arg Thr Tyr Thr Leu Val Thr Asn Cys Thr Lys Gly
20 25 30
Gly Pro Leu Pro Glu Gln Cys Arg Met Ile Glu Arg Gly Lys Ala Arg
35 40 45
Ala Met Lys Trp Glu Pro Lys Leu Val Gly Cys Gly Ser Cys Ala Ala
50 55 60
Ala Thr Val Asp Leu Pro Ala Ile Glu Glu Tyr Ala Gln Pro Gly Arg
65 70 75 80
Leu Asp Val Ala Lys Tyr Lys Leu Thr Thr Gln Ile Leu Ala Met Ala
85 90 95
Thr Arg Arg Met Met Val Arg Ala Ala Lys Leu Ser Arg Arg Lys Gly
100 105 110
Gln Trp Pro Ala Lys Val Gln Glu Glu Lys Glu Glu Pro Pro Glu Pro
115 120 125
Lys Lys Met Leu Lys Ala Val Glu Met Arg Pro Val Ala Ile Val Asp
130 135 140
Phe Asn Arg Val Ile Gln Thr Thr Ile Glu His Leu Trp Ala Glu Arg
145 150 155 160
Ala Asn Ala Asp Glu Ala Glu Leu Lys Ala Leu Lys Ala Ala Ala Ala
165 170 175
Tyr Phe Gly Pro Ser Leu Lys Ile Arg Ala Arg Gly Pro Pro Lys Ala
180 185 190
Ala Ile Gly Arg Glu Leu Lys Lys Ala His Arg Lys Lys Ala Tyr Ala
195 200 205
Glu Arg Lys Lys Ala Arg Arg Lys Arg Ala Glu Leu Ala Arg Ser Gln
210 215 220
Ala Arg Gly Ala Ala Ala His Ala Ala Ile Arg Glu Arg Asp Ile Pro
225 230 235 240
Pro Met Ala Tyr Glu Arg Thr Gln Gly Arg Asn Asp Val Thr Thr Ile
245 250 255
Pro Ile Ala Ala Ala Ile Lys Ile Ala Ala Thr Arg Gly Ala Arg Pro
260 265 270
Leu Pro Ala Pro Lys Pro Met Lys Trp Gln Cys Ser Leu Tyr Trp Asn
275 280 285
Glu Gly Gln Arg Trp Ile Arg Gly Gly Met Leu Thr Ala Gln Ala Tyr
290 295 300
Ala His Ala Ala Asn Ile His Arg Pro Met Arg Cys Glu Met Trp Gly
305 310 315 320
Val Gly Asn Pro Leu Lys Val Arg Ala Phe Glu Gly Arg Val Ala Asp
325 330 335
Pro Asp Gly Ala Lys Gly Arg Lys Ala Glu Phe Arg Leu Gln Thr Asn
340 345 350
Ala Phe Tyr Val Ser Gly Ala Ala Tyr Arg Asn Lys Lys Phe Lys Pro
355 360 365
Phe Gly Thr Asp Arg Gly Gly Ile Gly Ser Ala Arg Lys Lys Arg Glu
370 375 380
Arg Leu Met Ala Gln Leu Ala Lys Ile Leu Asp Lys Val Val Ser Gln
385 390 395 400
Ala Ala His Ser Pro Leu Asp Asp Ile Trp His Thr Arg Pro Ala Gln
405 410 415
Lys Leu Arg Ala Met Ile Lys Gln Leu Glu His Glu Trp Met Phe Leu
420 425 430
Arg Pro Gln Ala Pro Thr Val Glu Gly Thr Lys Pro Asp Val Asp Val
435 440 445
Ala Gly Asn Met Gln Arg Gln Ile Lys Ala Leu Met Ala Pro Asp Leu
450 455 460
Pro Pro Ile Glu Lys Gly Ser Pro Ala Lys Arg Phe Thr Gly Asp Lys
465 470 475 480
Arg Lys Lys Gly Glu Arg Ala Val Arg Val Ala Glu Ala His Ser Asp
485 490 495
Glu Val Val Thr Ala Trp Ile Ser Arg Trp Gly Ile Gln Thr Arg Arg
500 505 510
Asn Glu Gly Ser Tyr Ala Ala Gln Glu Leu Glu Leu Leu Leu Asn Trp
515 520 525
Leu Gln Ile Cys Arg Arg Arg Trp Leu Asp Met Thr Ala Ala Gln Arg
530 535 540
Val Ser Pro Tyr Ile Arg Met Lys Ser Gly Arg Met Ile Thr Asp Ala
545 550 555 560
Ala Asp Glu Gly Val Ala Pro Ile Pro Leu Val Glu Asn Met
565 570
<210> 207
<211> 743
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 207
Lys Ser Ile Ser Gly Arg Ser Ile Lys His Met Ala Cys Leu Lys Asp
1 5 10 15
Met Leu Lys Ser Glu Ile Thr Glu Ile Glu Glu Lys Gln Lys Lys Glu
20 25 30
Ser Leu Arg Lys Trp Asp Tyr Tyr Ser Lys Phe Ser Asp Glu Ile Leu
35 40 45
Phe Arg Arg Asn Leu Asn Val Ser Ala Asn His Asp Ala Asn Ala Cys
50 55 60
Tyr Gly Cys Asn Pro Cys Ala Phe Leu Lys Glu Val Tyr Gly Phe Arg
65 70 75 80
Ile Glu Arg Arg Asn Asn Glu Arg Ile Ile Ser Tyr Arg Arg Gly Leu
85 90 95
Ala Gly Cys Lys Ser Cys Val Gln Ser Thr Gly Tyr Pro Pro Ile Glu
100 105 110
Phe Val Arg Arg Lys Phe Gly Ala Asp Lys Ala Met Glu Ile Val Arg
115 120 125
Glu Val Leu His Arg Arg Asn Trp Gly Ala Leu Ala Arg Asn Ile Gly
130 135 140
Arg Glu Lys Glu Ala Asp Pro Ile Leu Gly Glu Leu Asn Glu Leu Leu
145 150 155 160
Leu Val Asp Ala Arg Pro Tyr Phe Gly Asn Lys Ser Ala Ala Asn Glu
165 170 175
Thr Asn Leu Ala Phe Asn Val Ile Thr Arg Ala Ala Lys Lys Phe Arg
180 185 190
Asp Glu Gly Met Tyr Asp Ile His Lys Gln Leu Asp Ile His Ser Glu
195 200 205
Glu Gly Lys Val Pro Lys Gly Arg Lys Ser Arg Leu Ile Arg Ile Glu
210 215 220
Arg Lys His Lys Ala Ile His Gly Leu Asp Pro Gly Glu Thr Trp Arg
225 230 235 240
Tyr Pro His Cys Gly Lys Gly Glu Lys Tyr Gly Val Trp Leu Asn Arg
245 250 255
Ser Arg Leu Ile His Ile Lys Gly Asn Glu Tyr Arg Cys Leu Thr Ala
260 265 270
Phe Gly Thr Thr Gly Arg Arg Met Ser Leu Asp Val Ala Cys Ser Val
275 280 285
Leu Gly His Pro Leu Val Lys Lys Lys Arg Lys Lys Gly Lys Lys Thr
290 295 300
Val Asp Gly Thr Glu Leu Trp Gln Ile Lys Lys Ala Thr Glu Thr Leu
305 310 315 320
Pro Glu Asp Pro Ile Asp Cys Thr Phe Tyr Leu Tyr Ala Ala Lys Pro
325 330 335
Thr Lys Asp Pro Phe Ile Leu Lys Val Gly Ser Leu Lys Ala Pro Arg
340 345 350
Trp Lys Lys Leu His Lys Asp Phe Phe Glu Tyr Ser Asp Thr Glu Lys
355 360 365
Thr Gln Gly Gln Glu Lys Gly Lys Arg Val Val Arg Arg Gly Lys Val
370 375 380
Pro Arg Ile Leu Ser Leu Arg Pro Asp Ala Lys Phe Lys Val Ser Ile
385 390 395 400
Trp Asp Asp Pro Tyr Asn Gly Lys Asn Lys Glu Gly Thr Leu Leu Arg
405 410 415
Met Glu Leu Ser Gly Leu Asp Gly Ala Lys Lys Pro Leu Ile Leu Lys
420 425 430
Arg Tyr Gly Glu Pro Asn Thr Lys Pro Lys Asn Phe Val Phe Trp Arg
435 440 445
Pro His Ile Thr Pro His Pro Leu Thr Phe Thr Pro Lys His Asp Phe
450 455 460
Gly Asp Pro Asn Lys Lys Thr Lys Arg Arg Arg Val Phe Asn Arg Glu
465 470 475 480
Tyr Tyr Gly His Leu Asn Asp Leu Ala Lys Met Glu Pro Asn Ala Lys
485 490 495
Phe Phe Glu Asp Arg Glu Val Ser Asn Lys Lys Asn Pro Lys Ala Lys
500 505 510
Asn Ile Arg Ile Gln Ala Lys Glu Ser Leu Pro Asn Ile Val Ala Lys
515 520 525
Asn Gly Arg Trp Ala Ala Phe Asp Pro Asn Asp Ser Leu Trp Lys Leu
530 535 540
Tyr Leu His Trp Arg Gly Arg Arg Lys Thr Ile Lys Gly Gly Ile Ser
545 550 555 560
Gln Glu Phe Gln Glu Phe Lys Glu Arg Leu Asp Leu Tyr Lys Lys His
565 570 575
Glu Asp Glu Ser Glu Trp Lys Glu Lys Glu Lys Leu Trp Glu Asn His
580 585 590
Glu Lys Glu Trp Lys Lys Thr Leu Glu Ile His Gly Ser Ile Ala Glu
595 600 605
Val Ser Gln Arg Cys Val Met Gln Ser Met Met Gly Pro Leu Asp Gly
610 615 620
Leu Val Gln Lys Lys Asp Tyr Val His Ile Gly Gln Ser Ser Leu Lys
625 630 635 640
Ala Ala Asp Asp Ala Trp Thr Phe Ser Ala Asn Arg Tyr Lys Lys Ala
645 650 655
Thr Gly Pro Lys Trp Gly Lys Ile Ser Val Ser Asn Leu Leu Tyr Asp
660 665 670
Ala Asn Gln Ala Asn Ala Glu Leu Ile Ser Gln Ser Ile Ser Lys Tyr
675 680 685
Leu Ser Lys Gln Lys Asp Asn Gln Gly Cys Glu Gly Arg Lys Met Lys
690 695 700
Phe Leu Ile Lys Ile Ile Glu Pro Leu Arg Glu Asn Phe Val Lys His
705 710 715 720
Thr Arg Trp Leu His Glu Met Thr Gln Lys Asp Cys Glu Val Arg Ala
725 730 735
Gln Phe Ser Arg Val Ser Met
740
<210> 208
<211> 769
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 208
Phe Pro Ser Asp Val Gly Ala Asp Ala Leu Lys His Val Arg Met Leu
1 5 10 15
Gln Pro Arg Leu Thr Asp Glu Val Arg Lys Val Ala Leu Thr Arg Ala
20 25 30
Pro Ser Asp Arg Pro Ala Leu Ala Arg Phe Ala Ala Val Ala Gln Asp
35 40 45
Gly Leu Ala Phe Val Arg His Leu Asn Val Ser Ala Asn His Asp Ser
50 55 60
Asn Cys Thr Phe Pro Arg Asp Pro Arg Asp Pro Arg Arg Gly Pro Cys
65 70 75 80
Glu Pro Asn Pro Cys Ala Phe Leu Arg Glu Val Trp Gly Phe Arg Ile
85 90 95
Val Ala Arg Gly Asn Glu Arg Ala Leu Ser Tyr Arg Arg Gly Leu Ala
100 105 110
Gly Cys Lys Ser Cys Val Gln Ser Thr Gly Phe Pro Ser Val Pro Phe
115 120 125
His Arg Ile Gly Ala Asp Asp Cys Met Arg Lys Leu His Glu Ile Leu
130 135 140
Lys Ala Arg Asn Trp Arg Leu Leu Ala Arg Asn Ile Gly Arg Glu Arg
145 150 155 160
Glu Ala Asp Pro Leu Leu Thr Glu Leu Ser Glu Tyr Leu Leu Val Asp
165 170 175
Ala Arg Thr Tyr Pro Asp Gly Ala Ala Pro Asn Ser Gly Arg Leu Ala
180 185 190
Glu Asn Val Ile Lys Arg Ala Ala Lys Lys Phe Arg Asp Glu Gly Met
195 200 205
Arg Asp Ile His Ala Gln Leu Arg Val His Ser Arg Glu Gly Lys Val
210 215 220
Pro Lys Gly Arg Leu Gln Arg Leu Arg Arg Ile Glu Arg Lys His Arg
225 230 235 240
Ala Ile His Ala Leu Asp Pro Gly Pro Ser Trp Glu Ala Glu Gly Ser
245 250 255
Ala Arg Ala Glu Val Gln Gly Val Ala Val Tyr Arg Ser Gln Leu Leu
260 265 270
Arg Val Gly His His Thr Gln Gln Ile Glu Pro Val Gly Ile Val Ala
275 280 285
Arg Thr Leu Phe Gly Val Gly Arg Thr Asp Leu Asp Val Ala Val Ser
290 295 300
Val Leu Gly Ala Pro Leu Thr Lys Arg Lys Lys Gly Ser Lys Thr Leu
305 310 315 320
Glu Ser Thr Glu Asp Phe Arg Ile Ala Lys Ala Arg Glu Thr Arg Ala
325 330 335
Glu Asp Lys Ile Glu Val Ala Phe Val Leu Tyr Pro Thr Ala Ser Leu
340 345 350
Leu Arg Asp Glu Ile Pro Lys Asp Ala Phe Pro Ala Met Arg Ile Asp
355 360 365
Arg Phe Leu Leu Lys Val Gly Ser Val Gln Ala Asp Arg Glu Ile Leu
370 375 380
Leu Gln Asp Asp Tyr Tyr Arg Phe Gly Asp Ala Glu Val Lys Ala Gly
385 390 395 400
Lys Asn Lys Gly Arg Thr Val Thr Arg Pro Val Lys Val Pro Arg Leu
405 410 415
Gln Ala Leu Arg Pro Asp Ala Lys Phe Arg Val Asn Val Trp Ala Asp
420 425 430
Pro Phe Gly Ala Gly Asp Ser Pro Gly Thr Leu Leu Arg Leu Glu Val
435 440 445
Ser Gly Val Thr Arg Arg Ser Gln Pro Leu Arg Leu Leu Arg Tyr Gly
450 455 460
Gln Pro Ser Thr Gln Pro Ala Asn Phe Leu Cys Trp Arg Pro His Arg
465 470 475 480
Val Pro Asp Pro Met Thr Phe Thr Pro Arg Gln Lys Phe Gly Glu Arg
485 490 495
Arg Lys Asn Arg Arg Thr Arg Arg Pro Arg Val Phe Glu Arg Leu Tyr
500 505 510
Gln Val His Ile Lys His Leu Ala His Leu Glu Pro Asn Arg Lys Trp
515 520 525
Phe Glu Glu Ala Arg Val Ser Ala Gln Lys Trp Ala Lys Ala Arg Ala
530 535 540
Ile Arg Arg Lys Gly Ala Glu Asp Ile Pro Val Val Ala Pro Pro Ala
545 550 555 560
Lys Arg Arg Trp Ala Ala Leu Gln Pro Asn Ala Glu Leu Trp Asp Leu
565 570 575
Tyr Ala His Asp Arg Glu Ala Arg Lys Arg Phe Arg Gly Gly Arg Ala
580 585 590
Ala Glu Gly Glu Glu Phe Lys Pro Arg Leu Asn Leu Tyr Leu Ala His
595 600 605
Glu Pro Glu Ala Glu Trp Glu Ser Lys Arg Asp Arg Trp Glu Arg Tyr
610 615 620
Glu Lys Lys Trp Thr Ala Val Leu Glu Glu His Ser Arg Met Cys Ala
625 630 635 640
Val Ala Asp Arg Thr Leu Pro Gln Phe Leu Ser Asp Pro Leu Gly Ala
645 650 655
Arg Met Asp Asp Lys Asp Tyr Ala Phe Val Gly Lys Ser Ala Leu Ala
660 665 670
Val Ala Glu Ala Phe Val Glu Glu Gly Thr Val Glu Arg Ala Gln Gly
675 680 685
Asn Cys Ser Ile Thr Ala Lys Lys Lys Phe Ala Ser Asn Ala Ser Arg
690 695 700
Lys Arg Leu Ser Val Ala Asn Leu Leu Asp Val Ser Asp Lys Ala Asp
705 710 715 720
Arg Ala Leu Val Phe Gln Ala Val Arg Gln Tyr Val Gln Arg Gln Ala
725 730 735
Glu Asn Gly Gly Val Glu Gly Arg Arg Met Ala Phe Leu Arg Lys Leu
740 745 750
Leu Ala Pro Leu Arg Gln Asn Phe Val Cys His Thr Arg Trp Leu His
755 760 765
Met
<210> 209
<211> 564
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 209
Ala Ala Arg Lys Lys Lys Arg Gly Lys Ile Gly Ile Thr Val Lys Ala
1 5 10 15
Lys Glu Lys Ser Pro Pro Ala Ala Gly Pro Phe Met Ala Arg Lys Leu
20 25 30
Val Asn Val Ala Ala Asn Val Asp Gly Val Glu Val His Leu Cys Val
35 40 45
Glu Cys Glu Ala Asp Ala His Gly Ser Ala Ser Ala Arg Leu Leu Gly
50 55 60
Gly Cys Arg Ser Cys Thr Gly Ser Ile Gly Ala Glu Gly Arg Leu Met
65 70 75 80
Gly Ser Val Asp Val Asp Arg Glu Arg Val Ile Ala Glu Pro Val His
85 90 95
Thr Glu Thr Glu Arg Leu Gly Pro Asp Val Lys Ala Phe Glu Ala Gly
100 105 110
Thr Ala Glu Ser Lys Tyr Ala Ile Gln Arg Gly Leu Glu Tyr Trp Gly
115 120 125
Val Asp Leu Ile Ser Arg Asn Arg Ala Arg Thr Val Arg Lys Met Glu
130 135 140
Glu Ala Asp Arg Pro Glu Ser Ser Thr Met Glu Lys Thr Ser Trp Asp
145 150 155 160
Glu Ile Ala Ile Lys Thr Tyr Ser Gln Ala Tyr His Ala Ser Glu Asn
165 170 175
His Leu Phe Trp Glu Arg Gln Arg Arg Val Arg Gln His Ala Leu Ala
180 185 190
Leu Phe Arg Arg Ala Arg Glu Arg Asn Arg Gly Glu Ser Pro Leu Gln
195 200 205
Ser Thr Gln Arg Pro Ala Pro Leu Val Leu Ala Ala Leu His Ala Glu
210 215 220
Ala Ala Ala Ile Ser Gly Arg Ala Arg Ala Glu Tyr Val Leu Arg Gly
225 230 235 240
Pro Ser Ala Asn Val Arg Ala Ala Ala Ala Asp Ile Asp Ala Lys Pro
245 250 255
Leu Gly His Tyr Lys Thr Pro Ser Pro Lys Val Ala Arg Gly Phe Pro
260 265 270
Val Lys Arg Asp Leu Leu Arg Ala Arg His Arg Ile Val Gly Leu Ser
275 280 285
Arg Ala Tyr Phe Lys Pro Ser Asp Val Val Arg Gly Thr Ser Asp Ala
290 295 300
Ile Ala His Val Ala Gly Arg Asn Ile Gly Val Ala Gly Gly Lys Pro
305 310 315 320
Lys Glu Ile Glu Lys Thr Phe Thr Leu Pro Phe Val Ala Tyr Trp Glu
325 330 335
Asp Val Asp Arg Val Val His Cys Ser Ser Phe Lys Ala Asp Gly Pro
340 345 350
Trp Val Arg Asp Gln Arg Ile Lys Ile Arg Gly Val Ser Ser Ala Val
355 360 365
Gly Thr Phe Ser Leu Tyr Gly Leu Asp Val Ala Trp Ser Lys Pro Thr
370 375 380
Ser Phe Tyr Ile Arg Cys Ser Asp Ile Arg Lys Lys Phe His Pro Lys
385 390 395 400
Gly Phe Gly Pro Met Lys His Trp Arg Gln Trp Ala Lys Glu Leu Asp
405 410 415
Arg Leu Thr Glu Gln Arg Ala Ser Cys Val Val Arg Ala Leu Gln Asp
420 425 430
Asp Glu Glu Leu Leu Gln Thr Met Glu Arg Gly Gln Arg Tyr Tyr Asp
435 440 445
Val Phe Ser Cys Ala Ala Thr His Ala Thr Arg Gly Glu Ala Asp Pro
450 455 460
Ser Gly Gly Cys Ser Arg Cys Glu Leu Val Ser Cys Gly Val Ala His
465 470 475 480
Lys Val Thr Lys Lys Ala Lys Gly Asp Thr Gly Ile Glu Ala Val Ala
485 490 495
Val Ala Gly Cys Ser Leu Cys Glu Ser Lys Leu Val Gly Pro Ser Lys
500 505 510
Pro Arg Val His Arg Gln Met Ala Ala Leu Arg Gln Ser His Ala Leu
515 520 525
Asn Tyr Leu Arg Arg Leu Gln Arg Glu Trp Glu Ala Leu Glu Ala Val
530 535 540
Gln Ala Pro Thr Pro Tyr Leu Arg Phe Lys Tyr Ala Arg His Leu Glu
545 550 555 560
Val Arg Ser Met
<210> 210
<211> 565
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 210
Ala Ala Lys Lys Lys Lys Gln Arg Gly Lys Ile Gly Ile Ser Val Lys
1 5 10 15
Pro Lys Glu Gly Ser Ala Pro Pro Ala Asp Gly Pro Phe Met Ala Arg
20 25 30
Lys Leu Val Asn Val Ala Ala Asn Val Asp Gly Val Glu Val Asn Leu
35 40 45
Cys Ile Glu Cys Glu Ala Asp Ala His Gly Ser Ala Pro Ala Arg Leu
50 55 60
Leu Gly Gly Cys Lys Ser Cys Thr Gly Ser Ile Gly Ala Glu Gly Arg
65 70 75 80
Leu Met Gly Ser Val Asp Val Asp Arg Ala Asp Ala Ile Ala Lys Pro
85 90 95
Val Asn Thr Glu Thr Glu Lys Leu Gly Pro Asp Val Gln Ala Phe Glu
100 105 110
Ala Gly Thr Ala Glu Thr Lys Tyr Ala Leu Gln Arg Gly Leu Glu Tyr
115 120 125
Trp Gly Val Asp Leu Ile Ser Arg Asn Arg Ser Arg Thr Val Arg Arg
130 135 140
Thr Glu Glu Gly Gln Pro Glu Ser Ala Thr Met Glu Lys Thr Ser Trp
145 150 155 160
Asp Glu Ile Ala Ile Lys Ser Tyr Thr Arg Ala Tyr His Ala Ser Glu
165 170 175
Asn His Leu Phe Trp Glu Arg Gln Arg Arg Val Arg Gln His Ala Leu
180 185 190
Ala Leu Phe Lys Arg Ala Lys Glu Arg Asn Arg Gly Asp Ser Thr Leu
195 200 205
Pro Arg Glu Pro Gly His Gly Leu Val Ala Ile Ala Ala Leu Ala Cys
210 215 220
Glu Ala Tyr Ala Val Gly Gly Arg Asn Leu Ala Glu Thr Val Val Arg
225 230 235 240
Gly Pro Thr Phe Gly Thr Ala Arg Ala Val Arg Asp Val Glu Ile Ala
245 250 255
Ser Leu Gly Arg Tyr Lys Thr Pro Ser Pro Lys Val Ala His Gly Ser
260 265 270
Pro Val Lys Arg Asp Phe Leu Arg Ala Arg His Arg Ile Val Gly Leu
275 280 285
Ala Arg Ala Tyr Tyr Arg Pro Ser Asp Val Val Arg Gly Thr Ser Asp
290 295 300
Ala Ile Ala His Val Ala Gly Arg Asn Ile Gly Val Ala Gly Gly Lys
305 310 315 320
Pro Arg Ala Val Glu Ala Val Phe Thr Leu Pro Phe Val Ala Tyr Trp
325 330 335
Glu Asp Val Asp Arg Val Val His Cys Ser Ser Phe Gln Val Ser Ala
340 345 350
Pro Trp Asn Arg Asp Gln Arg Met Lys Ile Ala Gly Val Thr Thr Ala
355 360 365
Ala Gly Thr Phe Ser Leu His Gly Gly Glu Leu Lys Trp Ala Lys Pro
370 375 380
Thr Ser Phe Tyr Ile Arg Cys Ser Asp Thr Arg Arg Lys Phe Arg Pro
385 390 395 400
Lys Gly Phe Gly Pro Met Lys Arg Trp Arg Gln Trp Ala Lys Asp Leu
405 410 415
Asp Arg Leu Val Glu Gln Arg Ala Ser Cys Val Val Arg Ala Leu Gln
420 425 430
Asp Asp Ala Ala Leu Leu Glu Thr Met Glu Arg Gly Gln Arg Tyr Tyr
435 440 445
Asp Val Phe Ala Cys Ala Val Thr His Ala Thr Arg Gly Glu Ala Asp
450 455 460
Arg Leu Ala Gly Cys Ser Arg Cys Ala Leu Thr Pro Cys Gln Glu Ala
465 470 475 480
His Arg Val Thr Thr Lys Pro Arg Gly Asp Ala Gly Val Glu Gln Val
485 490 495
Gln Thr Ser Asp Cys Ser Leu Cys Glu Gly Lys Leu Val Gly Pro Ser
500 505 510
Lys Pro Arg Leu His Arg Thr Leu Thr Leu Leu Arg Gln Glu His Gly
515 520 525
Leu Asn Tyr Leu Arg Arg Leu Gln Arg Glu Trp Glu Ser Leu Glu Ala
530 535 540
Val Gln Val Pro Thr Pro Tyr Leu Arg Phe Lys Tyr Ala Arg His Leu
545 550 555 560
Glu Val Arg Ser Met
565
<210> 211
<211> 499
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 211
Thr Asp Ser Gln Ser Glu Ser Val Pro Glu Val Val Tyr Ala Leu Thr
1 5 10 15
Gly Gly Glu Val Pro Gly Arg Val Pro Pro Asp Gly Gly Ser Ala Glu
20 25 30
Gly Ala Arg Asn Ala Pro Thr Gly Leu Arg Lys Gln Arg Gly Lys Ile
35 40 45
Lys Ile Ser Ala Lys Pro Ser Lys Pro Gly Ser Pro Ala Ser Ser Leu
50 55 60
Ala Arg Thr Leu Val Asn Glu Ala Ala Asn Val Asp Gly Val Gln Ser
65 70 75 80
Ser Gly Cys Ala Thr Cys Arg Met Arg Ala Asn Gly Ser Ala Pro Arg
85 90 95
Ala Leu Pro Ile Gly Cys Val Ala Cys Ala Ser Ser Ile Gly Arg Ala
100 105 110
Pro Gln Glu Glu Thr Val Cys Ala Leu Pro Thr Thr Gln Gly Pro Asp
115 120 125
Val Arg Leu Leu Glu Gly Gly His Ala Leu Arg Lys Tyr Asp Ile Gln
130 135 140
Arg Ala Leu Glu Tyr Trp Gly Val Asp Leu Ile Gly Arg Asn Leu Asp
145 150 155 160
Arg Gln Ala Gly Arg Gly Met Glu Pro Ala Glu Gly Ala Thr Ala Thr
165 170 175
Met Lys Arg Val Ser Met Asp Glu Leu Ala Val Leu Asp Phe Gly Lys
180 185 190
Ser Tyr Tyr Ala Ser Glu Gln His Leu Phe Ala Ala Arg Gln Arg Arg
195 200 205
Val Arg Gln His Ala Lys Ala Leu Lys Ile Arg Ala Lys His Ala Asn
210 215 220
Arg Ser Gly Ser Val Lys Arg Ala Leu Asp Arg Ser Arg Lys Gln Val
225 230 235 240
Thr Ala Leu Ala Arg Glu Phe Phe Lys Pro Ser Asp Val Val Arg Gly
245 250 255
Asp Ser Asp Ala Leu Ala His Val Val Gly Arg Asn Leu Gly Val Ser
260 265 270
Arg His Pro Ala Arg Glu Ile Pro Gln Thr Phe Thr Leu Pro Leu Cys
275 280 285
Ala Tyr Trp Glu Asp Val Asp Arg Val Ile Ser Cys Ser Ser Leu Leu
290 295 300
Ala Gly Glu Pro Phe Ala Arg Asp Gln Glu Ile Arg Ile Glu Gly Val
305 310 315 320
Ser Ser Ala Leu Gly Ser Leu Arg Leu Tyr Arg Gly Ala Ile Glu Trp
325 330 335
His Lys Pro Thr Ser Leu Tyr Ile Arg Cys Ser Asp Thr Arg Arg Lys
340 345 350
Phe Arg Pro Arg Gly Gly Leu Lys Lys Arg Trp Arg Gln Trp Ala Lys
355 360 365
Asp Leu Asp Arg Leu Val Glu Gln Arg Ala Cys Cys Ile Val Arg Ser
370 375 380
Leu Gln Ala Asp Val Glu Leu Leu Gln Thr Met Glu Arg Ala Gln Arg
385 390 395 400
Phe Tyr Asp Val His Asp Cys Ala Ala Thr His Val Gly Pro Val Ala
405 410 415
Val Arg Cys Ser Pro Cys Ala Gly Lys Gln Phe Asp Trp Asp Arg Tyr
420 425 430
Arg Leu Leu Ala Ala Leu Arg Gln Glu His Ala Leu Asn Tyr Leu Arg
435 440 445
Arg Leu Gln Arg Glu Trp Glu Ser Leu Glu Ala Gln Gln Val Lys Met
450 455 460
Pro Tyr Leu Arg Phe Lys Tyr Ala Arg Lys Leu Glu Val Ser Gly Pro
465 470 475 480
Leu Ile Gly Leu Glu Val Arg Arg Glu Pro Ser Met Gly Thr Ala Ile
485 490 495
Ala Glu Met
<210> 212
<211> 358
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 212
Ala Gly Thr Ala Gly Arg Arg His Gly Ser Leu Gly Ala Arg Arg Ser
1 5 10 15
Ile Asn Ile Ala Gly Val Thr Asp Arg His Gly Arg Trp Gly Cys Glu
20 25 30
Ser Cys Val Tyr Thr Arg Asp Gln Ala Gly Asn Arg Ala Arg Cys Ala
35 40 45
Pro Cys Asp Gln Ser Thr Tyr Ala Pro Asp Val Gln Glu Val Thr Ile
50 55 60
Gly Gln Arg Gln Ala Lys Tyr Thr Ile Phe Leu Thr Leu Gln Ser Phe
65 70 75 80
Ser Trp Thr Asn Thr Met Arg Asn Asn Lys Arg Ala Ala Ala Gly Arg
85 90 95
Ser Lys Arg Thr Thr Gly Lys Arg Ile Gly Gln Leu Ala Glu Ile Lys
100 105 110
Ile Thr Gly Val Gly Leu Ala His Ala His Asn Val Ile Gln Arg Ser
115 120 125
Leu Gln His Asn Ile Thr Lys Met Trp Arg Ala Glu Lys Gly Lys Ser
130 135 140
Lys Arg Val Ala Arg Leu Lys Lys Ala Lys Gln Leu Thr Lys Arg Arg
145 150 155 160
Ala Tyr Phe Arg Arg Arg Met Ser Arg Gln Ser Arg Gly Asn Gly Phe
165 170 175
Phe Arg Thr Gly Lys Gly Gly Ile His Ala Val Ala Pro Val Lys Ile
180 185 190
Gly Leu Asp Val Gly Met Ile Ala Ser Gly Ser Ser Glu Pro Ala Asp
195 200 205
Glu Gln Thr Val Thr Leu Asp Ala Ile Trp Lys Gly Arg Lys Lys Lys
210 215 220
Ile Arg Leu Ile Gly Ala Lys Gly Glu Leu Ala Val Ala Ala Cys Arg
225 230 235 240
Phe Arg Glu Gln Gln Thr Lys Gly Asp Lys Cys Ile Pro Leu Ile Leu
245 250 255
Gln Asp Gly Glu Val Arg Trp Asn Gln Asn Asn Trp Gln Cys His Pro
260 265 270
Lys Lys Leu Val Pro Leu Cys Gly Leu Glu Val Ser Arg Lys Phe Val
275 280 285
Ser Gln Ala Asp Arg Leu Ala Gln Asn Lys Val Ala Ser Pro Leu Ala
290 295 300
Ala Arg Phe Asp Lys Thr Ser Val Lys Gly Thr Leu Val Glu Ser Asp
305 310 315 320
Phe Ala Ala Val Leu Val Asn Val Thr Ser Ile Tyr Gln Gln Cys His
325 330 335
Ala Met Leu Leu Arg Ser Gln Glu Pro Thr Pro Ser Leu Arg Val Gln
340 345 350
Arg Thr Ile Thr Ser Met
355
<210> 213
<211> 369
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 213
Gly Val Arg Phe Ser Pro Ala Gln Ser Gln Val Phe Phe Arg Thr Val
1 5 10 15
Ile Pro Gln Ser Val Glu Ala Arg Phe Ala Ile Asn Met Ala Ala Ile
20 25 30
His Asp Ala Ala Gly Ala Phe Gly Cys Ser Val Cys Arg Phe Glu Asp
35 40 45
Arg Thr Pro Arg Asn Ala Lys Ala Val His Gly Cys Ser Pro Cys Thr
50 55 60
Arg Ser Thr Asn Arg Pro Asp Val Phe Val Leu Pro Val Gly Ala Ile
65 70 75 80
Lys Ala Lys Tyr Asp Val Phe Met Arg Leu Leu Gly Phe Asn Trp Thr
85 90 95
His Leu Asn Arg Arg Gln Ala Lys Arg Val Thr Val Arg Asp Arg Ile
100 105 110
Gly Gln Leu Asp Glu Leu Ala Ile Ser Met Leu Thr Gly Lys Ala Lys
115 120 125
Ala Val Leu Lys Lys Ser Ile Cys His Asn Val Asp Lys Ser Phe Lys
130 135 140
Ala Met Arg Gly Ser Leu Lys Lys Leu His Arg Lys Ala Ser Lys Thr
145 150 155 160
Gly Lys Ser Gln Leu Arg Ala Lys Leu Ser Asp Leu Arg Glu Arg Thr
165 170 175
Asn Thr Thr Gln Glu Gly Ser His Val Glu Gly Asp Ser Asp Val Ala
180 185 190
Leu Asn Lys Ile Gly Leu Asp Val Gly Leu Val Gly Lys Pro Asp Tyr
195 200 205
Pro Ser Glu Glu Ser Val Glu Val Val Val Cys Leu Tyr Phe Val Gly
210 215 220
Lys Val Leu Ile Leu Asp Ala Gln Gly Arg Ile Arg Asp Met Arg Ala
225 230 235 240
Lys Gln Tyr Asp Gly Phe Lys Ile Pro Ile Ile Gln Arg Gly Gln Leu
245 250 255
Thr Val Leu Ser Val Lys Asp Leu Gly Lys Trp Ser Leu Val Arg Gln
260 265 270
Asp Tyr Val Leu Ala Gly Asp Leu Arg Phe Glu Pro Lys Ile Ser Lys
275 280 285
Asp Arg Lys Tyr Ala Glu Cys Val Lys Arg Ile Ala Leu Ile Thr Leu
290 295 300
Gln Ala Ser Leu Gly Phe Lys Glu Arg Ile Pro Tyr Tyr Val Thr Lys
305 310 315 320
Gln Val Glu Ile Lys Asn Ala Ser His Ile Ala Phe Val Thr Glu Ala
325 330 335
Ile Gln Asn Cys Ala Glu Asn Phe Arg Glu Met Thr Glu Tyr Leu Met
340 345 350
Lys Tyr Gln Glu Lys Ser Pro Asp Leu Lys Val Leu Leu Thr Gln Leu
355 360 365
Met
<210> 214
<211> 486
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 214
Arg Ala Val Val Gly Lys Val Phe Leu Glu Gln Ala Arg Arg Ala Leu
1 5 10 15
Asn Leu Ala Thr Asn Phe Gly Thr Asn His Arg Thr Gly Cys Asn Gly
20 25 30
Cys Tyr Val Thr Pro Gly Lys Leu Ser Ile Pro Gln Asp Gly Glu Lys
35 40 45
Asn Ala Ala Gly Cys Thr Ser Cys Leu Met Lys Ala Thr Ala Ser Tyr
50 55 60
Val Ser Tyr Pro Lys Pro Leu Gly Glu Lys Val Ala Lys Tyr Ser Thr
65 70 75 80
Leu Asp Ala Leu Lys Gly Phe Pro Trp Tyr Ser Leu Arg Leu Asn Leu
85 90 95
Arg Pro Asn Tyr Arg Gly Lys Pro Ile Asn Gly Val Gln Glu Val Ala
100 105 110
Pro Val Ser Lys Phe Arg Leu Ala Glu Glu Val Ile Gln Ala Val Gln
115 120 125
Arg Tyr His Phe Thr Glu Leu Glu Gln Ser Phe Pro Gly Gly Arg Arg
130 135 140
Arg Leu Arg Glu Leu Arg Ala Phe Tyr Thr Lys Glu Tyr Arg Arg Ala
145 150 155 160
Pro Glu Gln Arg Gln His Val Val Asn Gly Asp Arg Asn Ile Val Val
165 170 175
Val Thr Val Leu His Glu Leu Gly Phe Ser Val Gly Met Phe Asn Glu
180 185 190
Val Glu Leu Leu Pro Lys Thr Pro Ile Glu Cys Ala Val Asn Val Phe
195 200 205
Ile Arg Gly Asn Arg Val Leu Leu Glu Val Arg Lys Pro Gln Phe Asp
210 215 220
Lys Glu Arg Leu Leu Val Glu Ser Leu Trp Lys Lys Asp Ser Arg Arg
225 230 235 240
His Thr Ala Lys Trp Thr Pro Pro Asn Asn Glu Gly Arg Ile Phe Thr
245 250 255
Ala Glu Gly Trp Lys Asp Phe Gln Leu Pro Leu Leu Leu Gly Ser Thr
260 265 270
Ser Arg Ser Leu Arg Ala Ile Glu Lys Glu Gly Phe Val Gln Leu Ala
275 280 285
Pro Gly Arg Asp Pro Asp Tyr Asn Asn Thr Ile Asp Glu Gln His Ser
290 295 300
Gly Arg Pro Phe Leu Pro Leu Tyr Leu Tyr Leu Gln Gly Thr Ile Ser
305 310 315 320
Gln Glu Tyr Cys Val Phe Ala Gly Thr Trp Val Ile Pro Phe Gln Asp
325 330 335
Gly Ile Ser Pro Tyr Ser Thr Lys Asp Thr Phe Gln Pro Asp Leu Lys
340 345 350
Arg Lys Ala Tyr Ser Leu Leu Leu Asp Ala Val Lys His Arg Leu Gly
355 360 365
Asn Lys Val Ala Ser Gly Leu Gln Tyr Gly Arg Phe Pro Ala Ile Glu
370 375 380
Glu Leu Lys Arg Leu Val Arg Met His Gly Ala Thr Arg Lys Ile Pro
385 390 395 400
Arg Gly Glu Lys Asp Leu Leu Lys Lys Gly Asp Pro Asp Thr Pro Glu
405 410 415
Trp Trp Leu Leu Glu Gln Tyr Pro Glu Phe Trp Arg Leu Cys Asp Ala
420 425 430
Ala Ala Lys Arg Val Ser Gln Asn Val Gly Leu Leu Leu Ser Leu Lys
435 440 445
Lys Gln Pro Leu Trp Gln Arg Arg Trp Leu Glu Ser Arg Thr Arg Asn
450 455 460
Glu Pro Leu Asp Asn Leu Pro Leu Ser Met Ala Leu Thr Leu His Leu
465 470 475 480
Thr Asn Glu Glu Ala Leu
485
<210> 215
<211> 400
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 215
Ala Ala Val Tyr Ser Lys Phe Tyr Ile Glu Asn His Phe Lys Met Gly
1 5 10 15
Ile Pro Glu Thr Leu Ser Arg Ile Arg Gly Pro Ser Ile Ile Gln Gly
20 25 30
Phe Ser Val Asn Glu Asn Tyr Ile Asn Ile Ala Gly Val Gly Asp Arg
35 40 45
Asp Phe Ile Phe Gly Cys Lys Lys Cys Lys Tyr Thr Arg Gly Lys Pro
50 55 60
Ser Ser Lys Lys Ile Asn Lys Cys His Pro Cys Lys Arg Ser Thr Tyr
65 70 75 80
Pro Glu Pro Val Ile Asp Val Arg Gly Ser Ile Ser Glu Phe Lys Tyr
85 90 95
Lys Ile Tyr Asn Lys Leu Lys Gln Glu Pro Asn Gln Ser Ile Lys Gln
100 105 110
Asn Thr Lys Gly Arg Met Asn Pro Ser Asp His Thr Ser Ser Asn Asp
115 120 125
Gly Ile Ile Ile Asn Gly Ile Asp Asn Arg Ile Ala Tyr Asn Val Ile
130 135 140
Phe Ser Ser Tyr Lys His Leu Met Glu Lys Gln Ile Asn Leu Leu Arg
145 150 155 160
Asp Thr Thr Lys Arg Lys Ala Arg Gln Ile Lys Lys Tyr Asn Asn Ser
165 170 175
Gly Lys Lys Lys His Ser Leu Arg Ser Gln Thr Lys Gly Asn Leu Lys
180 185 190
Asn Arg Tyr His Met Leu Gly Met Phe Lys Lys Gly Ser Leu Thr Ile
195 200 205
Thr Asn Glu Gly Asp Phe Ile Thr Ala Val Arg Lys Val Gly Leu Asp
210 215 220
Ile Ser Leu Tyr Lys Asn Glu Ser Leu Asn Lys Gln Glu Val Glu Thr
225 230 235 240
Glu Leu Cys Leu Asn Ile Lys Trp Gly Arg Thr Lys Ser Tyr Thr Val
245 250 255
Ser Gly Tyr Ile Pro Leu Pro Ile Asn Ile Asp Trp Lys Leu Tyr Leu
260 265 270
Phe Glu Lys Glu Thr Gly Leu Thr Leu Arg Leu Phe Gly Asn Lys Tyr
275 280 285
Lys Ile Gln Ser Lys Lys Phe Leu Ile Ala Gln Leu Phe Lys Pro Lys
290 295 300
Arg Pro Pro Cys Ala Asp Pro Val Val Lys Lys Ala Gln Lys Trp Ser
305 310 315 320
Ala Leu Asn Ala His Val Gln Gln Met Ala Gly Leu Phe Ser Asp Ser
325 330 335
His Leu Leu Lys Arg Glu Leu Lys Asn Arg Met His Lys Gln Leu Asp
340 345 350
Phe Lys Ser Leu Trp Val Gly Thr Glu Asp Tyr Ile Lys Trp Phe Glu
355 360 365
Glu Leu Ser Arg Ser Tyr Val Glu Gly Ala Glu Lys Ser Leu Glu Phe
370 375 380
Phe Arg Gln Asp Tyr Phe Cys Phe Asn Tyr Thr Lys Gln Thr Thr Met
385 390 395 400
<210> 216
<211> 666
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 216
Pro Gln Gln Gln Arg Asp Leu Met Leu Met Ala Ala Asn Tyr Asp Gln
1 5 10 15
Asp Tyr Gly Asn Gly Cys Gly Pro Cys Thr Val Val Ala Ser Ala Ala
20 25 30
Tyr Arg Pro Asp Pro Gln Ala Gln His Gly Cys Lys Arg His Leu Arg
35 40 45
Thr Leu Gly Ala Ser Ala Val Thr His Val Gly Leu Gly Asp Arg Thr
50 55 60
Ala Thr Ile Thr Ala Leu His Arg Leu Arg Gly Pro Ala Ala Leu Ala
65 70 75 80
Ala Arg Ala Arg Ala Ala Gln Ala Ala Ser Ala Pro Met Thr Pro Asp
85 90 95
Thr Asp Ala Pro Asp Asp Arg Arg Arg Leu Glu Ala Ile Asp Ala Asp
100 105 110
Asp Val Val Leu Val Gly Ala His Arg Ala Leu Trp Ser Ala Val Arg
115 120 125
Arg Trp Ala Asp Asp Arg Arg Ala Ala Leu Arg Arg Arg Leu His Ser
130 135 140
Glu Arg Glu Trp Leu Leu Lys Asp Gln Ile Arg Trp Ala Glu Leu Tyr
145 150 155 160
Thr Leu Ile Glu Ala Ser Gly Thr Pro Pro Gln Gly Arg Trp Arg Asn
165 170 175
Thr Leu Gly Ala Leu Arg Gly Gln Ser Arg Trp Arg Arg Val Leu Ala
180 185 190
Pro Thr Met Arg Ala Thr Cys Ala Glu Thr His Ala Glu Leu Trp Asp
195 200 205
Ala Leu Ala Glu Leu Val Pro Glu Met Ala Lys Asp Arg Arg Gly Leu
210 215 220
Leu Arg Pro Pro Val Glu Ala Asp Ala Leu Trp Arg Ala Pro Met Ile
225 230 235 240
Val Glu Gly Trp Arg Gly Gly His Ser Val Val Val Asp Ala Val Ala
245 250 255
Pro Pro Leu Asp Leu Pro Gln Pro Cys Ala Trp Thr Ala Val Arg Leu
260 265 270
Ser Gly Asp Pro Arg Gln Arg Trp Gly Leu His Leu Ala Val Pro Pro
275 280 285
Leu Gly Gln Val Gln Pro Pro Asp Pro Leu Lys Ala Thr Leu Ala Val
290 295 300
Ser Met Arg His Arg Gly Gly Val Arg Val Arg Thr Leu Gln Ala Met
305 310 315 320
Ala Val Asp Ala Asp Ala Pro Met Gln Arg His Leu Gln Val Pro Leu
325 330 335
Thr Leu Gln Arg Gly Gly Gly Leu Gln Trp Gly Ile His Ser Arg Gly
340 345 350
Val Arg Arg Arg Glu Ala Arg Ser Met Ala Ser Trp Glu Gly Pro Pro
355 360 365
Ile Trp Thr Gly Leu Gln Leu Val Asn Arg Trp Lys Gly Gln Gly Ser
370 375 380
Ala Leu Leu Ala Pro Asp Arg Pro Pro Asp Thr Pro Pro Tyr Ala Pro
385 390 395 400
Asp Ala Ala Val Ala Pro Ala Gln Pro Asp Thr Lys Arg Ala Arg Arg
405 410 415
Thr Leu Lys Glu Ala Cys Thr Val Cys Arg Cys Ala Pro Gly His Met
420 425 430
Arg Gln Leu Gln Val Thr Leu Thr Gly Asp Gly Thr Trp Arg Arg Phe
435 440 445
Arg Leu Arg Ala Pro Gln Gly Ala Lys Arg Lys Ala Glu Val Leu Lys
450 455 460
Val Ala Thr Gln His Asp Glu Arg Ile Ala Asn Tyr Thr Ala Trp Tyr
465 470 475 480
Leu Lys Arg Pro Glu His Ala Ala Gly Cys Asp Thr Cys Asp Gly Asp
485 490 495
Ser Arg Leu Asp Gly Ala Cys Arg Gly Cys Arg Pro Leu Leu Val Gly
500 505 510
Asp Gln Cys Phe Arg Arg Tyr Leu Asp Lys Ile Glu Ala Asp Arg Asp
515 520 525
Asp Gly Leu Ala Gln Ile Lys Pro Lys Ala Gln Glu Ala Val Ala Ala
530 535 540
Met Ala Ala Lys Arg Asp Ala Arg Ala Gln Lys Val Ala Ala Arg Ala
545 550 555 560
Ala Lys Leu Ser Glu Ala Thr Gly Gln Arg Thr Ala Ala Thr Arg Asp
565 570 575
Ala Ser His Glu Ala Arg Ala Gln Lys Glu Leu Glu Ala Val Ala Thr
580 585 590
Glu Gly Thr Thr Val Arg His Asp Ala Ala Ala Val Ser Ala Phe Gly
595 600 605
Ser Trp Val Ala Arg Lys Gly Asp Glu Tyr Arg His Gln Val Gly Val
610 615 620
Leu Ala Asn Arg Leu Glu His Gly Leu Arg Leu Gln Glu Leu Met Ala
625 630 635 640
Pro Asp Ser Val Val Ala Asp Gln Gln Arg Ala Ser Gly His Ala Arg
645 650 655
Val Gly Tyr Arg Tyr Val Leu Thr Ala Met
660 665
<210> 217
<211> 560
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 217
Ala Val Ala His Pro Val Gly Arg Gly Asn Ala Gly Ser Pro Gly Ala
1 5 10 15
Arg Gly Pro Glu Glu Leu Pro Arg Gln Leu Val Asn Arg Ala Ser Asn
20 25 30
Val Thr Arg Pro Ala Thr Tyr Gly Cys Ala Pro Cys Arg His Val Arg
35 40 45
Leu Ser Ile Pro Lys Pro Val Leu Thr Gly Cys Arg Ala Cys Glu Gln
50 55 60
Thr Thr His Pro Ala Pro Lys Arg Ala Val Arg Gly Gly Ala Asp Ala
65 70 75 80
Ala Lys Tyr Asp Leu Ala Ala Phe Phe Ala Gly Trp Ala Ala Asp Leu
85 90 95
Glu Gly Arg Asn Arg Arg Arg Gln Val His Ala Pro Leu Asp Pro Gln
100 105 110
Pro Asp Pro Asn His Glu Pro Ala Val Thr Leu Gln Lys Ile Asp Leu
115 120 125
Ala Glu Val Ser Ile Glu Glu Phe Gln Arg Val Leu Ala Arg Ser Val
130 135 140
Lys His Arg His Asp Gly Arg Ala Ser Arg Glu Arg Glu Lys Ala Arg
145 150 155 160
Ala Tyr Ala Gln Val Ala Lys Lys Arg Arg Asn Ser His Ala His Gly
165 170 175
Ala Arg Thr Arg Arg Ala Val Arg Arg Gln Thr Arg Ala Val Arg Arg
180 185 190
Ala His Arg Met Gly Ala Asn Ser Gly Glu Ile Leu Val Ala Ser Gly
195 200 205
Ala Glu Asp Pro Val Pro Glu Ala Ile Asp His Ala Ala Gln Leu Arg
210 215 220
Arg Arg Ile Arg Ala Cys Ala Arg Asp Leu Glu Gly Leu Arg His Leu
225 230 235 240
Ser Arg Arg Tyr Leu Lys Thr Leu Glu Lys Pro Cys Arg Arg Pro Arg
245 250 255
Ala Pro Asp Leu Gly Arg Ala Arg Cys His Ala Leu Val Glu Ser Leu
260 265 270
Gln Ala Ala Glu Arg Glu Leu Glu Glu Leu Arg Arg Cys Asp Ser Pro
275 280 285
Asp Thr Ala Met Arg Arg Leu Asp Ala Val Leu Ala Ala Ala Ala Ser
290 295 300
Thr Asp Ala Thr Phe Ala Thr Gly Trp Thr Val Val Gly Met Asp Leu
305 310 315 320
Gly Val Ala Pro Arg Gly Ser Ala Ala Pro Glu Val Ser Pro Met Glu
325 330 335
Met Ala Ile Ser Val Phe Trp Arg Lys Gly Ser Arg Arg Val Ile Val
340 345 350
Ser Lys Pro Ile Ala Gly Met Pro Ile Arg Arg His Glu Leu Ile Arg
355 360 365
Leu Glu Gly Leu Gly Thr Leu Arg Leu Asp Gly Asn His Tyr Thr Gly
370 375 380
Ala Gly Val Thr Lys Gly Arg Gly Leu Ser Glu Gly Thr Glu Pro Asp
385 390 395 400
Phe Arg Glu Lys Ser Pro Ser Thr Leu Gly Phe Thr Leu Ser Asp Tyr
405 410 415
Arg His Glu Ser Arg Trp Arg Pro Tyr Gly Ala Lys Gln Gly Lys Thr
420 425 430
Ala Arg Gln Phe Phe Ala Ala Met Ser Arg Glu Leu Arg Ala Leu Val
435 440 445
Glu His Gln Val Leu Ala Pro Met Gly Pro Pro Leu Leu Glu Ala His
450 455 460
Glu Arg Arg Phe Glu Thr Leu Leu Lys Gly Gln Asp Asn Lys Ser Ile
465 470 475 480
His Ala Gly Gly Gly Gly Arg Tyr Val Trp Arg Gly Pro Pro Asp Ser
485 490 495
Lys Lys Arg Pro Ala Ala Asp Gly Asp Trp Phe Arg Phe Gly Arg Gly
500 505 510
His Ala Asp His Arg Gly Trp Ala Asn Lys Arg His Glu Leu Ala Ala
515 520 525
Asn Tyr Leu Gln Ser Ala Phe Arg Leu Trp Ser Thr Leu Ala Glu Ala
530 535 540
Gln Glu Pro Thr Pro Tyr Ala Arg Tyr Lys Tyr Thr Arg Val Thr Met
545 550 555 560
<210> 218
<211> 404
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 218
Trp Asp Phe Leu Thr Leu Gln Val Tyr Glu Arg His Thr Ser Pro Glu
1 5 10 15
Val Cys Val Ala Gly Asn Ser Thr Lys Cys Ala Ser Gly Thr Arg Lys
20 25 30
Ser Asp His Thr His Gly Val Gly Val Lys Leu Gly Ala Gln Glu Ile
35 40 45
Asn Val Ser Ala Asn Asp Asp Arg Asp His Glu Val Gly Cys Asn Ile
50 55 60
Cys Val Ile Ser Arg Val Ser Leu Asp Ile Lys Gly Trp Arg Tyr Gly
65 70 75 80
Cys Glu Ser Cys Val Gln Ser Thr Pro Glu Trp Arg Ser Ile Val Arg
85 90 95
Phe Asp Arg Asn His Lys Glu Ala Lys Gly Glu Cys Leu Ser Arg Phe
100 105 110
Glu Tyr Trp Gly Ala Gln Ser Ile Ala Arg Ser Leu Lys Arg Asn Lys
115 120 125
Leu Met Gly Gly Val Asn Leu Asp Glu Leu Ala Ile Val Gln Asn Glu
130 135 140
Asn Val Val Lys Thr Ser Leu Lys His Leu Phe Asp Lys Arg Lys Asp
145 150 155 160
Arg Ile Gln Ala Asn Leu Lys Ala Val Lys Val Arg Met Arg Glu Arg
165 170 175
Arg Lys Ser Gly Arg Gln Arg Lys Ala Leu Arg Arg Gln Cys Arg Lys
180 185 190
Leu Lys Arg Tyr Leu Arg Ser Tyr Asp Pro Ser Asp Ile Lys Glu Gly
195 200 205
Asn Ser Cys Ser Ala Phe Thr Lys Leu Gly Leu Asp Ile Gly Ile Ser
210 215 220
Pro Asn Lys Pro Pro Lys Ile Glu Pro Lys Val Glu Val Val Phe Ser
225 230 235 240
Leu Phe Tyr Gln Gly Ala Cys Asp Lys Ile Val Thr Val Ser Ser Pro
245 250 255
Glu Ser Pro Leu Pro Arg Ser Trp Lys Ile Lys Ile Asp Gly Ile Arg
260 265 270
Ala Leu Tyr Val Lys Ser Thr Lys Val Lys Phe Gly Gly Arg Thr Phe
275 280 285
Arg Ala Gly Gln Arg Asn Asn Arg Arg Lys Val Arg Pro Pro Asn Val
290 295 300
Lys Lys Gly Lys Arg Lys Gly Ser Arg Ser Gln Phe Phe Asn Lys Phe
305 310 315 320
Ala Val Gly Leu Asp Ala Val Ser Gln Gln Leu Pro Ile Ala Ser Val
325 330 335
Gln Gly Leu Trp Gly Arg Ala Glu Thr Lys Lys Ala Gln Thr Ile Cys
340 345 350
Leu Lys Gln Leu Glu Ser Asn Lys Pro Leu Lys Glu Ser Gln Arg Cys
355 360 365
Leu Phe Leu Ala Asp Asn Trp Val Val Arg Val Cys Gly Phe Leu Arg
370 375 380
Ala Leu Ser Gln Arg Gln Gly Pro Thr Pro Tyr Ile Arg Tyr Arg Tyr
385 390 395 400
Arg Cys Asn Met
<210> 219
<211> 392
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 219
Ala Arg Asn Val Gly Gln Arg Asn Ala Ser Arg Gln Ser Lys Arg Glu
1 5 10 15
Ser Ala Lys Ala Arg Ser Arg Arg Val Thr Gly Gly His Ala Ser Val
20 25 30
Thr Gln Gly Val Ala Leu Ile Asn Ala Ala Ala Asn Ala Asp Arg Asp
35 40 45
His Thr Thr Gly Cys Glu Pro Cys Thr Trp Glu Arg Val Asn Leu Pro
50 55 60
Leu Gln Glu Val Ile His Gly Cys Asp Ser Cys Thr Lys Ser Ser Pro
65 70 75 80
Phe Trp Arg Asp Ile Lys Val Val Asn Lys Gly Tyr Arg Glu Ala Lys
85 90 95
Glu Glu Ile Met Arg Ile Ala Ser Gly Ile Ser Ala Asp His Leu Ser
100 105 110
Arg Ala Leu Ser His Asn Lys Val Met Gly Arg Leu Asn Leu Asp Glu
115 120 125
Val Cys Ile Leu Asp Phe Arg Thr Val Leu Asp Thr Ser Leu Lys His
130 135 140
Leu Thr Asp Ser Arg Ser Asn Gly Ile Lys Glu His Ile Arg Ala Val
145 150 155 160
His Arg Lys Ile Arg Met Arg Arg Lys Ser Gly Lys Thr Ala Arg Ala
165 170 175
Leu Arg Lys Gln Tyr Phe Ala Leu Arg Arg Gln Trp Lys Ala Gly His
180 185 190
Lys Pro Asn Ser Ile Arg Glu Gly Asn Ser Leu Thr Ala Leu Arg Ala
195 200 205
Val Gly Phe Asp Val Gly Val Ser Glu Gly Thr Glu Pro Met Pro Ala
210 215 220
Pro Gln Thr Glu Val Val Leu Ser Val Phe Tyr Lys Gly Ser Ala Thr
225 230 235 240
Arg Ile Leu Arg Ile Ser Ser Pro His Pro Ile Ala Lys Arg Ser Trp
245 250 255
Lys Val Lys Ile Ala Gly Ile Lys Ala Leu Lys Leu Ile Arg Arg Glu
260 265 270
His Asp Phe Ser Phe Gly Arg Glu Thr Tyr Asn Ala Ser Gln Arg Ala
275 280 285
Glu Lys Arg Lys Phe Ser Pro His Ala Ala Arg Lys Asp Phe Phe Asn
290 295 300
Ser Phe Ala Val Gln Leu Asp Arg Leu Ala Gln Gln Leu Cys Val Ser
305 310 315 320
Ser Val Glu Asn Leu Trp Val Thr Glu Pro Gln Gln Lys Leu Leu Thr
325 330 335
Leu Ala Lys Asp Thr Ala Pro Tyr Gly Ile Arg Glu Gly Ala Arg Phe
340 345 350
Ala Asp Thr Arg Ala Arg Leu Ala Trp Asn Trp Val Phe Arg Val Cys
355 360 365
Gly Phe Thr Arg Ala Leu His Gln Glu Gln Glu Pro Thr Pro Tyr Cys
370 375 380
Arg Phe Thr Trp Arg Ser Lys Met
385 390
<210> 220
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 220
ctacgccgat tatcttctga caactttcgc aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 221
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 221
gtgcccgcat tttttacctt acaccgcttg cgaaagttgt cagaagataa tcggcgtag 59
<210> 222
<211> 90
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 222
tttatatgtt tctcctggag ataacgcaat cgtgacaact ttcgcaagcg gtgtaaggta 60
gcaggcttcc gaattccgcg tttttacggc 90
<210> 223
<211> 90
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 223
gccgtaaaaa cgcggaattc ggaagcctgc taccttacac cgcttgcgaa agttgtcacg 60
attgcgttat ctccaggaga aacatataaa 90
<210> 224
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 224
gatcttcagc tatacattat tgcaccaaca ctaaggcaga gtatgtttac ctggac 56
<210> 225
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 225
gatcttcagc tttgtattac tggaaggatg cttgcttgag gtgtaaaaac ctggac 56
<210> 226
<211> 5
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 226
ttttt 5
<210> 227
<211> 6
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 227
tttttt 6
<210> 228
<211> 7
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 228
ttttttt 7
<210> 229
<211> 8
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 229
tttttttt 8
<210> 230
<211> 9
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 230
ttttttttt 9
<210> 231
<211> 10
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 231
tttttttttt 10
<210> 232
<211> 11
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 232
tttttttttt t 11
<210> 233
<211> 12
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 233
tttttttttt tt 12
<210> 234
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 234
gccggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagc 55
<210> 235
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 235
gccggggtgg tgcccatcct ggtcgagctg gacggcgacg tgctcggcca caagc 55
<210> 236
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 236
gccggggtgg tgcccatcct ggtcgagctg gacggcgagc taaacggcca caagc 55
<210> 237
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 237
gccggggtgg tgcccatcct ggtcgagctg gacggcctcg taaacggcca caagc 55
<210> 238
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 238
gccggggtgg tgcccatcct ggtcgagctg gacgcggacg taaacggcca caagc 55
<210> 239
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 239
gccggggtgg tgcccatcct ggtcgagctg gagcgcgacg taaacggcca caagc 55
<210> 240
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 240
gccggggtgg tgcccatcct ggtcgagctg ctcggcgacg taaacggcca caagc 55
<210> 241
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 241
gccggggtgg tgcccatcct ggtcgagcac gacggcgacg taaacggcca caagc 55
<210> 242
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 242
gccggggtgg tgcccatcct ggtcgacgtg gacggcgacg taaacggcca caagc 55
<210> 243
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 243
gccggggtgg tgcccatcct ggtcctgctg gacggcgacg taaacggcca caagc 55
<210> 244
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 244
gccggggtgg tgcccatcct ggaggagctg gacggcgacg taaacggcca caagc 55
<210> 245
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 245
gccggggtgg tgcccatcct cctcgagctg gacggcgacg taaacggcca caagc 55
<210> 246
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 246
gtgttaatac aaaggtacag gaacaaagaa tttg 34
<210> 247
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 247
caaagagaag cctcggcc 18
<210> 248
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 248
tttattcaag gcaatcacta tcagctgtgg aacacccagg taaactaaca caact 55
<210> 249
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 249
tttattcaag gcaatcacta tcagctgtgg aacacccagg tgctctaaca caact 55
<210> 250
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 250
tttattcaag gcaatcacta tcagctgtgg aacacccacc taaactaaca caact 55
<210> 251
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 251
tttattcaag gcaatcacta tcagctgtgg aacaccgtgg taaactaaca caact 55
<210> 252
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 252
tttattcaag gcaatcacta tcagctgtgg aacaggcagg taaactaaca caact 55
<210> 253
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 253
tttattcaag gcaatcacta tcagctgtgg aagtcccagg taaactaaca caact 55
<210> 254
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 254
tttattcaag gcaatcacta tcagctgtgg ttcacccagg taaactaaca caact 55
<210> 255
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 255
tttattcaag gcaatcacta tcagctgtcc aacacccagg taaactaaca caact 55
<210> 256
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 256
tttattcaag gcaatcacta tcagctcagg aacacccagg taaactaaca caact 55
<210> 257
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 257
tttattcaag gcaatcacta tcaggagtgg aacacccagg taaactaaca caact 55
<210> 258
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 258
tttattcaag gcaatcacta tctcctgtgg aacacccagg taaactaaca caact 55
<210> 259
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 259
tttattcaag gcaatcacta agagctgtgg aacacccagg taaactaaca caact 55
<210> 260
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 260
ctacgccgat tatcttctga caactttcgc aagcggtgta aggcgaaaaa tgcgggcac 59
<210> 261
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 261
ctacgccgat tatcttctga caactttcgc aagcggtgta aaataaaaaa tgcgggcac 59
<210> 262
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 262
ctacgccgat tatcttctga caactttcgc aagcggtgtg gggtaaaaaa tgcgggcac 59
<210> 263
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 263
ctacgccgat tatcttctga caactttcgc aagcggtaca aggtaaaaaa tgcgggcac 59
<210> 264
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 264
ctacgccgat tatcttctga caactttcgc aagcgacgta aggtaaaaaa tgcgggcac 59
<210> 265
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 265
ctacgccgat tatcttctga caactttcgc aagtagtgta aggtaaaaaa tgcgggcac 59
<210> 266
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 266
ctacgccgat tatcttctga caactttcgc agacggtgta aggtaaaaaa tgcgggcac 59
<210> 267
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 267
ctacgccgat tatcttctga caactttcgt gagcggtgta aggtaaaaaa tgcgggcac 59
<210> 268
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 268
ctacgccgat tatcttctga caacttttac aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 269
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 269
ctacgccgat tatcttctga caactcccgc aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 270
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 270
ctacgccgat tatcttctga caatcttcgc aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 271
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 271
ctacgccgat tatcttctga cggctttcgc aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 272
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 272
ctacgccgat tatcttctgg taactttcgc aagcggtgta aggtaaaaaa tgcgggcac 59
<210> 273
<211> 49
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 273
tatcttctga caactttcgc aagcggtgta aggtaaaaaa tgcgggcac 49
<210> 274
<211> 44
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 274
tctgacaact ttcgcaagcg gtgtaaggta aaaaatgcgg gcac 44
<210> 275
<211> 39
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 275
caactttcgc aagcggtgta aggtaaaaaa tgcgggcac 39
<210> 276
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 276
ttcgcaagcg gtgtaaggta aaaaatgcgg gcac 34
<210> 277
<211> 54
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 277
ctacgccgat tatcttctga caactttcgc aagcggtgta aggtaaaaaa tgcg 54
<210> 278
<211> 49
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 278
ctacgccgat tatcttctga caactttcgc aagcggtgta aggtaaaaa 49
<210> 279
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 279
ctacgccgat tatcttctga caactttcgc aagcggtgta 40
<210> 280
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 280
ctacgccgat tatcttctga caactttcgc aagcg 35
<210> 281
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 281
ctacgccgat tatcttctga caactttcgc 30
<210> 282
<211> 25
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 282
ctacgccgat tatcttctga caact 25
<210> 283
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 283
ctacgccgat tatcttctga 20
<210> 284
<211> 34
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 284
caactttcgc aagcggtgta aggtaaaaaa tgcg 34
<210> 285
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 285
atggaatgtg gcgaacgctt tcaacgaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 286
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 286
atggaatgtg gcgaacgctt agttggaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 287
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 287
atggaatgtg gcgaagcgaa agttggaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 288
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 288
atggaatgtg cgcttgcgaa agttggaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 289
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 289
atggatacac cgcttgcgaa agttggaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 290
<211> 63
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 290
taccttacac cgcttgcgaa agttggaaac aactttcgca agcggtgtaa ggtaaaaaat 60
gcg 63
<210> 291
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 291
gttttatctt ctgctggtgg ttcgttcggt atttttaatg 40
<210> 292
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 292
cattaaaaat accgaacgaa ccaccagcag aagataaaac 40
<210> 293
<211> 43
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 293
gaccatttgc gaaatgtatc taatggtcaa actaaatcta ctc 43
<210> 294
<211> 43
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 294
gagtagattt agtttgacca ttagatacat ttcgcaaatg gtc 43
<210> 295
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 295
cttgcagaac ccggatagac gaatgaagga atgcaac 37
<210> 296
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 296
cttgcaggcc ttgaatagag gagttaagga atgcaac 37
<210> 297
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 297
gttgcacagt gctaattaga gaaactagga atgcaac 37
<210> 298
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 298
ctagcatatt cagaacaaag ggattaagga atgcaac 37
<210> 299
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 299
ctttcatatt cagaaactag gggttaagga ctgcaac 37
<210> 300
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 300
gttgcatccc tacgtcgtga gcaccggtga gtgcaac 37
<210> 301
<211> 31
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 301
ggaaaggaat cccctgaagg aaacgagggg g 31
<210> 302
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 302
gtgtccatca atcagatttg cgttggccgg tgcaat 36
<210> 303
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 303
gtttcagcgc acgaattaac gagatgagag atgcaac 37
<210> 304
<211> 500
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 304
Lys Glu Pro Leu Asn Ile Gly Lys Thr Ala Lys Ala Val Phe Lys Glu
1 5 10 15
Ile Asp Pro Thr Ser Leu Asn Arg Ala Ala Asn Tyr Asp Ala Ser Ile
20 25 30
Glu Leu Asn Cys Lys Glu Cys Lys Phe Lys Pro Phe Lys Asn Val Lys
35 40 45
Arg Tyr Glu Phe Asn Phe Tyr Asn Asn Trp Tyr Arg Cys Asn Pro Asn
50 55 60
Ser Cys Leu Gln Ser Thr Tyr Lys Ala Gln Val Arg Lys Val Glu Ile
65 70 75 80
Gly Tyr Glu Lys Leu Lys Asn Glu Ile Leu Thr Gln Met Gln Tyr Tyr
85 90 95
Pro Trp Phe Gly Arg Leu Tyr Gln Asn Phe Phe His Asp Glu Arg Asp
100 105 110
Lys Met Thr Ser Leu Asp Glu Ile Gln Val Ile Gly Val Gln Asn Lys
115 120 125
Val Phe Phe Asn Thr Val Glu Lys Ala Trp Arg Glu Ile Ile Lys Lys
130 135 140
Arg Phe Lys Asp Asn Lys Glu Thr Met Glu Thr Ile Pro Glu Leu Lys
145 150 155 160
His Ala Ala Gly His Gly Lys Arg Lys Leu Ser Asn Lys Ser Leu Leu
165 170 175
Arg Arg Arg Phe Ala Phe Val Gln Lys Ser Phe Lys Phe Val Asp Asn
180 185 190
Ser Asp Val Ser Tyr Arg Ser Phe Ser Asn Asn Ile Ala Cys Val Leu
195 200 205
Pro Ser Arg Ile Gly Val Asp Leu Gly Gly Val Ile Ser Arg Asn Pro
210 215 220
Lys Arg Glu Tyr Ile Pro Gln Glu Ile Ser Phe Asn Ala Phe Trp Lys
225 230 235 240
Gln His Glu Gly Leu Lys Lys Gly Arg Asn Ile Glu Ile Gln Ser Val
245 250 255
Gln Tyr Lys Gly Glu Thr Val Lys Arg Ile Glu Ala Asp Thr Gly Glu
260 265 270
Asp Lys Ala Trp Gly Lys Asn Arg Gln Arg Arg Phe Thr Ser Leu Ile
275 280 285
Leu Lys Leu Val Pro Lys Gln Gly Gly Lys Lys Val Trp Lys Tyr Pro
290 295 300
Glu Lys Arg Asn Glu Gly Asn Tyr Glu Tyr Phe Pro Ile Pro Ile Glu
305 310 315 320
Phe Ile Leu Asp Ser Gly Glu Thr Ser Ile Arg Phe Gly Gly Asp Glu
325 330 335
Gly Glu Ala Gly Lys Gln Lys His Leu Val Ile Pro Phe Asn Asp Ser
340 345 350
Lys Ala Thr Pro Leu Ala Ser Gln Gln Thr Leu Leu Glu Asn Ser Arg
355 360 365
Phe Asn Ala Glu Val Lys Ser Cys Ile Gly Leu Ala Ile Tyr Ala Asn
370 375 380
Tyr Phe Tyr Gly Tyr Ala Arg Asn Tyr Val Ile Ser Ser Ile Tyr His
385 390 395 400
Lys Asn Ser Lys Asn Gly Gln Ala Ile Thr Ala Ile Tyr Leu Glu Ser
405 410 415
Ile Ala His Asn Tyr Val Lys Ala Ile Glu Arg Gln Leu Gln Asn Leu
420 425 430
Leu Leu Asn Leu Arg Asp Phe Ser Phe Met Glu Ser His Lys Lys Glu
435 440 445
Leu Lys Lys Tyr Phe Gly Gly Asp Leu Glu Gly Thr Gly Gly Ala Gln
450 455 460
Lys Arg Arg Glu Lys Glu Glu Lys Ile Glu Lys Glu Ile Glu Gln Ser
465 470 475 480
Tyr Leu Pro Arg Leu Ile Arg Leu Ser Leu Thr Lys Met Val Thr Lys
485 490 495
Gln Val Glu Met
500
<210> 305
<211> 507
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 305
Glu Leu Ile Val Asn Glu Asn Lys Asp Pro Leu Asn Ile Gly Lys Thr
1 5 10 15
Ala Lys Ala Val Phe Lys Glu Ile Asp Pro Thr Ser Ile Asn Arg Ala
20 25 30
Ala Asn Tyr Asp Ala Ser Ile Glu Leu Ala Cys Lys Glu Cys Lys Phe
35 40 45
Lys Pro Phe Asn Asn Thr Lys Arg His Asp Phe Ser Phe Tyr Ser Asn
50 55 60
Trp His Arg Cys Ser Pro Asn Ser Cys Leu Gln Ser Thr Tyr Arg Ala
65 70 75 80
Lys Ile Arg Lys Thr Glu Ile Gly Tyr Glu Lys Leu Lys Asn Glu Ile
85 90 95
Leu Asn Gln Met Gln Tyr Tyr Pro Trp Phe Gly Arg Leu Tyr Gln Asn
100 105 110
Phe Phe Asn Asp Gln Arg Asp Lys Met Thr Ser Leu Asp Glu Ile Gln
115 120 125
Val Thr Gly Val Gln Asn Lys Ile Phe Phe Asn Thr Val Glu Lys Ala
130 135 140
Trp Arg Glu Ile Ile Lys Lys Arg Phe Arg Asp Asn Lys Glu Thr Met
145 150 155 160
Arg Thr Ile Pro Asp Leu Lys Asn Lys Ser Gly His Gly Ser Arg Lys
165 170 175
Leu Ser Asn Lys Ser Leu Leu Arg Arg Arg Phe Ala Phe Ala Gln Lys
180 185 190
Ser Phe Lys Leu Val Asp Asn Ser Asp Val Ser Tyr Arg Ala Phe Ser
195 200 205
Asn Asn Val Ala Cys Val Leu Pro Ser Lys Ile Gly Val Asp Ile Gly
210 215 220
Gly Ile Ile Asn Lys Asp Leu Lys Arg Glu Tyr Ile Pro Gln Glu Ile
225 230 235 240
Thr Phe Asn Val Phe Trp Lys Gln His Asp Gly Leu Lys Lys Gly Arg
245 250 255
Asn Ile Glu Ile His Ser Val Gln Tyr Lys Gly Glu Ile Val Lys Arg
260 265 270
Ile Glu Ala Asp Thr Gly Glu Asp Lys Ala Trp Gly Lys Asn Arg Gln
275 280 285
Arg Arg Phe Thr Ser Leu Ile Leu Lys Ile Thr Pro Lys Gln Gly Gly
290 295 300
Lys Lys Ile Trp Lys Phe Pro Glu Lys Lys Asn Ala Ser Asp Tyr Glu
305 310 315 320
Tyr Phe Pro Ile Pro Ile Glu Phe Ile Leu Asp Asn Gly Asp Ala Ser
325 330 335
Ile Lys Phe Gly Gly Glu Glu Gly Glu Val Gly Lys Gln Lys His Leu
340 345 350
Leu Ile Pro Phe Asn Asp Ser Lys Ala Thr Pro Leu Ser Ser Lys Gln
355 360 365
Met Leu Leu Glu Thr Ser Arg Phe Asn Ala Glu Val Lys Ser Thr Ile
370 375 380
Gly Leu Ala Leu Tyr Ala Asn Tyr Phe Val Ser Tyr Ala Arg Asn Tyr
385 390 395 400
Val Ile Lys Ser Thr Tyr His Lys Asn Ser Lys Lys Gly Gln Ile Val
405 410 415
Thr Glu Ile Tyr Leu Glu Ser Ile Ser Gln Asn Phe Val Arg Ala Ile
420 425 430
Gln Arg Gln Leu Gln Ser Leu Met Leu Asn Leu Lys Asp Trp Gly Phe
435 440 445
Met Gln Thr His Lys Lys Glu Leu Lys Lys Tyr Phe Gly Ser Asp Leu
450 455 460
Glu Gly Ser Lys Gly Gly Gln Lys Arg Arg Glu Lys Glu Glu Lys Ile
465 470 475 480
Glu Lys Glu Ile Glu Ala Ser Tyr Leu Pro Arg Leu Ile Arg Leu Ser
485 490 495
Leu Thr Lys Ser Val Thr Lys Ala Glu Glu Met
500 505
<210> 306
<211> 529
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 306
Pro Glu Glu Lys Thr Ser Lys Leu Lys Pro Asn Ser Ile Asn Leu Ala
1 5 10 15
Ala Asn Tyr Asp Ala Asn Glu Lys Phe Asn Cys Lys Glu Cys Lys Phe
20 25 30
His Pro Phe Lys Asn Lys Lys Arg Tyr Glu Phe Asn Phe Tyr Asn Asn
35 40 45
Leu His Gly Cys Lys Ser Cys Thr Lys Ser Thr Asn Asn Pro Ala Val
50 55 60
Lys Arg Ile Glu Ile Gly Tyr Gln Lys Leu Lys Phe Glu Ile Lys Asn
65 70 75 80
Gln Met Glu Ala Tyr Pro Trp Phe Gly Arg Leu Arg Ile Asn Phe Tyr
85 90 95
Ser Asp Glu Lys Arg Lys Met Ser Glu Leu Asn Glu Met Gln Val Thr
100 105 110
Gly Val Lys Asn Lys Ile Phe Phe Asp Ala Ile Glu Cys Ala Trp Arg
115 120 125
Glu Ile Leu Lys Lys Arg Phe Arg Glu Ser Lys Glu Thr Leu Ile Thr
130 135 140
Ile Pro Lys Leu Lys Asn Lys Ala Gly His Gly Ala Arg Lys His Arg
145 150 155 160
Asn Lys Lys Leu Leu Ile Arg Arg Arg Ala Phe Met Lys Lys Asn Phe
165 170 175
His Phe Leu Asp Asn Asp Ser Ile Ser Tyr Arg Ser Phe Ala Asn Asn
180 185 190
Ile Ala Cys Val Leu Pro Ser Lys Val Gly Val Asp Ile Gly Gly Ile
195 200 205
Ile Ser Pro Asp Val Gly Lys Asp Ile Lys Pro Val Asp Ile Ser Leu
210 215 220
Asn Leu Met Trp Ala Ser Lys Glu Gly Ile Lys Ser Gly Arg Lys Val
225 230 235 240
Glu Ile Tyr Ser Thr Gln Tyr Asp Gly Asn Met Val Lys Lys Ile Glu
245 250 255
Ala Glu Thr Gly Glu Asp Lys Ser Trp Gly Lys Asn Arg Lys Arg Arg
260 265 270
Gln Thr Ser Leu Leu Leu Ser Ile Pro Lys Pro Ser Lys Gln Val Gln
275 280 285
Glu Phe Asp Phe Lys Glu Trp Pro Arg Tyr Lys Asp Ile Glu Lys Lys
290 295 300
Val Gln Trp Arg Gly Phe Pro Ile Lys Ile Ile Phe Asp Ser Asn His
305 310 315 320
Asn Ser Ile Glu Phe Gly Thr Tyr Gln Gly Gly Lys Gln Lys Val Leu
325 330 335
Pro Ile Pro Phe Asn Asp Ser Lys Thr Thr Pro Leu Gly Ser Lys Met
340 345 350
Asn Lys Leu Glu Lys Leu Arg Phe Asn Ser Lys Ile Lys Ser Arg Leu
355 360 365
Gly Ser Ala Ile Ala Ala Asn Lys Phe Leu Glu Ala Ala Arg Thr Tyr
370 375 380
Cys Val Asp Ser Leu Tyr His Glu Val Ser Ser Ala Asn Ala Ile Gly
385 390 395 400
Lys Gly Lys Ile Phe Ile Glu Tyr Tyr Leu Glu Ile Leu Ser Gln Asn
405 410 415
Tyr Ile Glu Ala Ala Gln Lys Gln Leu Gln Arg Phe Ile Glu Ser Ile
420 425 430
Glu Gln Trp Phe Val Ala Asp Pro Phe Gln Gly Arg Leu Lys Gln Tyr
435 440 445
Phe Lys Asp Asp Leu Lys Arg Ala Lys Cys Phe Leu Cys Ala Asn Arg
450 455 460
Glu Val Gln Thr Thr Cys Tyr Ala Ala Val Lys Leu His Lys Ser Cys
465 470 475 480
Ala Glu Lys Val Lys Asp Lys Asn Lys Glu Leu Ala Ile Lys Glu Arg
485 490 495
Asn Asn Lys Glu Asp Ala Val Ile Lys Glu Val Glu Ala Ser Asn Tyr
500 505 510
Pro Arg Val Ile Arg Leu Lys Leu Thr Lys Thr Ile Thr Asn Lys Ala
515 520 525
Met
<210> 307
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 307
cttttagaca gtttaaattc taaagggtat aaaac 35
<210> 308
<211> 36
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 308
gtcgaaatgc ccgcgcgggg gcgtcgtacc cgcgac 36
<210> 309
<211> 37
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 309
gttgcagcgg ccgacggagc gcgagcgtgg atgccac 37
<210> 310
<211> 35
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 310
ctttagactt ctccggaagt cgaattaatg gaaac 35
<210> 311
<211> 28
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 311
gggcgccccg cgcgagcggg ggttgaag 28
<210> 312
<211> 136
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 312
gaaggatgct tgcttgaggt gtagttgtca ttccttcatt cgtctattcg ggttctgcaa 60
ctatacatta ttgcaccaac actaaggcag agtatggttg cattccttca ttcgtctatt 120
cgggttctgc aacggg 136
<210> 313
<211> 102
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 313
agaatgcttg cttgaggtgt agttgcattc cttcattcgt ctattcgggt aattgcacca 60
acactaaggc agagtatggt tgcattcctt cattcgtcta gg 102
<210> 314
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 314
cgatgcttgc ttgaggtgta gttgcattgc accaacacta aggcagagta tggttgcatt 60
ccttcattcg tctag 75
<210> 315
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 315
gatgcttgct tgaggtgtag ttgcattcct tcattctgca ccaacactaa ggcagagtat 60
ggttgcattc cttttcgggt tctgcaacgg 90
<210> 316
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 316
gcttgcttga ggtgtagttg cattccttca ttccacctac actaaggcag agtatggttg 60
cattccttca ttc 73
<210> 317
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 317
gcttgcttga ggtgtagttg cattccttca ttccacctac actaaggcag agtatggttg 60
cattccttca ttc 73
<210> 318
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 318
gcttgcttga ggtgtagttg cattcgcaac actaaggcag agtatggttg cattccttca 60
ttc 63
<210> 319
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 319
cttgcttgag gtgtagttgc cgacactaag gcagagtatg gttgcattat tcgggttctg 60
caacgg 66
<210> 320
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 320
cttgcttgag gtgtagttgc attccttcat tcaaacacta aggcagagta tggttgcatt 60
ccttcattc 69
<210> 321
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 321
ttgcttgagg tgtagttgca ttccttcatt ctaacactaa ggcagagtat ggttgcattc 60
cttcattcgt cta 73
<210> 322
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 322
ttgcttgagg tgtagttgca tccacactaa ggcagagtat ggttgcattc cttcattc 58
<210> 323
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 323
tgcttaaggt gtagttgcat tccttcattc caacactaag gcagagtatg gttgcattcc 60
ttcattc 67
<210> 324
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 324
tgcttgaggt gtagttgcat tccttcattc cacactaagg cagagtatgg ttgcattcct 60
tcattc 66
<210> 325
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 325
tgcttgaggt gtagttgcat tccttcattc aacactaagg cagagtatgg ttgcattcct 60
tcattcgtct at 72
<210> 326
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 326
cttgaggtgt agttgcattc cttcattcaa cactaaggca gagtatggtt gcattccttc 60
attc 64
<210> 327
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 327
cttgaggtgt agttgcattc cttaacacta aggcagagta tggttgcatt ccttcattc 59
<210> 328
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 328
ttgaggtgta gttgcattcc ttcattcaac actaaggcag agtatggttg cattccttca 60
ttc 63
<210> 329
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 329
tgaggtgtag ttgcattcct tcattcaaca ctaaggcaga gtatggttgc attccttcat 60
tc 62
<210> 330
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 330
tgaggtgtag ttgcattcct tcgttcacac taaggcagag tatggttgca ttccttcatt 60
c 61
<210> 331
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 331
tgaggtgtag ttgcattcct tcattcacac taaggcagag tatggttgca ttccttcatt 60
c 61
<210> 332
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 332
ctacgccgat tatcttctga caactttcgc aagcggtgta aggtaaaaaa tgcgggcacc 60
c 61
<210> 333
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 333
ggaatgcaac taccttacac cgcttgcgaa 30
<210> 334
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 334
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt 140
<210> 335
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 335
gacgaatgaa ggaatgcaac taccttacac cgcttgcgaa 40
<210> 336
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 336
gacgaatgaa ggaatgcaac ccttacaccg cttgcgaaag 40
<210> 337
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 337
gacgaatgaa ggaatgcaac ttacaccgct tgcgaaagtt 40
<210> 338
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 338
gacgaatgaa ggaatgcaac acaccgcttg cgaaagttgt 40
<210> 339
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 339
gacgaatgaa ggaatgcaac cgtcgccgtc cagctcgacc a 41
<210> 340
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 340
gacgaatgaa ggaatgcaac gatcgttacg ctaactatga 40
<210> 341
<211> 180
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 341
ttcactgata aagtggagaa ccgcttcacc aaaagctgtc ccttagggga ttagaacttg 60
agtgaaggtg ggctgcttgc atcagcctaa tgtcgagaag tgctttcttc ggaaagtaac 120
cctcgaaaca aattcatttg aaagaatgaa ggaatgcaac acttgacact taatgctcaa 180
<210> 342
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 342
gggtaatttc tactaagtgt agatacttga cacttaatgc tcaa 44
<210> 343
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 343
gacgaatgaa ggaatgcaac taccttacac cgcttgcgaa agttg 45
<210> 344
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 344
gacgaatgaa ggaatgcaac taccttacac cgcttgcg 38
<210> 345
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 345
gacgaatgaa ggaatgcaac taccttacac cgcttg 36
<210> 346
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 346
gacgaatgaa ggaatgcaac taccttacac cgct 34
<210> 347
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 347
gacgaatgaa ggaatgcaac taccttacac cg 32
<210> 348
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 348
gacgaatgaa ggaatgcaac taccttacac 30
<210> 349
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 349
gttgcagaac ccgaatagac gaatgaagga atgcaactac cttacaccgc ttgcgaa 57
<210> 350
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 350
gaatgaagga atgcaactac cttacaccgc ttgcgaa 37
<210> 351
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 351
atgaaggaat gcaactacct tacaccgctt gcgaa 35
<210> 352
<211> 179
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 352
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca aaaaaaggtg agtccttat 179
<210> 353
<211> 110
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 353
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt 110
<210> 354
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 354
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gg 72
<210> 355
<211> 136
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 355
ttcactgata aagtggagaa ccgcttcacc aaaagctgtc ccttagggga ttagaacttg 60
agtgaaggtg ggctgcttgc atcagcctaa tgtcgagaag tgctttcttc ggaaagtaac 120
cctcgaaaca aattca 136
<210> 356
<211> 234
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 356
ttcacacttc actgataaag tggagaaccg cttcaccaaa agctgtccct taggggatta 60
gaacttgagt gaaggtgggc tgcttgcatc agcctaatgt cgagaagtgc tttcttcgga 120
aagtaaccct cgaaacaaat tcatttttcc tctccaattc tgcacaaaaa aaggtgagtc 180
cttataaacc ggcgtgcaga acgccggctc accttttttc ttcattcgat ttta 234
<210> 357
<211> 181
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 357
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt gaaagaatga aggaatgcaa ctaccttaca ccgcttgcga 180
a 181
<210> 358
<211> 222
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 358
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca actaccttac accgcttgcg aa 222
<210> 359
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 359
gacgaatgaa ggaatgcaac taccgaacga accaccagca gaaga 45
<210> 360
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 360
gacgaatgaa ggaatgcaac tcttctgctg gtggttcgtt cggta 45
<210> 361
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 361
gacgaatgaa ggaatgcaac gtttgaccat tagatacatt tcg 43
<210> 362
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 362
gacgaatgaa ggaatgcaac cgaaatgtat ctaatggtca aac 43
<210> 363
<211> 7580
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 363
gcaaccgcac ctgtggcgcc ggtgatgccg gccacgatgc gtccggcgta gaggatcgag 60
atctcgatcc cgcgaaatta atacgactca ctatagggag accacaacgg tttccctcta 120
gtgccggctc cggagagctc tttaattaag cggccgccct gcaggactcg agttctagaa 180
ataattttgt ttaactttaa gaaggagata tacatatgaa atcttctcac catcaccatc 240
accatcacca tcaccatggt tcttctatga aaatcgaaga aggtaaactg gtaatctgga 300
ttaacggcga taaaggctat aacggtctcg ctgaagtcgg taagaaattc gagaaagata 360
ccggaattaa agtcaccgtt gagcatccgg ataaactgga agagaaattc ccacaggttg 420
cggcaactgg cgatggccct gacattatct tctgggcaca cgaccgcttt ggtggctacg 480
ctcaatctgg cctgttggct gaaatcaccc cggacaaagc gttccaggac aagctgtatc 540
cgtttacctg ggatgccgta cgttacaacg gcaagctgat tgcttacccg atcgctgttg 600
aagcgttatc gctgatttat aacaaagatc tgctgccgaa cccgccaaaa acctgggaag 660
agatcccggc gctggataaa gaactgaaag cgaaaggtaa gagcgcgctg atgttcaacc 720
tgcaagaacc gtacttcacc tggccgctga ttgctgctga cgggggttat gcgttcaagt 780
atgaaaacgg caagtacgac attaaagacg tgggcgtgga taacgctggc gcgaaagcgg 840
gtctgacctt cctggttgac ctgattaaaa acaaacacat gaatgcagac accgattact 900
ccatcgcaga agctgccttt aataaaggcg aaacagcgat gaccatcaac ggcccgtggg 960
catggtccaa catcgacacc agcaaagtga attatggtgt aacggtactg ccgaccttca 1020
agggtcaacc atccaaaccg ttcgttggcg tgctgagcgc aggtattaac gccgccagtc 1080
cgaacaaaga gctggcaaaa gagttcctcg aaaactatct gctgactgat gaaggtctgg 1140
aagcggttaa taaagacaaa ccgctgggtg ccgtagcgct gaagtcttac gaggaagagt 1200
tggcgaaaga tccacgtatt gccgccacta tggaaaacgc ccagaaaggt gaaatcatgc 1260
cgaacatccc gcagatgtcc gctttctggt atgccgtgcg tactgcggtg atcaacgccg 1320
ccagcggtcg tcagactgtc gatgaagccc tgaaagacgc gcagactaat tcgagctcga 1380
acaacaacaa caataacaat aacaacaacc tcgggatcga ggaaaacctg tacttccaat 1440
ccaatgcaat ggaagaaagc attattaccg gtgtgaaatt caaactgcgc atcgataaag 1500
aaaccaccaa aaaactgaac gagtacttcg atgaatatgg caaagcaatt aacttcgccg 1560
tgaagatcat tcagaaagaa ctggcagatg atcgttttgc aggtaaagca aaactggacc 1620
agaataaaaa cccgatcctg gatgaaaacg gcaaaaaaat ctatgaattc ccggatgaat 1680
tttgcagctg tggtaaacag gttaacaagt acgttaacaa caaaccgttt tgccaagagt 1740
gctataaaat ccgctttacc gaaaatggta ttcgcaaacg tatgtatagc gccaaaggtc 1800
gtaaagccga acataaaatc aatatcctga acagcaccaa caagatcagc aaaacccatt 1860
ttaactatgc cattcgcgaa gccttcattc tggataaaag catcaaaaag cagcgcaaaa 1920
aacgtaatga acgtctgcgt gaaagtaaaa aacgtctgca gcagtttatc gatatgcgtg 1980
atggtaaacg tgaaatttgc ccgaccatta aaggtcagaa agtggatcgt tttattcatc 2040
cgagctggat caccaaagat aaaaagctgg aagattttcg cggttatacc ctgagcatta 2100
tcaacagcaa aattaagatt ctggatcgca acatcaaacg cgaagaaaaa agcctgaaag 2160
aaaaaggcca gatcatcttt aaagccaaac gtctgatgct ggataaatcc attcgttttg 2220
ttggtgatcg caaagtgctg tttacaatta gtaaaaccct gccgaaagag tatgaactgg 2280
atctgccgag caaagaaaaa cggctgaatt ggctgaaaga gaagatcgag attatcaaga 2340
accagaaacc gaaatatgcc tatctgctgc gcaaaaacat tgagagcgaa aaaaaaccga 2400
actatgagta ctatctgcag tacaccctgg aaattaaacc ggaactgaaa gatttttatg 2460
atggtgccat tggtattgac cgtggcatta atcatattgc cgtttgcacc tttattagca 2520
acgatggtaa agttacccct ccgaaatttt tcagcagcgg tgaaattctg cgtctgaaaa 2580
atctgcagaa agagcgtgat cgctttctgc tgcgtaaaca caacaaaaat cgcaaaaaag 2640
gcaacatgcg cgtgatcgaa aacaaaatca atctgatcct gcaccgttat agcaagcaga 2700
ttgttgatat ggccaaaaag ctgaatgcca gcattgtttt tgaagaactg ggtcgtattg 2760
gtaaaagccg caccaaaatg aaaaaaagcc agcgttataa actgagcctg ttcatcttca 2820
agaaactgag cgatctggtt gattacaaaa gccgtcgtga aggtattcgt gttacctatg 2880
ttccgcctga atataccagc aaagaatgta gccattgcgg tgaaaaagtt aatacccagc 2940
gtccgtttaa tggcaactat agcctgttta aatgcaacaa atgtggcatc cagctgaaca 3000
gcgattataa tgcaagcatc aacattgcga aaaagggcct gaaaattccg aatagcacct 3060
aataacattg gaagtggata acggatccgc gatcgcggcg cgccacctgg tggccggccg 3120
gtaccacgcg tgcgcgctga tccggctgct aacaaagccc gaaaggaagc tgagttggct 3180
gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg 3240
ggttttttgc tgaaaggagg aactatatcc ggatatccac aggacgggtg tggtcgccat 3300
gatcgcgtag tcgatagtgg ctccaagtag cgaagcgagc aggactgggc ggcggccaaa 3360
gcggtcggac agtgctccga gaacgggtgc gcatagaaat tgcatcaacg catatagcgc 3420
tagcagcacg ccatagtgac tggcgatgct gtcggaatgg acgatatccc gcaagaggcc 3480
cggcagtacc ggcataacca agcctatgcc tacagcatcc agggtgacgg tgccgaggat 3540
gacgatgagc gcattgttag atttcataca cggtgcctga ctgcgttagc aatttaactg 3600
tgataaacta ccgcattaaa gcttatcgat gataagctgt caaacatgag aattcttgaa 3660
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 3720
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 3780
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 3840
aacattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 3900
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 3960
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 4020
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 4080
tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac 4140
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 4200
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 4260
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 4320
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 4380
acgagcgtga caccacgatg cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg 4440
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 4500
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 4560
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 4620
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 4680
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 4740
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 4800
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 4860
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 4920
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 4980
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 5040
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5100
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5160
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5220
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5280
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5340
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5400
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 5460
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 5520
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 5580
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 5640
cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg 5700
gtatttcaca ccgcaatggt gcactctcag tacaatctgc tctgatgccg catagttaag 5760
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 5820
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 5880
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 5940
aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg attcacagat gtctgcctgt 6000
tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta atgtctggct tctgataaag 6060
cgggccatgt taagggcggt tttttcctgt ttggtcactg atgcctccgt gtaaggggga 6120
tttctgttca tgggggtaat gataccgatg aaacgagaga ggatgctcac gatacgggtt 6180
actgatgatg aacatgcccg gttactggaa cgttgtgagg gtaaacaact ggcggtatgg 6240
atgcggcggg accagagaaa aatcactcag ggtcaatgcc agcgcttcgt taatacagat 6300
gtaggtgttc cacagggtag ccagcagcat cctgcgatgc agatccggaa cataatggtg 6360
cagggcgctg acttccgcgt ttccagactt tacgaaacac ggaaaccgaa gaccattcat 6420
gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc ttcacgttcg ctcgcgtatc 6480
ggtgattcat tctgctaacc agtaaggcaa ccccgccagc ctagccgggt cctcaacgac 6540
aggagcacga tcatgcgcac ccgtggccag gacccaacgc tgcccgagat gcgccgcgtg 6600
cggctgctgg agatggcgga cgcgatggat atgttctgcc aagggttggt ttgcgcattc 6660
acagttctcc gcaagaattg attggctcca attcttggag tggtgaatcc gttagcgagg 6720
tgccgccggc ttccattcag gtcgaggtgg cccggctcca tgcaccgcga cgcaacgcgg 6780
ggaggcagac aaggtatagg gcggcgccta caatccatgc caacccgttc catgtgctcg 6840
ccgaggcggc ataaatcgcc gtgacgatca gcggtccaat gatcgaagtt aggctggtaa 6900
gagccgcgag cgatccttga agctgtccct gatggtcgtc atctacctgc ctggacagca 6960
tggcctgcaa cgcgggcatc ccgatgccgc cggaagcgag aagaatcata atggggaagg 7020
ccatccagcc tcgcgtcgcg aacgccagca agacgtagcc cagcgcgtcg gccgccatgc 7080
cggcgataat ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt 7140
gagcgagggc gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc 7200
agcgaaagcg gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt 7260
gcatgataaa gaagacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga 7320
aggagctgac tgggttgaag gctctcaagg gcatcggtcg acgctctccc ttatgcgact 7380
cctgcattag gaagcagccc agtagtaggt tgaggccgtt gagcaccgcc gccgcaagga 7440
atggtgcatg caaggagatg gcgcccaaca gtcccccggc cacggggcct gccaccatac 7500
ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc ccatcggtga 7560
tgtcggcgat ataggcgcca 7580
<210> 364
<211> 4715
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 364
atcgttgata gagttatttt accactccct atcagtgata gagaaaagaa ttcaaaagat 60
ctaaagagga gaaaggatct atggaagaaa gcattattac cggtgtgaaa ttcaaactgc 120
gcatcgataa agaaaccacc aaaaaactga acgagtactt cgatgaatat ggcaaagcaa 180
ttaacttcgc cgtgaagatc attcagaaag aactggcaga tgatcgtttt gcaggtaaag 240
caaaactgga ccagaataaa aacccgatcc tggatgaaaa cggcaaaaaa atctatgaat 300
tcccggatga attttgcagc tgtggtaaac aggttaacaa gtacgttaac aacaaaccgt 360
tttgccaaga gtgctataaa atccgcttta ccgaaaatgg tattcgcaaa cgtatgtata 420
gcgccaaagg tcgtaaagcc gaacataaaa tcaatatcct gaacagcacc aacaagatca 480
gcaaaaccca ttttaactat gccattcgcg aagccttcat tctggataaa agcatcaaaa 540
agcagcgcaa aaaacgtaat gaacgtctgc gtgaaagtaa aaaacgtctg cagcagttta 600
tcgatatgcg tgatggtaaa cgtgaaattt gcccgaccat taaaggtcag aaagtggatc 660
gttttattca tccgagctgg atcaccaaag ataaaaagct ggaagatttt cgcggttata 720
ccctgagcat tatcaacagc aaaattaaga ttctggatcg caacatcaaa cgcgaagaaa 780
aaagcctgaa agaaaaaggc cagatcatct ttaaagccaa acgtctgatg ctggataaat 840
ccattcgttt tgttggtgat cgcaaagtgc tgtttacaat tagtaaaacc ctgccgaaag 900
agtatgaact ggatctgccg agcaaagaaa aacggctgaa ttggctgaaa gagaagatcg 960
agattatcaa gaaccagaaa ccgaaatatg cctatctgct gcgcaaaaac attgagagcg 1020
aaaaaaaacc gaactatgag tactatctgc agtacaccct ggaaattaaa ccggaactga 1080
aagattttta tgatggtgcc attggtattg accgtggcat taatcatatt gccgtttgca 1140
cctttattag caacgatggt aaagttaccc ctccgaaatt tttcagcagc ggtgaaattc 1200
tgcgtctgaa aaatctgcag aaagagcgtg atcgctttct gctgcgtaaa cacaacaaaa 1260
atcgcaaaaa aggcaacatg cgcgtgatcg aaaacaaaat caatctgatc ctgcaccgtt 1320
atagcaagca gattgttgat atggccaaaa agctgaatgc cagcattgtt tttgaagaac 1380
tgggtcgtat tggtaaaagc cgcaccaaaa tgaaaaaaag ccagcgttat aaactgagcc 1440
tgttcatctt caagaaactg agcgatctgg ttgattacaa aagccgtcgt gaaggtattc 1500
gtgttaccta tgttccgcct gaatatacca gcaaagaatg tagccattgc ggtgaaaaag 1560
ttaataccca gcgtccgttt aatggcaact atagcctgtt taaatgcaac aaatgtggca 1620
tccagctgaa cagcgattat aatgcaagca tcaacattgc gaaaaagggc ctgaaaattc 1680
cgaatagcac ctaataatgt tggttaagcc acaatatgga atattgttct tatggacagt 1740
attgacttaa attaataatc ttcgaaggct atatgcggaa gatttggcgt tgttgtaacg 1800
caataagggg taaccctgaa aaggtttgaa atcatataaa cctagtttta tttgagttta 1860
ggctcagata aaatgaacag accaatcttt aattccgttc tgatttaaaa aatcagaatc 1920
tctttataaa tagtattaca aaaagtgtac attccaaaat ccgaaagcag aattgacctt 1980
tttaagccta aaaaagccaa atttcaaggc tctttcatac tcagaacaaa gggattaagg 2040
aatgcaacta ccttacaccg cttgcgaaag ttgtcagaag ataatctttc atactcagaa 2100
caaagggatt aaggaatgca actatcttat ccatttcttg acatcaaatt ttcttgcagc 2160
atctgaattg cttaattgct ttccttgctt cagcaggaaa tagccaagat tttccagttc 2220
tgctggcgtt attgcaagca cggggatttt gtgcttgctg tagattttgt tcttcaggac 2280
cttctttttc catgctagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat 2340
acctagggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 2400
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 2460
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 2520
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 2580
ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 2640
taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 2700
ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 2760
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 2820
cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 2880
taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 2940
ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 3000
ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaat 3060
cagataaaat atttctagat ttcagtgcaa tttatctctt caaatgtagc acctgaagtc 3120
agccccatac gatataagtt gttactagtg cttggattct caccaataaa aaacgcccgg 3180
cggcaaccga gcgttctgaa caaatccaga tggagttctg aggtcattac tggatctatc 3240
aacaggagtc caagcgagct cgatatcaaa ttacgccccg ccctgccact catcgcagta 3300
ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacaaacgg catgatgaac 3360
ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa 3420
aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 3480
ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag 3540
gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 3600
gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca 3660
agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac gaaattccgg 3720
atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt 3780
tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca 3840
ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac 3900
ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga 3960
taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct 4020
tacgtgccga tcaacgtctc attttcgcca gatatcgacg tcttaagacc cactttcaca 4080
tttaagttgt ttttctaatc cgcatatgat caattcaagg ccgaataaga aggctggctc 4140
tgcaccttgg tgatcaaata attcgatagc ttgtcgtaat aatggcggca tactatcagt 4200
agtaggtgtt tccctttctt ctttagcgac ttgatgctct tgatcttcca atacgcaacc 4260
taaagtaaaa tgccccacag cgctgagtgc atataatgca ttctctagtg aaaaaccttg 4320
ttggcataaa aaggctaatt gattttcgag agtttcatac tgtttttctg taggccgtgt 4380
acctaaatgt acttttgctc catcgcgatg acttagtaaa gcacatctaa aacttttagc 4440
gttattacgt aaaaaatctt gccagctttc cccttctaaa gggcaaaagt gagtatggtg 4500
cctatctaac atctcaatgg ctaaggcgtc gagcaaagcc cgcttatttt ttacatgcca 4560
atacaatgta ggctgctcta cacctagctt ctgggcgagt ttacgggttg ttaaaccttc 4620
gattccgacc tcattaagca gctctaatgc gctgttaatc actttacttt tatctaatct 4680
agacatcatt aattcctaat ttttgttgac actct 4715
<210> 365
<211> 4670
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 365
taattcctaa tttttgttga cactctatcg ttgatagagt tattttacca ctccctatca 60
gtgatagaga aaagaattca aaagatctaa agaggagaaa ggatctatga aatctcacca 120
tcaccatcac catgaaaacc tgtacttcca atccaatatt ggaagtggaa tggccaaaaa 180
caccattacc aaaacactga aactgcgtat tgtgcgtccg tataatagcg cagaagtgga 240
aaaaattgtt gccgacgaaa aaaacaaccg cgaaaaaatc gcactggaaa agaacaaaga 300
caaagtgaaa gaagcctgca gcaaacatct gaaagttgca gcatattgta ccacacaggt 360
tgaacgtaat gcatgcctgt tttgtaaagc acgtaaactg gatgacaaat tctaccaaaa 420
actgcgtggt cagtttccgg atgcagtttt ttggcaagaa atcagcgaaa tttttcgcca 480
gctgcagaaa caggcagcag aaatctataa tcagagcctg atcgaactgt actacgagat 540
ttttatcaaa ggcaaaggta ttgcaaatgc cagcagcgtt gaacattatc tgagtgatgt 600
ttgttatacc cgtgcagcag aactgtttaa aaacgcagca attgcaagcg gtctgcgtag 660
caaaatcaaa agcaattttc gtctgaaaga actgaaaaac atgaaaagtg gtctgccgac 720
caccaaaagc gataattttc cgattccgct ggttaaacag aaaggtggtc agtataccgg 780
ttttgaaatt agcaatcata atagcgactt catcatcaag attccgtttg gtcgttggca 840
ggtcaaaaaa gagattgata aatatcgtcc gtgggagaaa tttgactttg aacaggttca 900
gaaaagcccg aaaccgatta gcctgctgct gagcacccag cgtcgtaaac gtaataaagg 960
ttggagcaaa gatgaaggca ccgaagccga aatcaaaaaa gttatgaatg gcgattatca 1020
gaccagctac attgaagtta aacgtggcag caaaatcggt gaaaaaagcg catggatgct 1080
gaatctgagc attgatgttc cgaaaattga taaaggtgtg gatccgagca ttattggtgg 1140
tattgatgtt ggtgttaaat caccgctggt ttgcgcaatt aacaatgcat ttagccgtta 1200
tagcatcagc gataacgacc tgtttcactt caacaagaaa atgtttgcac gtcgtcgtat 1260
cctgctgaaa aaaaaccgtc ataaacgtgc aggtcatggt gcaaaaaaca aactgaaacc 1320
gatcaccatt ctgaccgaaa aaagtgaacg ttttcgcaaa aagctgattg aacgttgggc 1380
atgtgaaatc gcggatttct tcattaaaaa caaagttggc accgtgcaga tggaaaatct 1440
ggaaagcatg aaacgtaaag aggacagcta ttttaacatt cgcctgcgtg gcttttggcc 1500
gtatgcagaa atgcagaaca aaatcgaatt caaactgaag cagtatggca tcgaaattcg 1560
taaagttgca ccgaataata ccagcaaaac ctgtagcaaa tgtggccatc tgaacaacta 1620
tttcaacttc gagtaccgca agaaaaacaa attcccgcac tttaaatgcg aaaaatgcaa 1680
cttcaaagaa aacgccgatt ataatgcagc cctgaatatt tcaaacccga aactgaaaag 1740
caccaaagag gaaccgtaaa tatttatact ttattatcct tcattgacaa aaatgagaat 1800
gttatcccag ataacatttg atgtacacag attcacactt cactgataaa gtggagaacc 1860
gcttcaccaa aagctgtccc ttaggggatt agaacttgag tgaaggtggg ctgcttgcat 1920
cagcctaatg tcgagaagtg ctttcttcgg aaagtaaccc tcgaaacaaa ttcatttttc 1980
ctctccaatt ctgcacaaaa aaaggtgagt ccttataaac cggcgtgcag aacgccggct 2040
cacctttttt cttcattcga ttttatgctt aaaagccgta aaaacgcgga attcggcgcc 2100
gttgcagaac ccgaatagac gaatgaagga atgcaactac cttacaccgc ttgcgaaagt 2160
tgtcagaaga taatcttgca gaacccgaat agacgaatga aggaatgcaa tcttgacaga 2220
gcccgattgc gttatctcca ggagaaacat ataaaagcat caaccgctga tcggactaga 2280
gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tacctaggga tatattccgc 2340
ttcctcgctc actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta 2400
cgaacggggc ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg 2460
gccgcggcaa agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga 2520
cgctcaaatc agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 2580
ggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg 2640
ttatggccgc gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc 2700
caagctggac tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa 2760
ctatcgtctt gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg 2820
taattgattt agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga 2880
caagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc 2940
agagaacctt cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta 3000
cgcgcagacc aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga 3060
tttcagtgca atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt 3120
tgttactagt gcttggattc tcaccaataa aaaacgcccg gcggcaaccg agcgttctga 3180
acaaatccag atggagttct gaggtcatta ctggatctat caacaggagt ccaagcgagc 3240
tcgatatcaa attacgcccc gccctgccac tcatcgcagt actgttgtaa ttcattaagc 3300
attctgccga catggaagcc atcacaaacg gcatgatgaa cctgaatcgc cagcggcatc 3360
agcaccttgt cgccttgcgt ataatatttg cccatggtga aaacgggggc gaagaagttg 3420
tccatattgg ccacgtttaa atcaaaactg gtgaaactca cccagggatt ggctgagacg 3480
aaaaacatat tctcaataaa ccctttaggg aaataggcca ggttttcacc gtaacacgcc 3540
acatcttgcg aatatatgtg tagaaactgc cggaaatcgt cgtggtattc actccagagc 3600
gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac aagggtgaac actatcccat 3660
atcaccagct caccgtcttt cattgccata cgaaattccg gatgagcatt catcaggcgg 3720
gcaagaatgt gaataaaggc cggataaaac ttgtgcttat ttttctttac ggtctttaaa 3780
aaggccgtaa tatccagctg aacggtctgg ttataggtac attgagcaac tgactgaaat 3840
gcctcaaaat gttctttacg atgccattgg gatatatcaa cggtggtata tccagtgatt 3900
tttttctcca ttttagcttc cttagctcct gaaaatctcg ataactcaaa aaatacgccc 3960
ggtagtgatc ttatttcatt atggtgaaag ttggaacctc ttacgtgccg atcaacgtct 4020
cattttcgcc agatatcgac gtcttaagac ccactttcac atttaagttg tttttctaat 4080
ccgcatatga tcaattcaag gccgaataag aaggctggct ctgcaccttg gtgatcaaat 4140
aattcgatag cttgtcgtaa taatggcggc atactatcag tagtaggtgt ttccctttct 4200
tctttagcga cttgatgctc ttgatcttcc aatacgcaac ctaaagtaaa atgccccaca 4260
gcgctgagtg catataatgc attctctagt gaaaaacctt gttggcataa aaaggctaat 4320
tgattttcga gagtttcata ctgtttttct gtaggccgtg tacctaaatg tacttttgat 4380
ccatcgcgat gacttagtaa agcacatcta aaacttttag cgttattacg taaaaaatct 4440
tgccagcttt ccccttctaa agggcaaaag tgagtatggt gcctatctaa catctcaatg 4500
gctaaggcgt cgagcaaagc ccgcttattt tttacatgcc aatacaatgt aggctgctct 4560
acacctagct tctgggcgag tttacgggtt gttaaacctt cgattccgac ctcattaagc 4620
agctctaatg cgctgttaat cactttactt ttatctaatc tagacatcat 4670
<210> 366
<211> 4607
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 366
ttacttttat ctaatctaga catcattaat tcctaatttt tgttgacact ctatcgttga 60
tagagttatt ttaccactcc ctatcagtga tagagaaaag aattcaaaag atctaaagag 120
gagaaaggat ctatggccaa aaacaccatt accaaaacac tgaaactgcg tattgtgcgt 180
ccgtataata gcgcagaagt ggaaaaaatt gttgccgacg aaaaaaacaa ccgcgaaaaa 240
atcgcactgg aaaagaacaa agacaaagtg aaagaagcct gcagcaaaca tctgaaagtt 300
gcagcatatt gtaccacaca ggttgaacgt aatgcatgcc tgttttgtaa agcacgtaaa 360
ctggatgaca aattctacca aaaactgcgt ggtcagtttc cggatgcagt tttttggcaa 420
gaaatcagcg aaatttttcg ccagctgcag aaacaggcag cagaaatcta taatcagagc 480
ctgatcgaac tgtactacga gatttttatc aaaggcaaag gtattgcaaa tgccagcagc 540
gttgaacatt atctgagtga tgtttgttat acccgtgcag cagaactgtt taaaaacgca 600
gcaattgcaa gcggtctgcg tagcaaaatc aaaagcaatt ttcgtctgaa agaactgaaa 660
aacatgaaaa gtggtctgcc gaccaccaaa agcgataatt ttccgattcc gctggttaaa 720
cagaaaggtg gtcagtatac cggttttgaa attagcaatc ataatagcga cttcatcatc 780
aagattccgt ttggtcgttg gcaggtcaaa aaagagattg ataaatatcg tccgtgggag 840
aaatttgact ttgaacaggt tcagaaaagc ccgaaaccga ttagcctgct gctgagcacc 900
cagcgtcgta aacgtaataa aggttggagc aaagatgaag gcaccgaagc cgaaatcaaa 960
aaagttatga atggcgatta tcagaccagc tacattgaag ttaaacgtgg cagcaaaatc 1020
ggtgaaaaaa gcgcatggat gctgaatctg agcattgatg ttccgaaaat tgataaaggt 1080
gtggatccga gcattattgg tggtattgat gttggtgtta aatcaccgct ggtttgcgca 1140
attaacaatg catttagccg ttatagcatc agcgataacg acctgtttca cttcaacaag 1200
aaaatgtttg cacgtcgtcg tatcctgctg aaaaaaaacc gtcataaacg tgcaggtcat 1260
ggtgcaaaaa acaaactgaa accgatcacc attctgaccg aaaaaagtga acgttttcgc 1320
aaaaagctga ttgaacgttg ggcatgtgaa atcgcggatt tcttcattaa aaacaaagtt 1380
ggcaccgtgc agatggaaaa tctggaaagc atgaaacgta aagaggacag ctattttaac 1440
attcgcctgc gtggcttttg gccgtatgca gaaatgcaga acaaaatcga attcaaactg 1500
aagcagtatg gcatcgaaat tcgtaaagtt gcaccgaata ataccagcaa aacctgtagc 1560
aaatgtggcc atctgaacaa ctatttcaac ttcgagtacc gcaagaaaaa caaattcccg 1620
cactttaaat gcgaaaaatg caacttcaaa gaaaacgccg attataatgc agccctgaat 1680
atttcaaacc cgaaactgaa aagcaccaaa gaggaaccgt aaatatttat actttattat 1740
ccttcattga caaaaatgag aatgttatcc cagataacat ttgatgtaca cagattcaca 1800
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 1860
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 1920
ccctcgaaac aaattcattt ttcctctcca attctgcaca aaaaaaggtg agtccttata 1980
aaccggcgtg cagaacgccg gctcaccttt tttcttcatt cgattttatg cttaaaagcc 2040
gtaaaaacgc ggaattcggc gccgttgcag aacccgaata gacgaatgaa ggaatgcaac 2100
taccttacac cgcttgcgaa agttgtcaga agataatctt gcagaacccg aatagacgaa 2160
tgaaggaatg caatcttgac agagcccgat tgcgttatct ccaggagaaa catataaaag 2220
catcaaccgc tgatcggact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 2280
ttatacctag ggatatattc cgcttcctcg ctcactgact cgctacgctc ggtcgttcga 2340
ctgcggcgag cggaaatggc ttacgaacgg ggcggagatt tcctggaaga tgccaggaag 2400
atacttaaca gggaagtgag agggccgcgg caaagccgtt tttccatagg ctccgccccc 2460
ctgacaagca tcacgaaatc tgacgctcaa atcagtggtg gcgaaacccg acaggactat 2520
aaagatacca ggcgtttccc cctggcggct ccctcgtgcg ctctcctgtt cctgcctttc 2580
ggtttaccgg tgtcattccg ctgttatggc cgcgtttgtc tcattccacg cctgacactc 2640
agttccgggt aggcagttcg ctccaagctg gactgtatgc acgaaccccc cgttcagtcc 2700
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggaaag acatgcaaaa 2760
gcaccactgg cagcagccac tggtaattga tttagaggag ttagtcttga agtcatgcgc 2820
cggttaaggc taaactgaaa ggacaagttt tggtgactgc gctcctccaa gccagttacc 2880
tcggttcaaa gagttggtag ctcagagaac cttcgaaaaa ccgccctgca aggcggtttt 2940
ttcgttttca gagcaagaga ttacgcgcag accaaaacga tctcaagaag atcatcttat 3000
taatcagata aaatatttct agatttcagt gcaatttatc tcttcaaatg tagcacctga 3060
agtcagcccc atacgatata agttgttact agtgcttgga ttctcaccaa taaaaaacgc 3120
ccggcggcaa ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc 3180
tatcaacagg agtccaagcg agctcgatat caaattacgc cccgccctgc cactcatcgc 3240
agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat 3300
gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg 3360
tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 3420
tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 3480
ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 3540
cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 3600
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacgaaatt 3660
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 3720
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 3780
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 3840
caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 3900
tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 3960
ctcttacgtg ccgatcaacg tctcattttc gccagatatc gacgtcttaa gacccacttt 4020
cacatttaag ttgtttttct aatccgcata tgatcaattc aaggccgaat aagaaggctg 4080
gctctgcacc ttggtgatca aataattcga tagcttgtcg taataatggc ggcatactat 4140
cagtagtagg tgtttccctt tcttctttag cgacttgatg ctcttgatct tccaatacgc 4200
aacctaaagt aaaatgcccc acagcgctga gtgcatataa tgcattctct agtgaaaaac 4260
cttgttggca taaaaaggct aattgatttt cgagagtttc atactgtttt tctgtaggcc 4320
gtgtacctaa atgtactttt gctccatcgc gatgacttag taaagcacat ctaaaacttt 4380
tagcgttatt acgtaaaaaa tcttgccagc tttccccttc taaagggcaa aagtgagtat 4440
ggtgcctatc taacatctca atggctaagg cgtcgagcaa agcccgctta ttttttacat 4500
gccaatacaa tgtaggctgc tctacaccta gcttctgggc gagtttacgg gttgttaaac 4560
cttcgattcc gacctcatta agcagctcta atgcgctgtt aatcact 4607
<210> 367
<211> 7556
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 367
acccacgccg aaacaagcgc tcatgagccc gaagtggcga gcccgatctt ccccatcggt 60
gatgtcggcg atataggcgc cagcaaccgc acctgtggcg ccggtgatgc cggccacgat 120
gcgtccggcg tagaggatcg agatctcgat cccgcgaaat taatacgact cactataggg 180
agaccacaac ggtttccctc tagtgccggc tccggagagc tctttaatta agcggccgcc 240
ctgcaggact cgagttctag aaataatttt gtttaacttt aagaaggaga tatacatatg 300
aaatcttctc accatcacca tcaccatcac catcaccatg gttcttctat gaaaatcgaa 360
gaaggtaaac tggtaatctg gattaacggc gataaaggct ataacggtct cgctgaagtc 420
ggtaagaaat tcgagaaaga taccggaatt aaagtcaccg ttgagcatcc ggataaactg 480
gaagagaaat tcccacaggt tgcggcaact ggcgatggcc ctgacattat cttctgggca 540
cacgaccgct ttggtggcta cgctcaatct ggcctgttgg ctgaaatcac cccggacaaa 600
gcgttccagg acaagctgta tccgtttacc tgggatgccg tacgttacaa cggcaagctg 660
attgcttacc cgatcgctgt tgaagcgtta tcgctgattt ataacaaaga tctgctgccg 720
aacccgccaa aaacctggga agagatcccg gcgctggata aagaactgaa agcgaaaggt 780
aagagcgcgc tgatgttcaa cctgcaagaa ccgtacttca cctggccgct gattgctgct 840
gacgggggtt atgcgttcaa gtatgaaaac ggcaagtacg acattaaaga cgtgggcgtg 900
gataacgctg gcgcgaaagc gggtctgacc ttcctggttg acctgattaa aaacaaacac 960
atgaatgcag acaccgatta ctccatcgca gaagctgcct ttaataaagg cgaaacagcg 1020
atgaccatca acggcccgtg ggcatggtcc aacatcgaca ccagcaaagt gaattatggt 1080
gtaacggtac tgccgacctt caagggtcaa ccatccaaac cgttcgttgg cgtgctgagc 1140
gcaggtatta acgccgccag tccgaacaaa gagctggcaa aagagttcct cgaaaactat 1200
ctgctgactg atgaaggtct ggaagcggtt aataaagaca aaccgctggg tgccgtagcg 1260
ctgaagtctt acgaggaaga gttggcgaaa gatccacgta ttgccgccac tatggaaaac 1320
gcccagaaag gtgaaatcat gccgaacatc ccgcagatgt ccgctttctg gtatgccgtg 1380
cgtactgcgg tgatcaacgc cgccagcggt cgtcagactg tcgatgaagc cctgaaagac 1440
gcgcagacta attcgagctc gaacaacaac aacaataaca ataacaacaa cctcgggatc 1500
gaggaaaacc tgtacttcca atccaatgca atggccaaaa acaccattac caaaacactg 1560
aaactgcgta ttgtgcgtcc gtataatagc gcagaagtgg aaaaaattgt tgccgacgaa 1620
aaaaacaacc gcgaaaaaat cgcactggaa aagaacaaag acaaagtgaa agaagcctgc 1680
agcaaacatc tgaaagttgc agcatattgt accacacagg ttgaacgtaa tgcatgcctg 1740
ttttgtaaag cacgtaaact ggatgacaaa ttctaccaaa aactgcgtgg tcagtttccg 1800
gatgcagttt tttggcaaga aatcagcgaa atttttcgcc agctgcagaa acaggcagca 1860
gaaatctata atcagagcct gatcgaactg tactacgaga tttttatcaa aggcaaaggt 1920
attgcaaatg ccagcagcgt tgaacattat ctgagtgatg tttgttatac ccgtgcagca 1980
gaactgttta aaaacgcagc aattgcaagc ggtctgcgta gcaaaatcaa aagcaatttt 2040
cgtctgaaag aactgaaaaa catgaaaagt ggtctgccga ccaccaaaag cgataatttt 2100
ccgattccgc tggttaaaca gaaaggtggt cagtataccg gttttgaaat tagcaatcat 2160
aatagcgact tcatcatcaa gattccgttt ggtcgttggc aggtcaaaaa agagattgat 2220
aaatatcgtc cgtgggagaa atttgacttt gaacaggttc agaaaagccc gaaaccgatt 2280
agcctgctgc tgagcaccca gcgtcgtaaa cgtaataaag gttggagcaa agatgaaggc 2340
accgaagccg aaatcaaaaa agttatgaat ggcgattatc agaccagcta cattgaagtt 2400
aaacgtggca gcaaaatctg tgaaaaaagc gcatggatgc tgaatctgag cattgatgtt 2460
ccgaaaattg ataaaggtgt ggatccgagc attattggtg gtattgatgt tggtgttaaa 2520
tcaccgctgg tttgcgcaat taacaatgca tttagccgtt atagcatcag cgataacgac 2580
ctgtttcact tcaacaagaa aatgtttgca cgtcgtcgta tcctgctgaa aaaaaaccgt 2640
cataaacgtg caggtcatgg tgcaaaaaac aaactgaaac cgatcaccat tctgaccgaa 2700
aaaagtgaac gttttcgcaa aaagctgatt gaacgttggg catgtgaaat cgcggatttc 2760
ttcattaaaa acaaagttgg caccgtgcag atggaaaatc tggaaagcat gaaacgtaaa 2820
gaggacagct attttaacat tcgcctgcgt ggcttttggc cgtatgcaga aatgcagaac 2880
aaaatcgaat tcaaactgaa gcagtatggc atcgaaattc gtaaagttgc accgaataat 2940
accagcaaaa cctgtagcaa atgtggccat ctgaacaact atttcaactt cgagtaccgc 3000
aagaaaaaca aattcccgca ctttaaatgc gaaaaatgca acttcaaaga aaacgccgat 3060
tataatgcag ccctgaatat ttcaaacccg aaactgaaaa gcaccaaaga ggaaccgtaa 3120
taacattgga agtggataac ggatccgcga tcgcggcgcg ccacctggtg gccggccggt 3180
accacgcgtg cgcgctgatc cggctgctaa caaagcccga aaggaagctg agttggctgc 3240
tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg tcttgagggg 3300
ttttttgctg aaaggaggaa ctatatccgg atatccacag gacgggtgtg gtcgccatga 3360
tcgcgtagtc gatagtggct ccaagtagcg aagcgagcag gactgggcgg cggccaaagc 3420
ggtcggacag tgctccgaga acgggtgcgc atagaaattg catcaacgca tatagcgcta 3480
gcagcacgcc atagtgactg gcgatgctgt cggaatggac gatatcccgc aagaggcccg 3540
gcagtaccgg cataaccaag cctatgccta cagcatccag ggtgacggtg ccgaggatga 3600
cgatgagcgc attgttagat ttcatacacg gtgcctgact gcgttagcaa tttaactgtg 3660
ataaactacc gcattaaagc ttatcgatga taagctgtca aacatgagaa ttcttgaaga 3720
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 3780
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 3840
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 3900
cattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 3960
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 4020
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 4080
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 4140
tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 4200
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 4260
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 4320
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 4380
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 4440
gagcgtgaca ccacgatgcc tgcagcaatg gcaacaacgt tgcgcaaact attaactggc 4500
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 4560
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 4620
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 4680
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 4740
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 4800
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 4860
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 4920
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 4980
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5040
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 5100
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5160
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5220
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5280
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5340
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5400
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5460
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5520
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 5580
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 5640
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 5700
gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt 5760
atttcacacc gcaatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 5820
agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac acccgccaac 5880
acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt 5940
gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag 6000
gcagctgcgg taaagctcat cagcgtggtc gtgaagcgat tcacagatgt ctgcctgttc 6060
atccgcgtcc agctcgttga gtttctccag aagcgttaat gtctggcttc tgataaagcg 6120
ggccatgtta agggcggttt tttcctgttt ggtcactgat gcctccgtgt aagggggatt 6180
tctgttcatg ggggtaatga taccgatgaa acgagagagg atgctcacga tacgggttac 6240
tgatgatgaa catgcccggt tactggaacg ttgtgagggt aaacaactgg cggtatggat 6300
gcggcgggac cagagaaaaa tcactcaggg tcaatgccag cgcttcgtta atacagatgt 6360
aggtgttcca cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca 6420
gggcgctgac ttccgcgttt ccagacttta cgaaacacgg aaaccgaaga ccattcatgt 6480
tgttgctcag gtcgcagacg ttttgcagca gcagtcgctt cacgttcgct cgcgtatcgg 6540
tgattcattc tgctaaccag taaggcaacc ccgccagcct agccgggtcc tcaacgacag 6600
gagcacgatc atgcgcaccc gtggccagga cccaacgctg cccgagatgc gccgcgtgcg 6660
gctgctggag atggcggacg cgatggatat gttctgccaa gggttggttt gcgcattcac 6720
agttctccgc aagaattgat tggctccaat tcttggagtg gtgaatccgt tagcgaggtg 6780
ccgccggctt ccattcaggt cgaggtggcc cggctccatg caccgcgacg caacgcgggg 6840
aggcagacaa ggtatagggc ggcgcctaca atccatgcca acccgttcca tgtgctcgcc 6900
gaggcggcat aaatcgccgt gacgatcagc ggtccaatga tcgaagttag gctggtaaga 6960
gccgcgagcg atccttgaag ctgtccctga tggtcgtcat ctacctgcct ggacagcatg 7020
gcctgcaacg cgggcatccc gatgccgccg gaagcgagaa gaatcataat ggggaaggcc 7080
atccagcctc gcgtcgcgaa cgccagcaag acgtagccca gcgcgtcggc cgccatgccg 7140
gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg gaccagtgac gaaggcttga 7200
gcgagggcgt gcaagattcc gaataccgca agcgacaggc cgatcatcgt cgcgctccag 7260
cgaaagcggt cctcgccgaa aatgacccag agcgctgccg gcacctgtcc tacgagttgc 7320
atgataaaga agacagtcat aagtgcggcg acgatagtca tgccccgcgc ccaccggaag 7380
gagctgactg ggttgaaggc tctcaagggc atcggtcgac gctctccctt atgcgactcc 7440
tgcattagga agcagcccag tagtaggttg aggccgttga gcaccgccgc cgcaaggaat 7500
ggtgcatgca aggagatggc gcccaacagt cccccggcca cggggcctgc caccat 7556
<210> 368
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 368
ttcatttgag cattaaatgt caagttctgc 30
<210> 369
<211> 30
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 369
ttcatttgag cattaagtgt caagttctgc 30
<210> 370
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成序列
<400> 370
aaactcgtaa ttcacagttc a 21
<210> 371
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 371
tatatatata 10
<210> 372
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 372
tatata 6
<210> 373
<211> 5
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成序列
<400> 373
tatat 5

Claims (86)

1.一种将CasZ多肽导向至靶核酸的靶序列的方法,
所述方法包括使所述靶核酸与工程化的和/或非天然存在的复合物接触,所述复合物包含:
(a)CasZ多肽;
(b)CasZ指导RNA,所述CasZ指导RNA包含与所述靶核酸的靶序列杂交的指导序列,并且包含与所述CasZ多肽结合的区域。
2.如权利要求1所述的方法,其中所述方法导致所述靶核酸的修饰,从所述靶核酸的转录的调节,或与靶核酸相关联的多肽的修饰。
3.如权利要求2所述的方法,其中所述靶核酸通过被切割而被修饰。
4.如权利要求1-3中任一项所述的方法,其中所述靶核酸选自:双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。
5.如权利要求1-4中任一项所述的方法,其中所述指导序列和与所述CasZ多肽结合的所述区域彼此异源。
6.如权利要求1-5中任一项所述的方法,其中所述接触导致基因组编辑。
7.如权利要求1-5中任一项所述的方法,其中所述接触在细菌细胞外部和古细菌细胞外部发生。
8.如权利要求1-5中任一项所述的方法,其中所述接触在体外在细胞外部发生。
9.如权利要求1-7中任一项所述的方法,其中所述接触在靶细胞内部发生。
10.如权利要求9所述的方法,其中所述接触包括:将以下至少一项引入所述靶细胞中:
(a)所述CasZ多肽或编码所述CasZ多肽的核酸;和
(b)所述CasZ指导RNA或编码所述CasZ指导RNA的核酸。
11.如权利要求10所述的方法,其中编码所述CasZ多肽的所述核酸是经密码子优化以在所述靶细胞中表达的非天然序列。
12.如权利要求9-11中任一项所述的方法,其中所述靶细胞是真核细胞。
13.如权利要求9-12中任一项所述的方法,其中所述靶细胞在体外培养物中。
14.如权利要求9-12中任一项所述的方法,其中所述靶细胞是体内的。
15.如权利要求9-12中任一项所述的方法,其中所述靶细胞是离体的。
16.如权利要求12所述的方法,其中所述真核细胞选自由以下组成的组:植物细胞、真菌细胞、单细胞真核生物体、哺乳动物细胞、爬行动物细胞、昆虫细胞、禽细胞、鱼细胞、寄生虫细胞、节肢动物细胞、无脊椎动物细胞、脊椎动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人细胞。
17.如权利要求9-16中任一项所述的方法,其中所述接触还包括:将DNA供体模板引入所述靶细胞中。
18.如权利要求1-17中任一项所述的方法,其中所述方法包括使所述靶核酸与CasZ反式激活非编码RNA(trancRNA)接触。
19.如权利要求9-17中任一项所述的方法,其中所述接触包括:将CasZ反式激活非编码RNA(trancRNA)和/或编码所述CasZ trancRNA的核酸引入所述靶细胞中。
20.如权利要求18或权利要求19所述的方法,其中所述trancRNA包含与表2的trancRNA序列具有70%或更高的同一性的核苷酸序列。
21.一种包含工程化的和/或非天然存在的复合物的组合物,所述复合物包含:
(a)CasZ多肽或编码所述CasZ多肽的核酸;和
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
22.如权利要求21所述的组合物,其还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
23.一种包含工程化的和/或非天然存在的复合物的试剂盒,所述复合物包含:
(a)CasZ多肽或编码所述CasZ多肽的核酸;
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
24.如权利要求23所述的试剂盒,其还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
25.一种遗传修饰的真核细胞,其包含以下至少一项:
(a)CasZ多肽或编码所述CasZ多肽的核酸;
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域;和
(c)CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
26.如前述权利要求中任一项所述的组合物、试剂盒或真核细胞,其特征在于以下至少一项:
(a)编码所述CasZ多肽的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ多肽,并且(ii)与异源启动子可操作地连接;
(b)编码所述CasZ指导RNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ指导RNA,并且(ii)与异源启动子可操作地连接;和
(c)编码所述CasZ trancRNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ trancRNA,并且(ii)与异源启动子可操作地连接。
27.如前述权利要求中任一项所述的组合物、试剂盒或真核细胞,其用于治疗性治疗患者的方法中。
28.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项是重组表达载体:编码所述CasZ多肽的所述核酸、编码所述CasZ指导RNA的所述核酸和编码所述CasZ trancRNA的所述核酸。
29.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ指导RNA和/或所述CasZ trancRNA包含以下一项或多项:修饰的核碱基、修饰的骨架或非天然核苷间键联、修饰的糖部分、锁核酸、肽核酸和脱氧核糖核苷酸。
30.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽是与相应的野生型CasZ蛋白相比具有降低的核酸酶活性的变体CasZ多肽。
31.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项与异源部分缀合:所述CasZ多肽、编码所述CasZ多肽的所述核酸、所述CasZ指导RNA、编码所述CasZ指导RNA的所述核酸、所述CasZ trancRNA和编码所述CasZ trancRNA的所述核酸。
32.如权利要求31所述的方法、组合物、试剂盒或真核细胞,其中所述异源部分是异源多肽。
33.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽与相应的野生型CasZ蛋白相比具有降低的核酸酶活性,并且与异源多肽融合。
34.如权利要求33所述的方法、组合物、试剂盒或真核细胞,其中所述异源多肽:(i)具有DNA修饰活性,(ii)表现出增加或减少转录的能力,并且/或者(iii)具有修饰与DNA相关联的多肽的酶活性。
35.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽包含与图1或图7的CasZ蛋白具有70%或更高的同一性的氨基酸序列。
36.如前述权利要求中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述指导序列和与所述CasZ多肽结合的所述区域彼此异源。
37.一种检测样品中的靶DNA的方法,所述方法包括:
(a)使所述样品与以下物质接触:
(i)CasZ多肽;
(ii)指导RNA,所述指导RNA包含:与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列;和
(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及
(b)测量由所述CasZ切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
38.如权利要求37所述的方法,其中所述靶DNA是单链的。
39.如权利要求37或38所述的方法,其中所述靶DNA是双链的。
40.如权利要求37-39中任一项所述的方法,其中所述靶DNA是病毒DNA。
41.如权利要求37-40中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
42.如权利要求37-41中任一项所述的方法,其中所述CasZ多肽包含与图1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
43.如权利要求37-41中任一项所述的方法,其中所述CasZ多肽是Cas14a多肽。
44.根据权利要求37-43中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
45.根据权利要求37-44中任一项所述的方法,其中所述样品包含细胞。
46.根据权利要求37-45中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
47.根据权利要求46所述的方法,其中所述细胞是真核细胞。
48.根据权利要求37-47中任一项所述的方法,其中所述靶DNA能够以低至10aM的浓度被检测到。
49.根据权利要求37-48中任一项所述的方法,其包括确定所述样品中存在的所述靶DNA的量。
50.根据权利要求49所述的方法,其中所述确定包括:
测量所述可检测信号以生成测试测量值;
测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及
将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
51.根据权利要求37-50中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
52.根据权利要求37-51中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
53.根据权利要求52所述的方法,其中在所述单链检测剂DNA被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
54.根据权利要求52所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
55.根据权利要求52-54中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
56.根据权利要求18所述的方法,其中在所述单链检测剂DNA被切割之后,可检测信号的量增加。
57.根据权利要求52或权利要求56所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
58.根据权利要求52-57中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
59.根据权利要求58所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
60.根据权利要求37-59中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
61.根据权利要求37-60中任一项所述的方法,其中所述方法包括扩增所述样品中的核酸。
62.根据权利要求61所述的方法,其中所述扩增包括等温扩增。
63.根据权利要求62所述的方法,其中所述等温扩增包括重组酶聚合酶扩增(RPA)。
64.根据权利要求61-63中任一项所述的方法,其中所述扩增在所述步骤(a)的接触之前开始。
65.根据权利要求61-63中任一项所述的方法,其中所述扩增与所述步骤(a)的接触一起开始。
66.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:
(a)指导RNA或编码所述指导RNA的核酸;其中所述指导RNA包含:与CasZ多肽结合的区域和与靶DNA互补的指导序列;和
(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
67.如权利要求66所述的试剂盒,其还包含CasZ多肽。
68.如权利要求67所述的试剂盒,其中所述CasZ多肽包含与图1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
69.如权利要求67所述的试剂盒,其中所述CasZ多肽是Cas14a多肽。
70.如权利要求66-69中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
71.如权利要求70所述的试剂盒,其中所述荧光发射染料对是FRET对。
72.如权利要求70所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
73.如权利要求70-72中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
74.如权利要求73所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
75.如权利要求66-74中任一项所述的试剂盒,其还包含核酸扩增组分。
76.如权利要求75所述的试剂盒,其中所述核酸扩增组分是用于重组酶聚合酶扩增(RPA)的组分。
77.一种切割单链DNA(ssDNA)的方法,所述方法包括:
使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:
(i)CasZ多肽;和
(ii)指导RNA,所述指导RNA包含:与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列,
其中所述CasZ多肽切割所述多个非靶ssDNA。
78.如权利要求77所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
79.如权利要求78所述的方法,其中所述细胞是真核细胞。
80.如权利要求79所述的方法,其中所述真核细胞是植物细胞。
81.如权利要求78-80中任一项所述的方法,其中所述非靶ssDNA对于所述细胞是外源的。
82.如权利要求81所述的方法,其中所述非靶ssDNA是病毒DNA。
83.如权利要求77-82中任一项所述的方法,其中所述靶DNA是单链的。
84.如权利要求77-82中任一项所述的方法,其中所述靶DNA是双链的。
85.如权利要求77-84中任一项所述的方法,其中所述靶DNA是病毒DNA。
86.如权利要求77-84中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
CN201880084919.XA 2017-11-01 2018-10-31 Casz组合物和使用方法 Pending CN111886336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310721532.3A CN117487776A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762580395P 2017-11-01 2017-11-01
US62/580,395 2017-11-01
PCT/US2018/058545 WO2019089820A1 (en) 2017-11-01 2018-10-31 Casz compositions and methods of use

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310721532.3A Division CN117487776A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Publications (1)

Publication Number Publication Date
CN111886336A true CN111886336A (zh) 2020-11-03

Family

ID=66332730

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310721532.3A Pending CN117487776A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法
CN201880084919.XA Pending CN111886336A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310721532.3A Pending CN117487776A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Country Status (14)

Country Link
US (7) US20200087640A1 (zh)
EP (1) EP3704239A4 (zh)
JP (2) JP2021503278A (zh)
KR (1) KR20200091858A (zh)
CN (2) CN117487776A (zh)
AU (1) AU2018358051A1 (zh)
BR (1) BR112020008654A2 (zh)
CA (1) CA3080493A1 (zh)
GB (1) GB2582482B (zh)
IL (1) IL274276A (zh)
MX (1) MX2020004578A (zh)
RU (1) RU2020117711A (zh)
SG (1) SG11202003863VA (zh)
WO (1) WO2019089820A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113166744A (zh) * 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
CN114561456A (zh) * 2022-03-23 2022-05-31 北京盛因生物科技有限公司 一种等温核酸检测酶组合物、试剂盒及其用途和检测方法
WO2023208000A1 (en) * 2022-04-25 2023-11-02 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12f systems and uses thereof
CN117512071A (zh) * 2023-09-15 2024-02-06 湖北大学 一种耐高温TnpB蛋白及其在核酸检测中的应用

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8673267B2 (en) 2009-03-02 2014-03-18 Massachusetts Institute Of Technology Methods and products for in vivo enzyme profiling
CA3214092A1 (en) 2011-03-15 2012-09-20 Massachusetts Institute Of Technology Multiplexed detection with isotope-coded reporters
CN105452481A (zh) 2013-06-07 2016-03-30 麻省理工学院 基于亲和力检测配体编码的合成性生物标记物
US11448643B2 (en) 2016-04-08 2022-09-20 Massachusetts Institute Of Technology Methods to specifically profile protease activity at lymph nodes
CA3022928A1 (en) 2016-05-05 2017-11-09 Massachusetts Institute Of Technology Methods and uses for remotely triggered protease activity measurements
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
AU2018248327A1 (en) 2017-04-07 2019-10-17 Massachusetts Institute Of Technology Methods to spatially profile protease activity in tissue and sections
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
AU2018279829B2 (en) 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
WO2019089820A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
CN110551800B (zh) * 2018-06-03 2022-08-19 上海吐露港生物科技有限公司 一种耐高温Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
US20210317527A1 (en) * 2018-08-27 2021-10-14 The Regents Of The University Of California Reporter nucleic acids for type v crispr-mediated detection
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3911753A1 (en) 2019-01-17 2021-11-24 Massachusetts Institute of Technology Sensors for detecting and imaging of cancer metastasis
WO2020181101A1 (en) 2019-03-07 2020-09-10 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
EP3963069A1 (en) * 2019-05-01 2022-03-09 Mammoth Biosciences, Inc. Programmable nucleases and methods of use
KR102455623B1 (ko) 2019-10-29 2022-10-18 주식회사 진코어 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
US20210262025A1 (en) 2020-02-18 2021-08-26 Massachusetts Institute Of Technology Multiplexed in vivo disease sensing with nucleic acid-barcoded reporters
CN111257297B (zh) * 2020-03-31 2023-06-16 海南大学 一种基于Cas14a酶的RNA检测方法
EP4133069A2 (en) 2020-04-08 2023-02-15 Astrazeneca AB Compositions and methods for improved site-specific modification
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
CA3191387A1 (en) 2020-09-30 2022-04-07 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
AU2021357377A1 (en) 2020-10-08 2023-05-25 Genkore Inc. Engineered guide RNA for optimized CRISPR/Cas12f1 (Cas14a1) system and use thereof
KR102638799B1 (ko) * 2020-10-08 2024-02-22 주식회사 진코어 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
CA3198422A1 (en) 2020-10-08 2022-04-14 Genkore Inc. Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
WO2022075816A1 (ko) 2020-10-08 2022-04-14 주식회사 진코어 Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
CN116568803A (zh) 2020-10-08 2023-08-08 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1系统的效率的包含富含U的尾部的经工程化的引导RNA及其用途
CN112176035A (zh) * 2020-10-14 2021-01-05 杭州优思达生物技术有限公司 一种新型crispr核酸检测方法及应用
WO2022092317A1 (ja) * 2020-10-30 2022-05-05 国立大学法人東京大学 エンジニアリングされたCas12fタンパク質
EP4337701A1 (en) 2021-05-10 2024-03-20 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2022241032A1 (en) * 2021-05-12 2022-11-17 Mammoth Biosciences, Inc. Enhanced guide nucleic acids and methods of use
KR20220155553A (ko) 2021-05-14 2022-11-23 주식회사 진코어 RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법
BR112023024985A2 (pt) 2021-06-01 2024-02-20 Arbor Biotechnologies Inc Sistemas de edição de genes compreendendo uma crispr nuclease e usos dos mesmos
WO2023282597A1 (ko) 2021-07-05 2023-01-12 주식회사 진코어 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
WO2023004391A2 (en) 2021-07-21 2023-01-26 Montana State University Nucleic acid detection using type iii crispr complex
WO2023086938A2 (en) * 2021-11-12 2023-05-19 Arbor Biotechnologies, Inc. Type v nucleases
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
WO2023168242A1 (en) * 2022-03-01 2023-09-07 Epicrispr Biotechnologies, Inc. Engineered nucleases, compositions, and methods of use thereof
WO2023201275A1 (en) * 2022-04-13 2023-10-19 The Board Of Trustees Of The Leland Stanford Junior University Enzyme kinetics analyses of crispr endonucleases

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1580273A1 (en) * 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
CN101283089A (zh) * 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2410072C (en) 2000-05-24 2011-07-19 Third Wave Technologies, Inc. Polymerase cleavage agents and detection of rna
US6773885B1 (en) 2000-09-29 2004-08-10 Integrated Dna Technologies, Inc. Compositions and methods for visual ribonuclease detection assays
US9689031B2 (en) 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
US8597886B2 (en) 2010-02-15 2013-12-03 Cascade Biosystems, Inc. Methods and materials for detecting viral or microbial infections
SG186987A1 (en) 2010-06-11 2013-02-28 Pathogenica Inc Nucleic acids for multiplex organism detection and methods of use and making the same
US9730967B2 (en) 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
US8815782B2 (en) 2011-11-11 2014-08-26 Agilent Technologies, Inc. Use of DNAzymes for analysis of an RNA sample
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
ES2901396T3 (es) * 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CA2930877A1 (en) 2013-11-18 2015-05-21 Crispr Therapeutics Ag Crispr-cas system materials and methods
EP3080266B1 (en) 2013-12-12 2021-02-03 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
EP3126498A4 (en) 2014-03-20 2017-08-23 Université Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
WO2015157534A1 (en) * 2014-04-10 2015-10-15 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
CN107075546B (zh) * 2014-08-19 2021-08-31 哈佛学院董事及会员团体 用于对核酸探测并作图的rna-引导的系统
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016123243A1 (en) 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2016279062A1 (en) 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
RU2752834C2 (ru) 2015-06-18 2021-08-09 Те Брод Инститьют, Инк. Мутации фермента crispr, уменьшающие нецелевые эффекты
US9580727B1 (en) * 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
EP3365441A1 (en) 2015-10-22 2018-08-29 The Broad Institute Inc. Type vi-b crispr enzymes and systems
EP3400299B1 (en) * 2016-01-08 2020-11-11 University of Georgia Research Foundation, Inc. Methods for cleaving dna and rna molecules
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
JP2019506875A (ja) 2016-02-23 2019-03-14 アーク バイオ, エルエルシー 標的検出のための方法および組成物
WO2017176529A1 (en) 2016-04-06 2017-10-12 Temple Univesity-Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
US11371081B2 (en) 2016-05-25 2022-06-28 Arizona Board Of Regents On Behalf Of Arizona State University Portable, low-cost pathogen detection and strain identification platform
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US11788083B2 (en) 2016-06-17 2023-10-17 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
AU2017280353B2 (en) 2016-06-24 2021-11-11 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
WO2018035250A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
CN106701830B (zh) * 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
PT3551753T (pt) 2016-12-09 2022-09-02 Harvard College Diagnósticos baseados num sistema efetor de crispr
SG11201906297QA (en) 2017-03-24 2019-10-30 Curevac Ag Nucleic acids encoding crispr-associated proteins and uses thereof
EP3612551A4 (en) 2017-04-21 2020-12-30 The General Hospital Corporation VARIANTS OF CPF1 (CAS12A) WITH MODIFIED PAM SPECIFICITY
EP3665279B1 (en) * 2017-08-09 2023-07-19 Benson Hill, Inc. Compositions and methods for modifying genomes
WO2019089804A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casy compositions and methods of use
EP3704254A4 (en) 2017-11-01 2021-09-01 The Regents of The University of California CAS12C COMPOSITIONS AND METHOD OF USE
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
WO2019089820A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
US10253365B1 (en) * 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
CN111836903A (zh) 2017-12-22 2020-10-27 博德研究所 基于crispr效应系统的多重诊断

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1580273A1 (en) * 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
CN101283089A (zh) * 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUCAS B. HARRINGTON ET AL: "Programmed DNA destruction by miniature CRISPR-Cas14 enzymes", 《SCIENCE》 *
孟泽松等: "CRISPR/Cas9基因编辑技术在肿瘤研究及治疗中的应用", 《肿瘤》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113166744A (zh) * 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
CN114561456A (zh) * 2022-03-23 2022-05-31 北京盛因生物科技有限公司 一种等温核酸检测酶组合物、试剂盒及其用途和检测方法
WO2023208000A1 (en) * 2022-04-25 2023-11-02 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12f systems and uses thereof
CN117512071A (zh) * 2023-09-15 2024-02-06 湖北大学 一种耐高温TnpB蛋白及其在核酸检测中的应用
CN117512071B (zh) * 2023-09-15 2024-06-04 湖北大学 一种耐高温TnpB蛋白及其在核酸检测中的应用

Also Published As

Publication number Publication date
SG11202003863VA (en) 2020-05-28
US20200172886A1 (en) 2020-06-04
CN117487776A (zh) 2024-02-02
GB2582482B (en) 2023-05-17
US11180743B2 (en) 2021-11-23
RU2020117711A (ru) 2021-12-02
KR20200091858A (ko) 2020-07-31
EP3704239A4 (en) 2021-08-18
CA3080493A1 (en) 2019-05-09
US11453866B2 (en) 2022-09-27
AU2018358051A1 (en) 2020-05-14
US20200370028A1 (en) 2020-11-26
IL274276A (en) 2020-06-30
JP2023082141A (ja) 2023-06-13
RU2020117711A3 (zh) 2022-03-28
US11441137B2 (en) 2022-09-13
US20210017508A1 (en) 2021-01-21
MX2020004578A (es) 2020-12-03
GB202008124D0 (en) 2020-07-15
US11371031B2 (en) 2022-06-28
US20240167009A1 (en) 2024-05-23
US20200299660A1 (en) 2020-09-24
US20230323319A1 (en) 2023-10-12
BR112020008654A2 (pt) 2020-11-10
EP3704239A1 (en) 2020-09-09
US20200087640A1 (en) 2020-03-19
JP2021503278A (ja) 2021-02-12
GB2582482A (en) 2020-09-23
WO2019089820A1 (en) 2019-05-09

Similar Documents

Publication Publication Date Title
CN111886336A (zh) Casz组合物和使用方法
JP7239725B2 (ja) CRISPR-Casエフェクターポリペプチド及びその使用方法
JP7306696B2 (ja) Rna誘導型核酸修飾酵素及びその使用方法
JP2023027277A (ja) Rna誘導型核酸修飾酵素及びその使用方法
WO2019089808A1 (en) Class 2 crispr/cas compositions and methods of use
KR20240036729A (ko) 클래스 ii, 타입 v crispr 시스템
KR20190089175A (ko) 표적 핵산 변형을 위한 조성물 및 방법
CN114040971A (zh) CRISPR-Cas效应子多肽及其使用方法
KR20210005146A (ko) 유전자 편집된 t 세포에서의 인간 foxp3의 발현
JP2023508362A (ja) Crispr-casエフェクターポリペプチド及びその使用方法
CN116083398B (zh) 分离的Cas13蛋白及其应用
CN114921439A (zh) CRISPR-Cas效应子蛋白、其基因编辑系统及应用
CN107072183A (zh) 消除种系细胞的nanos敲除
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
WO2023147240A2 (en) Variant type v crispr/cas effector polypeptides and methods of use thereof
WO2022159822A1 (en) Crispr-cas effector polypeptides and methods of use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination