CN107690480B - Cas9分子/指导rna分子复合物的评价 - Google Patents

Cas9分子/指导rna分子复合物的评价 Download PDF

Info

Publication number
CN107690480B
CN107690480B CN201680032169.2A CN201680032169A CN107690480B CN 107690480 B CN107690480 B CN 107690480B CN 201680032169 A CN201680032169 A CN 201680032169A CN 107690480 B CN107690480 B CN 107690480B
Authority
CN
China
Prior art keywords
molecule
grna
cas9
complex
cas9 molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680032169.2A
Other languages
English (en)
Other versions
CN107690480A (zh
Inventor
H·亚拉姆
W·小塞莱克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Editas Medicine Inc
Original Assignee
Editas Medicine Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Editas Medicine Inc filed Critical Editas Medicine Inc
Publication of CN107690480A publication Critical patent/CN107690480A/zh
Application granted granted Critical
Publication of CN107690480B publication Critical patent/CN107690480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6486Measuring fluorescence of biological material, e.g. DNA, RNA, cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/11Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/916Hydrolases (3) acting on ester bonds (3.1), e.g. phosphatases (3.1.3), phospholipases C or phospholipases D (3.1.4)
    • G01N2333/922Ribonucleases (RNAses); Deoxyribonucleases (DNAses)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文披露了用于评价、选择、优化和设计Cas9分子/gRNA分子复合物的方法。

Description

CAS9分子/指导RNA分子复合物的评价
相关申请的交叉引用
本申请要求2015年4月24日提交的美国临时申请号62/152,473的优先权。
技术领域
本发明涉及Cas9分子/指导RNA(gRNA)分子复合物的评价、选择和设计。
背景技术
Cas9核糖核蛋白(RNP)复合物的直接递送允许有效地进行基因编辑,同时由于Cas9蛋白在细胞中的快速周转而使脱靶活性最小化。通过与体外转录或化学合成的指导RNA(gRNA)复合的经纯化的Cas9蛋白的阳离子脂质递送,可以在各种哺乳动物细胞中实现基因编辑。由RNP递送介导的基因编辑的效率随着基因座而变化,并且取决于gRNA的长度、以及递送的Cas9蛋白和gRNA的量和比例。鉴于RNP复合物的双组分性质,需要精确的条件来获得Cas9蛋白和gRNA之间完整且有生产力的复合物形成。虽然蛋白质和RNA的量可以通过染料结合测定(例如Bradford染料结合测定或核糖定量RNA测定)进行定量,但是这些技术不能提供基因编辑活性所需的生产性RNP复合物的定量。
Cas9/gRNA复合物的结构和生物物理学表征显示出大的接触面积和高的亲和力。热熔曲线是表征蛋白质-配体复合物的稳定性和结合的有用特性。差示扫描荧光测定法(DSF)是一种生物物理学技术,其中使用小分子染料(例如
Figure BDA0001491286140000011
orange)的荧光变化来监测蛋白质的热变性并确定其热熔融温度(℃)。配体与蛋白质的结合倾向于不同程度地稳定蛋白质并改变其Tm。不同配体浓度下的蛋白质的Tm的测量可以允许测量蛋白质对该配体的亲和力。可以使用大范围的热熔融特征来以高通量与高信噪比快速测定RNP复合物的质量。
因此,仍然需要开发可用于评价Cas9分子/gRNA分子复合物的质量的测定(如DSF),例如来定量生产性复合物形成,这是RNP介导的基因编辑的先决条件。
发明内容
本文提供了用于筛选用以向受试者给予的Cas9分子/gRNA分子复合物的方法,其包括(a)产生多个样品,每个样品包含通过将Cas9分子与多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物;(b)检测多个样品中每个中的Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及(c)基于以下项中的一项或多项来从多个样品中选择至少一个样品:(i)多个样品中的Tm值与参考Cas9分子/gRNA分子复合物的Tm值或预设的阈值Tm值的比较,或(ii)多个样品的Tm值的相对排序。在某些实施例中,检测多个样品中每个样品中的Cas9分子/gRNA分子复合物的Tm值的步骤可以包括通过差示扫描荧光测定法(DSF)评估多个样品中的每个样品。在某些实施例中,所述gRNA可以是嵌合gRNA。在某些实施例中,所述gRNA可以是模块化gRNA。在某些实施例中,样品可以包含含有添加剂、小分子、稳定剂、缓冲液、pH、盐浓度、甘油浓度或其他缓冲组分的组分。在某些实施例中,可以选择包含Cas9分子/gRNA分子复合物的样品,所述复合物具有比不存在gRNA分子的情况下Cas9分子的Tm值大至少8℃的Tm
在某些实施例中,本文提供了Cas9分子和gRNA分子的经分离的复合物,这些经分离的复合物具有比不存在根据本文提供的方法所选择的gRNA分子的情况下Cas9分子的Tm值大至少8℃的Tm
在某些实施例中,本文提供了包含Cas9分子和gRNA分子的经分离的复合物的组合物,所述经分离的复合物具有比不存在根据本文提供的方法所选择的gRNA分子的情况下Cas9分子的Tm大至少8℃的Tm。在某些实施例中,Cas9分子和gRNA分子的非天然存在的复合物的Tm与不存在gRNA分子情况下Cas9分子的Tm的差异可以通过DSF来评估。在某些实施例中,所述gRNA可以是嵌合gRNA或模块化gRNA。
在某些实施例中,本文提供了确定Cas9分子/gRNA分子复合物的稳定性的方法,其包括(a)产生多个Cas9分子/gRNA分子复合物,每个复合物包含通过将Cas9分子和多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物;(b)检测多个Cas9分子/gRNA分子复合物中每个Cas9分子/gRNA分子复合物的Tm值;以及(c)如果Cas9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则确定多个Cas9分子/gRNA分子复合物中的一个或多个是稳定的。
在本文方法的某些实施例中,多个gRNA分子可以是候选gRNA分子的文库。在某些实施例中,所述候选gRNA分子的文库可以包含tracrRNA分子或序列的文库。在某些实施例中,tracrRNA分子或序列的文库可以具有不同的长度。
在某些实施例中,本文提供了确定促进稳定的Cas9分子/gRNA分子复合物的条件的方法,其包括(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;(b)检测Cas9分子/gRNA分子复合物的Tm值;以及(c)如果Cas9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在某些实施例中,本文提供了筛选稳定的Cas9分子/gRNA分子复合物的方法,其包括(a)经由DSF检测Cas9分子/gRNA分子复合物的Tm值;和(b)如果Cas9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在某些实施例中,本文提供了用于鉴定最佳gRNA以形成稳定的Cas9分子/gRNA分子复合物的方法,其包括(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;(b)检测Cas9分子/gRNA分子复合物的Tm值;以及(c)如果Cas9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大至少8℃,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在某些实施例中,本文提供了确定Cas9分子/gRNA分子复合物的稳定性的方法,其包括(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;(b)检测Cas9分子/gRNA分子复合物的Tm值;(c)测量Cas9分子/gRNA分子复合物的活性值;以及(d)如果(i)Cas9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,和(ii)Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值或活性参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在某些实施例中,本文提供了优化gRNA分子与Cas9分子的结合以形成稳定的Cas9分子/gRNA分子复合物的方法,其包括(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;(b)检测Cas9分子/gRNA分子复合物的Tm值;(c)确定Cas9分子/gRNA分子复合物的Tm值和参考分子的Tm值或Tm参考值之间的Δ值;以及(d)如果Δ值为至少8℃并且Cas9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在某些实施例中,本文提供了检测稳定的Cas9分子/gRNA分子复合物的方法,其包括(a)检测参考分子的热稳定性值;(b)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;(c)测量Cas9分子/gRNA分子复合物的热稳定性值;以及(d)如果Cas9分子/gRNA分子复合物的热稳定性值大于参考分子的热稳定性值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
在本文方法的某些实施例中,热稳定性值可以是变性温度值,并且热稳定性参考值可以是变性温度参考值。在本文方法的某些实施例中,热稳定性值可以是Tm值,并且热稳定性参考值可以是Tm参考值。
在本文方法的某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大至少1℃、至少2℃、至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少11℃、至少12℃、至少13℃、至少14℃、至少15℃、至少16℃、至少17℃、至少18℃、至少19℃或至少20℃,则所述as9分子/gRNA分子复合物可以是稳定的。例如,在某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大至少8℃,则所述as9分子/gRNA分子复合物是稳定的。
在本文方法的某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大约1℃、约2℃、约3℃、约4℃、约5℃、约6℃、约7℃、约8℃、约9℃、约10℃、约11℃、约12℃、约13℃、约14℃、约15℃、约16℃、约17℃、约18℃、约19℃或约20℃,则所述as9分子/gRNA分子复合物可以是稳定的。例如,在某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大约8℃,则所述as9分子/gRNA分子复合物是稳定的。
在本文方法的某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大约1℃至5℃、约6℃至10℃、约11℃至15℃、或约16℃至20℃,则所述as9分子/gRNA分子复合物可以是稳定的。例如,在某些实施例中,如果as9分子/gRNA分子复合物的Tm值比参考分子的Tm值或Tm参考值大约6℃至10℃,则所述as9分子/gRNA分子复合物是稳定的。
在本文方法的某些实施例中,可以使用热移位测定来检测Tm值。在某些实施例中,热移位测定可以选自DSF、差示扫描量热法(DS)或等温滴定量热法(IT)。
在本文方法的某些实施例中,所述gRNA分子可以包括嵌合gRNA分子。在某些实施例中,所述gRNA分子可以包括模块化gRNA分子。
在本文方法的某些实施例中,所述as9分子可以是本文所披露的任何as9分子。例如,所述as9分子可以是选自表1的as9分子。在某些实施例中,所述as9分子可以是嵌合as9分子,或合成或工程化的as9分子。例如,所述as9分子可以是一部分或多部分缺失的as9分子。在某些实施例中,所述as9分子可以包括化脓链球菌或金黄色葡萄球菌as9分子。
在本文方法的某些实施例中,参考分子可以选自(a)不存在gRNA分子情况下的参考as9分子;(b)与第二gRNA分子(即不同于被评价的复合物中的gRNA的gRNA)复合的参考as9分子(例如与被评价的复合物中的as9分子相同的as9分子);和(c)参考as9分子/gRNA分子复合物,其中所述参考as9分子/gRNA分子在与as9分子/gRNA分子复合物不同的条件下形成,例如用与其不同比例的Cas9分子和gRNA分子,或者是在不同缓冲液中形成。在某些实施例中,参考Cas9分子可以与被评价的复合物中的Cas9分子相同。在某些实施例中,参考Cas9分子可以与被评价的复合物中的Cas9分子不同。在某些实施例中,参考Cas9分子可以在一级序列上与被评价的复合物中的Cas9分子不同。在某些实施例中,参考Cas9分子/gRNA分子复合物的gRNA分子可以与被评价的复合物中的gRNA分子相同。在某些实施例中,参考Cas9分子/gRNA分子复合物的gRNA分子可以与被评价的复合物中的gRNA分子不同。在某些实施例中,参考Cas9分子/gRNA分子复合物的gRNA分子可以在序列上不同于被评价的复合物中的gRNA分子或因修饰而与其不同。
在本文方法的某些实施例中,Tm参考值可以包括Tm的预选数值。在某些实施例中,Tm参考值可以包括与本文所述的任何参考分子的Tm相关的值。
在某些实施例中,本文所披露的方法可以进一步包括检测Cas9分子/gRNA分子复合物的活性;测量Cas9分子/gRNA分子复合物的活性值;以及如果Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值或活性参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,活性可以包括以下项中的一项或多项:诱导indel的能力;修饰靶DNA的能力;预选修复方法的倾向(propensity);gRNA分子与DNA靶保持杂交的能力;以及gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力。在某些实施例中,活性值可以是结合值,并且活性可以是gRNA分子结合Cas9分子的能力,包括:(a)将样品中的gRNA分子和Cas9分子组合以形成Cas9分子/gRNA分子复合物;(b)测量Cas9分子/gRNA分子复合物的结合值;以及(c)如果Cas9分子/gRNA分子复合物的结合值大于参考分子的结合值或结合参考值,则确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,可以使用动力学测定来测量结合值。在某些实施例中,动力学测定可以选自表面等离子体共振(SPR)测定、生物层干涉法(BLI)测定或凝胶带移位测定。在某些实施例中,预选修复方法的倾向可以是HDR或NHEJ。在某些实施例中,可以使用体外系统、离体系统、体内系统、细胞测定或动物模型来测试Cas9分子/gRNA分子复合物的活性。
在某些实施例中,参考分子选自本文提供的任何参考分子。在某些实施例中,用与Cas9分子/gRNA分子复合物不同比例的Cas9分子/gRNA分子,或者在与Cas9分子/gRNA分子复合物不同的缓冲液中来形成参考Cas9分子/gRNA分子复合物。
在某些实施例中,本文提供了使用本文所述的任何方法所产生的合成的Cas9分子/gRNA分子复合物。
在某些实施例中,本文提供了包含使用本文所述的任何方法所产生的Cas9分子/gRNA分子复合物的组合物。
在某些实施例中,本文提供了载体系统,其包含编码使用本文所述的任何方法所产生的一种或多种Cas9分子/gRNA分子复合物的核酸。
在某些实施例中,本文提供了将Cas9分子/gRNA分子复合物递送至靶细胞的方法,其包括将本文所述的任何Cas9分子/gRNA分子复合物递送至靶细胞。在某些实施例中,可通过RNP阳离子脂质转染、病毒载体或RNA转染将Cas9分子/gRNA分子复合物递送至细胞。在某些实施例中,病毒载体可以是AAV载体。
在某些实施例中,在本文提供的方法、组合物或配制品中的gRNA分子可以是单分子gRNA或嵌合gRNA。在其他实施例中,gRNA分子可以是模块化gRNA。
在某些实施例中,在本文提供的方法、组合物或配制品中的Cas9分子可以是化脓链球菌、金黄色葡萄球菌或嗜热链球菌Cas9分子,或衍生自化脓链球菌、金黄色葡萄球菌或嗜热链球菌Cas9分子的Cas9分子。在某些实施例中,可以标记Cas9分子,并且在这些实施例的某些中,所述标记可以是荧光染料。
本发明的其他特征和优势从详细说明、附图以及从权利要求书将变得显而易见。
附图说明
图1A-1I是若干示例性gRNA的表示。
图1A描绘了部分来源于(或部分地在序列上建模)化脓链球菌呈双链体结构的模块化gRNA分子(按照出现次序分别是SEQ ID NO:39和40);
图1B描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:41);
图1C描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:42);
图1D描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:43);
图1E描绘了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:44);
图1F描绘了部分来源于嗜热链球菌呈双链体结构的模块化gRNA分子(按照出现次序分别是SEQ ID NO:45和46);
图1G描绘了化脓链球菌和嗜热链球菌的模块化gRNA分子(按照出现次序分别是SEQ ID NO:39、45、47和46)的比对。
图1H-1I描绘了单分子gRNA分子的另外示例性结构。
图1H示出了部分来源于化脓链球菌呈双链体结构的单分子gRNA分子(SEQ ID NO:42)的示例性结构。
图1I示出了部分来源于金黄色葡萄球菌呈双链体结构的单分子gRNA分子(SEQ IDNO:38)的示例性结构。
图2A-2G描绘了Cas9序列的比对(Chylinski 2013)。N-末端RuvC样结构域加框并且以“Y”指示。其他两个RuvC样结构域加框并且以“B”指示。HNH样结构域加框并且以“G”指示。Sm:变形链球菌(SEQ ID NO:1);Sp:化脓链球菌(SEQ ID NO:2);St:嗜热链球菌(SEQ IDNO:4);以及Li:无害利斯特菌(SEQ ID NO:5)。“基序”(SEQ ID NO:14)是基于四个序列的共有序列。所有四个序列中的保守残基由单字母氨基酸缩写表示;“*”指示在这四个序列的任一者的相应位置中发现的任何氨基酸;并且“-”指示不存在。
图3A-3B示出了来自披露于Chylinski 2013中的Cas9分子(SEQ ID NO:52-95、120-123)的N-末端RuvC样结构域的比对。图3B的最后一行鉴定了4个高度保守的残基。
图4A-4B示出了来自披露于Chylinski 2013中的除去序列异常值的Cas9分子(SEQID NO:52-123)的N-末端RuvC样结构域的比对。图4B的最后一行鉴定了3个高度保守的残基。
图5A-5C示出了来自披露于Chylinski 2013中的Cas9分子(SEQ ID NO:124-198)的HNH样结构域的比对。图5C的最后一行鉴定了保守残基。
图6A-6B示出了来自披露于Chylinski 2013中的除去序列异常值的Cas9分子(SEQID NO:124-141、148、149、151-153、162、163、166-174、177-187、194-198)的HNH样结构域的比对。图6B的最后一行鉴定了3个高度保守的残基。
图7示出了使用示例性gRNA序列(SEQ ID NO:42)的gRNA结构域命名法。
图8A和8B提供了化脓链球菌Cas9的结构域组织的示意性表示。图8A参照Cas9的两种叶片(识别(REC)叶片和核酸酶(NUC)叶片)示出了Cas9结构域的组织,包括氨基酸位置。图8B示出了83个Cas9直向同源物中每个结构域的百分比同源性。
图9A描绘了如通过DSF测定的,在不存在gRNA的情况下的金黄色葡萄球菌Cas9的热稳定性。
图9B描绘了如通过DSF测定的,在不存在gRNA的情况下的化脓链球菌Cas9的热稳定性。
图10描绘了如通过DSF测定的,(1)化脓链球菌Cas9、(2)在化脓链球菌gRNA存在下的化脓链球菌Cas9、和(3)在金黄色葡萄球菌gRNA存在下的化脓链球菌Cas9的热稳定性。
图11A描绘了如通过DSF测定的,(1)金黄色葡萄球菌Cas9和(2)在有靶向CD3的gRNA的情况下金黄色葡萄球菌Cas9的热稳定性。
图11B描绘了示例性FACS分析,其示出在将金黄色葡萄球菌Cas9和靶向CD3的gRNA递送至Jurkat T细胞后CD3阴性群体的产生。
具体实施方式
定义
除非另外定义,本文使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。尽管可以在本发明的实践或测试中使用类似于或等效于本文描述的那些的方法和材料,但是下文描述了适合的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考文献通过引用以其全文而结合。另外,材料、方法和实例仅是说明性的并不旨在是限制性的。
如本文所用的“alt-HDR”、“替代性同源定向修复”或“替代性HDR”是指使用同源核酸(例如,内源性同源序列(例如姐妹染色单体)或外源核酸(例如模板核酸))修复DNA损伤的过程。alt-HDR与典型HDR的不同之处在于,所述过程利用与典型HDR不同的途径,并且可以被典型HDR介体RAD51和BRCA2抑制。此外,alt-HDR使用单链或有切口的同源核酸来修复断裂。
如本文所用的“典型HDR”或典型同源定向修复是指使用同源核酸(例如,内源性同源序列(例如姐妹染色单体)或外源核酸(例如模板核酸))修复DNA损伤的过程。当在双链断裂处已有显著切除时,典型HDR通常起作用,形成DNA的至少一个单链部分。在正常细胞中,HDR通常涉及一系列步骤,诸如断裂的识别、断裂的稳定、切除、单链DNA的稳定、DNA交叉中间体的形成、交叉中间体的拆分以及连接。所述过程需要RAD51和BRCA2,并且同源核酸通常是双链的。
除非另有说明,如本文所用的术语“HDR”涵盖典型HDR和alt-HDR两者。
如本文所用的“非同源末端连接”或“NHEJ”是指连接介导的修复和/或非模板介导的修复,包括典型NHEJ(cNHEJ)、替代性NHEJ(altNHEJ)、微同源性介导的末端连接(MMEJ)、单链退火(SSA)以及合成依赖性微同源性介导的末端连接(SD-MMEJ)。
“获取”(acquire或acquiring)作为术语在本文中使用是指通过以下项中的一种或多种或全部获得物理实体或值(例如数值)的拥有权:“直接获取”、“间接获取”物理实体或值,或在值的情况下,“通过计算获取”。
“直接获取”意指执行一个过程(例如,执行合成或分析方法)以获得物理实体或值。“直接获取物理实体”包括执行包括物理物质(例如,起始材料)的物理变化的过程。示例性的变化包括从两种或更多种起始材料制造物理实体、剪切或片段化物质、分离或纯化物质、将两个或更多个分离的实体组合成混合物、进行包括断裂或形成共价键或非共价键的化学反应。直接获取值包括执行包括样品或其他物质的物理变化的过程,例如执行包括物质(例如样品、分析物或试剂)的物理变化的分析过程(有时在本文中称为“物理分析”),执行一种分析方法,例如包括以下项中的一项或多项的方法:从另一物质中分离或纯化物质,例如分析物或其片段或其他衍生物;将分析物或其片段或其他衍生物与另一物质(例如缓冲液、溶剂或反应物)进行组合;或者例如通过断裂或形成在分析物的第一与第二原子之间的共价键或非共价键来改变分析物或其片段或其他衍生物的结构;或者例如通过断裂或形成在试剂的第一与第二原子之间的共价键或非共价键来改变试剂或其片段或其他衍生物的结构。
“间接获取”是指从另一方或来源(例如,直接获取物理实体或值的第三方实验室)接收物理实体或值。例如,第一方可以从第二方获取(间接获取)所述第二方直接获取或通过计算获取的值。
“通过计算获取”是指通过计算(calculation或computation,例如如在机器(例如计算机)上进行的)获取值。
如本文所用的“结构域”是用于描述蛋白质或核酸的区段。除非另外指明,结构域不需要具有任何特定功能特性。
如下进行两个序列之间的同源性或序列一致性(这些术语在本文可互换地使用)的计算。将这些序列进行比对用于最优比较的目的(例如,用于最优比对,可以在第一和第二氨基酸或核酸序列中的一个或两个中引入空位,并且出于比较的目的,可以不考虑非同源序列)。使用具有Blossum 62打分矩阵(其中空位罚分为12,空位延伸罚分为4,并且移码空位罚分为5)的GCG软件包中的GAP程序,将最优比对确定为最佳评分。然后比较相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置被与在第二序列中的相应位置相同的氨基酸残基或核苷酸占据时,则所述分子在那个位置是相同的。两个序列之间的百分比一致性是由所述序列共享的相同位置的数目的函数。
如本文所用的“多肽”是指具有少于100个氨基酸残基的氨基酸的聚合物。在某些实施例中,它具有少于50、20、或10个氨基酸残基。
如本文所用的“参考分子”是指经修饰或候选分子与其作比较的分子。例如,参考Cas9分子是指经修饰或候选Cas9分子与其作比较的Cas9分子。同样地,参考gRNA是指经修饰或候选gRNA分子与其作比较的gRNA分子。另外地,参考Cas9分子/gRNA分子复合物是指Cas9分子/gRNA分子复合物与其作比较的Cas9分子/gRNA分子复合物。经修饰或候选分子可以基于序列(例如,经修饰或候选分子可以与参考分子具有X%序列一致性或同源性)、热稳定性或活性(例如,经修饰或候选分子可以具有参考分子的X%的活性)与参考分子进行比较。例如,在参考分子是Cas9分子的情况下,经修饰或候选分子可以表征为具有不多于参考Cas9分子的核酸酶活性的10%。参考Cas9分子的实例包括天然存在的未经修饰的Cas9分子,例如来自化脓链球菌、金黄色葡萄球菌、嗜热链球菌或脑膜炎奈瑟氏菌的天然存在的Cas9分子。在某些实施例中,参考Cas9分子是具有和与其进行比较的经修饰或候选Cas9分子最接近序列一致性或同源性的天然存在的Cas9分子。在某些实施例中,参考Cas9分子是具有天然存在或已知的序列的亲本分子,其上已经进行突变以得到经修饰或候选Cas9分子。
如本文所用的“参考值”是指作为预选数值的参考值。预选数值可以是单个数字或范围。在某些实施例中,参考值可以包括与参考分子的值相关的值。在某些实施例中,参考值可以是热稳定性参考值。在某些实施例中,热稳定性参考值是热稳定性的预选数值。在某些实施例中,热稳定性参考值可以包括与参考分子的热稳定性值相关的值。在某些实施例中,热稳定性参考值可以包括与热稳定性相关的参数。在某些实施例中,热稳定性参考值可以是变性温度参考值或熔融温度(Tm)参考值。在某些实施例中,变性温度参考值是变性的预选数值。在某些实施例中,变性温度参考值可以包括与参考分子的变性温度值相关的值。在某些实施例中,变性温度参考值可以包括与变性相关的参数。在某些实施例中,Tm参考值可以是Tm的预选数值。在某些实施例中,Tm参考值可以是预定阈值Tm。在某些实施例中,Tm参考值可以包括与参考分子的Tm值相关的值。在某些实施例中,Tm参考值可以包括与Tm相关的参数。在某些实施例中,参考值可以是活性参考值。在某些实施例中,活性参考值可以包括与参考分子的活性值相关的值。在某些实施例中,活性参考值可以包括与活性相关的参数。在某些实施例中,活性参考值可以是切割参考值或结合参考值。在某些实施例中,切割参考值可以是核酸的切割的预选数值。在某些实施例中,结合参考值可以是两个或更多个分子的结合的预选数值。在某些实施例中,参考值可以是Δ参考值。在某些实施例中,Δ参考值可以是Δ值的预选数值。
如本文所用的“Δ值”是表示两个值之间的差异或偏移的值。例如,在某些实施例中,Δ值可以是表示被评价的Cas9分子/gRNA分子复合物的热稳定性值与参考分子的热稳定性值或热稳定性参考值之间的差异的值。在某些实施例中,Δ值可以是表示被评价的Cas9分子/gRNA分子复合物的活性值与参考分子的活性值或活性参考值之间的差异的值。
如本文关于分子的修饰所用的“替换”或“替换的”不需要方法限制,但仅表明替换实体是存在的。
如本文所用的“受试者”可以意指人或非人动物。所述术语包括但不限于,哺乳动物(例如,人类、其他灵长类动物、猪、啮齿动物(例如,小鼠和大鼠或仓鼠)、兔、豚鼠、奶牛、马、猫、狗、绵羊、以及山羊)。在某些实施例中,所述受试者是人。在另一实施例中,所述受试者是家禽。在某些实施例中,所述受试者是人,并且在这些实施例的某些中,所述人是婴儿、儿童、青少年或成年人。
如本文所用的在氨基酸序列的语境下的“X”是指任何氨基酸(例如,二十种天然氨基酸中的任何一种),除非另外说明。
如本文所用的“约”意指在所述值或值范围的10%内。
如本文所用的“Cas9分子”或“Cas9多肽”分别是指可以与gRNA分子相互作用,并且与gRNA分子一起定位至包含靶结构域(并且在某些实施例中,是PAM序列)的位点的分子或多肽。Cas9分子和Cas9多肽包括天然存在的Cas9分子和Cas9多肽,以及工程化的、改变的或经修饰的Cas9分子或Cas9多肽,它们与参考序列(例如最相似的天然存在的Cas9分子)相差例如至少一个氨基酸残基。
概述
诸位发明人已经发现,如通过DSF测定的Cas9分子/gRNA分子复合物的稳定性与Cas9分子/gRNA分子复合物的多种特性相关。照此,可以使用稳定性的测定来评价Cas9分子/gRNA分子复合物(或其组分)的多种特性,例如切割靶的能力、由Cas9分子/gRNA分子复合物介导的切割事件通过特定途径(例如HDR或NHEJ)解决的倾向、调节靶的能力或预选递送方法的适用性。稳定性的测定还可以用于评价Cas9分子、gRNA分子、制备复合物的方法(例如,组分的比例或化学计量)、或另外的组分的添加(并且通常包含在Cas9分子/gRNA分子复合物中)例如对Cas9分子/gRNA分子复合物的功效或稳健性。
基于披露的实验结果,本文提供了包括测量Cas9分子/gRNA分子复合物的热稳定性的方法。蛋白质的热稳定性可以在有利条件下增加,例如添加结合型RNA分子,例如gRNA。因此,关于Cas9/gRNA复合物的热稳定性的信息对于确定所述复合物是否稳定是有用的。可以包括测量Cas9分子/gRNA分子复合物的热稳定性的步骤的方法包括但不限于,测定Cas9分子/gRNA分子复合物的稳定性的方法,测定促进稳定的Cas9分子/gRNA分子复合物的条件的方法,筛选稳定的Cas9分子/gRNA分子复合物的方法,鉴定最佳gRNA以形成稳定的Cas9分子/gRNA分子复合物的方法,筛选用于给予受试者的Cas9/gRNA复合物的方法,以及选择用于给予受试者的Cas9/gRNA复合物的方法。在某些实施例中,可以测量Cas9分子/gRNA分子复合物的热稳定性值。另外地,在某些实施例中,还可以测量参考分子的热稳定性值。在某些实施例中,如果Cas9分子/gRNA分子复合物的热稳定性值大于参考分子的热稳定性值或如本文所述的热稳定性参考值,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的Cas9分子。在某些实施例中,所测量的热稳定性值可以是变性温度值。在这些实施例中,热稳定性参考值是变性温度参考值。在某些实施例中,所测量的热稳定性值可以是Tm值。在这些实施例中,热稳定性参考值可以是Tm参考值。在某些实施例中,热稳定性值可以使用热移位测定来测量。如本文所披露的,DSF是一种可以用于测量蛋白质的热稳定性的技术。在某些实施例中,用于测量热稳定性的热移位测定可以是DSF、差示扫描量热法(DSC)或等温滴定量热法(ITC)。在某些实施例中,如果Cas9分子/gRNA分子复合物的热稳定性值大于参考分子的热稳定性值或热稳定性参考值,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。例如,在某些实施例中,如果Cas9分子/gRNA分子复合物的热稳定性值比参考分子的热稳定性值或热稳定性参考值大至少8℃,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的参考Cas9分子。在某些实施例中,包括测量热稳定性值的步骤的方法可以进一步包括以下步骤,所述步骤包括测量Cas9分子/gRNA分子复合物的如本文所述的活性值。
基于披露的实验结果,本文还提供了包括测量Cas9分子/gRNA分子复合物的活性的步骤的方法,所述方法还可以用于测定所述复合物的稳定性。可以包括测量Cas9分子/gRNA分子复合物的活性的步骤的方法包括但不限于,测定Cas9分子/gRNA分子复合物的稳定性的方法,测定促进稳定的Cas9分子/gRNA分子复合物的条件的方法,筛选稳定的Cas9分子/gRNA分子复合物的方法,鉴定最佳gRNA以形成稳定的Cas9分子/gRNA分子复合物的方法,筛选用于给予受试者的Cas9分子/gRNA分子复合物的方法,以及选择用于给予受试者的Cas9分子/gRNA分子复合物的方法。在某些实施例中,可以检测Cas9分子/gRNA分子复合物的活性值。另外地,在某些实施例中,可以检测参考分子的活性值。在某些实施例中,如果Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值或活性参考值,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,被检测的活性可以是结合活性。在某些实施例中,结合活性可以包括但不限于,gRNA分子与DNA靶保持杂交的能力、gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力、或gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力。在某些实施例中,可以测量分子的结合值。在某些实施例中,如果被评价的分子的结合值大于参考分子的结合值或结合参考值,则可以选择或确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,活性是切割活性。切割活性的一些实例可以包括但不限于以下项中的任何一项或多项:Cas9分子/gRNA分子复合物切割靶的能力、由Cas9分子/gRNA分子复合物介导的切割事件通过特定途径(例如HDR或NHEJ)解决的倾向、Cas9分子/gRNA分子复合物调节靶的能力。在某些实施例中,可以测量Cas9分子/gRNA分子复合物的切割值。在某些实施例中,如果Cas9分子/gRNA分子复合物的切割值大于参考分子的切割值或切割参考值,则可以选择或确定所述Cas9分子/gRNA分子复合物是稳定的。
可以在多个样品上进行本文所披露的方法。例如,在某些实施例中,所述方法可以包括产生多个样品,每个样品包含通过将Cas9分子和多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物。在某些实施例中,可以在多个样品中的每个中检测Cas9分子/gRNA分子复合物的热稳定性值和/或活性值。在某些实施例中,可以从多个样品中选择至少一个包含Cas9分子/gRNA分子复合物的样品。在某些实施例中,可以基于以下项中的一项或多项来选择包含Cas9分子/gRNA分子复合物的样品:(i)多个样品中的Tm与参考复合物的Tm或预定阈值Tm的比较,或(ii)多个样品的Tm值的相对排序。
在某些实施例中,所述方法可以包括产生多个Cas9分子/gRNA分子复合物,每个包含通过将Cas9分子和多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物。在某些实施例中,可以针对多个Cas9分子/gRNA分子复合物中的每个检测Cas9分子/gRNA分子复合物的热稳定性值。在某些实施例中,如果Cas9分子/gRNA分子复合物的热稳定性值大于参考分子的热稳定性值或热稳定性参考值,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。在某些实施例中,可以针对多个Cas9分子/gRNA分子复合物中的每个检测Cas9分子/gRNA分子复合物的活性值。在某些实施例中,如果Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值或活性参考值,则可以确定所述Cas9分子/gRNA分子复合物是稳定的。
本文还提供了使用本文所披露的任何方法产生的非天然存在的Cas9分子/gRNA分子复合物。
本文提供了可以包含使用本文所述的方法产生的任何Cas9分子/gRNA分子复合物的组合物。例如,本文的组合物可以包含Cas9分子和gRNA分子的经分离的复合物,所述经分离的复合物具有比参考分子的Tm或根据本文提供的方法而选择的Tm参考值大至少8℃的Tm
本文还提供了包含编码使用本文所述的任何方法产生的Cas9分子/gRNA分子复合物的核酸的载体系统。
本文提供了将Cas9分子/gRNA分子复合物递送至靶细胞的方法,其包括递送使用本文所述的任何方法产生的Cas9分子/gRNA分子复合物。
基于所披露的实验结果,本文提供了用于评价、选择、优化或设计Cas9分子/gRNA分子复合物或其组分的方法。在某些实施例中,这些方法包括获取或测定Cas9分子/gRNA分子复合物或其制剂中的Cas9分子的稳定性值(即与稳定性相关的值(例如热稳定性值或活性值))。在某些实施例中,稳定性值可以是Cas9分子/gRNA分子复合物或其制剂中的Cas9分子的热稳定性值或活性值。在某些实施例中,热稳定性值可以是Tm值或变性温度值,并且在某些实施例中,使用DSF获取或测定热稳定性值。在某些实施例中,获取与gRNA分子复合的Cas9分子的稳定性值。在其他实施例中,在存在gRNA分子的情况下获取Cas9分子的稳定性值。在某些实施例中,将稳定性值与热稳定性参考值(即与热稳定性相关的参数,例如Tm参考值)或活性参考值(即与活性相关的参数,如切割活性,例如切割靶DNA的活性)进行比较。例如,在稳定性值是Tm值时,可以将Tm值与Tm参考值进行比较以确定Tm值是等于、大于还是小于Tm参考值。
在某些实施例中,本文所披露的方法用于选择或设计最佳Cas9分子/gRNA配对,例如具有最大稳定性或具有落在期望目标范围内的稳定性的配对。在某些实施例中,所述方法用于选择或设计用于与特定Cas9分子配对的一种或多种gRNA,例如鉴定与具有最大稳定性的特定Cas9分子复合的gRNA分子。在其他实施例中,所述方法用于选择与特定gRNA或gRNA组配对的Cas9分子,例如鉴定与具有最大稳定性的一种或多种特定gRNA复合的Cas9分子。在仍其他实施例中,所述方法用于选择用以在Cas9分子/gRNA分子复合物中配对的Cas9分子和gRNA或gRNA组两者。
在某些实施例中,本文提供了Cas9分子/gRNA复合物或其组分以及包含这些复合物或其组分的组合物和药物配制品,所述Cas9分子/gRNA复合物或其组分表现出与复合物中的Cas9分子的稳定性相关的期望值。在某些实施例中,该值可以是Tm或变性温度,并且在某些实施例中,使用DSF获取或测定所述值。在这些实施例的某些中,使用本文提供的方法产生所述复合物。
在某些实施例中,本文提供了包括比较热稳定性值的方法。在某些实施例中,所述方法包括将热稳定性值与热稳定性参考值进行比较。在某些实施例中,热稳定性参考值包括预选数值(其中值可以是单个数或范围),例如热稳定性的预选数值,例如Tm值。在某些实施例中,热稳定性参考值可以是与以下项的热稳定性相关的值:a)不存在gRNA分子情况下的参考Cas9分子,例如与被评价的复合物中的Cas9分子相同的Cas9分子(或不同的Cas9分子);b)与第二gRNA分子(即不同于被评价的复合物中的gRNA的gRNA)复合的参考Cas9分子(例如与被评价的复合物中的Cas9分子相同的Cas9分子);或c)参考Cas9分子/gRNA分子复合物,其中所述参考Cas9分子/gRNA分子在与Cas9分子/gRNA分子复合物不同的条件下形成,例如用与其不同比例的Cas9分子和gRNA分子,或者是在不同缓冲液中形成。
在某些实施例中,本文提供了参考Cas9分子。在某些实施例中,参考Cas9分子可以与被评价的复合物中的Cas9分子相同。在某些实施例中,参考Cas9分子可以不同于被评价的复合物的Cas9分子,例如在一级序列上不同。在某些实施例中,参考Cas9分子/gRNA分子复合物的gRNA分子可以与被评价的复合物的gRNA分子相同。在某些实施例中,参考Cas9分子/gRNA分子复合物的gRNA分子可以不同于所述gRNA分子,例如,在序列上不同或因修饰而不同。
在某些实施例中,可以获取(例如测定)本文提供的Δ值(例如,Δ值是两个值之间的差异或偏移)。在某些实施例中,Δ值可以包括与被评价的Cas9分子/gRNA分子复合物的稳定性差异相关的值和参考值。在某些实施例中,Δ值可以包括与以下项相关的值:被评价的Cas9分子/gRNA分子复合物的稳定性差异,例如变性温度或Tm;和稳定性,例如参考值(例如参考Cas9分子/gRNA分子复合物的值)的变性温度或Tm
在某些实施例中,本文提供的方法可以包括将Δ值与Δ参考值(例如,Δ值的参考值)进行比较的步骤。在某些实施例中,这可以包括评价Δ值是等于还是小于Δ参考值;等于还是大于Δ参考值;或者是否在Δ参考值的预定范围内。
在某些实施例中,本文提供的方法可以包括选择所述Cas9分子/gRNA分子复合物(或其组分)。在某些实施例中,所述方法可以包括基于Cas9分子/gRNA分子复合物的值(例如,包括但不限于,热稳定性值(例如,Tm值)、活性值或Δ值)与参考值的比较来选择Cas9分子/gRNA分子复合物(或其组分)。在某些实施例中,参考值可以包括但不限于,预定阈值、上限值、目标值。在某些实施例中,所述值可以是Δ值。在某些实施例中,参考值可以是Δ参考值。
在某些实施例中,所述方法可以包括评价Δ值是:等于还是小于Δ参考值;等于还是大于Δ参考值;是否在Δ参考值的预定范围内。
在某些实施例中,所述方法还可以包括评价或测量所选择的Cas9分子/gRNA分子复合物(或其组分)的活性或特性。在某些实施例中,活性可以是切割活性,例如切割的能力。在某些实施例中,活性可以是成功递送的能力。在某些实施例中,活性可以是结合活性,例如,gRNA分子保持与DNA靶杂交的能力。
在某些实施例中,评价步骤可以包括评价或测量系统(如体外系统、离体系统或体内系统)和测定(如细胞测定)或模型(如细胞或动物模型)中所选择的Cas9分子/gRNA分子复合物(或其组分)的活性。
在某些实施例中,评价步骤可以包括评价或测量所选择的Cas9分子/gRNA分子复合物(或其组分)的活性。在某些实施例中,活性可以是切割活性,如诱导indel的能力,修饰靶DNA的能力,预选修复方法(例如本文所述的途径,例如HDR或NHEJ)介导由Cas9分子/gRNA分子复合物催化的切割事件的倾向。在某些实施例中,活性可以是结合活性,如gRNA分子保持与DNA靶杂交的能力。
在某些实施例中,所述方法可以包括针对活性选择Cas9分子/gRNA分子复合物(或其组分)。例如,活性可以是切割活性,如诱导indel的能力;修饰靶DNA的能力;预选修复方法(例如本文所述的途径,例如HDR或NHEJ)介导由Cas9分子/gRNA分子复合物催化的切割事件的倾向。在某些实施例中,活性可以是结合活性,如gRNA分子保持与DNA靶杂交的能力。
在某些实施例中,所述方法可以包括针对活性设计或优化Cas9分子/gRNA分子复合物(或其组分)。例如,活性可以是切割活性,如诱导indel的能力;修饰靶DNA的能力;预选修复方法(例如本文所述的途径,例如HDR或NHEJ)介导由Cas9分子/gRNA分子复合物催化的切割事件的倾向。在某些实施例中,活性可以是结合活性,如gRNA分子保持与DNA靶杂交的能力。
在某些实施例中,所述方法可以包括测定至少X个Cas9分子/gRNA分子复合物的Cas9分子的稳定性。在某些实施例中,X可以等于2、3、4、5、10、20、30、40、50、100、500或1,000。在某些实施例中,测定稳定性可以包括测量Cas9分子的稳定性值。在某些实施例中,稳定性值可以是热稳定性值。在某些实施例中,热稳定性值可以是Tm值。在某些实施例中,可以通过DSF测定Tm值。
在某些实施例中,测定稳定性可以包括测定Cas9分子/gRNA分子复合物的Cas9分子变性的温度,例如测定Tm值。在某些实施例中,可以通过DSF测定Tm值。
在某些实施例中,所述方法可以包括通过DSF测定Cas9分子/gRNA分子复合物的Cas9分子变性的温度,例如测定第一Cas9分子/gRNA分子复合物和第二Cas9分子/gRNA分子复合物的Tm值。
在某些实施例中,至少X个Cas9分子/gRNA分子复合物中的第一Cas9分子/gRNA分子复合物和第二Cas9分子/gRNA分子复合物的不同之处在于具有不同序列的Cas9分子,具有序列上或因修饰、因加帽或加尾而不同的gRNA分子,已经在不同的条件(例如不同的化学计量)下形成。
在某些实施例中,响应于稳定性的测定,可以针对优化或预选的递送特征来选择Cas9分子/gRNA分子复合物(或其组分),例如,其中递送包括通过RNP阳离子脂质转染、病毒载体(例如AAV)或RNA转染的递送。
在某些实施例中,响应于稳定性的测定,针对与质量控制标准的优化或预选的关系来选择Cas9分子/gRNA分子复合物(或其组分)。
在某些实施例中,响应于稳定性的测定,Cas9分子/gRNA分子复合物(或其组分)可以被选择为满足质量控制或释放标准。
在某些实施例中,本文的方法可以包括如果热稳定性值(例如,Tm值或变性温度值)或Δ值与参考值或Δ参考值具有预选的关系,则选择Cas9分子/gRNA分子复合物(或其组分)。
在某些实施例中,响应于稳定性的测定,针对优化或预选的特征(例如切割特征)来选择Cas9分子/gRNA分子复合物(或其组分)。
在某些实施例中,响应于Cas9分子/gRNA分子复合物的热稳定性值与参考分子(例如在不存在gRNA分子下的Cas9分子)的热稳定性值之间的Δ值的评价,选择Cas9分子/gRNA分子复合物(或其组分)。
在某些实施例中,响应于Cas9分子/gRNA分子复合物的活性值与参考分子(例如在不存在gRNA分子下的Cas9分子)的活性值之间的Δ值的评价,选择Cas9分子/gRNA分子复合物(或其组分)。
在某些实施例中,本文的方法可以包括评价与Cas9分子复合的候选gRNA分子的文库(或单个候选gRNA分子),例如tracrRNA分子或序列的文库,并且响应于Cas9分子/候选gRNA分子复合物的稳定性的测定,选择候选gRNA分子或序列,例如候选tracr gRNA分子或序列。
在某些实施例中,文库可以包含不同结构的tracrRNA分子或序列,例如不同长度、不同序列或具有不同的修饰,例如具有另外的磷酸酯基团或替代的5'帽结构。
在某些实施例中,可以将tracrRNA分子或序列布置在嵌合gRNA上。
在某些实施例中,本文的方法可以包括评价包含在Cas9分子/gRNA分子制剂中的组分,包括评价包含所述组分的制剂中的Cas9分子/gRNA分子复合物的Cas9分子的稳定性。在某些实施例中,所述组分可以包括添加剂、小分子、稳定剂、缓冲液、pH、盐浓度、甘油浓度或其他缓冲组分。
在某些实施例中,本文的方法可以包括评价包含在Cas9分子/gRNA分子复合物中的候选Cas9分子,包括评价Cas9分子/gRNA分子复合物的Cas9分子的稳定性。在某些实施例中,候选Cas9分子可以包括嵌合Cas9分子、或合成或工程化的Cas9分子,例如一部分或多部分缺失的Cas9分子。
在某些实施例中,测定稳定性可以包括通过差示扫描荧光测定法(DSF)测定Cas9分子/gRNA分子复合物的Cas9分子变性的温度,例如Cas9分子的Tm
本文提供了反应混合物。所述反应混合物可以包含Cas9分子/gRNA分子复合物,例如本文所述的Cas9分子/gRNA分子复合物;和信号发射化合物,例如染料,其中信号发射与Cas9分子的变性相关。
本文提供了已经在其中布置了以下项的差示扫描荧光计:Cas9分子/gRNA分子复合物;和信号发射化合物,例如染料,其中信号发射与Cas9分子的变性相关。
本文提供了通过本文所述的方法评价、选择、优化或设计的Cas9分子/gRNA分子复合物。
本文提供了包含通过本文所述的方法选择或设计的Cas9分子/gRNA分子复合物的组合物。在某些实施例中,所述组合物可以是药物组合物。在某些实施例中,可以将Cas9分子/gRNA分子复合物配制在药学上可接受的载体中。
如本文所讨论的,本文所披露的方法可以用于评价、选择或设计针对配制或递送优化的复合物。例如,本文所述的方法能以多种方式,使用任何递送方法(例如但不限于RNP阳离子脂质转染、病毒载体(例如AAV)或RNA转染),用于改善嵌合gRNA或tracrRNA与Cas9分子(例如,Cas9蛋白)的复合物形成。
本文所讨论的方法可以用于质量控制,或用于确定蛋白质和RNA组分是否都满足释放标准。例如,如果不满足热移位的标准,例如在将Cas9蛋白与RNA一起孵育时不存在热移位的情况下,则指示不良质量的Cas9分子或gRNA分子。在一个实施例中,所述方法被用作指导或用作过程控制来解决这样的问题,例如通过检测和去除杂质。
本文所述的方法可以用于评估用以在Cas9/gRNA复合物中使用的候选Cas9分子或候选gRNA分子的文库。在一个实施例中,所述方法鉴定用于优化结合的组分。这可以允许筛选候选物以优化靶切割或其他特性。本文所述的方法还可以用于评价gRNA的长度和组分的改变。例如,纯化突变型Cas9蛋白后,能以预选的比例,例如以RNA:蛋白质的最小1:1比例将gRNA分子(例如,tracrRNA分子)或序列的文库与蛋白质一起孵育。与不存在gRNA分子情况下的Cas9蛋白质相比时观察到的热移位的出现指示有效的gRNA分子,例如能够体外、离体、或体内介导一种或多种CRISPR/Cas相关活性的gRNA分子。
本文所述的方法可用于筛选具有不同长度的tracr区域连同融合有不同接头序列并使用DSF测定了结合的同源指导序列的gRNA分子(例如,tracrRNA分子)或序列的文库。可以针对体外切割活性筛选良好结合的复合物。本文所述的方法允许针对对切割、递送的适用性或本文所讨论的其他特征的影响来评价RNA、另外的磷酸酯基团或替代的5'帽结构的化学修饰。
本文所述的方法可以用于筛选组分(如添加剂、小分子稳定剂、缓冲液、盐(例如盐摩尔浓度)、甘油浓度以及用于稳定Cas9分子和gRNA分子的相互作用的其他缓冲组分)的文库。
本文所述的方法可以用于筛选嵌合、工程化或合成的Cas9分子(例如用于稳定Cas9分子和gRNA分子相互作用的嵌合或工程化的Cas9分子)的文库。热移位不足指示RNA结合是次优的或中断的。部分热移位将暗示RNA正有成果地结合。对于没有DSF Tm的嵌合或工程化的Cas9分子,可以针对如通过DSF测量的恢复结合来筛选gRNA分子(例如,tracrRNA分子)或序列的文库。
视为无活性的Cas9分子可以用于针对核酸分子文库(例如随机化的核酸文库)的热稳定性测定。这将允许筛选可以发挥tracrRNA作用的新型分子。使用这种新发现的核酸分子(例如,tracrRNA分子)可以开发新的gRNA以靶向基因组DNA、体内RNA和/或来自侵入性生物体和病毒的遗传物质。
本文所述的方法可以应用于任何突变和嵌合形式的Cas9分子。还应当理解,本文所述的方法可以应用于其他Cas分子,例如本文所述的其他Cas分子。
指导RNA(gRNA)分子
如该术语在本文使用的,gRNA分子是指促进gRNA分子/Cas9分子复合物向靶核酸特异性靶向或归巢的核酸。gRNA分子可以是单分子的(具有单RNA分子)(在本文有时称为“嵌合”gRNA)、或模块化的(包含多于一种并且典型地两种分开的RNA分子)。本文提供的gRNA分子包含靶向结构域,所述靶向结构域包含与靶核酸序列完全或部分互补的核酸序列,由其组成或基本上由其组成。在某些实施例中,所述gRNA分子进一步包含一个或多个另外的结构域,包括例如第一互补结构域、连接结构域、第二互补结构域、近端结构域、尾部结构域和/或5'延伸结构域。下面详细讨论了这些结构域中的每一者。在某些实施例中,gRNA分子中的一个或多个结构域包含与例如来自化脓链球菌、金黄色葡萄球菌或嗜热链球菌的天然存在的序列相同或与其共享序列同源性的氨基酸序列。
图1A-1I中提供了若干示例性gRNA结构。关于gRNA的三维形式、或活化形式的链内或链间相互作用,高度互补的区域在图1A-1I和本文提供的其他描绘中有时显示为双链体。图7说明了使用SEQ ID NO:42的gRNA序列的gRNA结构域命名法,所述gRNA序列在tracrRNA衍生区域中含有一个发夹环。在某些实施例中,gRNA可以在该区域中含有多于一个(例如,两个、三个或更多个)发夹环(参见例如,图1H-1I)。
在某些实施例中,单分子的或嵌合的gRNA包含,优选地从5'到3':
靶向结构域,所述靶向结构域包含与靶核酸序列完全或部分互补的核酸序列或由其组成或基本上由其组成;
第一互补结构域;
连接结构域;
第二互补结构域(其与所述第一互补结构域互补);
近端结构域;以及
任选地,尾部结构域。
在某些实施例中,模块化gRNA包含:
第一链,其包含,优选地从5'到3':
靶向结构域,所述靶向结构域包含与靶核酸序列完全或部分互补的核酸序列或由其组成或基本上由其组成;和
第一互补结构域;以及
第二链,其包含,优选地从5'到3':
任选地,5'延伸结构域;
第二互补结构域;
近端结构域;和
任选地,尾部结构域。
靶向结构域
靶向结构域(有时可替代地称为指导序列或互补区)包含与靶核酸互补或部分互补的核酸序列,由其组成或基本上由其组成。全部或部分靶向结构域与其互补或部分互补的核酸序列在本文中称为靶结构域。用于选择靶向结构域的方法本领域是已知的(参见例如,Fu 2014;Sternberg 2014)。
包含靶结构域的靶核酸的链在本文中称为互补链,因为其与靶向结构域序列互补。由于靶向结构域是gRNA分子的一部分,所以它包含碱基尿嘧啶(U)而非胸腺嘧啶(T);相反,编码gRNA分子的任何DNA分子将包含胸腺嘧啶而非尿嘧啶。在靶向结构域/靶结构域对中,靶向结构域中的尿嘧啶碱基将与靶结构域中的腺嘌呤碱基配对。在某些实施例中,靶向结构域与靶结构域之间的互补程度足以允许gRNA分子/Cas9分子复合物靶向靶核酸。
在某些实施例中,靶向结构域包括核心结构域和任选的第二结构域。在这些实施例的某些中,核心结构域位于第二结构域的3'处,并且在这些实施例的某些中,核心结构域位于靶向结构域的3'端或其附近。在这些实施例的某些中,核心结构域由靶向结构域的3'端处的约8至约13个核苷酸组成或基本上由其组成。在某些实施例中,只有核心结构域与靶结构域的相应部分互补或部分互补,并且在这些实施例的某些中,核心结构域与靶结构域的相应部分完全互补。在其他实施例中,第二结构域也与靶结构域的一部分互补或部分互补。在某些实施例中,核心结构域与靶结构域中的核心结构域靶互补或部分互补,而第二结构域与靶结构域中的第二结构域靶互补或部分互补。在某些实施例中,核心结构域和第二结构域与靶结构的它们各自对应的部分域具有相同的互补程度。在其他实施例中,核心结构域与其靶之间的互补程度和第二结构域与其靶之间的互补程度可以不同。在这些实施例的某些中,核心结构域可以对其靶具有比第二结构域更高的互补程度,而在其他实施例中,第二结构域可以具有比核心结构域更高的互补程度。
在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为3至100、5至100、10至100或20至100个核苷酸,并且在这些实施例的某些中,靶向结构域或核心结构域的长度为3至15、3至20、5至20、10至20、15至20、5至50、10至50或20至50个核苷酸。在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在某些实施例中,靶向结构域和/或靶向结构域内的核心结构域的长度为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、10+/-4、10+/-5、11+/-2、12+/-2、13+/-2、14+/-2、15+/-2、或16+-2、20+/-5、30+/-5、40+/-5、50+/-5、60+/-5、70+/-5、80+/-5、90+/-5、或100+/-5个核苷酸。
在靶向结构域包括核心结构域的某些实施例中,核心结构域的长度为3至20个核苷酸,并且在这些实施例的某些中,核心结构域的长度为5至15或8至13个核苷酸。在靶向结构域包括第二结构域的某些实施例中,第二结构域的长度为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸。在靶向结构域包含长度为8至13个核苷酸的核心结构域的某些实施例中,各自地,靶向结构域的长度为26、25、24、23、22、21、20、19、18、17、或16个核苷酸,并且第二结构域的长度为13至18、12至17、11至16、10至15、9至14、8至13、7至12、6至11、5至10、4至9、或3至8个核苷酸。
在某些实施例中,靶向结构域与靶结构域完全互补。同样地,在靶向结构域包含核心结构域和/或第二结构域的情况下,在某些实施例中,核心结构域和第二结构域中的一个或两个与靶结构域的相应部分完全互补。在其他实施例中,靶向结构域与靶结构域部分互补,并且在靶向结构域包含核心结构域和/或第二结构域的这些实施例的某些中,核心结构域和第二结构域中的一个或两个与靶结构域的相应部分部分互补。在这些实施例的某些中,靶向结构域或靶向结构域内的核心结构域或第二结构域的核酸序列与靶结构域或靶结构域的相应部分至少80%、85%、90%或95%互补。在某些实施例中,靶向结构域和/或靶向结构域内的核心或第二结构域包括与靶结构域或其部分不互补的一个或多个核苷酸,并且在这些实施例的某些中,靶向结构域和/或靶向结构域内的核心或第二结构域包括与靶结构域不互补的1、2、3、4、5、6、7或8个核苷酸。在某些实施例中,核心结构域包括与靶结构域的相应部分不互补的1、2、3、4或5个核苷酸。在靶向结构域包括与靶结构域不互补的一个或多个核苷酸的某些实施例中,所述非互补核苷酸中的一个或多个位于靶向结构域的5'或3'端的五个核苷酸内。在这些实施例的某些中,靶向结构域包括在其5'端、3'端或其5'和3'端的五个核苷酸内的与靶结构域不互补的1、2、3、4或5个核苷酸。在靶向结构域包括与靶结构域不互补的两个或更多个核苷酸的某些实施例中,所述非互补核苷酸中的两个或更多个彼此相邻,并且在这些实施例的某些中,所述两个或更多个连续的非互补核苷酸位于靶向结构域的5'或3'端的五个核苷酸内。在其他实施例中,所述两个或更多个连续的非互补核苷酸都位于离靶向结构域的5'和3'端超过五个核苷酸处。
在某些实施例中,靶向结构域、核心结构域和/或第二结构域不包含任何修饰。在其他实施例中,靶向结构域、核心结构域和/或第二结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,靶向结构域、核心结构域和/或第二结构域的一个或多个核苷酸可以包含2'修饰(例如,在核糖上2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰靶向结构域的骨架。在某些实施例中,对靶向结构域、核心结构域和/或第二结构域的一个或多个核苷酸的修饰使得靶向结构域和/或包含靶向结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,靶向结构域和/或核心或第二结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,靶向结构域和/或核心或第二结构域包括它们各自5'端的五个核苷酸内的1、2、3或4个修饰,和/或它们各自3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,靶向结构域和/或核心或第二结构域包括在两个或更多个连续核苷酸处的修饰。
在靶向结构域包括核心和第二结构域的某些实施例中,核心和第二结构域含有相同数量的修饰。在这些实施例的某些中,这两个结构域都不含修饰。在其他实施例中,核心结构域包括比第二结构域更多的修饰,或反之亦然。
在某些实施例中,选择对靶向结构域(包括核心或第二结构域)中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过使用如下阐述的系统测试候选修饰来评价。具有候选靶向结构域的gRNA可以使用如下阐述的系统进行评价,所述候选靶向结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选靶向结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,全部的修饰核苷酸互补于并且能够杂交到靶结构域中存在的相应核苷酸上。在另一个实施例中,1、2、3、4、5、6、7或8个或更多个修饰核苷酸不互补于或不能够杂交到靶结构域中存在的相应核苷酸上。
图1A-1I提供了靶向结构域在gRNA分子内的放置的实例。
第一和第二互补结构域
第一和第二互补(有时可替代地分别称为crRNA衍生的发夹序列和tracrRNA衍生的发夹序列)结构域互相完全或部分互补。在某些实施例中,互补程度足以使所述两个结构域在至少一些生理条件下形成双链体区域。在模块化gRNA分子中,所述两个分子借助所述互补结构域的杂交而相关联(参见例如,图1A)。在某些实施例中,第一与第二互补结构域之间的互补程度与gRNA的其他特性一起足以允许Cas9分子靶向靶核酸。第一和第二互补结构域的实例在图1A-1G中进行了阐述。
在某些实施例中(参见例如,图1A-1B),第一和/或第二互补结构域包括与相应互补结构域缺乏互补性的一个或多个核苷酸。在某些实施例中,第一和/或第二互补结构域包括不与相应互补结构域互补的1、2、3、4、5或6个核苷酸。例如,第二互补结构域可以含有与第一互补结构域中的相应核苷酸不配对的1、2、3、4、5或6个核苷酸。在某些实施例中,第一或第二互补结构域上不与相应互补结构域互补的核苷酸从在第一与第二互补结构域之间形成的双链体环出。在这些实施例的某些中,未配对环出位于第二互补结构域上,并且在这些实施例的某些中,未配对区域从离第二互补结构域的5'端1、2、3、4、5或6个核苷酸处开始。
在某些实施例中,第一互补结构域的长度为5至30、5至25、7至25、5至24、5至23、7至22、5至22、5至21、5至20、7至18、7至15、9至16、或10至14个核苷酸,并且在这些实施例的某些中,第一互补结构域的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或25个核苷酸。在某些实施例中,第二互补结构域的长度为5至27、7至27、7至25、5至24、5至23、5至22、5至21、7至20、5至20、7至18、7至17、9至16、或10至14个核苷酸,并且在这些实施例的某些中,第二互补结构域的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在某些实施例中,第一和第二互补结构域的长度各自独立地为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、11+/-2、12+/-2、13+/-2、14+/-2、15+/-2、16+/-2、17+/-2、18+/-2、19+/-2、或20+/-2、21+/-2、22+/-2、23+/-2、或24+/-2个核苷酸。在某些实施例中,第二互补结构域长于第一互补结构域(例如,长出2、3、4、5、或6个核苷酸)。
在某些实施例中,第一和/或第二互补结构域各自独立地包含三个亚结构域,其按5'到3'方向是:5'亚结构域、中央亚结构域、和3'亚结构域。在某些实施例中,第一互补结构域的5'亚结构域和3'亚结构域分别与第二互补结构域的3'亚结构域和5'亚结构域完全或部分互补。
在某些实施例中,第一互补结构域的5'亚结构域的长度为4至9个核苷酸,并且在这些实施例的某些中,5'结构域的长度为4、5、6、7、8或9个核苷酸。在某些实施例中,第二互补结构域的5'亚结构域的长度为3至25、4至22、4至18、或4至10个核苷酸,并且在这些实施例的某些中,5'结构域的长度为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或25个核苷酸。在某些实施例中,第一互补结构域的中央亚结构域的长度为1、2或3个核苷酸。在某些实施例中,第二互补结构域的中央亚结构域的长度为1、2、3、4或5个核苷酸。在某些实施例中,第一互补结构域的3'亚结构域的长度为3至25、4至22、4至18、或4至10个核苷酸,并且在这些实施例的某些中,3'亚结构域的长度为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在某些实施例中,第二互补结构域的3'亚结构域的长度为4至9个(例如4、5、6、7、8或9个)核苷酸。
第一和/或第二互补结构域可以与天然存在的或参考的第一和/或第二互补结构域共享同源性,或者从其衍生。在这些实施例的某些中,第一和/或第二互补结构域与天然存在的或参考的第一和/或第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性或与其相差不多于1、2、3、4、5或6个核苷酸。在这些实施例的某些中,第一和/或第二互补结构域可以与来自化脓链球菌或金黄色葡萄球菌的第一和/或第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性。
在某些实施例中,第一和/或第二互补结构域不包含任何修饰。在其他实施例中,第一和/或第二互补结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,第一和/或第二互补结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰靶向结构域的骨架。在某些实施例中,对第一和/或第二互补结构域的一个或多个核苷酸的修饰使得第一和/或第二互补结构域和/或包含第一和/或第二互补结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,第一和/或第二互补结构域各自独立地包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,第一和/或第二互补结构域各自独立地包括它们各自的5'端、3'端或它们的5'和3'端的五个核苷酸内的1、2、3或4个修饰。在其他实施例中,第一和/或第二互补结构域各自独立地在它们各自的5'端、3'端或它们的5'和3'端的五个核苷酸内不含修饰。在某些实施例中,第一和第二互补结构域中的一个或两个包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对第一和/或第二互补结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过在下面阐述的系统中测试候选修饰来评价。具有候选第一或第二互补结构域的gRNA可以使用如下阐述的系统进行评价,所述第一或第二互补结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选互补结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,由第一和第二互补结构域形成的双链体区域的长度为例如6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22bp,排除任何环出的或未配对的核苷酸。
在某些实施例中,当成双链体时,第一和第二互补结构域包含11个配对的核苷酸(参见例如,SEQ ID NO:48的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含15个配对的核苷酸(参见例如,SEQ ID NO:50的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含16个配对的核苷酸(参见例如,SEQ ID NO:51的gRNA)。在某些实施例中,当成双链体时,第一和第二互补结构域包含21个配对的核苷酸(参见例如,SEQID NO:29的gRNA)。
在某些实施例中,在第一与第二互补结构域之间交换一个或多个核苷酸以去除聚-U束。例如,可以交换SEQ ID NO:48的gRNA的核苷酸23和48或核苷酸26和45,以分别产生SEQ ID NO:49或31的gRNA。类似地,SEQ ID NO:29的gRNA的核苷酸23和39可以与核苷酸50和68交换以产生SEQ ID NO:30的gRNA。
连接结构域
连接结构域被布置在单分子gRNA或嵌合gRNA中的第一和第二互补结构域之间并用于连接第一和第二互补结构域。图1B-1E提供了连接结构域的实例。在某些实施例中,连接结构域的一部分来自crRNA衍生区域,并且另一部分来自tracrRNA衍生区域。
在某些实施例中,连接结构域共价连接第一和第二互补结构域。在这些实施例的某些中,连接结构域由共价键组成或包含共价键。在其他实施例中,连接结构域非共价连接第一和第二互补结构域。在某些实施例中,连接结构域的长度为十个或更少的核苷酸,例如1、2、3、4、5、6、7、8、9或10个核苷酸。在其他实施例中,连接结构域的长度为大于10个核苷酸,例如11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个或更多个核苷酸。在某些实施例中,连接结构域的长度为2至50、2至40、2至30、2至20、2至10、2至5、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至30、10至20、10至15、20至100、20至90、20至80、20至70、20至60、20至50、20至40、20至30或20至25个核苷酸。在某些实施例中,连接结构域的长度为10+/-5、20+/-5、20+/-10、30+/-5、30+/-10、40+/-5、40+/-10、50+/-5、50+/-10、60+/-5、60+/-10、70+/-5、70+/-10、80+/-5、80+/-10、90+/-5、90+/-10、100+/-5或100+/-10个核苷酸。
在某些实施例中,连接结构域与天然存在的序列(例如,对所述第二互补结构域是5'的tracrRNA的序列)共享同源性,或从其衍生。在某些实施例中,连接结构域与本文所披露的连接结构域(例如,图1B-1E的连接结构域)具有至少50%、60%、70%、80%、90%或95%的同源性或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,连接结构域不包含任何修饰。在其他实施例中,连接结构域或其中的一个或多个核苷酸具有修饰,包括但不限于以下阐述的修饰。在某些实施例中,连接结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰连接结构域的骨架。在某些实施例中,对连接结构域的一个或多个核苷酸的修饰使得连接结构域和/或包含连接结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,连接结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,连接结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,连接结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对连接结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过使用如下阐述的系统测试候选修饰来评价。具有候选连接结构域的gRNA可以在如下阐述的系统中进行评价,所述候选连接结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选连接结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,连接结构域包含典型地邻近于第一互补结构域的3'端和/或第二互补结构域的5'端或在其1、2或3个核苷酸内的双链体区域。在这些实施例的某些中,连接区域的双链体区域的长度为10+/-5、15+/-5、20+/-5、20+/-10或30+/-5bp。在某些实施例中,连接结构域的双链体区域的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14或15bp。在某些实施例中,形成连接结构域的双链体区域的序列是完全互补的。在其他实施例中,形成双链体区域的一个或两个序列含有与其他双链体序列不互补的一个或多个核苷酸(例如,1、2、3、4、5、6、7或8个核苷酸)。
5'延伸结构域
在某些实施例中,如本文所披露的模块化gRNA包含5'延伸结构域,即第二互补结构域的5'的一个或多个另外的核苷酸(参见例如,图1A)。在某些实施例中,5'延伸结构域的长度为2至10或更多、2至9、2至8、2至7、2至6、2至5或2至4个核苷酸,并且在这些实施例的某些中,5'延伸结构域的长度为2、3、4、5、6、7、8、9或10个或更多个核苷酸。
在某些实施例中,5'延伸结构域核苷酸不包含修饰,例如以下提供的类型的修饰。然而,在某些实施例中,5'延伸结构域包含一个或多个修饰,例如,使其较不易降解或更生物相容(例如,更低的免疫原性)的修饰。作为举例,5'延伸结构域的骨架可以用硫代磷酸酯、或如下阐述的其他一个或多个修饰来修饰。在某些实施例中,5'延伸结构域的核苷酸可以包含2'修饰(例如,在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化,或如下阐述的其他一个或多个修饰。
在某些实施例中,5'延伸结构域可以包含多达1、2、3、4、5、6、7或8个修饰。在某些实施例中,5'延伸结构域包含其5'端的5个核苷酸内的多达1、2、3或4个修饰,例如在模块化gRNA分子中。在某些实施例中,5'延伸结构域包含其3'端的5个核苷酸内的多达1、2、3或4个修饰,例如在模块化gRNA分子中。
在某些实施例中,5'延伸结构域包含在两个连续核苷酸处的修饰,例如5'延伸结构域的5'端的5个核苷酸内、5'延伸结构域的3'端的5个核苷酸内、或远离5'延伸结构域的一端或两端超过5个核苷酸的两个连续核苷酸。在某些实施例中,在5'延伸结构域的5'端的5个核苷酸内、5'延伸结构域的3'端的5个核苷酸内、或在远离5'延伸结构域的一端或两端超过5个核苷酸的区域内没有两个连续核苷酸被修饰。在某些实施例中,在5'延伸结构域的5'端的5个核苷酸内、5'延伸结构域的3'端的5个核苷酸内、或在远离5'延伸结构域的一端或两端超过5个核苷酸的区域内没有核苷酸被修饰。
可以选择5'延伸结构域中的修饰以便不干扰gRNA分子功效,这可以通过在如下阐述的系统中测试候选修饰来评价。具有候选5'延伸结构域的gRNA可以在如下阐述的系统中进行评价,所述候选5'延伸结构域具有选定的长度、序列、互补程度、或修饰程度。候选5'延伸结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,5'延伸结构域与参考5'延伸结构域(例如天然存在的(例如,化脓链球菌、金黄色葡萄球菌或嗜热链球菌)5'延伸结构域)、或本文所述的5'延伸结构域(例如,来自图1A-1G))具有至少60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5、或6个核苷酸。
近端结构域
图1A-1G提供了近端结构域的实例。
在某些实施例中,近端结构域的长度为5至20个或更多个核苷酸,例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个核苷酸。在这些实施例的某些中,近端结构域的长度为6+/-2、7+/-2、8+/-2、9+/-2、10+/-2、11+/-2、12+/-2、13+/-2、14+/-2、14+/-2、16+/-2、17+/-2、18+/-2、19+/-2、或20+/-2个核苷酸。在某些实施例中,近端结构域的长度为5至20、7至18、9至16、或10至14个核苷酸。
在某些实施例中,近端结构域可以与天然存在的近端结构域共享同源性,或从其衍生。在这些实施例的某些中,近端结构域与本文所披露的近端结构域(例如化脓链球菌、金黄色葡萄球菌或嗜热链球菌近端结构域,包括图1A-1G所阐述的那些)具有至少50%、60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,近端结构域不包含任何修饰。在其他实施例中,近端结构域或其中的一个或多个核苷酸具有修饰,包括但不限于本文所阐述的修饰。在某些实施例中,近端结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰近端结构域的骨架。在某些实施例中,对近端结构域的一个或多个核苷酸的修饰使得近端结构域和/或包含近端结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,近端结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,近端结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,近端结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对近端结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过在如下阐述的系统中测试候选修饰来评价。具有候选近端结构域的gRNA可以在如下阐述的系统中进行评价,所述候选近端结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选近端结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
尾部结构域
广谱的尾部结构域适于在本文所披露的gRNA分子中使用。图1A和1C-1G提供了这种尾部结构域的实例。
在某些实施例中,不存在尾部结构域。在其他实施例中,尾部结构域的长度为1至100个或更多个核苷酸,例如长度为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个核苷酸。在某些实施例中,尾部结构域的长度为1至5、1至10、1至15、1至20、1至50、10至100、20至100、10至90、20至90、10至80、20至80、10至70、20至70、10至60、20至60、10至50、20至50、10至40、20至40、10至30、20至30、20至25、10至20或10至15个核苷酸。在某些实施例中,尾部结构域的长度为5+/-5、10+/-5、20+/-10、20+/-5、25+/-10、30+/-10、30+/-5、40+/-10、40+/-5、50+/-10、50+/-5、60+/-10、60+/-5、70+/-10、70+/-5、80+/-10、80+/-5、90+/-10、90+/-5、100+/-10或100+/-5个核苷酸。
在某些实施例中,尾部结构域可以与天然存在的尾部结构域或天然存在的尾部结构域的5'端共享同源性,或从其衍生。在这些实施例的某些中,尾部结构域与本文所披露的天然存在的尾部结构域(例如化脓链球菌、金黄色葡萄球菌或嗜热链球菌尾部结构域,包括图1A和1C-1G所阐述的那些)具有至少50%、60%、70%、80%、85%、90%或95%的同源性,或与其相差不多于1、2、3、4、5或6个核苷酸。
在某些实施例中,尾部结构域包括彼此互补,并且在至少一些生理条件下形成双链体区域的序列。在这些实施例的某些中,尾部结构域包含尾部双链体结构域,其可以形成尾部双链体区域。在某些实施例中,尾部双链体区域的长度为3、4、5、6、7、8、9、10、11或12bp。在某些实施例中,尾部结构域包含不形成双链体的尾部双链体结构域的3'的单链结构域。在这些实施例的某些中,单链结构域的长度为3至10个核苷酸(例如3、4、5、6、7、8、9、10个)或长度为4至6个核苷酸。
在某些实施例中,尾部结构域不包含任何修饰。在其他实施例中,尾部结构域或其中的一个或多个核苷酸具有修饰,包括但不限于本文所阐述的修饰。在某些实施例中,尾部结构域的一个或多个核苷酸可以包含2'修饰(例如在核糖上的2'位置处的修饰),例如2-乙酰化,例如2'甲基化。在某些实施例中,可以用硫代磷酸酯修饰尾部结构域的骨架。在某些实施例中,对尾部结构域的一个或多个核苷酸的修饰使得尾部结构域和/或包含尾部结构域的gRNA不易降解或更生物相容,例如更低的免疫原性。在某些实施例中,尾部结构域包括1、2、3、4、5、6、7或8个或更多个修饰,并且在这些实施例的某些中,尾部结构域包括其5'和/或3'端的五个核苷酸内的1、2、3或4个修饰。在某些实施例中,尾部结构域包含在两个或更多个连续核苷酸处的修饰。
在某些实施例中,选择对尾部结构域中的一个或多个核苷酸的修饰以不干扰靶向功效,这可以通过测试如下阐述的候选修饰来评价。具有候选尾部结构域的gRNA可以使用如下阐述的系统进行评价,所述候选尾部结构域具有选定的长度、序列、互补程度、或修饰程度。所述候选尾部结构域可以被单独地或与一种或多种其他候选变化放置在已知与选定的靶具有功能性的gRNA分子/Cas9分子系统中并且进行评价。
在某些实施例中,尾部结构域包括在3'端与体外或体内转录方法相关的核苷酸。当将T7启动子用于gRNA的体外转录时,这些核苷酸可以是DNA模板的3'端前存在的任何核苷酸。当将U6启动子用于体内转录时,这些核苷酸可以是序列UUUUUU。当将H1启动子用于转录时,这些核苷酸可以是序列UUUU。当使用替代的pol-III启动子时,这些核苷酸可以是各种数量的尿嘧啶碱基,这取决于例如pol-III启动子的终止信号,或者它们可以包括替代碱基。
在某些实施例中,所述近端结构域和尾部结构域一起包含SEQ ID NO:32、33、34、35、36或37所示的序列,由其组成或基本上由其组成。
示例性单分子/嵌合gRNA
在某些实施例中,如本文所披露的单分子或嵌合gRNA具有以下结构:5'[靶向结构域]-[第一互补结构域]-[连接结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3',其中:
靶向结构域包含核心结构域和任选地第二结构域,并且长度为10至50个核苷酸;
第一互补结构域的长度为5至25个核苷酸,并且在某些实施例中,与本文所披露的参考第一互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;
连接结构域的长度为1至5个核苷酸;
第二互补结构域的长度为5至27个核苷酸,并且在某些实施例中,与本文所披露的参考第二互补结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;
近端结构域的长度为5至20个核苷酸,并且在某些实施例中,与本文所披露的参考近端结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性;并且
尾部结构域是不存在的或是长度为1至50个核苷酸的核苷酸序列,并且在某些实施例中,与本文所披露的参考尾部结构域具有至少50%、60%、70%、80%、85%、90%或95%的同源性。
在某些实施例中,如本文所披露的单分子gRNA包含,优选地从5'到3':
靶向结构域,其例如包含10-50个核苷酸;
第一互补结构域,其例如包含15、16、17、18、19、20、21、22、23、24、25、或26个核苷酸;
连接结构域;
第二互补结构域;
近端结构域;以及
尾部结构域,
其中,
(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;
(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;或
(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,来自(a)、(b)、和/或(c)的序列与天然存在的gRNA的相应序列或与本文所述的gRNA具有至少50%、60%、70%、75%、80%、85%、90%、95%或99%的同源性。
在某些实施例中,当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域由16、17、18、19、20、21、22、23、24、25或26个与靶结构域或其部分互补或部分互补的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,基本上由其组成或包含其,例如,靶向结构域的长度为16、17、18、19、20、21、22、23、24、25或26个核苷酸。在这些实施例的某些中,靶向结构域在靶向结构域的整个长度、靶结构域的整个长度或两者上与靶结构域互补。
在某些实施例中,本文所披露的单分子的或嵌合的gRNA分子(包含靶向结构域、第一互补结构域、连接结构域、第二互补结构域、近端结构域以及任选地尾部结构域)包含SEQID NO:42所示的氨基酸序列,其中靶向结构域被列为20个N(残基1-20)但长度范围可以从16至26个核苷酸,并且其中最后的六个残基(残基97-102)表示U6启动子的终止信号,但可以不存在或数目更少。在某些实施例中,所述单分子的或嵌合的gRNA分子是化脓链球菌gRNA分子。
在某些实施例中,本文所披露的单分子的或嵌合的gRNA分子(包含靶向结构域、第一互补结构域、连接结构域、第二互补结构域、近端结构域以及任选地尾部结构域)包含SEQID NO:38所示的氨基酸序列,其中靶向结构域被列为20个N(残基1-20)但长度范围可以从16至26个核苷酸,并且其中最后的六个残基(残基97-102)表示U6启动子的终止信号,但可以不存在或数目更少。在某些实施例中,所述单分子的或嵌合的gRNA分子是金黄色葡萄球菌gRNA分子。
示例性嵌合gRNA的序列和结构也示于图1H-1I中。
示例性模块化gRNA
在某些实施例中,本文所披露的模块化gRNA包含:
第一链,其包含,优选地从5'到3':
靶向结构域,其例如包含15、16、17、18、19、20、21、22、23、24、25、或26个核苷酸;
第一互补结构域;以及
第二链,其包含,优选地从5'到3':
任选地,5'延伸结构域;
第二互补结构域;
近端结构域;和
尾部结构域,
其中:
(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;
(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;或
(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,来自(a)、(b)、或(c)的序列与天然存在的gRNA的相应序列或与本文所述的gRNA具有至少60%、75%、80%、85%、90%、95%或99%的同源性。
在某些实施例中,当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸。
在某些实施例中,第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含、具有、或由16、17、18、19、20、21、22、23、24、25或26个与靶结构域具有互补性的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,例如,靶向结构域的长度为16、17、18、19、20、21、22、23、24、25或26个核苷酸。
在某些实施例中,靶向结构域由16、17、18、19、20、21、22、23、24、25或26个与靶结构域或其部分互补的核苷酸(例如,16、17、18、19、20、21、22、23、24、25或26个连续核苷酸)组成,基本上由其组成或包含其。在这些实施例的某些中,靶向结构域在靶向结构域的整个长度、靶结构域的整个长度或两者上与靶结构域互补。
在某些实施例中,靶向结构域包含16个与靶结构域具有互补性的核苷酸(例如,16个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为16个核苷酸。在这些实施例的某些实施例中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含17个与靶结构域具有互补性的核苷酸(例如,17个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为17个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含18个与靶结构域具有互补性的核苷酸(例如,18个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为18个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含19个与靶结构域具有互补性的核苷酸(例如,19个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为19个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含20个与靶结构域具有互补性的核苷酸(例如,20个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为20个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含21个与靶结构域具有互补性的核苷酸(例如,21个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为21个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含22个与靶结构域具有互补性的核苷酸(例如,22个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为22个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含23个与靶结构域具有互补性的核苷酸(例如,23个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为23个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含24个与靶结构域具有互补性的核苷酸(例如,24个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为24个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含25个与靶结构域具有互补性的核苷酸(例如,25个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为25个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51、或54个核苷酸,所述核苷酸与第一互补结构域的相应核苷酸互补。
在某些实施例中,靶向结构域包含26个与靶结构域具有互补性的核苷酸(例如,26个连续核苷酸),由其组成或基本上由其组成,例如,靶向结构域的长度为26个核苷酸。在这些实施例的某些中,(a)当一起考虑时,近端结构域和尾部结构域包含至少15、18、20、25、30、31、35、40、45、49、50或53个核苷酸;(b)第二互补结构域的最后一个核苷酸的3'存在至少15、18、20、25、30、31、35、40、45、49、50、或53个核苷酸;并且/或(c)第二互补结构域的最后一个核苷酸的3'存在至少16、19、21、26、31、32、36、41、46、50、51或54个核苷酸,所述核苷酸与该第一互补结构域的相应核苷酸互补。
用于设计gRNA的方法
本文描述了用于设计gRNA的方法,包括用于选择、设计和验证在本文所述的gRNA中使用的靶向结构域的方法。本文还提供了用于掺入gRNA的示例性靶向结构域。本文考虑了,在某些实施例中,靶向结构域通过互补碱基配对与靶结构域杂交。
先前已经描述了用于靶序列的选择和验证以及脱靶分析的方法(参见例如,Mali2013;Hsu 2013;Fu 2014;Heigwer 2014;Bae 2014;Xiao2014)。例如,软件工具可以用来优化与使用者的靶序列对应的潜在靶向结构域的选择,例如,以跨基因组最小化总脱靶活性。脱靶活性可以不同于切割。对于使用化脓链球菌Cas9的每个可能的靶向结构域选择,所述工具可以鉴别跨基因组所有脱靶序列(以上的NAG或NGG PAM),所述脱靶序列含有高达一定数量(例如,1、2、3、4、5、6、7、8、9、或10)的错配碱基对。在每个脱靶序列处的切割效率是可以预测的,例如,使用实验衍生的加权方案。然后将每个可能的靶向结构域进行排序,根据其总的预测的脱靶切割;最高排名的靶向结构域表示可能具有最大中靶切割和最少脱靶切割的那些。其他功能(例如,用于CRISPR构建的自动化试剂设计、用于中靶Surveyor测定的引物设计、和用于高通量检测以及经由下一代测序对脱靶切割进行定量的引物设计)也可以被包括在所述工具中。可以使用本领域已知和/或本文所阐述的方法对候选靶向结构域和包含那些靶向结构域的gRNA进行功能评价。
作为非限制性实例,使用DNA序列检索算法鉴定用于与化脓链球菌Cas9和金黄色葡萄球菌Cas9一起使用的gRNA中使用的靶向结构域。使用基于公共工具cas-offinder(Bae2014)的定制gRNA设计软件进行gRNA设计。该软件在计算指导物的全基因组脱靶倾向之后为指导物打分。典型地,针对长度范围从17至24的指导物考虑范围从完美匹配至7个错配的匹配。一旦经计算确定了脱靶位点,便计算每种指导物的总分并且使用web界面以表格输出总结。除鉴定与PAM序列邻近的潜在靶位点之外,所述软件还鉴定与所选靶位点相差1、2、3个或多于3个核苷酸的所有PAM邻近序列。从UCSC基因组浏览器获得每个基因的基因组DNA序列,并且使用可公开获得的RepeaTmasker程序针对重复元件对序列进行筛选。RepeaTmasker针对重复元件和具有低复杂性的区域对输入DNA序列进行检索。输出是存在于给定查询序列中的重复的详细注释。
鉴定后,基于靶向结构域的正交性和5'G的存在(基于在人类基因组中含有相关PAM的靠近匹配的鉴定,例如在化脓链球菌的情况下是NGG PAM,在金黄色葡萄球菌的情况下是NNGRRT(SEQ ID NO:204)或NNGRRV(SEQ ID NO:205)PAM),将靶向结构域排成等级。正交性是指在人类基因组中含有与靶序列最小数目的错配的序列的数目。“高水平的正交性”或“良好的正交性”可以例如是指20-mer靶向结构域,其除预期靶之外在人类基因组中既没有一致序列,又没有含有靶序列中的一个或两个错配的任何序列。具有良好正交性的靶向结构域被选择用于最小化脱靶DNA切割。
针对单-gRNA核酸酶切割并且针对双-gRNA成对的“切口酶”策略两者对靶向结构域进行鉴定。用于选择靶向结构域并且确定哪些靶向结构域可以用于双-gRNA成对的“切口酶”策略的标准是基于两个考虑:
(1)靶向结构域对应该在DNA上定向成使得PAM朝外并且用D10A Cas9切口酶切割将产生5'突出端;和
(2)假设用双切口酶对切割将以合理频率导致整个插入序列的缺失。然而,用双切口酶对切割还可以仅在所述gRNA之一的位点处导致indel突变。可以针对它们如何有效地去除整个序列对比引起一个靶向结构域的靶位点处的indel突变对候选对成员进行测试。
Cas9分子
多个物种的Cas9分子可以用于本文所述的方法和组合物中。尽管化脓链球菌、金黄色葡萄球菌和嗜热链球菌Cas9分子是本文的披露的大部分的主题,也可以使用本文所列出的其他物种的Cas9蛋白的、从中衍生的、或基于其的Cas9分子。这些包括例如来自以下项的Cas9分子:燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)、琥珀酸放线杆菌(Actinobacillus succinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属(Actinomyces sp.)、cycliphilus denitrificans、Aminomonas paucivorans、蜡样芽孢杆菌(Bacillus cereus)、史氏芽孢杆菌(Bacillussmithii)、苏云金芽孢杆菌(Bacillus thuringiensis)、拟杆菌属(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatuspuniceispirillum、解纤维梭菌(Clostridium cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒状杆菌(Corynebacterium diphtheria)、Corynebacterium matruchotii、恒雄芝氏沟鞭藻玫瑰杆菌(Dinoroseobacter shibae)、细长真杆菌(Eubacterium dolichum)、γ-变形菌纲(gammaproteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、嗜血弯曲杆菌(Haemophilus sputorum)、Helicobacter canadensis、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、Ilyobacter polytropus、金氏金氏菌(Kingella kingae)、卷曲乳酸杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeria ivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科菌(Listeriaceae bacterium)、甲基孢囊菌属(Methylocystis sp.)、甲烷氧化菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、奈瑟氏杆菌(Neisseria bacilliformis)、灰色奈瑟球菌(Neisseria cinerea)、浅黄色奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌属(Neisseria sp.)、瓦茨瓦尔西奈瑟氏菌(Neisseriawadsworthii)、亚硝化单胞菌属(Nitrosomonas sp.)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、出血败血性巴士杆菌(Pasteurella multocida)、Phascolarctobacterium succinatutens、Ralstonia syzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属(Rhodovulum sp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属(Sphingomonas sp.)、Sporolactobacillusvineae、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属(Streptococcus sp.)、Subdoligranulum sp.、运动替斯崔纳菌(Tistrella mobilis)、密螺旋体属(Treponemasp.)或Verminephrobacter eiseniae。
Cas9结构域
已经确定了两种不同的天然存在的细菌Cas9分子(Jinek 2014)和具有指导RNA(例如,crRNA和tracrRNA的合成融合体)的化脓链球菌Cas9(Nishimasu 2014;Anders2014)的晶体结构。
天然存在的Cas9分子包含两种叶片:识别(REC)叶片和核酸酶(NUC)叶片;其各自进一步包含本文所述的结构域。图8A-8B提供了重要的Cas9结构域的一级结构的组织的示意图。贯穿本披露使用的由每个结构域所涵盖的结构域命名和氨基酸残基编号是如先前(Nishimasu 2014)所描述的。氨基酸残基的编号是参照来自化脓链球菌的Cas9。
REC叶片包含富精氨酸的桥螺旋(BH)、REC1结构域、和REC2结构域。REC叶片与其他已知蛋白不享有结构相似性,指示它是Cas9特异性功能结构域。BH结构域是长的α螺旋且富精氨酸的区域并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸60-93。REC1结构域对于例如gRNA或tracrRNA的重复:抗重复双链体的识别而言是重要的,并且因此对于识别靶序列的Cas9活性而言是关键的。REC1结构域在化脓链球菌Cas9(SEQ ID NO:2)的氨基酸94至179和308至717处包含两个REC1基序。尽管在线性一级结构中被REC2结构域分开,这两个REC1结构域在三级结构中组装以形成REC1结构域。REC2结构域、或其部分在重复:抗重复双链体的识别中也可以发挥作用。REC2结构域包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸180-307。
NUC叶片包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。RuvC结构域与逆转录病毒整合酶超家族成员享有结构相似性,并且切割靶核酸分子的单链(例如,非互补链)。RuvC结构域由化脓链球菌Cas9(SEQ ID NO:2)的分别在氨基酸1-59、718-769和909-1098处的三个分割RuvC基序(RuvCI、RuvCII和RuvCIII,在本领域其通常分别称为RuvCI结构域或N-末端RuvC结构域、RuvCII结构域和RuvCIII结构域)组装而来。与REC1结构域类似,这三个RuvC基序被一级结构中的其他结构域线性分开。然而,在三级结构中,这三个RuvC基序组装并形成RuvC结构域。HNH结构域与HNH内切核酸酶享有结构相似性,并且切割靶核酸分子的单链(例如,非互补链)。HNH结构域位于RuvC II-III基序之间并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸775-908。PI结构域与靶核酸分子的PAM相互作用,并且包含化脓链球菌Cas9(SEQ ID NO:2)的氨基酸1099-1368。
RuvC样结构域和HNH样结构域
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域和RuvC样结构域,并且在这些实施例的某些中,切割活性取决于RuvC样结构域和HNH样结构域。Cas9分子或Cas9多肽可以包含RuvC样结构域和HNH样结构域中的一者或多者。在某些实施例中,Cas9分子或Cas9多肽包含RuvC样结构域(例如,如下所述的RuvC样结构域)和/或HNH样结构域(例如,如下所述的HNH样结构域)。
RuvC样结构域
在某些实施例中,RuvC样结构域切割靶核酸分子的单链(例如,非互补链)。Cas9分子或Cas9多肽可以包括多于一个RuvC样结构域(例如,一个、两个、三个或更多个RuvC样结构域)。在某些实施例中,RuvC样结构域的长度为至少5、6、7、8个氨基酸但长度不多于20、19、18、17、16或15个氨基酸。在某些实施例中,Cas9分子或Cas9多肽包含长度为约10至20个氨基酸(例如,约15个氨基酸)的N-末端RuvC样结构域。
N-末端RuvC样结构域
一些天然存在的Cas9分子包含多于一个RuvC样结构域,其中切割取决于N-末端RuvC样结构域。因此,Cas9分子或Cas9多肽可以包含N-末端RuvC样结构域。示例性N-末端RuvC样结构域如下所述。
在某些实施例中,Cas9分子或Cas9多肽包含N-末端RuvC样结构域,所述N-末端RuvC样结构域包含具有化学式I的氨基酸序列:
D-X1-G-X2-X3-X4-X5-G-X6-X7-X8-X9(SEQ ID NO:20),
其中
X1选自I、V、M、L和T(例如,选自I、V和L);
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X4选自S、Y、N和F(例如,S);
X5选自V、I、L、C、T和F(例如,选自V、I和L);
X6选自W、F、V、Y、S和L(例如,W);
X7选自A、S、C、V和G(例如,选自A和S);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或例如,选自T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:20的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域是有切割能力的。在其他实施例中,N-末端RuvC样结构域是无切割能力的。
在某些实施例中,Cas9分子或Cas9多肽包含N-末端RuvC样结构域,所述N-末端RuvC样结构域包含具有化学式II的氨基酸序列:
D-X1-G-X2-X3-S-X5-G-X6-X7-X8-X9(SEQ ID NO:21),
其中
X1选自I、V、M、L和T(例如,选自I、V和L);
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X5选自V、I、L、C、T和F(例如,选自V、I和L);
X6选自W、F、V、Y、S和L(例如,W);
X7选自A、S、C、V和G(例如,选自A和S);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或选自例如,T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:21的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域包含具有化学式III的氨基酸序列:
D-I-G-X2-X3-S-V-G-W-A-X8-X9(SEQ ID NO:22),
其中
X2选自T、I、V、S、N、Y、E和L(例如,选自T、V和I);
X3选自N、S、G、A、D、T、R、M和F(例如,A或N);
X8选自V、I、L、A、M和H(例如,选自V、I、M和L);并且
X9选自任何氨基酸或是不存在的(例如,选自T、V、I、L、Δ、F、S、A、Y、M和R,或选自例如,T、V、I、L和Δ)。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:22的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域包含具有化学式IV的氨基酸序列:
D-I-G-T-N-S-V-G-W-A-V-X(SEQ ID NO:23),
其中
X是非极性烷基氨基酸或羟基氨基酸,例如,X选自V、I、L和T(例如,Cas9分子可以包含示于图2A-2G中的N-末端RuvC样结构域(描绘为Y))。
在某些实施例中,N-末端RuvC样结构域与SEQ ID NO:23的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域与本文(例如,在图3A-3B中)所披露的N-末端RuvC样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图3A-3B中鉴定出的高度保守残基中的1个、2个、3个或全部是存在的。
在某些实施例中,N-末端RuvC样结构域与本文(例如,在图4A-4B中)所披露的N-末端RuvC样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图4A-4B中鉴定出的高度保守残基中的1个、2个或全部是存在的。
另外的RuvC样结构域
除了N-末端RuvC样结构域之外,Cas9分子或Cas9多肽可以包含一个或多个另外的RuvC样结构域。在某些实施例中,Cas9分子或Cas9多肽可以包含两个另外的RuvC样结构域。优选地,另外的RuvC样结构域的长度为至少5个氨基酸,并且例如长度为小于15个氨基酸,例如长度为5至10个氨基酸,例如长度为8个氨基酸。
另外的RuvC样结构域可以包含具有化学式V的氨基酸序列:
I-X1-X2-E-X3-A-R-E(SEQ ID NO:15),
其中
X1是V或H;
X2是I、L或V(例如,I或V);并且
X3是M或T。
在某些实施例中,另外的RuvC样结构域包含具有化学式VI的氨基酸序列:
I-V-X2-E-M-A-R-E(SEQ ID NO:16),
其中
X2是I、L或V(例如,I或V)(例如,Cas9分子或Cas9多肽可以包含示于图2A-2G中的另外的RuvC样结构域(描绘为B))。
另外的RuvC样结构域可以包含具有化学式VII的氨基酸序列:
H-H-A-X1-D-A-X2-X3(SEQ ID NO:17),
其中
X1是H或L;
X2是R或V;并且
X3是E或V。
在某些实施例中,另外的RuvC样结构域包含如下氨基酸序列:H-H-A-H-D-A-Y-L(SEQ ID NO:18)。
在某些实施例中,另外的RuvC样结构域与SEQ ID NO:15-18的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,N-末端RuvC样结构域侧翼的序列具有化学式VIII的氨基酸序列:
K-X1’-Y-X2’-X3’-X4’-Z-T-D-X9’-Y(SEQ ID NO:19),
其中
X1’选自K和P;
X2’选自V、L、I和F(例如,V、I和L);
X3’选自G、A和S(例如,G);
X4’选自L、I、V和F(例如,L);
X9’选自D、E、N和Q;并且
Z是N-末端RuvC样结构域,例如,如以上所描述的。
HNH样结构域
在某些实施例中,HNH样结构域切割双链核酸分子的单链互补结构域(例如,互补链)。在某些实施例中,HNH样结构域的长度为至少15、20或25个氨基酸但长度为不多于40、35或30个氨基酸,例如长度为20至35个氨基酸,例如长度为25至30个氨基酸。示例性的HNH样结构域如下所述。
在一个实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域具有化学式IX的氨基酸序列:
X1-X2-X3-H-X4-X5-P-X6-X7-X8-X9-X10-X11-X12-X13-X14-X15-N-X16-X17-X18-X19-X20-X21-X22-X23-N(SEQ ID NO:25),
其中
X1选自D、E、Q和N(例如,D和E);
X2选自L、I、R、Q、V、M和K;
X3选自D和E;
X4选自I、V、T、A和L(例如,A、I和V);
X5选自V、Y、I、L、F和W(例如,V、I和L);
X6选自Q、H、R、K、Y、I、L、F和W;
X7选自S、A、D、T和K(例如,S和A);
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X11选自D、S、N、R、L和T(例如,D);
X12选自D、N和S;
X13选自S、A、T、G和R(例如,S);
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X16选自K、L、R、M、T和F(例如,L、R和K);
X17选自V、L、I、A和T;
X18选自L、I、V和A(例如,L和I);
X19选自T、V、C、E、S和A(例如,T和V);
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:25的序列相差至少一个但不多于2、3、4、或5个残基。
在某些实施例中,HNH样结构域是有切割能力的。在某些实施例中,HNH样结构域是无切割能力的。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域包括具有化学式X的氨基酸序列:
X1-X2-X3-H-X4-X5-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-X19-X20-X21-X22-X23-N(SEQ ID NO:26),
其中
X1选自D和E;
X2选自L、I、R、Q、V、M和K;
X3选自D和E;
X4选自I、V、T、A和L(例如,A、I和V);
X5选自V、Y、I、L、F和W(例如,V、I和L);
X6选自Q、H、R、K、Y、I、L、F和W;
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X19选自T、V、C、E、S和A(例如,T和V);
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:26的序列相差1、2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域包括具有化学式XI的氨基酸序列:
X1-V-X3-H-I-V-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-T-X20-X21-X22-X23-N(SEQ ID NO:27),
其中
X1选自D和E;
X3选自D和E;
X6选自Q、H、R、K、Y、I、L和W;
X8选自F、L、V、K、Y、M、I、R、A、E、D和Q(例如,F);
X9选自L、R、T、I、V、S、C、Y、K、F和G;
X10选自K、Q、Y、T、F、L、W、M、A、E、G和S;
X14选自I、L、F、S、R、Y、Q、W、D,K和H(例如,I、L和F);
X15选自D、S、I、N、E、A、H、F、L、Q、M、G、Y和V;
X20选自R、F、T、W、E、L、N、C、K、V、S、Q、I、Y、H和A;
X21选自S、P、R、K、N、A、H、Q、G和L;
X22选自D、G、T、N、S、K、A、I、E、L、Q、R和Y;并且
X23选自K、V、A、E、Y、I、C、L、S、T、G、K、M、D和F。
在某些实施例中,HNH样结构域与SEQ ID NO:27的序列相差1、2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含HNH样结构域,所述HNH样结构域具有化学式XII的氨基酸序列:
D-X2-D-H-I-X5-P-Q-X7-F-X9-X10-D-X12-S-I-D-N-X16-V-L-X19-X20-S-X22-X23-N(SEQID NO:28),
其中
X2选自I和V;
X5选自I和V;
X7选自A和S;
X9选自I和L;
X10选自K和T;
X12选自D和N;
X16选自R、K和L;
X19选自T和V;
X20选自S和R;
X22选自K、D和A;并且
X23选自E、K、G和N(例如,Cas9分子或Cas9多肽可以包含如本文所描述的HNH样结构域)。
在一个实施例中,HNH样结构域与SEQ ID NO:28的序列相差多达1个但不多于2、3、4或5个残基。
在某些实施例中,Cas9分子或Cas9多肽包含具有化学式XIII的氨基酸序列:
L-Y-Y-L-Q-N-G-X1’-D-M-Y-X2’-X3’-X4’-X5’-L-D-I-X6’-X7’-L-S-X8’-Y-Z-N-R-X9’-K-X10’-D-X11’-V-P(SEQ ID NO:24),
其中
X1’选自K和R;
X2’选自V和T;
X3’选自G和D;
X4’选自E、Q和D;
X5’选自E和D;
X6’选自D、N和H;
X7’选自Y、R和N;
X8’选自Q、D和N;
X9’选自G和E;
X10’选自S和G;
X11’选自D和N;并且
Z是HNH样结构域,例如,如以上所描述的。
在某些实施例中,Cas9分子或Cas9多肽包含与SEQ ID NO:24的序列相差多达1个但不多于2、3、4或5个残基的氨基酸序列。
在某些实施例中,HNH样结构域与本文(例如,在图5A-5C中)所披露的HNH样结构域的序列相差多达1个但不多于2、3、4或5个残基。在某些实施例中,在图5A-5C中鉴定出的高度保守残基中的1个或2个是存在的。
在某些实施例中,HNH样结构域与本文(例如,在图6A-6B中)所披露的HNH样结构域的序列相差多达1个但不多于2、3、4或5个残基。在一个实施例中,在图6A-6B中鉴定出的高度保守残基中的1个、2个或所有3个是存在的。
Cas9活性
在某些实施例中,Cas9分子或Cas9多肽能够切割靶核酸分子。典型地,野生型Cas9分子切割靶核酸分子的两条链。Cas9分子和Cas9多肽可以被工程化以改变核酸酶切割(或其他特性),例如以提供作为切口酶、或缺乏切割靶核酸能力的Cas9分子或Cas9多肽。能够切割靶核酸分子的Cas9分子或Cas9多肽在本文中称为eaCas9(酶促活性Cas9)分子或eaCas9多肽。
在某些实施例中,eaCas9分子或eaCas9多肽包含以下一种或多种酶活性:
(1)切口酶活性,即切割核酸分子的单链(例如非互补链或互补链)的能力;
(2)双链核酸酶活性,即切割双链核酸的两条链并且产生双链断裂的能力,其在一个实施例中是在两种切口酶活性的存在下;
(3)内切核酸酶活性;
(4)外切核酸酶活性;以及
(5)解旋酶活性,即解旋双链核酸的螺旋结构的能力。
在某些实施例中,eaCas9分子或eaCas9多肽切割两条DNA链,并且产生双链断裂。在某些实施例中,eaCas9分子或eaCas9多肽仅切割一条链,例如,gRNA杂交到的链、或互补于与gRNA杂交的链的链。在一个实施例中,eaCas9分子或eaCas9多肽包含与HNH结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含与RuvC结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含与HNH结构域相关的切割活性以及与RuvC结构域相关的切割活性。在一个实施例中,eaCas9分子或eaCas9多肽包含有活性、或有切割能力的HNH结构域以及无活性、或无切割能力的RuvC结构域。在一个实施例中,eaCas9分子或eaCas9多肽包含无活性、或无切割能力的HNH结构域和有活性、或有切割能力的RuvC结构域。
一些Cas9分子或Cas9多肽具有与gRNA分子相互作用,并且结合所述gRNA分子以定位至核心靶结构域的能力,但不能切割靶核酸、或不能以有效速率进行切割。不具有或实质上不具有切割活性的Cas9分子在本文中称为eiCas9分子或eiCas9多肽。例如,eiCas9分子或eiCas9多肽可以缺乏切割活性或具有实质上小于参考Cas9分子或eiCas9多肽,例如小于20%、10%、5%、1%或0.1%的切割活性,如通过本文所述的测定所测量的。
靶向和PAM
Cas9分子或Cas9多肽可以与gRNA分子相互作用并且与所述gRNA分子一起定位至包含靶结构域(并且在某些实施例中,是PAM序列)的位点。
在某些实施例中,eaCas9分子或eaCas9多肽与靶核酸相互作用并且切割靶核酸的能力是PAM序列依赖性的。PAM序列是在靶核酸中的序列。在一个实施例中,靶核酸的切割发生在PAM序列的上游。来自不同细菌物种的eaCas9分子可以识别不同序列基序(例如,PAM序列)。在一个实施例中,化脓链球菌的eaCas9分子识别序列基序NGG并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp(参见例如,Mali 2013)。在一个实施例中,嗜热链球菌的eaCas9分子识别序列基序NGGNG(SEQ ID NO:199)和/或NNAGAAW(W=A或T)(SEQID NO:200)并且指导切割靶核酸序列的在这些序列上游的1至10(例如,3至5)bp(参见例如,Horvath 2010;Deveau 2008)。在一个实施例中,变形链球菌的eaCas9分子识别序列基序NGG和/或NAAR(R=A或G)(SEQ ID NO:201)并且指导切割靶核酸序列的在该序列上游的1至10(例如,3至5)bp(参见例如,Deveau 2008)。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRR(R=A或G)(SEQ ID NO:202)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:203)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:204)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。在一个实施例中,金黄色葡萄球菌的eaCas9分子识别序列基序NNGRRV(R=A或G,V=A、G或C)(SEQ ID NO:205)并且指导切割靶核酸序列的在该序列的上游的1至10(例如,3至5)bp。Cas9分子识别PAM序列的能力可以例如使用如先前所述的转化测定(Jinek2012)来确定。在上述实施例(即SEQ ID NO:199-205)中的每一个中,N可以是任何核苷酸残基,例如A、G、C或T中的任一项。
如本文所讨论的,Cas9分子可以被工程化以改变Cas9分子的PAM特异性。
先前已经描述了示例性的天然存在的Cas9分子(参见例如,Chylinski2013)。此类Cas9分子包括以下项的Cas9分子:簇1细菌家族、簇2细菌家族、簇3细菌家族、簇4细菌家族、簇5细菌家族、簇6细菌家族、簇7细菌家族、簇8细菌家族、簇9细菌家族、簇10细菌家族、簇11细菌家族、簇12细菌家族、簇13细菌家族、簇14细菌家族、簇15细菌家族、簇16细菌家族、簇17细菌家族、簇18细菌家族、簇19细菌家族、簇20细菌家族、簇21细菌家族、簇22细菌家族、簇23细菌家族、簇24细菌家族、簇25细菌家族、簇26细菌家族、簇27细菌家族、簇28细菌家族、簇29细菌家族、簇30细菌家族、簇31细菌家族、簇32细菌家族、簇33细菌家族、簇34细菌家族、簇35细菌家族、簇36细菌家族、簇37细菌家族、簇38细菌家族、簇39细菌家族、簇40细菌家族、簇41细菌家族、簇42细菌家族、簇43细菌家族、簇44细菌家族、簇45细菌家族、簇46细菌家族、簇47细菌家族、簇48细菌家族、簇49细菌家族、簇50细菌家族、簇51细菌家族、簇52细菌家族、簇53细菌家族、簇54细菌家族、簇55细菌家族、簇56细菌家族、簇57细菌家族、簇58细菌家族、簇59细菌家族、簇60细菌家族、簇61细菌家族、簇62细菌家族、簇63细菌家族、簇64细菌家族、簇65细菌家族、簇66细菌家族、簇67细菌家族、簇68细菌家族、簇69细菌家族、簇70细菌家族、簇71细菌家族、簇72细菌家族、簇73细菌家族、簇74细菌家族、簇75细菌家族、簇76细菌家族、簇77细菌家族、或簇78细菌家族。
示例性的天然存在的Cas9分子包括簇1细菌家族的Cas9分子。实例包括以下项的Cas9分子:金黄色葡萄球菌、化脓链球菌(例如,菌株SF370、MGAS10270、MGAS10750、MGAS2096、MGAS315、MGAS5005、MGAS6180、MGAS9429、NZ131、SSI-1)、嗜热链球菌(例如,菌株LMD-9)、假豕链球菌(S.pseudoporcinus)(例如,菌株SPIN 20026)、变形链球菌(例如,菌株UA159、NN2025)、猕猴链环菌(S.macacae)(例如,菌株NCTC11558)、解没食子酸链球菌(S.gallolyticus)(例如,菌株UCN34、ATCC BAA-2069)、马链球菌(S.equinus)(例如,菌株ATCC9812、MGCS 124)、停乳链球菌(S.dysdalactiae)(例如,菌株GGS124)、牛链球菌(S.bovis)(例如,菌株ATCC 700338)、咽峡炎链球菌(S.anginosus)(例如,菌株F0211)、无乳链球菌(S.agalactiae)(例如,菌株NEM316、A909)、单核细胞增生李斯特菌(Listeriamonocytogenes)(例如,菌株F6854)、无害利斯特菌(Listeria innocua)(无害利斯特菌(L.innocua)(例如,菌株Clip11262))、意大利肠道球菌(Enterococcus italicus)(例如,菌株DSM 15952)、或屎肠球菌(Enterococcus faecium)(例如,菌株1,231,408)。
在某些实施例中,Cas9分子或Cas9多肽包含以下氨基酸序列:
与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列(例如,来自本文列出的(例如,SEQ ID NO:1、2、4-6或12)或描述于Chylinski2013中的物种的Cas9分子)具有60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、或99%的同源性;
当与其相比时,与其相差不多于2%、5%、10%、15%、20%、30%或40%的氨基酸残基;
与其相差至少1、2、5、10或20个氨基酸但相差不多于100、80、70、60、50、40或30个氨基酸;或
与其相同。在一个实施例中,Cas9分子或Cas9多肽包含以下一种或多种活性:切口酶活性;双链切割活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;或连同gRNA分子定位至靶核酸的能力。
在某些实施例中,Cas9分子或Cas9多肽包含图2A-2G的共有序列的任何氨基酸序列,其中“*”指示在化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9分子的氨基酸序列中的对应位置中发现的任何氨基酸,并且“-”指示不存在。在一个实施例中,Cas9分子或Cas9多肽与披露于图2A-2G中的共有序列的序列相差至少1个但不多于2、3、4、5、6、7、8、9或10个氨基酸残基。在某些实施例中,Cas9分子或Cas9多肽包含SEQ ID NO:2的氨基酸序列。在其他实施例中,Cas9分子或Cas9多肽与SEQ ID NO:2的序列相差至少1个但不多于2、3、4、5、6、7、8、9或10个氨基酸残基。
多个Cas9分子的序列的比较表明某些区域是保守的。这些鉴定如下:
区域1(残基1至180,或在区域1'的情况下,残基120至180);
区域2(残基360至480);
区域3(残基660至720);
区域4(残基817至900);以及
区域5(残基900至960)。
在某些实施例中,Cas9分子或Cas9多肽包含区域1-5,连同足够的另外的Cas9分子序列以提供生物活性分子(例如,具有至少一种本文所述的活性的Cas9分子)。在某些实施例中,区域1-5各自独立地与本文所述的Cas9分子或Cas9多肽(例如,来自图2A-2G的序列(SEQ ID NO:1、2、4、5、14))的相应残基具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的同源性。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域1的氨基酸序列:
与化脓链球菌的Cas9的氨基酸序列(SEQ ID NO:2)的氨基酸1-180具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(编号是根据图2中的基序序列;图2A-2G中的四个Cas9序列中的52%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸1-180相差至少1、2、5、10或20个氨基酸但相差不多于90、80、70、60、50、40或30个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸1-180相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域1'的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180具有55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的55%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸120-180相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域2的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的52%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸360-480相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域3的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720具有55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2中的四个Cas9序列中的56%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸660-720相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域4的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2A-2G中的四个Cas9序列中的55%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸817-900相同。
在某些实施例中,Cas9分子或Cas9多肽包含以下称为区域5的氨基酸序列:
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960具有50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性(图2A-2G中的四个Cas9序列中的60%的残基是保守的);
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960相差至少1、2或5个氨基酸但相差不多于35、30、25、20或10个氨基酸;或
与化脓链球菌、嗜热链球菌、变形链球菌或无害利斯特菌的Cas9的氨基酸序列(分别是SEQ ID NO:2、4、1和5)的氨基酸900-960相同。
工程化的或改变的Cas9
本文所述的Cas9分子和Cas9多肽(可以具有多种特性中的任一种,包括:核酸酶活性(例如,内切核酸酶和/或外切核酸酶活性);解旋酶活性;在功能上与gRNA分子相关联的能力;以及靶向(或定位至)核酸上的位点的能力(例如,PAM识别和特异性)。在某些实施例中,Cas9分子或Cas9多肽可以包括这些特性的全部或子集。在一个典型的实施例中,Cas9分子或Cas9多肽具有与gRNA分子相互作用,并且与所述gRNA分子一起定位至核酸中的位点的能力。其他活性(例如,PAM特异性、切割活性、或解旋酶活性)在Cas9分子和Cas9多肽中可以更广泛地变化。
Cas9分子包括工程化的Cas9分子和工程化的Cas9多肽(如在此背景下使用的,工程化的仅仅意指所述Cas9分子或Cas9多肽不同于参考序列,并且没有暗示过程或来源限制)。工程化的Cas9分子或Cas9多肽可以包含改变的酶特性,例如改变的核酸酶活性(与天然存在的或其他参考Cas9分子相比)或改变的解旋酶活性。如本文所讨论的,工程化的Cas9分子或Cas9多肽可以具有切口酶活性(与双链核酸酶活性相反)。在某些实施例中,工程化的Cas9分子或Cas9多肽可以具有改变其尺寸的改变,例如减小其尺寸的氨基酸序列缺失,例如对一种或多种Cas9活性没有显著影响。在某些实施例中,工程化的Cas9分子或Cas9多肽可以包含影响PAM识别的改变,例如,工程化的Cas9分子可被改变以识别不同于由内源性野生型PI结构域识别的PAM序列的PAM序列。在某些实施例中,Cas9分子或Cas9多肽在序列上可以不同于天然存在的Cas9分子,但是在一种或多种Cas9活性上没有显著改变。
具有所希望特性的Cas9分子或Cas9多肽可以通过多种方式制成,例如,通过改变亲本(例如天然存在的)Cas9分子或Cas9多肽,以提供具有所希望特性的改变的Cas9分子或Cas9多肽。例如,可以相对于亲本Cas9分子(例如,天然存在的或工程化的Cas9分子)引入一个或多个突变或差异。此类突变和差异包括:取代(例如,保守取代或非必需氨基酸的取代);插入;或缺失。在一个实施例中,Cas9分子或Cas9多肽相对于参考(例如,亲本)Cas9分子可以包含一个或多个突变或差异,例如,至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。
在某些实施例中,一个突变或多个突变对Cas9活性(例如,本文所述的Cas9活性)不具有实质影响。在其他实施例中,一个突变或多个突变对Cas9活性(例如,本文所述的Cas9活性)具有实质影响。
非切割和经修饰的切割Cas9
在一个实施例中,Cas9分子或Cas9多肽包含不同于天然存在的Cas9分子(例如,不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如,Cas9分子或Cas9多肽可以与天然存在的Cas9分子(例如,化脓链球菌的Cas9分子)有如下区别:例如,相比于天然存在的Cas9分子(例如,化脓链球菌的Cas9分子),它调节(例如,降低或增加)对双链核酸切割的能力(内切核酸酶和/或外切核酸酶活性);例如,相比于天然存在的Cas9分子(例如,化脓链球菌的Cas9分子),它调节(例如,降低或增加)对核酸的单链(例如,核酸分子的非互补链或核酸分子的互补链)切割的能力(切口酶活性);或切割核酸分子(例如,双链或单链核酸分子)的能力可以被消除。
在某些实施例中,eaCas9分子或eaCas9多肽包含以下一种或多种活性:与N-末端RuvC样结构域相关的切割活性;与HNH样结构域相关的切割活性;与HNH样结构域相关的切割活性和与N-末端RuvC样结构域相关的切割活性。
在某些实施例中,eaCas9分子或eaCas9多肽包含有活性、或有切割能力的HNH样结构域(例如,本文所述的HNH样结构域,例如,SEQ ID NO:24-28)和无活性、或无切割能力的N-末端RuvC样结构域。示例性的无活性、或无切割能力的N-末端RuvC样结构域可以在N-末端RuvC样结构域中具有天冬氨酸的突变(例如,披露于图2A-2G中的共有序列的位置9处的天冬氨酸或SEQ ID NO:2的位置10处的天冬氨酸例如可以被丙氨酸取代)。在一个实施例中,eaCas9分子或eaCas9多肽与野生型的区别在于N-末端RuvC样结构域并且不切割靶核酸、或以显著低于参考Cas9分子的切割活性(例如,低于20%、10%、5%、1%或0.1%)的效率进行切割,如通过本文所述的测定所测量的。参考Cas9分子可以是天然存在的未经修饰的Cas9分子,例如天然存在的Cas9分子,如化脓链球菌或嗜热链球菌的Cas9分子。在一个实施例中,参考Cas9分子是具有最接近序列一致性或同源性的天然存在的Cas9分子。
在一个实施例中,eaCas9分子或eaCas9多肽包含无活性、或无切割能力的HNH结构域和有活性、或有切割能力的N-末端RuvC样结构域(例如,本文所述的N-末端RuvC样结构域,例如SEQ ID NO:15-23)。示例性的无活性、或无切割能力的HNH样结构域可以具有在以下一处或多处的突变:HNH样结构域中的组氨酸(例如,在披露于图2A-2G中的共有序列的位置856处所示的组氨酸例如可以被丙氨酸取代);以及HNH样结构域中的一个或多个天冬酰胺(例如,在披露于图2A-2G中的共有序列的位置870处和/或披露于图2A-2G中的共有序列的位置879处所示的天冬酰胺例如可以被丙氨酸取代)。在一个实施例中,eaCas9与野生型的区别在于HNH样结构域并且不切割靶核酸、或以显著低于参考Cas9分子的切割活性(例如,低于20%、10%、5%、1%或0.1%)的效率进行切割,如通过本文所述的测定所测量的。参考Cas9分子可以是天然存在的未经修饰的Cas9分子,例如天然存在的Cas9分子,如化脓链球菌或嗜热链球菌的Cas9分子。在一个实施例中,参考Cas9分子是具有最接近序列一致性或同源性的天然存在的Cas9分子。
在某些实施例中,示例性Cas9活性包括PAM特异性、切割活性、和解旋酶活性中的一项或多项。一个或多个突变可以存在于,例如:一个或多个RuvC样结构域(例如,N-末端RuvC样结构域);HNH结构域;RuvC结构域和HNH结构域之外的区域中。在一个实施例中,一个或多个突变存在于RuvC结构域中。在一个实施例中,一个或多个突变存在于HNH结构域中。在一个实施例中,突变存在于RuvC结构域和HNH结构域二者中。
可以参照化脓链球菌序列在RuvC结构域或HNH结构域中进行的示例性突变包括:D10A、E762A、H840A、N854A、N863A和/或D986A。
在某些实施例中,Cas9分子可以是与参考Cas9分子相比包含RuvC结构域和/或HNH结构域中的一个或多个差异的eiCas9分子,其中例如在本文所述的切割测定中eiCas9分子不会以比参考Cas9分子明显更低的效率切割核酸或切割,例如,eiCas9分子以比参考Cas9分子(例如相应的野生型Cas9分子)低50%、25%、10%或1%的效率切割。
无论具体序列(例如,取代)是否可以影响一种或多种活性(如靶向活性、切割活性等),例如可以通过评价所述突变是否是保守的来评价或预测。在一个实施例中,“非必需”氨基酸残基,如在Cas9分子的背景下所使用的,是可以改变自Cas9分子的野生型序列(例如,天然存在的Cas9分子(例如,eaCas9分子))的残基,不会消除或更优选地不会实质上改变Cas9活性(例如,裂解活性),而改变“必需”氨基酸残基导致活性(例如,裂解活性)的实质性损失。
在一个实施例中,Cas9分子包含不同于天然存在的Cas9分子(例如,不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如,Cas9分子可以与天然存在的Cas9分子(例如,金黄色葡萄球菌、化脓链球菌、或空肠弯曲菌的Cas9分子)有如下区别:例如,相比于天然存在的Cas9分子(例如,金黄色葡萄球菌、化脓链球菌、或空肠弯曲菌的Cas9分子),它调节(例如,降低或增加)对双链断裂切割的能力(内切核酸酶和/或外切核酸酶活性);例如,相比于天然存在的Cas9分子(例如,金黄色葡萄球菌、化脓链球菌、或空肠弯曲菌的Cas9分子),它调节(例如,降低或增加)对核酸的单链(例如,核酸分子的非互补链或核酸分子的互补链)切割的能力(切口酶活性);或切割核酸分子(例如,双链或单链核酸分子)的能力可以被消除。
在一个实施例中,改变的Cas9分子是包含以下一种或多种活性的eaCas9分子:与RuvC结构域相关的切割活性;与HNH结构域相关的切割活性;与HNH结构域相关的切割活性和与RuvC结构域相关的切割活性。
在某些实施例中,改变的Cas9分子是不切割核酸分子(双链或单链核酸分子)或以显著低于参考Cas9分子的切割活性(如通过本文所述的测定所测量的)(例如,低于20%、10%、5%、1%或0.1%)的效率切割核酸分子的eiCas9分子。参考Cas9分子可以是天然存在的未经修饰的Cas9分子,例如天然存在的Cas9分子,如化脓链球菌、嗜热链球菌、金黄色葡萄球菌、空肠弯曲菌或脑膜炎奈瑟氏菌的Cas9分子。在某些实施例中,参考Cas9分子是具有最接近序列一致性或同源性的天然存在的Cas9分子。在某些实施例中,eiCas9分子缺乏与RuvC结构域相关的实质切割活性和/或与HNH结构域相关的切割活性。
在某些实施例中,改变的Cas9分子或Cas9多肽包含如下序列,其中:
对应于披露于图2A-2G中的共有序列的固定序列的序列与披露于图2A-2G中的共有序列中的固定残基的不多于1%、2%、3%、4%、5%、10%、15%或20%有区别;并且
对应于披露于图2A-2G中的共有序列中由“*”鉴定的残基的序列与来自天然存在的Cas9分子(例如,嗜热链球菌、变形链球菌、化脓链球菌或无害利斯特菌Cas9分子)的对应序列的“*”残基的不多于1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%或40%有区别。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的嗜热链球菌Cas9的氨基酸序列(SEQ ID NO:4)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于嗜热链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的变形链球菌Cas9的氨基酸序列(SEQ ID NO:1)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于变形链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的化脓链球菌Cas9的氨基酸序列(SEQ ID NO:2)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于化脓链球菌的序列的一个或多个氨基酸(例如,取代)。
在一个实施例中,改变的Cas9分子或Cas9多肽是包含披露于图2A-2G中的无害利斯特菌Cas9的氨基酸序列(SEQ ID NO:5)的eaCas9分子或eaCas9多肽,其中在由披露于图2A-2G中的共有序列(SEQ ID NO:14)中的“*”表示的一个或多个残基(例如,2、3、5、10、15、20、30、50、70、80、90、100、200个氨基酸残基)处具有不同于无害利斯特菌的序列的一个或多个氨基酸(例如,取代)。
在某些实施例中,改变的Cas9分子或Cas9多肽(例如,eaCas9分子或eaCas9多肽)可以是例如多种不同Cas9分子(例如,不同物种的两种或更多种天然存在的Cas9分子)中的两种的融合体。例如,可以将一个物种的天然存在的Cas9分子的片段融合到第二物种的Cas9分子的片段上。作为实例,可以将包含N-末端RuvC样结构域的化脓链球菌的Cas9分子的片段融合到包含HNH样结构域的不同于化脓链球菌的物种(例如,嗜热链球菌)的Cas9分子的片段上。
具有改变的PAM识别或无PAM识别的Cas9
天然存在的Cas9分子可以识别特异性PAM序列,例如如上针对例如化脓链球菌、嗜热链球菌、变形链球菌和金黄色葡萄球菌描述的PAM识别序列。
在某些实施例中,Cas9分子或Cas9多肽具有与天然存在的Cas9分子相同的PAM特异性。在其他实施例中,Cas9分子或Cas9多肽具有与天然存在的Cas9分子不相关的PAM特异性、或与它与之具有最接近序列同源性的天然存在的Cas9分子不相关的PAM特异性。例如,可以改变天然存在的Cas9分子,例如以改变PAM识别,例如以改变Cas9分子或Cas9多肽识别的PAM序列以减少脱靶位点和/或改进特异性;或消除PAM识别需要。在某些实施例中,可以改变Cas9分子或Cas9多肽,例如以增加PAM识别序列的长度和/或提高Cas9对高水平一致性(例如,gRNA与PAM序列之间的98%、99%或100%匹配)的特异性,例如以减少脱靶位点和/或增加特异性。在某些实施例中,PAM识别序列的长度在长度上是至少4、5、6、7、8、9、10或15个氨基酸。在一个实施例中,Cas9特异性需要gRNA与PAM序列之间的至少90%、95%、96%、97%、98%、99%或更多的同源性。可以使用定向进化产生识别不同PAM序列和/或具有降低的脱靶活性的Cas9分子或Cas9多肽。描述了可以用于Cas9分子定向进化的示例性方法和系统(参见例如,Esvelt 2011)。可以例如通过本文所述的方法对候选Cas9分子进行评价。
尺寸优化的Cas9
本文所描述的工程化的Cas9分子和工程化的Cas9多肽包括包含减小分子的尺寸但仍保留所希望Cas9特性(例如,基本上天然的构象、Cas9核酸酶活性、和/或靶核酸分子识别)的缺失的Cas9分子或Cas9多肽。本文提供了包含一个或多个缺失和任选地一个或多个接头的Cas9分子或Cas9多肽,其中接头被布置于在所述缺失的侧翼的氨基酸残基之间。用于鉴定参考Cas9分子中的适合缺失的方法、用于产生具有缺失和接头的Cas9分子的方法、以及使用此类Cas9分子的方法在审查本文献后对于本领域的普通技术人员应是清楚的。
具有缺失的Cas9分子(例如,金黄色葡萄球菌、化脓链球菌、或空肠弯曲菌Cas9分子)比对应的天然存在的Cas9分子小,例如具有减少数目的氨基酸。Cas9分子的较小尺寸允许提高递送方法的灵活性,并且由此增加基因组编辑的实用性。Cas9分子可以包含一个或多个不会实质上影响或降低本文所描述的所得Cas9分子的活性的缺失。包含如本文所描述的缺失的Cas9分子中所保留的活性包括以下项中的一种或多种:
切口酶活性,即切割核酸分子的单链(例如,非互补链或互补链)的能力;双链核酸酶活性,即切割双链核酸的两条链并且产生双链断裂的能力,其在一个实施例中是在两种切口酶活性的存在下;
内切核酸酶活性;
外切核酸酶活性;
解旋酶活性,即解旋双链核酸的螺旋结构的能力;
以及核酸分子(例如,靶核酸或gRNA)的识别活性。
可以使用本文所述的或本领域的活性测定来评估本文所述的Cas9分子的活性。
鉴定适于缺失的区域
可以通过多种方法鉴定Cas9分子的适于缺失的区域。可以在化脓链球菌Cas9的晶体结构上建模来自不同细菌物种的天然存在的直向同源Cas9分子(例如,在表1中所列出的那些中的任一种)(Nishimasu 2014),以便相对于所述蛋白的三维构象跨所选的Cas9直向同源物检查保守水平。在空间定位上远离在Cas9活性中所涉及的区域(例如,与靶核酸分子和/或gRNA相互作用)的较不保守的或不保守的区域代表作为用于缺失而不实质上影响或降低Cas9活性的候选物的区域或结构域。
编码Cas9分子的核酸
本文提供了编码Cas9分子或Cas9多肽(例如,eaCas9分子或eaCas9多肽)的核酸。先前已经描述了编码Cas9分子或Cas9多肽的示例性核酸(参见例如,Cong 2013;Wang2013;Mali 2013;Jinek 2012)。
在一个实施例中,编码Cas9分子或Cas9多肽的核酸可以是合成核酸序列。例如,合成核酸分子可以进行化学修饰,例如如本文所述。在一个实施例中,Cas9mRNA具有以下一种或多种(例如,所有)特性:它被5-甲基胞苷和/或假尿苷加帽、聚腺苷酸化、取代。
另外或可替代地,可以对合成核酸序列进行密码子优化,例如至少一个非常见密码子或低不常见密码子已经被常见密码子取代。例如,合成的核酸可以指导优化的信使mRNA的合成(例如,针对在哺乳动物表达系统(例如,本文描述的)中的表达进行优化)。
另外或可替代地,编码Cas9分子或Cas9多肽的核酸可以包含核定位序列(NLS)。核定位序列在本领域是已知的。
编码化脓链球菌的Cas9分子的示例性密码子优化的核酸序列示于SEQ ID NO:3中。化脓链球菌Cas9分子的相应氨基酸序列示于SEQ ID NO:2中。
编码金黄色葡萄球菌的Cas9分子的示例性密码子优化的核酸序列示于SEQ IDNO:7中。金黄色葡萄球菌Cas9分子的氨基酸序列示于SEQ ID NO:6中。
下面提供了编码金黄色葡萄球菌Cas9的Cas9分子的示例性密码子优化的核酸序列。
如果任何上述Cas9序列与肽或多肽在C-末端处融合,则应理解的是终止密码子将被去除。
其他Cas分子和Cas多肽
不同类型的Cas分子或Cas多肽可以用来实践本文所披露的发明。在一些实施例中,使用II型Cas系统的Cas分子。在其他实施例中,使用其他Cas系统的Cas分子。例如,可以使用I型或III型Cas分子。先前已经描述了示例性Cas分子(和Cas系统)(参见例如,Haft2005和Makarova 2011)。示例性Cas分子(和Cas系统)也示于表2中。
候选分子的功能分析
可以通过领域已知的方法或如本文所述的技术来评价候选Cas9分子、候选gRNA分子和候选Cas9分子/gRNA分子复合物。本文所述的每种技术可以单独使用或与一种或多种技术组合使用以评价候选分子。本文所披露的技术可以用于多种方法,包括但不限于,测定Cas9分子/gRNA分子复合物的稳定性的方法,测定促进稳定的Cas9分子/gRNA分子复合物的条件的方法,筛选稳定的Cas9分子/gRNA分子复合物的方法,鉴定最佳gRNA以形成稳定的Cas9分子/gRNA分子复合物的方法,筛选用于给予受试者的Cas9分子/gRNA分子复合物的方法,以及选择用于给予受试者的Cas9分子/gRNA分子复合物的方法。
用于测量Cas9/gRNA复合物的热稳定性的技术
可以通过差示扫描荧光测定法(DSF)和其他技术来检测Cas9-gRNA核糖核蛋白(RNP)复合物的热稳定性。蛋白质的热稳定性可以在有利条件下增加,例如添加结合型RNA分子,例如gRNA。因此,关于Cas9/gRNA复合物的热稳定性的信息对于确定所述复合物是否稳定是有用的。
差示扫描荧光测定法(DSF)
DSF是一种可以用于测量蛋白质的热稳定性的技术。所述测定可以按多种方式应用。示例性方案包括但不限于,确定RNP形成的所希望的溶液条件的方案(测定1,见下文),测试gRNA:Cas9蛋白的所希望的化学计量比的方案(测定2,见下文),筛选针对Cas9分子(例如野生型或突变型Cas9分子)的有效gRNA分子的方案(测定3,见下文)以及在靶DNA存在下检查RNP形成的方案(测定4)。
测定1
为了确定形成RNP复合物的所希望的溶液,将Cas9的2μM溶液置于水与10x SYPRO
Figure BDA0001491286140000591
(生命技术公司(Life Techonologies)目录#S-6650)中并分配到384孔板中。然后添加稀释于溶液中的具有不同pH和盐的等摩尔量的gRNA。在室温下孵育10分钟并在2000rpm下离心以去除任何气泡之后,使用带有Bio-Rad CFX Manager软件的Bio-RadCFX384TMReal-Time System C1000TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
测定2
第二个测定包括在来自上述测定1的缓冲液中混合不同浓度的gRNA分子与2μMCas9并在384孔板中于RT下孵育10分钟。添加等体积的最适缓冲液与10x SYPRO
Figure BDA0001491286140000592
(生命技术公司目录#S-6650)并且将板用
Figure BDA0001491286140000593
B粘合剂(MSB-1001)密封。在2000rpm下离心以去除任何气泡后,使用带有Bio-Rad CFX Manager软件的Bio-Rad CFX384TMReal-Time System C1000TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
测定3
在第三个测定中,纯化感兴趣的Cas9分子(例如Cas9蛋白,例如Cas9变体蛋白)。合成变体gRNA分子的文库并重悬浮至20μM的浓度。在5x SYPRO
Figure BDA0001491286140000601
(生命技术公司目录#S-6650)的存在下,将Cas9分子与gRNA分子以各自1μM的终浓度一起在预定缓冲液中进行孵育。在室温下孵育10分钟并在2000rpm下离心2分钟以去除任何气泡之后,使用带有Bio-Rad CFX Manager软件的Bio-Rad CFX384TMReal-Time System C1000TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
测定4
在第四个测定中,使用以下样品进行DSF实验:单独的Cas9蛋白,Cas9蛋白与gRNA,Cas9蛋白与gRNA和靶DNA,以及Cas9蛋白与靶DNA。混合组分的顺序为:反应溶液、Cas9蛋白、gRNA、DNA和SYPRO Orange。在不存在或存在MgCl2的情况下,反应溶液含有10mM HEPES pH7.5、100mM NaCl。在2000rpm下离心2分钟以去除任何气泡后,使用带有Bio-Rad CFXManager软件的Bio-Rad CFX384TMReal-Time System C1000TouchTM热循环仪运行从20℃至90℃的梯度,其中温度每10秒增加1℃。
如本文所述的实例1和2披露了使用DSF评价和测定Cas9分子和Cas9/gRNA复合物的稳定性的示例性结果。如本文所示,与不存在gRNA分子下的Cas9分子的Tm值相比,Cas9/gRNA复合物的较高的Tm值表明Cas9与gRNA之间的更紧密的复合。因此,关于Cas9分子和Cas9/gRNA复合物的Tm的信息对于确定所述Cas9/gRNA复合物是否稳定是有用的。
除了DSF之外,还有许多本领域已知的可用于测定Cas9分子/gRNA分子复合物或其制剂中Cas9分子的稳定性的另外的技术。这些包括测量热稳定性的DSF的替代方法,包括但不限于差示扫描量热法(DSC)和等温滴定量热法(ITC)。
DSC
DSC是一种在不同缓冲液以及apo与复合物中测量材料的热稳定性方面高度精确的技术。DSC的优势在于它还可以提供样品之间的转变焓的差异。然而,DSC需要比DSF显著更大量的材料来运行(>50倍以上)。DSC的流通量较低,因为它只能一次运行单个样品。
ITC
ITC可以测量两个分子的相互作用的热稳定性和动力学速率。ITC与其他技术相比的优势在于它提供更精确的测量和动力学信息。然而,它需要更低的流通量和更大量的材料。
本文所披露的热稳定性技术可以用于测量分子(例如Cas9分子)的热稳定性,其可以在诸如添加结合性RNA分子的有利条件下增加。此外,分子的热稳定性可以在诸如存在组分的有利条件下增加。在某些实施例中,所述组分可以包括添加剂、小分子、稳定剂、缓冲液、pH、盐浓度、甘油浓度或其他缓冲组分。
在某些实施例中,如果分子的热稳定性值大于参考分子的热稳定性值或热稳定性参考值,则可以选择或确定所述分子(例如,as9/gRNA复合物)是稳定的。在某些实施例中,被测量的热稳定性值是分子的变性温度值。例如,在某些实施例中,如果分子的变性温度值大于参考分子的变性温度值或变性温度参考值,则可以选择或确定所述分子(例如,as9/gRNA复合物)是稳定的。在某些实施例中,被测量的热稳定性值是分子的Tm值。例如,在某些实施例中,如果分子的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定所述分子(例如,as9/gRNA复合物)是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的as9分子。
在某些实施例中,如果分子的Tm值比参考分子的Tm值或Tm参考值大至少1℃、至少2℃、至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少11℃、至少12℃、至少13℃、至少14℃、至少15℃、至少16℃、至少17℃、至少18℃、至少19℃、至少20℃、至少21℃、至少22℃、至少23℃、至少24℃、至少25℃、至少26℃、至少27℃、至少28℃、至少29℃、至少30℃、至少31℃、至少32℃、至少33℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少43℃、至少44℃、至少45℃、至少46℃、至少47℃、至少48℃、至少49℃或至少50℃,则可以选择或确定被评价的分子是稳定的。例如,如果分子的Tm值比参考分子的Tm值或Tm参考值大至少8℃,则可以选择或确定被评价的分子是稳定的。
在某些实施例中,如果分子的Tm值比参考分子的Tm值或Tm参考值大约1℃、约2℃、约3℃、约4℃、约5℃、约6℃、约7℃、约8℃、约9℃、约10℃、约11℃、约12℃、约13℃、约14℃、约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃或约50℃,则可以选择或确定被评价的分子是稳定的。例如,如果分子的Tm值比参考分子的Tm值或Tm参考值大约8℃,则可以选择或确定被评价的分子是稳定的。
在某些实施例中,如果分子的Tm值比参考分子的Tm值或Tm参考值大约1℃至约5℃、约6℃至约10℃、约11℃至约15℃、约16℃至约20℃、约21℃至约25℃、约26℃至约30℃、约31℃至约35℃、约36℃至约40℃、约41℃至约45℃、约46℃至约50℃,则可以选择或确定被评价的分子是稳定的。例如,如果分子的Tm值比参考分子的Tm值或Tm参考值大约6℃至约10℃,则可以选择或确定被评价的分子是稳定的。在某些实施例中,如果分子的Tm值比参考分子的Tm值或Tm参考值大约8℃至约9℃,则可以选择或确定被评价的分子是稳定的。
在某些实施例中,本文提供的方法可以包括以下步骤:检测as9分子/gRNA分子复合物的Tm值,确定as9分子/gRNA分子复合物的Tm值与参考分子的Tm值或Tm参考值之间的Δ值,以及如果Δ值为至少8℃且as9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则确定as9分子/gRNA分子复合物是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的as9分子。
在某些实施例中,如果被评价的分子的Tm值与参考分子的Tm值或Tm参考值之间的Δ值是至少1℃、至少2℃、至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少11℃、至少12℃、至少13℃、至少14℃、至少15℃、至少16℃、至少17℃、至少18℃、至少19℃、至少20℃、至少21℃、至少22℃、至少23℃、至少24℃、至少25℃、至少26℃、至少27℃、至少28℃、至少29℃、至少30℃、至少31℃、至少32℃、至少33℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少43℃、至少44℃、至少45℃、至少46℃、至少47℃、至少48℃、至少49℃或至少50℃,并且被评价的分子的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定被评价的分子是稳定的。在某些实施例中,被评价的分子可以是as9分子/gRNA分子复合物,并且参考分子可以是不存在gRNA分子下的as9分子。
在某些实施例中,如果被评价的分子的Tm值与参考分子的Tm值或Tm参考值之间的Δ值是约1℃、约2℃、约3℃、约4℃、约5℃、约6℃、约7℃、约8℃、约9℃、约10℃、约11℃、约12℃、约13℃、约14℃、约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃或约50℃,并且被评价的分子的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定被评价的分子是稳定的。例如,如果Δ值为约8℃并且as9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定所述as9分子/gRNA分子复合物是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的as9分子。
在某些实施例中,如果被评价的分子的Tm值与参考分子的Tm值或Tm参考值之间的Δ值是约1℃至约5℃、约6℃至约10℃、约11℃至约15℃、约16℃至约20℃、约21℃至约25℃、约26℃至约30℃、约31℃至约35℃、约36℃至约40℃、约41℃至约45℃、约46℃至约50℃,并且被评价的分子的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定被评价的分子是稳定的。例如,如果Δ值为约6℃至约10℃并且as9分子/gRNA分子复合物的Tm值大于参考分子的Tm值或Tm参考值,则可以选择或确定所述as9分子/gRNA分子复合物是稳定的。在某些实施例中,参考分子可以是不存在gRNA分子下的as9分子。
在某些实施例中,本文使用的方法可以用于评价与as9分子复合的、具有不同长度的多种gRNA,以确定哪种as9/gRNA复合物形成稳定的as9/gRNA复合物。这些方法还可以用于评价as9分子和gRNA分子的不同化学计量,以确定哪种as9/gRNA复合物形成稳定的as9/gRNA复合物。
在某些实施例中,可以通过将as9分子和多个gRNA分子中的一个进行组合来产生多个样品,每个样品包含as9/gRNA复合物。在某些实施例中,可以在多个样品中的每个中检测as9/gRNA复合物的Tm值。在某些实施例中,可以基于以下项中的一项或多项来从多个样品中选择至少一个样品:(i)多个样品中的Tm值与参考as9/gRNA复合物的Tm值或预定阈值Tm值的比较,或(ii)多个样品的Tm值的相对排序。在某些实施例中,可以通过DSF检测Tm值。在某些实施例中,如果as9分子/gRNA分子复合物的Tm值比不存在gRNA分子下的as9分子的Tm值大至少8℃,则可以选择至少一个样品。
用于测量as9和as9/gRNA复合物的活性的技术
除了热稳定性技术之外,还有可以与本文方法一起使用的本领域已知的各种其他技术。例如,可以测量as9分子/gRNA分子复合物或其分子的某些活性,以选择或确定所述as9分子/gRNA分子复合物或其分子是否稳定。这些技术可以单独使用或与本文所述的热稳定性技术结合使用以确定as9分子/gRNA分子复合物或其分子是否稳定。本文所披露的技术可以用于检测被评价的分子(例如,as9分子/gRNA分子复合物中的as9分子、as9分子/gRNA分子复合物中的gRNA分子、或as9分子/gRNA分子复合物或其制剂)的活性。在某些实施例中,可以测量被评价的分子的活性值。在某些实施例中,如果被评价的分子的活性值大于参考分子的活性值或活性参考值,则可以选择或确定被评价的分子是稳定的。
可以被检测的待评价的分子的各种活性包括分子的结合活性和切割活性。可以使用本文所述的技术来检测待评价分子的结合活性和切割活性。
分子的结合活性的一些实例包括但不限于,gRNA分子与DNA靶保持杂交的能力、gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力、或gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力。在某些实施例中,当检测分子的结合活性时,可以测量结合值。在某些实施例中,如果被评价的分子的结合值大于参考分子的结合值或结合参考值,则可以选择或确定被评价的分子是稳定的。
切割活性的一些实例可以包括但不限于,诱导indel的能力、修饰靶DNA的能力以及预选修复方法的倾向。在某些实施例中,当检测切割活性时,可以测量切割值。在某些实施例中,如果被评价的分子的切割值大于参考分子的切割值或切割参考值,则可以选择或确定被评价的分子是稳定的。
用于测量Cas9和Cas9/gRNA复合物的结合活性(动力学)的技术
可以使用各种技术检测被评价的分子(例如,Cas9分子/gRNA分子复合物中的Cas9分子、Cas9分子/gRNA分子复合物中的gRNA分子、或Cas9分子/gRNA分子复合物或其制剂)的结合活性。两个分子之间的结合动力学可以在诸如组分存在的某些条件下是更有利的。在某些实施例中,所述组分可以包括添加剂、小分子、稳定剂、缓冲液、pH、盐浓度、甘油浓度或其他缓冲组分或特定组分的添加。
包括检测Cas9/gRNA复合物的结合活性的方法包括但不限于,检测gRNA分子与Cas9分子/gRNA分子复合物的Cas9分子结合的能力,以及检测Cas9分子和Cas9/gRNA复合物结合靶DNA的能力。可以使用诸如动力学测定的技术执行这些方法,动力学测定提供关于被评价分子的结合的生物物理信息。可以使用的动力学测定的一些实例是但不限于,如下所述的表面等离子体共振(SPR)、生物层干涉法(BLI)和凝胶带移位测定。
SPR
SPR需要使用BiaCore或ProteOn XPR系统。在这种技术中,一个分子共价地或经由亲和方法连接到芯片表面。将第二分子注入流动池并经由缓冲液推动。反射光角度的变化导致等离子体共振量的变化。由此可以测量动力学结合和分离。
BLI
BLI需要福特生物公司(fortéBio)的称为Octet的仪器。与SPR类似,BLI能够确定两个分子之间的相互作用的动力学速率。
凝胶带移位测定
凝胶带移位测定(例如,电泳迁移率变动测定)是确定两个相互作用分子的KD的另一种方法。该测定比其他可用技术更粗,但是具有可以用相对便宜的试剂进行的优势。
结合测定:测试Cas9分子和Cas9/gRNA复合物与靶DNA的结合
先前已经描述了用于评价Cas9分子与靶DNA的结合的示例性方法(Jinek 2012)。本文所述的技术(如SPR、BLI和凝胶带移位测定)可以用于测量例如gRNA分子结合Cas9分子/gRNA分子复合物的Cas9分子的能力、或Cas9分子和Cas9/gRNA复合物结合靶DNA的能力。
例如,在电泳迁移率变动测定中,通过在去离子水中混合每条链(10nmol),加热至95℃持续3分钟并且缓慢冷却至室温而形成靶DNA双链体。将所有DNA在含有1X TBE的8%非变性凝胶上进行纯化。将DNA条带通过UV遮蔽进行可视化,切除,并且通过将凝胶片浸泡在DEPC处理的H2O中进行洗脱。将洗脱的DNA进行乙醇沉淀并且溶解在DEPC处理的H2O中。在37℃下,使用T4多核苷酸激酶将DNA样品用[γ-32P]-ATP进行5'端标记持续30分钟。将多核苷酸激酶在65℃下热变性持续20分钟,并且使用柱去除未结合的放射性标记。在10μL的总体积中,在含有20mM HEPES pH7.5、100mM KCl、5mM MgCl2、1mM DTT以及10%甘油的缓冲液中进行结合测定。用等摩尔量的预退火的gRNA分子对Cas9蛋白分子进行程序化,并且从100pM滴定至1μM。将放射性标记的DNA添加至20pM的终浓度。将样品在37℃下孵育1小时并且在4℃下在含有1X TBE和5mM MgCl2的8%天然聚丙烯酰胺凝胶上进行解析。将凝胶干燥并且通过感光成像进行DNA可视化。
用于测量Cas9/gRNA复合物的切割活性的技术
本文所述的方法可以包括检测Cas9/gRNA复合物的切割活性。这可以包括检测Cas9/gRNA复合物修饰靶DNA的能力,例如Cas9/gRNA复合物切割靶核酸的能力。本文描述了可以用于检测Cas9/gRNA复合物的切割活性的技术的一些实例。
切割测定:测试Cas9分子/gRNA分子复合物的内切核酸酶活性
可以测试以确定Cas9/gRNA复合物的稳定性的另外的活性包括Cas9/gRNA复合物修饰靶DNA的能力,例如Cas9/gRNA复合物切割靶核酸的能力。可以如本文披露的那样测量Cas9/gRNA复合物的内切核酸酶活性。例如,先前已经描述了用于评价Cas9分子的内切核酸酶活性的示例性方法(Jinek 2012)。
可以在质粒切割测定中对Cas9分子/gRNA分子复合物结合至并且切割靶核酸的能力进行评价。在这个测定中,在反应之前通过加热至95℃并且缓慢冷却至室温,将合成或体外转录的gRNA分子预退火。在37℃下,将天然或限制酶切消化-线性化的质粒DNA(300ng(约8nM))用纯化的Cas9蛋白分子(50-500nM)和gRNA(50-500nM,1:1)在具有或不具有10mMMgCl2的Cas9质粒切割缓冲液(20mM HEPES pH 7.5、150mM KCl、0.5mM DTT、0.1mM EDTA)中孵育60分钟。用5X DNA加样缓冲液(30%甘油、1.2%SDS、250mM EDTA)终止反应,通过0.8%或1%琼脂糖凝胶电泳进行解析并且通过溴化乙锭染色进行可视化。所得切割产物指示Cas9分子是否切割两条DNA链、或仅切割两条链中的一条。例如,线性DNA产物指示两条DNA链的切割,而有缺口的开放圆形产物指示两条链中只有一条被切割。
可替代地,可以在寡核苷酸DNA切割测定中对Cas9分子/gRNA分子复合物结合至并且切割靶核酸的能力进行评价。在这个测定中,在37℃下,在50μL反应中,通过用在1X T4多核苷酸激酶反应缓冲液中的5单位T4多核苷酸激酶以及约3-6pmol(约20-40mCi)[γ-32P]-ATP孵育30分钟,对DNA寡核苷酸(10pmol)进行放射性标记。在热灭活后(65℃持续20min),通过柱对反应进行纯化以去除未结合的标记。通过在95℃下用等摩尔量的未标记的互补寡核苷酸退火标记的寡核苷酸持续3分钟,随后缓慢冷却至室温而生成双链体底物(100nM)。对于切割测定,通过加热至95℃持续30秒,随后缓慢冷却至室温对gRNA分子进行退火。在9μL的总体积中,将Cas9(500nM终浓度)与退火的gRNA分子(500nM)在切割测定缓冲液(20mMHEPES pH 7.5、100mM KCl、5mM MgCl2、1mM DTT、5%甘油)中进行预孵育。通过添加1μL靶DNA(10nM)开始反应并在37℃下孵育1小时。将反应通过添加20μL的加样染料(5mM EDTA、0.025%SDS、5%甘油,在甲酰胺中)淬灭并加热至95℃持续5分钟。将切割产物在含有7M尿素的12%变性聚丙烯酰胺凝胶上进行解析,并且通过磷成像进行可视化。所得切割产物指示互补链、非互补链、或两者是否被切割。
这些测定中的一个或两个可以用于确定Cas9/gRNA复合物的稳定性并评价候选gRNA分子或候选Cas9分子的适用性。
基因组编辑方法
本文所述的方法可以用于评价Cas9分子/gRNA分子复合物。使用本文所讨论的方法或途径中的一种或多种,这些Cas9分子/gRNA分子复合物可以用于靶向基因。在某些实施例中,使用外源提供的模板核酸通过HDR来校正靶基因中的突变。在其他实施例中,在不使用外源提供的模板核酸的情况下,通过HDR来校正靶基因中的突变。在某些实施例中,使用NHEJ敲除靶基因的一个或两个等位基因。在某些实施例中,靶基因的表达被敲低。本文所述的方法可以用于评价Cas9分子/gRNA分子复合物对于本文所讨论的一种或多种方法或途径是否是令人希望的。
HDR修复和模板核酸
如本文所述,可以使用核酸酶诱导的HDR来改变靶序列内的靶位置(例如,校正,例如修复或编辑基因组中的突变)。
在某些实施例中,用于改变靶位置的基于HDR的方法利用外源提供的模板核酸(本文也称为供体构建体或供体模板)。虽然不希望受理论束缚,但认为靶位置的改变通过用外源提供的供体模板或模板核酸进行HDR而发生。在此考虑了可以将质粒供体模板用作用于同源重组的模版。在此进一步考虑了可以通过在靶序列和供体模板之间的HDR(例如,单链退火)的替代方法,将单链供体模板用作用于改变靶位置的模板。通过供体模板实现的靶位置改变取决于Cas9分子的切割。经由Cas9切割可以包括双链断裂或两个单链断裂。
在其他实施例中,用于改变靶位置的基于HDR的方法不使用外源提供的模板核酸。虽然不希望受理论束缚,但认为靶位置的改变通过用内源基因组供体序列进行HDR而发生。在某些实施例中,内源基因组供体序列位于与靶位置相同的染色体上。在其他实施例中,内源基因组供体序列位于与靶序列不同的染色体上。通过内源基因组供体序列改变靶位置取决于Cas9分子的切割。经由Cas9切割可以包括双链断裂或两个单链断裂。
可以使用模板核酸或使用内源基因组供体序列通过HDR校正的突变包括点突变。在某些实施例中,可以使用一个双链断裂或两个单链断裂来校正点突变。在某些实施例中,点突变可以通过以下项来校正:(1)一个双链断裂,(2)两个单链断裂,(3)两个双链断裂,其中断裂发生在靶位置的每一侧,(4)一个双链断裂和两个单链断裂,其中双链断裂和两个单链断裂发生在靶位置的每一侧,(5)四个单链断裂,其中一对单链断裂发生在靶位置的每一侧,或(6)一个单链断裂。
在使用单链模板核酸的某些实施例中,靶位置可以通过替代的HDR来改变。
通过供体模板实现的靶位置改变取决于Cas9分子的切割。经由Cas9切割可以包括切口、双链断裂或两个单链断裂(例如靶核酸的每条链上的一个断裂)。在靶核酸上引入断裂之后,在断裂端发生切除,产生单链的突出DNA区域。
在典型HDR中,引入包含与靶核酸同源的序列的双链供体模板,其将会直接掺入靶核酸中或用作模板以校正靶核酸序列。在断裂处切除后,修复可以通过不同的途径进行,例如通过双霍利迪连接模型(或双链断裂修复(DSBR)途径)或合成依赖性链退火(SDSA)途径。在双霍利迪连接模型中,发生由靶核酸的两个单链突出端进行链入侵到供体模板中的同源序列,导致形成具有两个霍利迪连结的中间体。当从入侵链的末端合成新的DNA以填充由切除产生的空位时,结点迁移。将新合成的DNA的末端连接到切除的末端,并且结点被分解,导致靶核酸的校正,例如将供体模板的正确序列掺入相应的靶位置。与供体模板的交叉可能会在结点分解时发生。在SDSA途径中,只有一个单链突出端侵入供体模板,并从入侵链的末端合成新的DNA以填补由切除产生的空位。然后新合成的DNA与剩余的单链突出端退火,合成新的DNA以填补空位,并将链连接以产生校正的DNA双链体。
在可替代的HDR中,引入单链供体模板,例如模板核酸。用于改变所希望的A1AT靶位置的靶核酸处的切口、单链断裂或双链断裂由例如本文所述的Cas9分子介导,并且在断裂处发生切除以显示单链突出端。掺入模板核酸序列以校正或改变靶核酸的靶位置通常通过如上所述的SDSA途径而发生。
在国际申请PCT/US2014/057905中的标题为“模板核酸”的第IV节中提供了关于模板核酸的另外的细节。
用于基因靶向的NHEJ方法
如本文所述,核酸酶诱导的NHEJ可以用于靶向基因特异性敲除并去除(例如,缺失)感兴趣的基因中的序列。
虽然不希望受理论束缚,但认为在某些实施例中,与本文所描述的方法相关的基因组改变依赖于核酸酶诱导的NHEJ以及NHEJ修复途径的易错性质。NHEJ通过将两端连接在一起修复DNA中的双链断裂;然而,通常,只有两个相容末端(完全如它们通过双链断裂所形成的)是完全连接的,原始序列才被恢复。在末端重新连接之前,双链断裂的DNA末端常常是酶加工的受试者,在一条或两条链处产生核苷酸的添加或去除。这使得NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。典型地,这些突变中的三分之二改变阅读框并且因此产生非功能蛋白。另外,维持阅读框但插入或缺失大量的序列的突变可以破坏蛋白质的功能性。这是基因座依赖性的,因为关键功能结构域中的突变可能比蛋白质的非关键区中的突变耐受性低。
由NHEJ产生的indel突变在性质上是不可预测的;然而,在给定的断裂位点处,某些indel序列是有利的并且在群体中过度表达,这可能归因于微同源性的小区域。缺失的长度可以广泛变化;它们最常见地在1-50bp范围内,但是可以达到大于100-200bp。插入往往是较短的并且常常包括紧密围绕断裂位点的序列的短的重复。然而,有可能获得大插入,并且在这些情况中,插入序列通常已经被追溯至基因组的其他区域或至存在于细胞中的质粒DNA。
因为NHEJ是诱变的过程,所以它还可以用于缺失小序列基序(例如,长度上小于或等于50个核苷酸的基序),只要不需要产生特异性最终序列。如果双链断裂被靶向靶序列附近,则由NHEJ修复导致的缺失突变常常跨越并且因此去除不想要的核苷酸。对于较大的DNA区段的缺失,引入两个双链断裂(序列的每侧上一个双链断裂)可以在末端之间产生NHEJ,其中去除了整个间插序列。以这种方式,可以缺失大至几百千碱基的DNA区段。这两种方法都可以用于缺失特异性DNA序列;然而,NHEJ的易出错性质仍可能在修复位点产生indel突变。
双链切割性eaCas9分子和单链、或切口酶,eaCas9分子均可以用于本文所描述的方法和组合物以产生NHEJ介导的indel。靶向基因的NHEJ介导的indel(例如编码区,例如感兴趣基因的早期编码区)可以用于敲除感兴趣的基因(即,消除其表达)。例如,感兴趣基因的早期编码区包括紧跟着起始密码子、在编码序列的第一外显子之内、或在起始密码子的500bp之内(例如,小于500、450、400、350、300、250、200、150、100或50bp)的序列。
靶向敲低
与CRISPR/Cas介导的基因敲除不同(其通过在DNA水平使基因突变而永久消除表达),CRISPR/Cas敲低通过使用人工转录因子允许基因表达暂时减少。使Cas9蛋白的两个DNA切割结构域中的关键残基突变(例如,D10A和H840A突变)导致产生无酶促活性Cas9(eiCas9,也称为失活的Cas9或dCas9)分子。eiCas9与gRNA复合并且定位至由gRNA的靶向结构域指定的DNA序列,但不切割靶DNA。将eiCas9融合至效应子结构域(例如,转录阻遏结构域)能够将效应子募集到由gRNA指定的任何DNA位点。尽管当被募集到编码序列中的早期区时eiCas9本身可以阻断转录,但可以通过将转录阻遏结构域(例如KRAB、SID或ERD)融合至eiCas9并且将其募集到靶敲低位置(例如在起始密码子的3'序列的1000bp内或在基因起始密码子的5'启动子区的500bp内)来实现更稳健的阻遏。很可能靶向启动子的DNA酶I超敏位点(DHS)可产生更有效的基因阻遏或激活,因为这些区域更有可能接触到Cas9蛋白并且也更有可能为内源转录因子携带位点。尤其针对基因阻遏,本文考虑了阻断内源转录因子的结合位点将有助于下调基因表达。在某些实施例中,一种或多种eiCas9分子可以用于阻断一种或多种内源转录因子的结合。在其他实施例中,eiCas9分子可以与染色质修饰蛋白融合。改变染色质状态可以导致靶基因的表达降低。与一种或多种染色质修饰蛋白融合的一种或多种eiCas9分子可以用于改变染色质状态。
在某些实施例中,可以将gRNA分子靶向已知的转录应答元件(例如,启动子、增强子等)、已知的上游激活序列(UAS)、和/或具有怀疑能够控制靶DNA表达的未知或已知功能的序列。
CRISPR/Cas介导的基因敲低可以用于减少不想要的等位基因或转录物的表达。本文考虑的是永久破坏基因是不理想的情形。在这些情形中,位点特异性阻遏可以用于暂时降低或消除表达。本文还考虑了Cas阻遏物的脱靶效应可能比Cas核酸酶的脱靶效应更不严重,因为核酸酶可以切割任何DNA序列并且造成突变,而Cas阻遏物仅在其靶向转录活跃基因的启动区时才可具有效应。然而,尽管核酸酶介导的敲除是永久的,只有Cas阻遏物存在于细胞中,阻遏才可以持续。一旦阻遏物不再存在,很可能内源转录因子和基因调节元件将使表达恢复至它的天然状态。
单链退火
单链退火(SSA)是另一种修复存在于靶核酸中的两个重复序列之间的双链断裂的DNA修复过程。由SSA途径所利用的重复序列的长度通常大于30个核苷酸。在断裂端处发生切除,以显示靶核酸的两条链上的重复序列。切除之后,将含有重复序列的单链突出端用RPA蛋白涂覆,以防止重复序列不适当地退火,例如退火至自身。RAD52结合至突出端上的重复序列中的每者上并且将所述序列对齐以使得互补的重复序列能够退火。退火之后,切割突出端的单链翼。新的DNA合成填充任何空位,并且连接恢复DNA双链体。作为所述处理的结果,两个重复之间的DNA序列被缺失。缺失的长度可以取决于很多因素,包括所利用的两个重复的位置、以及切除的途径或持续进行能力。
与HDR途径相反,SSA不需要模板核酸来改变或校正靶核酸序列。而是利用互补的重复序列。
其他DNA修复途径
SSBR(单链断裂修复)
基因组中的单链断裂(SSB)由SSBR途径来修复,所述SSBR途径是不同于上文讨论的DSB修复机制的机制。SSBR途径具有四个主要阶段:SSB检测、DNA末端处理、DNA空位填充、以及DNA连接。更详细的解释给出于Caldecott 2008中,并且这里给出概述。
在第一阶段中,当形成SSB时,PARP1和/或PARP2识别断裂并募集修复机器。DNA断裂处的PARP1结合和活性是瞬时的,并且它似乎通过促进损伤处的SSBR蛋白复合物的病灶积累或稳定性而加速SSBR。可论证地,这些SSBR蛋白中最重要的是XRCC1,它作为分子支架起作用,所述分子支架与SSBR过程的多种酶组分(包括负责清除DNA 3'和5'端的蛋白质)相互作用,使所述酶组分稳定化,并且刺激所述酶组分。例如,XRCC1与促进末端处理的若干蛋白质(DNA聚合酶β、PNK、和三种核酸酶APE1、APTX和APLF)相互作用。APE1具有内切核酸酶活性。APLF展示出内切核酸酶和3'到5'外切核酸酶活性。APTX具有内切核酸酶和3'到5'外切核酸酶活性。
这种末端处理是SSBR的重要阶段,因为大部分(若非全部)SSB的3'-和/或5'-末端是‘被损伤的’。末端处理通常涉及将被损伤的3'-端恢复到羟基化状态和/或将被损伤的5'端恢复成磷酸酯部分,这样使得所述末端变得有连接能力。可以处理被损伤的3'末端的酶包括PNKP、APE1、和TDP1。可以处理被损伤的5'末端的酶包括PNKP、DNA聚合酶β、和APTX。LIG3(DNA连接酶III)也可以参与末端处理。一旦将末端清除,便发生空位填充。
在DNA空位填充阶段,典型存在的蛋白质是PARP1、DNA聚合酶β、XRCC1、FEN1(翼内切核酸酶1)、DNA聚合酶δ/ε、PCNA、以及LIG1。存在两种空位填充方式,短补丁修复(shortpatch repair)和长补丁修复(long patch repair)。短补丁修复涉及插入丢失的单核苷酸。在一些SSB处,“空位填充”可能继续取代两个或更多个核苷酸(已经报道了多达12个碱基的取代)。FEN1是去除被取代的5'-残基的内切核酸酶。多种DNA聚合酶(包括Polβ)涉及在SSB的修复中,其中DNA聚合酶的选择受SSB的来源和类型的影响。
在第四阶段中,DNA连接酶如LIG1(连接酶I)或LIG3(连接酶III)催化末端连接。短补丁修复使用连接酶III,并且长补丁修复使用连接酶I。
有时,SSBR是与复制偶联的。这条途径可以涉及CtIP、MRN、ERCC1、和FEN1中的一者或多者。可以促进SSBR的另外的因子包括:aPARP、PARP1、PARP2、PARG、XRCC1、DNA聚合酶b、DNA聚合酶d、DNA聚合酶e、PCNA、LIG1、PNK、PNKP、APE1、APTX、APLF、TDP1、LIG3、FEN1、CtIP、MRN、以及ERCC1。
MMR(错配修复)
细胞含有三条切除修复途径:MMR、BER、和NER。所述切除修复途径具有的共同特点在于它们典型地识别DNA一条链上的损伤,然后外切/内切核酸酶去除所述损伤并且留下随后被DNA聚合酶填充的1-30个核苷酸的空位并且最终用连接酶密封。更完整的图片给出于Li 2008中,并且这里提供了概述。
错配修复(MMR)在错配的DNA碱基上运行。
MSH2/6或MSH2/3两种复合物都具有在错配识别和修复启动中发挥重要作用的ATP酶活性。MSH2/6优先识别碱基-碱基错配并且鉴定1或2个核苷酸的错配,而MSH2/3优先识别较大的ID错配。
hMLH1与hPMS2杂二聚化,以形成hMutLα,其具有ATP酶活性并且对于MMR的多个步骤而言是重要的。它具有PCNA/复制因子C(RFC)依赖性内切核酸酶活性,所述活性在涉及EXO1(EXO1是HR和MMR两者中的参与者)的3′切口指导的MMR中发挥重要作用。它调节错配引起的切除的终止。连接酶I是这条途径的相关连接酶。可以促进MMR的另外的因子包括:EXO1、MSH2、MSH3、MSH6、MLH1、PMS2、MLH3、DNA Pol d、RPA、HMGB1、RFC、以及DNA连接酶I。
碱基切除修复(BER)
碱基切除修复(BER)途径贯穿细胞周期是激活的;它主要负责从基因组中去除小的、非螺旋扭曲碱基损伤。相比之下,相关的核苷酸切除修复途径(在下一部分中讨论)修复庞大的螺旋扭曲损伤。更详细的解释给出于Caldecott 2008中,并且这里给出概述。
DNA碱基损伤后,碱基切除修复(BER)启动并且所述过程可以被简化为五个主要步骤:(a)去除被损伤的DNA碱基;(b)切开后续碱基位点;(c)清理DNA末端;(d)将正确核苷酸插入修复空位中;以及(e)连接DNA骨架中的剩余切口。这些最后的步骤类似于SSBR。
在第一步中,损伤特异性DNA糖基化酶通过切割将碱基连接至糖磷酸骨架上的N-糖苷键而切除被损伤的碱基。然后具有相关裂解酶活性的AP内切核酸酶-1(APE1)或双功能DNA糖基化酶切开磷酸二酯骨架以产生DNA单链断裂(SSB)。BER的第三步涉及清理DNA末端。BER中的第四步由Polβ进行,它将新的互补核苷酸添加到修复空位中,并且在最终步骤中,XRCC1/连接酶III密封DNA骨架中的剩余切口。这完成了短补丁BER途径,其中大多数(约80%)的被损伤的DNA碱基得到修复。然而,如果在步骤3中在通过Polβ插入一个核苷酸后5′-端对末端处理活性有抗性,则将聚合酶换为复制型DNA聚合酶Polδ/ε,所述复制型DNA聚合酶然后再将约2-8个核苷酸添加到DNA修复空位中。这产生了5′翼结构,其被与持续合成能力因子增殖细胞核抗原(PCNA)相关的翼内切核酸酶-1(FEN-1)识别并切除。DNA连接酶I然后密封DNA骨架中的剩余切口并完成长补丁BER。可以促进BER途径的另外的因子包括:DNA糖基化酶、APE1、Polb、Pold、Pole、XRCC1、连接酶III、FEN-1、PCNA、RECQL4、WRN、MYH、PNKP、以及APTX。
核苷酸切除修复(NER)
核苷酸切除修复(NER)是从DNA中去除庞大的螺旋扭曲损伤的重要切除机制。关于NER的另外的细节在Marteijn 2014中给出,并且这里给出概述。NER是涵盖两条更小途径的宽途径:全基因组NER(GG-NER)和转录偶联修复NER(TC-NER)。GG-NER和TC-NER使用不同的因子来识别DNA损伤。然而,它们利用相同的机器进行损伤切开、修复、和连接。
一旦识别出损伤,细胞去除含有所述损伤的短的单链DNA区段。内切核酸酶XPF/ERCC1和XPG(由ERCC5编码)通过切割损伤任一侧上的被损伤的链而去除损伤,产生22-30个核苷酸的单链空位。接着,细胞进行DNA空位填充合成和连接。在这个过程中涉及的是:PCNA、RFC、DNA Pol δ、DNA Pol ε或DNA Pol κ、以及DNA连接酶I或XRCC1/连接酶III。复制型细胞倾向于使用DNA pol ε和DNA连接酶I进行连接步骤,而非复制型细胞倾向于使用DNAPol δ、DNA Pol κ、和XRCC1/连接酶III复合物进行连接步骤。
NER可以涉及以下因子:XPA-G、POLH、XPF、ERCC1、XPA-G、以及LIG1。转录偶联NER(TC-NER)可以涉及以下因子:CSA、CSB、XPB、XPD、XPG、ERCC1、以及TTDA。可以促进NER修复途径的另外的因子包括XPA-G、POLH、XPF、ERCC1、XPA-G、LIG1、CSA、CSB、XPA、XPB、XPC、XPD、XPF、XPG、TTDA、UVSSA、USP7、CETN2、RAD23B、UV-DDB、CAK子复合物、RPA、以及PCNA。
链间交联(ICL)
称为ICL修复途径的专用途径修复链间交联。可以在复制或转录期间在不同DNA链中的碱基之间发生链间交联、或共价交联。ICL修复涉及多个修复过程的协作,具体地溶核活性、跨损伤合成(TLS)、和HDR。核酸酶被募集以切除被交联的碱基的任一侧上的ICL,同时TLS和HDR协作以修复被切割的链。ICL修复可以涉及以下因子:内切核酸酶(例如,XPF和RAD51C)、内切核酸酶(如RAD51)、跨损伤聚合酶(例如,DNA聚合酶ζ和Rev1)、以及范科尼贫血(FA)蛋白(例如,FancJ)。
其他途径
在哺乳动物体内存在若干其他DNA修复途径。
跨损伤合成(TLS)是用于修复有缺陷复制事件之后留下的单链断裂的途径,并且涉及跨损伤聚合酶(例如,DNA polβ和Rev1)。
无误复制后修复(PRR)是另一条用于修复有缺陷复制事件之后留下的单链断裂的途径。
靶细胞
在多种细胞中,可以将Cas9分子和gRNA分子(例如,Cas9分子/gRNA分子复合物)用于改变靶核酸(例如,引入突变)。这种改变可以在体外、离体或体内进行。在某些实施例中,这种改变导致基因表达的调节。
可以将本文描述的Cas9和gRNA分子递送至靶细胞。示例性靶细胞包括但不限于,血细胞、神经细胞、免疫细胞、肌肉细胞、肾细胞、乳腺细胞、胃肠道细胞、血管细胞、肺细胞、骨细胞、胰腺细胞、皮肤细胞、脂肪细胞、激素分泌细胞、肝细胞、上皮细胞以及成纤维细胞。在某些实施例中,靶细胞是正常细胞。在其他实施例中,靶细胞是患病的细胞。在这些实施例的某些中,靶细胞是癌细胞。
适合的细胞可以包括干细胞,例如像胚胎干细胞、诱导多能干细胞、造血干细胞、神经元干细胞或间充质干细胞。在某些实施例中,细胞是诱导多能干(iPS)细胞或衍生自iPS细胞的细胞,例如从受试者产生的、经修饰以校正突变并分化成临床相关细胞(例如像肝细胞、巨噬细胞、单核吞噬细胞、肺泡巨噬细胞、骨髓祖细胞、肺上皮细胞或造血干细胞)的iPS细胞。在某些实施例中,将AAV用于转导靶细胞。
可以即刻使用由本文所述方法产生的细胞。可替代地,细胞可以被冷冻(例如在液氮中)并储存以备后用。通常细胞将被冷冻在10%二甲基亚砜(DMSO)、50%血清、40%缓冲介质或本领域常用的一些其他此类溶液中,以在这样的冷冻温度下保存细胞,并以本领域通常已知用于解冻冷冻的培养细胞的方式解冻。
递送、配制品和给予途径
Cas系统组分,例如Cas9分子、gRNA分子(例如,Cas9分子/gRNA分子复合物)、供体模板核酸或全部三种,能以各种形式被递送、配制或给予,参见例如表3和表4。表3提供了可以如何配制、递送、或给予所述组分的实例。表4概括了Cas系统的组分(例如,如本文所述的Cas9分子组分和gRNA分子组分)的各种递送方法。
Cas9、gRNA和/或供体模板的基于DNA的递送
编码Cas9分子(例如,eaCas9分子)或gRNA分子的DNA、供体模板或其任何组合(例如两种或全部)可以通过领域已知的方法或如本文所述的给予受试者或递送至细胞。例如,编码Cas9和/或gRNA的DNA以及供体模板可以通过例如载体(例如,病毒或非病毒载体)、非基于载体的方法(例如,使用裸DNA或DNA复合物)或其组合进行递送。类似地,供体模板可以通过例如载体(例如,病毒或非病毒载体)、非基于载体的方法(例如,使用裸DNA或DNA复合物)或其组合进行递送。
编码Cas9分子(例如eaCas9分子)和/或gRNA分子的DNA可以与促进靶细胞(例如本文所述的靶细胞)的摄取的分子(例如N-乙酰半乳糖胺)进行缀合。供体模板同样可以与促进靶细胞(例如本文所述的靶细胞)的摄取的分子(例如N-乙酰半乳糖胺)进行缀合。
在某些实施例中,通过载体(例如病毒载体/病毒或质粒)递送编码Cas9和/或gRNA的DNA。
在某些实施例中,载体可以包含编码Cas9分子和/或gRNA分子的DNA序列。在某些实施例中,载体可以包含与被靶向的区域(例如,靶序列)具有高同源性的供体模板。在这些实施例的某些中,供体模板包含靶序列的全部或部分。示例性供体模板是修复模板,例如基因校正模板或基因突变模板,例如点突变(例如单核苷酸(nt)取代)模板。
在某些实施例中,载体可以包含编码融合到例如Cas9分子序列上的信号肽(例如,用于核定位、核仁定位或线粒体定位)的序列。在某些实施例中,载体可以包含一个或多个调节/控制元件,例如启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、2A序列、和/或剪接受体或供体。在载体包含启动子的这些实施例的某些中,启动子被RNA聚合酶II识别(例如,CMV启动子)。在其他实施例中,启动子被RNA聚合酶III识别(例如,U6启动子)。
在某些实施例中,载体是病毒载体(例如,用于产生重组病毒)。在这些实施例的某些中,所述病毒是DNA病毒(例如,dsDNA或ssDNA病毒)。在其他实施例中,所述病毒是RNA病毒(例如,ssRNA病毒)。示例性病毒载体/病毒包括,例如,逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒、以及单纯疱疹病毒。在某些实施例中,通过重组AAV递送编码Cas9和/或gRNA的DNA。在某些实施例中,通过重组AAV递送供体模板核酸。在某些实施例中,病毒载体能够进行细胞类型和/或组织类型识别。在某些实施例中,病毒载体实现细胞类型特异性表达。在某些实施例中,病毒载体具有增加的病毒载体和靶细胞膜的融合效率。
在某些实施例中,通过非基于载体的方法(例如,使用裸DNA或DNA复合物)递送编码Cas9和/或gRNA的DNA。例如,DNA可以例如通过有机改性的二氧化硅或硅酸盐(Ormosil)、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee 2012)、基因枪、声致穿孔、磁转染、脂质介导的转染、树枝状聚合物、无机纳米粒子、磷酸钙、或其组合进行递送。
在某些实施例中,通过载体和非基于载体的方法的组合递送编码Cas9和/或gRNA的DNA。在某些实施例中,通过载体和非基于载体的方法的组合递送供体模板。
用于基因转移的示例性脂质示于下表1中。用于基因转移的示例性聚合物示于下表5中。
在某些实施例中,非载体递送运载体具有靶向修饰以增加靶细胞摄入纳米粒子和脂质体(例如,细胞特异性抗原、单克隆抗体、单链抗体、适配体、聚合物、糖(例如,N-乙酰半乳糖胺(GalNAc))和细胞穿透肽)。在某些实施例中,所述运载体使用融合肽和内体去稳定肽/聚合物。在某些实施例中,所述运载体经历酸触发的构象变化(例如,以加速负荷物的内体逃逸)。在某些实施例中,使用刺激可切割的聚合物,例如,用于在细胞区室中释放。在某些实施例中,递送运载体是生物非病毒递送运载体。
在某些实施例中,递送除了Cas系统的组分之外(即,除了编码Cas9分子和/或gRNA分子的DNA或供体模板之外)的一种或多种核酸分子(例如,DNA分子)。在这些实施例的某些中,这些其他核酸分子与Cas系统的一种或多种组分同时进行递送。在其他实施例中,这些其他核酸分子是在递送Cas系统的一种或多种组分之前或之后(例如,小于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)进行递送的。在某些实施例中,这些其他核酸分子以与Cas系统的一种或多种组分不同的方式进行递送。所述其他的核酸分子可以通过本文所述的任何递送方法进行递送。
Cas9和/或gRNA的基于RNA的递送
gRNA分子和/或编码Cas9分子的RNA分子可以通过领域已知的方法或如本文所述的递送到细胞(例如本文所述的靶细胞)中。例如,gRNA分子和/或编码Cas9分子的RNA分子可以例如通过显微注射、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee 2012)、脂质介导的转染、肽介导的递送或其组合进行递送。gRNA分子和/或编码Cas9分子的RNA分子可以与促进靶细胞(例如本文所述的靶细胞)摄取的分子进行缀合。
在某些实施例中,经由电穿孔的递送包括将细胞与gRNA分子和/或编码Cas9分子的RNA分子与或不与gRNA分子在盒、室或比色皿中混合,并且施加一个或多个限定持续时间和幅度的电脉冲。在某些实施例中,使用如下系统进行经由电穿孔的递送,在所述系统中将细胞与gRNA分子和/或编码Cas9分子的RNA分子、与或不与供体模板核酸分子在连接至装置(例如,泵)的容器中混合,所述装置向盒、室或比色皿中供给混合物,在所述盒、室或比色皿中施加一个或多个限定持续时间和幅度的电脉冲,之后将细胞递送至第二容器。gRNA分子和/或编码Cas9分子的RNA分子可以与促进靶细胞(例如本文所述的靶细胞)摄取的分子进行缀合。
Cas9分子的递送
Cas9分子可以通过领域已知的方法或如本文所述的递送到细胞中。例如,Cas9蛋白分子可以例如通过显微注射、电穿孔、瞬时细胞压缩或挤压(参见例如,Lee 2012)、脂质介导的转染、肽介导的递送或其组合进行递送。递送可以与编码gRNA的DNA或与gRNA相伴。Cas9蛋白可以与促进靶细胞(例如本文所述的靶细胞)摄取的分子进行缀合。
在某些实施例中,可以将Cas9蛋白与gRNA分子组合以形成待给予受试者或者通过领域已知的方法或如本文所述的递送至细胞的核糖核蛋白(RNP)复合物。将Cas9/gRNA RNP复合物直接递送到细胞消除了对从核酸表达(例如编码Cas9和gRNA的质粒的转染)的需求。它还消除了来源于核酸递送(例如,编码Cas9和gRNA的质粒的转染)的DNA区段的不希望的整合。因此,它是一种替代递送方法,其提供迅速作用、快速周转、中靶修饰的高速率、减少的脱靶效应以及对细胞的较小毒性。它还可以用于将Cas9/gRNA复合物递送到难以转染的细胞(例如,难以转染的原代和多能干细胞)。在某些实施例中,可以在给予之前形成Cas9/gRNA RNP复合物(即,预先形成)。在某些实施例中,可以同时地或顺序地递送(例如,给予)多个(例如,多于一个)Cas9/gRNA RNP复合物。在某些实施例中,Cas9/gRNA RNP复合物可以通过电穿孔递送至细胞。
在某些实施例中,经由电穿孔的递送包括将细胞与Cas9分子与或不与gRNA分子和/或供体模板核酸在盒、室或比色皿中混合,并且施加一个或多个限定持续时间和幅度的电脉冲。在某些实施例中,使用如下系统进行经由电穿孔的递送,在所述系统中将细胞与Cas9分子与或不与gRNA分子和/或供体模板核酸在连接至装置(例如,泵)的容器中混合,所述装置向盒、室或比色皿中供给混合物,在所述盒、室或比色皿中施加一个或多个限定持续时间和幅度的电脉冲,之后将细胞递送至第二容器。
Cas系统组分的给予途径
全身给予模式包括口服和肠胃外途径。肠胃外途径包括,举例来说,静脉内、动脉内、肌内、皮内、皮下、鼻内以及腹膜内途径。全身给予的组分可以被修饰或配制成靶向血细胞和骨髓细胞的组分。
局部给予模式包括,举例来说,骨髓内、鞘内和脑室内途径。在某些实施例中,相比于当全身给予(例如,静脉内)时,当局部给予时,显著更少量的组分(相比于全身方法)可以发挥效果。局部给予模式可以降低或消除潜在毒副作用的发生率,当全身给予治疗有效量的组分时可能发生毒副作用。
此外,可以将组分配制成允许在延长时段内释放。
Cas系统组分的离体递送
在某些实施例中,将表3中描述的Cas系统组分引入细胞中,然后将所述细胞引入受试者体内,例如,将细胞从受试者体内移除、离体操作并重新引入受试者。引入组分的方法可以包括例如表4中所述的任何递送方法。
修饰的核苷、核苷酸和核酸
修饰的核苷和修饰的核苷酸可以存在于核酸中,例如特别是gRNA,但是还有其他形式的RNA,例如mRNA、RNAi或siRNA。如本文所描述的,“核苷”被定义为包含五碳糖分子(戊糖或核糖)或其衍生物以及有机碱(嘌呤或嘧啶)或其衍生物的化合物。如本文所描述的,“核苷酸”被定义为进一步包含磷酸基团的核苷。
修饰的核苷和核苷酸可以包括以下项中的一项或多项:
(i)磷酸二酯骨架键联中的一个或两个非连接磷酸氧和/或一个或多个连接磷酸氧的改变,例如置换;
(ii)核糖的组分(例如,核糖上的2’羟基)的改变,例如置换;
(iii)“脱磷酸”接头对磷酸部分的完全置换;
(iv)天然存在的核碱基的修饰或置换;
(v)核糖-磷酸骨架的置换或修饰;
(vi)寡核苷酸的3'端或5'端的修饰,例如,末端磷酸基团的去除、修饰或置换或部分的结合;以及
(vii)糖的修饰。
以上列出的修饰可以组合,以提供可以具有两个、三个、四个或更多个修饰的修饰的核苷和核苷酸。例如,修饰的核苷或核苷酸可以具有修饰的糖和修饰的核碱基。在一个实施例中,修饰gRNA的每个碱基,例如所有碱基都具有修饰的磷酸酯基团,例如所有修饰的磷酸酯基团都是硫代磷酸酯基团。在一个实施例中,单分子的或模块化的gRNA分子的所有或基本上所有磷酸酯基团被硫代磷酸酯基团替换。
在一个实施例中,可以将修饰的核苷酸(例如,具有如本文描述的修饰的核苷酸)掺入核酸中,例如“修饰的核酸”。在一个实施例中,修饰的核酸包含一个、两个、三个或更多个修饰的核苷酸。在一个实施例中,修饰的核酸中的至少5%(例如,至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%)的位置是修饰的核苷酸。
未修饰的核酸可以易于被例如细胞核酸酶降解。例如,核酸酶可以水解核酸磷酸二酯键。因此,在一个方面中,本文描述的修饰的核酸可以含有一个或多个修饰的核苷或核苷酸,例如,以引入对核酸酶的稳定性。
在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸当被在体内和离体地引入细胞群体中时都可以展现出减少的先天性免疫应答。术语“先天性免疫应答”包括对外源核酸的细胞应答,外源核酸包括通常是病毒或细菌来源的单链核酸,所述细胞应答涉及细胞因子(特别是干扰素)表达与释放以及细胞死亡的诱导。在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸可以破坏大沟相互作用配偶体与核酸的结合。在一个实施例中,本文描述的修饰的核苷、修饰的核苷酸和修饰的核酸当被在体内和离体地引入细胞群体中时都可以展现出减少的先天性免疫应答,并且还破坏大沟相互作用配偶体与核酸的结合。
化学基团的定义
如本文所用的,“烷基”意在指直链的或支链的饱和烃基。示例性烷基基团包括甲基(Me)、乙基(Et)、丙基(例如,正丙基和异丙基)、丁基(例如,正丁基、异丁基、叔丁基)、戊基(例如,正戊基、异戊基、新戊基)等。烷基基团可以包含从1至约20、从2至约20、从1至约12、从1至约8、从1至约6、从1至约4或从1至约3个碳原子。
如本文所用的,“芳基”是指单环或多环(例如,具有2、3或4个稠环)的芳香烃,例如像苯基、萘基、蒽基、菲基、茚满基、茚基等。在一个实施例中,芳基基团具有从6至约20个碳原子。
如本文所用的,“烯基”是指包含至少一个双键的脂肪族基团。
如本文所用的,“炔基”是指含有2-12个碳原子并且特征在于具有一个或多个三键的直链的或支链的烃链。炔基基团的实例包括但不限于乙炔基、炔丙基和3-己炔基。
如本文所用的,“芳基烷基”或“芳烷基”是指烷基氢原子被芳基基团置换的烷基部分。芳烷基包括一个以上氢原子已经被芳基基团置换的基团。“芳基烷基”或“芳烷基”的实例包括苄基、2-苯基乙基、3-苯基丙基、9-芴基、二苯甲基以及三苯甲基基团。
如本文所用的,“环烷基”是指具有3至12个碳的环状的、二环的、三环的或多环的非芳香烃基团。环烷基部分的实例包括但不限于环丙基、环戊基和环己基。
如本文所用的,“杂环基”是指杂环系统的单价基。代表性杂环基包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二噁烷基、二氧戊环基、二氮杂卓基、氧氮杂卓基、硫氮杂卓基以及吗啉基。
如本文所用的,“杂芳基”是指杂芳香环系统的单价基。杂芳基部分的实例包括但不限于咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、苯硫基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、吲嗪基、嘌呤基、萘啶基、喹啉基以及蝶啶基。
磷酸骨架修饰
磷酸酯基团
在一个实施例中,可以通过用不同取代基置换一个或多个氧来修饰经修饰的核苷酸的磷酸酯基团。此外,修饰的核苷酸(例如,存在于修饰的核酸中的修饰的核苷酸)可以包括如本文描述的修饰的磷酸酯对未修饰的磷酸酯部分的完全置换。在一个实施例中,磷酸骨架的修饰可以包括产生不带电接头或具有不对称电荷分布的带电接头的改变。
修饰的磷酸酯基团的实例包括硫代磷酸酯、硒代磷酸酯(phosphoroselenate)、硼磷酸酯(borano phosphate)、硼磷酸酯(borano phosphate ester)、氢膦酸酯、磷酰胺酯(phosphoroamidate)、烷基或芳基膦酸酯和磷酸三酯。在一个实施例中,磷酸骨架部分中的非桥连磷酸氧原子之一可以被以下基团中的任一项置换:硫(S)、硒(Se)、BR3(其中R可以是例如氢、烷基或芳基)、C(例如,烷基基团、芳基基团等)、H、NR2(其中R可以是例如氢、烷基或芳基)或OR(其中R可以是例如烷基或芳基)。未修饰的磷酸酯基团中的磷原子是非手性的。然而,以上原子或原子的基团之一对非桥连磷酸氧之一的置换可以使得磷原子是手性的;也就是说以这种方式修饰的磷酸酯基团中的磷原子是立构中心。立构磷原子可以具有“R”构型(本文是Rp)或“S”构型(本文是Sp)。
二硫代磷酸酯的两个非桥连氧被硫置换。二硫代磷酸酯中的磷中心是非手性的,这阻止寡核糖核苷酸非对映异构体的形成。在一个实施例中,对一个或两个非桥连氧的修饰还可以包括用以下基团置换非桥连氧,所述基团独立地选自S、Se、B、C、H、N以及OR(R可以是例如烷基或芳基)。
还可以通过用氮(桥连的磷酰胺酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)置换桥连氧(即,将磷酸连接至核苷的氧)来修饰磷酸酯接头。置换可以发生在连接氧或发生在两个连接氧处。
磷酸酯基团的置换
磷酸酯基团可以被不含磷连接物置换。在一个实施例中,带电磷酸酯基团可以被中性部分置换。
可以置换磷酸酯基团的部分的实例可以包括但不限于例如甲基膦酸酯、羟氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛(thioformacetal)、甲缩醛(formacetal)、肟、亚甲亚氨基、亚甲甲基亚氨基、亚甲肼基、亚甲二甲基肼基以及亚甲氧基甲基亚氨基。
核糖磷酸骨架的置换
还可以构建可以模拟核酸的支架,其中磷酸酯接头和核糖被核酸酶抗性核苷或核苷酸替代物置换。在一个实施例中,可以通过替代骨架拴住核碱基。实例可以包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
糖修饰
修饰的核苷和修饰的核苷酸可以包括对糖基的一种或多种修饰。例如,2’羟基基团(OH)可以被多种不同的“氧基”或“脱氧”取代基修饰或替换。在一个实施例中,对2’羟基基团的修饰可以增强核酸的稳定性,因为羟基不再可以被去质子化以形成2’-醇盐离子。2’-醇盐可以通过接头磷原子上的分子内亲核攻击而催化降解。
“氧基”-2’羟基基团修饰的实例可以包括烷氧基或芳氧基(OR,其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG),O(CH2CH2O)nCH2CH2OR,其中R可以是例如H或任选取代的烷基,并且n可以是从0至20的整数(例如,从0至4、从0至8、从0至10、从0至16、从1至4、从1至8、从1至10、从1至16、从1至20、从2至4、从2至8、从2至10、从2至16、从2至20、从4至8、从4至10、从4至16以及从4至20)。在一个实施例中,“氧基”-2’羟基基团修饰可以包括“锁”核酸(LNA),其中2’羟基可以例如通过C1-6亚烷基或C1-6杂亚烷基桥连接至同一核糖的4’碳,其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)和氨基烷氧基O(CH2)n-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)。在一个实施例中,“氧基”-2’羟基基团修饰可以包括甲氧基乙基基团(MOE)(OCH2CH2OCH3,例如PEG衍生物)。
“脱氧”修饰可以包括氢(即脱氧核糖,例如在部分ds RNA的突出端部分);卤素(例如,溴、氯、氟或碘);氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基、二杂芳氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可以是例如如本文描述的),-NHC(O)R(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖),氰基;巯基;烷基-硫代-烷基;硫代烷氧基;以及烷基、环烷基、芳基、烯基和炔基,其可以任选地被例如如本文描述的氨基取代。
糖基还可以包含一个或多个具有与核糖中的对应碳相反的立体化学构型的碳。因此,修饰的核酸可以包括含有例如阿拉伯糖作为糖的核苷酸。核苷酸“单体”可以在糖的1'位置处具有α键联,例如α-核苷。修饰的核酸还可以包括“无碱基”糖,其在C-1'处缺乏核碱基。这些无碱基糖还可以在一个或多个构成性糖原子处被进一步修饰。修饰的核酸还可以包括一种或多种处于L型的糖,例如L-核苷。
通常,RNA包括糖基核糖,它是具有氧的5元环。示例性修饰的核苷和修饰的核苷酸可以包括但不限于核糖中氧的置换(例如,用硫(S)、硒(Se)或亚烷基,例如像亚甲基或亚乙基);双键的添加(例如,以用环戊烯基或环己烯基置换核糖);核糖的缩环(例如,以形成环丁烷或氧杂环丁烷的4元环);核糖的扩环(例如,以形成具有另外的碳或杂原子的6元或7元环,例如像脱水己糖醇、阿卓糖醇、甘露醇、环己烷基、环己烯基以及吗啉代,其也具有氨基磷酸酯骨架)。在一个实施例中,修饰的核苷酸可以包括多环形式(例如,三环;和“解锁”形式,如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被附接至磷酸二酯键的二醇单元置换),苏糖核酸(TNA,其中核糖被α-L-苏呋喃糖基(threofuranosyl)-(3'→2')置换)。
核碱基上的修饰
能够被掺入修饰的核酸中的本文描述的修饰的核苷和修饰的核苷酸可以包括修饰的核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)以及尿嘧啶(U)。这些核碱基可以被修饰或全部替换,以提供可以被掺入修饰的核酸中的修饰的核苷和修饰的核苷酸。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤或嘧啶类似物。在一个实施例中,核碱基可以包括例如天然存在的碱基及其合成的衍生物。
尿嘧啶
在一个实施例中,修饰的核碱基是修饰的尿嘧啶。具有修饰的尿嘧啶的示例性核碱基和核苷包括但不限于假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷(s2U)、4-硫代-尿苷(s4U)、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷(ho5U)、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如,5-碘代-尿苷或5-溴代-尿苷)、3-甲基-尿苷(m3U)、5-甲氧基-尿苷(mo5U)、尿苷5-氧基乙酸(cmo5U)、尿苷5-氧基乙酸甲酯(mcmo5U)、5-羧甲基-尿苷(cm5U)、1-羧甲基-假尿苷、5-羧基羟甲基-尿苷(chm5U)、5-羧基羟甲基-尿苷甲酯(mchm5U)、5-甲氧羰基甲基-尿苷(mcm5U)、5-甲氧羰基甲基-2-硫代-尿苷(mcm5s2U)、5-氨甲基-2-硫代-尿苷(nm5s2U)、5-甲基氨甲基-尿苷(mnm5U)、5-甲基氨甲基-2-硫代-尿苷(mnm5s2U)、5-甲基氨甲基-2-硒代-尿苷(mnm5se2U)、5-氨甲酰基甲基-尿苷(ncm5U)、5-羧甲基氨基甲基-尿苷(cmnm5U)、5-羧甲基氨基甲基-2-硫代-尿苷(cmnm 5s2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(τcm5U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷(τm5s2U)、1-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷(m5U,即具有核碱基脱氧胸腺嘧啶)、1-甲基-假尿苷(m1ψ)、5-甲基-2-硫代-尿苷(m5s2U)、1-甲基-4-硫代-假尿苷(m1s4ψ)、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷(m3ψ)、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮杂-假尿苷、2-硫代-1-甲基-1-去氮杂-假尿苷、二氢尿苷(D)、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷(m5D)、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧丙基)尿苷(acp3U)、1-甲基-3-(3-氨基-3-羧丙基)假尿苷(acp3ψ)、5-(异戊烯基氨甲基)尿苷(inm5U)、5-(异戊烯基氨甲基)-2-硫代-尿苷(inm5s2U)、α-硫代-尿苷、2'-O-甲基-尿苷(Um)、5,2'-O-二甲基-尿苷(m5Um)、2'-O-甲基-假尿苷(ψm)、2-硫代-2'-O-甲基-尿苷(s2Um)、5-甲氧基羰甲基-2'-O-甲基-尿苷(mcm 5Um)、5-氨甲酰基甲基-2'-O-甲基-尿苷(ncm 5Um)、5-羧甲基氨甲基-2'-O-甲基-尿苷(cmnm 5Um)、3,2'-O-二甲基-尿苷(m3Um)、5-(异戊烯基氨甲基)-2'-O-甲基-尿苷(inm 5Um)、1-硫代-尿苷、脱氧胸苷、2'-F-阿糖(ara)-尿苷、2'-F-尿苷、2'-OH-阿糖-尿苷、5-(2-甲氧甲酰基乙烯基)尿苷、5-[3-(1-E-丙烯基氨基)尿苷、吡唑并[3,4-d]嘧啶、黄嘌呤以及次黄嘌呤。
胞嘧啶
在一个实施例中,修饰的核碱基是修饰的胞嘧啶。具有修饰的胞嘧啶的示例性核碱基和核苷包括但不限于5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷、3-甲基-胞苷(m3C)、N4-乙酰基-胞苷(act)、5-甲酰基-胞苷(f5C)、N4-甲基-胞苷(m4C)、5-甲基-胞苷(m5C)、5-卤代-胞苷(例如,5-碘代-胞苷)、5-羟甲基-胞苷(hm5C)、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷(s2C)、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮杂-假异胞苷、1-甲基-1-去氮杂-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖西丁(k2C)、α-硫代-胞苷、2'-O-甲基-胞苷(Cm)、5,2'-O-二甲基-胞苷(m5Cm)、N4-乙酰基-2'-O-甲基-胞苷(ac4Cm)、N4,2'-O-二甲基-胞苷(m4Cm)、5-甲酰基-2'-O-甲基-胞苷(f5Cm)、N4,N4,2'-O-三甲基-胞苷(m4 2Cm)、1-硫代-胞苷、2'-F-阿糖-胞苷、2'-F-胞苷以及2'-OH-阿糖-胞苷。
腺嘌呤
在一个实施例中,修饰的核碱基是修饰的腺嘌呤。具有修饰的腺嘌呤的示例性核碱基和核苷包括但不限于2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如,2-氨基-6-氯代-嘌呤)、6-卤代-嘌呤(例如,6-氯代-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-去氮杂-腺苷、7-去氮杂-8-氮杂-腺苷、7-去氮杂-2-氨基-嘌呤、7-去氮杂-8-氮杂-2-氨基-嘌呤、7-去氮杂-2,6-二氨基嘌呤、7-去氮杂-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷(m1A)、2-甲基-腺苷(m2A)、N6-甲基-腺苷(m6A)、2-甲硫基-N6-甲基-腺苷(ms2m6A)、N6-异戊烯基-腺苷(i6A)、2-甲硫基-N6-异戊烯基-腺苷(ms2i6A)、N6-(顺羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺羟基异戊烯基)腺苷(ms2io6A)、N6-缩水甘油基氨甲酰基-腺苷(g6A)、N6-苏氨酰基氨甲酰基-腺苷(t6A)、N6-甲基-N6-苏氨酰基氨甲酰基-腺苷(m6t6A)、2-甲硫基-N6-苏氨酰基氨甲酰基-腺苷(ms2g6A)、N6,N6-二甲基-腺苷(m6 2A)、N6-羟基正缬氨酰基氨甲酰基-腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰基氨甲酰基-腺苷(ms2hn6A)、N6-乙酰基-腺苷(ac6A)、7-甲基-腺苷、2-甲硫基-腺苷、2-甲氧基-腺苷、α-硫代-腺苷、2'-O-甲基-腺苷(Am)、N6,2'-O-二甲基-腺苷(m6Am)、N6-甲基-2'-脱氧腺苷、N6,N6,2'-O-三甲基-腺苷(m6 2Am)、1,2'-O-二甲基-腺苷(m1Am)、2'-O-核糖基腺苷(磷酸盐)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2'-F-阿糖-腺苷、2'-F-腺苷、2'-Oh-阿糖-腺苷以及N6-(19-氨基-五氧杂十九烷基)-腺苷。
鸟嘌呤
在一个实施例中,修饰的核碱基是修饰的鸟嘌呤。具有修饰的鸟嘌呤的示例性核碱基和核苷包括但不限于肌苷(I)、1-甲基-肌苷(m1I)、怀俄苷(imG)、甲基怀俄苷(mimG)、4-去甲基-怀俄苷(imG-14)、异怀俄苷(imG2)、怀丁苷(yW)、过氧怀丁苷(o2yW)、羟基怀丁苷(OHyW)、修饰不足的羟基怀丁苷(OHyW*)、7-去氮杂-鸟苷、辫苷(Q)、环氧辫苷(oQ)、半乳糖基-辫苷(galQ)、甘露糖基-辫苷(manQ)、7-氰基-7-去氮杂-鸟苷(preQ0)、7-氨基甲基-7-去氮杂-鸟苷(preQ1)、古嘌苷(G+)、7-去氮杂-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮杂-鸟苷、6-硫代-7-去氮杂-8-氮杂-鸟苷、7-甲基-鸟苷(m7G)、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷(m'G)、N2-甲基-鸟苷(m2G)、N2,N2-二甲基-鸟苷(m2 2G)、N2,7-二甲基-鸟苷(m2,7G)、N2,N2,7-二甲基-鸟苷(m2,2,7G)、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、α-硫代-鸟苷、2'-O-甲基-鸟苷(Gm)、N2-甲基-2'-O-甲基-鸟苷(m2Gm)、N2,N2-二甲基-2'-O-甲基-鸟苷(m2 2Gm)、1-甲基-2'-O-甲基-鸟苷(m'Gm)、N2,7-二甲基-2'-O-甲基-鸟苷(m2,7Gm)、2'-O-甲基-肌苷(Im)、1,2'-O-二甲基-肌苷(m'Im)、O6-苯基-2’-脱氧肌苷、2'-O-核糖基鸟苷(磷酸盐)(Gr(p))、1-硫代-鸟苷、O6-甲基-鸟苷、O6-甲基-2’-脱氧鸟苷、2'-F-阿糖-鸟苷以及2'-F-鸟苷。
示例性修饰的gRNA
在某些实施例中,如本文所述的修饰的核酸可以是修饰的gRNA。应当理解,本文所述的任何gRNA可以如本文所述的进行修饰。
通过实验(结果未显示),已经发现当gRNA在其5'端或其附近被修饰时(例如,当通过包含真核mRNA帽结构或帽类似物来修饰gRNA的5'端时),CRISPR/Cas系统的gRNA组分在编辑T细胞中的基因时更有效。虽然不希望受理论束缚,但认为本文所述的这些和其他修饰的gRNA引起来自某些循环细胞类型(例如,T细胞)的降低的先天免疫应答,并且这种降低的应答可能是观察到的改善的原因。本发明涵盖这样的认识,即当使用gRNA编辑循环细胞(无论是离体还是体内)时,将循环细胞(例如,T细胞)对gRNA的先天免疫应答最小化可能是有利的,并且当使用gRNA编辑非循环细胞时也可能是有利的,例如当全身或局部给予gRNA用于体内基因编辑目的时。本发明还涵盖这样的认识,即通过5’加帽的gRNA观察到的改进可以扩展到已经以其他方式(例如,通过包含修饰的核苷或核苷酸、或当修饰体外转录的gRNA时通过用磷酸酶如牛小肠碱性磷酸酶处理以去除5’三磷酸酯基团)修饰以实现相同类型的结构或功能结果的gRNA上。虽然不希望受理论束缚,但在某些实施例中,本文所述的修饰的gRNA可以包含一种或多种对核酸酶引入稳定性的修饰(例如,修饰的核苷或核苷酸)(例如,通过包含修饰的核苷或核苷酸和/或3'聚A束)。
因此,在某些实施例中,本文提供的组合物和方法利用包含如本文所述的一种或多种修饰的核苷或核苷酸的gRNA。在这些实施例的某些中,与其他未修饰的gRNA相比,包含一种或多种修饰的核苷或核苷酸导致gRNA引起在某些循环细胞类型(例如,T细胞、巨噬细胞、树突细胞和/或B细胞)中的降低的先天免疫应答。
在某些实施例中,用于本文提供的组合物和方法中的gRNA在其5'端或其附近(例如,其5'端的1-10、1-5或1-2个核苷酸内)被修饰。在某些实施例中,gRNA通过包含真核mRNA帽结构或帽类似物(例如,G(5’)ppp(5’)G帽类似物、m7G(5’)ppp(5’)G帽类似物、或3’-O-Me-m7G(5’)ppp(5’)G抗反向帽类似物(ARCA))进行修饰。所述帽或帽类似物可以在gRNA的化学合成或体外转录期间被掺入。在某些实施例中,体外转录的gRNA通过用磷酸酶(例如,牛小肠碱性磷酸酶)处理进行修饰,以去除5’三磷酸酯基团。
在某些实施例中,用于本文提供的组合物和方法中的gRNA在其3'端或其附近(例如,其3'端的1-10、1-5或1-2个核苷酸内)被修饰。
在一个实施例中,gRNA的3'端通过添加一个或多个(例如,25-200个)腺嘌呤(A)残基进行修饰。聚A束可以被包含在编码gRNA的核酸(例如,质粒、PCR产物、病毒基因组)中,或者可以在化学合成期间、或在使用聚腺苷聚合酶(例如,大肠杆菌聚(A)聚合酶)体外转录后被添加到gRNA上。
在某些实施例中,用于本文提供的组合物和方法中的gRNA包含在其5'端或其附近的修饰以及在其3'端或其附近的修饰。
在某些实施例中,体外转录的gRNA既含有5’帽结构或帽类似物又含有3'聚A束。在一个实施例中,体外转录的gRNA通过用磷酸酶(例如,牛小肠碱性磷酸酶)处理进行修饰以去除5’三磷酸酯基团,并且包含3'聚A束。
在一些实施例中,gRNA可以在3'末端U核糖处被修饰。例如,U核糖的两个末端羟基基团可以被氧化为醛基基团和核糖环的伴随开口,以提供如下所示的修饰的核苷:
Figure BDA0001491286140000861
其中“U”可以是未修饰的或修饰的尿苷。
在另一个实施例中,可以用如下所示的2’3’环状磷酸酯修饰3'末端U:
Figure BDA0001491286140000862
其中“U”可以是未修饰的或修饰的尿苷。
在一些实施例中,gRNA分子可以含有3’核苷酸,其可以例如通过掺入本文描述的一个或多个修饰的核苷酸而相对于降解进行稳定化。在这个实施例中,例如,尿苷可以被修饰的尿苷(例如,5-(2-氨基)丙基尿苷和5-溴代尿苷)或被本文描述的任何修饰的尿苷置换;腺苷和鸟苷可以被修饰的腺苷和鸟苷(例如,在8-位具有修饰,例如8-溴代鸟苷)或被本文描述的任何修饰的腺苷和鸟苷置换。
在一些实施例中,可以向gRNA中掺入糖-修饰的核糖核苷酸,例如其中2’OH-基团被选自以下项的基团置换:H、-OR、-R(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤素、-SH、-SR(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基、二杂芳氨基或氨基酸);或氰基(-CN)。在一些实施例中,可以例如用硫代磷酸酯基团如本文描述的修饰磷酸骨架。在一些实施例中,gRNA的一个或多个核苷酸可以各自独立地是修饰的或未修饰的核苷酸,包括但不限于2’-糖修饰的如2’-O-甲基、2’-O-甲氧基乙基,或2’-氟修饰的,包括例如,2’-F或2’-O-甲基腺苷(A)、2’-F或2’-O-甲基胞苷(C)、2’-F或2’-O-甲基尿苷(U)、2’-F或2’-O-甲基胸苷(T)、2’-F或2’-O-甲基鸟苷(G)、2’-O-甲氧基乙基-5-甲基尿苷(Teo)、2’-O-甲氧基乙基腺苷(Aeo)、2’-O-甲氧基乙基-5-甲基胞苷(m5Ceo)、及其任何组合。
在一些实施例中,gRNA可以包括“锁”核酸(LNA),其中2’OH-基团可以例如通过C1-6亚烷基或C1-6杂亚烷基桥连接至同一核糖的4’碳,其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥;O-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)和氨基烷氧基或O(CH2)n-氨基(其中氨基可以是例如NH2;烷氨基、二烷氨基、杂环基、芳氨基、二芳氨基、杂芳氨基或二杂芳氨基、乙二胺或聚氨基)。
在一些实施例中,gRNA可以包括修饰的核苷酸,其是多环的(例如,三环;和“解锁”形式,如二醇核酸(GNA)(例如,R-GNA或S-GNA,其中核糖被附接至磷酸二酯键的二醇单元置换),或苏糖核酸(TNA,其中核糖被α-L-苏呋喃糖基-(3’→2’)置换)。
通常,gRNA分子包括糖基核糖,它是具有氧的5元环。示例性修饰的gRNA可以包括但不限于核糖中氧的置换(例如,用硫(S)、硒(Se)或亚烷基,例如像亚甲基或亚乙基);双键的添加(例如,以用环戊烯基或环己烯基置换核糖);核糖的缩环(例如,以形成环丁烷或氧杂环丁烷的4元环);核糖的扩环(例如,以形成具有另外的碳或杂原子的6元或7元环,例如像脱水己糖醇、阿卓糖醇、甘露醇、环己烷基、环己烯基以及吗啉代,其也具有氨基磷酸酯骨架)。尽管大多数的糖类似物改变被定位至2’位,其他位点也适于修饰,包括4’位。在一个实施例中,gRNA包含4’-S、4’-Se或4’-C-氨基甲基-2’-O-Me修饰。
在一些实施例中,可以将去氮杂核苷酸(例如,7-去氮杂-腺苷)掺入gRNA中。在一些实施例中,可以将O-和N-烷基化的核苷酸(例如,N6-甲基腺苷)掺入gRNA中。在一些实施例中,gRNA分子中的一个或多个或所有核苷酸是脱氧核苷酸。
miRNA结合位点
微小RNA(或miRNA)是天然存在的19-25个核苷酸长的细胞非编码RNA。它们结合至例如在mRNA的3’UTR中具有适当miRNA结合位点的核酸分子,并且下调基因表达。虽然不希望受理论束缚,但认为该下调是通过降低核酸分子稳定性或通过抑制翻译而发生。本文所披露的RNA种类(例如,编码Cas9的mRNA)可以例如在其3’UTR中包含miRNA结合位点。miRNA结合位点可以被选择为促进所选细胞类型中的表达下调。
实例
以下实例仅仅是说明性的,并不旨在以任何方式限制本发明的范围或内容。
实例1:Cas9核糖核蛋白复合物的生物物理学表征和直接递送
Cas9核糖核蛋白(RNP)复合物的直接递送允许有效地进行基因编辑,同时由于Cas9蛋白在细胞中的快速周转而使脱靶活性最小化。由RNP递送介导的基因编辑的效率随着基因座而变化,并且取决于gRNA的长度以及递送的Cas9蛋白和gRNA的量和比例。
Cas9与gRNA复合物的结构和生物物理学表征显示出大的接触面积和高的亲和力。热熔曲线是检测复合物的结合和稳定性的有用特性。使用从apo-Cas9分子(即,不存在gRNA分子下的Cas9分子)到与gRNA复合的Cas9分子的熔融温度的大幅增加来表征Cas9对gRNA的亲和力。不同长度的多个gRNA与Cas9以不同的化学计量进行复合,并且使用热移位(例如,熔融温度的移位)测量相互作用。然后将这些生物物理学表征的复合物转染到293T细胞中,并且测量产生的indel的效率。显示gRNA长度和碱基组成的细微差异影响RNP复合物的结合和形成。与基因组编辑的效率相关的结合亲和力允许设计RNP的最佳组合物,例如用于阳离子脂质介导的直接递送。
通过DSF评价Cas9分子和Cas9分子/gRNA分子复合物
重组表达金黄色葡萄球菌和化脓链球菌Cas9分子并使用Ni亲和层析、SPSepharose和Superdex 200进行纯化。
DSF用于检查经纯化的金黄色葡萄球菌和化脓链球菌Cas9分子在不存在gRNA分子下的稳定性。反应混合物含有在10μL体积中的5μM Cas9分子和5x SYPRO
Figure BDA0001491286140000881
(生命技术公司,目录#S-6650)。将梯度在20℃下运行1分钟,然后从20℃至95℃,每10秒增加1℃。将荧光信号的导数相对于温度作图,并确定解折叠过渡的温度中点(Tm)。如图9A和9B所示,金黄色葡萄球菌Cas9分子(Tm=36℃)比化脓链球菌Cas9分子(Tm=40℃)更不稳定。
DSF也用于检查Cas9分子/gRNA分子复合物。在H150(10mM Hepes pH 7.5、150mMNaCl)中测试单独的化脓链球菌Cas9、化脓链球菌Cas9与1μM化脓链球菌gRNA以及化脓链球菌Cas9与1μM金黄色葡萄球菌gRNA。这些实验中使用的编码gRNA分子的DNA序列是:
化脓链球菌gRNA:GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT(SEQ ID NO:206);和
金黄色葡萄球菌gRNA:GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTT(SEQ ID NO:207)。
如图10所示,化脓链球菌Cas9的热变性为42℃,并且在伴随的gRNA分子的存在下观察到热移位至50℃。然而,当化脓链球菌Cas9与外来的gRNA分子一起孵育时,没有观察到移位。这些结果表明Cas9分子/gRNA分子复合物形成可能与热移位相关。
将Cas9分子/gRNA分子复合物递送至Jurkat T细胞
Cas9和gRNA的比例为1:25。使用PCR方案产生gRNA构建体。gRNA被体外转录并加帽(例如,5'抗反向帽类似物(ARCA)帽)并且被加尾(例如3'聚A尾)。如图11A所示,gRNA结合诱导Tm从32℃移位至46℃。将Cas9/gRNA复合物递送至Jurkat T细胞。图11B表明约20%的细胞丢失了CD3标记。
实例2:来自体外转录或化学合成的gRNA分子的比较
DSF用于测定Cas9分子/gRNA分子复合物的成功形成,并比较了从三种方法或供应商获得的gRNA分子的质量和完整性。
以15-50μg的规模获得了具有与表6中那些相对应的序列的gRNA分子。
在室温下,在H150缓冲液(10mM Hepes pH 7.5、150mM NaCl)中,将4μM的经纯化的Cas9蛋白与等摩尔量的gRNA进行复合。然后使用脂质体-2000转染试剂将含有Cas9分子/gRNA分子复合物(RNP)的部分该反应物转染到HEK293FT细胞中。在所有情况下都使用100nM的RNP,而不管指导物来源。在每种情况下,将残余的RNP在H150缓冲液中稀释至1μM,添加SYPRO orange从5000X原料至终浓度为5X,并且根据本文所述的测定1进行DSF测定。根据本文所述的方案进行indel定量。
实验结果总结在表6中。将ΔTm与42℃下熔融的Cas9蛋白进行比较。结果表明,指示完整RNP复合物形成(由8℃-9℃的Δ-Tm所证明的)的样品在HEK293FT细胞中均显示良好的NHEJ活性。
发现来自公司2的化学合成的gRNA不足,具有可忽略的ΔTm和较低的NHEJ活性(11%indel)。
通过MEGAshortscript T7试剂盒体外转录的gRNA和从公司1购买的gRNA具有足够的质量和完整性,如7℃-8℃ Tm和在22℃-27℃范围内的NHEJ活性所证明的。
实例3:gRNA的克隆和初始筛选
本实例披露了用于评价嵌合gRNA的方法。也可以使用相同的方法来评价模块化gRNA。
将gRNA克隆进载体中
针对每种gRNA,设计并获得一对重叠寡核苷酸。使寡核苷酸退火并将其连接进含有上游U6启动子和长嵌合gRNA的剩余序列的经消化的载体骨架中。对质粒进行序列验证并制备以产生足够量的转染质量DNA。在某些实施例中,U6启动子可以被替代启动子替换以驱动体内转录(例如,H1启动子)或体外转录(例如,T7启动子)。
将gRNA克隆进线性dsDNA分子中(STITCHR)
针对每种gRNA,设计并获得单个寡核苷酸。将U6启动子和gRNA支架(例如除靶向结构域包括一切,例如包括衍生自crRNA和tracrRNA的序列,例如包括第一互补结构域;连接结构域;第二互补结构域;近端结构域;和尾部结构域)分开地PCR扩增并纯化为dsDNA分子。在PCR反应中使用gRNA特异性寡核苷酸,以便将通过寡核苷酸中指定的靶向结构域连接的U6和gRNA支架缝在一起。将所得dsDNA分子(STITCHR产物)纯化用于转染。任何gRNA支架都可以用于创造与来自任何细菌物种的Cas9相容的gRNA。在某些实施例中,U6启动子可以被替代启动子替换以驱动体内转录(例如,H1启动子)或体外转录(例如,T7启动子)。
初始gRNA筛选
将待测试的每种gRNA连同表达Cas9的质粒和少量的表达GFP的质粒转染进人类细胞中。在预实验中,这些细胞可以是永生人类细胞系,如293T、K562或U2OS。可替代地,可以使用原代人类细胞。用于筛选的细胞可以与最终治疗细胞靶(例如,红系细胞)有关。使用类似于潜在治疗靶细胞群的原代细胞可以提供关于在内源染色质和基因表达的背景下的基因靶向率的重要信息。
可以使用脂质转染(如Lipofectamine或Fugene)或通过电穿孔(如LonzaNucleofection)进行转染。转染后,可以通过荧光显微法或通过流式细胞术确定GFP表达,以确认一致且高水平的转染。预转染可以包括不同的gRNA和不同的靶向途径(例如,17-mer、20-mer、核酸酶、双切口酶等),以确定哪些gRNA/gRNA组合给出最大活性。
可以通过T7E1内切核酸酶测定测量在靶基因座处的NHEJ诱导的indel形成来评估用每种gRNA进行切割的效率。对于该测定,PCR扩增子是大约500-700bp,其中预期的切割位点不对称地放置。对PCR产物进行扩增、纯化和尺寸验证后,通过加热至95℃并且然后缓慢冷却使DNA变性并重新杂交。然后用识别并切割非完全匹配DNA的T7内切核酸酶I(或其他错配敏感酶)消化杂交的PCR产物。如果在原始模板DNA中存在indel,则扩增子的变性和再退火导致携带不同indel的DNA链的杂交,这产生不完全匹配的双链DNA。可以通过凝胶电泳或毛细管电泳使消化产物可视化。被切割DNA的分数(切割产物的密度除以切割和未切割的密度)可以用于使用以下等式估计百分比NHEJ:%NHEJ=(1-(1-切割的分数)1/2)。T7E1测定对低至约2%-5%的NHEJ是敏感的。
在某些实施例中,可以使用其他方法来评估切割效率,包括例如测序和使用错配敏感酶,例如CelI/Surveyor核酸酶。对于Sanger测序,将经纯化的PCR扩增子克隆进质粒骨架中,转化,小量制备并用单个引物测序。Sanger测序可以用于在通过T7E1确定NHEJ率之后确定indel的确切性质。对于下一代测序,扩增子可以为300-500bp,其中预期的切割位点不对称地放置。PCR后,可以将下一代测序衔接子和条形码(例如Illumina多元衔接子和索引)添加到扩增子的末端,例如用于在高通量测序(例如在Illumina MiSeq上)中使用。这种方法允许检测非常低的NHEJ率。
实例4:通过NHEJ评估基因靶向
可以选择在初始测试中诱导最大水平的NHEJ的gRNA用于基因靶向效率的进一步评价。在这种情况下,细胞来源于疾病受试者,并且因此具有相关突变。
转染后(通常是转染后2-3天),可以从大量的转染细胞中分离基因组DNA,并且PCR可以用于扩增靶区域。PCR后,可以通过测序确定用于产生所希望突变(敲除靶基因或去除靶序列基序)的基因靶向效率。对于Sanger测序,PCR扩增子可以是500-700bp长。对于下一代测序,PCR扩增子可以是300-500bp长。如果目的是敲除基因功能,则测序可以用于评估多少百分比的等位基因已经经历导致将预期破坏基因功能的移码或大的缺失或插入的NHEJ诱导的indel。如果目的是去除特定序列基序,则测序可以用于评估多少百分比的等位基因已经经历跨越这个序列的NHEJ诱导的缺失。
实例5:通过HDR评估基因靶向
可以选择在初始测试中诱导最大水平的NHEJ的gRNA用于基因靶向效率的进一步评价。在这种情况下,细胞来源于疾病受试者,并且因此具有相关突变。
转染后(通常是转染后2-3天),可以从大量的转染细胞中分离基因组DNA,并且PCR可以用于扩增靶区域。PCR后,可以通过几种方法测定基因靶向效率。
基因靶向频率的测定涉及测量如下等位基因的百分比,所述等位基因已经用外源提供的供体模板或内源基因组供体序列进行同源定向修复(HDR)并且因此已经掺入所希望的校正。如果所需的HDR事件创建或破坏限制酶位点,则基因靶向的频率可以通过RFLP测定来确定。如果没有创建或破坏限制性位点,则可以使用测序来确定基因靶向频率。如果使用RFLP测定,仍可使用测序来验证所需的HDR事件,并确保不存在其他突变。如果使用外源提供的供体模板,则将至少一个引物置于同源臂中包含的区域之外的内源基因序列中,这阻止了仍然存在于细胞中的供体模板的扩增。因此,供体模板中存在的同源臂的长度可以影响PCR扩增子的长度。PCR扩增子可以跨越整个供体区域(两个引物都置于同源臂外),或者它们可以仅跨越供体区域的一部分以及供体DNA和内源DNA之间的单个结点(一个内部引物和一个外部引物)。如果扩增子跨越不到整个供体区域,则应使用两个不同的PCR来扩增和测序5'和3'连接。
如果PCR扩增子较短(小于600bp),则使用下一代测序是可能的。PCR后,可以将下一代测序衔接子和条形码(例如Illumina多元衔接子和索引)添加到扩增子的末端,例如用于在高通量测序(例如在Illumina MiSeq上)中使用。这种方法允许检测非常低的基因靶向率。
如果PCR扩增子对于下一代测序来说太长,则可以进行Sanger测序。对于Sanger测序,经纯化的PCR扩增子将被克隆到质粒骨架中(例如,使用LifeTech Zero
Figure BDA0001491286140000921
Figure BDA0001491286140000922
克隆试剂盒克隆的TOPO),转化,小量制备并测序。
可以使用上述相同或类似的测定来测量如下等位基因的百分比,所述等位基因已经用内源基因组供体序列进行HDR并且因此已经掺入所希望的校正。
通过引用结合
本文提及的所有出版物、专利和专利申请都通过引用以其全文而特此结合,如同每一单独的出版物、专利或专利申请具体且单独地指明通过引用而结合一样。在有冲突的情况下,以本申请(包括本文的任何定义)为准。
等效物
本领域的普通技术人员仅使用常规实验就应认识到或能够确定本文描述的本发明的具体实施例的许多等效物。此类等效物旨在由以下权利要求书涵盖。
参考文献
Anders等人Nature[自然]513(7519):569-573(2014)
Bae等人Bioinformatics[生物信息学]30(10):1473-1475(2014)
Caldecott Nat Rev Genet[自然遗传学评论]9(8):619-631(2008)
Chylinski等人RNA Biol[RNA生物学]10(5):726–737(2013)
Cong等人Science[科学]399(6121):819-823(2013)
Deveau等人J Bacterial[细菌学杂志]190(4):1390-1400(2008)
Esvelt等人Nature[自然]472(7344):499-503(2011)
Fu等人Nat Biotechnol[自然生物技术]32:279-284(2014)
Haft PLoS Comput Biol[公共科学图书馆·计算生物学]1(6):e60(2005)
Heigwer Nat Methods[自然方法]11(2):122-123(2014)
Horvath&Barrangou Science[科学]327(5962):167-170(2010)
Hsu等人Nat Biotechnol[自然生物技术]31(9):827-832(2013)
Jinek等人Science[科学]337(6096):816-821(2012)
Jinek等人Science[科学]343(6176):1247997(2014)
Lee等人Nano Lett[纳米快报]12(12):6322-6327(2012)
Li Cell Res[细胞研究]18(1):85-98(2008)
Makarova等人Nat Rev Microbiol[自然微生物学评论]9(6):467-477(2011)
Mali等人Science[科学]339(6121):823-826(2013)
Marteijn等人Nat Rev Mol Cell Biol[自然分子细胞生物学评论]15(7):465-481(2014)
Nishimasu等人Cell[细胞]156(5):935-949(2014)
Sternberg等人Nature[自然]507(7490):62-67(2014)
Wang等人Cell[细胞]153(4):910-918(2013)
Xiao等人“CasOT:a genome-wide Cas9/gRNA off-target searching tool.[CasOT:全基因组Cas9/gRNA脱靶搜索工具]”Bioinformatics[生物信息学](电子版2014年1月21日)表1:用于基因转移的脂质
Figure BDA0001491286140000941
Figure BDA0001491286140000951
表2:Cas系统
Figure BDA0001491286140000961
Figure BDA0001491286140000971
Figure BDA0001491286140000981
Figure BDA0001491286140000991
Figure BDA0001491286140001001
表3:组分配制、递送以及给予策略
Figure BDA0001491286140001011
Figure BDA0001491286140001021
表4:Cas系统组分的递送方法
Figure BDA0001491286140001031
表5:用于基因转移的聚合物
Figure BDA0001491286140001041
Figure BDA0001491286140001051
表6
Figure BDA0001491286140001061
序列表
<110> 爱迪塔斯医药公司(Editas Medicine)
H·亚拉姆
W·小塞莱克
<120> Cas9分子/指导RNA分子复合物的评价
<130> 118945.8008.WO00 (EM050PCT)
<150> US 62/152,473
<151> 2015-04-24
<160> 210
<170> PatentIn 3.5版
<210> 1
<211> 1345
<212> PRT
<213> 变形链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N-末端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (759)..(766)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (837)..(863)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (982)..(989)
<223> RuvC样结构域
<400> 1
Met Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Ser His Ile Glu Lys Asn Leu Leu
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg
100 105 110
Gly Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr
115 120 125
His Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp
130 135 140
Asn Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr
165 170 175
Arg Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr
180 185 190
Asp Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val
195 200 205
Glu Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg
210 215 220
Val Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe
245 250 255
Glu Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu
275 280 285
Leu Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Thr Asp Val Gly Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys
325 330 335
Gln Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser
340 345 350
Asp Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu
370 375 380
Gly Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe
420 425 430
Leu Ala Asp Asn Gln Asp Arg Ile Glu Lys Leu Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp
450 455 460
Leu Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu
465 470 475 480
Ile Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Asn Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys
530 535 540
Gln Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys
545 550 555 560
Asp Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile
565 570 575
Val Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser
580 585 590
Tyr Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu
595 600 605
Asp Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu
610 615 620
Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr
625 630 635 640
Ser Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His
645 650 655
Tyr Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg
660 665 670
Asn Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly
675 680 685
Asn Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser
690 695 700
Phe Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn
705 710 715 720
Leu Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met
740 745 750
Gly His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln
755 760 765
Phe Thr Asn Gln Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Gly Leu
770 775 780
Thr Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr
820 825 830
Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys
835 840 845
Asp Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg
850 855 860
Gly Lys Ser Asp Asp Val Pro Ser Lys Asp Val Val Arg Lys Met Lys
865 870 875 880
Ser Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Thr Glu Thr Asp
930 935 940
Glu Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser
945 950 955 960
Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Ile Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys
1010 1015 1020
Ala Thr Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1025 1030 1035
Lys Lys Asp Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp
1040 1045 1050
Lys Lys Asp Glu His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr
1055 1060 1065
Pro Gln Val Asn Ile Val Lys Lys Val Glu Glu Gln Thr Gly Gly
1070 1075 1080
Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu
1085 1090 1095
Ile Pro Arg Lys Thr Lys Lys Phe Tyr Trp Asp Thr Lys Lys Tyr
1100 1105 1110
Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser Ile Leu Val Ile
1115 1120 1125
Ala Asp Ile Glu Lys Gly Lys Ser Lys Lys Leu Lys Thr Val Lys
1130 1135 1140
Ala Leu Val Gly Val Thr Ile Met Glu Lys Met Thr Phe Glu Arg
1145 1150 1155
Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr Arg Asn Val Gln
1160 1165 1170
Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Lys Leu
1175 1180 1185
Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu Leu Gln
1190 1195 1200
Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu Leu
1205 1210 1215
Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu
1220 1225 1230
Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp
1235 1240 1245
Val Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn
1250 1255 1260
Leu Glu Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp
1265 1270 1275
Leu Lys Glu Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr
1280 1285 1290
Ala Ile Gly Ala Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile
1295 1300 1305
Asp Arg Lys Arg Tyr Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr
1310 1315 1320
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1325 1330 1335
Leu Asn Lys Leu Gly Gly Asp
1340 1345
<210> 2
<211> 1368
<212> PRT
<213> 化脓链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N-末端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (759)..(766)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (837)..(863)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (982)..(989)
<223> RuvC样结构域
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 4107
<212> DNA
<213> 化脓链球菌
<400> 3
atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtg 60
attacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga 120
cactctataa agaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa 180
gccacaaggt tgaagcggac cgccaggagg cggtatacca ggagaaagaa ccgcatatgc 240
tacctgcaag aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc 300
ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc catctttggc 360
aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctacca cctcaggaag 420
aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccac 480
atgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac 540
gtcgataagc tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct 600
ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc aaaatctaga 660
agacttgaga atctgattgc tcagttgccc ggggaaaaga aaaatggatt gtttggcaac 720
ctgatcgccc tcagtctcgg actgacccca aatttcaaaa gtaacttcga cctggccgaa 780
gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaa tctgctggcc 840
cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc 900
ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct 960
atgatcaagc ggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg 1020
caacagctcc ccgaaaaata caaggaaatc ttctttgacc agagcaaaaa cggctacgct 1080
ggctatatag atggtggggc cagtcaggag gaattctata aattcatcaa gcccattctc 1140
gagaaaatgg acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg 1200
aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg cgaactgcac 1260
gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaata 1320
gaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca 1380
cggtttgcct ggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa 1440
gtggtggaca agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag 1500
aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta ctttaccgtc 1560
tacaatgaac tgactaaagt caagtacgtc accgagggaa tgaggaagcc ggcattcctt 1620
agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacag gaaggtgact 1680
gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatt 1740
tcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc 1800
ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc 1860
ctcaccctga ccctgttcga agacagggaa atgatagaag agcgcttgaa aacctatgcc 1920
cacctcttcg acgataaagt tatgaagcag ctgaagcgca ggagatacac aggatgggga 1980
agattgtcaa ggaagctgat caatggaatt agggataaac agagtggcaa gaccatactg 2040
gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac 2100
tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactccctt 2160
catgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact 2220
gtcaaggtgg tggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg 2280
atcgagatgg cccgcgaaaa ccagaccaca cagaagggcc agaaaaatag tagagagcgg 2340
atgaagagga tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc 2400
gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca gaacggcaga 2460
gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatga cgtagaccat 2520
atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagc 2580
gacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag 2640
aactactggc gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg 2700
acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat taagcggcag 2760
ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga ttttggacag ccggatgaac 2820
acaaaatacg acgaaaatga taaactgata cgagaggtca aagttatcac gctgaaaagc 2880
aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcga gattaataac 2940
taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag 3000
tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa 3060
atgatagcca agtccgagca ggagattgga aaggccacag ctaagtactt cttttattct 3120
aacatcatga atttttttaa gacggaaatt accctggcca acggagagat cagaaagcgg 3180
ccccttatag agacaaatgg tgaaacaggt gaaatcgtct gggataaggg cagggatttc 3240
gctactgtga ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta 3300
cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga caagctcatc 3360
gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcc 3420
tattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg 3480
aaggaactct tgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat 3540
ttcctggagg ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa 3600
tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc cggagagctg 3660
caaaagggaa acgagcttgc tctgccctcc aaatatgtta attttctcta tctcgcttcc 3720
cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagct gttcgtcgaa 3780
cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggtt 3840
atcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag 3900
cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcc 3960
cccgccgcct tcaaatactt tgatacgact atcgaccgga aacggtatac cagtaccaaa 4020
gaggtcctcg atgccaccct catccaccag tcaattactg gcctgtacga aacacggatc 4080
gacctctctc aactgggcgg cgactag 4107
<210> 4
<211> 1388
<212> PRT
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N-末端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (760)..(767)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (844)..(870)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (989)..(996)
<223> RuvC样结构域
<400> 4
Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu
35 40 45
Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg
100 105 110
Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr
115 120 125
His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp
130 135 140
Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser
165 170 175
Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr
180 185 190
Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu
195 200 205
Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg
210 215 220
Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe
245 250 255
Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp
260 265 270
Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp
275 280 285
Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala
305 310 315 320
Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys
325 330 335
Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys
340 345 350
Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu
370 375 380
Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe
420 425 430
Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp
450 455 460
Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp
465 470 475 480
Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg
515 520 525
Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln
530 535 540
Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr
545 550 555 560
Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp
595 600 605
Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn
625 630 635 640
Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu
660 665 670
Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys
690 695 700
Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn
705 710 715 720
Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn
755 760 765
Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg
770 775 780
Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn
785 790 795 800
Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp
805 810 815
Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu
850 855 860
Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu
865 870 875 880
Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser
885 890 895
Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu
930 935 940
Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp
965 970 975
Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala
1040 1045 1050
Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu
1055 1060 1065
Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val
1070 1075 1080
Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val
1085 1090 1095
Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu
1100 1105 1110
Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu
1115 1120 1125
Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly
1130 1135 1140
Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly
1145 1150 1155
Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu
1160 1165 1170
Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp
1175 1180 1185
Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu
1190 1195 1200
Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly
1205 1210 1215
Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg
1220 1225 1230
Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe
1235 1240 1245
Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn
1250 1255 1260
Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu
1265 1270 1275
Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly
1280 1285 1290
Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp
1295 1300 1305
Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro
1310 1315 1320
Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly
1325 1330 1335
Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr
1340 1345 1350
Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala
1370 1375 1380
Lys Leu Gly Glu Gly
1385
<210> 5
<211> 1334
<212> PRT
<213> 无害利斯特菌
<220>
<221> 尚未归类的特征
<222> (10)..(21)
<223> N-末端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (762)..(769)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (840)..(866)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (985)..(992)
<223> RuvC样结构域
<400> 5
Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met
20 25 30
Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp
35 40 45
Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met
50 55 60
Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser
65 70 75 80
Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn
85 90 95
Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg
100 105 110
Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr
115 120 125
His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn
130 135 140
Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr
165 170 175
Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr
180 185 190
Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu
195 200 205
Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg
210 215 220
Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser
225 230 235 240
Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly
245 250 255
Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys
260 265 270
Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile
275 280 285
Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser
290 295 300
Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn
305 310 315 320
Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu
325 330 335
Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His
340 345 350
Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr
355 360 365
Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met
370 375 380
Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu
385 390 395 400
Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile
405 410 415
Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln
420 425 430
Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser
435 440 445
Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly
450 455 460
Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg
465 470 475 480
Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp
485 490 495
Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn
500 505 510
Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn
515 520 525
Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr
530 535 540
Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln
545 550 555 560
Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met
565 570 575
Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn
580 585 590
Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln
595 600 605
Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val
610 615 620
Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu
625 630 635 640
Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met
660 665 670
Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met
675 680 685
Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser
690 695 700
Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala
705 710 715 720
Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val
740 745 750
Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr
770 775 780
Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys
785 790 795 800
Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu
805 810 815
Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp
820 825 830
Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser
835 840 845
Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala
850 855 860
Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg
865 870 875 880
Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser
885 890 895
Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr
900 905 910
Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg
915 920 925
Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr
930 935 940
Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr
945 950 955 960
Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr
965 970 975
Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
980 985 990
Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu
995 1000 1005
Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys
1010 1015 1020
Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met
1025 1030 1035
Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu
1040 1045 1050
Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met
1055 1060 1065
Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys
1070 1075 1080
Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser
1085 1090 1095
Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly
1100 1105 1110
Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr
1115 1120 1125
Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg
1130 1135 1140
Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala
1145 1150 1155
Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys
1160 1165 1170
Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg
1175 1180 1185
Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val
1190 1195 1200
Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys
1205 1210 1215
Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg
1220 1225 1230
Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys
1235 1240 1245
Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu
1250 1255 1260
Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser
1265 1270 1275
Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser
1280 1285 1290
Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn
1295 1300 1305
Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr
1310 1315 1320
Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp
1325 1330
<210> 6
<211> 1053
<212> PRT
<213> 金黄色葡萄球菌
<400> 6
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 7
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 7
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 8
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 8
atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac 120
gtggaaaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg 180
cggcatagaa tccagagagt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg 300
agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg cgtgcacaac 360
gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagca gatcagccgg 420
aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaa 480
gacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc 540
aaacagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga gggcagcccc 660
ttcggctgga aggacatcaa agaatggtac gagatgctga tgggccactg cacctacttc 720
cccgaggaac tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaata ttacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag 1020
attattgaga acgccgagct gctggatcag attgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggaaga actgaccaat ctgaactccg agctgaccca ggaagagatc 1140
gagcagatct ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc 1440
gagaagaact ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gaaggcaagt gcctgtacag cctggaagcc 1620
atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggacca catcatcccc 1680
agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac 1740
agcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc 1800
tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag 1860
accaagaaag agtatctgct ggaagaacgg gacatcaaca ggttctccgt gcagaaagac 1920
ttcatcaacc ggaacctggt ggataccaga tacgccacca gaggcctgat gaacctgctg 1980
cggagctact tcagagtgaa caacctggac gtgaaagtga agtccatcaa tggcggcttc 2040
accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaa 2160
ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc 2220
atgcccgaga tcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc 2280
aagcacatta aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcctaat 2340
agagagctga ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa aaagctgatc 2460
aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagaccta ccagaaactg 2520
aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaa 2580
accgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt 2640
aagtattacg gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc 2700
agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta cctggacaat 2760
ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga tcaaaaaaga aaactactac 2820
gaagtgaata gcaagtgcta tgaggaagct aagaagctga agaagatcag caaccaggcc 2880
gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcga gctgtataga 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc 3000
taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc 3060
gcctccaaga cccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa 3120
gtgaaatcta agaagcaccc tcagatcatc aaaaagggc 3159
<210> 9
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 9
atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatc 60
atcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac 120
gtggagaaca acgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc 180
agacatagaa tccagcgcgt gaagaagctg ctgttcgact acaaccttct gaccgaccac 240
tccgaacttt ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg 300
tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg agtgcacaat 360
gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagca gatcagccgg 420
aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaa 480
gacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc 540
aagcagctcc tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc 600
tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga gggctcccca 660
tttggttgga aggatattaa ggagtggtac gaaatgctga tgggacactg cacatacttc 720
cctgaggagc tgcggagcgt gaaatacgca tacaacgcag acctgtacaa cgcgctgaac 780
gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagta ttacgaaaag 840
ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc 900
aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag 960
ccggagttca ccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag 1020
atcattgaga acgcggagct gttggaccag attgcgaaga ttctgaccat ctaccaatcc 1080
tccgaggata ttcaggaaga actcaccaac ctcaacagcg aactgaccca ggaggagata 1140
gagcaaatct ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc 1200
aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat tttcaatcgg 1260
ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactaccctt 1320
gtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg 1380
atcaatgcca ttatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc 1440
gagaagaact cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag 1500
actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc gaagtacctg 1560
atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt gtctgtactc gctggaggcc 1620
attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatca tatcattccg 1680
aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac 1740
tcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc 1800
tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag 1860
accaagaagg aatatctgct ggaagaaaga gacatcaaca gattctccgt gcaaaaggac 1920
ttcatcaacc gcaacctcgt ggatactaga tacgctactc ggggtctgat gaacctcctg 1980
agaagctact ttagagtgaa caatctggac gtgaaggtca agtcgattaa cggaggtttc 2040
acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaa 2160
cttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct 2220
atgcctgaaa tcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc 2280
aaacacatca aggatttcaa ggattacaag tactcacatc gcgtggacaa aaagccgaac 2340
agggaactga tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc 2400
atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa gaagctcatt 2460
aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagactta ccagaagctc 2520
aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaa 2580
actgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt 2640
aagtactacg gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc 2700
cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta ccttgacaat 2760
ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga tcaagaagga gaactactac 2820
gaagtcaact ccaagtgcta cgaggaagca aagaagttga agaagatctc gaaccaggcc 2880
gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcga actgtaccgc 2940
gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact 3000
taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc 3060
gcctcaaaga cccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtcaaatcga agaagcaccc ccagatcatc aagaaggga 3159
<210> 10
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 10
atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 11
<211> 3159
<212> DNA
<213> 金黄色葡萄球菌
<400> 11
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagaggcc 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 12
<211> 1082
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 12
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 13
<211> 3249
<212> DNA
<213> 脑膜炎奈瑟氏菌
<220>
<221> 尚未归类的特征
<222> (1)..(3249)
<223> 示例性密码子优化的Cas9
<400> 13
atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggacat cggcatcgcc 60
agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120
ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180
gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240
cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300
ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360
aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420
ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480
ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540
gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600
cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660
gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720
acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgctgggcca ctgcaccttc 780
gagccagccg agcccaaggc cgccaagaac acctacaccg ccgagcgctt catctggctg 840
accaagctga acaacctgcg catcctggag cagggcagcg agcgccccct gaccgacacc 900
gagcgcgcca ccctgatgga cgagccctac cgcaagagca agctgaccta cgcccaggcc 960
cgcaagctgc tgggtctgga ggacaccgcc ttcttcaagg gcctgcgcta cggcaaggac 1020
aacgccgagg ccagcaccct gatggagatg aaggcctacc acgccatcag ccgcgccctg 1080
gagaaggagg gcctgaagga caagaagagt cctctgaacc tgagccccga gctgcaggac 1140
gagatcggca ccgccttcag cctgttcaag accgacgagg acatcaccgg ccgcctgaag 1200
gaccgcatcc agcccgagat cctggaggcc ctgctgaagc acatcagctt cgacaagttc 1260
gtgcagatca gcctgaaggc cctgcgccgc atcgtgcccc tgatggagca gggcaagcgc 1320
tacgacgagg cctgcgccga gatctacggc gaccactacg gcaagaagaa caccgaggag 1380
aagatctacc tgcctcctat ccccgccgac gagatccgca accccgtggt gctgcgcgcc 1440
ctgagccagg cccgcaaggt gatcaacggc gtggtgcgcc gctacggcag ccccgcccgc 1500
atccacatcg agaccgcccg cgaggtgggc aagagcttca aggaccgcaa ggagatcgag 1560
aagcgccagg aggagaaccg caaggaccgc gagaaggccg ccgccaagtt ccgcgagtac 1620
ttccccaact tcgtgggcga gcccaagagc aaggacatcc tgaagctgcg cctgtacgag 1680
cagcagcacg gcaagtgcct gtacagcggc aaggagatca acctgggccg cctgaacgag 1740
aagggctacg tggagatcga ccacgccctg cccttcagcc gcacctggga cgacagcttc 1800
aacaacaagg tgctggtgct gggcagcgag aaccagaaca agggcaacca gaccccctac 1860
gagtacttca acggcaagga caacagccgc gagtggcagg agttcaaggc ccgcgtggag 1920
accagccgct tcccccgcag caagaagcag cgcatcctgc tgcagaagtt cgacgaggac 1980
ggcttcaagg agcgcaacct gaacgacacc cgctacgtga accgcttcct gtgccagttc 2040
gtggccgacc gcatgcgcct gaccggcaag ggcaagaagc gcgtgttcgc cagcaacggc 2100
cagatcacca acctgctgcg cggcttctgg ggcctgcgca aggtgcgcgc cgagaacgac 2160
cgccaccacg ccctggacgc cgtggtggtg gcctgcagca ccgtggccat gcagcagaag 2220
atcacccgct tcgtgcgcta caaggagatg aacgccttcg acggtaaaac catcgacaag 2280
gagaccggcg aggtgctgca ccagaagacc cacttccccc agccctggga gttcttcgcc 2340
caggaggtga tgatccgcgt gttcggcaag cccgacggca agcccgagtt cgaggaggcc 2400
gacacccccg agaagctgcg caccctgctg gccgagaagc tgagcagccg ccctgaggcc 2460
gtgcacgagt acgtgactcc tctgttcgtg agccgcgccc ccaaccgcaa gatgagcggt 2520
cagggtcaca tggagaccgt gaagagcgcc aagcgcctgg acgagggcgt gagcgtgctg 2580
cgcgtgcccc tgacccagct gaagctgaag gacctggaga agatggtgaa ccgcgagcgc 2640
gagcccaagc tgtacgaggc cctgaaggcc cgcctggagg cccacaagga cgaccccgcc 2700
aaggccttcg ccgagccctt ctacaagtac gacaaggccg gcaaccgcac ccagcaggtg 2760
aaggccgtgc gcgtggagca ggtgcagaag accggcgtgt gggtgcgcaa ccacaacggc 2820
atcgccgaca acgccaccat ggtgcgcgtg gacgtgttcg agaagggcga caagtactac 2880
ctggtgccca tctacagctg gcaggtggcc aagggcatcc tgcccgaccg cgccgtggtg 2940
cagggcaagg acgaggagga ctggcagctg atcgacgaca gcttcaactt caagttcagc 3000
ctgcacccca acgacctggt ggaggtgatc accaagaagg cccgcatgtt cggctacttc 3060
gccagctgcc accgcggcac cggcaacatc aacatccgca tccacgacct ggaccacaag 3120
atcggcaaga acggcatcct ggagggcatc ggcgtgaaga ccgccctgag cttccagaag 3180
taccagatcg acgagctggg caaggagatc cgcccctgcc gcctgaagaa gcgccctcct 3240
gtgcgctaa 3249
<210> 14
<211> 859
<212> PRT
<213> 人工序列
<220>
<223> 衍生自Sm、Sp、St和Li Cas9序列的合成的Cas9共有序列
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (8)..(18)
<223> N-末端RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (26)..(26)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (29)..(31)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (33)..(33)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (36)..(36)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (45)..(45)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (54)..(54)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (63)..(63)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (71)..(71)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (75)..(75)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (76)..(76)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (78)..(80)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (82)..(82)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (84)..(84)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (85)..(85)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (89)..(89)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (90)..(90)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (98)..(98)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (100)..(100)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (106)..(106)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (113)..(113)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (116)..(116)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (125)..(125)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (126)..(126)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (128)..(133)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (135)..(135)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (137)..(137)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (139)..(147)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (153)..(155)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (157)..(157)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (159)..(159)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (161)..(161)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (163)..(163)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (166)..(168)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (170)..(170)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (171)..(171)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (173)..(175)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (177)..(177)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (183)..(183)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (185)..(187)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (189)..(189)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (192)..(195)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (198)..(198)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (199)..(199)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (202)..(202)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (206)..(206)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (207)..(207)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (210)..(210)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (212)..(212)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (213)..(213)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (219)..(219)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (220)..(220)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (222)..(222)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (224)..(224)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (226)..(226)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (236)..(236)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (240)..(240)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (241)..(241)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (244)..(246)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (248)..(248)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (249)..(249)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (250)..(250)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (252)..(254)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (256)..(256)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (257)..(257)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (268)..(268)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (271)..(271)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (273)..(273)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (277)..(277)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (280)..(280)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (281)..(281)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (283)..(283)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (289)..(289)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (290)..(290)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (292)..(294)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (301)..(301)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (308)..(308)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (319)..(322)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (328)..(328)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (329)..(329)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (335)..(337)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (346)..(346)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (347)..(347)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (356)..(361)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (363)..(363)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (370)..(373)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (375)..(375)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (376)..(376)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (379)..(379)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (386)..(390)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (393)..(393)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (395)..(395)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (396)..(396)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (398)..(398)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (400)..(400)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (403)..(403)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (407)..(407)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (410)..(410)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (411)..(411)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (413)..(416)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (418)..(418)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (422)..(422)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (428)..(428)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (431)..(431)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (433)..(433)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (437)..(439)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (445)..(445)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (451)..(451)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (456)..(456)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (459)..(459)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (465)..(469)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (481)..(481)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (482)..(482)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (484)..(484)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (490)..(490)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (494)..(494)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (495)..(502)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (497)..(497)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (506)..(506)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (510)..(510)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (513)..(513)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (514)..(514)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (517)..(517)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (520)..(520)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (525)..(525)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (526)..(526)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (529)..(529)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (531)..(531)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (532)..(532)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (534)..(534)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (542)..(542)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (546)..(546)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (547)..(547)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (553)..(553)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (555)..(575)
<223> HNH样结构域
<220>
<221> 尚未归类的特征
<222> (556)..(556)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (560)..(560)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (563)..(563)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (565)..(565)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (567)..(567)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (579)..(579)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (582)..(582)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (583)..(583)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (585)..(585)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (588)..(588)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (590)..(590)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (592)..(592)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (594)..(596)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (610)..(610)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (616)..(616)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (628)..(628)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (631)..(631)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (633)..(633)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (634)..(634)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (636)..(636)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (638)..(641)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (643)..(645)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (653)..(653)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (657)..(657)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (659)..(659)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (660)..(660)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (665)..(665)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (666)..(666)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (668)..(668)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (669)..(669)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (670)..(677)
<223> RuvC样结构域
<220>
<221> 尚未归类的特征
<222> (680)..(680)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (681)..(681)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (683)..(683)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (686)..(686)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (696)..(696)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (697)..(697)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (704)..(704)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (708)..(708)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (710)..(710)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (711)..(711)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (714)..(714)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (717)..(720)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (722)..(722)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (725)..(725)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (727)..(727)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (733)..(735)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (740)..(740)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (742)..(742)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (749)..(754)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (758)..(761)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (763)..(768)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (771)..(771)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (774)..(777)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (782)..(782)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (784)..(786)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (788)..(788)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (790)..(790)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (795)..(795)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (799)..(799)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (801)..(801)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (802)..(802)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (804)..(804)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (806)..(813)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (815)..(818)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (820)..(820)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (823)..(827)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (829)..(829)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (830)..(830)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (832)..(832)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (835)..(837)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (842)..(844)
<223> 每个Xaa可以独立地是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (846)..(846)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (848)..(848)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (851)..(851)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (857)..(857)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> 尚未归类的特征
<222> (857)..(857)
<223> Xaa可以是任何天然存在的氨基酸
<400> 14
Met Lys Tyr Xaa Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp
1 5 10 15
Ala Val Thr Asp Xaa Tyr Xaa Xaa Lys Xaa Lys Gly Xaa Xaa Xaa Ile
20 25 30
Xaa Lys Asn Xaa Gly Leu Phe Asp Gly Thr Ala Arg Xaa Arg Thr Ala
35 40 45
Arg Arg Arg Arg Arg Xaa Asn Arg Ile Tyr Leu Gln Ile Phe Xaa Glu
50 55 60
Met Asp Phe Phe Arg Leu Xaa Ser Phe Val Xaa Xaa Lys Xaa Xaa Xaa
65 70 75 80
Pro Xaa Phe Xaa Xaa Glu Tyr His Xaa Xaa Pro Thr Ile Tyr His Leu
85 90 95
Arg Xaa Leu Xaa Lys Asp Leu Arg Leu Xaa Tyr Leu Ala Leu Ala His
100 105 110
Xaa Ile Lys Xaa Arg Gly Asn Phe Leu Ile Glu Gly Xaa Xaa Asn Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Tyr Xaa Phe Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Pro Glu Lys Gly Phe Xaa Xaa Xaa Leu Xaa Gly Xaa Phe
145 150 155 160
Xaa Phe Xaa Leu Glu Xaa Xaa Xaa Lys Xaa Xaa Tyr Xaa Xaa Xaa Leu
165 170 175
Xaa Leu Leu Ile Gly Asp Xaa Tyr Xaa Xaa Xaa Phe Xaa Ala Lys Xaa
180 185 190
Xaa Xaa Xaa Leu Ser Xaa Xaa Val Thr Xaa Ala Leu Ser Xaa Xaa Met
195 200 205
Ile Xaa Arg Xaa Xaa His Asp Leu Leu Lys Xaa Xaa Tyr Xaa Glu Xaa
210 215 220
Phe Xaa Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Xaa Gln Phe Tyr Xaa
225 230 235 240
Xaa Lys Leu Xaa Xaa Xaa Gly Xaa Xaa Xaa Lys Xaa Xaa Xaa Glu Xaa
245 250 255
Xaa Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Xaa Ile Pro Xaa Gln
260 265 270
Xaa His Leu Glu Xaa Ala Ile Xaa Xaa Gln Xaa Tyr Pro Phe Leu Asn
275 280 285
Xaa Xaa Ile Xaa Xaa Xaa Thr Phe Arg Ile Pro Tyr Xaa Val Gly Pro
290 295 300
Leu Ala Gly Xaa Ser Phe Ala Trp Arg Lys Ile Pro Trp Asn Xaa Xaa
305 310 315 320
Xaa Xaa Asp Ser Ala Phe Ile Xaa Xaa Met Thr Asp Leu Pro Xaa Xaa
325 330 335
Xaa Val Leu Pro Lys His Ser Leu Tyr Xaa Xaa Val Tyr Asn Glu Leu
340 345 350
Thr Lys Val Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Ile Phe Lys Arg Lys
355 360 365
Val Xaa Xaa Xaa Xaa Gly Xaa Xaa Phe Asn Xaa Ser Thr Tyr His Asp
370 375 380
Leu Xaa Xaa Xaa Xaa Xaa Leu Asp Xaa Asn Xaa Xaa Glu Xaa Ile Xaa
385 390 395 400
Leu Thr Xaa Phe Glu Asp Xaa Met Ile Xaa Xaa Leu Xaa Xaa Xaa Xaa
405 410 415
Lys Xaa Leu Arg Arg Xaa Tyr Thr Gly Trp Gly Xaa Leu Ser Xaa Leu
420 425 430
Xaa Gly Ile Arg Xaa Xaa Xaa Ser Thr Ile Leu Asp Xaa Leu Asp Asn
435 440 445
Arg Asn Xaa Met Gln Leu Ile Xaa Asp Leu Xaa Phe Lys Ile Lys Gln
450 455 460
Xaa Xaa Xaa Xaa Xaa Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
465 470 475 480
Xaa Xaa Lys Xaa Val Asp Glu Leu Val Xaa Met Gly Pro Xaa Ile Val
485 490 495
Xaa Glu Met Ala Arg Glu Asn Gln Thr Xaa Gly Asn Ser Xaa Arg Lys
500 505 510
Xaa Xaa Lys Glu Xaa Gly Ser Xaa Ile Leu Lys Glu Xaa Xaa Asn Leu
515 520 525
Xaa Asn Xaa Xaa Leu Xaa Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met
530 535 540
Tyr Xaa Xaa Leu Asp Ile Leu Ser Xaa Tyr Asp Xaa Asp His Ile Xaa
545 550 555 560
Pro Gln Xaa Phe Xaa Asp Xaa Ser Ile Asp Asn Val Leu Ser Asn Arg
565 570 575
Lys Asp Xaa Val Pro Xaa Xaa Val Xaa Lys Lys Xaa Trp Xaa Leu Xaa
580 585 590
Leu Xaa Xaa Xaa Arg Lys Phe Asp Leu Thr Lys Ala Glu Arg Gly Gly
595 600 605
Leu Xaa Asp Lys Ala Phe Ile Xaa Arg Gln Leu Val Glu Thr Arg Gln
610 615 620
Ile Thr Lys Xaa Val Ala Xaa Leu Xaa Xaa Asn Xaa Asp Xaa Xaa Xaa
625 630 635 640
Xaa Val Xaa Xaa Xaa Thr Leu Lys Ser Leu Val Ser Xaa Phe Arg Lys
645 650 655
Xaa Phe Xaa Xaa Leu Tyr Lys Val Xaa Xaa Asn Xaa Xaa His His Ala
660 665 670
His Asp Ala Tyr Leu Asn Val Xaa Xaa Leu Xaa Tyr Pro Xaa Leu Glu
675 680 685
Glu Phe Val Tyr Gly Asp Tyr Xaa Xaa Lys Ala Thr Lys Phe Tyr Xaa
690 695 700
Asn Ile Met Xaa Phe Xaa Xaa Gly Glu Xaa Trp Lys Xaa Xaa Xaa Xaa
705 710 715 720
Val Xaa Met Gln Xaa Asn Xaa Val Lys Lys Glu Gln Xaa Xaa Xaa Pro
725 730 735
Lys Asn Ser Xaa Leu Xaa Lys Asp Lys Tyr Gly Gly Xaa Xaa Xaa Xaa
740 745 750
Xaa Xaa Lys Gly Lys Xaa Xaa Xaa Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
755 760 765
Phe Leu Xaa Gly Tyr Xaa Xaa Xaa Xaa Leu Pro Lys Tyr Xaa Leu Xaa
770 775 780
Xaa Xaa Gly Xaa Arg Xaa Leu Ala Ser Glu Xaa Lys Gly Asn Xaa Leu
785 790 795 800
Xaa Xaa Leu Xaa Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Xaa
805 810 815
Xaa Xaa Phe Xaa Ala Asn Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Gly Xaa
820 825 830
Ala Phe Xaa Xaa Xaa Ile Arg Arg Tyr Xaa Xaa Xaa Thr Xaa Ile Xaa
835 840 845
Gln Ser Xaa Thr Gly Leu Tyr Glu Xaa Arg Leu
850 855
<210> 15
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Val或His
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Ile、 Leu或Val
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Met或Thr
<400> 15
Ile Xaa Xaa Glu Xaa Ala Arg Glu
1 5
<210> 16
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Ile、Leu或 Val
<400> 16
Ile Val Xaa Glu Met Ala Arg Glu
1 5
<210> 17
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是His或Leu
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Arg或Val
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Glu或Val
<400> 17
His His Ala Xaa Asp Ala Xaa Xaa
1 5
<210> 18
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> RuvC样结构域
<400> 18
His His Ala His Asp Ala Tyr Leu
1 5
<210> 19
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> N-末端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Lys或Pro
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Val、Leu、Ile或Phe
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Gly、Ala或Ser
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Leu、Ile、Val或Phe
<220>
<221> 修饰的残基
<222> (7)..(26)
<223> N-末端RuvC样结构域,每个Xaa可以是任何氨基酸或不存在的,区域可以涵盖15-20个残基
<220>
<221> 变体
<222> (29)..(29)
<223> Xaa是Asp、Glu、Asn或Gln
<400> 19
Lys Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asp Xaa Tyr
20 25 30
<210> 20
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N-末端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile、Val、Met、Leu或Thr
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、Val、Ser、Asn、Tyr、Glu或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met或Phe
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Ser、Tyr、Asn或Phe
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Val、Ile、Leu、Cys、Thr或Phe
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Trp、Phe、Val、Tyr、Ser或Leu
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Ala、Ser、Cys、Val或Gly
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在
<400> 20
Asp Xaa Gly Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 21
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N-末端RuvC样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile、Val、Met、Leu或Thr
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、Val、Ser、Asn、Tyr、Glu或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met或Phe
<220>
<221> 变体
<222> (7)..(7)
<223> Xaa是Val、Ile、Leu、Cys、Thr或Phe
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Trp、Phe、Val、Tyr、Ser或Leu
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Ala、Ser、Cys、Val或Gly
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在
<400> 21
Asp Xaa Gly Xaa Xaa Ser Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 22
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N-末端RuvC样结构域
<220>
<221> 变体
<222> (4)..(4)
<223> Xaa是Thr、Ile、Val、Ser、Asn、Tyr、Glu或Leu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Asn、Ser、Gly、Ala、Asp、Thr、Arg、Met或Phe
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Val、Ile、Leu、Ala、Met或His
<220>
<221> 变体
<222> (12)..(12)
<223> 任何氨基酸或不存在
<400> 22
Asp Ile Gly Xaa Xaa Ser Val Gly Trp Ala Xaa Xaa
1 5 10
<210> 23
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> N-末端RuvC样结构域
<220>
<221> 修饰的残基
<222> (12)..(12)
<223> 任何非极性烷基氨基酸或羟基氨基酸
<400> 23
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Xaa
1 5 10
<210> 24
<211> 73
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Lys或Arg
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Val或Thr
<220>
<221> 变体
<222> (13)..(13)
<223> Xaa是Gly或Asp
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Glu、Gln或Asp
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa是Glu或Asp
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Asp、Asn或His
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa是Tyr、Arg或Asn
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Gln、Asp或Asn
<220>
<221> 修饰的残基
<222> (25)..(64)
<223> HNH样结构域,每个Xaa可以是任何氨基酸或不存在的,区域可以涵盖15-40个残基
<220>
<221> 变体
<222> (67)..(67)
<223> Xaa是Gly或Glu
<220>
<221> 变体
<222> (69)..(69)
<223> Xaa是Ser或Gly
<220>
<221> 变体
<222> (71)..(71)
<223> Xaa是Asp或Asn
<400> 24
Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met Tyr Xaa Xaa Xaa Xaa Leu
1 5 10 15
Asp Ile Xaa Xaa Leu Ser Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Asn Arg Xaa Lys Xaa Asp Xaa Val Pro
65 70
<210> 25
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp、Glu、Gln或Asn
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Leu、Ile、Arg、Gln、Val、Met或Lys
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Ile、Val、Thr、Ala或Leu
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Val、Tyr、Ile、Leu、Phe或Trp
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu、Phe或Trp
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Ser、Ala、Asp、Thr或Lys
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly或
Ser
<220>
<221> 变体
<222> (13)..(13)
<223> Xaa是Asp、Ser、Asn、Arg、Leu或Thr
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Asp、Asn或Ser
<220>
<221> 变体
<222> (15)..(15)
<223> Xaa是Ser、Ala、Thr、Gly或Arg
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr或Val
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Lys、Leu、Arg、Met、Thr或Phe
<220>
<221> 变体
<222> (20)..(20)
<223> Xaa是Val、Leu、Ile、Ala或Thr
<220>
<221> 变体
<222> (21)..(21)
<223> Xaa是Leu、Ile、Val或Ala
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr、Val、Cys、Glu、Ser或Ala
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、Gln、
Arg或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp或Phe
<400> 25
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 26
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Leu、Ile、Arg、Gln、Val、Met或Lys
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (5)..(5)
<223> Xaa是Ile、Val、Thr、Ala或Leu
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Val、Tyr、Ile、Leu、Phe或Trp
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu、Phe或Trp
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly或
Ser
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr或Val
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr、Val、Cys、Glu、Ser或Ala
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、Gln、
Arg或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp或Phe
<400> 26
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 27
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (1)..(1)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (3)..(3)
<223> Xaa是Asp或Glu
<220>
<221> 变体
<222> (8)..(8)
<223> Xaa是Gln、His、Arg、Lys、Tyr、Ile、Leu或Trp
<220>
<221> 变体
<222> (10)..(10)
<223> Xaa是Phe、Leu、Val、Lys、Tyr、Met、Ile、Arg、Ala、Glu、Asp或
Gln
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Leu、Arg、Thr、Ile、Val、Ser、Cys、Tyr、Lys、Phe或Gly
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys、Gln、Tyr、Thr、Phe、Leu、Trp、Met、Ala、Glu、Gly或
Ser
<220>
<221> 变体
<222> (16)..(16)
<223> Xaa是Ile、Leu、Phe、Ser、Arg、Tyr、Gln、Trp、Asp、Lys或His
<220>
<221> 变体
<222> (17)..(17)
<223> Xaa是Asp、Ser、Ile、Asn、Glu、Ala、His、Phe、Leu、Gln、Met、
Gly、Tyr或Val
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Arg、Phe、Thr、Trp、Glu、Leu、Asn、Cys、Lys、Val、Ser、
Gln、Ile、Tyr、His或Ala
<220>
<221> 变体
<222> (24)..(24)
<223> Xaa是Ser、Pro、Arg、Lys、Asn、Ala、His、Gln、Gly或Leu
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Asp、Gly、Thr、Asn、Ser、Lys、Ala、Ile、Glu、Leu、Gln、
Arg或Tyr
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Lys、Val、Ala、Glu、Tyr、Ile、Cys、Leu、Ser、Thr、Gly、
Lys、Met、Asp或Phe
<400> 27
Xaa Val Xaa His Ile Val Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Thr Xaa Xaa Xaa Xaa Asn
20 25
<210> 28
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> HNH样结构域
<220>
<221> 变体
<222> (2)..(2)
<223> Xaa是Ile或Val
<220>
<221> 变体
<222> (6)..(6)
<223> Xaa是Ile或Val
<220>
<221> 变体
<222> (9)..(9)
<223> Xaa是Ala或Ser
<220>
<221> 变体
<222> (11)..(11)
<223> Xaa是Ile或Leu
<220>
<221> 变体
<222> (12)..(12)
<223> Xaa是Lys或Thr
<220>
<221> 变体
<222> (14)..(14)
<223> Xaa是Asp或Asn
<220>
<221> 变体
<222> (19)..(19)
<223> Xaa是Arg、Lys或Leu
<220>
<221> 变体
<222> (22)..(22)
<223> Xaa是Thr或Val
<220>
<221> 变体
<222> (23)..(23)
<223> Xaa是Ser或Arg
<220>
<221> 变体
<222> (25)..(25)
<223> Xaa是Lys、Asp或Ala
<220>
<221> 变体
<222> (26)..(26)
<223> Xaa是Glu、Lys、Gly或Asn
<400> 28
Asp Xaa Asp His Ile Xaa Pro Gln Xaa Phe Xaa Xaa Asp Xaa Ser Ile
1 5 10 15
Asp Asn Xaa Val Leu Xaa Xaa Ser Xaa Xaa Asn
20 25
<210> 29
<211> 116
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向区域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (47)..(70)
<223> 第二互补结构域
<400> 29
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 30
<211> 116
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向区域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (47)..(70)
<223> 第二互补结构域
<400> 30
nnnnnnnnnn nnnnnnnnnn guauuagagc uaugcuguau uggaaacaau acagcauagc 60
aaguuaauau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 31
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 31
nnnnnnnnnn nnnnnnnnnn guuuaagagc uagaaauagc aaguuuaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 32
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的gRNA近端和尾部结构域
<400> 32
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcu 47
<210> 33
<211> 49
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 33
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cgguggugc 49
<210> 34
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 34
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcggau c 51
<210> 35
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 35
aaggcuaguc cguuaucaac uugaaaaagu g 31
<210> 36
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 36
aaggcuaguc cguuauca 18
<210> 37
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> gRNA近端和尾部结构域
<400> 37
aaggcuaguc cg 12
<210> 38
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 来源于金黄色葡萄球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<400> 38
nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuggaaaca gaaucuacua aaacaaggca 60
aaaugccgug uuuaucucgu caacuuguug gcgagauuuu uu 102
<210> 39
<211> 42
<212> RNA
<213> 人工的
<220>
<223> 来源于化脓链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<400> 39
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 40
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(9)
<223> 5’延伸结构域
<220>
<221> 尚未归类的特征
<222> (10)..(33)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (34)..(45)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (46)..(85)
<223> 尾部结构域
<400> 40
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuu 85
<210> 41
<211> 62
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 41
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cg 62
<210> 42
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (63)..(102)
<223> 尾部结构域
<400> 42
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 43
<211> 75
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (21)..(36)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (37)..(40)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (41)..(58)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (59)..(70)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (71)..(75)
<223> 尾部结构域
<400> 43
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuauc 75
<210> 44
<211> 87
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的单分子gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (57)..(70)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (71)..(82)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (83)..(87)
<223> 尾部结构域
<400> 44
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuauc 87
<210> 45
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 来源于嗜热链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> a、c、u、g,未知或其他
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(42)
<223> 第一互补结构域
<400> 45
nnnnnnnnnn nnnnnnnnnn guuuuagagc uguguuguuu cg 42
<210> 46
<211> 78
<212> RNA
<213> 人工序列
<220>
<223> 来源于嗜热链球菌的模块化gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(3)
<223> 5’延伸结构域
<220>
<221> 尚未归类的特征
<222> (4)..(27)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (28)..(40)
<223> 近端结构域
<220>
<221> 尚未归类的特征
<222> (41)..(78)
<223> 尾部结构域
<400> 46
gggcgaaaca acacagcgag uuaaaauaag gcuuaguccg uacucaacuu gaaaaggugg 60
caccgauucg guguuuuu 78
<210> 47
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 来源于化脓链球菌的模块化gRNA
<400> 47
gaaccauuca aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa 60
guggcaccga gucggugcuu uuuuu 85
<210> 48
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> 来自化脓链球菌的gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<400> 48
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 49
<211> 96
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(32)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (33)..(36)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (37)..(50)
<223> 第二互补结构域
<220>
<221> 尚未归类的特征
<222> (51)..(62)
<223> 近端结构域
<400> 49
nnnnnnnnnn nnnnnnnnnn guauuagagc uagaaauagc aaguuaauau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 50
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(36)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (37)..(40)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (41)..(58)
<223> 第二互补结构域
<400> 50
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugc 104
<210> 51
<211> 106
<212> RNA
<213> 人工序列
<220>
<223> gRNA
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a、c、g或u
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> 靶向结构域
<220>
<221> 尚未归类的特征
<222> (21)..(37)
<223> 第一互补结构域
<220>
<221> 尚未归类的特征
<222> (38)..(41)
<223> 连接结构域
<220>
<221> 尚未归类的特征
<222> (42)..(60)
<223> 第二互补结构域
<400> 51
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuggaa acagcauagc aaguuaaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106
<210> 52
<211> 12
<212> PRT
<213> Peptoniphilus duerdenii
<400> 52
Asp Ile Gly Thr Ala Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 53
<211> 12
<212> PRT
<213> 齿垢密螺旋体
<400> 53
Asp Val Gly Thr Gly Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 54
<211> 12
<212> PRT
<213> 变形链球菌
<400> 54
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val
1 5 10
<210> 55
<211> 12
<212> PRT
<213> 化脓链球菌
<400> 55
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 56
<211> 12
<212> PRT
<213> 无害利斯特菌
<400> 56
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 57
<211> 12
<212> PRT
<213> Flavobacterium branchiophilum FL-15
<400> 57
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Val Val
1 5 10
<210> 58
<211> 11
<212> PRT
<213> Pedobacter glucosidilyticus
<400> 58
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Ile
1 5 10
<210> 59
<211> 12
<212> PRT
<213> 脆弱拟杆菌(Bacteroides fragilis),NCTC 9343
<400> 59
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Leu Val
1 5 10
<210> 60
<211> 12
<212> PRT
<213> 具核梭杆菌(Fusobacterium nucleatum)
<400> 60
Asp Ile Gly Thr Asn Ser Val Gly Trp Cys Val Thr
1 5 10
<210> 61
<211> 12
<212> PRT
<213> 氨基酸球菌属(Acidaminococcus sp.) D21
<400> 61
Asp Ile Gly Thr Asn Ser Val Gly Tyr Ala Val Thr
1 5 10
<210> 62
<211> 12
<212> PRT
<213> Coprococcus catus GD-7
<400> 62
Asp Met Gly Thr Gly Ser Leu Gly Trp Ala Val Thr
1 5 10
<210> 63
<211> 12
<212> PRT
<213> Oenococcus kitaharae DSM 17330
<400> 63
Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Ala Ile
1 5 10
<210> 64
<211> 12
<212> PRT
<213> Catenibacterium mitsuokai DSM 15897
<400> 64
Asp Leu Gly Thr Gly Ser Val Gly Trp Ala Val Val
1 5 10
<210> 65
<211> 12
<212> PRT
<213> 鸡毒霉形体(Mycoplasma gallisepticum)str. F
<400> 65
Asp Leu Gly Val Gly Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 66
<211> 12
<212> PRT
<213> 绵羊肺炎霉形体(Mycoplasma ovipneumoniae) SC01
<400> 66
Asp Leu Gly Ile Ala Ser Ile Gly Trp Ala Ile Ile
1 5 10
<210> 67
<211> 12
<212> PRT
<213> 犬支原体 (Mycoplasma canis)PG 14
<400> 67
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 68
<211> 12
<212> PRT
<213> 滑液囊支原体(Mycoplasma synoviae) 53
<400> 68
Asp Leu Gly Val Ala Ser Val Gly Trp Ser Ile Val
1 5 10
<210> 69
<211> 12
<212> PRT
<213> 直肠真杆菌(Eubacterium rectale)
<400> 69
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Leu
1 5 10
<210> 70
<211> 12
<212> PRT
<213> 粪肠球菌(Enterococcus faecalis) TX0012
<400> 70
Asp Leu Gly Ile Ser Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 71
<211> 12
<212> PRT
<213> 多营养泥杆菌(Ilyobacter polytropus) DSM 2926
<400> 71
Asp Ile Gly Ile Ala Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 72
<211> 12
<212> PRT
<213> 白色瘤胃球菌(Ruminococcus albus) 8
<400> 72
Asp Val Gly Ile Gly Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 73
<211> 12
<212> PRT
<213> Elusimicrobium minutum Pei191
<400> 73
Asp Leu Gly Val Gly Ser Ile Gly Phe Ala Ile Val
1 5 10
<210> 74
<211> 12
<212> PRT
<213> Akkermansia muciniphila
<400> 74
Asp Ile Gly Tyr Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 栖瘤胃普雷沃氏菌(Prevotella ruminicola)
<400> 75
Asp Thr Gly Thr Asn Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 76
<211> 12
<212> PRT
<213> Cand. Puniceispirillum marinum
<400> 76
Asp Leu Gly Thr Asn Ser Ile Gly Trp Cys Leu Leu
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 深红螺菌(Rhodospirillum rubrum)
<400> 77
Asp Ile Gly Thr Asp Ser Leu Gly Trp Ala Val Phe
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 鼠李糖乳杆菌(Lactobacillus rhamnosus) GG
<400> 78
Asp Ile Gly Ser Asn Ser Ile Gly Phe Ala Val Val
1 5 10
<210> 79
<211> 12
<212> PRT
<213> Sphaerochaeta globus str. Buddy
<400> 79
Asp Leu Gly Val Gly Ser Ile Gly Val Ala Val Ala
1 5 10
<210> 80
<211> 12
<212> PRT
<213> 沼泽红假单胞菌(Rhodopseudomonas palustris)
<400> 80
Asp Leu Gly Ile Ala Ser Cys Gly Trp Gly Val Val
1 5 10
<210> 81
<211> 12
<212> PRT
<213> 运动支原体(Mycoplasma mobile) 163K
<400> 81
Asp Leu Gly Ile Ala Ser Val Gly Trp Cys Leu Thr
1 5 10
<210> 82
<211> 12
<212> PRT
<213> 嗜热链球菌 LMD-9
<400> 82
Asp Ile Gly Ile Gly Ser Val Gly Val Gly Ile Leu
1 5 10
<210> 83
<211> 12
<212> PRT
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)M23590
<400> 83
Asp Ile Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile
1 5 10
<210> 84
<211> 12
<212> PRT
<213> 细长真杆菌(Eubacterium dolichum)DSM 3991
<400> 84
Asp Ile Gly Ile Thr Ser Val Gly Phe Gly Ile Ile
1 5 10
<210> 85
<211> 12
<212> PRT
<213> 棒状乳杆菌(Lactobacillus coryniformis)KCTC 3535
<400> 85
Asp Val Gly Ile Thr Ser Thr Gly Tyr Ala Val Leu
1 5 10
<210> 86
<211> 12
<212> PRT
<213> Nitratifractor salsuginis DSM 16511
<400> 86
Asp Leu Gly Ile Thr Ser Phe Gly Tyr Ala Ile Leu
1 5 10
<210> 87
<211> 12
<212> PRT
<213> 两岐双岐杆菌(Bifidobacterium bifidum)S17
<400> 87
Asp Ile Gly Asn Ala Ser Val Gly Trp Ser Ala Phe
1 5 10
<210> 88
<211> 12
<212> PRT
<213> 加氏乳杆菌(Lactobacillus gasseri)
<400> 88
Asp Val Gly Thr Asn Ser Cys Gly Trp Val Ala Met
1 5 10
<210> 89
<211> 12
<212> PRT
<213> 解纤维热酸菌(Acidothermus cellulolyticus) 11B
<400> 89
Asp Val Gly Glu Arg Ser Ile Gly Leu Ala Ala Val
1 5 10
<210> 90
<211> 12
<212> PRT
<213> 长双歧杆菌(Bifidobacterium longum)DJO10A
<400> 90
Asp Val Gly Leu Asn Ser Val Gly Leu Ala Ala Val
1 5 10
<210> 91
<211> 12
<212> PRT
<213> 齿双歧杆菌(Bifidobacterium dentium)
<400> 91
Asp Val Gly Leu Met Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 92
<211> 12
<212> PRT
<213> 白喉杆菌(Corynebacterium diphtheriae)
<400> 92
Asp Val Gly Thr Phe Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 93
<211> 12
<212> PRT
<213> Staphylococcus pseudintermedius ED99
<400> 93
Asp Ile Gly Thr Gly Ser Val Gly Tyr Ala Cys Met
1 5 10
<210> 94
<211> 12
<212> PRT
<213> 黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)
<400> 94
Asp Leu Gly Thr Thr Ser Ile Gly Phe Ala His Ile
1 5 10
<210> 95
<211> 12
<212> PRT
<213> 栖牙普雷沃菌(Prevotella denticola)
<400> 95
Asp Leu Gly Thr Asn Ser Ile Gly Ser Ser Val Arg
1 5 10
<210> 96
<211> 12
<212> PRT
<213> 青枯菌(Ralstonia solanacearum)
<400> 96
Asp Ile Gly Thr Asn Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 97
<211> 12
<212> PRT
<213> 多杀巴斯德菌(Pasteurella multocida) str. Pm70
<400> 97
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Val Val
1 5 10
<210> 98
<211> 12
<212> PRT
<213> Comamonas granuli
<400> 98
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 99
<211> 12
<212> PRT
<213> 鼬鼠螺杆菌(Helicobacter mustelae)12198
<400> 99
Asp Ile Gly Ile Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 100
<211> 12
<212> PRT
<213> Agathobacter rectalis
<400> 100
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Ile
1 5 10
<210> 101
<211> 12
<212> PRT
<213> 解纤维梭菌(Clostridium cellulolyticum)H10
<400> 101
Asp Val Gly Ile Ala Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 102
<211> 11
<212> PRT
<213> 嗜甲基菌属(Methylophilus sp.)OH31
<400> 102
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Leu
1 5 10
<210> 103
<211> 12
<212> PRT
<213> 脑膜炎奈瑟氏菌
<400> 103
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val
1 5 10
<210> 104
<211> 12
<212> PRT
<213> 产气荚膜梭菌(Clostridium perfringens)
<400> 104
Asp Ile Gly Ile Thr Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 105
<211> 12
<212> PRT
<213> 产琥珀酸沃廉菌(Wolinella succinogenes)DSM 1740
<400> 105
Asp Leu Gly Ile Ser Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 106
<211> 12
<212> PRT
<213> 固氮螺菌属(Azospirillum sp.)B510
<400> 106
Asp Leu Gly Thr Asn Ser Ile Gly Trp Gly Leu Leu
1 5 10
<210> 107
<211> 12
<212> PRT
<213> Verminephrobacter eiseniae
<400> 107
Asp Leu Gly Ser Thr Ser Leu Gly Trp Ala Ile Phe
1 5 10
<210> 108
<211> 12
<212> PRT
<213> 空肠弯曲菌(Campylobacter jejuni),NCTC 11168
<400> 108
Asp Ile Gly Ile Ser Ser Ile Gly Trp Ala Phe Ser
1 5 10
<210> 109
<211> 12
<212> PRT
<213> 食清洁剂细小棒菌(Parvibaculum lavamentivorans) DS-1
<400> 109
Asp Ile Gly Thr Thr Ser Ile Gly Phe Ser Val Ile
1 5 10
<210> 110
<211> 12
<212> PRT
<213> Dinoroseobacter shibae DFL 12
<400> 110
Asp Ile Gly Thr Ser Ser Ile Gly Trp Trp Leu Tyr
1 5 10
<210> 111
<211> 12
<212> PRT
<213> 汉氏硝化细菌(Nitrobacter hamburgensis) X14
<400> 111
Asp Leu Gly Ser Asn Ser Leu Gly Trp Phe Val Thr
1 5 10
<210> 112
<211> 12
<212> PRT
<213> 慢生根瘤菌属(Bradyrhizobium sp.)BTAi1
<400> 112
Asp Leu Gly Ala Asn Ser Leu Gly Trp Phe Val Val
1 5 10
<210> 113
<211> 15
<212> PRT
<213> 蜡样芽孢杆菌(Bacillus cereus)
<400> 113
Asp Ile Gly Leu Arg Ile Gly Ile Thr Ser Cys Gly Trp Ser Ile
1 5 10 15
<210> 114
<211> 12
<212> PRT
<213> Sutterella wadsworthensis
<400> 114
Asp Met Gly Ala Lys Tyr Thr Gly Val Phe Tyr Ala
1 5 10
<210> 115
<211> 12
<212> PRT
<213> 产琥珀酸沃廉菌 DSM 1740
<400> 115
Asp Leu Gly Gly Lys Asn Thr Gly Phe Phe Ser Phe
1 5 10
<210> 116
<211> 12
<212> PRT
<213> 土拉弗朗西斯菌(Francisella tularensis)
<400> 116
Asp Leu Gly Val Lys Asn Thr Gly Val Phe Ser Ala
1 5 10
<210> 117
<211> 12
<212> PRT
<213> γ变形菌(Gamma proteobacterium) HTCC5015
<400> 117
Asp Leu Gly Ala Lys Phe Thr Gly Val Ala Leu Tyr
1 5 10
<210> 118
<211> 12
<212> PRT
<213> 嗜肺军团菌(Legionella pneumophila) str. Paris
<400> 118
Asp Leu Gly Gly Lys Phe Thr Gly Val Cys Leu Ser
1 5 10
<210> 119
<211> 12
<212> PRT
<213> Parasutterella excrementihominis
<400> 119
Asp Leu Gly Gly Thr Tyr Thr Gly Thr Phe Ile Thr
1 5 10
<210> 120
<211> 12
<212> PRT
<213> 嗜热链球菌
<400> 120
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 121
<211> 12
<212> PRT
<213> 尤里优杆菌(Eubacterium yurii)
<400> 121
Asp Val Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 122
<211> 12
<212> PRT
<213> Butyrivibrio hungatei
<400> 122
Asp Met Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 123
<211> 12
<212> PRT
<213> Solobacterium moorei F0204
<400> 123
Asp Val Gly Thr Ser Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 124
<211> 27
<212> PRT
<213> 齿垢密螺旋体
<400> 124
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Ser Asn Arg Val Leu Val Cys Ser Ser Cys Asn
20 25
<210> 125
<211> 27
<212> PRT
<213> Coprococcus catus GD-7
<400> 125
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Val Leu Val Lys Lys Asn Tyr Asn
20 25
<210> 126
<211> 27
<212> PRT
<213> Peptoniphilus duerdenii
<400> 126
Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Asn Leu Asn
20 25
<210> 127
<211> 27
<212> PRT
<213> Catenibacterium mitsuokai DSM 15897
<400> 127
Gln Ile Asp His Ile Val Pro Gln Ser Leu Val Lys Asp Asp Ser Phe
1 5 10 15
Asp Asn Arg Val Leu Val Val Pro Ser Glu Asn
20 25
<210> 128
<211> 27
<212> PRT
<213> 变形链球菌
<400> 128
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn
20 25
<210> 129
<211> 27
<212> PRT
<213> 嗜热链球菌
<400> 129
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ser Ser Ala Ser Asn
20 25
<210> 130
<211> 27
<212> PRT
<213> Oenococcus kitaharae DSM 17330
<400> 130
Asp Ile Asp His Ile Ile Pro Gln Ala Tyr Thr Lys Asp Asn Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Ser Asn Ile Thr Asn
20 25
<210> 131
<211> 27
<212> PRT
<213> 无害利斯特菌
<400> 131
Asp Ile Asp His Ile Val Pro Gln Ser Phe Ile Thr Asp Asn Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Thr Ser Ser Ala Gly Asn
20 25
<210> 132
<211> 27
<212> PRT
<213> 化脓链球菌
<400> 132
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
20 25
<210> 133
<211> 27
<212> PRT
<213> 氨基酸球菌属D21
<400> 133
Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn
20 25
<210> 134
<211> 27
<212> PRT
<213> 鼠李糖乳杆菌GG
<400> 134
Asp Ile Asp His Ile Leu Pro Gln Ser Leu Ile Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Asn Ala Thr Ile Asn
20 25
<210> 135
<211> 27
<212> PRT
<213> 加氏乳杆菌
<400> 135
Asp Ile Asp His Ile Leu Pro Gln Ser Phe Ile Lys Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Ala Val Asn
20 25
<210> 136
<211> 27
<212> PRT
<213> Staphylococcus pseudintermedius ED99
<400> 136
Glu Val Asp His Ile Phe Pro Arg Ser Phe Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ile Lys Lys Met Asn
20 25
<210> 137
<211> 27
<212> PRT
<213> Olsenella uli
<400> 137
Glu Val Asp His Ile Ile Pro Arg Ser Tyr Ile Lys Asp Asp Ser Phe
1 5 10 15
Glu Asn Lys Val Leu Val Tyr Arg Glu Glu Asn
20 25
<210> 138
<211> 27
<212> PRT
<213> 两岐双岐杆菌S17
<400> 138
Asp Ile Asp His Ile Ile Pro Gln Ala Val Thr Gln Asn Asp Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Val Ala Arg Ala Glu Asn
20 25
<210> 139
<211> 27
<212> PRT
<213> 鸡毒霉形体 str. F
<400> 139
Glu Ile Asp His Ile Ile Pro Tyr Ser Ile Ser Phe Asp Asp Ser Ser
1 5 10 15
Ser Asn Lys Leu Leu Val Leu Ala Glu Ser Asn
20 25
<210> 140
<211> 27
<212> PRT
<213> 犬支原体 PG 14
<400> 140
Glu Ile Asp His Ile Ile Pro Tyr Ser Leu Cys Phe Asp Asp Ser Ser
1 5 10 15
Ala Asn Lys Val Leu Val His Lys Gln Ser Asn
20 25
<210> 141
<211> 27
<212> PRT
<213> 多营养泥杆菌 DSM 2926
<400> 141
Asp Ile Asp His Ile Ile Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Ser Asn Lys Val Leu Val Leu Ser Gly Glu Asn
20 25
<210> 142
<211> 27
<212> PRT
<213> 未培养的白蚁组1细菌
<400> 142
Asp Ile Asp His Ile Ile Pro Tyr Ser Lys Ser Met Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Cys Leu Ala Glu Glu Asn
20 25
<210> 143
<211> 27
<212> PRT
<213> 空肠弯曲菌
<400> 143
Glu Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Phe Thr Lys Gln Asn
20 25
<210> 144
<211> 27
<212> PRT
<213> 解纤维梭菌 H10
<400> 144
Gln Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Leu Thr Asp Glu Asn
20 25
<210> 145
<211> 27
<212> PRT
<213> 产气荚膜梭菌
<400> 145
Glu Ile Asp His Ile Ile Pro Phe Ser Arg Ser Phe Asp Asp Ser Leu
1 5 10 15
Ser Asn Lys Ile Leu Val Leu Gly Ser Glu Asn
20 25
<210> 146
<211> 27
<212> PRT
<213> 脑膜炎奈瑟菌
<400> 146
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Gly Ser Glu Asn
20 25
<210> 147
<211> 27
<212> PRT
<213> 多杀巴斯德菌str. Pm70
<400> 147
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ala Ser Glu Asn
20 25
<210> 148
<211> 27
<212> PRT
<213> 粪肠球菌 TX0012
<400> 148
Glu Ile Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ser Lys Ala Asn
20 25
<210> 149
<211> 27
<212> PRT
<213> 细长真杆菌DSM 3991
<400> 149
Glu Val Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Thr Asn Lys Val Leu Val Thr His Arg Glu Asn
20 25
<210> 150
<211> 27
<212> PRT
<213> Acidovorax ebreus
<400> 150
Gln Val Asp His Ala Leu Pro Tyr Ser Arg Ser Tyr Asp Asp Ser Lys
1 5 10 15
Asn Asn Lys Val Leu Val Leu Thr His Glu Asn
20 25
<210> 151
<211> 27
<212> PRT
<213> 嗜热链球菌 LMD-9
<400> 151
Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp Asp Ser Leu
1 5 10 15
Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn
20 25
<210> 152
<211> 27
<212> PRT
<213> 直肠真杆菌
<400> 152
Glu Ile Asp His Ile Ile Pro Arg Ser Ile Ser Phe Asp Asp Ala Arg
1 5 10 15
Ser Asn Lys Val Leu Val Tyr Arg Ser Glu Asn
20 25
<210> 153
<211> 27
<212> PRT
<213> 路邓葡萄球菌M23590
<400> 153
Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr
1 5 10 15
His Asn Lys Val Leu Val Lys Gln Ser Glu Asn
20 25
<210> 154
<211> 27
<212> PRT
<213> Roseburia intestinalis
<400> 154
Asp Ile Asp His Ile Leu Pro Tyr Ser Ile Thr Phe Asp Asp Ser Phe
1 5 10 15
Arg Asn Lys Val Leu Val Thr Ser Gln Glu Asn
20 25
<210> 155
<211> 27
<212> PRT
<213> 产琥珀酸沃廉菌 DSM 1740
<400> 155
Glu Ile Asp His Ile Leu Pro Arg Ser Arg Ser Ala Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Cys Leu Ala Arg Ala Asn
20 25
<210> 156
<211> 27
<212> PRT
<213> Cand. Puniceispirillum marinum
<400> 156
Glu Ile Glu His Leu Leu Pro Phe Ser Leu Thr Leu Asp Asp Ser Met
1 5 10 15
Ala Asn Lys Thr Val Cys Phe Arg Gln Ala Asn
20 25
<210> 157
<211> 27
<212> PRT
<213> 固氮螺菌属 B510
<400> 157
Asp Ile Asp His Ile Leu Pro Phe Ser Val Ser Leu Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Leu Arg Glu Ala Asn
20 25
<210> 158
<211> 27
<212> PRT
<213> 慢生根瘤菌属 BTAi1
<400> 158
Asp Ile Asp His Leu Ile Pro Phe Ser Ile Ser Trp Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Met Arg Tyr Ala Asn
20 25
<210> 159
<211> 27
<212> PRT
<213> 汉氏硝化细菌 X14
<400> 159
Asp Ile Asp His Ile Leu Pro Val Ala Met Thr Leu Asp Asp Ser Pro
1 5 10 15
Ala Asn Lys Ile Ile Cys Met Arg Tyr Ala Asn
20 25
<210> 160
<211> 27
<212> PRT
<213> Dinoroseobacter shibae
<400> 160
Asp Val Asp His Ile Leu Pro Tyr Ser Arg Thr Leu Asp Asp Ser Phe
1 5 10 15
Pro Asn Arg Thr Leu Cys Leu Arg Glu Ala Asn
20 25
<210> 161
<211> 27
<212> PRT
<213> Verminephrobacter eiseniae
<400> 161
Glu Ile Glu His Ile Leu Pro Phe Ser Arg Thr Leu Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Thr Val Ala Met Arg Arg Ala Asn
20 25
<210> 162
<211> 27
<212> PRT
<213> 棒状乳杆菌KCTC 3535
<400> 162
Glu Val Asp His Ile Ile Pro Tyr Ser Ile Ser Trp Asp Asp Ser Tyr
1 5 10 15
Thr Asn Lys Val Leu Thr Ser Ala Lys Cys Asn
20 25
<210> 163
<211> 27
<212> PRT
<213> 沼泽红假单胞菌
<400> 163
Gln Val Asp His Ile Leu Pro Trp Ser Arg Phe Gly Asp Asp Ser Tyr
1 5 10 15
Leu Asn Lys Thr Leu Cys Thr Ala Arg Ser Asn
20 25
<210> 164
<211> 27
<212> PRT
<213> Ralstonia syzygii R24
<400> 164
Gln Val Asp His Ile Leu Pro Phe Ser Lys Thr Leu Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Ala Gln His Asp Ala Asn
20 25
<210> 165
<211> 27
<212> PRT
<213> 鼬鼠螺杆菌12198
<400> 165
Gln Ile Asp His Ala Phe Pro Leu Ser Arg Ser Leu Asp Asp Ser Gln
1 5 10 15
Ser Asn Lys Val Leu Cys Leu Thr Ser Ser Asn
20 25
<210> 166
<211> 27
<212> PRT
<213> 运动支原体163K
<400> 166
Asp Ile Asp His Ile Val Pro Arg Ser Ile Ser Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Leu Val Ile Val Asn Lys Leu Asp Asn
20 25
<210> 167
<211> 27
<212> PRT
<213> 绵羊肺炎霉形体 SC01
<400> 167
Glu Ile Glu His Ile Ile Pro Tyr Ser Met Ser Tyr Asp Asn Ser Gln
1 5 10 15
Ala Asn Lys Ile Leu Thr Glu Lys Ala Glu Asn
20 25
<210> 168
<211> 27
<212> PRT
<213> 滑液囊支原体 53
<400> 168
Glu Ile Asp His Val Ile Pro Tyr Ser Lys Ser Ala Asp Asp Ser Trp
1 5 10 15
Phe Asn Lys Leu Leu Val Lys Lys Ser Thr Asn
20 25
<210> 169
<211> 27
<212> PRT
<213> Aminomonas paucivorans DSM 12260
<400> 169
Glu Met Asp His Ile Leu Pro Tyr Ser Arg Ser Leu Asp Asn Gly Trp
1 5 10 15
His Asn Arg Val Leu Val His Gly Lys Asp Asn
20 25
<210> 170
<211> 27
<212> PRT
<213> 白色瘤胃球菌 8
<400> 170
Glu Val Asp His Ile Val Pro Tyr Ser Leu Ile Leu Asp Asn Thr Ile
1 5 10 15
Asn Asn Lys Ala Leu Val Tyr Ala Glu Glu Asn
20 25
<210> 171
<211> 27
<212> PRT
<213> 产琥珀酸丝状杆菌
<400> 171
Glu Ile Glu His Val Ile Pro Gln Ser Leu Tyr Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Val Ile Cys Glu Ala Glu Val Asn
20 25
<210> 172
<211> 27
<212> PRT
<213> 脆弱拟杆菌,NCTC 9343
<400> 172
Asp Ile Glu His Ile Ile Pro Gln Ala Arg Leu Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Glu Ala Arg Ser Val Asn
20 25
<210> 173
<211> 27
<212> PRT
<213> 生痰二氧化碳嗜纤维菌(Capnocytophaga sputigena)
<400> 173
Glu Ile Glu His Ile Val Pro Lys Ala Arg Val Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Thr Phe His Arg Ile Asn
20 25
<210> 174
<211> 28
<212> PRT
<213> 大芬戈尔德菌(Finegoldia magna)
<400> 174
Asp Lys Asp His Ile Ile Pro Gln Ser Met Lys Lys Asp Asp Ser Ile
1 5 10 15
Ile Asn Asn Leu Val Leu Val Asn Lys Asn Ala Asn
20 25
<210> 175
<211> 27
<212> PRT
<213> 食清洁剂细小棒菌 DS-1
<400> 175
Glu Val Glu His Ile Trp Pro Arg Ser Arg Ser Phe Asp Asn Ser Pro
1 5 10 15
Arg Asn Lys Thr Leu Cys Arg Lys Asp Val Asn
20 25
<210> 176
<211> 27
<212> PRT
<213> 蜡样芽孢杆菌
<400> 176
Ile Val Asn His Ile Ile Pro Tyr Asn Arg Ser Phe Asp Asp Thr Tyr
1 5 10 15
His Asn Arg Val Leu Thr Leu Thr Glu Thr Lys
20 25
<210> 177
<211> 27
<212> PRT
<213> Prevotella micans
<400> 177
Asp Met Glu His Thr Ile Pro Lys Ser Ile Ser Phe Asp Asn Ser Asp
1 5 10 15
Gln Asn Leu Thr Leu Cys Glu Ser Tyr Tyr Asn
20 25
<210> 178
<211> 27
<212> PRT
<213> 栖瘤胃普雷沃菌
<400> 178
Asp Ile Glu His Thr Ile Pro Arg Ser Ala Gly Gly Asp Ser Thr Lys
1 5 10 15
Met Asn Leu Thr Leu Cys Ser Ser Arg Phe Asn
20 25
<210> 179
<211> 27
<212> PRT
<213> 柱状黄杆菌(Flavobacterium columnare)
<400> 179
Asp Ile Glu His Thr Ile Pro Arg Ser Ile Ser Gln Asp Asn Ser Gln
1 5 10 15
Met Asn Lys Thr Leu Cys Ser Leu Lys Phe Asn
20 25
<210> 180
<211> 27
<212> PRT
<213> 深红螺菌
<400> 180
Asp Ile Asp His Val Ile Pro Leu Ala Arg Gly Gly Arg Asp Ser Leu
1 5 10 15
Asp Asn Met Val Leu Cys Gln Ser Asp Ala Asn
20 25
<210> 181
<211> 27
<212> PRT
<213> Elusimicrobium minutum Pei191
<400> 181
Asp Ile Glu His Leu Phe Pro Ile Ala Glu Ser Glu Asp Asn Gly Arg
1 5 10 15
Asn Asn Leu Val Ile Ser His Ser Ala Cys Asn
20 25
<210> 182
<211> 27
<212> PRT
<213> Sphaerochaeta globus str. Buddy
<400> 182
Asp Val Asp His Ile Phe Pro Arg Asp Asp Thr Ala Asp Asn Ser Tyr
1 5 10 15
Gly Asn Lys Val Val Ala His Arg Gln Cys Asn
20 25
<210> 183
<211> 27
<212> PRT
<213> Nitratifractor salsuginis DSM 16511
<400> 183
Asp Ile Glu His Ile Val Pro Gln Ser Leu Gly Gly Leu Ser Thr Asp
1 5 10 15
Tyr Asn Thr Ile Val Thr Leu Lys Ser Val Asn
20 25
<210> 184
<211> 27
<212> PRT
<213> 解纤维热酸菌11B
<400> 184
Glu Leu Asp His Ile Val Pro Arg Thr Asp Gly Gly Ser Asn Arg His
1 5 10 15
Glu Asn Leu Ala Ile Thr Cys Gly Ala Cys Asn
20 25
<210> 185
<211> 28
<212> PRT
<213> 长双歧杆菌DJO10A
<400> 185
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Thr Asn Phe Ala Ala Val Cys Ala Glu Cys Asn
20 25
<210> 186
<211> 28
<212> PRT
<213> 齿双歧杆菌
<400> 186
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Val Asn Leu Ala Ala Ala Cys Ala Ala Cys Asn
20 25
<210> 187
<211> 28
<212> PRT
<213> 白喉杆菌
<400> 187
Glu Met Asp His Ile Val Pro Arg Ala Gly Gln Gly Ser Thr Asn Thr
1 5 10 15
Arg Glu Asn Leu Val Ala Val Cys His Arg Cys Asn
20 25
<210> 188
<211> 33
<212> PRT
<213> Sutterella wadsworthensis
<400> 188
Glu Ile Asp His Ile Leu Pro Arg Ser Leu Ile Lys Asp Ala Arg Gly
1 5 10 15
Ile Val Phe Asn Ala Glu Pro Asn Leu Ile Tyr Ala Ser Ser Arg Gly
20 25 30
Asn
<210> 189
<211> 33
<212> PRT
<213> γ变形菌 HTCC5015
<400> 189
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Gly Arg Thr Lys Lys
1 5 10 15
Thr Val Phe Asn Ser Glu Ala Asn Leu Ile Tyr Cys Ser Ser Lys Gly
20 25 30
Asn
<210> 190
<211> 33
<212> PRT
<213> Parasutterella excrementihominis
<400> 190
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Leu Lys Lys Ser Glu
1 5 10 15
Ser Ile Tyr Asn Ser Glu Val Asn Leu Ile Phe Val Ser Ala Gln Gly
20 25 30
Asn
<210> 191
<211> 33
<212> PRT
<213> 嗜肺军团菌 str. Paris
<400> 191
Glu Ile Asp His Ile Tyr Pro Arg Ser Leu Ser Lys Lys His Phe Gly
1 5 10 15
Val Ile Phe Asn Ser Glu Val Asn Leu Ile Tyr Cys Ser Ser Gln Gly
20 25 30
Asn
<210> 192
<211> 33
<212> PRT
<213> 产琥珀酸沃廉菌 DSM 1740
<400> 192
Glu Ile Asp His Ile Leu Pro Arg Ser His Thr Leu Lys Ile Tyr Gly
1 5 10 15
Thr Val Phe Asn Pro Glu Gly Asn Leu Ile Tyr Val His Gln Lys Cys
20 25 30
Asn
<210> 193
<211> 30
<212> PRT
<213> 土拉弗朗西斯菌
<400> 193
Glu Leu Asp His Ile Ile Pro Arg Ser His Lys Lys Tyr Gly Thr Leu
1 5 10 15
Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg Gly Asp Asn
20 25 30
<210> 194
<211> 27
<212> PRT
<213> Akkermansia muciniphila
<400> 194
Glu Leu Glu His Ile Val Pro His Ser Phe Arg Gln Ser Asn Ala Leu
1 5 10 15
Ser Ser Leu Val Leu Thr Trp Pro Gly Val Asn
20 25
<210> 195
<211> 27
<212> PRT
<213> Solobacterium moorei F0204
<400> 195
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Thr Asn Arg Val Leu Val Glu Lys Asp Ile Asn
20 25
<210> 196
<211> 28
<212> PRT
<213> 非典型韦荣菌(Veillonella atypica) ACS-134-V-Col7a
<400> 196
Tyr Asp Ile Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Cys Glu Arg Thr Ala Asn
20 25
<210> 197
<211> 28
<212> PRT
<213> 具核梭杆菌
<400> 197
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Val Ile Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Val Leu Lys Asn Glu Asn
20 25
<210> 198
<211> 27
<212> PRT
<213> Filifactor alocis
<400> 198
Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Val Asn Lys Thr Tyr Asn
20 25
<210> 199
<211> 5
<212> DNA
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> 任何核苷酸(例如,A、G、C或T)
<400> 199
nggng 5
<210> 200
<211> 7
<212> DNA
<213> 嗜热链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> A或T
<400> 200
nnagaaw 7
<210> 201
<211> 4
<212> DNA
<213> 变形链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<400> 201
naar 4
<210> 202
<211> 5
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<400> 202
nngrr 5
<210> 203
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> 任何核苷酸(例如,A、G、C或T)
<400> 203
nngrrn 6
<210> 204
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<400> 204
nngrrt 6
<210> 205
<211> 6
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> 任何核苷酸(例如,A、G、C或T)
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> A或G
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> A、G或C
<400> 205
nngrrv 6
<210> 206
<211> 80
<212> DNA
<213> 化脓链球菌
<400> 206
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt 80
<210> 207
<211> 80
<212> DNA
<213> 金黄色葡萄球菌
<400> 207
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgagatttt 80
<210> 208
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> gRNA分子
<400> 208
guaacggcag acuucuccuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 209
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> gRNA分子
<400> 209
gguaacggca gacuucuccu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 101
<210> 210
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> gRNA分子
<400> 210
ggguaacggc agacuucucc ucguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60
uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

Claims (62)

1.一种筛选Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)产生多个样品,每个样品包含通过将Cas9分子和多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物;
(b)检测所述多个样品中每个中的所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述多个样品中的至少一个样品中的Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则选择所述至少一个样品;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
2.根据权利要求1所述的方法,其中所述gRNA是嵌合gRNA。
3.根据权利要求1所述的方法,其中所述gRNA是模块化gRNA。
4.一种确定Cas9分子/gRNA分子复合物的稳定性的方法,所述方法包括:
(a)产生多个Cas9分子/gRNA分子复合物,每个复合物包含通过将Cas9分子和多个gRNA分子中的一个进行组合而产生的Cas9分子/gRNA分子复合物;
(b)检测所述多个Cas9分子/gRNA分子复合物中每个Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述多个Cas9分子/gRNA分子复合物中的一个或多个Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述一个或多个Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
5.一种确定促进稳定的Cas9分子/gRNA分子复合物的条件的方法,所述方法包括:
(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;
(b)检测所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
6.一种筛选稳定的Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)通过差示扫描荧光测定法(DSF)检测Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(b)如果所述Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述Cas9分子/gRNA分子复合物是稳定的。
7.一种用于鉴定最佳gRNA以形成稳定的Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)将样品中的Cas9分子和gRNA分子组合以形成所述Cas9分子/gRNA分子复合物;
(b)检测所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
8.一种确定Cas9分子/gRNA分子复合物的稳定性的方法,所述方法包括:
(a)将样品中的Cas9分子和gRNA分子组合以形成所述Cas9分子/gRNA分子复合物;
(b)检测所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;
(c)测量所述Cas9分子/gRNA分子复合物的活性值;以及
(d)如果(i)所述Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,和(ii)所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
9.一种优化gRNA分子与Cas9分子的结合以形成稳定的Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;
(b)检测所述Cas9分子/gRNA分子复合物的熔融温度(Tm);
(c)确定所述Cas9分子/gRNA分子复合物的Tm值与包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值之间的Δ值;以及
(d)如果所述Δ值为至少8ºC并且所述Cas9分子/gRNA分子复合物的Tm值大于所述参考Cas9分子/gRNA分子复合物的Tm值或所述不存在gRNA情况下的所述Cas9分子的Tm值,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
10.一种检测稳定的Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)检测包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的热稳定性值;
(b)将样品中的Cas9分子和gRNA分子组合以形成Cas9分子/gRNA分子复合物;
(c)测量Cas9分子/gRNA分子复合物的热稳定性值;以及
(d)如果所述Cas9分子/gRNA分子复合物的热稳定性值比所述参考Cas9分子/gRNA分子复合物的热稳定性值大至少8ºC,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
11.如权利要求4-10中任一项所述的方法,其中所述gRNA分子包括嵌合gRNA分子。
12.如权利要求4-10中任一项所述的方法,其中所述gRNA分子包括模块化gRNA分子。
13.如权利要求1-10中任一项所述的方法,其中所述Cas9分子是嵌合Cas9分子或合成的或工程化的Cas9分子。
14.如权利要求11所述的方法,其中所述Cas9分子是嵌合Cas9分子或合成的或工程化的Cas9分子。
15.如权利要求12所述的方法,其中所述Cas9分子是嵌合Cas9分子或合成的或工程化的Cas9分子。
16.如权利要求13所述的方法,其中所述Cas9分子是一部分或多部分缺失的Cas9分子。
17.如权利要求14所述的方法,其中所述Cas9分子是一部分或多部分缺失的Cas9分子。
18.如权利要求15所述的方法,其中所述Cas9分子是一部分或多部分缺失的Cas9分子。
19.如权利要求1-10中任一项所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
20.如权利要求11所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
21.如权利要求12所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
22.如权利要求4-10中任一项所述的方法,其中所述参考Cas9分子/gRNA分子复合物中包含第二gRNA分子,所述第二gRNA分子不同于被评价的复合物中的gRNA的gRNA。
23.如权利要求4-10中任一项所述的方法,其中所述参考Cas9分子/gRNA分子复合物在与所述Cas9分子/gRNA分子复合物不同的条件下形成,所述不同的条件是用与其不同比例的Cas9分子和gRNA分子形成,或者是在不同缓冲液中形成。
24.如权利要求4-10中任一项所述的方法,其中所述参考Cas9分子/gRNA分子复合物的所述gRNA分子与被评价的复合物的所述gRNA分子相同。
25.如权利要求4-10中任一项所述的方法,其中所述参考Cas9分子/gRNA分子复合物的所述gRNA分子不同于被评价的复合物的所述gRNA分子。
26.如权利要求25所述的方法,其中所述参考Cas9分子/gRNA分子复合物的所述gRNA分子在序列上不同于被评价的复合物的所述gRNA分子或因修饰而与其不同。
27.如权利要求1-7、9、10、14-18、20、21和26中任一项所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
28.如权利要求11所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
29.如权利要求12所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
30.如权利要求13所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
31.如权利要求19所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
32.如权利要求22所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
33.如权利要求23所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
34.如权利要求24所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
35.如权利要求25所述的方法,进一步包括:
检测所述Cas9分子/gRNA分子复合物的活性;
测量所述Cas9分子/gRNA分子复合物的活性值;以及
如果所述Cas9分子/gRNA分子复合物的活性值大于参考分子的活性值,则确定所述该Cas9分子/gRNA分子复合物是稳定的。
36.如权利要求27所述的方法,其中所述活性包括以下项中的一项或多项:
诱导indel的能力;
修饰靶DNA的能力;
预选修复方法的倾向;
gRNA分子保持与所述DNA靶杂交的能力;以及
所述gRNA分子结合所述Cas9分子/gRNA分子复合物的所述Cas9分子的能力。
37.如权利要求36所述的方法,其中所述活性值是结合值,并且所述活性是所述gRNA分子结合所述Cas9分子的能力,所述方法包括:
将样品中的所述gRNA分子和所述Cas9分子组合以形成所述Cas9分子/gRNA分子复合物;
测量所述Cas9分子/gRNA分子复合物的结合值;以及
如果所述Cas9分子/gRNA分子复合物的结合值大于参考分子的结合值,则确定所述Cas9分子/gRNA分子复合物是稳定的。
38.如权利要求37所述的方法,其中使用动力学测定来测量所述结合值。
39.如权利要求38所述的方法,其中所述动力学测定选自由表面等离子体共振(SPR)测定、生物层干涉法(BLI)测定和凝胶带移位测定组成。
40.如权利要求36所述的方法,其中所述预选修复方法的倾向是HDR或NHEJ。
41.如权利要求8和28-40中任一项所述的方法,其中使用以下项测试所述Cas9分子/gRNA分子复合物的活性:
体外系统;
离体系统;
体内系统;
细胞测定;或
动物模型。
42.如权利要求27中任一项所述的方法,其中使用以下项测试所述Cas9分子/gRNA分子复合物的活性:
体外系统;
离体系统;
体内系统;
细胞测定;或
动物模型。
43.如权利要求37-40中任一项所述的方法,其中所述参考Cas9分子/gRNA分子复合物由与所述Cas9分子/gRNA分子复合物不同比例的Cas9分子和gRNA分子形成,或者是在与所述Cas9分子/gRNA分子复合物不同的缓冲液中形成。
44.如权利要求41所述的方法,其中所述参考Cas9分子/gRNA分子复合物由与所述Cas9分子/gRNA分子复合物不同比例的Cas9分子和gRNA分子形成,或者是在与所述Cas9分子/gRNA分子复合物不同的缓冲液中形成。
45.如权利要求5所述的方法,其中所述样品包含以下组分,所述组分包括添加剂或其他缓冲组分。
46.如权利要求5所述的方法,其中所述样品包含小分子、稳定剂、缓冲液,或其组合。
47.如权利要求1或4所述的方法,其中所述多个gRNA分子是候选gRNA分子的文库。
48.如权利要求47所述的方法,其中所述候选gRNA分子的文库包括tracrRNA分子或序列的文库。
49.如权利要求48所述的方法,其中所述tracrRNA分子或序列的文库具有不同长度。
50.一种筛选Cas9分子/gRNA分子复合物的方法,所述方法包括:
(a)产生一个包含Cas9分子/gRNA分子复合物的样品,所述Cas9分子/gRNA分子复合物包含Cas9分子和第一gRNA分子;
(b)检测所述样品中所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)将检测到的Tm值与包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值进行比较,如果所述Tm值比参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则选择所述Cas9分子/gRNA分子复合物;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
51.一种确定Cas9分子/gRNA分子复合物的稳定性的方法,所述方法包括:
(a)产生包含Cas9分子和第一gRNA分子的Cas9分子/gRNA分子复合物;
(b)检测所述Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述Cas9分子/gRNA分子复合物的Tm值比包含所述Cas9分子的参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述Cas9分子/gRNA分子复合物是稳定的;
其中,所述Tm值是通过差示扫描荧光测定法(DSF)法测得的。
52.根据权利要求50或51所述的方法,其中所述gRNA分子是嵌合gRNA分子。
53.根据权利要求50或51所述的方法,其中所述gRNA分子是模块化gRNA分子。
54.如权利要求50或51所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
55.如权利要求52所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
56.如权利要求53所述的方法,其中所述Cas9分子包括化脓链球菌或金黄色葡萄球菌Cas9分子。
57.如权利要求50、51、55和56中任一项所述的方法,其中所述方法还包括确定第二Cas9分子/gRNA分子复合物是稳定的,其包括:
(a)产生包含Cas9分子和第二gRNA分子的第二Cas9分子/gRNA分子复合物,其中所述第二gRNA分子与所述第一gRNA分子相同并与所述第一gRNA分子分开产生;
(b)检测所述第二Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述第二Cas9分子/gRNA分子复合物的Tm值比所述参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述第二Cas9分子/gRNA分子复合物是稳定的。
58.如权利要求52所述的方法,其中所述方法还包括确定第二Cas9分子/gRNA分子复合物是稳定的,其包括:
(a)产生包含Cas9分子和第二gRNA分子的第二Cas9分子/gRNA分子复合物,其中所述第二gRNA分子与所述第一gRNA分子相同并与所述第一gRNA分子分开产生;
(b)检测所述第二Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述第二Cas9分子/gRNA分子复合物的Tm值比所述参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述第二Cas9分子/gRNA分子复合物是稳定的。
59.如权利要求53所述的方法,其中所述方法还包括确定第二Cas9分子/gRNA分子复合物是稳定的,其包括:
(a)产生包含Cas9分子和第二gRNA分子的第二Cas9分子/gRNA分子复合物,其中所述第二gRNA分子与所述第一gRNA分子相同并与所述第一gRNA分子分开产生;
(b)检测所述第二Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述第二Cas9分子/gRNA分子复合物的Tm值比所述参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述第二Cas9分子/gRNA分子复合物是稳定的。
60.如权利要求54所述的方法,其中所述方法还包括确定第二Cas9分子/gRNA分子复合物是稳定的,其包括:
(a)产生包含Cas9分子和第二gRNA分子的第二Cas9分子/gRNA分子复合物,其中所述第二gRNA分子与所述第一gRNA分子相同并与所述第一gRNA分子分开产生;
(b)检测所述第二Cas9分子/gRNA分子复合物的熔融温度(Tm)值;以及
(c)如果所述第二Cas9分子/gRNA分子复合物的Tm值比所述参考Cas9分子/gRNA分子复合物的Tm值或不存在gRNA情况下的所述Cas9分子的Tm值大至少8ºC,则确定所述第二Cas9分子/gRNA分子复合物是稳定的。
61.如权利要求57所述的方法,其中所述第二Cas9分子/gRNA分子复合物在与被评价的Cas9分子/gRNA分子复合物相同的条件下形成,或在相同的缓冲液中形成。
62.如权利要求61所述的方法,其中所述条件包括使用与被评价的复合物相关的Cas9分子和gRNA分子的比例。
CN201680032169.2A 2015-04-24 2016-04-25 Cas9分子/指导rna分子复合物的评价 Active CN107690480B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562152473P 2015-04-24 2015-04-24
US62/152,473 2015-04-24
PCT/US2016/029252 WO2016172727A1 (en) 2015-04-24 2016-04-25 Evaluation of cas9 molecule/guide rna molecule complexes

Publications (2)

Publication Number Publication Date
CN107690480A CN107690480A (zh) 2018-02-13
CN107690480B true CN107690480B (zh) 2022-03-22

Family

ID=55967433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680032169.2A Active CN107690480B (zh) 2015-04-24 2016-04-25 Cas9分子/指导rna分子复合物的评价

Country Status (11)

Country Link
US (2) US11180793B2 (zh)
EP (2) EP4019975A1 (zh)
JP (1) JP2018522249A (zh)
KR (1) KR102535217B1 (zh)
CN (1) CN107690480B (zh)
AU (1) AU2016253150B2 (zh)
CA (1) CA2982966C (zh)
IL (1) IL255125A0 (zh)
SG (1) SG11201708653RA (zh)
WO (1) WO2016172727A1 (zh)
ZA (1) ZA201707018B (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
EP3597741A1 (en) 2012-04-27 2020-01-22 Duke University Genetic correction of mutated genes
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US10093967B2 (en) 2014-08-12 2018-10-09 The Regents Of The University Of Michigan Detection of nucleic acids
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
CA2986262A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
US11970710B2 (en) 2015-10-13 2024-04-30 Duke University Genome engineering with Type I CRISPR systems in eukaryotic cells
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
ES2835101T3 (es) * 2016-02-10 2021-06-21 Univ Michigan Regents Detección de ácidos nucleicos
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
KR102618864B1 (ko) * 2016-12-30 2024-01-02 에디타스 메디신, 인코포레이티드 합성 가이드 분자, 그와 관련된 조성물 및 방법
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
US10947599B2 (en) 2017-06-13 2021-03-16 Genetics Research, Llc Tumor mutation burden
US11142788B2 (en) 2017-06-13 2021-10-12 Genetics Research, Llc Isolation of target nucleic acids
US20180355380A1 (en) * 2017-06-13 2018-12-13 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Methods and kits for quality control
US10527608B2 (en) 2017-06-13 2020-01-07 Genetics Research, Llc Methods for rare event detection
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
AU2019261387A1 (en) * 2018-04-27 2020-11-19 Seattle Children's Hospital (dba Seattle Children's Research Institute) Homology-directed repair template design and delivery to edit hemoglobin-related mutations
GB2593353B (en) 2018-10-16 2023-03-01 Blueallele Corp Methods for targeted insertion of DNA in genes
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
WO2024102972A1 (en) * 2022-11-11 2024-05-16 Beam Therapeutics Inc. Base editing of transthyretin gene

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7150982B2 (en) 1991-09-09 2006-12-19 Third Wave Technologies, Inc. RNA detection assays
US6203986B1 (en) 1998-10-22 2001-03-20 Robert H. Singer Visualization of RNA in living cells
PL196988B1 (pl) 1999-10-21 2008-02-29 Alcon Inc Oftalmiczne urządzenie do aplikowania leków
JP2004536631A (ja) 2001-05-03 2004-12-09 マサチューセッツ・アイ・アンド・イア・インファーマリー 移植可能な薬物送達デバイスおよびその使用
WO2003072788A1 (en) 2002-02-21 2003-09-04 The Wistar Institute Of Anatomy And Biology Methods and compositions for reversibly controlling expression of target genes in cells
JP2006513694A (ja) 2002-06-11 2006-04-27 ザ スクリップス リサーチ インスティテュート 人工転写因子
DE10324912A1 (de) 2003-05-30 2005-01-05 Siemens Ag Verfahren zur Detektion von DNA-Punktmutationen (SNP-Analyse) sowie zugehörige Anordnung
US20100055793A1 (en) 2005-07-25 2010-03-04 Johns Hopkins University Site-specific modification of the human genome using custom-designed zinc finger nucleases
US9677123B2 (en) 2006-03-15 2017-06-13 Siemens Healthcare Diagnostics Inc. Degenerate nucleobase analogs
NZ592231A (en) 2007-03-02 2012-07-27 Danisco Methods to generate bacteriophage resistant bacterial strains and produce bacteriophage CRISPR loci phage mutants
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9115386B2 (en) 2008-09-26 2015-08-25 Children's Medical Center Corporation Selective oxidation of 5-methylcytosine by TET-family proteins
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
BR112012028805A2 (pt) 2010-05-10 2019-09-24 The Regents Of The Univ Of California E Nereus Pharmaceuticals Inc composições de endorribonuclease e métodos de uso das mesmas.
GB201013153D0 (en) 2010-08-04 2010-09-22 Touchlight Genetics Ltd Primer for production of closed linear DNA
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
WO2012145601A2 (en) 2011-04-22 2012-10-26 The Regents Of The University Of California Adeno-associated virus virions with variant capsid and methods of use thereof
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
EP3461896B1 (en) 2011-07-15 2023-11-29 The General Hospital Corporation Methods of transcription activator like effector assembly
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
CA2865011C (en) 2012-02-29 2021-06-15 Sangamo Biosciences, Inc. Methods and compositions for treating huntington's disease
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
EP3597741A1 (en) 2012-04-27 2020-01-22 Duke University Genetic correction of mutated genes
UA118014C2 (uk) 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US9890364B2 (en) 2012-05-29 2018-02-13 The General Hospital Corporation TAL-Tet1 fusion proteins and methods of use thereof
CN105188767A (zh) 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
EP2880171B1 (en) 2012-08-03 2018-10-03 The Regents of The University of California Methods and compositions for controlling gene expression by rna processing
EP2890780B8 (en) 2012-08-29 2020-08-19 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
US20150267176A1 (en) 2012-10-12 2015-09-24 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
CN110669746B (zh) 2012-10-23 2024-04-16 基因工具股份有限公司 用于切割靶dna的组合物及其用途
IL300199A (en) 2012-12-06 2023-03-01 Sigma Aldrich Co Llc CRISPR-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
SG10201912327SA (en) 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
PL2921557T3 (pl) 2012-12-12 2017-03-31 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
CA2894668A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas systems and methods for altering expression of gene products in eukaryotic cells
RU2721275C2 (ru) 2012-12-12 2020-05-18 Те Брод Инститьют, Инк. Доставка, конструирование и оптимизация систем, способов и композиций для манипуляции с последовательностями и применения в терапии
DK2921557T3 (en) 2012-12-12 2016-11-07 Broad Inst Inc Design of systems, methods and optimized sequence manipulation guide compositions
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2741951T3 (es) 2012-12-17 2020-02-12 Harvard College Modificación por ingeniería genética del genoma humano guiada por ARN
JP6445462B2 (ja) 2013-02-07 2018-12-26 ザ ジェネラル ホスピタル コーポレイション Tale転写活性化因子
AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
CA3161835A1 (en) 2013-03-15 2014-09-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9828582B2 (en) 2013-03-19 2017-11-28 Duke University Compositions and methods for the induction and tuning of gene expression
US9873894B2 (en) 2013-05-15 2018-01-23 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
BR112015030491A8 (pt) 2013-06-04 2022-07-26 Harvard College método de modular a expressão de um ácido nucleico alvo em uma célula, bem como método de alterar um ácido nucleico de dna alvo em uma célula
KR20230136697A (ko) 2013-06-05 2023-09-26 듀크 유니버시티 Rna-가이드 유전자 편집 및 유전자 조절
AU2014281027A1 (en) 2013-06-17 2016-01-28 Massachusetts Institute Of Technology Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
EP3019595A4 (en) 2013-07-09 2016-11-30 THERAPEUTIC USES OF A GENERIC CHANGE WITH CRISPR / CAS SYSTEMS
RU2764637C2 (ru) 2013-07-09 2022-01-19 Президент Энд Фэллоуз Оф Харвард Коллидж Мультиплексная геномная инженерия, направляемая рнк
AU2014287397B2 (en) 2013-07-10 2019-10-10 President And Fellows Of Harvard College Orthogonal Cas9 proteins for RNA-guided gene regulation and editing
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
WO2015048690A1 (en) * 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
WO2015048680A1 (en) 2013-09-27 2015-04-02 Kyocera Corporation User equipment detection for energy saving cell activation
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
CN111218447A (zh) 2013-11-07 2020-06-02 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
EP3375877A1 (en) 2013-11-18 2018-09-19 Crispr Therapeutics AG Crispr-cas system materials and methods
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
SG10201804976YA (en) 2013-12-12 2018-07-30 Broad Inst Inc Delivery, Use and Therapeutic Applications of the Crispr-Cas Systems and Compositions for Genome Editing
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
EP3985124A1 (en) 2013-12-26 2022-04-20 The General Hospital Corporation Multiplex guide rnas
EP3152319A4 (en) 2014-06-05 2017-12-27 Sangamo BioSciences, Inc. Methods and compositions for nuclease design
CA2952697A1 (en) 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
EP3274453B1 (en) 2015-03-26 2021-01-27 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
US20160324987A1 (en) 2015-04-15 2016-11-10 Cedars-Sinai Medical Center Use of crispr/cas9 as in vivo gene therapy to generate targeted genomic disruptions in genes bearing dominant mutations for retinitis pigmentosa
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
PL3298134T3 (pl) 2015-05-16 2023-09-18 Genzyme Corporation Edycja genów mutacji głęboko intronowych
EP3436575A1 (en) 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
EP3325018A4 (en) 2015-07-22 2019-04-24 Duke University HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES
ES2929110T3 (es) 2015-08-25 2022-11-24 Univ Duke Composiciones y métodos para mejorar la especificidad en ingeniería genética usando endonucleasas guiadas por ARN
EP3344771A4 (en) 2015-08-31 2019-03-20 Agilent Technologies, Inc. COMPOUNDS AND METHODS FOR GENOME EDITING BASED ON CRISPR / CAS BY HOMOLOGOUS RECOMBINATION
JP6775584B2 (ja) 2015-09-08 2020-10-28 プレシジョン バイオサイエンシズ,インク. 設計されたメガヌクレアーゼを使用した網膜色素変性症の治療
EP3445848A1 (en) 2016-04-19 2019-02-27 The Broad Institute, Inc. Novel crispr enzymes and systems
KR102618864B1 (ko) 2016-12-30 2024-01-02 에디타스 메디신, 인코포레이티드 합성 가이드 분자, 그와 관련된 조성물 및 방법

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Becky Xu Hua Fu等.Landscape of target:guide homology effects on Cas9-mediated cleavage.《Nucleic Acids Research》.2014,第42卷(第22期),第13778-13787页. *
Improving CRISPR-Cas nuclease specificity using truncated guide RNAs;Yanfang Fu等;《Nature Biotechnology》;20140331;第32卷(第3期);第8页第4段 *
Landscape of target:guide homology effects on Cas9-mediated cleavage;Becky Xu Hua Fu等;《Nucleic Acids Research》;20141115;第42卷(第22期);第13780页图1,第13783页左栏第1-2段 *
Monitoring assembly of ribonucleoprotein complexes by isothermal titration calorimetry;Michael I. Recht等;《Methods in Molecular Biology》;20081231;第488卷;第117-127页 *
Structure of a dimeric crenarchaeal Cas6 enzyme with an atypical active site for CRISPR RNA processing;Judith REEKS等;《Biochemical Journal》;20130325;第452卷;第225页左栏第2段,第226页左栏第3段、右栏第1段 *

Also Published As

Publication number Publication date
JP2018522249A (ja) 2018-08-09
CA2982966C (en) 2024-02-20
US20180135109A1 (en) 2018-05-17
EP4019975A1 (en) 2022-06-29
US20220325326A1 (en) 2022-10-13
EP3286571A1 (en) 2018-02-28
KR20180037139A (ko) 2018-04-11
AU2016253150B2 (en) 2022-04-21
CN107690480A (zh) 2018-02-13
US11180793B2 (en) 2021-11-23
EP3286571B1 (en) 2021-08-18
KR102535217B1 (ko) 2023-05-19
SG11201708653RA (en) 2017-11-29
ZA201707018B (en) 2024-02-28
AU2016253150A1 (en) 2017-11-09
WO2016172727A1 (en) 2016-10-27
IL255125A0 (en) 2017-12-31
CA2982966A1 (en) 2016-10-27

Similar Documents

Publication Publication Date Title
CN107690480B (zh) Cas9分子/指导rna分子复合物的评价
US20230026726A1 (en) Crispr/cas-related methods and compositions for treating sickle cell disease
US20220106600A1 (en) Crispr-cas-related methods, compositions and components for cancer immunotherapy
EP3443086B1 (en) Cas9 fusion molecules, gene editing systems, and methods of use thereof
EP3277816B1 (en) Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
WO2017180711A1 (en) Grna fusion molecules, gene editing systems, and methods of use thereof
EP3215617B1 (en) Systems for improving crispr/cas-mediated genome-editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant