CN116096879A - Rna引导的核酸酶及其活性片段和变体以及使用方法 - Google Patents

Rna引导的核酸酶及其活性片段和变体以及使用方法 Download PDF

Info

Publication number
CN116096879A
CN116096879A CN202180044771.9A CN202180044771A CN116096879A CN 116096879 A CN116096879 A CN 116096879A CN 202180044771 A CN202180044771 A CN 202180044771A CN 116096879 A CN116096879 A CN 116096879A
Authority
CN
China
Prior art keywords
seq
sequence
sequence identity
rgn
tracrrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180044771.9A
Other languages
English (en)
Inventor
T·D·博文
M·寇伊勒
A·B·克拉维利
T·D·埃里驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Editor Pharmaceutical Co ltd
Original Assignee
Life Editor Pharmaceutical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Editor Pharmaceutical Co ltd filed Critical Life Editor Pharmaceutical Co ltd
Publication of CN116096879A publication Critical patent/CN116096879A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

提供了用于结合所关注的目标序列的组合物和方法。该组合物可用于切割或修饰所关注的目标序列、所关注的目标序列的可视化、以及修饰所关注的序列的表达。组合物包含RNA引导的核酸酶(RGN)多肽、CRISPR RNA、转录活化的CRISPR RNA、引导RNA、以及编码其的核酸分子。还提供了包含该核酸分子的载体和宿主细胞。进一步提供了用于结合所关注的目标序列的RGN系统,其中该RGN系统包括RNA引导的核酸酶多肽以及一个或多个引导RNA。

Description

RNA引导的核酸酶及其活性片段和变体以及使用方法
相关申请的交叉引用
本申请要求2020年4月24日提出的第63/014,970号美国临时申请和2020年9月11日提出的第63/077,211号美国临时申请的优先权,每一个专利申请通过引用整体地并入本文中。
关于序列列表的声明
与本申请关联的序列表以ASCII格式代替印刷本来提供,并且通过引用并入说明书。该ASCII复本被命名为L103438_1200TW_(0085_9)_SL,其大小为859,992字节,其创建于2021年4月16日,并且以电子方式经由EFS-Web提交。
技术领域
本发明与分子生物学和基因编辑领域有关。
背景技术
靶向基因组编辑或修饰正迅速成为基础和应用研究的重要工具。最初的方法涉及例如大范围核酸酶(meganuclease)、锌指融合蛋白或TALEN等工程核酸酶,这需要产生具有对每一种特定目标序列特异性的工程化、可程序化、序列特异性的DNA结合结构域的嵌合核酸酶。RNA引导的核酸酶(例如,规律间隔成簇短回文重复序列(Clustered RegularlyInterspaced Short Palindromic Repeat)(CRISPR)-相关(cas)细菌系统的CRISPR-Cas蛋白)可以通过将核酸酶与引导RNA(引导RNA与特定目标序列特异性杂交)复合以靶向特定序列。相比于为每一个目标序列产生嵌合核酸酶,产生靶特异性引导RNA的成本更低且效率更高。任选地,此类RNA引导的核酸酶可用于经由引入序列特异性、经由易错的非同源末端连接(NHEJ)进行修复的双链断裂来编辑基因组,该断裂经由易错的非同源末端连接(NHEJ)被修复,以在特定基因组位置引入突变。或者,可经由同源介导的修复将异源DNA引入基因组位点。当与脱氨酶融合时,RNA引导的核酸酶(RGN)还可用于碱基编辑。
发明内容
提供了用于结合所关注的目标序列的组合物和方法。该组合物可用于切割或修饰所关注的目标序列、检测所关注的目标序列、以及修饰所关注的序列的表达。组合物包含RNA引导的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、转录活化的CRISPR RNA(tracrRNA)、引导RNA(gRNA)、编码同者的核酸分子、以及包含核酸分子的载体及宿主细胞。还提供了用于结合所关注的目标序列的RGN系统,其中该RGN系统包括RNA引导的核酸酶多肽以及一个或多个引导RNA。因此,将本文所公开的方法描述为用于结合所关注的目标序列,并且在一些实施方案中,用于切割或修饰所关注的目标序列。所关注的目标序列可例如由于非同源末端连接、引入的供体序列的同源介导的修复或碱基编辑而被修饰。
发明详述
受益于前述描述和相关图片中呈现的教导,与这些发明有关领域中技术人员将想到本文阐述的本发明的许多修改及其他实施方案。因此,应该理解,本发明不限于所公开的特定实施方案,并且修改以及其他实施方案旨在被包含在所附实施方案的范围内。虽然本文采用特定术语,但这些术语仅在一般性及描述性意义上使用,而非出于限制性目的。
I.概述
RNA引导的核酸酶(RGN)允许对基因组内的一个或多个特定位点的靶向操纵,并且在基因靶向的环境下可用于治疗及研究应用。在各种生物体(包含哺乳动物)中,例如,通过刺激非同源末端连接和同源重组,RNA引导的核酸酶已被用于基因组工程。本文所述的组合物和方法可用于在多核苷酸中产生单链或双链断裂、修饰多核苷酸、检测多核苷酸内的特定位点、或修饰特定基因的表达。
本文所公开的RNA引导的核酸酶可通过修饰目标序列来改变基因表达。在特定实施方案中,RNA引导的核酸酶通过引导RNA(gRNA)作为规律间隔成簇短回文重复序列(CRISPR)RNA引导的核酸酶系统的一部分而被导向至目标序列。RGN被认为是“RNA引导”,因为引导RNA与RNA引导的核酸酶形成复合物,以将RNA引导的核酸酶导向至与目标序列结合,并且在一些实施方案中,在目标序列处引入单链或双链断裂。在目标序列已被切割后,断裂可被修复,使得目标序列的DNA序列在修复过程期间被修饰。因此,本文提供了使用RNA引导的核酸酶修饰宿主细胞的DNA中的目标序列的方法。例如,RNA引导的核酸酶可用于修饰真核细胞或原核细胞的基因组基因座处的目标序列。
II.RNA引导的核酸酶
本文提供了RNA引导的核酸酶。术语“RNA引导的核酸酶(RGN)”是指以序列特异性方式与特定目标核苷酸序列结合且通过与多肽复合并与该目标序列杂交的引导RNA分子而被导向至该目标核苷酸序列。虽然RNA引导的核酸酶能够在结合时切割目标序列,但术语“RNA引导的核酸酶”还包含能够结合至目标序列但不切割目标序列的无核酸酶活性的RNA引导的核酸酶。RNA引导的核酸酶对目标序列的切割可导致单链或双链断裂。仅能够切割双链核酸分子的单链的RNA引导的核酸酶在本文中被称为切口酶。
本文公开的RNA引导的核酸酶包括APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217和APG06657 RNA引导的核酸酶,其氨基酸序列分别如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579所示,以及保留以RNA引导的序列特异性方式结合至目标核苷酸序列的能力的其活性片段或变体。在这些实施方案中的一些实施方案中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性片段或变体能够切割单链或双链目标序列。在一些实施方案中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性变体包含与如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。在某些实施方案中,APG06622、APG02787、APG06248、APG06007、APG02874、APG03850、APG07553、APG03031、APG09208、APG05586、APG08770、APG08167、APG01604、APG03021、APG06015、APG09344、APG07991、APG01868、APG02998、APG09298、APG06251、APG03066、APG01560、APG02777、APG05761、APG02479、APG08385、APG09217或APG06657 RGN的活性片段包含如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的氨基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个连续氨基酸残基。本文提供的RNA引导的核酸酶可包含至少一个核酸酶结构域(例如,DNase、RNase结构域)和至少一个RNA识别和/或RNA结合结构域,以与引导RNA相互作用。可在本文提供的RNA引导的核酸酶中发现的其他结构域包括但不限于:DNA结合结构域、核酸酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域。在特定实施方案中,本文提供的RNA引导的核酸酶可包含与DNA结合结构域、核酸酶结构域、蛋白质-蛋白质相互作用结构域和二聚化结构域中的一个或多个具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
目标核苷酸序列与本文提供的RNA引导的核酸酶结合,以及与RNA引导的核酸酶相关的引导RNA杂交。然后,如果多肽具有核酸酶活性,则可由RNA引导的核酸酶随后切割该目标序列。术语“切割(cleave)”或“切割(cleavage)”是指目标核苷酸序列的骨架内的至少一个磷酸二酯键的水解,其可导致该目标序列内的单链或双链断裂。本发明公开的RGN可以作为核酸内切酶、或者可以是核酸外切酶(从多核苷酸的末端(5'端和/或3'端)去除连续的核苷酸)而切割多核苷酸内的核苷酸。在其他实施方案中,所公开的RGN可在多核苷酸的任何位置内切割目标序列的核苷酸,且因此起核酸内切酶和核酸外切酶二者的作用。本发明公开的RGN对目标多核苷酸的切割可导致交错的断裂或钝端。
本发明公开的RNA引导的核酸酶可以是衍生自细菌或古细菌物种的野生型序列。可替代地,RNA引导的核酸酶可为野生型多肽的变体或片段。例如,可修饰野生型RGN以改变核酸酶活性或改变PAM特异性。在一些实施方案中,RNA引导的核酸酶不是天然存在的。
在某些实施方案中,RNA引导的核酸酶仅作为切割目标核苷酸序列的单链的切口酶。这样的RNA引导的核酸酶具有单一功能性核酸酶结构域。在特定实施方案中,切口酶能够切割正链或负链。在这些实施方案中的一些实施方案中,另外的核酸酶结构域已经突变,使得核酸酶活性降低或消除。
在其他实施方案中,RNA引导的核酸酶完全缺少核酸酶活性,并且在本文中被称为无核酸酶活性(nuclease-dead)或非活化的核酸酶(nuclease inactive)。用于将突变引入氨基酸序列的本领域已知的任何方法(例如PCR介导的诱变和定点诱变)可用于产生无切口酶或无核酸酶活性的RGN。参见例如美国公开号2014/0068797以及第9,790,490号美国专利;上述专利案中的每一个的全部内容通过引用而被并入本文。
缺少核酸酶活性的RNA引导的核酸酶可用于将融合的多肽、多核苷酸或小分子负载递送至特定基因组位置。在这些实施方案中的一些中,RGN多肽或引导RNA可与可检测标记融合,以允许特定序列的检测。作为非限制性示例,无核酸酶活性的RGN可与可检测标记(例如,荧光蛋白)融合且靶向与疾病关联的特定序列,以允许与疾病关联序列的检测。
可替代地,可将无核酸酶活性的RGN靶向特定基因组位置,以改变期望序列的表达。在一些实施方案中,通过干扰所靶向的基因组区域内的RNA聚合酶或转录因子的结合,无核酸酶活性的RNA引导的核酸酶与目标序列的结合导致降低了目标序列的或受目标序列的转录控制下的基因的表达。在其他实施方案中,RGN(例如,无核酸酶活性的RGN)或其复合的引导RNA进一步包含表达调节子,其在与目标序列结合时用于阻抑或活化目标序列或受目标序列转录控制的基因的表达。在这些实施方案中的一些中,表达调节子经由表观遗传机制调节目标序列或受调节基因的表达。
在其他实施方案中,可以将无核酸酶活性的RGN或仅具有切口酶活性的RGN靶向特定基因组位置,以经由与碱基编辑多肽(例如,脱氨酶多肽、或其对核苷酸碱基直接进行化学修饰(例如,脱氨基)的活性变体或片段)融合来修饰目标多核苷酸的序列,导致从一种核苷酸碱基转化为另一种核苷酸碱基。该碱基编辑多肽可在RGN的N末端处或C端末端处与其融合。另外,可经由肽接头将碱基编辑多肽与RGN融合。可用于此类组合物和方法的脱氨酶多肽的非限制性示例包括胞苷脱氨酶或腺苷脱氨酶(例如,Gaudelli等人(2017)Nature551:464-471、美国公开号2017/0121693和2018/0073012、国际公开号WO/2018/027078中描述的腺嘌呤脱氨酶碱基编辑器,或者国际公开号WO 2020/139873和2020年9月11日提出的第63/077,089号、2021年2月8日提出的第63/146,840号以及2021年3月22日提出的第63/164,273号的美国临时申请中公开的脱氨酶中任一个,上述的每一个的全部内容通过引用而被并入本文)。此外,本领域已知的RGN与碱基编辑酶之间的某些融合蛋白还可包含至少一个尿嘧啶稳定多肽(uracil stabilizing polypeptide),其通过脱氨酶增加核酸分子中的胞苷、脱氧胞苷或胞嘧啶至胸苷、脱氧胸苷或胸腺嘧啶的突变率。尿嘧啶稳定多肽的非限制性示例包括2020年7月15日提出的第63/052,175号美国临时申请公开的尿嘧啶稳定多肽(包含USP2(SEQ ID NO:1089))和尿嘧啶糖苷酶抑制剂(UGI)结构域(SEQ ID NO:212),其可增加碱基编辑效率。因此,融合蛋白可包含本文描述的RGN或其变体、脱氨酶、和任选的至少一个尿嘧啶稳定多肽(例如,UGI或USP2)。在某些实施方案中,与该碱基编辑多肽融合的RGN是切割不受该碱基编辑多肽作用的DNA链的切口酶(例如,脱氨酶)。
与多肽或结构域融合的RNA引导的核酸酶可通过接头而被连接或分开。本文使用的术语“接头”指连接两个分子或部分(例如,核酸酶的结合结构域和切割结构域)的化学基团或分子。在一些实施方案中,接头将RNA引导的核酸酶的gRNA结合结构域与例如脱氨酶的碱基编辑多肽连接。在一些实施方案中,接头连接无核酸酶活性的RGN与脱氨酶。通常,接头位于两个基团、分子或其他部分之间或两侧,并经由共价键而被连接到每一基团、分子或其他部分,从而连接二者。在一些实施方案中,接头为氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头为有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为5-100个氨基酸,例如,长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可考虑更长或更短的接头。
本发明公开的RNA引导的核酸酶可包含至少一个核定位信号(NLS),以增强该RGN向细胞的核的输送。核定位信号为本领域已知的且通常包含一段碱性氨基酸(参见,例如,Lange等人,J.Biol.Chem.(2007)282:5101-5105)。在特定实施方案中,RGN包含2、3、4、5、6或更多个核定位信号。一个或多个核定位信号可为异源NLS。可用于本发明公开的RGN的核定位信号的非限制性示例为SV40大T抗原、核质蛋白和c-Myc的核定位信号(参见,例如,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。在特定实施方案中,RGN包含如SEQ ID NO:251或253所示的NLS序列。该RGN可在其N-端、C-端、或在N-端及C-端二者处包含一个或多个NLS序列。例如,RGN可在N端区域处包含二个NLS序列,而在C端区域处包含四个NLS序列。
本领域已知将多肽定位于一个或多个特定亚细胞位置的其他定位信号序列还可用于靶向RGN,包括但不限于质体定位序列、线粒体定位序列以及靶向质体和线粒体二者的双靶向信号序列(参见,例如,Nassoury和Morse(2005)Biochim Biophys Acta 1743:5-19;Kunze和Berger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol 5:529-535;Carrie和Small(2013)Biochim Biophys Acta 1833:253-259;Carrie等人(2009)FEBSJ 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;Peeters和Small(2001)Biochim Biophys Acta 1541:54-63;Murcha等人(2014)J Exp Bot 65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glase等人(1998)Plant Mol Biol38:311-338)。
在某些实施方案中,本发明公开的RNA引导的核酸酶包含促进该RGN的细胞摄取的至少一个细胞穿透结构域。细胞穿透结构域为本领域已知的且通常包含数段带正电荷的氨基酸残基(即,聚阳离子细胞穿透结构域)、交替的极性氨基酸残基和非极性氨基酸残基(即,两亲性细胞穿透结构域)、或疏水性氨基酸残基(即,疏水性细胞穿透结构域)(参见,例如,Milletti F.(2012)Drug Discov Today 17:850-860)。细胞穿透结构域的非限制性示例为来自人免疫缺陷病毒1的转录活化转录激活因子(TAT)。
可将核定位信号、质体定位信号、线粒体定位信号、双靶向定位信号、和/或细胞穿透结构域定位于RNA引导的核酸酶的氨基端(N-端)、羧基端(C-端)、或内部位置中。
本发明公开的RGN可经由接头肽而直接或间接地与例如切割结构域、脱氨酶结构域、或表达调节子结构域的效应子结构域融合。这样的结构域可被定位于RNA引导的核酸酶的N端、C端或内部位置处。在这些实施方案中的一些中,融合蛋白的RGN成分为无核酸酶活性的RGN。
在一些实施方案中,RGN融合蛋白包含切割结构域,该切割结构域为能够切割多核苷酸(即,RNA、DNA或RNA/DNA杂交体)的任何结构域,并且包括但不限于限制性核酸内切酶和归巢核酸内切酶(homing endonuclease),例如IIS型核酸内切酶(例如,FokI)(参见,例如,Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Linn等人(编辑)Nucleases(核酸酶),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1993)。
在其他实施方案中,RGN融合蛋白包含脱氨酶结构域,该脱氨酶结构域将核苷酸碱基脱氨,导致从一种核苷酸碱基转化为另一种核苷酸碱基,并且包括但不限于胞苷脱氨酶或腺嘌呤脱氨酶碱基编辑器(参见,例如,Gaudelli等人(2017)Nature 551:464-471、美国公开号2017/0121693和2018/0073012、第9,840,699号美国专利及国际公开号WO/2018/027078)。
在一些实施方案中,RGN融合蛋白的效应子结构域可为表达调节子结构域,该表达调节子结构域为用来上调或下调转录的结构域。该表达调节子结构域可为表观遗传修饰结构域、转录抑制子结构域或转录活化结构域。
在这些实施方案中的一些中,RGN融合蛋白的表达调节子包含表观遗传修饰结构域,该表观遗传修饰结构域共价地修饰DNA或组蛋白以改变组蛋白结构和/或染色体结构,而不改变DNA序列,导致基因表达的变化(即,上调或下调)。表观遗传修饰的非限制性示例包括赖氨酸残基的乙酰化或甲基化、精氨酸甲基化、丝氨酸和苏氨酸磷酸化、以及组蛋白的赖氨酸泛素化和类泛素化(sumoylation)、以及DNA中胞嘧啶残基的甲基化和羟甲基化。表观遗传修饰结构域的非限制性示例包括组蛋白乙酰基转移酶结构域、组蛋白脱乙酰酶结构域、组蛋白甲基转移酶结构域、组蛋白去甲基化酶结构域、DNA甲基转移酶结构域和DNA去甲基化酶结构域。
在其他实施方案中,融合蛋白的表达调节子包含转录抑制子结构域,该转录抑制子结构域与例如RNA聚合酶和转录因子的转录控制元件和/或转录调节蛋白相互作用,以减少或终止至少一个基因的转录。转录抑制子结构域为本领域已知的且包括但不限于Sp1样抑制子、IκB和Krüppel相关盒(KRAB)结构域。
在又一些其他实施方案中,融合蛋白的表达调节子包含转录活化结构域,该转录活化结构域与例如RNA聚合酶和转录因子的转录控制元件和/或转录调节蛋白相互作用,以增加或活化至少一个基因的转录。转录活化结构域为本领域已知的且包括但不限于单纯疱疹病毒VP16活化结构域和NFAT活化结构域。
本发明公开的RGN多肽可包含可检测标记或纯化标签。可检测标记或纯化标签可直接地或经由接头肽间接地被定位于RNA引导的核酸酶的N-端、C-端或内部位置处。在这些实施方案中的一些中,融合蛋白的RGN成分为无核酸酶活性RGN。在其他实施方案中,融合蛋白的RGN成分为具有切口酶活性的RGN。
可检测标记为可以可视化的或以其他方式观察到的分子。可检测标记可与RGN融合为融合蛋白(例如,荧光蛋白),或者可为与RGN多肽缀合的、可视觉上检测或以其他方式检测的小分子。可与本发明公开的RGN融合为融合蛋白的可检测标记包括任何可检测的蛋白质结构域,包括但不限于可用特异性抗体检测的蛋白质结构域或荧光蛋白。荧光蛋白的非限制性示例包括绿色荧光蛋白(例如,GFP、EGFP、ZsGreen1)和黄色荧光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可检测标记的非限制性示例包括放射性标记,例如,3H以及35S。
RGN多肽还可包含纯化标签,该纯化标签为从混合物(例如,生物样品、培养基)中分离蛋白质或融合蛋白可使用的任何分子。纯化标签的非限制性示例包括生物素、myc、麦芽糖结合蛋白(MBP)、谷胱甘肽-S-转移酶(GST)和3X FLAG标签。
II.引导RNA
本公开内容提供引导RNA和编码引导RNA的多核苷酸。术语“引导RNA”是指与目标核苷酸序列具有足够互补性以与目标序列杂交并引导相关联的RNA引导的核酸酶与目标核苷酸序列的序列特异性结合的核苷酸序列。因此,RGN各自的引导RNA为一个或多个RNA分子(通常是一个或二个),其可与RGN结合并且引导RGN与特定目标核苷酸序列结合,且在RGN具有切口酶或核酸酶活性的那些实施方案中,还切割目标核苷酸序列。一般来说,引导RNA包含CRISPR RNA(crRNA)和转录活化CRISPR RNA(tracrRNA)。包括crRNA和tracrRNA二者的天然引导RNA通常包含两个单独的RNA分子,这些RNA分子经由crRNA的重复序列及tracrRNA的抗重复序列彼此杂交。
CRISPR阵列内的天然直接重复序列的长度通常在28至37个碱基对的范围内,但该长度可在约23bp至约55bp之间变化。CRISPR阵列内的间隔序列的长度通常在约32至约38bp的范围内。但长度可在约21bp至约72bp之间。每一个CRISPR阵列通常包含少于50个单位的CRISPR重复-间隔序列。CRISPR被转录为被称为初级CRISPR转录物的长转录物的一部分,其包含CRISPR阵列的大部分。初级CRISPR转录物被Cas蛋白切割以产生crRNA,或者在一些情况中,产生前体crRNA(pre-crRNA),这些pre-crRNA被其他Cas蛋白进一步处理为成熟的crRNA。成熟的crRNA包含间隔序列和CRISPR重复序列。在前体crRNA被处理为成熟(或经处理的)crRNA的一些实施方案中,成熟涉及去除约1至约6个或更多个5'、3'或5'和3'核苷酸。为了基因组编辑或靶向所关注的特定目标核苷酸序列的目的,在前体crRNA分子成熟期间被去除的这些核苷酸对于产生或设计引导RNA不是必需的。
CRISPR RNA(crRNA)包含间隔序列和CRISPR重复序列。“间隔序列”为与所关注的目标核苷酸序列直接杂交的核苷酸序列。间隔序列被工程化为与所关注的目标序列完全地或部分地互补。在各种实施方案中,间隔序列可包含约8个核苷酸至约30个核苷酸或更多个核苷酸。例如,间隔序列的长度可为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在一些实施方案中,间隔序列的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸。在一些实施方案中,间隔序列的长度为约10至约26个核苷酸、或长度为约12至约30个核苷酸。在特定实施方案中,间隔序列的长度为约30个核苷酸。在一些实施方案中,间隔序列的长度为30个核苷酸。在一些实施方案中,当使用适合的比对算法进行最佳比对时,间隔序列与其对应的目标序列之间的互补性程度为介于50%与99%之间或更高,包括但不限于约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,当使用适合的比对算法进行最佳比对时,间隔序列与其对应的目标序列之间的互补性程度为50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。在特定实施方案中,间隔序列不含使用本领域已知的任何适合的多核苷酸折叠算法可预测的二级结构,多核苷酸折叠算法包括但不限于mFold(参见,例如Zuker和Stiegler(1981)Nucleic AcidsRes.9:133-148)以及RNAfold(参见,例如Gruber等人(2008)Cell 106(1):23-24)。
CRISPR RNA重复序列包含核苷酸序列,该核苷酸序列或者独自地或者与所杂交tracrRNA配合形成通过该RGN分子识别的结构。在各种实施方案中,CRISPR RNA重复序列可包含约8个核苷酸至约30个核苷酸或更多个核苷酸。例如,CRISPR重复序列的长度可为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在特定实施方案中,CRISPR重复序列的长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸。在一些实施方案中,当使用适合的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA序列之间的互补性程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,当使用适合的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA序列之间的互补性程度为50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
在特定实施方案中,CRISPR重复序列包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性变体或片段,当被包含在引导RNA内时能够引导本文提供的相关联RNA引导的核酸酶与所关注的目标序列的序列特异性结合。在某些实施方案中,野生型序列的活性CRISPR重复序列变体包含与如SEQ IDNO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性CRISPR重复序列片段包含如SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个连续核苷酸。
在某些实施方案中,crRNA不是天然存在的。在这些实施方案中的一些中,特定的CRISPR重复序列在本质上不与工程化间隔序列连接,且该CRISPR重复序列被认为与间隔序列是异源的。在某些实施方案中,间隔序列为非天然存在的工程化序列。
转录活化的CRISPR RNA或tracrRNA分子包含核苷酸序列,该核苷酸序列包含具有与crRNA的CRISPR重复序列杂交的足够互补性的区域,其在本文中被称为抗重复区。在一些实施方案中,tracrRNA分子进一步包含具有二级结构(例如,茎环)的区域、或在与其对应的crRNA杂交时形成二级结构。在特定实施方案中,tracrRNA的与CRISPR重复序列完全地或部分地互补的区域在分子的5'端,且该tracrRNA的3'端包含二级结构。该二级结构区域通常包含若干发夹结构,包含被发现与抗重复序列相邻的连结(nexus)发夹。该连结在引导RNA与RGN之间形成相互作用的核心、并处于引导RNA、RGN与目标DNA之间的相交处。连结发夹通常在发夹茎的碱基中具有保守的核苷酸序列,而且基序UNANNC(SEQ ID NO:132)存在于tracrRNA中的许多连结发夹中。有趣的是,本发明的若干RGN使用在其连结发夹的发夹茎的碱基中包含非典型序列的tracrRNA,其包含UNANNA、UNANNU、UNANNG及CNANNC(SEQ ID NO分别为:129、130、131和133)。该tracrRNA的3'端处常常存在端发夹,其结构和数量可有所不同,但通常包含富含GC的Rho独立转录终止子发夹,其后在3'端处具有一串U。参见,例如Briner等人(2014)Molecular Cell 56:333-339、Briner和Barrangou(2016)Cold SpringHarb Protoc;doi:10.1101/pdb.top090902以及美国专利公开号2017/0275648,其每一个的全部内容通过引用并入本文。
在各种实施方案中,与CRISPR重复序列完全地或部分地互补的tracrRNA的抗重复区包含约8个核苷酸至约30个核苷酸或更多个核苷酸。例如,tracrRNA抗重复序列与该CRISPR重复序列之间的碱基配对区域的长度可为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在特定实施方案中,tracrRNA抗重复序列与该CRISPR重复序列之间的碱基配对区域的长度可为6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸。在一些实施方案中,当使用适合的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA抗重复序列之间的互补性程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更高。在特定实施方案中,当使用适合的比对算法进行最佳比对时,CRISPR重复序列与其对应的tracrRNA抗重复序列之间的互补性程度为50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
在各种实施方案中,整个tracrRNA可包含约60个核苷酸至多于约210个核苷酸。例如,tracrRNA的长度可为约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约150、约160、约170、约180、约190、约200、约210或更多个核苷酸。在特定实施方案中,tracrRNA的长度为60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、150、160、170、180、190、200、210或更多个核苷酸。在特定实施方案中,tracrRNA的长度为约80至约90个核苷酸,长度为包括约80、约81、约82、约83、约84、约85、约86、约87、约88、约89和约90个核苷酸。在特定实施方案中,tracrRNA的长度为80至90个核苷酸,长度为包括80、81、82、83、84、85、86、87、88、89及90个核苷酸。
在特定实施方案中,tracrRNA包含SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性变体或片段,当被包含在引导RNA内时能够引导本文提供的相关联RNA引导的核酸酶与所关注的目标序列的序列特异性结合。在某些实施方案中,野生型序列的活性tracrRNA序列变体包含与如SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性tracrRNA序列片段包含如SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多个连续核苷酸。
当两个序列在严格条件下彼此杂交时,可认为两个多核苷酸序列基本上互补。同样地,如果与RGN结合的引导RNA在严格条件下与目标序列结合,则认为RGN以序列特异性方式与特定目标序列结合。“严格条件”或“严格杂交条件”意指在该条件下两个多核苷酸序列彼此杂交的程度比与其他序列的杂交程度可检测程度较大(例如,比背景至少高2倍)。严格条件为序列依赖性的并且在不同环境下将会不同。典型地,严格条件将是这样的条件,其中:在pH 7.0至8.3,盐类浓度小于约1.5M Na离子,典型地约0.01至1.0M Na离子浓度(或其它盐类),且对于短序列(例如,10至50个核苷酸),温度为至少约30℃,而对于长序列(例如,大于50个核苷酸),温度为至少约60℃。通过添加例如甲酰胺的去稳定剂也可达到严格条件。示例性的低严格条件包括在37℃下以30至35%甲酰胺、1M NaCl、1% SDS(十二烷基硫酸钠)的缓冲溶液杂交并在50至55℃下以1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37℃下于40至45%甲酰胺、1.0M NaCl、1% SDS中杂交并在55至60℃下在0.5X至1X SSC中洗涤。示例性的高严格条件包括在37℃下于50%甲酰胺、1M NaCl、1% SDS中杂交并在60至65℃下在0.1X SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%的SDS。杂交持续时间通常小于约24小时,通常约4至约12小时。洗涤时间的持续时间将至少为足以达到平衡的时间长度。
Tm为50%的互补目标序列与完全匹配的序列杂交的温度(在所限定的离子强度和pH下)。对于DNA-DNA杂交体,Tm可以从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的等式:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L大致估计;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,以及L为碱基对中的杂交体的长度。通常,严格条件被选择为比在限定的离子强度和pH下比特异性序列及其互补序列的热熔点(Tm)低约5℃。然而,极度严格条件可以在比热熔点(Tm)低1、2、3或4℃下进行杂交和/或洗涤;中等严格条件可以在比热熔点(Tm)低6、7、8、9或10℃下进行杂交和/或洗涤;低严格条件可以在比热熔点(Tm)低11、12、13、14、15或20℃下进行杂交和/或洗涤。本领域技术人员将明白,使用该等式、杂交和洗涤组合物以及所需的Tm,杂交和/或洗涤溶液的严格性的变化被固有地描述。核酸杂交的广泛指南可在Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes,Part I,Chapter 2(Elsevier,New York);和Ausubel等人编辑(1995)Current Protocols in Molecular Biology,Chapter 2(GreenePublishing and Wiley-Interscience,New York)中得到。参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Cold Spring Harbor LaboratoryPress,Plainview,New York)。
术语“序列特异性”还可指,相比于与随机化背景序列的结合,以更高频率与目标序列结合。
引导RNA可为单引导RNA或双引导RNA系统。单引导RNA包含单个RNA分子上的crRNA和tracrRNA,而双引导RNA系统包括存在于两个不同RNA分子上的crRNA和tracrRNA,其经由crRNA的CRISPR重复序列的至少一部分和tracrRNA的至少一部分而彼此杂交,其可与该crRNA的CRISPR重复序列完全地或部分地互补。在其中引导RNA为单引导RNA的那些实施方案中的一些实施方案中,crRNA与tracrRNA被接头核苷酸序列分开。一般来说,为避免二级结构在接头核苷酸序列的核苷酸内的形成或避免包含该核苷酸的二级结构的形成,接头核苷酸序列为不包含互补碱基的核苷酸序列。在一些实施方案中,crRNA与tracrRNA之间的接头核苷酸序列的长度为至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12个或更多个核苷酸。在特定实施方案中,单引导RNA的接头核苷酸序列的长度为至少4个核苷酸。在某些实施方案中,接头核苷酸序列为如SEQ ID NO:249所示的核苷酸序列。
单引导RNA或双引导RNA可被化学合成或经由体外转录合成。用于确定RGN与引导RNA之间的序列特异性结合的测定法为本领域已知的、并且包括但不限于表达的RGN与引导RNA之间的体外结合测定法,其可用可检测的标记(如生物素)标记并用于下拉检测测定法,其中,引导RNA:RGN复合物是经由可检测标记(例如,利用链霉亲和珠)捕获的。具有与引导RNA无关的序列或结构的对照引导RNA可作为RGN与RNA的非特异性结合的阴性对照。在某些实施方案中,引导RNA为SEQ ID NO:4、11、18、25、32、39、46、53、59、66、73、79、86、92、99、106、113、120或126,其中该间隔序列可为任何序列且以poly-N序列表示。
在某些实施方案中,引导RNA可作为RNA分子而被引入目标细胞、细胞器或胚胎中。引导RNA可以在体外被转录或被化学合成。在其他实施方案中,将编码引导RNA的核苷酸序列引入细胞、细胞器或胚胎中。在这些实施方案中的一些中,编码引导RNA的核苷酸序列可操作地被连接至启动子(例如,RNA聚合酶III启动子)。该启动子可为天然启动子或与编码引导RNA的核苷酸序列异源。
在各种实施方案中,如本文所述,可以将引导RNA作为核糖核蛋白复合物引入目标细胞、细胞器或胚胎中,其中引导RNA与RNA引导的核酸酶多肽结合。
引导RNA经由该引导RNA与目标核苷酸序列的杂交而将关联的RNA引导的核酸酶引导至所关注的特定目标核苷酸序列。目标核苷酸序列可包含DNA、RNA或二者的组合,并且可为单链或双链的。目标核苷酸序列可为基因组DNA(即,染色体DNA)、质粒DNA、或RNA分子(例如,讯息RNA、核糖体RNA、转移RNA、微RNA、小干扰RNA)。目标核苷酸序列可在体外或在细胞中被RNA引导的核酸酶结合(而在一些实施方案中被切割)。RGN靶向的染色体序列可为核、质体或线粒体的染色体序列。在一些实施方案中,目标核苷酸序列在目标基因组中是独特的。
目标核苷酸序列与前间隔序列邻近基序(PAM)相邻。前间隔序列邻近基序通常在距该目标核苷酸序列约1至约10个核苷酸内,包含距目标核苷酸序列约1、约2、约3、约4、约5、约6、约7、约8、约9或约10个核苷酸。在特定实施方案中,PAM在距离目标核苷酸序列1至10个核苷酸内,包含距目标核苷酸序列1、2、3、4、5、6、7、8、9或10个核苷酸。PAM可为目标序列的5'或3'。在一些实施方案中,PAM为本发明公开的RGN的目标序列的3'。通常,该PAM是约3-4个核苷酸的共有序列,但在特定实施方案中,PAM的长度可为2、3、4、5、6、7、8、9或更多个核苷酸。在各种实施方案中,本发明公开的RGN识别的PAM序列包含如SEQ ID NO:7、14、21、28、35、42、49、62、69、79、82、95、102、109或116所示的共有序列。
在特定实施方案中,具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的RNA引导的核酸酶或其变体或片段结合与SEQ ID NO:7、14、21、28、35、42、49、62、69、79、82、95、102、109或116所示的PAM序列相邻的目标核苷酸序列。在这些实施方案中的一些中,RNG与包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124分别所示的CRISPR重复序列或其活性变体或片段以及SEQ ID NO:120至128、140、142、145、147和148分别所示的tracrRNA序列或其活性变体或片段的引导序列结合。该RGN系统进一步描述于本说明书的实施例1-3和表1以及表2中。
产生RGN APG05586(SEQ ID NO:63)的变体且其具有SEQ ID NO:570-579的氨基酸序列。具有SEQ ID NO:63和570-579中任一项的RGN可结合与SEQ ID NO:79所示的PAM序列相邻的目标核苷酸序列。在一些实施方案中,RGN APG05586的变体与包含SEQ ID NO:64所示的CRISPR重复序列的引导序列结合且还可包含SEQ ID NO:65所示的tracrRNA序列。这些RGN系统被进一步描述于本说明书的实施例5中。
本领域中众所周知,对于给定核酸酶酶的PAM序列特异性受酶浓度的影响(参见,例如,Karvelis等人(2015)Genome Biol 16:253),其可通过改变用于表达RGN的启动子或被递送至细胞、细胞器或胚胎的核糖核蛋白复合物的量而被修饰。
在识别其对应的PAM序列时,RGN可在特异性切割位点切割目标核苷酸序列。如本文所使用的,切割位点是由目标核苷酸序列内的两个特定核苷酸组成,它们之间的核苷酸序列被RGN切割。该切割位点可包含在5'或3'方向上自该PAM起的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9个核苷酸。在一些实施方案中,切割位点可在5'或3'方向上自该PAM起的10、11、12、13、14、15、16、17、18、19或20个以上的核苷酸。因RGN可切割目标核苷酸序列,导致交错的末端,所以在一些实施方案中,基于该多核苷酸的正(+)链上的两个核苷酸与该PAM的距离以及该多核苷酸的负(-)链上的两个核苷酸与该PAM的距离来界定该切割位点。
III.编码RNA引导的核酸酶、CRISPR RNA和/或tracrRNA的核苷酸
本公开内容提供包含本发明公开的CRISPR RNA、tracrRNA和/或sgRNA的多核苷酸以及包含编码本发明公开的RNA引导的核酸酶、CRISPR RNA、tracrRNA和/或sgRNA的核苷酸序列的多核苷酸。本发明公开的多核苷酸包括了包含或编码CRISPR重复序列的那些多核苷酸,该CRISPR重复序列包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性变体或片段,当被包含在引导RNA内时能够引导关联的RNA引导的核酸酶与所关注的目标序列的序列特异性结合。还公开了包含或编码tracrRNA的多核苷酸,该tracrRNA包含SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性变体或片段,当被包含在引导RNA内时能够将相关联RNA引导的核酸酶的序列特异性结合导向至所关注的目标序列。还提供编码RNA引导的核酸酶的多核苷酸,该RNA引导的核酸酶包含如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的氨基酸序列及其活性片段或变体,其保持以RNA引导的序列特异性方式结合至目标核苷酸序列的能力。
术语“多核苷酸”或“核酸分子”的使用不旨在将本公开内容限制于包含DNA的多核苷酸。本领域中技术人员将认识到多核苷酸可包含核糖核苷酸(RNA)以及核糖核苷酸与脱氧核糖核苷酸的组合。这样的脱氧核糖核苷酸和核糖核苷酸包含天然存在的分子及合成类似物二者。这些包含肽核酸(PNA)、PNA-DNA嵌合体(chimer)、锁核酸(LNA)以及硫代磷酸酯连接的序列。本文所公开的多核苷酸还包含所有形式的序列,包括但不限于单链形式、双链形式、DNA-RNA杂交体、三链体结构(triplex structure)、茎环结构等。
编码RGN的核酸分子可针对于所关注的生物体中的表达而被密码子优化。“密码子优化的”编码序列为使其密码子使用频率设计成模拟优选密码子使用频率或特定宿主细胞的转录条件的多核苷酸编码序列。由于核酸层次上的一个或多个密码子的改变使得翻译的氨基酸序列未改变,所以该特定宿主细胞或生物体中的表达被增强。核酸分子可以全部或部分地被密码子优化。密码子表以及提供大范围生物体的偏好信息的其他参考文献在本领域中是可获得的(参见,例如,Campbell和Gowri(1990)Plant Physiol.92:1-11,有关植物优选密码子使用的讨论)。本领域中用于合成植物优选基因或哺乳动物(例如,人类)密码子优化的编码序列的方法是可获得的。参见,例如,第5,380,831号和第5,436,391号美国专利以及Murray等人(1989)Nucleic Acids Res.17:477-498,这些通过引用并入本文。
编码本文中提供的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可在表达盒中提供,以用于在体外表达或在所关注的细胞、细胞器、胚胎或生物体中表达。该盒可包含5'和3'调节序列,该5'和3'调节序列可操作地连接至编码本文中提供的允许多核苷酸表达的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸。该盒可额外含有至少一种额外基因或基因元件,以共转化至该生物体内。如果包含额外基因或元件,则该组分被可操作地连接。术语“可操作地连接”旨在表示两个或更多个元素之间的功能性连接。例如,启动子与所关注的编码区域(例如,编码RGN、crRNA、tracrRNA和/或sgRNA的区域)之间的可操作地连接为允许所关注的编码区域表达的功能性连接。可操作地连接的元件可为连续的或非连续的。当用于指两个蛋白质编码区域的连接时,通过可操作地连接意指该编码区域在相同的阅读框中。或者,可在多个表达盒上提供一个或多个额外基因或元件。例如,编码本发明公开的RGN的核苷酸序列可存在于一个表达盒上,而编码crRNA、tracrRNA或完整引导RNA的核苷酸序列可在分开的表达盒上。这样的表达盒被提供有多个限制性位点和/或重组位点,以使该多核苷酸的插入受调节区域的转录调节。表达盒可额外含有选择性标记基因。
表达盒在转录的5'-3'方向上可包含转录(而在一些实施方案中为翻译)起始区域(即,启动子)、本发明的RGN-、crRNA-、tracrRNA-和/或sgRNA-编码多核苷酸以及在所关注的生物体中起作用的转录(而在一些实施方案中为翻译)终止区域(即,终止区域)。本发明的启动子能够在宿主细胞中引导或驱动编码序列的表达。调节区域(例如,启动子、转录调节区域以及翻译终止区域)可与宿主细胞为内源或异源、或彼此为内源的或异源的。如本文所使用的,关于序列的“异源”为源自外来物种的序列,或者,如果来自相同物种,则为通过蓄意的人为干预在组成和/或基因组位点方面从其天然形式实质上被修饰的序列。如本文中所使用的,嵌合基因包含与转录起始区域可操作地连接的编码序列,该转录起始区域与该编码序列是异源的。
方便的终止区域可从农杆菌(A.tumefaciens)的Ti质粒获得,例如章鱼肉碱合成酶以及胭脂碱(nopaline)合成酶终止区域。还参见Guerineau等人(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res.17:7891-7903;以及Joshi等人(1987)Nucleic Acids Res.15:9627-9639。
另外的调节信号包括但不限于转录起始开始位点、操纵基因、活化子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。参见,例如,第5,039,523号和第4,853,331号美国专利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:ALaboratory Manual,Maniatis等人编辑(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.),以下称“Sambrook 11”;Davis等人编辑(1980)Advanced BacterialGenetics(Cold Spring Harbor Laboratory Press),Cold Spring Harbor,N.Y.,以及其中引用的参考文献。
在制备表达盒时,可操纵各种DNA片段,以便在合适的方向上以及恰当的情况下在合适阅读框中提供DNA序列。为此,可以采用衔接子或接头来连接DNA片段,或者可涉及其他操纵以提供方便的限制位点、移除多余的DNA、移除限制位点等。为此目的,可涉及体外诱变、引物修复、限制、退火(annealing)、重新取代,例如,转换和置换(transversion)。
许多启动子可用于本发明的实施。可基于期望的结果来选择启动子。该核酸可以与组成型、诱导型、生长阶段特定、细胞类型特定、组织优选、组织特定的启动子或其他启动子结合,以用于在所关注的生物体中表达。参见,例如WO 99/43838中以及第8,575,425号;第7,790,846号;第8,147,856号;第8,586832号;第7,772,369号;第7,534,939号;第6,072,050号;第5,659,026号;第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号;以及第6,177,611号美国专利中所示的启动子;其通过引用并入本文。
为了在植物中表达,组成型启动子还包括CaMV 35S启动子(Odell等人(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人(1990)Plant Cell 2:163-171);泛素(Christensen等人(1989)Plant Mol.Biol.12:619-632以及Christensen等人(1992)PlantMol.Biol.18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.81:581-588);以及MAS(Velten等人(1984)EMBO J.3:2723-2730)。
诱导型启动子的示例为可通过缺氧或冷应激诱导的Adh1启动子、可通过热应激诱导的Hsp70启动子、可由光诱导的PPDK启动子以及磷酸稀醇丙酮酸羧化酶(pepcarboxylase)启动子。化学诱导的启动子也是有用的,例如保护剂诱导的In2-2启动子(第5,364,780号美国专利)、生长素诱导的并且是绒毡层特定的但在愈伤组织中也有活性的Axig1启动子(PCT US01/22169)、类固醇反应性启动子(参见,例如,Schena等人(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425以及McNellis等人(1998)Plant J.14(2):247-257中的雌激素诱导型ERE启动子以及糖皮质激素诱导型启动子)、以及四环素诱导型和四环素抑制型启动子(参见,例如Gatz等人(1991)Mol.Gen.Genet.227:229-237以及第5,814,618号和第5,789,156号美国专利),其通过引用并入本文。
组织特定或组织优选的启动子可用于靶向特定组织内的表达构建体的表达。在某些实施方案中,组织特定或组织优选的启动子在植物组织中是有活性的。在植物中受发育控制的启动子的示例包括在例如叶、根、果实、种子或花的某些组织中优先地起始转录的启动子。“组织特定”启动子为仅在某些组织中起始转录的启动子。与基因的组成型表达不同,组织特定的表达是几种水平的基因调节相互作用的结果。这样,来自同源或密切相关的植物物种的启动子可优选地用于在特定组织中实现转基因的有效且可靠的表达。在一些实施方案中,表达包含组织优选的启动子。“组织优选的”启动子是优选地在、但不一定完全在或仅在某些组织中起始转录的启动子。
在一些实施方案中,编码RGN、crRNA和/或tracrRNA的核酸分子包含细胞类型特定启动子。“细胞类型特定”启动子为主要在一个或多个器官中的某些细胞类型中驱动表达的启动子。例如,其中在植物中起作用的细胞类型特定启动子可为主要具有活性的植物细胞的一些示例包含BETL细胞、根、叶中的维管细胞、柄细胞以及杆细胞(stem cell)。核酸分子还可包含细胞类型优选的启动子。“细胞类型优选的”启动子为主要驱动大部分在、但不一定完全在或仅在一个或多个器官中的某些细胞类型中的表达的启动子。例如,其中在植物中起作用的细胞类型优选的启动子可优先具有活性的植物细胞的一些示例包括BETL细胞、根、叶中的维管细胞、柄细胞以及杆细胞。
编码该RGN、crRNA、tracrRNA和/或sgRNA的核酸序列可与例如通过用于体外mRNA合成的噬菌体RNA聚合酶识别的启动子序列可操作地连接。在这样的实施方案中,可纯化体外转录的RNA,以用于本文所述的方法。例如,该启动子序列可为T7、T3或SP6启动子序列、或T7、T3或SP6启动子序列的变体。在这样的实施方案中,可纯化表达的蛋白和/或RNA,以用于本文所述的基因组修饰的方法。
在某些实施方案中,编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸还可与多腺苷酸化信号(例如,SV40 polyA信号以及在植物中起作用的其他信号)和/或至少一个转录终止序列连接。另外,编码RGN的序列还可与编码至少一个核定位信号、至少一个细胞穿透结构域和/或能够将蛋白质运输至特定亚细胞部分的至少一个信号肽的一个或多个序列连接,如本文中别处所述。
编码该RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可存在于一个载体或多个载体中。“载体”指用于将核酸转移、递送或引入宿主细胞内的多核苷酸组合物。适合的载体包括质粒载体、噬菌粒、黏粒、人工/微型染色体、转座子和病毒载体(例如,慢病毒载体、腺相关病毒载体、杆状病毒载体)。该载体可包含额外的表达控制序列(例如,增强子序列、Kozak序列、聚腺苷酸化序列、转录终止序列)、选择性标记序列(例如,抗生素抗性基因)、复制起点等。额外信息可在“Current Protocols in Molecular Biology”Ausubel等人,JohnWiley&Sons,New York,2003或“Molecular Cloning:A Laboratory Manual”Sambrook&Russell,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,第3版,2001中找到。
该载体还可包含用于选择转化细胞的选择性标记基因。使用选择性标记基因以用于转化的细胞或组织的选择。标记基因包含:编码抗生素抗性的基因,例如,编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因;以及对例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧乙酸盐(2,4-D)等除草性化合物赋予抗性的基因。
在一些实施方案中,包含编码RGN多肽的序列的表达盒或载体可进一步包含编码crRNA和/或tracrRNA或者被组合以创建引导RNA的crRNA和tracrRNA的序列。编码crRNA和/或tracrRNA的一个或多个序列可与至少一个转录控制序列可操作地连接,用于在所关注的生物体或宿主细胞中表达crRNA和/或tracrRNA。例如,编码crRNA和/或tracrRNA的多核苷酸可与由RNA聚合酶III(Pol III)识别的启动子序列可操作地连接。适合的Pol III启动子的示例包括但不限于哺乳动物U6、U3、H1和7SL RNA启动子以及水稻U6和U3启动子。
如所指出的,包含编码RGN、crRNA、tracrRNA和/或sgRNA的核苷酸序列的表达构建体可用于转化所关注的生物体。用于转化的方法涉及将核苷酸构建体引入所关注的生物体内。通过“引入”旨在以使得构建体能够进入宿主细胞内部的方式将核苷酸构建体引至宿主细胞。本发明的方法不需要将核苷酸构建体引至宿主生物体的特定方法,仅在于核苷酸构建体能够进入宿主生物体的至少一个细胞内部。宿主细胞可为真核细胞或原核细胞。在特定实施方案中,真核宿主细胞为植物细胞、哺乳动物细胞、鸟类细胞或昆虫细胞。在一些实施方案中,包含或表达本发明公开的RGN或已由本发明公开的RGN修饰的真核细胞为人细胞。在一些实施方案中,包含或表达本发明公开的RGN或已通过本发明公开的RGN修饰的真核细胞为造血源的细胞,例如,免疫细胞(即,先天或适应性免疫系统的细胞),包括但不限于:B细胞、T细胞、自然杀伤(NK)细胞、多潜能干细胞、经诱导的多潜能干细胞、嵌合抗原受体T(CAR-T)细胞、单核细胞、巨噬细胞和树突状细胞。
用于将核苷酸构建体引入植物和其他宿主细胞内的方法为本领域已知的,其包括但不限于稳定转化方法、瞬时转化方法以及病毒介导方法。
这些方法得到转化的生物体,例如植物,包含整株植物以及植物器官(例如,叶、茎、根等)、种子、植物细胞、繁殖体、胚胎及其后代。植物细胞可以是分化的或未分化的(例如,愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。
“转基因生物”或“转化生物”或“稳定转化的”生物或细胞或组织是指已并入或整合了编码本发明的RGN、crRNA和/或tracrRNA的多核苷酸的生物。应当认识到,其他外源或内源核酸序列或DNA片段还可被并入该宿主细胞内。农杆菌和基因枪介导的转化仍然为用于植物细胞转化的两种主要采用的方法。然而,宿主细胞的转化可通过感染、转染、显微注射、电穿孔、显微注射、基因枪或粒子轰击、电穿孔、二氧化硅/碳纤维、超声波介导、PEG介导、磷酸钙共沉淀、聚阳离子DMSO技术、DEAE葡聚糖程序、以及病毒介导、脂质体介导等来进行。编码RGN、crRNA和/或tracrRNA的多核苷酸的病毒介导的引入包含逆转录病毒、慢病毒、腺病毒以及腺相关病毒介导的引入和表达、以及花椰菜花叶病毒、双生病毒和RNA植物病毒的使用。
转化实验方案以及用于将多肽或多核苷酸序列引入植物内的实验方案可根据针对转化所靶向的宿主细胞的类型(例如,单子叶植物或双子叶植物细胞)而不同。用于转化的方法为本领域已知的,且包含第8,575,425号、第7,692,068号、第8,802,934号、第7,541,517号美国专利中阐述的那些方法,这些专利中的每一个都通过引用并入本文。还参见Rakoczy-Trojanowska,M.(2002)Cell Mol Biol Lett.7:849-858;Jones等人(2005)PlantMethods 1:5;Rivera等人(2012)Physics of Life Reviews 9:308-345;Bartlett等人(2008)Plant Methods 4:1-12;Bates,G.W.(1999)Methods in Molecular Biology 111:359-366;Binns和Thomashow(1988),Microbiology 42:575-606中的Annual Reviews;Christou,P.(1992)The Plant Journal 2:275-281;Christou,P.(1995)Euphytica 85:13-27;Tzfira等人(2004)TRENDS in Genetics 20:375-383;Yao等人(2006)Journal ofExperimental Botany 57:3737-3746;Zupan和Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。
转化可导致核酸稳定或瞬时并入细胞内。“稳定转化”是指引入宿主细胞的核苷酸构建体整合至该宿主细胞的基因组内并且能够被其子代遗传。“瞬时转化”是指将多核苷酸引入宿主细胞内,并且不整合至该宿主细胞的基因组中。
用于叶绿体转化的方法为本领域已知的,参见,例如,Svab等人(1990)Proc.Nail.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA90:913-917;Svab和Maliga(1993)EMBO J.12:601-606。该方法取决于含有选择性标记的DNA的粒子枪递送以及经由同源重组将该DNA靶向该质体基因组。另外,质体转化可通过核编码的以及质体导向的RNA聚合酶的组织优选表达来反式激活沉默的质体携带转基因来实现。McBride等人(1994)在Proc.Natl.Acad.Sci.USA 91:7301-7305已报导了这样的系统。
根据传统方式,已转化的细胞可生长成转基因生物,例如,植物。参见,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。然后,可以使这些植物生长,并用相同转化株或不同株进行授粉,并鉴定出具有期望表达型特征的组成型表达的所得杂交体。可生长二代或更多代,以确保稳定维持并遗传期望表达型特征的表达,然后,收获种子,以确保已经达成期望表达型特征的表达。以此方式,本发明提供具有稳定地并入其基因组内的本发明的核苷酸构建体(例如,本发明的表达盒)的转化种子(也称为“转基因种子”)。
或者,可将已转化的细胞引入生物内。这些细胞可源自该生物,其中该细胞以离体方法被转化。
本文提供的序列可用于转化任何植物物种,包括但不限于单子叶植物和双子叶植物。所关注的植物的示例包括但不限于:玉蜀黍(玉米)、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦和油菜、甘蓝型油菜(Brassica sp.)、苜蓿、黑麦、小米、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑橘、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、木瓜、腰果、澳洲胡桃、杏仁、燕麦、蔬菜、观赏植物以及针叶树。
蔬菜包括但不限于西红柿、莴苣、绿豆、青豆、豌豆、以及例如黄瓜、哈密瓜和洋香瓜的甜瓜(Curcumis)属的成员。观赏植物包括但不限于:杜鹃花、绣球花、芙蓉、玫瑰、郁金香、水仙、矮牵牛、康乃馨、圣诞红和菊花。优选地,本发明的植物为农作物(例如,玉米、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。
如本文所使用的,术语“植物”包含植物细胞、植物原生质体、可从其再生植物的植物细胞组织培养物、植物愈伤组织、植物丛、以及在植物或植物的部分中完整的植物细胞(例如胚胎、花粉、胚珠、种子、叶子、花、枝、果实、仁、穗、穗轴、壳、茎、根、根尖、花药等)。谷物意指由商业种植者出于生长或繁殖物种以外的目的而生产的成熟种子。再生植物的子代、变体和突变体也包含在本发明的范围内,前提条件是这些部分包含所引入的多核苷酸。进一步提供了保留本文公开的序列的经处理的植物产品或副产物,包括例如豆粕。
编码RGN、crRNA和/或tracrRNA的多核苷酸还可用于转化任何原核物种,包括但不限于古生菌和细菌(例如,芽孢杆菌属物种、克雷伯菌属物种(Klebsiella sp.)、链霉菌属物种、根瘤菌属物种、埃希氏菌属(Escherichia sp.)物种、假单胞菌属物种、沙门氏菌属物种、志贺氏杆菌属物种、弧菌属物种、耶尔森氏菌属物种、支原体属物种、农杆菌属物种、乳酸杆菌属物种)。
编码RGN、crRNA和/或tracrRNA的多核苷酸可用于转化任何真核物种,包括但不限于动物(例如,哺乳动物、昆虫、鱼类、鸟类和爬行类)、真菌、变形虫、藻类和酵母。
传统的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物、昆虫或鸟类细胞或目标组织中。这样的方法可用于将编码RGN系统组分的核酸施用至培养物中的细胞或宿主生物中的细胞。非病毒载体递送系统包括DNA质粒、RNA(例如,本文描述的载体的转录物)、裸核酸、以及与例如脂质体的递送载体复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加型或整合的基因组。有关基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel&Feigner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,于CurrentTopics in Microbiology and Immunology,Doerfler和Bohm(编辑)(1995);以及Yu等人,Gene Therapy 1:13-26(1994)。
核酸的非病毒递送方法包括脂质体转染、核转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子以及DNA的药剂增强摄取。例如,第5,049,386号、第4,946,787号和第4,897,355号美国专利中描述了脂质体转染,脂质体转染试剂是市售的(例如,TransfectamTM及LipofectinTM)。适合用于多核苷酸的有效受体识别脂质体转染的阳离子和中性脂质包括Feigner的WO 91/17424;WO 91/16024中的那些阳离子和中性脂质。递送可以至细胞(例如,在体外或离体地施用)或目标组织(例如,体内施用)。脂质:核酸复合物(包含靶向的脂质体,例如免疫脂质复合物)的制备是本领域技术人员熟知的(参见,例如,Crystal,Science 270:404-410(1995);Blaese等人,Cancer Gene Ther.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号以及第4,946,787号美国专利)。
使用基于RNA或DNA病毒的系统来递送核酸利用高度进化的过程将病毒靶向体内的特定细胞且将病毒负载运输至细胞核。病毒载体可被直接施用患者(体内),或者该病毒载体可用于体外处理细胞,并且任选地将经修饰的细胞施用至患者(离体)。传统的基于病毒的系统可包含用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关和单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法,在宿主基因组中的整合是可能的,常常导致所插入的转基因的长期表达。另外,在许多不同细胞类型和目标组织中已经观察到高转导效率。
逆转录病毒的向性(tropism)可通过并入外来包膜蛋白而被改变,从而扩大目标细胞的潜在目标群体。慢病毒载体为能够转导或感染非分裂细胞并且通常情况下产生高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于该目标组织。逆转录病毒载体由顺式作用长末端重复序列构成,该顺式作用长末端重复序列具有达到6-10kb的外来序列的包装能力。最小顺式作用LTR足以复制和包装载体,然后,使用其将治疗性基因整合至目标细胞内,以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于小鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些载体(参见,例如,Buchscher等人,J.Viral.66:2731-2739(1992);Johann等人,J.Viral.66:1635-1640(1992);Sommnerfelt等人,Viral.176:58-59(1990);Wilson等人,J.Viral.63:2374-2378(1989);Miller等人,1.Viral.65:2220-2224(1991);PCT/US94/05700)。
在优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中能够有非常高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高效价和高表达水平。这种载体可在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体还可例如在核酸和肽的体外生产中用于转导具有目标核酸的细胞,以及用于体内和离体基因治疗程序(参见,例如,West等人,Virology 160:38-47(1987);第4,797,368号美国专利;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1.Clin.Invest.94:1351(1994))。重组AAV载体的构建描述于许多出版物中,包括第5,173,414号美国专利;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,1.Viral.63:03822-3828(1989)。包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψJ2细胞或PA317细胞。
基因疗法中使用的病毒载体通常通过产生将核酸载体包装于病毒颗粒中的细胞系而被产生。该载体通常含有可用于包装并且随后整合至宿主中所需的最小病毒序列,其他病毒序列被用于要表达的多核苷酸的表达盒替代。缺失的病毒功能通常由包装细胞系以反式提供。例如,基因治疗中使用的AAV载体通常仅具有包装及整合至宿主基因组中所需的来自AAV基因组的ITR序列。病毒DNA被包装于细胞系中,该细胞系含有编码其他AAV基因的辅助质粒,即rep和cap,但缺少ITR序列。
还可用腺病毒作为辅助体(helper)来感染细胞系。辅助病毒促进AAV载体的复制和来自辅助质粒中的AAV基因的表达。由于缺少ITR序列,没有大量包装该辅助质粒。腺病毒的污染可通过例如热处理来降低,腺病毒对热处理比对AAV更敏感。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。参见,例如,US20030087817,其通过引用并入本文。
在一些实施方案中,用本文描述的一个或多个载体瞬时地或非瞬时地转染宿主细胞。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,被转染的细胞取自受试者。在一些实施方案中,细胞衍生自取自受试者的细胞,例如细胞系。在一些实施方案中,细胞系可为哺乳动物、昆虫或鸟类细胞。用于组织培养的多种细胞系为本领域已知的。细胞系的示例包括但不限于:C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4.COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎纤维母细胞、3T3 Swiss、3T3-Ll、132-d5人胎儿纤维母细胞;10.1小鼠纤维母细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY细胞、K562细胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THPl细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可从本领域中技术人员已知的多种来源获得(参见,例如,美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(Manassas,Va.))。
在一些实施方案中,使用用本文描述的一个或多个载体转染的细胞用于建立包含一个或多个载体衍生序列的新细胞系。在一些实施方案中,使用如本文描述的RGN系统的组分瞬时转染的(例如,通过一个或多个载体的瞬时转染,或用RNA转染)并经由RGN系统的活性修饰的细胞建立包含含有该修饰但缺少任何其他外源序列的细胞的新细胞系。在一些实施方案中,使用用本文描述的一个或多个载体暂时或非暂时转染的细胞或从这样的细胞取得的细胞系来评估一个或多个测试化合物。
在一些实施方案中,使用本文描述的一个或多个载体来产生非人的转基因动物或转基因植物。在一些实施方案中,转基因动物为哺乳动物,例如,小鼠、大鼠、仓鼠、兔子、牛或猪。在一些实施方案中,转基因动物为鸟类,例如,鸡或鸭。在一些实施方案中,转基因动物为昆虫,例如,蚊子或蜱。
IV.多肽和多核苷酸的变体及片段
本公开内容提供:天然存在的(即,野生型)RNA引导的核酸酶的活性变体及片段,其氨基酸序列如SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示;以及天然存在的CRISPR重复序列的活性变体和片段,例如,SEQ IDNO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的序列;以及天然存在的tracrRNA的活性变体和片段,例如,SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的序列;以及编码这些序列的多核苷酸。
尽管相比于所关注的多核苷酸或多肽可以改变变体或片段的活性,但该变体及片段应保留所关注的多核苷酸或多肽的功能性。例如,当与所关注的多核苷酸或多肽相比时,变体或片段可具有增加的活性、降低的活性、不同的活性谱或活性的任何其他改变。
例如本文所公开的天然存在的RGN多肽的片段及变体将保守序列特异性的RNA引导的DNA结合活性。在特定实施方案中,例如本文所公开的天然存在的RGN多肽的片段及变体将保留核酸酶活性(单链或双链)。
例如本文所公开的天然存在的CRISPR重复序列的片段及变体当作为引导RNA(包含tracrRNA)的一部分时,将保留以序列特异性方式结合并将RNA引导的核酸酶(与引导RNA复合)引导至目标核苷酸序列的能力。
例如本文所公开的天然存在的tracrRNA的片段及变体为引导RNA(包含CRISPRRNA)的一部分时,将保留以序列特异性方式将RNA引导的核酸酶(与该引导RNA复合)引导至目标核苷酸序列的能力。
术语“片段”指本发明的多核苷酸或多肽序列的一部分。“片段”或“生物活性部分”包含多核苷酸,该多核苷酸包含足够数量的连续核苷酸,以保留生物活性(即,当包含在引导RNA中时,以序列特异性方式结合RNA至并将RGN引导至目标核苷酸序列)。“片段”或“生物活性部分”包含多肽,该多肽包含足够数量的连续氨基酸残基,以保留生物活性(即,当与引导RNA复合时,以序列特异性方式与目标核苷酸序列结合)。RGN蛋白的片段包含由于使用替代的下游开始位点而比全长序列短的那些片段。RGN蛋白的生物活性部分可为包含例如SEQID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700或更多个连续氨基酸残基的多肽。此类生物活性部分可通过重组技术而被制备并针对序列特异性的RNA引导的DNA结合活性而被评估。CRISPR重复序列的生物活性片段可包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的至少8个连续氨基酸。CRISPR重复序列的生物活性部分可为包含例如SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个连续核苷酸的多核苷酸。tracrRNA的生物活性部分可为包含例如SEQID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110或更多个连续核苷酸的多核苷酸。
一般来说,“变体”旨在是指基本上相似的序列。对于多核苷酸,变体包含天然多核苷酸中的一个或多个内部位点处的一个或多个核苷酸的缺失和/或添加和/或在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的取代。如本文所使用的,“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包含因为遗传密码的简并性(degeneracy)而编码所关注基因的天然氨基酸序列的那些序列。例如可使用众所周知的分子生物学技术鉴定(例如,利用如以下概述的聚合酶链式反应(PCR)和杂交技术)的天然存在的等位基因变体。变体多核苷酸还包含合成衍生的多核苷酸,例如那些例如通过使用定点诱变产生的但其仍然编码所关注的多肽或多核苷酸。通常,与如通过本文别处描述的序列比对程序和参数所确定的,本文所公开的特定多核苷酸的变体将与如通过本文别处描述的序列比对程序和参数所确定的那个特定多核苷酸具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性。
本文所公开的特定多核苷酸的变体(即,该参考多核苷酸)还可通过比较由变体多核苷酸所编码的多肽与由该参考多核苷酸所编码的多肽之间的序列同一性百分比来评估。可使用本文别处描述的序列比对程序和参数来计算任何两个多肽之间的序列同一性百分比。当通过比较本文公开的任何给定的多核苷酸对所编码的两个多肽共同的序列同一性百分比来评估本文公开的任何给定的多核苷酸对时,两个编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。
在特定实施方案中,本发明公开的多核苷酸编码RNA引导的核酸酶多肽,该RNA引导的核酸酶多肽包含的氨基酸序列与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。在一些实施方案中,SEQ ID NO:63的变体维持在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ IDNO:63的405对应的氨基酸位置处的缬氨酸。与第二氨基酸序列的特定位置“对应”的第一氨基酸序列的氨基酸位置指:当第一和第二氨基酸序列被最佳比对时,第一氨基酸序列中与第二序列中的指定的氨基酸残基位置对齐的位置。在特定实施方案中,SEQ ID NO:63的变体与SEQ ID NO:63保持的这些氨基酸残基(即,I305、V328、L366、T368和V405)外的SEQ IDNO:63具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。
本发明的RGN多肽的生物活性变体可相差少至约1-15个氨基酸残基、少至约1-10个(例如,约6-10个)、少至5个、少至4个、少至3个、少至2个、或少至1个氨基酸残基。在具体实施方案中,多肽可包含N端或C端截断(truncation),该截断可至少包含从该多肽的N端或C端缺失10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700个或更多个氨基酸。
在某些实施方案中,本发明公开的多核苷酸包含或编码CRISPR重复序列,该CRISPR重复序列包含与SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。
本发明公开的多核苷酸包含或编码tracrRNA,该tracrRNA包含与SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。
本发明的CRISPR重复序列或tracrRNA的生物活性变体可相差少至约1-15个氨基酸残基、少至约1-10个(例如,约6-10个)、少至5个、少至4个、少至3个、少至2个、或少至1个核苷酸。在具体实施方案中,多核苷酸可包含5'或3'截断,其可至少包含从该多核苷酸的5'或3'端缺失10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、95、100、105、110个或更多个核苷酸。
应当认识到,可对本文提供的RGN多肽、CRISPR重复序列及tracrRNA进行修饰,从而产生变体蛋白和多核苷酸。人为设计的改变可经由定点诱变技术的应用而被引入。或者,在结构上和/或功能上与本文公开的序列有关的天然的、未知的或尚未鉴定的多核苷酸和/或多肽也可被认为落入本发明的范围内。可在不改变该RGN蛋白功能的非保留区域中进行保守氨基酸取代。或者,可进行改善RGN活性的修饰。
变体多核苷酸和蛋白还包含源自例如诱变和重组程序(例如DNA改组(DNAshuffling))取得的序列和蛋白。用这种程序,操纵本文所公开的一个或多个不同的RGN蛋白质(例如,SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579),以产生具有期望特性的新RGN蛋白。以这种方式,重组多核苷酸文库是从包含序列区域的相关序列多核苷酸的群体产生的,该序列区域具有基本序列同一性且可在体外或体内同源地重组。例如,使用这种方法,编码所关注结构域的序列基序可在本文提供的RGN序列与其他已知RGN基因之间改组,以获得对具有改善的所关注性质(例如在酶的情况中,增加的Km)的蛋白质编码的新基因。这样的DNA改组的策略为本领域已知的。例如,参见Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri等人(1997)Nature Biotech.15:436-438;Moore等人(1997)J.Mol.Biol.272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri等人(1998)Nature 391:288-291;以及第5,605,793号和第5,837,458号美国专利。“改组的”核酸是通过改组程序(例如本文阐述的任何改组程序)产生的核酸。改组的核酸是通过例如以人工方式及任选地递归的方式(物理地或虚拟地)重组两个或更多个核酸(或字符串)产生的。通常,改组过程中使用一个或多个筛选步骤来识别所关注的核酸;该筛选步骤可在任何重组步骤之前或之后进行。在一些(但不是全部)改组实施方案中,期望在选择之前执行多轮重组,以增加要筛选的池的多样性。重组和选择的整个过程任选地递归地重复。根据背景,改组可指重组和选择的整个过程,或者可替代地,可仅指整个过程的重组部分。
如本文使用的,在两个多核苷酸或多肽序列的上下文中使用的“序列同一性”或“同一性”涉及到当在指定的比较窗上比对以获得最大对应性时为相同的两个序列中的残基。当使用与蛋白质有关的序列同一性百分比时,应当认识到,不同的残基位置通常因保守氨基酸取代而不同,其中氨基酸残基被具有类似化学性质(例如,电荷或疏水性)的其他氨基酸残基取代,并且因此不会改变分子的功能特性。当序列在保守取代方面不同时,可以向上调整序列同一性百分比,以校正取代的保留性质。通过这种保守取代而不同的序列被称为具有“序列相似性”或“相似性”。用于进行这样的调整的手段是本领域技术人员熟知的。通常,这涉及将保守取代计为部分错配而非全部错配,从而增加序列同一性百分比。因此,例如,在相同氨基酸的评分为1,并且非保守取代的评分为零的请况下,保守取代的评分为0与1之间的计分。例如,以在程序PC/GENE(Intelligenetics,Mountain View,California)中实施的那样,计算保守取代的计分。
如本文所使用的,“序列同一性百分比”是指通过在比较窗上比较两个最佳比对的序列所确定的值,其中比较窗中的多核苷酸序列的部位可包含相比于用于该两个序列的最佳比对的参考序列(不包含添加或缺失)的添加或缺失(即,缺口)。通过确定在两个序列中出现相同核酸碱基或氨基酸残基的位置数以求得匹配位置数、将匹配位置数除以比较窗中的位置总数、以及将结果乘以100以求得序列同一性百分比,来计算该百分比。
除非另有说明,否则本文提供的序列同一性/相似性值指使用利用以下参数的GAP版本10获得的值:使用GAP权重50以及长度权重3以及nwsgapdna.cmp计分矩阵的核苷酸序列的%同一性及%相似性;使用GAP权重8以及长度权重2以及BLOSUM62计分矩阵的氨基酸序列的%同一性及%相似性;或其任何等效程序。“等效程序”是指任何序列比较程序,当与GAP版本10产生的对应比对进行比较时,针对所涉及的任何两个序列,该序列比较程序产生具有相同核苷酸或氨基酸残基匹配及相同序列同一性百分比的比对。
当使用所界定的氨基酸取代矩阵(例如,BLOSUM62)、缺口存在罚分(gapexistence penalty)以及缺口延伸罚分(gap extension penalty)比对两个序列,以达到该对序列可能的最高分数时,两个序列被“最佳比对”。氨基酸取代矩阵及其在量化该两个序列之间的相似性中的使用是本领域所熟知的,并且被描述于例如Dayhoff等人(1978)“Amodel of evolutionary change in proteins”中;“Atlas of Protein Sequence andStructure”,Vol.5,Suppl.3(M.O.Dayhoff编辑),第345-352页;Natl.Biomed.Res.Found.,Washington,D.C.;和Henikoff等人(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919中。BLOSUM62矩阵通常用作序列比对实验方案中的默认计分替换矩阵。缺口存在罚分实施于在其中一个比对序列中的引入单个氨基酸缺口,而缺口延伸罚分实施于插入已经打开的缺口中的每一个另外的空氨基酸位置。通过比对开始和结束处的每一个序列的氨基酸位置、以及可任选地通过在一个或两个序列中插入一个或多个缺口来达到最高可能计分来定义比对。尽管可以手动完成最佳比对和评分,但是该过程可通过使用计算机实施的比对算法(例如Altschul等人在(1997)Nucleic Acids Res.25:3389-3402中所述、并且在美国国家生物技术信息中心(National Center for Biotechnology Information)网站(www.ncbi.nlm.nih.gov)上向公众开放的有缺口BLAST 2.0)促进了该流程。可以使用例如经由www.ncbi.nlm.nih.gov可获得的和Altschul等人在(1997)Nucleic Acids Res.25:3389-3402中描述的PSI-BLAST来准备包含多重比对的最佳比对。
关于与参考序列最佳比对的氨基酸序列,氨基酸残基“对应于”在该比对中的参考序列中该残基与之配对的位置。该“位置”由数字表示,该数字基于其相对于N-端的位置依次识别该参考序列中的每一个氨基酸。由于在确定最佳比对时必须考虑的缺失、插入、截断、融合等,通常通过简单地从N端计数即可确定的测试序列中的氨基酸残基数目,不必与在该参考序列中其对应位置的数目相同。例如,在所比对的测试序列中存在缺失的情况中,将不存在与参考序列中缺失位点处的位置对应的氨基酸。在所比对的参考序列中有插入的情况下,该插入将不对应于该参考序列中的任何氨基酸位置。在截断或融合的情况中,该参考序列或所比对的序列中可存在不对应于相应序列中的任何氨基酸的氨基酸段(stretch)。
V.抗体
还包括针对本发明的RGN多肽或包含本发明的RGN多肽的核糖核蛋白,包括具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579所示的氨基酸序列或其活性变体或其片段的那些RGN多肽或核糖核蛋白。产生抗体的方法为本领域所熟知的(参见,例如,Harlow和Lane(1988)Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.;以及第4,196,265号美国专利)。这些抗体可用于试剂盒中,用于RGN多肽或核糖核蛋白的检测及分离。因此,本公开内容提供了包含特异性结合至本文描述的多肽或核糖核蛋白的抗体的试剂盒,该多肽或核糖核蛋白包含例如具有SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的序列的多肽。
VI.用于结合所关注的目标序列的系统和核糖核蛋白复合物及其制备方法
本公开内容提供一种用于结合所关注的目标序列的系统,其中该系统包括至少一个引导RNA或编码该至少一个引导RNA的核苷酸序列以及至少一个RNA引导的核酸酶或编码该至少一个RNA引导的核酸酶的核苷酸序列。该引导RNA与所关注的目标序列杂交、并且还与该RGN多肽形成复合物,从而引导该RGN多肽与该目标序列结合。在这些实施方案中的一些中,RGN包含SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的氨基酸序列或其活性变体或片段。在各种实施方案中,引导RNA包含CRISPR重复序列,该CRISPR重复序列包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性变体或片段。在一些特定实施方案中,引导RNA包含tracrRNA,该tracrRNA包含SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性变体或片段。该系统的引导RNA可为单引导RNA或双引导RNA。在一些特定实施方案中,系统包括与该引导RNA异源的RNA引导的核酸酶,其中该RGN与引导RNA在本质上不是彼此复合(即,彼此结合)。
本文提供的用于结合所关注的目标序列的系统可为核糖核蛋白复合物,其是与至少一个蛋白质结合的RNA的至少一个分子。本文提供的核糖核蛋白复合物包含作为该RNA组成的至少一个引导RNA以及作为该蛋白质组成的RNA引导的核酸酶。可从天然表达RGN多肽的细胞或生物体中纯化此类核糖核蛋白复合物,并且此类核糖核蛋白复合物已经被工程化,以表达对所关注的目标序列特异的特定引导RNA。或者,可从已用对RGN多肽及引导RNA进行编码的多核苷酸转化且在允许该RGN多肽及引导RNA表达的条件下培养的细胞或生物体中纯化核糖核蛋白复合物。因此,提供用于制备RGN多肽或RGN核糖核蛋白复合物的方法。此类方法包括:在RGN多肽(而在一些实施方案中,引导RNA)被表达的条件下,培养包含对RGN多肽进行编码的核苷酸序列的细胞,而且在一些实施方案中,培养包含对引导RNA进行编码的核苷酸序列的细胞。然后,可从所培养的细胞的裂解产物中纯化RGN多肽或RGN核糖核蛋白。
从生物样品的溶解产物中纯化RGN多肽或RGN核糖核蛋白复合物的方法是本领域已知的(例如,尺寸排阻和/或亲和层析法、2D-PAGE、HPLC、反相层析法、免疫沉淀法)。在一些特定方法中,RGN多肽为重组产生的且包含有助于其纯化的纯化标签,其包括但不限于:谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。通常,所标记的RGN多肽或RGN核糖核蛋白复合物是使用固定化金属亲和层析法纯化的。应当理解,可单独地或组合地使用本领域已知的其他类似方法,包括其他形式的层析法或例如免疫沉淀法。
“分离的”或“纯化的”多肽或其生物活性部分基本上或实质上不含在其天然存在的环境中发现的、正常情况下与该多肽相伴或相互作用的组分。因此,分离的或纯化的多肽当通过重组技术被产生时基本上不含其他细胞物质或培养基,或当被化学合成时基本上不含化学前体物或其他化学物质。基本上不含细胞物质的蛋白质包含具有少于约30%、20%、10%、5%或1%(以干重计)的污染蛋白质的蛋白质制剂。当重组产生本发明的蛋白质或其生物活性部分时,最佳培养基呈现少于约30%、20%、10%、5%或1%(以干重计)的化学前体物或所关注的非蛋白质化学物质。
本文所提供的用于结合和/或切割所关注的目标序列的特定方法涉及使用体外组装的RGN核糖核蛋白复合物。RGN核糖核蛋白复合物的体外组装可使用本领域已知的方法进行,其中在允许RGN多肽与引导RNA结合的条件下使RGN多肽与引导RNA接触。如本文中所使用的,“接触(contact、contacting)”、“接触的(contacted)”指在适合进行期望反应的条件下,将期望反应的组分放在一起。RGN多肽可从生物样品、细胞裂解产物或培养基中纯化、经由体外转换产生、或被化学合成。引导RNA可从生物样品、细胞裂解产物或培养基中纯化、在体外被转录、或被化学合成。可使RGN多肽和引导RNA在溶液(例如,缓冲盐溶液)中接触以允许RGN核糖核蛋白复合物的体外组装。
VII.结合、切割或修饰目标序列的方法
本公开内容提供用于结合、切割和/或修饰所关注的目标核苷酸序列的方法。该方法包括向目标序列或包含该目标序列的细胞、细胞器或胚胎,递送包含至少一个引导RNA或编码该至少一个引导RNA的多核苷酸、以及至少一个RGN多肽或编码该至少一个RGN多肽的多核苷酸的系统。在这些实施方案中的一些中,RGN包含SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的氨基酸序列或其活性变体或片段。在各种实施方案中,引导RNA包含CRISPR重复序列,该CRISPR重复序列包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列或其活性变体或片段。在特定实施方案中,引导RNA包含tracrRNA,该tracrRNA包含SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列或其活性变体或片段。该系统的引导RNA可为单引导RNA或双引导RNA。该系统的RGN可为无核酸酶活性的RGN,具有切口酶活性、或者可为融合多肽。在一些实施方案中,融合多肽包含碱基编辑多肽,例如,胞苷脱氨酶或腺苷脱氨酶。在其他实施方案中,RGN融合蛋白包含反转录酶。在其他实施方案中,RGN融合蛋白包含多肽,该多肽加入功能性核酸修复复合物的成员,例如,核苷酸切除修复(NER)或转录偶联的-核苷酸切除修复(TC-NER)途径的成员(Wei等人,2015,PNAS USA 112(27):E3495-504;Troelstra等人,1992,Cell 71:939-953;Marnef等人,2017,J Mol Biol 429(9):1277-1288),如2020年1月27日申请的第62/966,203号美国临时专利申请中所描述的,且该美国临时专利申请的全部内容通过引用并入本文。在一些实施方案中,RGN融合蛋白包含CSB(van den Boom等人,2004,J Cell Biol 166(1):27-36;van Gool等人,1997,EMBO J 16(19):5955-65;其示例如SEQ ID NO:608所示),CSB为TC-NER(核苷酸切除修复)途径的成员且在加入其他成员中产生功能。在另外的实施方案中,RGN融合蛋白包含CSB的活性结构域,例如,包含SEQ ID NO:608的氨基酸残基356-394的CSB的酸性结构域(Teng等人,2018,Nat Commun 9(1):4115)。
在特定实施方案中,RGN和/或引导RNA对于该RGN和/或引导RNA(或编码该RGN及引导RNA中的至少一个的多核苷酸)被引入到的细胞、细胞器或胚胎为异源的。
在其中该方法包括递送编码引导RNA和/或RGN多肽的多核苷酸的那些实施方案中,细胞或胚胎可接着在引导RNA和/或RGN多肽被表达的条件下培养。在各种实施方案中,该方法包括使目标序列与RGN核糖核蛋白复合物接触。该RGN核糖核蛋白复合物可包含无核酸酶活性或具有切口酶活性的RGN。在一些实施方案中,核糖核蛋白复合物的RGN为包含碱基编辑多肽的融合多肽。在某些实施方案中,该方法包括将RGN核糖核蛋白复合物引入包含目标序列的细胞、细胞器或胚胎中。RGN核糖核蛋白复合物可为已从生物样品中被纯化、重组产生并随后纯化、或如本文所描述的体外组装的复合物。在其中与目标序列或细胞、细胞器或胚胎接触的RGN核糖核蛋白复合物已经在体外被组装的那些实施方案中,该方法可进一步包含该复合物在与该目标序列、细胞、细胞器或胚胎接触之前的体外组装。
可使用本领域已知的、包括但不限于电穿孔的任何方法将纯化的或体外组装的RGN核糖核蛋白复合物引入细胞、细胞器或胚胎内。或者,可使用本领域已知的任何方法(例如,电穿孔)将编码或包含引导RNA的RGN多肽和/或多核苷酸引入细胞、细胞器或胚胎内。
在递送至或接触目标序列或包含目标序列的细胞、细胞器或胚胎时,引导RNA引导RGN以序列特异性方式与目标序列结合。在其中RGN具有核酸酶活性的那些实施方案中,RGN多肽在结合时切割所关注的目标序列。目标序列随后可经由例如非同源末端连接或用所提供的供体多核苷酸进行同源介导的修复等内源修复机制而被修饰。
测量RGN多肽与目标序列的结合的方法为本领域已知的并且包括染色质免疫沉淀测定法、凝胶迁移位移测定、DNA下拉测定、报导子测定(reporter assay)、微量板捕获和检测测定。同样地,测量目标序列的切割或修饰的方法为本领域已知的并且包括体外或体内切割测定法,其中在在有或没有适当标记物(例如,放射性同位素、荧光物质)附接至目标序列以方便检测降解产物的情况下,使用PCR、测序或凝胶电泳来确认切割。或者,可使用切口触发的指数扩增反应(NTEXPAR)测定法(参见,例如,Zhang等人(2016)Chem.Sci.7:4951-4957)。可使用Surveyor测定法来评估体内切割(Guschin等人(2010)Methods Mol Biol649:247-256)。
在一些实施方案中,方法涉及使用与一个以上的引导RNA复合的单一类型RGN。该一个以上的引导RNA可靶向单一基因的不同区域、或者可靶向多个基因。
在其中未提供供体多核苷酸的那些实施方案中,可通过非同源末端连接(NHEJ)修复过程来修复由RGN多肽引入的双链断裂。由于NHEJ的易错性质,双链断裂的修复可导致对目标序列的修饰。如本文所使用的,关于核酸分子的“修饰”是指核酸分子的核苷酸序列的变化,其可为一个或多个核苷酸的缺失、插入或取代或其组合。目标序列的修饰可导致改变的蛋白质产物的表达或编码序列的失活。
在其中存在供体多核苷酸的那些实施方案中,在修复所引入的双链断裂的过程中,供体多核苷酸中的供体序列可被整合至目标核苷酸序列中或与目标核苷酸序列交换,导致外源供体序列的引入。因此,供体多核苷酸包含期望被引入所关注的目标序列中的供体序列。在一些实施方案中,供体序列改变原始目标核苷酸序列,使得新整合的供体序列将不被该RGN识别和切割。供体序列的整合可通过在供体多核苷酸中包含侧翼序列来增强,该侧翼序列与目标核苷酸序列两侧的序列具有基本的序列同一性、本文中被称为“同源臂”,以允许同源介导的修复过程。在一些实施方案中,同源臂具有至少50个碱基对、至少100个碱基对以及多达2000个碱基对或更多个碱基对的长度,并且与其在该目标核苷酸序列内的对应序列具有至少90%、至少95%或更高序列同源性。
在其中RGN多肽引入双链交错断裂的那些实施方案中,供体多核苷酸可包含侧翼为相容突出部的供体序列,以允许在双链断裂的修复期间通过非同源修复过程将供体序列直接连接至包含突出部的经切割的目标核苷酸序列。
在其中该方法涉及使用为切口酶(即,仅能够切割双链多核苷酸中的单链)的RGN的那些实施方案中,该方法可包含引入靶向相同或重叠的目标序列并切割该多核苷酸的不同链的两个RGN切口酶。例如,可将仅切割双链多核苷酸的正(+)链的RGN切口酶与仅切割双链多核苷酸的负(-)链的第二RGN切口酶一起引入。
在各种实施方案中,提供一种用于结合目标核苷酸序列并检测该目标序列的方法,其中该方法包括将至少一个引导RNA或编码该至少一个引导RNA的多核苷酸、以及至少一个RGN多肽或编码该至少一个RGN多肽的多核苷酸引入细胞、细胞器或胚胎中;表达该引导RNA和/或RGN多肽(如果编码序列被引入),其中该RGN多肽为无核酸酶活性的RGN且进一步包含可检测标记,并且该方法进一步包含检测该可检测标记。该可检测标记可与该RGN融合为融合蛋白(例如,荧光蛋白),或者可为与RGN多肽接合或被并入RGN多肽中、可以用视觉或通过其他方式检测的小分子。
本文还提供用于在目标序列的调控下调控所关注的目标序列或基因的表达的方法。该方法包括将至少一个引导RNA或编码该至少一个引导RNA的多核苷酸、以及至少一个RGN多肽或编码该至少一个RGN多肽的多核苷酸引入细胞、细胞器或胚胎中;表达引导RNA和/或RGN多肽(如果编码序列被引入),其中RGN多肽为无核酸酶活性的RGN。在这些实施方案中的一些中,无核酸酶活性的RGN为包含如本文所描述的表达调节子结构域(即,表观遗传修饰结构域、转录活化结构域、或转录抑制子结构域)的融合蛋白。
本公开内容还提供用于结合和/或修饰所关注的目标核苷酸序列的方法。该方法包括递送系统至该目标序列或包含该目标序列的细胞、细胞器或胚胎,该系统包括至少一个引导RNA或编码该至少一个引导RNA的多核苷酸、以及至少一个融合多肽,该至少一个融合多肽包含本发明的RGN和碱基编辑多肽(例如,胞苷脱氨酶或腺苷脱氨酶)或编码该融合多肽的多核苷酸。
本领域中技术人员将理解,本发明公开的任何方法可用于靶向单一目标序列或多个目标序列。因此,这些方法包括将单一RGN多肽与多个不同的引导RNA组合地使用,该引导RNA可靶向单一基因和/或多个基因内的多个不同序列。本文还包括其中与多个不同的RGN多肽组合地引入多个不同的引导RNA的方法。这些引导RNA和引导RNA/RGN多肽系统可靶向单一基因和/或多个基因内的多个不同序列。
在一方面,本发明提供包括上述方法和组合物中所公开的任何一个或多个元素的试剂盒。在一些实施方案中,该试剂盒包括载体系统和使用试剂盒的说明。在一些实施方案中,载体系统包括(a)第一调节元件,该第一调节元件与编码crRNA序列的DNA序列以及用于在经编码的crRNA序列的上游插入引导序列的一个或多个插入位点可操作地连接,其中当被表达时,该引导序列在真核细胞中引导RGN复合物与目标序列的序列特异性结合,其中RGN复合物包含与引导RNA多核苷酸复合的RGN酶;和/或(b)第二调节元件,该第二调节元件与酶编码序列可操作地连接,该酶编码序列编码包含核定位序列的该RGN酶。这些元素可个别地或组合地被提供,并且可以被提供在任何适合的容器中,例如,小瓶、瓶子或管。
在一些实施方案中,试剂盒包括一种或多种语言的说明。在一些实施方案中,试剂盒包括在利用本文所述的一个或多个组件的方法中使用的一种或更多种试剂。试剂可被提供于任何适合的容器中。例如,试剂盒可以提供一个或多个种反应或储存缓冲液。试剂可为以可用于特别测定的形式、或以在使用前需要添加一个或多个种其他成分的形式(例如,以浓缩或冷冻干燥形式)被提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施方案中,缓冲剂为碱性的。在一些实施方案中,缓冲液具有约7至约10的pH。
在一些实施方案中,试剂盒包括与用于插入载体的引导序列对应的一个或多个寡核苷酸,以便可操作地连接引导序列与调控元件。在一些实施方案中,试剂盒包括同源重组模板多核苷酸。在一方面,本发明提供用于使用RGN系统的一个或多个元件的方法。本发明的RGN系统提供用于修饰目标多核苷酸的有效手段。本发明的RGN系统具有多种多样的功能,包括在多种细胞类型中修饰(例如,缺失、插入、移位、失活、活化、碱基编辑)目标多核苷酸。这样,本发明的RGN系统在例如基因治疗、药物筛选、疾病诊断以及预后中具有广泛的应用。示例性的RGN系统或RGN复合物包括与引导序列复合的RGN酶,该引导序列与目标多核苷酸内的目标序列杂交。
VIII.目标多核苷酸
在一方面,本发明提供修饰真核细胞中的目标多核苷酸的方法,其可为体内、离体或体外的。在一些实施方案中,该方法包括从人类或非人类动物或植物(包括微藻类)中取样细胞或细胞群、以及修饰细胞。培养可以在离体的任何阶段发生。甚至可以将细胞重新引入非人类动物或植物(包括微藻类)中。
使用自然变异性,植物育种者结合了大多数有用的基因以获得所需的品质,例如产量、质量、一致性、抗逆性以及抗害虫性。这些所需的品质还包括生长、日长偏好、温度要求、花或生殖发育的起始日期、脂肪酸含量、抗虫性、抗病性、线虫抗性、真菌抗性、除草剂抗性、对各种环境因素(包含干旱、热、湿、冷、风和包含高盐度的不利土壤条件)的耐受性。这些有用基因的来源包含天然或外来品种、原生种(heirloom variety)、野生植物近缘种、以及例如以诱变剂处置植物材料的诱导突变。使用本发明,为植物育种者提供诱导突变的新工具。据此,本领域中技术人员可以针对有用基因来源而分析基因组,并且在具有所需特征或性状的品种中采用本发明以诱导有用基因的增加,而且比先前的诱变剂更精确,并且因此加速和改善植物育种计划。
RGN系统的目标多核苷酸可为对真核细胞是内源或外源的任何多核苷酸。例如,该目标多核苷酸可为存在于真核细胞的细胞核中的多核苷酸。目标多核苷酸可为编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节性多核苷酸或垃圾DNA(junk DNA))。不希望受理论的束缚,目标序列应该与PAM(前间隔序列邻近基序)相关联;即,该RGN系统识别的短序列。该PAM的精确序列和长度要求随所使用的RGN而不同,但PAM通常是与前间隔序列(即,目标序列)相邻的2-5个碱基对序列。
RGN系统的目标多核苷酸可包含许多疾病关联基因和多核苷酸以及与信号传导生化途径关联的基因和多核苷酸。目标多核苷酸的示例包括与信号传导生化途径关联的序列,例如,与信号传导生化途径关联的基因或多核苷酸。目标多核苷酸的示例包括与疾病关联的基因或多核苷酸。“与疾病关联的”基因或多核苷酸指:与非疾病对照的组织或细胞相比,在从患病组织取得的细胞中以异常水平或以异常形式产出转录或翻译产物的任何基因或多核苷酸。其可为一种变得以异常高水平表达的基因;其可为一种变得以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。与疾病关联的基因也指具有突变或基因变异的基因,具有突变或基因变异的基因为直接造成疾病病因(例如,因果突变)、或为与造成疾病病因(例如,因果突变)的基因呈连锁不平衡。转录或翻译的产物可为已知的或未知的并且还可能处于正常或异常水平。在一些实施方案中,疾病可为动物疾病。在一些实施方案中,该疾病可为鸟类疾病。与其他实施方案中,疾病可为哺乳动物疾病。在进一步实施方案中,疾病可为人类疾病。人类的疾病关联基因和多核苷酸的示例可获自:McKusick-Nathans遗传医学研究所,Johns Hopkins University(Baltimore,Md.)和美国国家生物技术信息中心,美国国家医学图书馆(Bethesda,Md.),可在万维网上获得。
虽然RGN系统因其相对容易靶向所关注的基因组序列方面格外有用,但仍然存在该RGN如何解决因果突变的问题。一种方法为在RGN(优选地,RGN的无活性或切口酶变体)与碱基编辑酶或碱基编辑酶(例如,胞苷脱氨酶或腺苷脱氨酶碱基编辑器)的活性结构域之间产生融合蛋白(第9,840,699号美国专利,通过引用并入本文)。在一些实施方案中,这些方法包括使DNA分子与(a)包含本发明的RGN以及例如脱氨酶等碱基编辑多肽的融合蛋白接触;以及(b)将(a)的融合蛋白靶向DNA链的目标核苷酸序列的gRNA接触;其中该DNA分子以有效量并且在适于核苷酸碱基脱氨作用的条件下与融合蛋白和gRNA接触。在一些实施方案中,该目标DNA序列包含与疾病或病症关联的序列,并且其中该核苷酸碱基的脱氨作用导致与疾病或病症无关联的序列。在一些实施方案中,该目标DNA序列位于农作物的等位基因中,其中所关注的性状的特定等位基因导致农艺价值较低的植物。该核苷酸碱基的脱氨作用导致改善了植物的性状并增加植物的农艺价值的等位基因。
在一些实施方案中,DNA序列包含与疾病或病症关联的T→C或A→G点突变,并且其中突变体C或G碱基的脱氨作用导致与疾病或病症无关联的序列。在一些实施方案中,脱氨作用校正与该疾病或病症关联的序列中的点突变。
在一些实施方案中,与该疾病或病症关联的序列编码蛋白质,并且其中该脱氨作用将终止密码子引入与疾病或病症关联的序列中,导致编码的蛋白质被截断。在一些实施方案中,接触是在易患有、患有或被诊断患有疾病或病症的受试者体内进行。在一些实施方案中,疾病或病症为与基因组中的点突变或单碱基突变关联的疾病。在一些实施方案中,该疾病为遗传性疾病、癌症、代谢疾病或溶酶体贮积病。
IX.药物组合物和治疗方法
提供药物组合物,该药物组合物包含:本发明公开的RGN多肽及其活性变体或片段以及编码该RGN多肽及其活性变体或片段的多核苷酸、本发明公开的gRNA或编码该gRNA的多核苷酸、本发明公开的系统、或包含该RGN多肽或RGN编码多核苷酸、gRNA或gRNA编码多核苷酸、或该RGN系统中任一个的细胞和药学上可接受的载体。
药物组合物为被用于防止、降低程度、治愈或治疗目标病症或疾病的组合物,该组合物包含活性成分(即,RGN多肽、RGN编码多核苷酸、gRNA、gRNA编码多核苷酸、RGN系统、或包含这些中任一个的细胞)和药学上可接受的载体。
如本文中使用的,“药学上可接受的载体”是指不对生物体引起明显刺激且不消除该活性成分(即,RGN多肽、RGN编码多核苷酸、gRNA、gRNA编码多核苷酸、RGN系统、或包含这些中任一个的细胞)的活性及特性的材料。载体必须具有足够高的纯度和足够低的毒性,以使其适合施用至正被治疗的受试者。该载体可为惰性的,或其可具有医药益处。在一些实施方案中,药学上可接受的载体包含适合对人或其他脊椎动物施用的一个或多个兼容固体或液体填充剂、稀释剂或封装物质。在一些实施方案中,药学上可接受的载体不是天然发生的。在一些实施方案中,未发现该药学上可接受的载体在本质上与该活性成分在一起。
本发明公开的方法中使用的药学组合物可由提供合适转移、递送、耐受性等的合适载体、赋形剂和其他药剂配制。众多恰当制剂是本领域技术人员已知的。参见,例如,Remington,The Science and Practice of Pharmacy(21st ed.2005)。合适的制剂例如包含:粉剂、糊剂、膏剂、凝胶、蜡、油类、脂质、含脂质(阳离子或阴离子)的囊泡(例如,LIPOFECTIN囊泡)、脂质纳米粒子、DNA缀合物、无水吸收糊剂、水包油和油包水、乳液卡波蜡(emulsions carbowax)(各种分子量的聚乙二醇)、半固体凝胶(semi-solid gel)以及含有卡波蜡的半固体混合物。经口或非口服使用的药学组合物可被制备为适于适应活性成分剂量的单位剂量的剂型。这些单位剂量的剂型例如包含片剂、丸剂、胶囊、注射剂(安瓿)、栓剂等。
在其中包含或以本发明公开的RGN、gRNA、RGN系统或编码该RGN、gRNA、RGN系统的多核苷酸的细胞被施用至受试者的一些实施方案中,这些细胞与药学上可接受的载体一起作为悬浮剂被施用。本领域中技术人员将认识到将被用于细胞组合物中的药学上可接受的载体将不包含实质上干扰将被递送至该受试者的细胞的生存力的量的缓冲液、化合物、冷冻保存剂、保存剂、或其他制剂。包含细胞的制剂可包含例如允许细胞膜保持完整性的渗透压缓冲液,以及任选地包含在施用时保持细胞生存力或增强植入的营养素。这样的制剂和悬浮剂是本领域技术人员已知的,和/或使用常规实验可被调适成与本文公开的细胞一起使用。
细胞组合物还可被乳化为或呈现为脂质体组合物,前提条件为该乳化程序不会不利地影响细胞生存力。该细胞和任何其他活性成分可以与药学上可接受并且与该活性成分兼容的赋形剂以及以适合在本文公开的治疗方法中使用的量混合。
细胞组合物中包含的其他药剂可包含其内的组分的药学上可接受的盐。药学上可接受的盐包括例如与例如盐酸或磷酸的无机酸、或与例如醋酸、酒石酸、苯乙醇酸等的有机酸形成的酸加成盐(与多肽的自由胺基基团形成)。与自由羧基基团形成的盐还可例如衍生自例如钠、钾、铵、钙或铁的氢氧化物的无机碱、以及例如异丙胺、三甲胺、2-乙胺基乙醇、组氨酸、普鲁卡因等的有机碱。
生理学上可耐受且药学上可接受的载体是本领域已知的。示例性液体载体为无菌水溶液,其除了活性成分和水外不含有其他材料,或其含有例如在生理pH值的磷酸钠、生理盐水或二者的缓冲液(例如,磷酸盐缓冲盐水)。此外,水性载体可含有一种以上的缓冲盐以及例如氯化钠和氯化钾的盐、葡萄糖、聚乙二醇以及其他溶质。液体组合物还可含有除了水和排除水的液相。此类另外的液相的示例为甘油、植物油例如棉花籽油和水油乳液。在特定病症或病况的治疗中有效的细胞组合物中使用的活性化合物的量可取决于该病症或病况的本质,并且可由标准临床技术确定。
本发明公开的RGN多肽、引导RNA、RGN系统、或编码该RGN多肽、引导RNA、RGN系统的多核苷酸可取决于施用的特定方式和剂型而以例如载体、溶剂、稳定剂、佐剂、稀释剂等的药学上可接受的赋形剂配制。在一些实施方案中,这些药学组合物被配制以达到生理学上相容的pH;并且取决于制剂和施用途径,其范围为约3的pH至约11的pH、约pH 3至约pH 7。在一些实施方案中,可将pH调整至约pH 5.0至约pH 8的范围。在一些实施方案中,组合物可包含本文描述的治疗有效量的至少一种化合物,连同一种或多种药学上可接受的赋形剂。在一些实施方案中,组合物包含本文描述的化合物的组合、或包含治疗或防止细菌生长中有用的第二活性成分(例如而不限于,抗菌或抗微生物药剂)、或包含本公开内容的试剂的组合。
例如,适合的赋形剂包含载体分子,该载体分子包含大型、缓慢代谢的大分子,例如,蛋白质、多糖、聚乳酸、聚乙醇酸、聚合的氨基酸、氨基酸共聚物以及非活性的病毒粒子。其他示例性赋形剂可包含抗氧化剂(例如而不限于,抗坏血酸)、螯合剂(例如而不限于,EDTA)、碳水化合物(例如而不限于,糊精、羟烷基纤维素和羟烷基甲基纤维素)、硬脂酸、液体(例如而不限于,油、水、盐水、甘油和乙醇)、润湿剂或乳化剂、pH缓冲物质等。
在一些实施方案中,制剂以单位剂量或多剂量容器(例如,密封安瓿和小瓶(vial))被提供,并且可被储存于冻干(冷冻干燥)条件下,需要在立即使用之前,添加无菌液体载体(例如,盐水、注射用水、半液体泡沫或凝胶)。实时注射溶液和悬浮剂可从前面描述种类的无菌粉剂、颗粒和片剂制备。在一些实施方案中,活性成分溶解于缓冲液体溶液中,其以单位剂量或多剂量容器被冷冻,以及之后被解冻用于注射或被保持/稳定在冷冻下直到使用。
治疗剂可被包含在受控的释放系统中。为了延长药物的作用,常常期望从皮下、鞘内、或肌肉内注射以减缓药物的吸收。这可通过使用具有水难溶性的结晶或非结晶材料的液体悬浮剂来完成。然后,药物的吸收速率取决于其溶解速率,而其溶解速率又可取决于结晶大小和结晶的形式。或者,非经口施用药物的延迟吸收通过该药物溶解或悬浮于油媒介中来完成。在一些实施方案中,长期持续释放的植入剂的使用特别适合用于慢性病症的治疗。长期持续释放的植入剂是本领域技术人员已知的。
本文提供了在有需要的受试者中治疗疾病的方法。该方法包括将有效量的本发明公开的RGN多肽或其活性变体或片段或编码该RGN多肽或其活性变体或片段的多核苷酸、本发明公开的gRNA或编码该gRNA的多核苷酸、本发明公开的RGN系统、或由这些组合物中任一个修饰的或包含这些组合物中任一个的细胞施用至有需要的受试者。
在一些实施方案中,治疗包括通过施用本发明公开的RGN多肽、gRNA、或RGN系统、或编码该RGN多肽、gRNA、或RGN系统的一个或多个多核苷酸的体内基因编辑。在一些实施方案中,治疗包括体外基因编辑,其中细胞用本发明公开的RGN多肽、gRNA、或RGN系统、或编码该RGN多肽、gRNA、或RGN系统的一个或多个多核苷酸进行体外基因修饰,然后将经修饰的细胞施用至受试者。在一些实施方案中,经基因修饰的细胞源自之后被施用该修饰的细胞的受试者,并且所移植细胞在本文中被称为自体的。在一些实施方案中,经基因修饰的细胞源自与被施用该经修饰的细胞的受试者(即,接受者)同种内的不同受试者(即,供体),并且所移植细胞在本文中被称为异体的。在本文描述的一些示例中,细胞可在对有需要的受试者施用之前在培养中扩大。
在一些实施方案中,要用本发明公开的组合物治疗的疾病为可用免疫疗法(例如,用嵌合抗原受体(CAR)T细胞)治疗的疾病。此类疾病包括但不限于癌症。在一些实施方案中,要用本发明公开的组合物治疗的疾病与因果突变关联。如本文中使用的,“因果突变”指对受试者中的疾病或病症的严重程度或存在有贡献的基因组中的特定核苷酸、多个核苷酸或核苷酸序列。因果突变的校正导致由疾病或病症引起的至少一个症状改善。在一些实施方案中,因果突变与本文公开的RGN所识别的PAM位点相邻。该因果突变可用本发明公开的RGN或包含本发明公开的RGN和碱基编辑的多肽(即,碱基编辑器)的融合多肽来校正。与因果突变关联的疾病的非限制性示例包括囊性纤维化、赫尔勒综合征、弗里德赖希共济失调(Friedreich’s Ataxia)、亨廷顿病(Huntington’s Disease)以及镰状细胞疾病。在一些实施方案中,要用本公开的RGN治疗的疾病为列于表11中的疾病。疾病关联基因及突变的额外非限制性示例可获自:McKusick-Nathans遗传医学研究所,Johns Hopkins University(Baltimore,Md.)和美国国家生物技术信息中心,美国国家医学图书馆(Bethesda,Md.),可在万维网上获得。
如本文中使用的,“治疗”或“处理”、或“缓和”或“改善”可被互换地使用。这些术语指用于获得有益或期望结果的方法,有益结果或期望结果包括但不限于治疗性益处和/或预防性益处。通过治疗性益处意味着对治疗中的一个或多个疾病、病况或症状中的任何治疗相关改善或对治疗中的一个或多个疾病、病况或症状的效果。对于预防性益处,组合物可被施用处于特定疾病、病症或症状的发展风险中的受试者、或被施用报告疾病的一个或多个生理症状的受试者,即使该疾病、病症或症状可能尚未呈现征兆。
术语“有效量”或“治疗有效量”是指足以达到有益或期望结果的药剂量。治疗有效量可取决于下列中的一个或多个而变化:被治疗的受试者和疾病病况、受试者的重量和年龄、疾病病况的严重性、施用方式等,本领域中技术人员可容易地对此做出确定。特定剂量可取决于下列中的一个或多个而变化:所选的特定药剂、要遵循的给药方案、是否与其他化合物组合地施用、施用时机以及运载其的递送系统。
术语“施用”指通过导致所引入的活性成分至少部分地定位于期望位点(例如,受伤或修复的位点)处的方法或途径以将活性成分置于受试者内,使得产生期望效果。在其中施用细胞的那些实施方案中,可通过导致递送至受试者中的期望位置的任何恰当途径施用该细胞,其中至少一部分所移植的细胞或该细胞的组分维持存活。施用至受试者后的细胞的存活期可短至几小时(例如,二十四小时)、至几天、至长至若干年、甚至患者的生命期,即,长期植入。例如,在本文描述的一些方面,光受体细胞或视网膜前体细胞的有效量是经由系统施用途径(例如腹膜内或静脉内途径)施用。
在一些实施方案中,施用包括通过病毒递送的施用。在一些实施方案中,施用包括通过电穿孔的施用。在一些实施方案中,施用包括通过纳米粒子递送的施用。在一些实施方案中,施用包括通过核糖体递送的施用。施用的任何有效途径可用于施用有效量的本文描述的药物组合物。在一些实施方案中,施用包括由选自由下列各项组成的组的方法的施用:静脉内地、皮下地、肌肉内地、口服地、经直肠地、通过气溶胶、非经口地、经眼地、经肺地、经皮地、经阴道地、经耳地、经鼻地以及通过外部施用、或其任何组合。在一些实施方案中,对于细胞的递送,使用通过注射或灌注的施用。
如本文中使用的,术语“受试者”是指期望对其进行诊断、治疗或疗法的任何个体。在一些实施方案中,受试者为动物。在一些实施方案中,受试者为哺乳动物。在一些实施方案中,受试者为人类。
治疗效力可由熟练的临床医师确定。然而,如果疾病或病症的体征或症状的任何一个或全部是以有益方式被改变(例如,至少减少10%)、或其他临床上接受的疾病的症状或标记被改善或缓和,则该治疗被认为“有效治疗”。还可通过个体未发生如通过住院评估的恶化、或不需要医学介入(例如,疾病的进展被停止或至少减慢)来测量效力。测量这些指标的方法是本领域中技术人员已知的。治疗包括:(1)抑制疾病,例如,遏止或减慢症状的进展;或(2)减缓疾病,例如,引起症状消退;以及(3)预防或降低症状发展的可能性。
A.使用碱基编辑修饰因果突变
可使用依赖于本发明的RGN-碱基编辑器融合蛋白的方法来校正的遗传性疾病的示例是赫尔勒综合征。赫尔勒综合征(也称为MPS-1)为α-L-艾杜糖醛酸酶(IDUA)缺乏的结果,导致在分子层次上由溶酶体中硫酸乙酰肝素和硫酸皮肤素的累积表征的溶酶体贮积病。该疾病通常是由编码α-L-艾杜糖醛酸酶的IDUA基因中的突变引起的遗传性基因病症。常见的IDUA突变是W402X及Q70X,两者都是导致翻译过早终止的无义突变。通过精确的基因组编辑(PGE)方法很好地解决了这种突变,由于单一核苷酸的回复(例如,通过碱基编辑方法)将恢复野生型编码序列并导致受遗传基因座的内源性调控机制控制的蛋白质表达。另外,由于已知杂合子是无症状的,所以靶向这些突变中的一个的PGE疗法对于大部分患有此疾病的患者是有用的,因为仅需要校正其中一个突变的等位基因(Bunge等人(1994)Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。
对赫尔勒综合征的目前治疗包括酶替代疗法和骨髓移植(Vellodi等人(1997)Arch.Dis.Child.76(2):92-99;Peters等人(1998)Blood 91(7):2601-2608,通过引用并入本文)。尽管酶替代疗法对赫尔勒综合征患者的存活和生活质量产生了显著影响,但这种方法需要每周进行昂贵且耗时的输注。另外的方法包括递送表达载体上的IDUA基因或将该基因插入高度表达的基因座中,例如,血清白蛋白的基因座中(美国专利号9,956,247,通过引用并入本文)。然而,这些方法不能将原始IDUA基因座恢复至正确的编码序列。基因组编辑策略可具有许多优点,最显著的是基因表达的调控将受健康个体中存在的天然机制的控制。另外,使用碱基编辑不一定引起双链DNA断裂,这可能由肿瘤抑制机制的破坏导致大规模染色体重排、细胞死亡或致癌。一般策略可被指向为使用本发明的RGN碱基编辑器融合蛋白来靶向并校正人类基因组中的某些致病的突变。应理解,还可寻求类似方法来靶向可由碱基编辑校正的疾病。还应进一步理解,还可使用本发明的RGN采用类似的方法来靶向其他物种(特别是常见家庭宠物或家畜)中的致病突变。常见家庭宠物和家畜包括狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、鱼(包括鲑鱼)和虾。
B.通过靶向缺失修饰因果突变
本发明的RGN在因果突变更复杂的人类治疗方法中也有用。例如,例如弗里德赖希共济失调和亨廷顿病的一些疾病是在基因特定区域处的三个核苷酸基序的重复显著增加的结果,这会影响表达的蛋白起作用或被表达的能力。弗里德赖希共济失调(FRDA)是一种导致脊髓神经组织进行性退化的常染色体隐性疾病。线粒体中的共济蛋白(frataxin,FXN)蛋白质的降低水平引起细胞层次的氧化损伤和铁缺乏。降低的FXN表达已与体细胞和生殖系列FXN基因的内含子1内的GAA三联体扩增关联。在FRDA患者中,GAA重复通常由超过70个,有时甚至超过1000个(最常见的是600-900个)三联体组成,而未受影响的个体具有约40个或更少的重复(Pandolfo等人(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人(1996)Science 271:1423-1427;Pandolfo(2002)Adv.Exp.Med.Biol.516:99-118;全部通过引用并入本文)。
引起弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内限定的基因座中,被称为FRDA不稳定性区域。RNA引导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。该方法需要:1)可被程序化以靶向人类基因组中的等位基因的引导RNA序列以及RGN;以及2)用于RGN和引导序列的递送方法。特别是,当除了功能性表达盒所需的其他遗传元件之外,还要考虑到SpCas9基因和引导RNA的长度时,用于基因组编辑的许多核酸酶(例如,来自化脓性链球菌的常用Cas9核酸酶(SpyCas9))太大而无法包装到腺相关病毒(AAV)载体内。这使得使用SpCas9的方法更加困难。
本发明的某些RNA引导的核酸酶极适合随引导RNA一起被包装至AAV载体内。包装两个引导RNA可能需要第二载体,但这样的方法仍然比可能需要例如SpCas9的较大核酸酶的方法有利,这可能需要在两个载体之间拆开蛋白质序列。本发明包含使用本发明的RGN的策略,其中去除了基因组不稳定性的区域。这种策略适用于具有类似遗传基础的其他疾病和病症,例如亨廷顿病。使用本发明的RGN的类似策略还可适用于具有农艺或经济重要性的非人类动物(包含狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、以及鱼(包括鲑鱼)和虾)的类似疾病和病症。
C.通过靶向诱变修饰因果突变
本发明的RGN也可引入可导致有益效果的破坏性突变。编码血红素的基因(特别是β球蛋白链(HBB基因))中的基因缺陷可能是许多称为血红素病的疾病(包含镰状细胞贫血症和地中海贫血症)的原因。
在成年人中,血红素为包含两条α样球蛋白链和两条β样球蛋白链以及4个原血红素基的异源四聚体。在成人中,α2β2四聚体被称为血红素A(HbA)或成人血红素。通常情况下,α及β球蛋白链以大约1:1的比例合成,且该比例就血红素和红细胞(RBC)稳定性而言似乎是至关重要的。在发育中的胎儿中,产生了不同形式的血红素(胎儿血红素(HbF)),其对氧的结合亲和力高于血红素A,使得氧可经由母亲的血流递送至婴儿的系统。胎儿血红素也含有两条α球蛋白链,但是代替成人β-球蛋白链,其具有两条胎儿γ-球蛋白链(即,胎儿血红素为α2γ2)。从产生γ-球蛋白转换为产生β-球蛋白的调控相当复杂,并且主要涉及γ球蛋白转录的下调与β球蛋白转录的同时上调。在妊娠约30周时,胎儿中γ球蛋白的合成开始下降,而β球蛋白的产量增加。到约10个月龄时,新生儿的血红素几乎都是α2β2,虽然一些HbF持续到成年(约为总血红素的1-3%)。在大多数具有血红素病的患者中,编码γ球蛋白的基因仍然存在,但由于如上所述在临近分娩时发生正常的基因抑制,表达相对较低。
镰状细胞疾病是由β球蛋白基因(HBB)中的V6E突变(DNA层次的GAG至GTG)引起的,其中产生的血红素被称为“血红素S”或“HbS”。在低氧条件下,HbS分子聚集并形成纤维状沉淀。这些聚集体引起RBC异常或“形成镰状”,导致细胞的柔韧性丧失。形成镰状的RBC不再能够挤入微血管床,并且可能导致镰状细胞患者发生血管闭塞性危机。此外,镰状的RBC比正常RBC更脆弱,且倾向于溶血,最终导致患者贫血。
镰状细胞患者的治疗和管理是终生的课题,其涉及抗生素治疗、疼痛管理以及急性发作期间的输液。一种方法为使用羟基脲,其通过增加γ球蛋白的产生来部分地发挥其效应。然而,慢性羟基脲疗法的长期副作用仍然是未知的,而且治疗会产生不良副作用并且可能在患者之间具有不同的效果。尽管镰状细胞治疗的功效有所提高,但患者的预期寿命仍然仅在50岁中期至晚期,并且疾病的相关发病率对患者的生活质量具有深远的影响。
地中海贫血症(α地中海贫血症及β地中海贫血症)也是与血红素有关的疾病,并且通常涉及球蛋白链表达降低。这可以经由基因调控区域中的突变或从球蛋白编码序列中的突变发生,该突变导致功能性球蛋白表达减少或水平降低。地中海贫血症的治疗通常涉及输血和铁螯合疗法。如果可以找到合适的捐赠者,则骨髓移植也可以用于治疗重度地中海贫血症的人,但这种方法可能具有重大风险。
已经提出用于治疗镰状细胞病(SCD)和β地中海贫血症的一种方法是增加γ球蛋白的表达,使得HbF在功能上取代异常的成人血红素。如上所述,用羟基脲治疗SCD患者由于其在增加γ球蛋白表达上的效果而被认为是部分成功的(DeSimone(1982)Proc Nat'lAcad Sci USA 79(14):4428-31;Ley等人(1982)N.Engl.J.Medicine,307:1469-1475;Ley等人(1983)Blood 62:370-380;Constantoulakis等人(1988)Blood 72(6):1961-1967,全部通过引用并入本文)。增加HbF的表达涉及鉴定其产物在γ球蛋白表达的调控中起作用的基因。一种这样的基因为BCL11A。BCL11A编码在成人红细胞样前体细胞中表达的锌指蛋白,且其表达的下调导致γ球蛋白表达增加(Sankaran等人(2008)Science 322:1839,通过引用并入本文)。已经提出使用靶向BCL11A基因的抑制性RNA(例如,美国专利公开号2011/0182867,通过引用并入本文),但该技术具有若干潜在的缺点,包含可能无法实现完全敲减,这种RNA的递送可能是有问题的,RNA必须连续存在并且终生需要多次治疗。
本发明的RGN可用于靶向BCL11A增强子区域,以破坏BCL11A的表达,从而增加γ球蛋白表达。这种靶向的破坏可通过非同源末端连接(NHEJ)来实现,由此本发明的RGN靶向BCL11A增强子区域内的特定序列、使双链断裂,且细胞的机制修复该断裂,通常同时引入有害突变。类似于针对其他疾病目标所描述的,本发明的RGN由于其相对小的尺寸,使得能够将RGN及其引导RNA的表达盒包装至单一AAV载体中以用于体内递送,从而具有优于其他已知RGN的优点。使用本发明的RGN的类似策略还可应用于人类和具有农艺或经济重要性的非人类动物中的类似疾病和病症。
X.包含多核苷酸基因修饰的细胞
本文提供了包含已使用如本文所描述的RGN、crRNA和/或tracrRNA介导的过程修饰的所关注的目标序列的细胞和生物体。在这些实施方案中的一些中,RGN包含SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579的氨基酸序列、或其活性变体或片段。在各种实施方案中,引导RNA包含CRISPR重复序列,该CRISPR重复序列包含SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118或124的核苷酸序列、或其活性变体或片段。在特定实施方案中,引导RNA包含tracrRNA,该tracrRNA包含SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125的核苷酸序列、或其活性变体或片段。该系统的引导RNA可为单引导RNA或双引导RNA。
经修饰的细胞可为真核的(例如,哺乳动物、植物、昆虫细胞)或原核的。还提供包含至少一种核苷酸序列的细胞器和胚胎,该核苷酸序列已通过利用如本文所描述的RGN、crRNA和/或tracrRNA的方法进行了修饰。经基因修饰的细胞、生物体、细胞器和胚胎对于经修饰的核苷酸序列可以是杂合的或纯合的。
该细胞、生物体、细胞器或胚胎的染色体修饰可导致表达改变(上调或下调)、失活、或改变的蛋白质产物或整合序列的表达。在其中染色体修饰导致基因失活或非功能性蛋白质产物表达的那些实施方案中,经基因修饰的细胞、生物体、细胞器或胚胎被称为“敲除”。敲除表型可为缺失突变(即,至少一个核苷酸的缺失)、插入突变(即,至少一个核苷酸的插入)、或无义突变(即,至少一个核苷酸的取代,使得引入终止密码子)的结果。
或者,细胞、生物体、细胞器或胚胎的染色体修饰可产生“敲入”,这是由编码蛋白质的核苷酸序列的染色体整合导致的。在这些实施方案中的一些中,编码序列被整合至该染色体中,使得编码野生型蛋白质的染色体序列失去活性,但表达出外源引入的蛋白。
在一些实施方案中,染色体修饰导致变体蛋白质产物的产生。表达的变体蛋白质产物可具有至少一个氨基酸取代和/或至少一个氨基酸的添加或缺失。当与野生型蛋白质比较时,由改变的染色体序列所编码的变体蛋白质产物可呈现出经修饰的特征或活性,包括但不限于改变的酶活性或底物特异性。
在又一些其他实施方案中,染色体修饰可导致改变的蛋白质表达模式。作为非限制性示例,控制蛋白质产物表达的调控区域中的染色体改变可导致蛋白质产物过度表达或下调或改变的组织或暂时表达模式。
已经被修饰的细胞可根据传统方式生长成生物体,例如,植物。参见,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。然后,可使这些植物生长,且用相同修饰株或不同株授粉,且所得杂交体具有基因修饰。本发明提供基因修饰种子。再生植物的子代、变体及突变体也包含在本发明的范围内,前提条件是这些部分包含基因修饰。进一步提供了保持了基因修饰的经加工的植物产物或副产物,例如,包含豆粕。
本文提供的方法可用于修饰任何植物物种,包括但不限于单子叶植物和双子叶植物。所关注的植物的示例包括但不限于玉米(玉蜀黍)、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦和油菜、甘蓝型油菜、苜蓿、黑麦、小米、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑橘、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、木瓜、腰果、澳洲胡桃、杏仁、燕麦、蔬菜、观赏植物以及针叶树。
蔬菜包括但不限于西红柿、莴苣、绿豆、青豆、豌豆、以及例如黄瓜、哈密瓜和洋香瓜的甜瓜属的成员。观赏植物包括但不限于杜鹃花、绣球花、芙蓉、玫瑰、郁金香、水仙、矮牵牛、康乃馨、圣诞红和菊花。优选地,本发明的植物为农作物(例如,玉米、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。
本文提供的方法还可用于基因修饰任何原核物种,包括但不限于:古生菌和细菌(例如,芽孢杆菌属物种、克雷伯菌属物种、链霉菌属物种、根瘤菌属物种、埃希氏菌属物种、假单胞菌属物种、沙门氏菌属物种、志贺氏杆菌属物种、弧菌属物种、耶尔森氏菌属物种、支原体属物种、农杆菌属物种、乳酸杆菌属物种)。
本文提供的方法可用于基因修饰任何真核物种或来自其的细胞,包括但不限于:动物(例如,哺乳动物、昆虫、鱼类、鸟类和爬行类)、真菌、变形虫、藻类和酵母。在一些实施方案中,由本发明公开的方法修饰的细胞包括造血源的细胞,例如,免疫系统的细胞,包括但不限于:B细胞、T细胞、自然杀伤(NK)细胞、多潜能干细胞、经诱导的多潜能干细胞、嵌合抗原受体T(CAR-T)细胞、单核细胞、巨噬细胞和树突状细胞。
已修饰的细胞可被引入生物体内。在自体细胞移植的情况中,这些细胞可源自同一个生物体(例如,人),其中该细胞以离体方法被修饰。或者,在异体细胞移植的情况中,该细胞源自相同物种中的另一生物体(例如,另一个人)。
冠词“一个(a)”和“一种(an)”在本文中用于指该冠词的一个或一个以上/一种或一种以上(即,至少一个/至少一种)的语法对象。作为示例,“多肽”意指一个或多个/一种或多种多肽。
说明书中提及的所有出版物和专利申请表示本公开内容所属领域中技术人员的层次。所有出版物和专利申请通过引用并入本文,如同每一个单独出版物或专利申请被具体且单独地指示通过引用而被并入本文。
虽然为了清楚理解的目的已经以说明和示例颇详细地描述了前述发明,但显然可在所附实施方案的范围内实施某些改变和修饰。
非限制性实施方案包括:
1.一种核酸分子,包含编码RNA引导的核酸酶(RGN)多肽的多核苷酸,其中所述多核苷酸包含编码RGN多肽的核苷酸序列,所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;
其中,当与能够与所述目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合目标DNA序列,以及
其中所述编码RGN多肽的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。
2.实施方案1的核酸分子,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
3.实施方案1的核酸分子,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
4.实施方案1的核酸分子,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
5.实施方案1-4中任一实施方案的核酸分子,其中所述RGN多肽能够在结合时切割所述目标DNA序列。
6.实施方案5的核酸分子,其中所述RGN多肽能够产生双链断裂。
7.实施方案5的核酸分子,其中所述RGN多肽能够产生单链断裂。
8.实施方案1-4中任一实施方案的核酸分子,其中所述RGN多肽为非活化的核酸酶或为切口酶。
9.实施方案1-8中任一实施方案的核酸分子,其中所述RGN多肽与碱基编辑多肽可操作地融合。
10.实施方案9的核酸分子,其中所述碱基编辑多肽为脱氨酶。
11.实施方案10的核酸分子,其中该脱氨酶为胞苷脱氨酶或腺嘌呤脱氨酶。
12.实施方案1-11中任一实施方案的核酸分子,其中所述RGN多肽包含一个或多个核定位信号。
13.实施方案1-12中任一实施方案的核酸分子,其中所述RGN多肽针对在真核细胞中的表达被密码子优化。
14.实施方案1-13中任一实施方案的核酸分子,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
15.一种包含实施方案1-14中任一实施方案的核酸分子的载体。
16.实施方案15的载体,进一步包含编码所述gRNA的至少一种核苷酸序列,所述gRNA能够与所述目标DNA序列杂交。
17.实施方案16的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
18.实施方案16的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
19.实施方案16的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
20.实施方案16-19中任一实施方案的载体,其中所述gRNA为单引导RNA。
21.实施方案16-19中任一实施方案的载体,其中所述gRNA为双引导RNA。
22.一种包含实施方案1-14中任一实施方案的核酸分子或实施方案15-21中任一实施方案的载体的细胞。
23.一种制备RGN多肽的方法,包括:在所述RGN多肽被表达的条件下,培养实施方案22的细胞。
24.一种制备RGN多肽的方法,包括将异源核酸分子引入细胞中,所述异源核酸分子包含编码RNA引导的核酸酶(RGN)多肽的核苷酸序列,所述RNA引导的核酸酶(RGN)多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;
其中当与能够与所述目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合目标DNA序列;
以及在所述RGN多肽被表达的条件下,培养所述细胞。
25.实施方案24的方法,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
26.实施方案24的方法,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
27.实施方案24的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
28.实施方案23-27中任一实施方案的方法,进一步包括纯化所述RGN多肽。
29.实施方案23-27中任一实施方案的方法,其中所述细胞进一步表达一个或多个引导RNA,所述一个或多个引导RNA能够与所述RGN多肽结合,以形成RGN核糖核蛋白复合物。
30.实施方案29的方法,进一步包括纯化所述RGN核糖核蛋白复合物。
31.一种分离的RNA引导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
其中当与能够与所述目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合DNA分子的所述目标DNA序列。
32.实施方案31的分离的RGN多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
33.实施方案31的分离的RGN多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
34.实施方案31的分离的RGN多肽,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ IDNO:63的405对应的氨基酸位置处的缬氨酸。
35.实施方案31-34中任一实施方案的分离的RGN多肽,其中所述RGN多肽能够在结合时切割所述目标DNA序列。
36.实施方案35的分离的RGN多肽,其中通过所述RGN多肽的切割产生双链断裂。
37.实施方案35的分离的RGN多肽,其中通过所述RGN多肽的切割产生单链断裂。
38.实施方案31-34中任一实施方案的分离的RGN多肽,其中所述RGN多肽为非活化的核酸酶或为切口酶。
39.实施方案31-38中任一实施方案的分离的RGN多肽,其中所述RGN多肽与碱基编辑多肽可操作地融合。
40.实施方案39的分离的RGN多肽,其中所述碱基编辑多肽为脱氨酶。
41.实施方案31-40中任一实施方案的分离的RGN多肽,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
42.实施方案31-41中任一实施方案的分离的RGN多肽,其中所述RGN多肽包含一个或多个核定位信号。
43.一种包含编码CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中所述crRNA包含间隔序列和CRISPR重复序列,其中所述CRISPR重复序列包含与SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118及124中任一个具有至少90%序列同一性的核苷酸序列;
其中引导RNA包含:
a)所述crRNA;以及
b)转录活化的CRISPR RNA(tracrRNA),所述转录活化的CRISPR RNA(tracrRNA)与所述crRNA的所述CRISPR重复序列杂交;
当所述引导RNA与RNA引导的核酸酶(RGN)多肽结合时,经由所述crRNA的间隔序列,能够以序列特异性方式与目标DNA序列杂交,以及
其中编码crRNA的所述多核苷酸被可操作地连接至与所述多核苷酸异源的启动子。
44.实施方案43的核酸分子,其中所述CRISPR重复序列包含与SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118和124中任一个具有至少95%序列同一性的核苷酸序列。
45.实施方案43的核酸分子,其中所述CRISPR重复序列包含与SEQ ID NO:2、9、16、23、30、37、44、51、57、64、71、77、84、90、97、104、111、118和124中任一个具有100%序列同一性的核苷酸序列。
46.一种包含实施方案43-45中任一实施方案的核酸分子的载体。
47.实施方案46的载体,其中所述载体进一步包含编码所述tracrRNA的多核苷酸。
48.实施方案47的载体,其中所述tracrRNA选自由下列各项组成的组:
a)与SEQ ID NO:3具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:2具有至少90%序列同一性;
b)与SEQ ID NO:10具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:9具有至少90%序列同一性;
c)与SEQ ID NO:17具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:16具有至少90%序列同一性;
d)与SEQ ID NO:24具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:23具有至少90%序列同一性;
e)与SEQ ID NO:31具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:30具有至少90%序列同一性;
f)与SEQ ID NO:38具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:37具有至少90%序列同一性;
g)与SEQ ID NO:45具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:44具有至少90%序列同一性;
h)与SEQ ID NO:52具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:51具有至少90%序列同一性;
i)与SEQ ID NO:58具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:57具有至少90%序列同一性;
j)与SEQ ID NO:65具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:64具有至少90%序列同一性;
k)与SEQ ID NO:72具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:71具有至少90%序列同一性;
l)与SEQ ID NO:78具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:77具有至少90%序列同一性;
m)与SEQ ID NO:85具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:84具有至少90%序列同一性;
n)与SEQ ID NO:91具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:90具有至少90%序列同一性;
o)与SEQ ID NO:98具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:97具有至少90%序列同一性;
p)与SEQ ID NO:105具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:104具有至少90%序列同一性;
q)与SEQ ID NO:112具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:111具有至少90%序列同一性;
r)与SEQ ID NO:119具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:118具有至少90%序列同一性;以及
s)与SEQ ID NO:125具有至少90%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:124具有至少90%序列同一性。
49.实施方案47的载体,其中所述tracrRNA选自由下列各项组成的组:
a)与SEQ ID NO:3具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:2具有至少95%序列同一性;
b)与SEQ ID NO:10具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:9具有至少95%序列同一性;
c)与SEQ ID NO:17具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:16具有至少95%序列同一性;
d)与SEQ ID NO:24具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:23具有至少95%序列同一性;
e)与SEQ ID NO:31具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:30具有至少95%序列同一性;
f)与SEQ ID NO:38具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:37具有至少95%序列同一性;
g)与SEQ ID NO:45具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:44具有至少95%序列同一性;
h)与SEQ ID NO:52具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:51具有至少95%序列同一性;
i)与SEQ ID NO:58具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:57具有至少95%序列同一性;
j)与SEQ ID NO:65具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:64具有至少95%序列同一性;
k)与SEQ ID NO:72具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:71具有至少95%序列同一性;
l)与SEQ ID NO:78具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:77具有至少95%序列同一性;
m)与SEQ ID NO:85具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:84具有至少95%序列同一性;
n)与SEQ ID NO:91具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:90具有至少95%序列同一性;
o)与SEQ ID NO:98具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:97具有至少95%序列同一性;
p)与SEQ ID NO:105具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:104具有至少95%序列同一性;
q)与SEQ ID NO:112具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:111具有至少95%序列同一性;
r)与SEQ ID NO:119具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:118具有至少95%序列同一性;以及
s)与SEQ ID NO:125具有至少95%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:124具有至少95%序列同一性。
50.实施方案47的载体,其中所述tracrRNA选自由下列各项组成的组:
a)与SEQ ID NO:3具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:2具有100%序列同一性;
b)与SEQ ID NO:10具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:9具有100%序列同一性;
c)与SEQ ID NO:17具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:16具有100%序列同一性;
d)与SEQ ID NO:24具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:23具有100%序列同一性;
e)与SEQ ID NO:31具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:30具有100%序列同一性;
f)与SEQ ID NO:38具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:37具有100%序列同一性;
g)与SEQ ID NO:45具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:44具有100%序列同一性;
h)与SEQ ID NO:52具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:51具有100%序列同一性;
i)与SEQ ID NO:58具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:57具有100%序列同一性;
j)与SEQ ID NO:65具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:64具有100%序列同一性;
k)与SEQ ID NO:72具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:71具有100%序列同一性;
l)与SEQ ID NO:78具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:77具有100%序列同一性;
m)与SEQ ID NO:85具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:84具有100%序列同一性;
n)与SEQ ID NO:91具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:90具有100%序列同一性;
o)与SEQ ID NO:98具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:97具有100%序列同一性;
p)与SEQ ID NO:105具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:104具有100%序列同一性;
q)与SEQ ID NO:112具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:111具有100%序列同一性;
r)与SEQ ID NO:119具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:118具有100%序列同一性;以及
s)与SEQ ID NO:125具有100%序列同一性的tracrRNA,其中所述CRISPR重复序列与SEQ ID NO:124具有100%序列同一性。
51.实施方案47-50中任一实施方案的载体,其中编码所述crRNA的所述多核苷酸和编码所述tracrRNA的所述多核苷酸可操作地连接至相同启动子,并且被编码为单引导RNA。
52.实施方案47-50中任一实施方案的载体,其中编码所述crRNA的所述多核苷酸以及编码所述tracrRNA的所述多核苷酸可操作地连接至单独的启动子。
53.实施方案46-52中任一实施方案的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸。
54.实施方案53的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:2具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有至少90%序列同一性;
b)与SEQ ID NO:8具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:9具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有至少90%序列同一性;
c)与SEQ ID NO:15具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:16具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有至少90%序列同一性;
d)与SEQ ID NO:22具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:23具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有至少90%序列同一性;
e)与SEQ ID NO:29具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:30具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有至少90%序列同一性;
f)与SEQ ID NO:36具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:37具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有至少90%序列同一性;
g)与SEQ ID NO:43具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:44具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有至少90%序列同一性;
h)与SEQ ID NO:50具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:51具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有至少90%序列同一性;
i)与SEQ ID NO:56具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:57具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有至少90%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:64具有至少90%序列同一性,并且所述tracrRNA与SEQID NO:65具有至少90%序列同一性;
k)与SEQ ID NO:70具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:71具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有至少90%序列同一性;
l)与SEQ ID NO:76具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:77具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
m)与SEQ ID NO:83具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有至少90%序列同一性;
n)与SEQ ID NO:89具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:90具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有至少90%序列同一性;
o)与SEQ ID NO:96具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:97具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有至少90%序列同一性;
p)与SEQ ID NO:103具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:104具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有至少90%序列同一性;
q)与SEQ ID NO:110具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:111具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有至少90%序列同一性;
r)与SEQ ID NO:117具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:118具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有至少90%序列同一性;
s)与SEQ ID NO:123具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:124具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有至少90%序列同一性;以及
t)与SEQ ID NO:83具有至少90%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少90%序列同一性。
55.实施方案53的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:2具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有至少95%序列同一性;
b)与SEQ ID NO:8具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:9具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有至少95%序列同一性;
c)与SEQ ID NO:15具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:16具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有至少95%序列同一性;
d)与SEQ ID NO:22具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:23具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有至少95%序列同一性;
e)与SEQ ID NO:29具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:30具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有至少95%序列同一性;
f)与SEQ ID NO:36具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:37具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有至少95%序列同一性;
g)与SEQ ID NO:43具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:44具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有至少95%序列同一性;
h)与SEQ ID NO:50具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:51具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有至少95%序列同一性;
i)与SEQ ID NO:56具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:57具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有至少95%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:64具有至少95%序列同一性,并且所述tracrRNA与SEQID NO:65具有至少95%序列同一性;
k)与SEQ ID NO:70具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:71具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有至少95%序列同一性;
l)与SEQ ID NO:76具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:77具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
m)与SEQ ID NO:83具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有至少95%序列同一性;
n)与SEQ ID NO:89具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:90具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有至少95%序列同一性;
o)与SEQ ID NO:96具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:97具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有至少95%序列同一性;
p)与SEQ ID NO:103具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:104具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有至少95%序列同一性;
q)与SEQ ID NO:110具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:111具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有至少95%序列同一性;
r)与SEQ ID NO:117具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:118具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有至少95%序列同一性;
s)与SEQ ID NO:123具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:124具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有至少95%序列同一性;以及
t)与SEQ ID NO:83具有至少95%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少95%序列同一性。
56.实施方案53的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:2具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有100%序列同一性;
b)与SEQ ID NO:8具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:9具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有100%序列同一性;
c)与SEQ ID NO:15具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:16具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有100%序列同一性;
d)与SEQ ID NO:22具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:23具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有100%序列同一性;
e)与SEQ ID NO:29具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:30具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有100%序列同一性;
f)与SEQ ID NO:36具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:37具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有100%序列同一性;
g)与SEQ ID NO:43具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:44具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有100%序列同一性;
h)与SEQ ID NO:50具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:51具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有100%序列同一性;
i)与SEQ ID NO:56具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:57具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有100%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:64具有100%序列同一性,并且所述tracrRNA与SEQ IDNO:65具有100%序列同一性;
k)与SEQ ID NO:70具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:71具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有100%序列同一性;
l)与SEQ ID NO:76具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:77具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有100%序列同一性;
m)与SEQ ID NO:83具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有100%序列同一性;
n)与SEQ ID NO:89具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:90具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有100%序列同一性;
o)与SEQ ID NO:96具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:97具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有100%序列同一性;
p)与SEQ ID NO:103具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:104具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有100%序列同一性;
q)与SEQ ID NO:110具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:111具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有100%序列同一性;
r)与SEQ ID NO:117具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:118具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有100%序列同一性;
s)与SEQ ID NO:123具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:124具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有100%序列同一性;以及
t)与SEQ ID NO:83具有100%序列同一性的RGN多肽,其中所述CRISPR重复序列与SEQ ID NO:84具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有100%序列同一性。
57.一种包含编码转录活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,所述转录活化的CRISPR RNA(tracrRNA)包含与SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有至少90%序列同一性的核苷酸序列;
其中引导RNA包含:
a)所述tracrRNA;以及
b)crRNA,所述crRNA包含间隔序列和CRISPR重复序列,其中所述tracrRNA与所述crRNA的所述CRISPR重复序列杂交;
当所述引导RNA与RNA引导的核酸酶(RGN)多肽结合时,经由所述crRNA的间隔序列,能够以序列特异性方式与目标DNA序列杂交,以及
其中编码tracrRNA的所述多核苷酸被可操作地连接至与所述多核苷酸异源的启动子。
58.实施方案57的核酸分子,其中所述tracrRNA包含与SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有至少95%序列同一性的核苷酸序列。
59.实施方案57的核酸分子,其中所述tracrRNA包含与SEQ ID NO:3、10、17、24、31、38、45、52、58、65、72、78、85、91、98、105、112、119或125具有100%序列同一性的核苷酸序列。
60.一种包含实施方案57-59中任一实施方案的核酸分子的载体。
61.实施方案60的载体,其中所述载体进一步包含编码所述crRNA的多核苷酸。
62.实施方案61的载体,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列选自由下列各项组成的组:
a)与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:3具有至少90%序列同一性;
b)与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:10具有至少90%序列同一性;
c)与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:17具有至少90%序列同一性;
d)与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:24具有至少90%序列同一性;
e)与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:31具有至少90%序列同一性;
f)与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:38具有至少90%序列同一性;
g)与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:45具有至少90%序列同一性;
h)与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:52具有至少90%序列同一性;
i)与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:58具有至少90%序列同一性;
j)与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:65具有至少90%序列同一性;
k)与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:72具有至少90%序列同一性;
l)与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
m)与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:85具有至少90%序列同一性;
n)与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:91具有至少90%序列同一性;
o)与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:98具有至少90%序列同一性;
p)与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:105具有至少90%序列同一性;
q)与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:112具有至少90%序列同一性;
r)与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:119具有至少90%序列同一性;以及
s)与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:125具有至少90%序列同一性。
63.实施方案61的载体,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列选自由下列各项组成的组:
a)与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:3具有至少95%序列同一性;
b)与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:10具有至少95%序列同一性;
c)与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:17具有至少95%序列同一性;
d)与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:24具有至少95%序列同一性;
e)与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:31具有至少95%序列同一性;
f)与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:38具有至少95%序列同一性;
g)与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:45具有至少95%序列同一性;
h)与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:52具有至少95%序列同一性;
i)与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:58具有至少95%序列同一性;
j)与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:65具有至少95%序列同一性;
k)与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:72具有至少95%序列同一性;
l)与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
m)与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:85具有至少95%序列同一性;
n)与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:91具有至少95%序列同一性;
o)与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:98具有至少95%序列同一性;
p)与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:105具有至少95%序列同一性;
q)与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:112具有至少95%序列同一性;
r)与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:119具有至少95%序列同一性;以及
s)与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:125具有至少95%序列同一性。
64.实施方案61的载体,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列选自由下列各项组成的组:
a)与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:3具有100%序列同一性;
b)与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:10具有100%序列同一性;
c)与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:17具有100%序列同一性;
d)与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:24具有100%序列同一性;
e)与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:31具有100%序列同一性;
f)与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:38具有100%序列同一性;
g)与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:45具有100%序列同一性;
h)与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:52具有100%序列同一性;
i)与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:58具有100%序列同一性;
j)与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:65具有100%序列同一性;
k)与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:72具有100%序列同一性;
l)与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:78具有100%序列同一性;
m)与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:85具有100%序列同一性;
n)与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:91具有100%序列同一性;
o)与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:98具有100%序列同一性;
p)与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:105具有100%序列同一性;
q)与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:112具有100%序列同一性;
r)与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:119具有100%序列同一性;以及
s)与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列,其中所述tracrRNA与SEQ ID NO:125具有100%序列同一性。
65.实施方案61-64中任一实施方案的载体,其中编码所述crRNA的所述多核苷酸和编码所述tracrRNA的所述多核苷酸可操作地连接至相同启动子,并且被编码为单引导RNA。
66.实施方案61-64中任一实施方案的载体,其中编码所述crRNA的所述多核苷酸和编码所述tracrRNA的所述多核苷酸可操作地连接至单独的启动子。
67.实施方案60-66中任一实施方案的载体,其中所述载体进一步包含编码所述RGN多肽的多核苷酸。
68.实施方案67的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:2具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有至少90%序列同一性;
b)与SEQ ID NO:8具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:9具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有至少90%序列同一性;
c)与SEQ ID NO:15具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:16具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有至少90%序列同一性;
d)与SEQ ID NO:22具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:23具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有至少90%序列同一性;
e)与SEQ ID NO:29具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:30具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有至少90%序列同一性;
f)与SEQ ID NO:36具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:37具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有至少90%序列同一性;
g)与SEQ ID NO:43具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:44具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有至少90%序列同一性;
h)与SEQ ID NO:50具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:51具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有至少90%序列同一性;
i)与SEQ ID NO:56具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:57具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有至少90%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:64具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:65具有至少90%序列同一性;
k)与SEQ ID NO:70具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:71具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有至少90%序列同一性;
l)与SEQ ID NO:76具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:77具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
m)与SEQ ID NO:83具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有至少90%序列同一性;
n)与SEQ ID NO:89具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:90具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有至少90%序列同一性;
o)与SEQ ID NO:96具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:97具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有至少90%序列同一性;
p)与SEQ ID NO:103具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:104具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有至少90%序列同一性;
q)与SEQ ID NO:110具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:111具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有至少90%序列同一性;
r)与SEQ ID NO:117具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:118具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有至少90%序列同一性;
s)与SEQ ID NO:123具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:124具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有至少90%序列同一性;以及
t)与SEQ ID NO:83具有至少90%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有至少90%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少90%序列同一性。
69.实施方案67的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:2具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有至少95%序列同一性;
b)与SEQ ID NO:8具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:9具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有至少95%序列同一性;
c)与SEQ ID NO:15具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:16具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有至少95%序列同一性;
d)与SEQ ID NO:22具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:23具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有至少95%序列同一性;
e)与SEQ ID NO:29具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:30具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有至少95%序列同一性;
f)与SEQ ID NO:36具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:37具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有至少95%序列同一性;
g)与SEQ ID NO:43具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:44具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有至少95%序列同一性;
h)与SEQ ID NO:50具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:51具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有至少95%序列同一性;
i)与SEQ ID NO:56具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:57具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有至少95%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:64具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:65具有至少95%序列同一性;
k)与SEQ ID NO:70具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:71具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有至少95%序列同一性;
l)与SEQ ID NO:76具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:77具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
m)与SEQ ID NO:83具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有至少95%序列同一性;
n)与SEQ ID NO:89具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:90具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有至少95%序列同一性;
o)与SEQ ID NO:96具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:97具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有至少95%序列同一性;
p)与SEQ ID NO:103具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:104具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有至少95%序列同一性;
q)与SEQ ID NO:110具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:111具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有至少95%序列同一性;
r)与SEQ ID NO:117具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:118具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有至少95%序列同一性;
s)与SEQ ID NO:123具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:124具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有至少95%序列同一性;以及
t)与SEQ ID NO:83具有至少95%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有至少95%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有至少95%序列同一性。
70.实施方案67的载体,其中所述RGN多肽选自由下列各项组成的组:
a)与SEQ ID NO:1具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:2具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:3具有100%序列同一性;
b)与SEQ ID NO:8具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:9具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:10具有100%序列同一性;
c)与SEQ ID NO:15具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:16具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:17具有100%序列同一性;
d)与SEQ ID NO:22具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:23具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:24具有100%序列同一性;
e)与SEQ ID NO:29具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:30具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:31具有100%序列同一性;
f)与SEQ ID NO:36具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:37具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:38具有100%序列同一性;
g)与SEQ ID NO:43具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:44具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:45具有100%序列同一性;
h)与SEQ ID NO:50具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:51具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:52具有100%序列同一性;
i)与SEQ ID NO:56具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:57具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:58具有100%序列同一性;
j)与SEQ ID NO:63和570-579中任一项具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:64具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:65具有100%序列同一性;
k)与SEQ ID NO:70具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:71具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:72具有100%序列同一性;
l)与SEQ ID NO:76具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:77具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有100%序列同一性;
m)与SEQ ID NO:83具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:85具有100%序列同一性;
n)与SEQ ID NO:89具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:90具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:91具有100%序列同一性;
o)与SEQ ID NO:96具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:97具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:98具有100%序列同一性;
p)与SEQ ID NO:103具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:104具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:105具有100%序列同一性;
q)与SEQ ID NO:110具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:111具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:112具有100%序列同一性;
r)与SEQ ID NO:117具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:118具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:119具有100%序列同一性;
s)与SEQ ID NO:123具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:124具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:125具有100%序列同一性;以及
t)与SEQ ID NO:83具有100%序列同一性的RGN多肽,其中所述crRNA包含CRISPR重复序列,所述CRISPR重复序列与SEQ ID NO:84具有100%序列同一性,并且所述tracrRNA与SEQ ID NO:78具有100%序列同一性。
71.一种用于结合DNA分子的目标DNA序列的系统,所述系统包括:
a)能够与所述目标DNA序列杂交的一个或多个引导RNA、或包含编码所述一个或多个引导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列的RNA引导的核酸酶(RGN)多肽、或包含编码所述RGN多肽的核苷酸序列的多核苷酸;
其中编码所述RGN多肽的所述核苷酸序列以及编码所述一个或多个引导RNA的所述核苷酸序列中的至少一个可操作地连接至与所述核苷酸序列异源的启动子;
其中所述一个或多个引导RNA能够与所述目标DNA序列杂交,以及
其中所述一个或多个引导RNA能够与所述RGN多肽形成复合物,以便引导所述RGN多肽与所述DNA分子的所述目标DNA序列结合。
72.一种用于结合DNA分子的目标DNA序列的系统,所述系统包括:
a)能够与所述目标DNA序列杂交的一个或多个引导RNA、或包含编码所述一个或多个引导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列的RNA引导的核酸酶(RGN)多肽;
其中所述一个或多个引导RNA能够与所述目标DNA序列杂交,以及
其中所述一个或多个引导RNA能够与所述RGN多肽形成复合物,以便引导所述RGN多肽与所述DNA分子的所述目标DNA序列结合。
73.实施方案71或72的系统,其中编码所述一个或多个引导RNA的至少一个所述核苷酸序列可操作地连接至与所述核苷酸序列异源的启动子。
74.实施方案71-73中任一实施方案的系统,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
75.实施方案71-73中任一实施方案的系统,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
76.实施方案71-73中任一实施方案的系统,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
77.实施方案71-76中任一实施方案的系统,其中未发现所述RGN多肽与所述一个或多个引导RNA在本质上彼此复合。
78.实施方案71-77中任一实施方案的系统,其中所述目标DNA序列为真核目标DNA序列。
79.实施方案71-78中任一实施方案的系统,其中所述gRNA为单引导RNA(sgRNA)。
80.实施方案71-78中任一实施方案的系统,其中所述gRNA为双引导RNA。
81.实施方案71-80中任一实施方案的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
82.实施方案71-80中任一实施方案的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
83.实施方案71-80中任一实施方案的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
84.实施方案71-83中任一实施方案的系统,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
85.实施方案71-84中任一实施方案的系统,其中所述目标DNA序列在细胞内。
86.实施方案85的系统,其中所述细胞为真核细胞。
87.实施方案86的系统,其中所述真核细胞为植物细胞。
88.实施方案86的系统,其中所述真核细胞为哺乳动物细胞。
89.实施方案88的系统,其中所述哺乳动物细胞为人类细胞。
90.实施方案89的系统,其中所述人类细胞为免疫细胞。
91.实施方案90的系统,其中所述免疫细胞为干细胞。
92.实施方案91的系统,其中所述干细胞为经诱导的多潜能干细胞。
93.实施方案86的系统,其中所述真核细胞为昆虫细胞。
94.实施方案85的系统,其中所述细胞为原核细胞。
95.实施方案71-94中任一实施方案的系统,其中,当被转录时,所述一个或多个引导RNA能够与所述目标DNA序列杂交,并且所述引导RNA能够与所述RGN多肽形成复合物,以导向至所述目标DNA序列的切割。
96.实施方案95的系统,其中所述切割产生双链断裂。
97.实施方案95的系统,其中所述切割产生单链断裂。
98.实施方案71-94中任一实施方案的系统,其中所述RGN多肽为非活化的核酸酶或为切口酶。
99.实施方案71-98中任一实施方案的系统,其中所述RGN多肽可操作地连接至碱基编辑多肽。
100.实施方案99的系统,其中所述碱基编辑多肽为脱氨酶。
101.实施方案100的系统,其中该脱氨酶为胞苷脱氨酶或腺嘌呤脱氨酶。
102.实施方案71-101中任一实施方案的系统,其中所述RGN多肽包含一个或多个核定位信号。
103.实施方案71-102中任一实施方案的系统,其中所述RGN多肽针对在真核细胞中的表达被密码子优化。
104.实施方案71-103中任一实施方案的系统,其中编码一个或多个引导RNA的核苷酸序列及编码RGN多肽的核苷酸序列被定位于一个载体上。
105.实施方案71-104中任一实施方案的系统,其中所述系统进一步包括一个或多个供体多核苷酸或编码所述一个或多个供体多核苷酸的一个或多个核苷酸序列。
106.一种药物组合物,包含实施方案1-14、43-45和57-59中任一实施方案的核酸分子、实施方案15-21、46-56和60-70中任一实施方案的载体、实施方案22的细胞、实施方案31-42中任一实施方案的分离的RGN多肽、或实施方案71-105中任一实施方案的系统、以及药学上可接受的载体。
107.一种用于结合DNA分子的目标DNA序列的方法,包括将根据实施方案71-105中任一实施方案的系统递送至所述目标DNA序列或包含所述目标DNA序列的细胞。
108.实施方案107的方法,其中所述RGN多肽或所述引导RNA进一步包含可检测标记,从而允许用于所述目标DNA序列的检测。
109.实施方案107的方法,其中所述引导RNA或所述RGN多肽进一步包含表达调节子,从而调节所述目标DNA序列的表达或由所述目标DNA序列的转录控制下的基因的表达。
110.一种用于切割或修饰DNA分子的目标DNA序列的方法,包括将根据实施方案71-105中任一实施方案的系统递送至所述目标DNA序列或包含所述DNA分子的细胞,并且发生所述目标DNA序列的切割或修饰。
111.实施方案110的方法,其中所述经修饰的目标DNA序列包含异源DNA插入至所述目标DNA序列。
112.实施方案110的方法,其中所述经修饰的目标DNA序列包含从所述目标DNA序列缺失至少一个核苷酸。
113.实施方案110的方法,其中所述经修饰的目标DNA序列包含所述目标DNA序列中的至少一个核苷酸的突变。
114.一种用于结合DNA分子的目标DNA序列的方法,包括:
a)在适合形成RGN核糖核苷酸复合物的条件下,通过组合以下,以在体外组装RNA引导的核酸酶(RGN)核糖核苷酸复合物:
i)能够与所述目标DNA序列杂交的一个或多个引导RNA;以及
ii)RGN多肽,所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
b)使所述目标DNA序列或包含所述目标DNA序列的细胞与在体外组装的RGN核糖核苷酸复合物接触;
其中所述一个或多个引导RNA与所述目标DNA序列杂交,从而将所述RGN多肽导向至与所述目标DNA序列结合。
115.实施方案114的方法,其中所述RGN多肽或所述引导RNA进一步包含可检测标记,从而允许用于所述目标DNA序列的检测。
116.实施方案114的方法,其中所述引导RNA或所述RGN多肽进一步包含表达调节子,从而允许对所述目标DNA序列的表达的调节。
117.一种用于切割和/或修饰DNA分子的目标DNA序列的方法,包括使所述DNA分子与以下接触:
a)RNA引导的核酸酶(RGN)多肽,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
b)能够将(a)的RGN靶向所述目标DNA序列的一个或多个引导RNA;
其中所述一个或多个引导RNA与所述目标DNA序列杂交,从而将所述RGN多肽导向至与所述目标DNA序列结合,并且发生所述目标DNA序列的切割和/或修饰。
118.实施方案117的方法,其中通过所述RGN多肽的切割产生双链断裂。
119.实施方案117的方法,其中通过所述RGN多肽的切割产生单链断裂。
120.实施方案117的方法,其中所述RGN多肽为非活化的核酸酶或为切口酶,并且与碱基编辑多肽可操作地融合。
121.实施方案120的方法,其中所述碱基编辑多肽为脱氨酶。
122.实施方案121的方法,其中所述脱氨酶为胞苷脱氨酶或腺嘌呤脱氨酶。
123.实施方案117的方法,其中所述经修饰的目标DNA序列包含异源DNA插入至所述目标DNA序列。
124.实施方案117的方法,其中所述经修饰的目标DNA序列包含从所述目标DNA序列缺失至少一个核苷酸。
125.实施方案117的方法,其中所述经修饰的目标DNA序列包含所述目标DNA序列中的至少一个核苷酸的突变。
126.实施方案114-125中任一实施方案的方法,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
127.实施方案114-126中任一实施方案的方法,其中所述目标DNA序列为真核目标DNA序列。
128.实施方案114-127中任一实施方案的方法,其中所述gRNA为单引导RNA(sgRNA)。
129.实施方案114-127中任一实施方案的方法,其中所述gRNA为双引导RNA。
130.实施方案114-129中任一实施方案的方法,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
131.实施方案114-129中任一实施方案的方法,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
132.实施方案114-129中任一实施方案的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
133.实施方案114-129中任一实施方案的方法,其中:
a)所述RGN与SEQ ID NO:1具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:2具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:3具有至少90%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:9具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:10具有至少90%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:16具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:17具有至少90%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:23具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:24具有至少90%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:30具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:31具有至少90%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:37具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:38具有至少90%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:44具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:45具有至少90%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:51具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:52具有至少90%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:57具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:58具有至少90%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:64具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:65具有至少90%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:71具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:72具有至少90%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:77具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:78具有至少90%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:84具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:85具有至少90%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:90具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:91具有至少90%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:97具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:98具有至少90%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有至少90%序列同一性,所述引导RNA包含与SEQID NO:104具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:105具有至少90%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有至少90%序列同一性,所述引导RNA包含与SEQID NO:111具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:112具有至少90%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有至少90%序列同一性,所述引导RNA包含与SEQID NO:118具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:119具有至少90%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有至少90%序列同一性,所述引导RNA包含与SEQID NO:124具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:125具有至少90%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:84具有至少90%序列同一性的crRNA重复序列和与SEQ ID NO:78具有至少90%序列同一性的tracrRNA。
134.实施方案114-129中任一实施方案的方法,其中:
a)所述RGN与SEQ ID NO:1具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:2具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:3具有至少95%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:9具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:10具有至少95%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:16具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:17具有至少95%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:23具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:24具有至少95%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:30具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:31具有至少95%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:37具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:38具有至少95%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:44具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:45具有至少95%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:51具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:52具有至少95%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:57具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:58具有至少95%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:64具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:65具有至少95%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:71具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:72具有至少95%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:77具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:78具有至少95%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:84具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:85具有至少95%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:90具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:91具有至少95%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:97具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:98具有至少95%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有至少95%序列同一性,所述引导RNA包含与SEQID NO:104具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:105具有至少95%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有至少95%序列同一性,所述引导RNA包含与SEQID NO:111具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:112具有至少95%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有至少95%序列同一性,所述引导RNA包含与SEQID NO:118具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:119具有至少95%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有至少95%序列同一性,所述引导RNA包含与SEQID NO:124具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:125具有至少95%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:84具有至少95%序列同一性的crRNA重复序列和与SEQ ID NO:78具有至少95%序列同一性的tracrRNA。
135.实施方案114-129中任一实施方案的方法,其中:
a)所述RGN与SEQ ID NO:1具有100%序列同一性,所述引导RNA包含与SEQ ID NO:2具有100%序列同一性的crRNA重复序列和与SEQ ID NO:3具有100%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有100%序列同一性,所述引导RNA包含与SEQ ID NO:9具有100%序列同一性的crRNA重复序列和与SEQ ID NO:10具有100%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有100%序列同一性,所述引导RNA包含与SEQ IDNO:16具有100%序列同一性的crRNA重复序列和与SEQ ID NO:17具有100%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有100%序列同一性,所述引导RNA包含与SEQ IDNO:23具有100%序列同一性的crRNA重复序列和与SEQ ID NO:24具有100%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有100%序列同一性,所述引导RNA包含与SEQ IDNO:30具有100%序列同一性的crRNA重复序列和与SEQ ID NO:31具有100%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有100%序列同一性,所述引导RNA包含与SEQ IDNO:37具有100%序列同一性的crRNA重复序列和与SEQ ID NO:38具有100%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有100%序列同一性,所述引导RNA包含与SEQ IDNO:44具有100%序列同一性的crRNA重复序列和与SEQ ID NO:45具有100%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有100%序列同一性,所述引导RNA包含与SEQ IDNO:51具有100%序列同一性的crRNA重复序列和与SEQ ID NO:52具有100%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有100%序列同一性,所述引导RNA包含与SEQ IDNO:57具有100%序列同一性的crRNA重复序列和与SEQ ID NO:58具有100%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有100%序列同一性,所述引导RNA包含与SEQ ID NO:64具有100%序列同一性的crRNA重复序列和与SEQ ID NO:65具有100%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有100%序列同一性,所述引导RNA包含与SEQ IDNO:71具有100%序列同一性的crRNA重复序列和与SEQ ID NO:72具有100%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有100%序列同一性,所述引导RNA包含与SEQ IDNO:77具有100%序列同一性的crRNA重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有100%序列同一性,所述引导RNA包含与SEQ IDNO:84具有100%序列同一性的crRNA重复序列和与SEQ ID NO:85具有100%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有100%序列同一性,所述引导RNA包含与SEQ IDNO:90具有100%序列同一性的crRNA重复序列和与SEQ ID NO:91具有100%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有100%序列同一性,所述引导RNA包含与SEQ IDNO:97具有100%序列同一性的crRNA重复序列和与SEQ ID NO:98具有100%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有100%序列同一性,所述引导RNA包含与SEQ IDNO:104具有100%序列同一性的crRNA重复序列和与SEQ ID NO:105具有100%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有100%序列同一性,所述引导RNA包含与SEQ IDNO:111具有100%序列同一性的crRNA重复序列和与SEQ ID NO:112具有100%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有100%序列同一性,所述引导RNA包含与SEQ IDNO:118具有100%序列同一性的crRNA重复序列和与SEQ ID NO:119具有100%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有100%序列同一性,所述引导RNA包含与SEQ IDNO:124具有100%序列同一性的crRNA重复序列和与SEQ ID NO:125具有100%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有100%序列同一性,所述引导RNA包含与SEQ IDNO:84具有100%序列同一性的crRNA重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA。
136.实施方案107-135中任一实施方案的方法,其中所述目标DNA序列在细胞内。
137.实施方案136的方法,其中所述细胞为真核细胞。
138.实施方案137的方法,其中所述真核细胞为植物细胞。
139.实施方案137的方法,其中所述真核细胞为哺乳动物细胞。
140.实施方案139的方法,其中所述哺乳动物细胞为人类细胞。
141.实施方案140的方法,其中所述人类细胞为免疫细胞。
142.实施方案141的方法,其中所述免疫细胞为干细胞。
143.实施方案142的方法,其中所述干细胞为经诱导的多潜能干细胞。
144.实施方案137的方法,其中所述真核细胞为昆虫细胞。
145.实施方案136的方法,其中所述细胞为原核细胞。
146.实施方案136-145中任一实施方案的方法,进一步包括:在所述RGN多肽被表达并且切割所述目标DNA序列以产生包含经修饰的DNA序列的DNA分子的条件下,培养所述细胞;以及选择包含所述经修饰的目标DNA序列的细胞。
147.一种包含根据实施方案146的方法的经修饰的目标DNA序列的细胞。
148.实施方案147的细胞,其中所述细胞为真核细胞。
149.实施方案148的细胞,其中所述真核细胞为植物细胞。
150.一种包含实施方案149的细胞的植物。
151.一种包含实施方案149的细胞的种子。
152.实施方案148的细胞,其中所述真核细胞为哺乳动物细胞。
153.实施方案152的细胞,其中所述哺乳动物细胞为人类细胞。
154.实施方案153的细胞,其中所述人类细胞为免疫细胞。
155.实施方案154的细胞,其中所述免疫细胞为干细胞。
156.实施方案155的细胞,其中所述干细胞为经诱导的多潜能干细胞。
157.实施方案148的细胞,其中所述真核细胞为昆虫细胞。
158.实施方案147的细胞,其中所述细胞为原核细胞。
159.一种包含实施方案148和152-156中任一实施方案的细胞以及药学上可接受的载体的药物组合物。
160.一种用于利用针对遗传性疾病的因果突变(causal mutation)的校正来产生基因修饰细胞的方法,所述方法包括将以下引入所述细胞内:
a)RNA引导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列同一性的氨基酸序列;或编码所述RGN多肽的多核苷酸,其中编码所述RGN多肽的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述RGN多肽的表达;以及
b)引导RNA(gRNA)或编码所述gRNA的多核苷酸,其中编码所述gRNA的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述gRNA的表达,
由此,所述RGN和gRNA靶向所述因果突变的基因组位置并且修饰所述基因组序列以移除所述因果突变。
161.实施方案160的方法,其中所述RGN为非活化的核酸酶或为切口酶,并且与具有碱基编辑活性的多肽融合。
162.实施方案161的方法,其中所述碱基编辑多肽为脱氨酶。
163.实施方案162的方法,其中具有碱基编辑活性的多肽为胞苷脱氨酶或腺嘌呤脱氨酶。
164.实施方案160-163中任一实施方案的方法,其中所述遗传性疾病是由单核苷酸多态性引起的。
165.实施方案160-163中任一实施方案的方法,其中所述遗传性疾病为赫尔勒综合征。
166.实施方案160-163中任一实施方案的方法,其中所述gRNA进一步包含靶向靠近所述因果单核苷酸多态性的区域的间隔序列。
167.一种用于利用引起疾病的不稳定基因组区域中的缺失来产生基因修饰细胞的方法,所述方法包括将以下引入所述细胞内:
a)RNA引导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列同一性的氨基酸序列;或编码所述RGN多肽的多核苷酸,其中编码所述RGN多肽的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述RGN多肽的表达;以及
b)第一引导RNA(gRNA)或编码所述gRNA的多核苷酸,其中编码所述gRNA的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述gRNA的表达,并且进一步地其中所述gRNA包含靶向所述不稳定基因组区域的5'侧翼的间隔序列;以及
c)第二引导RNA(gRNA)或编码所述gRNA的多核苷酸,其中编码所述gRNA的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述gRNA的表达,并且进一步地其中所述第二gRNA包含靶向所述不稳定基因组区域的3'侧翼的间隔序列;
由此,所述RGN和两个gRNA靶向所述不稳定基因组区域,并且所述不稳定基因组区域的至少一部分被移除。
168.实施方案167的方法,其中所述遗传性疾病为弗里德赖希共济失调或亨廷顿病。
169.实施方案167的方法,其中所述第一gRNA进一步包含靶向所述不稳定基因组区域内的或靠近所述不稳定基因组区域的区域的间隔序列。
170.实施方案169的方法,其中所述第二gRNA进一步包含靶向所述不稳定基因组区域内的或靠近所述不稳定基因组区域的区域的间隔序列。
171.实施方案160-170中任一实施方案的方法,其中所述RGN多肽与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一项具有至少95%序列同一性。
172.实施方案160-170中任一实施方案的方法,其中所述RGN多肽与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一项具有100%序列同一性。
173.实施方案160-170中任一实施方案的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
174.实施方案160-170中任一实施方案的方法,其中所述gRNA、所述第一gRNA、所述第二gRNA、或所述第一gRNA和所述第二gRNA从选自由下列各项组成的组的gRNA选出:
a)包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
175.实施方案160-170中任一实施方案的方法,其中所述gRNA、所述第一gRNA、所述第二gRNA、或所述第一gRNA和所述第二gRNA从选自由下列各项组成的组的gRNA选出:
a)包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
176.实施方案160-170中任一实施方案的方法,其中所述gRNA、所述第一gRNA、所述第二gRNA、或所述第一gRNA和所述第二gRNA从选自由下列各项组成的组的gRNA选出:
a)包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
177.实施方案160-176中任一实施方案的方法,其中所述细胞为动物细胞。
178.实施方案177的方法,其中所述动物细胞为哺乳动物细胞。
179.实施方案177的方法,其中所述细胞为从狗、猫、小鼠、大鼠、兔、马、牛、猪或人取得的。
180.一种用于产生具有降低的BCL11A mRNA和蛋白质表达的基因修饰的哺乳动物造血前体细胞的方法,所述方法包括将以下引入分离的人造血前体细胞内:
a)RNA引导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579具有至少90%序列同一性的氨基酸序列;或编码所述RGN多肽的多核苷酸,其中编码所述RGN多肽的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述RGN多肽的表达;以及
b)引导RNA(gRNA)或编码所述gRNA的多核苷酸,其中编码所述gRNA的所述多核苷酸可操作地连接至启动子,以使得在所述细胞中所述gRNA的表达,
由此,所述RGN和gRNA在细胞中表达,并且在BCL11A增强子区域处切割,导致所述人造血前体细胞的基因修饰并且降低BCL11A的mRNA和/或蛋白质表达。
181.实施方案180的方法,其中所述RGN多肽与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一项具有至少95%序列同一性。
182.实施方案180的方法,其中所述RGN多肽与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123或570-579中任一项具有100%序列同一性。
183.实施方案180的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
184.实施方案180的方法,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
185.实施方案180的方法,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:3具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:10具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:17具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:24具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:31具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:38具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:45具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:52具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:58具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:65具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:72具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:85具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:91具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:98具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ IDNO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
186.实施方案180的方法,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:105具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:112具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:119具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列和与SEQ IDNO:125具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽具有与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
187.实施方案180-186中任一实施方案的方法,其中所述gRNA进一步包含靶向在所述BCL11A增强子区域内的或靠近所述BCL11A增强子区域的区域的间隔序列。
188.一种治疗疾病的方法,所述方法包括向有需要的受试者施用有效量的实施方案106或159的药物组合物。
189.实施方案188的方法,其中所述疾病与因果突变关联,并且有效量的所述药物组合物校正所述因果突变。
190.实施方案1-14、43-45和57-59中任一实施方案的核酸分子、实施方案15-21、46-56和60-70中任一实施方案的载体、实施方案22、147、148和152-156中任一实施方案的细胞、实施方案31-42中任一实施方案的分离的RGN多肽、或实施方案71-105中任一实施方案的系统用于治疗受试者的疾病的用途。
191.实施方案190的用途,其中所述疾病与因果突变关联,并且所述治疗包括校正所述因果突变。
192.实施方案1-14、43-45和57-59中任一实施方案的核酸分子、实施方案15-21、46-56和60-70中任一实施方案的载体、实施方案22、147、148和152-156中任一实施方案的细胞、实施方案31-42中任一实施方案的分离的RGN多肽、或实施方案71-105中任一实施方案的系统在制备用于治疗疾病的药物中的用途。
193.实施方案192的用途,其中所述疾病与因果突变关联,并且有效量的所述药物校正所述因果突变。
提供以下实施例仅作为说明而非限制性的。
实施例
实施例1.RNA引导的核酸酶的鉴定
鉴定出19种不同的CRISPR关联的RNA引导的核酸酶(RGN)并描述于下表1中。表1提供每一个RGN的名称、其氨基酸序列、其取得来源、及经处理的crRNA和tracrRNA序列(对于鉴定方法参见实施例2)。表1还提供通用单引导RNA(sgRNA)序列,其中poly-N指出确定sgRNA的核酸目标序列的间隔序列的位置。对于RGN系统APG06622、APG02787和APG06248,tracrRNA的发夹茎的碱基中的保守序列为UNANNA(SEQ ID NO:129)。对于APG06007、APG09344和APG07991,相同位置中的序列为UNANNU(SEQ ID NO:130)。对于APG02874、APG03850和APG07553,相同位置中的序列为UNANNG(SEQ ID NO:131)。对于RGN系统APG03031、APG09208、APG05586、APG08770、APG03021、APG06015、APG01868和APG02998,tracrRNA的发夹茎的碱基中的保守序列为UNANNC(SEQ ID NO:132)。对于APG08167和APG01604,相同位置中的序列为CNANNC(SEQ ID NO:133)。
表1:SEQ ID和CRISPR关联系统的汇总
Figure BDA0004012237450001461
Figure BDA0004012237450001471
实施例2:引导RNA鉴定和sgRNA构建
使天然表达了调查中的RNA引导的核酸酶系统的细菌培养物生长至对数中期(~0.600的OD600)、沉淀并快速冷冻。使用mirVANA miRNA分离试剂盒(Life Technologies,Carlsbad,CA)从沉淀物中分离RNA,并使用NEBNext Small RNA Library Prep试剂盒(NEB,Beverly,MA)从分离的RNA制备测序文库。将文库制备物在6%聚丙烯酰胺凝胶上分划,以捕获小于200nt的RNA物种,以分别检测crRNA和tracrRNA。在服务提供商(MoGene,St.Louis,MO)在Next Seq 500(高输出试剂盒)上进行深度测序(75bp配对末端)。使用Cutadapt对读数进行质量修整、并使用Bowtie2将读数映射到参考基因组。用python编写定制RNAseq管线来检测crRNA和tracrRNA转录物。通过天然重复间隔阵列的序列覆盖来确定经处理的crRNA边界。使用容许的BLASTn参数鉴定tracrRNA的抗重复部分。通过鉴定含有抗重复的转录物,RNA测序深度确认经处理的tracrRNA的边界。使用NUPACK(RNA折叠软件)进行的二级结构预测来进行RNA的手动整理。sgRNA盒是通过DNA合成而制备的,且通常如下设计(5'->3'):20-30bp间隔序列,在其3’端可操作地连接至crRNA的经处理的重复部分、可操作地连接至4bp非互补接头(AAAG;SEQ ID NO:249)、在其3’端可操作地连接至经处理的tracrRNA。也可以使用其他4bp非互补接头。
对于体外测定,通过用GeneArtTM精确gRNA合成试剂盒(GeneArtTM PrecisiongRNA Synthesis Kit)(ThermoFisher)的sgRNA盒的体外转录来合成sgRNA。RGN多肽的每一个的经处理的crRNA和tracrRNA序列被辨别且被列于表1中。关于对PAM文库1和2构建的sgRNA,见下面。
实施例3:每一个RGN的PAM要求的确定
使用基本上改编自Kleinstiver等人(2015)Nature 523:481-485和Zetsche等人(2015)Cell 163:759-771的PAM缺乏测定法,确定每一个RGN的PAM要求。简言之,在pUC18(ampR)中产生两个质粒文库(L1和L2),而且每一个质粒文库都含有侧翼为8个随机核苷酸(即,PAM区域)的不同的30bp前间隔序列(目标)序列。每一个RGN的文库1和文库2的目标序列以及侧翼PAM区域列于表2中。
将文库分别电穿孔至带有pRSF-1b表达载体的大肠杆菌BL21(DE3)细胞中,该载体含有本发明的RGN的pRSF-1b表达载体(针对于大肠杆菌而被密码子优化)以及含有对应于L1或L2文库中的前间隔序列的间隔序列的同源sgRNA。将足够的文库质粒用于转化反应中,以获得>106CFU。pRSF-1b骨架中的RGN和sgRNA二者都在T7启动子的控制下。使转化反应物恢复1小时,然后将其稀释到含有羧苄青霉素和卡那霉素的LB培养基中并生长过夜。第二天,将混合物稀释到自诱导过夜ExpressTM实时TB培养基(Overnight ExpressTM InstantTB Medium)(Millipore Sigma)中,以允许RGN和sgRNA的表达,并另外生长4小时或20小时,然后离心分离细胞,并用Mini-prep试剂盒(Qiagen,Germantown,MD)分离质粒DNA。在适当的sgRNA存在下,含有可以被RGN识别的PAM的质粒将被切割,导致其从群体中移出。含有RGN无法识别的或被转化为不含有适当的sgRNA的细菌的PAM的质粒将存活并复制。按照公开的实验方案(16s-metagenomic library prep guide 15044223B,Illumina,San Diego,CA),PCR扩增并制备未切割质粒的PAM和前间隔区域以进行测序。在服务提供商(MoGene,St.Louis,MO)的MiSeq(Illumina)上进行深度测序(75bp单末端读数)。通常,获得每扩增子1-4M读数。对于每一个样品,PAM区域被取出、计数且被标准化至总读数。当与对照组相比时(即,将文库转化至含有RGN但缺少适合的sgRNA的大肠杆菌中时),导致质粒切割的PAM被鉴定为代表性不足。为呈现新型RGN的PAM要求,利用以2为底的负对数转换,将所涉及的区域中的全部序列的缺乏率(样品中的频率/对照组中的频率)转换为富集值。足够的PAM被定义为富集值>2.3的PAM(对应于缺乏率<~0.2)。两个文库中大于此临界值的PAM被收集且被用于产生网站标志(web logo),例如,在因特网上使用被称为”网站标志”的基于网络的服务,可产生网站标志。当最富含PAM中存在一致的模式时,PAM序列被鉴定和报告。每一个RGN的共有PAM(具有富集因子(EF)>2.3)被提供于表2中。PAM方向也在表2中指出。
表2:PAM或PAM样确定
Figure BDA0004012237450001491
Figure BDA0004012237450001501
实施例4:哺乳动物细胞中的基因编辑活性的证明
产生RGN表达盒并将其引入载体中以进行哺乳动物表达。每一个RGN都针对人类表达(SEQ ID NO:134-152)而被密码子优化,并且在5’端处与SV40核定位序列(NLS;SEQ IDNO:251)和3xFLAG标签(SEQ ID NO:252)可操作地融合,并且在3’端处与核质蛋白NLS序列(SEQ ID NO:253)可操作地融合。NLS序列的两个拷贝被使用、被可操作地串联融合。每一个表达盒都在巨细胞病毒(CMV)启动子(SEQ ID NO:258)的控制下。本领域中已知CMB转录增强子(SEQ ID NO:259)还可被包含在包含CMV启动子的构建体中。每一个都在人类RNA聚合酶III U6启动子(SEQ ID NO:260)控制下编码单一gRNA的引导RNA表达构建体被产生且被引入pTwist高拷贝扩增(pTwist High Copy Amp)载体中。针对每一个引导的目标序列的序列列于表3中。
将上述的若干构建体引入哺乳动物细胞中。转染前一天,将1x105个HEK293T细胞(Sigma)涂抹在Dulbecco的改善Eagle培养基(DMEM)加10%(vol/vol)胎牛血清(Gibco)和1%青霉素-链霉素(Gibco)的24孔培养皿中。当细胞达到50-60%汇合度(confluency)时的第二天,按照制备商的使用说明,使用每孔1.5μL的Lipofectamine 3000(ThermoScientific)共转染500ng RGN表达质粒加500ng单一gRNA表达质粒。生长48小时后,按照制备商的使用说明,使用基因组DNA分离试剂盒(Machery-Nagel)来收获总基因组DNA。
然后,对总基因组DNA进行分析,以确定每一个RGN对每一个基因组目标的编辑率。首先,产生寡核苷酸,以用于PCR扩增和经扩增的基因组目标位点的后续分析。所使用的寡核苷酸序列列于表4中。
全部PCR反应都是在20μL反应(包含每一引物0.5μM)中使用10μL的2X Master MixPhusion高保真DNA聚合酶(Thermo Scientific)进行的。首先,使用PCR#1引物并使用以下程序扩增包含每一个目标基因的大基因组区域:98℃,1分钟;[98℃,10秒;62℃,15秒;72℃,5分钟]的30次循环;72℃,5分钟;12℃,永远。然后,使用对每一个引导物特异的引物(PCR#2引物)并使用以下程序进一步扩增1微升的该PCR反应:98℃,1分钟;[98℃,10秒;67℃,15秒;72℃,30秒]的35个循环;72℃,5分钟;12℃,永远。PCR#2的引物包含用于Illumina测序的Nextera读数1和读数2转座酶衔接子突出序列。
对于RGN APG02874、APG03850和APG09208,进行如上所述的方法。针对RNA引导的切割,靶向人类基因组中许多不同的基因。这些基因座连同sgRNA的SEQ ID NO被包含在下面的表3中。还显示了RGN活性的指示的插入或缺失(Indel)百分比。
表3:用于测试哺乳动物细胞中的基因编辑活性的引导RNA的目标序列和sgRNA序列
Figure BDA0004012237450001511
Figure BDA0004012237450001521
Figure BDA0004012237450001531
Figure BDA0004012237450001541
Figure BDA0004012237450001551
Figure BDA0004012237450001561
Figure BDA0004012237450001571
表4:用于检测哺乳动物细胞中的基因编辑活性的寡核苷酸
Figure BDA0004012237450001572
Figure BDA0004012237450001581
Figure BDA0004012237450001591
Figure BDA0004012237450001601
Figure BDA0004012237450001611
对经纯化的基因组DNA进行如上所述的PCR#1和PCR#2。在第二次PCR扩增后,根据制备商的使用说明,使用PCR净化试剂盒(Zymo)清洗DNA,并在水中洗涤。将200-500ng纯化的PCR#2产物与2μL的10X NEB缓冲液2与水在20μL反应中合并,并使用程序:95℃,5分钟;95-85℃,以2℃/秒的速率冷却;85-25℃,以0.1℃/秒的速率冷却;12℃,永远,进行退火,以形成异源双链DNA。退火后,移除5μL的DNA,以作为无酶对照,并且加入1μL的T7核酸内切酶I(NEB),并使反应在37℃下温育1小时。温育后,加入5x FlashGel装载染料(Lonza),并使用凝胶电泳以通过2.2%琼脂糖FlashGel(Lonza)分析5μL的每一个反应和对照。在凝胶可视化之后,使用以下公式来确定非同源末端连接(NHEJ)的百分比:%NHEJ事件=100x[1-(1-切割的分数)^(1/2)],其中(切割的分数(fraction))被定义为:(分解产物的密度)/(分解产物的密度+未分解的亲本带的密度)。
对于一些样品,使用
Figure BDA0004012237450001621
分析在哺乳动物细胞中表达后的结果。在基因组DNA提取前,将细胞在37℃下培养,以进行72小时的后转染。按照制备商的实验方案,使用QuickExtract DNA提取溶液(Epicentre)来提取基因组DNA。对RGN目标位点侧翼的基因组区域进行PCR扩增,并按照制备商的实验方案,使用QiaQuick Spin Column(Qiagen)来纯化产物。总计200-500ng的纯化PCR产物与1μl 10×Taq DNA聚合酶PCR缓冲液(Enzymatics)和超纯水混合至10μl的最终体积,并进行重退火过程,以使异源双链形成:95℃10分钟;以-2℃/s从95℃降至85℃;以-0.25℃/s从85℃降至25℃;并在25℃下保持1分钟。
在重退火后,按照制备商建议的实验方案,用
Figure BDA0004012237450001622
核酸酶和
Figure BDA0004012237450001623
增强剂S(Integrated DNA Technologies)处理产物,并在4-20%的NovexTBE聚丙烯酰胺凝胶(Life Technologies)上进行分析。用SYBR Gold DNA染料(LifeTechnologies)将凝胶染色10分钟,并用Gel Doc凝胶成像系统(Bio-rad)将凝胶成像。定量是基于相对条带强度。插入或缺失(Indel)百分比由公式100×(1-(1-(b+c)/(a+b+c))1/2)确定,其中a是未分解的PCR产物的累积强度,b和c是每种切割产物的累积强度。
另外,按照Illumina 16S总基因组测序文库(Metagenomic Sequencing Library)实验方案,对含有Illumina突出序列的PCR#2的产物进行文库制备。深度测序在服务提供商(MOGene)的Illumina Mi-Seq平台上进行。通常,产生每扩增子200,000个250bp的配对末端读数(2x100,000个读数)。使用CRISPResso(Pinello等人,2016,Nature Biotech 34:695-697)分析读数,以计算编辑率。手动整理输出比对,以确认插入和缺失位点并鉴定重组位点处的微同源位点。编辑率显示于表5中。所有实验均在人类细胞中进行。“目标序列”是基因目标内的靶向序列。对于每一个目标序列,依据所使用的RGN,引导RNA包含互补RNA目标序列以及适合的sgRNA。通过引导RNA选择的实验分析显示于表6.1-6.3中。
表5:哺乳动物细胞中的RGN活性
Figure BDA0004012237450001631
Figure BDA0004012237450001641
Figure BDA0004012237450001651
相应的引导物的特定插入和缺失显示于表6.1-6.3中。在这些表中,目标序列由粗体大写字母标出。8mer PAM区域用双底线标出,主要识别的核苷酸以粗体显示。插入由小写字母标出。缺失用破折线(---)表示。插入或缺失(INDEL)位置是自目标序列的PAM近端边缘计算的,而且边缘是位置0。如果位置是在边缘的目标侧,则该位置为正(+);如果位置是在边缘的PAM侧,则该位置为负(-)。
表6.1:使用RGN APG02874的引导977的特定插入和缺失
Figure BDA0004012237450001661
表6.2:使用RGN APG03850的引导985的特定插入和缺失
Figure BDA0004012237450001662
表6.3:使用RGN APG09208的引导793的特定插入和缺失
Figure BDA0004012237450001663
Figure BDA0004012237450001671
表6.4:使用RGN APG005586的引导1166的特定插入和缺失
Figure BDA0004012237450001681
Figure BDA0004012237450001691
Figure BDA0004012237450001701
Figure BDA0004012237450001711
Figure BDA0004012237450001721
Figure BDA0004012237450001731
Figure BDA0004012237450001741
Figure BDA0004012237450001751
Figure BDA0004012237450001761
Figure BDA0004012237450001771
通过测定若干核酸酶在横跨若干基因的许多不同目标位点处编辑的能力来测试这些核酸酶的稳健性。在扩大的引导组(guide panel)中测试40个以上的目标。所有测试的蛋白质在多种位点都显示稳健编辑。结果显示于表7中。
表7:选择RNA引导的核酸酶的稳健性
Figure BDA0004012237450001781
Figure BDA0004012237450001791
Figure BDA0004012237450001801
Figure BDA0004012237450001811
Figure BDA0004012237450001821
实施例5:APG05586的蛋白质工程
通过将APG05586与包含APG08770(SEQ ID NO:70)、APG09882(如SEQ ID NO:568所示的且被描述于国际专利申请号PCT/US2020/045759中,其通过引用整体并入本文中)以及APG01658(如SEQ ID NO:569所示、且被描述于国际专利申请号PCT/US2020/045759中)的密切相关的同源物相比,辨别APG05586的保守的可变残基。产生在非保守位置处含有突变的若干变体,以辨别APG05586蛋白质中的关键残基。总体来看,在10个APG05586工程化变体RGN(SEQ ID NO:570-579)中132个残基被改变。然后,测定这10个APG05586变体和野生型APG05586在哺乳动物细胞中的活性。按照实施例4描述的方法,使用APG05586(SEQ ID NO:66)的引导RNA骨架,测试RGN在六个靶向的基因组位置(表8)处的活性。每一个变体的哺乳动物密码子优化的编码序列被提供为SEQ ID NO:580-589。可用于检测基因编辑活性的5'及3'引物核苷酸序列也提供于表8中。编辑率显示于表9中。
表8:目标序列
Figure BDA0004012237450001831
表9:APG05586及其变体的编辑率
RGN ID RGN SEQ ID NO. SGN001159 SGN001162 SGN001163 SGN001164 SGN001165 SGN001166
APG09298 570 33.40% 44.26% 42.06% 8.10% 33.94% 46.19%
APG06251 571 0% 43.59% 48.82% 5.90% 25.07% 35.08%
APG03066 572 0% 0% 0% 0% 0% 0%
APG01560 573 15.12% 16.38% 17.59% 2.52% 44.99% 20.68%
APG02777 574 0% 0.08% 0% 0% 0% 0%
APG05761 575 24.25% 21.95% 21.86% 10.45% 23.72% 20.17%
APG02479 576 5.61% 9.25% 11.00% 1.45% 4.53% 6.34%
APG08385 577 31.16% 39.95% 35.42% 2.37% 31.41% 26.65%
APG09217 578 29.43% 41.12% 44.71% 4.79% 38.16% 31.76%
APG06657 579 36.81% 44.20% 41.54% 4.44% 16.29% 21.86%
APG05586 63 40.13% 46.12% 43.77% 8.00% 96.76% 77.38%
变体的相对活性表明蛋白质中的哪个位置耐受突变。下面显示的表10为与APG005586相比被引入一些突变的变体RGN的活性的汇总。“-”为无活性;“+”为6个目标中至少4个有1-15%编辑;“++”为6个目标中至少4个有10-25%编辑;以及“+++”为6个目标中至少4个有20-50%编辑。
表10:蛋白质工程化变化和编辑率的汇总
蛋白质 活性结果 突变数目
APG09298 +++ 10
APG06251 +++ 12
APG03066 - 87
APG01560 ++ 10
APG02777 - 37
APG05761 ++ 10
APG02479 + 12
APG08385 +++ 12
APG09217 +++ 14
APG06657 +++ 14
APG05586 +++ 0
变体APG03066和APG02777含有太多突变,以致不能辨别对功能重要的特异性残基,然而,这些变体的低活性表明在此蛋白质中不耐受桥式螺旋和识别结构域的广泛变化。全部其他变体含有14个或更少的突变,这样使得对活性重要的特异性残基的辨别。基于这些结果,若干残基被辨别为对蛋白质的功能重要。I305L、V328A、L366I、T368S和V405A突变导致所测定的变体中的活性降低。所有这些突变被预测将位于蛋白质的识别结构域中。APG01560的活性的降低是被定位至该蛋白质内的特异性区域中的多个变化的结果。
实施例6:疾病目标的鉴定
从经由在NCBI ClinVar网站的万维网可获得的NCBI ClinVar数据文库获得临床变体的数据文库。从此列表鉴定出致病性单核苷酸多态性(SNP)。使用基因组基因座信息,鉴定出在与每一个SNP重叠且在每一个SNP周围的区域中的CRIgvSPR目标。表11中列出了为靶向因果突变(“Casl Mut.”)可使用碱基编辑、结合本发明的RGN来校正的SNP的选择。在表11中,仅列出了每一种疾病的一个别名。“RS#”对应于经由NCBI网站上的SNP数据文库获得的RS登录号。等位基因ID对应于因果等位基因登录号,染色体登录号还提供经由NCBI网站找到的登录参考信息。表11还提供了适合于针对每一种疾病所列的RGN的基因组目标序列信息。目标序列信息还提供前间隔序列,用于产生本发明的对应RGN所需的sgRNA。
表11:RGN的疾病目标
Figure BDA0004012237450001841
Figure BDA0004012237450001851
Figure BDA0004012237450001861
Figure BDA0004012237450001871
Figure BDA0004012237450001881
Figure BDA0004012237450001891
Figure BDA0004012237450001901
Figure BDA0004012237450001911
Figure BDA0004012237450001921
Figure BDA0004012237450001931
Figure BDA0004012237450001941
Figure BDA0004012237450001951
Figure BDA0004012237450001961
Figure BDA0004012237450001971
Figure BDA0004012237450001981
Figure BDA0004012237450001991
Figure BDA0004012237450002001
Figure BDA0004012237450002011
实施例7:赫尔勒综合征起因的靶向突变
下面描述使用RNA引导的碱基编辑系统对赫尔勒综合征(也称为MPS-1)的可能治疗,该RNA引导的碱基编辑系统校正在患有该疾病的大部分患者中造成赫尔勒综合征的突变。该方法采用了是RNA引导的且可被包装于单一AAV载体中以递送至大范围组织类型的碱基编辑融合蛋白。依据确切的调控元件和所使用的碱基编辑器结构域,还可能设计出编码碱基编辑融合蛋白和单引导RNA二者以靶向患病基因座的单一载体。
实施例7.1:用理想的PAM辨别RGN
遗传性疾病MPS-1为在分子层次上由溶酶体中硫酸乙酰肝素及硫酸皮肤素的累积表征的溶酶体贮积病。此疾病通常是由编码α-L-艾杜糖醛酸酶的IDUA基因(NCBI参考序列NG_008103.1)中的突变引起的遗传性基因病症。该疾病是α-L-艾杜糖醛酸酶缺乏的结果。在北欧背景个体的研究中发现的最常见的IDUA突变为W402X和Q70X,两者都是无义突变,导致翻译的过早终止(Bunge等人(1994),Hum.Mol.Genet,3(6):861-866,通过引用并入本文)。单一核苷酸的反转将恢复野生型编码序列并导致由遗传基因座的内源性调控机制控制的蛋白质表达。
人类Idua基因的W402X突变是大多数MPS-1H病例的原因。相对于引导RNA的前间隔序列组分的结合位点,碱基编辑器可靶向窄序列窗口,并且因此PAM序列距目标基因座特定距离的存在对于策略的成功是必要的。假若存在在碱基编辑蛋白质的相互作用期间目标突变必须位于暴露的非目标链(NTS)上且RGN结构域的足迹将阻挡进入接近PAM的区域的限制,则认为可及的基因座距PAM是10-30bp。为避免在该窗口中的其他邻近腺苷碱基的编辑和诱变,应筛选不同的接头。理想窗口为距PAM 12-16bp。
与APG02874、APG09208和APG05586相容的PAM序列在基因座中是明显的。这些核酸酶分别具有5’-nnnnCC-3’的PAM序列(SEQ ID NO:35)、5’-nnnnC-3’的PAM序列(SEQ ID NO:62)和5’-nnRYA-3’的PAM序列(SEQ ID NO:69),且大小紧密-可能允许经由单一AAV载体递送。相对于例如进入大范围组织(肝脏、肌肉、CNS)的其他递送方法,该递送方法赋予了多种优势以及完善建立的安全性和制备技术。
来自化脓性链球菌的Cas9(SpyCas9)需要接近W402X基因座出现的NGG的PAM序列(SEQ ID NO:256),但SpyCas9的大小阻止了包装到单一AAV载体中,且因此放弃了该方法的上述优点。尽管可采用双递送策略(例如,Ryu等人(2018),Nat.Biotechnol.,36(6):536-539,通过引用并入本文中),但这将显著增加制备复杂性和成本。另外,由于给定细胞中的成功编辑需要与两个载体的感染以及在该细胞中组装融合蛋白,所以双病毒载体递送显著降低基因校正的效率。
相对于SpyCas9,来自金黄色葡萄球菌的常用Cas9e异种同源物(SauCas9)的大小相当地较小,但具有更复杂的PAM要求-NGRRT(SEQ ID NO:257)。此序列不在预期对致病基因座的碱基编辑有用的范围内。
实施例7.2:RGN融合构建体和sgRNA序列
使用标准的分子生物学技术产生编码具有以下结构域的融合蛋白的DNA序列:1)具有使DNA切割活性不活化的(“无活性”或“切口酶”)、具有突变的RGN结构域;2)可用于碱基编辑的腺苷脱氨酶。下表中描述的全部构建体都包含具有碱基编辑活性结构域的融合蛋白,在该实施例中为与无活性的RGN APG02874(SEQ ID NO:214)、APG09208(SEQ ID NO:216)和APG005586(SEQ ID NO:567)的N端末端可操作地融合的ADAT(SEQ ID NO:211)。还可使用可用于碱基编辑DNA的其他腺苷脱氨酶(见例如PCT申请PCT/US2019/068079)。本领域中已知融合蛋白也可用RGN的C端末端处的碱基编辑酶制成。另外,融合蛋白的碱基编辑器与RGN典型地被接头氨基酸序列分开。本领域中已知标准接头的长度范围是15-30个氨基酸。此外,本领域中已知RGN与碱基编辑酶之间的某些融合蛋白还可包含至少一个尿嘧啶糖苷酶抑制剂(UGI)结构域(SEQ ID NO:22),该尿嘧啶糖苷酶抑制剂(UGI)结构域可增加碱基编辑效率(第10,167,457号美国专利,通过引用并入本文中)。因此,融合蛋白可包含RGNAPG02874、APG09208、或其变体、腺苷脱氨酶以及任选的至少一个UGI。
表12:用于RNA靶向的碱基编辑的构建体
Figure BDA0004012237450002031
RGN的可及编辑位点由PAM序列确定。当使RGN与碱基编辑结构域结合时,因为NTS是单链的,而RGN与基因座相关联,所以用于编辑的目标残基必须位于非目标链(NTS)上。评估若干核酸酶和对应引导RNA可以为该特定基因座选择最适合的基因编辑工具。在人类Idua基因中的上述构建体可靶向的若干潜在PAM序列位于造成W402X突变的突变核苷酸附近。还产生了编码引导RNA转录物的序列,引导RNA转录物包含1)与疾病基因座处的非编码DNA链互补的“间隔序列”;和2)引导RNA与RGN缔合所需的RNA序列。这样的sgRNA可以由APG02874 RGN的SEQ ID NO:217、APG09208 RGN系统的SEQ ID NO:218或APG005586RGN系统的SEQ ID NO:566编码。可对这些sgRNA分子和本领域技术人员可想到的类似sgRNA可就其在将上述碱基编辑器导向所关注的基因座的效率而被评估。
实施例7.3:来自赫尔勒综合征患者的细胞中活性的测定
为验证基因型策略并评估上述构建体,使用来自赫尔勒综合征患者的纤维母细胞。与实施例4中描述的那些载体类似,设计了在融合蛋白编码序列和sgRNA编码序列的上游含有适合的启动子的载体,用于在人类细胞中的表达这些序列。认识到,还可使用已知在人类细胞中有高水平表达或在纤维母细胞中可很好地特异性地表达的启动子和其他DNA元件(例如,增强子或终止子)。使用标准技术,例如,与实施例4中描述的转染类似的转染,将载体转染至纤维母细胞中。或者,可使用电穿孔。将细胞培养1-3天。使用标准技术分离基因组DNA(gDNA)。如下所述,通过对经纯化的gDNA进行qPCR基因分型测定和/或下一代测序,确定编辑效率。
TaqmanTMqPCR分析采用对野生型和突变体等位基因特异的探针。这些探针携带荧光团,使用qPCR仪器、通过这些荧光团的光谱激发和/或发射特性来解析这些荧光团。含有PCR引物和探针的基因分型试剂盒可商购获得(即,SNP ID rs121965019的Thermo FisherTaqmanTMSNP基因分型分析ID C__27862753_10)或经设计的。所设计的引物和探针组的实例显示于表13中。
表13:RT-PCR引物和探针
Figure BDA0004012237450002042
编辑实验之后,使用标准方法和上面描述的引物及探针,对gDNA进行qPCR分析。预期结果显示于表14中。可使用该体外系统方便地评估构建体以及选取具高编辑效率的构建体用于进一步研究。与具有或不具有W402X突变的细胞和优选地与对该突变为杂合的一些细胞进行比较来评估该系统。使用例如Sybr green染料,将Ct值与基因座的总扩增或参考基因进行比较。
表14:预期的qPCR结果
基因型 用碱基编辑器转染 预期的PCR结果
<![CDATA[Idua<sup>WT/WT</sup>]]> 纯合的WT
<![CDATA[Idua<sup>WT/W402X</sup>]]> 杂合的:50% WT,50%W402X
<![CDATA[Idua<sup>W402X/W402X</sup>]]> 杂合的W402X
<![CDATA[Idua<sup>W402X/W402X</sup>]]> 可变
还可通过下一代测序来分析组织。可使用例如下面(表15)显示的引物结合位点的引物结合位点或可以由本领域中技术人员识别的其他适合的引物结合位点。PCR扩增之后,按照Illumina 16S总基因组测序文库(Metagenomic Sequencing Library)实验方案对含有Illumina Nextera XT突出序列的产物进行文库制备。深度测序在Illumina Mi-Seq平台上进行。通常,每扩增子产生200,000个250bp的配对末端读数(2×100,000个读数)。使用CRISPResso(Pinello等人,2016)分析读数以计算编辑率。手工整理输出比对,以确认插入和缺失位点以及识别重组位点处的微同源位点。
表15:NGS引物结合位点
Figure BDA0004012237450002041
Figure BDA0004012237450002051
使用抗IDUA抗体对被转染细胞及对照组细胞的细胞裂解产物进行蛋白质印迹(western blotting),以验证全长蛋白质的表达,并使用底物4-甲基伞形酮基α-L-艾杜糖醛酸苷(4-methylumbelliferyl a-L-iduronide)对细胞裂解产物进行酶活性测定以验证该酶是否有催化活性(Hopwood等人,Clin.Chim.ACta(1979),92(2):257-265,通过引用并入本文)。这些实验是与原始的IduaW402X/W402X细胞系(未转染)、用碱基编辑构建体和随机的引导序列转染的IduaW402X/W402X细胞系以及表达野生型IDUA的细胞系比较而进行的。
实施例7.4:鼠模型中的疾病治疗验证
为验证该治疗方法的功效,使用在同功氨基酸中具有无义突变的小鼠模型。小鼠品系在其Idua基因(基因ID:15932)中带有W392X突变,该W392X突变对应于赫尔勒综合征患者中的同源突变(Bunge等人,(1994),Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。该基因座包含相对于人类核苷酸序列的独特核苷酸序列,该核苷酸序列缺少用前面的实施例中描述的碱基编辑器进行校正所需的PAM序列,因此,需要设计独特的融合蛋白来进行核苷酸校正。该动物疾病的改善可验证校正基因递送载体可及的组织中的突变的治疗方法。
对该突变纯合的小鼠表示出与赫尔勒综合征患者类似的若干表达型特征。如上所述的碱基编辑RGN融合蛋白(表12)连同RNA引导序列被并入表达载体,该表达载体允许在小鼠中的蛋白质表达和RNA转录。研究设计显示于下面的表16中。该研究包括用包含碱基编辑融合蛋白和RNA引导序列的高剂量表达载体、低剂量的相同表达载体处理的组、用不包含碱基编辑融合蛋白或引导RNA的表达载体处理的模型小鼠的对照组以及用相同空载体处理的野生型小鼠的第二对照组。
表16:小鼠模型中的基因组编辑实验
Figure BDA0004012237450002052
Figure BDA0004012237450002061
评估的结果变量包括体重、尿液GAG排泄、血清IDUA酶活性、所关注的组织中的IDUA活性、组织病理、为验证SNP的校正而对所关注组织的基因分型以及行为和神经评估。由于一些结果变量是最终的,所以在研究结束之前,可增加额外组以用于评估例如组织病理和组织IDUA活性。结果变量的其他实例可见于建立赫尔勒综合征动物模型的已发表论文(Shull等人(1994),Proc.Natl.Acad.Sci.U.S.A.,91(26):12937-12941;Wang等人(2010),Mol.Genet.Metab.,99(1):62-71;Hartung等人(2004),Mol.Ther.,9(6):866-875;Liu等人(2005),Mol.Ther.,11(1):35-47;Clarke等人(1997),Hum.Mol.Genet.6(4):503-511;全部通过引用并入本文)。
一种可能的递送载体采用腺相关病毒(adeno associated virus,AAV)。产生载体,以包含碱基编辑器dRGN融合蛋白编码序列(例如,Nuc-ADAT-接头-dAPG19748-接头-SV40,如上所述),该碱基编辑器dRGN融合蛋白编码序列的前面为CMV增强子(SEQ ID NO:259)和启动子(SEQ ID NO:258)或其他适合的增强子和启动子组合、任选的Kozak序列,且其在3’端处与终止子序列和聚腺苷酸化序列(例如Levitt,N.;Briggs,D.;Gil,A.;Proudfoot,N.J.Definition of an Efficient Synthetic Poly(A)Site.GenesDev.1989,3(7),1019–1025中描述的最小序列)可操作地融合。该载体可进一步包含表达盒,该表达盒对其5’端处可操作地连接至人类U6启动子(SEQ ID NO:260)或适合产生小非编码RNA的另一个启动子的单一引导RNA进行编码,且该表达盒进一步包含包装至AAV衣壳中所必需以及本领域中众所周知的反向末端重复(ITR)序列。通过标准方法(例如,第9,587,250号美国专利中描述的那些方法,通过引用并入本文)进行产生和病毒包装。
其他可能的病毒载体包含腺病毒和慢病毒载体,腺病毒和慢病毒载体被共同使用并且可含有类似元素,具有不同的包装能力和要求。也可使用非病毒递送方法,例如,脂质纳米粒子包裹的mRNA和sgRNA(Cullis,P.R.和Allen,T.M.(2013),Adv.Drug Deliv.Rev.65(1):36-48;Finn等人(2018),Cell Rep.22(9):2227-2235,二者均通过引用并入)、质粒DNA的流体动力注射(Suda T和Liu D,(2007)Mol.Ther.15(12):2063-2069,通过引用并入本文)、或与金纳米粒子缔合的sgRNA的核糖核蛋白复合物(Lee,K.;Conboy,M.;Park,H.M.;Jiang,F.;Kim,H.J.;Dewitt,M.A.;Mackley,V.A.;Chang,K.;Rao,A.;Skinner,C.;等人,Nanoparticle Delivery of Cas9 Ribonucleoprotein and Donor DNA in Vivo InducesHomology-Directed DNA Repair.Nat.Biomed.Eng.2017,1(11),889–90)。
实施例7.5:具有人源化基因座的小鼠模型中的疾病校正
为了评估与用于人类治疗的相同碱基编辑器构建体的功效,需要一种小鼠模型,其中W392附近的核苷酸被改变以与人类的W402附近的序列匹配。这可通过各种技术实现,包括使用RGN和HDR模板切断以及取代小鼠胚胎中的基因座。
由于氨基酸的高度保守性,小鼠基因座中的大多数核苷酸可被改变至具有如表17所显示的沉默突变的人类序列的核苷酸。导致所得的工程化小鼠基因组中编码序列改变的唯一碱基变化发生在引入的终止密码子之后。
表17:产生人源化小鼠基因座的核苷酸突变
Figure BDA0004012237450002071
Figure BDA0004012237450002081
工程化该小鼠品系后,将进行如实施例7.4中描述的类似实验。
实施例8:靶向造成弗里德赖希共济失调的突变
引起弗里德赖希共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内、被称为FRDA不稳定性区域的经确定的遗传基因座中。RNA引导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定性区域。该方法需要1)RGN和引导RNA序列,其可被编程,以靶向人类基因组中的等位基因;以及2)RGN和引导序列的递送方法。特别是当除了功能性表达盒所需的其他遗传元素外还要考虑到引导RNA和SpCas9基因的长度时,用于基因组编辑的许多核酸酶(例如来自化脓性链球菌的常用Cas9核酸酶(SpyCas9))太大而无法被包装于腺相关病毒(AAV)载体内。这使得不太可能存在使用SpCas9的可行方法。
本发明的紧密RNA引导的核酸酶(例如,APG03850)相当适合于FRDA不稳定性区域的切除。APG03850具有在FRDA不稳定性区域附近的PAM需求。另外,APG03850可与引导RNA一起包装于AAV载体内。包装两个引导RNA可能需要第二载体,但是与需要在两个载体之间切割蛋白质序列的较大的核酸酶(例如SpCas9)所需的相比,这种方法仍然具有优势。
表18显示了适合将APG03850靶向FRDA不稳定性区域的5'和3'侧翼的基因组目标序列的部位以及用于基因组目标的sgRNA的序列。一旦在基因座,RGN将切除FA不稳定性区域。可用基因座的Illumina测序来验证区域的切除。
表18:RGN系统的基因组目标序列
Figure BDA0004012237450002091
实施例9:靶向造成镰状细胞疾病的突变
靶向BCL11A增强子区域内的序列(SEQ ID NO:236)可提供用于增加胎儿血红素(HbF)以治愈或减轻镰状细胞疾病的症状的机制。例如,基因组广泛关联研究已经确认了在BCL11A处的一组基因变异与增加的HbF水平相关联。这些变异是在BCL11A中发现的SNP的集合,这些SNP作用为阶段特异性、谱系限制的增强子区域的非编码区。进一步的调研显示,在红细胞样细胞中BCL11A增强子是BCL11A表达所必需的(Bauer等人(2013)Science 343:253-257,通过引用并入本文)。在BCL11A基因的内含子2内发现了增强子区域、并识别出在内含子2中的DNAseI过敏反应的三个区域(通常表示与调节潜能关联的染色质状态)。根据自BCL11A的转录起始位点的距离(以千碱基为单位),将这三个区域确定为“+62”、“+58”以及“+55”。这些增强子区域的长度为大约350(+55);550(+58);以及350(+62)个核苷酸(Bauer等人,2013)。
实施例9.1:确定优选的RGN系统
在此描述了使用RGN系统对β-血红素病变的潜在治疗,该RGN系统破坏BCL11A与其在HBB基因座内的结合位点的结合,HBB基因座是负责制备成人血红素中的β-球蛋白的基因。该方法使用了在哺乳动物细胞中更有效的NHEJ。此外,该方法使用可以被包装于单一AAV载体中以用于体内递送的足够小尺寸的核酸酶。
人类BCL11A增强子区域中的GATA1增强子基序(SEQ ID NO:236)是用于使用RNA引导的核酸酶(RGN)的破坏以降低成人红细胞中的HbF同时重新表达以及BCL11A表达的理想目标(Wu等人(2019)Nat Med 387:2554)。与APG03850或APG09208兼容的若干PAM序列在该GATA1位点周围的遗传基因座处是非常表观的。这些核酸酶分别具有5’-nnnnG-3’(SEQ IDNO:42)和5’-nnnnC-3’(SEQ ID NO:62)的PAM序列、并且大小紧密,潜在地允许这些核酸酶在单一AAV或腺病毒载体中与适当的引导RNA一起递送。相对于其他方法,例如,获得造血干细胞以及完善的安全性和制备技术,这种递送方法具有多种优势。
来自化脓性链球菌的常用Cas9核酸酶(SpyCas9)需要5'-NGG-3'的PAM序列(SEQID NO:256),其中一些存在于GATA1基序附近。然而,SpyCas9的大小妨碍了包装到单一AAV或腺病毒载体中、并因此放弃了该方法的上述优点。尽管可以采用双递送策略,但这样会增加显著的制备复杂性和成本。另外,双病毒载体递送明显降低了基因校正的效率,由于给定细胞中的成功编辑需要用两个载体来感染。
产生了编码人类密码子优化的APG03850或APG09208的表达盒,类似于实施例4中描述的那些。还产生了针对RGN APG03850或APG09208表达引导RNA的表达盒。这些引导RNA包含:1)前间隔序列,其与BCL11A增强子基因座(目标序列)内的非编码或编码DNA链互补;和2)引导RNA与RGN缔合所需的RNA序列。因为通过APG03850或APG09208靶向的若干潜在PAM序列围绕BCL11A GATA1增强子基序,所以产生了若干潜在的引导RNA构建体,以确定产生BCL11A GATA1增强子序列的NHEJ介导的破坏以及稳健切割的最佳前间隔序列。使用表19中提供的sgRNA评估表19中的目标基因组序列,以将RGN引导至该基因座。
表19:使用APG03850或APG09208的BCL11A GATA1增强子基因座的目标序列
Figure BDA0004012237450002101
Figure BDA0004012237450002111
为了评估APG03850或APG09208产生破坏BCL11A增强子区域的插入或缺失的效率,使用人细胞系,例如,人类胚胎肾细胞(HEK细胞)。产生包含RGN表达盒的DNA载体(例如,如在实施例4中所述)。还产生包含表达盒的单独载体,该表达盒包含表16的引导RNA序列的编码序列。如在实施例4中所描述,这种表达盒还可包含人类RNA聚合酶III U6启动子(SEQ IDNO:260)。或者,可使用包含RGN和引导RNA二者的表达盒的单一载体。使用标准技术,例如,在实施例4中所描述的那些技术,将载体引入HEK细胞中,并将细胞培养1-3天。在此培养期后,分离基因组DNA,并使用T7核酸内切酶I分解和/或直接DNA测序来确定插入或缺失频率,如在实施例4中所描述的。
用含有Illumina Nextera XT突出序列的引物,通过PCR来扩增包含目标BCL11A区域的DNA的区域。使用T7核酸内切酶I分解以针对NHEJ形成来检查这些PCR扩增子,或者这些PCR扩增子按照Illumina 16S总基因组测序文库实验方案或类似的下一代测序(NGS)文库制备进行文库制备。在深度测序后,通过CRISPResso分析产生的读数,以计算编辑率。手工整理输出比对,以确认插入和缺失位点。此分析识别出优选RGN和对应的优选引导RNA(sgRNA)。该分析可得出的结果是APG03850及APG09208是同样优选的。另外,该分析可确定存在一个以上的优选引导RNA,或者表16中的所有目标基因组序列是同样优选的。
实施例9.2:胎儿血红素表达的测定
在该实施例中,测定APG03850或APG09208产生的破坏BCL11A增强子区域的插入或缺失是否有胎儿血红素的表达。使用健康人类供体CD34+造血干细胞(HSC)。培养这些HSC,并使用与在实施例8.1中描述的方法类似的方法,引入包含表达盒的一个或多个载体,该表达盒包含优选RGN和优选sgRNA的编码区域。在电穿孔后,使用已建立的实验方案使这些细胞在体外分化为红细胞(例如,Giarratana等人(2004)Nat Biotechnology 23:69-74,通过引用并入本文中)。然后,使用蛋白质印迹,用抗人类HbF抗体来测量HbF的表达,或经由高效液相层析法(HPLC)定量HbF的表达。当与仅用RGN电穿孔而没有引导的HSC相比时,预期BCL11A增强子基因座的成功破坏将引起HbF产生的增加。
实施例9.3:镰状细胞形成减少的测定
在该实施例中,针对镰状细胞形成减少,测定了破坏BCL11A增强子区域的APG03850或APG09208产生的插入或缺失。使用来自患有镰状细胞疾病的患者的供体CD34+造血干细胞(HSC)。培养这些HSC,并使用与在实施例8.1中描述的方法类似的方法引入包含表达盒的一个或多个载体,该表达盒包含优选RGN的和优选sgRNA的编码区域。在电穿孔后,使用已建立的实验方案(Giarratana等人(2004)Nat Biotechnology 23:69-74)使这些细胞在体外分化成红细胞。然后,使用蛋白质印迹、利用抗人类HbF抗体来测量HbF的表达,或经由高效液相层析法(HPLC)定量HbF的表达。当与仅用RGN但没有引导进行电穿孔的HSC相比时,预期BCL11A增强子基因座的成功破坏将引起HbF产生的增加。
通过加入偏亚硫酸氢盐(metabisulfite),在这些分化的红细胞中诱导镰状细胞形成。使用显微镜对镰状红细胞与正常红细胞的数量进行计数。预期在用APG03850或APG09208加sgRNA处置的细胞中,镰状细胞的数目少于在未经处理的或仅用RGN处理的细胞的数目。
实施例9.4:鼠模型中的疾病治疗验证
为评估使用APG03850或APG09208破坏BCL11A基因座的功效,使用适合的镰状细胞贫血症的人源化小鼠模型。将编码优选RGN和优选sgRNA的表达盒包装于AAV载体或腺病毒载体中。尤其是,腺病毒Ad5/35型可有效靶向HSC。选用含有具有镰状细胞等位基因的人源化HBB基因座的适合的小鼠模型,例如,B6;FVB-Tg(LCR-HBA2、LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。单独用粒细胞集落刺激因子(granulocyte colony-stimulating factor)或与普乐沙福(plerixafor)组合治疗这些小鼠,以使HSC进入循环。然后,静脉注射携带RGN和引导质粒的AAV或腺病毒,并使小鼠恢复一周。在体外镰状细胞形成测定(sickling assay)中使用偏亚硫酸氢盐测试从这些小鼠获得的血液,并连续追踪小鼠,以监测死亡率及造血功能。当与用缺少RGN以及引导RNA表达盒的病毒或用仅携带RGN表达盒的病毒处理的小鼠相比时,预期用携带RGN和引导RNA的AAV或腺病毒的治疗将降低镰状细胞形成、死亡率且改善造血功能。
实施例10:测试不同递送格式
为确定RGN是否能够以不同形式递送,用原代T细胞测试mRNA和RNP核转染递送。经纯化的CD3+T-细胞或外周血单核细胞(PBMC)被解冻、使用CD3/CD28球粒(ThermoFisher)活化3天、然后使用Lonza 4D-Nucleofector X单元和Nucleocuvette试验片(strip)进行核转染。P3 Primary Cell试剂盒用于mRNA和RNP二者的递送。使用EO-115和EH-115程序转染细胞以分别用于mRNA和RNP递送。在使用Nucleospin Tissue基因组DNA分离试剂盒(MacheryNagel)收获前,核转染后细胞在含有IL-2、IL-7和IL-15(Miltenyi Biotec)的CTSOpTimizer T细胞扩展培养基(ThermoFisher)中培养4天。
使用表4中识别的引物以通过PCR产生编辑位点周围的扩增子,并按照实施例4中的方法使用Illumina Nextera平台且使用2x250bp配对末端测序进行NGS测序。
表20:原代T细胞中的RGN的mRNA和RNP递送
RGN 递送方法 SGN 编辑%
APG01604 mRNA,核转染 SGN001671 1.18
APG01604 mRNA,核转染 SGN001673 22.7
APG01604 RNP,核转染 SGN001673 0.56
APG01604 mRNA,核转染 SGN001674 0.63
APG01604 RNP,核转染 SGN001674 0.77
APG01868 mRNA,核转染 SGN001684 77.85
APG01868 RNP,核转染 SGN001684 83.73
APG01868 mRNA,核转染 SGN001691 82.53
APG01868 RNP,核转染 SGN001691 80.7
APG01868 mRNA,核转染 SGN001692 76.84
APG01868 RNP,核转染 SGN001692 86.06
APG01868 mRNA,核转染 SGN001785 0.22
APG01868 RNP,核转染 SGN001785 0.43
mRNA和RNP二者的递送显示用APG01868成功编辑。APG01868显示在若干基因组目标处用RNP成功编辑。用APG01604限制RNP递送,但RNP递送与mRNA递送显示相等的编辑率。
实施例11:碱基编辑器测试
为确定APG09298和APG01604是否可在哺乳动物细胞中进行胞嘧啶碱基编辑,将胞嘧啶脱氨酶与每一个RGN的切口酶版本可操作地融合,以产生融合蛋白。去活化RGNAPG09298和APG01604的RuvC结构域所预测的残基被识别出,且RGN被修饰成切口酶变体。RGN的切口酶变体在本文中被称为“nRGN”。应当明白,RGN的任何切口酶变体可用于产生本发明的融合蛋白。
脱氨酶和针对哺乳动物表达被密码子优化的nRGN核苷酸序列与N端核定位标签合成为融合蛋白、且被克隆至pTwist CMV(Twist Biosciences)表达质粒内。每一个融合蛋白在氨基端处开始,包含在C端末端处可操作地连接至3X FLAG标签(SEQ ID NO:252)的SV40NLS(SEQ ID NO:251)、在C端末端处可操作地连接至脱氨酶(APG05840)、在C端末端处可操作地连接至肽接头、在C端末端可操作地连接至nRGN(nAPG09298或nAPG01604)、在C端末端可操作地连接至肽接头、在C端末端可操作地连接至尿嘧啶稳定蛋白(USP2如SEQ ID NO:1089所示)、最后在C端末端可操作地连接至核质蛋白NLS(SEQ ID NO:253)。APG05840-nAPG09298-USP2和APG05840-nAPG01604-USP2融合蛋白的氨基酸序列如SEQ ID NO:1090和1091所示。
还产生了包含编码sgRNA的表达盒的表达质粒。人类基因组目标序列以及用于将融合蛋白引导至基因组目标的sgRNA序列被示于表3中,以及用于基因组区域的扩增的引物列于表4中。当被限制在胞嘧啶脱氨酶时,使用实施例4中将质粒递送至哺乳动物细胞及扩增子测序的相同方法来测试这些RGN的碱基编辑能力。
表21:针对所测试的每一个RGN估计的碱基编辑率
Figure BDA0004012237450002141
Figure BDA0004012237450002151
实施例12:脱靶分析
为评估核酸酶的特异性,在经由生物信息识别的潜在位点处确定脱靶编辑。APG01604的潜在脱靶位点通过目标序列中具有少于5个错配和PAM序列中具有至少一个残基匹配的目标识别。
使用与实施例4中描述的将质粒递送至哺乳动物细胞和扩增子测序的方法相同的方法来测试APG01604的特异性以及脱靶编辑。从针对在目标编辑上测试表22中的SGN的相同实验,针对潜在编辑,测定表23中的潜在脱靶位置。表24中的引物用于扩增与目标位点上的序列具有序列相似度的潜在脱靶位点,以查找脱靶编辑。
表22:用于查找脱靶编辑的SGN
Figure BDA0004012237450002152
表23:被测定的脱靶序列
Figure BDA0004012237450002153
Figure BDA0004012237450002161
表24:用于扩增脱靶区域的引物
Figure BDA0004012237450002162
Figure BDA0004012237450002171
使用质粒递送,在所测试的三个引导物中的两个不存在可检测的脱靶编辑。SGN001675的一个脱靶位点1675-8在脱靶基因座处显示2%编辑。在NGS读数中的切断位点处存在132bp的基因组区域的重复。由于不良的引物扩增,两个脱靶位点1675-7和1675-13不能被测序。
表25:SGN001594和APG08167的脱靶编辑
Figure BDA0004012237450002172
表26:SGN001675和APG08167的脱靶编辑
Figure BDA0004012237450002173
Figure BDA0004012237450002181
表27:SGN001674和APG08167的脱靶编辑
Figure BDA0004012237450002182
实施例13:引导RNA骨架变体测试
APG08167与APG01604具有接近62.72%的同一性,但识别相同PAM、共有相同crRNA以及具有密切相关的tracrRNA序列。因为引导RNA序列的相似度,所以先前对APG01604产生的所有数据都使用APG08167 tracrRNA骨架。进行这些研究,以确认APG01604蛋白与APG08167基因组中所编码的tracrRNA(天然APG08167 tracrRNA)一起更具活性。还测试了crRNA中的不同间隔序列长度,以确定APG01604蛋白是否以20或25碱基对间隔序列为佳。
为此,产生具有含有20或25碱基对目标的六个不同目标序列的合成crRNA。以组合式方式将不同crRNA与来自APG08167或APG01604基因组的合成tracrRNA组合。形成RNP,且RNP复合物被核转染至HEK293T细胞内。实施例4中的标准方法用于确定细胞中的编辑率。
表28:crRNA序列
Figure BDA0004012237450002183
Figure BDA0004012237450002191
表29:tracrRNA序列
Figure BDA0004012237450002192
表30:测序引物序列
引物 SEQ ID NO
TRAC左引物 1170
TRAC右引物 1171
B2M左引物 1172
B2M右引物 1173
表31:APG01604骨架的编辑结果以及目标长度测试
Figure BDA0004012237450002193
Figure BDA0004012237450002201
哺乳动物细胞中的编辑率说明,当使用天然APG01604 tracrRNA序列时,不存在稳健的编辑。当使用APG08167 tracrRNA序列时,APG01604 RNP显示以非常高的编辑率编辑。另外,当与相同目标相比时,在目标A、C、D、E和F处,相比于具有20bp间隔序列长度的crRNA,25碱基对间隔序列长度显示较高的编辑。结合这些结果说明了相比于APG01604 tracrRNA,APG08167tracrRNA呈现较高的编辑。另外,相比于20bp间隔序列,APG01604 RNP与25bp间隔序列一起的作用更佳。

Claims (122)

1.一种核酸分子,包含编码RNA引导的核酸酶(RGN)多肽的多核苷酸,其中所述多核苷酸包含编码RGN多肽的核苷酸序列,所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;
其中,当与能够与目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合所述目标DNA序列,以及
其中所述编码RGN多肽的多核苷酸可操作地连接至与所述多核苷酸异源的启动子。
2.权利要求1所述的核酸分子,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
3.权利要求1所述的核酸分子,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
4.权利要求1所述的核酸分子,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
5.权利要求1至权利要求4中任一项所述的核酸分子,其中所述RGN多肽能够在结合时切割所述目标DNA序列。
6.权利要求5所述的核酸分子,其中所述RGN多肽能够产生双链断裂。
7.权利要求5所述的核酸分子,其中所述RGN多肽能够产生单链断裂。
8.权利要求1至权利要求4中任一项所述的核酸分子,其中所述RGN多肽为非活化的核酸酶或为切口酶。
9.权利要求1至权利要求8中任一项所述的核酸分子,其中所述RGN多肽与碱基编辑多肽可操作地融合。
10.权利要求9所述的核酸分子,其中所述碱基编辑多肽为脱氨酶。
11.权利要求1至权利要求10中任一项所述的核酸分子,其中所述RGN多肽包含一个或多个核定位信号。
12.权利要求1至权利要求11中任一项所述的核酸分子,其中所述RGN多肽针对在真核细胞中的表达被密码子优化。
13.权利要求1至权利要求12中任一项所述的核酸分子,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
14.一种包含权利要求1至权利要求13中任一项所述的核酸分子的载体。
15.权利要求14所述的载体,进一步包含编码所述gRNA的至少一种核苷酸序列,所述gRNA能够与所述目标DNA序列杂交。
16.权利要求15所述的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPRRNA包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPRRNA,该CRISPR RNA包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPRRNA,该CRISPR RNA包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少90%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
17.权利要求15所述的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有至少95%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
18.权利要求15所述的载体,其中所述引导RNA选自由下列各项组成的组:
a)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:3具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:10具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:17具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:24具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:31具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:38具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:45具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:52具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:58具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:65具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:72具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:85具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:91具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:98具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:105具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:112具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:119具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:125具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)引导RNA,包含:
i)CRISPR RNA,该CRISPR RNA包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列;以及
ii)tracrRNA,该tracrRNA与SEQ ID NO:78具有100%序列同一性;
其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
19.权利要求15至权利要求18中任一项所述的载体,其中所述gRNA为单引导RNA。
20.权利要求15至权利要求18中任一项所述的载体,其中所述gRNA为双引导RNA。
21.一种包含权利要求1至权利要求13中任一项所述的核酸分子或权利要求14至权利要求20中任一项所述的载体的细胞。
22.一种用于制备RGN多肽的方法,包括:在所述RGN多肽被表达的条件下,培养权利要求21所述的细胞。
23.一种用于制备RGN多肽的方法,包括将异源核酸分子引入细胞内,该异源核酸分子包含编码RNA引导的核酸酶(RGN)多肽的核苷酸序列,该RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;
其中,当与能够与目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合所述目标DNA序列;
且在该RGN多肽被表达的条件下,培养所述细胞。
24.权利要求23所述的方法,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
25.权利要求23所述的方法,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
26.权利要求23所述的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
27.权利要求22至权利要求26中任一项所述的方法,进一步包括纯化所述RGN多肽。
28.权利要求22至权利要求26中任一项所述的方法,其中所述细胞进一步表达一个或多个引导RNA,所述一个或多个引导RNA能够与所述RGN多肽结合,以形成RGN核糖核蛋白复合物。
29.权利要求28所述的方法,进一步包括纯化所述RGN核糖核蛋白复合物。
30.一种分离的RNA引导的核酸酶(RGN)多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
其中,当与能够与目标DNA序列杂交的引导RNA(gRNA)结合时,所述RGN多肽能够以RNA引导的序列特异性方式结合DNA分子的所述目标DNA序列。
31.权利要求30所述的分离的RGN多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
32.权利要求30所述的分离的RGN多肽,其中所述RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
33.权利要求30所述的分离的RGN多肽,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ IDNO:63的405对应的氨基酸位置处的缬氨酸。
34.权利要求30至权利要求33中任一项所述的分离的RGN多肽,其中所述RGN多肽能够在结合时切割所述目标DNA序列。
35.权利要求34所述的分离的RGN多肽,其中通过所述RGN多肽的切割产生双链断裂。
36.权利要求34所述的分离的RGN多肽,其中通过所述RGN多肽的切割产生单链断裂。
37.权利要求30至权利要求33中任一项所述的分离的RGN多肽,其中所述RGN多肽为非活化的核酸酶或为切口酶。
38.权利要求30至权利要求37中任一项所述的分离的RGN多肽,其中所述RGN多肽与碱基编辑多肽可操作地融合。
39.权利要求38所述的分离的RGN多肽,其中所述碱基编辑多肽为脱氨酶。
40.权利要求30至权利要求39中任一项所述的分离的RGN多肽,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
41.权利要求30至权利要求40中任一项所述的分离的RGN多肽,其中所述RGN多肽包含一个或多个核定位信号。
42.一种用于结合DNA分子的目标DNA序列的系统,该系统包括:
a)能够与所述目标DNA序列杂交的一个或多个引导RNA、或包含编码所述一个或多个引导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列的RNA引导的核酸酶(RGN)多肽、或包含编码该RGN多肽的核苷酸序列的多核苷酸;
其中编码所述RGN多肽的所述核苷酸序列以及编码所述一个或多个引导RNA的所述核苷酸序列中的至少一个可操作地连接至与所述核苷酸序列异源的启动子;
其中所述一个或多个引导RNA能够与所述目标DNA序列杂交,以及
其中所述一个或多个引导RNA能够与所述RGN多肽形成复合物,以便将所述RGN多肽导向至与所述DNA分子的所述目标DNA序列结合。
43.一种用于结合DNA分子的目标DNA序列的系统,该系统包括:
a)能够与所述目标DNA序列杂交的一个或多个引导RNA、或包含编码所述一个或多个引导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列的RNA引导的核酸酶(RGN)多肽;
其中所述一个或多个引导RNA能够与所述目标DNA序列杂交,以及
其中所述一个或多个引导RNA能够与该RGN多肽形成复合物,以便将所述RGN多肽导向至与所述DNA分子的所述目标DNA序列结合。
44.权利要求42或权利要求43所述的系统,其中编码所述一个或多个引导RNA的至少一个所述核苷酸序列可操作地连接至与所述核苷酸序列异源的启动子。
45.权利要求42至权利要求44中任一项所述的系统,其中所述RGN多肽包含与SEQ IDNO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
46.权利要求42至权利要求44中任一项所述的系统,其中所述RGN多肽包含与SEQ IDNO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
47.权利要求42至权利要求44中任一项所述的系统,其中所述RGN多肽与SEQ ID NO:63具有至少95%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
48.权利要求42至权利要求47中任一项所述的系统,其中未发现所述RGN多肽与所述一个或多个引导RNA在本质上彼此复合。
49.权利要求42至权利要求48中任一项所述的系统,其中所述目标DNA序列为真核目标DNA序列。
50.权利要求42至权利要求49中任一项所述的系统,其中所述gRNA为单引导RNA(sgRNA)。
51.权利要求42至权利要求49中任一项所述的系统,其中所述gRNA为双引导RNA。
52.权利要求42至权利要求51中任一项所述的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有至少90%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有至少90%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有至少90%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有至少90%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有至少90%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有至少90%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有至少90%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有至少90%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有至少90%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有至少90%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有至少90%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:105具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有至少90%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:112具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有至少90%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:119具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有至少90%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:125具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有至少90%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少90%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有至少90%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少90%序列同一性的氨基酸序列。
53.权利要求42至权利要求51中任一项所述的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有至少95%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有至少95%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有至少95%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有至少95%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有至少95%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有至少95%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有至少95%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有至少95%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有至少95%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有至少95%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有至少95%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有至少95%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有至少95%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:105具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有至少95%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:112具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有至少95%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:119具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有至少95%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:125具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有至少95%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有至少95%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有至少95%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有至少95%序列同一性的氨基酸序列。
54.权利要求42至权利要求51中任一项所述的系统,其中所述gRNA选自由下列各项组成的组:
a)包含与SEQ ID NO:2具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:3具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:1具有100%序列同一性的氨基酸序列;
b)包含与SEQ ID NO:9具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:10具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:8具有100%序列同一性的氨基酸序列;
c)包含与SEQ ID NO:16具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:17具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:15具有100%序列同一性的氨基酸序列;
d)包含与SEQ ID NO:23具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:24具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:22具有100%序列同一性的氨基酸序列;
e)包含与SEQ ID NO:30具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:31具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:29具有100%序列同一性的氨基酸序列;
f)包含与SEQ ID NO:37具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:38具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:36具有100%序列同一性的氨基酸序列;
g)包含与SEQ ID NO:44具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:45具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:43具有100%序列同一性的氨基酸序列;
h)包含与SEQ ID NO:51具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:52具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:50具有100%序列同一性的氨基酸序列;
i)包含与SEQ ID NO:57具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:58具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:56具有100%序列同一性的氨基酸序列;
j)包含与SEQ ID NO:64具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:65具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:63和570-579中任一项具有100%序列同一性的氨基酸序列;
k)包含与SEQ ID NO:71具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:72具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:70具有100%序列同一性的氨基酸序列;
l)包含与SEQ ID NO:77具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:76具有100%序列同一性的氨基酸序列;
m)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:85具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列;
n)包含与SEQ ID NO:90具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:91具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:89具有100%序列同一性的氨基酸序列;
o)包含与SEQ ID NO:97具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:98具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:96具有100%序列同一性的氨基酸序列;
p)包含与SEQ ID NO:104具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:105具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:103具有100%序列同一性的氨基酸序列;
q)包含与SEQ ID NO:111具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:112具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:110具有100%序列同一性的氨基酸序列;
r)包含与SEQ ID NO:118具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:119具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:117具有100%序列同一性的氨基酸序列;
s)包含与SEQ ID NO:124具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:125具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:123具有100%序列同一性的氨基酸序列;以及
t)包含与SEQ ID NO:84具有100%序列同一性的CRISPR重复序列和与SEQ ID NO:78具有100%序列同一性的tracrRNA的gRNA,其中所述RGN多肽包含与SEQ ID NO:83具有100%序列同一性的氨基酸序列。
55.权利要求42至权利要求54中任一项所述的系统,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
56.权利要求42至权利要求55中任一项所述的系统,其中所述目标DNA序列在细胞内。
57.权利要求56所述的系统,其中所述细胞为真核细胞。
58.权利要求57所述的系统,其中所述真核细胞为植物细胞。
59.权利要求57所述的系统,其中所述真核细胞为哺乳动物细胞。
60.权利要求57所述的系统,其中所述真核细胞为昆虫细胞。
61.权利要求56所述的系统,其中所述细胞为原核细胞。
62.权利要求42至权利要求61中任一项所述的系统,其中,当被转录时,所述一个或多个引导RNA能够与所述目标DNA序列杂交,并且所述引导RNA能够与所述RGN多肽形成复合物,以导向至所述目标DNA序列的切割。
63.权利要求62所述的系统,其中所述切割产生双链断裂。
64.权利要求62所述的系统,其中所述切割产生单链断裂。
65.权利要求42至权利要求61中任一项所述的系统,其中所述RGN多肽为非活化的核酸酶或为切口酶。
66.权利要求42至权利要求65中任一项所述的系统,其中所述RGN多肽可操作地连接至碱基编辑多肽。
67.权利要求66所述的系统,其中所述碱基编辑多肽为脱氨酶。
68.权利要求42至权利要求67中任一项所述的系统,其中所述RGN多肽包含一个或多个核定位信号。
69.权利要求42至权利要求68中任一项所述的系统,其中所述RGN多肽针对在真核细胞中的表达被密码子优化。
70.权利要求42至权利要求69中任一项所述的系统,其中编码一个或多个引导RNA的核苷酸序列以及编码RGN多肽的核苷酸序列被定位在一个载体上。
71.权利要求42至权利要求70中任一项所述的系统,其中所述系统进一步包括一个或多个供体多核苷酸或编码所述一个或多个供体多核苷酸的一个或多个核苷酸序列。
72.一种药物组合物,包含权利要求1至权利要求13中任一项所述的核酸分子、权利要求14至权利要求20中任一项所述的载体、权利要求21所述的细胞、权利要求30至权利要求41中任一项所述的分离的RGN多肽、或权利要求42至权利要求71中任一项所述的系统、以及药学上可接受的载体。
73.一种用于结合DNA分子的目标DNA序列的方法,包括将根据权利要求42至权利要求71中任一项所述的系统递送至所述目标DNA序列或包含所述目标DNA序列的细胞。
74.权利要求73所述的方法,其中所述RGN多肽或所述引导RNA进一步包含可检测标记,从而允许用于所述目标DNA序列的检测。
75.权利要求73所述的方法,其中所述引导RNA或所述RGN多肽进一步包含表达调节子,从而调节所述目标DNA序列的或由所述目标DNA序列的转录控制下的基因的表达。
76.一种用于切割或修饰DNA分子的目标DNA序列的方法,包括将根据权利要求42至权利要求71中任一项所述的系统递送至所述目标DNA序列或包含所述DNA分子的细胞,并且发生所述目标DNA序列的切割或修饰。
77.权利要求76所述的方法,其中所述经修饰的目标DNA序列包含异源DNA插入至所述目标DNA序列。
78.权利要求76所述的方法,其中所述经修饰的目标DNA序列包含从所述目标DNA序列缺失至少一个核苷酸。
79.权利要求76所述的方法,其中所述经修饰的目标DNA序列包含所述目标DNA序列中的至少一个核苷酸的突变。
80.一种用于结合DNA分子的目标DNA序列的方法,包括:
a)在适合形成所述RGN核糖核苷酸复合物的条件下,通过组合以下,以在体外组装RNA引导的核酸酶(RGN)核糖核苷酸复合物:
i)能够与所述目标DNA序列杂交的一个或多个引导RNA;以及
ii)RGN多肽,该RGN多肽包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
b)使所述目标DNA序列或包含所述目标DNA序列的细胞与在体外组装的RGN核糖核苷酸复合物接触;
其中所述一个或多个引导RNA与所述目标DNA序列杂交,从而将所述RGN多肽导向至与所述目标DNA序列结合。
81.权利要求80所述的方法,其中所述RGN多肽或所述引导RNA进一步包含可检测标记,从而允许用于所述目标DNA序列的检测。
82.权利要求80所述的方法,其中所述引导RNA或所述RGN多肽进一步包含表达调节子,从而允许用于所述目标DNA序列的表达的调节。
83.一种用于切割和/或修饰DNA分子的目标DNA序列的方法,包括使所述DNA分子与以下接触:
a)RNA引导的核酸酶(RGN)多肽,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少90%序列同一性的氨基酸序列;以及
b)能够将(a)的RGN靶向所述目标DNA序列的一个或多个引导RNA;
其中所述一个或多个引导RNA与所述目标DNA序列杂交,从而将所述RGN多肽导向至与所述目标DNA序列结合,并且发生所述目标DNA序列的切割和/或修饰。
84.权利要求83所述的方法,其中通过所述RGN多肽的切割产生双链断裂。
85.权利要求83所述的方法,其中通过所述RGN多肽的切割产生单链断裂。
86.权利要求83所述的方法,其中所述RGN多肽为非活化的核酸酶或为切口酶,并且与碱基编辑多肽可操作地连接。
87.权利要求86所述的方法,其中所述碱基编辑多肽包含脱氨酶。
88.权利要求83所述的方法,其中所述经修饰的目标DNA序列包含异源DNA插入至所述目标DNA序列。
89.权利要求83所述的方法,其中所述经修饰的目标DNA序列包含从所述目标DNA序列缺失至少一个核苷酸。
90.权利要求83所述的方法,其中所述经修饰的目标DNA序列包含所述目标DNA序列中的至少一个核苷酸的突变。
91.权利要求80至权利要求90中任一项所述的方法,其中所述目标DNA序列被定位为与前间隔序列邻近基序(PAM)相邻。
92.权利要求80至权利要求91中任一项所述的方法,其中所述目标DNA序列为真核目标DNA序列。
93.权利要求80至权利要求92中任一项所述的方法,其中所述gRNA为单引导RNA(sgRNA)。
94.权利要求80至权利要求92中任一项所述的方法,其中所述gRNA为双引导RNA。
95.权利要求80至权利要求94中任一项所述的方法,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有至少95%序列同一性的氨基酸序列。
96.权利要求80至权利要求94中任一项所述的方法,其中所述RGN包含与SEQ ID NO:1、8、15、22、29、36、43、50、56、63、70、76、83、89、96、103、110、117、123和570-579中任一项具有100%序列同一性的氨基酸序列。
97.权利要求80至权利要求94中任一项所述的方法,其中所述RGN多肽与SEQ ID NO:63具有至少90%序列同一性,并且具有在与SEQ ID NO:63的305对应的氨基酸位置处的异亮氨酸、在与SEQ ID NO:63的328对应的氨基酸位置处的缬氨酸、在与SEQ ID NO:63的366对应的氨基酸位置处的亮氨酸、在与SEQ ID NO:63的368对应的氨基酸位置处的苏氨酸,以及在与SEQ ID NO:63的405对应的氨基酸位置处的缬氨酸。
98.权利要求80至权利要求94中任一项所述的方法,其中:
a)所述RGN与SEQ ID NO:1具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:2具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:3具有至少90%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:9具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:10具有至少90%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:16具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:17具有至少90%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:23具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:24具有至少90%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:30具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:31具有至少90%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:37具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:38具有至少90%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:44具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:45具有至少90%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:51具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:52具有至少90%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:57具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:58具有至少90%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:64具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:65具有至少90%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:71具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:72具有至少90%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:77具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有至少90%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:84具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:85具有至少90%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:90具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:91具有至少90%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:97具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:98具有至少90%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:104具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:105具有至少90%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:111具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:112具有至少90%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:118具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:119具有至少90%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有至少90%序列同一性,所述引导RNA包含与SEQ IDNO:124具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:125具有至少90%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有至少90%序列同一性,所述引导RNA包含与SEQ ID NO:84具有至少90%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有至少90%序列同一性的tracrRNA。
99.权利要求80至权利要求94中任一项所述的方法,其中:
a)所述RGN与SEQ ID NO:1具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:2具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:3具有至少95%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:9具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:10具有至少95%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:16具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:17具有至少95%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:23具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:24具有至少95%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:30具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:31具有至少95%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:37具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:38具有至少95%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:44具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:45具有至少95%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:51具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:52具有至少95%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:57具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:58具有至少95%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:64具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:65具有至少95%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:71具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:72具有至少95%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:77具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有至少95%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:84具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:85具有至少95%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:90具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:91具有至少95%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:97具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:98具有至少95%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:104具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:105具有至少95%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:111具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:112具有至少95%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:118具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:119具有至少95%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有至少95%序列同一性,所述引导RNA包含与SEQ IDNO:124具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:125具有至少95%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有至少95%序列同一性,所述引导RNA包含与SEQ ID NO:84具有至少95%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有至少95%序列同一性的tracrRNA。
100.权利要求80至权利要求94中任一项所述的方法,其中:
a)所述RGN与SEQ ID NO:1具有100%序列同一性,所述引导RNA包含与SEQ ID NO:2具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:3具有100%序列同一性的tracrRNA;
b)所述RGN与SEQ ID NO:8具有100%序列同一性,所述引导RNA包含与SEQ ID NO:9具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:10具有100%序列同一性的tracrRNA;
c)所述RGN与SEQ ID NO:15具有100%序列同一性,所述引导RNA包含与SEQ ID NO:16具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:17具有100%序列同一性的tracrRNA;
d)所述RGN与SEQ ID NO:22具有100%序列同一性,所述引导RNA包含与SEQ ID NO:23具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:24具有100%序列同一性的tracrRNA;
e)所述RGN与SEQ ID NO:29具有100%序列同一性,所述引导RNA包含与SEQ ID NO:30具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:31具有100%序列同一性的tracrRNA;
f)所述RGN与SEQ ID NO:36具有100%序列同一性,所述引导RNA包含与SEQ ID NO:37具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:38具有100%序列同一性的tracrRNA;
g)所述RGN与SEQ ID NO:43具有100%序列同一性,所述引导RNA包含与SEQ ID NO:44具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:45具有100%序列同一性的tracrRNA;
h)所述RGN与SEQ ID NO:50具有100%序列同一性,所述引导RNA包含与SEQ ID NO:51具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:52具有100%序列同一性的tracrRNA;
i)所述RGN与SEQ ID NO:56具有100%序列同一性,所述引导RNA包含与SEQ ID NO:57具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:58具有100%序列同一性的tracrRNA;
j)所述RGN与SEQ ID NO:63和570-579中任一项具有100%序列同一性,所述引导RNA包含与SEQ ID NO:64具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:65具有100%序列同一性的tracrRNA;
k)所述RGN与SEQ ID NO:70具有100%序列同一性,所述引导RNA包含与SEQ ID NO:71具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:72具有100%序列同一性的tracrRNA;
l)所述RGN与SEQ ID NO:76具有100%序列同一性,所述引导RNA包含与SEQ ID NO:77具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有100%序列同一性的tracrRNA;
m)所述RGN与SEQ ID NO:83具有100%序列同一性,所述引导RNA包含与SEQ ID NO:84具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:85具有100%序列同一性的tracrRNA;
n)所述RGN与SEQ ID NO:89具有100%序列同一性,所述引导RNA包含与SEQ ID NO:90具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:91具有100%序列同一性的tracrRNA;
o)所述RGN与SEQ ID NO:96具有100%序列同一性,所述引导RNA包含与SEQ ID NO:97具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:98具有100%序列同一性的tracrRNA;
p)所述RGN与SEQ ID NO:103具有100%序列同一性,所述引导RNA包含与SEQ ID NO:104具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:105具有100%序列同一性的tracrRNA;
q)所述RGN与SEQ ID NO:110具有100%序列同一性,所述引导RNA包含与SEQ ID NO:111具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:112具有100%序列同一性的tracrRNA;
r)所述RGN与SEQ ID NO:117具有100%序列同一性,所述引导RNA包含与SEQ ID NO:118具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:119具有100%序列同一性的tracrRNA;
s)所述RGN与SEQ ID NO:123具有100%序列同一性,所述引导RNA包含与SEQ ID NO:124具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:125具有100%序列同一性的tracrRNA;或
t)所述RGN与SEQ ID NO:83具有100%序列同一性,所述引导RNA包含与SEQ ID NO:84具有100%序列同一性的crRNA重复序列以及与SEQ ID NO:78具有100%序列同一性的tracrRNA。
101.权利要求73至权利要求100中任一项所述的方法,其中所述目标DNA序列在细胞内。
102.权利要求101所述的方法,其中所述细胞为真核细胞。
103.权利要求102所述的方法,其中所述真核细胞为植物细胞。
104.权利要求102所述的方法,其中所述真核细胞为哺乳动物细胞。
105.权利要求102所述的方法,其中所述真核细胞为昆虫细胞。
106.权利要求101所述的方法,其中所述细胞为原核细胞。
107.权利要求101至权利要求106中任一项所述的方法,进一步包括:在所述RGN多肽被表达并且切割所述目标DNA序列以产生包含经修饰的DNA序列的DNA分子的条件下,培养所述细胞;以及选择包含所述经修饰的目标DNA序列的细胞。
108.一种包含权利要求107所述的方法的经修饰的目标DNA序列的细胞。
109.权利要求108所述的细胞,其中所述细胞为真核细胞。
110.权利要求109所述的细胞,其中所述真核细胞为植物细胞。
111.一种包含权利要求110所述的细胞的植物。
112.一种包含权利要求110所述的细胞的种子。
113.权利要求109所述的细胞,其中所述真核细胞为哺乳动物细胞。
114.权利要求113所述的细胞,其中所述哺乳动物细胞为人类细胞。
115.权利要求114所述的细胞,其中所述人类细胞为免疫细胞。
116.权利要求115所述的细胞,其中所述免疫细胞为干细胞。
117.权利要求116所述的细胞,其中所述干细胞为经诱导的多潜能干细胞。
118.权利要求109所述的细胞,其中所述真核细胞为昆虫细胞。
119.权利要求108所述的细胞,其中所述细胞为原核细胞。
120.一种包含权利要求108、权利要求109及权利要求113至权利要求117中任一项所述的细胞以及药学上可接受的载体的药物组合物。
121.一种治疗疾病的方法,所述方法包括向有需要的受试者施用有效量的权利要求72或权利要求120所述的药物组合物。
122.权利要求121所述的方法,其中所述疾病与因果突变关联,并且有效量的所述药物组合物校正所述因果突变。
CN202180044771.9A 2020-04-24 2021-04-23 Rna引导的核酸酶及其活性片段和变体以及使用方法 Pending CN116096879A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063014970P 2020-04-24 2020-04-24
US63/014,970 2020-04-24
US202063077211P 2020-09-11 2020-09-11
US63/077,211 2020-09-11
PCT/US2021/028843 WO2021217002A1 (en) 2020-04-24 2021-04-23 Rna-guided nucleases and active fragments and variants thereof and methods of use

Publications (1)

Publication Number Publication Date
CN116096879A true CN116096879A (zh) 2023-05-09

Family

ID=75919401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180044771.9A Pending CN116096879A (zh) 2020-04-24 2021-04-23 Rna引导的核酸酶及其活性片段和变体以及使用方法

Country Status (12)

Country Link
US (4) US20230175018A1 (zh)
EP (2) EP4242306A3 (zh)
JP (1) JP2023516226A (zh)
KR (1) KR20230014700A (zh)
CN (1) CN116096879A (zh)
AU (1) AU2021258273A1 (zh)
BR (1) BR112022021459A2 (zh)
CA (1) CA3174124A1 (zh)
IL (1) IL297500A (zh)
MX (1) MX2022013187A (zh)
TW (1) TW202208626A (zh)
WO (1) WO2021217002A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022242754A1 (en) 2021-03-22 2023-11-02 LifeEDIT Therapeutics, Inc. Dna modifyng enzymes and active fragments and variants thereof and methods of use
WO2022261394A1 (en) 2021-06-11 2022-12-15 LifeEDIT Therapeutics, Inc. Rna polymerase iii promoters and methods of use
WO2024033901A1 (en) 2022-08-12 2024-02-15 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10167A (en) 1853-10-25 Soda-jountaiet
US457A (en) 1837-11-11 Caleb slade
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
HU218717B (hu) 1989-03-17 2000-11-28 E. I. Du Pont De Nemours And Co. Nukleinsav-termelést fokozó növényi eredetű génfragmentek és eljárás előállításukra
ES2187497T3 (es) 1990-04-12 2003-06-16 Syngenta Participations Ag Promotores preferentemente en tejidos.
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
CA2051562C (en) 1990-10-12 2003-12-02 Jewel M. Payne Bacillus thuringiensis isolates active against dipteran pests
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
JPH06510187A (ja) 1991-08-27 1994-11-17 ノバルティス アクチエンゲゼルシャフト 同翅類昆虫に対する殺虫性質を有したタンパク質及び植物保護におけるそれらの用法
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
ATE342985T1 (de) 1998-02-26 2006-11-15 Pioneer Hi Bred Int Mais alpha-tubulin 3-18 promoter
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CN1360632A (zh) 1999-05-04 2002-07-24 孟山都技术有限公司 鞘翅目毒性多肽组合物和抗虫转基因植物
CA2384967A1 (en) 1999-09-15 2001-03-22 Monsanto Technology Llc Lepidopteran-active bacillus thuringiensis .delta.-endotoxin compositions and methods of use
US6521901B1 (en) 1999-09-20 2003-02-18 Applied Materials, Inc. System to reduce heat-induced distortion of photomasks during lithography
PT1453547T (pt) 2001-12-17 2016-12-28 Univ Pennsylvania Sequências do vírus adeno-associado (aav) do serotipo 8, vetores contendo as mesmas, e utilizações destas
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
WO2005066202A2 (en) 2003-12-22 2005-07-21 E.I. Du Pont De Nemours And Company Bacillus cry9 family members
DK2032598T3 (da) 2006-06-14 2013-01-21 Athenix Corp Axmi-031, axmi-039, axmi-040 og axmi-049, en familie af deltaendotoksingener og fremgangsmåder til deres anvendelse
MX2011002731A (es) 2008-09-15 2011-04-26 Childrens Medical Center Modulacion de bcl11a para tratamiento de hemoglobinopatias.
MX346215B (es) 2009-07-02 2017-03-10 Athenix Corp Gen plaguicida axmi-205 y metodos para su uso.
US8586832B2 (en) 2009-12-21 2013-11-19 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with Lepidopteran activity
US8802934B2 (en) 2010-08-19 2014-08-12 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with lepidopteran activity
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
EP4289948A3 (en) 2012-05-25 2024-04-17 The Regents of the University of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
EP3816281A1 (en) 2012-07-11 2021-05-05 Sangamo Therapeutics, Inc. Methods and compositions for the treatment of lysosomal storage diseases
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
EP3633032A3 (en) 2014-08-28 2020-07-29 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
US11371050B2 (en) * 2015-05-15 2022-06-28 Pioneer Hi-Bred International, Inc. Rapid characterization of Cas endonuclease systems, PAM sequences and guide RNA elements
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CA3002827A1 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
EP3426778A1 (en) * 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
EP3481857A1 (en) * 2016-07-06 2019-05-15 Crispr Therapeutics AG Materials and methods for treatment of pain related disorders
CN110214183A (zh) 2016-08-03 2019-09-06 哈佛大学的校长及成员们 腺苷核碱基编辑器及其用途
SG11201906297QA (en) * 2017-03-24 2019-10-30 Curevac Ag Nucleic acids encoding crispr-associated proteins and uses thereof
JP2021506251A (ja) * 2017-12-14 2021-02-22 クリスパー セラピューティクス アーゲー 新規rnaプログラム可能エンドヌクレアーゼ系、ならびにゲノム編集および他の適用におけるその使用
EP3755792A4 (en) * 2018-02-23 2021-12-08 Pioneer Hi-Bred International, Inc. NEW CAS9 ORTHOLOGIST
US20210172008A1 (en) * 2018-04-04 2021-06-10 Lifeedit, Inc. Methods and compositions to identify novel crispr systems
WO2019236566A1 (en) * 2018-06-05 2019-12-12 Lifeedit, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2020139873A1 (en) 2018-12-24 2020-07-02 Virginia Polytechnic Institute And State University Tollip deficient neutrophils and uses thereof
EP3902911B1 (en) * 2018-12-27 2023-12-13 LifeEDIT Therapeutics, Inc. Polypeptides useful for gene editing and methods of use
CN110551762B (zh) * 2019-08-08 2023-03-10 复旦大学 CRISPR/ShaCas9基因编辑系统及其应用
JP2022545385A (ja) * 2019-08-12 2022-10-27 ライフエディット セラピューティクス,インコーポレイティド Rna誘導ヌクレアーゼ及びその活性断片及び変異体ならびに使用方法

Also Published As

Publication number Publication date
CA3174124A1 (en) 2021-10-28
KR20230014700A (ko) 2023-01-30
US11859181B2 (en) 2024-01-02
US20240026384A1 (en) 2024-01-25
WO2021217002A1 (en) 2021-10-28
US20230235360A1 (en) 2023-07-27
IL297500A (en) 2022-12-01
EP4118198A1 (en) 2023-01-18
JP2023516226A (ja) 2023-04-18
US20230175018A1 (en) 2023-06-08
MX2022013187A (es) 2022-11-14
US20230257742A1 (en) 2023-08-17
US11981916B2 (en) 2024-05-14
TW202208626A (zh) 2022-03-01
BR112022021459A2 (pt) 2023-01-17
EP4242306A3 (en) 2023-10-18
EP4242306A2 (en) 2023-09-13
AU2021258273A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
US11926843B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
EP3902911B1 (en) Polypeptides useful for gene editing and methods of use
US11859181B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
EP4013864A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
US20230203463A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2023139557A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
CA3125175A1 (en) Polypeptides useful for gene editing and methods of use
WO2021231437A1 (en) Rna-guided nucleic acid binding proteins and active fragments and variants thereof and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination