CN113286619A - 用于调节适应性免疫的组合物和方法 - Google Patents

用于调节适应性免疫的组合物和方法 Download PDF

Info

Publication number
CN113286619A
CN113286619A CN201980051039.7A CN201980051039A CN113286619A CN 113286619 A CN113286619 A CN 113286619A CN 201980051039 A CN201980051039 A CN 201980051039A CN 113286619 A CN113286619 A CN 113286619A
Authority
CN
China
Prior art keywords
sequence
rna
present disclosure
protein
grna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980051039.7A
Other languages
English (en)
Inventor
D·A·内尔斯
R·巴特拉
E·杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rocana Biological Co ltd
Locana Inc
Original Assignee
Rocana Biological Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rocana Biological Co ltd filed Critical Rocana Biological Co ltd
Publication of CN113286619A publication Critical patent/CN113286619A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1136Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Endocrinology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

公开了用于同时提供基因疗法并且防止受试者的免疫系统对通过所述基因疗法修饰的细胞的适应性免疫应答的组合物和方法。在一些实施方案中,本公开文本的组合物修饰与疾病或障碍相关的RNA分子的表达水平,以及抑制适应性免疫应答的组分的表达或活性,以从受试者的免疫系统中掩蔽所述修饰的细胞。

Description

用于调节适应性免疫的组合物和方法
技术领域
本公开文本涉及分子生物学,并且更具体而言涉及用于修饰涉及适应性免疫应答的RNA分子的表达和活性的组合物和方法。
相关申请的交叉引用
本申请要求2018年6月8日提交的美国专利申请号62/682,276的优先权,将其内容通过引用以其整体并入本文。将2019年6月7日提交的国际申请号PCT/US2019/036021、2019年6月7日提交的美国专利申请号16/434,689和2018年6月8日提交的美国专利申请号62/682,271的内容通过引用以其整体并入本文。
序列表的并入
将2019年6月6日创建的大小为2.93MB的名为“LOCN_003_001WO_SeqList_ST25”的文本文件的内容通过引用以其整体特此并入。
背景技术
对于同时提供基因疗法并且抑制当例如通过病毒载体递送所述基因疗法时可能出现的适应性免疫应答,在本领域中存在长期但未得到满足的需要。本公开文本提供了用于以序列特异性方式特异性靶向RNA分子的组合物和方法,其在体内提供基因疗法,同时从受试者的免疫系统中掩蔽修饰的细胞,从而防止对所述修饰的细胞的适应性免疫应答。
发明内容
本公开文本提供了一种组合物,其包含含有特异性结合靶RNA序列的指导RNA(gRNA)序列的核酸序列,其中所述靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
本公开文本还提供了一种组合物,其包含(a)包含特异性结合RNA分子内的靶序列的指导RNA(gRNA)的第一序列,其中所述靶序列包含编码适应性免疫应答的组分的序列;以及(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
本公开文本提供了一种组合物,其包含:(a)包含特异性结合第一RNA分子内的第一靶序列的指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;和(b)包含特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列;以及(c)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一靶序列或所述第二靶序列包含至少一个重复的序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一序列包含能够在真核细胞中表达所述gRNA的第一启动子和/或所述第二序列包含能够在真核细胞中表达所述gRNA的第二启动子。在一些实施方案中,所述第一启动子和所述第二启动子是相同的。在一些实施方案中,所述第一启动子和所述第二启动子是不同的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一序列和所述第二序列包含能够在真核细胞中表达所述第一gRNA和所述第二gRNA的启动子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述真核细胞是动物细胞。在一些实施方案中,所述动物细胞是哺乳动物细胞。在一些实施方案中,所述动物细胞是人细胞。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述启动子是组成型活性启动子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述gRNA序列包含从能够驱动RNA聚合酶的表达的启动子分离或衍生的序列。在一些实施方案中,所述启动子序列是从U6启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述启动子包含从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的序列。在一些实施方案中,所述启动子序列是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。在一些实施方案中,所述启动子序列是从缬氨酸tRNA启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第一gRNA的序列还包含与所述第一靶RNA序列特异性结合的第一间隔子序列。在一些实施方案中,所述第一间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述第一间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述第一间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含编码β-2-微球蛋白(β2M)蛋白的氨基酸序列的20个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含以下的氨基酸序列的20个核苷酸或由其组成:
MSRSVALAVL ALLSLSGLEA IQRTPKIQVY SRHPADIEVD LLKNGERIEK VEHSDLSFSKDWSFYLLYYT EFTPTEKDEY ACRVNHVTLS QPKIVKWDRD M(SEQ ID NO:88)。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第一gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第一支架序列。在一些实施方案中,所述第一支架序列包含茎环结构。在一些实施方案中,所述支架序列包含90个核苷酸或由其组成。在一些实施方案中,所述支架序列包含93个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第二gRNA的序列还包含与所述第二靶RNA序列特异性结合的第二间隔子序列。在一些实施方案中,所述第二间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述第二间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述第二间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述第二间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述第二间隔子序列包含或还包含含有以下序列的至少1、2、3、4、5、6或7个重复的序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第二gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第二支架序列。在一些实施方案中,所述第二支架序列包含茎环结构。在一些实施方案中,所述支架序列包含85个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一gRNA不结合或不选择性结合所述第一RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二gRNA不结合或不选择性结合所述第二RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,RNA基因组或RNA转录组包含所述第一RNA分子或所述第二RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且其中所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白或其RNA结合部分。在一些实施方案中,所述第一RNA结合蛋白包含基于Pumilio的联合体(Pumilio-based assembly,PUMBY)蛋白或其RNA结合部分。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述第一RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述第一RNA结合蛋白。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。在一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,编码所述第一RNA结合蛋白的序列还包含编码核定位信号(NLS)的序列。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶1或由其组成。在一些实施方案中,所述RNA酶1蛋白包含SEQ ID NO:20或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶4或由其组成。在一些实施方案中,所述RNA酶4蛋白包含SEQ ID NO:21或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6或由其组成。在一些实施方案中,所述RNA酶6蛋白包含SEQ ID NO:22或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶7或由其组成。在一些实施方案中,所述RNA酶7蛋白包含SEQ ID NO:23或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶8或由其组成。在一些实施方案中,所述RNA酶8蛋白包含SEQ ID NO:24或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶2或由其组成。在一些实施方案中,所述RNA酶2包含SEQ ID NO:25或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6PL或由其组成。在一些实施方案中,所述RNA酶6PL蛋白包含SEQ ID NO:26或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶L或由其组成。在一些实施方案中,所述RNA酶L蛋白包含SEQ ID NO:27或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2或由其组成。在一些实施方案中,所述RNA酶T2蛋白包含SEQ ID NO:28或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶11或由其组成。在一些实施方案中,所述RNA酶11蛋白包含SEQ ID NO:29或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2样蛋白或由其组成。在一些实施方案中,所述RNA酶T2样蛋白包含SEQ ID NO:30或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含NOB1多肽或由其组成。在一些实施方案中,所述NOB1多肽包含SEQ ID NO:31或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内切核酸酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)或由其组成。在一些实施方案中,所述ENDOV包含SEQ ID NO:32或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)或由其组成。在一些实施方案中,所述ENDOG包含SEQ ID NO:33或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)或由其组成。在一些实施方案中,所述ENDOD1包含SEQ ID NO:34或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)或由其组成。在一些实施方案中,所述hFEN1包含SEQ ID NO:35或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人斯库拉芬蛋白(Schlafen)14(hSLFN14)多肽或由其组成。在一些实施方案中,所述hSLFN14包含SEQ ID NO:36或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。在一些实施方案中,所述hLACTB2包含SEQID NO:37或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。在一些实施方案中,所述APEX2包含SEQ ID NO:38或由其组成。在一些实施方案中,所述APEX2包含SEQ ID NO:39或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。在一些实施方案中,所述ANG包含SEQ ID NO:40或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。在一些实施方案中,所述HRSP12包含SEQ ID NO:41或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含含锌指CCCH型12A(Zinc Finger CCCH-Type Containing 12A,ZC3H12A)或由其组成。在一些实施方案中,所述ZC3H12A包含SEQ ID NO:42或由其组成。在一些实施方案中,所述ZC3H12A包含SEQ ID NO:43或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(Reactive Intermediate Imine Deaminase A,RIDA)多肽或由其组成。在一些实施方案中,所述RIDA多肽包含SEQ ID NO:44或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。在一些实施方案中,所述PDL6多肽包含SEQ IDNO:126或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。在一些实施方案中,所述NTHL多肽包含SEQID NO:123或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。在一些实施方案中,所述KIAA0391多肽包含SEQ ID NO:127或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。在一些实施方案中,所述APEX1多肽包含SEQ ID NO:125或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含阿尔古蛋白(argonaute)2(AGO2)多肽或由其组成。在一些实施方案中,编码所述AGO2多肽包含SEQ ID NO:128或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。在一些实施方案中,所述EXOG多肽包含SEQ IDNO:129或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。在一些实施方案中,所述ZC3H12D多肽包含SEQID NO:130或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。在一些实施方案中,所述ERN2多肽包含SEQID NO:131或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(pelota mRNA surveillance and ribosome rescuefactor,PELO)多肽或由其组成。在一些实施方案中,所述PELO多肽包含SEQ ID NO:132或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。在一些实施方案中,所述YBEY多肽包含SEQ ID NO:133或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。在一些实施方案中,所述CPSF4L多肽包含SEQ ID NO:134或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。在一些实施方案中,所述hCG_2002731多肽包含SEQ ID NO:135或由其组成。在一些实施方案中,编码所述hCG_2002731多肽的序列包含SEQ ID NO:136或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。在一些实施方案中,所述ERCC1多肽包含SEQID NO:137或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。在一些实施方案中,所述RAC1多肽包含SEQ ID NO:138或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。在一些实施方案中,所述RAA1多肽包含SEQ ID NO:139或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。在一些实施方案中,所述RAB1多肽包含SEQ ID NO:140或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。在一些实施方案中,所述DNA2多肽包含SEQID NO:141或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。在一些实施方案中,所述FLJ35220多肽包含SEQ ID NO:142或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。在一些实施方案中,所述FLJ13173多肽包含SEQ ID NO:143或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。在一些实施方案中,所述ERCC4多肽包含SEQID NO:124或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。在一些实施方案中,所述RNA酶1(K41R)多肽包含SEQ ID NO:116或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(K41R、D121E))多肽包含SEQ ID NO:117或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含SEQ ID NO:118或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(H119N))多肽包含SEQ ID NO:119或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含SEQ ID NO:120或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含SEQID NO:121或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含SEQ ID NO:122或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含特诺伊林(Teneurin)跨膜蛋白1(TENM1)多肽或由其组成。在一些实施方案中,所述TENM1多肽包含SEQ ID NO:144或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM2)多肽或由其组成。在一些实施方案中,所述TENM2多肽包含SEQ IDNO:145或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核糖核酸酶κ(RNA酶K)多肽或由其组成。在一些实施方案中,所述RNA酶K蛋白包含SEQ ID NO:204或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述TALEN多肽包含以下序列或由其组成:
Figure BDA0002925003530000191
Figure BDA0002925003530000201
在一些实施方案中,所述TALEN多肽包含以下序列或由其组成:
Figure BDA0002925003530000202
Figure BDA0002925003530000211
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含ZNF638多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述ZNF638多肽多肽包含以下序列或由其组成:
Figure BDA0002925003530000212
Figure BDA0002925003530000221
在本公开文本的组合物的一些实施方案中,所述组合物还包含(a)包含特异性结合于RNA分子内的gRNA的序列;以及(b)编码核酸酶的序列。在一些实施方案中,编码核酸酶的所述序列包含从CRISPR/Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR/Cas蛋白是从以下中的任一种分离或衍生的:I型、IA型、IB型、IC型、ID型、IE型、IF型、IU型、III型、IIIA型、IIIB型、IIIC型、IIID型、IV型、IVA型、IVB型、II型、IIA型、IIB型、IIC型、V型或VI型CRISPR/Cas蛋白。在一些实施方案中,编码核酸酶的所述序列包含从TALEN或其核酸酶结构域分离或衍生的序列。在一些实施方案中,编码核酸酶的所述序列包含从锌指核酸酶或其核酸酶结构域分离或衍生的序列。在一些实施方案中,所述靶序列包含编码适应性免疫应答的组分的序列。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体包含从慢病毒、腺病毒、腺相关病毒(AAV)载体或逆转录病毒分离或衍生的序列。在一些实施方案中,所述载体无复制能力。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体包含从腺相关载体(AAV)分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)是分离的AAV。在一些实施方案中,所述腺相关病毒(AAV)是自身互补的腺相关病毒(scAAV)。在一些实施方案中,所述腺相关病毒(AAV)是重组腺相关病毒(rAAV)。在一些实施方案中,所述腺相关病毒(AAV)包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)包含从血清型AAV9的AAV分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)包含从Anc80分离或衍生的序列。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是逆转录病毒。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是慢病毒。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是非病毒载体。在一些实施方案中,所述非病毒载体包含纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物(lipoplex)、聚合物囊泡(polymersome)、聚合物/DNA复合物(polyplex)或树枝状聚合物。
本公开文本提供了一种包含本公开文本的载体的组合物。
本公开文本提供了一种包含本公开文本的载体的细胞。
本公开文本提供了一种包含本公开文本的细胞的细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述免疫细胞是T淋巴细胞(T细胞)。在一些实施方案中,所述T细胞是效应T细胞、辅助T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关恒定T细胞或γδT细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述免疫细胞是抗原呈递细胞。在一些实施方案中,所述抗原呈递细胞是树突细胞、巨噬细胞或B细胞。在一些实施方案中,所述抗原呈递细胞是体细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述细胞是健康细胞。在一些实施方案中,所述细胞不是健康细胞。在一些实施方案中,所述细胞是从患有疾病或障碍的受试者分离或衍生的。
本公开文本提供了一种包含本公开文本的细胞的组合物。
本公开文本提供了一种包含本公开文本的多个细胞的组合物。
本公开文本提供了一种从适应性免疫应答中掩蔽细胞的方法,其包括使本公开文本的组合物与所述细胞接触以产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述细胞是体外的或离体的。在一些实施方案中,多个细胞包含所述细胞。在一些实施方案中,使所述多个细胞中的每个细胞与所述组合物接触,从而产生多个修饰的细胞。在一些实施方案中,所述方法还包括向受试者施用所述修饰的细胞。在一些实施方案中,所述方法还包括向受试者施用所述多个修饰的细胞。在一些实施方案中,所述细胞是自体的。在一些实施方案中,所述细胞是同种异体的。在一些实施方案中,所述多个修饰的细胞是自体的。在一些实施方案中,所述多个修饰的细胞是同种异体的。在一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。在一些实施方案中,适应性免疫应答的蛋白质组分是但不限于β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)或CC趋化因子受体7(CCR7)。
本公开文本提供了一种防止或减少受试者的适应性免疫应答的方法,其包括向所述受试者施用治疗有效量的本公开文本的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
本公开文本提供了一种治疗受试者的疾病或障碍的方法,其包括向所述受试者施用治疗有效量的本公开文本的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述组合物防止或减少对所述修饰的细胞的适应性免疫应答。
在本公开文本的方法的一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHCII)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
在本公开文本的治疗疾病或障碍的方法的一些实施方案中,所述疾病或障碍是遗传疾病或障碍。在一些实施方案中,所述疾病或障碍是单基因遗传疾病或障碍。在一些实施方案中,所述疾病或障碍是由微卫星不稳定性引起的。在一些实施方案中,所述微卫星不稳定性发生在DNA序列的至少1、2、3、4、5或6个重复的基序处。在一些实施方案中,RNA分子包含所述DNA序列的转录物,并且其中所述组合物与所述RNA分子的靶序列结合,所述靶序列包含至少1、2、3、4、5或6个重复的基序。
在本公开文本的方法的一些实施方案中,全身性施用所述组合物。在一些实施方案中,静脉内施用所述组合物。在一些实施方案中,通过注射或输注施用所述组合物。
在本公开文本的方法的一些实施方案中,局部施用所述组合物。在一些实施方案中,通过骨内、眼内、脑内或脊柱内途径施用所述组合物。在一些实施方案中,通过注射或输注施用所述组合物。
在本公开文本的方法的一些实施方案中,所述组合物的治疗有效量是单剂量。
在本公开文本的方法的一些实施方案中,所述组合物是非基因组整合的。
附图说明
所述专利或申请文件含有至少一张彩色附图。在请求并支付必要的费用后,官方将会提供带有一张或多张彩色附图的本专利或专利申请公开案的副本。
图1A是描绘了示例性RNA内切核酸酶-空肠弯曲杆菌(C.jejuni)Cas9融合蛋白的示意图。
图1B是描绘了在E43和E67 CjeCas9-内切核酸酶融合物二者的存在下Zika NS5的表达水平的变化的图,所述融合物具有含有如表8中指示的各种靶向NS5的间隔子序列的sgRNA。将Zika NS5表达展示为相对于加载有含有对照(λ)间隔子序列的sgRNA的内切核酸酶的变化倍数。
图2A是用加载有含有靶向Zika NS5的间隔子序列的sgRNA的CjeCas9-内切核酸酶融合物转染的细胞的荧光显微镜检查图像。
图2B是描绘了如与加载有不靶向Zika NS5的sgRNA的CjeCas9-内切核酸酶融合物相比在加载有靶向Zika NS5的适当sgRNA的CjeCas9-内切核酸酶融合物的存在下Zika NS5的表达的变化的图。
图3是用于本公开文本的组合物中的示例性内切核酸酶的列表。
图4是描绘了编码示例性RNA内切核酸酶-空肠弯曲杆菌Cas9融合蛋白和用于在基因疗法的背景下调节免疫应答的两种gRNA分子的构建体的示意图。本发明描述了使用基于CRISPR的基因疗法或在AAV中编码的其他非自身蛋白同时改变宿主基因表达以防止对非自身蛋白的适应性免疫应答来解决人类疾病的方式。在一个实施方案中,所述AAV颗粒(左)携带一对指导RNA和CRISPR相关(Cas)蛋白。所述指导物分别靶向与适应性免疫应答相关的基因和促进治疗效果的基因(或基因产物)。递送至靶组织后,所述靶向免疫应答的指导物减少与抗原呈递(β-2-微球蛋白,B2M)或T细胞的共刺激(ICOSLG、CD80、CD86、OX40L、IL12、CCR7)相关的基因的表达。抗原呈递抑制防止对治疗性转基因(如Cas蛋白)具有特异性的T辅助(Th)细胞的形成,同时共刺激抑制防止对转基因具有特异性的Th细胞的激活。
具体实施方式
本公开文本提供了用于通过靶向修饰的细胞的RNA分子同时治疗疾病并且同时从适应性免疫应答中掩蔽所述修饰的细胞的组合物和方法。通过抑制或减少在所述修饰的细胞中适应性免疫应答的组分的表达,所述修饰的细胞对于宿主免疫系统不可见。例如,本公开文本的组合物可以同时靶向与遗传疾病或障碍相关的RNA分子和编码MHC I的β2M亚基的RNA分子。通过选择性靶向编码MHC I的β2M亚基的RNA分子,所述组合物防止所述修饰的细胞在所述修饰的细胞表面上展示一种或多种衍生自RNA靶向构建体、载体或其组合的抗原肽。因此,受试者的免疫系统不会将所述修饰的细胞鉴定为含有外源序列,并且不会尝试针对所述修饰的细胞产生免疫应答。此方法提高了治疗所述遗传疾病或障碍的治疗功效,同时避免了基因疗法的常见副作用。
靶向RNA的融合蛋白组合物
本公开文本提供了一种组合物,其包含(a)包含特异性结合RNA分子内的靶序列的指导RNA(gRNA)的序列;以及(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在本公开文本的组合物的一些实施方案中,所述靶序列包含至少一个重复的序列。
在本公开文本的组合物的一些实施方案中,所述gRNA序列包含能够在真核细胞中表达所述gRNA的启动子。
在本公开文本的组合物的一些实施方案中,所述真核细胞是动物细胞。在一些实施方案中,所述动物细胞是哺乳动物细胞。在一些实施方案中,所述动物细胞是人细胞。
在本公开文本的组合物的一些实施方案中,所述启动子是组成型活性启动子。在一些实施方案中,所述启动子序列是从能够驱动RNA聚合酶的表达的启动子分离或衍生的。在一些实施方案中,所述启动子序列是从U6启动子分离或衍生的。在一些实施方案中,所述启动子序列是从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的。在一些实施方案中,所述启动子序列是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。在一些实施方案中,所述启动子序列是从缬氨酸tRNA启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由其组成:
UGGAGCGAGCAUCCCCCAAA(SEQ ID NO:1)、GUUUGGGGGAUGCUCGCUCCA(SEQ ID NO:2)、CCCUCACUGCUGGGGAGUCC(SEQ ID NO:3)、GGACUCCCCAGCAGUGAGGG(SEQ ID NO:4)、GCAACUGGAUCAAUUUGCUG(SEQ ID NO:5)、GCAGCAAAUUGAUCCAGUUGC(SEQ ID NO:6)、GCAUUCUUAUCUGGUCAGUGC(SEQ ID NO:7)、GCACUGACCAGAUAAGAAUG(SEQ ID NO:8)、GAGCAGCAGCAGCAGCAGCAG(EQ ID NO:9)、GCAGGCAGGCAGGCAGGCAGG(SEQ ID NO:10)、GCCCCGGCCCCGGCCCCGGC(SEQ ID NO:11)或GCTGCTGCTGCTGCTGCTGC(SEQ ID NO:84)、GGGGCCGGGGCCGGGGCCGG(SEQ ID NO:74)、GGGCCGGGGCCGGGGCCGGG(SEQ ID NO:75)、GGCCGGGGCCGGGGCCGGGG(SEQ ID NO:76)、GCCGGGGCCGGGGCCGGGGC(SEQ ID NO:77)、CCGGGGCCGGGGCCGGGGCC(SEQ ID NO:78)或CGGGGCCGGGGCCGGGGCCG(SEQ ID NO:79)。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由其组成:
GUGAUAAGUGGAAUGCCAUG(SEQ ID NO:14)、CUGGUGAACUUCCGAUAGUG(SEQ ID NO:15)或GAGATATAGCCTGGTGGTTC(SEQ ID NO:16)。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由以下序列组成,所述序列包含序列CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合的至少1、2、3、4、5、6或7个重复。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的支架序列。在一些实施方案中,所述支架序列包含茎环结构。在一些实施方案中,所述支架序列包含90个核苷酸或由其组成。在一些实施方案中,所述支架序列包含93个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列或由其组成:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:83)。在一些实施方案中,所述支架序列包含以下序列或由其组成:
GGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU(SEQ ID NO:17)。在一些实施方案中,所述支架序列包含以下序列或由其组成:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:82)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。在一些实施方案中,所述第一RNA结合蛋白包含Cas13d多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。在一些实施方案中,所述第一RNA结合蛋白包含基于Pumilio的联合体(PUMBY)蛋白。在一些实施方案中,本公开文本的PUF1蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000321
在一些实施方案中,本公开文本的PUF3蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000322
Figure BDA0002925003530000331
Figure BDA0002925003530000332
在一些实施方案中,本公开文本的PUF4蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000333
在一些实施方案中,本公开文本的PUF5蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000341
Figure BDA0002925003530000342
在一些实施方案中,本公开文本的PUF6蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000343
Figure BDA0002925003530000344
在一些实施方案中,本公开文本的PUF7蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000345
Figure BDA0002925003530000351
在一些实施方案中,本公开文本的PUF8蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000352
Figure BDA0002925003530000353
在一些实施方案中,本公开文本的PUF9蛋白包含以下的氨基酸序列或由其组成:
Figure BDA0002925003530000354
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述第一RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述第一RNA结合蛋白。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白的序列还包含核定位信号(NLS)。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。
在本公开文本的组合物的一些实施方案中,编码所述第二RNA结合蛋白的序列包含RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶1多肽或由其组成。在一些实施方案中,RNA酶1多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGLCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:20)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶4多肽或由其组成。在一些实施方案中,RNA酶4多肽包含以下序列或由其组成:
QDGMYQRFLRQHVHPEETGGSDRYCDLMMQRRKMTLYHCKRFNTFIHEDIWNIRSICSTTNIQCKNGKMNCHEGVVKVTDCRDTGSSRAPNCRYRAIASTRRVVIACEGNPQVPVHFDG(SEQ ID NO:21)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6多肽或由其组成。在一些实施方案中,RNA酶6多肽包含以下序列或由其组成:
WPKRLTKAHWFEIQHIQPSPLQCNRAMSGINNYTQHCKHQNTFLHDSFQ
NVAAVCDLLSIVCKNRRHNCHQSSKPVNMTDCRLTSGKYPQCRYSAAAQYKFFIVACDPPQKSDPPYKLVPVHLDSIL(SEQ ID NO:22)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶7多肽或由其组成。在一些实施方案中,RNA酶7多肽包含以下序列或由其组成:
APARAGFCPLLLLLLLGLWVAEIPVSAKPKGMTSSQWFKIQHMQPSPQACNSAMKNINKHTKRCKDLNTFLHEPFSSVAATCQTPKIACKNGDKNCHQSHGPVSLTMCKLTSGKYPNCRYKEKRQNKSYVVACKPPQKKDSQQFHLVPVHLDRVL(SEQ ID NO:23)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶8多肽或由其组成。在一些实施方案中,RNA酶8多肽包含以下序列或由其组成:
TSSQWFKTQHVQPSPQACNSAMSIINKYTERCKDLNTFLHEPFSSVAITCQTPNIACKNSCKNCHQSHGPMSLTMGELTSGKYPNCRYKEKHLNTPYIVACDPPQQGDPGYPLVPVHLDKVV(SEQ ID NO:24)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶2多肽或由其组成。在一些实施方案中,RNA酶2多肽包含以下序列或由其组成:
KPPQFTWAQWFETQHINMTSQQCTNAMQVINNYQRRCKNQNTFLLTTFANVVNVCGNPNMTCPSNKTRKNCHHSGSQVPLIHCNLTTPSPQNISNCRYAQTPANMFYIVACDNRDQRRDPPQYPVVPVHLDRII(SEQ ID NO:25)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6PL多肽或由其组成。在一些实施方案中,RNA酶6PL多肽包含以下序列或由其组成:
DKRLRDNHEWKKLIMVQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKKNWMEITDSSLPSPSMGPAPPRWMRSTPRRSTLAEAWNSTGSWTSTGGCALPPAALPSGDLCCRPSLTAGSRGVGVDLTALHQLLHVHYSATGIIPEECSEPTKPFQIILHHDHTEWVQSIGMPIWGTISSSESAIGKNEESQPACAVLSHDS(SEQID NO:26)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶L多肽或由其组成。在一些实施方案中,RNA酶L多肽包含以下序列或由其组成:
AAVEDNHLLIKAVQNEDVDLVQQLLEGGANVNFQEEEGGWTPLHNAVQMSREDIVELLLRHGADPVLRKKNGATPFILAAIAGSVKdLLKLFLSKGADVNECDFYGFTAFMEAAVYGKVKALKFLYKRGANVNLRRKTKEDQERLRKGGATALMDAAEKGHVEVLKILLDEMGADVNACDNMGRNALIHALLSSDDSDVEAITHLLLDHGADVNVRGERGKTPLILAVEKKHLGLVQRLLEQEHIEINDTDSDGKTALLLAVELKLKKIAELLCKRGASTDCGDLVMTARRNYDHSLVKVLLSHGAKEDFHPPAEDWKPQSSHWGAALKDLHRIYRPMIGKLKFFIDEKYKIADTSEGGIYLGFYEKQEVAVKTFCEGSPRAQREVSCLQSSRENSHLVTFYGSESHRGHLFVCVTLCEQTLEACLDVHRGEDVENEEDEFARNVLSSIFKAVQELHLSCGYTHQDLQPQNILIDSKKAAHLADFDKSIKWAGDPQEVKRDLEDLGRLVLYVVKKGSISFEDLKAQSNEEVVQLSPDEETKDLIHRLFHPGEHVRDCLSDLLGHPFFWTWESRYRTLRNVGNESDIKTRKSESEILRLLQPGPSEHSKSFDKWTTKINECVMKKMNKFYEKRGNFYQNTVGDLLKFIRNLGEHIDEEKHKKMKLKIGDPSLYFQKTFPDLVIYVYTKLQNTEYRKHFPQTHSPNKPQCDGAGGASGLASPGC(SEQ ID NO:27)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2多肽或由其组成。在一些实施方案中,RNA酶T2多肽包含以下序列或由其组成:
VQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKDLLPEMRAYWPDVIHSFPNRSRFWKHEWEKHGTCAAQVDALNSQKKYFGRSLELYRELDLNSVLLKLGIKPSINYYQVADFKDALARVYGVIPKIQCLPPSQDEEVQTIGQIELCLTKQDQQLQNCTEPGEQPSPKQEVWLANGAAESRGLRVCEDGPVFYPPPKKTKH(SEQID NO:28)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶11多肽或由其组成。在一些实施方案中,RNA酶11多肽包含以下序列或由其组成:
EASESTMKIIKEEFTDEEMQYDMAKSGQEKQTIEILMNPILLVKNTSLSMSKDDMSSTLLTFRSLHYNDPKGNSSGNDKECCNDMTVWRKVSEANGSCKWSNNFIRSSTEVMRRVHRAPSCKFVQNPGISCCESLELENTVCQFTTGKQFPRCQYHSVTSLEKILTVLTGHSLMSWLVCGSKL(SEQ ID NO:29)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2样多肽或由其组成。在一些实施方案中,RNA酶T2样多肽包含以下序列或由其组成:
XLGGADKRLRDNHEWKKLIMVQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKDLLPEMRAYWPDVIHSFPNRSRFWKHEWEKHGTCAAQVDALNSQKKYFGRSLELYRELDLNSVLLKLGIKPSINYYQTTEEDLNLDVEPTTEDTAEEVTIHVLLHSALFGEIGPRRW(SEQ ID NO:30)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。在一些实施方案中,RNA酶1(K41R)多肽包含以下序列或由其组成:KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:116)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(K41R、D121E))包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFEASVEDST(SEQ ID NO:117)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:118)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVNFDASVEDST(SEQ ID NO:119)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCKPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFDASVEDST(SEQ ID NO:120)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCRPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:121)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCKPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:122)。
在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽或由其组成,所述多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCRPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:225)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含NOB1多肽或由其组成。在一些实施方案中,NOB1多肽包含以下序列或由其组成:
APVEHVVADAGAFLRHAALQDIGKNIYTIREVVTEIRDKATRRRLAVLPYELRFKEPLPEYVRLVTEFSKKTGDYPSLSATDIQVLALTYQLEAEFVGVSHLKQEPQKVKVSSSIQHPETPLHISGFHLPYKPKPPQETEKGHSACEPENLEFSSFMFWRNPLPNIDHELQELLIDRGEDVPSEEEEEEENGFEDRKDDSDDDGGGWITPSNIKQIQQELEQCDVPEDVRVGCLTTDFAMQNVLLQMGLHVLAVNGMLIREARSYILRCHGCFKTTSDMSRVFCSHCGNKTLKKVSVTV(SEQ ID NO:31)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)或由其组成。在一些实施方案中,ENDOV多肽包含以下序列或由其组成:
AFSGLQRVGGVDVSFVKGDSVRACASLVVLSFPELEVVYEESRMVSLTAPYVSGFLAFREVPFLLELVQQLREKEPGLMPQVLLVDGNGVLHHRGFGVACHLGVLTDLPCVGVAKKLLQVDGLENNALHKEKIRLLQTRGDSFPLLGDSGTVLGMALRSHDRSTRPLYISVGHRMSLEAAVRLTCCCCRFRIPEPVRQADICSREHIRKS(SEQ ID NO:32)。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)多肽或由其组成。在一些实施方案中,ENDOG多肽包含以下序列或由其组成:
AELPPVPGGPRGPGELAKYGLPGLAQLKSRESYVLCYDPRTRGALWVVEQLRPERLRGDGDRRECDFREDDSVHAYHRATNADYRGSGFDRGHLAAAANHRWSQKAMDDTFYLSNVAPQVPHLNQNAWNNLEKYSRSLTRSYQNVYVCTGPLFLPRTEADGKSYVKYQVIGKNHVAVPTHFFKVLILEAAGGQIELRTYVMPNAPVDEAIPLERFLVPIESIERASGLLFVPNILARAGSLKAITAGSK(SEQ ID NO:33)。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)多肽或由其组成。在一些实施方案中,ENDOD1多肽包含以下序列或由其组成:
RLVGEEEAGFGECDKFFYAGTPPAGLAADSHVKICQRAEGAERFATLYSTRDRIPVYSAFRAPRPAPGGAEQRWLVEPQIDDPNSNLEEAINEAEAITSVNSLGSKQALNTDYLDSDYQRGQLYPFSLSSDVQVATFTLTNSAPMTQSFQERWYVNLHSLMDRALTPQCGSGEDLYILTGTVPSDYRVKDKVAVPEFVWLAACCAVPGGGWAMGFVKHTRDSDIIEDVMVKDLQKLLPFNPQLFQNNCGETEQDTEKMKKILEVVNQIQDEERMVQSQKSSSPLSSTRSKRSTLLPPEASEGSSSFLGKLMGFIATPFIKLFQLIYYLVVAILKNIVYFLWCVTKQVINGIESCLYRLGSATISYFMAIGEELVSIPWKVLKVVAKVIRALLRILCCLLKAICRVLSIPVRVLVDVATFPVYTMGAIPIVCKDIALGLGGTVSLLFDTAFGTLGGLFQVVFSVCKRIGYKVTFDNSGEL(SEQ ID NO:34)。在一些实施方案中,所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)多肽或由其组成。在一些实施方案中,hFEN1多肽包含以下序列或由其组成:
MGIQGLAKLIADVAPSAIRENDIKSYFGRKVAIDASMSIYQFLIAVRQGGDVLQNEEGETTSHLMGMFYRTIRMMENGIKPVYVFDGKPPQLKSGELAKRSERRAEAEKQLQQAQAAGAEQEVEKFTKRLVKVTKQHNDECKHLLSLMGIPYLDAPSEAEASCAALVKAGKVYAAATEDMDCLTFGSPVLMRHLTASEAKKLPIQEFHLSRILQELGLNQEQFVDLCILLGSDYCESIRGIGPKRAVDLIQKHKSIEEIVRRLDPNKYPVPENWLHKEAHQLFLEPEVLDPESVELKWSEPNEEELIKFMCGEKQFSEERIRSGVKRLSKSRQGSTQGRLDDFFKVTGSLSSAKRKEPEPKGSTKKKAKTGAAGKFKRGK(SEQ ID NO:35)。在一些实施方案中,所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。在一些实施方案中,ERCC4多肽包含以下序列或由其组成:
MESGQPARRIAMAPLLEYERQLVLELLDTDGLVVCARGLGADRLLYHFLQLHCHPACLVLVLNTQPAEEEYFINQLKIEGVEHLPRRVTNEITSNSRYEVYTQGGVIFATSRILVVDFLTDRIPSDLITGILVYRAHRIIESCQEAFILRLFRQKNKRGFIKAFTDNAVAFDTGFCHVERVMRNLFVRKLYLWPRFHVAVNSFLEQHKPEVVEIHVSMTPTMLAIQTAILDILNACLKELKCHNPSLEVEDLSLENAIGKPFDKTIRHYLDPLWHQLGAKTKSLVQDLKILRTLLQYLSQYDCVTFLNLLESLRATEKAFGQNSGWLFLDSSTSMFINARARVYHLPDAKMSKKEKISEKMEIKEGEGILWG(SEQ ID NO:124)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。在一些实施方案中,NTHL多肽包含以下序列或由其组成:
CSPQESGMTALSARMLTRSRSLGPGAGPRGCREEPGPLRRREAAAEARKSHSPVKRPRKAQRLRVAYEGSDSEKGEGAEPLKVPVWEPQDWQQQLVNIRAMRNKKDAPVDHLGTEHCYDSSAPPKVRRYQVLLSLMLSSQTKDQVTAGAMQRLRARGLTVDSILQTDDATLGKLIYPVGFWRSKVKYIKQTSAILQQHYGGDIPASVAELVALPGVGPKMAHLAMAVAWGTVSGIAVDTHVHRIANRLRWTKKATKSPEETRAALEEWLPRELWHEINGLLVGFGQQTCLPVHPRCHACLNQALCPAAQGL(SEQ ID NO:123)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含人斯库拉芬蛋白14(hSLFN14)多肽或由其组成。在一些实施方案中,hSLFN14多肽包含以下序列或由其组成:
ESTHVEFKRFTTKKVIPRIKEMLPHYVSAFANTQGGYVLIGVDDKSKEVVGCKWEKVNPDLLKKEIENCIEKLPTFHFCCEKPKVNFTTKILNVYQKDVLDGYVCVIQVEPFCCVVFAEAPDSWIMKDNSVTRLTAEQWVVMMLDTQSAPPSLVTDYNSCLISSASSARKSPGYPIKVHKFKEALQ(SEQ ID NO:36)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。在一些实施方案中,hLACTB2多肽包含以下序列或由其组成:
TLQGTNTYLVGTGPRRILIDTGEPAIPEYISCLKQALTEFNTAIQEIVVTHWHRDHSGGIGDICKSINNDTTYCIKKLPRNPQREEIIGNGEQQYVYLKDGDVIKTEGATLRVLYTPGHTDDHMALLLEEENAIFSGDCILGEGTTVFEDLYDYMNSLKELLKIKADIIYPGHGPVIHNAEAKIQQYISHRNIREQQILTLFRENFEKSFTVMELVKIIYKNTPENLHEMAKHNLLLHLKKLEKEGKIFSNTDPDKKWKAHL(SEQ ID NO:37)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。在一些实施方案中,APEX2多肽包含以下序列或由其组成:
MLRVVSWNINGIRRPLQGVANQEPSNCAAVAVGRILDELDADIVCLQETKVTRDALTEPLAIVEGYNSYFSFSRNRSGYSGVATFCKDNATPVAAEEGLSGLFATQNGDVGCYGNMDEFTQEELRALDSEGRALLTQHKIRTWEGKEKTLTLINVYCPHADPGRPERLVFKMRFYRLLQIRAEALLAAGSHVIILGDLNTAHRPIDHWDAVNLECFEEDPGRKWMDSLLSNLGCQSASHVGPFIDSYRCFQPKQEGAFTCWSAVTGARHLNYGSRLDYVLGDRTLVIDTFQASFLLPEVMGSDHCPVGAVLSVSSVPAKQCPPLCTRFLPEFAGTQLKILRFLVPLEQSPVLEQSTLQHNNQTRVQTCQNKAQVRSTRPQPSQVGSSRGQKNLKSYFQPSPSCPQASPDIELPSLPLMSALMTPKTPEEKAVAKVVKGQAKTSEAKDEKELRTSFWKSVLAGPLRTPLCGGHREPCVMRTVKKPGPNLGRRFYMCARPRGPPTDPSSRCNFFLWSRPS(SEQ IDNO:38)。在一些实施方案中,APEX2多肽包含以下序列或由其组成:
MLRVVSWNINGIRRPLQGVANQEPSNCAAVAVGRILDELDADIVCLQETKVTRDALTEPLAIVEGYNSYFSFSRNRSGYSGVATFCKDNATPVAAEEGLSGLFATQNGDVGCYGNMDEFTQEELRALDSEGRALLTQHKIRTWEGKEKTLTLINVYCPHADPGRPERLVFKMRFYRLLQIRAEALLAAGSHVIILGDLNTAHRPIDHWDAVNLECFEEDPGRKWMDSLLSNLGCQSASHVGPFIDSYRCFQPKQEGAFTCWSAVTGARHLNYGSRLDYVLGDRTLVIDTFQASFLLPEVMGSDHCPVGAVLSVSSVPAKQCPPLCTRFLPEFAGTQLKILRFLVPLEQSP(SEQ ID NO:39)。在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。在一些实施方案中,APEX1多肽包含以下序列或由其组成:
PKRGKKGAVAEDGDELRTEPEAKKSKTAAKKNDKEAAGEGPALYEDPPDQKTSPSGKPATLKICSWNVDGLRAWIKKKGLDWVKEEAPDILCLQETKCSENKLPAELQELPGLSHQYWSAPSDKEGYSGVGLLSRQCPLKVSYGIGDEEHDQEGRVIVAEFDSFVLVTAYVPNAGRGLVRLEYRQRWDEAFRKFLKGLASRKPLVLCGDLNVAHEEIDLRNPKGNKKNAGFTPQERQGFGELLQAVPLADSFRHLYPNTPYAYTFWTYMMNARSKNVGWRLDYFLLS(SEQ IDNO:125)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。在一些实施方案中,ANG多肽包含以下序列或由其组成:
QDNSRYTHFLTQHYDAKPQGRDDRYCESIMRRRGLTSPCKDINTFIHGNKRSIKAICENKNGNPHRENLRISKSSFQVTTCKLHGGSPWPPCQYRATAGFRNVVVACENGLPVHLDQSIFRRP(SEQ ID NO:40)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。在一些实施方案中,HRSP12多肽包含以下序列或由其组成:
SSLIRRVISTAKAPGAIGPYSQAVLVDRTIYISGQIGMDPSSGQLVSGGVAEEAKQALKNMGEILKAAGCDFTNVVKTTVLLADINDFNTVNEIYKQYFKSNFPARAAYQVAALPKGSRIEIEAVAIQGPLTTASL(SEQ IDNO:41)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12A(ZC3H12A)多肽或由其组成。在一些实施方案中,ZC3H12A多肽包含以下序列或由其组成:
GGGTPKAPNLEPPLPEEEKEGSDLRPVVIDGSNVAMSHGNKEVFSCRGILLAVNWFLERGHTDITVFVPSWRKEQPRPDVPITDQHILRELEKKKILVFTPSRRVGGKRVVCYDDRFIVKLAYESDGIVVSNDTYRDLQGERQEWKRFIEERLLMYSFVNDKFMPPDDPLGRHGPSLDNFLRKKPLTLE(SEQ ID NO:42)。
在一些实施方案中,ZC3H12A多肽包含以下序列或由其组成:
SGPCGEKPVLEASPTMSLWEFEDSHSRQGTPRPGQELAAEEASALELQMKVDFFRKLGYSSTEIHSVLQKLGVQADTNTVLGELVKHGTATERERQTSPDPCPQLPLVPRGGGTPKAPNLEPPLPEEEKEGSDLRPVVIDGSNVAMSHGNKEVFSCRGILLAVNWFLERGHTDITVFVPSWRKEQPRPDVPITDQHILRELEKKKILVFTPSRRVGGKRVVCYDDRFIVKLAYESDGIVVSNDTYRDLQGERQEWKRFIEERLLMYSFVNDKFMPPDDPLGRHGPSLDNFLRKKPLTLEHRKQPCPYGRKCTYGIKCRFFHPERPSCPQRSVADELRANALLSPPRAPSKDKNGRRPSPSSQSSSLLTESEQCSLDGKKLGAQASPGSRQEGLTQTYAPSGRSLAPSGGSGSSFGPTDWLPQTLDSLPYVSQDCLDSGIGSLESQMSELWGVRGGGPGEPGPPRAPYTGYSPYGSELPATAAFSAFGRAMGAGHFSVPADYPPAPPAFPPREYWSEPYPLPPPTSVLQEPPVQSPGAGRSPWGRAGSLAKEQASVYTKLCGVFPPHLVEAVMGRFPQLLDPQQLAAEILSYKSQHPSE(SEQ ID NO:43)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(RIDA)多肽或由其组成。在一些实施方案中,RIDA多肽包含以下序列或由其组成:
SSLIRRVISTAKAPGAIGPYSQAVLVDRTIYISGQIGMDPSSGQLVSGGVAEEAKQALKNMGEILKAAGCDFTNVVKTTVLLADINDFNTVNEIYKQYFKSNFPARAAYQVAALPKGSRIEIEAVAIQGPLTTASL(SEQ IDNO:44)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。在一些实施方案中,PDL6多肽包含以下序列或由其组成:
EALFFPSQVTCTEALLRAPGAELAELPEGCPCGLPHGESALSRLLRALLAARASLDLCLFAFSSPQLGRAVQLLHQRGVRVRVVTDCDYMALNGSQIGLLRKAGIQVRHDQDPGYMHHKFAIVDKRVLITGSLNWTTQAIQNNRENVLITEDDEYVRLFLEEFERIWEQFNPTKYTFFPPKKSHGSCAPPVSRAGGRLLSWHRTCGTSSESQT(SEQ IDNO:126)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。在一些实施方案中,KIAA0391多肽包含以下序列或由其组成:
KARYKTLEPRGYSLLIRGLIHSDRWREALLLLEDIKKVITPSKKNYNDCIQGALLHQDVNTAWNLYQELLGHDIVPMLETLKAFFDFGKDIKDDNYSNKLLDILSYLRNNQLYPGESFAHSIKTWFESVPGKQWKGQFTTVRKSGQCSGCGKTIESIQLSPEEYECLKGKIMRDVIDGGDQYRKTTPQELKRFENFIKSRPPFDVVIDGLNVAKMFPKVRESQLLLNVVSQLAKRNLRLLVLGRKHMLRRSSQWSRDEMEEVQKQASCFFADDISEDDPFLLYATLHSGNHCRFITRDLMRDHKACLPDAKTQRLFFKWQQGHQLAIVNRFPGSKLTFQRILSYDTVVQTTGDSWHIPYDEDLVERCSCEVPTKWLCLHQKT(SEQ ID NO:127)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含阿尔古蛋白2(AGO2)多肽或由其组成。
在本公开文本的组合物的一些实施方案中,AGO2多肽包含以下序列或由其组成:
SVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA(SEQ ID NO:128)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。在一些实施方案中,EXOG多肽包含以下序列或由其组成:
QGAEGALTGKQPDGSAEKAVLEQFGFPLTGTEARCYTNHALSYDQAKRVPRWVLEHISKSKIMGDADRKHCKFKPDPNIPPTFSAFNEDYVGSGWSRGHMAPAGNNKFSSKAMAETFYLSNIVPQDFDNNSGYWNRIEMYCRELTERFEDVWVVSGPLTLPQTRGDGKKIVSYQVIGEDNVAVPSHLYKVILARRSSVSTEPLALGAFVVPNEAIGFQPQLTEFQVSLQDLEKLSGLVFFPHLDRTSDIRNICSVDTCKLLDFQEFTLYLSTRKIEGARSVLRLEKIMENLKNAEIEPDDYFMSRYEKKLEELKAKEQSGTQIRKPS(SEQ ID NO:129)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。在一些实施方案中,ZC3H12D多肽包含以下序列或由其组成:
EHPSKMEFFQKLGYDREDVLRVLGKLGEGALVNDVLQELIRTGSRPGALEHPAAPRLVPRGSCGVPDSAQRGPGTALEEDFRTLASSLRPIVIDGSNVAMSHGNKETFSCRGIKLAVDWFRDRGHTYIKVFVPSWRKDPPRADTPIREQHVLAELERQAVLVYTPSRKVHGKRLVCYDDRYIVKVAYEQDGVIVSNDNYRDLQSENPEWKWFIEQRLLMFSFVNDRFMPPDDPLGRHGPSLSNFLSRKPKPPEPSWQHCPYGKKCTYGIKCKFYHPERPHHAQLAVADELRAKTGARPGAGAEEQRPPRAPGGSAGARAAPREPFAHSLPPARGSPDLAALRGSFSRLAFSDDLGPLGPPLPVPACSLTPRLGGPDWVSAGGRVPGPLSLPSPESQFSPGDLPPPPGLQLQPRGEHRPRDLHGDLLSPRRPPDDPWARPPRSDRFPGRSVWAEPAWGDGATGGLSVYATEDDEGDARARARIALYSVFPRDQVDRVMAAFPELSDLARLILLVQRCQSAGAPLGKP(SEQ ID NO:130)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。在一些实施方案中,ERN2多肽包含以下序列或由其组成:
RQQQPQVVEKQQETPLAPADFAHISQDAQSLHSGASRRSQKRLQSPSKQAQPLDDPEAEQLTVVGKISFNPKDVLGRGAGGTFVFRGQFEGRAVAVKRLLRECFGLVRREVQLLQESDRHPNVLRYFCTERGPQFHYIALELCRASLQEYVENPDLDRGGLEPEVVLQQLMSGLAHLHSLHIVHRDLKPGNILITGPDSQGLGRVVLSDFGLCKKLPAGRCSFSLHSGIPGTEGWMAPELLQLLPPDSPTSAVDIFSAGCVFYYVLSGGSHPFGDSLYRQANILTGAPCLAHLEEEVHDKVVARDLVGAMLSPLPQPRPSAPQVLAHPFFWSRAKQLQFFQDVSDWLEKESEQEPLVRALEAGGCAVVRDNWHEHISMPLQTDLRKFRSYKGTSVRDLLRAVRNKKHHYRELPVEVRQALGQVPDGFVQYFTNRFPRLLLHTHRAMRSCASESLFLPYYPPDSEARRPCPGATGR(SEQ ID NO:131)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(PELO)多肽或由其组成。在一些实施方案中,PELO多肽包含以下序列或由其组成:
KLVRKNIEKDNAGQVTLVPEEPEDMWHTYNLVQVGDSLRASTIRKVQTESSTGSVGSNRVRTTLTLCVEAIDFDSQACQLRVKGTNIQENEYVKMGAYHTIELEPNRQFTLAKKQWDSVVLERIEQACDPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYLFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:132)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。在一些实施方案中,YBEY多肽包含以下序列或由其组成:
SLVIRNLQRVIPIRRAPLRSKIEIVRRILGVQKFDLGIICVDNKNIQHINRIYRDRNVPTDVLSFPFHEHLKAGEFPQPDFPDDYNLGDIFLGVEYIFHQCKENEDYNDVLTVTATHGLCHLLGFTHGTEAEWQQMFQKEKAVLDELGRRTGTRLQPLTRGLFGGS(SEQ ID NO:133)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。在一些实施方案中,CPSF4L包含以下序列或由其组成:
QEVIAGLERFTFAFEKDVEMQKGTGLLPFQGMDKSASAVCNFFTKGLCEKGKLCPFRHDRGEKMVVCKHWLRGLCKKGDHCKFLHQYDLTRMPECYFYSKFGDCSNKECSFLHVKPAFKSQDCPWYDQGFCKDGPLCKYRHVPRIMCLNYLVGFCPEGPKCQFAQKIREFKLLPGSKI(SEQ ID NO:134)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。在一些实施方案中,hCG_2002731多肽包含以下序列或由其组成:
KLVRKNIEKDNAGQVTLVPEEPEDMWHTYNLVQVGDSLRASTIRKVQTESSTGSVGSNRVRTTLTLCVEAIDFDSQACQLRVKGTNIQENEYVKMGAYHTIELEPNRQFTLAKKQWDSVVLERIEQACDPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYMFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:135)。在一些实施方案中,hCG_2002731多肽包含以下序列或由其组成:
DPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYMFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:136)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。在一些实施方案中,ERCC1多肽包含以下序列或由其组成:
MDPGKDKEGVPQPSGPPARKKFVIPLDEDEVPPGVRGNPVLKFVRNVPWEFGDVIPDYVLGQSTCALFLSLRYHNLHPDYIHGRLQSLGKNFALRVLLVQVDVKDPQQALKELAKMCILADCTLILAWSPEEAGRYLETYKAYEQKPADLLMEKLEQDFVSRVTECLTTVKSVNKTDSQTLLTTFGSLEQLIAASREDLALCPGLGPQK(SEQ ID NO:137)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。在一些实施方案中,RAC1多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:138)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。在一些实施方案中,RAA1多肽包含以下序列或由其组成:
QDNSRYTHFLTQHYDAKPQGRDDRYCESIMRRRGLTSPCKDINTFIHGNKRSIKAICENKNGNPHRENLRISKSSFQVTTCKLHGGSPWPPCQYRATAGFRNVVVACENGLPVHLDQSIFRRP(SEQ ID NO:139)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。在一些实施方案中,RAB1多肽包含以下序列或由其组成:
GLGLVQPSYGQDGMYQRFLRQHVHPEETGGSDRYCNLMMQRRKMTLYHCKRFNTFIHEDIWNIRSICSTTNIQCKNGKMNCHEGVVKVTDCRDTGSSRAPNCRYRAIASTRRVVIACEGNPQVPVHFDG(SEQ ID NO:140)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。在一些实施方案中,DNA2多肽包含以下序列或由其组成:
XSAVDNILLKLAKFKIGFLRLGQIQKVHPAIQQFTEQEICRSKSIKSLALLEELYNSQLIVATTCMGINHPIFSRKIFDFCIVDEASQISQPICLGPLFFSRRFVLVGDHQQLPPLVLNREARALGMSESLFKRLEQNKSAVVQLTVQYRMNSKIMSLSNKLTYEGKLECGSDKVANAVINLRHFKDVKLELEFYADYSDNPWLMGVFEPNNPVCFLNTDKVPAPEQVEKGGVSNVTEAKLIVFLTSIFVKAGCSPSDIGIIAPYRQQLKIINDLLARSIGMVEVNTVDKYQGRDKSIVLVSFVRSNKDGTVGELLKDWRRLNVAITRAKHKLILLGCVPSLNCYPPLEKLLNHLNSEKLISFFFCIWSHLIALL(SEQ ID NO:141)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。在一些实施方案中,FLJ35220多肽包含以下序列或由其组成:
MALRSHDRSTRPLYISVGHRMSLEAAVRLTCCCCRFRIPEPVRQADICSREHIRKSLGLPGPPTPRSPKAQRPVACPKGDSGESSALC(SEQ ID NO:142)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。在一些实施方案中,FLJ13173多肽包含以下序列或由其组成:
CYTNHALSYDQAKRVPRWVLEHISKSKIMGDADRKHCKFKPDPNIPPTFSAFNEDYVGSGWSRGHMAPAGNNKFSSKAMAETFYLSNIVPQDFDNNSGYWNRIEMYCRELTERFEDVWVVSGPLTLPQTRGDGKKIVSYQVIGEDNVAVPSHLYKVILARRSSVSTEPLALGAFVVPNEAIGFQPQLTEFQVSLQDLEKLSGLVFFPHLDRT(SEQ IDNO:143)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白(TENM)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM1)多肽或由其组成。在一些实施方案中,TENM1多肽包含以下序列或由其组成:
VTVSQMTSVLNGKTRRFADIQLQHGALCFNIRYGTTVEEEKNHVLEIARQRAVAQAWTKEQRRLQEGEEGIRAWTEGEKQQLLSTGRVQGYDGYFVLSVEQYLELSDSANNIHFMRQSEIGRR(SEQ ID NO:144)。在一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白2(TENM2)多肽或由其组成。
在一些实施方案中,TENM2多肽包含以下序列或由其组成:
TVSQPTLLVNGKTRRFTNIEFQYSTLLLSIRYGLTPDTLDEEKARVLDQARQRALGTAWAKEQQKARDGREGSRLWTEGEKQQLLSTGRVQGYEGYYVLPVEQYPELADSSSNIQFLRQNEMGKR(SEQ ID NO:145)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶κ(RNA酶K)多肽或由其组成。在一些实施方案中,RNA酶K多肽包含以下序列或由其组成:
MGWLRPGPRPLCPPARASWAFSHRFPSPLAPRRSPTPFFMASLLCCGPKLAACGIVLSAWGVIMLIMLGIFFNVHSAVLIEDVPFTEKDFENGPQNIYNLYEQVSYNCFIAAGLYLLLGGFSFCQVRLNKRKEYMVR(SEQ IDNO:204)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含ZNF638多肽或所述多肽的核酸酶结构域或由其组成。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含从人SMG6蛋白衍生的PIN结构域或由其组成,所述人SMG6蛋白通常也称为端粒酶结合蛋白EST1A亚型3,NCBI参考序列:NP_001243756.1。在一些实施方案中,来自hSMG6的PIN以Cas融合蛋白的形式在本文中使用并且作为内部对照。
指导RNA
术语指导RNA(gRNA)与单一指导RNA(sgRNA)在整个本公开文本中可互换使用。
本公开文本的指导RNA(gRNA)可以包含间隔子序列和支架序列。在一些实施方案中,指导RNA是单一指导RNA(sgRNA),其包含连续间隔子序列和支架序列。在一些实施方案中,间隔子序列和支架序列是连续的。在一些实施方案中,支架序列包含“同向重复”(DR)序列。DR序列是指CRISPR基因座(天然存在于细菌基因组或质粒中)中的重复性序列,其中散布有间隔子序列。众所周知,如果相关CRISPR基因座的序列是已知的,则将能够推断相应Cas蛋白的DR序列。在一些实施方案中,间隔子序列和支架序列是不连续的。在一些实施方案中,编码本公开文本的指导RNA的序列包含由接头序列隔开的间隔子序列和支架序列或由其组成。在一些实施方案中,接头序列可以包含1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,接头序列可以包含至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸。
本公开文本的指导RNA(gRNA)可以包含非天然存在的核苷酸。在一些实施方案中,本公开文本的指导RNA或编码所述指导RNA的序列包含修饰的或合成的RNA核苷酸或由其组成。示例性的修饰的RNA核苷酸包括但不限于假尿苷(Ψ)、二氢尿苷(D)、肌苷(I)、和7-甲基鸟苷(m7G)、次黄嘌呤、黄嘌呤、黄苷、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶、5-甲基胞苷、5-羟甲基胞嘧啶、异鸟嘌呤和异胞嘧啶。
本公开文本的指导RNA(gRNA)可以结合靶序列内的修饰的RNA。在靶序列内,本公开文本的指导RNA(gRNA)可以结合修饰的RNA。示例性的表观遗传或转录后修饰的RNA包括但不限于2'-O-甲基化(2'-OMe)(2'-O-甲基化发生在核糖部分的游离2'-OH的氧上)、N6-甲基腺苷(m6A)和5-甲基胞嘧啶(m5C)。
在本公开文本的组合物的一些实施方案中,本公开文本的指导RNA包含编码非编码C/D盒核仁小RNA(snoRNA)序列的至少一个序列。在一些实施方案中,snoRNA序列包含与靶RNA互补的至少一个序列,其中所述RNA分子的靶序列包含至少一个2'-OMe。在一些实施方案中,snoRNA序列包含与靶RNA互补的至少一个序列,其中与靶RNA互补的所述至少一个序列包含盒C基序(RUGAUGA)和盒D基序(CUGA)。
本公开文本的间隔子序列与RNA分子的靶序列结合。本公开文本的间隔子序列可以包含CRISPR RNA(crRNA)。本公开文本的间隔子序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,间隔子序列可以将支架序列和融合蛋白中的一种或多种指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。
本公开文本的支架序列结合本公开文本的第一RNA结合多肽。本公开文本的支架序列可以包含反式作用RNA(tracrRNA)。本公开文本的支架序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,支架序列可以将融合蛋白指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。可替代地,或另外地,在一些实施方案中,本公开文本的支架序列包含与本公开文本的融合蛋白的第一RNA结合蛋白或第二RNA结合蛋白结合的序列或由其组成。在一些实施方案中,本公开文本的支架序列包含二级结构或三级结构。示例性二级结构包括但不限于螺旋、茎环、凸起、四环和假结。示例性三级结构包括但不限于螺旋的A形式、螺旋的B形式和螺旋的Z形式。示例性三级结构包括但不限于扭曲的或螺旋化的茎环。示例性三级结构包括但不限于扭曲的或螺旋化的假结。在一些实施方案中,本公开文本的支架序列包含至少一种二级结构或至少一种三级结构。在一些实施方案中,本公开文本的支架序列包含一种或多种二级结构或者一种或多种三级结构。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分与本公开文本的RNA分子中的四环基序选择性结合。在一些实施方案中,RNA分子的靶序列包含四环基序。在一些实施方案中,四环基序是“GRNA”基序,所述基序包含GAAA、GUGA、GCAA或GAGA的序列中的一种或多种或由其组成。
在本公开文本的组合物的一些实施方案中,与RNA分子的靶序列结合的指导RNA或其部分与所述RNA分子的靶序列杂交。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白共价结合。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白非共价结合。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分包含在10个与100个之间的核苷酸(包括端点)或由所述核苷酸组成。在一些实施方案中,本公开文本的间隔子序列包含在10个与30个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或由其组成。在一些实施方案中,本公开文本的间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,本公开文本的间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含在10个与100个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含30、35、40、45、50、55、60、65、70、76、80、87、90、95、100个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含在85个与95个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含85个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含90个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含93个核苷酸或由其组成。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分不包含核定位序列(NLS)。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分不包含与原间隔子相邻基序(PAM)互补的序列。
本公开文本的治疗或药物组合物不包含PAMmer寡核苷酸。在其他实施方案中,任选地,非治疗或非药物组合物可以包含PAMmer寡核苷酸。术语“PAMmer”是指以下寡核苷酸,其包含能够与指导核苷酸序列可编程的RNA结合蛋白相互作用的PAM序列。PAMmer的非限制性例子描述于通过引用并入本文的O'Connell等人Nature 516,第263-266页(2014)中。PAM序列是指包含约2至约10个核苷酸的原间隔子相邻基序。PAM序列对与其相互作用的指导核苷酸序列可编程的RNA结合蛋白具有特异性,并且是本领域中已知的。例如,酿脓链球菌(Streptococcus pyogenes)PAM具有序列5'-NGG-3',其中“N”是任何核碱基,之后有两个鸟嘌呤(“G”)核碱基。新凶手弗朗西丝菌(Francisella novicida)的Cas9识别规范PAM序列5'-NGG-3',但是已经被工程化以识别PAM 5'-YG-3'(其中“Y”是嘧啶),从而添加至可能的Cas9靶标的范围内。新凶手弗朗西丝菌的Cpf1核酸酶识别PAM 5'-TTTN-3'或5'-YTN-3'。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分包含与原间隔子侧翼序列(PFS)互补的序列。在一些实施方案中,包括以下那些实施方案:其中指导RNA或其部分包含与PFS互补的序列,第一RNA结合蛋白可以包含从Cas13蛋白分离或衍生的序列。在一些实施方案中,包括以下那些实施方案:其中指导RNA或其部分包含与PFS互补的序列,第一RNA结合蛋白可以包含编码Cas13蛋白或其RNA结合部分的序列。在一些实施方案中,所述指导RNA或其部分不包含与PFS互补的序列。
在本公开文本的组合物的一些实施方案中,本公开文本的指导RNA序列包含用于驱动指导RNA的表达的启动子。在一些实施方案中,包含本公开文本的指导RNA序列的载体包含用于驱动指导RNA的表达的启动子。在一些实施方案中,所述启动子是组成型启动子。在一些实施方案中,启动子是组织特异性和/或细胞类型特异性启动子。在一些实施方案中,启动子诱导型启动子。在一些实施方案中,启动子是杂合启动子或重组启动子。在一些实施方案中,启动子是能够在哺乳动物中驱动表达的启动子。在一些实施方案中,启动子是能够在人细胞中表达的启动子。在一些实施方案中,启动子是能够表达指导RNA序列并且将表达限制于细胞核的启动子。在一些实施方案中,启动子是人RNA聚合酶启动子或从人RNA聚合酶启动子分离或衍生的启动子序列。在一些实施方案中,启动子是U6启动子或从编码U6启动子的序列分离或衍生的序列。在一些实施方案中,启动子是人tRNA启动子或从人tRNA启动子的序列分离或衍生的启动子序列。在一些实施方案中,启动子是人缬氨酸tRNA启动子或从人缬氨酸tRNA启动子分离或衍生的启动子序列。
在本公开文本的组合物的一些实施方案中,启动子还包含调节元件。在一些实施方案中,包含启动子的载体还包含调节元件。在一些实施方案中,调节元件增强指导RNA的表达。示例性调节元件包括但不限于增强子元件、内含子、外显子或其组合。
在本公开文本的组合物的一些实施方案中,本公开文本的载体包含指导RNA序列、用于驱动指导RNA的表达的启动子和用于增强指导RNA的表达的调节元件中的一种或多种。在本公开文本的组合物的一些实施方案中,所述载体还包含编码本公开文本的融合蛋白的核酸序列。
融合蛋白
本公开文本的融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,沿着编码融合蛋白的序列,编码第一RNA结合蛋白的序列定位于编码第二RNA结合蛋白的序列的5'。在一些实施方案中,沿着编码融合蛋白的序列,编码第一RNA结合蛋白的序列定位于编码第二RNA结合蛋白的序列的3'。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够选择性结合RNA分子,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,并且诱导所述RNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且既不结合DNA分子、哺乳动物DNA分子或任何DNA分子,也不诱导所述DNA分子中的断裂。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从没有DNA核酸酶活性的蛋白质分离或衍生的序列。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中所述DNA核酸酶活性是失活的,并且其中在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低至以下水平的突变,在所述水平下,在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低的突变,并且所述突变包含对编码第一RNA结合蛋白或其核酸酶结构域的核酸序列或氨基酸序列的取代、倒位、转座、插入、缺失或其任何组合中的一种或多种。
在本公开文本的组合物的一些实施方案中,编码本文公开的RNA指导的融合蛋白的第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含II型CRISPR Cas蛋白。在一些实施方案中,所述II型CRISPR Cas蛋白包含Cas9蛋白。本公开文本的示例性Cas9蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cas9蛋白可以从任何物种分离或衍生,所述物种包括但不限于酿脓链球菌、地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、多杀巴斯德菌(Pasteurella multocida)、脑膜炎奈瑟球菌(Neisseria meningitidis)、空肠弯曲杆菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)、红嘴鸥弯曲杆菌CF89-12(Campylobacter lari CF89-12)、鸡毒支原体F株(Mycoplasma gallisepticum str.F)、卤水硝酸盐裂解菌DSM 16511株(Nitratifractor salsuginis str.DSM 16511)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis)、灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510、球状螺旋菌巴迪株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare)、塔夫河栖河菌(Fluviicola taffensis)、嗜粪拟杆菌(Bacteroides coprophilus)、运动支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis)、巴氏链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedius)、龈沟产线菌(Filifactor alocis)、齿垢密螺旋体(Treponema denticola)、嗜肺军团菌巴黎株(Legionella pneumophila str.Paris)、华德萨特氏菌(Sutterellawadsworthensis)、白喉棒状杆菌(Corynebacter diphtherias)、金黄色葡萄球菌(Streptococcus aureus)和新凶手弗朗西丝菌。
本公开文本的示例性的野生型酿脓链球菌Cas9蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000581
Figure BDA0002925003530000591
核酸酶失活的酿脓链球菌Cas9蛋白可以包含丙氨酸(A)取代位置10的天冬氨酸(D)以及丙氨酸(A)取代位置840的组氨酸(H)。本公开文本的示例性的核酸酶失活的酿脓链球菌Cas9蛋白可以包含以下氨基酸序列或由其组成(D10A和H840A加粗并加下划线):
Figure BDA0002925003530000592
Figure BDA0002925003530000601
核酸酶失活的酿脓链球菌Cas9蛋白可以包含RuvC核酸酶结构域或其部分、HNH结构域、DNA酶活性位点、包含DNA酶活性位点的ββα-金属折叠或其部分或者其任何组合的缺失。
其他示例性Cas9蛋白或其部分可以包含以下氨基酸序列或由所述氨基酸序列组成。
在一些实施方案中,所述Cas9蛋白可以是酿脓链球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:149)
在一些实施方案中,所述Cas9蛋白可以是金黄色葡萄球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG(SEQID NO:150)
在一些实施方案中,所述Cas9蛋白可以是嗜热链球菌CRISPR1Cas9,并且可以包含以下氨基酸序列或由其组成:
MSDLVLGLDIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINLNPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLRGDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGETLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKLLSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQVDELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSVRQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKIRLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFRELKAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTRYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHWGIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFEDSILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVIEPILENYPNKQINDKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWRADVYFNKTTGKYEILGLKYADLQFDKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLSRTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDF(SEQ ID NO:151)。
在一些实施方案中,所述Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPINYILGLDIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:152)。
在一些实施方案中,所述Cas9蛋白可以是食清洁剂细小棒菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MERIFGFDIGTTSIGFSVIDYSSTQSAGNIQRLGVRIFPEARDPDGTPLNQQRRQKRMMRRQLRRRRIRRKALNETLHEAGFLPAYGSADWPVVMADEPYELRRRGLEEGLSAYEFGRAIYHLAQHRHFKGRELEESDTPDPDVDDEKEAANERAATLKALKNEQTTLGAWLARRPPSDRKRGIHAHRNVVAEEFERLWEVQSKFHPALKSEEMRARISDTIFAQRPVFWRKNTLGECRFMPGEPLCPKGSWLSQQRRMLEKLNNLAIAGGNARPLDAEERDAILSKLQQQASMSWPGVRSALKALYKQRGEPGAEKSLKFNLELGGESKLLGNALEAKLADMFGPDWPAHPRKQEIRHAVHERLWAADYGETPDKKRVIILSEKDRKAHREAAANSFVADFGITGEQAAQLQALKLPTGWEPYSIPALNLFLAELEKGERFGALVNGPDWEGWRRTNFPHRNQPTGEILDKLPSPASKEERERISQLRNPTVVRTQNELRKVVNNLIGLYGKPDRIRIEVGRDVGKSKREREEIQSGIRRNEKQRKKATEDLIKNGIANPSRDDVEKWILWKEGQERCPYTGDQIGFNALFREGRYEVEHIWPRSRSFDNSPRNKTLCRKDVNIEKGNRMPFEAFGHDEDRWSAIQIRLQGMVSAKGGTGMSPGKVKRFLAKTMPEDFAARQLNDTRYAAKQILAQLKRLWPDMGPEAPVKVEAVTGQVTAQLRKLWTLNNILADDGEKTRADHRHHAIDALTVACTHPGMTNKLSRYWQLRDDPRAEKPALTPPWDTIRADAEKAVSEIVVSHRVRKKVSGPLHKETTYGDTGTDIKTKSGTYRQFVTRKKIESLSKGELDEIRDPRIKEIVAAHVAGRGGDPKKAFPPYPCVSPGGPEIRKVRLTSKQQLNLMAQTGNGYADLGSNHHIAIYRLPDGKADFEIVSLFDASRRLAQRNPIVQRTRADGASFVMSLAAGEAIMIPEGSKKGIWIVQGVWASGQVVLERDTDADHSTTTRPMPNPILKDDAKKVSIDPIGRVRPSND(SEQ ID NO:153)。
在一些实施方案中,所述Cas9蛋白可以是白喉棒状杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MKYHVGIDVGTFSVGLAAIEVDDAGMPIKTLSLVSHIHDSGLDPDEIKSAVTRLASSGIARRTRRLYRRKRRRLQQLDKFIQRQGWPVIELEDYSDPLYPWKVRAELAASYIADEKERGEKLSVALRHIARHRGWRNPYAKVSSLYLPDGPSDAFKAIREEIKRASGQPVPETATVGQMVTLCELGTLKLRGEGGVLSARLQQSDYAREIQEICRMQEIGQELYRKIIDVVFAAESPKGSASSRVGKDPLQPGKNRALKASDAFQRYRIAALIGNLRVRVDGEKRILSVEEKNLVFDHLVNLTPKKEPEWVTIAEILGIDRGQLIGTATMTDDGERAGARPPTHDTNRSIVNSRIAPLVDWWKTASALEQHAMVKALSNAEVDDFDSPEGAKVQAFFADLDDDVHAKLDSLHLPVGRAAYSEDTLVRLTRRMLSDGVDLYTARLQEFGIEPSWTPPTPRIGEPVGNPAVDRVLKTVSRWLESATKTWGAPERVIIEHVREGFVTEKRAREMDGDMRRRAARNAKLFQEMQEKLNVQGKPSRADLWRYQSVQRQNCQCAYCGSPITFSNSEMDHIVPRAGQGSTNTRENLVAVCHRCNQSKGNTPFAIWAKNTSIEGVSVKEAVERTRHWVTDTGMRSTDFKKFTKAVVERFQRATMDEEIDARSMESVAWMANELRSRVAQHFASHGTTVRVYRGSLTAEARRASGISGKLKFFDGVGKSRLDRRHHAIDAAVIAFTSDYVAETLAVRSNLKQSQAHRQEAPQWREFTGKDAEHRAAWRVWCQKMEKLSALLTEDLRDDRVVVMSNVRLRLGNGSAHKETIGKLSKVKLSSQLSVSDIDKASSEALWCALTREPGFDPKEGLPANPERHIRVNGTHVYAGDNIGLFPVSAGSIALRGGYAELGSSFHHARVYKITSGKKPAFAMLRVYTIDLLPYRNQDLFSVELKPQTMSMRQAEKKLRDALATGNAEYLGWLVVDDELVVDTSKIATDQVKAVEAELGTIRRWRVDGFFSPSKLRLRPLQMSKEGIKKESAPELSKIIDRPGWLPAVNKLFSDGNVTVVRRDSLGRVRLESTAHLPVTWKVQ(SEQ ID NO:154)。
在一些实施方案中,所述Cas9蛋白可以是巴氏链球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MTNGKILGLDIGIASVGVGIIEAKTGKVVHANSRLFSAANAENNAERRGFRGSRRLNRRKKHRVKRVRDLFEKYGIVTDFRNLNLNPYELRVKGLTEQLKNEELFAALRTISKRRGISYLDDAEDDSTGSTDYAKSIDENRRLLKNKTPGQIQLERLEKYGQLRGNFTVYDENGEAHRLINVFSTSDYEKEARKILETQADYNKKITAEFIDDYVEILTQKRKYYHGPGNEKSRTDYGRFRTDGTTLENIFGILIGKCNFYPDEYRASKASYTAQEYNFLNDLNNLKVSTETGKLSTEQKESLVEFAKNTATLGPAKLLKEIAKILDCKVDEIKGYREDDKGKPDLHTFEPYRKLKFNLESINIDDLSREVIDKLADILTLNTEREGIEDAIKRNLPNQFTEEQISEIIKVRKSQSTAFNKGWHSFSAKLMNELIPELYATSDEQMTILTRLEKFKVNKKSSKNTKTIDEKEVTDEIYNPVVAKSVRQTIKIINAAVKKYGDFDKIVIEMPRDKNADDEKKFIDKRNKENKKEKDDALKRAAYLYNSSDKLPDEVFHGNKQLETKIRLWYQQGERCLYSGKPISIQELVHNSNNFEIDHILPLSLSFDDSLANKVLVYAWTNQEKGQKTPYQVIDSMDAAWSFREMKDYVLKQKGLGKKKRDYLLTTENIDKIEVKKKFIERNLVDTRYASRVVLNSLQSALRELGKDTKVSVVRGQFTSQLRRKWKIDKSRETYHHHAVDALIIAASSQLKLWEKQDNPMFVDYGKNQVVDKQTGEILSVSDDEYKELVFQPPYQGFVNTISSKGFEDEILFSYQVDSKYNRKVSDATIYSTRKAKIGKDKKEETYVLGKIKDIYSQNGFDTFIKKYNKDKTQFLMYQKDSLTWENVIEVILRDYPTTKKSEDGKNDVKCNPFEEYRRENGLICKYSKKGKGTPIKSLKYYDKKLGNCIDITPEESRNKVILQSINPWRADVYFNPETLKYELMGLKYSDLSFEKGTGNYHISQEKYDAIKEKEGIGKKSEFKFTLYRNDLILIKDIASGEQEIYRFLSRTMPNVNHYVELKPYDKEKFDNVQELVEALGEADKVGRCIKGLNKPNISIYKVRTDVLGNKYFVKKKGDKPKLDFKNNKK(SEQ ID NO:155)。
在一些实施方案中,所述Cas9蛋白可以是灰色奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPMNYILGLDIGIASVGWAIVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAAARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNTHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFNRKDLQAELNLLFEKQKEFGNPHVSDGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPTEPKAAKNTYTAERFVWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLDLDDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGNRYDEACTEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKSAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLALGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYINRFLCQFVADHMLLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTIAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKAHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHKYVTPLFISRAPNRKMSGQGHMETVKSAKRLDEGISVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVHNHNGIADNATIVRVDVFEKGGKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWTVMDDSFEFKFVLYANDLIKLTAKKNEFLGYFVSLNRATGAIDIRTHDTDSTKGKNGIFQSVGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:156)。
在一些实施方案中,所述Cas9蛋白可以是红嘴鸥弯曲杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MRILGFDIGINSIGWAFVENDELKDCGVRIFTKAENPKNKESLALPRRNARSSRRRLKRRKARLIAIKRILAKELKLNYKDYVAADGELPKAYEGSLASVYELRYKALTQNLETKDLARVILHIAKHRGYMNKNEKKSNDAKKGKILSALKNNALKLENYQSVGEYFYKEFFQKYKKNTKNFIKIRNTKDNYNNCVLSSDLEKELKLILEKQKEFGYNYSEDFINEILKVAFFQRPLKDFSHLVGACTFFEEEKRACKNSYSAWEFVALTKIINEIKSLEKISGEIVPTQTINEVLNLILDKGSITYKKFRSCINLHESISFKSLKYDKENAENAKLIDFRKLVEFKKALGVHSLSRQELDQISTHITLIKDNVKLKTVLEKYNLSNEQINNLLEIEFNDYINLSFKALGMILPLMREGKRYDEACEIANLKPKTVDEKKDFLPAFCDSIFAHELSNPVVNRAISEYRKVLNALLKKYGKVHKIHLELARDVGLSKKAREKIEKEQKENQAVNAWALKECENIGLKASAKNILKLKLWKEQKEICIYSGNKISIEHLKDEKALEVDHIYPYSRSFDDSFINKVLVFTKENQEKLNKTPFEAFGKNIEKWSKIQTLAQNLPYKKKNKILDENFKDKQQEDFISRNLNDTRYIATLIAKYTKEYLNFLLLSENENANLKSGEKGSKIHVQTISGMLTSVLRHTWGFDKKDRNNHLHHALDAIIVAYSTNSIIKAFSDFRKNQELLKARFYAKELTSDNYKHQVKFFEPFKSFREKILSKIDEIFVSKPPRKRARRALHKDTFHSENKIIDKCSYNSKEGLQIALSCGRVRKIGTKYVENDTIVRVDIFKKQNKFYAIPIYAMDFALGILPNKIVITGKDKNNNPKQWQTIDESYEFCFSLYKNDLILLQKKNMQEPEFAYYNDFSISTSSICVEKHDNKFENLTSNQKLLFSNAKEGSVKVESLGIQNLKVFEKYIITPLGDKIKADFQPRENISLKTSKKYGLR(SEQ ID NO:157)。
在一些实施方案中,所述Cas9蛋白可以是齿垢密螺旋体Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKEIKDYFLGLDVGTGSVGWAVTDTDYKLLKANRKDLWGMRCFETAETAEVRRLHRGARRRIERRKKRIKLLQELFSQEIAKTDEGFFQRMKESPFYAEDKTILQENTLFNDKDFADKTYHKAYPTINHLIKAWIENKVKPDPRLLYLACHNIIKKRGHFLFEGDFDSENQFDTSIQALFEYLREDMEVDIDADSQKVKEILKDSSLKNSEKQSRLNKILGLKPSDKQKKAITNLISGNKINFADLYDNPDLKDAEKNSISFSKDDFDALSDDLASILGDSFELLLKAKAVYNCSVLSKVIGDEQYLSFAKVKIYEKHKTDLTKLKNVIKKHFPKDYKKVFGYNKNEKNNNNYSGYVGVCKTKSKKLIINNSVNQEDFYKFLKTILSAKSEIKEVNDILTEIETGTFLPKQISKSNAEIPYQLRKMELEKILSNAEKHFSFLKQKDEKGLSHSEKIIMLLTFKIPYYIGPINDNHKKFFPDRCWVVKKEKSPSGKTTPWNFFDHIDKEKTAEAFITSRTNFCTYLVGESVLPKSSLLYSEYTVLNEINNLQIIIDGKNICDIKLKQKIYEDLFKKYKKITQKQISTFIKHEGICNKTDEVIILGIDKECTSSLKSYIELKNIFGKQVDEISTKNMLEEIIRWATIYDEGEGKTILKTKIKAEYGKYCSDEQIKKILNLKFSGWGRLSRKFLETVTSEMPGFSEPVNIITAMRETQNNLMELLSSEFTFTENIKKINSGFEDAEKQFSYDGLVKPLFLSPSVKKMLWQTLKLVKEISHITQAPPKKIFIEMAKGAELEPARTKTRLKILQDLYNNCKNDADAFSSEIKDLSGKIENEDNLRLRSDKLYLYYTQLGKCMYCGKPIEIGHVFDTSNYDIDHIYPQSKIKDDSISNRVLVCSSCNKNKEDKYPLKSEIQSKQRGFWNFLQRNNFISLEKLNRLTRATPISDDETAKFIARQLVETRQATKVAAKVLEKMFPETKIVYSKAETVSMFRNKFDIVKCREINDFHHAHDAYLNIVVGNVYNTKFTNNPWNFIKEKRDNPKIADTYNYYKVFDYDVKRNNITAWEKGKTIITVKDMLKRNTPIYTRQAACKKGELFNQTIMKKGLGQHPLKKEGPFSNISKYGGYNKVSAAYYTLIEYEEKGNKIRSLETIPLYLVKDIQKDQDVLKSYLTDLLGKKEFKILVPKIKINSLLKINGFPCHITGKTNDSFLLRPAVQFCCSNNEVLYFKKIIRFSEIRSQREKIGKTISPYEDLSFRSYIKENLWKKTKNDEIGEKEFYDLLQKKNLEIYDMLLTKHKDTIYKKRPNSATIDILVKGKEKFKSLIIENQFEVILEILKLFSATRNVSDLQHIGGSKYSGVAKIGNKISSLDNCILIYQSITGIFEKRIDLLKV(SEQ ID NO:158)。
在一些实施方案中,所述Cas9蛋白可以是变形链球菌(S.mutans)Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKSHIEKNLLGALLFDSGNTAEDRRLKRTARRRYTRRRNRILYLQEIFSEEMGKVDDSFFHRLEDSFLVTEDKRGERHPIFGNLEEEVKYHENFPTIYHLRQYLADNPEKVDLRLVYLALAHIIKFRGHFLIEGKFDTRNNDVQRLFQEFLAVYDNTFENSSLQEQNVQVEEILTDKISKSAKKDRVLKLFPNEKSNGRFAEFLKLIVGNQADFKKHFELEEKAPLQFSKDTYEEELEVLLAQIGDNYAELFLSAKKLYDSILLSGILTVTDVGTKAPLSASMIQRYNEHQMDLAQLKQFIRQKLSDKYNEVFSDVSKDGYAGYIDGKTNQEAFYKYLKGLLNKIEGSGYFLDKIEREDFLRKQRTFDNGSIPHQIHLQEMRAIIRRQAEFYPFLADNQDRIEKLLTFRIPYYVGPLARGKSDFAWLSRKSADKITPWNFDEIVDKESSAEAFINRMTNYDLYLPNQKVLPKHSLLYEKFTVYNELTKVKYKTEQGKTAFFDANMKQEIFDGVFKVYRKVTKDKLMDFLEKEFDEFRIVDLTGLDKENKVFNASYGTYHDLCKILDKDFLDNSKNEKILEDIVLTLTLFEDREMIRKRLENYSDLLTKEQVKKLERRHYTGWGRLSAELIHGIRNKESRKTILDYLIDDGNSNRNFMQLINDDALSFKEEIAKAQVIGETDNLNQVVSDIAGSPAIKKGILQSLKIVDELVKIMGHQPENIVVEMARENQFTNQGRRNSQQRLKGLTDSIKEFGSQILKEHPVENSQLQNDRLFLYYLQNGRDMYTGEELDIDYLSQYDIDHIIPQAFIKDNSIDNRVLTSSKENRGKSDDVPSKDVVRKMKSYWSKLLSAKLITQRKFDNLTKAERGGLTDDDKAGFIKRQLVETRQITKHVARILDERFNTETDENNKKIRQVKIVTLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVIGKALLGVYPQLEPEFVYGDYPHFHGHKENKATAKKFFYSNIMNFFKKDDVRTDKNGEIIWKKDEHISNIKKVLSYPQVNIVKKVEEQTGGFSKESILPKGNSDKLIPRKTKKFYWDTKKYGGFDSPIVAYSILVIADIEKGKSKKLKTVKALVGVTIMEKMTFERDPVAFLERKGYRNVQEENIIKLPKYSLFKLENGRKRLLASARELQKGNEIVLPNHLGTLLYHAKNIHKVDEPKHLDYVDKHKDEFKELLDVVSNFSKKYTLAEGNLEKIKELYAQNNGEDLKELASSFINLLTFTAIGAPATFKFFDKNIDRKRYTSTTEILNATLIHQSITGLYETRIDLNKLGGD(SEQ ID NO:159)
在一些实施方案中,所述Cas9蛋白可以是嗜热链球菌CRISPR 3Cas9,并且可以包含以下氨基酸序列或由其组成:
MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRLSNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG(SEQ ID NO:160)
在一些实施方案中,所述Cas9蛋白可以是空肠弯曲杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK(SEQ ID NO:161)
在一些实施方案中,所述Cas9蛋白可以是多杀巴斯德菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MQTTNLSYILGLDLGIASVGWAVVEINENEDPIGLIDVGVRIFERAEVPKTGESLALSRRLARSTRRLIRRRAHRLLLAKRFLKREGILSTIDLEKGLPNQAWELRVAGLERRLSAIEWGAVLLHLIKHRGYLSKRKNESQTNNKELGALLSGVAQNHQLLQSDDYRTPAELALKKFAKEEGHIRNQRGAYTHTFNRLDLLAELNLLFAQQHQFGNPHCKEHIQQYMTELLMWQKPALSGEAILKMLGKCTHEKNEFKAAKHTYSAERFVWLTKLNNLRILEDGAERALNEEERQLLINHPYEKSKLTYAQVRKLLGLSEQAIFKHLRYSKENAESATFMELKAWHAIRKALENQGLKDTWQDLAKKPDLLDEIGTAFSLYKTDEDIQQYLTNKVPNSVINALLVSLNFDKFIELSLKSLRKILPLMEQGKRYDQACREIYGHHYGEANQKTSQLLPAIPAQEIRNPVVLRTLSQARKVINAIIRQYGSPARVHIETGRELGKSFKERREIQKQQEDNRTKRESAVQKFKELFSDFSSEPKSKDILKFRLYEQQHGKCLYSGKEINIHRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLASENQNKGNQTPYEWLQGKINSERWKNFVALVLGSQCSAAKKQRLLTQVIDDNKFIDRNLNDTRYIARFLSNYIQENLLLVGKNKKNVFTPNGQITALLRSRWGLIKARENNNRHHALDAIVVACATPSMQQKITRFIRFKEVHPYKIENRYEMVDQESGEIISPHFPEPWAYFRQEVNIRVFDNHPDTVLKEMLPDRPQANHQFVQPLFVSRAPTRKMSGQGHMETIKSAKRLAEGISVLRIPLTQLKPNLLENMVNKEREPALYAGLKARLAEFNQDPAKAFATPFYKQGGQQVKAIRVEQVQKSGVLVRENNGVADNASIVRTDVFIKNNKFFLVPIYTWQVAKGILPNKAIVAHKNEDEWEEMDEGAKFKFSLFPNDLVELKTKKEYFFGYYIGLDRATGNISLKEHDGEISKGKDGVYRVGVKLALSFEKYQVDELGKNRQICRPQQRQPVR(SEQ ID NO:162)
在一些实施方案中,所述Cas9蛋白可以是新凶手弗朗西丝菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MNFKILPIAIDLGVKNTGVFSAFYQKGTSLERLDNKNGKVYELSKDSYTLLMNNRTARRHQRRGIDRKQLVKRLFKLIWTEQLNLEWDKDTQQAISFLFNRRGFSFITDGYSPEYLNIVPEQVKAILMDIFDDYNGEDDLDSYLKLATEQESKISEIYNKLMQKILEFKLMKLCTDIKDDKVSTKTLKEITSYEFELLADYLANYSESLKTQKFSYTDKQGNLKELSYYHHDKYNIQEFLKRHATINDRILDTLLTDDLDIWNFNFEKFDFDKNEEKLQNQEDKDHIQAHLHHFVFAVNKIKSEMASGGRHRSQYFQEITNVLDENNHQEGYLKNFCENLHNKKYSNLSVKNLVNLIGNLSNLELKPLRKYFNDKIHAKADHWDEQKFTETYCHWILGEWRVGVKDQDKKDGAKYSYKDLCNELKQKVTKAGLVDFLLELDPCRTIPPYLDNNNRKPPKCQSLILNPKFLDNQYPNWQQYLQELKKLQSIQNYLDSFETDLKVLKSSKDQPYFVEYKSSNQQIASGQRDYKDLDARILQFIFDRVKASDELLLNEIYFQAKKLKQKASSELEKLESSKKLDEVIANSQLSQILKSQHTNGIFEQGTFLHLVCKYYKQRQRARDSRLYIMPEYRYDKKLHKYNNTGRFDDDNQLLTYCNHKPRQKRYQLLNDLAGVLQVSPNFLKDKIGSDDDLFISKWLVEHIRGFKKACEDSLKIQKDNRGLLNHKINIARNTKGKCEKEIFNLICKIEGSEDKKGNYKHGLAYELGVLLFGEPNEASKPEFDRKIKKFNSIYSFAQIQQIAFAERKGNANTCAVCSADNAHRMQQIKITEPVEDNKDKIILSAKAQRLPAIPTRIVDGAVKKMATILAKNIVDDNWQNIKQVLSAKHQLHIPIITESNAFEFEPALADVKGKSLKDRRKKALERISPENIFKDKNNRIKEFAKGISAYSGANLTDGDFDGAKEELDHIIPRSHKKYGTLNDEANLICVTRGDNKNKGNRIFCLRDLADNYKLKQFETTDDLEIEKKIADTIWDANKKDFKFGNYRSFINLTPQEQKAFRHALFLADENPIKQAVIRAINNRNRTFVNGTQRYFAEVLANNIYLRAKKENLNTDKISFDYFGIPTIGNGRGIAEIRQLYEKVDSDIQAYAKGDKPQASYSHLIDAMLAFCIAADEHRNDGSIGLEIDKNYSLYPLDKNTGEVFTKDIFSQIKITDNEFSDKKLVRKKAIEGFNTHRQMTRDGIYAENYLPILIHKELNEVRKGYTWKNSEEIKIFKGKKYDIQQLNNLVYCLKFVDKPISIDIQISTLEELRNILTTNNIAATAEYYYINLKTQKLHEYYIENYNTALGYKKYSKEMEFLRSLAYRSERVKIKSIDDVKQVLDKDSNFIIGKITLPFKKEWQRLYREWQNTTIKDDYEFLKSFFNVKSITKLHKKVRKDFSLPISTNEGKFLVKRKTWDNNFIYQILNDSDSRADGTKPFIPAFDISKNEIVEAIIDSFTSKNIFWLPKNIELQKVDNKNIFAIDTSKWFEVETPSDLRDIGIATIQYKIDNNSRPKVRVKLDYVIDDDSKINYFMNHSLLKSRYPDKVLEILKQSTIIEFESSGFNKTIKEMLGMKLAGIYNETSNN(SEQ ID NO:163)
在一些实施方案中,所述Cas9蛋白可以是布氏乳杆菌(Lactobacillus buchneri)Cas9,并且可以包含以下氨基酸序列或由其组成:MKVNNYHIGLDIGTSSIGWVAIGKDGKPLRVKGKTAIGARLFQEGNPAADRRMFRTTRRRLSRRKWRLKLLEEIFDPYITPVDSTFFARLKQSNLSPKDSRKEFKGSMLFPDLTDMQYHKNYPTIYHLRHALMTQDKKFDIRMVYLAIHHIVKYRGNFLNSTPVDSFKASKVDFVDQFKKLNELYAAINPEESFKINLANSEDIGHQFLDPSIRKFDKKKQIPKIVPVMMNDKVTDRLNGKIASEIIHAILGYKAKLDVVLQCTPVDSKPWALKFDDEDIDAKLEKILPEMDENQQSIVAILQNLYSQVTLNQIVPNGMSLSESMIEKYNDHHDHLKLYKKLIDQLADPKKKAVLKKAYSQYVGDDGKVIEQAEFWSSVKKNLDDSELSKQIMDLIDAEKFMPKQRTSQNGVIPHQLHQRELDEIIEHQSKYYPWLVEINPNKHDLHLAKYKIEQLVAFRVPYYVGPMITPKDQAESAETVFSWMERKGTETGQITPWNFDEKVDRKASANRFIKRMTTKDTYLIGEDVLPDESLLYEKFKVLNELNMVRVNGKLLKVADKQAIFQDLFENYKHVSVKKLQNYIKAKTGLPSDPEISGLSDPEHFNNSLGTYNDFKKLFGSKVDEPDLQDDFEKIVEWSTVFEDKKILREKLNEITWLSDQQKDVLESSRYQGWGRLSKKLLTGIVNDQGERIIDKLWNTNKNFMQIQSDDDFAKRIHEANADQMQAVDVEDVLADAYTSPQNKKAIRQVVKVVDDIQKAMGGVAPKYISIEFTRSEDRNPRRTISRQRQLENTLKDTAKSLAKSINPELLSELDNAAKSKKGLTDRLYLYFTQLGKDIYTGEPINIDELNKYDIDHILPQAFIKDNSLDNRVLVLTAVNNGKSDNVPLRMFGAKMGHFWKQLAEAGLISKRKLKNLQTDPDTISKYAMHGFIRRQLVETSQVIKLVANILGDKYRNDDTKIIEITARMNHQMRDEFGFIKNREINDYHHAFDAYLTAFLGRYLYHRYIKLRPYFVYGDFKKFREDKVTMRNFNFLHDLTDDTQEKIADAETGEVIWDRENSIQQLKDVYHYKFMLISHEVYTLRGAMFNQTVYPASDAGKRKLIPVKADRPVNVYGGYSGSADAYMAIVRIHNKKGDKYRVVGVPMRALDRLDAAKNVSDADFDRALKDVLAPQLTKTKKSRKTGEITQVIEDFEIVLGKVMYRQLMIDGDKKFMLGSSTYQYNAKQLVLSDQSVKTLASKGRLDPLQESMDYNNVYTEILDKVNQYFSLYDMNKFRHKLNLGFSKFISFPNHNVLDGNTKVSSGKREILQEILNGLHANPTFGNLKDVGITTPFGQLQQPNGILLSDETKIRYQSPTGLFERTVSLKDL(SEQ ID NO:164)
在一些实施方案中,所述Cas9蛋白可以是无害李斯特菌(Listeria innocua)Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKPYTIGLDIGTNSVGWAVLTDQYDLVKRKMKIAGDSEKKQIKKNFWGVRLFDEGQTAADRRMARTARRRIERRRNRISYLQGIFAEEMSKTDANFFCRLSDSFYVDNEKRNSRHPFFATIEEEVEYHKNYPTIYHLREELVNSSEKADLRLVYLALAHIIKYRGNFLIEGALDTQNTSVDGIYKQFIQTYNQVFASGIEDGSLKKLEDNKDVAKILVEKVTRKEKLERILKLYPGEKSAGMFAQFISLIVGSKGNFQKPFDLIEKSDIECAKDSYEEDLESLLALIGDEYAELFVAAKNAYSAVVLSSIITVAETETNAKLSASMIERFDTHEEDLGELKAFIKLHLPKHYEEIFSNTEKHGYAGYIDGKTKQADFYKYMKMTLENIEGADYFIAKIEKENFLRKQRTFDNGAIPHQLHLEELEAILHQQAKYYPFLKENYDKIKSLVTFRIPYFVGPLANGQSEFAWLTRKADGEIRPWNIEEKVDFGKSAVDFIEKMTNKDTYLPKENVLPKHSLCYQKYLVYNELTKVRYINDQGKTSYFSGQEKEQIFNDLFKQKRKVKKKDLELFLRNMSHVESPTIEGLEDSFNSSYSTYHDLLKVGIKQEILDNPVNTEMLENIVKILTVFEDKRMIKEQLQQFSDVLDGVVLKKLERRHYTGWGRLSAKLLMGIRDKQSHLTILDYLMNDDGLNRNLMQLINDSNLSFKSIIEKEQVTTADKDIQSIVADLAGSPAIKKGILQSLKIVDELVSVMGYPPQTIVVEMARENQTTGKGKNNSRPRYKSLEKAIKEFGSQILKEHPTDNQELRNNRLYLYYLQNGKDMYTGQDLDIHNLSNYDIDHIVPQSFITDNSIDNLVLTSSAGNREKGDDVPPLEIVRKRKVFWEKLYQGNLMSKRKFDYLTKAERGGLTEADKARFIHRQLVETRQITKNVANILHQRFNYEKDDHGNTMKQVRIVTLKSALVSQFRKQFQLYKVRDVNDYHHAHDAYLNGVVANTLLKVYPQLEPEFVYGDYHQFDWFKANKATAKKQFYTNIMLFFAQKDRIIDENGEILWDKKYLDTVKKVMSYRQMNIVKKTEIQKGEFSKATIKPKGNSSKLIPRKTNWDPMKYGGLDSPNMAYAVVIEYAKGKNKLVFEKKIIRVTIMERKAFEKDEKAFLEEQGYRQPKVLAKLPKYTLYECEEGRRRMLASANEAQKGNQQVLPNHLVTLLHHAANCEVSDGKSLDYIESNREMFAELLAHVSEFAKRYTLAEANLNKINQLFEQNKEGDIKAIAQSFVDLMAFNAMGAPASFKFFETTIERKRYNNLKELLNSTIIYQSITGLYESRKRLDD(SEQ ID NO:165)
在一些实施方案中,所述Cas9蛋白可以是嗜肺军团菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MESSQILSPIGIDLGGKFTGVCLSHLEAFAELPNHANTKYSVILIDHNNFQLSQAQRRATRHRVRNKKRNQFVKRVALQLFQHILSRDLNAKEETALCHYLNNRGYTYVDTDLDEYIKDETTINLLKELLPSESEHNFIDWFLQKMQSSEFRKILVSKVEEKKDDKELKNAVKNIKNFITGFEKNSVEGHRHRKVYFENIKSDITKDNQLDSIKKKIPSVCLSNLLGHLSNLQWKNLHRYLAKNPKQFDEQTFGNEFLRMLKNFRHLKGSQESLAVRNLIQQLEQSQDYISILEKTPPEITIPPYEARTNTGMEKDQSLLLNPEKLNNLYPNWRNLIPGIIDAHPFLEKDLEHTKLRDRKRIISPSKQDEKRDSYILQRYLDLNKKIDKFKIKKQLSFLGQGKQLPANLIETQKEMETHFNSSLVSVLIQIASAYNKEREDAAQGIWFDNAFSLCELSNINPPRKQKILPLLVGAILSEDFINNKDKWAKFKIFWNTHKIGRTSLKSKCKEIEEARKNSGNAFKIDYEEALNHPEHSNNKALIKIIQTIPDIIQAIQSHLGHNDSQALIYHNPFSLSQLYTILETKRDGFHKNCVAVTCENYWRSQKTEIDPEISYASRLPADSVRPFDGVLARMMQRLAYEIAMAKWEQIKHIPDNSSLLIPIYLEQNRFEFEESFKKIKGSSSDKTLEQAIEKQNIQWEEKFQRIINASMNICPYKGASIGGQGEIDHIYPRSLSKKHFGVIFNSEVNLIYCSSQGNREKKEEHYLLEHLSPLYLKHQFGTDNVSDIKNFISQNVANIKKYISFHLLTPEQQKAARHALFLDYDDEAFKTITKFLMSQQKARVNGTQKFLGKQIMEFLSTLADSKQLQLEFSIKQITAEEVHDHRELLSKQEPKLVKSRQQSFPSHAIDATLTMSIGLKEFPQFSQELDNSWFINHLMPDEVHLNPVRSKEKYNKPNISSTPLFKDSLYAERFIPVWVKGETFAIGFSEKDLFEIKPSNKEKLFTLLKTYSTKNPGESLQELQAKSKAKWLYFPINKTLALEFLHHYFHKEIVTPDDTTVCHFINSLRYYTKKESITVKILKEPMPVLSVKFESSKKNVLGSFKHTIALPATKDWERLFNHPNFLALKANPAPNPKEFNEFIRKYFLSDNNPNSDIPNNGHNIKPQKHKAVRKVFSLPVIPGNAGTMMRIRRKDNKGQPLYQLQTIDDTPSMGIQINEDRLVKQEVLMDAYKTRNLSTIDGINNSEGQAYATFDNWLTLPVSTFKPEIIKLEMKPHSKTRRYIRITQSLADFIKTIDEALMIKPSDSIDDPLNMPNEIVCKNKLFGNELKPRDGKMKIVSTGKIVTYEFESDSTPQWIQTLYVTQLKKQP(SEQ ID NO:166)
在一些实施方案中,所述Cas9蛋白可以是嗜乳糖奈瑟球菌(N.lactamica)Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPMNYILGLDIGIASVGWAMVEVDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQDADFDENGLVKSLPNTPWQLRAAALDRKLTCLEWSAVLLHLVKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELNLLFEKQKEFGNPHVSDGLKEDIETLLMAQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSTELQDEIGTAFSLFKTDKDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYCKKNAEEKIYLPPIPADEIRNPVVLRALSQARKVINCVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEEGFKERNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRTENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKAHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGISVLRVPLTQLKLKGLEKMVNREREPKLYDALKAQLETHKDDPAKAFAEPFYKYDKAGSRTQQVKAVRIEQVQKTGVWVRNHNGIADNATMVRVDVFEKGGKYYLVPIYSWQVAKGILPDRAVVAFKDEEDWTVMDDSFEFRFVLYANDLIKLTAKKNEFLGYFVSLNRATGAIDIRTHDTDSTKGKNGIFQSVGVKTALSFQKNQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:167)
在一些实施方案中,所述Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPINYILGLDIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:168)
在一些实施方案中,所述Cas9蛋白可以是长双歧杆菌(B.longum)Cas9,并且可以包含以下氨基酸序列或由其组成:
MLSRQLLGASHLARPVSYSYNVQDNDVHCSYGERCFMRGKRYRIGIDVGLNSVGLAAVEVSDENSPVRLLNAQSVIHDGGVDPQKNKEAITRKNMSGVARRTRRMRRRKRERLHKLDMLLGKFGYPVIEPESLDKPFEEWHVRAELATRYIEDDELRRESISIALRHMARHRGWRNPYRQVDSLISDNPYSKQYGELKEKAKAYNDDATAAEEESTPAQLVVAMLDAGYAEAPRLRWRTGSKKPDAEGYLPVRLMQEDNANELKQIFRVQRVPADEWKPLFRSVFYAVSPKGSAEQRVGQDPLAPEQARALKASLAFQEYRIANVITNLRIKDASAELRKLTVDEKQSIYDQLVSPSSEDITWSDLCDFLGFKRSQLKGVGSLTEDGEERISSRPPRLTSVQRIYESDNKIRKPLVAWWKSASDNEHEAMIRLLSNTVDIDKVREDVAYASAIEFIDGLDDDALTKLDSVDLPSGRAAYSVETLQKLTRQMLTTDDDLHEARKTLFNVTDSWRPPADPIGEPLGNPSVDRVLKNVNRYLMNCQQRWGNPVSVNIEHVRSSFSSVAFARKDKREYEKNNEKRSIFRSSLSEQLRADEQMEKVRESDLRRLEAIQRQNGQCLYCGRTITFRTCEMDHIVPRKGVGSTNTRTNFAAVCAECNRMKSNTPFAIWARSEDAQTRGVSLAEAKKRVTMFTFNPKSYAPREVKAFKQAVIARLQQTEDDAAIDNRSIESVAWMADELHRRIDWYFNAKQYVNSASIDDAEAETMKTTVSVFQGRVTASARRAAGIEGKIHFIGQQSKTRLDRRHHAVDASVIAMMNTAAAQTLMERESLRESQRLIGLMPGERSWKEYPYEGTSRYESFHLWLDNMDVLLELLNDALDNDRIAVMQSQRYVLGNSIAHDATIHPLEKVPLGSAMSADLIRRASTPALWCALTRLPDYDEKEGLPEDSHREIRVHDTRYSADDEMGFFASQAAQIAVQEGSADIGSAIHHARVYRCWKTNAKGVRKYFYGMIRVFQTDLLRACHDDLFTVPLPPQSISMRYGEPRVVQALQSGNAQYLGSLVVGDEIEMDFSSLDVDGQIGEYLQFFSQFSGGNLAWKHWVVDGFFNQTQLRIRPRYLAAEGLAKAFSDDVVPDGVQKIVTKQGWLPPVNTASKTAVRIVRRNAFGEPRLSSAHHMPCSWQWRHE(SEQ ID NO:169)
在一些实施方案中,所述Cas9蛋白可以是嗜粘蛋白艾克曼菌(A.muciniphila)Cas9,并且可以包含以下氨基酸序列或由其组成:
MSRSLTFSFDIGYASIGWAVIASASHDDADPSVCGCGTVLFPKDDCQAFKRREYRRLRRNIRSRRVRIERIGRLLVQAQIITPEMKETSGHPAPFYLASEALKGHRTLAPIELWHVLRWYAHNRGYDNNASWSNSLSEDGGNGEDTERVKHAQDLMDKHGTATMAETICRELKLEEGKADAPMEVSTPAYKNLNTAFPRLIVEKEVRRILELSAPLIPGLTAEIIELIAQHHPLTTEQRGVLLQHGIKLARRYRGSLLFGQLIPRFDNRIISRCPVTWAQVYEAELKKGNSEQSARERAEKLSKVPTANCPEFYEYRMARILCNIRADGEPLSAEIRRELMNQARQEGKLTKASLEKAISSRLGKETETNVSNYFTLHPDSEEALYLNPAVEVLQRSGIGQILSPSVYRIAANRLRRGKSVTPNYLLNLLKSRGESGEALEKKIEKESKKKEADYADTPLKPKYATGRAPYARTVLKKVVEEILDGEDPTRPARGEAHPDGELKAHDGCLYCLLDTDSSVNQHQKERRLDTMTNNHLVRHRMLILDRLLKDLIQDFADGQKDRISRVCVEVGKELTTFSAMDSKKIQRELTLRQKSHTDAVNRLKRKLPGKALSANLIRKCRIAMDMNWTCPFTGATYGDHELENLELEHIVPHSFRQSNALSSLVLTWPGVNRMKGQRTGYDFVEQEQENPVPDKPNLHICSLNNYRELVEKLDDKKGHEDDRRRKKKRKALLMVRGLSHKHQSQNHEAMKEIGMTEGMMTQSSHLMKLACKSIKTSLPDAHIDMIPGAVTAEVRKAWDVFGVFKELCPEAADPDSGKILKENLRSLTHLHHALDACVLGLIPYIIPAHHNGLLRRVLAMRRIPEKLIPQVRPVANQRHYVLNDDGRMMLRDLSASLKENIREQLMEQRVIQHVPADMGGALLKETMQRVLSVDGSGEDAMVSLSKKKDGKKEKNQVKASKLVGVFPEGPSKLKALKAAIEIDGNYGVALDPKPVVIRHIKVFKRIMALKEQNGGKPVRILKKGMLIHLTSSKDPKHAGVWRIESIQDSKGGVKLDLQRAHCAVPKNKTHECNWREVDLISLLKKYQMKRYPTSYTGTPR(SEQ ID NO:170)
在一些实施方案中,所述Cas9蛋白可以是兰氏臭杆菌(O.laneus)Cas9,并且可以包含以下氨基酸序列或由其组成:
METTLGIDLGTNSIGLALVDQEEHQILYSGVRIFPEGINKDTIGLGEKEESRNATRRAKRQMRRQYFRKKLRKAKLLELLIAYDMCPLKPEDVRRWKNWDKQQKSTVRQFPDTPAFREWLKQNPYELRKQAVTEDVTRPELGRILYQMIQRRGFLSSRKGKEEGKIFTGKDRMVGIDETRKNLQKQTLGAYLYDIAPKNGEKYRFRTERVRARYTLRDMYIREFEIIWQRQAGHLGLAHEQATRKKNIFLEGSATNVRNSKLITHLQAKYGRGHVLIEDTRITVTFQLPLKEVLGGKIEIEEEQLKFKSNESVLFWQRPLRSQKSLLSKCVFEGRNFYDPVHQKWIIAGPTPAPLSHPEFEEFRAYQFINNIIYGKNEHLTAIQREAVFELMCTESKDFNFEKIPKHLKLFEKFNFDDTTKVPACTTISQLRKLFPHPVWEEKREEIWHCFYFYDDNTLLFEKLQKDYALQTNDLEKIKKIRLSESYGNVSLKAIRRINPYLKKGYAYSTAVLLGGIRNSFGKRFEYFKEYEPEIEKAVCRILKEKNAEGEVIRKIKDYLVHNRFGFAKNDRAFQKLYHHSQAITTQAQKERLPETGNLRNPIVQQGLNELRRTVNKLLATCREKYGPSFKFDHIHVEMGRELRSSKTEREKQSRQIRENEKKNEAAKVKLAEYGLKAYRDNIQKYLLYKEIEEKGGTVCCPYTGKTLNISHTLGSDNSVQIEHIIPYSISLDDSLANKTLCDATFNREKGELTPYDFYQKDPSPEKWGASSWEEIEDRAFRLLPYAKAQRFIRRKPQESNEFISRQLNDTRYISKKAVEYLSAICSDVKAFPGQLTAELRHLWGLNNILQSAPDITFPLPVSATENHREYYVITNEQNEVIRLFPKQGETPRTEKGELLLTGEVERKVFRCKGMQEFQTDVSDGKYWRRIKLSSSVTWSPLFAPKPISADGQIVLKGRIEKGVFVCNQLKQKLKTGLPDGSYWISLPVISQTFKEGESVNNSKLTSQQVQLFGRVREGIFRCHNYQCPASGADGNFWCTLDTDTAQPAFTPIKNAPPGVGGGQIILTGDVDDKGIFHADDDLHYELPASLPKGKYYGIFTVESCDPTLIPIELSAPKTSKGENLIEGNIWVDEHTGEVRFDPKKNREDQRHHAIDAIVIALSSQSLFQRLSTYNARRENKKRGLDSTEHFPSPWPGFAQDVRQSVVPLLVSYKQNPKTLCKISKTLYKDGKKIHSCGNAVRGQLHKETVYGQRTAPGATEKSYHIRKDIRELKTSKHIGKVVDITIRQMLLKHLQENYHIDITQEFNIPSNAFFKEGVYRIFLPNKHGEPVPIKKIRMKEELGNAERLKDNINQYVNPRNNHHVMIYQDADGNLKEEIVSFWSVIERQNQGQPIYQLPREGRNIVSILQINDTFLIGLKEEEPEVYRNDLSTLSKHLYRVQKLSGMYYTFRHHLASTLNNEREEFRIQSLEAWKRANPVKVQIDEIGRITFLNGPLC(SEQ ID NO:171)。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含V型CRISPR Cas蛋白。在一些实施方案中,所述V型CRISPR Cas蛋白包含Cpf1蛋白。本公开文本的示例性Cpf1蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cpf1蛋白可以从任何物种分离或衍生,所述物种包括但不限于土拉热弗朗西丝菌新凶手亚种、氨基酸球菌属物种(Acidaminococcus sp.)BV3L6和毛螺科细菌物种(Lachnospiraceae bacterium sp.)ND2006。本公开文本的示例性Cpf1蛋白可以是核酸酶失活的。
本公开文本的示例性野生型土拉热弗朗西丝菌新凶手亚种Cpf1(FnCpf1)蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000801
Figure BDA0002925003530000811
本公开文本的示例性野生型毛螺科细菌物种ND2006 Cpf1(LbCpf1)蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000812
Figure BDA0002925003530000821
本公开文本的示例性野生型氨基酸球菌属物种BV3L6 Cpf1(AsCpf1)蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000822
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含VI型CRISPR Cas蛋白或其部分。在一些实施方案中,所述VI型CRISPR Cas蛋白包含Cas13蛋白或其部分。本公开文本的示例性Cas13蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cas13蛋白可以从任何物种分离或衍生,所述物种包括但不限于韦德纤毛菌(Leptotrichia wadei)、西尔李斯特菌血清变型(Listeriaseeligeri serovar)1/2b(菌株ATCC 35967/DSM 20751/CIP 100100/SLCC 3954)、毛螺科细菌、嗜氨基梭菌(Clostridium aminophilum)DSM10710、鸡肉杆菌(Carnobacteriumgallinarum)DSM 4847、产丙酸沼杆菌(Paludibacter propionicigenes)WB4、韦氏李斯特菌(Listeria weihenstephanensis)FSL R9-0317、韦氏李斯特菌FSL R9-0317、细菌FSLM6-0635(纽约李斯特菌(Listeria newyorkensis))、韦德纤毛菌F0279、荚膜红细菌(Rhodobacter capsulatus)SB 1003、荚膜红细菌R121、荚膜红细菌DE442和溃疡棒状杆菌(Corynebacterium ulcerans)。本公开文本的示例性Cas13蛋白可以是DNA核酸酶失活的。本公开文本的示例性Cas13蛋白包括但不限于Cas13a、Cas13b、Cas13c、Cas13d及其直系同源物。本公开文本的示例性Cas13b蛋白包括但不限于亚型1和2,在本文中分别称为Csx27和Csx28。
示例性Cas13a蛋白包括但不限于:
Figure BDA0002925003530000831
Figure BDA0002925003530000841
本公开文本的示例性野生型Cas13a蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000842
Figure BDA0002925003530000851
示例性Cas13b蛋白包括但不限于:
Figure BDA0002925003530000852
Figure BDA0002925003530000861
Figure BDA0002925003530000871
Figure BDA0002925003530000881
本公开文本的示例性野生型动物溃疡伯格菌ATCC 43767Cas13b(BzCas13b)蛋白可以包含以下氨基酸序列或由其组成:
Figure BDA0002925003530000882
Figure BDA0002925003530000891
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白或RNA指导的靶RNA结合蛋白的序列包含从CasRX/Cas13d蛋白分离或衍生的序列。CasRX/Cas13d是VI-D型CRISPR-Cas系统的效应子。在一些实施方案中,所述CasRX/Cas13d蛋白是可以切割或结合RNA的RNA指导的RNA内切核酸酶。在一些实施方案中,所述CasRX/Cas13d蛋白可以包括一个或多个高等真核生物和原核生物核苷酸结合(HEPN)结构域。在一些实施方案中,所述CasRX/Cas13d蛋白可以包括野生型或突变的HEPN结构域。在一些实施方案中,所述CasRX/Cas13d蛋白包括无法切割RNA但可以加工指导RNA的突变的HEPN结构域。在一些实施方案中,所述CasRX/Cas13d蛋白不需要原间隔子侧翼序列。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群6049000251(CasRX/Cas13d Gut_metagenome_contig6049000251):
Figure BDA0002925003530000892
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群546000275:
Figure BDA0002925003530000893
Figure BDA0002925003530000901
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群4114000374:
Figure BDA0002925003530000902
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群721000619:
Figure BDA0002925003530000903
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群2002000411:
Figure BDA0002925003530000904
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群13552000311:
Figure BDA0002925003530000905
Figure BDA0002925003530000911
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群10037000527:
Figure BDA0002925003530000912
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群238000329:
Figure BDA0002925003530000913
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群2643000492:
Figure BDA0002925003530000914
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群874000057:
Figure BDA0002925003530000921
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群4781000489:
Figure BDA0002925003530000922
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群12144000352:
Figure BDA0002925003530000923
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群5590000448:
Figure BDA0002925003530000924
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群525000349:
Figure BDA0002925003530000931
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群7229000302:
Figure BDA0002925003530000932
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群3227000343:
Figure BDA0002925003530000933
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群7030000469:
Figure BDA0002925003530000934
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_P17E0k2120140920,_c87000043:
Figure BDA0002925003530000935
Figure BDA0002925003530000943
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OBVH01003037.1,人肠宏基因组序列(也发现于WGS重叠群emb|OBXZ01000094.1|和emb|OBJF01000033.1|):
Figure BDA0002925003530000941
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群tpg|DJXD01000002.1|(未培育的瘤胃球菌属(Ruminococcus)联合体,UBA7013,来自绵羊肠道宏基因组):
Figure BDA0002925003530000942
Figure BDA0002925003530000951
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群tpg|D JXD01000002.1|(未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组)(SEQ ID NO:95)的示例性同向重复序列包含以下核酸序列或由其组成:
CasRX/Cas13d DR:
caactacaac cccgtaaaaa tacggggttc tgaaac 36
(SEQ ID NO:96)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OGZC01000639.1(人肠道宏基因组联合体):
Figure BDA0002925003530000952
Figure BDA0002925003530000961
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OHBM01000764.1(人肠道宏基因组联合体):
Figure BDA0002925003530000962
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OHCP01000044.1(人肠道宏基因组联合体):
Figure BDA0002925003530000971
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGDF01008514.1|(人肠道宏基因组联合体):
Figure BDA0002925003530000972
Figure BDA0002925003530000981
(SEQ ID NO:100)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGPN01002610.1(人肠道宏基因组联合体):
Figure BDA0002925003530000982
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):来自重叠群emb|OBLI01020244和emb|OBLI01038679(来自猪肠道宏基因组):
Figure BDA0002925003530000991
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OIZX01000427.1:
Figure BDA0002925003530000992
Figure BDA0002925003530001001
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OCTW011587266.1:
Figure BDA0002925003530001002
Figure BDA0002925003530001013
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGNF01009141.1:
Figure BDA0002925003530001011
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OIEN01002196.1:
Figure BDA0002925003530001012
Figure BDA0002925003530001021
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群e-k87_11092736:
Figure BDA0002925003530001022
Figure BDA0002925003530001033
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群e-k87_11092736(SEQ IDNO:107)的示例性同向重复序列包含以下核酸序列或由其组成:
CasRX/Cas13d同向重复1:gtgagaagtc tccttatggg gagatgctac 30
(SEQ ID NO:108)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0129306_1000735:
Figure BDA0002925003530001031
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0129317_1008067:
Figure BDA0002925003530001032
Figure BDA0002925003530001041
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0224415_10048792:
Figure BDA0002925003530001042
Figure BDA0002925003530001051
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 160582958_基因49834:
Figure BDA0002925003530001052
CasRX/Cas13d蛋白的示例性同向重复序列可以包含以下序列或由其组成:
CasRX/Cas13d 160582958_基因49834(SEQ ID NO:112)包含以下核酸序列或由其组成:
CasRX/Cas13d DR:
gaactacacc cctctgttct tgtaggggtc taacac 36
(SEQ ID NO:113)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 250twins_35838_GL0110300:
Figure BDA0002925003530001061
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 250twins_36050_GL0158985:
Figure BDA0002925003530001062
Figure BDA0002925003530001071
Yan等人(2018)Mol Cell.70(2):327-339(doi:10.1016/j.molcel.2018.02.2018)和Konermann等人(2018)Cell 173(3):665-676(doi:10.1016/j.c ell/2018.02.033)已经描述了CasRX/Cas13d蛋白,将所述两篇参考文献都通过引用以其整体并入本文。还参见WO公开号WO 2018/183703(CasM)和WO2019/006471(Cas13d),将其通过引用以其整体并入本文。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(生黄瘤胃球菌(Ruminococcus flavefaciens)XPD3002)序列:
Figure BDA0002925003530001072
Figure BDA0002925003530001081
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(重叠群e-k87_11092736):
MKRQKTFAKRIGIKSTVAYGQGKYAITTFGKGSKAEIAVRSADPPEETLPTESDATLSIHAKFAKAGRDGREFKCGDVDETRIHTSRSEYESLISNPAESPREDYLGLKGTLERKFFGDEYPKDNLRIQIIYSILDIQKILGLYVEDILHFVDGLQDEPEDLVGLGLGDEKMQKLLSKALPYMGFFGSTDVFKVTKKREERAAADEHNAKVFRALGAIRQKLAHFKWKESLAIFGANANMPIRFFQGATGGRQLWNDVIAPLWKKRIERVRKSFLSNSAKNLWVLYQVFKDDTDEKKKARARQYYHFSVLKEGKNLGFNLTKTREYFLDKFFPIFHSSAPDVKRKVDTFRSKFYAILDFIIYEASVSVANSGQMGKVAPWKGAIDNALVKLREAPDEEAKEKIYNVLAASIRNDSLFLRLKSACDKFGAEQNRPVFPNELRNNRDIRNVRSEWLEATQDVDAAAFVQLIAFLCNFLEGKEINELVTALIKKFEGIQALIDLLRNLEGVDSIRFENEFALFNDDKGNMAGRIARQLRLLASVGKMKPDMTDAKRVLYKSALEILGAPPDEVSDEWLAENILLDKSNNDYQKAKKTVNPFRNYIAKNVITSRSFYYLVRYAKPTAVRKLMSNPKIVRYVLKRLPEKQVASYYSAIWTQSESNSNEMVKLIEMIDRLTTEIAGFSFAVLKDKKDSIVSASRESRAVNLEVERLKKLTTLYMSIAYIAVKSLVKVNARYFIAYSALERDLYFFNEKYGEEFRLHFIPYELNGKTCQFEYLAILKYYLARDEETLKRKCEICEEIKVGCEKHKKNANPPYEYDQEWIDKKKALNSERKACERRLHFSTHWAQYATKRDENMAKHPQKWYDILASHYDELLALQATGWLATQARNDAEHLNPVNEFDVYIEDLRRYPEGTPKNKDYHIGSYFEIYHYIRQRAYLEEVLAKRKEYRDSGSFTDEQLDKLQKILDDIRARGSYDKNLLKLEYLPFAYNLPRYKNLTTEALFDDDSVSGKKRVAEWREREKTREAEREQRRQR(SEQ ID NO:46)。
Cas13d(重叠群e-k87_11092736)(SEQ ID NO:46)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(重叠群e-k87_11092736)同向重复序列:
GTGAGAAGTCTCCTTATGGGGAGATGCTAC(SEQ ID NO:47)。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(160582958_基因49834):
MKNSVTFKLIQAQENKEAARKKAKDIAEQARIAKRNGVVKKEENRINRIQIEIQTQKKSNTQNAYHLKSLAKAAGVKSVFAIGNDLLMTGFGPGNDATIEKRVFQNRAIETLSSPEQYSAEFQNKQFKIKGNIKVLNHSTQKMEEIQTELQDNYNRPHFDLLGCKNVLEQKYFGRTFSDNIHVQIAYNIMDIEKLLTPYINNIIYTLNELMRDNSKDDFFGCDSHFSVAYLYDELKAGYSDRLKTKPNLSKNIDRIWNNFCNYMNSDSGNTEARLAYFGELFYKPKETGDAKSDYKTHLSNNQKEEWELKSDKEVYNIFAILCDLRHFCTHGESITPSGKPFPYNLEKNLFPEAKQVLNSLFEEKAESLGAEAFGKTAGKTDVSILLKVFEKEQASQKEQQALLKEYYDFKVQKTYKNMGFSIKKLREAIMEIPDAAKFKDDLYSSLRHKLYGLFDFILVKHFLDTSDSENLQNNDIFRQLRACRCEEEKDQVYRSIAVKVWEKVKKKELNMFKQVVVIPSLSKDELKQMEMTKNTELLSSIETISTQASLFSEMIFMMTYLLDGKEINLLCTSLIEKFENIASFNEVLKSPQIGYETKYTEGYAFFKNADKTAKELRQVNNMARMTKPLGGVNTKCVMYNEAAKILGAKPMSKAELESVFNLDNHDYTYSPSGKKIPNKNFRNFIINNVITSRRFLYLIRYGNPEKIRKIAINPSIISFVLKQIPDEQIKRYYPPCIGKRTDDVTLMRDELGKMLQSVNFEQFSRVNNKQNAKQNPNGEKARLQACVRLYLTVPYLFIKNMVNINARYVLAFHCLERDHALCFNSRKLNDDSYNEMANKFQMVRKAKKEQYEKEYKCKKQETGTAHTKKIEKLNQQIAYIDKDIKNMHSYTCRNYRNLVAHLNVVSKLQNYVSELPNDYQITSYFSFYHYCMQLGLMEKVSSKNIPLVESLKNEANDAQSYSAKKTLEYFDLIEKNRTYCKDFLKALNAPFSYNLPRFKNLSIEALFDKNIVYEQADLKKE(SEQ ID NO:48)。
Cas13d(160582958_基因49834)(SEQ ID NO:48)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(160582958_基因49834)同向重复序列:
GAACTACACCCCTCTGTTCTTGTAGGGGTCTAACAC(SEQ ID NO:49)。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组):
MKKQKSKKTVSKTSGLKEALSVQGTVIMTSFGKGNMANLSYKIPSSQKPQNLNSSAGLKNVEVSGKKIKFQGRHPKIATTDNPLFKPQPGMDLLCLKDKLEMHYFGKTFDDNIHIQLIYQILDIEKILAVHVNNIVFTLDNVLHPQKEELTEDFIGAGGWRINLDYQTLRGQTNKYDRFKNYIKRKELLYFGEAFYHENERRYEEDIFAILTLLSALRQFCFHSDLSSDESDHVNSFWLYQLEDQLSDEFKETLSILWEEVTERIDSEFLKTNTVNLHILCHVFPKESKETIVRAYYEFLIKKSFKNMGFSIKKLREIMLEQSDLKSFKEDKYNSVRAKLYKLFDFIITYYYDHHAFEKEALVSSLRSSLTEENKEEIYIKTARTLASALGADFKKAAADVNAKNIRDYQKKANDYRISFEDIKIGNTGIGYFSELIYMLTLLLDGKEINDLLTTLINKFDNIISFIDILKKLNLEFKFKPEYADFFNMTNCRYTLEELRVINSIARMQKPSADARKIMYRDALRILGMDNRPDEEIDRELERTMPVGADGKFIKGKQGFRNFIASNVIESSRFHYLVRYNNPHKTRTLVKNPNVVKFVLEGIPETQIKRYFDVCKGQEIPPTSDKSAQIDVLARIISSVDYKIFEDVPQSAKINKDDPSRNFSDALKKQRYQAIVSLYLTVMYLITKNLVYVNSRYVIAFHCLERDAFLHGVTLPKMNKKIVYSQLTTHLLTDKNYTTYGHLKNQKGHRKWYVLVKNNLQNSDITAVSSFRNIVAHISVVRNSNEYISGIGELHSYFELYHYLVQSMIAKNNWYDTSHQPKTAEYLNNLKKHHTYCKDFVKAYCIPFGYVVPRYKNLTINELFDRNNPNPEPKEEV(SEQ ID NO:50)。
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组)(SEQ ID NO:50)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组):CAACTACAACCCCGTAAAAATACGGGGTTCTGAAAC(SEQ ID NO:51)。
在本公开文本的一些实施方案中,CjeCas9-内切核酸酶融合物和gRNA分子可以包含以下的核酸序列或由其组成:
E43-CjeCas9和sgRNA质粒(U6:N=sgRNA间隔子,E43,CjeCas9)gtttattacagggac agcagagatccagtttggttaattaaggtaccgagggcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaactt gaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgTGTTCTCCCCAAGAATCTGGCATGACCGCTCTTTCAGCGAGGATGTTGACGCGAAGCAGATCCCTGGGACCTGGGGCCGGGCCACGAGGGTGTCGGGAAGAACCAGGACCGTTGCGACGGAGGGAAGCAGCAGCGGAAGCTCGGAAATCCCATTCTCCGGTTAAACGACCCCGCAAGGCACAACGGCTCAGGGTTGCTTACGAGGGGAGCGATTCCGAAAAGGGTGAAGGAGCAGAGCCCTTGAAGGTTCCAGTATGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAA GGATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTG GCACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGT TTAAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCC GTATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCG AAGAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAA ATGAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAA TAGCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGAC GAGCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGA GCGTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAA ACGGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTT AAAAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTT TGACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTT CATCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAA ATTGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAA ACCAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCAC CCCCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGAC AAAAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCA TCAAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGC AAGGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAG GACGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAG AACAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAAT AGACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAAT CAGGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGG CTAAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAA AGACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTG CCGCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTG GGATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCAT TGACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCC AACAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCA GCGGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGG CGCCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAG GCTCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCT TCAAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAA TAAGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTT TCTCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTT TTACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGAT TCTCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAA TATATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:202)。
在本公开文本的一些实施方案中,CjeCas9-内切核酸酶融合物和gRNA分子可以包含以下的核酸序列或由其组成:
E67-CjeCas9和sgRNA质粒(U6:N=sgRNA间隔子,E67,CjeCas9)gtttattacagggac agcagagatccagtttggttaattaaggtaccgagggcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaactt gaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgCAGGAGGTAATAGCGGGGCTTGAGCGATTTACCTTTGCCTTCGAAAAAGACGTAGAGATGCAGAAGGGAACCGGCCTGCTCCCATTTCAAGGTATGGACAAATCAGCATCTGCCGTGTGCAATTTTTTCACCAAGGGTCTGTGTGAAAAGGGGAAGCTCTGTCCATTTCGCCATGATCGCGGAGAGAAGATGGTGGTGTGTAAGCACTGGCTGAGAGGGCTTTGCAAAAAAGGCGACCACTGCAAATTTCTTCACCAATATGACCTGACTCGAATGCCTGAGTGTTATTTTTACAGTAAGTTCGGTGACTGTAGCAACAAAGAATGCAGCTTCTTGCATGTCAAACCAGCATTCAAGTCACAGGATTGCCCGTGGTACGATCAGGGTTTTTGCAAGGACGGTCCCCTCTGCAAATATCGACACGTACCCAGAATTATGTGCCTTAATTACCTGGTCGGCTTCTGTCCTGAAGGGCCAAAATGTCAGTTTGCTCAAAAAATTCGCGAGTTCAAATTGCTCCCTGGGTCTAAAATTTGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGc gATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAAGGATTGCGGCGTGCGAATTTTCACT AAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTGGCACGCTCCGCACGAAAGAGGCTTG CCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGTTTAAACTGAATTATGAGGACTACCA ATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCCGTATGAGCTCCGGTTCAGAGCACTC AACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCGAAGAGGCGAGGATACGATGACATTA AAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAAATGAAGAGAAGCTCGCTAACTATCA ATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAATAGCAAGGAATTTACTAATGTCCGG AATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGACGAGCTCAAATTGATTTTCAAGAAAC AAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGAGCGTTGCCTTTTACAAACGCGCCCT TAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAAACGGGCGCCAAAAAATAGCCCTTTG GCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTTAAAAACACGGAAGGGATTCTGTACA CAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTTTGACCTACAAACAAACCAAAAAGCT TCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTTCATCGAATTCAAGAAGTATAAGGAG TTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAAATTGCTAAGGATATCACTCTGATTA AAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAAACCAAATAGATAGCCTCAGCAAGTT GGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCACCCCCTTGATGCTTGAAGGAAAGAAA TATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGACAAAAAAGATTTCCTCCCAGCTTTCA ATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCATCAAAGAGTATCGAAAGGTCCTGAA TGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGCAAGGGAGGTCGGTAAGAACCACTCC CAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAGGACGCCGAGCTCGAGTGCGAAAAGC TGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAGAACAAAAAGAATTTTGTGCTTATAG TGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAATAGACgcgATATATCCATATAGCAGG TCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAATCAGGAAAAGTTGAATCAGACCCCCT TTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGGCTAAGAATCTTCCTACTAAGAAACA GAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAAAGACCGCAACCTCAATGACACCAGA TACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTGCCGCTGTCTGATGATGAGAACACGA AACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTGGGATGCTCACCTCAGCATTGAGGCA TACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCATTGACGCAGTTATCATAGCGTATGCC AATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCCAACAGCGCCGAGCTCTACGCAAAAA AGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCAGCGGATTTCGACAGAAGGTATTGGA TAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGGCGCCTTGCACGAAGAGACTTTCAGG AAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAGGCTCTCGAACTTGGAAAGATTAGGA AGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCTTCAAACATAAAAAAACGAATAAATT TTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAATAAGGCGGTAGCCCGATCTAAAAAA GGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTTTCTCTCTACAAGGATTCCCTTATAT TGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTTTTACTTCCTCTACGGTATCTTTGAT TGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGATTCTCTTTAAAAATGCGAACGAGAAA GAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAATATATAGTATCTGCCCTCGGAGAGG TTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:203)。
gRNA靶序列
在本公开文本的组合物的一些实施方案中,RNA分子的靶序列包含对应于第一RNA结合蛋白和/或第二RNA结合蛋白的序列基序。
在本公开文本的组合物和方法的一些实施方案中,所述序列基序是疾病或障碍的标志。
本公开文本的序列基序可以从基因组序列中发现的外来或外源序列的序列分离或衍生,并且因此翻译为本公开文本的mRNA分子或在本公开文本的RNA序列中发现的外来或外源序列的序列。
本公开文本的序列基序可以包含内源序列中引起疾病或障碍的突变或由其组成。所述突变可以包含序列取代、倒位、缺失、插入、转座或其任何组合,或者由其组成。
本公开文本的序列基序可以包含重复的序列或由其组成。在一些实施方案中,所述重复的序列可能与微卫星不稳定性(MSI)相关。一个或多个基因座处的MSI是由于本公开文本的细胞的DNA错配修复机制受损所致。可以将DNA的超变序列转录为本公开文本的包含靶序列的mRNA,所述靶序列包含所述超变序列或由其组成。
本公开文本的序列基序可以包含生物标记或由其组成。所述生物标记可以指示患上疾病或障碍的风险。所述生物标记可以指示健康基因(低或无可确定的患上疾病或障碍的风险)。所述生物标记可以指示编辑的基因。示例性生物标记包括但不限于单核苷酸多态性(SNP)、序列变异或突变、表观遗传标记、剪接受体位点、外源序列、异源序列及其任何组合。
本公开文本的序列基序可以包含二级、三级或四级结构或由其组成。所述二级、三级或四级结构可以是内源的或天然存在的。所述二级、三级或四级结构可以是诱导的或非天然存在的。所述二级、三级或四级结构可以由内源、外源或异源序列编码。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列包含在2个与100个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的所述靶序列包含在2个与50个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的所述靶序列包含在2个与20个之间的核苷酸或核酸碱基(包括端点)或由其组成。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列是连续的。在一些实施方案中,RNA分子的所述靶序列是不连续的。例如,RNA分子的所述靶序列可以包含不连续的一个或多个核苷酸或核酸碱基或由其组成,因为一个或多个间断的核苷酸定位于所述靶序列的核苷酸之间。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列是天然存在的。在一些实施方案中,RNA分子的所述靶序列是非天然存在的。示例性的非天然存在的靶序列可以包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或其任何组合,或者由其组成。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的指导RNA结合。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的第一RNA结合蛋白结合。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的第二RNA结合蛋白结合。
RNA分子
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含靶序列。在一些实施方案中,本公开文本的RNA分子包含至少一个靶序列。在一些实施方案中,本公开文本的RNA分子包含一个或多个靶序列。在一些实施方案中,本公开文本的RNA分子包含两个或更多个靶序列。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子是天然存在的RNA分子。在一些实施方案中,本公开文本的RNA分子是非天然存在的分子。示例性的非天然存在的RNA分子可以包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或其任何组合,或者由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从病毒分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从原核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含从古菌的物种或菌株或者细菌的物种或菌株分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从真核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含从以下的物种分离或衍生的序列或由其组成:原生动物、寄生虫、原生生物、藻类、真菌、酵母、变形虫、蠕虫、微生物、无脊椎动物、脊椎动物、昆虫、啮齿类动物、小鼠、大鼠、哺乳动物或灵长类动物。在一些实施方案中,本公开文本的RNA分子包含从人分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从生物或病毒的基因组的编码序列衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含初级RNA转录物、前体信使RNA(前体mRNA)或信使RNA(mRNA)或由其组成。在一些实施方案中,本公开文本的RNA分子包含尚未加工的基因产物(例如转录物)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行转录后加工的基因产物(例如包含5'帽和3'多聚腺苷酸化信号的转录物)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行选择性剪接的基因产物(例如剪接变体)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行非编码序列和/或内含子序列的去除的基因产物(例如信使RNA(mRNA))或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从非编码序列衍生的序列(例如非编码RNA(ncRNA))或由其组成。在一些实施方案中,本公开文本的RNA分子包含核糖体RNA或由其组成。在一些实施方案中,本公开文本的RNA分子包含小ncRNA分子或由其组成。本公开文本的示例性小RNA分子包括但不限于微小RNA(miRNA)、小干扰(siRNA)、piwi相互作用RNA(piRNA)、核仁小RNA(snoRNA)、小核RNA(snRNA)、细胞外或外泌体RNA(exRNA)和小卡哈尔体特异性RNA(scaRNA)。在一些实施方案中,本公开文本的RNA分子包含长ncRNA分子或由其组成。本公开文本的示例性长RNA分子包括但不限于X染色体失活特异性转录物(Xist)和HOX转录物反义RNA(HOTAIR)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞内间隙中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在胞质溶胶面中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在核中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在囊泡、细胞的膜结合区室或细胞器中接触。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞外间隙中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在外泌体中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在脂质体、聚合物囊泡、胶束或纳米颗粒中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞外基质中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在液滴中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在微流体液滴中接触。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含单链序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含双链序列或由其组成。在一些实施方案中,所述双链序列包含两个RNA分子。在一些实施方案中,所述双链序列包含一个RNA分子和一个DNA分子。在一些实施方案中,包括以下那些实施方案:其中所述双链序列包含一个RNA分子和一个DNA分子,本公开文本的组合物选择性结合并任选地选择性切割所述RNA分子。
融合蛋白
在本公开文本的组合物和方法的一些实施方案中,所述组合物包含编码靶RNA结合融合蛋白的序列,所述序列包含(a)编码第一RNA结合多肽或其部分的序列;以及(b)编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽结合靶RNA,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在一些实施方案中,靶RNA结合融合蛋白是RNA指导的靶RNA结合融合蛋白。RNA指导的靶RNA结合融合蛋白包含至少一种RNA结合多肽,其对应于将所述RNA结合多肽指导至靶RNA的gRNA。RNA指导的靶RNA结合融合蛋白包括但不限于RNA结合多肽,其是基于CRISPR/Cas的RNA结合多肽或其部分。
在一些实施方案中,靶RNA结合融合蛋白不是RNA指导的靶RNA结合融合蛋白,并且因此包含至少一种RNA结合多肽,其能够在没有相应gRNA序列的情况下结合靶RNA。此类非指导的RNA结合多肽包括但不限于作为PUF(Pumilio和FBF同源家族)的至少一种RNA结合蛋白或其RNA结合部分。这种类型的RNA结合多肽可以用于代替gRNA指导的RNA结合蛋白如CRISPR/Cas。参与介导mRNA稳定性和翻译的PUF蛋白(以果蝇(Drosophila)Pumilio和秀丽隐杆线虫(C.elegans)fem-3结合因子命名)的独特RNA识别模式是本领域中熟知的。也是本领域中已知的人Pumilio1的PUF结构域与同源RNA序列紧密结合,并且可以修饰其特异性。其含有八个PUF重复,它们识别八个保守RNA碱基,且每个重复识别单个碱基。由于每个重复中的两条氨基酸侧链识别相应碱基的Watson-Crick边缘并决定该重复的特异性,PUF结构域可以被设计为特异性结合大多数8-nt RNA。Wang等人,Nat Methods.2009;6(11):825-830。还参见WO 2012/068627,将其通过引用以其整体并入本文。
在本公开文本的非指导的RNA结合融合蛋白的一些实施方案中,所述融合蛋白包含作为PUMBY(基于Pumilio的联合体)蛋白的至少一种RNA结合蛋白或其RNA结合部分。已经以天然和修饰形式广泛用于靶向RNA的RNA结合蛋白PumHD(Pumilio同源结构域,PUF家族的成员)已经被工程化以产生一组四个规范蛋白质模块,其中的每个靶向一个RNA碱基。这些模块(即,Pumby,代表基于Pumilio的联合体)可以以不同组成和长度的链进行链状结合,以结合所需靶RNA。此类Pumby-RNA相互作用的特异性高,且Pumby链与携带相对于靶序列的三个或更多个错配的RNA序列的结合不可检测。Katarzyna等人,PNAS,2016;113(19):E2579-E2588。还参见US2016/0238593,将其通过引用以其整体并入本文。
在本公开文本的组合物的一些实施方案中,至少一种RNA结合蛋白或其RNA结合部分是PPR蛋白。PPR蛋白(从植物衍生的具有三角状五肽重复(PPR)基序的蛋白质)是核编码的并且仅在RNA水平上受控制细胞器(叶绿体和线粒体),切割,翻译,剪接,RNA编辑,特异性作用于RNA稳定性的基因。PPR蛋白通常是35个氨基酸的基序,并且具有以下结构,其中PPR基序是约10个连续氨基酸。PPR基序的组合可以用于与RNA的序列选择性结合。PPR蛋白通常由约10个重复结构域的PPR基序构成。PPR结构域或RNA结合结构域可以被配置为无催化活性的。将WO 2013/058404通过引用以其整体并入本文。
在一些实施方案中,本文公开的融合蛋白在所述至少两种RNA结合多肽之间包含接头。在一些实施方案中,所述接头是肽接头。在一些实施方案中,所述肽接头包含三肽GGS的一个或多个重复。在其他实施方案中,所述接头是非肽接头。在一些实施方案中,所述非肽接头包含聚乙二醇(PEG)、聚丙二醇(PPG)、共-聚(乙二醇/丙二醇)、聚氧乙烯(POE)、聚氨基甲酸酯、聚膦腈、多糖、葡聚糖、聚乙烯醇、聚乙烯吡咯烷酮、聚乙烯基乙醚、聚丙烯酰胺、聚丙烯酸酯、聚氰基丙烯酸酯、脂质聚合物、甲壳素、透明质酸、肝素或烷基接头。
在一些实施方案中,所述至少一种RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述至少一种RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述RNA结合蛋白。在一些实施方案中,所述至少一种RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述至少一种RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述至少一种RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。在一些实施方案中,所述至少一种RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在一些实施方案中,本文公开的编码融合蛋白的所述至少一种RNA结合蛋白的序列还包含编码核定位信号(NLS)的序列。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述RNA结合蛋白的序列的3'。在一些实施方案中,所述至少一种RNA结合蛋白包含在所述蛋白质的C末端的NLS。在一些实施方案中,编码所述至少一种RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述RNA结合蛋白的序列的3'。在一些实施方案中,所述至少一种RNA结合蛋白包含在所述蛋白质的C末端的第一NLS或第二NLS。在一些实施方案中,所述至少一种RNA结合蛋白还包含NES(核输出信号)或其他肽标签或分泌信号。
在一些实施方案中,本文公开的融合蛋白包含所述至少一种RNA结合蛋白作为第一RNA结合蛋白以及包含核酸酶结构域或由其组成的第二RNA结合蛋白。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。
在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的C末端的第一RNA结合多肽。在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的N末端的第一RNA结合多肽。
载体
在本公开文本的组合物和方法的一些实施方案中,载体包含本公开文本的指导RNA。在一些实施方案中,所述载体包含本公开文本的至少一种指导RNA。在一些实施方案中,所述载体包含本公开文本的一种或多种指导RNA。在一些实施方案中,所述载体包含本公开文本的两种或更多种指导RNA。在一些实施方案中,所述载体还包含本公开文本的融合蛋白。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。
在本公开文本的组合物和方法的一些实施方案中,第一载体包含本公开文本的指导RNA,并且第二载体包含本公开文本的融合蛋白。在一些实施方案中,所述第一载体包含本公开文本的至少一种指导RNA。在一些实施方案中,所述第一载体包含本公开文本的一种或多种指导RNA。在一些实施方案中,所述第一载体包含本公开文本的两种或更多种指导RNA。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,所述第一载体和所述第二载体是相同的。在一些实施方案中,所述第一载体和所述第二载体是不同的。
在本公开文本的组合物和方法的一些实施方案中,所述载体是或包含“双组分RNA靶向系统”的组分,所述双组分RNA靶向系统包含(a)编码本公开文本的靶向RNA的融合蛋白的核酸序列;以及(b)单一指导RNA(sgRNA)序列,其包含:在其5'端,与靶RNA序列杂交或特异性结合的RNA序列(例如,间隔子序列);和在其3'端,能够与所述融合蛋白的CRISPR/Cas蛋白特异性结合或缔合的RNA序列(例如,支架序列);并且其中所述双组分RNA靶向系统在PAMmer不存在的情况下识别并改变细胞中的所述靶RNA。在一些实施方案中,所述双组分系统的序列包含在单一(例如,一元)载体内。在一些实施方案中,所述双组分系统的间隔子序列靶向选自以下的重复序列:CUG、CCUG、CAG和GGGGCC。在一些实施方案中,所述双组分系统的间隔子序列靶向涉及适应性免疫应答的RNA序列。在一些实施方案中,所述双组分系统的间隔子序列包含编码适应性免疫应答的蛋白质组分的核酸序列的一部分,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。在一些实施方案中,所述双组分系统包含间隔子,其是编码适应性免疫应答的蛋白质组分的核酸序列的一部分,并且其长度是约20或21个核苷酸。在一些实施方案中,所述双组分系统包含第一和第二间隔子,其包含在单一的(singular)gRNA内。在一些实施方案中,所述双组分系统包含第一和第二间隔子序列,其包含在第一和第二gRNA序列内。在一些实施方案中,所述第一间隔子靶向重复序列,并且所述第二间隔子靶向涉及适应性免疫应答的RNA。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的载体是病毒载体。在一些实施方案中,所述病毒载体包含从逆转录病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从慢病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的。在一些实施方案中,所述病毒载体是自身互补的。
在本公开文本的组合物和方法的一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的反向末端重复序列或衣壳序列。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的(rAAV)。在一些实施方案中,所述病毒载体是自身互补的(scAAV)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的载体是非病毒载体。在一些实施方案中,所述载体包含以下项或由其组成:纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物或树枝状聚合物。在一些实施方案中,所述载体是表达载体或重组表达系统。如本文所用,术语“重组表达系统”是指用于表达通过重组形成的某些遗传物质的遗传构建体。
在本公开文本的组合物和方法的一些实施方案中,本文提供的表达载体、病毒载体或非病毒载体包括但不限于表达控制元件。如本文所用的“表达控制元件”是指调节编码序列如基因的表达的任何序列。示例性表达控制元件包括但不限于启动子、增强子、微小RNA、转录后调节元件、多聚腺苷酸化信号序列和内含子。例如,表达控制元件可以是组成型的、诱导型的、阻抑型的或组织特异性的。“启动子”是以下控制序列,其是多核苷酸序列中控制转录起始和速率的区域。它可以含有调节蛋白和分子可以结合的遗传元件,如RNA聚合酶和其他转录因子。在一些实施方案中,启动子对表达的控制是组织特异性的。非限制性的示例性启动子包括CMV、CBA、CAG、Cbh、EF-1a、PGK、UBC、GUSB、UCOE、hAAT、TBG、结蛋白(Desmin)、MCK、C5-12、NSE、突触蛋白(Synapsin)、PDGF、MecP2、CaMKII、mGluR2、NFL、NFH、nβ2、PPE、ENK、EAAT2、GFAP、MBP和U6启动子。“增强子”是DNA中可以由激活蛋白结合以增加转录的可能性或频率的区域。非限制性的示例性增强子和转录后调节元件包括CMV增强子和WPRE。
在本公开文本的组合物和方法的一些实施方案中,本文提供的表达载体、病毒载体或非病毒载体包括但不限于用于建构“多顺反子(multicistronic)”或“多顺反子(polycistronic)”或“双顺反子”或“三顺反子”构建体(即,具有双重或三重或多重编码区或外显子)的载体元件,如IRES或2A肽位点,并且因此将具有从mRNA表达来自单一构建体的两种或更多种蛋白质的能力。多顺反子载体从同一mRNA同时表达两种或更多种单独蛋白质。最广泛用于构建多顺反子构型的两种策略是通过使用IRES或2A自切割位点。“IRES”是指用于多顺反子载体构建体内的病毒、原核或真核来源的内部核糖体进入位点或其部分。在一些实施方案中,IRES是允许以非帽依赖性方式进行翻译起始的RNA元件。术语“自切割肽”或“编码自切割肽的序列”或“2A自切割位点”是指在载体构建体内用于并入位点以促进核糖体跳跃且因此从单一启动子产生两种多肽的连接序列,此类自切割肽包括但不限于T2A和P2A肽或编码自切割肽的序列。
在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是腺病毒载体、腺相关病毒(AAV)载体或慢病毒载体。在一些实施方案中,所述载体是逆转录病毒载体、腺病毒/逆转录病毒嵌合体载体、单纯疱疹病毒I或II载体、细小病毒载体、网状内皮组织增殖病病毒载体、脊髓灰质炎病毒载体、乳头状瘤病毒载体、痘苗病毒载体或者并入两种或更多种病毒载体的有利方面的任何杂合或嵌合载体。在一些实施方案中,所述载体还包含与多核苷酸可操作地连接的一种或多种表达控制元件。在一些实施方案中,所述载体还包含一种或多种选择标记。在一些实施方案中,所述AAV载体具有低毒性。在一些实施方案中,所述AAV载体不并入宿主基因组中,从而具有低的引起插入诱变的概率。在一些实施方案中,所述AAV载体可以编码4.5kb至4.75kb的一系列总多核苷酸。在一些实施方案中,可以用于任何本文所述的组合物、系统、方法和试剂盒中的示例性AAV载体可以包括AAV1载体、修饰的AAV1载体、AAV2载体、修饰的AAV2载体、AAV3载体、修饰的AAV3载体、AAV4载体、修饰的AAV4载体、AAV5载体、修饰的AAV5载体、AAV6载体、修饰的AAV6载体、AAV7载体、修饰的AAV7载体、AAV8载体、AAV9载体、AAV.rh10载体、修饰的AAV.rh10载体、AAV.rh32/33载体、修饰的AAV.rh32/33载体、AAV.rh43载体、修饰的AAV.rh43载体、AAV.rh64R1载体和修饰的AAV.rh64R1载体及其任何组合或等效物。在一些实施方案中,所述慢病毒载体是有整合酶能力的慢病毒载体(integrase-competent lentiviral vector,ICLV)。在一些实施方案中,所述慢病毒载体可以是指转基因质粒载体,以及与相关质粒(例如,包装质粒、rev表达质粒、包膜质粒)结合的转基因质粒载体,以及能够通过病毒或病毒样进入机制将外源核酸引入细胞中的基于慢病毒的颗粒。慢病毒载体是本领域中熟知的(参见例如,Trono D.(2002)Lentiviral vectors,New York:Spring-Verlag Berlin Heidelberg和Durand等人(2011)Viruses 3(2):132-159doi:10.3390/v3020132)。在一些实施方案中,可以用于任何本文所述的组合物、系统、方法和试剂盒中的示例性慢病毒载体可以包括人免疫缺陷病毒(HIV)1载体、修饰的人免疫缺陷病毒(HIV)1载体、人免疫缺陷病毒(HIV)2载体、修饰的人免疫缺陷病毒(HIV)2载体、白领白眉猴(sooty mangabey)猿猴免疫缺陷病毒(SIVSM)载体、修饰的白领白眉猴猿猴免疫缺陷病毒(SIVSM)载体、非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、修饰的非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、马传染性贫血病毒(EIAV)载体、修饰的马传染性贫血病毒(EIAV)载体、猫免疫缺陷病毒(FIV)载体、修饰的猫免疫缺陷病毒(FIV)载体、维斯纳/梅迪病毒(Visna/maedi virus)(VNV/VMV)载体、修饰的维斯纳/梅迪病毒(VNV/VMV)载体、羊关节炎-脑炎病毒(CAEV)载体、修饰的羊关节炎-脑炎病毒(CAEV)载体、牛免疫缺陷病毒(BIV)或修饰的牛免疫缺陷病毒(BIV)。
核酸
本文提供了编码用于本文所述的基因转移和表达技术中的本文公开的融合蛋白的核酸序列。虽然没有总是明确陈述,但是应当理解,本文提供的序列可以用于提供表达产物以及产生具有相同生物特性的蛋白质的基本上相同的序列。这些“生物等效的”或“生物活性的”或“等效的”多肽是由如本文所述的等效多核苷酸编码的。当使用在默认条件下运行的序列同一性方法比较时,它们可以具有与参考多肽至少60%、或可替代地至少65%、或可替代地至少70%、或可替代地至少75%、或可替代地至少80%、或可替代地至少85%、或可替代地至少90%、或可替代地至少95%、或可替代地至少98%相同的初级氨基酸序列。提供了特定多肽序列作为具体实施方案的例子。用具有类似电荷的可替代氨基酸对序列中的氨基酸进行修饰。另外,等效多核苷酸是在严格条件下与参考多核苷酸或其互补体杂交的多核苷酸,或者就多肽而言,是由在严格条件下与参考编码多核苷酸或其互补链杂交的多核苷酸编码的多肽。可替代地,等效多肽或蛋白质是从等效多核苷酸表达的多肽或蛋白质。
本文公开的核酸序列(例如,多核苷酸序列)可以是密码子优化的,密码子优化是本领域熟知的技术。在本文公开的一些实施方案中,示例性Cas序列(如例如,SEQ ID NO:46(Cas13d))被密码子优化以用于在人细胞中表达。密码子优化涉及以下事实,即不同细胞在对特定密码子的使用方面有所不同。该密码子偏倚对应于特定tRNA在细胞类型中的相对丰度的偏倚。通过改变序列中的密码子以与相应tRNA的相对丰度匹配,可能增加表达。还可能通过故意选择已知相应tRNA在特定细胞类型中罕见的密码子来减少表达。哺乳动物细胞以及多种其他生物的密码子使用表是本领域中已知的。基于遗传密码,可以产生编码例如Cas蛋白的核酸序列。在一些实施方案中,这样的序列被优化以用于在宿主细胞或靶细胞中表达,所述宿主细胞或靶细胞是如用于表达Cas蛋白的宿主细胞或在其中实践所公开方法的细胞(如在哺乳动物细胞例如人细胞中)。特定物种的密码子偏好和密码子使用表可以用于工程化编码Cas蛋白的分离的核酸分子(如编码与其相应野生型蛋白具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的蛋白质的核酸分子),其利用该特定物种的密码子使用偏好。例如,本文公开的Cas蛋白可以被设计为具有特定目标生物优先使用的密码子。在一个例子中,Cas核酸序列被优化以用于在人细胞中表达,如与其相应野生型或起源核酸序列具有至少70%、至少80%、至少85%、至少90%、至少92%、至少95%、至少98%或至少99%序列同一性的Cas核酸序列。在一些实施方案中,编码至少一种Cas蛋白(其可能是载体的一部分)的分离的核酸分子包括被密码子优化以用于在真核细胞中表达的至少一个Cas蛋白编码序列或被密码子优化以用于在人细胞中表达的至少一个Cas蛋白编码序列。在一个实施方案中,这样的密码子优化的Cas编码序列与其相应野生型或起源序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在另一个实施方案中,真核细胞密码子优化的核酸序列编码与其相应野生型或起源蛋白具有至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的Cas蛋白。在另一个实施方案中,可以常规地产生含有功能等效核酸的多个克隆,所述功能等效核酸是如序列不同但编码相同Cas蛋白序列的核酸。编码序列中的沉默突变是由于遗传密码的简并性(即,冗余)所致,借此多于一种密码子可以编码相同氨基酸残基。因此,例如,亮氨酸可以由CTT、CTC、CTA、CTG、TTA或TTG编码;丝氨酸可以由TCT、TCC、TCA、TCG、AGT或AGC编码;天冬酰胺可以由AAT或AAC编码;天冬氨酸可以由GAT或GAC编码;半胱氨酸可以由TGT或TGC编码;丙氨酸可以由GCT、GCC、GCA或GCG编码;谷氨酰胺可以由CAA或CAG编码;酪氨酸可以由TAT或TAC编码;并且异亮氨酸可以由ATT、ATC或ATA编码。显示标准遗传密码的表格可以在多个来源发现(参见例如,Stryer,1988,Biochemistry,第3版,W.H.5Freeman and Co.,NY)。
“杂交”是指一种或多种多核苷酸反应形成通过核苷酸残基的碱基之间的氢键合稳定化的复合物的反应。氢键合可以通过Watson-Crick碱基配对、Hoogstein结合或以任何其他序列特异性方式来进行。所述复合物可以包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单条自杂交链或这些的任何组合。杂交反应可以构成更广泛过程(如PC反应的起始或核酶对多核苷酸的酶促切割)中的步骤。
严格杂交条件的例子包括:约25℃至约37℃的孵育温度;约6x SSC至约10x SSC的杂交缓冲液浓度;约0%至约25%的甲酰胺浓度;以及约4x SSC至约8x SSC的洗涤溶液。中等杂交条件的例子包括:约40℃至约50℃的孵育温度;约9x SSC至约2x SSC的缓冲液浓度;约30%至约50%的甲酰胺浓度;以及约5x SSC至约2x SSC的洗涤溶液。高严格性条件的例子包括:约55℃至约68℃的孵育温度;约lx SSC至约0.1x SSC的缓冲液浓度;约55%至约75%的甲酰胺浓度;以及约lx SSC、0.1x SSC或去离子水的洗涤溶液。通常,杂交孵育时间为5分钟至24小时,有1个、2个或更多个洗涤步骤,并且洗涤孵育时间为约1、2或15分钟。SSC是0.15M NaCl和15mM柠檬酸盐缓冲液。应理解,可以采用使用其他缓冲液系统的SSC的等效物。
“同源性”或“同一性”或“相似度”是指两个肽之间或两个核酸分子之间的序列相似度。同源性可以通过比较每个序列中的位置来确定,所述序列可以出于比较目的进行比对。在所比较序列中的位置由相同的碱基或氨基酸占据时,则所述分子在该位置是同源的。序列之间的同源性程度随着序列共有的匹配或同源位置的数量而变。“无关的”或“非同源的”序列与本发明的一个序列共有小于40%同一性、或可替代地小于25%同一性。
细胞
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是原核细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是真核细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是牛、鼠、猫、马、猪、犬、猿猴或人细胞。在一些实施方案中,所述细胞是非人哺乳动物细胞,如非人灵长类动物细胞。
在一些实施方案中,本公开文本的细胞是体细胞。在一些实施方案中,本公开文本的细胞是性细胞。在一些实施方案中,本公开文本的性细胞不是人细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是干细胞。在一些实施方案中,本公开文本的细胞是胚胎干细胞。在一些实施方案中,本公开文本的胚胎干细胞不是人细胞。在一些实施方案中,本公开文本的细胞是多潜能干细胞或多能干细胞。在一些实施方案中,本公开文本的细胞是成体干细胞。在一些实施方案中,本公开文本的细胞是诱导多能干细胞(iPSC)。在一些实施方案中,本公开文本的细胞是造血干细胞(HSC)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是免疫细胞。在一些实施方案中,本公开文本的免疫细胞是淋巴细胞。在一些实施方案中,本公开文本的免疫细胞是T淋巴细胞(本文也称为T细胞)。本公开文本的示例性T细胞包括但不限于幼稚T细胞、效应T细胞、辅助T细胞、记忆T细胞、调节T细胞(Treg)和γδT细胞。在一些实施方案中,本公开文本的免疫细胞是B淋巴细胞。在一些实施方案中,本公开文本的免疫细胞是自然杀伤细胞。在一些实施方案中,本公开文本的免疫细胞是抗原呈递细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是肌肉细胞。在一些实施方案中,本公开文本的肌肉细胞是成肌细胞或肌细胞。在一些实施方案中,本公开文本的肌肉细胞是心肌细胞、骨骼肌细胞或平滑肌细胞。在一些实施方案中,本公开文本的肌肉细胞是横纹肌细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是上皮细胞。在一些实施方案中,本公开文本的上皮细胞形成鳞状细胞上皮、立方细胞上皮、柱状细胞上皮、层状细胞上皮、假复层柱状细胞上皮或移行细胞上皮。在一些实施方案中,本公开文本的上皮细胞形成腺体,包括但不限于松果腺、胸腺、垂体、甲状腺、肾上腺、顶质分泌腺、全质分泌腺、局质分泌腺、浆液腺、粘液腺和皮脂腺。在一些实施方案中,本公开文本的上皮细胞接触器官的外表面,所述器官包括但不限于肺、脾、胃、胰腺、膀胱、肠、肾、胆囊、肝、喉或咽。在一些实施方案中,本公开文本的上皮细胞接触血管或静脉的外表面。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是神经元细胞。在一些实施方案中,本公开文本的神经元细胞是中枢神经系统的神经元。在一些实施方案中,本公开文本的神经元细胞是脑或脊髓的神经元。在一些实施方案中,本公开文本的神经元细胞是视网膜的神经元。在一些实施方案中,本公开文本的神经元细胞是脑神经或视神经的神经元。在一些实施方案中,本公开文本的神经元细胞是周围神经系统的神经元。在一些实施方案中,本公开文本的神经元细胞是神经胶质细胞或胶质细胞。在一些实施方案中,本公开文本的胶质细胞是中枢神经系统的胶质细胞,包括但不限于少突胶质细胞、星形胶质细胞、室管膜细胞和小胶质细胞。在一些实施方案中,本公开文本的胶质细胞是周围神经系统的胶质细胞,包括但不限于施万细胞和卫星细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是原代细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是培养的细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是体内的、体外的、离体的或原位的。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是自体的或同种异体的。
掩蔽本公开文本的修饰的细胞
本公开文本的组合物同时递送基因疗法并且防止从基因疗法构建体或相关递送载体衍生的抗原的表达,防止所述抗原在本公开文本的修饰的细胞的表面上展示。
通过抑制或减少在所述修饰的细胞中适应性免疫应答的组分的表达,所述修饰的细胞对于宿主免疫系统不可见。例如,本公开文本的组合物可以同时靶向与遗传疾病或障碍相关的RNA分子和编码MHC I的β2M亚基的RNA分子。通过选择性靶向编码MHC I的β2M亚基的RNA分子,所述组合物防止所述修饰的细胞在所述修饰的细胞表面上展示一种或多种衍生自RNA靶向构建体、载体或其组合的抗原肽。因此,受试者的免疫系统不会将所述修饰的细胞鉴定为含有外源序列,并且不会尝试针对所述修饰的细胞产生免疫应答。此方法提高了治疗所述遗传疾病或障碍的治疗功效,同时避免了基因疗法的常见副作用。
在本公开文本的组合物和方法的一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
MHC I的α链可以由HLA基因(包括但不限于HLA-A、HLA-B和HLA-C)编码。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-A基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001331
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-B基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001332
Figure BDA0002925003530001341
Figure BDA0002925003530001351
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-C基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001352
Figure BDA0002925003530001361
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-C基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001362
Figure BDA0002925003530001371
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码β2M蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001372
Figure BDA0002925003530001381
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001382
Figure BDA0002925003530001391
Figure BDA0002925003530001401
Figure BDA0002925003530001411
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001412
Figure BDA0002925003530001421
Figure BDA0002925003530001431
Figure BDA0002925003530001441
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001442
Figure BDA0002925003530001451
Figure BDA0002925003530001461
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD80蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001462
Figure BDA0002925003530001471
Figure BDA0002925003530001481
本公开文本的与本公开文本的编码CD80蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自包含SEQ ID NO:330至SEQ ID NO:3067中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001482
Figure BDA0002925003530001491
本公开文本的与本公开文本的编码CD86蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:3068至SEQ ID NO:5783中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001501
Figure BDA0002925003530001511
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001512
Figure BDA0002925003530001521
Figure BDA0002925003530001531
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001532
Figure BDA0002925003530001541
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001542
Figure BDA0002925003530001551
Figure BDA0002925003530001561
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码ICOSLG蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001562
Figure BDA0002925003530001571
本公开文本的与本公开文本的编码IOSLG蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:5784至SEQ ID NO:7789中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码OX40L蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001572
Figure BDA0002925003530001581
Figure BDA0002925003530001591
本公开文本的与本公开文本的编码OX40L蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:7790至SEQ ID NO:11254中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码IL12蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001592
Figure BDA0002925003530001601
本公开文本的与本公开文本的编码IL12蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:11255至SEQ ID NO:12685中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CCR7蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
Figure BDA0002925003530001602
Figure BDA0002925003530001611
本公开文本的与本公开文本的编码CCR7蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:12686至SEQ ID NO:14872中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,其中所述间隔子序列和所述靶序列是彼此的反向互补体。在一些实施方案中,本公开文本的组合物可以包含单一(即,单一的)gRNA,其包含a)与第一靶RNA序列特异性结合的第一间隔子序列以及b)与第二靶RNA序列特异性结合的第二间隔子序列,其中所述第一和第二间隔子序列各自结合不同的靶RNA序列。在一些实施方案中,结合不同的靶RNA序列的第一和第二间隔子序列不包含在单一(即,单一的)gRNA内,而是第一间隔子序列包含在第一gRNA内,并且第二间隔子序列包含在第二gRNA序列内。在一些实施方案中,本文公开的间隔子序列包含编码适应性免疫应答的蛋白质组分的核酸序列的一部分,其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。在一些实施方案中,作为编码适应性免疫应答的蛋白质组分的核酸序列的一部分的间隔子的长度是约20或21个核苷酸。
本公开文本的所有核苷酸序列可以互换地包括尿嘧啶(U)或胸腺嘧啶(T)。
sgRNA的示例性的非限制性的靶向Zika NS5的间隔子序列包括但不限于:gcaatgatcttcatgttgggagc(SEQ ID NO:196)、gaaccttgttgatgaactcttc(SEQ ID NO:197)、gttggtgattagagcttcattc(SEQ ID NO:198)和gagtgatcctcgttcaagaatcc(SEQ ID NO:199)。
sgRNA的示例性的非限制性的靶向λNS5的间隔子序列包括但不限于:GTGATAAGTGGAATGCCATG(SEQ ID NO:200)和GNNNNNNNNNNNNNNNNNNNNGUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:201)。
同时治疗疾病并且防止免疫应答的方法
本公开文本提供了用于通过将基因疗法递送至细胞同时治疗受试者的疾病或障碍并且防止对接受所述基因疗法的细胞的免疫应答的组合物和方法。例如,可以将图4中所示的组合物施用至受试者,其中gRNA 1与编码适应性免疫应答的组分的RNA分子内的靶序列结合,并且gRNA2与和疾病或障碍相关的RNA分子内的靶序列结合。通过靶向编码适应性免疫应答的组分的RNA分子,gRNA1防止与所述组合物或包含所述组合物的载体相关的抗原在所述细胞的表面上展示,从而从所述受试者的免疫系统中掩蔽所述细胞。gRNA2同时靶向第二RNA分子以治疗本公开文本的疾病或障碍。
在可替代的实施方案中,图4中所示的组合物的gRNA1和gRNA2例如可以各自靶向编码适应性免疫应答的组分的不同的RNA分子。例如,在gRNA1靶向编码β2M多肽的RNA分子的时候,gRNA2靶向共刺激分子(ICOSLG、CD80、CD86、OX40L、IL12或CCR7)。
在一些实施方案中,本公开文本的组合物可以包含至少1、2、3、4、5、6、7、8、9或10种gRNA或由其组成。
在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在组成型启动子(例如U6)的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在病毒启动子(其可以任选地是组成型的(例如EFS))的控制下。
在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在第一启动子的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在第二启动子的控制下,其中所述第一启动子驱动至少1、2、3、4、5、6、7、8、9或10种gRNA的更强的表达,并且所述第二启动子驱动所述融合蛋白的表达。在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在第一启动子的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在第二启动子的控制下,其中所述第一启动子驱动至少1、2、3、4、5、6、7、8、9或10种gRNA的更弱的表达,并且所述第二启动子驱动所述融合蛋白的表达。通过改变驱动本公开文本的组合物的gRNA相比于融合蛋白组分的表达的启动子的相关强度,所述组合物可以以按比率计的剂量提供,同时从同一载体表达所述gRNA和所述融合蛋白。因此,本公开文本的组合物可以包含以下gRNA,其结合与两种或更多种疾病以及适应性免疫应答的两种或更多种组分相关的RNA分子。在一些实施方案中,所述本公开文本的组合物可以包含本文公开的融合蛋白,其中至少一种融合配偶体蛋白是内切核酸酶,如但不限于RNA酶1、RNA酶4、RNA酶6、RNA酶7、RNA酶8、RNA酶2、RNA酶6PL、RNA酶L、RNA酶T2、RNA酶11、RNA酶T2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、RNA酶1(K41R)、RNA酶1(K41R、D121E)、RNA酶1(K41R、D121E、H119N)、RNA酶1(H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、RNA酶1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNA酶K、TALEN、ZNF638、或hSMG6的PIN。
使用方法
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与所述RNA分子接触。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与所述RNA分子接触。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与包含所述RNA分子的细胞接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与包含所述RNA分子的细胞接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与所述RNA分子接触,其中所述融合蛋白诱导所述RNA分子中的断裂。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与所述RNA分子接触,其中所述融合蛋白诱导所述RNA分子中的断裂。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与包含所述RNA分子的细胞接触,其中所述融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与包含所述RNA分子的细胞接触,其中所述融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物,其中所述组合物包含载体,所述载体包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物,并且其中所述组合物修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物,其中所述组合物包含载体,所述载体包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物,并且其中所述组合物修饰由RNA分子编码的蛋白质的活性。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于遗传疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是单基因疾病或障碍。在一些实施方案中,所述单基因疾病或障碍是常染色体显性疾病或障碍、常染色体隐性疾病或障碍、X染色体连锁(X连锁)疾病或障碍、X连锁显性疾病或障碍、X连锁隐性疾病或障碍、Y连锁疾病或障碍或线粒体疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是多基因疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是多基因疾病或障碍。在一些实施方案中,所述单基因疾病或障碍是常染色体显性疾病或障碍,包括但不限于亨廷顿病(Huntington's disease)、神经纤维瘤病1型、神经纤维瘤病2型、马凡综合征(Marfansyndrome)、遗传性非息肉病性结直肠癌、遗传性多发性外生骨疣、血管性血友病(VonWillebrand disease)和急性间歇性卟啉病。在一些实施方案中,所述单基因疾病或障碍是常染色体隐性疾病或障碍,包括但不限于白化病、中链酰基辅酶A脱氢酶缺乏症、囊性纤维化、镰状细胞病、泰-萨克斯病(Tay-Sachs disease)、尼曼-皮克病(Niemann-Pickdisease)、脊髓性肌萎缩和罗伯茨综合征(Roberts syndrome)。在一些实施方案中,所述单基因疾病或障碍是X连锁疾病或障碍,包括但不限于肌营养不良、杜氏肌营养不良(Duchenne muscular dystrophy)、血友病、肾上腺脑白质营养不良(ALD)、雷特综合征(Rett syndrome)和血友病A。在一些实施方案中,所述单基因疾病或障碍是线粒体障碍,包括但不限于利伯氏遗传性视神经病变(Leber's hereditary optic neuropathy)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于免疫疾病或障碍。在一些实施方案中,所述免疫疾病或障碍是免疫缺陷疾病或障碍,包括但不限于B细胞缺乏症、T细胞缺乏症、嗜中性粒细胞减少症、无脾、补体缺乏症、获得性免疫缺陷综合征(AIDS)和由于医学干预所致的免疫缺陷(免疫抑制是医学疗法的预期或不利影响)。在一些实施方案中,所述免疫疾病或障碍是自身免疫性疾病或障碍,包括但不限于失弛缓症、艾迪生病(Addison’s disease)、成人斯蒂尔病(Adult Still'sdisease)、无丙种球蛋白血症、斑秃、淀粉样变性、抗GBM/抗TBM肾炎、抗磷脂综合征、自身免疫性血管性水肿、自身免疫性自主神经机能异常、自身免疫性脑脊髓炎、自身免疫性肝炎、自身免疫性内耳病(AIED)、自身免疫性心肌炎、自身免疫性卵巢炎、自身免疫性睾丸炎、自身免疫性胰腺炎、自身免疫性视网膜病变、自身免疫性荨麻疹、轴突和神经元神经病(AMAN)、巴洛病(Balódisease)、白塞病(Behcet's disease)、良性粘膜类天疱疮、大疱性类天疱疮、卡斯尔曼病(Castleman disease,CD)、乳糜泻、美洲锥虫病(Chagas disease)、慢性炎症性脱髓鞘性多发性神经病(CIDP)、慢性复发性多病灶性骨髓炎(CRMO)、变应性肉芽肿性血管炎(Churg-Strauss Syndrome,CSS)或嗜伊红细胞性肉芽肿病(EGPA)、瘢痕性类天疱疮、寇甘综合征(Cogan's syndrome)、冷凝集素病、先天性心脏传导阻滞、柯萨奇病毒性心肌炎、CREST综合征、克罗恩病(Crohn’s disease)、疱疹样皮炎、皮肌炎、德维克病(Devic's disease)(视神经脊髓炎)、盘状狼疮、德雷斯勒综合征(Dressler’s syndrome)、子宫内膜异位症、嗜酸性食道炎(EoE)、嗜酸性筋膜炎、结节性红斑、特发性混合性冷球蛋白血症(Essential mixed cryoglobulinemia)、伊文思综合征(Evans syndrome)、纤维肌痛、纤维化肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞性心肌炎、肾小球肾炎、肺出血-肾炎综合征(Goodpasture’s syndrome)、肉芽肿性多血管炎、格雷夫斯病(Graves’disease)、格林-巴利综合征(Guillain-Barre syndrome)、桥本甲状腺炎(Hashimoto’s thyroiditis)、溶血性贫血、过敏性紫癜(Henoch-Schonlein purpura,HSP)、妊娠疱疹或妊娠性类天疱疮(PG)、化脓性汗腺炎(HS)(反常性痤疮)、低丙球蛋白血症、IgA肾病、IgG4相关性硬化性疾病、免疫性血小板减少性紫癜(ITP)、包涵体肌炎(IBM)、间质性膀胱炎(IC)、幼年型关节炎、幼年型糖尿病(1型糖尿病)、幼年型肌炎(JM)、川崎病(Kawasaki disease)、兰伯特-伊顿综合征(Lambert-Eaton syndrome)、白细胞破碎性血管炎、扁平苔癣、硬化性苔癣、木样结膜炎、线性IgA疾病(LAD)、狼疮、慢性莱姆病(Lyme disease chronic)、梅尼埃病(Meniere’sdisease)、显微镜下多血管炎(MPA)、混合性结缔组织病(MCTD)、蚕蚀性角膜溃疡(Mooren’sulcer)、穆-哈二氏病(Mucha-Habermann disease)、多灶性运动神经病(MMN)或MMNCB、多发性硬化症、重症肌无力、肌炎、发作性睡病、新生儿狼疮、视神经脊髓炎、嗜中性粒细胞减少症、眼部瘢痕性类天庖疮、视神经炎、复发性风湿病(PR)、PANDAS、副肿瘤性小脑变性(PCD)、阵发性睡眠性血红蛋白尿(PNH)、帕里-龙贝格综合征(Parry Romberg syndrome)、睫状体扁平部炎(周边葡萄膜炎)、帕-特二氏综合征(Parsonnage-Turner syndrome)、天疱疮、周围神经病变、静脉周围性脑脊髓炎(Perivenous encephalomyelitis)、恶性贫血(PA)、POEMS综合征、结节性多动脉炎、多腺体综合征I型、II型、III型、风湿性多肌痛、多发性肌炎、心肌梗死后综合征、心包切开术后综合征、原发性胆汁性肝硬化、原发性硬化性胆管炎、孕酮性皮炎、银屑病、银屑病关节炎、纯红细胞再生障碍(PRCA)、坏疽性脓皮病、雷诺现象(Raynaud’s phenomenon)、反应性关节炎、反射性交感神经营养不良、复发性多软骨炎、不宁腿综合征(RLS)、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施密特综合征(Schmidt syndrome)、巩膜炎、硬皮病、干燥综合征(
Figure BDA0002925003530001681
syndrome)、精子和睾丸自身免疫、僵人综合征(SPS)、亚急性细菌性心内膜炎(SBE)、苏萨克综合征(Susac'ssyndrome)、交感性眼炎(SO)、大动脉炎(Takayasu's arteritis)、颞动脉炎/巨细胞动脉炎、血小板减少性紫癜(TTP)、托洛萨-亨特综合征(Tolosa-Hunt syndrome,THS)、横贯性脊髓炎、1型糖尿病、溃疡性结肠炎(UC)、未分化结缔组织病(UCTD)、葡萄膜炎、血管炎、白癜风、小柳原田病(Vogt-Koyanagi-Harada Disease)或韦氏肉芽肿病(Wegener’sgranulomatosis)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于炎性疾病或障碍。在一些实施方案中,所述炎性疾病或障碍包括但不限于阿尔茨海默病(Alzheimer's disease)、强直性脊柱炎、关节炎、骨关节炎、类风湿性关节炎、银屑病性关节炎、哮喘、动脉粥样硬化、克罗恩病、结肠炎、皮炎、憩室炎、纤维肌痛、肝炎、肠易激综合征(IBS)、系统性红斑狼疮(SLE)、肾炎、帕金森病(Parkinson's disease)、溃疡性结肠炎、急性支气管炎、急性阑尾炎、扁桃体炎、感染性脑膜炎、鼻窦炎、哮喘、慢性消化性溃疡、结核病、类风湿性关节炎、牙周炎、痛风、硬皮病、血管炎和肌炎。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于代谢性疾病或障碍。在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于退行性或进行性疾病或障碍。在一些实施方案中,所述退行性或进行性疾病或障碍包括但不限于肌萎缩侧索硬化(ALS)、亨廷顿病、阿尔茨海默病和衰老。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于感染性疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于儿科或发育性疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于心血管疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于增生性疾病或障碍。在一些实施方案中,所述增生性疾病或障碍是癌症。在一些实施方案中,所述癌症包括但不限于急性淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、肾上腺皮质癌、AIDS相关性癌症、卡波西肉瘤(Kaposi Sarcoma)(软组织肉瘤)、AIDS相关性淋巴瘤(淋巴瘤)、原发性CNS淋巴瘤(淋巴瘤)、肛门癌、阑尾癌、胃肠道类癌瘤、星形细胞瘤、非典型畸胎瘤/横纹肌样瘤、中枢神经系统(脑癌)、基底细胞癌、胆管癌、膀胱癌、骨癌、尤因肉瘤(Ewing Sarcoma)、骨肉瘤、恶化纤维组织细胞瘤、脑瘤、乳腺癌、伯基特淋巴瘤(BurkittLymphoma)、类癌瘤、癌、心脏(Cardiac/Heart)肿瘤、胚胎瘤、胚细胞瘤、原发性CNS淋巴瘤、宫颈癌、胆管细胞癌(Cholangiocarcinoma)、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性髓细胞性白血病(CML)、慢性骨髓增殖性肿瘤、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、原位导管癌、胚胎瘤、子宫内膜癌(子宫癌)、室管膜瘤、食管癌、鼻腔神经胶质瘤(头颈癌)、尤因肉瘤(骨癌)、颅外胚细胞瘤、性腺外胚细胞瘤、眼癌、儿童眼内黑色素瘤、眼内黑色素瘤、视网膜母细胞瘤、输卵管癌、骨恶性纤维组织细胞瘤和骨肉瘤、胆囊癌、胃(Gastric/Stomach)癌、胃肠道类癌瘤、胃肠道间质瘤(GIST)(软组织肉瘤)、儿童胃肠道间质瘤、胚细胞瘤、儿童颅外胚细胞瘤、性腺外胚细胞瘤、卵巢胚细胞瘤、睾丸癌、妊娠滋养细胞疾病、毛细胞白血病、头颈癌、心脏肿瘤、肝细胞(肝)癌、组织细胞增多症、霍奇金淋巴瘤(Hodgkin Lymphoma)、下咽癌(头颈癌)、眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波西肉瘤(软组织肉瘤)、肾(肾细胞)癌、朗格汉斯细胞组织细胞增生症(Langerhans Cell Histiocytosis)、喉癌(Laryngeal Cancer)(头颈癌)、白血病、唇和口腔癌(Lip and Oral Cavity Cancer)(头颈癌)、肝癌、肺癌(非小细胞和小细胞)、儿童肺癌、淋巴瘤、男性乳腺癌、骨恶性纤维组织细胞瘤和骨肉瘤、黑色素瘤、梅克尔细胞癌(Merkel Cell Carcinoma)(皮肤癌)、间皮瘤、隐匿性原发性转移性鳞状颈癌(头颈癌)、具有NUT基因变化的中线道癌、口腔癌(Mouth Cancer)(头颈癌)、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞瘤、蕈样真菌病(淋巴瘤)、骨髓增生异常综合征、骨髓增生异常性/骨髓增生性肿瘤、鼻腔和鼻旁窦癌(头颈癌)、鼻咽癌(头颈癌)、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌(Oral Cancer)、唇和口腔癌和口咽癌、骨肉瘤和骨恶性纤维组织细胞瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤(胰岛细胞瘤)、乳头状瘤病、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌(头颈癌)、嗜铬细胞瘤、浆细胞瘤/多发性骨髓瘤、胸膜肺母细胞瘤、妊娠期乳腺癌、原发性中枢神经系统(CNS)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性癌症、肾细胞(肾)癌、视网膜母细胞瘤、横纹肌肉瘤、儿童(软组织肉瘤)、涎腺癌(头颈癌)、肉瘤、儿童横纹肌肉瘤(软组织肉瘤)、儿童血管瘤(软组织肉瘤)、尤因肉瘤(骨癌)、卡波西肉瘤(软组织肉瘤)、骨肉瘤(骨癌)、子宫肉瘤、塞扎里综合征(Sézary Syndrome)、淋巴瘤、皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、鳞状颈癌、胃(Stomach/Gastric)癌、T细胞淋巴瘤、睾丸癌、喉癌(Throat Cancer)(头颈癌)、鼻咽癌、口咽癌、下咽癌、胸腺瘤和胸腺癌、甲状腺癌、肾盂和输尿管移行细胞癌、肾细胞癌、尿道癌、子宫肉瘤、阴道癌、血管瘤(软组织肉瘤)、外阴癌、肾母细胞瘤(WilmsTumor)和其他儿童肾脏肿瘤。
在本公开文本的方法的一些实施方案中,本公开文本的受试者已经被诊断患有所述疾病或障碍。在一些实施方案中,本公开文本的受试者呈现所述疾病或障碍的至少一种体征或症状。在一些实施方案中,所述受试者具有预示患上所述疾病或障碍的风险的生物标记。在一些实施方案中,所述生物标记是基因突变。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是雌性。在本公开文本的方法的一些实施方案中,本公开文本的受试者是雄性。在一些实施方案中,本公开文本的受试者具有两个XX或XY染色体。在一些实施方案中,本公开文本的受试者具有两个XX或XY染色体和第三染色体(X或Y)。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是新生儿、婴儿、儿童、成人、年长成人或老年人。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31日龄。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、11或12月龄。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100岁或之间的任何岁数或非整岁数。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是哺乳动物。在一些实施方案中,本公开文本的受试者是非人哺乳动物。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是人。
在本公开文本的方法的一些实施方案中,治疗有效量包含本公开文本的组合物的单个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开文本的组合物的至少一个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开文本的组合物的一个或多个剂量。
在本公开文本的方法的一些实施方案中,治疗有效量消除所述疾病或障碍的体征或症状。在一些实施方案中,治疗有效量降低所述疾病或障碍的体征或症状的严重程度。
在本公开文本的方法的一些实施方案中,治疗有效量消除所述疾病或障碍。
在本公开文本的方法的一些实施方案中,治疗有效量防止疾病或障碍的发作。在一些实施方案中,治疗有效量延迟疾病或障碍的发作。在一些实施方案中,治疗有效量降低所述疾病或障碍的体征或症状的严重程度。在一些实施方案中,治疗有效量改善所述受试者的预后。
在本公开文本的方法的一些实施方案中,将本公开文本的组合物全身施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过静脉内途径施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过注射或输注施用至所述受试者。
在本公开文本的方法的一些实施方案中,将本公开文本的组合物局部施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过骨内、眼内、脑脊髓内或脊柱内途径施用至所述受试者。在一些实施方案中,将本公开文本的组合物直接施用至中枢神经系统的脑脊液。在一些实施方案中,将本公开文本的组合物直接施用至眼组织或流体,并且在眼结构外不具有生物利用性。在一些实施方案中,将本公开文本的组合物通过注射或输注施用至所述受试者。
在一些实施方案中,将包含本文公开的RNA结合融合蛋白的组合物配制为药物组合物。简言之,如本文所公开使用的药物组合物可以包含与一种或多种药学上或生理上可接受的载体、稀释剂或赋形剂组合的一种或多种融合蛋白或编码所述一种或多种融合蛋白的多核苷酸,所述融合蛋白或多核苷酸任选地包含于AAV中,所述AAV任选地也是免疫正交的。此类组合物可以包含缓冲液,如中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸,如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);和防腐剂。可以将本公开文本的组合物配制用于口服、静脉内、局部、肠内、眼内和/或肠胃外施用。在某些实施方案中,将本公开文本的组合物配制用于静脉内施用。
实施例
实施例1:病毒RNA分子的RNA指导的切割
将A549细胞在含有10%FBS和1%青霉素/链霉素的DMEM(GIBCO)中培养,并以90%-100%汇合度进行传代。将细胞以1x10^5个细胞/孔接种于24孔板中用于RNA分离,或以.5x10^5个细胞/孔接种。将细胞用与基因NTHL1(残基31-312,E43)或CPSF4L(全长,E67)融合的编码空肠弯曲杆菌Cas9(CjeCas9)的质粒与编码Zika NS5 RNA中的四个位点之一的质粒转染。CjeCas9是由EFS启动子驱动的,而指导RNA是由U6启动子驱动的。sgRNA的序列呈现于表8中。下文呈现了在此项研究中使用的构建体的序列(SEQ ID NO:13656和SEQ IDNO:13657)。
RNA分离是用RNAeasy柱(Qiagen)根据制造商的方案来进行。使用Nanodrop分光光度计来估计RNA质量和浓度。使用Superscript III(Thermo)以随机引物根据制造商的方案进行cDNA制备。用如表7中所列的以下引物进行qPCR。
图1显示了在具有含有如表8中指示的各种靶向NS5的间隔子序列的sgRNA的E43和E67内切核酸酶二者的存在下评估的Zika NS5的表达水平。将Zika NS5表达展示为相对于加载有含有对照(λ)间隔子序列的sgRNA的内切核酸酶的变化倍数。
使用免疫荧光显微镜检查将在与CjeCas9融合的E43或E67内切核酸酶的存在下的Zika NS5表达可视化。图2A显示了用加载有含有靶向Zika NS5的间隔子序列的sgRNA的CjeCas9-内切核酸酶融合物转染的细胞的荧光显微镜检查图像。如与加载有不靶向ZikaNS5的sgRNA的CjeCas9-内切核酸酶融合物相比,在加载有靶向Zika NS5的适当sgRNA的CjeCas9-内切核酸酶融合物的存在下,Zika NS5的表达显著降低(图2A和图2B)。图3是用于本公开文本的组合物中的示例性内切核酸酶的列表。
表7:qPCR引物
GAPDH_F CAGCCTCAAGATCATCAGCAA(SEQ ID NO:192)
GAPDH_R TGTGGTCATGAGTCCTTCCA(SEQ ID NO:193)
NS5_F GAGGAGAGTGCCAGAGTTGT(SEQ ID NO:194)
NS5_R TCTCTCTCCCCATCCAGTGA(SEQ ID NO:195)
表8:sgRNA序列
Figure BDA0002925003530001731
E43-CjeCas9和sgRNA质粒可以包含以下序列或由其组成(U6:N=sgRNA间隔子,E43,CjeCas9):
gtttattacagggacagcagagatccagtttggttaattaaggtaccgagggcctatttcccatgatt ccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgga ctatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgTGTTCTCCCCAAGAATCTGGCATGACCGCTCTTTCAGCGAGGATGTTGACGCGAAGCAGATCCCTGGGACCTGGGGCCGGGCCACGAGGGTGTCGGGAAGAACCAGGACCGTTGCGACGGAGGGAAGCAGCAGCGGAAGCTCGGAAATCCCATTCTCCGGTTAAACGACCCCGCAAGGCACAACGGCTCAGGGTTGCTTACGAGGGGAGCGATTCCGAAAAGGGTGAAGGAGCAGAGCCCTTGAAGGTTCCAGTATGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCA TTCTCTGAAAACGACGAACTGAAGGATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAAT CACTCGCTCTCCCTAGACGACTGGCACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCT TAAACACCTTATTGCAAATGAGTTTAAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCC TACAAAGGGAGCCTTATATCCCCGTATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTG CTCGCGTGATTCTCCACATAGCGAAGAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGC CATACTCAAAGCGATTAAGCAAAATGAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAG TACTTCCAGAAGTTCAAAGAAAATAGCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTA TTGCGCAATCTTTCCTCAAGGACGAGCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAA AAAATTTGAGGAAGAGGTTCTGAGCGTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAAT TGTAGTTTCTTCACCGATGAAAAACGGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCA TCATTAATCTGCTCAACAACCTTAAAAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAA CGAAGTTTTGAAGAACGGGACTTTGACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTC AAGGGAGAAAAAGGGACATATTTCATCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACT TGTCTCAAGATGATCTCAACGAAATTGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTT GGCGAAGTATGACCTTAACCAAAACCAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGT TTCAAGGCCCTTAAGTTGGTCACCCCCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATC TCAAGGTTGCTATTAACGAAGACAAAAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTAC CAATCCTGTGGTGCTCCGAGCCATCAAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTA CACAAAATAAATATTGAGCTCGCAAGGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGA ATGAAAATTACAAAGCGAAAAAGGACGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACAT TCTCAAACTCCGCCTCTTCAAAGAACAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTT CAAGACGAGAAGATGCTCGAAATAGACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAG TGCTTGTTTTCACTAAGCAGAATCAGGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAA GTGGCAGAAGATCGAGGTCTTGGCTAAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAA GACAAAGAACAAAAGAACTTTAAAGACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACA CAAAAGATTATTTGGACTTCTTGCCGCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAA AGTCCACGTCGAAGCTAAATCTGGGATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGA AACAATCACCTGCACCATGCCATTGACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCG ACTTCAAGAAGGAACAAGAGTCCAACAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAA AAGAAAATTCTTTGAGCCGTTCAGCGGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAA CCCGAAAGGAAAAAGCCCTCAGGCGCCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACG GCGGAAAAGAGGGAGTTTTGAAGGCTCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGG CGATATGTTCCGGGTTGATATCTTCAAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGAC TTCGCACTTAAGGTCCTGCCGAATAAGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGG ATGAAAATTACGAGTTCTGCTTTTCTCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACC GGAATTCGTGTATTACAACGCTTTTACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAA ACACTCAGTAAAAACCAAAAGATTCTCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCC AAAATTTGAAAGTTTTTGAAAAATATATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGA GGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:202)。
E67-CjeCas9和sgRNA质粒可以包含以下序列或由其组成(U6:N=sgRNA间隔子,E67,CjeCas9):
gtttattacagggacagcagagatccagtttggttaattaaggtaccgagggcctatttcccatgatt ccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgga ctatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgCAGGAGGTAATAGCGGGGCTTGAGCGATTTACCTTTGCCTTCGAAAAAGACGTAGAGATGCAGAAGGGAACCGGCCTGCTCCCATTTCAAGGTATGGACAAATCAGCATCTGCCGTGTGCAATTTTTTCACCAAGGGTCTGTGTGAAAAGGGGAAGCTCTGTCCATTTCGCCATGATCGCGGAGAGAAGATGGTGGTGTGTAAGCACTGGCTGAGAGGGCTTTGCAAAAAAGGCGACCACTGCAAATTTCTTCACCAATATGACCTGACTCGAATGCCTGAGTGTTATTTTTACAGTAAGTTCGGTGACTGTAGCAACAAAGAATGCAGCTTCTTGCATGTCAAACCAGCATTCAAGTCACAGGATTGCCCGTGGTACGATCAGGGTTTTTGCAAGGACGGTCCCCTCTGCAAATATCGACACGTACCCAGAATTATGTGCCTTAATTACCTGGTCGGCTTCTGTCCTGAAGGGCCAAAATGTCAGTTTGCTCAAAAAATTCGCGAGTTCAAATTGCTCCCTGGGTCTAAAATTTGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAAGG ATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTGGC ACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGTTT AAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCCGT ATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCGAA GAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAAAT GAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAATA GCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGACGA GCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGAGC GTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAAAC GGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTTAA AAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTTTG ACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTTCA TCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAAAT TGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAAAC CAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCACCC CCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGACAA AAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCATC AAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGCAA GGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAGGA CGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAGAA CAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAATAG ACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAATCA GGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGGCT AAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAAAG ACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTGCC GCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTGGG ATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCATTG ACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCCAA CAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCAGC GGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGGCG CCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAGGC TCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCTTC AAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAATA AGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTTTC TCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTTTT ACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGATTC TCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAATA TATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:203)。
示例实施方案
实施方案1.一种组合物,其包含:
(a)包含特异性结合RNA分子内的靶序列的第一指导RNA(gRNA)的第一序列,其中所述靶序列包含编码适应性免疫应答的组分的序列;以及
(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,
其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,
其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且
其中所述第二RNA结合多肽包含RNA-核酸酶活性。
实施方案2.一种组合物,其包含:(a)包含特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;和
(b)包含特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列;以及
(c)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,
其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,
其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且
其中所述第二RNA结合多肽包含RNA-核酸酶活性。
实施方案3.根据实施方案2所述的组合物,其中所述第一靶序列或所述第二靶序列包含至少一个重复的序列。
实施方案4.根据实施方案2所述的组合物,其中包含所述第一gRNA的第一序列还包含能够在真核细胞中表达所述gRNA的第一启动子,和/或包含所述第二gRNA的第二序列还包含能够在真核细胞中表达所述gRNA的第二启动子。
实施方案5.根据实施方案2所述的组合物,其中包含含有所述第一gRNA的第一序列和含有所述第二gRNA的第二序列的序列包含能够在真核细胞中表达所述第一gRNA和所述第二gRNA的启动子。
实施方案6.根据实施方案4所述的组合物,其中所述第一启动子和所述第二启动子是相同的。
实施方案7.根据实施方案4所述的组合物,其中所述第一启动子和所述第二启动子是不同的。
实施方案8.根据实施方案4-7中任一项所述的组合物,其中所述真核细胞是动物细胞。
实施方案9.根据实施方案8所述的组合物,其中所述动物细胞是哺乳动物细胞。
实施方案10.根据实施方案9所述的组合物,其中所述动物细胞是人细胞。
实施方案11.根据实施方案5-10中任一项所述的组合物,其中所述启动子是组成型活性启动子。
实施方案12.根据实施方案5-11中任一项所述的组合物,其中所述启动子包含从能够驱动RNA聚合酶的表达的启动子分离或衍生的序列。
实施方案13.根据实施方案12所述的组合物,其中所述启动子包含从U6启动子分离或衍生的序列。
实施方案14.根据实施方案5-12中任一项所述的组合物,其中所述启动子包含从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的序列。
实施方案15.根据实施方案14所述的组合物,其中所述启动子包含从以下启动子分离或衍生的序列:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。
实施方案16.根据实施方案14所述的组合物,其中所述启动子包含从缬氨酸tRNA启动子分离或衍生的序列。
实施方案17.根据实施方案2-16中任一项所述的组合物,其中包含所述第一gRNA的序列还包含与所述第一靶RNA序列特异性结合的第一间隔子序列。
实施方案18.根据实施方案17所述的组合物,其中所述第一间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
实施方案19.根据实施方案17所述的组合物,其中所述第一间隔子序列与所述靶RNA序列具有100%互补性。
实施方案20.根据实施方案17-19中任一项所述的组合物,其中所述第一间隔子序列包含20个核苷酸或由其组成。
实施方案21.根据实施方案17-19中任一项所述的组合物,其中所述第一间隔子序列包含21个核苷酸或由其组成。
实施方案22.根据实施方案21所述的组合物,其中所述第一间隔子序列包含编码β-2-微球蛋白(β2M)蛋白的氨基酸序列的20个核苷酸或由其组成。
实施方案23.根据实施方案22所述的组合物,其中所述第一间隔子序列包含以下的氨基酸序列的20个核苷酸或由其组成:
Figure BDA0002925003530001831
实施方案24.根据实施方案2-23中任一项所述的组合物,其中包含所述第一gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第一支架序列。
实施方案25.根据实施方案24所述的组合物,其中所述第一支架序列包含茎环结构。
实施方案26.根据实施方案24或25所述的组合物,其中所述支架序列包含90个核苷酸或由其组成。
实施方案27.根据实施方案24或25所述的组合物,其中所述支架序列包含93个核苷酸或由其组成。
实施方案28.根据实施方案27所述的组合物,其中所述支架序列包含以下序列:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
实施方案29.根据实施方案1-28中任一项所述的组合物,其中包含所述第二gRNA的序列还包含与所述第二靶RNA序列特异性结合的第二间隔子序列。
实施方案30.根据实施方案29所述的组合物,其中所述第二间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
实施方案31.根据实施方案29所述的组合物,其中所述第二间隔子序列与所述靶RNA序列具有100%互补性。
实施方案32.根据实施方案29-31中任一项所述的组合物,其中所述第二间隔子序列包含20个核苷酸或由其组成。
实施方案33.根据实施方案29-31中任一项所述的组合物,其中所述第二间隔子序列包含21个核苷酸或由其组成。
实施方案34.根据实施方案2-34中任一项所述的组合物,其中所述第二间隔子序列包含或还包含含有以下序列的至少1、2、3、4、5、6或7个重复的序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合。
实施方案35.根据实施方案2-34中任一项所述的组合物,其中包含所述第二gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第二支架序列。
实施方案36.根据实施方案35所述的组合物,其中所述第二支架序列包含茎环结构。
实施方案37.根据实施方案35或36所述的组合物,其中所述第二支架序列包含85个核苷酸或由其组成。
实施方案38.根据实施方案37所述的组合物,其中所述第二支架序列包含以下序列:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
实施方案39.根据实施方案1所述的组合物,其中所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
实施方案40.根据实施方案2-38中任一项所述的组合物,其中所述第一gRNA不结合或不选择性结合所述第一RNA分子内的第二序列。
实施方案41.根据实施方案2-38中任一项所述的组合物,其中所述第二gRNA不结合或不选择性结合所述第二RNA分子内的第二序列。
实施方案42.根据实施方案39所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案43.根据实施方案40或41所述的组合物,其中RNA基因组或RNA转录组包含所述第一RNA分子或所述第二RNA分子。
实施方案44.根据实施方案1-43中任一项所述的组合物,其中所述第一RNA结合蛋白包含CRISPR-Cas蛋白。
实施方案45.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。
实施方案46.根据实施方案45所述的组合物,其中所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。
实施方案47.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。
实施方案48.根据实施方案47所述的组合物,其中所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。
实施方案49.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。
实施方案50.根据实施方案49所述的组合物,其中所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。
实施方案51.根据实施方案44-50中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。
实施方案52.根据实施方案51所述的组合物,其中所述天然RNA核酸酶活性被降低或抑制。
实施方案53.根据实施方案52所述的组合物,其中所述天然RNA核酸酶活性被增加或诱导。
实施方案54.根据实施方案44-53中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然DNA核酸酶活性,并且其中所述天然DNA核酸酶活性被抑制。
实施方案55.根据实施方案54所述的组合物,其中所述CRISPR-Cas蛋白包含突变。
实施方案56.根据实施方案54或55所述的组合物,其中所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。
实施方案57.根据实施方案54-56中任一项所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。
实施方案58.根据实施方案54-56中任一项所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。
实施方案59.根据实施方案54-58中任一项所述的组合物,其中所述突变包含取代、插入、缺失、移码、倒位或转座。
实施方案60.根据实施方案59所述的组合物,其中所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
实施方案61.根据实施方案1-43中任一项所述的组合物,其中所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。
实施方案62.根据实施方案61所述的组合物,其中所述第一RNA结合蛋白包含基于Pumilio的联合体(PUMBY)蛋白。
实施方案63.根据实施方案1-56中任一项所述的组合物,其中所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。
实施方案64.根据实施方案63所述的组合物,其中所述第一RNA结合蛋白不是多聚体复合物的单体。
实施方案65.根据实施方案63所述的组合物,其中多聚体蛋白复合物不包含所述第一RNA结合蛋白。
实施方案66.根据实施方案1-65中任一项所述的组合物,其中所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。
实施方案67.根据实施方案66所述的组合物,其中所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。
实施方案68.根据实施方案66或67所述的组合物,其中所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
实施方案69.根据实施方案68所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案70.根据实施方案1-69中任一项所述的组合物,其中所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
实施方案71.根据实施方案1-70中任一项所述的组合物,其中编码所述第一RNA结合蛋白的序列还包含核定位信号(NLS)。
实施方案72.根据实施方案71所述的组合物,其中编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。
实施方案73.根据实施方案72所述的组合物,其中所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
实施方案74.根据实施方案1-70中任一项所述的组合物,其中编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。
实施方案75.根据实施方案74所述的组合物,其中编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。
实施方案76.根据实施方案75所述的组合物,其中所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
实施方案77.根据实施方案1-76中任一项所述的组合物,其中所述第二RNA结合蛋白包含核酸酶结构域或由其组成。
实施方案78.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含RNA酶或由其组成。
实施方案79.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶1或由其组成。
实施方案80.根据实施方案79所述的组合物,其中所述RNA酶1蛋白包含SEQ IDNO:20或由其组成。
实施方案81.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶4或由其组成。
实施方案82.根据实施方案81所述的组合物,其中所述RNA酶4蛋白包含SEQ IDNO:21或由其组成。
实施方案83.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶6或由其组成。
实施方案84.根据实施方案83所述的组合物,其中所述RNA酶6蛋白包含SEQ IDNO:22或由其组成。
实施方案85.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶7或由其组成。
实施方案86.根据实施方案85所述的组合物,其中所述RNA酶7蛋白包含SEQ IDNO:23或由其组成。
实施方案87.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶8或由其组成。
实施方案88.根据实施方案87所述的组合物,其中所述RNA酶8蛋白包含SEQ IDNO:24或由其组成。
实施方案89.根据实施方案88所述的组合物,其中所述第二RNA结合蛋白包含RNA酶2或由其组成。
实施方案90.根据实施方案89所述的组合物,其中所述RNA酶2蛋白包含SEQ IDNO:25或由其组成。
实施方案91.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶6PL或由其组成。
实施方案92.根据实施方案91所述的组合物,其中所述RNA酶6PL蛋白包含SEQ IDNO:26或由其组成。
实施方案93.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶L或由其组成。
实施方案94.根据实施方案93所述的组合物,其中所述RNA酶L蛋白包含SEQ IDNO:27或由其组成。
实施方案95.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶T2或由其组成。
实施方案96.根据实施方案95所述的组合物,其中所述RNA酶T2蛋白包含SEQ IDNO:28或由其组成。
实施方案97.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶11或由其组成。
实施方案98.根据实施方案97所述的组合物,其中所述RNA酶11蛋白包含SEQ IDNO:29或由其组成。
实施方案99.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶T2样蛋白或由其组成。
实施方案100.根据实施方案99所述的组合物,其中所述RNA酶T2样蛋白包含SEQID NO:30或由其组成。
实施方案101.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含NOB1多肽或由其组成。
实施方案102.根据实施方案101所述的组合物,其中所述NOB1多肽包含SEQ IDNO:31或由其组成。
实施方案103.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶或由其组成。
实施方案104.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)多肽或由其组成。
实施方案105.根据实施方案104所述的组合物,其中所述ENDOV蛋白包含SEQ IDNO:32或由其组成。
实施方案106.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)或由其组成。
实施方案107.根据实施方案106所述的组合物,其中所述ENDOG蛋白包含SEQ IDNO:33或由其组成。
实施方案108.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)多肽或由其组成。
实施方案109.根据实施方案108所述的组合物,其中所述ENDOD1包含SEQ ID NO:34或由其组成。
实施方案110.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)多肽或由其组成。
实施方案111.根据实施方案110所述的组合物,其中所述hFEN1蛋白包含SEQ IDNO:35或由其组成。
实施方案112.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人斯库拉芬蛋白14(hSLFN14)多肽或由其组成。
实施方案113.根据实施方案112所述的组合物,其中所述hSLFN14多肽包含SEQ IDNO:36或由其组成。
实施方案114.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。
实施方案115.根据实施方案114所述的组合物,其中所述hLACTB2多肽包含SEQ IDNO:37或由其组成。
实施方案116.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。
实施方案117.根据实施方案116所述的组合物,其中所述APEX2多肽包含SEQ IDNO:38或由其组成。
实施方案118.根据实施方案116所述的组合物,其中所述APEX2多肽包含SEQ IDNO:39或由其组成。
实施方案119.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。
实施方案120.根据实施方案119所述的组合物,其中所述ANG多肽包含SEQ ID NO:40或由其组成。
实施方案121.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。
实施方案122.根据实施方案121所述的组合物,其中所述HRSP12多肽包含SEQ IDNO:41或由其组成。
实施方案123.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含含锌指CCCH型12A(ZC3H12A)多肽或由其组成。
实施方案124.根据实施方案123所述的组合物,其中所述ZC3H12A多肽包含SEQ IDNO:42或由其组成。
实施方案125.根据实施方案124所述的组合物,其中所述ZC3H12A多肽包含SEQ IDNO:43或由其组成。
实施方案126.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(RIDA)多肽或由其组成。
实施方案127.根据实施方案126所述的组合物,其中所述RIDA多肽包含SEQ IDNO:44或由其组成。
实施方案128.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。
实施方案129.根据实施方案128所述的组合物,其中所述PDL6多肽包含SEQ IDNO:126或由其组成。
实施方案130.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。
实施方案131.根据实施方案130所述的组合物,其中所述NTHL多肽包含SEQ IDNO:123或由其组成。
实施方案132.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。
实施方案133.根据实施方案132所述的组合物,其中所述KIAA0391多肽包含SEQID NO:127或由其组成。
实施方案134.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。
实施方案135.根据实施方案134所述的组合物,其中所述APEX1多肽包含SEQ IDNO:125或由其组成。
实施方案136.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含阿尔古蛋白2(AGO2)多肽或由其组成。
实施方案137.根据实施方案136所述的组合物,其中所述AGO2多肽包含SEQ IDNO:128或由其组成。
实施方案138.根据实施方案67所述的组合物,其中所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。
实施方案139.根据实施方案138所述的组合物,其中所述EXOG多肽包含SEQ IDNO:129或由其组成。
实施方案140.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。
实施方案141.根据实施方案140所述的组合物,其中所述ZC3H12D多肽包含SEQ IDNO:130或由其组成。
实施方案142.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。
实施方案143.根据实施方案142所述的组合物,其中所述ERN2多肽包含SEQ IDNO:131或由其组成。
实施方案144.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(PELO)多肽或由其组成。
实施方案145.根据实施方案144所述的组合物,其中所述PELO多肽包含SEQ IDNO:132或由其组成。
实施方案146.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。
实施方案147.根据实施方案146所述的组合物,其中所述YBEY多肽包含SEQ IDNO:133或由其组成。
实施方案148.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。
实施方案149.根据实施方案148所述的组合物,其中所述CPSF4L多肽包含SEQ IDNO:134或由其组成。
实施方案150.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。
实施方案151.根据实施方案150所述的组合物,其中所述hCG_2002731多肽包含SEQ ID NO:135或由其组成。
实施方案152.根据实施方案150所述的组合物,其中所述hCG_2002731多肽包含SEQ ID NO:136或由其组成。
实施方案153.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。
实施方案154.根据实施方案153所述的组合物,其中所述ERCC1多肽包含SEQ IDNO:137或由其组成。
实施方案155.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。
实施方案156.根据实施方案155所述的组合物,其中所述RAC1多肽包含SEQ IDNO:138或由其组成。
实施方案157.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。
实施方案158.根据实施方案157所述的组合物,其中所述RAA1多肽包含SEQ IDNO:139或由其组成。
实施方案159.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。
实施方案160.根据实施方案159所述的组合物,其中所述RAB1多肽包含SEQ IDNO:140或由其组成。
实施方案161.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。
实施方案162.根据实施方案161所述的组合物,其中所述DNA2多肽包含SEQ IDNO:141或由其组成。
实施方案163.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。
实施方案164.根据实施方案163所述的组合物,其中所述FLJ35220多肽包含SEQID NO:142或由其组成。
实施方案165.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。
实施方案166.根据实施方案165所述的组合物,其中所述FLJ13173多肽包含SEQID NO:143或由其组成。
实施方案167.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。
实施方案168.根据实施方案167所述的组合物,其中所述ERCC4多肽包含SEQ IDNO:124或由其组成。
实施方案169.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。
实施方案170.根据实施方案169所述的组合物,其中所述RNA酶1(K41R)多肽包含SEQ ID NO:116或由其组成。
实施方案171.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。
实施方案172.根据实施方案171所述的组合物,其中所述RNA酶1(RNA酶1(K41R、D121E))多肽包含SEQ ID NO:117或由其组成。
实施方案173.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。
实施方案174.根据实施方案173所述的组合物,其中所述RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含SEQ ID NO:118或由其组成。
实施方案175.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。
实施方案166.根据实施方案175所述的组合物,其中所述RNA酶1(RNA酶1(H119N))多肽包含SEQ ID NO:119或由其组成。
实施方案177.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案178.根据实施方案177所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含SEQ ID NO:120或由其组成。
实施方案179.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案180.根据实施方案179所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含SEQ ID NO:121或由其组成。
实施方案181.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案182.根据实施方案181所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含SEQ ID NO:122或由其组成。
实施方案183.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM1)多肽或由其组成。
实施方案184.根据实施方案173所述的组合物,其中所述TENM1多肽包含SEQ IDNO:144或由其组成。
实施方案185.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含特诺伊林跨膜蛋白2(TENM2)多肽或由其组成。
实施方案186.根据实施方案185所述的组合物,其中所述TENM2多肽包含SEQ IDNO:145或由其组成。
实施方案187.根据实施方案1-77中任一项所述的组合物,其中所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。
实施方案188.根据实施方案187所述的组合物,其中所述TALEN多肽包含以下序列或由其组成:
Figure BDA0002925003530001951
实施方案189.根据实施方案187所述的组合物,其中所述TALEN多肽包含以下序列或由其组成:
Figure BDA0002925003530001961
实施方案190.根据实施方案1-77中任一项所述的组合物,其中所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。
实施方案191.根据实施方案190所述的组合物,其中所述锌指核酸酶多肽包含以下序列或由其组成:
Figure BDA0002925003530001962
Figure BDA0002925003530001971
Figure BDA0002925003530001981
实施方案192.根据实施方案1-191中任一项所述的组合物,其中所述组合物还包含(a)包含特异性结合于RNA分子内的gRNA的序列;以及
(b)编码核酸酶的序列。
实施方案193.根据实施方案192所述的组合物,其中所述核酸酶包含从CRISPR/Cas蛋白分离或衍生的序列。
实施方案194.根据实施方案193所述的组合物,其中所述CRISPR/Cas蛋白是从以下中的任一种分离或衍生的:I型、IA型、IB型、IC型、ID型、IE型、IF型、IU型、III型、IIIA型、IIIB型、IIIC型、IIID型、IV型、IVA型、IVB型、II型、IIA型、IIB型、IIC型、V型或VI型CRISPR/Cas蛋白。
实施方案195.根据实施方案192所述的组合物,其中所述核酸酶包含从TALEN或其核酸酶结构域分离或衍生的序列。
实施方案196.根据实施方案192所述的组合物,其中所述核酸酶包含从锌指核酸酶或其核酸酶结构域分离或衍生的序列。
实施方案197.根据实施方案191-196中任一项所述的组合物,其中所述靶序列包含编码适应性免疫应答的组分的序列。
实施方案198.一种载体,其包含根据实施方案1-197中任一项所述的组合物。
实施方案199.根据实施方案198所述的载体,其中所述载体是病毒载体。
实施方案200.根据实施方案199所述的载体,其中所述载体包含从慢病毒、腺病毒、腺相关病毒(AAV)载体或逆转录病毒分离或衍生的序列。
实施方案201.根据实施方案199或200所述的载体,其中所述载体无复制能力。
实施方案202.根据实施方案100-201中任一项的实施方案所述的载体,其中所述载体包含从腺相关载体(AAV)分离或衍生的序列。
实施方案203.根据实施方案202所述的载体,其中所述腺相关病毒(AAV)是分离的AAV。
实施方案204.根据实施方案202或203所述的载体,其中所述腺相关病毒(AAV)是自身互补的腺相关病毒(scAAV)。
实施方案205.根据实施方案202-204中任一项所述的载体,其中所述腺相关病毒(AAV)是重组腺相关病毒(rAAV)。
实施方案206.根据实施方案202-205中任一项所述的载体,其中所述腺相关病毒(AAV)包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的序列。
实施方案207.根据实施方案202-206中任一项所述的载体,其中所述腺相关病毒(AAV)包含从血清型AAV9的AAV分离或衍生的序列。
实施方案208.根据实施方案202-206中任一项所述的载体,其中所述腺相关病毒(AAV)包含从Anc80分离或衍生的序列。
实施方案209.根据实施方案100-201中任一项所述的载体,其中所述载体是逆转录病毒。
实施方案210.根据权利要求100-201中任一项的实施方案所述的载体,其中所述逆转录病毒是慢病毒。
实施方案211.根据实施方案198所述的载体,其中所述载体是非病毒载体。
实施方案212.根据实施方案211所述的载体,其中所述非病毒载体包含纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物或树枝状聚合物。
实施方案213.一种组合物,其包含根据实施方案198-212中任一项所述的载体。
实施方案214.一种细胞,其包含根据实施方案198-212中任一项所述的载体。
实施方案215.一种细胞,其包含根据实施方案214所述的组合物。
实施方案216.根据实施方案214或215所述的细胞,其中所述细胞是哺乳动物细胞。
实施方案217.根据实施方案216所述的细胞,其中所述细胞是人细胞。
实施方案218.根据实施方案215-217中任一项所述的细胞,其中所述细胞是免疫细胞。
实施方案219.根据实施方案218所述的细胞,其中所述免疫细胞是T淋巴细胞(T细胞)。
实施方案220.根据实施方案219所述的细胞,其中所述T细胞是效应T细胞、辅助T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关恒定T细胞或γδT细胞。
实施方案221.根据实施方案215-217中任一项所述的细胞,其中所述免疫细胞是抗原呈递细胞。
实施方案222.根据实施方案221所述的细胞,其中所述抗原呈递细胞是树突细胞、巨噬细胞或B细胞。
实施方案223.根据实施方案221所述的细胞,其中所述抗原呈递细胞是体细胞。
实施方案224.根据实施方案215-223中任一项所述的细胞,其中所述细胞是健康细胞。
实施方案225.根据实施方案215-223中任一项所述的细胞,其中所述细胞不是健康细胞。
实施方案226.根据实施方案225所述的细胞,其中所述细胞是从患有疾病或障碍的受试者分离或衍生的。
实施方案227.一种组合物,其包含根据实施方案215-226中任一项所述的细胞。
实施方案228.一种从适应性免疫应答中掩蔽细胞的方法,其包括使根据实施方案1-197、213或227中任一项所述的组合物与所述细胞接触以产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
实施方案229.根据实施方案228所述的方法,其中所述细胞是体内的、体外的、离体的或原位的。
实施方案230.根据实施方案228所述的方法,其中所述细胞是体外的或离体的。
实施方案231.根据实施方案228-230中任一项所述的方法,其中多个细胞包含所述细胞。
实施方案232.根据实施方案231所述的方法,其中使所述多个细胞中的每个细胞与所述组合物接触,从而产生多个修饰的细胞。
实施方案233.根据实施方案228-230中任一项所述的方法,其中所述方法还包括向受试者施用所述修饰的细胞。
实施方案234.根据实施方案231-232中任一项所述的方法,其中所述方法还包括向受试者施用所述多个修饰的细胞。
实施方案235.根据实施方案233所述的方法,其中所述细胞是自体的。
实施方案236.根据实施方案233所述的方法,其中所述是同种异体的。
实施方案237.根据实施方案233所述的方法,其中所述多个修饰的细胞是自体的。
实施方案238.根据实施方案233所述的方法,其中所述多个修饰的细胞是同种异体的。
实施方案239.根据实施方案228-238中任一项所述的方法,其中适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。
实施方案240.根据实施方案239所述的方法,其中所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。
实施方案241.根据实施方案228-238中任一项所述的方法,其中适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。
实施方案242.根据实施方案239所述的方法,其中所述MHC II组分包含α1链、α2链、β1链或β2链。
实施方案243.根据实施方案239所述的方法,其中所述TCR组分包含α链和β链。
实施方案244.根据实施方案239所述的方法,其中所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
实施方案245.一种防止或减少受试者的适应性免疫应答的方法,其包括向所述受试者施用治疗有效量的根据实施方案1-197、213或227中任一项所述的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
实施方案246.一种治疗受试者的疾病或障碍的方法,其包括向所述受试者施用治疗有效量的根据实施方案1-197、213或227中任一项所述的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述组合物防止或减少对所述修饰的细胞的适应性免疫应答。
实施方案247.根据实施方案246所述的方法,其中适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。
实施方案248.根据实施方案247所述的方法,其中所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。
实施方案249.根据实施方案247或248所述的方法,其中适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。
实施方案250.根据实施方案249所述的方法,其中所述MHC II组分包含α1链、α2链、β1链或β2链。
实施方案251.根据实施方案247所述的方法,其中所述TCR组分包含α链和β链。
实施方案252.根据实施方案247所述的方法,其中所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
实施方案253.根据实施方案246-252中任一项所述的方法,其中所述疾病或障碍是遗传疾病或障碍。
实施方案254.根据实施方案253所述的方法,其中所述疾病或障碍是单基因遗传疾病或障碍。
实施方案255.根据实施方案254所述的方法,其中所述疾病或障碍是由微卫星不稳定性引起的。
实施方案256.根据实施方案255所述的方法,其中所述微卫星不稳定性发生在DNA序列的至少1、2、3、4、5或6个重复的基序处。
实施方案257.根据实施方案256所述的方法,其中RNA分子包含所述DNA序列的转录物,并且其中所述组合物与所述RNA分子的靶序列结合,所述靶序列包含至少1、2、3、4、5或6个重复的基序。
实施方案258.根据实施方案246-257中任一项所述的方法,其中全身性施用所述组合物。
实施方案259.根据实施方案259所述的方法,其中静脉内施用所述组合物。
实施方案260.根据实施方案258或259所述的方法,其中通过注射或输注施用所述组合物。
实施方案261.根据实施方案246-257中任一项所述的方法,其中局部施用所述组合物。
实施方案262.根据实施方案261所述的方法,其中通过骨内、眼内、脑内或脊柱内途径施用所述组合物。
实施方案263.根据实施方案261或262所述的方法,其中通过注射或输注施用所述组合物。
实施方案264.根据实施方案265-263中任一项所述的方法,其中所述治疗有效量是单剂量。
实施方案265.根据实施方案265-264中任一项所述的方法,其中所述组合物是非基因组整合的。
通过引用并入
将在本文中引用的每个文件(包括任何交叉参考或相关的专利或申请)通过引用以其整体特此并入本文,除非明确排除或另有限制。引用任何文件并非承认,它是关于本文公开或要求保护的任何发明的现有技术,或者它单独地或与任何其他一个或多个参考文献的任何组合传授、表明或公开任何这种发明。此外,在本文件中术语的任何含义或定义与通过引用并入的文件中相同术语的任何含义或定义矛盾的方面来说,应当以分配给本文件中该术语的含义或定义为准。
其他实施方案
虽然已经说明并描述了本公开文本的特定实施方案,但是可以在不背离本公开文本的精神和范围的情况下做出各种其他变化和修改。所附权利要求的范围包括在本公开文本的范围内的所有此类变化和修改。

Claims (30)

1.一种组合物,其包含含有特异性结合靶RNA序列的指导RNA(gRNA)序列的核酸序列,其中所述靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
2.根据权利要求1所述的组合物,其中所述适应性免疫应答选自I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子及其组合。
3.根据权利要求1所述的组合物,其中所述间隔子序列的长度是约20或21个核苷酸。
4.根据权利要求1所述的组合物,其中所述间隔子序列和所述靶RNA序列是彼此的反向互补体。
5.根据权利要求1所述的组合物,其中所述gRNA序列包含与CRISPR/Cas多肽或其部分特异性结合的支架序列。
6.根据权利要求5所述的组合物,其中所述CRISPR/Cas多肽或其部分选自Cas9、Cpf1、Cas13a、Cas13b、Cas13c和CasRX/Cas13d,其中所述CRISPR/Cas多肽具有天然的、降低的或无效的活性。
7.根据权利要求1所述的组合物,其中所述核酸序列包含驱动所述gRNA序列的表达的启动子。
8.根据权利要求7所述的组合物,其中所述启动子选自聚合酶III启动子和tRNA启动子。
9.根据权利要求8所述的组合物,其中所述聚合酶III启动子是U6启动子。
10.根据权利要求1所述的组合物,其中所述间隔子序列是特异性结合第一靶RNA序列的第一间隔子序列,并且其中所述组合物还包含特异性结合第二靶RNA序列的第二间隔子序列,其中所述第一间隔子序列与第二间隔子序列结合不同的靶RNA序列。
11.根据权利要求10所述的组合物,其中所述gRNA序列是第一gRNA序列,并且其中所述第二间隔子序列包含在第二gRNA序列内。
12.根据权利要求10所述的组合物,其中所述第二靶RNA序列编码适应性免疫应答的蛋白质组分。
13.根据权利要求10所述的组合物,其中所述第二间隔子序列包含编码选自以下的蛋白质组分的核酸序列的一部分:β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
14.根据权利要求10所述的组合物,其中所述第二间隔子序列包含选自以下的核酸序列的至少1、2、3、4、5、6或7个重复:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ IDNO:80)、GGGGCC(SEQ ID NO:81)及其组合。
15.一种组合物,其包含含有以下的核酸序列:(a)特异性结合第一靶RNA序列的第一指导RNA(gRNA)序列;以及(b)特异性结合第二靶RNA序列的第二gRNA,其中所述第一靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述第一gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
16.一种组合物,其包含含有以下的核酸序列:(a)根据权利要求1所述的指导RNA(gRNA)序列;以及(b)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽和第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
17.一种组合物,其包含含有以下的核酸序列:(a)根据权利要求11所述的第一和第二指导RNA(gRNA)序列;以及(b)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽和第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
18.一种组合物,其包含含有以下的核酸序列:(a)特异性结合第一RNA分子内的第一靶RNA序列的第一指导RNA(gRNA),其中所述第一靶RNA序列编码适应性免疫应答的蛋白质组分;(b)特异性结合第二RNA分子内的第二靶RNA序列的第二指导RNA(gRNA);以及(c)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽、第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
19.根据权利要求18所述的组合物,其中所述第一gRNA序列包含含有编码选自以下的蛋白质的核酸序列的一部分的间隔子序列:β-2-微球蛋白(β2M)、HLA-A、HLA-B、HLA-C、CD28、CD80、CD86、ICOSLG、OX40L、IL12和CCR7。
20.根据权利要求18所述的组合物,其中所述第一RNA结合多肽或其部分是CRISPR/Cas多肽或其部分。
21.根据权利要求20所述的组合物,其中所述CRISPR/Cas多肽或其部分选自Cas9、Cpf1、Cas13a、Cas13b、Cas13c和CasRX/Cas13d,其中所述CRISPR/Cas多肽具有天然的、降低的或无效的活性。
22.根据权利要求18所述的组合物,其中所述第二RNA结合多肽以与RNA缔合的方式结合RNA。
23.根据权利要求22所述的组合物,其中所述第二RNA结合多肽以切割RNA的方式与RNA缔合。
24.根据权利要求18所述的组合物,其中所述核酸序列包含启动子。
25.根据权利要求18所述的组合物,其中所述第二gRNA包含含有选自以下的序列的至少1、2、3、4、5、6或7个重复的间隔子序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)及其组合。
26.根据权利要求18所述的组合物,其中所述融合蛋白包含NLS、NES或标签。
27.一种载体,其包含根据权利要求18所述的组合物。
28.根据权利要求27所述的载体,其中所述载体选自:腺相关病毒、逆转录病毒、慢病毒、腺病毒、纳米颗粒、胶束、脂质体、阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物和树枝状聚合物。
29.一种细胞,其包含根据权利要求28所述的载体。
30.根据权利要求18所述的组合物,其中所述第二RNA结合多肽选自:RNA酶1、RNA酶4、RNA酶6、RNA酶7、RNA酶8、RNA酶2、RNA酶6PL、RNA酶L、RNA酶T2、RNA酶11、RNA酶T2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、RNA酶1(K41R)、RNA酶1(K41R、D121E)、RNA酶1(K41R、D121E、H119N)、RNA酶1(H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、RNA酶1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNA酶K、TALEN、ZNF638和hSMG6 PIN。
CN201980051039.7A 2018-06-08 2019-06-07 用于调节适应性免疫的组合物和方法 Pending CN113286619A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862682276P 2018-06-08 2018-06-08
US62/682,276 2018-06-08
PCT/US2019/036050 WO2019236998A1 (en) 2018-06-08 2019-06-07 Compositions and methods for the modulation of adaptive immunity

Publications (1)

Publication Number Publication Date
CN113286619A true CN113286619A (zh) 2021-08-20

Family

ID=68769461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980051039.7A Pending CN113286619A (zh) 2018-06-08 2019-06-07 用于调节适应性免疫的组合物和方法

Country Status (9)

Country Link
US (1) US20190382759A1 (zh)
EP (1) EP3801641A4 (zh)
JP (1) JP2021526860A (zh)
KR (1) KR20210060429A (zh)
CN (1) CN113286619A (zh)
AU (1) AU2019281006A1 (zh)
CA (1) CA3102783A1 (zh)
SG (1) SG11202012015YA (zh)
WO (1) WO2019236998A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023208256A1 (zh) * 2022-04-26 2023-11-02 北京干细胞与再生医学研究院 经分离的Cas13蛋白、基于它的基因编辑系统及其用途

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3765094A4 (en) 2018-03-15 2021-12-22 KSQ Therapeutics, Inc. GENE REGULATION COMPOSITIONS AND METHODS FOR IMPROVING IMMUNOTHERAPY
SG11202012004SA (en) 2018-06-08 2021-01-28 Locanabio Inc Rna-targeting fusion protein compositions and methods for use
EP3911741A1 (en) * 2019-01-14 2021-11-24 University of Rochester Targeted nuclear rna cleavage and polyadenylation with crispr-cas
US11661459B2 (en) 2020-12-03 2023-05-30 Century Therapeutics, Inc. Artificial cell death polypeptide for chimeric antigen receptor and uses thereof
WO2023150131A1 (en) * 2022-02-01 2023-08-10 The Regents Of The University Of California Method of regulating alternative polyadenylation in rna
CN114848808B (zh) * 2022-03-24 2023-04-25 四川大学 基于阳离子脂多肽及细胞因子的免疫增强剂及制法、应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170145394A1 (en) * 2015-11-23 2017-05-25 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
WO2017093969A1 (en) * 2015-12-04 2017-06-08 Novartis Ag Compositions and methods for immunooncology

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018081806A2 (en) * 2016-10-31 2018-05-03 University Of Florida Research Foundation, Inc. Compositions and methods for impeding transcription of expanded microsatellite repeats
CN110959039A (zh) * 2017-03-15 2020-04-03 博德研究所 新型cas13b直向同源物crispr酶和系统
US11168322B2 (en) * 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170145394A1 (en) * 2015-11-23 2017-05-25 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
WO2017091630A1 (en) * 2015-11-23 2017-06-01 The Regents Of The University Of California Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9
WO2017093969A1 (en) * 2015-12-04 2017-06-08 Novartis Ag Compositions and methods for immunooncology

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAVID B.T. CO: "RNA Editing with CRISPR-Cas13", SCIENCE, vol. 258, no. 6366, pages 1019 - 1027, XP055491658, DOI: 10.1126/science.aaq0180 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023208256A1 (zh) * 2022-04-26 2023-11-02 北京干细胞与再生医学研究院 经分离的Cas13蛋白、基于它的基因编辑系统及其用途

Also Published As

Publication number Publication date
EP3801641A4 (en) 2022-09-28
EP3801641A1 (en) 2021-04-14
KR20210060429A (ko) 2021-05-26
JP2021526860A (ja) 2021-10-11
US20190382759A1 (en) 2019-12-19
SG11202012015YA (en) 2021-01-28
WO2019236998A1 (en) 2019-12-12
AU2019281006A1 (en) 2021-01-28
CA3102783A1 (en) 2019-12-12

Similar Documents

Publication Publication Date Title
US10822617B2 (en) RNA-targeting fusion protein compositions and methods for use
CN113286619A (zh) 用于调节适应性免疫的组合物和方法
US20220127621A1 (en) Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna
CN108463211B (zh) 用于治疗肌联蛋白类肌病和其它肌联蛋白病变的材料和方法
JP7379447B2 (ja) ゲノム編集分子の細胞内送達のためのペプチドおよびナノ粒子
AU2022271376A1 (en) CRISPR/CAS-related methods and compositions for treating herpes simplex virus
CN114450031A (zh) 靶向rna的敲低和替代组合物及使用方法
JP2020519269A (ja) Crispr/cas9核送達による細胞rnaの狙いを定めた編集
CA3009727A1 (en) Compositions and methods for the treatment of hemoglobinopathies
AU2019326617A1 (en) FASL immunomodulatory gene therapy compositions and methods for use
CN111218447A (zh) 使用统治型gRNA的CRISPR相关方法和组合物
CN113423831A (zh) 核酸酶介导的重复扩增
US20220220473A1 (en) Protein translational control
CN112041436A (zh) 雷帕霉素抗性细胞
JP2023551873A (ja) Cagリピート病を処置するためのrna標的化組成物および方法
JP2024502036A (ja) 操作されたt細胞
CN118159650A (zh) 一种CRISPR-Cas13系统及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination