CN116806261A - 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途 - Google Patents

用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途 Download PDF

Info

Publication number
CN116806261A
CN116806261A CN202180082426.4A CN202180082426A CN116806261A CN 116806261 A CN116806261 A CN 116806261A CN 202180082426 A CN202180082426 A CN 202180082426A CN 116806261 A CN116806261 A CN 116806261A
Authority
CN
China
Prior art keywords
seq
sequence
engineered
region
cas12f1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180082426.4A
Other languages
English (en)
Inventor
金龙三
金掉妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keenkorey Co ltd
Original Assignee
Keenkorey Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keenkorey Co ltd filed Critical Keenkorey Co ltd
Priority claimed from PCT/KR2021/013923 external-priority patent/WO2022075813A1/ko
Publication of CN116806261A publication Critical patent/CN116806261A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本申请文件提供了经工程化的Cas12f1引导RNA,用于通过克服现有技术的限制来增强CRISPR/Cas12f1系统的细胞内基因编辑活性。该经工程化的Cas12f1引导RNA通过对自然界中发现的引导RNA结构的一部分进行修饰来获得。该经工程化的Cas12f1引导RNA的特征在于其组成部分中的至少一部分支架区已经被修饰,该支架区起到与Cas12f1蛋白相互作用的作用。该经工程化的支架区的特征在于它不同于自然界中发现的引导RNA的支架区。

Description

用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA 及其用途
技术领域
[相关申请]
本申请要求于2020年10月8日提交的韩国专利申请No.10-2020-0129937和2021年4月21日提交的韩国专利申请No.10-2021-0051552的优先权,以引用方式将其各自的公开内容整体并入本文。
[技术领域]
本文公开了使用CRISPR/Cas系统、特别是CRISPR/Cas12f1系统用于基因编辑的领域的技术。
背景技术
CRISPR/Cas12f1系统是一种被归类为2类V型的CRISPR/Cas系统。之前的研究(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))首次报道了作为衍生自古细菌的CRISPR/Cas系统的CRISPR/Cas14a系统。随后的研究(Karvelis等,Nucleic Acids Research,Vol.48,No.9 5017(2020))将CRISPR/Cas14系统归类为CRISPR/Cas12f1系统。CRISPR/Cas12f1系统属于V-F1系统(其为CRISPR/Cas系统的一个亚型,被归类为2类V型),并且包括具有Cas14a作为效应蛋白的CRISPR/Cas14a系统,CRISPR/Cas12f1系统的特征在于其效应蛋白的大小显著小于CRISPR/Cas9系统。然而,正如之前的研究(Harrington等,Programmed DNA destructionby miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018),US 2020/0190494A1)所揭示的,CRISPR/Cas12f1系统、特别是CRISPR/Cas14a系统表现出切割单链DNA的能力,但对双链DNA没有或有极低的切割活性,使其在基因编辑技术中的应用受到限制。
作为继续研究的结果,近期文献(Takeda等,Structure of the miniature typeV-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))揭示了Cas12f1蛋白在CRISPR/Cas12f1系统中形成二聚体的事实,以及其引导RNA的结构。现有文献发现,引导RNA含有不与Cas12f1蛋白直接相互作用的所谓的无序区。在另一篇现有文献(Xiao等,Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease,bioRxiv(2020))中,移除了无序区,并在体外研究了该系统的双链DNA切割效率。
然而,1)先前的研究没有显示出细胞内基因编辑活性,也不涉及增加细胞内基因编辑活性的方法(如插入缺失产生效率);2)在这些研究中,有项实验中移除了无序区,但据报道该实验中的切割活性甚至有所降低;并且另外,3)该实验是在体外进行的,而未能揭示哪些修饰表现出细胞内基因编辑活性或提高效率。
发明内容
技术问题
本公开旨在提供可用于CRISPR/Cas12f1系统以提高基因编辑效率的经工程化的Cas12f1引导RNA。
本公开旨在提供被包含在经工程化的Cas12f1引导RNA中并可以提高基因编辑效率的经工程化的支架区。
本公开旨在提供具有提高的基因编辑效率的经工程化的CRISPR/Cas12f1复合物。
本公开旨在提供具有提高的基因编辑效率的经工程化的CRISPR/Cas12f1系统。
本公开旨在提供具有编码经工程化的CRISPR/Cas12f1系统的各个组分的核酸的载体。
本公开旨在提供使用经工程化的CRISPR/Cas12f1系统的基因编辑方法。
本公开旨在提供经工程化的CRISPR/Cas12f1系统的用途。
技术方案
在实施方式中,本文提供了用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9):
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO;41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID N0;46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
为了解决该问题,本文提供了用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315);并且
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(sEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(sEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117),
5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293),
5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294),
5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295),
5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ ID NO:296),
5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297),
5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298),
5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299),
5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300),
5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301),
5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:302),
5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303),
5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:305),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:306),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:307),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314);以及
5′-AUGCAAC-3′。
在实施方式中,本文提供了用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区具有10个核苷酸至50个核苷酸的长度,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
由5′-A-3′示出的第一序列;
由5′-CCGCUUCAC-3′(SEQ ID NO:432)示出的第二序列;
由5′-UUAG-3′示出的第三序列;
由5′-AGUGAAGGUGG-3′(SEQ ID NO:433)示出的第四序列;
由5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQID NO:11)示出的第五序列;
由5′-AACAAA-3′示出的第六序列;
接头;
由5′-GGA-3′示出的第七序列;
由5′-AUGCAAC-3′示出的第八序列。
为解决该问题,本文提供了用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述间隔区具有10个核苷酸至30个核苷酸的长度,并且具有与靶序列互补的序列,
经工程化的支架区的序列包括:
以5′至3′的方向,
经工程化的tracrRNA,其中,以下序列彼此连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);以及
选自于由以下所组成的组中的序列:5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′,5′-AACAAAUUCA-3′(SEQ ID NO:66),5′-AACAAAUUCAU-3′(SEQ ID NO:67),5′-AACAAAUUCAUU-3′(SEQ ID NO:68),和5′-AACAAAUUCAUUU-3′(SEQ IDNO:12);并且
经工程化的crRNA重复序列部分,其中,以下序列彼此连接:
选自于由5′-GGA-3′、5′-AGGA-3′、5′-AAGGA-3′、5′-GAAGGA-3′、5′-UGAAGGA-3′、5′-AUGAAGGA-3′、5′-AAUGAAGGA-3′和5′-GAAUGAAGGA-3′(SEQ ID NO:14)所组成的组中的序列;以及
5′-AUGCAAC-3′;
其中,所述经工程化的crRNA重复序列的3’端与所述间隔区的5’端连接,并且
其中,将如下排除:其中的经工程化的tracrRNA的序列与5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:1)相同,并且经工程化的crRNA重复序列与5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)相同。
在实施方式中,本文提供了经工程化的CRISPR/Cas12f1复合物,包括:
Cas12f1蛋白,和
经工程化的引导RNA,
其中,所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包括10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7);并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(sEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(sEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-
CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID No:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
在实施方式中,本文提供了能够表达CRISPR/Cas12f1系统的各个组分的载体,包括:
第一序列,所述第一序列包含编码Cas12f1蛋白的核酸序列;
可操作地连接到所述第一序列的第一启动子序列;
第二序列,所述第二序列包含编码所述经工程化的引导RNA的核酸序列;以及
可操作地连接到所述第二序列的第二启动子序列,
其中,所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7);
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID No:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-,3(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
在实施方式中,本文提供了编辑细胞中的靶核酸的方法或靶向细胞中的靶核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑或靶向含有靶序列的核酸,
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以51至31的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5’至31的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
在实施方式中,本文提供了编辑细胞中的靶核酸的方法或靶向细胞中的靶核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑或靶向所述靶核酸,并且
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(sEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117),
5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293),
5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294),
5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295),
5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ ID NO:296),
5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297),
5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298),
5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299),
5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300),
5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301),
5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:302),
5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303),
5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:305),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:306),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:307),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308),
5′一AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314);以及
5′-AUGCAAC-3′。
有益效果
在将包含具有经工程化的支架区的经工程化的Cas12f1引导RNA的CRISPR/Cas12f1系统用于基因编辑的情况下,CRISPR/Cas12f1系统表现出比起天然存在的CRISPR/Cas12f1系统更高的基因编辑效率。
附图说明
图1为显示本文公开的经工程化的Cas12f1引导RNA的示意图。
图2为显示实验例2公开的实施例之中的、靶向DY2的实施例1.1至实施例1.3的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图3为显示实验例2公开的实施例之中的、靶向DY2的实施例1.7至实施例1.9的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图4为显示实验例2公开的实施例之中的、靶向DY2的实施例1.11至实施例1.13的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图5为显示实验例2公开的实施例之中的、靶向DY10的实施例2.1至实施例2.3的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图6为显示实验例2公开的实施例之中的、靶向DY10的实施例2.4至实施例2.6的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图7为显示实验例2公开的实施例之中的、靶向DY10的实施例2.7至实施例2.9的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图8为显示实验例2公开的实施例之中的、靶向DY10的实施例2.10至实施例2.13的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图9为显示实验例2公开的实施例之中的、靶向Intergenic-22的实施例3.1至实施例3.3的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图10为显示实验例2公开的实施例之中的、靶向Intergenic-22的实施例3.4至实施例3.6的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图11为显示实验例2公开的实施例之中的、靶向Intergenic-22的实施例3.7至实施例3.9的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图12为显示实验例2公开的实施例之中的、靶向Intergenic-22的实施例3.10至实施例3.13的平均的插入缺失效率的图表。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
图13显示出了实验例2公开的实施例之中的、靶向DY2的实施例1.13至实施例1.14的平均的插入缺失效率,靶向DY10的实施例2.13至实施例2.14的平均的插入缺失效率,靶向Intergenic-22的实施例3.13至实施例3.14的平均的插入缺失突变效率。此处,Ex是实施例(Example)的缩写,Comp是比较例(Comparative Example)的缩写,并且Control指未用CRISPR/Cas12f1处理的阴性对照。
具体实施方式
术语定义
如本文所用,术语“约”是指相对于参比的量、水平、值、数目、频率、百分比、尺寸、大小、重量或长度变化约30%、25%、20%、25%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的量、水平、值、数目、频率、百分比、尺寸、大小、重量或长度。
A、T、C、G和U
本文所用的符号A、T、C、G和U按本领域技术人员所理解的进行解释。根据上下文和描述,其可被恰当地解释为DNA或RNA中的碱基、核苷或核苷酸。例如,在符号意味着碱基的情况下,它们可被分别解释为腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、鸟嘌呤(G)或尿嘧啶(U);在符号意味着核苷的情况下,它们可被分别解释为腺苷(A)、胸苷(T)、胞苷(C)、鸟苷(G)或尿苷(U);并且在符号意味着核苷酸的情况下,它们可被解释为意味着包含相应核苷的核苷酸。
可操作地连接
如本文所用,在基因表达中,术语“可操作地连接”是指特定的组分被连接至另一组分而使得该特定组分可以施行其预期功能。例如,当启动子序列被可操作地连接至编码序列时,这意味着启动子与其连接从而影响所述编码序列在细胞内的转录和/或表达。此外,该术语包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
靶基因或靶核酸
本文所用的“靶基因”或“靶核酸”基本上意味着成为基因编辑靶标的细胞中的基因或核酸。靶基因或靶核酸可互换使用,并且可指同一靶标。除非另有描述,靶基因或靶核酸可指靶细胞中所固有的基因和核酸、或者外部来源的基因或核酸,并且只要其可为编辑的靶标,就没有特别限制。靶基因或靶核酸可包含靶序列或与其相邻的区域。靶基因或靶核酸可为单链DNA、双链DNA和/或RNA。此外,该术语包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
靶序列或识别序列
如本文所用,“靶序列”或“识别序列”是指由CRISPR/Cas复合物识别以对靶基因或靶核酸进行切割的特定序列。可根据其目的适当地选择靶序列。具体而言,“靶序列”可为上述靶基因或靶核酸中包含的序列,并且是指与本文提供的经工程化的引导RNA或引导RNA中包含的间隔区序列具有互补性的序列。通常,间隔区序列是考虑靶基因或靶核酸序列以及被CRISPR/Cas系统的效应蛋白识别的原间隔邻近基序(PAM)序列来确定的。在本公开中,靶序列可仅指互补结合至CRISPR/Cas复合物的引导RNA的特定链,或可指包含特定链部分的整个靶双链。可根据上下文对该术语进行适当解释。此外,该术语包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
载体
如本文所用,除非另有指明,“载体”统指能够将遗传材料运送至细胞中的任何材料。例如,载体可为DNA分子,包括感兴趣的遗传材料,例如编码CRISPR/Cas系统的效应蛋白的核酸,和/或编码引导RNA的核酸,然而,载体不限于此。该术语包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
天然存在
本文所用的术语“天然存在”是指在自然界中发现的未经人工修饰的客体。该术语用于与通过人工修饰获得的“经工程化的客体”进行区分。“天然存在”的基因、核酸、DNA、RNA等被用作如下概念,其涵盖野生型(原始形式)和成熟形式(活化形式)的所有基因、核酸、DNA和RNA。该术语包括由本领域技术人员认可的所有含义,并且应根据上下文进行适当解释。
经工程化的
本文所用的术语“经工程化的”用于与其构型已存在于自然界中的材料、分子等进行区分,并且这意味着材料、分子等经过了人工修饰。例如,“经工程化的引导RNA”是指通过对天然存在的引导RNA的构型进行人工修饰而获得的引导RNA。此外,该术语包括由本领域技术人员认可的所有含义,并且可以根据上下文进行适当解释。
核定位序列或信号(NLS)
在通过核转运而将细胞核外的物质运送至核内的情况下,本文所用的术语“NLS”是指具有一定长度的肽或其序列,其中,该肽附着至待运送的蛋白并充当一种“标签”。具体而言,NLS可为但不限于源自如下的NLS序列:具有氨基酸序列PKKKRKV(SEQ ID NO:277)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ IDNO:278)的双分型核质蛋白(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:279)或RQRRNELKRSP(SEQ ID NO:280)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:281)的hRNPA1 M9 NLS;来自输入蛋白α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:282);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:283)和PPKKARED(SEQ ID NO:284);人p53的序列PQPKKKPL(SEQ ID NO:285);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:286);流感病毒NS1的序列DRLRR(SEQ ID NO:287)和PKQKKRK(SEQ ID NO:288);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:289);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:290);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:291);或类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:292)。如本文所用,术语“NLS”包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
核输出序列或信号(NES)
在通过核转运而将细胞核内的物质运送至核外的情况下,本文所用的术语“NES”是指具有一定长度的肽或其序列,其中该肽附着至待运送的蛋白并充当一种“标签”。如本文所用,术语“NES”包括由本领域技术人员认可的所有含义,并且可根据上下文适当地解释。
标签
如本文所用,术语“标签”统指添加以便于肽或蛋白质的转运、示踪和/或分离和纯化的功能结构域。具体而言,标签包括但不限于:标签蛋白,如组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx);自体荧光蛋白,如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、蓝色荧光蛋白(BFP)、HcRED和DsRed;以及报告蛋白,如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡萄糖醛酸酶和荧光素酶。如本文所用,术语“标签”包括由本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
背景技术-CRISPR/Cas12f1复合物的结构
CRISPR/Cas12f系统
CRISPR/Cas12f系统属于V型CRISPR/Cas系统之中的V-F亚型,进一步分为V-F1至V-F3的变体。CRISPR/Cas12f系统包括CRISPR/Cas14系统,包括在先前的研究中命名为Cas14的效应蛋白中的Cas14a、Cas14b和Cas14c变体(Harrington等,Programmed DNAdestruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。其中,包含Cas14a效应蛋白的CRISPR/Cas14a系统被归类为CRISPR/Cas12f1系统(Makarova等,Nature Reviews,Microbiology,第18卷,67(2020))。最近的前期研究(Takeda等,Structure of the miniature type V-F CRISPR-Cas effector enzyme、Molecular Cell81、1-13(2021),Xiao等,Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease,bioRxiv(2020))等,揭示了CRISPR/Cas12f1复合物的结构,下文将对此进行简要描述。
CRISPR/Cas12f1复合物的结构
发现在CRISPR/Cas12f1复合物中,Cas12f1蛋白的两个分子(处于二聚体的形式)与引导RNA结合形成复合物。将Cas12f1蛋白分为氨基末端结构域(NTD)和羧基末端结构域(CTD),并且具有其中的两个结构域通过连接环连接的结构。NTD由wedge(WED)、识别(REC)和锌指(ZF)结构域组成,并且CTD由另一ZF结构域和RuvC结构域组成。Cas12f1二聚体蛋白的结构可大致分为识别(REC)瓣叶和核酸酶(NUC)瓣叶。REC瓣叶由如下组成:构成二聚体的一个Cas12f1蛋白的REC结构域、WED结构域、和ZF结构域,以及构成二聚体的另一Cas12f1蛋白的的REC结构域、WED结构域、和ZF结构域。核酸酶瓣叶由如下组成:构成二聚体的一个Cas12f1蛋白的TNB结构域和RuvC结构域,以及构成二聚体的另一Cas12f1蛋白的TNB结构域和RuvC结构域。Cas12f1蛋白的每个结构域的全部或部分分别识别Cas12f1引导RNA的支架区的特定部分,并形成CRISPR/Cas12f1复合物。
Cas12f1引导RNA的结构
在本公开中,Cas12f1引导RNA按功能大致分为间隔区和支架区。支架区由五个茎(命名为茎1-茎5)和一个假结(PK)组成。
通常,本领域技术人员众所周知的是,将天然存在的Cas12f1引导RNA分为tracrRNA和crRNA,其中crRNA可进一步分为crRNA重复序列部分和间隔区。除了上述标准之外,在本公开中,与Cas12f1蛋白相互作用的Cas12f1引导RNA的部分统称为支架区。支架区是包含tracrRNA和crRNA的部分的区域,并且起到与Cas12f1蛋白相互作用的功能。其详细描述将在下面的相应部分中提供。
Cas12f1引导RNA包括两个结构,其中tracrRNA的一部分(tracrRNA反-重复)和crRNA的一部分重复部分互补结合以形成双链,并且该结构被命名为crRNA重复-tracrRNA反-重复(R:AR)部分。茎5(R:AR2)和PK(R:AR1)形成这种crRNA重复-tracrRNA反-重复双链结构。在CRISPR/Cas12f1复合物中,发现Cas12f1引导RNA中的茎1部分、茎2的一部分和茎5(R:AR2)部分不与Cas12f1二聚体相互作用,并且这些部分被称为无序区。
背景技术-表达CRISPR/Cas系统的载体的设计
载体设计的概述
为了使用CRISPR/Cas系统进行基因编辑,在本领域广泛使用如下方法,该方法将具有编码CRISPR/Cas系统的各个组分的序列的载体引入细胞中,从而使CRISPR/Cas系统的各个组分在细胞中表达。下文将描述使CRISPR/Cas系统能够在细胞中得以表达的载体的组分。
编码CRISPR/Cas系统的组分的核酸
由于载体的目的是在细胞中表达CRISPR/Cas系统的各个组分,因此载体的序列可包括编码CRISPR/Cas系统的各个组分的一种或多种核酸。具体而言,载体的序列包括编码引导RNA和/或Cas蛋白的核酸,这些核酸被包含在待表达的CRISPR/Cas系统中。本文中,载体的序列可包括编码经工程化的Cas12f1引导RNA和经密码子优化的Cas蛋白的核酸,或者根据目的编码经工程化的Cas蛋白的核酸,以及编码野生型引导RNA和野生型Cas蛋白的核酸。本文中,编码每个组分的核酸序列可以是DNA序列。
调节/控制元件
为了在细胞中表达组分,载体需要包含一个或多个调节/控制元件。具体而言,调节/控制元件可包括但不限于启动子、增强子、内含子、多腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体、2A序列和/或复制起点。本文中,复制起点可以是但不限于f1复制起点、SV40复制起点、pMB1复制起点、腺病毒复制起点、AAV复制起点和/或BBV复制起点。
启动子
为了使载体在细胞中表达其靶标,启动子序列需要与编码各组分的序列可操作地连接,以便转录因子可在细胞中被激活。启动子序列可以根据相应的转录因子或表达环境进行不同的设计,并且不受限制,只要它可以在细胞中恰当地表达CRISPR/Cas系统的组分即可。启动子序列可以是促进RNA聚合酶(例如,RNA Pol I、Pol II或Pol III)活化的启动子。例如,启动子可以是但不限于选自以下启动子的其中之一:SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复序列(LTR)启动子、腺病毒主要晚期启动子(Ad MLP)、单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子如CMV立即早期启动子区(CMVIE)、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等,Nature Biotechnology 20,497-500(2002))、增强型U6启动子(如Xia等,Nucleic Acids Res.2003Sep 1:31(17))、人H1启动子(H1)和7SK启动子。
终止信号
诱导转录因子的转录活性终止的序列被称为终止信号。终止信号可以根据启动子序列的类型而变化。例如,当启动子是U6或H1启动子时,启动子识别胸苷重复序列(例如TTTTTT(T6)序列)作为终止信号。
额外表达的元件
需要时,除了野生型CRISPR/Cas系统和/或经工程化的CRISPR/Cas系统的组分之外,载体可包含编码本领域技术人员意图表达的额外地表达的元件的核酸序列。例如,额外地表达的元件可为“标签”部分中描述的标签之一,但不限于此。例如,额外地表达的元件可以是可具有期望的额外功能的基因,例如用于选择的选择标记,例如,除草剂(如草甘膦、草铵膦或草丁膦)抗性基因以及抗生素(如氨苄青霉素、卡那霉素、G418、博来霉素、潮霉素和氯霉素)抗性基因,但不限于此。
表达载体的形式
表达载体可设计成线性或环状载体的形式。
现有技术的局限
由于CRISPR/Cas12f1系统具有相对较小的尺寸,对于基因编辑技术来说是有吸引力的系统。自首次报道以来(Harrington等,Programmed DNA destruction by miniatureCRISPR-Cas14 enzymes,Science 362,839-842(2018)),已经对其进行了几项相关研究(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018),US 2020/0190494 A1)。然而,CRISPR/Cas12f1系统在细胞(例如真核细胞)中没有或显示出极低的基因编辑活性,这是其利用的障碍。
作为继续研究的结果,近期文献((Takeda等,Structure of the miniature typeV-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))揭示了如下事实,Cas12f1蛋白在CRISPR/Cas12f1系统中形成二聚体,并揭示了其引导RNA的结构。先前的文献发现,在引导RNA中存在所谓的无序区,该区不与Cas12f1蛋白直接相互作用。在另一篇先前的文献中(Xiao等,Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease,bioRxiv(2020)),移除了无序区,并在体外研究了该系统的双链DNA切割效率。然而,1)先前的研究没有显示细胞内的基因编辑活性,也与增加细胞内的基因编辑活性(例如插入缺失产生效率)的方法无关,2)在这些研究中,存在移除无序区的实验,然而据报道,在该实验中,切割活性甚至有所降低;此外,3)上述研究中进行的实验是在体外进行的,且未能揭示哪些修饰表现出细胞内的基因编辑活性或提高效率。
因此,增强CRISPR/Cas12f1系统的细胞内的基因编辑活性仍然是重要任务。
经工程化的Cas12f1引导RNA的特征
经工程化的Cas12f1引导RNA的概述
在本公开中,提供了通过克服现有技术的限制来增加CRISPR/Cas12f1系统的细胞内基因编辑活性的经工程化的Cas12f1引导RNA。经工程化的Cas12f1引导RNA是天然存在的引导RNA的修饰形式,其结构被部分修饰。经工程化的Cas12f1引导RNA的特征在于,用于与Cas12f1蛋白相互作用的支架区的至少一部分得到修饰。
在实施方式中,经工程化的Cas12f1引导RNA可包括经工程化的支架区和间隔区。本文中,经工程化的支架区的特征在于与天然存在的引导RNA的支架区不同。
经工程化的Cas12f1引导RNA的特征-支架区的一个或多个部分被修饰
本文提供的经工程化的Cas12f1引导RNA的特征在于,与天然存在的引导RNA相比,其支架区的一部分被修饰。支架区是包含tracrRNA和部分crRNA的区域,并且具有与Cas12f1蛋白相互作用的功能。下面将更详细地描述支架区。
在实施方式中,经工程化的Cas12f1引导RNA可包括经工程化的支架区。本文中,经工程化的支架区是通过对天然存在的引导RNA的支架区进行修饰而获得的。因此,经工程化的支架区具有与天然存在的引导RNA的支架区不同的序列。在实施方式中,经工程化的支架区可以通过移除天然存在的引导RNA的支架区的一部分来获得。在实施方式中,经工程化的支架区可以通过从天然存在的引导RNA的支架区中包含的特定部分移除一个或多个核苷酸来获得。
经工程化的Cas12f1引导RNA的作用
当将本文提供的经工程化的Cas12f1引导RNA用于CRISPR/Cas12f1系统时,与使用天然存在的引导RNA时相比,该系统在细胞中的基因编辑活性显著提高。本发明人通过实验详细揭示了需要向天然存在的引导RNA中添加哪些组分、或者需要向其支架区施用哪些修饰,以提高其基因编辑效率。通过克服现有技术的限制,使用经工程化的Cas12f1引导RNA使得能够高效地在细胞中编辑基因。此外,经工程化的Cas12f1引导RNA具有等于或短于天然存在的引导RNA的长度,并因此在基因编辑技术领域具有很高的应用潜力。本申请的经工程化的Cas12f1引导RNA使得能够在基因编辑技术中充分利用CRISPR/Cas12f1系统的优势(例如,具有非常小的尺寸优势)。
经工程化的Cas12f1引导RNA的用途
本文提供的经工程化的Cas12f1引导RNA可与Cas12f1蛋白一起用于基因编辑和/或基因治疗。此外,经工程化的Cas12f1引导RNA可用于制备用于基因编辑的组合物。
术语解释-关于Cas12f1引导RNA的部分的术语
Cas12f1引导RNA的部分-概述
本领域技术人员众所周知的是,天然存在的Cas12f1引导RNA分为tracrRNA和crRNA,其中crRNA进一步分为crRNA重复序列部分和间隔区。
除了上述标准之外,在本公开中,与Cas12f1蛋白相互作用的Cas12f1引导RNA的部分统称为支架区。支架区包括tracrRNA和crRNA的一部分,并且可能不是指单个RNA分子。支架区可以进一步细分为第一区域、第二区域、第三区域、第四区域、第五区域和第六区域(图1)。当相对于tracrRNA和crRNA来描述细分的区域时,tracrRNA包括第一区域至第四区域,而crRNA、特别是crRNA重复序列部分包括第五区域至第六区域。
如下所述的“第n区域”或“天然存在的第n区域”(n是介于1和6之间的整数,包括端值)是指天然存在的Cas12f1引导RNA的各部分。具体而言,“第n区域”可以指对应于在原核细胞中转录的引导RNA的结构和/或实际在原核系统中运行的引导RNA结构的各个区域(其在原核细胞中处于激活形式而不是转录形式)。与上述分类标准相对应的经工程化的Cas12f1引导RNA中的区域通常被描述为“经修饰的第n区域”或“经工程化的支架区的第n区域”。
然而,可能存在经工程化的支架区中包含的第n区域没有被修饰的情况,并因此与天然存在的第n区域相同,并且只有在这种情况下,术语“第n区域”可以互换使用。本文中,应该根据上下文适当解释“第n区域”所指的是什么(例如,它是包含在经工程化的Cas12f1引导RNA中的区域还是包含在天然存在的引导RNA中的区域)。
tracrRNA,crRNA
如本文所用,术语“tracrRNA”和“crRNA”包括可由CRISPR/Cas技术领域的技术人员认可的所有含义。这些术语通常用于指代天然存在的双引导RNA分子的各自的分子,并且还可用于指代其中tracrRNA和crRNA通过接头连接的单引导RNA的各自的对应部分。除非另有规定,在仅被写成“tracrRNA”和“crRNA”的情况下,这些术语分别指构成CRISPR/Cas12f1系统的tracrRNA和crRNA。
在实施方式中,tracrRNA的序列可以是
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:1)或
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:2)。在实施方式中,tracrRNA包括第一区域、第二区域、第三区域和第四区域。在实施方式中,tracrRNA为其中第一区域、第二区域、第三区域和第四区域以5’至3’的方向彼此顺序连接的那个。
在实施方式中,crRNA的序列包括crRNA重复序列和间隔区序列。本文中,crRNA重复序列可以是5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)或5′-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:4)。crRNA重复序列包括第五区域和第六区域。间隔区序列可以根据靶序列而变化,并且通常包含10个核苷酸至50个核苷酸。在实施方式中,crRNA为其中第五区域、第六区域和间隔区以5’至3’的方向彼此顺序连接的那个。
支架区-概述
如本文所用,术语“支架区”统指除间隔区之外的天然存在的引导RNA的其余部分。具体来讲,支架区包括tracrRNA和部分crRNA。具体来讲,部分crRNA可能是crRNA重复序列部分。支架区通常指能够与Cas蛋白相互作用的部分。在本公开中,支架区被分为第一区域至第六区域以用于描述,并且各区域将在下文中更详细地介绍。
支架区1-第一区域
如本文所用,术语“第一区域”是指包含tracrRNA的5′端的区域。第一区域可能包括在CRISPR/Cas12f1复合物中形成茎结构的核苷酸,并且可包括与其相邻的核苷酸。
第一区域包括茎1部分(Takeda等,Structure of the miniature type V-FCRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))。第一区域可包括与茎1部分相邻的一个或多个核苷酸。
第一区域包括不与CRISPR/Cas12f1复合物中的Cas12f1蛋白相互作用的无序区。
在实施方式中,第一区域可指从由SEQ ID NO:1或SEQ ID NO:2示出的tracrRNA的5’端起的第1个核苷酸至第11个核苷酸。在实施方式中,第一区域的序列可以是5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)。
支架区2-第二区域
如本文所用,术语“第二区域”是指位于tracrRNA中第一区域的3′端的区域。第二区域包括在CRISPR/Cas12f1复合物中形成茎结构的核苷酸,且可包括与其相邻的核苷酸。本文中,茎结构与包括在第一区域中的茎不同。
第二区域包括茎2部分(Takeda等,Structure of the miniature type V-FCRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))。第二区域可包括与茎2部分相邻的一个或多个核苷酸。
第二区域可以包含一个或多个核苷酸,所述核苷酸在CRISPR/Cas12f1复合物中与形成二聚体的一个Cas12f1蛋白的RuvC结构域和/或形成二聚体的另一Cas12f1蛋白的RuvC结构域相互作用。第二区域包括不与CRISPR/Cas12f1复合物中的Cas12f1蛋白相互作用的无序区。
在实施方式中,第二区域可指从由SEQ ID NO:1或SEQ ID NO:2示出的tracrRNA的5’端起的第22个核苷酸至第72个核苷酸。在实施方式中,第二区域的序列可以是
支架区3-第三区域
如本文所用,术语“第三区域”是指位于tracrRNA中第二区域3′端的区域。第三区域可包括在CRISPR/Cas12f1复合物中形成茎结构的核苷酸,以及与crRNA中包括的一些核苷酸形成互补键的核苷酸,并且可包括与其相邻的核苷酸。
第三区域包含属于tracrRNA的核苷酸,位于茎4部分(Takeda等,Structure ofthe miniature type V-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))以及茎3-PK(R:AR-1)部分(T(Takeda等,Structure of the miniature type V-FCRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))。第三区域可以包含与茎4部分和/或茎3-PK(R:AR-1)部分中的属于tracrRNA的核苷酸相邻的一个或多个核苷酸。
第三区域包括一个或多个核苷酸,所述核苷酸与CRISPR/Cas12f1复合物中的形成二聚体的一个Cas12f1蛋白的RuvC结构域和/或WED结构域相互作用。此处,核苷酸可以是在茎3-PK(R:AR-1)部分中的属于tracrRNA的核苷酸。
第三区域包含一个或多个核苷酸,所述核苷酸与CRISPR/Cas12f1复合物中形成二聚体的一个Cas12f1蛋白的RuvC结构域和/或形成二聚体的另一个Cas12f1蛋白的REC结构域相互作用。此处,核苷酸可以是来自茎4部分的核苷酸。
第三区域可包含与crRNA的第六区域中所含的一个或多个核苷酸互补结合的一个或者多个核苷酸。
在实施方式中,第三区域可以指从由SEQ ID NO:1或SEQ ID NO:2示出的tracrRNA的5’端起的第72个核苷酸至第127个核苷酸。在实施方式中,第三区域的序列可以是
支架区4-第四区域
如本文所用,术语“第四区域”是指位于tracrRNA中第三区域3′端的区域。第四区域可包括能够与CRISPR/Cas12f1复合物中的crRNA中的一些核苷酸形成互补键的核苷酸,并且可包括与其相邻的核苷酸。
第四区域包含位于茎5(R:AR-2)中的属于tracrRNA的核苷酸(Takeda等,Structure of the miniature type V-F CRISPR-Cas effector enzyme,Molecular Cell81,1-13(2021))。第四区域可包括与茎5(R:AR-2)中的属于tracrRNA的核苷酸相邻的一个或多个核苷酸。
第四区域包括与CRISPR/Cas12f1复合物中形成二聚体的一个Cas12f1蛋白的ZF结构域和/或WED结构域相互作用的一个或多个核苷酸。此处,核苷酸可以是在茎5(R:AR-2)中的属于tracrRNA的核苷酸。
第四区域可包括与crRNA的第五区域中包含的一个或多个核苷酸互补结合的一个或者多个核苷酸。第四区域包括不与CRISPR/Cas12f1复合物中的Cas12f1蛋白相互作用的无序区。
在实施方式中,第四区域可以指从由SEQ ID NO:1示出的tracrRNA的5’端起的第128个核苷酸至第140个核苷酸。在实施方式中,第四区域可以指从由SEQ ID NO:2示出的tracrRNA的5’端起的第128个核苷酸至第162个核苷酸。
在实施方式中,第四区域的序列可以是5′-AACAAAUUCAUUU-3′(SEQ ID NO:12)或5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:13)。
支架区5-第五区域
如本文所用,术语“第五区域”是指包含crRNA的5′端的区域。第五区域可包括与CRISPR/Cas12f1复合物中的第四区域的一个或多个核苷酸形成互补键的核苷酸,并且可包括与其相邻的任何核苷酸。
第五区域包含位于茎5(R:AR-2)部分中的属于crRNA的核苷酸(Takeda等,Structure of the miniature type V-F CRISPR-Cas effector enzyme,Molecular Cell81,1-13(2021))。第五区域可包括与茎5(R:AR-2)部分中的属于crRNA的核苷酸相邻的一个或多个核苷酸。
第五区域包含一个或多个核苷酸,所述核苷酸与CRISPR/Cas12f1复合物中形成二聚体的一个Cas12f1蛋白的ZF结构域、REC结构域和/或WED结构域相互作用。此处,核苷酸可以是在茎5(R:AR-2)中的属于crRNA的核苷酸。
第五区域可包括与第四区域中包含的一个或多个核苷酸互补结合的一个或者多个核苷酸。第五区域包括在CRISPR/Cas12f1复合物中不与Cas12f1蛋白相互作用的无序区。
在实施方式中,第五区域可以指从由SEQ ID NO:3示出的crRNA的5’端起的第1个核苷酸至第10个核苷酸。在实施方式中,第五区域可以指从由SEQ ID NO:4示出的crRNA的5’端起的第1个核苷酸至第30个核苷酸。在实施方式中,第五区域的序列可以是5′-GAAUGAAGGA-3′(SEQ ID NO:14)或5′-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:15)。
支架区6-第六区域
如本文所用,术语“第六区域”是指位于crRNA中第五区域3′端的区域。第六区域可包括与CRISPR/Cas12f1复合物中第三区域的一个或多个核苷酸形成互补键的核苷酸,并且可包括与其相邻的任何核苷酸。
第六区域包含位于茎3-PK(R:AR-1)部分中的属于crRNA的核苷酸(Takeda等,Structure of the miniature type V-F CRISPR-Cas effector enzyme,Molecular Cell81,1-13(2021))。第六区域可包括与茎3-PK(R:AR-1)部分中的属于crRNA的核苷酸相邻的任何一个或多个核苷酸。
第六区域包含与CRISPR/Cas12f1复合物中形成二聚体的一个Cas12f1蛋白的RuvC结构域、ZF结构域和/或WED结构域相互作用的一个或多个核苷酸。此处,核苷酸可以是在茎3-PK(R:AR-1)中的属于crRNA的核苷酸。
在实施方式中,第六区域可指从由SEQ ID NO:3示出的crRNA的5’端起的第11个核苷酸至第17个核苷酸。在实施方式中,第六区域可指从由SEQ ID NO:4示出的crRNA的5’端起的第31个核苷酸至第37个核苷酸。在实施方式中,第六区域的序列可以是5′-AUGCAAC-3′。
间隔区
如本文所用,术语“间隔区”是指在CRISPR/Cas12f1系统中与靶序列杂交的一个或多个核苷酸。间隔区是指CRISPR/Cas12f1系统中引导RNA的crRNA的3’端附近的10个至50个连续的核苷酸。间隔区被设计为匹配待使用CRISPR/Cas12f1系统编辑的靶核酸中的靶序列。换句话说,间隔区可以具有不同的序列,这取决于靶核酸的靶序列。
经工程化的支架区-概述
经工程化的支架区的概述
在本公开中,提供了经工程化的支架区,该支架区可以被引入CRISPR/Cas12f1系统以提高其基因编辑效率。经工程化的支架区提高了CRISPR/Cas12f1系统的基因编辑效率,其中使用了经工程化的Cas12f1引导RNA。经工程化的支架区的特征在于,它通过对天然存在的Cas12f1引导RNA的支架区(以下称为天然存在的支架区)中的一个或多个位置进行修饰而获得,并因此在序列和/或结构方面与天然存在的支架区不同。
本文中,经工程化的支架区的功能与天然存在的支架区的功能相同或相似。具体而言,经工程化的支架区具有与CRISPR/Cas12f1复合体中的Cas12f1蛋白二聚体相互作用的功能。
经工程化的支架区包括与天然存在的支架区的相应部分对应的区域。具体而言,经工程化的支架区包括第一区域、第二区域、第三区域、第四区域、第五区域和第六区域,它们分别对应天然存在的支架区中的第一区域至第六区域。
制备单引导RNA的修饰
如本文所提供的,经工程化的Cas12f1引导RNA可以是一个分子的单引导RNA。因此,本文提供的经工程化的支架区可以是天然存在的支架区的经工程化的形式,其中一个或多个相应区域被修饰,此外,tracrRNA的第四区域的3’端和crRNA的第五区域的5’端通过接头连接。
在实施方式中,经工程化的支架区可以是天然存在的支架区的修饰形式,其中一个或多个位置被修饰,并且第四区域的3’端和第五区域的5’端通过接头连接。例如,接头可以是5’-GAAA-3’。
经工程化的支架区1-第一区域的修饰
第一区域的修饰的概述
本文提供的经工程化的支架区可以是天然存在的支架区的修饰形式,其中,第一区域被修饰。
在实施方式中,经工程化的支架区可包括经修饰的第一区域。此处,经修饰的第一区域通过从天然存在的支架区的第一区域移除一个或多个核苷酸而获得。此处,移除的核苷酸是从CRISPR/Cas12f1复合物中形成茎结构的区域中选择的核苷酸。
在实施方式中,在经工程化的Cas12f1引导RNA中包含的经工程化的支架区可是天然存在的支架区的修饰形式,其中,将一个或多个核苷酸从第一区域移除,并且其可以任选地具有除第一区域之外的其他修饰部分。在实施方式中,移除的核苷酸可以是包含在天然存在的第一区域中的于CRISPR/Cas12f1复合物中形成茎结构的部分中的核苷酸。在实施方式中,移除的核苷酸可以是属于天然存在的第一区域中的茎1的核苷酸(Takeda等,Structure of the miniature type V-F CRISPR-Cas effector enzyme,Molecular Cell81,1-13(2021))。在实施方式中,移除的核苷酸可以是在天然存在的第一区域中不与CRISPR/Cas12f1复合物中的Cas12f1蛋白相互作用的核苷酸。
在实施方式中,经修饰的第一区域在3′端包含5′-A-3′的序列。
在实施方式中,经工程化的支架区可以是天然存在的支架区的修饰形式,将第一区域从支架区移除。换句话说,经工程化的支架区可以不包括与天然存在的支架区的第一区域相对应的区域。
第一区域的修饰-移除一些核苷酸
经工程化的支架区的第一区域可以是天然存在的支架区的第一区域的修饰形式,将一个或多个核苷酸从第一区域移除。
在实施方式中,经工程化的支架区的经修饰的第一区域可以是天然存在的支架区的第一区域的修饰形式,将5’端的1个核苷酸至20个核苷酸从第一区域移除。在实施方式中,经修饰的第一区域可以是天然存在的支架区的第一区域的修饰形式,将5’端的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个连续核苷酸从该第一区域移除。在实施方式中,经修饰的第一区域可以是天然存在的支架区的第一区域的修饰形式,将5’端的连续核苷酸从第一区域移除,核苷酸的数量处于在紧邻的上一句所选的两个数字之间的范围内。例如,经修饰的第一区域可以是天然存在的支架区的第一区域的修饰形式,将5’端的1—3个连续核苷酸从第一区域移除。
在实施方式中,经修饰的第一区域包含至少一个核苷酸,其可以是5′-A-3′。
经修饰的第一区域的序列示例
在实施方式中,经修饰的第一区域可选自于由以下所组成的组:5′-A-3′,5′-AA-3′,5′-GAA-3′,
5′-AGAA-3′,5′-GAGAA-3′。5′GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,5′-AAGUGGAGAA-3′(SEQ ID NO:16),
5′-AAAGUGGAGAA-3′(SEQ ID NO:17),5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),
5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),和
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)。
在实施方式中,其中第一区域被修饰的经工程化的支架区的序列包括:
其中以下的序列以5’至3’的方向彼此连接的序列,
选自于由以下所组成的组中序列:5′-A-3′,5′-AA-3′,
5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,以及SEQ ID NO:16至SEQ ID NO:26,
SEQ ID NO:10,
SEQ ID NO:11,和
SEQ ID NO:12;以及
其中SEQ ID NO:14和5′-AUGCAAC-3’以5’至3’的方向彼此连接的序列。
在实施方式中,其中的第一区域被修饰的经工程化的支架区的序列可包括:
选自于由以下所组成的组中的序列:
5′-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:118),
5′-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:119),
5′-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:120),
5′-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:121),
5′-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:122),
5′-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:123),
5′-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:124),
5′-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:125),
5′-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:126),
5′-AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:127),
5′-AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:128),
5′-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:129),
5′-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:130),
5′-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQID NO:131),
5′-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQID NO:132),
5′-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQID NO:133),
5′-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:134),
5′-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:135),
5′-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:136),和
5′-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:137);以及
5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)。
在实施方式中,其中第一区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5’至3’的方向彼此连接的序列,
选自于由以下所组成的组中序列:5′-A-3′,5′-AA-3′,
5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′、以及SEQ ID NO:16至SEQ ID NO:26,
SEQ ID NO:10,
SEQ ID NO:11,和
SEQ ID NO:13;以及
其中SEQ ID NO:15和5’-AUGCAAC-3’以5’至3’的方向彼此连接的序列。
在实施方式中,其中第一区域被修饰的经工程化的支架区的序列可以是其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由以下所组成的组中序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′、以及SEQID NO:16至SEQ ID NO:26,
SEQ ID NO:10,
SEQ ID NO:11,
SEQ ID NO:12,
接头,
SEQ ID NO:14,和
5′-AUGCAAC-3′。
此处,接头为5’-GAAA-3’。
在实施方式中,其中第一区域被修饰的经工程化的支架区可以是选自于由以下所组成的组中的序列:
5′-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:167),
5′-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:168),
5′-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:169),
5′-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:170),
5′-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU UCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:171),
5′-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:172),
5′-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:173),
5′-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:174),
5′-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:175),
5′AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:176),
5′AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:177),
5′-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:178),
5′-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:179),
5′-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:180),
5′-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:181),
5′-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:182),
5′-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:183),
5′-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:184),
5′-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:185),和
5′-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:186)
经工程化的支架区2-第二区域的修饰
第二区域的修饰的概述
本文提供的经工程化的引导RNA中包含的经工程化的支架区可以是天然存在的支架区的修饰形式,其中第二区域被修饰。
在实施方式中,经工程化的支架区可以包括经修饰的第二区域。此处,经修饰的第二区域是天然存在的支架区的第二区域的修饰形式,将一个或多个核苷酸从第二区域移除。此处,移除的核苷酸是从CRISPR/Cas12f1复合物中形成茎结构的区域中选择的核苷酸。
在实施方式中,经工程化的Cas12f1引导RNA中包含的经工程化的支架区可具有天然存在的第二区域的修饰形式,将一个或多个核苷酸从第二区域移除,并且其可以任选地具有除第二区域之外的其他修饰部分。在实施方式中,核苷酸的移除可以发生在天然存在的第二区域中形成茎结构的部分中,其中可将核苷酸以互补对移除。在实施方式中,移除的核苷酸可以是在天然存在的第二区域的部分中包含的核苷酸,该部分形成CRISPR/Cas12f1复合物中的茎结构。在实施方式中,移除的核苷酸可以是天然存在的第二区域中的属于茎2的核苷酸(Takeda等,Structure of the miniature type V-FCRISPR-Cas effectorenzyme,Molecular Cell 81,1-13(2021))。在实施方式中,移除的核苷酸可以是天然存在的第二区域中的不与CRISPR/Cas12f1复合物中的Cas12f1蛋白相互作用的核苷酸。
在实施方式中,经修饰的第二区域在5’端具有5’-CCGCUCAC-3’(SEQ ID NO:432)结构。在实施方式中,经修饰的第二区域在3’端具有5’-UGAGUGAAGG-3’(SEQ ID NO:433)结构。
第二区域的修饰细节1-移除一些核苷酸
经工程化的支架区的第二区域可以是天然存在的支架区的第二区域的修饰形式,将一个或多个核苷酸从第二区域移除。
在实施方式中,经工程化的支架区的经修饰的第二区域可为天然存在的支架区的第二区域的修饰形式,从该第二区域移除1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个或27个连续或非连续核苷酸。在实施方式中,经修饰的第二区域可为天然存在的支架区的第二区域的修饰形式,从该第二区域移除基于SEQ ID NO:10的序列的从5’端起的第12个至第24个核苷酸和/或第27个至第40个核苷酸中的一个或多个核苷酸。在实施方式中,经修饰的第二区域可为天然存在的支架区的如下第二区域,从该第二区域移除基于SEQ ID NO:10的序列的从5’端起的第12个至第24个核苷酸中的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或13个连续核苷酸的区域。在实施方式中,经修饰的第二区域可为天然存在的支架区的第二区域的修饰形式,从该第二区域移除基于SEQ ID NO:10的序列的从5’端起的第27个至第38个核苷酸中的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或14个连续核苷酸。
在实施方式中,经修饰的第二区域序列的特征在于包含至少5′-CCGCUUCAC-3′(SEQ ID NO:432)和5′-UGAGUGAAGG-3′(SEQ ID NO:433)。此处,经修饰的第二区域的序列可以为如下序列,在该序列中5′-CCGCUUCAC-3′(SEQ ID NO:432)和5′-UGAGUGAAGG-3′(SEQID NO:433)以5’至3’的方向彼此顺序连接,其中所述序列可通过适当的中间序列进行连接。例如,所述中间序列可选自于由以下所组成的组:
5′-UUAG-3′,5′-AUUAGU-3′,5′-AAUUAGCU-3′,5′-AAAUUAGACU-3′(SEQ ID NO:57),5′-AAAGUUAGAACU-3′(SEQ ID NO:58),
5′-AAAGCUUAGGAACU-3′(SEQ ID NO:59),
5′-AAAGCUUUAGAGAACU-3′(SEQ ID NO:60),
5′-AAAGCUGUUAGUUAGAACU-3′(SEQ ID NO:61),
5′-AAAGCUGUUAGUAGAACU-3′(SEQ ID NO:62),
5′-AAAGCUGUUUAGAUUAGAACU-3′(SEQ ID NO:63),
5′-AAAGCUGUCUUAGGAUUAGAACU-3′(SEQ ID NO:64),
5′-AAAGCUGUCCUUAGGGAUUAGAACU-3′(SEQ ID NO:65),
5′-AAAAGCUGUCCCUUAGGGGAUUAGAACUU-3′(SEQ ID NO:434),和
5′-CAAAAGCUGUCCCUUAGGGGAUUAGAACUUG-3′(SEQ ID NO:435)。
第二区域的修饰细节2-以互补对移除
第二区域的修饰可以是移除一对或多对核苷酸,所述核苷酸被包含在形成茎结构的部分中并彼此互补结合。
在实施方式中,经修饰的第二区域可以是天然存在的支架区的第二区域,从第二区域移除基于SEQ ID NO:10的序列的从5’端起的第12个至第24个核苷酸和/或第27个至第40个核苷酸的、在CRISPR/Cas12f1复合物中形成互补对的一对或多对核苷酸。
在实施方式中,经修饰的第二区域可以是天然存在的支架区的第二区域的修饰形式,从第二区域移除基于SEQ ID NO:10的序列的从5’端起的第12个至第24个核苷酸和/或第27个至第40个核苷酸的、在CRISPR/Cas12f1复合物中形成互补对的一对或多对核苷酸和/或不形成互补对的一个或多个核苷酸。
在实施方式中,经修饰的第二区域可以是天然存在的支架区的第二区域的修饰形式,从第二区域移除基于SEQ ID NO:10的序列的从5’端起的第12个至第24个核苷酸和/或第27个至第40个核苷酸的、在CRISPR/Cas12f1复合物中形成互补对的一对或多对核苷酸和/或一对或多对错配的核苷酸对。
经修饰的第二区域的序列的实例
在实施方式中,经修饰的第二区域的序列可以是选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:48),和
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3′(SEQ ID NO:49)。
在实施方式中,其中第二区域被修饰的经工程化的支架区的序列可包括:
其中的以下序列以5’至3’的方向彼此连接的序列,
SEQ ID NO:9,
选自于由SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,和
SEQ ID NO:12;以及
其中SEQ ID NO:14和5’-AUGCAAC-3’以5’至3’的方向彼此连接的序列。
在实施方式中,其中第二区域被修饰的经工程化的支架区的序列可包括:
选自于由以下所组成的组中的序列:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:138),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:139),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:140),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:141),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:142),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:143),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:144),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ IDNO:145),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQID NO:146),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:147),和
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:148);以及
SEQ ID NO:3。
在实施方式中,其中第二区域被修饰的经工程化支架区的序列可包括:
其中的以下序列以5’至3’的方向彼此连接的序列:
SEQ ID NO:9,
选自SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431的序列,
SEQ ID NO:11,和
SEQ ID NO:13;以及
其中SEQ ID NO:15和5’-AUGCAAC-3’以5’至3’的方向彼此连接的序列。
在实施方式中,其中第二区域被修饰的经工程化的支架区的序列可以是如下的序列,其中选自SEQ ID NO:9、SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431、SEQ ID NO:11、SEQ ID NO:12、接头、SEQ ID NO:14和5’-AUGCAAC-3’的序列以5’至3’的方向彼此连接。
此处,接头可以为5’-GAAA-3’。
在实施方式中,其中第二区域被修饰的经工程化的支架区的序列可以选自于由如下所组成的组:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:187),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:188),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGCUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:189),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:190),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:191),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:192),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:193),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:194),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:195).
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:196),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:197),和
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:198)。
经工程化的支架区3-第三区域的修饰
本文提供的经工程化的支架的第三区域是含有对DNA切割活性具有关键作用的茎4部分的区域。因此,经工程化的支架的第三区域可以与天然存在的支架区的第三区域相同,或者可以是天然存在的支架区的第三区域(对其修饰至该第三区域的功能不受损的程度)。
经工程化的支架区4-第四区域和第五区域的修饰
第四区域和第五区域的修饰的概述
本文提供的经工程化的支架区可以是天然存在的支架区的修饰形式,其中第四区域和第五区域被修饰。第四区域和第五区域包括彼此杂交以形成CRISPR/Cas12f1复合物中的茎的部分,并因此相应的部分可以被一起修饰以构成经工程化的支架区。
在实施方式中,经工程化的支架区可包括经修饰的第四区域和/或经修饰的第五区域。
经修饰的第四区域的特征在于,它是通过从天然存在的支架区的第四区域移除一个或多个核苷酸而获得的。经修饰的第五区域的特征在于,它是通过从天然存在的支架区的第五区域移除一个或多个核苷酸而获得的。
在实施方式中,经工程化的Cas12f1引导RNA中包含的经工程化的支架区可以是天然存在的支架区的修饰形式,其中从第四区域和/或第五区域移除一个或多个核苷酸。
在实施方式中,经修饰的第四区域在5’端具有5’-AACAAA-3’。在实施方式中,经修饰的第五区域在3’端具有5’-GGA-3’。
第四区域和第五区域的修饰细节1-移除一些核苷酸
经工程化的支架区的第四区域可以是天然存在的支架区的第四区域的修饰形式,从第四区域移除一个或多个核苷酸。经工程化的支架区的第五区域可以是天然存在的支架区的第五区域的修饰形式,从第五区域移除一个或多个核苷酸。
在实施方式中,经工程化的支架区的经修饰的第四区域是天然存在的支架区的第四区域的修饰形式,从第四区域移除1个、2个、3个、4个、5个、6个或7个连续或非连续核苷酸。
在实施方式中,经工程化的支架区的经修饰的第四区域可以是天然存在的支架区的第四区域的修饰形式,从第四区域移除1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个连续或非连续核苷酸。
在实施方式中,经修饰的第四区域可以是天然存在的支架区的第四区域的修饰形式,从第四区域移除基于SEQ ID NO:12的序列的从5’端起的第7个至第13个核苷酸的一个或多个核苷酸。在实施方式中,经修饰的第四区域可以是天然存在的支架区的第四区域的修饰形式,从第四区域移除基于SEQ ID NO:13的序列的从5’端起的第7个至第34个核苷酸中的一个或多个核苷酸。
在实施方式中,经修饰的第四区域的序列至少包含5’-AACAAA-3’。
在实施方式中,经工程化的支架区的经修饰的第五区域可以是天然存在的支架区的第五区域的修饰形式,从第五区域移除1个、2个、3个、4个、5个、6个或7个连续或非连续核苷酸。
在实施方式中,经工程化的支架区的经修饰的第五区域可以是天然存在的支架区的第五区域的修饰形式,从第五区域移除1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个或27个连续或非连续核苷酸。
在实施方式中,经修饰的第五区域可以是天然存在的支架区的第五区域的修饰形式,从第五区域移除基于SEQ ID NO:14的序列的从5’端开的第1个至第7个核苷酸中的一个或多个核苷酸。在实施方式中,经修饰的第五区域可以是天然存在的支架区的第五区域的修饰形式,从第五区域移除基于SEQ ID NO:15的序列的从5’端起的第1个至第27个核苷酸中的一个或多个核苷酸。
在实施方式中,经修饰的第五区域包含5’-GGA-3’。
第四区域和第五区域的修饰细节2-以互补对移除
已知第四区域和第五区域在CRISPR/Cas12复合物中通过彼此互补结合来形成茎。由于第四区域和第五区域的上述修饰受到构成茎的一个或多个核苷酸的影响,可以进行第四区域和第五区域的修饰而以互补对移除构成茎的核苷酸。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:12的序列的从5’端起的第7个至第13个核苷酸和基于SEQ ID NO:14的序列的从5’端起的第1个至第7个核苷酸中的、CRISPR/Cas12f1复合体物中的形成互补对的一对或多对核苷酸。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:12的序列的从5’端起的第7个至第13个核苷酸和基于SEQ ID NO:14的序列的从5’端起的第1个至第7个核苷酸中的、CRISPR/Cas12f1复合物中的形成互补对的一对或多对核苷酸和/或不形成互补对的一个或多个核苷酸。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:12的序列的从5’端起的第7个至第13个核苷酸和基于SEQ ID NO:14的序列的从5’端起的第1个至第7个核苷酸中的、CRISPR/Cas12f1复合物中形成互补对的一对或多对核苷酸和/或一对或多对错配的核苷酸对。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:13的序列的从5’端起的第7个至第34个核苷酸和基于SEQ ID NO:15的序列的从5’端起的第1个至第27个核苷酸中的、CRISPR/Cas12f1复合物中的形成互补对的一对或多对核苷酸。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:13的序列的从5’端起的第7个至第34个核苷酸和基于SEQ IDNO:15的序列的从5’端起的第1个至第27个核苷酸中的、CRISPR/Cas12f1复合物中的形成互补对的一对或多对核苷酸和/或不形成互补对的一个或多个核苷酸。
在实施方式中,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和第五区域的修饰形式,从第四区域和第五区域移除基于SEQ ID NO:13的序列的从5’端起的第7个至第34个核苷酸和基于SEQ ID NO:15的序列的从5’端起的第1个至第27个核苷酸中的、CRISPR/Cas12f1复合物中的形成互补对的一对或多对核苷酸对和/或一对或多对错配的核苷酸对。
经修饰的第四区域和第五区域的序列的实例
在实施方式中,经修饰的第四区域的序列可以选自于由以下所组成的组:5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′,5′-AACAAAUUCA-3′(SEQID NO:66),5′-AACAAAUUCAU-3′(SEQ ID NO:67),和5′-AACAAAUUCAUU-3′(SEQ ID NO:68)。
在实施方式中,经修饰的第四区域的序列可以选自于由以下所组成的组:5′-AACAAA-3′,5′-AACAAAU-3′,
5′-AACAAAUU-3′,5′-AACAAAUUC-3′,5′-AACAAAUUCA-3′(SEQ ID NO:66),
5′-AACAAAUUCAU-3′(SEQ ID NO:67),5′-AACAAAUUCAUU-3′(SEQ ID NO:68),
5′-AACAAAUUCAUUU-3′(SEQ ID NO:69),5′-AACAAAUUCAUUUU-3′(SEQ ID NO:70),5′-AACAAAUUCAUUUUU-3′(SEQ ID NO:71),
5′-AACAAAUUCAUUUUUC-3′(SEQ ID NO:72),
5′-AACAAAUUCAUUUUUCC-3′(SEQ ID NO:73),
5′-AACAAAUUCAUUUUUCCU-3′(SEQ ID NO:74),
5′-AACAAAUUCAUUUUUCCUC-3′(SEQ ID NO:75),
5′-AACAAAUUCAUUUUUCCUCU-3′(SEQ ID NO:76),
5′-AACAAAUUCAUUUUUCCUCUC-3′(SEQ ID NO:77),
5′-AACAAAUUCAUUUUUCCUCUCC-3′(SEQ ID NO:78),
5′-AACAAAUUCAUUUUUCCUCUCCA-3′(SEQ ID NO:79),
5′-AACAAAUUCAUUUUUCCUCUCCAA-3′(SEQ ID NO:80),
5′-AACAAAUUCAUUUUUCCUCUCCAAU-3′(SEQ ID NO:81),
5′-AACAAAUUCAUUUUUCCUCUCCAAUU-3′(SEQ ID NO:82),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUC-3′(SEQ ID NO:83),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCU-3′(SEQ ID NO:84),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUG-3′(SEQ ID NO:85),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGC-3′(SEQ ID NO:86),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCA-3′(SEQ ID NO:87),
5′-AAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC-3′(SEQ ID NO:88),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACA-3′(SEQ ID NO:89)。
在实施方式中,修饰的第五区域的序列可选自于由以下所组成的组:5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′和5′-AAUGAAGGA-3′。
在实施方式中,经修饰的第五区域的序列可选自于由以下所组成的组:5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′,5′-AAUGAAGGA-3′,5′-GAAUGAAGGA-3′(SEQ ID NO:90),5′-CGAAUGAAGGA-3′(SEQ ID NO:91),5′-ACGAAUGAAGGA-3′(SEQ ID NO:92),5′-GACGAAUGAAGGA-3′(SEQ ID NO:93),5′-AGACGAAUGAAGGA-3′(SEQ ID NO:94),5′-UAGACGAAUGAAGGA-3′(SEQ ID NO:95),
5′-AUAGACGAAUGAAGGA-3′(SEQ ID NO:96),
5′-AAUAGACGAAUGAAGGA-3′(SEQ ID NO:97),
5′-GAAUAGACGAAUGAAGGA-3′(SEQ ID NO:98),
5′-CGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:99),
5′-CCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:100),
5′-CCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:101),
5′-ACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:102),
5′-AACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:103),
5′-GAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:104),
5′-AGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:105),
5′-CAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:106),
5′-GCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:107),
5′-UGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:108),和
5′-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:109)。
在实施方式中,其中第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5’至3’的方向彼此连接的序列:
SEQ ID NO:9,
SEQ ID NO:10,
SEQ ID NO:11,和
选自于由以下所组成的组中的序列:5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′和SEQ ID NO:66至SEQ ID NO:68;以及
其中以下的序列以5’至3’的方向彼此连接的序列,
选自于由以下所组成的组中的序列:5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′和5′-AAUGAAGGA-3′,以及
5′-AUGCAAC-3′。
在实施方式中,其中第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
选自于由以下所组成的组中的序列:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3′(SEQID NO:149)。
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAU-3′(SEQID NO:150),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUU-3′(SEQID NO:151),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUC-3′(SEQ ID NO:152),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCA-3′(SEQ ID NO:153),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAU-3′(SEQ ID NO:154),和
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUU-3′(SEQ ID NO:155);以及
选自于由以下所组成的组中的序列:
5′-GGAAUGCAAC-3′,5′-AGGAAUGCAAC-3′,5′-AAGGAAUGCAAC-3′,5′-GAAGGAAUGCAAC-3′,5′-UGAAGGAAUGCAAC-3′,5′-AUGAAGGAAUGCAAC-3′,和5′-AAUGAAGGAAUGCAAC-3′。
在实施方式中,其中第四和第五区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5′至3’的方向彼此连接的序列,
SEQ ID NO:9,
SEQ ID NO:10,
SEQ ID NO:11,以及
选自于由以下所组成的组中的序列:5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′和SEQ ID NO:66至SEQ ID NO:89;以及
其中以下的序列以5′至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′,5′-AAUGAAGGA-3′和SEQ ID NO:90至SEQ IDNO:109,以及
5′-AUGCAAC-3′。
在实施方式中,其中第四区域和第五区域被修饰的经工程化的支架区的序列可以是如下序列,其中以下的序列以5′至3’的方向彼此连接:
SEQ ID NO:9,
SEQ ID NO:10,
SEQ ID NO:11,和
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),和
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116);以及
5′-AUGCAAC-3′。
在实施方式中,其中第四区域和第五区域被修饰的经工程化的支架区可以选自于由以下所组成的组:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3′(SEQ ID NO:199),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUGAAAAGGAAUGCAAC-3′(SEQ ID NO:200),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUGAAAAAGGAAUGCAAC-3′(SEQ ID NO:201),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGAAAGAAGGAAUGCAAC-3′(SEQ ID NO:202),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGAAAUGAAGGAAUGCAAC-3′(SEQ ID NO:203),
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUGAAAAUGAAGGAAUGCAAC-3′(SEQ ID NO:204),和
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGAAAAAUGAAGGAAUGCAAC-3′(SEQ ID NO:205)。
经工程化的支架区5-第六区域的修饰
在本文提供的经工程化的支架中,第六区域是包括属于茎3-PK(R:AR-1)部分中的crRNA的核苷酸的区域。如上所述,第六区域包含与CRISPR/Cas12f1复合物中形成二聚体的一个Cas12f1蛋白的WED结构域、ZF结构域和/或RuvC结构域相互作用的一个或多个核苷酸。经工程化的支架的第六区域可以与天然存在的支架区的第六区域相同,或者可以是将天然存在的支架区的第六区域(对其修饰至该第六区域的功能不受损的程度)。
经工程化的支架区6-各修饰的组合
各修饰的组合的概述
本文提供的经工程化的Cas12f1引导RNA中包含的经工程化的支架区可以是天然存在的支架区的修饰形式,其中组合了针对各区域的一种或多种上述的修饰。
在实施方式中,经工程化的支架区可包括经修饰的第一区域和经修饰的第二区域。
在实施方式中,经工程化的支架区可包括经修饰的第一区域以及经修饰的第四区域和第五区域。
在实施方式中,经工程化的支架区可包括修饰的第二区域以及经修饰的第四区域和第五区域。
在实施方式中,经工程化的支架区可包括经修饰的第一区域、经修饰的第二区域以及经修饰的第四区域和第五区域。
此处,经修饰的区域如上文针对各区域的修饰的部分的描述。
各修饰的组合1-第一区域的修饰和第二区域的修饰
在实施方式中,经工程化的支架区可包括经修饰的第一区域和经修饰的第二区域。此处,经修饰的第一区域包括“经工程化的支架区1-第一区域的修饰”部分中描述的所有修饰。此处,经修饰的第二区域包括“经工程化的支架区2-第二区域的修饰”部分中描述的所有修饰。
在实施方式中,其中第一区域和第二区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5′至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
选自于由SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,和
SEQ ID NO:12;以及
其中SEQ ID NO:14和5′-AUGCAAC-3′以5’至3’的方向彼此连接的序列。
在实施方式中,其中第一区域和第二区域被修饰的经工程化的支架区的序列可包括:
以5’至3’的方向,
5′-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:156);和
5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)。
在实施方式中,其中第一区域和第二区域被修饰的经工程化的支架区的序列可以是其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
选自于由SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,
SEQ ID NO:12,
接头,
SEQ ID NO:14,和
5′-AUGCAAC-3′。
此处,接头为5′-GAAA-3′。
在实施方式中,其中第一区域和第二区域被修饰的经工程化的支架区的序列可以是:
各修饰的组合2-第一区域的修饰以及第四区域和第五区域的修饰
在实施方式中,经工程化的支架区可包括经修饰的第一区域和经修饰的第四区域和第五区域。此处,经修饰的第一区域包括“经工程化的支架区1-第一区域的修饰”部分中描述的所有修饰。此处,经修饰的第四区域和第五区域包括“经工程化的支架区4-第四区域和第五区域的修饰”部分中描述的所有修饰。
在实施方式中,其中第一区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5′至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
SEQ ID NO:10,
SEQ ID NO:11,和
选自于由5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′和SEQ ID NO:66至SEQ ID NO:68所组成的组中的序列;以及
其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′,和5′-AAUGAAGGA-3′所组成的组中的序列,以及
5′-AUGCAAC-3′。
在实施方式中,其中第一区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
以5’至3’的方向,
5′-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3′(SEQ ID NO:157);和
5′-GGAAUGCAAC-3′(SEQ ID NO:160)。
在实施方式中,其中第一区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可以是其中以下的序列以5’至3’的方向彼此连接的以下序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
SEQ ID NO:10,
SEQ ID NO:11,
选自SEQ ID NO:110至SEQ ID NO:116的序列,和
5’-AUGCAAC-3’。
在实施方式中,其中第一区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可以是:
各修饰的组合3-第二区域的修饰以及第四区域和第五区域的修饰
在实施方式中,经工程化的支架区可包括经修饰的第二区域和经修饰的第四区域和第五区域。此处,经修饰的第二区域包括“经工程化的支架区2-第二区域的修饰”部分中描述的所有修饰。此处,经修饰的第四区域和第五区域包括“经工程化的支架区4-第四区域和第五区域的修饰”部分中描述的所有修饰。
在实施方式中,其中第二区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5’至3’的方向彼此连接的序列:
SEQ ID NO:9,
选自于由SEQ ID NO:38至49和SEQ ID NO:430至431所组成的组中的序列,
SEQ ID NO:11,和
选自于由5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′和SEQ ID NO:66至SEQ ID NO:68所组成的组中的序列;以及
其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′和5′-AAUGAAGGA-3′所组成的组中的序列,以及
5′-AUGCAAC-3′。
在实施方式中,其中第二区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可包括:
以5’至3’的方向,
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3′(SEQ ID NO:158);和
5′-GGAAUGCAAC-3′(SEQ ID NO:160)。
在实施方式中,其中第二区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可以是其中以下的序列以5’至3’的方向彼此连接的序列:
SEQ ID NO:9,
选自于由SEQ ID NO:38至SEQ ID NO:49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,
选自于由SEQ ID NO:110至SEQ ID NO:116所组成的组中的序列,以及
5′-AUGCAAC-3′。
在实施方式中,其中第二区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可以是:
各修饰的组合4-第二区域的修饰、第三区域的修饰以及第四区域和第五区域的修
在实施方式中,经工程化的支架区可包括经修饰的第一区域、经修饰的第二区域以及经修饰的第四区域和第五区域。此处,经修饰的第一区域包括“经工程化的支架区1-第一区域的修饰”部分中描述的所有修饰。此处,经修饰的第二区域包括“经工程化的支架区2-第二区域的修饰”部分中描述的所有修饰。此处,经修饰的第四区域和第五区域包括“经工程化的支架区4-第四区域和第五区域的修饰”部分中描述的所有修饰。
在实施方式中,其中第一区域、第二区域以及第四区域和第五区域的序列被修饰的经工程化的支架区的序列可包括:
其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
选自于由SEQ ID NO:38至49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,和
选自于由5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′和SEQ ID NO:66至SEQ ID NO:68所组成的组中的序列,以及
其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′和5′-AAUGAAGGA-3′所组成的组中的序列,以及
5′-AUGCAAC-3′。
在实施方式中,其中第一区域、第二区域以及第四区域和第五区域被修饰的经工程化的支架区可包括:
以5’至3’的方向,
5′-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3′(SEQ ID NO:159);和
5′-GGAAUGCAAC-3′(SEQ ID NO:160)。
在实施方式中,其中第一区域、第二区域以及第四区域和第五区域被修饰的经工程化的支架区可以是其中以下的序列以5’至3’的方向彼此连接的序列:
选自于由以下所组成的组中的序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′和SEQ IDNO:16至SEQ ID NO:26,
选自于由SEQ ID NO:38至49和SEQ ID NO:430至SEQ ID NO:431所组成的组中的序列,
SEQ ID NO:11,
选自于由SEQ ID NO:110至SEQ ID NO:116所组成的组中的序列,以及
5′-AUGCAAC-3′。
在实施方式中,其中第一区域、第二区域以及第四区域和第五区域被修饰的经工程化的支架区的序列可以是
各修饰的组合5-第三区域和第六区域的额外修饰
如上所述,由于第三区域和第六区域也可以在其功能不受损的范围内被修饰,因此本文提供的经工程化的支架区可以是其中除上述的第一区域、第二区域、第四区域和/或第五区域的修饰之外的第三区域和/或第六区域被额外修饰的支架区。
经工程化的支架区7-包含具有同源性的序列
本文提供的经工程化的支架区包含与如下部分描述中的经工程化的支架区(以下称为上述的经工程化的支架区)的序列具有同一性的序列:“经工程化的支架区1-第一区域的修饰”、“经工程化的支架区2-第二区域的修饰”、“经工程化的支架区3-第三区域的修饰”、“经工程化的支架区4-第四区域和第五区域的修饰”以及“经工程化的支架区6-各修饰的组合”。
在实施方式中,经工程化的支架区的序列可为与上述经工程化的支架区的任一序列具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的序列同一性或序列同源性的序列。在实施方式中,支架序列可为如下的序列,该序列与上述经工程化的支架区的任一序列具有以落在选自紧邻的上一句的两个数字之间的范围内的百分比计的相同性。例如,支架序列可以是与上述的经工程化的支架区的任一序列90%至100%相同的序列。
经工程化的Cas12f1引导RNA
经工程化的Cas12f1引导RNA的概述
在本公开中,提供了经工程化的Cas12f1引导RNA,用于提高细胞中的CRISPR/Cas12f1系统的基因编辑效率。经工程化的Cas12f1引导RNA包括经工程化的支架区和间隔区。此处,经工程化的支架可以是上述的“经工程化的支架区”中描述的任一种。
单引导RNA或双引导RNA
经工程化的Cas12f1引导RNA可以是单引导RNA或双引导RNA。双引导RNA是指由tracrRNA和crRNA两个独立的RNA分子组成的引导RNA。单引导RNA是指通过接头将(经工程化的)tracrRNA的3’端和(经工程化的)crRNA的5’端连接形成的分子。换句话说,单引导RNA意指通过接头将第四区域的3’端和第五区域的5’端连接而获得的分子,其中第四区域和第五区域被包含在双引导RNA的经工程化的支架中。此处,经工程化的支架的各部分可包括在“经工程化的支架区”的部分中描述的所有修饰以及其特定的序列。
经工程化的单引导RNA的实例1
在实施方式中,经工程化的Cas12f1引导RNA可以是其中将经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接的引导RNA。
间隔区的长度为10个至50个核苷酸,并且具有与靶序列互补的序列。
经工程化的支架区为如下的支架区,其中,对应于天然存在的支架区的那些区域的第一区域、第二区域、第三区域、第四区域、接头、第五区域和第六区域以5’至3’的方向彼此顺序连接,其中,与天然存在的支架区相比,选自第一区域、第二区域、第四区域和第五区域中的一个或多个的区域被修饰。
例如,当经工程化的支架区的第一区域被修饰时,经修饰的第一区域可以是天然存在的支架区的第一区域的修饰形式,从第一区域移除一个或多个核苷酸。此处,移除的核苷酸可以是属于第一区域中的茎1的核苷酸(Takeda等,Structure of the miniaturetype V-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021))。此处,经修饰的第一区域的序列的特征在于包含5’-A-3’。
例如,当经工程化的支架区的第二区域被修饰时,经修饰的第二区域可以是天然存在的支架区的第二区域的修饰形式,从第二区域移除一个或多个核苷酸。此处,核苷酸的移除可以发生在形成第二区域的茎2结构的部分中(Takeda等,Structure of theminiature type V-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021)),并且形成彼此互补的对的核酸可被以对为单位移除。此处,经修饰的第二区域的序列的特征在于至少包含5′-CCGCUUCAC-3′(SEQ ID NO:432)和5′-UGAGUGAAGG-3′(SEQ ID NO:433)。更具体地,经修饰的第二区域的序列可以如下的序列,其中5′-CCGCUUCAC-3′(SEQ IDNO:432)和5′-UGAGUGAAGG-3′(SEQ ID NO:433)以5’至3’的方向彼此顺序连接,其中,所述序列可以通过适当的中间序列连接。例如,所述中间序列可选自于由以下所组成的组:
5′-UUAG-3′,5′-AUUAGU-3′,5′-AAUUAGCU-3′,
5′-AAAUUAGACU-3′(SEQ ID NO:57),5′-AAAGUUAGAACU-3′(SEQ ID NO:58),
5′-AAAGCUUAGGAACU-3′(SEQ ID NO:59),
5′-AAAGCUUUAGAGAACU-3′(SEQ ID NO:60),
5′-AAAGCUGUUAGUUAGAACU-3′(SEQ ID NO:61),
5′-AAAGCUGUUAGUAGAACU-3′(SEQ ID NO:62),
5′-AAAGCUGUUUAGAUUAGAACU-3′(SEQ ID NO:63),
5′-AAAGCUGUCUUAGGAUUAGAACU-3′(SEQ ID NO:64),
5′-AAAGCUGUCCUUAGGGAUUAGAACU-3′(SEQ ID NO:65),
5′-AAA AGCUGUCCCUUAGGGGAUUAGAACUU-3′(SEQ ID NO:434),和
5′-CAAAAGCUGUCCCUUAGGGGAUUAGAACUUG-3′(SEQ ID NO:435)。
作为另一实例,当经工程化的支架区的第四区域和第五区域被修饰时,经修饰的第四区域和第五区域可以是天然存在的支架区的第四区域和/或第五区域的修饰形式,从第四区域和/或第五区域移除一个或多个核苷酸。此处,核苷酸的移除可发生在第四区域和第五区域中形成茎5(R:AR-2)结构的部分中(Takeda等,Structure of the miniaturetype V-F CRISPR-Cas effector enzyme,Molecular Cell 81,1-13(2021)),并且这种移除可以以彼此互补的成对核苷酸进行。此处,经修饰的第四区域的序列的特征在于至少包含5′-AACAAA-3′。此处,经修饰的第五区域的特征在于至少包含5’-GGA-3’。
经工程化的单引导RNA的实例2
在实施方式中,经工程化的Cas12f1引导RNA可以是如下的引导RNA,其中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接。
间隔区具有10个至50个核苷酸的长度,并且具有与靶序列互补的序列。
经工程化的支架区的序列使得以下的序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)。
选自以下的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID No:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′,
其中,经工程化的支架区的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7)。
经工程化的单引导RNA的实例3
在实施方式中,经工程化的Cas12f1引导RNA可以是如下的引导RNA,其中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接。
间隔区的长度为10个-50个核苷酸,并且具有与靶序列互补的序列。例如,间隔区可具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的长度。
经工程化的支架区的序列使得以下的序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44).
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117),
5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293),
5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294),
5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295),
5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ ID NO:296),
5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297),
5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA一3′(SEQ ID NO:298),
5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′( SEQ ID NO:299),
5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID No:300),
5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301),
5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:302),
5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303),
5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:305),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:306),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:307),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314);以及
5′-AUGCAAC-3′,
此处,经工程化的支架区的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315)。
经工程化的单引导RNA的实例4
在实施方式中,经工程化的Cas12f1引导RNA可以是引导RNA,其中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接。
间隔区的长度为10个-50个核苷酸,并且具有与靶序列互补的序列。例如,间隔区可具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的长度。
经工程化的支架区的序列使得以下的序列以5′至3’的方向彼此顺序连接:
由5’-A-3’示出的第一序列;
由5′-CCGCUUCAC-3′(SEQ ID NO:432)示出的第二序列;
由5′-UUAG-3′示出的第三序列;
由5′-UGAGUGAAGG-3′(SEQ ID NO:433)示出的第四序列;
由5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQID NO:11)示出的第五序列;
由5′-AACAAA-3′示出的第六序列;
接头;
由5′-GGA-3′示出的第七序列;和
由5′-AUGCAAC-3′示出的第八序列。
作为实例,接头可为5′-GAAA-3′。
作为另一实例,接头可选自于由以下所组成的组:
5′-GAAA-3′,5′-UGAAAA-3′,5′-UUGAAAAA-3′,5′-UUCGAAAGAA-3′(SEQ ID NO:425),5′-UUCAGAAAUGAA-3′(SEQ ID NO:426),5′-UUCAUGAAAAUGAA-3′(SEQ ID NO:427),5′-UUCAUUGAAAAAUGAA-3′(SEQ ID NO:428)和5′-UUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:429)。
作为实施方式的具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第九序列:
5′-A-3′,5′-GA-3′,5′-AGA-3′,5′-GAGA-3′,5′-GGAGA-3′,5′-UGGAGA-3′,
5′-GUGGAGA-3′,5′-AGUGGAGA-3′,5′-AAGUGGAGA-3′,
5′-AAAGUGGAGA-3′(SEQ ID NO:27),5′-UAAAGUGGAGA-3′(SEQ ID NO:28),
5′-AUAAAGUGGAGA-3′(SEQ ID NO:29),5′-GAUAAAGUGGAGA-3′(SEQ ID NO:30),
5′-UGAUAAAGUGGAGA-3′(SEQ ID NO:31),
5′-CUGAUAAAGUGGAGA-3′(SEQ ID NO:32),
5′-ACUGAUAAAGUGGAGA-3′(SEQ ID NO:33),
5′-CACUGAUAAAGUGGAGA-3′(SEQ ID NO:34),
5′-UCACUGAUAAAGUGGAGA-3′(SEQ ID NO:35),
5′-UUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:36),和
5′-CUUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:37)。此处,第九序列的3’端可以连接至第一序列的5’端。
作为实施方式的另一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十序列:
5′-A-3′,5′-AA-3′,5′-AAA-3′,5′-AAAG-3′,5′-AAAGC-3′,5′-AAAGCU-3′,5′-AAAGCUG-3′,5′-AAAGCUGU-3′,5′-AAAGCUGUC-3′,
5′-AAAGCUGUCC-3′(SEQ ID NO:52),5′-AAAGCUGUCCC-3′(SEQ ID NO:53),
5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)和5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)。此处,第二序列的3’端和第三序列的5’端可通过第十序列进行连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十一序列:
5′-U-3′,5′-CU-3′,5′-ACU-3′,5′-AACU-3′,5′-GAACU-3′,5′-AGAACU-3′,5′-UAGAACU-3′,5′-UUAGAACU-3′,5′-AUUAGAACU-3′,
5′-GAUUAGAACU-3′(SEQ ID NO:54),5′-GGAUUAGAACU-3′(SEQ ID NO:55),
5′-GGGAUUAGAACU-3′(SEQ ID No:56),5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)和5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。此处,第三序列的3’端和第四序列的5’端可通过第十一序列进行连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含第十序列和第十一序列,所述第十序列选自于由以下所组成的组:
5′-A-3′,5′-AA-3′,5′-AAA-3′,5′-AAAG-3′,5′-AAAGC-3′,5′-AAAGCU-3′,5′-AAAGCUG-3′,5′-AAAGCUGU-3′,5′-AAAGCUGUC-3′,
5′-AAAGCUGUCC-3′(SEQ ID NO:52),5′-AAAGCUGUCCC-3′(SEQ ID NO:53),5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)和5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441);
所述第十一序列选自于由以下所组成的组:
5′-U-3′,5′-CU-3′,5′-ACU-3′,5′-AACU-3′,5′-GAACU-3′,5′-AGAACU-3′,5′-UAGAACU-3′,5′-UUAGAACU-3′,5′-AUUAGAACU-3′,5′-GAUUAGAACU-3′(SEQ ID NO:54),5′-GGAUUAGAACU-3′(SEQ ID NO:55),5′-GGGAUUAGAACU-3′(SEQ ID NO:56),5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)和5′-GGGAUUAGA ACUUG-3′(SEQ ID NO:443)。此处,第二序列的3’端和第三序列的5’端可通过第十序列进行连接,并且第三序列的3’端和第四序列的5’端可通过第十一序列进行连接。
作为实例,当第十序列为5′-A-3′时,第十一序列可为5′-U-3′。作为另一实例,当第十序列为5′-AA-3′时,第十一序列可为5′-CU-3′。作为又一实例,当第十序列为5′-AAA-3′时,第十一序列可为5′-ACU-3′。作为又一实例,当第十序列为5′-AAAG-3′时,第十一序列可为5′-AACU-3′。作为又一实例,当第十序列为5′-AAAGC-3′,第十一序列可为5′-GAACU-3′。作为又一实例,当第十序列为5′-AAAGCU-3′时,第十一序列可为5′-AGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUG-3′,第十一序列可为5′-UAGAACU-3′或5′-UUAGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUGU-3′时,第十一序列可为5′-AUUAGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUGUC-3′时,第十一序列可为5′-GAUUAGAACU-3′(SEQ IDNO:54)。作为又一实例,当第十序列为5′-AAAGCUGUCC-3′(SEQ ID NO:52)时,第十一序列可为5′-GGAUUAGAACU-3′(SEQ ID NO:55)。作为又一实例,当第十序列为5′-AAAGCUGUCCC-3′(SEQ ID NO:53)时,第十一序列可为5′-GGGAUUAGAACU-3′(SEQ ID NO:56)。作为又一实例,当第十序列为5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)时,第十一序列可为5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)。作为又一实例,当第十序列为5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)时,第十一序列可为5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。
作为实施方式的另一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十二序列:5′-U-3′,5′-UU-3′,5′-UUC-3′,5′-UUCA-3′,5′-UUCAU-3′,5′-UUCAUU-3′和5′-UUCAUUU-3′。此处,第六序列的3’端和接头的5’端可通过第十二序列进行连接。
作为实施方式的另一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十三序列:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-UGAA-3′,5′-AUGAA-3′,5′-AAUGAA-3′和5′-GAAUGAA-3′。此处,接头的3’端和第七序列的5’端可通过第十三序列彼此进行连接。
作为实施方式的另一具体实例,经工程化的支架区的序列可额外包含第十二序列和第十三序列,所述第十二序列选自于由以下所组成的组:5′-U-3′,5′-UU-3′,5′-UUC-3′,5′-UUCA-3′,5′-UUCAU-3′,5′-UUCAUU-3′和5′-UUCAUUU-3′,所述第十三序列选自于由以下所组成的组:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-UGAA-3′,5′-AUGAA-3′,5′-AAUGAA-3′和5′-GAAUGAA-3′。此处,第六序列的3’端和接头的5’端可通过第十二序列进行连接,并且接头的3’端和第七序列的5’端可通过第十三序列进行连接。
作为实例,当第十二序列为5′-U-3′时,第十三序列可为5′-A-3′。作为另一实例,当第十二序列为5′-UU-3′时,第十三序列可为5′-AA-3′。作为又一实例,当第十二序列为5′-UUC-3′时,第十三序列可为5′-GAA-3′。作为又一实例,当第十二序列为5′-UUCA-3′时,第十三序列可为5′-UGAA-3′。作为又一实例,当第十二序列为5′-UUCAU-3′时,第十三序列可为5′-AUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUU-3′时,第十三序列可为5′-AAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUU-3′时,第十三序列可为5′-GAAUGAA-3′。
经工程化的单引导RNA的实例5
在实施方式中,经工程化的Cas12f1引导RNA可为如下的引导RNA,其中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接。
间隔区的长度为10个-50个核苷酸,并且具有与靶序列互补的序列。例如,间隔区可具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的长度。
经工程化的支架区的序列使得以下的序列以5’至3’的方向彼此顺序连接:
由5′-A-3′示出的第一序列;
由5′-CCGCUUCAC-3′(SEQ ID NO:432)示出的第二序列;
由5′-UUAG-3′示出的第三序列;
由5′-UGAGUGAAGG-3′(SEQ ID NO:433)示出的第四序列;
由5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQID NO:11)示出的第五序列;
由5′-AACAAA-3′示出的第六序列;
接头;
由5′-GGA-3′示出的第七序列;和
由5′-AUGCAAC-3′示出的第八序列。
在实例中,接头可为5′-GAAA-3′。
作为另一实例,接头可选自于由以下所组成的组:
5′-GAAA-3′,5′-AGAAAG-3′,5′-AAGAAAGU-3′,
5′-CAAGAA AGUU-3′(SEQ ID NO:316),5′-ACAAGAAAGUUG-3′(SEQ ID NO:317),
5′-CACAAGAAAGUUGC-3′(SEQ ID NO:318),
5′-GCACAAGAAAGUUGCA-3′(SEQ ID NO:319),
5′-UGCACAAGAAAGUUGCAG-3′(SEQ ID NO:320),
5′-CUGCACAAGAAAGUUGCAGA-3′(SEQ ID NO:321),
5′-UCUGCACAAGAAAGUUGCAGAA-3′(SEQ ID NO:322),
5′-UUCUGCACAAGAAAGUUGCAGAAC-3′(SEQ ID NO:323),
5′-AUUCUGCACAAGAAAGUUGCAGAACC-3′(SEQ ID NO:324),
5′-AAUUCUGCACAAGAAAGUUGCAGAACCC-3′(SEQ ID NO:325),
5′-CAAUUCUGCACAAGAAAGUUGCAGAACCCG-3′(SEQ ID NO:326),
5′-CCAAUUCUGCACAAGAAAGUUGCAGAACCCGA-3′(SEQ ID No:327),
5′-UCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAA-3′(SEQ ID No:328),
5′-CUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAU-3′(SEQ ID NO:329),
5′-UCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUA-3′(SEQ ID NO:330),
5′-CUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAG-3′(SEQ ID NO:331),
5′-CCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGA-3′(SEQ ID NO:332),
5′-UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAC-3′(SEQ ID NO:333),
5′-UUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACG-3′(SEQ ID NO:334),
5′-UUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGA-3′(SEQ ID NO:335),
5′-UUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAA-3′(SEQ ID NO:336),
5′-UUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAU-3′(SEQ ID NO:337),
5′-AUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUG-3′(SEQ IDNO:338),
5′-CAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGA-3′(SEQ IDNO:339),
5′-UCAUUU UUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQID NO:340),
5′-UCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGA-3′(SEQID NO:341),和
5′-UUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQID NO:342)。
作为实施方式的具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第九序列:5′-A-3′,5′-GA-3′,5′-AGA-3′,5′-GAGA-3′,5′-GGAGA-3′,5′-UGGAGA-3′,5′-GUGGAGA-3′,5′-AGUGGAGA-3′,5′-AAGUGGAGA-3′,
5′-AAAGUGGAGA-3′(SEQ ID NO:27),5′-UAAAGUGGAGA-3′(SEQ ID NO:28),
5′-AUAAAGUGGAGA-3′(SEQ ID NO:29),5′-GAUAAAGUGGAGA-3′(SEQ ID NO:30),
5′-UGAUAAAGUGGAGA-3′(SEQ ID NO:31),
5′-CUGAUAAAGUGGAGA-3′( SEQ ID NO:32),
5′-ACUGAUAAAGUGGAGA-3′(SEQ ID NO:33),
5′-CACUGAUAAAGUGGAGA-3′(SEQ ID NO:34),
5′-UCACUGAUAAAGUGGAGA-3′(SEQ ID NO:35),
5′-UUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:36),和
5′-CUUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:37)。此处,第九序列的3’端可连接至第一序列的5’端。
作为实施方式的另一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十序列:
5′-A-3′,5′-AA-3′,5′-AAA-3′,5′-AAAG-3′,5′-AAAGC-3′,5′-AAAGCU-3′,5′-AAAGCUG-3′,5′-AAAGCUGU-3′,5′-AAAGCUGUC-3′,
5′-AAAGCUGUCC-3′(SEQ ID NO:52),5′-AAAGCUGUCCC-3′(SEQ ID NO:53),5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)和5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)。此处,第二序列的3’端和第三序列的5’端可通过第十序列连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十一序列:5′-U-3′,5′-CU-3′,5′-ACU-3′,5′-AACU-3′,5′-GAACU-3′,5′-AGAACU-3′,5′-UAGAACU-3′,5′-UUAGAACU-3′,5′-AUUAGAACU-3′,5′-GAUUAGAACU-3′(SEQ ID NO:54),5′-GGAUUAGAACU-3′(SEQ ID NO:55),5′-GGGAUUAGAACU-3′(SEQ ID NO:56),5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)和5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。此处,第三序列的3’端和第四序列的5’端可通过第十一序列连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含第十序列和第十一序列,第十序列选自于由以下所组成的组:5′-A-3′,5′-AA-3′,5′-AAA-3′,5′-AAAG-3′,5′-AAAGC-3′,5′-AAAGCU-3′,5′-AAAGCUG-3′,5′-AAAGCUGU-3′,5′-AAAGCUGUC-3′,
5′-AAAGCUGUCC-3′(SEQ ID NO:52),5′-AAAGCUGUCCC-3′(SEQ ID NO:53),
5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)和5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441);第十一序列选自于由以下所组成的组:5′-U-3′,5′-CU-3′,5′-ACU-3′,5′-AACU-3′,5′-GAACU-3′,5′-AGAACU-3′,5′-UAGAACU-3′,5′-UUAGAACU-3′,5′-AUUAGAACU-3′,5′-GAUUAGAACU-3′(SEQ ID NO:54),5′-GGAUUAGAACU-3′(SEQ ID NO:55),5′-GGGAUUAGAACU-3′(SEQ ID NO:56),5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)和5′-GGGAUUAGAACUUG-3′(SEQID NO:443)。此处,第二序列的3’端和第三序列的5’端可通过第十序列连接,并且第三序列的3’端和第四序列的5’端可通过第十一序列连接。
作为实例,当第十序列为5′-A-3′时,第十一序列可为5′-U-3′。作为另一实例,当第十序列为5′-AA-3′时,第十一序列可为5′-CU-3′。作为又一实例,当第十序列为5′-AAA-3′时,第十一序列可为5′-ACU-3′。作为又一实例,当第十序列为5′-AAAG-3′时,第十一序列可为5′-AACU-3′。作为又一实例,当第十序列为5′-AAAGC-3′,第十一序列可为5′-GAACU-3′。作为又一实例,当第十序列为5′-AAAGCU-3′时,第十一序列可为5′-AGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUG-3′,第十一序列可为5′-UAGAACU-3′或5′-UUAGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUGU-3′时,第十一序列可为5′-AUUAGAACU-3′。作为又一实例,当第十序列为5′-AAAGCUGUC-3′时,第十一序列可为5′-GAUUAGAACU-3′(SEQ IDNO:54)。作为又一实例,当第十序列为5′-AAAGCUGUCC-3′(SEQ ID NO:52)时,第十一序列可为5′-GGAUUAGAACU-3′(SEQ ID NO:55)。作为又一实例,当第十序列为5′-AAAGCUGUCCC-3′(SEQ ID NO:53)时,第十一序列可为5′-GGGAUUAGAACU-3′(SEQ ID NO:56)。作为又一实例,当第十序列为5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)时,第十一序列可为5′-GGGAUUAGAACUU-3′(SEQ ID NO:442)。作为又一实例,当第十序列为5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)时,第十一序列可为5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。
作为实施方式的又一具体实例,经工程化的支架区的序列可包含选自于由以下所组成的组中的第十二序列:5′-U-3′,5′-UU-3′,5′-UUC-3′,5′-UUCA-3′,5′-UUCAU-3′,5′-UUCAUU-3′,5′-UUCAUUU-3′,5′-UUCAUUUU-3′,5′-UUCAUUUUU-3′,5′-UUCAUUUUUC-3′(SEQID NO:343),5′-UUCAUUUUUCC-3′(SEQ ID NO:344),5′-UUCAUUUUUCCU-3′(SEQ ID NO:345),5′-UUCAUUUUUCCUC-3′(SEQ ID NO:346),5′-UUCAUUUUUCCUCU-3′(SEQ ID NO:347),5′-UUCAUU UUUCCUCUC-3′(SEQ ID NO:348),
5′-UUCAUUUUUCCUCUCC-3′(SEQ ID NO:349),
5′-UUCAUUUUUCCUCUCCA-3′(SEQ ID NO:350),
5′-UUCAUUUUUCCUCUCCAA-3′(SEQ ID NO:351),
5′-UUCAUUUUUCCUCUCCAAU-3′(SEQ ID NO:352),
5′-UUCAUUUUUCCUCUCCAAUU-3′(SEQ ID NO:353),
5′-UUCAUUUUUCCUCUCCAAUUC-3′(SEQ ID NO:354),
5′-UUCAUUUUUCCUCUCCAAUUCU-3′(SEQ ID NO:355),
5′-UUCAUUUUUCCUCUCCAAUUCUG-3′(SEQ ID NO:356),
5′-UUCAUUUUUCCUCUCCAAUUCUGC-3′(SEQ ID NO:357),
5′-UUCAUUUUUCCUCUCCAAUUCUGCA-3′(SEQ ID NO:358),
5′-UUCAUUUUUCCUCUCCAAUUCUGCAC-3′(SEQ ID NO:359),
5′-UUCAUUUUUCCUCUCCAAUUCUGCACA-3′(SEQ ID NO:360)和
5′-UUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:361)
此处,第六序列的3’端和接头的5’端可通过第十二序列连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含选自于由以下所组成的组中的第十三序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-UGAA-3′,5′-AUGAA-3′,5′-AAUGAA-3′,
5′-GAAUGAA-3′,5′-CGAAUGAA-3′,5′-ACGAAUGAA-3′,
5′-GACGAAUGAA-3′(SEQ ID NO:362),5′-AGACGAAUGAA-3′(SEQ ID NO:363),
5′-UAGACGAAUGAA-3′(SEQ ID NO:364),5′-AUAGACGAAUGAA-3′(SEQ ID NO:365),5′-AAUAGACGAAUGAA-3′(SEQ ID NO:366),
5′-GAAUAGACGAAUGAA-3′(SEQ ID NO:367),
5′-CGAAUAGACGAAUGAA-3′(SEQ ID NO:368),
5′-CCGAAUAGACGAAUGAA-3′(SEQ ID NO:369),
5′-CCCGAAUAGACGAAUGAA-3′(SEQ ID NO:370),
5′-ACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:371),
5′-AACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:372),
5′-GAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:373)。
5′-AGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:374),
5′-CAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:375),
5′-GCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:376),
5′-UGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:377),
5′-UUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:378),和
5′-GUUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:379)。此处,接头的3’端和第七序列的5’端可通过第十三序列连接。
作为实施方式的又一具体实例,经工程化的支架区的序列可额外包含第十二序列和第十三序列,所述第十二序列选自于由以下所组成的组:
5′-U-3′,5′-UU-3′,5′-UUC-3′,5′-UUCA-3′,5′-UUCAU-3′,5′-UUCAUU-3′,
5′-UUCAUUU-3′,5′-UUCAUUUU-3′,5-UUCAUUUUU-3′,
5′-UUCAUUUUUC-3′(SEQ ID NO:343),5′-UUCAUUUUUCC-3′(SEQ ID NO:344),
5′-UUCAUUUUUCCU-3′(SEQ ID NO:345),5′-UUCAUUUUUCCUC-3′(SEQ ID NO:346),5′-UUCAUUUUUCCUCU-3′(SEQ ID NO:347),
5′-UUCAUUUUUCCUCUC-3′(SEQ ID NO:348),
5′-UUCAUUUUUCCUCUCC-3′(SEQ ID NO:349),
5′-UUCAUUUUUCCUCUCCA-3′(SEQ ID NO:350),
5′-UUCAUUUUUCCUCUCCAA-3′(SEQ ID NO:351),
5′-UUCAUUUUUCCUCUCCAAU-3′(SEQ ID NO:352),
5′-UUCAUUUUUCCUCUCCAAUU-3′(SEQ ID NO:353),
5′-UUCAUU UUUCCUCUCCAAUUC-3′(SEQ ID NO:354),
5′-UUCAUUUUUCCUCUCCAAUUCU-3′(SEq ID NO:355),
5′-UUCAUU UUUCCUCUCCAAUUCUG-3′(SEQ ID NO:356),
5′-UUCAUUUUUCCUCUCCAAUUCUGC-3′(SEQ ID NO:357),
5′-UUCAUUUUUCCUCUCCAAUUCUGCA-3′(SEQ ID NO:358),
5′-UUCAUUUUUCCUCUCCAAUUCUGCAC-3′(SEQ ID NO:359),
5′-UUCAU U UUUCCUCUCCAAUUCUGCACA-3′(SEQ ID NO:360)和
5′-UUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:361);第十三序列选自于由以下所组成的组:5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-UGAA-3′,5′-AUGAA-3′,5′-AAUGAA-3′,5′-GAAUGAA-3′,5′-CGAAUGAA-3′,
5′-ACGAAUGAA-3′,5′-GACGAAUGAA-3′(SEQ ID NO:362),
5′-AGACGAAUGAA-3′(SEQ ID NO:363),5′-UAGACGAAUGAA-3′(SEQ ID NO:364),
5′-AUAGACGAAUGAA-3′(SEQ ID NO:365),5′-AAUAGACGAAUGAA-3′(SEQ ID NO:366),5′-GAAUAGACGAAUGAA-3′(SEQ ID NO:367),
5′-CGAAUAGACGAAUGAA-3′(SEQ ID NO:368),
5′-CCGAAUAGACGAAUGAA-3′(SEQ ID NO:369),
5′-CCCGAAUAGACGAAUGAA-3′(SEQ ID NO:370),
5′-ACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:371),
5′-AACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:372),
5′-GAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:373),
5′-AGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:374),
5′-CAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:375),
5′-GCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:376),
5′-UGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:377),
5′-UUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:378)和
5′-GUUGCAGAACCCGAAUAGACGAAUGAA-3′(SEQ ID NO:379)。此处,第六序列的3’端和接头的5’端可通过第十二序列连接,并且接头的3’端和第七序列的5’端可通过第十三序列连接。
作为实例,当第十二序列为5′-U-3′时,第十三序列可为5′-A-3′。作为另一实例,当第十二序列为5′-UU-3′时,第十三序列可为5′-AA-3′。作为又一实例,当第十二序列为5′-UUC-3′时,第十三序列可为5′-GAA-3′。作为又一实例,当第十二序列为5′-UUCA-3′时,第十三序列可为5′-UGAA-3′。作为又一实例,当第十二序列为5′-UUCAU-3′时,第十三序列可为5′-AUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUU-3′时,第十三序列可为5′-AAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUU-3′时,第十三序列可为5′-GAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUU-3′时,第十三序列可为5′-CGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUU-3′时,第十三序列可为5′-ACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUC-3′时,第十三序列可为5′-GACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCC-3′时,第十三序列可为5′-AGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCU-3′时,第十三序列可为5′-UAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUC-3′时,第十三序列可为5′-AUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCU-3′时,第十三序列可为5′-AAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUC-3′时,第十三序列可为5′-GAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCC-3′时,第十三序列可为5′-CGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCA-3′时,第十三序列可为5′-CCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAA-3′时,第十三序列可为5′-CCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAU-3′时,第十三序列可为5′-ACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUU-3′时,第十三序列可为5′-AACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUC-3′时,第十三序列可为5′-GAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCU-3′时,第十三序列可为5′-AGAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCUG-3′时,第十三序列可为5′-CAGAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCUGC-3′时,第十三序列可为5′-GCAGAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCUGCA-3′时,第十三序列可为5′-UGCAGAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCUGCAC-3′时,第十三序列可为5′-UUGCAGAACCCGAAUAGACGAAUGAA-3′。作为又一实例,当第十二序列为5′-UUCAUUUUUCCUCUCCAAUUCUGCACA-3′、或5′-UUCAUUUUUCCUCUCCAAUUCUGCACAA-3′时,第十三序列可为5′-GUUGCAGAACCCGAAUAGACGAAUGAA-3′。
经工程化的单引导RNA序列的实例
在实施方式中,经工程化的单引导RNA可具有选自于由以下所组成的组中的序列:SEQ ID NO:210至SEQ ID NO:258,SEQ ID NO:381至SEQ ID NO:393,SEQ ID NO:396至SEQID NO:407,SEQ ID NO:409至SEQ ID NO:421和SEQ ID NO:436至SEQ ID NO:439。
经工程化的双引导RNA的实例1
在实施方式中,经工程化的Cas12f1引导RNA可包括经工程化的支架区和间隔区。
间隔区的长度为10个-50个核苷酸,并且具有与靶序列互补的序列。例如间隔可具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的长度。
经工程化的支架区的序列包括:
以5’至3’的方向,
经工程化tracrRNA,其中以下的序列彼此连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID No:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID No:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID No:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10):
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11),和
选自于由以下所组成的组中的序列:
5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′,5′-AACAAAUUCA-3′(SEQ ID NO:66),5′-AACAAAUUCAU-3′(SEQ ID NO:67),5′-AACAAAUUCAUU-3′(SEQ ID NO:68)和5′-AACAAAUUCAUUU-3′(SEQ ID NO:12);以及
经工程化的crRNA重复序列部分,其中以下的序列彼此连接:选自于由以下所组成的组中的序列:
5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,
5′-AUGAAGGA-3′,5′-AAUGAAGGA-3′和5′-GAAUGAAGGA-3′(SEQ ID NO:14),和
5’-AUGCAAC-3’;
其中,经工程化的crRNA重复序列部分的3’端连接至间隔区的5’端。
此处,经工程化的tracrRNA的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:1),和/或
经工程化的crRNA重复序列部分不同于5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)。
作为实例,经工程化的tracrRNA的序列可与SEQ ID NO:1的序列相同,且经工程化的crRNA重复序列部分可与SEQ ID NO:3的序列不同。作为另一实例,经工程化的tracrRNA的序列可与SEQ ID NO:1的序列不同,且经工程化的crRNA重复序列部分可与SEQ ID NO:3相同。作为又一实例,经工程化的tracrRNA的序列可与SEQ ID NO:1的序列不同,且经工程化的crRNA重复序列部分可与SEQ ID NO:3的序列不同。
作为实例,当经工程化的tracrRNA包含5′-AACAAA-3′,经工程化的crRNA可包含5′-GGA-3′。作为另一实例,当经工程化的tracrRNA包含5′-AACAAAU-3′时,经工程化的crRNA可包含5′-AGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUU-3′时,经工程化的crRNA可包含5′-AAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUC-3′时,经工程化的crRNA可包含5′-GAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCA-3′(SEQ ID NO:66)时,经工程化的crRNA可包含5′-UGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAU-3′(SEQ ID NO:67)时,经工程化的crRNA可包含5′-AUGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUU-3′(SEQ ID NO:68)时,经工程化的crRNA可包含5′-AAUGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUU-3′(SEQ ID NO:12)时,经工程化的crRNA可包含5′-GAAUGAAGGA-3′(SEQ ID NO:14)。
经工程化的双引导RNA的实例2
在实施方式中,经工程化的Cas12f1引导RNA可包括经工程化的支架区和间隔区。
间隔区的长度为10个-50个核苷酸,并具有与靶序列互补的序列。例如间隔区可具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个或40个核苷酸的长度。
经工程化的支架区的序列包括:
以5’至3’的方向,
经工程化的tracrRNA,其中以下的序列彼此连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11),和
选自于由以下所组成的组中的序列:
5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′,
5′-AACAAAUUCA-3′(SEQ ID NO:66),5′-AACAAAUUCAU-3′(SEQ ID NO:67),
5′-AACAAAUUCAUU-3′(SEQ ID NO:68),5′-AACAAAUUCAUUU-3′(SEQ ID NO:69),
5′-AACAAAUUCAUUUU-3′(SEQ ID NO:70),
5′-AACAAAUUCAUUUUU-3′(SEQ ID NO:71),
5′-AACAAAUUCAUUUUUC-3′(SEQ ID NO:72),
5′-AACAAAUUCAUUUUUCC-3′(sEQ ID NO:73),
5′-AACAAAUUCAUUUUUCCU-3′(SEQ ID NO:74),
5′-AACAAAUUCAUUUUUCCUC-3′(SEQ ID NO:75),
5′-AACAAAUUCAUUUUUCCUCU-3′(SEQ ID NO:76)。
5′-AACAAAUUCAUUUUUCCUCUC-3′(SEQ ID NO:77),
5′-AACAAAUUCAUUUUUCCUCUCC-3′(sEQ ID NO:78),
5′-AACAAAUUCAUUUUUCCUCUCCA-3′(SEQ ID NO:79),
5′-AACAAAUUCAUUUUUCCUCUCCAA-3′(SEQ ID NO:80),
5′-AACAAAUUCAUUUUUCCUCUCCAAU-3′(SEQ ID NO:81),
5′-AACAAAUUCAUUUUUCCUCUCCAAUU-3′(sEQ ID NO:82),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUC-3′(SEQ ID NO:83),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCU-3′(SEQ ID NO:84),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUG-3′(SEQ ID NO:85),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGC-3′(SEQ ID NO:86),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCA-3′(SEQ ID NO:87),
5′-AAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC-3′(SEQ ID NO:88),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACA-3′(SEQ ID NO:89),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:13);以及
crRNA重复序列部分,其中以下的序列彼此连接:
选自于由以下所组成的组中的序列:
5′-GGA-3′,5′-AGGA-3′,5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,
5′-AUGAAGGA-3′,5′-AAUGAAGGA-3′,5′-GAAUGAAGGA-3′(SEQ ID NO:90),
5′-CGAAUGAAGGA-3′(SEQ ID NO:91),5′-ACGAAUGAAGGA-3′(SEQ ID NO:92),
5′-GACGAAUGAAGGA-3′(SEQ ID NO:93),5′-AGACGAAUGAAGGA-3′(SEQ ID NO:94),5′-UAGACGAAUGAAGGA-3′(SEQ ID NO:95),
5′-AUAGACGAAUGAAGGA-3′(SEQ ID NO:96),
5′-AAUAGACGAAUGAAGGA-3′(SEQ ID NO:97),
5′-GAAUAGACGAAUGAAGGA-3′(SEQ ID NO:98),
5′-CGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:99),
5′-CCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:100),
5′-CCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:101),
5′-ACCCGAAUAGACGAAUGAAGGA-3′( SEQ ID NO:102),
5′-AACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:103),
5′-GAACCCGAAUAGACGAAUGAAGGA-3′( SEQ ID NO:104),
5′-AGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:105),
5′-CAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:106),
5′-GCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:107),
5′-UGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:108),
5′-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:109),和
5′-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:15);和
5′-AUGCAAC-3′,
其中,经工程化的crRNA重复序列部分的3’端连接至间隔区的5’端。
此处,经工程化的tracrRNA的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ ID NO:2),和/或
经工程化的crRNA重复序列部分不同于:5′-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:4)。
作为实例,经工程化的tracrRNA的序列可与SEQ ID NO:2的序列相同,且经工程化的crRNA重复序列部分可与SEQ ID NO:4的序列不同。作为另一实例,经工程化的tracrRNA的序列可与SEQ ID NO:2的序列不同,且经工程化的crRNA重复序列部分可与SEQ ID NO:4的序列相同。作为又一实例,经工程化的tracrRNA的序列可与SEQ ID NO:2的序列不同,且经工程化的crRNA重复序列部分可与SEQ ID NO:4的序列相同。
作为实例,当经工程化的tracrRNA包含5′-AACAAA-3′,经工程化的crRNA可包含5′-GGA-3′。作为另一实例,经当工程化的tracrRNA包含5′-AACAAAU-3′时,经工程化的crRNA可包含5′-AGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUU-3′时,经工程化的crRNA可包含5′-AAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUC-3′时,经工程化的crRNA可包含5′-GAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCA-3′(SEQ ID NO:66)时,经工程化的crRNA可包含5′-UGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAU-3′(SEQ ID NO:67)时,经工程化的crRNA可包含5′-AUGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUU-3′(SEQ ID NO:68)时,经工程化的crRNA可包含5′-AAUGAAGGA-3′。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUU-3′(SEQ ID NO:69)时,经工程化的crRNA可包含5′-GAAUGAAGGA-3′(SEQ ID NO:90)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUU-3′(SEQ ID NO:70)时,经工程化的crRNA可包含5′-CGAAUGAAGGA-3′(SEQ ID NO:91)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUU-3′(SEQID NO:71)时,经工程化的crRNA可包含5′-ACGAAUGAAGGA-3′(SEQ ID NO:92)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUC-3′(SEQ ID NO:72)时,经工程化的crRNA可包含5′-GACGAAUGAAGGA-3′(SEQ ID NO:93)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCC-3′(SEQ ID NO:73)时,经工程化的crRNA可包含5′-AGACGAAUGAAGGA-3′(SEQ ID NO:94)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCU-3′(SEQ ID NO:74)时,经工程化的crRNA可包含5′-UAGACGAAUGAAGGA-3′(SEQ ID NO:95)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUC-3′(SEQ ID NO:75)时,经工程化的crRNA可包含5′-AUAGACGAAUGAAGGA-3′(SEQ ID NO:96)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCU-3′(SEQ ID NO:76)时,经工程化的crRNA可包含5′-AAUAGACGAAUGAAGGA-3′(SEQ ID NO:97)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUC-3′(SEQID NO:77)时,经工程化的crRNA可包含5′-GAAUAGACGAAUGAAGGA-3′(SEQ ID NO:98)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCC-3′(SEQ IDNO:78)时,经工程化的crRNA可包含5′-CGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:99)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCA-3′(SEQ ID NO:79)时,经工程化的crRNA可包含5′-CCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:100)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAA-3′(SEQ ID NO:80)时,经工程化的crRNA可包含5′-CCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:101)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAU-3′(SEQ ID NO:81)时,经工程化的crRNA可包含5′-ACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:102)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUU-3′(SEQ ID NO:82)时,经工程化的crRNA可包含5′-AACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:103)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUC-3′(SEQ ID NO:83)时,经工程化的crRNA可包含5′-GAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:104)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUCU-3′(SEQ ID NO:84)时,经工程化的crRNA可包含5′-AGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:105)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUG-3′(SEQ ID NO:85)时,经工程化的crRNA可包含5′-CAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:106)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGC-3′(SEQ ID NO:86)时,经工程化的crRNA可包含5′-GCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:107)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCA-3′(SEQ ID NO:87)时,经工程化的crRNA可包含5′-UGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:108)。作为又一实例,当经工程化的tracrRNA包含5′-AAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC-3′(SEQ ID NO:88)时,经工程化的crRNA可包含5′-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:109)。作为又一实例,当经工程化的tracrRNA包含5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACA-3′(SEQ ID NO:89)或5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3′(SEQ IDNO:13)时,经工程化的crRNA可包含5′-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:15)。
经工程化的CRISPR/Cas12f1复合物
CRISPR/Cas12f1复合物的概述
在本公开中,提供了经工程化的CRISPR/Cas12f1复合物。经工程化的CRISPR/Cas12f1复合物包括Cas12f1蛋白和经工程化的Cas12f1引导RNA。此处,经工程化的Cas12f1引导RNA如“经工程化的Cas12f1引导RNA”部分所述。
在实施方式中,本文提供了能够编辑包含靶序列的核酸的经工程化的CRISPR/Cas12f1复合物,该复合物包含Cas12f1蛋白和经工程化的Cas12f1引导RNA。此处,经工程化的Cas12f1引导RNA可以是“经工程化的Cas12f1引导RNA”部分中描述的任何一种。
Cas12f1蛋白-概述
本文提供的经工程化的CRISPR/Cas12f1复合物包含Cas12f1蛋白。Cas12f1蛋白基本上可为自然界中存在的野生型Cas12f1蛋白。编码Cas12f1蛋白的序列可为针对野生型Cas12f1蛋白的人密码子优化的Cas12f1序列。此外,所述Cas12f1蛋白可具有与自然界中存在的野生型Cas12f1蛋白相同的功能。然而,除非另有限定,如本文所用,术语“Cas12f1蛋白”不仅可以指野生型或密码子优化的Cas12f1蛋白,还可以指经修饰的Cas12f1蛋白或Cas12f1融合蛋白。此外,所述“Cas12f1蛋白”不仅可统指具有与自然界中存在的野生型Cas12f1蛋白相同功能的Cas12f1蛋白,还可统指功能全部或部分被修饰的Cas12f1蛋白、全部或部分功能丧失的Cas12f1蛋白、和/或添加了额外功能的Cas12f1蛋白。“Cas12f1蛋白”的含义可根据上下文进行适当解释,并且除非有特殊情况,否则以最广义解释。在下文中,将详细描述Cas12f1蛋白的结构或功能。
Cas12f1蛋白-野生型Cas12f1蛋白
本文提供的经工程化的CRISPR/Cas12f1复合物可包含Cas12f1蛋白。
在实施方式中,所述Cas12f1蛋白可为野生型Cas12f1蛋白。在实施方式中,所述Cas12f1蛋白可由Cas14家族衍生而来(Harrington等,Programmed DNA destruction byminiature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。在实施方式中,所述Cas12f1蛋白可为由未培养的古细菌衍生而来的Cas14a蛋白(Harrington等,ProgrammedDNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。在实施方式中,所述Cas12f1蛋白可为Cas14a1蛋白。
Cas12f1蛋白-经修饰的Cas12f1蛋白
本文提供的经工程化的CRISPR/Cas12f1复合物可包含经修饰的Cas12f1蛋白。经修饰的Cas12f1是指野生型或密码子优化的Cas12f1蛋白的序列的修饰形式,其中的至少一部分被修饰。Cas12f1蛋白的修饰可在其单个氨基酸单元、或其功能结构域单元进行。
在实施方式中,蛋白质的修饰可通过在野生型或密码子优化的Cas12f1蛋白的序列中的一个或多个氨基酸、肽、多肽、蛋白质和/或结构域的单独取代、缺失和/或添加来进行。在实施方式中,所述Cas12f1蛋白可为其RuvC结构域包含一个或多个氨基酸、肽和/或多肽的取代、缺失和添加的野生型Cas12f1蛋白。
Cas12f1蛋白-Cas12f1融合蛋白
本文提供的经工程化的CRISPR/Cas12f1复合物可包含Cas12f1融合蛋白。此处,Cas12f1融合蛋白是指其中野生型或经修饰的Cas12f1蛋白与额外的氨基酸、肽、多肽、蛋白质和/或结构域融合的蛋白。
在实施方式中,Cas12f1蛋白可为野生型Cas12f1蛋白与碱基编辑器和/或逆转录酶融合的蛋白。在实施方式中,所述碱基编辑器可为腺苷脱氨酶和/或胞苷脱氨酶。在实施方式中,所述逆转录酶可为莫洛尼鼠白血病病毒(M-MLV)逆转录酶和/或其变体。此处,与所述逆转录酶融合的Cas12f1蛋白可充当先导编辑器。
在实施方式中,Cas12f1蛋白可为野生型Cas12f1蛋白与能够参与细胞内基因表达过程的各种酶融合的蛋白。此处,与所述酶融合的Cas12f1蛋白可能会造成细胞中基因表达的各种量和质的变化。在实施方式中,所述酶可为VP64、DNMT、TET、KRAB、DHAC、LSD和/或p300。
Cas12f1蛋白-功能改变
本文提供的经工程化的CRISPR/Cas12f1复合物中包含的Cas12f1蛋白可具有与野生型Cas12f1蛋白相同的功能。本文提供的经工程化的CRISPR/Cas12f1复合物中包含的Cas12f1蛋白与野生型Cas12f1蛋白相比可具有改变的功能。具体而言,所述改变可为全部或部分功能的修饰、全部或部分功能的丧失和/或增加额外功能。在实施方式中,所述Cas12f1蛋白不受特别限制,只要可由本领域技术人员将这种改变应用于CRISPR/Cas系统的Cas蛋白即可。此处,可以使用本领域中已知的技术进行改变。
在实施方式中,所述Cas12f1蛋白可以是改变的Cas12f1蛋白,以仅切割靶核酸的双链中的一条链。此外,Cas12f1蛋白可以是改变的Cas12f1蛋白,以使得其能够仅切割靶核酸的双链中的一条链,并对未切割的链进行碱基编辑或先导编辑。在实施方式中,Cas12f1蛋白可以是改变的Cas12f1蛋白,使得其不能切割靶核酸的双链中的任一条链。此外,Cas12f1蛋白可以是改变的Cas12f1蛋白,使得其不能切割靶核酸的双链中的任一条链,并且可针对所述靶核酸实施碱基编辑、先导编辑或基因表达调控功能。
Cas12f1蛋白-其它修饰的实例
在实施方式中,所述Cas12f1蛋白可包含核定位序列(NLS)或核输出序列(NES)。具体而言,所述NLS可为“术语的定义”中NLS部分中示例的NLS中的任一种,但不限于此。在实施方式中,所述Cas12f1蛋白可包含标签。具体而言,所述标签可为“术语的定义”的标签部分中示例的标签中的任一种,但不限于此。
Cas12f1蛋白-PAM序列
CRISPR/Cas12f1复合物切割靶基因或靶核酸需要两个条件。
首先,靶基因或靶核酸中必须有Cas12f1蛋白可识别的具有一定长度的核苷酸序列。此处,由Cas12f1蛋白识别的特定长度的核苷酸序列被称为原间隔邻近基序(PAM)序列。PAM序列是根据Cas12f1蛋白确定的独特序列。其次,在所述具有一定长度的PAM序列周围,必须有能够与引导RNA中包含的间隔区序列互补结合的序列。
当满足这两个条件时,即1)Cas12f1蛋白识别特定长度的PAM序列,以及2)间隔区序列部分与PAM序列周围的序列互补结合,Cas12f1蛋白质/引导RNA复合物(CRISPR/Cas12f1复合物)切割靶基因或靶核酸。因此,当确定CRISPR/Cas12f1复合物的靶序列时,存在如下限制:靶序列必须在与PAM序列相邻的序列内确定。
Cas12f1蛋白-PAM序列的实例
在实施方式中,Cas12f1蛋白的PAM序列可为富含T的序列。在实施方式中,Cas12f1蛋白的PAM序列可以是5’至3’方向的THTN。此处,N可为脱氧胸苷(T)、脱氧腺苷(A)、脱氧胞苷(C)或脱氧鸟苷(G)中的一种,并且H可为脱氧胸苷(T)、脱氧腺苷(A)和脱氧胞苷(C)中的一种。在实施方式中,Cas12f1蛋白的PAM序列可为处于5’至3’方向的TTTN。此处,N为脱氧胸苷(T)、脱氧腺苷(A)、脱氧胞苷(C)或脱氧鸟苷(G)中的一种。在实施方式中,Cas12f1蛋白的PAM序列可为处于5’至3’方向的TTTA、TTTT、TTTC或TTTG。在实施方式中,Cas12f1蛋白的PAM序列可为处于5’至3’方向的TATA、TATT、TATC或TATG。在实施方式中,Cas12f1蛋白的PAM序列可为处于5’至3’方向的TCTA、TCTT、TCTC或TCTG。在实施方式中,Cas12f1蛋白的PAM序列可为处于5’至3’方向的TTTA或TTTG。在实施方式中,Cas12f1蛋白的PAM序列可不同于野生型Cas12f1蛋白的PAM序列。
Cas12f1蛋白-序列的实例
在实施方式中,所述Cas12f1蛋白可具有选自于由SEQ ID NO:259至SEQ ID NO:266所组成的组中的氨基酸序列。
在实施方式中,编码所述Cas12f1蛋白的DNA序列可为人密码子优化的序列。
在实施方式中,编码所述Cas12f1蛋白的DNA序列可为选自于由SEQ ID NO:267至SEQ ID NO:276所组成的组中的DNA序列。
经工程化的Cas12f1引导RNA
本文提供的构成CRISPR/Cas12f1复合物的经工程化的Cas12f1引导RNA具有和“经工程化的Cas12f1引导RNA”部分所述的相同的特征和结构。
CRISPR/Cas12f1复合物-结构的实例
在实施方式中,Cas12f1蛋白可以具有选自SEQ ID NO:259至SEQ ID NO:262的氨基酸序列,并且经工程化的Cas12f1引导RNA可以具有选自于由SEQ ID NO:210至SEQ IDNO:258、SEQ ID NO:381至SEQ ID NO:393、SEQ ID NO:396至SEQ ID NO:407和SEQ ID NO:409至SEQ ID NO:421所组成的组中的序列。此处,Cas12f1蛋白和经工程化的Cas12f1引导RNA可以结合形成CRISPR/Cas12f1复合物。
在实施方式案中,Cas12f1蛋白可以具有选自于由SEQ ID NO:263至SEQ ID NO:266所组成的组中的氨基酸序列,并且经工程化的Cas12f1引导RNA可以具有选自SEQ IDNO:210至SEQ ID NO:258、SEQ ID NO:381至SEQ ID NO:393、SEQ ID NO:396至SEQ ID NO:407和SEQ ID NO:409至SEQ ID NO:421的序列。此处,由Cas12f1蛋白与经工程化的Cas12f1引导RNA结合形成的CRISPR/Cas12f1复合物可具有碱基编辑功能。
用于表达CRISPR/Cas12f1系统的各组分的载体
载体的概述
在本公开中,提供了用于表达CRISPR/Cas12f1系统的组分的载体。构建载体以表达Cas12f1蛋白和/或经工程化的Cas12f1引导RNA。载体的序列可以包括编码CRISPR/Cas12f1系统的组分之一的核酸序列,或者可以包括编码其两个或更多个组分的核酸序列。载体的序列包括编码Cas12f1蛋白的核酸序列和/或编码经工程化的Cas12f1引导RNA的核酸序列。载体的序列包括一个或多个启动子序列。启动子与编码Cas12f1蛋白的核酸序列和/或编码经工程化的Cas12f1引导RNA的核酸序列可操作地连接,从而使得可以促进核酸序列在细胞中的转录。Cas12f1蛋白具有与“经工程化的CRISPR/Cas12f1复合物”部分中描述的Cas12f1蛋白、经修饰的Cas12f1蛋白和/或Cas12f1融合蛋白具有相同的特征和结构。经工程化的Cas12f1引导RNA具有与“经工程化的Cas12f1引导RNA”部分所述的经工程化的Cas12f1引导RNA相同的特征和组成。
载体的序列可以包括编码Cas12f1蛋白的核酸序列和/或编码经工程化的Cas12f1引导RNA的核酸序列。在实施方式中,载体的序列可包含第一序列和第二序列,第一序列包含编码Cas12f1蛋白的核酸序列,第二序列包含编码经工程化的Cas12f1引导RNA的核酸序列。载体的序列包括用于在细胞中表达编码Cas12f1蛋白的核酸序列的启动子序列和用于在细胞内表达编码经工程化的Cas12f1引导RNA的核酸序列的启动子序列,其中启动子各自可操作地连接至待表达的每个靶标。在实施方式中,载体的序列可以包括可操作地连接到第一序列的第一启动子序列和可操作地连接到第二序列的第二启动子序列。
载体的序列可以包括编码Cas12f1蛋白的核酸序列和/或编码两种或更多种彼此不同的经工程化的Cas12f1引导RNA的核酸序列。在实施方式中,载体的序列可以包括第一序列、第二序列和第三序列,第一序列包含编码Cas12f1蛋白的核酸序列,第二序列包含编码第一经工程化的Cas12f1引导RNA的核酸序列,第三序列包含编码第二经工程化的Cas12f1引导RNA的核酸序列。此外,载体的序列可以包括可操作地连接到第一序列的第一启动子序列、可操作地连接到第二序列的第二启动子序列和可操作地连接到第三序列的第三启动子序列。
在载体中,编码各个组分的核酸序列可以是DNA序列。
待表达的靶标-Cas12f1蛋白
所述载体可以被构建为表达Cas12f1蛋白。此处,Cas12f1蛋白可具有与“经工程化的CRISPR/Cas12f1复合物”部分中描述的各蛋白相同的结构和特征。
在实施方式中,可以构建载体以表达野生型Cas12f1蛋白。此处,野生型Cas12f1蛋白可以是Cas14a1。在实施方式中,可以构建载体以表达经改变的Cas12f1蛋白,使其仅切割靶核酸的双链中的一条链。此外,经修饰的Cas12f1蛋白可以是经改变的Cas12f1蛋白,使其能够仅切割靶核酸的双链中的一条链,并且能够对未切割的链进行碱基编辑或先导编辑。在实施方式中,Cas12f1蛋白可以被改变,以使其不能切割靶核酸的双链中的任一条链。此外,Cas12f1蛋白可以被改变,以使其不能切割靶核酸的双链中的任一条链,并且能够针对靶核酸实施碱基编辑、先导编辑或调节基因表达的功能。
待表达的靶标-经工程化的Cas12f1引导RNA
载体可以被构建为表达经工程化的Cas12f1引导RNA。经工程化的Cas12f1引导RNA可能具有与“经工程化的Cas12f1引导RNA”部分中所述的经工程化的Cas12f1引导RNA相同的特征和组成。该载体可以被构建为表达两种或更多种彼此不同的经工程化的Cas12f1引导RNA。
待表达的靶标-额外组分
所述载体可以被构建为表达除了上述待表达的靶标之外的额外组分,例如NLS和标签蛋白。在实施方式中,额外组分可以独立于Cas12f1蛋白、经修饰的Cas12f1蛋白和/或经工程化的Cas12f1引导RNA而被表达。在另一实施方式中,额外的组分可以与Cas12f1蛋白、经修饰的Cas12f1蛋白质和/或经工程化的Cas12f1引导RNA一起表达。此处,额外组分可以是通常用于表达CRISPR/Cas系统时而被表达的组分。在这方面,可以参考现有技术。额外组分可以是“背景技术-表达CRISPR/Cas系统的载体的设计”部分中描述的一个或多个组分。
载体的组分-表达Cas12f1蛋白的序列
载体序列可包含编码Cas12f1蛋白的核酸序列。此处,Cas12f1蛋白可具有与“经工程化的CRISPR/Cas12f1复合物”部分中描述的每一个的结构和特征相同的结构和特征。
在实施方式中,载体的序列可包含编码野生型Cas12f1蛋白的序列。此处,野生型Cas12f1蛋白可为Cas14a1。在实施方式中,载体的序列可包含编码Cas12f1蛋白的人密码子优化的核酸序列。此处,编码Cas12f1蛋白的人密码子优化的核酸序列可为编码Cas14a1蛋白的人密码子优化的核酸序列。在实施方式中,载体的序列可包含编码经修饰的Cas12f1蛋白或Cas12f1融合蛋白的序列。在实施方式中,载体的序列可包含编码Cas12f1融合蛋白的序列,所述Cas12f1融合蛋白被改变使得能够仅切割靶核酸的双链中的一条链,并且可针对未切割的链进行碱基编辑或先导(prime)编辑。在实施方式中,载体的序列可以包括编码Cas12f1融合蛋白的序列,该融合蛋白被改变,使得其不能切割靶核酸的双链中的任一条链,并且能够针对未切割的链实施碱基编辑、先导编辑或调节基因表达的功能。
载体的组分-表达经工程化的Cas12f1引导RNA的序列
在实施方式中,载体的序列可以包括编码经工程化的Cas12f1引导RNA的序列。例如,载体的序列可以包括选自于由SEQ ID NO:210至SEQ ID NO:258、SEQ ID NO:381至SEQID NO:393、SEQ ID NO:395至SEQ ID NO:407、SEQ ID NO:409至SEQ ID NO:421和SEQ IDNO:436至SEQ ID NO:439所组成的组中的序列。
在实施方式中,载体的序列可以包括编码两个或更多个彼此不同的经工程化的Cas12f1引导RNA的序列。例如,所述载体的序列可以包括编码第一经工程化的Cas12f1引导RNA的序列和编码第二经工程化的Cas12f1引导RNA的序列,所述序列各自选自于由SEQ IDNO:210至SEQ ID NO:258、SEQ ID NO:381至SEQ ID NO:393、SEQ ID NO:395至SEQ ID NO:407、SEQ ID NO:409至SEQ ID NO:421和SEQ ID NO:436至SEQ ID NO:439所组成的组。
载体的组分-启动子序列
载体序列可包含与编码各组分的序列可操作地连接的启动子序列。具体而言,所述启动子序列可为“背景技术-表达CRISPR/Cas系统的载体的设计”部分的启动子部分中公开的启动子之一,但不限于此。
在实施方式中,载体序列可包含编码Cas12f1蛋白的序列和启动子序列。此处,所述启动子序列可操作地连接至编码Cas12f1蛋白的序列。在实施方式中,载体序列可包含编码经工程化的Cas12f1引导RNA的序列和启动子序列。此处,所述启动子序列可操作地连接至编码经工程化的Cas12f1引导RNA的序列。在实施方式中,载体序列可包含编码Cas12f1蛋白的序列、编码经工程化的Cas12f1引导RNA的序列和启动子序列。此处,所述启动子序列可操作地连接至编码Cas12f1蛋白的序列以及编码经工程化的Cas12f1引导RNA的序列,其中由所述启动子序列激活的转录因子引起所述Cas12f1蛋白和所述经工程化的Cas12f1引导RNA的表达。
载体的组分-可包含两个或更多个启动子序列
在实施方式中,载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码经工程化的Cas12f1引导RNA的第二序列以及第二启动子序列。此处,第一启动子序列可操作地连接至第一序列,第二启动子序列可操作地连接至第二序列,第一序列的转录由第一启动子序列诱导,其中第二序列的转录由第二启动子序列诱导。此处,第一启动子和第二启动子可为相同类型的启动子。此处,第一启动子和第二启动子可为不同类型的启动子。
在实施方式中,载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码第一经工程化的Cas12f1引导RNA的第二序列、第二启动子序列、编码第二经工程化的Cas12f1引导RNA的第三序列以及第三启动子序列。此处,第一启动子序列可操作地连接至第一序列,第二启动子序列可操作地连接至第二序列,并且第三启动子序列可操作地连接至第三序列,其中第一序列的转录由第一启动子序列诱导,第二序列的转录由第二启动子序列诱导,并且第三序列的转录由第三启动子序列诱导。此处,第二启动子和第三启动子可为相同类型的启动子。具体而言,第二启动子序列和第三启动子序列可为U6启动子序列,但不限于此。此处,第二启动子和第三启动子可为不同类型的启动子。具体而言,第二启动子序列可为U6启动子序列,并且第三启动子序列可为H1启动子序列,但这些启动子不限于此。
载体的组分-终止信号
载体可包含与启动子序列可操作地连接的终止信号。此处,终止信号可为在“背景技术-表达CRISPR/Cas系统的载体的设计”部分的终止信号部分中公开的终止信号之一,但不限于此。终止信号可根据启动子序列的类型而异。
在实施方式中,当载体序列包含U6启动子序列时,与U6启动子序列可操作地连接的胸苷重复序列可充当终止信号。在实施方式中,所述胸苷重复序列可为其中五个以上的胸苷连续连接的序列。在实施方式中,当载体序列包含H1启动子序列时,与H1启动子序列可操作地连接的胸苷重复序列可充当终止信号。在实施方式中,所述胸苷重复序列可为其中五个以上的胸苷连续连接的序列。
载体的组分-其它组分
除了上述组分之外,载体序列可包含根据目的所需的组分。
在实施方式中,载体序列可包含调节/控制组分的序列和/或额外组分的序列。在实施方式中,为了区分转染细胞和非转染细胞的目的,可添加额外组分。此处,所述调节/控制元件的每一个序列和额外组分可为“背景技术-表达CRISPR/Cas系统的载体的设计”中公开的那些中的一种,但不限于此。
载体的类型-病毒载体
载体可为病毒载体。
在实施方式中,所述病毒载体可为选自于由以下所组成的组中的至少一种:逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒。在实施方式中,所述病毒载体可为腺相关病毒。
载体的类型-非病毒载体
载体可为非病毒载体。在实施方式中,非病毒载体可为选自于由以下所组成的组中的一种或多种:质粒、噬菌体、裸DNA、DNA复合物和mRNA。在实施方式中,质粒可选自于由以下所组成的组:pcDNA系列、pSC101、pG1796、pACYC177、ColE1、pKT230、pME290、pBR322、pUC8/9、pUC6、pBD9、pHC79、pIJ61、pLAFR1、pHV14、pGEX系列、pET系列和pUC19。在实施方式中,噬菌体可选自于由以下所组成的组:λgt4λB、λ-Charon、λΔz1和M13。在实施方式中,载体可为PCR扩增子。
载体形式-环状载体或线性载体
载体可为环状或线性形式。当载体为线性载体时,即使线性载体序列不单独包含终止信号,RNA转录在其3’端终止。相比之下,当载体为环状载体时,除非环状载体序列单独包含终止信号,否则RNA转录不终止。因此,当载体以环状载体的形式使用时,必须包含对应于与每个启动子序列相关的转录因子的终止信号,以使载体表达预期的靶标。
在实施方式中,载体可为线性载体。在实施方式中,载体可为线性扩增子。在实施方式中,所述载体可为包含选自于由如下所组成的组中的序列的线性载体:SEQ ID NO:267至SEQ ID NO:276和SEQ ID NO:210至SEQ ID NO:258,SEQ ID NO:381至SEQ ID NO:393,SEQ ID NO:396至SEQ ID NO:407,和SEQ ID NO:409至SEQ ID NO:421。在实施方式中,载体可为环状载体。在实施方式中,所述载体可为包含选自于由如下所组成的组中的序列的环状载体:SEQ ID NO:267至SEQ ID NO:276和SEQ ID NO:210至SEQ ID NO:258,SEQ ID NO:381至SEQ ID NO:393,SEQ ID NO:396至SEQ ID NO:407,和SEQ ID NO:409至SEQ ID NO:421。
载体-序列的实例
在实施方式中,所述载体序列可包含选自于由SEQ ID NO:267-276、SEQ ID NO:210-258、SEQ ID NO:381-393、SEQ ID NO:396-407、和SEQ ID NO:409-421所组成的组中的序列。
核酸的化学修饰
在本公开中,提供了包含如下核酸或由如下核酸组成的组分,和/或用于表达CRISPR/Cas12f1系统的组分的载体,所述核酸例如经工程化的crRNA或编码其的核酸、经工程化的Cas12f1引导RNA或编码其的核酸。此处,组分中的“核酸”可为自然界中存在的DNA或RNA,或可为其中的组成核酸的部分或全部被化学修饰的经修饰的核酸。在实施方式中,所述组成核酸可为自然界中存在的DNA和/或RNA。在实施方式中,所述组成核酸可为其中一个或多个核苷酸被化学修饰的核酸。此处,所述化学修饰包括本领域技术人员已知的所有核酸修饰。具体而言,所述化学修饰可包括WO 2019/089820 A1中描述的所有核酸修饰,但不限于此。
使用经工程化的Cas12f1引导RNA的基因编辑方法
基因编辑方法的概述
如本文所公开的,提供了使用经工程化的crRNA在靶细胞中编辑靶基因或靶核酸的方法。所述靶基因或靶核酸包含靶序列。所述靶核酸可为单链DNA、双链DNA和/或RNA。所述基因编辑方法包括:将经工程化的Cas12f1引导RNA和Cas12f1蛋白、或者编码所述经工程化的Cas12f1引导RNA和所述Cas12f1蛋白中的每一个的核酸递送到包含靶基因或靶核酸的靶细胞中。因此,将经工程化的CRISPR/Cas12f1复合物引入所述靶细胞中,或诱导所述经工程化的CRISPR/Cas12f1复合物的形成,使得通过所述经工程化的CRISPR/Cas12f1复合物对靶基因进行编辑。所述经工程化的Cas12f1引导RNA具有与“经工程化的Cas12f1引导RNA”部分中描述的特征和结构相同的特征和结构。所述Cas12f1蛋白具有与“经工程化的CRISPR/Cas12f1复合物”部分中描述的Cas12f1蛋白和/或经修饰的Cas12f1蛋白相同的特征和结构。
在实施方式中,基因编辑方法可以包括将Cas12f1蛋白或编码其的核酸、以及经工程化的Cas12f1引导RNA或编码其的核酸递送到靶细胞中。
此处,经工程化的Cas12f1引导RNA可以包括经工程化的支架区和间隔区。
此处,经工程化的支架区具与上述任一个的“经工程化的支架区”部分中所述的每个支架区相同的特征和结构。作为实例,经工程化的支架区可以通过选自于由SEQ ID NO:167至SEQ ID NO:186所组成组中的序列表示。作为另一实例,经工程化的支架区可以通过选自于由SEQ ID NO:187至SEQ ID NO:198所组成的组中的序列表示。在另一实例中,经工程化的支架区可以通过选自于由SEQ ID NO:199至SEQ ID NO:205所组成的组中的序列表示。作为又一实例,经工程化的支架区可以通过选自于由SEQ ID NO:206至SEQ ID NO:209所组成的组中的序列表示。
此处,间隔区序列可以与靶细胞中包括的靶基因或靶核酸互补结合。
靶细胞
在实施方式中,靶细胞可以是原核细胞。在实施方式中,靶细胞可以是真核细胞。具体而言,真核细胞可以是但不限于植物细胞、动物细胞和/或人类细胞。
靶序列的确定
可考虑基因编辑的目的、靶细胞的环境、由Cas12f1蛋白识别的PAM序列和/或其它变量来确定待通过CRISPR/Cas12f1复合物编辑的靶基因或核酸和靶序列。此处,只要可确定具有适当长度的靶序列,确定靶序列的方法就不受特别限制,并且可将本领域已知的技术用于此。
根据靶序列确定间隔区序列
一旦确定了靶序列,相应的间隔区序列就被设计。所述间隔区序列被设计为能够与靶序列互补结合的序列。在实施方式中,所述间隔区序列可被设计为能够与靶基因互补结合的序列。在实施方式中,所述间隔区序列可被设计为能够与靶核酸互补结合。在实施方式中,所述间隔区序列可被设计为与包含在靶核酸的靶链序列中的靶序列互补的序列。在实施方式中,所述间隔区序列被设计为对应于如下的RNA序列:包含在靶核酸的非靶链序列中的原间隔区的DNA序列。具体而言,除了核苷酸序列中所含的各胸苷被置换为尿苷之外,所述间隔区序列被设计为具有与原间隔区序列相同的核苷酸序列。
在实施方式中,间隔区具有10个至50个核苷酸的长度。例如,间隔区具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸的长度。优选地,间隔区具有17个、18个、19个、20个、21个、22个、23个、24个或25个核苷酸的长度。
靶序列和间隔区序列之间的互补性
在实施方式中,所述间隔区序列可与靶序列互补60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在实施方式中,所述间隔区序列可为与靶序列在紧邻的前一句中选择的数值之间的范围内互补的序列。作为实例,所述间隔区序列可为与靶序列60%-90%互补的序列。作为另一实例,所述间隔区序列可为与靶序列90%-100%互补的序列。
靶序列和间隔区序列之间的错配数
在实施方式中,间隔区序列可为与靶序列互补的序列,并与靶序列具有0个、1个、2个、3个、4个、5个、6个、7个、8个、9个或10个错配。在实施方式中,间隔区序列可具有在紧邻的前一句中选择的数值范围内的错配。作为实例,间隔区序列可与靶序列具有0个、1个、2个、3个、4个或5个错配。作为另一实例,间隔区序列可与靶序列具有6个-10个错配。
CRISPR/Cas12f1复合物的用途
本文提供的基因编辑方法利用所述经工程化的CRISPR/Cas12f1复合物具有以靶特异性方式切割基因或核酸的活性这一事实。所述经工程化的CRISPR/Cas12f1复合物与“经工程化的CRISPR/Cas12f1复合物”部分中描述的经工程化的CRISPR/Cas12f1复合物具有相同的特征和组成。
将CRISRP/Cas12f1复合物的各组分递送至细胞中
本文提供的基因编辑方法包括使经工程化的CRISPR/Cas12f1复合物与靶细胞中的靶基因或靶核酸接触。因此,为了诱导经工程化的CRISPR/Cas12f1复合物以与靶基因或靶核酸接触,所述基因编辑方法包括:将经工程化的CRISPR/Cas12f1复合物的各组分递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将经工程化的Cas12f1引导RNA和Cas12f1蛋白递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将编码经工程化的Cas12f1引导RNA和Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将经工程化的Cas12f1引导RNA和编码Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将编码经工程化的Cas12f1引导RNA的核酸和编码Cas12f1蛋白的核酸递送到靶细胞中。可使用各种递送方法以各种递送形式将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送到靶细胞中。
递送形式-RNP
作为递送形式,可使用其中经工程化的Cas12f1引导RNA和Cas12f1蛋白彼此结合的核糖核蛋白颗粒(RNP)。在实施方式中,所述基因编辑方法可包括将其中经工程化的Cas12f1引导RNA和Cas12f1蛋白彼此结合的CRISPR/Cas12f1复合物引入靶细胞中。
递送形式-非病毒载体
作为另一递送形式,可使用包含编码经工程化的Cas12f1引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体。在实施方式中,所述基因编辑方法可包括将包含编码经工程化的Cas12f1引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体引入靶细胞中。具体而言,所述非病毒载体可为质粒、裸DNA、DNA复合物或mRNA,但不限于此。在另一实施方式中,所述基因编辑方法包括将包含编码经工程化的Cas12f1引导RNA的核酸序列的第一非病毒载体和包含编码Cas12f1蛋白的核酸序列的第二非病毒载体引入靶细胞中。具体而言,第一非病毒载体和第二非病毒载体各自可为选自于由质粒、裸DNA、DNA复合物和mRNA所组成的组中的一种,但不限于此。
递送形式-病毒载体
作为另一递送形式,可使用包含编码经工程化的Cas12f1引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的病毒载体。在实施方式中,基因编辑方法可包括将病毒载体引入靶细胞,所述病毒载体包含编码经工程化的Cas12f1引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列。具体而言,所述病毒载体可为选自逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒中的一种,但不限于此。在实施方式中,所述病毒载体可为腺相关病毒。
在另一实施方式中,所述基因编辑方法可包括:将包含编码经工程化的Cas12f1引导RNA的核酸序列的第一病毒载体和包含编码Cas12f1蛋白的核酸序列的第二病毒载体引入靶细胞中。具体而言,第一病毒载体和第二病毒载体各自可为选自逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒中的一种,但不限于此。
递送方法-一般递送方式
只要其能够以适当的递送形式将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送到细胞中,递送方法不受特别限制。在实施方式中,所述递送方法可为电穿孔、基因枪法、超声穿孔、磁转染和/或瞬时细胞压缩或挤压。
递送方法-纳米颗粒
所述递送方法可为使用纳米颗粒递送CRISPR/Cas12f1系统中所含的至少一种组分。此处,递送方法可为本领域的已知方法,其能够由本领域技术人员恰当选择。例如,纳米颗粒递送方法可为WO 2019/089820A1中公开的方法,但不限于此。
在实施方式中,所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码其的核酸和/或经工程化的Cas12f1引导RNA或编码其的核酸。在实施方式中,所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码其的核酸、第一经工程化的Cas12f1引导RNA或编码其的核酸、和/或第二经工程化的引导RNA或编码其的核酸。此处,所述递送方法可为阳离子脂质体法、乙酸锂-二甲基亚砜(DMSO)法、脂质介导的转染、磷酸钙沉淀法、脂质转染、聚乙烯亚胺(PEI)介导的转染、二乙氨基乙基(DEAE)-葡聚糖介导的转染和/或纳米颗粒介导的核酸递送(参见Panyam等,Adv Drug Deliv Rev.,2012年9月13,pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023),但不限于此。此处,CRISPR/Cas12f1系统的组分可处于RNP、非病毒载体和/或病毒载体的形式。例如,CRISPR/Cas12f1系统的组分各自可处于编码各组分的mRNA的形式,但不限于此。
递送形式和方法-可能的组合
所述基因编辑方法包括:将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送到细胞中,其中,各组分的递送形式和/或递送方法可彼此相同也可不同。在实施方式中,所述基因编辑方法可包括:以第一递送形式递送经工程化的Cas12f1引导RNA或编码其的核酸,以及以第二递送形式递送Cas12f1蛋白或编码其的核酸。此处,第一递送形式和第二递送形式各自可为上述递送形式中的任一种。在实施方式中,所述基因编辑方法可包括:以第一递送形式递送经工程化的Cas12f1引导RNA或编码其的核酸,以及以第二递送形式递送Cas12f1蛋白或编码其的核酸。此处,第一递送形式和第二递送形式各自可为上述递送形式中的任一种。
递送顺序
所述基因编辑方法包括:将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送至细胞中,其中,可将所述组分同时递送至细胞中、或以一定时间间隔顺序递送至细胞中。
在实施方式中,所述基因编辑方法可包括:将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸同时递送至靶细胞中。在实施方式中,所述基因编辑方法可包括:将经工程化的Cas12f1引导RNA或编码其的核酸递送至细胞中,然后将Cas12f1蛋白或编码其的核酸递送至所述细胞中。在实施方式中,所述基因编辑方法可包括:将Cas12f1蛋白或编码其的核酸递送至细胞中,然后将经工程化的Cas12f1引导RNA递送至所述细胞中。在实施方式中,所述基因编辑方法可包括:将编码Cas12f1蛋白的核酸递送至细胞中,然后将经工程化的Cas12f1引导RNA递送至所述细胞中。
多个经工程化的Cas12f1引导RNA或编码其的核酸的递送
本文提供的基因编辑方法可包括:将Cas12f1蛋白或编码其的核酸、以及两种以上的经工程化的Cas12f1引导RNA或编码其的核酸递送至靶细胞中。通过使用所述方法,可将靶向不同序列的两种以上的CRISPR/Cas12f1复合物引入靶细胞中、或者可在靶细胞中形成靶向不同序列的两种以上的CRISPR/Cas12f1复合物。因此,所述方法使得能够可对细胞中包含的两个以上的不同的靶基因或靶核酸进行编辑。在实施方式中,所述基因编辑方法包括:将Cas12f1蛋白或编码其的核酸、第一经工程化的Cas12f1引导RNA或编码其的核酸、以及第二经工程化的Cas12f1引导RNA或编码其的核酸递送至包含靶基因或靶核酸的靶细胞中。此处,可使用上述的递送形式和递送方法中的一种或多种将各种组分递送至细胞中。此处,可将两种以上的组分同时递送至细胞中,或者可将它们顺序递送至细胞中。
使CRISPR/Cas12f1复合物与靶核酸彼此接触
在本文提供的基因编辑方法中,在使经工程化的CRISPR/Cas12f1复合物与靶基因或靶核酸接触的同时进行靶细胞中的靶基因或靶核酸的编辑。因此,所述基因编辑方法可包括使经工程化的CRISPR/Cas12f1复合物与靶细胞中的靶基因或靶核酸接触,或诱导经工程化的CRISPR/Cas12f1复合物与其接触。在实施方式中,所述基因编辑方法可包括:使经工程化的CRISPR/Cas12f1复合物与靶细胞中的靶核酸接触。在实施方式中,所述基因编辑方法可包括:诱导经工程化的CRISPR/Cas12f1复合物与靶细胞中的靶核酸接触。此处,诱导方法不受特别限制,只要它能够使经工程化的CRISPR/Cas12f1复合物与细胞中的靶核酸接触即可。在实施方式中,所述诱导可通过如下实现:将经工程化的Cas12f1引导RNA或编码其的核酸以及Cas12f1蛋白或编码其的核酸递送至细胞中。
基因编辑结果-插入缺失
作为实施本文提供的基因编辑方法的结果,可在靶基因或靶核酸中出现插入缺失。此处,插入缺失可出现在靶序列部分和/或原间隔区序列部分的内部和/或外部。插入缺失是指由如下引起的突变:在基因编辑之前,核酸的核苷酸序列中的一些核苷酸的缺失,任意核苷酸向其中的插入,和/或插入和缺失两者。通常,当靶基因或靶核酸序列中出现插入缺失时,使基因或核酸失活。在实施方式中,作为实施所述基因编辑方法的结果,可在靶基因或靶核酸中出现一个或多个核苷酸的缺失和/或添加。
基因编辑的结果-碱基编辑
作为实施本文提供的基因编辑方法的结果,可在靶基因或靶核酸内发生碱基编辑。碱基编意味着有意改变核酸中的一个或多个特定核苷酸,而不同于由靶基因或靶核酸中任何核苷酸的缺失或添加引起的插入缺失。换言之,碱基编辑在靶基因或核酸的特定位置处引起预定的点突变。在实施方式中,作为实施所述基因编辑方法的结果,可在靶基因或靶核酸中发生通过其它核苷酸对一个或多个核苷酸进行的置换。
基因编辑的结果-插入
作为实施本文提供的基因编辑方法的结果,可在靶基因或靶核酸中发生敲入(knock-in)。敲入意味着向靶基因或靶核酸序列中插入额外的核酸序列。为了引起敲入,除了CRISPR/Cas12f1复合物外,还需要包含额外的核酸序列的供体来进行敲入。当CRISPR/Cas12f1复合物切割细胞中的靶基因或靶核酸时,发生经切割的靶基因或靶核酸的修复。此处,所述供体参与修复过程,从而可将所述额外的核酸序列插入靶基因或靶核酸中。在实施方式中,所述基因编辑方法还可包括:将供体引入靶细胞中。例如,所述供体包含待插入细胞内基因组中的外源DNA序列,并诱导外源DNA序列插入靶基因或靶核酸中。此处,当将所述供体递送至靶细胞中时,可使用上述的递送形式和/或递送方法。
基因编辑的结果-缺失
作为实施本文提供的基因编辑方法的结果,靶基因或靶核酸序列的全部或部分可被删除。删除意味着在靶基因或靶核酸中移除一定长度或更长的一部分核苷酸序列。缺失是指与上述插入缺失的效果相比,能够完全移除基因的特定区域(例如第一外显子区域)的效果。
在实施方式中,所述基因编辑方法包括:将Cas12f1蛋白或编码其的核酸、第一经工程化的Cas12f1引导RNA或编码其的核酸、以及第二经工程化的Cas12f1引导RNA或编码其的核酸引入包含靶基因或靶核酸的细胞中。因此,作为基因编辑的结果,发生所述靶基因或靶核酸中的特定序列部分的移除。
基因编辑方法的实例
在实施方式中,所述基因编辑方法可包括:以核糖核蛋白颗粒的形式将CRISPR/Cas12f1复合物递送至真核细胞中,在所述核糖核蛋白颗粒中经工程化的Cas12f1引导RNA和Cas12f1蛋白彼此结合。此处,可通过电穿孔或脂质转染实现所述递送。
在实施方式中,所述基因编辑方法可包括:将编码经工程化的Cas12f1引导RNA的核酸和编码Cas12f1蛋白的核酸递送到真核细胞中。此处,可通过电穿孔或脂质转染进行所述递送。
在实施方式中,所述基因编辑方法可包括:将腺相关病毒(AAV)载体递送到真核细胞中,所述腺相关病毒(AAV)载体包含编码经工程化的Cas12f1引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列。
在实施方式中,所述基因编辑方法可包括:将腺相关病毒(AAV)递送到真核细胞中,所述腺相关病毒包含编码第一经工程化的Cas12f1引导RNA的核酸序列、编码第二经工程化的Cas12f1引导RNA的核酸序列以及编码Cas12f1蛋白的核酸序列。
实施例
实施例1 sgRNA ver.A,MF
用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区;和
间隔区,
其中,在经工程化的引导RNA中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接,
间隔区包括10个至50个核苷酸,并且具有与靶序列互补的序列,
经工程化的支架区的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
经工程化的支架区的序列使得以下的序列以5’至3’的方向顺序彼此连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9):
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′
实施例2 sgRNA ver.A,WT
用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区;和
间隔区,
其中,在经工程化的引导RNA中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接,
间隔区包括10个至50个核苷酸,并且具有与靶序列互补的序列,
经工程化的支架区的序列不同于:
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315),以及
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117),
5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293),
5′AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294),
5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295),
5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ ID NO:296),
5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297),
5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298),
5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299),
5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300),
5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301),
5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:302),
5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303),
5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:305),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:306),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:307),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314);以及
5′-AUGCAAC-3′。
实施例3sgRNA ver.A,v4.0
实施例1中的经工程化的引导RNA,其中支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例4.sgRNA er.A,v4.1
实施例1中的经工程化的引导RNA,其中支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例5 sgRNA ver.B
用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区;和
间隔区,
其中,在经工程化的引导RNA中,经工程化的支架区和间隔区以5’至3’的方向彼此顺序连接,
间隔区具有10至50个核苷酸的长度,并且具有与靶序列互补的序列,以及
经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:由5’-A-3’示出的第一序列;
由5′-CCGCUUCAC-3′(SEQ ID NO:432)示出的第二序列;
由5′-UUAG-3′示出的第三序列;
由5′-AGUGAAGGUGG-3′(SEQ ID NO:433)示出的第四序列;
由5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGU AACCCUCGA-3′(SEQID NO:11)示出的第五序列;
由5′-AACAAA-3′示出的第六序列;
接头;
由5′-GGA-3′示出的第七序列;以及
由5′-AUGCAAC-3′示出的第八序列。
实施例6 sgRNA ver.B,接头
实施例5中的经工程化的引导RNA,其中接头为5′-GAAA-3′。
实施例7 sgRNA ver.B,接头变化
实施例5中的经工程化的引导RNA,其中接头选自于由以下所组成的组:
5′-GAAA-3′,5′-UGAAAA-3′,5′-UUGAAAAA-3′,5′-UUCGAAAGAA-3′(SEQ ID NO:425),5′-UUCAGAAAUGAA-3′(SEQ ID NO:426),5′-UUCAUGAAAAUGAA-3′(SEQ ID NO:427),和5′-UUCAUUGAAAAAUGAA-3′(SEQ ID NO:428)。
实施例8 sgRNA ver.B+第一区域变化
实施例5中的经工程化的引导RNA,其中经工程化的支架区的序列额外包含第九序列,所述第九序列选自于由以下所组成的组:
5′-A-3′,5′-GA-3′,5′-AGA-3′,5′-GAGA-3′,5′-GGAGA-3′,5′-UGGAGA-3′,
5′-GUGGAGA-3′,5′-AGUGGAGA-3′,5′-AAGUGGAGA-3′,
5′-AAAGUGGAGA-3′(SEQ ID NO:27),5′-UAAAGUGGAGA-3′(SEQ ID NO:28),
5′-AUAAAGUGGAGA-3′(SEQ ID NO:29),5′-GAUAAAGUGGAGA-3′(SEQ ID NO:30),
5′-UGAUAAAGUGGAGA-3′(SEQ ID NO:31),
5′-CUGAUAAAGUGGAGA-3′(SEQ ID NO:32),
5′-ACUGAUAAAGUGGAGA-3′(SEQ ID NO:33),
5′-CACUGAUAAAGUGGAGA-3′(SEQ ID NO:34),
5′-UCACUGAUAAAGUGGAGA-3′(SEQ ID No:35),
5′-UUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:36),和
5′-CUUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:37),并且,第九序列的3’端连接至第一序列的5’端。
实施例9 sgRNA ver.B+第二区域变化
实施例5中的经工程化的引导RNA,其中经工程化的支架区的序列额外包含第十序列和第十一序列,第十序列选自于由以下所组成的组:
5′-A-3′,5′-AA-3′,5′-AAA-3′,5′-AAAG-3′,5′-AAAGC-3′,5′-AAAGCU-3′,
5′-AAAGCUG-3′,5′-AAAGCUGU-3′,5′-AAAGCUGUC-3′,
5′-AAAGCUGUCC-3′(SEQ ID NO:52)和5′-AAAGCUGUCCC-3′(SEQ ID NO:53);
第十一序列选自于由以下所组成的组:;
5′-U-3′,5′-CU-3′,5′-ACU-3′,5′-AACU-3′,5′-GAACU-3′,5′-AGAACU-3′,
5′-UAGAACU-3′,5′-UUAGAACU-3′,5′-AUUAGAACU-3′,
5′-GAUUAGAACU-3′(SEQ ID NO:54),5′-GGAUUAGAACU-3′(SEQ ID NO:55)和5′-GGGAUUAGAACU-3′(SEQ ID NO:56);
其中,第二序列的3’端和第三序列的5’端通过第十序列彼此连接,以及
第三序列的3’端和第四序列的5’端通过第十一序列彼此连接。
实施例10sgRNA ver.B+第二区域实例
实施例9中的经工程化的引导RNA,其中
当第十序列是5′-A-3′时,第十一序列是5′-U-3′,
当第十序列是5′-AA-3′时,第十一序列是5′-CU-3′,
当第十序列是5′-AAA-3′时,第十一序列是5′-ACU-3′,
当第十序列是5′-AAAG-3′时,第十一序列是5′-AACU-3′,
当第十序列是5′-AAAGC-3′时,第十一序列是5′-GAACU-3′,
当第十序列是5′-AAAGCU-3′时,第十一序列是5′-AGAACU-3′,
当第十序列是5′-AAAGCUG-3′时,第十一序列是5′-UAGAACU-3′或5′-UUAGAACU-3′,
当第十序列是5′-AAAGCUGU-3′时,第十一序列是5′-AUUAGAACU-3′,
当第十序列是5′-AAAGCUGUC-3′时,第十一序列是5′-GAUUAGAACU-3′(SEQ ID NO:54),
当第十序列是5′-AAAGCUGUCC-3′(SEQ ID NO:52)时,第十一序列是5′-GGAUUAGAACU-3′(SEQ ID NO:55),
当第十序列是5′-AAAGCUGUCCC-3′(SEQ ID NO:53)时,第十一序列是5′-GGGAUUAGAACU-3′(SEQ ID NO:56),
当第十序列是5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)时,第十一序列可为5′-GGGAUUAGAACUU-3′(SEQ ID NO:442),或
当第十序列是5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)时,第十一序列是5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。
实施例11 sgRNA ver.B,v4.0
实施例10中的经工程化的引导RNA,其中第十序列是5′-CAAAAGCUGUCCC-3′(SEQID NO:441),并且第十一序列是5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。
实施例12 sgRNA ver.B+第四区域和第五区域变化
实施例5中的经工程化的引导RNA,其中经工程化的支架区的序列进一步包含:
第十二序列,选自于由5′-U-3′,5′-UU-3′,5′-UUC-3′,5′-UUCA-3′,5′-UUCAU-3′,5′-UUCAUU-3′和5′-UUCAUUU-3′所组成的组;以及
第十三序列,选自于由5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-UGAA-3′,5′-AUGAA-3′,5′-AAUGAA-3′和5′-GAAUGAA-3′所组成的组,
其中,第六序列的3’端和接头的5’端通过第十二序列彼此连接,并且
第三序列的3’端和第七序列的5’端通过第十三序列彼此连接。
实施例13.sgRNA ver.B,第四区域和第五区域实例
实施例12中的经工程化的引导RNA,其中
当第十二序列是5′-U-3′时,第十三序列是5′-A-3′,
当第十二序列是5′-UU-3′时,第十三序列是5′-AA-3′,
当第十二序列是5′-UUC-3′时,第十三序列是5′-GAA-3′,
当第十二序列是5′-UUCA-3′时,第十三序列是5′-UGAA-3′,
当第十二序列是5′-UUCAU-3′时,第十三序列是5′-AUGAA-3′,
当第十二序列是5′-UUCAUU-3′时,第十三序列是5′-AAUGAA-3′,或
当第十二序列是5′-UUCAUUU-3′时,第十三序列是5′-GAAUGAA-3′。
实施例14.双重gRNA
用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区;和
间隔区,
其中,间隔区具有10个至50个核苷酸的长度,并且具有与靶序列互补的序列,
经工程化的支架区的序列以5′至3′的方向包括:
经工程化的tracrRNA,其中,以下的序列彼此连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);以及
选自于由以下所组成的组中的序列:
5′-AACAAA-3′,5′-AACAAAU-3′,5′-AACAAAUU-3′,5′-AACAAAUUC-3′,
5′-AACAAAUUCA-3′(SEQ ID NO:66),5′-AACAAAUUCAU-3′(SEQ ID NO:67),
5′-AACAAAUUCAUU-3′(SEQ ID NO:68), 和5′-AACAAAUUCAUUU-3′(SEQ ID NO:12);
经工程化的crRNA重复序列部分,其中以下的序列彼此连接:
选自于由以下所组成的组中的序列:
5′-GGA-3′,5′-AGGA-3′, 5′-AAGGA-3′,5′-GAAGGA-3′,5′-UGAAGGA-3′,5′-AUGAAGGA-3′,5′-AAUGAAGGA-3′,和5′-GAAUGAAGGA-3′(SEQ ID NO:14);以及
5′-AUGCAAC-3′;
其中,经工程化的crRNA重复序列的3’端与所述间隔区的5’端连接,并且
其中,将如下排除:其中的经工程化的tracrRNA的序列与5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:1)相同,并且经工程化的crRNA重复序列与5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)相同。
实施例15.复合物,ver.A
能够编辑含有靶序列的核酸的经工程化的CRISPR/Cas12f1复合物,包括:
Cas 12f1蛋白;和
经工程化的引导RNA,
其中,所述经工程化的引导RNA包括:
经工程化的支架区;和
间隔区;
其中,在所述经工程化的引导RNA中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
间隔区包括10个至50个核苷酸,并且具有与靶序列互补的序列,
经工程化的支架区的序列不同于
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID N0:117);以及
5′-AUGCAAC-3′。
实施例16复合物,ver.A,v4.0
实施例15的经工程化的CRISPR/Cas12f1复合物,其中包括在经工程化的引导RNA中的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例17复合物,ver.A,v4.1
实施例15的经工程化的CRISPR/Cas12f1复合物,其中包括在经工程化的引导RNA中的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例18.复合物,ver.B
一种能够编辑含有靶序列的核酸的经工程化的CRISPR/Cas12f1复合物,包括:
Cas 12f1蛋白;和
实施例5至实施例13中任一项的经工程化的引导RNA。
实施例19.载体,ver.A
一种能够表达CRISPR/Cas12f1系统的各组分的载体,包括:
第一序列,所述第一序列包含编码Cas12f1蛋白的核酸序列;
可操作地连接到所述第一序列的第一启动子序列;
第二序列,所述第二序列包含编码所述经工程化的引导RNA的核酸序列;以及
可操作地连接到所述第二序列的第二启动子序列,
其中,所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,在所述经工程化的引导RNA中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
经工程化的支架区的序列不同于
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下的序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′( SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
实施例20载体,ver.A,v4.0
实施例19的载体,其中包括在经工程化的引导RNA中的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例21.载体,ver.A,v4.1
实施例19的载体,其中包括在经工程化的引导RNA中的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAG UGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
实施例22载体,ver.A,病毒或质粒
实施例19的载体,其中所述载体是选自于由质粒、逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的至少一种。
实施例23载体,ver.B
一种能够表达CRISPR/Cas12f1系统的各组分的载体,包括:
第一序列,所述第一序列包含编码Cas12f1蛋白的核酸序列;
可操作地连接到所述第一序列的第一启动子序列;
第二序列,所述第二序列包含编码实施例5至实施例13中任一项的经工程化的引导RNA的核酸序列;和
可操作地连接到所述第二序列的第二启动子序列。
实施例24编辑方法,ver.A,MF
一种编辑细胞中的含有靶序列的核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑含有靶序列的核酸,
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,在所述经工程化的引导RNA中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于
5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),
5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),和
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117);以及
5′-AUGCAAC-3′。
实施例25.编辑方法,ver.A,WT
一种编辑细胞中的含有靶序列的核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑含有靶序列的核酸,
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,在所述经工程化的引导RNA中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由以下所组成的组中的序列:
5′-A-3′,5′-AA-3′,5′-GAA-3′,5′-AGAA-3′,5′-GAGAA-3′,5′-GGAGAA-3′,
5′-UGGAGAA-3′,5′-GUGGAGAA-3′,5′-AGUGGAGAA-3′,
5′-AAGUGGAGAA-3′(SEQ ID NO:16),5′-AAAGUGGAGAA-3′(SEQ ID NO:17),
5′-UAAAGUGGAGAA-3′(SEQ ID NO:18),5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19),
5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20),
5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21),
5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22),
5′-ACUGAUAAAGUGGAGAA-3′(sEQ ID NO:23),
5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24),
5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25),
5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26),和
5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9);
选自于由以下所组成的组中的序列:
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430),
5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431),
5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38),
5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39),
5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40),
5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41),
5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42),5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43),
5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44),
5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45),
5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46),
5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47),
5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:48),
5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49),和
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11);
选自于由以下所组成的组中的序列:
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110),
5′-AACAAAUGAAAAGGA-3′(SEQ ID NO:111),
5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112),
5′-AACAAAUUCGAAAGAAGGA-3′(SEQ ID NO:113),
5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114),
5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115),
5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQ ID NO:116),
5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(sEQ ID NO:117),
5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293),
5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294),
5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295),
5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ ID NO:296),
5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297),
5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298),
5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299),
5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300),
5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301),
5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:302),
5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303),
5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:305),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:306),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:307),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312),
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313),和
5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314);以及
5′-AUGCAAC-3′。
实施例26编辑方法,ver.A,引入RNP
实施例24或实施例25中任一项的方法,其中,所述递送通过向细胞中引入Cas12f1蛋白和作为CRISPR/Cas12f1复合物的经工程化的引导RNA来实现。
实施例27编辑方法,ver.A,引入载体
实施例24的方法,其中通过将包含编码Cas12f1蛋白的核酸和编码经工程化的引导RNA的核酸的载体引入细胞中来实现递送。
实施例28编辑方法,ver.A,编辑真核细胞
实施例24或实施例25中任一项的方法,其中所述细胞是真核细胞。
实施例29编辑方法,ver.A,载体限制
实施例27的载体,所述载体是选自于由质粒、逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的至少一种。
实施例30编辑方法,ver.B
一种编辑细胞中的含有靶序列的核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸、以及实施例5至实施例13中任一项的经工程化的引导RNA或编码其的核酸递送到细胞中,
使CRISPR/Cas12f1复合物能够在细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑含有靶序列的核酸。
实施例31 sgRNA,ver.A,DNA
编码实施例1至实施例2中任一项的经工程化的引导RNA的DNA。
实施例32 sgRNA,ver.B,DNA
编码实施例5至实施例13中任一项的经工程化的引导RNA的DNA。
实施例33双重引导RNA,DNA
编码实施例14的经工程化的引导RNA的DNA。
发明的实施方式
在下文中,将通过实验例和实施例更详细地描述本公开。这些实施例仅用于说明本公开,并且对于本领域技术人员来说将显而易见的是,本公开的范围不应被解释为受这些实施例的限制。
实验例1实验材料的制备
实验例1.1.质粒载体的设计与构建
为在人细胞中表达,对Cas12f1基因进行密码子优化,并合成经优化的序列以用于载体构建。最后,向Cas12f1蛋白编码序列中添加鸡β-肌动蛋白启动子、位于5’端和3’端的核定位信号序列,以及编码由自切割T2A肽连接的增强型绿色荧光蛋白(eGFP)的序列。将Cas12f1蛋白的氨基酸序列和编码其的DNA序列在表01示出。
[表01]
合成编码(经工程化的)Cas12f1引导RNA的模板DNA,并将其克隆入pTwist Amp质粒载体(Twist Bioscience)中。必要时,使用U6互补正向引物和原间隔区互补反向引物,将载体用作扩增编码引导RNA的序列的模板。使用Gibson组装,将编码经工程化的Cas12f1引导RNA的寡核苷酸克隆入包含经密码子优化的Cas12f1基因的载体中,从而构建经工程化的CRISPR/Cas12f1系统的载体。
实验例1.2.Cas12f1引导RNA的工程化
使用ApoI和BamHI限制性酶,通过克隆合成的寡核苷酸来实施经工程化的Cas12f1引导RNA的第二区域、第四区域和第五区域的修饰,所寡核苷酸各自将经修饰的序列(Macrogen)递送到线性化的引导RNA编码载体中。使用靶向tracrRNA的5’端的正向引物和靶向U6启动子区域的反向引物,通过经典或经工程化的模板质粒载体的PCR扩增来实施经工程化的Cas12f1引导RNA的经工程化的支架区的第一区域的修饰。使用Q5 Hot Start高保真DNA聚合酶(NEB)实施PCR扩增,并使用KLD酶混合物(NEB)实施PCR产物的连接。将经连接的PCR产物转化入DH5αE.coli细胞中。通过Sanger测序分析鉴别突变。使用Xtra Midi EF试剂盒(MN)纯化经修饰的质粒载体。将1微克纯化后的质粒用作使用T7 RNA聚合酶(NEB)和NTPs(Jena Bioscience)的mRNA合成的模板。使用/>RNA cleanup试剂盒(NEB)对上述制备的经工程化的Cas12f1引导RNA进行纯化,等分入低温小瓶中,并贮存在液氮中。
实验例1.3.细胞培养和转染
将HEK293 T细胞(LentX-293T,Takara)在5% CO2条件下、在补充有10%的热灭活胎牛血清(FBS)(Corning)和青霉素/链霉素的Dulbecco改良eagle培养基(DMEM)中培养。通过电穿孔或脂质体转染实施细胞转染。对于电穿孔,使用Neon转染系统(Invitrogen),将各个2μg至5μg的编码Cas12f1蛋白的质粒载体和实验例1.2中产生的编码引导RNA的DNA(或经工程化的引导RNA)转染入4×105HEK-293T细胞。电穿孔在1300V、10mA和3个脉冲的条件下进行。对于脂质体转染,将6μL至15μL的FuGene试剂(Promega)与2μg至5μg的编码Cas12f1蛋白的质粒载体和1.5μg至5μg的PCR扩增子混合15分钟。在转染前1天,将混合物(300μL)添加到接种有1×106细胞的1.5mL DMEM培养基中。将细胞在混合物的存在下培养1天至10天。培养后,收集细胞,并使用PureHelixTM基因组DNA制备试剂盒(NanoHelix)或Maxwell RSC培养细胞DNA试剂盒(Promega)人为分离细胞的基因组DNA。
实验例1.4.细胞间插入缺失效率的测定
在KAPA HiFi HotStart DNA聚合酶(Roche)的存在下,针对从HEK-293T细胞分离的基因组DNA中的包含原间隔区的区域,使用靶标特异性引物进行PCR。按照制造商的说明进行扩增。PCR扩增子是扩增的产物并包含Illumina TruSeq HT双指示物(dual indexes),使其经受使用Illumina iSeq 100的150bp双端测序。插入缺失频率使用MAUND计算。MAUND提供于https://github.com/ibs-cge/maund。
实验例1.5.定量实时PCR
引导RNA(或经工程化的引导RNA)或基因组DNA各自使用RNeasy Miniprep kit(Qiagen)、Maxwell RSC miRNA Tissue Kit(Promega)或DNeasy Blood&Tissue Kit(Qiagen)从HEK293T细胞中提取。为了定量引导RNA,使用crRNA特异性引物合成cDNA并进行RNA特异性引物的连接。然后将该cDNA用作定量实时PCR的模板。使用KAFA SYBR FAST qPCRMaster Mix(2X)Kit(KAPAbiosystems)对实时PCR进行分析。
实验例1.6.统计分析
对于各实验例,实验重复进行三次,并将各自值的平均值用于分析。
实验例2.经工程化的CRISPR/Cas12f1系统之间的插入缺失效率比较
为了使用经工程化的Cas12f1引导RNA测量经工程化的CRISPR/Cas12f1系统的插入缺失效率,通过实验例1.1至实验例1.2制备各实例。将实验所用的靶序列在下表02中示出。
[表02]
将各个实例中使用的经工程化的Cas12f1引导RNA的序列在表03至表08中示出。
[表03]
[表04]
[表05]
[表06]
[表07]
[表08]
在此,对于各靶序列:
1)比较例n.1为单引导RNA,其中天然存在的Cas12f1 tracrRNA和天然存在的Cas12f1 crRNA通过5’-GAAA-3’连接。
2)实施例n.1至实施例n.3各自为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第一区域。
3)实施例n.4至实施例n.6各自为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第二区域。
4)实施例n.7至实施例n.9各自为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第四区域和第五区域。
5)实施例n.10为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第一区域和经修饰的第二区域。
6)实施例n.11为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第一区域和经修饰的第四区域和第五区域。
7)实施例n.12为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第二区域和经修饰的第四区域和第五区域。
8)实施例n.13和实施例n.14各自为具有间隔区和经工程化的支架区的经工程化的Cas12f1引导RNA,经工程化的支架区具有经修饰的第一区域、经修饰的第二区域和经修饰的第四区域和第五区域。
在此,n取决于靶序列,是1、2或3,其中n为1代表靶标1(DY2)的情况,n为2代表靶标2(DY10)的情况,并且n为3代表靶标3(Intergenic-22)的情况。
将在各实施例中构建的载体根据实验例1.3转染入HEK293 T细胞,并通过实验例1.4至实验例1.5测定插入缺失产生效率。将结果通过实验例1.6进行分析,并在图2至图13中示出。
图2至图4显示了实施例1.1至实施例1.13靶向DY2的平均插入缺失效率,图5至图8显示了实施例2.1至实施例2.13靶向DY10的平均插入缺失效率,图9至图12显示了实施例3.1至实施例3.13靶向Intergenic-22的平均插入缺失效率,并且图13显示了实施例1.13至实施例1.14靶向DY2、实施例2.13至实施例2.14靶向DY10及实施例3.13至实施例3.14靶向Intergenic-22的平均插入缺失效率。
从实验结果可以看出,当将本文公开的具有经工程化的支架区的经工程化的Cas12f1引导RNA用于基因编辑时,与如下情况相比,基因编辑效率通常增强:使用具有天然存在的支架区的Cas12f1引导RNA的情况,以及其中的天然存在的支架区的crRNA重复序列和tracrRNA通过接头5’-GAAA-3’彼此连接的引导RNA的情况。此外,当将针对各区域的修饰组合(例如,实施例n.10至实施例n.14)时,可以看出由于通过所述组合产生的协同作用,获得了进一步增强的基因编辑效率。
工业实用性
本公开提供了可用于基因编辑技术的CRISPR/Cas12f1系统,特别是具有通过引入经工程化的支架区而产生的提高的基因编辑效率的经工程化的CRISPR/Cas12f1系统。当将本文提供的经工程化的CRISPR/Cas12f1系统用于基因编辑时,与使用天然存在的CRISPR/Cas12f1系统时相比,该系统展示出高的基因编辑效率,并因此可用于编辑真核生物基因。
<110> 基恩科雷有限责任公司(Genkore)
<120> 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途
<130> OPP21-064-PCT
<150> KR 10-2020-0129937
<151> 2020-10-08
<150> KR 10-2021-0051552
<151> 2020-04-21
<160> 441
<170> KoPatentIn 3.0
<210> 1
<211> 140
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 tracrRNA的成熟形式
<400> 1
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu 140
<210> 2
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 tracrRNA的野生型
<400> 2
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca a 161
<210> 3
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 crRNA重复序列的成熟形式
<400> 3
gaaugaagga augcaac 17
<210> 4
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 crRNA重复序列的野生型
<400> 4
guugcagaac ccgaauagac gaaugaagga augcaac 37
<210> 5
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 crRNA的成熟形式
<400> 5
gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 37
<210> 6
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 crRNA的野生型
<400> 6
guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57
<210> 7
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 tracrRNA的成熟形式 + GAAA + Cas12f1
crRNA重复序列的成熟形式
<400> 7
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa c 161
<210> 8
<211> 181
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 tracrRNA的成熟形式 + GAAA + Cas12f1
crRNA的成熟形式
<400> 8
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180
n 181
<210> 9
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA的第一区域
<400> 9
cuucacugau aaaguggaga a 21
<210> 10
<211> 50
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA的第二区域
<400> 10
ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 50
<210> 11
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA的第三区域
<400> 11
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucga 56
<210> 12
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA (成熟形式)的第四区域
<400> 12
aacaaauuca uuu 13
<210> 13
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA (野生型)的第四区域
<400> 13
aacaaauuca uuuuuccucu ccaauucugc acaa 34
<210> 14
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA (成熟形式)的第五区域
<400> 14
gaaugaagga 10
<210> 15
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1引导RNA (野生型)的第五区域
<400> 15
guugcagaac ccgaauagac gaaugaagga 30
<210> 16
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 11nt缺失
<400> 16
aaguggagaa 10
<210> 17
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 10nt缺失
<400> 17
aaaguggaga a 11
<210> 18
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 9nt缺失
<400> 18
uaaaguggag aa 12
<210> 19
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 8nt缺失
<400> 19
auaaagugga gaa 13
<210> 20
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 7nt缺失
<400> 20
gauaaagugg agaa 14
<210> 21
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 6nt缺失
<400> 21
ugauaaagug gagaa 15
<210> 22
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 5nt缺失
<400> 22
cugauaaagu ggagaa 16
<210> 23
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 4nt缺失
<400> 23
acugauaaag uggagaa 17
<210> 24
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 3nt缺失
<400> 24
cacugauaaa guggagaa 18
<210> 25
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 2nt缺失
<400> 25
ucacugauaa aguggagaa 19
<210> 26
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 第一区域, 1nt缺失
<400> 26
uucacugaua aaguggagaa 20
<210> 27
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 10nt
<400> 27
aaaguggaga 10
<210> 28
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 11nt
<400> 28
uaaaguggag a 11
<210> 29
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 12nt
<400> 29
auaaagugga ga 12
<210> 30
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 13nt
<400> 30
gauaaagugg aga 13
<210> 31
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 14nt
<400> 31
ugauaaagug gaga 14
<210> 32
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 15nt
<400> 32
cugauaaagu ggaga 15
<210> 33
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 16nt
<400> 33
acugauaaag uggaga 16
<210> 34
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 17nt
<400> 34
cacugauaaa guggaga 17
<210> 35
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 18nt
<400> 35
ucacugauaa aguggaga 18
<210> 36
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 19nt
<400> 36
uucacugaua aaguggaga 19
<210> 37
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 第一区域的缺失部分, 20nt
<400> 37
cuucacugau aaaguggaga 20
<210> 38
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 11bp缺失
<400> 38
ccgcuucacc auuagugagu gaaggugg 28
<210> 39
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 10bp缺失
<400> 39
ccgcuucacc aauuaguuga gugaaggugg 30
<210> 40
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 9bp缺失
<400> 40
ccgcuucacc aaauuagcuu gagugaaggu gg 32
<210> 41
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 8bp缺失
<400> 41
ccgcuucacc aaaauuagac uugagugaag gugg 34
<210> 42
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 7bp缺失
<400> 42
ccgcuucacc aaaaguuaga acuugaguga aggugg 36
<210> 43
<211> 38
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 6bp缺失
<400> 43
ccgcuucacc aaaagcuuag gaacuugagu gaaggugg 38
<210> 44
<211> 40
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 5bp缺失
<400> 44
ccgcuucacc aaaagcuuua gagaacuuga gugaaggugg 40
<210> 45
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 4bp缺失
<400> 45
ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ugg 43
<210> 46
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 4bp+1nt缺失
<400> 46
ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu gg 42
<210> 47
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 3bp缺失
<400> 47
ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggugg 45
<210> 48
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 2bp缺失
<400> 48
ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggugg 47
<210> 49
<211> 49
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 1bp缺失
<400> 49
ccgcuucacc aaaagcuguc cuuagggauu agaacuugag ugaaggugg 49
<210> 50
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 5' 保留
<400> 50
ccgcuucacc a 11
<210> 51
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 3' 保留
<400> 51
ugagugaagg ugg 13
<210> 52
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的上游缺失部分, 10nt
<400> 52
aaagcugucc 10
<210> 53
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的上游缺失部分, 11nt
<400> 53
aaagcugucc c 11
<210> 54
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的下游缺失部分, 10nt
<400> 54
gauuagaacu 10
<210> 55
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的下游缺失部分, 11nt
<400> 55
ggauuagaac u 11
<210> 56
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的下游缺失部分, 12nt
<400> 56
gggauuagaa cu 12
<210> 57
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 10nt
<400> 57
aaauuagacu 10
<210> 58
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 11nt
<400> 58
aaaguuagaa cu 12
<210> 59
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 12nt
<400> 59
aaagcuuagg aacu 14
<210> 60
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 13nt
<400> 60
aaagcuuuag agaacu 16
<210> 61
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 14nt
<400> 61
aaagcuguua guagaacu 18
<210> 62
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 15nt
<400> 62
aaagcuguua guuagaacu 19
<210> 63
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 16nt
<400> 63
aaagcuguuu agauuagaac u 21
<210> 64
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 17nt
<400> 64
aaagcugucu uaggauuaga acu 23
<210> 65
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列, 18nt
<400> 65
aaagcugucc uuagggauua gaacu 25
<210> 66
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(成熟形式),缺失3nt
<400> 66
aacaaauuca 10
<210> 67
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(成熟形式),缺失4nt
<400> 67
aacaaauuca u 11
<210> 68
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(成熟形式),缺失5nt
<400> 68
aacaaauuca uu 12
<210> 69
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 21nt缺失
<400> 69
aacaaauuca uuu 13
<210> 70
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 20nt缺失
<400> 70
aacaaauuca uuuu 14
<210> 71
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 19nt缺失
<400> 71
aacaaauuca uuuuu 15
<210> 72
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 18nt缺失
<400> 72
aacaaauuca uuuuuc 16
<210> 73
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 17nt缺失
<400> 73
aacaaauuca uuuuucc 17
<210> 74
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 16nt缺失
<400> 74
aacaaauuca uuuuuccu 18
<210> 75
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 15nt缺失
<400> 75
aacaaauuca uuuuuccuc 19
<210> 76
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 14nt缺失
<400> 76
aacaaauuca uuuuuccucu 20
<210> 77
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 13nt缺失
<400> 77
aacaaauuca uuuuuccucu c 21
<210> 78
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 12nt缺失
<400> 78
aacaaauuca uuuuuccucu cc 22
<210> 79
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 11nt缺失
<400> 79
aacaaauuca uuuuuccucu cca 23
<210> 80
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 10nt缺失
<400> 80
aacaaauuca uuuuuccucu ccaa 24
<210> 81
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 9nt缺失
<400> 81
aacaaauuca uuuuuccucu ccaau 25
<210> 82
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 8nt缺失
<400> 82
aacaaauuca uuuuuccucu ccaauu 26
<210> 83
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 7nt缺失
<400> 83
aacaaauuca uuuuuccucu ccaauuc 27
<210> 84
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 6nt缺失
<400> 84
aacaaauuca uuuuuccucu ccaauucu 28
<210> 85
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 5nt缺失
<400> 85
aacaaauuca uuuuuccucu ccaauucug 29
<210> 86
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 4nt缺失
<400> 86
aacaaauuca uuuuuccucu ccaauucugc 30
<210> 87
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 3nt缺失
<400> 87
aacaaauuca uuuuuccucu ccaauucugc a 31
<210> 88
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 2nt缺失
<400> 88
aacaaauuca uuuuuccucu ccaauucugc ac 32
<210> 89
<211> 33
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA的第四区域(野生型), 1nt缺失
<400> 89
aacaaauuca uuuuuccucu ccaauucugc aca 33
<210> 90
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 20nt缺失
<400> 90
gaaugaagga 10
<210> 91
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 19nt缺失
<400> 91
cgaaugaagg a 11
<210> 92
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 18nt缺失
<400> 92
acgaaugaag ga 12
<210> 93
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 17nt缺失
<400> 93
gacgaaugaa gga 13
<210> 94
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 16nt缺失
<400> 94
agacgaauga agga 14
<210> 95
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 15nt缺失
<400> 95
uagacgaaug aagga 15
<210> 96
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 14nt缺失
<400> 96
auagacgaau gaagga 16
<210> 97
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 13nt缺失
<400> 97
aauagacgaa ugaagga 17
<210> 98
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 12nt缺失
<400> 98
gaauagacga augaagga 18
<210> 99
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 11nt缺失
<400> 99
cgaauagacg aaugaagga 19
<210> 100
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 10nt缺失
<400> 100
ccgaauagac gaaugaagga 20
<210> 101
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 9nt缺失
<400> 101
cccgaauaga cgaaugaagg a 21
<210> 102
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 8nt缺失
<400> 102
acccgaauag acgaaugaag ga 22
<210> 103
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 7nt缺失
<400> 103
aacccgaaua gacgaaugaa gga 23
<210> 104
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 6nt缺失
<400> 104
gaacccgaau agacgaauga agga 24
<210> 105
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 5nt缺失
<400> 105
agaacccgaa uagacgaaug aagga 25
<210> 106
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 4nt缺失
<400> 106
cagaacccga auagacgaau gaagga 26
<210> 107
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 3nt缺失
<400> 107
gcagaacccg aauagacgaa ugaagga 27
<210> 108
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 2nt缺失
<400> 108
ugcagaaccc gaauagacga augaagga 28
<210> 109
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> crRNA的第五区域(野生型), 1nt缺失
<400> 109
uugcagaacc cgaauagacg aaugaagga 29
<210> 110
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 7bp缺失 (成熟形式)
<400> 110
aacaaagaaa gga 13
<210> 111
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 6bp缺失 (成熟形式)
<400> 111
aacaaaugaa aagga 15
<210> 112
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 5bp缺失 (成熟形式)
<400> 112
aacaaauuga aaaagga 17
<210> 113
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 4bp缺失 (成熟形式)
<400> 113
aacaaauucg aaagaagga 19
<210> 114
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 3bp缺失 (成熟形式)
<400> 114
aacaaauuca gaaaugaagg a 21
<210> 115
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 2bp缺失 (成熟形式)
<400> 115
aacaaauuca ugaaaaugaa gga 23
<210> 116
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域, 1bp缺失 (成熟形式)
<400> 116
aacaaauuca uugaaaaaug aagga 25
<210> 117
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 第四区域+接头+第五区域 (成熟形式)
<400> 117
aacaaauuca uuugaaagaa ugaagga 27
<210> 118
<211> 120
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 第一区域中的20nt缺失)
<400> 118
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
120
<210> 119
<211> 121
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 第一区域中的19nt缺失)
<400> 119
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
u 121
<210> 120
<211> 122
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 第一区域中的18nt缺失)
<400> 120
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uu 122
<210> 121
<211> 123
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 第一区域中的17nt缺失)
<400> 121
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuu 123
<210> 122
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的16nt缺失)
<400> 122
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuu 124
<210> 123
<211> 125
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 第一区域中的15nt缺失)
<400> 123
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuu 125
<210> 124
<211> 126
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的14nt缺失)
<400> 124
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuu 126
<210> 125
<211> 127
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的13nt缺失)
<400> 125
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuu 127
<210> 126
<211> 128
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的12nt缺失)
<400> 126
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuu 128
<210> 127
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的11nt缺失)
<400> 127
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuu 129
<210> 128
<211> 130
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的10nt缺失)
<400> 128
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu 130
<210> 129
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的9nt缺失)
<400> 129
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu u 131
<210> 130
<211> 132
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的8nt缺失)
<400> 130
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uu 132
<210> 131
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的7nt缺失)
<400> 131
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuu 133
<210> 132
<211> 134
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的6nt缺失)
<400> 132
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuu 134
<210> 133
<211> 135
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的5nt缺失)
<400> 133
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuu 135
<210> 134
<211> 136
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的4nt缺失)
<400> 134
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 135
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的3nt缺失)
<400> 135
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuu 137
<210> 136
<211> 138
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的2nt缺失)
<400> 136
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 137
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第一区域中的1nt缺失)
<400> 137
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuu 139
<210> 138
<211> 117
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的10bp缺失)
<400> 138
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 117
<210> 139
<211> 119
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的9bp缺失)
<400> 139
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuu 119
<210> 140
<211> 122
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的8bp缺失)
<400> 140
cuucacugau aaaguggaga accgcuucac caaauuagac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uu 122
<210> 141
<211> 125
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的7bp缺失)
<400> 141
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuu 125
<210> 142
<211> 127
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的6bp缺失)
<400> 142
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuu 127
<210> 143
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的5bp缺失)
<400> 143
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuu 129
<210> 144
<211> 132
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的4bp缺失)
<400> 144
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uu 132
<210> 145
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的4bp+1nt缺失)
<400> 145
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu u 131
<210> 146
<211> 134
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的3bp缺失)
<400> 146
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuu 134
<210> 147
<211> 136
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的2bp缺失)
<400> 147
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuu 136
<210> 148
<211> 138
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第二区域中的1bp缺失)
<400> 148
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuu 138
<210> 149
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的7nt缺失)
<400> 149
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaa 133
<210> 150
<211> 134
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的6nt缺失)
<400> 150
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaau 134
<210> 151
<211> 135
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的5nt缺失)
<400> 151
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauu 135
<210> 152
<211> 136
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的4nt缺失)
<400> 152
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauuc 136
<210> 153
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的3nt缺失)
<400> 153
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauuca 137
<210> 154
<211> 138
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的2nt缺失)
<400> 154
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucau 138
<210> 155
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式,第四区域中的1nt缺失)
<400> 155
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauu 139
<210> 156
<211> 97
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 经修饰的第一区域和
经修饰的第二区域)
<400> 156
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuu 97
<210> 157
<211> 113
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 经修饰的第一区域和
经修饰的第四区域和第五区域)
<400> 157
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaa 113
<210> 158
<211> 110
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 经修饰的第二区域以及
经修饰的第四区域和第五区域)
<400> 158
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 110
<210> 159
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的tracrRNA(成熟形式, 经修饰的第一区域、经修饰的
第二区域、 经修饰的第四区域和第五区域)
<400> 159
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa 90
<210> 160
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式,第五区域中的7nt缺失)
<400> 160
ggaaugcaac 10
<210> 161
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式, 第五区域中的6nt缺失)
<400> 161
aggaaugcaa c 11
<210> 162
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式, 第五区域中的5nt缺失)
<400> 162
aaggaaugca ac 12
<210> 163
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式,第五区域中的4nt缺失)
<400> 163
gaaggaaugc aac 13
<210> 164
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式, 第五区域中的3nt缺失)
<400> 164
ugaaggaaug caac 14
<210> 165
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式, 第五区域中的2nt缺失)
<400> 165
augaaggaau gcaac 15
<210> 166
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的crRNA重复序列(成熟形式,第五区域中的1nt缺失)
<400> 166
aaugaaggaa ugcaac 16
<210> 167
<211> 141
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的20nt缺失)
<400> 167
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa c 141
<210> 168
<211> 142
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的19nt缺失)
<400> 168
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca ac 142
<210> 169
<211> 143
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的18nt缺失)
<400> 169
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uugaaagaau gaaggaaugc aac 143
<210> 170
<211> 144
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的17nt缺失)
<400> 170
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 171
<211> 145
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的16nt缺失)
<400> 171
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuugaaaga augaaggaau gcaac 145
<210> 172
<211> 146
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的15nt缺失)
<400> 172
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 173
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的14nt缺失)
<400> 173
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaac 147
<210> 174
<211> 148
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的13nt缺失)
<400> 174
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaac 148
<210> 175
<211> 149
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的12nt缺失)
<400> 175
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaac 149
<210> 176
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第一区域中的11nt缺失)
<400> 176
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac 150
<210> 177
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的10nt缺失)
<400> 177
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu gaaagaauga aggaaugcaa c 151
<210> 178
<211> 152
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的9nt缺失)
<400> 178
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca ac 152
<210> 179
<211> 153
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的8nt缺失)
<400> 179
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 180
<211> 154
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的7nt缺失)
<400> 180
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caac 154
<210> 181
<211> 155
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的6nt缺失)
<400> 181
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 182
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的5nt缺失)
<400> 182
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuugaaag aaugaaggaa ugcaac 156
<210> 183
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的4nt缺失)
<400> 183
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 184
<211> 158
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的3nt缺失)
<400> 184
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuugaa agaaugaagg aaugcaac 158
<210> 185
<211> 159
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第一区域中的2nt缺失)
<400> 185
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 186
<211> 160
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第一区域中的1nt缺失)
<400> 186
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 160
<210> 187
<211> 138
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第二区域中的11bp缺失)
<400> 187
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaac 138
<210> 188
<211> 140
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的10bp缺失)
<400> 188
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac 140
<210> 189
<211> 142
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的9bp缺失)
<400> 189
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca ac 142
<210> 190
<211> 144
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的8bp缺失)
<400> 190
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caac 144
<210> 191
<211> 146
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的7bp缺失)
<400> 191
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaac 146
<210> 192
<211> 148
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的6bp缺失)
<400> 192
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaac 148
<210> 193
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的5bp缺失)
<400> 193
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac 150
<210> 194
<211> 152
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的4bp缺失)
<400> 194
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca ac 152
<210> 195
<211> 153
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的4bp+1nt缺失)
<400> 195
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aac 153
<210> 196
<211> 155
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第二区域中的3bp缺失)
<400> 196
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaac 155
<210> 197
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的2bp缺失)
<400> 197
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaac 157
<210> 198
<211> 159
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第二区域中的1bp缺失)
<400> 198
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaac 159
<210> 199
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第四区域和第五区域中的7bp缺失)
<400> 199
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaac 147
<210> 200
<211> 149
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第四区域和第五区域中的6bp缺失)
<400> 200
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaaugaaaag gaaugcaac 149
<210> 201
<211> 151
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第四区域和第五区域中的5bp缺失)
<400> 201
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauugaaaa aggaaugcaa c 151
<210> 202
<211> 153
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第四区域和第五区域中的4bp缺失)
<400> 202
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aac 153
<210> 203
<211> 155
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,第四区域和第五区域中的3bp缺失)
<400> 203
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagaa augaaggaau gcaac 155
<210> 204
<211> 157
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第四区域和第五区域中的2bp缺失)
<400> 204
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaac 157
<210> 205
<211> 159
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 第四区域和第五区域中的1bp缺失)
<400> 205
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug aaaaaugaag gaaugcaac 159
<210> 206
<211> 118
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 经修饰的第一区域和第二区域)
<400> 206
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaac 118
<210> 207
<211> 127
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式,经修饰的第一区域、第四区域和第五区域)
<400> 207
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaac 127
<210> 208
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 经修饰的第二区域、第四区域和
第五区域)
<400> 208
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caac 124
<210> 209
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的支架(成熟形式, 经修饰的第一区域、第二区域、第四区域
和第五区域)
<400> 209
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caac 104
<210> 210
<211> 189
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的1nt缺失)
<400> 210
uucacugaua aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug 60
agugaaggug ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac 120
ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn 180
uuuuauuuu 189
<210> 211
<211> 188
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的2nt缺失)
<400> 211
ucacugauaa aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu 180
uuuauuuu 188
<210> 212
<211> 187
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的3nt缺失)
<400> 212
cacugauaaa guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag 60
ugaagguggg cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc 120
ucgaaacaaa uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu 180
uuauuuu 187
<210> 213
<211> 186
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的4nt缺失)
<400> 213
acugauaaag uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180
uauuuu 186
<210> 214
<211> 185
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 第一区域中的5nt缺失)
<400> 214
cugauaaagu ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug 60
aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc 120
gaaacaaauu cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnnuuuu 180
auuuu 185
<210> 215
<211> 184
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的6nt缺失)
<400> 215
ugauaaagug gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua 180
uuuu 184
<210> 216
<211> 183
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的7nt缺失)
<400> 216
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnnuuuuau 180
uuu 183
<210> 217
<211> 182
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的8nt缺失)
<400> 217
auaaagugga gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnnuuuuauu 180
uu 182
<210> 218
<211> 181
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的9nt缺失)
<400> 218
uaaaguggag aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuuauuu 180
u 181
<210> 219
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的10nt缺失)
<400> 219
aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu 60
gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac 120
aaauucauuu gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn nuuuuauuuu 180
180
<210> 220
<211> 179
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的11nt缺失)
<400> 220
aaguggagaa ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn uuuuauuuu 179
<210> 221
<211> 170
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的12nt缺失)
<400> 221
aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60
gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120
auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnnu 170
<210> 222
<211> 168
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的13nt缺失)
<400> 222
guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnn 168
<210> 223
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的14nt缺失)
<400> 223
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 167
<210> 224
<211> 166
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的15nt缺失)
<400> 224
ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnn 166
<210> 225
<211> 165
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的16nt缺失)
<400> 225
gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60
cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120
auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 165
<210> 226
<211> 164
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的17nt缺失)
<400> 226
agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnn 164
<210> 227
<211> 163
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的18nt缺失)
<400> 227
gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60
ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucau 120
uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnn 163
<210> 228
<211> 162
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的19nt缺失)
<400> 228
aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 162
<210> 229
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第一区域中的20nt缺失)
<400> 229
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn n 161
<210> 230
<211> 179
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的1bp缺失)
<400> 230
cuucacugau aaaguggaga accgcuucac caaaagcugu ccuuagggau uagaacuuga 60
gugaaggugg gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc 120
cucgaaacaa auucauuuga aagaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnn 179
<210> 231
<211> 177
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的2bp缺失)
<400> 231
cuucacugau aaaguggaga accgcuucac caaaagcugu cuuaggauua gaacuugagu 60
gaaggugggc ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu 120
cgaaacaaau ucauuugaaa gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 177
<210> 232
<211> 175
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的3bp缺失)
<400> 232
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 175
<210> 233
<211> 173
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的4bp+1nt缺失)
<400> 233
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguuagaac uugagugaag 60
gugggcugcu ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa 120
acaaauucau uugaaagaau gaaggaaugc aacnnnnnnn nnnnnnnnnn nnn 173
<210> 234
<211> 172
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的4bp缺失)
<400> 234
cuucacugau aaaguggaga accgcuucac caaaagcugu uaguagaacu ugagugaagg 60
ugggcugcuu gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa 120
caaauucauu ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 172
<210> 235
<211> 170
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的5bp缺失)
<400> 235
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn 170
<210> 236
<211> 168
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的6bp缺失)
<400> 236
cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60
cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120
uucauuugaa agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnn 168
<210> 237
<211> 166
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的7bp缺失)
<400> 237
cuucacugau aaaguggaga accgcuucac caaaaguuag aacuugagug aaggugggcu 60
gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120
cauuugaaag aaugaaggaa ugcaacnnnn nnnnnnnnnn nnnnnn 166
<210> 238
<211> 164
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的8bp缺失)
<400> 238
cuucacugau aaaguggaga accgcuucac caaaauuaga cuugagugaa ggugggcugc 60
uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120
uuugaaagaa ugaaggaaug caacnnnnnn nnnnnnnnnn nnnn 164
<210> 239
<211> 162
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的9bp缺失)
<400> 239
cuucacugau aaaguggaga accgcuucac caaauuagcu ugagugaagg ugggcugcuu 60
gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucauu 120
ugaaagaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 162
<210> 240
<211> 160
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的10bp缺失)
<400> 240
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn 160
<210> 241
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第二区域中的11bp缺失)
<400> 241
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaacnn nnnnnnnnnn nnnnnnnnuu uuauuuu 167
<210> 242
<211> 179
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的1bp缺失)
<400> 242
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauug aaaaaugaag gaaugcaacn nnnnnnnnnn nnnnnnnnn 179
<210> 243
<211> 177
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 第四区域和第五区域中的2bp缺失)
<400> 243
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 177
<210> 244
<211> 175
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的3bp缺失)
<400> 244
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucagaa augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 175
<210> 245
<211> 173
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的4bp缺失)
<400> 245
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aacnnnnnnn nnnnnnnnnn nnn 173
<210> 246
<211> 171
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的5bp缺失)
<400> 246
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauugaaaa aggaaugcaa cnnnnnnnnn nnnnnnnnnn n 171
<210> 247
<211> 169
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的6bp缺失)
<400> 247
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaaugaaaag gaaugcaacn nnnnnnnnnn nnnnnnnnn 169
<210> 248
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式,第四区域和第五区域中的7bp缺失)
<400> 248
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaacnnn nnnnnnnnnn nnnnnnn 167
<210> 249
<211> 138
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域和第二区域)
<400> 249
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa agaaugaagg aaugcaacnn 120
nnnnnnnnnn nnnnnnnn 138
<210> 250
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、第四区域和第五区域)
<400> 250
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaacnnn nnnnnnnnnn nnnnnnn 147
<210> 251
<211> 144
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第二区域、第四区域和第五区域)
<400> 251
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug 120
caacnnnnnn nnnnnnnnnn nnnn 144
<210> 252
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、第二区域、第四区域和第五区域)
<400> 252
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 253
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 253
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 254
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 254
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 255
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 255
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 256
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 256
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 257
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 257
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 258
<211> 124
<212> RNA
<213> 人工序列
<220>
<223> sgRNA(成熟形式, 经修饰的第一区域、 第二区域、第四区域和第五区域)
<400> 258
accgcuucac cauuagugag ugaagguggg cugcuugcau cagccuaaug ucgagaagug 60
cuuucuucgg aaaguaaccc ucgaaacaaa gaaaggaaug caacnnnnnn nnnnnnnnnn 120
nnnn 124
<210> 259
<211> 529
<212> PRT
<213> 人工序列
<220>
<223> Cas14a1氨基酸序列
<400> 259
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro
<210> 260
<211> 536
<212> PRT
<213> 人工序列
<220>
<223> N-末端NLS + Cas14a1氨基酸序列
<400> 260
Met Pro Lys Lys Lys Arg Lys Val Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro
530 535
<210> 261
<211> 536
<212> PRT
<213> 人工序列
<220>
<223> C-末端NLS + Cas14a1氨基酸序列
<400> 261
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro Pro Lys Lys Lys Arg Lys Val
530 535
<210> 262
<211> 543
<212> PRT
<213> 人工序列
<220>
<223> N/C-末端NLS + Cas14a1氨基酸序列
<400> 262
Met Pro Lys Lys Lys Arg Lys Val Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro Pro Lys Lys Lys Arg Lys Val
530 535 540
<210> 263
<211> 1003
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸序列 (N末端-胞苷脱氨酶)
<400> 263
Met Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala
1 5 10 15
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
20 25 30
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
35 40 45
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
50 55 60
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
65 70 75 80
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
85 90 95
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
100 105 110
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
115 120 125
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
130 135 140
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
145 150 155 160
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
165 170 175
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
180 185 190
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
195 200 205
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
210 215 220
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser
225 230 235 240
Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
245 250 255
Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn Thr
260 265 270
Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala
275 280 285
Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile
290 295 300
Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His
305 310 315 320
Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys
325 330 335
Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu
340 345 350
Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile
355 360 365
Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu
370 375 380
Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn
385 390 395 400
Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala
405 410 415
Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys
420 425 430
Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly
435 440 445
Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln
450 455 460
Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp
465 470 475 480
Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile
485 490 495
Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys
500 505 510
Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg
515 520 525
Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys
530 535 540
Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly
545 550 555 560
Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp
565 570 575
Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile
580 585 590
Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe
595 600 605
Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys
610 615 620
Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg
625 630 635 640
Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr
645 650 655
Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys
660 665 670
Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met
675 680 685
Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile
690 695 700
Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu
705 710 715 720
Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn
725 730 735
Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe
740 745 750
Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu
755 760 765
Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile
770 775 780
Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 264
<211> 1003
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸序列 (C末端-胞苷脱氨酶)
<400> 264
Met Pro Lys Lys Lys Arg Lys Val Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser
530 535 540
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
545 550 555 560
Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala
565 570 575
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
580 585 590
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
595 600 605
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
610 615 620
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
625 630 635 640
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
645 650 655
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
660 665 670
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
675 680 685
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
690 695 700
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
705 710 715 720
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
725 730 735
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
740 745 750
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
755 760 765
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
770 775 780
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 265
<211> 941
<212> PRT
<213> 人工序列
<220>
<223> DNA序列(N末端-腺苷脱氨酶)
<400> 265
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn
385 390 395 400
Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser
405 410 415
Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys
420 425 430
Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys
435 440 445
His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala
450 455 460
Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys
465 470 475 480
Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu
485 490 495
Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser
500 505 510
Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala
515 520 525
Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg
530 535 540
Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser
545 550 555 560
Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser
565 570 575
Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys
580 585 590
Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser
595 600 605
Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu
610 615 620
Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln
625 630 635 640
Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys
645 650 655
Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys
660 665 670
Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg
675 680 685
Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile
690 695 700
Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly
705 710 715 720
Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala
725 730 735
Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys
740 745 750
Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys
755 760 765
Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu
770 775 780
Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala
785 790 795 800
Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln
805 810 815
Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn
820 825 830
Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile
835 840 845
Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro
850 855 860
Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr
865 870 875 880
Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys
885 890 895
Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn
900 905 910
Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 266
<211> 941
<212> PRT
<213> 人工序列
<220>
<223> DNA序列(C末端-腺苷脱氨酶)
<400> 266
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
530 535 540
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
545 550 555 560
Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
565 570 575
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
580 585 590
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
595 600 605
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
610 615 620
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
625 630 635 640
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
645 650 655
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
660 665 670
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
675 680 685
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
690 695 700
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
705 710 715 720
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
725 730 735
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
740 745 750
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
755 760 765
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
770 775 780
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
785 790 795 800
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
805 810 815
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
820 825 830
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
835 840 845
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
850 855 860
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
865 870 875 880
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
885 890 895
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
900 905 910
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 267
<211> 1680
<212> DNA
<213> 人工序列
<220>
<223> 具有NLS的人密码子优化的Cas14a1
<400> 267
atgccaaaga agaagcggaa ggtcggtatc cacggagtcc cagcagccgc caagaacaca 60
attacaaaga cactgaagct gaggatcgtg agaccataca acagcgctga ggtcgagaag 120
attgtggctg atgaaaagaa caacagggaa aagatcgccc tcgagaagaa caaggataag 180
gtgaaggagg cctgctctaa gcacctgaaa gtggccgcct actgcaccac acaggtggag 240
aggaacgcct gtctgttttg taaagctcgg aagctggatg ataagtttta ccagaagctg 300
cggggccagt tccccgatgc cgtcttttgg caggagatta gcgagatctt cagacagctg 360
cagaagcagg ccgccgagat ctacaaccag agcctgatcg agctctacta cgagatcttc 420
atcaagggca agggcattgc caacgcctcc tccgtggagc actacctgag cgacgtgtgc 480
tacacaagag ccgccgagct ctttaagaac gccgctatcg cttccgggct gaggagcaag 540
attaagagta acttccggct caaggagctg aagaacatga agagcggcct gcccactaca 600
aagagcgaca acttcccaat tccactggtg aagcagaagg ggggccagta cacagggttc 660
gagatttcca accacaacag cgactttatt attaagatcc cctttggcag gtggcaggtc 720
aagaaggaga ttgacaagta caggccctgg gagaagtttg atttcgagca ggtgcagaag 780
agccccaagc ctatttccct gctgctgtcc acacagcggc ggaagaggaa caaggggtgg 840
tctaaggatg aggggaccga ggccgagatt aagaaagtga tgaacggcga ctaccagaca 900
agctacatcg aggtcaagcg gggcagtaag attggcgaga agagcgcctg gatgctgaac 960
ctgagcattg acgtgccaaa gattgataag ggcgtggatc ccagcatcat cggagggatc 1020
gatgtggggg tcaagagccc cctcgtgtgc gccatcaaca acgccttcag caggtacagc 1080
atctccgata acgacctgtt ccactttaac aagaagatgt tcgcccggcg gaggattttg 1140
ctcaagaaga accggcacaa gcgggccgga cacggggcca agaacaagct caagcccatc 1200
actatcctga ccgagaagag cgagaggttc aggaagaagc tcatcgagag atgggcctgc 1260
gagatcgccg atttctttat taagaacaag gtcggaacag tgcagatgga gaacctcgag 1320
agcatgaaga ggaaggagga ttcctacttc aacattcggc tgagggggtt ctggccctac 1380
gctgagatgc agaacaagat tgagtttaag ctgaagcagt acgggattga gatccggaag 1440
gtggccccca acaacaccag caagacctgc agcaagtgcg ggcacctcaa caactacttc 1500
aacttcgagt accggaagaa gaacaagttc ccacacttca agtgcgagaa gtgcaacttt 1560
aaggagaacg ccgattacaa cgccgccctg aacatcagca accctaagct gaagagcact 1620
aaggaggagc ccaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 1680
1680
<210> 268
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> 脱氨酶融合Cas14a1
<400> 268
atgccaaaga agaagcggaa agtctcctca gagactgggc ctgtcgccgt cgatccaacc 60
ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 120
aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 180
acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 240
cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 300
ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 360
atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 420
ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 480
cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 540
tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 600
aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 660
cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagtc tggaggatct 720
agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 780
agtggcggca gcagcggcgg cagcgccaag aacacaatta caaagacact gaagctgagg 840
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 269
<211> 1586
<212> DNA
<213> 人工序列
<220>
<223> 人密码子优化的Cas14a1
<400> 269
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagcc 1586
<210> 270
<211> 1607
<212> DNA
<213> 人工序列
<220>
<223> N-末端NLS + Cas14a1氨基酸序列
<400> 270
atgccaaaga agaagcggaa agtcgccaag aacacaatta caaagacact gaagctgagg 60
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcc 1607
<210> 271
<211> 1607
<212> DNA
<213> 人工序列
<220>
<223> C-末端NLS + Cas14a1氨基酸序列
<400> 271
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagccccaa agaagaagcg gaaagtc 1607
<210> 272
<211> 1628
<212> DNA
<213> 人工序列
<220>
<223> N/C-末端NLS + Cas14a1氨基酸序列
<400> 272
atgccaaaga agaagcggaa agtcgccaag aacacaatta caaagacact gaagctgagg 60
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccca aagaagaagc 1620
ggaaagtc 1628
<210> 273
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> 氨基酸序列 (N末端-胞苷脱氨酶)
<400> 273
atgccaaaga agaagcggaa agtctcctca gagactgggc ctgtcgccgt cgatccaacc 60
ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 120
aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 180
acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 240
cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 300
ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 360
atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 420
ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 480
cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 540
tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 600
aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 660
cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagtc tggaggatct 720
agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 780
agtggcggca gcagcggcgg cagcgccaag aacacaatta caaagacact gaagctgagg 840
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 274
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> 氨基酸序列 (C末端-胞苷脱氨酶)
<400> 274
atgccaaaga agaagcggaa agtcgccaag aacacaatta caaagacact gaagctgagg 60
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagccctc tggaggatct 1620
agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 1680
agtggcggca gcagcggcgg cagctcctca gagactgggc ctgtcgccgt cgatccaacc 1740
ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 1800
aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 1860
acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 1920
cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 1980
ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 2040
atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 2100
ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 2160
cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 2220
tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 2280
aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 2340
cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 275
<211> 2823
<212> DNA
<213> 人工序列
<220>
<223> DNA序列(N末端-腺苷脱氨酶)
<400> 275
atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480
aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 540
cccgggacct cagagtccgc cacacccgaa agttctggtg gttcttctgg tggttcttcc 600
gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 660
cgagatgaac gcgaggtgcc cgtgggggca gtactcgtgc tcaacaatcg cgtaatcggc 720
gaaggttgga atagggcaat cggactccac gaccccactg cacatgcgga aatcatggcc 780
cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 840
acgtttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 900
gtattcggtg ttcgcaacgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 960
tacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcg 1020
gcgctgttgt gttacttttt tcgcatgccc aggcaggtct ttaacgccca gaaaaaagca 1080
caatcctcta ctgactctgg tggttcttct ggtggttcta gcggcagcga gactcccggg 1140
acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgccaagaac 1200
acaattacaa agacactgaa gctgaggatc gtgagaccat acaacagcgc tgaggtcgag 1260
aagattgtgg ctgatgaaaa gaacaacagg gaaaagatcg ccctcgagaa gaacaaggat 1320
aaggtgaagg aggcctgctc taagcacctg aaagtggccg cctactgcac cacacaggtg 1380
gagaggaacg cctgtctgtt ttgtaaagct cggaagctgg atgataagtt ttaccagaag 1440
ctgcggggcc agttccccga tgccgtcttt tggcaggaga ttagcgagat cttcagacag 1500
ctgcagaagc aggccgccga gatctacaac cagagcctga tcgagctcta ctacgagatc 1560
ttcatcaagg gcaagggcat tgccaacgcc tcctccgtgg agcactacct gagcgacgtg 1620
tgctacacaa gagccgccga gctctttaag aacgccgcta tcgcttccgg gctgaggagc 1680
aagattaaga gtaacttccg gctcaaggag ctgaagaaca tgaagagcgg cctgcccact 1740
acaaagagcg acaacttccc aattccactg gtgaagcaga aggggggcca gtacacaggg 1800
ttcgagattt ccaaccacaa cagcgacttt attattaaga tcccctttgg caggtggcag 1860
gtcaagaagg agattgacaa gtacaggccc tgggagaagt ttgatttcga gcaggtgcag 1920
aagagcccca agcctatttc cctgctgctg tccacacagc ggcggaagag gaacaagggg 1980
tggtctaagg atgaggggac cgaggccgag attaagaaag tgatgaacgg cgactaccag 2040
acaagctaca tcgaggtcaa gcggggcagt aagattggcg agaagagcgc ctggatgctg 2100
aacctgagca ttgacgtgcc aaagattgat aagggcgtgg atcccagcat catcggaggg 2160
atcgatgtgg gggtcaagag ccccctcgtg tgcgccatca acaacgcctt cagcaggtac 2220
agcatctccg ataacgacct gttccacttt aacaagaaga tgttcgcccg gcggaggatt 2280
ttgctcaaga agaaccggca caagcgggcc ggacacgggg ccaagaacaa gctcaagccc 2340
atcactatcc tgaccgagaa gagcgagagg ttcaggaaga agctcatcga gagatgggcc 2400
tgcgagatcg ccgatttctt tattaagaac aaggtcggaa cagtgcagat ggagaacctc 2460
gagagcatga agaggaagga ggattcctac ttcaacattc ggctgagggg gttctggccc 2520
tacgctgaga tgcagaacaa gattgagttt aagctgaagc agtacgggat tgagatccgg 2580
aaggtggccc ccaacaacac cagcaagacc tgcagcaagt gcgggcacct caacaactac 2640
ttcaacttcg agtaccggaa gaagaacaag ttcccacact tcaagtgcga gaagtgcaac 2700
tttaaggaga acgccgatta caacgccgcc ctgaacatca gcaaccctaa gctgaagagc 2760
actaaggagg agcccaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820
aag 2823
<210> 276
<211> 2823
<212> DNA
<213> 人工序列
<220>
<223> DNA序列(C末端-腺苷脱氨酶)
<400> 276
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagccctct ggaggatcta gcggaggatc ctctggcagc 1620
gagacaccag gaacaagcga gtcagcaaca ccagagagca gtggcggcag cagcggcggc 1680
agctccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 1740
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 1800
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 1860
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 1920
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 1980
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 2040
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 2100
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 2160
aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 2220
cccgggacct cagagtccgc cacacccgaa agttcaggtg gatcttcagg tggatcttcg 2280
gaagtggaat tttcgcacga gtattggatg aggcacgctt taactctcgc taagagagca 2340
cgagacgaac gggaagtgcc ggttggggct gtcctcgtac tcaataatcg agttatcgga 2400
gaaggctgga acagggcaat cggactccac gatcccacag ctcatgccga gataatggcg 2460
cttcgacaag gaggcctagt catgcaaaat tatcgtctta ttgacgcgac cctctacgtg 2520
acctttgagc catgcgttat gtgtgcgggt gcaatgatac attcccggat aggacgtgta 2580
gtatttggag ttcgcaacgc gaagaccggt gcggctggtt ctctcatgga tgtcctgcac 2640
taccctggga tgaatcaccg cgttgaaatc actgaaggca ttttggccga tgaatgcgcg 2700
gccctgttat gttacttttt tcgcatgccc aggcaggtct ttaacgcaca gaagaaagcc 2760
caatcgtcca ctgataaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820
aag 2823
<210> 277
<211> 7
<212> PRT
<213> 猴病毒40
<400> 277
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 278
<211> 16
<212> PRT
<213> 小鼠
<400> 278
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 279
<211> 9
<212> PRT
<213> 智人
<400> 279
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 280
<211> 11
<212> PRT
<213> 智人
<400> 280
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 281
<211> 38
<212> PRT
<213> 小鼠
<400> 281
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 282
<211> 42
<212> PRT
<213> 智人
<400> 282
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 283
<211> 8
<212> PRT
<213> 智人
<400> 283
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 284
<211> 8
<212> PRT
<213> 智人
<400> 284
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 285
<211> 8
<212> PRT
<213> 智人
<400> 285
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 286
<211> 12
<212> PRT
<213> 小鼠
<400> 286
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 287
<211> 5
<212> PRT
<213> 流感病毒
<400> 287
Asp Arg Leu Arg Arg
1 5
<210> 288
<211> 7
<212> PRT
<213> 流感病毒
<400> 288
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 289
<211> 10
<212> PRT
<213> Hepatitis D virus
<400> 289
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 290
<211> 10
<212> PRT
<213> 小鼠
<400> 290
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 291
<211> 20
<212> PRT
<213> 智人
<400> 291
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 292
<211> 17
<212> PRT
<213> 智人
<400> 292
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 293
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 293
aacaaauuca uuuugaaacg aaugaagga 29
<210> 294
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 294
aacaaauuca uuuuugaaaa cgaaugaagg a 31
<210> 295
<211> 33
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 295
aacaaauuca uuuuucgaaa gacgaaugaa gga 33
<210> 296
<211> 35
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 296
aacaaauuca uuuuuccgaa aagacgaaug aagga 35
<210> 297
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 297
aacaaauuca uuuuuccuga aauagacgaa ugaagga 37
<210> 298
<211> 39
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 298
aacaaauuca uuuuuccucg aaaauagacg aaugaagga 39
<210> 299
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 299
aacaaauuca uuuuuccucu gaaaaauaga cgaaugaagg a 41
<210> 300
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 300
aacaaauuca uuuuuccucu cgaaagaaua gacgaaugaa gga 43
<210> 301
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 301
aacaaauuca uuuuuccucu ccgaaacgaa uagacgaaug aagga 45
<210> 302
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 302
aacaaauuca uuuuuccucu ccagaaaccg aauagacgaa ugaagga 47
<210> 303
<211> 49
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 303
aacaaauuca uuuuuccucu ccaagaaacc cgaauagacg aaugaagga 49
<210> 304
<211> 51
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 304
aacaaauuca uuuuuccucu ccaaugaaaa cccgaauaga cgaaugaagg a 51
<210> 305
<211> 53
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 305
aacaaauuca uuuuuccucu ccaauugaaa aacccgaaua gacgaaugaa gga 53
<210> 306
<211> 55
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 306
aacaaauuca uuuuuccucu ccaauucgaa agaacccgaa uagacgaaug aagga 55
<210> 307
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 307
aacaaauuca uuuuuccucu ccaauucuga aaagaacccg aauagacgaa ugaagga 57
<210> 308
<211> 59
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 308
aacaaauuca uuuuuccucu ccaauucugg aaacagaacc cgaauagacg aaugaagga 59
<210> 309
<211> 61
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 309
aacaaauuca uuuuuccucu ccaauucugc gaaagcagaa cccgaauaga cgaaugaagg 60
a 61
<210> 310
<211> 63
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 310
aacaaauuca uuuuuccucu ccaauucugc agaaaugcag aacccgaaua gacgaaugaa 60
gga 63
<210> 311
<211> 65
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 311
aacaaauuca uuuuuccucu ccaauucugc acgaaauugc agaacccgaa uagacgaaug 60
aagga 65
<210> 312
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 312
aacaaauuca uuuuuccucu ccaauucugc acagaaaguu gcagaacccg aauagacgaa 60
ugaagga 67
<210> 313
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的经工程化的(第4区域+接头+第5区域)
<400> 313
aacaaauuca uuuuuccucu ccaauucugc acagaaauug cagaacccga auagacgaau 60
gaagga 66
<210> 314
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> WT gRNA的(第4区域+接头+第5区域)
<400> 314
aacaaauuca uuuuuccucu ccaauucugc acaagaaagu ugcagaaccc gaauagacga 60
augaagga 68
<210> 315
<211> 202
<212> RNA
<213> 人工序列
<220>
<223> Cas12f1 tracrRNA的野生型+GAAA+Cas12f1 crRNA重复序列的野生型
<400> 315
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca ac 202
<210> 316
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 316
caagaaaguu 10
<210> 317
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 317
acaagaaagu ug 12
<210> 318
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 318
cacaagaaag uugc 14
<210> 319
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 319
gcacaagaaa guugca 16
<210> 320
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 320
ugcacaagaa aguugcag 18
<210> 321
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 321
cugcacaaga aaguugcaga 20
<210> 322
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 322
ucugcacaag aaaguugcag aa 22
<210> 323
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 323
uucugcacaa gaaaguugca gaac 24
<210> 324
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 324
auucugcaca agaaaguugc agaacc 26
<210> 325
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 325
aauucugcac aagaaaguug cagaaccc 28
<210> 326
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 326
caauucugca caagaaaguu gcagaacccg 30
<210> 327
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 327
ccaauucugc acaagaaagu ugcagaaccc ga 32
<210> 328
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 328
uccaauucug cacaagaaag uugcagaacc cgaa 34
<210> 329
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 329
cuccaauucu gcacaagaaa guugcagaac ccgaau 36
<210> 330
<211> 38
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 330
ucuccaauuc ugcacaagaa aguugcagaa cccgaaua 38
<210> 331
<211> 40
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 331
cucuccaauu cugcacaaga aaguugcaga acccgaauag 40
<210> 332
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 332
ccucuccaau ucugcacaag aaaguugcag aacccgaaua ga 42
<210> 333
<211> 44
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 333
uccucuccaa uucugcacaa gaaaguugca gaacccgaau agac 44
<210> 334
<211> 46
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 334
uuccucucca auucugcaca agaaaguugc agaacccgaa uagacg 46
<210> 335
<211> 48
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 335
uuuccucucc aauucugcac aagaaaguug cagaacccga auagacga 48
<210> 336
<211> 50
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 336
uuuuccucuc caauucugca caagaaaguu gcagaacccg aauagacgaa 50
<210> 337
<211> 52
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 337
uuuuuccucu ccaauucugc acaagaaagu ugcagaaccc gaauagacga au 52
<210> 338
<211> 54
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 338
auuuuuccuc uccaauucug cacaagaaag uugcagaacc cgaauagacg aaug 54
<210> 339
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 339
cauuuuuccu cuccaauucu gcacaagaaa guugcagaac ccgaauagac gaauga 56
<210> 340
<211> 58
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 340
ucauuuuucc ucuccaauuc ugcacaagaa aguugcagaa cccgaauaga cgaaugaa 58
<210> 341
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 341
ucauuuuucc ucuccaauuc ugcacaagaa aguugcagaa cccgaauaga cgaauga 57
<210> 342
<211> 59
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, WT
<400> 342
uucauuuuuc cucuccaauu cugcacaaga aaguugcaga acccgaauag acgaaugaa 59
<210> 343
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 343
uucauuuuuc 10
<210> 344
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 344
uucauuuuuc c 11
<210> 345
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 345
uucauuuuuc cu 12
<210> 346
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 346
uucauuuuuc cuc 13
<210> 347
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 347
uucauuuuuc cucu 14
<210> 348
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 348
uucauuuuuc cucuc 15
<210> 349
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 349
uucauuuuuc cucucc 16
<210> 350
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 350
uucauuuuuc cucucca 17
<210> 351
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 351
uucauuuuuc cucuccaa 18
<210> 352
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 352
uucauuuuuc cucuccaau 19
<210> 353
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 353
uucauuuuuc cucuccaauu 20
<210> 354
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 354
uucauuuuuc cucuccaauu c 21
<210> 355
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 355
uucauuuuuc cucuccaauu cu 22
<210> 356
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 356
uucauuuuuc cucuccaauu cug 23
<210> 357
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 357
uucauuuuuc cucuccaauu cugc 24
<210> 358
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 358
uucauuuuuc cucuccaauu cugca 25
<210> 359
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 359
uucauuuuuc cucuccaauu cugcac 26
<210> 360
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 360
uucauuuuuc cucuccaauu cugcaca 27
<210> 361
<211> 28
<212> RNA
<213> 人工序列
<220>
<223> 第4区域的缺失部分, WT
<400> 361
uucauuuuuc cucuccaauu cugcacaa 28
<210> 362
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 362
gacgaaugaa 10
<210> 363
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 363
agacgaauga a 11
<210> 364
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 364
uagacgaaug aa 12
<210> 365
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 365
auagacgaau gaa 13
<210> 366
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 366
aauagacgaa ugaa 14
<210> 367
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 367
gaauagacga augaa 15
<210> 368
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 368
cgaauagacg aaugaa 16
<210> 369
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 369
ccgaauagac gaaugaa 17
<210> 370
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 370
cccgaauaga cgaaugaa 18
<210> 371
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 371
acccgaauag acgaaugaa 19
<210> 372
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 372
aacccgaaua gacgaaugaa 20
<210> 373
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 373
gaacccgaau agacgaauga a 21
<210> 374
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 374
agaacccgaa uagacgaaug aa 22
<210> 375
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 375
cagaacccga auagacgaau gaa 23
<210> 376
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 376
gcagaacccg aauagacgaa ugaa 24
<210> 377
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 377
ugcagaaccc gaauagacga augaa 25
<210> 378
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 378
uugcagaacc cgaauagacg aaugaa 26
<210> 379
<211> 27
<212> RNA
<213> 人工序列
<220>
<223> 第5区域的缺失部分, WT
<400> 379
guugcagaac ccgaauagac gaaugaa 27
<210> 380
<211> 181
<212> RNA
<213> 人工序列
<220>
<223> 比较例1.1
<400> 380
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccacacacac agugggcuac 180
c 181
<210> 381
<211> 174
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.1
<400> 381
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caaccacaca cacagugggc uacc 174
<210> 382
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.2
<400> 382
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaaccac acacacagug ggcuacc 167
<210> 383
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.3
<400> 383
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa ccacacacac agugggcuac c 161
<210> 384
<211> 175
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.4
<400> 384
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaaccacac acacaguggg cuacc 175
<210> 385
<211> 170
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.5
<400> 385
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac cacacacaca gugggcuacc 170
<210> 386
<211> 158
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.6
<400> 386
cuucacugau aaaguggaga accgcuucac cauuagugag ugaagguggg cugcuugcau 60
cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa uucauuugaa 120
agaaugaagg aaugcaacca cacacacagu gggcuacc 158
<210> 387
<211> 177
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.7
<400> 387
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaaccac acacacagug ggcuacc 177
<210> 388
<211> 173
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.8
<400> 388
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aaccacacac acagugggcu acc 173
<210> 389
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.9
<400> 389
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaaccac acacacagug ggcuacc 167
<210> 390
<211> 140
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.10
<400> 390
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 120
cacacacaca gugggcuacc 140
<210> 391
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.11
<400> 391
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccac acacacagug ggcuacc 147
<210> 392
<211> 146
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.12
<400> 392
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa 120
ugcaaccaca cacacagugg gcuacc 146
<210> 393
<211> 126
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.13
<400> 393
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccaca cacacagugg 120
gcuacc 126
<210> 394
<211> 181
<212> RNA
<213> 人工序列
<220>
<223> 比较例2.1
<400> 394
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa ccauccccag gacacacaca 180
c 181
<210> 395
<211> 174
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.1
<400> 395
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caaccauccc caggacacac acac 174
<210> 396
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.2
<400> 396
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaaccau ccccaggaca cacacac 167
<210> 397
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.3
<400> 397
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa ccauccccag gacacacaca c 161
<210> 398
<211> 175
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.4
<400> 398
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaaccaucc ccaggacaca cacac 175
<210> 399
<211> 170
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.5
<400> 399
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac cauccccagg acacacacac 170
<210> 400
<211> 160
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.6
<400> 400
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac cauccccagg acacacacac 160
<210> 401
<211> 177
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.7
<400> 401
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaaccau ccccaggaca cacacac 177
<210> 402
<211> 173
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.8
<400> 402
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aaccaucccc aggacacaca cac 173
<210> 403
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.9
<400> 403
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaaccau ccccaggaca cacacac 167
<210> 404
<211> 140
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.10
<400> 404
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 120
cauccccagg acacacacac 140
<210> 405
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.11
<400> 405
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaaccau ccccaggaca cacacac 147
<210> 406
<211> 146
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.12
<400> 406
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa 120
ugcaaccauc cccaggacac acacac 146
<210> 407
<211> 126
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.13
<400> 407
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaaccauc cccaggacac 120
acacac 126
<210> 408
<211> 181
<212> RNA
<213> 人工序列
<220>
<223> 比较例3.1
<400> 408
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu gaaagaauga aggaaugcaa cagaacacau accccugggc 180
c 181
<210> 409
<211> 174
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.1
<400> 409
gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60
ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120
aacaaauuca uuugaaagaa ugaaggaaug caacagaaca cauaccccug ggcc 174
<210> 410
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.2
<400> 410
uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60
ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120
ucauuugaaa gaaugaagga augcaacaga acacauaccc cugggcc 167
<210> 411
<211> 161
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.3
<400> 411
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucauuu 120
gaaagaauga aggaaugcaa cagaacacau accccugggc c 161
<210> 412
<211> 175
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.4
<400> 412
cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60
aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120
aaacaaauuc auuugaaaga augaaggaau gcaacagaac acauaccccu gggcc 175
<210> 413
<211> 170
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.5
<400> 413
cuucacugau aaaguggaga accgcuucac caaaagcuuu agagaacuug agugaaggug 60
ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 120
aauucauuug aaagaaugaa ggaaugcaac agaacacaua ccccugggcc 170
<210> 414
<211> 160
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.6
<400> 414
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug 120
aaagaaugaa ggaaugcaac agaacacaua ccccugggcc 160
<210> 415
<211> 177
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.7
<400> 415
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauga aaaugaagga augcaacaga acacauaccc cugggcc 177
<210> 416
<211> 173
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.8
<400> 416
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucgaaa gaaggaaugc aacagaacac auaccccugg gcc 173
<210> 417
<211> 167
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.9
<400> 417
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaagaaagga augcaacaga acacauaccc cugggcc 167
<210> 418
<211> 140
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.10
<400> 418
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aauucauuug aaagaaugaa ggaaugcaac 120
agaacacaua ccccugggcc 140
<210> 419
<211> 147
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.11
<400> 419
accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60
caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaagaaagga 120
augcaacaga acacauaccc cugggcc 147
<210> 420
<211> 146
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.12
<400> 420
cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60
aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa 120
ugcaacagaa cacauacccc ugggcc 146
<210> 421
<211> 126
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.13
<400> 421
accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60
ugcuuucuuc ggaaaguaac ccucgaaaca aagaaaggaa ugcaacagaa cacauacccc 120
ugggcc 126
<210> 422
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向DY2的原间隔区序列
<400> 422
cacacacaca gtgggctacc 20
<210> 423
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向DY10的原间隔区序列
<400> 423
catccccagg acacacacac 20
<210> 424
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶向Intergenic-22的原间隔区序列
<400> 424
agaacacata cccctgggcc 20
<210> 425
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, MF
<400> 425
uucgaaagaa 10
<210> 426
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, MF
<400> 426
uucagaaaug aa 12
<210> 427
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, MF
<400> 427
uucaugaaaa ugaa 14
<210> 428
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, MF
<400> 428
uucauugaaa aaugaa 16
<210> 429
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 接头变化, MF
<400> 429
uucauuugaa agaaugaa 18
<210> 430
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 13bp缺失
<400> 430
ccgcuucacu uagagugaag gugg 24
<210> 431
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 12bp缺失
<400> 431
ccgcuucacc uuaggaguga aggugg 26
<210> 432
<211> 9
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 5' 保留
<400> 432
ccgcuucac 9
<210> 433
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 第二区域, 3' 保留
<400> 433
agugaaggug g 11
<210> 434
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列
<400> 434
aaaagcuguc ccuuagggga uuagaacuu 29
<210> 435
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的中间序列
<400> 435
caaaagcugu cccuuagggg auuagaacuu g 31
<210> 436
<211> 120
<212> RNA
<213> 人工序列
<220>
<223> 实施例1.14
<400> 436
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cacacacaca gugggcuacc 120
120
<210> 437
<211> 120
<212> RNA
<213> 人工序列
<220>
<223> 实施例2.14
<400> 437
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac cauccccagg acacacacac 120
120
<210> 438
<211> 120
<212> RNA
<213> 人工序列
<220>
<223> 实施例3.14
<400> 438
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac agaacacaua ccccugggcc 120
120
<210> 439
<211> 120
<212> RNA
<213> 人工序列
<220>
<223> 经工程化的sgRNA
<400> 439
accgcuucac uuagagugaa ggugggcugc uugcaucagc cuaaugucga gaagugcuuu 60
cuucggaaag uaacccucga aacaaagaaa ggaaugcaac nnnnnnnnnn nnnnnnnnnn 120
120
<210> 440
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的上游缺失部分
<400> 440
aaaagcuguc cc 12
<210> 441
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 第二区域的下游缺失部分
<400> 441
caaaagcugu ccc 13

Claims (33)

1.一种用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区,
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)和5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)所组成的组中的序列;以及
5′-AUGCAAC-3′。
2.一种用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315);
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)、5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)、5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293)、5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294)、5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295)、5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ IDNO:296)、5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297)、5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298)、5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299)、5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300)、5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301)、5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQID NO:302)、5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303)、5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:305)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:306)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SE 0IDNO:307)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQID NO:308)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313)和5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:314)所组成的组中的序列;以及
5′-AUGCAAC-3′。
3.如权利要求1所述的经工程化的引导RNA,其中,所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
4.如权利要求1所述的经工程化的引导RNA,其中,所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
5.一种用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区具有10个核苷酸至50个核苷酸的长度,并且具有与靶序列互补的序列,并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
由5’-A-3’示出的第一序列;
由5′-CCGCUUCAC-3′(SEQ ID NO:432)示出的第二序列;
由5′-UUAG-3′示出的第三序列;
由5′-AGUGAAGGUGG-3′(SEQ ID NO:433)示出的第四序列;
由5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ IDNO:11)示出的第五序列;
由5′-AACAAA-3′示出的第六序列;
接头;
由5′-GGA-3′示出的第七序列;和
由5′-AUGCAAC-3′示出的第八序列。
6.如权利要求5所述的经工程化的引导RNA,其中,所述接头为5′-GAAA-3′。
7.如权利要求5所述的经工程化的引导RNA,其中,所述接头选自于由以下所组成的组:
5′-GAAA-3′,5′-UGAAAA-3′,5′-UUGAAAAA-3′,5′-UUCGAAAGAA-3′(SEQ ID NO:425),5′-UUCAGAAAUGAA-3′(SEQ ID NO:426),5′-UUCAUGAAAAUGAA-3′(SEQ ID NO:427)和
5′-UUCAUUGAAAAAUGAA-3′(SEQ ID NO:428)。
8.如权利要求5所述的经工程化的引导RNA,其中,所述经工程化的支架区的序列进一步包含第九序列,所述第九序列选自于由以下所组成的组:
5′-A-3′,5′-GA-3′,5′-AGA-3′,5′-GAGA-3′,5′-GGAGA-3′,5′-UGGAGA-3′,
5′-GUGGAGA-3′,5′-AGUGGAGA-3′,5′-AAGUGGAGA-3′,
5′-AAAGUGGAGA-3′(SEQ ID NO:27),5′-UAAAGUGGAGA-3′(SEQ ID NO:28),
5′-AUAAAGUGGAGA-3′(SEQ ID NO:29),5′-GAUAAAGUGGAGA-3′(SEQ ID NO:30),
5′-UGAUAAAGUGGAGA-3′(SEQ ID NO:31),
5′-CUGAUAAAGUGGAGA-3′(SEQ ID NO:32),
5′-ACUGAUAAAGUGGAGA-3′(SEQ ID NO:33),
5′-CACUGAUAAAGUGGAGA-3′(SEQ ID NO:34),
5′-UCACUGAUAAAGUGGAGA-3′(SEQ ID NO:35),
5′-UUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:36),和
5′-CUUCACUGAUAAAGUGGAGA-3′(SEQ ID NO:37),
并且,所述第九序列的3’端连接至所述第一序列的5’端。
9.如权利要求5所述的经工程化的引导RNA,其中,所述经工程化的支架区的序列进一步包含第十序列和第十一序列,
所述第十序列选自于由5′-A-3′、5′-AA-3′、5′-AAA-3′、5′-AAAG-3′、5′-AAAGC-3′、5′-AAAGCU-3′、5′-AAAGCUG-3′、5′-AAAGCUGU-3′、5′-AAAGCUGUC-3′、5′-AAAGCUGUCC-3′(SEQID NO:52)和5′-AAAGCUGUCCC-3′(SEQ ID NO:53)所组成的组;
所述第十一序列选自于由5′-U-3′、5′-CU-3′、5′-ACU-3′、5′-AACU-3′、5′-GAACU-3′、5′-AGAACU-3′、5′-UAGAACU-3′、5′-UUAGAACU-3′、5′-AUUAGAACU-3′、5′-GAUUAGAACU-3′(SEQ ID NO:54)、5′-GGAUUAGAACU-3′(SEQ ID NO:55)和5′-GGGAUUAGAACU-3′(SEQ ID NO:56)所组成的组:
其中,所述第二序列的3’端和所述第三序列的5’端通过所述第十序列彼此连接;以及
所述第三序列的3’端和所述第四序列的5’端通过所述第十一序列彼此连接。
10.如权利要求9所述的经工程化的引导RNA,其中
当第十序列是5′-A-3′时,第十一序列是5′-U-3′,
当第十序列是5′-AA-3′时,第十一序列是5′-CU-3′,
当第十序列是5′-AAA-3′时,第十一序列是5′-ACU-3′,
当第十序列是5′-AAAG-3′时,第十一序列是5′-AACU-3′,
当第十序列是5′-AAAGC-3′时,第十一序列是5′-GAACU-3′,
当第十序列是5′-AAAGCU-3′时,第十一序列是5′-AGAACU-3′,
当第十序列是5′-AAAGCUG-3′时,第十一序列是5′-UAGAACU-3′或5′-UUAGAACU-3′,
当第十序列是5′-AAAGCUGU-3′时,第十一序列是5′-AUUAGAACU-3′,
当第十序列是5′-AAAGCUGUC-3′时,第十一序列是5′-GAUUAGAACU-3′(SEQ ID NO:54),
当第十序列是5′-AAAGCUGUCC-3′(SEQ ID NO:52)时,第十一序列是5′-GGAUUAGAACU-3′(SEQ ID NO:55),
当第十序列是5′-AAAGCUGUCCC-3′(SEQ ID NO:53)时,第十一序列是5′-GGGAUUAGAACU-3′(SEQ ID NO:56),
当第十序列是5′-AAAAGCUGUCCC-3′(SEQ ID NO:440)时,第十一序列可以是5′-GGGAUUAGAACUU-3′(SEQ ID NO:442),或
当第十序列是5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441)时,第十一序列是5′-GGGAUUAGAACUUG-3′(SEQ ID NO:443)。
11.如权利要求10所述的经工程化的引导RNA,其中,所述第十序列是5′-CAAAAGCUGUCCC-3′(SEQ ID NO:441),并且所述第十一序列是5′-GGGAUUAGAACUUG-3′(SEQID NO:443)。
12.如权利要求5所述的经工程化的引导RNA,其中,所述经工程化的支架区的序列进一步包含第十二序列和第十三序列,
第十二序列选自于由5′-U-3′、5′-UU-3′、5′-UUC-3′、5′-UUCA-3′、5′-UUCAU-3′、5′-UUCAUU-3′和5′-UUCAUUU-3′所组成的组;
第十三序列选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-UGAA-3′、5′-AUGAA-3′、5′-AAUGAA-3′和5′-GAAUGAA-3′所组成的组,
其中,所述第六序列的3’端和所述接头的5’端通过所述第十二序列彼此连接,以及
所述接头的3’端和所述第七序列的5’端通过所述第十三序列彼此连接。
13.如权利要求12所述的经工程化的引导RNA,其中
当第十二序列是5′-U-3′时,第十三序列是5′-A-3′,
当第十二序列是5′-UU-3′时,第十三序列是5′-AA-3′,
当第十二序列是5′-UUC-3′时,第十三序列是5′-GAA-3′,
当第十二序列是5′-UUCA-3′时,第十三序列是5′-UGAA-3′,
当第十二序列是5′-UUCAU-3′时,第十三序列是5′-AUGAA-3′,
当第十二序列是5′-UUCAUU-3′时,第十三序列是5′-AAUGAA-3′,或
当第十二序列是5′-UUCAUUU-3′时,第十三序列是5′-GAAUGAA-3′。
14.一种用于CRISPR/Cas12f1系统的经工程化的引导RNA,包括:
经工程化的支架区,和
间隔区;
其中,所述间隔区具有10个至50个核苷酸的长度,并且具有与靶序列互补的序列,并且
经工程化的支架区的序列以5′至3′的方向包括:
经工程化的tracrRNA,其中,以下的序列彼此连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5’-CCGCUUCACUUAGAGUGAAGGUGG-3’(SEQ ID NO:ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);以及
选自于由5′-AACAAA-3′、5′-AACAAAU-3′、5′-AACAAAUU-3′、5′-AACAAAUUC-3′、5′-AACAAAUUCA-3′(SEQ ID NO:66)、5′-AACAAAUUCAU-3′(SEQ ID NO:67)、5′-AACAAAUUCAUU-3′(SEQ ID NO:68)和5′-AACAAAUUCAUUU-3′(SEQ ID NO:12)所组成的组中的序列;
经工程化的crRNA重复序列部分,其中以下的序列彼此连接:
选自于由5′-GGA-3′、5′-AGGA-3′、5′-AAGGA-3′、5′-GAAGGA-3′、5′-UGAAGGA-3′、5′-AUGAAGGA-3′、5′-AAUGAAGGA-3′和5′-GAAUGAAGGA-3′(SEQ ID NO:14)所组成的组中的序列;以及
5′-AUGCAAC-3′;
其中,所述经工程化的crRNA重复序列的3’端与所述间隔区的5’端连接,并且
其中,将如下排除:其中的经工程化的tracrRNA的序列与5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3′(SEQ ID NO:1)相同,并且经工程化的crRNA重复序列与5′-GAAUGAAGGAAUGCAAC-3′(SEQ ID NO:3)相同。
15.经工程化的CRISPR/Cas12f1复合物,包含:
Cas12f1蛋白;和
经工程化的引导RNA,
其中,所述经工程化的引导RNA包括:
经工程化的支架区;和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包括10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)和5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)所组成的组中的序列;以及
5′-AUGCAAC-3′。
16.如权利要求15所述的经工程化的CRISPR/Cas12f1复合物,其中,包括在所述经工程化的引导RNA中的所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
17.如权利要求15所述的经工程化的CRISPR/Cas12f1复合物,其中,所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
18.经工程化的CRISPR/Cas12f1复合物,包括:
Cas12f1蛋白,和
权利要求5-13中任一项所述的经工程化的引导RNA。
19.一种能够表达CRISPR/Cas12f1系统的各组分的载体,包括:
第一序列,所述第一序列包含编码Cas12f1蛋白的核酸序列;
可操作地连接到所述第一序列的第一启动子序列;
第二序列,所述第二序列包含编码经工程化的引导RNA的核酸序列;和
可操作地连接到所述第二序列的第二启动子序列,
其中,所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区,
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)和5′-AACAAAUUCAU UUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)所组成的组中的序列;以及
5′-AUGCAAC-3′。
20.如权利要求19所述的载体,其中,所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
21.如权利要求19所述的载体,其中,所述支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
5′-A-3′;
5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430);
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
5′-AACAAAGAAAGGA-3′(SEQ ID NO:110);以及
5′-AUGCAAC-3′。
22.如权利要求19所述的载体,其中,所述载体为选自于由质粒、逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的至少一种。
23.一种能够表达CRISPR/Cas12f1系统的各组分的载体,包括:
第一序列,所述第一序列包含编码Cas12f1蛋白的核酸序列;
可操作地连接到所述第一序列的第一启动子序列;
第二序列,所述第二序列包含编码权利要求5至13中任一项所述的经工程化的引导RNA的核酸序列;和
可操作地连接到所述第二序列的第二启动子序列。
24.一种编辑细胞中的靶核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到所述细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,
其中,所述CRISPR/Cas12f1复合物能够编辑所述靶核酸,并且
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:7),并且
所述经工程化的支架区的序列使得以下序列以5’至3’的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQ ID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEQ ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)和5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)所组成的组中的序列;以及
5′-AUGCAAC-3′。
25.一种编辑细胞中的靶核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及经工程化的引导RNA或编码其的核酸递送到所述细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,
其中,所述CRISPR/Cas12f1复合物能够编辑所述靶核酸,并且
所述经工程化的引导RNA包括:
经工程化的支架区,和
间隔区;
其中,所述经工程化的支架区和所述间隔区以5’至3’的方向彼此顺序连接,
所述间隔区包含10个核苷酸至50个核苷酸,并且具有与靶序列互补的序列,
所述经工程化的支架区的序列不同于5′-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3′(SEQ ID NO:315);并且
所述经工程化的支架区的序列使得以下序列以5′至3′的方向彼此顺序连接:
选自于由5′-A-3′、5′-AA-3′、5′-GAA-3′、5′-AGAA-3′、5′-GAGAA-3′、5′-GGAGAA-3′、5′-UGGAGAA-3′、5′-GUGGAGAA-3′、5′-AGUGGAGAA-3′、5′-AAGUGGAGAA-3′(SEQ ID NO:16)、5′-AAAGUGGAGAA-3′(SEQID NO:17)、5′-UAAAGUGGAGAA-3′(SEQ ID NO:18)、5′-AUAAAGUGGAGAA-3′(SEQ ID NO:19)、5′-GAUAAAGUGGAGAA-3′(SEQ ID NO:20)、5′-UGAUAAAGUGGAGAA-3′(SEO ID NO:21)、5′-CUGAUAAAGUGGAGAA-3′(SEQ ID NO:22)、5′-ACUGAUAAAGUGGAGAA-3′(SEQ ID NO:23)、5′-CACUGAUAAAGUGGAGAA-3′(SEQ ID NO:24)、5′-UCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:25)、5′-UUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:26)和5′-CUUCACUGAUAAAGUGGAGAA-3′(SEQ ID NO:9)所组成的组中的序列;
选自于由5′-CCGCUUCACUUAGAGUGAAGGUGG-3′(SEQ ID NO:430)、5′-CCGCUUCACCUUAGGAGUGAAGGUGG-3′(SEQ ID NO:431)、5′-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3′(SEQ ID NO:38)、5′-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3′(SEQ ID NO:39)、5′-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3′(SEQ ID NO:40)、5′-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3′(SEQ ID NO:41)、5′-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:42)、5′-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:43)、5′-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:44)、5′-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:45)、5′-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:46)、5′-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:47)、5′-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ IDNO:48)、5′-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:49)和5′-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3′(SEQ ID NO:10)所组成的组中的序列;
5′-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3′(SEQ ID NO:11);
选自于由5′-AACAAAGAAAGGA-3′(SEQ ID NO:110)、5′-AACAAAUGAAAAGGA-3′(SEQ IDNO:111)、5′-AACAAAUUGAAAAAGGA-3′(SEQ ID NO:112)、5′-AACAAAUUCGAAAGAAGGA-3′(SEQID NO:113)、5′-AACAAAUUCAGAAAUGAAGGA-3′(SEQ ID NO:114)、5′-AACAAAUUCAUGAAAAUGAAGGA-3′(SEQ ID NO:115)、5′-AACAAAUUCAUUGAAAAAUGAAGGA-3′(SEQID NO:116)、5′-AACAAAUUCAUUUGAAAGAAUGAAGGA-3′(SEQ ID NO:117)、5′-AACAAAUUCAUUUUGAAACGAAUGAAGGA-3′(SEQ ID NO:293)、5′-AACAAAUUCAUUUUUGAAAACGAAUGAAGGA-3′(SEQ ID NO:294)、5′-AACAAAUUCAUUUUUCGAAAGACGAAUGAAGGA-3′(SEQ ID NO:295)、5′-AACAAAUUCAUUUUUCCGAAAAGACGAAUGAAGGA-3′(SEQ IDNO:296)、5′-AACAAAUUCAUUUUUCCUGAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:297)、5′-AACAAAUUCAUUUUUCCUCGAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:298)、5′-AACAAAUUCAUUUUUCCUCUGAAAAAUAGACGAAUGAAGGA-3′(SEQ ID NO:299)、5′-AACAAAUUCAUUUUUCCUCUCGAAAGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:300)、5′-AACAAAUUCAUUUUUCCUCUCCGAAACGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:301)、5′-AACAAAUUCAUUUUUCCUCUCCAGAAACCGAAUAGACGAAUGAAGGA-3′(SEQID NO:302)、5′-AACAAAUUCAUUUUUCCUCUCCAAGAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:303)、5′-AACAAAUUCAUUUUUCCUCUCCAAUGAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:304)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUGAAAAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:305)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCGAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:306)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ IDNO:307)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGACGAAUGAAGGA-3′(SEOID NO:308)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:309)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:310)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:311)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:312)、5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAGAAAUUGCAGAACCCGAAUAGACGAAUGAAGGA-3′(SEQ ID NO:313)和5′-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAG ACGAAUGAAGGA-3′(SEQ ID NO:314)所组成的组中的序列;以及
5′-AUGCAAC-3′。
26.如权利要求24或25中任一项所述的方法,其中,通过将Cas12f1蛋白和经工程化的引导RNA作为CRISPR/Cas1 2f1复合物引入所述细胞中来实现所述递送。
27.如权利要求24所述的方法,其中,通过将包含编码Cas12f1蛋白的核酸和编码经工程化的引导RNA的核酸的载体引入所述细胞中来实现所述递送。
28.如权利要求24或25中任一项所述的方法,其中,所述细胞为真核细胞。
29.如权利要求27所述的载体,其中,所述载体为选自于由质粒、逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的至少一种。
30.一种编辑细胞中的靶核酸的方法,包括:
将Cas12f1蛋白或编码其的核酸以及权利要求5至13中任一项所述的经工程化的引导RNA或编码其的核酸递送到所述细胞中,
使CRISPR/Cas12f1复合物能够在所述细胞中形成,并且
其中,所述CRISPR/Cas12f1复合物能够编辑所述靶核酸。
31.编码权利要求1或2所述的经工程化的引导RNA的DNA。
32.编码权利要求5至13中任一项所述的经工程化的引导RNA的DNA。
33.编码权利要求14所述的经工程化的引导RNA的DNA。
CN202180082426.4A 2020-10-08 2021-10-08 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途 Pending CN116806261A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2020-0129937 2020-10-08
KR10-2020-0185528 2020-12-29
KR1020210051552A KR20220145438A (ko) 2021-04-21 2021-04-21 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
KR10-2021-0051552 2021-04-21
PCT/KR2021/013923 WO2022075813A1 (ko) 2020-10-08 2021-10-08 Crispr/cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 그 용도

Publications (1)

Publication Number Publication Date
CN116806261A true CN116806261A (zh) 2023-09-26

Family

ID=83803041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180082426.4A Pending CN116806261A (zh) 2020-10-08 2021-10-08 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途

Country Status (2)

Country Link
KR (1) KR20220145438A (zh)
CN (1) CN116806261A (zh)

Also Published As

Publication number Publication date
KR20220145438A (ko) 2022-10-31

Similar Documents

Publication Publication Date Title
CN114846146B (zh) 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途
JP2020532968A (ja) Rna標的化方法および組成物
CN116568803A (zh) 用于增加CRISPR/Cas12f1系统的效率的包含富含U的尾部的经工程化的引导RNA及其用途
EP4227411A1 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same
KR20240023081A (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
US20230374500A1 (en) Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
CN114144519A (zh) 单碱基置换蛋白以及包含其的组合物
KR20230007218A (ko) 초소형 염기교정 시스템 및 이의 용도
CN116806261A (zh) 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途
KR102638799B1 (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
KR20230051095A (ko) 유전자 편집을 위한 TaRGET 시스템 및 이의 용도
CN117916372A (zh) 无切割活性的cas12f1、基于无切割活性的cas12f1的融合蛋白、包括其的crispr基因编辑系统及其制备方法和用途
US20240026345A1 (en) Parallel single-cell reporter assays and compositions
CN116568806A (zh) 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途
KR20240034661A (ko) 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템
US20050233994A1 (en) Methods and vectors for expressing siRNA
EP4368713A1 (en) Cleavage-inactive cas12f1, cleavage-inactive cas12f1-based fusion protein, crispr gene-editing system comprising same, and preparation method and use thereof
US20070122798A1 (en) Methods and tools for screening active rna in cellulo
AU2018279569B2 (en) System for DNA editing and application thereof
CN104498451A (zh) 兼具核酸外切和单链dna交换活性的重组酶及其应用
KR20230166041A (ko) 확장된 표적 범위를 갖는 엔지니어링된 Cas12f 단백질 및 이의 용도
CN117813379A (zh) 包括crispr核酸酶的基因编辑系统和其用途
Eggleston Tailor-made riboswitches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination