CN116887854A - Omni-103 crispr核酸酶 - Google Patents

Omni-103 crispr核酸酶 Download PDF

Info

Publication number
CN116887854A
CN116887854A CN202280013312.9A CN202280013312A CN116887854A CN 116887854 A CN116887854 A CN 116887854A CN 202280013312 A CN202280013312 A CN 202280013312A CN 116887854 A CN116887854 A CN 116887854A
Authority
CN
China
Prior art keywords
sequence
composition
seq
tracrrna
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280013312.9A
Other languages
English (en)
Inventor
利奥尔·以斯哈
纳达夫·马巴赫·巴尔
利亚特·洛克
努里特·梅隆
俄斐·阿迪夫·塔尔
阿里尔·吉斯潘
伊迪特·布赫
尼尔·赫克特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emmendo Biology
Original Assignee
Emmendo Biology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Emmendo Biology filed Critical Emmendo Biology
Priority claimed from PCT/US2022/015504 external-priority patent/WO2022170199A2/en
Publication of CN116887854A publication Critical patent/CN116887854A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了一种非天然存在的组合物,其包含:CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的序列;或核酸分子,其包含编码所述CRISPR核酸酶的序列。

Description

OMNI-103 CRISPR核酸酶
本申请要求于2021年12月7日提交的美国临时申请号63/286,855、于2021年6月24日提交的美国临时申请号63/214,506和于2021年2月8日提交的美国临时申请号63/147,166的权益,该美国临时申请中的每一个申请的内容特此通过援引并入。
贯穿本申请,引用了各种出版物,包括括号中引用的。本申请中提及的所有出版物的公开内容均特此通过援引以其全文并入本申请,以提供对本发明所属技术领域以及本技术领域中可与本发明一起使用的特征的额外描述。
序列表的引用
本申请通过援引并入了存在于名为“220207_91677-A-PCT_Sequence_Listing_AWG.txt”的文件中的核苷酸序列,该文件的大小为86千字节、于2022年2月6日以IBM-PC机器格式创建、具有与MS-Windows兼容的操作系统、作为本申请的一部分包含在于2022年2月7日提交的文本文件中。
技术领域
本发明尤其涉及用于基因组编辑的组合物和方法。
背景技术
细菌和古细菌适应性免疫的聚类规则间隔短回文重复序列(CRISPR)系统显示了蛋白质组成和基因组位点结构的极端多样性。CRISPR系统已成为研究和基因组工程的重要工具。然而,CRISPR系统的许多细节尚未确定,并且CRISPR核酸酶的适用性可能受到序列特异性要求、表达或递送挑战的限制。不同的CRISPR核酸酶具有不同的特性,诸如:大小、PAM位点、靶标活性、特异性、切割模式(例如平的、交错的末端)以及切割后插入缺失形成的显著模式。不同的特性集合可能对不同的应用有用。例如,一些CRISPR核酸酶可能能够靶向其他CRISPR核酸酶由于PAM位点的限制而无法靶向的特定基因组位点。此外,目前使用的一些CRISPR核酸酶表现出预免疫性,这可能会限制体内适用性。参见Charlesworth等人,NatureMedicine(2019)和Wagner等人,Nature Medicine(2019)。因此,新颖CRISPR核酸酶的发现、工程化和改进具有重要意义。
发明内容
本文公开了可用于基因组工程、表观基因组工程、基因组靶向、细胞的基因组编辑和/或体外诊断的组合物和方法。
所公开的组合物可用于修饰基因组DNA序列。如本文使用的,基因组DNA是指存在于一个或多个目标细胞中的线性和/或染色体DNA和/或质粒或其他染色体外DNA序列。在一些实施例中,目标细胞是真核细胞。在一些实施例中,目标细胞是原核细胞。在一些实施例中,该方法在基因组DNA序列中的预定靶位点处产生双链断裂(DSB),从而导致基因组中靶位点处的DNA序列的突变、插入和/或缺失。
因此,在一些实施例中,组合物包含聚类规则间隔短回文重复序列(CRISPR)核酸酶。在一些实施例中,CRISPR核酸酶是CRISPR相关蛋白。
OMNI-103 CRISPR核酸酶
本发明的实施例提供了被指定为表1中提供的“OMNI-103”核酸酶的CRISPR核酸酶。
本发明提供了一种修饰哺乳动物细胞的基因组中靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入(i)组合物,该组合物包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的CRISPR核酸酶或包含编码CRISPR核酸酶的序列的核酸分子,该序列与SEQID NO:2-3的核酸序列具有至少95%同一性,以及(ii)靶向DNA的RNA分子,或编码靶向DNA的RNA分子的DNA多核苷酸,其包含与靶DNA中的序列互补的核苷酸序列。
本发明还提供了一种包含CRISPR相关系统的非天然存在的组合物,该系统包含:
a)一个或多个RNA分子,其包含连接至正向重复序列的引导序列部分,其中该引导序列能够与靶序列或编码所述一个或多个RNA分子的一个或多个核苷酸序列杂交;以及
b)CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的氨基酸序列,或核酸分子,其包含编码该CRISPR核酸酶的序列;并且
其中所述一个或多个RNA分子与该靶序列杂交,其中该靶序列与原型间隔区相邻基序(PAM)的互补序列相邻,并且所述一个或多个RNA分子与RNA引导性核酸酶形成复合物。
本发明还提供了一种非天然存在的组合物,其包含:
a)CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的序列或核酸分子,其包含编码该CRISPR核酸酶的序列;以及
b)一个或多个RNA分子,或编码所述一个或多个RNA分子的一个或多个DNA多核苷酸,其包含以下中的至少一者:
i)核酸酶结合型RNA核苷酸序列,其能够与该CRISPR核酸酶相互作用/结合;
以及
ii)靶向DNA的RNA核苷酸序列,其包含与靶DNA序列中的序列互补的序列,其中该CRISPR核酸酶能够与所述一个或多个RNA分子复合,以形成能够与该靶DNA序列杂交的复合物。
OMNI-103 CRISPR核酸酶-RNA复合物
本发明还提供了一种组合物,其包含非天然存在的RNA分子,该RNA分子包含crRNA重复序列部分和引导序列部分,其中该RNA分子在存在tracrRNA序列的情况下与OMNI-103核酸酶形成复合物并将该核酸酶靶向DNA靶位点,其中该tracrRNA序列由该RNA分子的tracrRNA部分或第二RNA分子的tracrRNA部分编码。
本发明还提供了一种组合物,其包含非天然存在的RNA分子,该RNA分子包含RNA支架部分,该RNA支架部分具有以下结构:
crRNA重复序列部分-tracrRNA部分;
其中该RNA支架部分与OMNI-103 CRISPR核酸酶形成复合物并将该核酸酶靶向与该RNA分子的引导序列部分具有互补性的DNA靶位点。
本文公开了可用于基因组工程、表观基因组工程、基因组靶向、细胞的基因组编辑和/或体外诊断的组合物和方法,其使用OMNI-103 CRISPR核酸酶和包含支架部分的非天然存在的RNA分子,该支架部分能够特异性结合并活化该OMNI-103 CRISPR核酸酶,以基于该RNA分子的引导序列部分(也被称为RNA间隔区部分)靶向DNA靶位点。
所公开的组合物可用于修饰基因组DNA序列。如本文使用的,基因组DNA是指存在于一个或多个目标细胞中的线性和/或染色体DNA和/或质粒或其他染色体外DNA序列。在一些实施例中,目标细胞是真核细胞。在一些实施例中,目标细胞是原核细胞。在一些实施例中,该方法在基因组DNA序列中的预定靶位点处产生双链断裂(DSB),从而导致基因组中靶位点处的DNA序列的突变、插入和/或缺失。
附图说明
图1A至1B:sgRNA12的预测二级结构,一种与OMNI-103兼容的单引导RNA(sgRNA)(crRNA-tracrRNA)。图1A:OMNI-103V1(图1A)和V2(图1B)的crRNA-tracrRNA双链体的示意图,其中标注了sgRNA的crRNA和tracrRNA部分(见表2)。
图2A至2C:OMNI-103在U2OS细胞中作为RNP的活性和间隔区优化。将OMNI-103核酸酶过度表达和纯化。将纯化的蛋白质与合成的sgRNA复合,以形成RNP。(图2A)对于体外测定,将间隔区长度为20bp至25bp的减少量(4pmol、2pmol、1pmol和0.5pmol)的RNP(列于表6中)与40ng PDCD1 DNA靶模板一起温育。通过切割线性模板的能力来验证活性。(图2B至2C)在体内测定中(图2B),将具有PDCD1 S40的间隔区长度(20个至25个核苷酸)的RNP电穿孔到U2OS细胞系中,并通过NGS测量编辑水平(插入缺失)。(图2C)OMNI-103在U2OS细胞中作为RNP的活性测定:将具有PDCD1S40、TRACS35、TRACS33和B2M S12(22bp间隔区长度,表6)的RNP电穿孔到U2OS细胞系中,并通过下一代测序(NGS)测量编辑水平(插入缺失)。
图3A至3B.通过无偏生化测定(guide-seq)进行的OMNI-103脱靶分析。将具有PDCD1 S40和TRAC S35引导分子的RNP(表6)与dsODN混合并电穿孔到U2OS细胞系中。(图3A)通过NGS测量编辑水平(插入缺失)和dsODN整合。(图3B)Guide seq分析在PDCD1 S40位点(SEQ ID NO:133)或TRAC S35位点(SEQ ID NO:134)处未显示任何脱靶。
图4A至4B:OMNI核酸酶的体外TXTL PAM耗尽结果。PAM徽标是耗尽位点的比率的示意图(顶部图片)。在TXTL反应的NGS之后,计算来自PAM质粒文库的特定PAM序列(左下图)的耗尽率(右下图)。每个OMNI的计算基于沿PAM文库的8bp序列的4N窗口。所测试的OMNI所需的PAM和反应条件下的核酸酶活性水平是从耗尽率推断的。体外PAM耗尽结果为:图4A:带有sgRNA 12的OMNI-103。图B4:带有sgRNA 32的OMNI-103。
图5A至5C:OMNI-103的sgRNA版本在HeLa细胞中显示编辑。为了缩短OMNI-103的sgRNA,测试了支架的四个不同版本。这些版本包括在上茎处和/或末端发夹处的缺失。图5A:为OMNI-103设计的不同sgRNA的多序列比对。具体而言,比对OMNI-103sgRNA v2支架(107个核苷酸,RNA列为SEQ ID NO:16)与较短的sgRNA支架版本OMNI-103.1(101个核苷酸,RNA列为SEQ ID NO:33)、OMNI-103.2(85个核苷酸,RNA列为SEQ ID NO:34)、OMNI-103.3(79个核苷酸,RNA列为SEQ ID NO:35)和OMNI-103.4(95个核苷酸,RNA列为SEQ ID NO:36)处未显示任何脱靶。图5B:sgRNA 103.v2的预测结构,其用作创建较短版本的模板(用于创建较短版本的缺失部分被标明)。图5C:通过下一代测序(NGS)确定的具有不同支架的OMNI-103CRISPR核酸酶的编辑活性。测试了两个位点,TRAC S91和PDCD S40。转染效率由FACS确定,因为质粒表达报告荧光蛋白(mCherry)。
图6A至6F.表3中列出的sgRNA的预测二级结构。图6A:支架V2。图6B:支架V2.1。图6C:支架V2.2。图6D:支架V2.3。图6E:支架V2.4。图6F:支架V2.5。
图7.OMNI-103在具有不同sgRNA支架的HeLa细胞中的编辑活性(表3)。将Hela细胞用OMNI-103和靶向TRAC-S91或PDCD-S40的sgRNA质粒转染。编辑活性是基于下一代测序结果(条)计算的,并且转染效率基于对mCherry表达的FACS分析。呈现的是三个技术复制的平均值和标准偏差。
图8.U2OS中的活性。将U2OS细胞用OMNI-103和靶向TRAC S35和B2M S12的sgRNA(RNP)进行电穿孔。编辑活性是根据下一代测序(NGS)结果计算的。呈现的是三个技术复制的平均值和标准偏差。
图9.原代T细胞中的活性。从PBMC中分离出原代T细胞,并根据制造商的方案(Miltenyi#130-096-535、#130-091-441)进行活化。将活化的T细胞用OMNI-103和靶向TRAC-s35和B2M-s12的sgRNA(RNP)进行电穿孔。八(8)天后,通过流式细胞术测量细胞的TCR和B2M表达水平。对于分析,仅对活细胞和CD3阳性细胞进行计数。所提出的结果具有代表性,并且是均显示出相似结果的三个T细胞供体之一。
图10.T细胞活化测定。将用于切割活性测定的供体样品细胞用珠子活化72小时,并且该供体样品细胞显示出85%的原代T细胞活化率,如通过FACS(CD3+CD25+细胞)所测量的。
图11.RNA支架的代表性实例。示例性RNA支架部分包含通过四环连接至tracrRNA部分的crRNA部分。crRNA部分包含crRNA重复序列。tracrRNA部分包含tracrRNA抗重复序列和额外的tracrRNA节段。RNA分子可以进一步包含连接至crRNA重复序列的引导序列部分(即RNA间隔区),使得RNA分子充当单引导RNA分子。
具体实施方式
根据本发明的一些方面,所公开的组合物包含聚类规则间隔短回文重复序列(CRISPR)核酸酶和/或包含编码该核酸酶的序列的核酸分子。
表1列出了新颖CRISPR核酸酶,以及每个核酸酶内一个或多个位置处的取代,这些取代将核酸酶转化为切口酶或催化失活的核酸酶。
表2提供了crRNA、tracrRNA和单引导RNA(sgRNA)序列,以及crRNA、tracrRNA和sgRNA序列的与每个列出的CRISPR核酸酶兼容的部分。因此,作为crRNA:tracrRNA复合物的一部分能够结合和靶向表2中列出的OMNI核酸酶的crRNA分子可以包含表2中列出的任何crRNA序列。类似地,作为crRNA:tracrRNA复合物的一部分能够结合和靶向表2中列出的OMNI核酸酶的tracrRNA分子可以包含表2中列出的任何tracrRNA序列。此外,能够结合和靶向表2中列出的OMNI核酸酶的单引导RNA分子可以包含表2中列出的任何序列。
例如,OMNI-103核酸酶的crRNA分子(SEQ ID NO:1)可以包含SEQ ID NO:4-7和18-21中的任一者的序列;OMNI-103核酸酶的tracrRNA分子可以包含SEQ ID NO:8-14、17、22-28和32中的任一者的序列;并且OMNI-103核酸酶的sgRNA分子可以包含SEQ ID NO:4-36中的任一者的序列。每个OMNI核酸酶的其他crRNA分子、tracrRNA分子或sgRNA分子可以以相同的方式衍生自表2中列出的序列。
本发明提供了一种非天然存在的组合物,其包含:CRISPR核酸酶,其包含与SEQ IDNO:1的氨基酸序列具有至少90%同一性的序列,或核酸分子,其包含编码该CRISPR核酸酶的序列。核酸分子可以是例如DNA分子或RNA分子。
在一些实施例中,CRISPR核酸酶具有完全的催化活性、是切口酶、或无催化活性、并且融合至DNA相互作用或修饰性蛋白。例如,CRISPR核酸酶可以融合至脱氨酶蛋白,以用于碱基编辑方法。在另一个实例中,CRISPR核酸酶可以融合至逆转录酶,以用于引物编辑方法。
在一些实施例中,组合物进一步包含一个或多个RNA分子,或编码所述一个或多个RNA分子中的任一者的DNA多核苷酸,其中所述一个或多个RNA分子和该CRISPR核酸酶不天然地一起存在,并且所述一个或多个RNA分子配置成与该CRISPR核酸酶形成复合物及/或将该复合物靶向靶位点。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:4-36组成的组的序列。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,该分子包含引导序列部分和选自由SEQ ID NO:4-7和18-21组成的组的序列。
在一些实施例中,组合物进一步包含反式活化CRISPR RNA(tracrRNA)分子,该分子包含由SEQ ID NO:8-14、17、22-28和32组成的组中所示的序列。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,该分子包含引导序列部分和选自由SEQ ID NO:4-36组成的组的序列。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,该分子包含引导序列部分和长度为至少79个核苷酸的支架部分。
在一些实施例中,CRISPR核酸酶是具有失活RuvC结构域的切口酶,其是通过表1的第5列中为CRISPR核酸酶提供的位置处的氨基酸取代而创建的。
在一些实施例中,CRISPR核酸酶是具有失活HNH结构域的切口酶,其是通过表1的第6列中为CRISPR核酸酶提供的位置处的氨基酸取代而创建的。
在一些实施例中,CRISPR核酸酶是具有失活RuvC结构域和失活HNH结构域的催化失活的核酸酶,其是通过表1的第7列中为CRISPR核酸酶提供的位置处的取代而创建的。
例如,可以通过将OMNI-103核酸酶的氨基酸序列(SEQ ID NO:1)的第12位中的天冬氨酸残基(D)替换为另一个氨基酸例如丙氨酸(A)来灭活其RuvC结构域,从而生成用于OMNI-103的切口酶。对于表1第5-7列中所示的氨基酸位置中的每一个,允许替换为任何其他氨基酸,除非氨基酸位置后跟星号,这表明除了天冬氨酸(D)到谷氨酸(E)或谷氨酸(E)或天冬氨酸(D)以外的任何取代都导致失活。例如,可以通过将OMNI-103核酸酶的氨基酸序列(SEQ ID NO:1)的第856位中的天冬氨酸(D)替换为除谷氨酸残基(E)以外的氨基酸例如丙氨酸(A)来灭活其HNH结构域,从而生成用于OMNI-103的切口酶。可以使用表1中的相同符号生成其他切口酶或催化失活的核酸酶。
在一些实施例中,CRISPR核酸酶是通过位置D12、E776、H988或D991处的氨基酸取代而创建的切口酶。
在一些实施例中,CRISPR核酸酶是通过位置D856、H857或N880处的氨基酸取代而创建的切口酶,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
在一些实施例中,CRISPR核酸酶是通过位置D12、E776、H988或D991中的任何一者处的氨基酸取代以及位置D856、H857或N880中的任何一者处的氨基酸取代而创建的催化失活的核酸酶,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
在一些实施例中,CRISPR核酸酶利用表3的第2列或第3列中为CRISPR核酸酶提供的原型间隔区相邻基序(PAM)序列。
本发明还提供了一种用于修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入上述任何一种组合物。在一些实施例中,组合物包含CRISPR核酸酶和crRNA:tracrRNA复合物或sgRNA分子。
在一些实施例中,CRISPR核酸酶在与表3的第2列或第3列中为CRISPR核酸酶提供的原型间隔区相邻基序(PAM)序列相邻的DNA链中实现DNA断裂,并且在与PAM序列互补的序列相邻的DNA链中实现DNA断裂。例如,具有适当靶向性sgRNA或crRNA:tracrRNA复合物的OMNI-103核酸酶能够在与NNRRHY、NNRACT或NNRVCT序列相邻的链中以及与NNRRHY、NNRACT或NNRVCT序列互补的序列相邻的DNA链中形成DNA断裂。在一些实施例中,DNA链在细胞的核内。
在一些实施例中,CRISPR核酸酶是具有失活RuvC结构域的切口酶,其是通过表1的第5列中为CRISPR核酸酶提供的位置处的氨基酸取代而创建的,并且在与PAM序列互补的序列相邻的DNA链中实现DNA断裂。
在一些实施例中,CRISPR核酸酶是具有失活HNH结构域的切口酶,其是通过表1的第6列中为CRISPR核酸酶提供的位置处的氨基酸取代而创建的,并且在与PAM序列相邻的DNA链中实现DNA断裂。
在一些实施例中,CRISPR核酸酶是具有失活RuvC结构域和失活HNH结构域的催化失活的核酸酶,其是通过表1的第7列中为CRISPR核酸酶提供的位置处的取代而创建的,并且在与PAM序列相邻的DNA链中实现DNA断裂。
本发明还提供了一种修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入本文提供的任何一种组合物。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,其中CRISPR核酸酶实现与NNRRHY、NNRACT或NNRVCT原型间隔区相邻基序(PAM)序列相邻的DNA链断裂,及/或实现与PAM序列互补的序列相邻的DNA链断裂。
在一些实施例中,CRISPR核酸酶是通过位置D12、E776、H988或D991处的氨基酸取代而创建的切口酶,并且实现与PAM序列相邻的DNA链断裂。
在一些实施例中,CRISPR核酸酶是通过位置D856、H857或N880处的氨基酸取代而创建的切口酶,并且实现与PAM序列互补的序列相邻的DNA链断裂,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
在一些实施例中,细胞是真核细胞或原核细胞。
在一些实施例中,细胞是哺乳动物细胞。
在一些实施例中,细胞是人类细胞。
在一些实施例中,CRISPR核酸酶包含与SEQ ID NO:1的CRISPR核酸酶具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%或82%氨基酸序列同一性的氨基酸序列。在实施例中,编码CRISPR核酸酶的序列与选自由SEQ ID NO:2-3组成的组的核酸序列具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%或82%同一性。
本发明还提供了一种非天然存在的组合物,其包含CRISPR核酸酶,其中该CRISPR核酸酶包含与SEQ ID NO:1的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列相对应的氨基酸序列,
a)其中结构域A包含与SEQ ID NO:1的氨基酸1-45具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
b)其中结构域B包含与SEQ ID NO:1的氨基酸46-83具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
c)其中结构域C包含与SEQ ID NO:1的氨基酸84-158具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
d)其中结构域D包含与SEQ ID NO:1的氨基酸159-302具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
e)其中结构域E包含与SEQ ID NO:1的氨基酸303-515具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
f)其中结构域F包含与SEQ ID NO:1的氨基酸516-727具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
g)其中结构域G包含与SEQ ID NO:1的氨基酸728-778具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
h)其中结构域H包含与SEQ ID NO:1的氨基酸779-923具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
i)其中结构域I包含与SEQ ID NO:1的氨基酸924-1068具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;并且
j)其中结构域J包含与SEQ ID NO:1的氨基酸1069-1348具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
根据本发明的一些方面,所公开的组合物包含DNA构建体或载体系统,该载体系统包含编码CRISPR核酸酶或变体CRISPR核酸酶的核苷酸序列。在一些实施例中,编码CRISPR核酸酶或变体CRISPR核酸酶的核苷酸序列可操作地连接至在目标细胞中可操作的启动子。在一些实施例中,目标细胞是真核细胞。在一些实施例中,目标细胞是哺乳动物细胞。在一些实施例中,编码工程化CRISPR核酸酶的核酸序列是经过密码子优化的,以用于来自特定生物体的细胞。在一些实施例中,编码核酸酶的核酸序列针对大肠杆菌进行了密码子优化。在一些实施例中,编码核酸酶的核酸序列针对真核细胞进行了密码子优化。在一些实施例中,编码核酸酶的核酸序列针对哺乳动物细胞进行了密码子优化。
在一些实施例中,组合物包含重组核酸,该重组核酸包含可操作地连接至编码CRISPR酶的多核苷酸的异源启动子,该多核苷酸与SEQ ID NO:1具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%同一性。每种可能性代表单独的实施例。
在组合物的一个实施例中,CRISPR核酸酶与SEQ ID NO:1中所示的氨基酸序列具有至少75%、80%、85、90%、95%或97%同一性或者编码CRISPR核酸酶的序列与选自由SEQID NO:2和3组成的组的核苷酸序列具有至少75%、80%、85%、90%、95%或97%序列同一性。
根据一些实施例,提供了一种工程化的或非天然存在的组合物,其包含:CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%同一性的序列,或核酸分子,其包含编码该CRISPR核酸酶的序列。每种可能性代表单独的实施例。
在实施例中,CRISPR核酸酶是工程化的或非天然存在的。该CRISPR核酸酶也可以是重组的。此类CRISPR核酸酶是如下产生的:使用实验室方法(例如分子克隆)将来自多个来源的遗传物质汇集在一起,从而创建以其他方式不会在生物有机体内发现的序列。
在实施例中,CRISPR核酸酶进一步包含能够与靶向DNA的RNA分子(gRNA)相互作用的RNA结合性部分和表现出定点酶促活性的活性部分。
在实施例中,组合物进一步包含靶向DNA的RNA分子或编码靶向DNA的RNA分子的DNA多核苷酸,其中该靶向DNA的RNA分子包含引导序列部分,即与靶区域中的序列互补的核苷酸序列,其中该靶向DNA的RNA分子和该CRISPR核酸酶不天然地一起存在。
在实施例中,靶向DNA的RNA分子进一步包含可以与CRISPR核酸酶形成复合物的核苷酸序列。
本发明还提供了一种包含CRISPR相关系统的非天然存在的组合物,该系统包含:
a)一个或多个RNA分子,其包含连接至正向重复序列的引导序列部分,其中该引导序列能够与靶序列或编码所述一个或多个RNA分子的一个或多个核苷酸序列杂交;以及
b)CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的氨基酸序列,或核酸分子,其包含编码该CRISPR核酸酶的序列;
其中所述一个或多个RNA分子与该靶序列杂交,其中该靶序列与原型间隔区相邻基序(PAM)相邻,并且所述一个或多个RNA分子与RNA引导性核酸酶形成复合物。
在实施例中,组合物进一步包含:包含可与CRISPR核酸酶形成复合物的核苷酸序列的RNA分子(例如tracrRNA分子)或包含编码可与CRISPR核酸酶形成复合物的RNA分子的序列的DNA多核苷酸。
在实施例中,组合物进一步包含用于同源定向修复(HDR)的供体模板。
在实施例中,组合物能够编辑细胞的基因组中的靶区域。
根据一些实施例,提供了一种非天然存在的组合物,其包含:
(a)CRISPR核酸酶,或编码该CRISPR核酸酶的多核苷酸,其包含:
RNA结合性部分;和
表现出定点酶促活性的活性部分,其中该CRISPR核酸酶与SEQ ID NO:1具有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%同一性;以及
(b)一个或多个RNA分子或编码所述一个或多个RNA分子的DNA多核苷酸,其包含:
i)靶向DNA的RNA序列,其包含与靶DNA序列中的序列互补的核苷酸序列;
ii)蛋白质结合型RNA序列,其能够与该CRISPR核酸酶的RNA结合性部分相互作用,
其中该靶向DNA的RNA序列和该CRISPR核酸酶不天然地一起存在。每种可能性代表单独的实施例。
在一些实施例中,提供了一种包含靶向DNA的RNA序列和蛋白质结合型RNA序列的单一RNA分子,其中该RNA分子可以与该CRISPR核酸酶形成复合物并用作DNA靶向模块。在一些实施例中,RNA分子的长度为至多1000个碱基、900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基、100个碱基、50个碱基。每种可能性代表单独的实施例。在一些实施例中,包含靶向DNA的RNA序列的第一RNA分子和包含蛋白质结合型RNA序列的第二RNA分子通过碱基配对相互作用或可替代地融合在一起以形成一个或多个与CRISPR核酸酶复合并用作DNA靶向模块的RNA分子。
本发明还提供了一种非天然存在的组合物,其包含:
a)CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的序列,或核酸分子,其包含编码该CRISPR核酸酶的序列;以及
b)一个或多个RNA分子,或编码所述一个或多个RNA分子的一个或多个DNA多核苷酸,其包含以下中的至少一者:
i)核酸酶结合型RNA核苷酸序列,其能够与该CRISPR核酸酶相互作用/结合;
以及
ii)靶向DNA的RNA核苷酸序列,其包含与靶DNA序列中的序列互补的序列,其中该CRISPR核酸酶能够与所述一个或多个RNA分子复合,以形成能够与该靶DNA序列杂交的复合物。
在实施例中,CRISPR核酸酶与一个或多个RNA分子形成能够结合至靶DNA序列以实现靶DNA序列的切割的CRISPR复合物。
在实施例中,CRISPR核酸酶和一个或多个RNA分子中的至少一个RNA分子不天然地一起存在。
在实施例中:
a)CRISPR核酸酶包含RNA结合性部分和表现出定点酶促活性的活性部分;
b)靶向DNA的RNA核苷酸序列包含与靶DNA序列中的序列互补的核苷酸序列;
并且
c)核酸酶结合型RNA核苷酸序列包含与CRISPR核酸酶的RNA结合性部分相互作用的序列。
在实施例中,核酸酶结合型RNA核苷酸序列和靶向DNA的RNA核苷酸序列在单引导RNA分子(sgRNA)上,其中sgRNA分子可以与CRISPR核酸酶形成复合物并用作DNA靶向模块。
在实施例中,核酸酶结合型RNA核苷酸序列在第一RNA分子上并且靶向DNA的RNA核苷酸序列在第二RNA分子上,并且其中第一和第二RNA分子通过碱基配对相互作用或融合在一起以形成与CRISPR核酸酶形成复合物并用作DNA靶向模块的RNA复合物或sgRNA。
在实施例中,sgRNA的长度为至多1000个碱基、900个碱基、800个碱基、700个碱基、600个碱基、500个碱基、400个碱基、300个碱基、200个碱基、100个碱基、50个碱基。
在实施例中,组合物进一步包含用于同源定向修复(HDR)的供体模板。
在实施例中,CRISPR核酸酶是非天然存在的。
在实施例中,CRISPR核酸酶是工程化的,并且包含非天然或合成氨基酸。
在实施例中,CRISPR核酸酶是工程化的,并且包含核定位序列(NLS)、细胞穿透肽序列和/或亲和标签中的一者或多者。
在实施例中,CRISPR核酸酶包含一个或多个核定位序列,其强度足以驱动包含CRISPR核酸酶的CRISPR复合物在真核细胞的细胞核中以可检测的量积累。
本发明还提供了一种修饰无细胞系统或细胞的基因组中靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入本发明的任何组合物。
在实施例中,细胞是真核细胞。
在另一个实施例中,细胞是原核细胞。
在一些实施例中,一个或多个RNA分子进一步包含:包含可与RNA核酸酶形成复合物的核苷酸分子的RNA序列(tracrRNA)或编码包含可与CRISPR核酸酶形成复合物的核苷酸序列的RNA分子的DNA多核苷酸。
在实施例中,CRISPR核酸酶包含:氨基末端处或附近的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS;羧基末端或附近处的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS;或氨基末端处或附近的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS与羧基末端或附近处的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS的组合。在实施例中,1个至4个NLS与CRISPR核酸酶融合。在实施例中,NLS位于CRISPR核酸酶的开放阅读框(ORF)内。
在所表达的蛋白质的氨基末端处或附近、羧基末端处或附近、或在ORF内融合NLS的方法是本领域众所周知的。例如,为了将NLS融合至CRISPR核酸酶的氨基末端,将NLS的核酸序列紧接在编码NLS融合的CRISPR核酸酶的核酸上的CRISPR核酸酶的起始密码子之后放置。相反,为了将NLS融合至CRISPR核酸酶的羧基末端,将NLS的核酸序列置于编码CRISPR核酸酶的最后一个氨基酸的密码子之后和终止密码子之前。
本发明考虑了在沿CRISPR核酸酶的ORF的任何位置处的NLS、细胞穿透肽序列和/或亲和标签的任何组合。
本文提供的CRISPR核酸酶的氨基酸序列和核酸序列可以包括插入的NLS和/或TAG,以便中断CRISPR核酸酶的连续氨基酸或核酸序列。
在实施例中,一个或多个NLS是串联重复序列。
在实施例中,当NLS的最近的氨基酸在沿多肽链从N末端或C末端起约1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、40个、50个或更多个氨基酸内时,认为一个或多个NLS接近于N末端或C末端。
如所讨论的,CRISPR核酸酶可以被工程化为包含核定位序列(NLS)、细胞穿透肽序列和/或亲和标签中的一者或多者。
在实施例中,组合物进一步包含重组核酸分子,该重组核酸分子包含可操作地连接至包含编码CRISPR核酸酶的序列的核苷酸分子的异源启动子。
在实施例中,CRISPR核酸酶或包含编码CRISPR核酸酶的序列的核酸分子是非天然存在的或工程化的。
本发明还提供了包含载体系统的非天然存在的或工程化的组合物,该载体系统包含核酸分子,该核酸分子包含编码本发明的任何CRISPR核酸酶的序列。
本发明还提供了本发明的任何组合物用于治疗患有与基因组突变相关的疾病的受试者的用途,该用途包括修饰受试者基因组中靶位点处的核苷酸序列。
本发明提供了一种修饰哺乳动物细胞的基因组中的靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入(i)组合物,该组合物包含与SEQ ID NO:1的氨基酸序列具有至少95%同一性的CRISPR核酸酶或包含编码CRISPR核酸酶的序列的核酸分子,该序列与SEQ ID NO:2-3的核酸序列具有至少95%同一性,以及(ii)靶向DNA的RNA分子,或编码靶向DNA的RNA分子的DNA多核苷酸,其包含与靶DNA中的序列互补的核苷酸序列。
在一些实施例中,该方法离体进行。在一些实施例中,该方法在体内进行。在一些实施例中,该方法的一些步骤离体进行并且一些步骤在体内进行。在一些实施例中,哺乳动物细胞是人类细胞。
在实施例中,该方法进一步包括向细胞中引入以下各项:(iii)包含tracrRNA序列的RNA分子或编码包含tracrRNA序列的RNA分子的DNA多核苷酸。
在实施例中,靶向DNA的RNA分子包含crRNA重复序列。
在实施例中,包含tracrRNA序列的RNA分子能够结合靶向DNA的RNA分子。
在实施例中,靶向DNA的RNA分子和包含tracrRNA序列的RNA分子相互作用以形成RNA复合物,并且RNA复合物能够与CRISPR核酸酶形成活性复合物。
在实施例中,靶向DNA的RNA分子和包含核酸酶结合型RNA序列的RNA分子以适合与CRISPR核酸酶形成活性复合物的单引导RNA分子的形式融合。
在实施例中,引导序列部分包含与原型间隔区序列互补的序列。
在实施例中,CRISPR核酸酶与靶向DNA的RNA分子形成复合物,并在原型间隔区相邻基序(PAM)的3'或5'区域实现双链断裂。
在本文所述的任何方法的一个实施例中,该方法用于治疗患有与基因组突变相关的疾病的受试者,包括修饰受试者基因组中靶位点处的核苷酸序列。
在实施例中,该方法包括首先选择患有与基因组突变相关的疾病的受试者并从该受试者获得细胞。
本发明还提供了通过本文所述的任何方法获得的一种或多种经修饰细胞。在实施例中,这些一种或多种经修饰细胞能够产生子代细胞。在实施例中,这些一种或多种经修饰细胞能够在植入后产生子代细胞。
本发明还提供了一种包含这些经修饰细胞和药学上可接受的载体的组合物。还提供了一种制备该组合物的体外或离体方法,该方法包括将细胞与药学上可接受的载体混合。
本发明还提供了一种组合物,其包含非天然存在的RNA分子,该RNA分子包含crRNA重复序列部分和引导序列部分,其中该RNA分子在存在tracrRNA序列的情况下与OMNI-103核酸酶形成复合物并将该核酸酶靶向DNA靶位点,其中该tracrRNA序列由该RNA分子的tracrRNA部分或第二RNA分子的tracrRNA部分编码。
在一些实施例中,crRNA重复序列部分的长度为至多17个核苷酸,优选地长度为14个至17个核苷酸。
在一些实施例中,crRNA重复序列部分与SEQ ID NO:114或115具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
在一些实施例中,crRNA重复序列部分与SEQ ID NO:114或115中的任一者具有至少95%序列同一性。
在一些实施例中,crRNA重复序列是除SEQ ID NO:115以外的序列。
在一些实施例中,包含crRNA重复序列部分和引导序列部分的RNA分子进一步包含tracrRNA部分。
在一些实施例中,crRNA重复序列部分通过多核苷酸接头部分共价连接至tracrRNA部分。
在一些实施例中,组合物包含第二RNA分子,该第二RNA分子包含tracrRNA部分。
在一些实施例中,OMNI-103核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性。
在一些实施例中,引导序列部分的长度为17个至30个核苷酸,优选地长度为22个核苷酸。
本发明还提供了一种组合物,其包含非天然存在的RNA分子,该RNA分子包含tracrRNA部分,其中该RNA分子在存在crRNA重复序列部分和引导序列部分的情况下与OMNI-103核酸酶形成复合物并将该核酸酶靶向DNA靶位点,其中该crRNA重复序列部分和该引导序列部分由该RNA分子或第二RNA分子编码。
在一些实施例中,tracrRNA部分的长度小于85个核苷酸,优选地长度为84个至80个、79个至75个、74个至70个、69个至65个或64个至60个核苷酸。
在一些实施例中,tracrRNA部分与SEQ ID NO:109-113中的任一者的tracrRNA部分具有至少30%-40%、41%-50%、51%-60%、61%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
在一些实施例中,tracrRNA部分与SEQ ID NO:109-113中的任一者的tracrRNA部分具有至少95%序列同一性。
在一些实施例中,tracrRNA部分是除SEQ ID NO:15或16的tracr部分以外的部分。
在一些实施例中,tracrRNA部分包含长度为至多19个核苷酸、优选地长度为16个至19个核苷酸的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA部分包含与SEQ ID NO:116或117中的任一者具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA部分包含与SEQ ID NO:116或117中的任一者具有至少95%序列同一性的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA部分包含具有除SEQ ID NO:117以外的序列的tracrRNA抗重复序列部分。
在一些实施例中,RNA分子包含tracrRNA部分,并且进一步包含crRNA重复序列部分和引导序列部分。
在一些实施例中,tracrRNA部分通过多核苷酸接头部分共价连接至crRNA重复序列。
在一些实施例中,多核苷酸接头部分的长度为4个至10个核苷酸。
在一些实施例中,多核苷酸接头具有GAAA序列。
在一些实施例中,组合物进一步包含第二RNA分子,该第二RNA分子包含crRNA重复序列部分和引导序列部分。
在一些实施例中,OMNI-103核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性。
在一些实施例中,引导序列部分的长度为17个至30个核苷酸,优选地长度为22个核苷酸。
本发明还提供了一种组合物,其包含非天然存在的RNA分子,该RNA分子包含RNA支架部分,该RNA支架部分具有以下结构:
crRNA重复序列部分-tracrRNA部分;
其中该RNA支架部分与OMNI-103 CRISPR核酸酶形成复合物并将该核酸酶靶向与该RNA分子的引导序列部分具有互补性的DNA靶位点。
在一些实施例中,OMNI-103核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性。
在一些实施例中,RNA支架部分的长度为110个至105个、104个至100个、99个至95个、94个至90个、89个至85个、84个至80个、79个至75个或74个至70个核苷酸。
在一些实施例中,RNA支架部分的长度为107个、101个、95个、85个或79个核苷酸。
在一些实施例中,RNA支架部分与SEQ ID NO:109-113中的任一者具有至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%或至少95%序列同一性。
在一些实施例中,crRNA重复序列部分的长度为至多17个核苷酸,优选地长度为14个至17个核苷酸。
在一些实施例中,crRNA重复序列部分与SEQ ID NO:114或115具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
在一些实施例中,crRNA重复序列部分与SEQ ID NO:114或115中的任一者具有至少95%序列同一性。
在一些实施例中,crRNA重复序列是除SEQ ID NO:23以外的序列。
在一些实施例中,tracrRNA部分的长度小于85个核苷酸,优选地长度为84个至80个、79个至75个、74个至70个、69个至65个或64个至60个核苷酸。
在一些实施例中,tracrRNA部分与SEQ ID NO:109-113中的任一者的tracrRNA部分具有至少30%-40%、41%-50%、51%-60%、61%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
在一些实施例中,tracrRNA部分与SEQ ID NO:109-113中的任一者的tracrRNA部分具有至少95%序列同一性。
在一些实施例中,tracrRNA部分是除SEQ ID NO:15或16的tracrRNA部分以外的部分。
在一些实施例中,RNA支架部分进一步包含介于该crRNA重复序列部分与该tracrRNA部分之间的接头部分,使得该RNA支架具有以下结构:
crRNA重复序列部分-接头部分-tracrRNA部分。
在一些实施例中,tracrRNA部分包含tracrRNA抗重复序列部分,其中该crRNA重复序列和该tracrRNA抗重复序列部分通过该接头部分共价连接。
在一些实施例中,接头部分是长度为4个至10个核苷酸的多核苷酸接头。
在一些实施例中,多核苷酸接头具有GAAA序列。
在一些实施例中,tracrRNA部分包含长度为至多19个核苷酸、优选地长度为16个至19个核苷酸的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA部分包含与SEQ ID NO:116或117中的任一者具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA部分包含与SEQ ID NO:116或117中的任一者具有至少95%序列同一性的tracrRNA抗重复序列部分。
在一些实施例中,tracrRNA抗重复序列是除SEQ ID NO:117以外的序列。
在一些实施例中,tracrRNA部分包含连接至tracrRNA抗重复部分的核苷酸的第一段,并且该核苷酸的第一段与SEQ ID NO:118-120中的任一者具有至少95%序列同一性。
在一些实施例中,tracrRNA部分包含连接至核苷酸的第一段的核苷酸的第二段,并且该核苷酸的第二段与SEQ ID NO:121-124中的任一者具有至少95%序列同一性。
在一些实施例中,RNA支架部分与SEQ ID NO:109-113中的任一者的核苷酸序列具有至少95%同一性。
在一些实施例中,RNA支架部分具有V2、V2.1、V2.2、V2.3、V2.4或V2.5 RNA支架中的任何一者的预测结构。
在一些实施例中,RNA支架部分具有除SEQ ID NO:15或16以外的序列。
在一些实施例中,引导序列部分共价连接至RNA分子的crRNA重复序列部分,形成具有以下结构的单引导RNA分子:
引导序列部分-crRNA重复序列部分-tracrRNA部分。
在一些实施例中,引导序列部分的长度为17个至30个核苷酸、更优选地20个至23个核苷酸、更优选地22个核苷酸。
在一些实施例中,组合物进一步包含OMNI-103 CRISPR核酸酶,其中该OMNI-103CRISPR核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%同一性。
在一些实施例中,RNA分子通过体外转录(IVT)或固相人工寡核苷酸合成形成。
在一些实施例中,RNA分子包含经修饰的核苷酸。
本发明还提供了一种多核苷酸分子,其编码上述实施例中的任何一个实施例的RNA分子。
本发明还提供了一种修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的方法,该方法包括向该系统或细胞中引入本文呈现的任何一种RNA分子和CRISPR核酸酶,该CRISPR核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性。
在一些实施例中,细胞是真核细胞或原核细胞。
在一些实施例中,真核细胞是人类细胞或植物细胞。
本发明还提供了一种用于修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的试剂盒,该试剂盒包括向该系统或细胞中引入上述实施例中的任何一个实施例的组合物、与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性的CRISPR核酸酶,以及用于将该RNA分子和该CRISPR核酸酶递送至该细胞的说明。
在本发明的实施例中,非天然存在的RNA分子包含“间隔区”或“引导序列”部分。RNA分子的“间隔区部分”或“引导序列部分”是指能够杂交至特定靶DNA序列的核苷酸序列,例如,引导序列部分具有与沿该引导序列部分的长度被靶向的DNA序列完全互补的核苷酸序列。在一些实施例中,引导序列部分的长度为17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,或长度为约17个至30个、17个至29个、17个至28个、17个至27个、17个至26个、17至25、17个至24个、18个至22个、19个至22个、18个至20个、17个至20个或21个至22个核苷酸。优选地,引导序列部分的全长与沿该引导序列部分的长度被靶向的DNA序列完全互补。引导序列部分可以是具有“支架部分”的RNA分子的一部分,该支架部分可与CRISPR核酸酶形成复合物并活化该CRISPR核酸酶,其中该RNA分子的该引导序列部分用作CRISPR复合物的DNA靶向性部分。当具有支架部分和引导序列部分的RNA分子与CRISPR分子同时存在时,该RNA分子能够将CRISPR核酸酶靶向特定的靶DNA序列。每种可能性代表单独的实施例。RNA分子间隔区部分可以被定制设计成靶向任何所需序列。
在实施例中,核酸酶结合型RNA核苷酸序列和靶向DNA的RNA核苷酸序列(例如间隔区或引导序列部分)在单引导RNA分子(sgRNA)上,其中sgRNA分子可以与OMNI-103 CRISPR核酸酶形成复合物并用作DNA靶向模块。
在实施例中,核酸酶结合型RNA核苷酸序列在第一RNA分子上并且靶向DNA的RNA核苷酸序列在第二RNA分子上,并且第一和第二RNA分子通过碱基配对相互作用并与CRISPR核酸酶复合,以用作靶向模块。
根据本发明的一些方面,所公开的方法包括一种修饰无细胞系统或细胞的基因组中靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入本文所述的实施例中的任何一个实施例的组合物。
本发明还提供了本发明的任何组合物或方法用于修饰细胞中DNA靶位点处的核苷酸序列的用途。
本发明提供了一种修饰真核细胞的基因组中靶位点处的核苷酸序列的方法。
本发明提供了一种修饰哺乳动物细胞的基因组中靶位点处的核苷酸序列的方法。在一些实施例中,哺乳动物细胞是人类细胞。
本发明提供了一种修饰植物细胞的基因组中靶位点处的核苷酸序列的方法。
在一些实施例中,该方法离体进行。在一些实施例中,该方法在体内进行。在一些实施例中,该方法的一些步骤离体进行并且一些步骤在体内进行。在一些实施例中,哺乳动物细胞是人类细胞。
本发明还提供了通过本文所述的任何方法获得的一种或多种经修饰细胞。在实施例中,这些一种或多种经修饰细胞能够产生子代细胞。在实施例中,这些一种或多种经修饰细胞能够在植入后产生子代细胞。
本发明还提供了一种包含这些经修饰细胞和药学上可接受的载体的组合物。还提供了一种制备该组合物的体外或离体方法,该方法包括将细胞与药学上可接受的载体混合。
本发明还提供了一种用于修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的试剂盒,该试剂盒包括向该系统或细胞中引入与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性的CRISPR核酸酶、一个或多个被配置成与CRISPR核酸酶形成复合物及/或将复合物靶向靶位点的RNA分子,以及将该RNA分子和该CRISPR核酸酶递送至该细胞的说明。例如,该试剂盒可用作诊断试剂盒以检测细胞或试管中的核苷酸分子中靶位点(例如DNA序列)的存在。
靶向DNA的RNA分子
RNA分子的“引导序列部分”是指能够杂交至特定靶DNA序列的核苷酸序列,例如,引导序列部分具有与沿该引导序列部分的长度被靶向的DNA序列部分或完全互补的核苷酸序列。在一些实施例中,引导序列部分的长度为17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸,或长度为约17个至50个、17个至49个、17个至48个、17个至47个、17个至46个、17个至45个、17个至44个、17个至43个、17个至42个、17个至41个、17个至40个、17个至39个、17个至38个、17个至37个、17个至36个、17个至35个、17个至34个、17个至33个、17个至31个、17个至30个、17个至29个、17个至28个、17个至27个、17个至26个、17个至25个、17个至24个、17个至22个、17个至21个、18个至25个、18个至24个、18个至23个、18个至22个、18个至21个、19个至25个、19个至24个、19个至23个、19个至22个、19个至21个、19个至20个、20个至22个、18个至20个、20个至21个、21个至22个或17个至20个核苷酸。引导序列部分的全长与沿该引导序列部分的长度被靶向的DNA序列完全互补。引导序列部分可以是可与CRISPR核酸酶形成复合物的RNA分子的一部分,其中该引导序列部分用作CRISPR复合物的DNA靶向性部分。当具有引导序列部分的DNA分子与CRISPR分子同时存在时,该RNA分子能够将CRISPR核酸酶靶向特定的靶DNA序列。每种可能性代表单独的实施例。RNA分子可以被定制设计成靶向任何所需序列。因此,包含“引导序列部分”的分子是一种靶向性分子。在本申请中,术语“引导分子”、“RNA引导分子”、“引导RNA分子”和“gRNA分子”与包含引导序列部分的分子同义,并且术语“间隔区”与“引导序列部分”同义。
在本发明的实施例中,当与包含具有17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸的引导序列部分的RNA分子一起使用时,CRISPR核酸酶具有其最大的切割活性。
单引导RNA(sgRNA)分子可用于将CRISPR核酸酶引导至所需的靶位点。单引导RNA包含引导序列部分以及支架部分。支架部分与CRISPR核酸酶相互作用,并与引导序列部分一起,活化CRISPR核酸酶并将该核酸酶靶向所需的靶位点。例如,支架部分可以被进一步设计成具有减小的尺寸。例如,OMNI-103 CRIPSR核酸酶展示了靶向核酸酶活性,其sgRNA分子具有长度仅为79个核苷酸的工程化支架部分。
根据本发明的一些方面,所公开的方法包括一种修饰无细胞系统或细胞的基因组中靶位点处的核苷酸序列的方法,该方法包括向该细胞中引入本文所述的实施例中的任何一个实施例的组合物。
在一些实施例中,细胞是真核细胞,优选地哺乳动物细胞或植物细胞。
根据本发明的一些方面,所公开的方法包括本文所述的任何一种组合物用于治疗患有与基因组突变相关的疾病的受试者的用途,该用途包括修饰受试者基因组中靶位点处的核苷酸序列。
根据本发明的一些方面,所公开的方法包括一种治疗患有突变病症的受试者,该方法包括将本文所述的任何一种组合物靶向与该突变病症相关的等位基因。
在一些实施例中,突变病症与选自以下中任一项的疾病或病状相关:肿瘤形成、年龄相关性黄斑变性、精神分裂症、神经系统、神经退行性或运动障碍、脆性X综合征、分泌酶相关病症、朊病毒相关病症、ALS、成瘾、自闭症、阿尔茨海默氏病、中性粒细胞减少症、炎症相关病症、帕金森氏病、血液和凝血疾病和病症、β地中海贫血、镰状细胞性贫血、细胞失调和肿瘤疾病和病症、炎症和免疫相关疾病和病症、代谢、肝脏、肾脏和蛋白质疾病和病症、肌肉和骨骼疾病和病症、皮肤疾病和病症、神经系统和神经元疾病和病症,以及眼部疾病和病症。
OMNI CRISPR核酸酶结构域
CRISPR核酸酶的特征性靶向核酸酶活性是由其特定结构域的各种功能赋予的。在本申请中,OMNI-103 CRISPR核酸酶域被定义为结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I和结构域J。
本文描述了每个OMNI-103 CRISPR核酸酶结构域的活性,其中每个结构域活性提供了核酸酶的有利特征的各个方面。
具体来说,结构域A、结构域G和结构域I形成OMNI CRISPR核酸酶的结构单元,该结构单元含有参与DNA链切割的核酸酶活性位点。由结构域A、结构域G和结构域I形成的结构单元切割一条DNA链,该DNA链被结合在双链DNA靶位点处的引导RNA分子置换。
结构域B在OMNI CRISPR核酸酶与靶DNA位点结合时参与启动DNA切割活性。
结构域C、结构域D、结构域E和结构域F结合引导RNA分子,并参与提供针对靶位点识别的特异性。
结构域H含有参与DNA链切割的核酸酶活性位点。结构域H切割引导RNA分子在DNA靶位点处结合的DNA链。
结构域J参与向OMNI CRISPR核酸酶提供PAM位点特异性,包括PAM位点询问和识别的各个方面。结构域J还执行拓扑异构酶活性。
对其他CRISPR核酸酶结构域及其一般功能的进一步描述可在以下文献中找到:尤其,Mir等人,ACS Chem.Biol.(2019),Palermo等人,Quarterly Reviews of Biophysics(2018),Jiang和Doudna,Annual Review of Biophysics(2017),Nishimasu等人,Cell(2014)以及Nishimasu等人,Cell(2015),该文献通过援引并入本文。
在本发明的一方面,与OMNI CRISPR核酸酶结构域具有相似性的氨基酸序列可用于设计和制造非天然存在的肽,例如CRISPR核酸酶,使得该肽显示出OMNI CRISPR核酸酶结构域活性的有利特征。
在实施例中,此类肽,例如CRISPR核酸酶,包含与OMNI-103 CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性的氨基酸序列。在一些实施例中,肽包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或至少十一个选自以下的氨基酸序列:与OMNI-103 CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I和结构域J的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性的氨基酸序列。每种可能性代表单独的实施例。在实施例中,相对于除与OMNI-103 CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列具有至少100%、99.5%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%或70%同一性的氨基酸序列以外的全长OMNI-103 CRISPR核酸酶氨基酸序列,该肽表现出广泛的氨基酸变异性。在实施例中,肽包含介于两个结构域序列之间的间插氨基酸序列。在实施例中,间插氨基酸序列的长度为1个至10个、10个至20个、20个至40个、40个至50个、50个至60个、80个至100个、100个至150个、150个至200个、200个至250个、至多100个、至多200个或至多300个氨基酸。每种可能性代表单独的实施例。在实施例中,间插序列是连接序列。在实施例中,CRISPR核酸酶包含来自OMNI CRISPR核酸酶的多个结构域,并且这些结构域优选地从CRISPR核酸酶的N末端到C末端按字母顺序排列。例如,包含OMNI-103的结构域A、结构域E和结构域I的CRISPR核酸酶,这些结构域在CRISPR核酸酶序列中的顺序将是结构域A、结构域E,并且最后是结构域I,可能在每个结构域的任一端或两端有间插序列。
在本发明的一方面,编码本文所述的OMNI CRISPR核酸酶的任何一个结构域的氨基酸序列可以包含相对于原始OMNI CRISPR核酸酶结构域序列的一个或多个氨基酸取代。氨基酸取代可以是保守取代,即替换为与原始氨基酸具有相似化学性质的氨基酸。例如,可以将带正电的氨基酸替换为候补带正电的氨基酸,例如可以将精氨酸残基替换为赖氨酸残基,或者可以将极性氨基酸替换为不同的极性氨基酸。保守取代更容易被接受,并且编码OMNI CRISPR核酸酶的任何一个结构域的氨基酸序列可以含有多达10%的此类取代。氨基酸取代可以是彻底的取代,即替换为与原始氨基酸具有不同化学性质的氨基酸。例如,可以将带正电的氨基酸替换为带负电的氨基酸,例如可以将精氨酸残基替换为谷氨酸残基,或者可以将极性氨基酸替换为非极性氨基酸。氨基酸取代可以是半保守取代,或者氨基酸取代可以是任何其他氨基酸。取代可能会改变相对于原始OMNI CRISPR核酸酶结构域功能的活性,例如降低催化核酸酶活性。
根据本发明的一些方面,所公开的组合物包含非天然存在的组合物,该非天然存在的组合物包含CRISPR核酸酶,其中该CRISPR核酸酶包含与OMNI-103 CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列相对应的氨基酸序列。补充表1中提供了每个结构域在其各自的OMNI CRISPR核酸酶氨基酸序列中的氨基酸范围。在本发明的一些实施例中,CRISPR核酸酶包含至少一个、至少两个、至少三个、至少四个或至少五个氨基酸序列,其中每个氨基酸序列对应于OMNI-103 CRISPR核酸酶的氨基酸序列结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的任何一个。因此,CRISPR核酸酶可以包括对应于OMNI CRISPR核酸酶的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的任何一个结构域的氨基酸序列的任何组合。在一些实施例中,氨基酸序列的长度为至少100个至250个、250个至500个、500个至1000个、1000个至1500个、1000个至1700个或1000个至2000个氨基酸。
疾病和疗法
本发明的某些实施例将核酸酶靶向与疾病或病症相关的特定遗传基因座,作为基因编辑、治疗方法或疗法的一种形式。例如,为了诱导基因的编辑或敲除,可以使用定制设计的引导RNA分子将本文公开的新颖核酸酶特异性靶向基因的致病性突变等位基因。引导RNA分子优选地通过首先考虑核酸酶的PAM要求来设计,如本文所示,这也取决于正在进行基因编辑的系统。例如,被设计成将OMNI-103核酸酶靶向靶位点的引导RNA分子被设计成含有与邻接OMNI-103PAM序列的DNA双链区域的DNA链互补的间隔区,例如“NNRRHY”或“NNRACT”或“NNRVCT”。引导RNA分子进一步优选地被设计成含有足够且优选最佳长度的间隔区(即引导RNA分子中与靶等位基因具有互补性的区域),以增加核酸酶的比活力并减少脱靶效应。
作为非限制性实例,引导RNA分子可以被设计成将核酸酶靶向突变等位基因的特定区域,例如在起始密码子附近,使得在由核酸酶引起的DNA损伤时,诱导非同源末端连接(NHEJ)途径并通过引入移码突变导致突变等位基因的沉默。这种引导RNA分子设计的方法对于改变显性失活突变的影响并从而治疗受试者特别有用。作为单独的非限制性实例,引导RNA分子可以被设计成靶向突变等位基因的特定致病性突变,使得在由核酸酶引起的DNA损伤时,诱导同源定向修复(HDR)途径并导致模板介导的突变等位基因的校正。这种引导RNA分子设计的方法对于改变突变等位基因的单倍体剂量不足效应并从而治疗受试者特别有用。
可被靶向改变以治疗疾病或病症的特定基因的非限制性实例在下文中呈现。文献中描述了诱发突变病症的特定疾病相关基因和突变。此类突变可用于将靶向DNA的RNA分子设计成将CRISPR组合物靶向疾病相关基因的等位基因,其中CRISPR组合物引起DNA损伤并诱导DNA修复途径以改变等位基因,从而治疗突变病症。
ELANE基因的突变与中性粒细胞减少症有关。因此,在没有限制的情况下,本发明的靶向ELANE的实施例可用于治疗患有中性粒细胞减少症的受试者的方法。
CXCR4是人免疫缺陷病毒1型(HIV-1)感染的共同受体。因此,在没有限制的情况下,本发明的靶向CXCR4的实施例可用于治疗患有HIV-1的受试者或赋予受试者对HIV-1感染的抗性的方法。
程序性细胞死亡蛋白1(PD-1)的破坏增强了CAR-T细胞介导的对肿瘤细胞的杀伤,并且PD-1可以是其他癌症疗法的靶标。因此,在没有限制的情况下,本发明的靶向PD-1的实施例可用于治疗患有癌症的受试者的方法。在实施例中,治疗是使用根据本发明被修饰为PD-1缺陷型的T细胞进行CAR-T细胞疗法。
此外,BCL11A是一种在抑制血红蛋白生成中起作用的基因。通过抑制BCL11A,可以增加血红蛋白的产生,以治疗地中海贫血或镰状细胞性贫血等疾病。参见,例如,PCT国际公开号WO 2017/077394A2;美国公开号US2011/0182867A1;Humbert等人Sci.Transl.Med.(2019);和Canver等人Nature(2015)。因此,在没有限制的情况下,本发明的靶向BCL11A增强子的实施例可用于治疗患有β地中海贫血或镰状细胞性贫血的受试者的方法。
本发明的实施例还可以用于靶向任何疾病相关基因,用于研究、改变或治疗下表A或表B中列出的任何疾病或病症。事实上,任何与遗传基因座相关的疾病都可以通过使用本文公开的核酸酶靶向适当的疾病相关基因来进行研究、改变或治疗,例如,美国公开号2018/0282762A1和欧洲专利号EP3079726B1中列出的疾病。
表A-疾病、病症及其相关基因
表B-疾病、病症及其相关基因
除非另外定义,否则本文中使用的所有技术术语和/或科学术语的含义与本发明涉及的领域的普通技术人员通常理解的含义相同。尽管与本文所述的方法和材料类似或同等的材料和方法可以用于本发明的实施例的实践或测试,但下文描述了示例性方法和/或材料。在有冲突的情况下,以包含定义的专利说明书为准。另外,材料、方法和实例仅是说明性的并且不意在是必然进行限制。
在讨论中,除非另有说明,否则“基本上”和“约”等修饰本发明的实施例的一个或多个特征的条件或关系特征的形容词被理解为意指该条件或特征被定义为在对于预期应用的实施例的操作是可接受的公差内。除非另有说明,否则说明书和权利要求中的“或”一词被认为是包含性的“或”,而不是排他性的“或”,并且表示其连接的至少一项及其任意组合。
应当理解,如上文和本文别处所使用的,术语“一个(a/an)”是指所列举的组分中的“一个或多个”。除非另有具体说明,否则本领域普通技术人员将清楚,单数的使用包括复数。因此,术语“一个”和“至少一个”在本申请中可互换使用。
为了更好地理解本教导而不以任何方式限制教导的范围,除非另有说明,否则所有表示数量、百分比或比例的数字以及说明书和权利要求中使用的其他数值应被理解为在所有情况下都由术语“约”来修饰。因此,除非有相反的指示,否则以下说明书和所附权利要求中列出的数字参数是近似值,该近似值可以根据试图获得的期望特性而变化。任何数字参数应至少根据所报告的有效数字的数量并通过应用普通的四舍五入技术来进行解释。
应当理解,除非另有说明,否则在本文列举了数值范围的情况下,本发明涵盖上限与下限之间并且包括上限和下限的每个整数。
在本申请的说明书和权利要求中,动词“包含”、“包括”和“具有”及其变位中的每一个用于指示该动词的一个或多个对象不一定是该动词的一个或多个对象的组分、要素或部分的完整清单。本文使用的其他术语意在由它们在本领域中众所周知的含义来定义。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。这些术语是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任何三维结构并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由连锁分析定义的多个(一个)基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可以包含一个或多个经修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物。如果存在,则可以在组装聚合物之前或之后赋予对核苷酸结构的修饰。核苷酸序列可以被非核苷酸组分中断。可以在聚合后进一步修饰多核苷酸,诸如通过与标记组分缀合。
术语“核苷酸类似物”或“经修饰的核苷酸”是指在核苷的含氮碱基(例如,胞嘧啶(C)、胸腺嘧啶(T)或尿嘧啶(U)、腺嘌呤(A)或鸟嘌呤(G))之中或之上、在核苷的糖部分(例如,核糖、脱氧核糖、经修饰的核糖、经修饰的脱氧核糖、六元糖类似物或开链糖类似物)或磷酸盐之中或之上含有一种或多种化学修饰(例如,取代)的核苷酸。本文所述的RNA序列中的每一个可以包含一个或多个核苷酸类似物。
如本文使用的,以下核苷酸标识符用于表示参考的核苷酸碱基:
如本文使用的,术语“靶向性序列”或“靶向性分子”是指包含能够杂交至特定靶序列的核苷酸序列的核苷酸序列或分子,例如,靶向性序列具有至少部分地与沿该靶向性序列的长度被靶向的序列互补的核苷酸序列。靶向性序列或靶向性分子可以是可与CRISPR核酸酶形成复合物的靶向性RNA分子的一部分,其中该靶向性序列用作CRISPR复合物的靶向性部分。当具有靶向性序列的分子与CRISPR分子同时存在时,该RNA分子能够将CRISPR核酸酶靶向特定的靶序列。每种可能性代表单独的实施例。靶向性RNA分子可以被定制设计成靶向任何所需序列。
如本文使用的,术语“靶标”是指靶向性序列或靶向性分子与具有靶向核苷酸序列的核酸的优先杂交。应当理解,术语“靶标”涵盖可变的杂交效率,使得具有靶向核苷酸序列的核酸被优先靶向,但除了靶标杂交外,也可能发生无意的脱靶杂交。应当理解,在RNA分子靶向序列的情况下,RNA分子与CRISPR核酸酶分子的复合物靶向该序列以获得核酸酶活性。
在靶向存在于多个细胞中的DNA序列的上下文中,应当理解,该靶向涵盖RNA分子的引导序列部分与一个或多个细胞中的序列的杂交,并且还涵盖RNA分子与多个细胞中少于所有细胞的细胞中的靶序列的杂交。因此,应当理解,在RNA分子靶向多个细胞中的序列的情况下,RNA分子与CRISPR核酸酶的复合物被理解为与一个或多个细胞中的靶序列杂交,并且还可以与少于所有细胞的细胞中的靶序列杂交。因此,应当理解,RNA分子与CRISPR核酸酶的复合物在与一个或多个细胞中的靶序列杂交时引入双链断裂,并且还可以在与少于所有细胞的细胞中的靶序列杂交时引入双链断裂。如本文使用的,术语“经修饰的细胞”是指由于与靶序列杂交,即靶标杂交,双链断裂受到RNA分子与CRISPR核酸酶的复合物影响的细胞。
如本文使用的,术语“野生型”是技术人员所理解的本领域术语,并且意指有生物体、菌种、基因或特性在自然界中存在的典型形式,与突变体或变体形式相区别。因此,如本文使用的,在氨基酸或核苷酸的序列是指野生型序列的情况下,变体是指该序列的变体,例如,包含取代、缺失、插入。在本发明的实施例中,工程化的CRISPR核酸酶是变体CRISPR核酸酶,与表1中所示的任何CRISPR核酸酶的CRISPR核酸酶相比,其包含至少一个氨基酸修饰(例如,取代、缺失和/或插入)。
术语“非天然存在的”或“工程化的”可互换使用,并表示人为操作。当提及核酸分子或多肽时,这些术语可以意指,核酸分子或多肽至少基本上不含至少一种与它们在自然界中天然相关并且如在自然界中发现的其他组分。
如本文使用的,术语“氨基酸”包括天然和/或非天然的或合成的氨基酸,包括甘氨酸和D或I光学异构体两者,以及氨基酸类似物和肽模拟物。
如本文使用的,“基因组DNA”是指线性和/或染色体DNA,和/或是指质粒或存在于一个或多个目标细胞中的其他染色体外DNA序列。在一些实施例中,目标细胞是真核细胞。在一些实施例中,目标细胞是原核细胞。在一些实施例中,该方法在基因组DNA序列中的预定靶位点处产生双链断裂(DSB),从而导致基因组中靶位点处的DNA序列的突变、插入和/或缺失。
“真核”细胞包括但不限于真菌细胞(诸如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞。
如本文使用的,术语“核酸酶”是指能够切割核酸的核苷酸亚基之间的磷酸二酯键的酶。核酸酶可以从天然来源分离或衍生。天然来源可以是任何活的生物体。可替代地,核酸酶可以是保留磷酸二酯键切割活性的经修饰的或合成的蛋白质。
如本文使用的,术语“PAM”是指位于靶向DNA序列附近并被CRISPR核酸酶识别的靶DNA的核苷酸序列。PAM序列可能因核酸酶身份而不同。
如本文使用的,术语“突变病症”或“突变疾病”是指与由突变引起的基因功能障碍相关的任何病症或疾病。表现为突变病症的功能失调基因在其至少一个等位基因中包含突变,并且被称为“疾病相关基因”。突变可以在疾病相关基因的任何部分中,例如在调节、编码或非编码部分中。突变可以是任何种类的突变,诸如取代、插入或缺失。疾病相关基因的突变可根据任何类型的突变的机制表现为病症或疾病,诸如隐性、显性阴性、功能增益、功能缺失或导致基因产物单倍体剂量不足的突变。
技术人员将理解,本发明的实施例公开了能够与核酸酶,例如CRISPR核酸酶复合的RNA分子,诸如与原型间隔区相邻基序(PAM)旁边的目标靶基因组DNA序列相关联。然后核酸酶介导靶DNA的切割,以在原型间隔区内创建双链断裂。
在本发明的实施例中,CRISPR核酸酶与靶向性分子形成结合至靶DNA序列以实现靶DNA序列的切割的CRISPR复合物。CRISPR核酸酶可以形成包含CRISPR核酸酶和RNA分子而没有另外的单独的tracrRNA分子的CRISPR复合物。可替代地,CRISPR核酸酶可以在CRISPR核酸酶、RNA分子和tracrRNA分子之间形成CRISPR复合物。
术语“蛋白质结合序列”或“核酸酶结合序列”是指能够与CRISPR核酸酶结合以形成CRISPR复合物的序列。本领域技术人员将理解,能够与CRISPR核酸酶结合以形成CRISPR复合物的tracrRNA包含蛋白质或核酸酶结合序列。
CRISPR核酸酶的“RNA结合性部分”是指CRISPR核酸酶中可以结合至RNA分子以形成CRISPR复合物的一部分,例如tracrRNA分子的核酸酶结合序列。CRISPR核酸酶的“活性部分”或“活跃部分”是指CRISPR核酸酶中在DNA分子中实现双链断裂的一部分,例如当与靶向DNA的RNA分子复合时。
RNA分子可以包含与tracrRNA分子充分互补的序列,以便经由碱基配对杂交至tracrRNA并促进CRISPR复合物的形成。(参见美国专利号8,906,616)。在本发明的实施例中,RNA分子可以进一步包含具有tracr配对序列的部分。
在本发明的实施例中,靶向性分子可以进一步包含tracrRNA分子的序列。此类实施例可以被设计成RNA分子的引导部分(gRNA或crRNA)与反式活化crRNA(tracrRNA)的合成融合,从而一起形成单引导RNA(sgRNA)。(参见Jinek等人,Science(2012))。本发明的实施例还可以利用单独的tracrRNA分子和包含引导序列部分的单独的RNA分子形成CRISPR复合物。在此类实施例中,tracrRNA分子可以经由碱基配对与RNA分子杂交,并且在本文所述的本发明的某些应用中可能是有利的。
在本发明的实施例中,RNA分子可以包含“联结”区域和/或“发夹”区域,该区域可进一步限定RNA分子的结构。(参见Briner等人,Molecular Cell(2014))。
如本文使用的,术语“正向重复序列”是指核苷酸序列的特定氨基酸序列的两个或更多个重复序列。
如本文使用的,能够与CRISPR核酸酶“相互作用”或“结合”的RNA序列或分子是指能够与CRISPR核酸酶形成CRISPR复合物的RNA序列或分子。
如本文使用的,术语“可操作地连接”是指两个序列或分子之间允许它们以其预期方式发挥作用的关系(即融合、杂交)。在本发明的实施例中,当RNA分子可操作地连接至启动子时,允许RNA分子和启动子二者以它们预期的方式发挥作用。
如本文使用的,术语“异源启动子”是指不与被启动的分子或途径一起天然存在的启动子。
如本文使用的,如果分子的序列之间有X%的碱基或氨基酸是相同的且处于相同的相对位置,则一个序列或分子与另一个序列或分子具有X%的“序列同一性”。例如,与第二核苷酸序列具有至少95%序列同一性的第一核苷酸序列将在相同的相对位置具有至少95%的碱基与另一个序列相同。
核定位序列
术语“核定位序列”和“NLS”可互换使用,以指示氨基酸序列/肽,该氨基酸序列/肽指导与其相关的蛋白质从细胞的细胞质转运穿过核膜屏障。术语“NLS”旨在不仅涵盖特定肽的核定位序列,而且涵盖能够指导细胞质多肽易位穿过核膜屏障的核定位序列衍生物。NLS在连接至多肽的N末端、C末端或N末端和C末端两者时,能够指导多肽的核易位。此外,具有通过其N末端或C末端偶联至沿多肽的氨基酸序列随机定位的氨基酸侧链的NLS的多肽将发生易位。通常,NLS由暴露在蛋白质表面上的一个或多个带正电的赖氨酸或精氨酸短序列组成,但其他类型的NLS是已知的。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原、核质蛋白、c-myc、hRNPAl M9NLS、来自输入蛋白-α的IBB结构域、肌瘤T蛋白、人p53、小鼠c-abl IV、流感病毒NS1、肝炎病毒δ抗原、小鼠Mx1蛋白、人聚(ADP-核糖)聚合酶和类固醇激素受体(人)糖皮质激素。
递送
本文所述的CRISPR核酸酶或CRISPR组合物可以作为蛋白质、DNA分子、RNA分子、核糖核蛋白(RNP)、核酸载体或其任何组合来递送。在一些实施例中,RNA分子包含化学修饰。合适的化学修饰的非限制性实例包括2'-0-甲基(M)、2'-0-甲基、3'硫代磷酸酯(MS)或2'-0-甲基、3'硫代PACE(MSP)、假尿苷和1-甲基假尿苷。每种可能性代表本发明的独立实施例。
本文所述的CRISPR核酸酶和/或编码其的多核苷酸,以及任选的额外蛋白质(例如,ZFP、TALEN、转录因子、限制性内切酶)和/或核苷酸分子,诸如引导RNA,可以通过任何合适的方式递送至靶细胞。靶细胞可以是任何类型的细胞,例如,真核细胞或原核细胞,在任何环境中,例如,分离的或非分离的,维持在培养物中、体外、离体、体内或植物中。
在一些实施例中,待递送的组合物包括核酸酶的mRNA和引导的RNA。在一些实施例中,待递送的组合物包括核酸酶的mRNA、引导的RNA和供体模板。在一些实施例中,待递送的组合物包括CRISPR核酸酶和引导RNA。在一些实施例中,待递送的组合物包括CRISPR核酸酶、引导RNA和用于通过例如同源定向修复进行基因编辑的供体模板。在一些实施例中,待递送的组合物包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA。在一些实施例中,待递送的组合物包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA,以及供体模板。在一些实施例中,待递送的组合物包括CRISPR核酸酶、靶向DNA的RNA和tracrRNA。在一些实施例中,待递送的组合物包括CRISPR核酸酶、靶向DNA的RNA和tracrRNA以及用于通过例如同源定向修复进行基因编辑的供体模板。
可以使用任何合适的病毒载体系统来递送RNA组合物。常规的基于病毒和非病毒的基因转移方法可用于在细胞(例如,哺乳动物细胞、植物细胞等)和靶组织中引入核酸和/或CRISPR核酸酶。此类方法也可用于在体外向细胞施用编码核酸和/或CRISPR核酸酶蛋白。在某些实施例中,施用核酸和/或CRISPR核酸酶用于体内或离体基因疗法用途。非病毒载体递送系统包括裸核酸,以及与递送媒剂诸如脂质体或泊洛沙姆复合的核酸。关于基因疗法程序的回顾,参见Anderson,Science(1992);Nabel和Felgner,TIBTECH(1993);Mitani和Caskey,TIBTECH(1993);Dillon,TIBTECH(1993);Miller,Nature(1992);Van Brunt,Biotechnology(1988);Vigne等人,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin(1995);Haddada等人,CurrentTopics in Microbiology and Immunology(1995);以及Yu等人,Gene Therapy 1:13-26(1994)。
核酸和/或蛋白质的非病毒递送方法包括电穿孔、脂质转染、显微注射、基因枪法、粒子枪加速、病毒体、脂质体、免疫脂质体、脂质纳米颗粒(LNP)、聚阳离子或脂质:核酸缀合物、人工病毒粒子和试剂增强的核酸摄入,或者可以通过细菌或病毒(例如,农杆菌属、根瘤菌NGR234、苜蓿中华根瘤菌(Sinorhizoboiummeliloti)、百脉根中慢生根瘤菌(Mesorhizobium loti)、烟草花叶病毒、马铃薯X病毒、花椰菜花叶病毒和木薯脉花叶病毒)递送至植物细胞。参见,例如,Chung等人Trends Plant Sci.(2006)。使用例如Sonitron2000系统(Rich-Mar)的声孔效应也可用于递送核酸。阳离子脂质介导的蛋白质和/或核酸递送也被考虑为体内、离体或体外递送方法。参见Zuris等人,Nat.Biotechnol.(2015)、Coelho等人,N.Engl.J.Med.(2013);Judge等人,Mol.Ther.(2006);和Basha等人,Mol.Ther.(2011)。
非病毒载体,诸如基于转座子的系统,例如重组睡美人转座子系统或重组PiggyBac转座子系统也可被递送至靶细胞,并用于组合物分子的多核苷酸序列或编码组合物分子的多核苷酸序列在靶细胞中的转座。
另外的示例性核酸递送系统包括由Biosystems(德国科隆市)、Maxcyte,Inc.(马里兰州罗克维尔市)、BTX Molecular Delivery Systems(马萨诸塞州霍利斯顿市)和Copernicus Therapeutics Inc.提供的那些系统(参见例如美国专利号6,008,336)。脂质转染描述于例如美国专利号5,049,386、美国专利号4,946,787;和美国专利号4,897,355中,并且脂质转染试剂在市场上出售(例如,Transfectam.TM.、Lipofectin.TM.和Lipofectamine.TM.RNAiMAX)。适用于多核苷酸的有效受体识别脂质转染的阳离子和中性脂质包括PCT国际公开号WO/1991/017424和WO/1991/016024中公开的那些脂质。可以递送至细胞(离体施用)或靶组织(体内施用)。
脂质:核酸复合物(包括靶向脂质体诸如免疫脂质复合物)的制备是本领域技术人员众所周知的(参见,例如,Crystal,Science(1995);Blaese等人,Cancer Gene Ther.(1995);Behr等人,Bioconjugate Chem.(1994);Remy等人,Bioconjugate Chem.(1994);Gao和Huang,Gene Therapy(1995);Ahmad和Allen,Cancer Res.,(1992);美国专利号4,186,183;4,217,344;4,235,871;4,261,975;4,485,054;4,501,728;4,774,085;4,837,028;和4,946,787)。
另外的递送方法包括使用将待递送的核酸包装到EnGeneIC递送媒剂(EDV)中。使用双特异性抗体将这些EDV特异性递送至靶组织,其中抗体的一个臂对靶组织具有特异性,并且另一个臂对EDV具有特异性。抗体将EDV带到靶细胞表面,然后EDV通过内吞作用被带入细胞中。一旦进入细胞,内容物就会释放出来(参见MacDiamid等人,Nature Biotechnology(2009))。
递送媒剂包括但不限于细菌(优选地非致病性细菌)、载体、纳米颗粒、外来体、微泡、基因枪递送(例如,通过将组合物附着到金颗粒上,该金颗粒使用经由“基因枪”被射入细胞)、病毒媒剂(包括但不限于慢病毒、AAV和逆转录病毒)、病毒样颗粒(VLP)大VLP(LVLP)、慢病毒样颗粒、转座子、病毒载体、裸载体、DNA或RNA,以及本领域已知的其他递送媒剂。
CRISPR核酸酶和/或编码CRIPSR核酸酶的多核苷酸以及任选的额外的核苷酸分子和/或额外的蛋白质或肽的递送可以通过利用单一递送媒剂或方法或不同递送媒剂或方法的组合来进行。例如,可以利用LNP将CRISPR核酸酶递送至细胞,并且可以利用AAV将crRNA分子和tracrRNA分子递送至细胞。可替代地,可以利用AAV颗粒将CRISPR核酸酶递送至细胞,并且可以利用单独的AAV颗粒将crRNA分子和tracrRNA分子递送至细胞,由于尺寸限制,这可能是有利的。
使用基于RNA或DNA病毒的系统来递送核酸利用了高度进化的过程,用于将病毒靶向体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可以直接施用于患者(体内),或者它们可以用于在体外处理细胞,然后将经修饰的细胞施用于患者(离体)。用于递送核酸的常规基于病毒的系统包括但不限于用于基因转移的重组逆转录病毒、慢病毒、腺病毒、腺相关病毒、牛痘和单纯疱疹病毒载体。然而,RNA病毒优选地用于递送本文所述的RNA组合物。此外,已在许多不同的细胞类型和靶组织中观察到高转导效率。本发明的核酸可以通过非整合型慢病毒递送。任选地,利用慢病毒递送RNA。任选地,慢病毒包括核酸酶的mRNA、引导的RNA。任选地,慢病毒包括核酸酶的mRNA、引导的RNA和供体模板。任选地,慢病毒包括核酸酶蛋白、引导RNA。任选地,慢病毒包括核酸酶蛋白、引导RNA和/或用于通过例如同源定向修复进行基因编辑的供体模板。任选地,慢病毒包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA。任选地,慢病毒包括核酸酶的mRNA、靶向DNA的RNA和tracrRNA,以及供体模板。任选地,慢病毒包括核酸酶蛋白、靶向DNA的RNA和tracrRNA。任选地,慢病毒包括核酸酶蛋白、靶向DNA的RNA和tracrRNA,以及用于通过例如同源定向修复进行基因编辑的供体模板。
如上所述,本文所述的组合物可使用非整合型慢病毒颗粒方法(例如系统)递送至靶细胞。此类方法可用于将mRNA或其他类型的RNA递送到靶细胞中,使得RNA到靶细胞的递送导致本文所述的组合物在靶细胞内组装。另见PCT国际公开号WO2013/014537、WO2014/016690、WO2016185125、WO2017194902和WO2017194903。
逆转录病毒的嗜性可以通过掺入外源包膜蛋白来改变,从而扩大靶细胞的潜在靶标群体。慢病毒载体是能够转导或感染非分裂细胞的逆转录病毒载体,并且通常产生高的病毒滴度。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体包含具有至多6kb至10kb外源序列包装能力的顺式作用长末端重复序列。最小的顺式作用LTR足以复制和包装载体,然后该载体用于将治疗基因整合到靶细胞中以提供永久性的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些逆转录病毒载体(参见,例如,Buchscher Panganiban,J.Virol.(1992);Johann等人,J.Virol.(1992);Sommerfelt等人,Virol.(1990);Wilson等人,J.Virol.(1989);Miller等人,J.Virol.(1991);PCT国际公开号WO/1994/026877A1)。
目前至少有六种病毒载体方法可用于临床试验中的基因转移,这些方法利用涉及通过插入辅助细胞系的基因对有缺陷的载体进行补充以产生转导剂的方法。
pLASN和MFG-S是已被用于临床试验的逆转录病毒载体的实例(Dunbar等人,Blood(1995);Kohn等人,Nat.Med.(1995);Malech等人,PNAS(1997))。PA317/pLASN是第一个用于基因疗法试验的治疗载体。(Blaese等人,Science(1995))。已观察到MFG-S包装载体的转导效率为50%或更高。(Ellem等人,Immunol Immunother.(1997);Dranoff等人,Hum.GeneTher.(1997)。
包装细胞用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒、AAV和psi.2细胞的293细胞或包装逆转录病毒的PA317细胞。基因疗法中使用的病毒载体通常由将核酸载体包装到病毒颗粒中的生产者细胞系产生。载体通常含有包装和随后整合到宿主中所需的最小病毒序列(如果适用),其他病毒序列被编码待表达的蛋白质的表达盒所代替。缺失的病毒功能由包装细胞系反式提供。例如,用于基因疗法的AAV载体通常仅具有来自AAV基因组的倒置末端重复(ITR)序列,这些序列是包装和整合到宿主基因组中所必需的。病毒DNA被包装在细胞系中,该细胞系含有编码其他AAV基因的辅助质粒,即rep和cap,但缺少ITR序列。该细胞系还感染了腺病毒作为辅助。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺乏ITR序列,辅助质粒并没有大量包装。可以通过例如热处理来减少腺病毒的污染,腺病毒对热处理比AAV更敏感。此外,可以使用杆状病毒系统以临床规模生产AAV(参见美国专利号7,479,554)。
在许多基因疗法应用中,令人期望的是,基因疗法载体以高度特异性递送至特定组织类型。因此,可以通过将配体表达为与病毒外表面上的病毒外壳蛋白的融合蛋白来将病毒载体修饰成对给定细胞类型具有特异性。选择的配体对已知存在于目标细胞类型上的受体具有亲和力。例如,Han等人,Proc.Natl.Acad.Sci.USA(1995)报道称,莫洛尼鼠白血病病毒可以被修饰成表达融合至gp70的人调蛋白,并且重组病毒感染某些表达人表皮生长因子受体的人乳腺癌细胞。这一原理可以扩展到其他病毒-靶细胞对,其中靶细胞表达受体,并且病毒表达包含细胞-表面受体的配体的融合蛋白。例如,丝状噬菌体可以被设计成显示对几乎任何选定的细胞受体具有特定结合亲和力的抗体片段(例如,FAB或Fv)。尽管以上描述主要适用于病毒载体,但同样的原理也适用于非病毒载体。此类载体可以被工程化为含有有利于被特定靶细胞摄取的特定摄取序列。
基因疗法载体可以通过施用于个体患者进行体内递送,通常通过全身施用(例如,静脉内、腹膜内、肌内、皮下或颅内输注)或局部施用,如下所述。可替代地,可以将载体离体递送至细胞,诸如从个体患者外植的细胞(例如,淋巴细胞、骨髓抽吸物、组织活检)或通用的供体造血干细胞,然后将细胞重新植入患者体内,通常是在选择已掺入载体的细胞之后。在一些实施例中,可以利用体内和离体mRNA递送,以及RNP递送。
用于诊断、研究或用于基因疗法的离体细胞转染(例如,经由将转染的细胞重新输注到宿主生物体中)是本领域技术人员众所周知的。在一个优选的实施例中,将细胞从受试生物体中分离出来,用RNA组合物转染,并重新输注到受试生物体(例如,患者)中。适用于离体转染的各种细胞类型是本领域技术人员众所周知的(参见,例如,Freshney,“Culture ofAnimal Cells,A Manual of Basic Technique and Specialized Applications(第6版,2010)”以及其中引用的关于如何从患者身上分离和培养细胞的讨论)。
合适的细胞包括但不限于真核和原核细胞和/或细胞系。此类细胞或由此类细胞生成的细胞系的非限制性实例包括COS、CHO(例如,CHO--S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NSO、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)和perC6细胞、任何植物细胞(分化或未分化)以及昆虫细胞,诸如草地贪夜蛾(Sf),或真菌细胞,诸如酵母属、毕赤醇母属和裂殖酵母属。在某些实施例中,细胞系是CHO-K1、MDCK或HEK293细胞系。此外,可以分离原代细胞并离体使用,用于在用核酸酶(例如ZFN或TALEN)或核酸酶系统(例如CRISPR)处理后重新引入待治疗的受试者。合适的原代细胞包括外周血单核细胞(PBMC)和其他血细胞亚群,诸如但不限于CD4+T细胞或CD8+T细胞。合适的细胞还包括干细胞,诸如,例如胚胎干细胞、诱导性多能干细胞、造血干细胞(CD34+)、神经元干细胞和间充质干细胞。
在一个实施例中,干细胞用于细胞转染和基因疗法的离体程序。使用干细胞的优势在于,干细胞可以在体外分化成其他细胞类型,或者可以被引入哺乳动物(诸如细胞的供体)中,在那里它们将在骨髓中进行移植。使用GM-CSF、IFN-γ和TNF-α等细胞因子在体外将CD34+细胞分化为临床上重要的免疫细胞类型的方法是已知的(作为非限制性实例,参见Inaba等人,J.Exp.Med.(1992))。
使用已知方法分离干细胞用于转导和分化。例如,通过用结合不需要的细胞,诸如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化的抗原呈递细胞)的抗体淘洗骨髓细胞,从骨髓细胞中分离干细胞(作为非限制性实例,参见Inaba等人,J.Exp.Med.(1992))。在一些实施例中也可以使用已经过修饰的干细胞。
值得注意的是,本文所述的任何一种CRISPR核酸酶可适用于有丝分裂后细胞或任何不活跃分裂的细胞(例如,停滞细胞)中的基因组编辑。可使用本发明的CRISPR核酸酶进行编辑的有丝分裂后细胞的实例包括但不限于肌细胞、心肌细胞、肝细胞、骨细胞和神经元。
含有治疗性RNA组合物的载体(例如,逆转录病毒、脂质体等)也可以直接施用于生物体,以在体内转导细胞。可替代地,可以施用裸RNA或mRNA。施用是通过通常用于将分子引入最终与血液或组织细胞接触的任何途径,包括但不限于注射、输注、局部应用和电穿孔进行的。施用此类核酸的合适方法是可用的并且为本领域技术人员所熟知,并且尽管可以使用一种以上途径来施用特定组合物,但特定的途径往往可以提供比另一种途径更直接和更有效的反应。
适用于将转基因引入免疫细胞(例如,T细胞)的载体包括非整合型慢病毒载体。参见,例如,美国专利公开号2009/0117617。
药学上可接受的载体部分地由所施用的特定组合物以及用于施用该组合物的特定方法确定。因此,有多种合适的药物组合物调配物可供使用,如下所述(参见,例如,Remington's Pharmaceutical Sciences,第17版,1989)。
通过同源重组进行DNA修复
术语“同源定向修复”或“HDR”是指修复细胞中的DNA损伤的机制,例如,在修复DNA中的双链和单链断裂期间。HDR需要核苷酸序列同源性,并使用“核酸模板”(核酸模板或供体模板在本文中可互换使用)来修复发生双链或单断裂的序列(例如,DNA靶序列)。这导致遗传信息从例如核酸模板转移到DNA靶序列。如果核酸模板序列与DNA靶序列不同并且部分或全部核酸模板多核苷酸或寡核苷酸被并入DNA靶序列中,则HDR可能导致DNA靶序列的改变(例如,插入、缺失、突变)。在一些实施例中,整个核酸模板多核苷酸、核酸模板多核苷酸的一部分或核酸模板的拷贝被整合到DNA靶序列的位点处。
术语“核酸模板”和“供体”是指被插入或复制到基因组中的核苷酸序列。核酸模板包含例如一个或多个核苷酸的核苷酸序列,该核苷酸序列将被添加到靶核酸中或将靶核酸中的变化模板化,或者可用于修饰靶序列。核酸模板序列可以是任何长度,例如长度介于2个核苷酸与10,000个核苷酸之间(或其间或以上的任何整数值)、优选地长度介于约100个核苷酸与1,000个核苷酸之间(或其间的任何整数)、更优选地长度介于约200个核苷酸与500个核苷酸之间。核酸模板可以是单链核酸、双链核酸。在一些实施例中,核酸模板包含例如一个或多个核苷酸的核苷酸序列,该核苷酸序列对应于例如靶位置的靶核酸的野生型序列。在一些实施例中,核酸模板包含例如一个或多个核糖核苷酸的核糖核苷酸序列,该核糖核苷酸序列对应于例如靶位置的靶核酸的野生型序列。在一些实施例中,核酸模板包含经修饰的核糖核苷酸。
也可以插入外源序列(也被称为“供体序列”、“供体模板”或“供体”),例如,用于校正突变基因或用于增加野生型基因的表达。显而易见的是,供体序列通常与其所在的基因组序列不完全相同。供体序列可以包含一个非同源序列,其两侧是两个同源区域,以允许在目标位置处进行有效的HDR。此外,供体序列可以包含含有与细胞染色质中目标区域不同源的序列的载体分子。一个供体分子可以含有几个与细胞染色质同源的不连续区域。例如,对于通常不存在于目标区域中的序列的靶向插入,该序列可以存在于供体核酸分子中并且侧接与目标区域中的序列同源的区域。
供体多核苷酸可以是单链和/或双链的DNA或RNA,并且可以线性或环状形式引入细胞中。参见,例如,美国专利公开号2010/0047805;2011/0281361;2011/0207221;和2019/0330620。如果以线性形式引入,可以通过本领域技术人员已知的方法保护供体序列的末端(例如,防止核酸外切降解)。例如,将一个或多个双脱氧核苷酸残基添加到线性分子的3'末端及/或将自互补寡核苷酸连接到一个或两个末端。参见,例如,Chang和Wilson,Proc.Natl.Acad.Sci.USA(1987);Nehls等人,Science(1996)。用于保护外源多核苷酸免于降解的另外的方法包含但不限于添加末端氨基以及使用经过修饰的核苷酸间键,诸如例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。
因此,使用供体模板进行修复的本发明的实施例可以使用可以以线性或环状形式引入细胞中的DNA或RNA、单链和/或双链供体模板。在本发明的实施例中,基因编辑组合物包含:(1)包含引导序列的RNA分子,用于在修复前实现基因中的双链断裂;以及(2)用于修复的供体RNA模板,该包含引导序列的RNA分子是第一RNA分子并且该供体RNA模板是第二RNA分子。在一些实施例中,引导RNA分子和模板RNA分子作为单一分子的一部分连接。
供体序列也可以是寡核苷酸,并用于基因校正或内源序列的靶向改变。寡核苷酸可以在载体上引入细胞、可以电穿孔到细胞中,或者可以经由本领域已知的其他方法引入。寡核苷酸可用于“校正”内源基因中的突变序列(例如,β珠蛋白中的镰状突变),或可用于将具有所需目的的序列插入内源基因座。
可以将多核苷酸作为载体分子的一部分引入细胞,该载体分子具有额外序列,诸如例如复制起点、启动子和编码抗生素抗性的基因。此外,供体多核苷酸可以作为裸核酸、作为与脂质体或泊洛沙姆等药剂复合的核酸被引入,或者可以通过重组病毒(例如,腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷型慢病毒(IDLV))递送。
通常插入供体,使得其表达被整合位点处的内源启动子驱动,即驱动插入了供体的内源基因的表达的启动子。然而,显而易见的是,供体可以包含启动子和/或增强子,例如组成型启动子或诱导型或组织特异性启动子。
可以将供体分子插入到内源基因中,使得所有内源基因被表达、一些内源基因被表达或没有内源基因被表达。例如,可以将本文所述的转基因插入到内源基因座中,使得一些内源序列(转基因的N末端和/或C末端)被表达或没有内源序列被表达,例如作为与转基因的融合体。在其他实施例中,转基因(例如,具有或不具有诸如内源基因的额外编码序列)被整合到任何内源基因座中,例如安全港基因座,例如CCR5基因、CXCR4基因、PPP1R12c(也被称为AAVS1)基因、白蛋白基因或Rosa基因。参见,例如,美国专利号7,951,925和8,110,379;美国公开号2008/0159996;20100/0218264;2010/0291048;2012/0017290;2011/0265198;2013/0137104;2013/0122591;2013/0177983和2013/0177960以及美国临时申请号61/823,689)。
当内源序列(内源或部分转基因)与转基因一起表达时,内源序列可以是全长序列(野生型或突变型)或部分序列。优选地,内源序列是功能性的。这些全长或部分序列的功能的非限制性实例包括增加由转基因(例如,治疗基因)表达的多肽的血清半衰期及/或充当载体。
此外,尽管表达不需要,但外源序列也可以包括转录或翻译调节序列,例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽的序列和/或聚腺苷酸化信号。
在某些实施例中,供体分子包含选自由以下各项组成的组的序列:编码蛋白质的基因(例如,编码细胞或个体中缺乏的蛋白质的编码序列或编码蛋白质的基因的候补版本)、调节序列和/或编码结构核酸诸如微小RNA或siRNA的序列。
对于前述实施例,本文所公开的每个实施例均被认为适用于其他所公开的实施例中的每一个实施例。例如,应当理解,本发明的任何RNA分子或组合物可用于本发明的任何方法。
如本文使用的,所有标题仅用于组织,而不旨在以任何方式限制本公开。任何单独章节的内容可能同样适用于所有章节。
本领域的普通技术人员在审查以下实例后将清楚本发明的其他目的、优点和新颖特征,这些实例不旨在进行限制。此外,如在上文所描绘的以及如在以下权利要求书部分中所要求保护的本发明的各个实施例和方面中的每一个实施例和方面在以下实例中找到实验支持。
应当理解,为了清楚起见,在单独实施例的背景下描述的本发明的某些特征还可以以组合形式提供在单一实施例中。相反地,为简便起见,在单一实施例的背景下描述的本发明的不同特征也可以单独地或以任何适合的子组合或在适当情况下提供于本发明的任何其他已描述的实施例中。在各个实施例的上下文中描述的某些特征不应被视为那些实施例的基本特征,除非该实施例在不具有那些元件的情况下无效。
一般来说,本文所使用的命名和本发明中所利用的实验室程序包括分子技术、生物化学技术、微生物学技术和重组DNA技术。文献中透彻地解释了此类技术。参见,例如,Sambrook等人,"Molecular Cloning:A laboratory Manual"(1989);Ausubel,R.M.(编辑),"Current Protocols in Molecular Biology"第I-III卷(1994);Ausubel等人,"Current Protocols in Molecular Biology",约翰威利父子出版公司(John Wiley andSons),马里兰州巴尔的摩(1989);Perbal,"A Practical Guide to Molecular Cloning",约翰威利父子出版公司,纽约(1988);Watson等人,"Recombinant DNA",ScientificAmerican Books,纽约;Birren等人(编辑),"Genome Analysis:A Laboratory ManualSeries",第1-4卷,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约(1998);美国专利号4,666,828;4,683,202;4,801,531;5,192,659和5,272,057中所阐述的方法学;Cellis,J.E.(编辑),"Cell Biology:A Laboratory Handbook",第I-III卷(1994);Freshney,"Culture of Animal Cells-A Manual of Basic Technique"第三版,Wiley-Liss出版社,N.Y.(1994);Coligan J.E.(编辑),"Current Protocols inImmunology"第I-III卷(1994);Stites等人(编辑),"Basic and Clinical Immunology"(第8版),Appleton&Lange出版社,康涅狄格州诺沃克(1994);Mishell和Shiigi(编辑),"Strategies for Protein Purification and Characterization-ALaboratory CourseManual"CSHL出版社(1996);Clokie和Kropinski(编辑),"Bacteriophage Methods andProtocols",第1卷:Isolation,Characterization,and Interactions(2009),所有这些文献均都通过援引并入。贯穿本文件提供了其他的一般参考文献。
下面提供实例以促进对本发明的更完整的理解。以下实例说明了制造和实施本发明的示例性模式。然而,本发明的范围不限于这些实例中公开的特定实施例,这些实例仅用于说明目的。
实验细节
下面提供实例以促进对本发明的更完整的理解。以下实例说明了制造和实施本发明的示例性模式。然而,本发明的范围不限于这些实例中公开的特定实施例,这些实例仅用于说明目的。
实例1:OMNI-103 CRISPR核酸酶
从环境样品的序列的不同宏基因组数据库中预测CRISPR重复序列(crRNA)、反式活化RNA (tracrRNA)、核酸酶多肽(OMNI)和原型间隔区相邻基序(PAM)序列。
OMNI核酸酶多肽的构建
对于新颖核酸酶多肽(OMNI)的构建,针对人类细胞系表达对几个经鉴定的OMNI的开放阅读框进行了密码子优化。将ORF克隆到细菌表达质粒pET9a和哺乳动物表达质粒pmOMNI中(表4)。
sgRNA的预测与构建
对于每个OMNI,通过检测相应细菌基因组中的CRISPR重复阵列序列和tracrRNA来预测单引导RNA(sgRNA)。将天然早熟crRNA和tracrRNA序列在计算机中与四环“gaaa”序列连接,并使用RNA二级结构预测工具预测双链体的二级结构元件。
使用预测的全双链体RNA元件(crRNA-tracrRNA嵌合体)的二级结构鉴定出可能的tracrRNA序列,以设计sgRNA。通过缩短不同位置处上茎的双链体,构建了几个可能的sgRNA支架版本(表2中列出了OMNI-103sgRNA设计)。此外,为了克服潜在的转录和结构限制并评估sgRNA支架在人类细胞环境背景下的可塑性,在一些情况下对可能的sgRNA的核苷酸序列进行了微小的改变(图1,表2)。最后,为每个OMNI合成了至多三个版本的可能设计的支架,并在下游连接至22个核苷酸的通用独特间隔区序列(T2,SEQ ID NO:135)并在诱导型T7启动子和用于哺乳动物表达的U6启动子的作用下克隆到细菌表达质粒中(pShuttleGuide,表4)。
T2-GGAAGAGCAGAGCCTTGGTCTC(SEQ ID NO:135)
通过TXTL进行体外耗尽测定
遵循体外PAM序列的耗尽,如Maxwell等人,Methods.2018所述。简而言之,将表达OMNI核酸酶的线性DNA和T7启动子下的sgRNA与表达T7聚合酶的线性构建体一起添加到无细胞转录-翻译体外系统(TXTL混合物,Arbor Bioscience)中。TXTL混合物的RNA表达和蛋白质翻译导致核糖核蛋白(RNP)复合物的形成。由于使用了线性DNA,因此将Chi6 DNA序列添加到TXTL反应混合物中以抑制RecBCD的核酸外切酶活性,从而保护线性DNA免于降解。sgRNA间隔区被设计成靶向含有靶原型间隔区的质粒库(pbPOS T2文库,表4),其两侧是8N随机的潜在PAM序列集合。通过高通量测序,使用PCR向切割文库和表达非靶向gRNA的对照文库添加必要的适配器和指数,测量文库中PAM序列的耗尽情况。深度测序后,体外活性通过具有相同PAM序列的耗尽序列相对于它们在对照中出现的比例得到证实,这表明了OMNI核酸酶的功能性DNA切割(图4A至4B和表3)。
人类细胞中对内源基因组靶标的活性
评估了OMNI-103促进对人类细胞中特定基因组位置进行编辑的能力。通过对用OMNI-103核酸酶和一组独特的sgRNA分子共转染的HeLa细胞进行NGS切割分析,评估了OMNI-103对人类基因组靶标的编辑活性,每个sgRNA分子被设计成靶向不同的基因组位置。为此,将人类优化的OMNI-103核酸酶克隆到框内P2A-mCherry表达载体(pmOMNI,表4)中,并且将OMNI-103sgRNA分子序列中的每一个序列克隆到穿梭引导载体(pShuttle Guide,表4)中。根据对应的OMNI-103PAM偏好,sgRNA分子被设计成含有22个核苷酸的引导序列部分,该部分靶向人类基因组中的特定位置(表5),然后是由TXTL发现的sgRNA支架序列(表3)。转染后72小时,收获细胞。将一半收获的细胞用于通过FACS使用mCherry荧光作为标志物对OMNI-103核酸酶表达进行定量。将其余的细胞裂解,并提取它们的基因组DNA含量并作为模板用于对应基因组靶标的PCR扩增。对扩增子进行下一代测序(NGS),然后使用所得读长计算其靶位点中编辑事件的百分比。切割位点周围的短插入或缺失(插入缺失)是核酸酶诱导的DNA切割后DNA末端修复的典型结果。编辑百分比的计算是由插入缺失读长相对于每个扩增子内总比对读长的分数推导出来的。如表5(第5列,“编辑百分比”)所示,OMNI-103核酸酶在大多数基因组位点上表现出高且显著的编辑水平。
OMNI-103核酸酶的蛋白质纯化
在美国临时申请号63/286,855中描述了用于RNP组装的核酸酶蛋白生产和合成引导生产的表达方法。简而言之,将OMNI-103核酸酶开放阅读框针对细菌进行密码子优化(表1),并克隆到具有以下元件的经修饰的pET9a质粒中:-SV40 NLS-优化的OMNI-103ORF细菌(来自第2个氨基酸)-HA标签-SV40 NLS-8His-标签(表4)。将OMNI-103构建体在KRX细胞(PROMEGA)中表达。将细胞在添加了6.66mM鼠李糖(26.4ml,来自0.5M原液)和0.05%葡萄糖(2ml,来自0.5M)的TB+0.4%甘油中生长,并在温度降低至20℃时,在对数中期下表达4小时。使用化学裂解法裂解细胞,并在Ni-NTA树脂上纯化清除的裂解液。将Ni-NTA洗脱级分在CEX(SO3 fractogel)树脂上纯化,然后在200Increase 10/300GL,AKTA Pure(GEHealthcare Life Sciences)上进行SEC纯化。将含有OMNI-103蛋白的级分合并,并浓缩至30mg/ml原液,并在液氮中快速冷冻,并储存在-80℃下。
RNP的体外OMNI-103切割活性
合成OMNI-103的合成sgRNA,其在3'端和5'端有三个3'-硫代磷酸2'-O-甲酯(Agilent)。
用具有不同间隔区长度(20个至25个核苷酸)的引导分子在体外测定OMNI-103RNP的活性,这些引导分子靶向与引导PDCD1 S40相同的靶位点(表6,图2A)。简而言之,将10pmol的OMNI-103核酸酶与20pmol的合成引导混合。在室温下温育10分钟后,将RNP复合物连续稀释至4pmol、2pmol、1pmol、0.5pmol,并与通过从提取的基因组DNA中扩增PDCD1 S40靶位点而制备的40ng线性DNA模板反应。所有间隔区长度(20个至25个核苷酸)在所有RNP浓度下都显示出对PDCD1模板的完全切割,这表明切割活性高(图2A)。
通过测量U2OS细胞中RNP的编辑活性来引导OMNI-103核酸酶的优化
还在哺乳动物细胞背景下测试了间隔区长度优化。通过将100uM OMNI-103核酸酶与120uM不同间隔区长度的合成引导(20个至25个核苷酸,表6)和100uM Cas9电穿孔增强子(IDT)混合来组装RNP。在室温下温育10分钟后,将RNP复合物与200,000个预洗的U2OS细胞混合,并根据制造商的方案使用带有DN100的Lonza SE细胞系4D-NucleofectorTM X试剂盒进行电穿孔。电穿孔后72小时,裂解细胞并提取其基因组DNA含量。然后通过PCR扩增对应的基因组靶位点。对扩增子进行NGS,并使用所得序列计算编辑事件的百分比。从图2B和表7中可以看出,22个核苷酸的间隔区长度显示出最高的编辑水平。
人类细胞中的OMNI-103RNP编辑活性
在U2OS中观察到哺乳动物细胞中作为RNP的OMNI-103蛋白的活性(表7,图2C),并且在T细胞中也观察到相当的活性(表8)。通过将100uM核酸酶与120uM合成引导(表6)和100uM Cas9电穿孔增强子(IDT)混合来组装RNP。在室温下温育10分钟后,将RNP复合物与200,000个U2OS细胞混合,并根据制造商的方案使用带有DN100的Lonza SE细胞系4D-NucleofectorTM X试剂盒进行电穿孔。电穿孔后72小时,裂解细胞并提取其基因组DNA含量。然后通过PCR扩增对应的基因组靶位点。对扩增子进行NGS,并使用所得序列计算编辑事件的百分比。用PDCD1 S40、TRAC S35、TRAC S36和B2M S12引导测试了OMNI-103RNP。测试的所有四(4)个向均显示出70%-90%的编辑水平(图2C)。
使用Guide-seq无偏分析方法评价脱靶效应
Guide-seq允许无偏地在体内检测活细胞中由CRISPR核酸酶引起的脱靶基因组编辑事件。将平末端CRISPR RNA引导性核酸酶(RGN)诱导的活体人类细胞的基因组中的DSB经由与NHEJ一致的末端连接过程在这些断裂处整合平末端双链寡脱氧核苷酸(dsODN)来进行标记。使用无偏扩增和深度NGS对基因组DNA中的dsODN整合位点进行核苷酸水平的精确映射。在基因组DNA超声处理和一系列适配器连接后,对含有寡核苷酸的文库进行高通量DNA测序,并使用默认的Guide-seq软件处理输出,以鉴定寡核苷酸捕获的位点。
为了评估OMNI-103核酸酶的特异性,使用Guide-seq对使用PDCD1 S40和TRAC S35位点的人U2OS细胞的整个基因组的脱靶切割进行了无偏调查(表6)。
通过将100uM核酸酶与120uM合成引导和100uM Cas9电穿孔增强子(IDT)混合来组装RNP。在室温下温育10分钟后,将RNP复合物与100uM dsODN和200,000个预洗的U2OS细胞混合。根据制造商的方案,使用带有DN100的Lonza SE细胞系4D-NucleofectorTM X试剂盒对细胞进行电穿孔。电穿孔后72小时,裂解细胞并提取其基因组DNA含量。然后通过PCR扩增对应的基因组靶位点。对扩增子进行NGS,然后使用所得序列计算编辑事件的百分比和dsODN整合(图3A)。OMNI-103在PDCD1 S40和TRAC S35位点处未显示任何脱靶效应(图3B)。
表1-OMNI CRISPR核酸酶序列
表1.OMNI核酸酶序列:表1列出了OMNI名称、其对应的核酸酶蛋白质序列、其DNA序列、其人类优化的DNA序列、将被替换以生成具有失活RuvC结构域的切口酶的替代性位置、将被替换以生成具有失活HNH结构域的切口酶的替代性位置,以及将被替换以生成具有失活RuvC和HNH结构域的催化失活的核酸酶的替代性位置。对于第5-7列中所示的氨基酸位置中的每一个,允许替换为任何其他氨基酸,除非后跟星号,这表明除了天冬氨酸(D)到谷氨酸(E)或谷氨酸(E)到天冬氨酸(D)以外的任何取代都导致失活。
补充表1-OMNI-103结构域
补充表1.OMNI结构域:补充表1列出了OMNI CRISPR核酸酶的每个经鉴定结构域的氨基酸范围。例如,OMNI-103的结构域G由SEQ ID NO:1的第728位至第778位氨基酸鉴定。列出的氨基酸范围基于对使用Smith-Waterman算法生成的局部比对的优选分析,然而,每个结构域范围的开始或结束可增加或减少至多五个氨基酸。
表2OMNI引导RNA和支架RNA序列
表2(续)-OMNI引导RNA和支架RNA序列
表3-显示每个测试的sgRNA的活性的OMNIPAM序列
*耗尽分数分数-两个最耗尽位点的平均比率
表4-质粒和构建体
表4附录-构建体元件的详细信息
元件 蛋白质序列 DNA序列
HA标签 SEQ ID NO:41 SEQ ID NO:45
NLS SEQ ID NO:42 SEQ ID NO:46
P2A SEQ ID NO:43 SEQ ID NO:47
mCherry SEQ ID NO:44 SEQ ID NO:48
表5-哺乳动物细胞内源背景下的OMNI-103核酸酶活性
表5.哺乳动物细胞内源背景下的核酸酶活性:将OMNI-103核酸酶通过DNA转染和sgRNA表达质粒在哺乳动物细胞系统(HeLa)中表达。将细胞裂解液用于位点特异性基因组DNA扩增和NGS。测量和分析插入缺失的百分比以确定编辑水平。
表6-OMNI-103的合成sgRNA(间隔区和支架)
表7-OMNI-103在U2OS细胞中作为RNP的活性和间隔区优化
表7.将OMNI-103RNP与合成sgRNA(Agilent)组装在一起,并电穿孔到U2OS细胞中。基因名称、间隔区序列和间隔区长度显示在由NGS测量的编辑水平(插入缺失百分比)旁边。
表8-OMNI-103在原代T细胞中作为RNP进行编辑的FACS结果
表8.在用靶向TRAC或B2M的特定合成sgRNA分子(Agilent)对OMNI-103进行电穿孔后3天,原代T细胞中TCR和B2M的蛋白质表达水平。
实例2:候补OMNI-103 CRISPR核酸酶-RNA复合物
方法
OMNI-103蛋白质表达
简而言之,并且类似于上述蛋白质表达方法,将核酸酶开放阅读框针对人类细胞进行密码子优化,并克隆到具有以下元件的经修饰的pET9a质粒中:-SV40 NLS-OMNI-103ORF(来自人类优化的第2个氨基酸)-HA标签-SV40 NLS-8His-标签。这个序列可在表4中找到。将OMNI-103构建体在KRX细胞(Promega)中表达。将细胞在添加了6.66mM鼠李糖(26.4ml,来自0.5M原液)和0.05%葡萄糖(2ml,来自0.5M)的TB+0.4%甘油中生长。在温度降低至20℃时,将蛋白质在对数中期下表达4小时。使用化学裂解法裂解细胞,并在Ni-NTA树脂上纯化清除的裂解液。将Ni-NTA洗脱级分在CEX(SO3 fractogel)树脂上纯化,然后在Superdex 200Increase 10/300GL,AKTA Pure(GE Healthcare Life Sciences)上进行SEC纯化。将含有OMNI-103蛋白的级分合并,并浓缩至30mg/ml原液,并在液氮中快速冷冻,并储存在-80℃下。
所使用的合成sgRNA
合成OMNI-103的所有合成sgRNA,其在3'端和5'端有三个3'-硫代磷酸2'-O-甲酯(Agilent或Synthego)。
哺乳动物细胞系中的活性
在人类细胞中的特定基因组位置上测试了OMNI-103促进使用较短sgRNA版本进行编辑的能力(表10)。对于HeLa细胞,将OMNI-103-P2A-mCherry表达载体(pmOMNI,表4)与sgRNA(pShuttle引导-表4,间隔区序列-表10)一起转染。
对于U2OS细胞,通过将100uM核酸酶与120uM合成引导和100uM Cas9电穿孔增强子(IDT)混合来组装RNP。在室温下温育10分钟后,将RNP复合物与200,000个预洗的U2OS细胞混合,并根据制造商的方案使用带有DN100程序的Lonza SE细胞系4D-NucleofectorTM X试剂盒进行电穿孔。在72小时后,将细胞裂解,并将其基因组DNA含量用于扩增对应的假定基因组靶标的PCR反应。对扩增子进行NGS,然后使用所得序列计算编辑事件的百分比。
对于T细胞,通过混合113uM核酸酶和160uM合成引导并在室温下温育10分钟来组装RNP,将RNP复合物与200,000个原代活化T细胞混合,并使用P3原代细胞4D-NucleofectorTM X试剂盒,用EH-115脉冲编码进行电穿孔。三(3)天和八(8)天后收集细胞,并通过流式细胞术测量CD3和编辑的蛋白质表达。
结果
跨基因组位点和细胞类型的短引导的活性
对OMNI-103核酸酶活性进行优化,以与较短的sgRNA支架一起使用。基于‘V2’双链体版本设计了五(5)个短sgRNA支架,其在四环“GAAA”和终止子区域周围含有至多四个缺失(表9,图6A至6F)。为了测试用所设计的V2支架展示的OMNI-103活性水平,将具有“TRAC-s91”或“PDCD-s40”引导序列部分的sgRNA转染到HeLa细胞中。基于NGS结果计算编辑活性(图7)。在所有情况下,所设计的sgRNA都能实现编辑活性。下一步是测试OMNI-103在U2OS和原代T细胞中作为RNP的活性。将OMNI-103用具有V2、V2.2或V2.3支架并具有“TRAC-s35”或“B2M-s12”引导序列部分的sgRNA进行电穿孔。基于NGS结果计算编辑活性,并且正如所证明的那样,当与任何支架变体一起使用时,OMNI-103的活性水平没有受到影响(图8)。在原代T细胞中,当利用短支架变体时,显示出活性的提高。
表9-OMNI-103设计的支架序列
表9(续)-OMNI-103设计的支架序列
表9(续)-OMNI-103设计的支架序列
表10-用于测试活性短支架引导活性的内生靶标
基因 位点 间隔区
TRAC s91 GCUGUGGCCUGGAGCAACAAAU(SEQ ID NO:125)
PDCD1 s40 AACACAUCGGAGAGCUUCGUGC(SEQ ID NO:126)
B2M S12 GUAUGCCUGCCGUGUGAACCAU(SEQ ID NO:127)
TRAC S35 GACCCUGCCGUGUACCAGCUGA(SEQ ID NO:128)
表11-三种细胞类型中跨不同内生靶标的短引导的活性面板的总结
表12-U2OS和原代T细胞测定中使用的sgRNA的总结
参考文献
1.Ahmad和Allen(1992)“Antibody-mediated Specific Binging andCytotoxicity of Lipsome-entrapped Doxorubicin to Lung Cancer Cells in Vitro”,Cancer Research 52:4817-20。
2.Anderson(1992)“Human gene therapy”,Science 256:808-13。
3.Basha等人(2011)“Influence of Cationic Lipid Composition on GeneSilencing Properties of Lipid Nanoparticle Formulations of siRNA in Antigen-Presenting Cells”,Mol.Ther.19(12):2186-200。
4.Behr(1994)“Gene transfer with synthetic cationic amphiphiles:Prospects for gene therapy”,Bioconjuage Chem 5:382-89。
5.Blaese等人(1995)“Vectors in cancer therapy:how will they deliver”,Cancer Gene Ther.2:291-97。
6.Blaese等人(1995)“T lympocyte-directed gene therapy for ADA-SCID:initial trial results after 4years”,Science 270(5235):475-80。
7.Briner等人(2014)“Guide RNA functional modules direct Cas9 activityand orthognality”,Molecular Cell 56:333-39。
8.Buchschacher和Panganiban(1992)“Human immunodeficiency virus vectorsfor inducible expression of foreign genes”,J.Virol.66:2731-39。
9.Burstein等人(2017)“New CRISPR-Cas systems from uncultivatedmicrobes”,Nature 542:237-41。
10.Canver等人,(2015)"BCL11A enhancer dissection by Cas9-mediated insitu saturating mutagenesis",Nature第527卷,第192-214页。
11.Chang和Wilson(1987)“Modification of DNA ends can decrease end-joining relative to homologous recombination in mammalian cells”,Proc.Natl.Acad.Sci.USA 84:4959-4963。
12.Charlesworth等人(2019)“Identification of preexisting adaptiveimmunity to Cas9 proteins in humans”,Nature Medicine,25(2),249。
13.Chung等人(2006)“Agrobacterium is not alone:gene transfer to plantsby viruses and other bacteria”,Trends Plant Sci.11(1):1-4。
14.Coelho等人(2013)“Safety and efficacy of RNAi therapy fortransthyretin amyloidosis”N.Engl.J.Med.369,819-829。
15.Crystal(1995)“Transfer of genes to humans:early lessons andobstacles to success”,Science 270(5235):404-10。
16.Dillon(1993)“Regulation gene expression in gene therapy”Trends inBiotechnology 11(5):167-173。
17.Dranoff等人(1997)“A phase I study of vaccination with autologous,irradiated melanoma cells engineered to secrete human granulocyte macrophagecolony stimulating factor”,Hum.Gene Ther.8(1):111-23。
18.Dunbar等人(1995)“Retrovirally marked CD34-enriched peripheralblood and bone marrow cells contribute to long-term engraftment afterautologous transplantation”,Blood 85:3048-57。
19.Ellem等人(1997)“A case report:immune responses and clinical courseof the first human use of ganulocyte/macrophage-colony-stimulating-factor-tranduced autologous melanoma cells for immunotherapy”,Cancer ImmunolImmunother 44:10-20。
20.Gao和Huang(1995)“Cationic liposome-mediated gene transfer”GeneTher.2(10):710-22。
21.Haddada等人(1995)“Gene Therapy Using Adenovirus Vectors”,载于:TheMolecular Repertoire of Adenoviruses III:Biology and Pathogenesis,编者:Doerfler和第297-306页。
22.Han等人(1995)“Ligand-directed retro-viral targeting of humanbreast cancer cells”,Proc.Natl.Acad.Sci.USA 92(21):9747-51。
23.Humbert等人,(2019)"Therapeutically relevant engraftment of aCRISPR-Cas9-edited HSC-enriched population with HbF reactivation in nonhumanprimates",Sci.Trans.Med.,第11卷,第1-13页。
24.Inaba等人(1992)“Generation of large numbers of dendritic cellsfrom mouse bone marrow cultures supplemented with granulocyte/macrophagecolony-stimulating factor”,J Exp Med.176(6):1693-702。
25.Jiang和Doudna(2017)“CRISPR-Cas9 Structures and Mechanisms”,AnnualReview of Biophysics 46:505-29。
26.Jinek等人(2012)“A programmabledual-RNA-guided DNA endonuclease inadaptive bacterial immunity”,Science 337(6096):816-21。
27.Johan等人(1992)“GLVR1,a receptor for gibbon ape leukemia virus,ishomologous to a phosphate permease of Neurospora crassa and is expressed athigh levels in the brain and thymus”,J Virol 66(3):1635-40。
28.Judge等人(2006)“Design of noninflammatory synthetic siRNAmediating potent gene silencing in vivo”,Mol Ther.13(3):494-505。
29.Kohn等人(1995)“Engraftment of gene-modified umbilical cord bloodcells in neonates with adnosine deaminase deficiency”,Nature Medicine 1:1017-23。
30.Kremer和Perricaudet(1995)“Adenovirus and adeno-associated virusmediated gene transfer”,Br.Med.Bull.51(1):31-44。
31.Macdiarmid等人(2009)“Sequential treatment of drug-resistant tumorswith targeted minicells containing siRNA or a cytotoxic drug”,NatBiotehcnol.27(7):643-51。
32.Malech等人(1997)“Prolonged production of NADPH oxidase-correctedgranulocyes after gene therapy of chronic granulomatous disease”,PNAS 94(22):12133-38。
33.Maxwell等人(2018)“A detailed cell-free transcription-translation-based assay to decipher CRISPR protospacer adjacent motifs”,Methods 14348-57
34.Miller等人(1991)“Construction and properties of retroviruspackaging cells based on gibbon ape leukemia virus”,J Virol.65(5):2220-24。
35.Miller(1992)“Human gene therapy comes of age”,Nature 357:455-60。
36.Mir等人(2019)“Type II-C CRISPR-Cas9 Biology,Mechanism andApplication”,ACS Chem.Biol.13(2):357-365。
37.Mitani和Caskey(1993)“Delivering therapeutic genes-matchingapproach and application”,Trends in Biotechnology 11(5):162-66。
38.Nabel和Felgner(1993)“Direct gene transfer for immunotherapy andimmunization”,Trends in Biotechnology 11(5):211-15。
39.Nehls等人(1996)“Two genetically separable steps in thedifferentiation of thymic epithelium”Science 272:886-889。
40.Nishimasu等人“Crystal structure of Cas9 in complex with guide RNAand target DNA”(2014)Cell 156(5):935-49。
41.Nishimasu等人(2015)“Crystal Structure of Staphylococcus aureusCas9”Cell 162(5):1113-26。
42.Palermo等人(2018)“Key role of the REC lobe during CRISPR-Cas9activation by‘sensing’,‘regulating’,and‘locking’the catalytic HNH domain”Quarterly Reviews of Biophysics 51,e9,1-11。
43.Remy等人(1994)“Gene Transfer with a Series of Lipphilic DNA-Binding Molecules”,Bioconjugate Chem.5(6):647-54。
44.Sentmanat等人(2018)“A Survey of Validation Strategies for CRISPR-Cas9 Editing”,Scientific Reports 8:888,doi:10.1038/s41598-018-19441-8。
45.Sommerfelt等人(1990)“Localization of the receptor gene for type Dsimian retroviruses on human chromosome 19”,J.Virol.64(12):6214-20。
46.Van Brunt(1988)“Molecular framing:transgenic animals as bioactors”Biotechnology 6:1149-54。
47.Vigne等人(1995)“Third-generation adenovectors for gene therapy”,Restorative Neurology and Neuroscience 8(1,2):35-36。
48.Wagner等人(2019)“High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population”Nature Medicine,25(2),242
49.Wilson等人(1989)“Formation of infectious hybrid virion with gibbonape leukemia virus and human T-cell leukemia virus retroviral envelopeglycoproteins and the gag and pol proteins of Moloney murine leukemiavirus”,J.Virol.63:2374-78。
50.Yu等人(1994)“Progress towards gene therapy for HIV infection”,GeneTher.1(1):13-26。
51.Zetsche等人(2015)“Cpf1 is a single RNA-guided endonuclease of aclass 2CRIPSR-Cas system”Cell 163(3):759-71。
52.Zuris等人(2015)“Cationic lipid-mediated delivery of proteinsenables efficient protein based genome editing in vitro and in vivo”NatBiotechnol.33(1):73-80。
序列表
<110> EmendoBio公司(EmendoBio Inc.)
<120> OMNI-103 CRISPR核酸酶
<130> 91677-A-PCT/GJG/AWG
<150> 63/286,855
<151> 2021-12-09
<150> 63/214,506
<151> 2021-06-24
<150> 63/147,166
<151> 2021-02-08
<160> 135
<170> PatentIn版本3.5
<210> 1
<211> 1348
<212> PRT
<213> 未知
<220>
<223> OMNI-103
<400> 1
Met Ser Ile Lys Ser Asp Tyr Phe Leu Gly Leu Asp Ile Gly Thr Asp
1 5 10 15
Ser Ile Gly Trp Ala Val Thr Asp Pro Glu Tyr His Ile Leu Arg Arg
20 25 30
Lys Gly Lys Ala Leu Trp Gly Ile Arg Leu Phe Asp Ala Ala Asn Thr
35 40 45
Ala Ala Glu Arg Arg Thr Phe Arg Thr Ser Arg Arg Arg Ile Gln Arg
50 55 60
Arg Arg Gln Arg Ile Arg Leu Leu Gln Glu Leu Phe Ala Glu Glu Met
65 70 75 80
Val Lys Leu Asp Pro Gly Phe Phe Gln Arg Leu Ser Asp Ser Ala Phe
85 90 95
Trp Gln Glu Asp Lys Gln Glu Gln Gln Ile Tyr Ser Leu Phe Thr Cys
100 105 110
Glu Asn Tyr Thr Asp Val Asp Tyr Tyr Arg Glu Tyr Pro Thr Ile Tyr
115 120 125
His Leu Arg Ser Ala Leu Ile Gln Glu Lys Lys Glu Phe Asp Leu Arg
130 135 140
Leu Leu Tyr Leu Ala Leu His His Leu Met Lys His Arg Gly His Phe
145 150 155 160
Leu Phe Asn Gly Ser Ile Asn Asn Val Thr Ser Phe His Thr Thr Phe
165 170 175
Gln Thr Phe Ala Asp Cys Leu Tyr Asp Glu Phe Asp Ile Glu Leu Glu
180 185 190
Cys Asp Ser Glu Asp Arg Phe Ala Glu Ile Leu Lys Asp Lys His Ala
195 200 205
Arg Lys Thr Gly Lys Cys Ser Glu Leu Glu Ile Ile Cys His Ile Glu
210 215 220
Lys Ser Asn Lys Gln Leu Lys Glu Leu Phe Lys Leu Ile Thr Gly Met
225 230 235 240
Lys Ala Ser Leu Ser Val Val Phe Gly Asp Asp Glu Leu Ala Glu Ile
245 250 255
Glu His Asn Lys Ile Ser Phe Ser Glu Ser Ser Tyr Asp Glu Val Arg
260 265 270
Leu Ala Leu Glu Asp Glu Ile Gln Glu Arg Thr Gly Ile Leu Asp Ile
275 280 285
Phe His Ala Val Tyr Ser Trp Ala Ile Leu Ala Asp Ile Leu Glu Gly
290 295 300
Gly Glu Tyr Glu Gly Asn Ser Tyr Leu Ser Val Ala Lys Val Ser Thr
305 310 315 320
Tyr Lys Lys His Gly Asp Asp Leu Arg Leu Leu Arg Thr Leu Val Arg
325 330 335
Glu Tyr Cys Pro Asp His Tyr Lys Ser Phe Phe Ser Val Ser Gly Lys
340 345 350
Glu Asn Tyr Cys Ala Tyr Ala Gly Thr Leu Lys Lys Asn Gly Lys Lys
355 360 365
Gln Pro Ile Lys Arg Cys Ser Gln Glu Asp Phe Tyr Lys Ala Leu Lys
370 375 380
Lys Leu Leu Asn Gln Met Pro Thr Glu Gln Pro Glu Val Lys Asp Ile
385 390 395 400
Phe Ile Glu Ile Glu Asn Gly Thr Phe Leu Pro Leu Gln Val Ser Lys
405 410 415
Asp Asn Gly Val Ile Pro Tyr Gln Val Asn Lys Met Glu Leu Glu Lys
420 425 430
Ile Leu Gln Asn Ala Glu Glu Tyr Leu Pro Phe Leu Lys Asn Ile Asp
435 440 445
Glu Glu Cys Gly Lys Thr Val Ser Lys Lys Ile Ile Asp Leu Phe Glu
450 455 460
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Asn Thr Ala Lys Gly Glu
465 470 475 480
Asn Cys Trp Met Val Arg Lys Glu Ala Gly Arg Ile Tyr Pro Trp Asn
485 490 495
Phe Asp Glu Lys Val Asp Arg Asp Gln Ser Ala Glu Lys Phe Ile Arg
500 505 510
Arg Met Thr Asn Gln Cys Thr Tyr Leu Ile His Glu Asp Val Val Pro
515 520 525
Lys Asn Ser Leu Leu Tyr Ser Glu Phe Met Val Leu Asn Glu Leu Asn
530 535 540
Asn Val Lys Ile Arg Ser Glu Lys Leu Pro Val Glu Leu Lys Gln Ala
545 550 555 560
Ile Val Leu Asp Leu Phe Lys Lys Gln Lys Gln Ile Thr Gly Lys Lys
565 570 575
Leu Leu Asn Tyr Leu Asn Ala Asn Gly Tyr Asp Val Lys Lys Glu Asp
580 585 590
Leu Ser Gly Phe Asp Gly Asn Phe Lys Ser Ser Leu Ser Ser Tyr Leu
595 600 605
Thr Leu Lys Lys Val Phe Gly Glu Glu Leu Asp Lys Tyr Ser Val Gln
610 615 620
Gln Met Ala Glu Asp Ile Ile Leu Trp Ile Thr Leu Tyr Gly Asp Asp
625 630 635 640
Gln Lys Met Leu Arg Arg Val Ile Arg Lys His Tyr Glu Gln Gln Leu
645 650 655
Ser Glu Glu Gln Ile Leu Ser Leu Ser Lys Leu Lys Phe Gln Gly Trp
660 665 670
Gly Arg Leu Ser Arg Arg Leu Leu Ser Glu Met Glu Gly Val Asp Cys
675 680 685
Glu Thr Gly Glu Cys Met Thr Val Met Gln Gly Leu Arg Asn Thr Gln
690 695 700
Asn Asn Leu Met Gln Leu Leu Ser Gln Gln Phe Ser Phe Met Glu Leu
705 710 715 720
Ile Glu Glu Glu Asn Gly Asn Tyr Tyr Val Asp Glu Ile Thr Tyr Asp
725 730 735
Asn Leu Val Lys Asp Met Val Ile Ser Pro Ser Val Lys Arg Ala Val
740 745 750
Trp Gln Thr Val Gln Ile Val Glu Glu Ile Lys Gly Val Met Gly Cys
755 760 765
Gln Pro Lys Lys Ile Phe Val Glu Met Ala Arg Ser Asp Glu Glu Lys
770 775 780
Lys Arg Thr Val Ser Arg Lys Asp Arg Leu Leu Glu Ala Tyr Asp Ala
785 790 795 800
Ile Lys Asp Glu Ala Arg Gln Trp Gln Glu Glu Leu Gln Lys Tyr Ser
805 810 815
Asp Gly Asp Phe Lys Ala Ile Lys Leu Tyr Leu Tyr Tyr Thr Gln Met
820 825 830
Gly Gln Cys Met Tyr Thr Gly Arg Lys Ile Asp Leu Ser Gln Leu Asn
835 840 845
Asp Ala Thr Val Trp Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Thr
850 855 860
Lys Asp Asp Ser Leu Asp Asn Leu Val Leu Val Asp Arg Ser Val Asn
865 870 875 880
Ala Lys Lys Ser Asp Gly Met Leu Ser Pro Glu Ile Gln Gln Arg Met
885 890 895
Arg Ala Thr Trp Lys Tyr Leu Lys Glu Lys Lys Leu Ile Ser Glu Lys
900 905 910
Lys Tyr Glu Arg Leu Thr Arg Val Ser Pro Leu Thr Asp Glu Glu Leu
915 920 925
Ala Gly Phe Ile Asn Arg Gln Leu Val Glu Thr Arg Gln Ser Ser Lys
930 935 940
Ala Val Ala Thr Leu Leu Lys Arg Val Tyr Asp Glu Ala Glu Ile Val
945 950 955 960
Tyr Val Lys Ala Glu Ala Val Ser Asn Phe Arg Arg Asp Asn Leu Asp
965 970 975
Tyr Ile Lys Val Arg Asp Leu Asn Asp Tyr His His Ala Lys Asp Ala
980 985 990
Tyr Gln Asn Ile Val Val Gly Asn Val Phe His Glu Lys Phe Thr Ser
995 1000 1005
Asn Pro Leu Arg Trp Leu Lys Asn Asn Pro Asn Thr Lys Tyr Ser
1010 1015 1020
Leu Asn Gln Met Phe Asn Phe Asp Leu Glu Lys Asn Gly Val Val
1025 1030 1035
Ile Trp Lys Arg Gly Lys Ala Gly Ser Ile Lys Cys Val Glu Glu
1040 1045 1050
Thr Leu Lys Arg Asn Asp Ile Leu Phe Thr Arg Tyr Ala Phe Cys
1055 1060 1065
Asn Lys Gly Gly Phe Phe Asn Gln Met Leu Thr Ala Ala Pro Glu
1070 1075 1080
Asp Lys Thr Lys Ala Lys Gly Leu Val Pro Ile Lys Lys Gly Met
1085 1090 1095
Glu Thr Trp Lys Tyr Gly Gly Tyr Thr Ser Val Thr Pro Ser His
1100 1105 1110
Phe Met Leu Val Ala Ser Lys Asp Lys Lys Gly Lys Glu Ile Arg
1115 1120 1125
Thr Ile Glu Thr Val Pro Leu Tyr Arg Trp Lys Glu Phe Lys Glu
1130 1135 1140
Asn Pro Asp Ala Leu Leu Gln Tyr Cys Arg Glu Phe Tyr Gly Leu
1145 1150 1155
Lys Glu Pro Lys Val Leu Ile Pro Cys Ile Lys Lys Asn Ala Arg
1160 1165 1170
Leu Val Val Asn Gly Phe Pro Met His Leu Lys Gly Ser Thr Gly
1175 1180 1185
Lys Gln Leu Ile Leu Gln Gly Ala Val Gln Leu Cys Leu Asn Asn
1190 1195 1200
Glu Asn Ile Lys Tyr Leu Lys Lys Val Thr Lys Tyr Leu Glu Tyr
1205 1210 1215
Asn Ala Gln Arg Arg Asp Lys Arg Thr Leu Leu Glu Val Arg Glu
1220 1225 1230
Val Thr Gly Ile Asn Lys Glu Glu Asn Ile Gln Leu Tyr Asp Val
1235 1240 1245
Phe Val Asp Lys Leu Ser Asn Thr Ile Tyr Gln Tyr Arg Pro Ala
1250 1255 1260
Asn Pro Lys Asp Asn Leu Ile Lys Gly Arg Glu Lys Phe Ile Glu
1265 1270 1275
Leu Gly Leu Ala Glu Gln Cys Val Val Leu Gly Glu Val Leu His
1280 1285 1290
Leu Phe Gln Cys Lys Pro Leu Thr Ser Asp Leu Thr Leu Ile Gly
1295 1300 1305
Gly Ser Pro Asn Thr Gly Thr Ile Lys Ile Thr Lys Thr Ile Ser
1310 1315 1320
Asn Cys Asn Val Val Lys Leu Leu Ser Gln Ser Ile Ala Gly Val
1325 1330 1335
Lys Val Arg Glu Ile Asn Leu Leu Ile Ile
1340 1345
<210> 2
<211> 4047
<212> DNA
<213> 未知
<220>
<223> OMNI-103
<400> 2
atgagcataa aaagtgatta ttttttagga cttgatattg gtacggattc tattggatgg 60
gcggtaaccg acccagaata tcacatattg agacgaaaag gtaaagcatt atggggaata 120
agattatttg atgcggccaa tacagcggca gaacggcgaa catttaggac aagccgaaga 180
aggattcaga gaagacgaca gagaattcgg ttattgcaag aattatttgc agaagaaatg 240
gtaaaattag acccaggatt ttttcagagg ttgtcagaca gcgcattttg gcaggaggat 300
aagcaagagc agcaaattta ttcacttttt acttgtgaaa attatacaga tgttgattat 360
tacagagaat atcctactat ttatcatttg agaagtgcat tgattcagga aaagaaggaa 420
tttgatcttc gtcttctata tcttgctctt caccatttga tgaagcacag gggacatttc 480
ctgtttaatg ggagtattaa taatgtgacg tcatttcata cgacgtttca gacgtttgca 540
gattgtcttt atgatgagtt tgatatagaa ctggaatgtg attccgaaga tagatttgca 600
gaaattttaa aggataaaca tgccagaaaa acaggaaaat gttctgaatt agagataatc 660
tgtcatatag aaaaatcaaa taagcagcta aaagaacttt ttaaattaat tacaggaatg 720
aaagctagtt tgagtgttgt gtttggtgat gatgagttag cggaaataga acataataag 780
attagttttt cagagagtag ttatgatgaa gtacgtcttg cattggagga tgagattcag 840
gagaggactg gtatactgga tatctttcat gcagtttata gttgggcgat tctcgcggat 900
attttagaag gcggagaata tgaggggaat tcttatctaa gcgttgcgaa ggtaagcact 960
tataaaaagc atggtgatga tttgcggttg ctaagaacac tggttcggga atattgtcct 1020
gatcattaca aatctttctt ttccgtatca gggaaggaga attattgtgc atatgcgggt 1080
actttaaaaa agaatggaaa aaaacagccg attaaacgtt gcagccagga agatttttat 1140
aaagcgttaa agaaattgct gaatcagatg ccgacagaac aaccagaagt gaaagacatc 1200
ttcatcgaaa ttgaaaatgg tacttttttg ccgttgcagg taagtaagga taatggagtg 1260
ataccttatc aggtaaataa gatggaatta gaaaaaatcc tgcagaatgc agaggaatat 1320
ttgccatttc taaaaaatat agatgaagaa tgtggaaaaa cggttagtaa gaagattata 1380
gatctctttg agtttagaat accatattat gtagggccgc ttaataccgc taaaggagaa 1440
aactgttgga tggtcagaaa agaagcgggg agaatatatc cgtggaattt tgatgaaaag 1500
gtagacagag atcaatcagc agaaaaattt atccgtagaa tgacgaatca gtgtacatat 1560
ttaatacatg aggatgttgt acctaaaaat tctttgcttt attcggagtt tatggtgctt 1620
aatgaattaa ataatgtaaa gatccggtct gagaagctgc cggtggagtt aaaacaggca 1680
atagtattgg atttgtttaa gaaacaaaag cagataacag gaaaaaaact tcttaattac 1740
ttgaatgcaa atggatatga tgtaaaaaaa gaagatttgt cagggtttga cggaaacttt 1800
aaatcatctc tgtcatcata tcttactttg aaaaaagtat ttggtgaaga attagataaa 1860
tatagtgtgc agcagatggc agaggatatt atcttgtgga tcactctgta tggagatgat 1920
cagaagatgt tgcgcagggt aattcgaaaa cattatgaac agcaattgag tgaagaacag 1980
attctttcct tatcgaaatt gaaattccaa ggctggggaa gattatccag acgacttttg 2040
agtgaaatgg aaggcgttga ttgtgagact ggtgagtgta tgacggtcat gcaaggactt 2100
cgtaatactc agaataatct gatgcagctt ctaagtcagc agttttcatt tatggaattg 2160
attgaggaag aaaatgggaa ttattatgta gatgagatta catacgataa tcttgtgaaa 2220
gatatggtta tatctccgtc agtgaagaga gcagtctggc agacagttca gattgtggag 2280
gagattaagg gggtaatggg ctgtcagcct aagaagatat ttgtcgagat ggcgcgaagc 2340
gatgaagaga aaaagcgtac tgtatctagg aaagacaggt tattagaagc atatgatgcg 2400
atcaaggatg aggctcgtca atggcaggaa gagttgcaaa agtattcaga tggtgatttt 2460
aaggctatta aactttatct gtattatacg cagatggggc aatgtatgta tactggaaga 2520
aagatagatc tgtcacaatt aaatgatgcg acggtatggg acagagatca tatatatcca 2580
cagtccaaaa caaaagatga tagtctggat aatctggtat tggtagaccg gagcgtgaac 2640
gctaagaaaa gtgatgggat gctatcacct gagattcagc agagaatgcg ggctacttgg 2700
aaatacttaa aagagaaaaa gttgatttca gagaagaaat atgagcgttt gactagggtc 2760
tcaccactta cagatgagga attggcaggt tttattaatc gacagttagt tgaaacacgt 2820
cagtcttcga aagcagtagc aacacttttg aaacgagtat atgatgaagc ggagattgtc 2880
tatgtaaaag cggaagctgt ttcaaatttt agaagagata atttggatta tattaaggtg 2940
cgtgatctga atgattatca tcatgctaaa gatgcatatc agaatattgt agtggggaat 3000
gtttttcatg agaaatttac cagcaatccg cttcgttggc tgaaaaacaa tcctaatacg 3060
aaatatagtt taaatcagat gtttaacttt gatttagaga aaaatggggt ggtaatatgg 3120
aaaaggggga aggctggaag tattaaatgt gttgaagaaa cattgaaaag aaatgatatt 3180
ctttttacac gatatgcttt ttgtaataaa ggtggttttt ttaaccagat gttaacggca 3240
gctccagaag ataaaacgaa agcaaaggga cttgtaccaa taaaaaaagg tatggaaaca 3300
tggaaatacg ggggatatac atcagtaact ccgtcacatt ttatgttggt tgcttcgaaa 3360
gataagaaag gaaaggagat aagaacgatt gagacagttc cgttgtatag gtggaaagag 3420
ttcaaagaaa atccagatgc attactccaa tattgtagag agttctatgg tttgaaagag 3480
cccaaggtgt tgataccatg catcaagaag aatgccagat tagtcgttaa tggatttcca 3540
atgcatttga aagggagtac aggaaaacaa ttgattttgc agggagcggt tcaattatgt 3600
ctgaataatg aaaatataaa gtatttgaaa aaagtcacaa aatatttgga atataatgca 3660
cagagaagag ataaaagaac actgctggaa gtaagagagg ttacaggaat taacaaagag 3720
gaaaatatac agttatatga tgtgtttgtt gataaattga gtaacacaat atatcagtat 3780
cgtccggcca atccaaagga caatcttata aaaggaagag agaagtttat agaattaggg 3840
ttggcagaac aatgtgttgt gttaggtgaa gtattgcatt tgttccaatg taaaccactc 3900
acgtctgatt tgactttgat tggaggttca ccgaatacag ggacaataaa aataacaaag 3960
acaattagta attgtaatgt tgtaaagttg ttaagccaat ctattgcagg tgttaaagtg 4020
agagaaatta atttgttaat aatatga 4047
<210> 3
<211> 4047
<212> DNA
<213> 人工序列
<220>
<223> OMNI-103人类优化的DNA序列
<400> 3
atgtctatca agagcgacta cttcctgggc ctcgacatcg gcacagattc tatcggatgg 60
gccgtgacag accccgagta ccacatcctg agaagaaagg gcaaagccct gtggggcatc 120
agactgttcg atgccgccaa tactgccgcc gagagaagaa ccttccggac cagcagaaga 180
agaatccagc ggcggagaca gcggatcaga ctgctgcaag agctgttcgc cgaggaaatg 240
gttaagctgg accccggctt cttccagaga ctgagcgata gcgccttctg gcaagaggac 300
aagcaagagc agcagatcta cagcctgttt acctgcgaga actacaccga cgtggactac 360
tacagagagt accccaccat ctaccacctg agaagcgccc tgatccaaga gaaaaaagag 420
ttcgacctgc ggctgctgta tctggccctg caccatctga tgaagcaccg gggccacttt 480
ctgttcaacg gcagcatcaa caacgtgacc agcttccaca ccaccttcca gaccttcgcc 540
gactgcctgt acgacgagtt cgacatcgag ctggaatgcg acagcgagga cagattcgcc 600
gagatcctga aggataagca cgccagaaag accggcaagt gctctgagct ggaaatcatc 660
tgccacatcg agaagtccaa caagcagctg aaagaactgt tcaagctgat caccggcatg 720
aaggccagcc tgagcgtggt gtttggagat gatgagctgg ccgagatcga gcacaacaag 780
atcagcttca gcgagagcag ctacgacgaa gtgcggctgg ccctggaaga tgagattcaa 840
gagagaaccg gcatcctgga catcttccac gccgtgtatt cttgggccat cctggccgat 900
attctggaag gcggcgagta cgagggcaac agctatctgt ctgtggccaa ggtgtccacc 960
tacaagaagc acggcgacga cctgagactg ctgagaacac tcgtgcgcga gtactgcccc 1020
gaccactaca agagcttttt cagcgtgtcc ggcaaagaga actactgcgc ctacgccggc 1080
acactgaaga agaacggcaa gaagcagccc atcaagcggt gcagccaaga ggacttctac 1140
aaggccctga agaaactgct gaaccagatg cctaccgagc agcccgaagt gaaggatatc 1200
ttcatcgaga ttgagaacgg caccttcctg cctctgcaag tgtccaagga caacggcgtg 1260
atcccctacc aagtgaacaa gatggaactc gagaagatcc tgcagaacgc cgaagagtac 1320
ctgcctttcc tgaagaacat cgacgaggaa tgcggcaaga ccgtgtccaa gaagatcatc 1380
gacctgttcg agttcagaat cccctactac gtgggccctc tgaataccgc caagggcgag 1440
aattgctgga tggttcgaaa agaggccggc agaatctacc cctggaactt cgatgagaag 1500
gtggacagag atcagagcgc cgagaagttc atcagacgga tgaccaacca gtgcacctac 1560
ctgatccacg aggacgtggt gcctaagaac agcctgctgt actccgagtt catggtgctg 1620
aacgagctga acaatgtgaa gattcggagc gagaagctgc ccgtggaact gaagcaggcc 1680
atcgtgctgg acctgtttaa gaagcagaag cagatcacag ggaagaagct gctcaactac 1740
ctgaacgcca acggctacga cgtgaagaaa gaggacctga gcggcttcga cggcaacttc 1800
aagtccagcc tgtccagcta cctgactctg aagaaggtgt tcggagagga actggacaag 1860
tacagcgtgc agcagatggc cgaggacatc atcctgtgga tcaccctgta tggcgacgat 1920
cagaaaatgc tgcggagagt gatccggaag cactacgagc agcagctgtc tgaggaacag 1980
atcctgagcc tgagcaagct gaagttccaa ggctggggca gactgtctag acggctgctc 2040
tctgaaatgg aaggcgtgga ctgtgaaacc ggcgagtgca tgacagtgat gcagggcctg 2100
agaaacaccc agaacaacct gatgcagctg ctgagccagc agttcagctt catggaactg 2160
atcgaggaag agaacgggaa ctactacgtc gacgagatca cctacgacaa cctggtcaag 2220
gacatggtca tcagccctag cgtgaaaagg gccgtgtggc agacagtgca gatcgtggaa 2280
gaaatcaagg gcgtgatggg atgccagcct aagaaaatct tcgtggaaat ggcccgcagc 2340
gacgaagaga agaaacggac cgtgtctcgg aaggatcggc tgctggaagc ctacgacgcc 2400
atcaaggatg aggcccggca atggcaagaa gaactgcaga aatactccga cggcgatttc 2460
aaggccatca agctgtacct gtactacacc cagatgggcc agtgcatgta caccggcaga 2520
aaaatcgatc tgtcccagct gaacgacgcc accgtgtggg atagagatca catctaccct 2580
cagagcaaga ccaaggacga cagcctggac aatctggtgc tggtggatag atccgtgaat 2640
gccaagaaaa gcgacggcat gctgagcccc gagatccagc agagaatgag agccacctgg 2700
aagtacctga aagaaaagaa gctcatcagc gagaagaagt acgagcggct gaccagagtg 2760
tcccctctga cagatgaaga actggccggc ttcatcaacc ggcagctggt ggaaacaaga 2820
cagagcagca aagccgtggc cacactgctg aagagggtgt acgatgaggc cgagattgtg 2880
tatgtgaagg ccgaggccgt gtctaacttc cggcgggata acctggacta catcaaagtg 2940
cgggacctga acgactacca ccacgccaag gacgcctacc agaacatcgt cgtgggcaac 3000
gtgttccacg agaagtttac cagcaatccc ctgcggtggc tgaaaaacaa ccccaacacc 3060
aagtactccc tcaaccagat gttcaacttc gacctggaaa agaacggcgt ggtcatctgg 3120
aagagaggca aggccggctc cattaagtgt gtggaagaga cactgaagcg gaacgacatc 3180
ctgttcacca gatacgcttt ctgcaacaaa ggcggcttct ttaatcagat gctgaccgcc 3240
gctccagagg ataagacaaa ggccaaaggc ctggtgccta tcaagaaagg catggaaacc 3300
tggaaatacg gcggctacac cagcgtgacc cctagccact ttatgctggt ggccagcaag 3360
gacaagaagg gaaaagagat ccggaccatc gagacagtgc ccctgtaccg gtggaaagag 3420
ttcaaagaga atcccgacgc tctgctccag tactgcagag agttctacgg cctgaaagag 3480
cccaaggttc tgatcccttg catcaagaag aatgcccggc tggtcgtgaa cggcttccct 3540
atgcacctga agggcagcac cggaaaacag ctgattctgc agggtgccgt gcagctgtgc 3600
ctgaacaacg agaacatcaa gtacctcaag aaagtgacga agtacctcga gtacaacgcc 3660
cagcggagag acaagagaac cctgctcgaa gttcgggaag tgaccggaat caacaaagag 3720
gaaaacatcc agctgtacga tgtgttcgtg gacaagctga gcaacacaat ctaccagtac 3780
agacccgcca atcctaagga caacctcatc aagggccgcg agaaattcat cgagcttggc 3840
ctggctgagc agtgcgtggt gctgggagaa gtgctgcatc tgttccagtg caagcccctg 3900
accagcgatc tgacactgat cggcggaagc cctaacaccg gcaccatcaa gatcaccaag 3960
accatcagca actgcaacgt ggtcaagctg ctgtcccagt ctatcgccgg cgtgaaagtc 4020
cgcgagatca acctgctgat catctga 4047
<210> 4
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 crRNA重复序列
<400> 4
guuugagagu aguguaa 17
<210> 5
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分crRNA 1
<400> 5
guuugagagu agugu 15
<210> 6
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分crRNA 2
<400> 6
guuugagagu ag 12
<210> 7
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分crRNA 3
<400> 7
guuugagagu 10
<210> 8
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 tracrRNA抗重复序列
<400> 8
uuacacuaca aguucaaau 19
<210> 9
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分tracrRNA 1
<400> 9
acacuacaag uucaaau 17
<210> 10
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分tracrRNA 2
<400> 10
cuacaaguuc aaau 14
<210> 11
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12部分tracrRNA 3
<400> 11
acaaguucaa au 12
<210> 12
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 tracrRNA第1部分
<400> 12
aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41
<210> 13
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 tracrRNA第2部分
<400> 13
aaagaucugg caacagaucu uuuuuu 26
<210> 14
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 tracrRNA第2部分polyT
<400> 14
aaagaucugg caacagauc 19
<210> 15
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 V1
<400> 15
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 16
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 V2
<400> 16
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 17
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 12 V2修饰的tracrRNA
<400> 17
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 18
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 crRNA重复序列
<400> 18
guuugagagu aguguaa 17
<210> 19
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分crRNA 1
<400> 19
guuugagagu agugu 15
<210> 20
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分crRNA 2
<400> 20
guuugagagu ag 12
<210> 21
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分crRNA 3
<400> 21
guuugagagu 10
<210> 22
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 tracrRNA抗重复序列
<400> 22
uuacacuaca aguucaaau 19
<210> 23
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分tracrRNA 1
<400> 23
acacuacaag uucaaau 17
<210> 24
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分tracrRNA 2
<400> 24
cuacaaguuc aaau 14
<210> 25
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32部分tracrRNA 3
<400> 25
acaaguucaa au 12
<210> 26
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 tracrRNA第1部分
<400> 26
aaaaauuuau ucaaauccuu uugcuacauu guguagaauu u 41
<210> 27
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 tracrRNA第2部分
<400> 27
aaagaucugg caacagaucu uuuuuauuuu uu 32
<210> 28
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 tracrRNA第2部分polyT
<400> 28
aaagaucugg caacagaucu uuuuua 26
<210> 29
<211> 113
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 V1
<400> 29
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuauuu uuu 113
<210> 30
<211> 106
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 V2
<400> 30
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccuu 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106
<210> 31
<211> 106
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 V3
<400> 31
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuu 106
<210> 32
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> sgRNA 32 V3修饰的tracrRNA
<400> 32
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 33
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> V2.1
<400> 33
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101
<210> 34
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> V2.2
<400> 34
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uuuuu 85
<210> 35
<211> 79
<212> RNA
<213> 人工序列
<220>
<223> V2.3
<400> 35
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuuuuu 79
<210> 36
<211> 95
<212> RNA
<213> 人工序列
<220>
<223> V2.4
<400> 36
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95
<210> 37
<211> 6373
<212> DNA
<213> 人工序列
<220>
<223> pET9a OMNI-103
<400> 37
taatacgact cactataggg agaccacaac ggtttccctc tagagagaca ataaccctga 60
taatgcttca ataatattga aaaaggaaga gtatgcctaa gaagaagaga aaggtgggta 120
cctctatcaa gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg 180
ccgtgacaga ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca 240
gactgttcga tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa 300
gaatccagcg gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg 360
ttaagctgga ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca 420
agcaagagca gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact 480
acagagagta ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt 540
tcgacctgcg gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc 600
tgttcaacgg cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg 660
actgcctgta cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg 720
agatcctgaa ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct 780
gccacatcga gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga 840
aggccagcct gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga 900
tcagcttcag cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag 960
agagaaccgg catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata 1020
ttctggaagg cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct 1080
acaagaagca cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg 1140
accactacaa gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca 1200
cactgaagaa gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca 1260
aggccctgaa gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct 1320
tcatcgagat tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga 1380
tcccctacca agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc 1440
tgcctttcct gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg 1500
acctgttcga gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga 1560
attgctggat ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg 1620
tggacagaga tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc 1680
tgatccacga ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga 1740
acgagctgaa caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca 1800
tcgtgctgga cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc 1860
tgaacgccaa cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca 1920
agtccagcct gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt 1980
acagcgtgca gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc 2040
agaaaatgct gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga 2100
tcctgagcct gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct 2160
ctgaaatgga aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga 2220
gaaacaccca gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga 2280
tcgaggaaga gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg 2340
acatggtcat cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag 2400
aaatcaaggg cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg 2460
acgaagagaa gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca 2520
tcaaggatga ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca 2580
aggccatcaa gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa 2640
aaatcgatct gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc 2700
agagcaagac caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg 2760
ccaagaaaag cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga 2820
agtacctgaa agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt 2880
cccctctgac agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac 2940
agagcagcaa agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt 3000
atgtgaaggc cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc 3060
gggacctgaa cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg 3120
tgttccacga gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca 3180
agtactccct caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga 3240
agagaggcaa ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc 3300
tgttcaccag atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg 3360
ctccagagga taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct 3420
ggaaatacgg cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg 3480
acaagaaggg aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt 3540
tcaaagagaa tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc 3600
ccaaggttct gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta 3660
tgcacctgaa gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc 3720
tgaacaacga gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc 3780
agcggagaga caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg 3840
aaaacatcca gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca 3900
gacccgccaa tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc 3960
tggctgagca gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga 4020
ccagcgatct gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga 4080
ccatcagcaa ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc 4140
gcgagatcaa cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg 4200
ctccaaaaaa gaaaagaaaa gttgcggcta gccatcatca ccatcaccat catcattaag 4260
gctgctaaca aagcccgaaa ggaagctgag ttggctgctg ccaccgctga gcaataacta 4320
gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa aggaggaact 4380
atatccggat atccacagga cgggtgtggt cgccatgatc gcgtagtcga tagtggctcc 4440
aagtagcgaa gcgagcagga ctgggcggcg gccaaagcgg tcggacagtg ctccgagaac 4500
gggtgcgcat agaaattgca tcaacgcata tagcgctagc agcacgccat agtgactggc 4560
gatgctgtcg gaatggacga tatcccgcaa gaggcccggc agtaccggca taaccaagcc 4620
tatgcctaca gcatccaggg tgacggtgcc gaggatgacg atgagcgcat tgttagattt 4680
catacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc attaaagctt 4740
atcgatgata agctgtcaaa catgagaatt cttagaaaaa ctcatcgagc atcaaatgaa 4800
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 4860
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 4920
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 4980
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 5040
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 5100
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 5160
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 5220
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 5280
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 5340
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 5400
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 5460
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 5520
aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat 5580
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgacc 5640
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5700
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5760
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5820
actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc gtagttaggc 5880
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5940
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 6000
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 6060
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 6120
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 6180
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 6240
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 6300
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 6360
gatcccgcga aat 6373
<210> 38
<211> 2783
<212> DNA
<213> 人工序列
<220>
<223> pShuttle引导OMNI-103 V2
<400> 38
tacacggtgc ctgactgcgt tagcaattta actgtgataa actaccgcat taaagcttat 60
cgatgataag ctgtcaacac atttccccga aaagtgccac ctgacgtcct cgagtcccgc 120
ataatcgaaa tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 180
ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata 240
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 300
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 360
tgctaatacg actcactata ggaagagcag agccttggtc tcgtttgaga gtagtgtaag 420
aaattacact acaagttcaa ataaaaattt attcaaatcc atttgctaca ttgtgtagaa 480
tttaaagatc tggcaacaga tctttttttg aattctctag cataacccct tggggcctct 540
aaacgggtct tgaggggttt tttgacctag gctaggggat atattccggg taccccgctt 600
cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa atggcttacg 660
aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa gtgagagggc 720
cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg aaatctgacg 780
ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 840
cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca ttccgctgtt 900
atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca gttcgctcca 960
agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta tccggtaact 1020
atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca gccactggta 1080
attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac tgaaaggaca 1140
agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt ggtagctcag 1200
agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca agagattacg 1260
cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata tttctagatt 1320
tcagtgcaat ttatctcttc aaatgtagca cctgaagtca gccccatacg atataagttg 1380
ttactagtgc ttggattctc accaataaaa aacgcccggc ggcaaccgag cgttctgaac 1440
aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc aagcgagaag 1500
ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt cttggagtgg 1560
tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc ggctccatgc 1620
accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa tccatgccaa 1680
cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg gtccaatgat 1740
cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat ggtcgtcatc 1800
tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg aagcgagaag 1860
aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga cgtagcccag 1920
cgcgtcggcc gccatgccgg cgataatggc ctgcttctcg ccgaaacgtt tggtggcggg 1980
accagtgacg aaggcttgag cgagggcgtg caagattccg aataccgcaa gcgacaggcc 2040
gatcatcgtc gcgctccagc gaaagcggtc ctcgccgaaa atgacccaga gcgctgccgg 2100
cacctgtcct acgagttgca tgataaagaa gacagtcata agtgcggcga cgatagtcat 2160
gccccgcgcc caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgacg 2220
ctctccctta tgcgactcct gcattaggaa gcagcccagt agtaggttga ggccgttgag 2280
caccgccgcc gcaaggaatg gtgcatgcaa ggagatggcg cccaacagtc ccccggccac 2340
ggggcctgcc accataccca cgccgaaaca agcgctcatg agcccgaagt ggcgagcccg 2400
atcttcccca tcggtgatgt cggcgatata ggcgccagca accgcacctg tggcgccggt 2460
gatgccggcc acgatgcgtc cggcgtagag gatccacagg acgggtgtgg tcgccatgat 2520
cgcgtagtcg atagtggctc caagtagcga agcgagcagg actgggcggc ggccaaagcg 2580
gtcggacagt gctccgagaa cgggtgcgca tagaaattgc atcaacgcat atagcgctag 2640
cagcacgcca tagtgactgg cgatgctgtc ggaatggacg atatcccgca agaggcccgg 2700
cagtaccggc ataaccaagc ctatgcctac agcatccagg gtgacggtgc cgaggatgac 2760
gatgagcgca ttgttagatt tca 2783
<210> 39
<211> 5009
<212> DNA
<213> 人工序列
<220>
<223> pbPOS T2文库
<220>
<221> misc_feature
<222> (3040)..(3047)
<223> n为a、c、g或t
<400> 39
tcgagtcttt acactttatg cttccggctc gtatgttgtg tggaattgtg agcggataac 60
aatttcacac atgattacgg attcaacgtc gtgactggta aaacccgggc gttacccaac 120
ttaatcgcct tgcagcacat ccccctttcg ccagcaggcg taataaggaa aggattcatg 180
tactatttga aaaacacaaa cttttggatg ttcggtttat tctttttctt ttactttttt 240
atcatgggag cctacttccc gtttttcccg atttggctac atgatatcaa ccatatcagc 300
aaaagtgata cgggtattat ttttgccgct atttctctgt tctcgctatt attccaaccg 360
ctgtttggtc tgctttctga caaactcggt ctacgcaaat acctgctgtg gattattacc 420
ggcatgttag tgatgtttgc gccgttcttt atttttatct tcgggccact gctgcagtac 480
aacattttag tagggtcgat tgttggtggt atttatctag gctttagttt taacgccggt 540
gcgccagcag tagaggcatt tattgagaaa gtcagccggc gcagtaattt cgaatttggt 600
cgcgcgcgga tgtttggcag tgttggctgg gcgctggttg cctcgattgt cgggatcatg 660
ttcaccatta ataatcagtt tgttttctgg ctgggctctg gcagttgtct catcctcgcc 720
gttttactct ttttcgccaa aacggacgcg ccctcaagtg ccacggttgc caatgcggta 780
ggtgccaacc attcggcatt tagccttaag ctggcactgg aactgttcag acagccaaaa 840
ctgtggtttt tgtcactgta tgttattggc gtttcctcca cctacgatgt ttttgaccaa 900
cagtttgcta atttctttac ttcgttcttt gctaccggtg aacagggtac ccgcgtattt 960
ggctacgtaa cgacaatggg cgaattactt aacgcctcga ttatgttctt tgcgccactg 1020
atcattaatc gcatcggtgg gaagaatgcc ctgctgctgg ctggcactat tatgtctgta 1080
cgtattattg gctcatcgtt cgccacctca gcgctggaag tggttattct gaaaacgctg 1140
catatgtttg aagtaccgtt cctgctggtg ggctccttta aatatattac tagtcagttt 1200
gaagtgcgtt tttcagcgac gatttatctg gtcagtttca gcttctttaa gcaactggcg 1260
atgattttta tgtctgtact ggcgggcaat atgtatgaaa gcataggttt ccaaggcgct 1320
tatctggtgc tgggtctggt ggcgctgggc ttcaccttaa tttccgtgtt cacgcttagc 1380
ggcccgggcc cgctttccct gctgcgtcgt caggtgaatg aagtcgctta aaggcctcga 1440
tgcagctagc atgctaatct gattcgttac caattatgac aacttgacgg ctacatcatt 1500
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 1560
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 1620
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 1680
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 1740
aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat cgctgatgta 1800
ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt taatcgcttc 1860
catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg aatagcgccc 1920
ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc 1980
ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa gccattcatg 2040
ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag cctccggatg 2100
acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac 2160
aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat tgagaatata 2220
acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg 2280
cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg gatcattttg 2340
cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt gtccatattg 2400
catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca aaccggtaac 2460
cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa aaacgcgtaa 2520
caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg gcgtcacact 2580
ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac gctttttatc 2640
gcaactctct actgtttctc catacccgtt tttttggggt agcgattgaa aacgatgcag 2700
tttaaggttt acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt 2760
gatattattg acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg 2820
tcagataaag tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc 2880
atgatgacca ccgatatggc cagtgtgccg gtctccgtta tcggggaaga agtggctgat 2940
ctcagccacc gcgaaaatga catcaaaaac gccattaacc tgatgttttg gggaatataa 3000
tcttctagac atacaatgga agagcagagc cttggtctcn nnnnnnnaag cttgatatcg 3060
aattcctgca gcccggggga tcccatggta cgcgtgctag aggcatcaaa taaaacgaaa 3120
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 3180
gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc ggtatcagct 3240
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 3300
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 3360
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 3420
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 3480
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 3540
gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 3600
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 3660
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 3720
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 3780
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 3840
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 3900
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 3960
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 4020
actagtgctt ggattctcac caataaaaaa cgcccggcgg caaccgagcg ttctgaacaa 4080
atccagatgg agttctgagg tcattactgg atctatcaac aggagtccaa gcgagctcga 4140
tatcaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc 4200
tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca 4260
ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca 4320
tattggccac gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa 4380
acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat 4440
cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg 4500
aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca 4560
ccagctcacc gtctttcatt gccatacgga attccggatg agcattcatc aggcgggcaa 4620
gaatgtgaat aaaggccgga taaaacttgt gcttattttt ctttacggtc tttaaaaagg 4680
ccgtaatatc cagctgaacg gtctggttat aggtacattg agcaactgac tgaaatgcct 4740
caaaatgttc tttacgatgc cattgggata tatcaacggt ggtatatcca gtgatttttt 4800
tctccatttt agcttcctta gctcctgaaa atctcgataa ctcaaaaaat acgcccggta 4860
gtgatcttat ttcattatgg tgaaagttgg aacctcttac gtgccgatca acgtctcatt 4920
ttcgccagat atcgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 4980
gcgtatcacg aggccctttc gtcttcacc 5009
<210> 40
<211> 10286
<212> DNA
<213> 人工序列
<220>
<223> pmOMNI OMNI-103
<400> 40
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gtttaaactt aagcttgcca ccatgcctaa gaagaagaga aaggtgggta cctctatcaa 960
gagcgactac ttcctgggcc tcgacatcgg cacagattct atcggatggg ccgtgacaga 1020
ccccgagtac cacatcctga gaagaaaggg caaagccctg tggggcatca gactgttcga 1080
tgccgccaat actgccgccg agagaagaac cttccggacc agcagaagaa gaatccagcg 1140
gcggagacag cggatcagac tgctgcaaga gctgttcgcc gaggaaatgg ttaagctgga 1200
ccccggcttc ttccagagac tgagcgatag cgccttctgg caagaggaca agcaagagca 1260
gcagatctac agcctgttta cctgcgagaa ctacaccgac gtggactact acagagagta 1320
ccccaccatc taccacctga gaagcgccct gatccaagag aaaaaagagt tcgacctgcg 1380
gctgctgtat ctggccctgc accatctgat gaagcaccgg ggccactttc tgttcaacgg 1440
cagcatcaac aacgtgacca gcttccacac caccttccag accttcgccg actgcctgta 1500
cgacgagttc gacatcgagc tggaatgcga cagcgaggac agattcgccg agatcctgaa 1560
ggataagcac gccagaaaga ccggcaagtg ctctgagctg gaaatcatct gccacatcga 1620
gaagtccaac aagcagctga aagaactgtt caagctgatc accggcatga aggccagcct 1680
gagcgtggtg tttggagatg atgagctggc cgagatcgag cacaacaaga tcagcttcag 1740
cgagagcagc tacgacgaag tgcggctggc cctggaagat gagattcaag agagaaccgg 1800
catcctggac atcttccacg ccgtgtattc ttgggccatc ctggccgata ttctggaagg 1860
cggcgagtac gagggcaaca gctatctgtc tgtggccaag gtgtccacct acaagaagca 1920
cggcgacgac ctgagactgc tgagaacact cgtgcgcgag tactgccccg accactacaa 1980
gagctttttc agcgtgtccg gcaaagagaa ctactgcgcc tacgccggca cactgaagaa 2040
gaacggcaag aagcagccca tcaagcggtg cagccaagag gacttctaca aggccctgaa 2100
gaaactgctg aaccagatgc ctaccgagca gcccgaagtg aaggatatct tcatcgagat 2160
tgagaacggc accttcctgc ctctgcaagt gtccaaggac aacggcgtga tcccctacca 2220
agtgaacaag atggaactcg agaagatcct gcagaacgcc gaagagtacc tgcctttcct 2280
gaagaacatc gacgaggaat gcggcaagac cgtgtccaag aagatcatcg acctgttcga 2340
gttcagaatc ccctactacg tgggccctct gaataccgcc aagggcgaga attgctggat 2400
ggttcgaaaa gaggccggca gaatctaccc ctggaacttc gatgagaagg tggacagaga 2460
tcagagcgcc gagaagttca tcagacggat gaccaaccag tgcacctacc tgatccacga 2520
ggacgtggtg cctaagaaca gcctgctgta ctccgagttc atggtgctga acgagctgaa 2580
caatgtgaag attcggagcg agaagctgcc cgtggaactg aagcaggcca tcgtgctgga 2640
cctgtttaag aagcagaagc agatcacagg gaagaagctg ctcaactacc tgaacgccaa 2700
cggctacgac gtgaagaaag aggacctgag cggcttcgac ggcaacttca agtccagcct 2760
gtccagctac ctgactctga agaaggtgtt cggagaggaa ctggacaagt acagcgtgca 2820
gcagatggcc gaggacatca tcctgtggat caccctgtat ggcgacgatc agaaaatgct 2880
gcggagagtg atccggaagc actacgagca gcagctgtct gaggaacaga tcctgagcct 2940
gagcaagctg aagttccaag gctggggcag actgtctaga cggctgctct ctgaaatgga 3000
aggcgtggac tgtgaaaccg gcgagtgcat gacagtgatg cagggcctga gaaacaccca 3060
gaacaacctg atgcagctgc tgagccagca gttcagcttc atggaactga tcgaggaaga 3120
gaacgggaac tactacgtcg acgagatcac ctacgacaac ctggtcaagg acatggtcat 3180
cagccctagc gtgaaaaggg ccgtgtggca gacagtgcag atcgtggaag aaatcaaggg 3240
cgtgatggga tgccagccta agaaaatctt cgtggaaatg gcccgcagcg acgaagagaa 3300
gaaacggacc gtgtctcgga aggatcggct gctggaagcc tacgacgcca tcaaggatga 3360
ggcccggcaa tggcaagaag aactgcagaa atactccgac ggcgatttca aggccatcaa 3420
gctgtacctg tactacaccc agatgggcca gtgcatgtac accggcagaa aaatcgatct 3480
gtcccagctg aacgacgcca ccgtgtggga tagagatcac atctaccctc agagcaagac 3540
caaggacgac agcctggaca atctggtgct ggtggataga tccgtgaatg ccaagaaaag 3600
cgacggcatg ctgagccccg agatccagca gagaatgaga gccacctgga agtacctgaa 3660
agaaaagaag ctcatcagcg agaagaagta cgagcggctg accagagtgt cccctctgac 3720
agatgaagaa ctggccggct tcatcaaccg gcagctggtg gaaacaagac agagcagcaa 3780
agccgtggcc acactgctga agagggtgta cgatgaggcc gagattgtgt atgtgaaggc 3840
cgaggccgtg tctaacttcc ggcgggataa cctggactac atcaaagtgc gggacctgaa 3900
cgactaccac cacgccaagg acgcctacca gaacatcgtc gtgggcaacg tgttccacga 3960
gaagtttacc agcaatcccc tgcggtggct gaaaaacaac cccaacacca agtactccct 4020
caaccagatg ttcaacttcg acctggaaaa gaacggcgtg gtcatctgga agagaggcaa 4080
ggccggctcc attaagtgtg tggaagagac actgaagcgg aacgacatcc tgttcaccag 4140
atacgctttc tgcaacaaag gcggcttctt taatcagatg ctgaccgccg ctccagagga 4200
taagacaaag gccaaaggcc tggtgcctat caagaaaggc atggaaacct ggaaatacgg 4260
cggctacacc agcgtgaccc ctagccactt tatgctggtg gccagcaagg acaagaaggg 4320
aaaagagatc cggaccatcg agacagtgcc cctgtaccgg tggaaagagt tcaaagagaa 4380
tcccgacgct ctgctccagt actgcagaga gttctacggc ctgaaagagc ccaaggttct 4440
gatcccttgc atcaagaaga atgcccggct ggtcgtgaac ggcttcccta tgcacctgaa 4500
gggcagcacc ggaaaacagc tgattctgca gggtgccgtg cagctgtgcc tgaacaacga 4560
gaacatcaag tacctcaaga aagtgacgaa gtacctcgag tacaacgccc agcggagaga 4620
caagagaacc ctgctcgaag ttcgggaagt gaccggaatc aacaaagagg aaaacatcca 4680
gctgtacgat gtgttcgtgg acaagctgag caacacaatc taccagtaca gacccgccaa 4740
tcctaaggac aacctcatca agggccgcga gaaattcatc gagcttggcc tggctgagca 4800
gtgcgtggtg ctgggagaag tgctgcatct gttccagtgc aagcccctga ccagcgatct 4860
gacactgatc ggcggaagcc ctaacaccgg caccatcaag atcaccaaga ccatcagcaa 4920
ctgcaacgtg gtcaagctgc tgtcccagtc tatcgccggc gtgaaagtcc gcgagatcaa 4980
cctgctgatc atcggatcct acccatacga tgttccagat tacgcggccg ctccaaaaaa 5040
gaaaagaaaa gttgaattcg gcggcagcgg cgccaccaac ttcagcctgc tgaagcaggc 5100
cggcgacgtg gaggagaacc ccggccccat ggtgagcaag ggcgaggagg ataacatggc 5160
catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga acggccacga 5220
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga ccgccaagct 5280
gaaggtgacc aagggtggcc ccctgccctt cgcctgggac atcctgtccc ctcagttcat 5340
gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact tgaagctgtc 5400
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac 5460
cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg 5520
caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct gggaggcctc 5580
ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc agaggctgaa 5640
gctgaaggac ggcggccact acgacgctga ggtcaagacc acctacaagg ccaagaagcc 5700
cgtgcagctg cccggcgcct acaacgtcaa catcaagttg gacatcacct cccacaacga 5760
ggactacacc atcgtggaac agtacgaacg cgccgagggc cgccactcca ccggcggcat 5820
ggacgagctg tacaagtagc tcgagtctag agggcccgtt taaacccgct gatcagcctc 5880
gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac 5940
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg 6000
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga 6060
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctt ctgaggcgga 6120
aagaaccagc tggggctcta gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc 6180
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 6240
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 6300
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 6360
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 6420
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 6480
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 6540
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt 6600
cagttagggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 6660
ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg 6720
caaagcatgc atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg 6780
cccctaactc cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt 6840
tatgcagagg ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt 6900
tttggaggcc taggcttttg caaaaagctc ccgggagctt gtatatccat tttcggatct 6960
gatcaagaga caggatgagg atcgtttcgc atgattgaac aagatggatt gcacgcaggt 7020
tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 7080
tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct ttttgtcaag 7140
accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct atcgtggctg 7200
gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc gggaagggac 7260
tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc 7320
gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc 7380
tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc 7440
ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg 7500
ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat 7560
gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat cgactgtggc 7620
cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa 7680
gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat 7740
tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg actctggggt 7800
tcgaaatgac cgaccaagcg acgcccaacc tgccatcacg agatttcgat tccaccgccg 7860
ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg atgatcctcc 7920
agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt gcagcttata 7980
atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 8040
attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt ataccgtcga 8100
cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 8160
cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 8220
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 8280
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 8340
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8400
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8460
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 8520
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 8580
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8640
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8700
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8760
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 8820
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 8880
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 8940
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 9000
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9060
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9120
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9180
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9240
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9300
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9360
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9420
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9480
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 9540
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 9600
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 9660
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 9720
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 9780
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 9840
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 9900
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 9960
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10020
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10080
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10140
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10200
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10260
ttccccgaaa agtgccacct gacgtc 10286
<210> 41
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> HA标签氨基酸序列
<400> 41
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> SV40 NLS氨基酸序列
<400> 42
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 43
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> P2A氨基酸序列
<400> 43
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 44
<211> 236
<212> PRT
<213> 人工序列
<220>
<223> mCherry氨基酸序列
<400> 44
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 45
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> HA标签DNA序列
<400> 45
tacccatacg atgttccaga ttacgct 27
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> SV40 NLS DNA序列
<400> 46
ccaaaaaaga aaagaaaagt t 21
<210> 47
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> P2A DNA序列
<400> 47
gccaccaact tcagcctgct gaagcaggcc ggcgacgtgg aggagaaccc cggcccc 57
<210> 48
<211> 711
<212> DNA
<213> 人工序列
<220>
<223> mCherry DNA序列
<400> 48
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta g 711
<210> 49
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_s11-ref
<400> 49
ggaccagagc gggaggguag ga 22
<210> 50
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_s12-ref
<400> 50
guaugccugc cgugugaacc au 22
<210> 51
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S26 -ref
<400> 51
ucucucucca uucuucagua ag 22
<210> 52
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S27 -ref
<400> 52
agaauugaaa aaguggagca uu 22
<210> 53
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S40 -ref
<400> 53
aagaauguaa gacuuacccc ac 22
<210> 54
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S41 -ref
<400> 54
ucagcagcuu acaaaagaau gu 22
<210> 55
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S48 -ref
<400> 55
cgucgcgcug gcgggcauuc cu 22
<210> 56
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S49 -ref
<400> 56
agacaucucg gcccgaaugc ug 22
<210> 57
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_CXCR4_S35-ref
<400> 57
cuggagugaa aacuugaaga cu 22
<210> 58
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_CXCR4_s93-ref
<400> 58
gggguucaga caacagugga ag 22
<210> 59
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_ELANE_g114-ref
<400> 59
gguguuaugg ucacagcggg ug 22
<210> 60
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_ELANE_g115-alt
<400> 60
ugggaauccc auucccgcag cu 22
<210> 61
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_ELANE_g128-ref
<400> 61
ugcuccccac ccgcucccag cc 22
<210> 62
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40-ref
<400> 62
aacacaucgg agagcuucgu gc 22
<210> 63
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S92-ref
<400> 63
gaggaccgca gccagcccgg cc 22
<210> 64
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SAMD9_g34-ref
<400> 64
gccaagaccc uuuaaacaga cc 22
<210> 65
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SAMD9_g36-ref
<400> 65
guaauaccag agugaagauu au 22
<210> 66
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SAMD9L_g133-alt
<400> 66
aggaacaaag agccuuuggu gc 22
<210> 67
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SAMD9L_g79-alt
<400> 67
ugacuucugu cuacgcuaca ga 22
<210> 68
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SAMD9L_g80-alt
<400> 68
gcauucuaga gccuggaauu ua 22
<210> 69
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SARM1_g42-ref
<400> 69
cgcgcggccu gcacacgcgu cu 22
<210> 70
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SARM1_g43-ref
<400> 70
cgccacugcg cgcuggcgcu gg 22
<210> 71
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SARM1_g44-ref
<400> 71
gugucugagc agcagcugcu gg 22
<210> 72
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_SARM1_g45-ref
<400> 72
gaugucuuca ucagcuaccg cc 22
<210> 73
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S124 -ref
<400> 73
ucucgaccag cuugacauca ca 22
<210> 74
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S141 -ref
<400> 74
cuugguuuua cagauacgaa cc 22
<210> 75
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S142 -ref
<400> 75
cgucaugagc agauuaaacc cg 22
<210> 76
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S24-ref
<400> 76
acugugcuag acaugagguc ua 22
<210> 77
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S35-ref
<400> 77
gacccugccg uguaccagcu ga 22
<210> 78
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S36-ref
<400> 78
ucaaaaucgg ugaauaggca ga 22
<210> 79
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S58-ref
<400> 79
agaacccuga cccugccgug ua 22
<210> 80
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_s90-ref
<400> 80
uucugaugug uauaucacag ac 22
<210> 81
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S91-ref
<400> 81
gcuguggccu ggagcaacaa au 22
<210> 82
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S12间隔区
<400> 82
guaugccugc cgugugaacc au 22
<210> 83
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S36间隔区
<400> 83
ucaaaaucgg ugaauaggca ga 22
<210> 84
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S35间隔区
<400> 84
gacccugccg uguaccagcu ga 22
<210> 85
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 25nt间隔区
<400> 85
uccaacacau cggagagcuu cgugc 25
<210> 86
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 24nt间隔区
<400> 86
ccaacacauc ggagagcuuc gugc 24
<210> 87
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 23nt间隔区
<400> 87
caacacaucg gagagcuucg ugc 23
<210> 88
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 22nt间隔区
<400> 88
aacacaucgg agagcuucgu gc 22
<210> 89
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 21nt间隔区
<400> 89
acacaucgga gagcuucgug c 21
<210> 90
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 20nt间隔区
<400> 90
cacaucggag agcuucgugc 20
<210> 91
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_B2M_S12
<400> 91
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 92
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_TRAC_S36
<400> 92
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 93
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_TRAC_S35
<400> 93
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 94
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 25nt
<400> 94
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 95
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 24nt
<400> 95
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 96
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 23nt
<400> 96
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 97
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 22nt
<400> 97
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 98
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 21nt
<400> 98
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 99
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 带有sgRNA 12 V2支架的OMNI-103_PDCD1_S40 20nt
<400> 99
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaucug gcaacagauc uuuuuuu 107
<210> 100
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_B2M_S12完整sgRNA
<400> 100
guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 101
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S36完整sgRNA
<400> 101
ucaaaaucgg ugaauaggca gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 102
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_TRAC_S35完整sgRNA
<400> 102
gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 103
<211> 132
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 25nt完整sgRNA
<400> 103
uccaacacau cggagagcuu cgugcguuug agaguagugu aagaaauuac acuacaaguu 60
caaauaaaaa uuuauucaaa uccauuugcu acauugugua gaauuuaaag aucuggcaac 120
agaucuuuuu uu 132
<210> 104
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 24nt完整sgRNA
<400> 104
ccaacacauc ggagagcuuc gugcguuuga gaguagugua agaaauuaca cuacaaguuc 60
aaauaaaaau uuauucaaau ccauuugcua cauuguguag aauuuaaaga ucuggcaaca 120
gaucuuuuuu u 131
<210> 105
<211> 130
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 23nt完整sgRNA
<400> 105
caacacaucg gagagcuucg ugcguuugag aguaguguaa gaaauuacac uacaaguuca 60
aauaaaaauu uauucaaauc cauuugcuac auuguguaga auuuaaagau cuggcaacag 120
aucuuuuuuu 130
<210> 106
<211> 129
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 22nt完整sgRNA
<400> 106
aacacaucgg agagcuucgu gcguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuaaagauc uggcaacaga 120
ucuuuuuuu 129
<210> 107
<211> 128
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 21nt完整sgRNA
<400> 107
acacaucgga gagcuucgug cguuugagag uaguguaaga aauuacacua caaguucaaa 60
uaaaaauuua uucaaaucca uuugcuacau uguguagaau uuaaagaucu ggcaacagau 120
cuuuuuuu 128
<210> 108
<211> 127
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103_PDCD1_S40 20nt完整sgRNA
<400> 108
cacaucggag agcuucgugc guuugagagu aguguaagaa auuacacuac aaguucaaau 60
aaaaauuuau ucaaauccau uugcuacauu guguagaauu uaaagaucug gcaacagauc 120
uuuuuuu 127
<210> 109
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> V2.1支架
<400> 109
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ucuggcaaca gaucuuuuuu u 101
<210> 110
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> V2.2支架
<400> 110
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uuuuu 85
<210> 111
<211> 79
<212> RNA
<213> 人工序列
<220>
<223> V2.3支架
<400> 111
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuuuuu 79
<210> 112
<211> 95
<212> RNA
<213> 人工序列
<220>
<223> V2.4支架
<400> 112
guuugagagu aguggaaaca cuacaaguuc aaauaaaaau uuauucaaau ccauuugcua 60
cauuguguag aauuuaaaga ugcaaaucuu uuuuu 95
<210> 113
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> V2.5支架
<400> 113
guuugagagu aguguaagaa auuacacuac aaguucaaau aaaaauuuau ucaaauccau 60
uugcuacauu guguagaauu uaaagaugca aaucuuuuuu u 101
<210> 114
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> crRNA重复序列A
<400> 114
guuugagagu agug 14
<210> 115
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> crRNA重复序列B
<400> 115
guuugagagu aguguaa 17
<210> 116
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA抗重复序列A
<400> 116
cacuacaagu ucaaau 16
<210> 117
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA抗重复序列B
<400> 117
uuacacuaca aguucaaau 19
<210> 118
<211> 41
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第1部分序列A
<400> 118
aaaaauuuau ucaaauccau uugcuacauu guguagaauu u 41
<210> 119
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第1部分序列B
<400> 119
aaaaauuuau ucaaauccau uugcuacauu guguagaauu uuuuu 45
<210> 120
<211> 38
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第1部分 部分序列
<400> 120
aaaaauuuau ucaaauccau uugcuacauu guguagaa 38
<210> 121
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第2部分序列A
<400> 121
aaagaucugg caacagaucu uuuuuu 26
<210> 122
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第2部分序列B
<400> 122
aaagaugcaa aucuuuuuuu 20
<210> 123
<211> 17
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第2部分-部分序列A
<400> 123
aaagaucugg caacaga 17
<210> 124
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA第2部分-部分序列B
<400> 124
aaagaugcaa auc 13
<210> 125
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> TRAC s91间隔区
<400> 125
gcuguggccu ggagcaacaa au 22
<210> 126
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> PDCD1 s40间隔区
<400> 126
aacacaucgg agagcuucgu gc 22
<210> 127
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> B2M s12间隔区
<400> 127
guaugccugc cgugugaacc au 22
<210> 128
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> TRAC s35间隔区
<400> 128
gacccugccg uguaccagcu ga 22
<210> 129
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103 v2.2 TRAC S35 sgRNA
<400> 129
gacccugccg uguaccagcu gaguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107
<210> 130
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103 v2.3 TRAC S35 sgRNA
<400> 130
gacccugccg uguaccagcu gaguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60
auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101
<210> 131
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103 v2.2 B2M S12 sgRNA
<400> 131
guaugccugc cgugugaacc auguuugaga guaguguaag aaauuacacu acaaguucaa 60
auaaaaauuu auucaaaucc auuugcuaca uuguguagaa uuuuuuu 107
<210> 132
<211> 101
<212> RNA
<213> 人工序列
<220>
<223> OMNI-103 v2.3 B2M S12 sgRNA
<400> 132
guaugccugc cgugugaacc auguuugaga guaguggaaa cacuacaagu ucaaauaaaa 60
auuuauucaa auccauuugc uacauugugu agaauuuuuu u 101
<210> 133
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> PDCD1 S40位点
<220>
<221> misc_feature
<222> (23)..(24)
<223> n为a、c、g或t
<400> 133
gaccctgccg tgtaccagct gannract 28
<210> 134
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> TRAC S35位点
<220>
<221> misc_feature
<222> (23)..(24)
<223> n为a、c、g或t
<400> 134
aacacatcgg agagcttcgt gcnnract 28
<210> 135
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> T2序列
<400> 135
ggaagagcag agccttggtc tc 22

Claims (81)

1.一种非天然存在的组合物,其包含:CRISPR核酸酶,其包含与SEQ ID NO:1的氨基酸序列具有至少90%同一性的序列;或核酸分子,其包含编码所述CRISPR核酸酶的序列。
2.根据权利要求1所述的组合物,其进一步包含:一个或多个RNA分子,或编码所述一个或多个RNA分子中的任一者的DNA多核苷酸,其中所述一个或多个RNA分子和所述CRISPR核酸酶不天然地一起存在,并且所述一个或多个RNA分子配置成与所述CRISPR核酸酶形成复合物及/或将所述复合物靶向靶位点。
3.根据权利要求2所述的组合物,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子包含选自由SEQ ID NO:4-36组成的组的序列。
4.根据权利要求3所述的组合物,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是CRISPR RNA(crRNA)分子,所述分子包含引导序列部分和选自由SEQ ID NO:4-7和18-21组成的组的序列。
5.根据权利要求4所述的组合物,其进一步包含反式活化CRISPR RNA(tracrRNA)分子,所述分子包含由SEQ ID NO:8-14、17、22-28和32组成的组中所示的序列。
6.根据权利要求2所述的组合物,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA(sgRNA)分子,所述分子包含引导序列部分和选自由SEQ ID NO:4-36组成的组的序列。
7.根据权利要求2所述的组合物,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,并且至少一个RNA分子是单引导RNA (sgRNA)分子,所述分子包含引导序列部分和长度为至少79个核苷酸的支架部分。
8.根据权利要求1至7中任一项所述的组合物,其中所述CRISPR核酸酶是通过位置D12、E776、H988或D991处的氨基酸取代而创建的切口酶。
9.根据权利要求1至7中任一项所述的组合物,其中所述CRISPR核酸酶是通过位置D856、H857或N880处的氨基酸取代而创建的切口酶,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
10.根据权利要求1至7中任一项所述的组合物,其中所述CRISPR核酸酶是通过位置D12、E776、H988或D991中的任何一者处的氨基酸取代以及位置D856、H857或N880中的任何一者处的氨基酸取代而创建的催化失活的核酸酶,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
11.一种非天然存在的组合物,其包含CRISPR核酸酶,其中所述CRISPR核酸酶包含与SEQ ID NO:1的结构域A、结构域B、结构域C、结构域D、结构域E、结构域F、结构域G、结构域H、结构域I或结构域J中的至少一者的氨基酸序列相对应的氨基酸序列,
a)其中结构域A包含与SEQ ID NO:1的氨基酸1-45具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
b)其中结构域B包含与SEQ ID NO:1的氨基酸46-83具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
c)其中结构域C包含与SEQ ID NO:1的氨基酸84-158具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
d)其中结构域D包含与SEQ ID NO:1的氨基酸159-302具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
e)其中结构域E包含与SEQ ID NO:1的氨基酸303-515具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
f)其中结构域F包含与SEQ ID NO:1的氨基酸516-727具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
g)其中结构域G包含与SEQ ID NO:1的氨基酸728-778具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
h)其中结构域H包含与SEQ ID NO:1的氨基酸779-923具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;
i)其中结构域I包含与SEQ ID NO:1的氨基酸924-1068具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;并且
j)其中结构域J包含与SEQ ID NO:1的氨基酸1069-1348具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
12.一种修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的方法,所述方法包括向所述细胞中引入根据权利要求1至11中任一项所述的组合物。
13.根据权利要求12所述的方法,其中所述CRISPR核酸酶包含与SEQ ID NO:1中所示的氨基酸序列具有至少90%同一性的序列,其中CRISPR核酸酶实现与NNRRHY、NNRACT或NNRVCT原型间隔区相邻基序(PAM)序列相邻的DNA链断裂,及/或实现与PAM序列互补的序列相邻的DNA链断裂。
14.根据权利要求12所述的方法,其中所述CRISPR核酸酶是通过位置D12、E776、H988或D991处的氨基酸取代而创建的切口酶,并且实现与所述PAM序列相邻的DNA链断裂。
15.根据权利要求12所述的方法,其中所述CRISPR核酸酶是通过位置D856、H857或N880处的氨基酸取代而创建的切口酶,并且实现与所述PAM序列互补的序列相邻的DNA链断裂,其中位置D856处的氨基酸取代是除天冬氨酸(D)到谷氨酸(E)以外的取代。
16.根据权利要求12至15中任一项所述的方法,其中所述细胞是真核细胞或原核细胞。
17.根据权利要求16所述的方法,其中所述细胞是哺乳动物细胞。
18.根据权利要求17所述的方法,其中所述细胞是人类细胞。
19.一种组合物,其包含非天然存在的RNA分子,所述RNA分子包含crRNA重复序列部分和引导序列部分,其中所述RNA分子在存在tracrRNA序列的情况下与OMNI-103核酸酶形成复合物并将所述核酸酶靶向DNA靶位点,其中所述tracrRNA序列由所述RNA分子的tracrRNA部分或第二RNA分子的tracrRNA部分编码。
20.根据权利要求19所述的组合物,其中所述crRNA重复序列部分的长度为至多17个核苷酸,优选地长度为14个至17个核苷酸。
21.根据权利要求19或权利要求20所述的组合物,其中所述crRNA重复序列部分与SEQID NO:114或115具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
22.根据权利要求19至21中任一项所述的组合物,其中所述crRNA重复序列部分与SEQID NO:114或115中的任一者具有至少95%序列同一性。
23.根据权利要求19至22中任一项所述的组合物,其中crRNA重复序列是除SEQ ID NO:115以外的序列。
24.根据权利要求19至23中任一项所述的组合物,其中包含所述crRNA重复序列部分和所述引导序列部分的所述RNA分子进一步包含所述tracrRNA部分。
25.根据权利要求24所述的组合物,其中所述crRNA重复序列部分通过多核苷酸接头部分共价连接至所述tracrRNA部分。
26.根据权利要求19至23中任一项所述的组合物,其中所述组合物包含第二RNA分子,所述第二RNA分子包含所述tracrRNA部分。
27.根据权利要求19至26中任一项所述的组合物,其中所述OMNI-103核酸酶与SEQ IDNO:1的氨基酸序列具有至少95%序列同一性。
28.根据权利要求19至27中任一项所述的组合物,其中所述引导序列部分的长度为17个至30个核苷酸,优选地长度为22个核苷酸。
29.一种组合物,其包含非天然存在的RNA分子,所述RNA分子包含tracrRNA部分,其中所述RNA分子在存在crRNA重复序列部分和引导序列部分的情况下与OMNI-103核酸酶形成复合物并将所述核酸酶靶向DNA靶位点,其中所述crRNA重复序列部分和所述引导序列部分由所述RNA分子或第二RNA分子编码。
30.根据权利要求29所述的组合物,其中所述tracrRNA部分的长度小于85个核苷酸,优选地长度为84个至80个、79个至75个、74个至70个、69个至65个或64个至60个核苷酸。
31.根据权利要求29或30所述的组合物,其中所述tracrRNA部分与SEQ ID NO:109-113中的任一者的tracrRNA部分具有至少30%-40%、41%-50%、51%-60%、61%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
32.根据权利要求29至31中任一项所述的组合物,其中所述tracrRNA部分与SEQ IDNO:109-113中的任一者的tracrRNA部分具有至少95%序列同一性。
33.根据权利要求29至32中任一项所述的组合物,其中所述tracrRNA部分是除SEQ IDNO:15或16的tracr部分以外的部分。
34.根据权利要求29至33中任一项所述的组合物,其中所述tracrRNA部分包含长度为至多19个核苷酸、优选地长度为16个至19个核苷酸的tracrRNA抗重复序列部分。
35.根据权利要求29至34中任一项所述的组合物,其中所述tracrRNA部分包含与SEQID NO:116或117中的任一者具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性的tracrRNA抗重复序列部分。
36.根据权利要求29至35中任一项所述的组合物,其中所述tracrRNA部分包含与SEQID NO:116或117中的任一者具有至少95%序列同一性的tracrRNA抗重复序列部分。
37.根据权利要求29至36中任一项所述的组合物,其中所述tracrRNA部分包含具有除SEQ ID NO:117以外的序列的tracrRNA抗重复序列部分。
38.根据权利要求29至37中任一项所述的组合物,其中所述RNA分子包含tracrRNA部分,并且进一步包含crRNA重复序列部分和引导序列部分。
39.根据权利要求29至38中任一项所述的组合物,其中所述tracrRNA部分通过多核苷酸接头部分共价连接至crRNA重复序列。
40.根据权利要求39所述的组合物,其中所述多核苷酸接头部分的长度为4个至10个核苷酸。
41.根据权利要求40所述的组合物,其中所述多核苷酸接头具有GAAA序列。
42.根据权利要求29至37中任一项所述的组合物,其中所述组合物进一步包含第二RNA分子,所述第二RNA分子包含crRNA重复序列部分和引导序列部分。
43.根据权利要求29至42中任一项所述的组合物,其中所述OMNI-103核酸酶与SEQ IDNO:1的氨基酸序列具有至少95%序列同一性。
44.根据权利要求29至43中任一项所述的组合物,其中所述引导序列部分的长度为17个至30个核苷酸,优选地长度为22个核苷酸。
45.一种组合物,其包含非天然存在的RNA分子,所述RNA分子包含RNA支架部分,所述RNA支架部分具有以下结构:
crRNA重复序列部分-tracrRNA部分;
其中所述RNA支架部分与OMNI-103CRISPR核酸酶形成复合物并将所述核酸酶靶向与所述RNA分子的引导序列部分具有互补性的DNA靶位点。
46.根据权利要求45所述的组合物,其中所述OMNI-103核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性。
47.根据权利要求45或46所述的组合物,其中所述RNA支架部分的长度为110个至105个、104个至100个、99个至95个、94个至90个、89个至85个、84个至80个、79个至75个或74个至70个核苷酸。
48.根据权利要求45至47中任一项所述的组合物,其中所述RNA支架部分的长度为107个、101个、95个、85个或79个核苷酸。
49.根据权利要求45至48中任一项所述的组合物,其中所述RNA支架部分与SEQ ID NO:109-113中的任一者具有至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少85%、至少90%或至少95%序列同一性。
50.根据权利要求45至49中任一项所述的组合物,其中所述crRNA重复序列部分的长度为至多17个核苷酸,优选地长度为14个至17个核苷酸。
51.根据权利要求45至50中任一项所述的组合物,其中所述crRNA重复序列部分与SEQID NO:114或115具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
52.根据权利要求45至51中任一项所述的组合物,其中所述crRNA重复序列部分与SEQID NO:114或115中的任一者具有至少95%序列同一性。
53.根据权利要求45至52中任一项所述的组合物,其中crRNA重复序列是除SEQ ID NO:115以外的序列。
54.根据权利要求45至53中任一项所述的组合物,其中所述tracrRNA部分的长度小于85个核苷酸,优选地长度为84个至80个、79个至75个、74个至70个、69个至65个或64个至60个核苷酸。
55.根据权利要求45至54中任一项所述的组合物,其中所述tracrRNA部分与SEQ IDNO:109-113中的任一者的tracrRNA部分具有至少30%-40%、41%-50%、51%-60%、61%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性。
56.根据权利要求45至55中任一项所述的组合物,其中所述tracrRNA部分与SEQ IDNO:109-113中的任一者的tracrRNA部分具有至少95%序列同一性。
57.根据权利要求45至56中任一项所述的组合物,其中所述tracrRNA部分是除SEQ IDNO:15或16的tracrRNA部分以外的部分。
58.根据权利要求45至57中任一项所述的组合物,其中所述RNA支架部分进一步包含在所述crRNA重复序列部分与所述tracrRNA部分之间的接头部分,使得所述RNA支架具有以下结构:
crRNA重复序列部分-接头部分-tracrRNA部分。
59.根据权利要求45至58中任一项所述的组合物,其中所述tracrRNA部分包含tracrRNA抗重复序列部分,其中所述crRNA重复序列和所述tracrRNA抗重复序列部分通过所述接头部分共价连接。
60.根据权利要求59所述的组合物,其中所述接头部分是长度为4个至10个核苷酸的多核苷酸接头。
61.根据权利要求60所述的组合物,所述多核苷酸接头具有GAAA序列。
62.根据权利要求45至61中任一项所述的组合物,其中所述tracrRNA部分包含长度为至多19个核苷酸、优选地长度为16个至19个核苷酸的tracrRNA抗重复序列部分。
63.根据权利要求45至62中任一项所述的组合物,其中所述tracrRNA部分包含与SEQID NO:116或117中的任一者具有至少60%-70%、71%-80%、81%-90%、91%-95%或96%-99%序列同一性的tracrRNA抗重复序列部分。
64.根据权利要求45至63中任一项所述的组合物,其中所述tracrRNA部分包含与SEQID NO:116或117中的任一者具有至少95%序列同一性的tracrRNA抗重复序列部分。
65.根据权利要求45至64中任一项所述的组合物,其中tracrRNA抗重复序列是除SEQID NO:117以外的序列。
66.根据权利要求45至65中任一项所述的组合物,其中所述tracrRNA部分包含连接至tracrRNA抗重复部分的核苷酸的第一段,并且所述核苷酸的第一段与SEQ ID NO:118-120中的任一者具有至少95%序列同一性。
67.根据权利要求45至66中任一项所述的组合物,其中所述tracrRNA部分包含连接至核苷酸的第一段的核苷酸的第二段,并且所述核苷酸的第二段与SEQ ID NO:121-124中的任一者具有至少95%序列同一性。
68.根据权利要求45至67中任一项所述的组合物,其中所述RNA支架部分与SEQ ID NO:109-113中的任一者的核苷酸序列具有至少95%同一性。
69.根据权利要求45至68中任一项所述的组合物,其中所述RNA支架部分具有V2、V2.1、V2.2、V2.3、V2.4或V2.5 RNA支架中的任何一者的预测结构。
70.根据权利要求45至69中任一项所述的组合物,其中所述RNA支架部分具有除SEQ IDNO:15或16以外的序列。
71.根据权利要求45至70中任一项所述的组合物,其中引导序列部分共价连接至所述RNA分子的所述crRNA重复序列部分,形成具有以下结构的单引导RNA分子:
引导序列部分-crRNA重复序列部分-tracrRNA部分。
72.根据权利要求45至71中任一项所述的组合物,其中所述引导序列部分的长度为17个至30个核苷酸、更优选地20个至23个核苷酸、更优选地22个核苷酸。
73.根据权利要求45至72中任一项所述的组合物,其进一步包含OMNI-103CRISPR核酸酶,其中所述OMNI-103CRISPR核酸酶与SEQ ID NO:1的氨基酸序列具有至少95%同一性。
74.根据权利要求1至73中任一项所述的组合物,其中所述RNA分子通过体外转录(IVT)或固相人工寡核苷酸合成形成。
75.根据权利要求74所述的组合物,其中所述RNA分子包含经修饰的核苷酸。
76.一种多核苷酸分子,其编码根据权利要求1至75中任一项所述的RNA分子。
77.一种修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的方法,所述方法包括向所述系统或细胞中引入根据权利要求1至75中任一项所述的组合物。
78.根据权利要求77所述的方法,其中所述细胞是真核细胞或原核细胞。
79.根据权利要求78所述的方法,其中所述真核细胞是人类细胞或植物细胞。
80.一种用于修饰无细胞系统或细胞的基因组中DNA靶位点处的核苷酸序列的试剂盒,所述试剂盒包括向所述系统或细胞中引入根据权利要求2至75中任一项所述的组合物、与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性的CRISPR核酸酶,以及用于将所述RNA分子和所述CRISPR核酸酶递送至所述细胞的说明。
81.一种组合物、方法、产品、过程、系统、试剂盒或用途,其特征在于本申请中公开的一个或多个要素。
CN202280013312.9A 2021-02-08 2022-02-07 Omni-103 crispr核酸酶 Pending CN116887854A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/147,166 2021-02-08
US63/214,506 2021-06-24
US202163286855P 2021-12-07 2021-12-07
US63/286,855 2021-12-07
PCT/US2022/015504 WO2022170199A2 (en) 2021-02-08 2022-02-07 Omni-103 crispr nuclease

Publications (1)

Publication Number Publication Date
CN116887854A true CN116887854A (zh) 2023-10-13

Family

ID=86731282

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202280013312.9A Pending CN116887854A (zh) 2021-02-08 2022-02-07 Omni-103 crispr核酸酶
CN202280090982.0A Pending CN118660967A (zh) 2021-12-07 2022-12-06 Omni-103 crispr核酸酶-rna复合物

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202280090982.0A Pending CN118660967A (zh) 2021-12-07 2022-12-06 Omni-103 crispr核酸酶-rna复合物

Country Status (5)

Country Link
CN (2) CN116887854A (zh)
AU (1) AU2022405520A1 (zh)
CA (1) CA3240329A1 (zh)
IL (1) IL313397A (zh)
WO (1) WO2023107946A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12091688B2 (en) 2021-02-08 2024-09-17 Emendobio Inc. OMNI-103 CRISPR nuclease

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020069029A1 (en) * 2018-09-26 2020-04-02 Emendobio Inc. Novel crispr nucleases
WO2021243058A1 (en) * 2020-05-27 2021-12-02 Emendobio Inc. Biallelic knockout of sarm1

Also Published As

Publication number Publication date
AU2022405520A1 (en) 2024-07-04
CA3240329A1 (en) 2023-06-15
IL313397A (en) 2024-08-01
WO2023107946A3 (en) 2023-08-03
WO2023107946A2 (en) 2023-06-15
CN118660967A (zh) 2024-09-17

Similar Documents

Publication Publication Date Title
KR102021982B1 (ko) Mnd 프로모터 키메라 항원 수용체
KR20210056329A (ko) 신규 cas12b 효소 및 시스템
AU2021285983A1 (en) Novel OMNI-59, 61, 67, 76, 79, 80, 81, and 82 CRISPR nucleases
KR20240021218A (ko) 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템
KR20230010231A (ko) 생체내 형질도입을 위한 벡터 및 방법
WO2008144052A2 (en) Bioluminescent imaging of stem cells
CN113355323B (zh) 人源化ace2基因改造小鼠模型的制备方法及应用
CN116887854A (zh) Omni-103 crispr核酸酶
KR20230142740A (ko) Omni-103 crispr 뉴클레아제
WO2023091987A2 (en) Omni 263, 264, 266, 268, 269, 271, 274, 275, 276, 278, 279, 280, 281, 283, 284, 286,287, 288, 290, 291, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 307,308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325,326, 327, 329, 330, 331, 332, 333, 334, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345,346, 347, 348, 349, 350, 351, 352, 353, 354, 356, 357, 358, 359, 360, 361, 362, 363, 364,365, 366, 367, 368, 369, 370, 371, 372, 373, 375, 376, 377, 378, 380, 381, 382, 383, 384, 385, and 386 crispr nucleases
CN113355325B (zh) 人源化ace2基因改造小鼠胚胎干细胞模型制备方法及应用
AU2022215636A1 (en) Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, and 131-138 crispr nucleases
KR102624831B1 (ko) 근육 특이적 pck1 과발현 형질전환 개 생산
CN111727244B (zh) 循环肿瘤细胞的通用检测探针
EP4232573A1 (en) Novel omni 56, 58, 65, 68, 71, 75, 78, and 84 crispr nucleases
CN112980800A (zh) Car-t细胞、其构建方法及其应用
CN107384921B (zh) miR216a用于抑制骨肉瘤细胞的增殖、侵袭和迁移
KR102468650B1 (ko) T7 RNA 중합효소 및 mRNA 캡핑 효소를 유도 발현하는 재조합 벡터 및 이의 용도
CN117480253A (zh) 编码klk2-gpi融合蛋白的核酸、重组细胞及其用途
CN115216492B (zh) 一种小鼠原发神经胶质瘤模型的制备方法及其应用
CN115044617B (zh) Car t细胞的制备方法、car t细胞及其应用
CN115161345A (zh) 高表达FRα的重组载体、重组细胞及其构建方法和用途
CN113736741A (zh) 一种用于测定特立帕肽生物学活性的克隆化细胞株
JP2001299336A (ja) ワクチン及び診断用抗原としての安定で毒性のないフラビウイルス様粒子の作製
WO2024145426A2 (en) Omni-335 crispr nuclease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40102227

Country of ref document: HK