CN114901303A - 修饰的核酸内切酶和相关方法 - Google Patents

修饰的核酸内切酶和相关方法 Download PDF

Info

Publication number
CN114901303A
CN114901303A CN202080085104.0A CN202080085104A CN114901303A CN 114901303 A CN114901303 A CN 114901303A CN 202080085104 A CN202080085104 A CN 202080085104A CN 114901303 A CN114901303 A CN 114901303A
Authority
CN
China
Prior art keywords
endonuclease
amino acids
mixed charge
cas9
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080085104.0A
Other languages
English (en)
Inventor
袁哲凡
江绍毅
Y·韩
S·罗中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Washington
Original Assignee
University of Washington
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Washington filed Critical University of Washington
Publication of CN114901303A publication Critical patent/CN114901303A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

提供了用于产生具有降低的脱靶活性的修饰的核酸内切酶,如CRISPR/Cas9系统的组合物和方法。还公开了体外和体内使用所述修饰的核酸内切酶编辑多核苷酸的方法。一方面,公开内容提供了修饰的核酸内切酶,包括核酸内切酶和与所述核酸内切酶共价连接的一个或多个混合电荷部分,其中每个混合电荷部分包括约10至约400个带正电荷的部分和约10至约400个带负电荷的部分,并且其中带正电荷的部分的数目与带负电荷的部分的数目的比率为约1:0.5至约1:2。

Description

修饰的核酸内切酶和相关方法
相关申请的交叉引用
本申请要求2019年10月11日提交的美国临时申请第62/913,916号的权益,其公开内容通过引用以其整体并入本文。
关于序列表的声明
与该申请相关的序列表以文本格式提供,替代纸印本,并且特此通过引用并入说明书中。包括序列表的文本文件的名称为72968_SEQ_final-2020-10-7.txt。文本文件大小为27.2KB,于2020年10月7日创建,并随同说明书的提交通过EFS-web提交。
政府许可权利的声明
该发明是在美国国立卫生研究院(the National Institutes of Health)授予的批准号为R21 GM128004号的政府支持下完成的。政府对发明拥有某些权利。
背景
CRISPR/Cas系统是在各种生物体和细胞类型中广泛使用的用于基因组编辑的工具。不幸的是,它也可能在类似于在靶序列的脱靶位点引起不需要的突变。脱靶突变是由CRISPR/Cas9 RNP对DNA序列的非特异性识别引起的。已经证明,除了最佳PAM序列5’-NGG-3’之外,Cas9还可以采用5’-NAG-3’或5’-NGA-3’PAM切割位点,尽管效率较低。此外,20nt单向导RNA(sgRNA)可识别具有多至3-5个与sgRNA的碱基对错配的DNA序列,表明在人类基因组中给定核酸酶存在多达数千个可能的结合位点。此外,与RNA引导链相比,CRISPR/Cas9可以诱导对包含几个额外碱基(‘DNA凸起’)或几个缺失碱基(‘RNA凸起’)的DNA序列的脱靶切割。脱靶DNA切割可在非预期的基因组基因座产生突变和产生总染色体重排,如缺失、倒位和易位。这些在不需要的位点的突变可能使抑癌基因失效或激活致癌基因。已知易位是慢性髓性白血病的可能原因。
防止、避免或至少减少这些脱靶效应对于任何下游基因组编辑应用的成功都是至关重要的。已经开发了各种策略来减少通常使用的Cas9核酸酶的基因组范围的脱靶突变,包括带有缩短的靶互补区的截短的sgRNA、Cas9突变体、配对的Cas9切口酶,以及无催化活性的Cas9与非特异性FokI核酸酶的二聚融合体。然而,这些方法仅部分有效和/或有产生更多脱靶位点的可能性。此外,它们还可能需要表达多个sgRNA和/或将额外的功能结构域融合到Cas9,这会缩小靶向范围,并对使用具有有限的核酸有效载荷大小的病毒载体进行递送造成挑战。
因此,仍然需要可以减少CRISPR/Cas9系统的脱靶效应的简单稳健的策略和具有减少的脱靶效应的CRISPR/Cas9系统。
概述
提供该概述从而以简化形式介绍将在以下详细描述中进一步描述的一些概念。该概述不旨在确认所要求保护的主题的关键特征,也不旨在被用于帮助确定所要求保护的主题的范围。
一方面,公开内容提供了一种修饰的核酸内切酶,其包括核酸内切酶和与核酸内切酶共价连接的一个或多个混合电荷部分,其中每个混合电荷部分包括约10至约400个带正电荷的部分和约10至约400个带负电荷的部分,并且其中带正电荷的部分的数目与带负电荷的部分的数目的比率为约1:0.5至约1:2。在一些实施方案中,混合电荷部分在约7.4的pH下基本上是电中性的。
在一些实施方案中,核酸内切酶是核酸引导的核酸酶系统蛋白。在一些实施方案中,核酸内切酶是CRISPR相关(Cas)蛋白,如Cas9、Cas12、Cas13、Cas14,或其突变体或变体。在一些实施方案中,核酸内切酶是Cas9或其突变体或变体。
在一些实施方案中,核酸内切酶在CRISPR/Cas系统中具有活性,其中CRISPR/Cas系统相对于野生型CRISPR/Cas系统表现出降低的脱靶编辑活性和维持的在靶编辑活性。在一些实施方案中,与未修饰的核酸内切酶相比,脱靶编辑活性降低至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%或至少80%。
在一些实施方案中,混合电荷部分与核酸内切酶的氨基酸的侧链、核酸内切酶的N端氨基和/或核酸内切酶的C端羧基共价连接。
在一些实施方案中,混合电荷部分是分子量为约2kDa至约130kDa的肽。
在一些实施方案中,修饰的核酸内切酶是融合蛋白,其中混合电荷部分是由以下组成的混合电荷结构域:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;以及
c)任选的多个独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸;以及
其中带正电荷的氨基酸的数目与带负电荷的氨基酸的数目的比率为约1:0.5至约1:2。
在一些实施方案中,混合电荷结构域包括随机序列。在一些实施方案中,混合电荷结构域包括序列(X1-X2-X3)n,其中X1是带正电荷的氨基酸,X2是带负电荷的氨基酸,并且X3不存在或是独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,其中n是约5至约50的整数。
在一些实施方案中,多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。在一些实施方案中,多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。在一些实施方案中,混合电荷结构域不包括多个另外的氨基酸。在一些实施方案中,多个带正电荷的氨基酸是赖氨酸,多个带负电荷的氨基酸是谷氨酸。
在一些实施方案中,混合电荷结构域包括多个赖氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。在一些实施方案中,混合电荷结构域包括多个组氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。在一些实施方案中,多个另外的氨基酸选自脯氨酸、丝氨酸和甘氨酸。在一些实施方案中,多个另外的氨基酸是多个脯氨酸。在一些实施方案中,混合电荷结构域包括多个赖氨酸,多个谷氨酸和多个脯氨酸。
在一些实施方案中,混合电荷部分是分子量为约2kDa至约80kDa的合成聚合物。在一些实施方案中,聚合物选自聚(羧基甜菜碱)(PCB)、聚(磺基甜菜碱)(PSB)、聚(2-甲基丙烯酰氧乙基磷酸胆碱)(PMPC)和聚(氧化三甲胺)(TMAO)聚合物。在一些实施方案中,聚合物是聚(羧基甜菜碱)(PCB)。
另一方面,公开内容提供了包括编码本文公开的修饰的核酸内切酶的序列的核酸。
另一方面,公开内容提供了包括所公开的核酸和与其可操作地连接的启动子的表达载体。
另一方面,公开内容提供了包括所公开的核酸或表达载体的细胞。在一些实施方案中,细胞是原核细胞或真核细胞。在一些实施方案中,细胞是哺乳动物细胞。在一些实施方案中,细胞在细胞培养物中。在一些实施方案中,细胞在生物体中。
另一方面,公开内容提供了用于编辑细胞中或受试者中的多核苷酸的方法,所述方法包括向细胞或受试者中引入所公开的至少一种修饰的核酸内切酶、核酸或表达载体。
在一些实施方案中,多核苷酸是DNA或RNA。在一些实施方案中,核酸是编码修饰的核酸内切酶的mRNA。
附图说明
因为当结合附图时,通过参考以下详细描述,该发明的前述方面和许多伴随的优点变得更好理解,因此其将变得更容易认识,其中:
图1A是GFP破坏测定和GFP基因中使用的靶位点的示意图。
图1B显示由天然Cas9和示例性修饰的Cas9(pCB-Cas9缀合物)介导的HEK293-GFP细胞中GFP破坏的效率。
图1C说明了天然Cas9和pCB-Cas9缀合物的脱靶编辑效率,其中在GFP破坏测定中,错配的sgRNA具有一个、两个或三个核苷酸突变。
图2是pCB缀合在降低CRISPR/Cas9系统的脱靶效率中的机制的示意图。Cas9/sgRNA复合物拥有比其靶DNA位点的最佳识别所需的能量更多的能量,导致错配的脱靶位点的切割。pCB聚合物缀合消除Cas9/sgRNA复合物和双链DNA之间的非特异性结合,从而降低结合能。剩余的能量对于在靶结合足够强,但对于错配结合不够强。
图3A-3C显示当靶向VEGF(3A)、EMX(3B)和CLTA(3C)基因座时,Cas9:sgRNA的在靶和脱靶序列。
图3D-3F说明了当在三种不同细胞系HEK293(3D)、U2OS(3E)和K562(3F)中靶向VEGF(顶部)、EMX(中部)和CLTA(底部)时,由天然Cas9和pCB-Cas9得到的在靶和脱靶DNA编辑效率。
图4显示用于制备示例性pCB-Cas9缀合物的合成路线。
图5是天然Ca和示例性pCB10-Cas9、pCB20-Cas9、pCB50-Cas9缀合物的尺寸排阻色谱。
图6A和6B说明天然Cas9(6A)和pCB-Cas9(6B)的示例性最佳sgRNA与蛋白比率。所有实验在96孔板中使用110μl的体积进行。
图7A和7B显示CRISPRMAX剂量对Cas9/sgRNA(7A)和pCB-Cas9/sgRNA(7B)的递送效率和细胞毒性的影响。
图8A-8C显示编码示例性修饰的Cas9(Cas9-(EK)n)的表达质粒的构建。
图9是体外转录的Cas9和Cas9-EK mRNA在聚腺苷酸化之前和之后的凝胶电泳。
图10是使用商品化Cas9 mRNA和实验室制备的Cas9 mRNA的Cas9的基因编辑功效的图。
图11A-11C是HEK293-GFP细胞中由天然Cas9、Cas9-(EK)10、(EK)10-Cas9-(EK)10和Cas9-(EK)30得到的对靶位点GFP(11A)、VEGF(11B)和EMX(11C)的在靶DNA编辑的凝胶电泳。
图11D是定量化的图11A-C中所显示的数据的图。
详细描述
成簇的、规律间隔的、短回文重复序列(CRISPR)相关蛋白(Cas)系统是广泛用于许多不同应用的强大基因组编辑工具。然而,由RNA引导的Cas蛋白在除预期的在靶位点以外的位点诱导的高频突变是妨碍治疗和临床应用的主要问题。不期望受理论束缚,因为大多数脱靶事件是由单向导RNA(sgRNA)和靶DNA之间的非特异性错配导致的,发明人假设使非特异性RNA-DNA相互作用最小化可以是该问题的有效解决方案。
发明人证明,通过用混合的带电部分修饰核酸内切酶,如Cas9,可以使该错配问题最小化(例如,通过将Cas9与两性离子聚合物缀合或将混合的带电肽结构域添加到核酸内切酶的N和/或C端)。所公开的CRISPR/Cas核糖核蛋白(RNP)显示出减少的脱靶DNA编辑,但类似水平的在靶基因编辑活性。该方法提供了提高基因组编辑发展效率的简单有效的途径,具有加速CRISPR/Cas技术的广泛生物技术和治疗应用的潜力。
因此,一方面,公开内容提供了一种修饰的核酸内切酶,其包括核酸内切酶和与核酸内切酶共价连接的一个或多个混合电荷部分,其中每个混合电荷部分包括约10至约400个带正电荷的部分或基团,和约10至约400个带负电荷的部分或基团,并且其中带正电荷的部分或基团的数目与带负电荷的部分或基团的数目的比率为约1:0.5至约1:2。
在一些实施方案中,一个或多个混合电荷部分包括约20至约300、约30至约200、约30至约150、或约30至约100个带正电荷的部分或基团。在一些实施方案中,一个或多个混合电荷部分包括约20至约300、约30至约200、约30至约150、或约30至约100个带负电荷的部分或基团。
如本文所用的,术语“混合电荷部分”是指具有基本上相等数目的带正电基团和带负电基团以提供在生理学相关pH下基本上电中性的部分的部分。在一些实施方案中,混合电荷部分在约7.4的pH下基本上是电中性的。混合电荷部分包括两性离子部分。
如本文所用的,术语“基本上电中性”是指具有基本上为零的净电荷的部分。在一些实施方案中,带正电荷的部分或基团的数目与带负电荷的部分或基团的数目的比率为约1:1.1至约1:0.5。在一些实施方案中,带正电荷的部分或基团的数目与带负电荷的部分或基团的数目的比率为约1:1.1至约1:0.7。在一些实施方案中,带正电荷的部分或基团的数目与带负电荷的部分或基团的数目的比率为约1:1.1至约1:0.9。
所公开的修饰的核酸内切酶在CRISPR/Cas系统,如适合于多核苷酸编辑,如基因组工程化的2类成簇的规律间隔的短回文重复序列(CRISPR)系统中是有活性的。这样的工程化的CRISPR系统通常包含两种组分:向导RNA(gRNA或sgRNA)和CRISPR相关核酸内切酶(Cas蛋白)。gRNA是短合成RNA,其由Cas结合所必需的骨架序列和限定待修饰的多核苷酸(例如基因组)靶点的用户定义的核苷酸间隔区组成。因此,可以通过简单地改变gRNA中存在的靶序列来改变Cas蛋白的靶点。
所公开的修饰的核酸内切酶与未修饰的(例如,野生型)核酸内切酶相比具有某些有利的特性。具体地,当在CRISPR/Cas系统中使用时,与未修饰的核酸内切酶相比,本文公开的修饰的核酸内切酶可以基本上保持它们的在靶活性,同时具有降低的脱靶活性。在一些实施方案中,修饰的核酸内切酶包括核酸内切酶,如核酸指导的核酸酶系统蛋白,例如RNA引导的核酸酶。合适的核酸内切酶包括Cas9、Cas12、Cas13、Cas14及它们的突变体和其变体。如本文所用的,“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白或多肽衍生物,其基本上保留野生型Cas蛋白的核酸酶活性、RNA结合活性或DNA靶向活性中的一种或多种。在一些实施方案中,蛋白或多肽可包括SEQ ID NO:1编码的蛋白的片段,由SEQ ID NO:1编码的蛋白的片段组成,或基本上由SEQ ID NO:1编码的蛋白的片段组成。在一些实施方案中,突变体或变体与SEQ ID NO:1编码的蛋白至少50%(例如,在50%和100%之间的任何数字,包括端值,包括但不限于至少55%、至少60%、至少65%、至少70%、至少75、至少80%、至少85%、至少90%、至少95%、至少98%和至少99%)相同。在一些实施方案中,核酸内切酶是Cas9或其突变体或变体。
当在CRISPR/Cas系统中使用时,相对于野生型CRISPR/Cas系统(即,包括对应的未修饰的核酸内切酶的CRISPR/Cas系统),所公开的修饰的核酸内切酶显示出降低的脱靶编辑活性并且维持的在靶编辑活性。在一些实施方案中,脱靶编辑包括在不期望的基因组位置和/或不期望的基因靶点编辑。在一些实施方案中,脱靶编辑包括在不期望的基因组位置和/或不期望的基因靶点的非预期的基因组修饰。在一些实施方案中,脱靶编辑包括非特异性和/或非预期的遗传修饰。在一些实施方案中,脱靶编辑包括非预期的/不期望的遗传修饰,例如点突变、缺失、插入、倒位和/或易位。在一些实施方案中,脱靶编辑包括插入和/或缺失(插入缺失(indel))。在一些实施方案中,与未修饰的核酸内切酶相比,脱靶编辑活性降低至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%或至少80%。在一些实施方案中,当靶点包括一个、两个、三个或更多个错配时,与未修饰的核酸内切酶相比,脱靶编辑活性降低至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%或至少80%。
在本文公开的修饰的核酸内切酶中,一个或多个混合电荷部分可以以任何合适的方式与未修饰的核酸内切酶连接。在一些实施方案中,修饰的核酸内切酶包括连接至核酸内切酶的一个或多个氨基酸的侧链,例如连接至赖氨酸的氨基的混合电荷部分。共价连接部分,如混合电荷部分的方法是本领域已知的。例如,在图4中显示一种这样的示例性方法。在一些实施方案中,修饰的核酸内切酶可以包括短接头,如包括2-10个碳原子的任选取代的亚烷基或任选取代的杂亚烷基,其连接核酸内切酶和混合电荷部分。
在一些实施方案中,混合电荷部分可以连接到核酸内切酶的N端或C端。在一些实施方案中,核酸内切酶可以包括连接到核酸内切酶的N端和C端的两个混合电荷部分。
适合修饰本文公开的核酸内切酶的混合电荷部分的实例包括合成聚合物和肽。在一些实施方案中,混合电荷部分是合成共聚物,例如无规共聚物,其包括具有带正电基团的重复单元和具有带负电基团的重复单元。在一些实施方案中,混合电荷部分是包括两性离子重复单元的两性离子合成聚合物,即,其中正基团和负基团都存在于同一重复单元中。在一些实施方案中,混合电荷部分是包括基本上相等数目的带正电荷的氨基酸和带负电荷的氨基酸的肽。
在一些实施方案中,混合电荷部分是沿着聚合物主链不具有带正电荷或带负电荷的广大区域的无规共聚物(即,带正电荷和带负电荷的结构单元沿着聚合物骨架相对均匀地分布)。
在一些实施方案中,混合电荷部分是两性离子聚合物。合适的两性离子聚合物的非限制性实例包括聚(羧基甜菜碱)(PCB)、聚(磺基甜菜碱)(PSB)、聚(2-甲基丙烯酰氧乙基磷酸胆碱)(PMPC)和聚(氧化三甲胺)(TMAO)。在一些实施方案中,混合电荷部分是聚(羧基甜菜碱)(PCB)。
在一些实施方案中,混合电荷部分是分子量为约2kDa至约80kDa的合成聚合物。在一些实施方案中,混合电荷部分是分子量为约5kDa至约50kDa的合成聚合物。在一些实施方案中,混合电荷部分是分子量为约5kDa至约40kDa的合成聚合物。在一些实施方案中,混合电荷部分是分子量为约5kDa至约30kDa的合成聚合物。
在一些实施方案中,混合电荷部分是肽。在一些实施方案中,混合电荷部分是分子量为约2kDa至约130kDa的肽。在一些实施方案中,混合电荷部分是分子量为约2kDa至约80kDa的肽。在一些实施方案中,混合电荷部分是分子量为约5kDa至约70kDa的肽。在一些实施方案中,混合电荷部分是分子量为约10kDa至约60kDa的肽。在一些实施方案中,混合电荷部分是分子量为约10kDa至约50kDa的肽。
所公开的修饰的核酸内切酶包括融合蛋白。如本文所用的,“融合蛋白”是由至少两个结构域组成的蛋白,所述结构域由不同的基因编码,所述基因已被连接使得它们被作为单一单元转录和翻译,产生单一多肽。
在一些实施方案中,修饰的核酸内切酶是融合蛋白,其中混合电荷部分是由以下组成的混合电荷结构域:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;以及
c)任选的多个独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸;以及
其中带负电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2。
在一些实施方案中,混合电荷结构域不包括多个另外的氨基酸。在一些实施方案中,混合电荷结构域基本上由多个带负电荷的氨基酸和多个带正电荷的氨基酸组成。
在一些实施方案中,混合电荷结构域包括随机序列。在一些实施方案中,混合电荷结构域包括序列的重复,所述序列包括一个或多个带正电荷的氨基酸,一个或多个带负电荷的氨基酸和一个或多个另外的氨基酸。
在一些实施方案中,混合电荷结构域包括序列(X1-X2-X3)n,其中X1是带正电荷的氨基酸,X2是带负电荷的氨基酸,并且X3是独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,其中n是约5至约50的整数。在一些实施方案中,混合电荷结构域包括序列(E-K-X)n,其中E是赖氨酸,K是谷氨酸,并且X可以不存在或是独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,其中n是约5至约50的整数。在一些实施方案中,混合电荷结构域包括序列(E-K-P)n,其中E为赖氨酸,K为谷氨酸,P为脯氨酸,且n为约5至约50的整数。在一些实施方案中,混合电荷域包括序列(E-K)n,其中E为赖氨酸,K为谷氨酸,且n为约5至约50的整数。
混合电荷结构域通常包括约6个或更多个氨基酸。在一些实施方案中,混合电荷域包括约6至约1000个氨基酸、约20至约1000个氨基酸、约30至约1000个氨基酸、约50至约1000个氨基酸、约80至约1000个氨基酸、约80至约600个氨基酸、或约50至约500个氨基酸。
本文公开的融合蛋白的混合电荷结构域包括数量基本上相等的带负电荷的氨基酸和带正电荷的氨基酸。在一些实施方案中,带负电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2、约1:07至约1:1.4、约1:0.8至约1:1.25、或约1:0.9至约1:1.1。因此,混合电荷结构域基本上是电中性的。在一些实施方案中,混合电荷结构域在约7.4的pH下基本上是电中性的。
在一些实施方案中,混合电荷结构域包括多个赖氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。在一些实施方案中,混合电荷结构域包括多个组氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。
在一些实施方案中,混合电荷结构域中的多个另外的氨基酸选自丝氨酸、天冬酰胺、甘氨酸和脯氨酸。在一些实施方案中,多个另外的氨基酸选自丝氨酸、甘氨酸和脯氨酸。在一些实施方案中,多个另外的氨基酸选自丝氨酸和甘氨酸。修饰的核酸内切酶的混合电荷结构域可仅包括一种类型的另外的氨基酸(例如脯氨酸),两种不同的另外的氨基酸(例如脯氨酸和甘氨酸),三种不同的另外的氨基酸(例如丝氨酸、甘氨酸和脯氨酸)。在一些实施方案中,混合电荷结构域包括一个另外的氨基酸。在一些实施方案中,混合电荷域包括两个另外的氨基酸。
在一些实施方案中,多个另外的氨基酸是多个脯氨酸。在一些实施方案中,多个另外的氨基酸是多个甘氨酸。在一些实施方案中,多个另外的氨基酸是多个丝氨酸。
在一些实施方案中,混合电荷结构域包括多个赖氨酸,多个谷氨酸和多个选自丝氨酸、甘氨酸和脯氨酸的另外的氨基酸。
在一些实施方案中,混合电荷结构域包括多个赖氨酸,多个谷氨酸和多个选自甘氨酸和脯氨酸的另外的氨基酸。在一些实施方案中,多个带正电荷的氨基酸是赖氨酸(K),多个带负电荷的氨基酸是谷氨酸(E)。
在一些实施方案中,混合电荷结构域基本上由多个带负电荷的氨基酸;多个带正电荷的氨基酸;和多个独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,和任选的如可用于融合蛋白的亲和纯化的组氨酸标签的亲和标签组成。在一些实施方案中,带电荷的结构域基本上由多个谷氨酸组成;多个赖氨酸;和多个独立地选自脯氨酸和甘氨酸的另外的氨基酸,和任选的如可用于融合蛋白的亲和纯化的组氨酸标签的亲和标签组成。
在一些实施方案中,所公开的融合蛋白可包括任选的结构域,诸如亲和标签(例如组氨酸标签),其可用于融合蛋白的亲和纯化。
带电荷的结构域中的氨基酸可以以任何方式或顺序,例如以如上所述方式排列。在一些实施方案中,带电荷的结构域是无规卷曲多肽。
本文公开的融合蛋白可以任何合适的方式,例如使用分子克隆技术制备。
因此,一方面,当修饰的核酸内切酶是融合蛋白时,公开内容提供包括所公开的修饰的核酸内切酶的序列的核酸。在一个实施方案中,公开内容提供了编码融合蛋白,即修饰的核酸内切酶的分离的核酸。分离的核酸序列可以包括RNA或DNA。如本文所用的,“分离的核酸”是已经从基因组中或cDNA序列中其正常周围核酸序列移开的核酸。这样的分离的核酸序列可以进一步包括用于促进所编码的多肽的表达和/或纯化的另外的序列,如前所述。在一些实施方案中,核酸可以包括由SEQ ID NOS:2-4编码的蛋白的片段,由其组成,或基本上由其组成。在一些实施方案中,核酸是编码修饰的核酸内切酶的mRNA。在一些实施方案中,核酸是序列SEQ ID NOS:2-4的DNA。
编码融合蛋白,即,所公开的修饰的核酸内切酶的核酸可并入合适的表达载体中。因此,公开内容提供了包括编码所公开的修饰的核酸内切酶的核酸和与其可操作地连接的启动子的表达载体。表达载体或表达构建体是核酸,例如DNA分子,其将特定基因携带到宿主细胞中并使用细胞的蛋白合成机制来产生由基因编码的蛋白。表达载体还含有基因表达所必需的元件,例如与基因可操作连接的启动子区域,其实现基因的有效转录。通过使用诱导物,可以控制蛋白的表达,并且仅在必要时以显著量产生蛋白。大肠杆菌通常被用作蛋白生产的宿主,但也可使用其它细胞类型,如酵母、昆虫细胞和哺乳动物细胞。
另一方面,本文提供了包括编码所公开的修饰的核酸内切酶的核酸或载体的细胞。细胞是原核细胞或真核细胞。在一些实施方案中,细胞是哺乳动物细胞。在一些实施方案中,细胞在细胞培养物中。在一些实施方案中,细胞在生物体中。
在一些实施方案中,所公开的融合蛋白(即,修饰的核酸内切酶)可在体外或体内表达。
在一些实施方案中,本文公开的融合蛋白可以使用任何合适的表达系统,例如大肠杆菌表达系统、枯草芽孢杆菌表达系统或任何其他原核表达系统合成。
在一些实施方案中,本文公开的融合蛋白可以使用毕赤酵母表达系统来合成。在一些实施方案中,本文公开的融合蛋白可以使用人胚胎肾293表达系统来合成。在一些实施方案中,本文公开的融合蛋白可以使用中国仓鼠卵巢表达系统来合成。在一些实施方案中,本文公开的融合蛋白可以使用无原核或真核细胞的表达系统来合成。
本文公开的融合蛋白的回收和纯化可以通过任何合适的方法或这样的方法的组合来实现。在一些实施方案中,可以使用蛋白沉淀技术。在一些实施方案中,纯化可以包括尺寸排阻色谱法。在一些实施方案中,纯化可以包括离子交换色谱法。在一些实施方案中,纯化可以包括使用脱盐柱。在一些实施方案中,纯化可以包括亲和色谱法。
另一方面,本文提供了一种用于编辑细胞中或受试者中的多核苷酸的方法,所述方法包括向细胞或受试者中引入至少一种所公开的修饰的核酸内切酶、所公开的核酸或本文公开的表达载体。适合通过本文公开的修饰的核酸内切酶编辑的多核苷酸包括DNA和RNA。在一些实施方案中,多核苷酸是基因组DNA,例如人基因组DNA。在一些实施方案中,多核苷酸是线粒体DNA。可以使用本领域已知的任何合适的方法将修饰的核酸内切酶和编码它们的核酸以及载体引入细胞或受试者中。
所公开的修饰的核酸内切酶具有广泛的用途,包括基因工程、体内和离体的治疗性基因编辑和诊断应用。
除非本文具体定义,否则本文使用的所有术语具有与其对于本发明的领域中的技术人员而言相同的含义。对本领域的定义和术语,从业者特别关注Sambrook J.等人(编),《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),第三版,ColdSpring Harbor Press,Plainsview,New York(2001);Ausubel,F.M.,等人(编),《现代分子生物学实验指南》(Current Protocols in Molecular Biology),John Wiley&Sons,NewYork(2010);和Coligan,J.E.等人,(编),《现代免疫学实验指南》(Current Protocols inImmunology),John Wiley&Sons,New York(2010)。此外,分子生物学中常见术语的定义可见于Jones和Bartlet出版的Benjamin Lewin,Genes IX,2008(ISBN 0763752223);Blackwell Science Ltd.出版的Kendrew等人(编),《分子生物学百科全书》(TheEncyclopedia of Molecular Biology),1994(ISBN 0632021829);和VCH Publishers,Inc.出版的Robert A.Meyers(编),《分子生物学和生物技术:综合案头参考》(MolecularBiology and Biotechnology:a Comprehensive Desk Reference),1995(ISBN9780471185710)。在冲突的情况下,以说明书中的术语为准。
权利要求中使用的术语“或”用于表示“和/或”,除非明确指出仅指可供选择的事物或者可供选择的事物是互相排斥的,尽管公开内容支持仅指可供选择的事物和“和/或”的定义。除非特别指出,否则词语“一(a)”和“一(an)”在权利要求或说明书中与词语“包括”结合使用时表示一或多。
除非上下文清楚地另有要求,否则在整个说明书和权利要求书中,词语“包括(comprise)”、“包括(comprising)”等应被解释为包括性意义,而不是排他性或穷举性意义;也就是说,应被解释为“包括但不限于”的意义。使用单数或复数的词语也分别包括复数和单数。出于描述的目的,“A/B”形式或“A和/或B”形式的短语是指(A)、(B)或(A和B)。出于描述的目的,“A,B和C中的至少一个”形式的短语是指(A)、(B)、(C)、(A和B)、(A和C)、(B和C)或(A、B和C)。出于描述的目的,“(A)B”形式的短语是指(B)或(AB),即A是任选的要素。另外,当在本申请中使用时,词语“本文”、“上文”和“下文”以及具有类似含义的词语应当指作为整体的本申请,而不是指本申请的任何特定部分。词语“约”表示在高于或低于所述参考数字的微小变化范围内的数字。例如,在一些实施方案中,“约”可指高于或低于所示的参考数字10%、9%、8%、7%、6%、5%、4%、3%、2%或1%范围内的数字。
公开了可用于所公开的方法和组合物、可与所公开的方法和组合物结合使用、可用于制备所公开的方法和组合物或是所公开的方法和组合物的产品的材料、组合物和组分。应当理解,当公开这些材料的组合、子集、相互作用、组等时,具体考虑各个单一和集合组合中的每一种,即使可能没有明确公开对这些组分的每一单个组合和排列等的具体提及。该概念适用于该公开内容的所有方面,包括但不限于所述方法中的步骤。因此,任何前述实施方案的具体要素可以组合或替代其它实施方案中的要素。例如,如果存在可以进行的各种附加步骤,则应当理解,这些附加步骤中的每一个都可以与所公开的方法的任何特定方法步骤或方法步骤的组合一起来进行,并且每个这样的组合或组合的子集都被具体考虑并且应当被认为是公开的。另外,应当理解,本文描述的实施例可以使用任何合适的材料,例如本文别处描述的或本领域已知的那些来实现。
本文所引用的所有出版物和它们所引用的主题在此特意通过引用以其整体并入。
提供以下实施例以说明公开内容的某些具体特征和/或实施方案。实施例不应解释为将公开内容限制于所述的具体特征或实施方案。
实施例
实施例1通过与混合电荷聚合物缀合制备示例性修饰的核酸内切酶。
在该实施例中,通过与亲水性两性离子合成聚合物缀合来修饰来自酿脓链球菌的Cas9核酸酶。
1.1N-羟基琥珀酰亚胺聚(羧基甜菜碱丙烯酰胺)(NHS-PCBAA)的合成
如前所述合成pCB-NHS。简言之,合成3-丙烯酰胺基-N-(2-(叔丁氧基)-2-氧代乙基)-N,N-二甲基丙-1-铵(CBAAM-tBu)。然后,进行典型的可逆加成断裂链转移(RAFT)聚合反应以产生10kDa SH-pCB聚合物。通过在DI水(pH6)中以1:10摩尔比与AMAS反应30min,随后通过Amicon旋转透析管除去未反应的AMAS并冷冻干燥48h,形成最终的无色的NHS-活化的聚合物。
1.2pCB-Cas9缀合物的制备和表征。
通过使聚合物的NHS酯基团与蛋白上的可用胺基反应合成pCB-Cas9缀合物。在典型的缀合反应中,将Cas9核酸酶和NHS-pCB以1:10、1:20或1:50的摩尔比溶解在50mM硼酸钠缓冲液(pH9.0)中。最终蛋白浓度为~5mg/mL。将反应混合物在4℃下搅拌2h并通过用冰醋酸将混合物的pH调节至4.5来停止。聚合物-蛋白缀合物通过截留分子量(MWCO)旋转透析膜和随后的离子交换层析分离。使用高效液相色谱法(HPLC)测量蛋白缀合物的流体动力学尺寸。
1.3sgRNA的体外合成
使用
Figure BDA0003683380750000151
sgRNA合成试剂盒,使用制造商推荐的条件进行sgRNA的体外合成。如手册中所述,使用GeneJET RNA提纯和浓缩微试剂盒(GeneJET RNA Cleanup andConcentration Micro Kit)纯化sgRNA产物。通过在酶标仪上测量260nm处的吸光度来测定RNA的浓度。
1.4哺乳动物细胞培养
在补充有10%FBS的DMEM培养基中维持HEK 293-GFP细胞。将在补充有25mM HEPES和10%FBS的McCoy’s 5A改良培养基中维持U2OS细胞。在含有10%FBS的RPMI 1640培养基中增殖K562细胞。解冻后,细胞传代4-5次,然后用于转染。在建立转染实验时,将培养的细胞以24孔格式(500μl体积)铺在完全生长的培养基中,第二天细胞密度必须达到~70%融合。在递送前至少1h,用相同但不含抗生素的培养基替换完全血清培养基。在加湿培养箱中在5%CO2中在37℃下维持所有培养物。
1.5Cas9蛋白和sgRNA的体外共递送
对于Cas9蛋白转染,将200ng纯化的Cas9蛋白加入5μl的Opti-MEM培养基中,然后加入50ng gRNA。gRNA与Cas9蛋白的摩尔比保持在约1至1.2:1。通过轻轻敲打管几次来混合样品,然后在室温下孵育10min。在不同的试管中,用Opti-MEM培养基将0.8μl的Lipofectamine CRISPRMAX转染试剂稀释至5μl。将稀释的转染试剂转移到含有Cas9蛋白/gRNA复合物的管中,然后在室温下孵育10min,然后将整个溶液加到24孔板中的细胞中,并通过轻轻使板涡旋来混合。将板在5%CO2培养箱中在37℃下孵育48h。
1.6人细胞中的在靶和脱靶突变频率的测定。
根据制造商的说明,使用Quick-DNA Miniprep(Zymo Research),在转染U2OS、HEK293或K562细胞2天后获取基因组DNA。使用100ng分离的基因组DNA作为模板,以使用引物对对被靶向的基因组位点进行PCR扩增。使用PureLinkTM PCR纯化试剂盒(ThermoFisher)纯化PCR产物,并在酶标仪上对其定量。将250ng纯化的PCR DNA与2μl的NEBuffer 2(NEB)合并,总体积为19μl,将其变性,然后以这样的热循环再退火,即95℃下5min、以2℃/s95-85℃、以0.2℃/s 85-20℃。将再退火的DNA与1μl的T7核酸内切酶I(10U/μl,NEB)在37℃下孵育30min。Cas9诱导的裂解条带和未裂解的条带在UV光下显现并使用ImageJ软件30定量。切割的条带的峰强度除以所有条带(未切割的+切割的条带)的总强度以确定切割的分数,其用于估计基因修饰水平。对于每个样品,在不同的日子一式三份进行转染和随后的修饰测量。使用基于生物信息学的搜索工具进行脱靶分析以选择潜在的脱靶位点,其也使用T7E1突变检测测定进行评价。
1.7桑格测序
为了更好地确定突变率,对用于T7EI测定的相同纯化PCR产物进行测序以观察个体突变并确定突变谱。使用桑格测序来证实修饰的和未修饰的CRISPR/Cas9系统的基因修饰频率。通过ICE分析(Synthego)分析结果。
1.8结果
出现核酸酶的“脱靶”活性根本上是因为Cas9/sgRNA复合物拥有比有效识别其预期靶DNA位点所需的能量更多的能量。结果,复合物缺乏高特异性并且能够结合与在靶DNA链相似的序列。因此,发明人假设CRISPR/Cas9的脱靶效应可能通过减少与其靶DNA位点的非特异性相互作用而被最小化。
两性离子聚(羧基甜菜碱)(pCB)聚合物是高度水合的并且有效地对抗非特异性相互作用。先前,已将pCB聚合物与胰凝乳蛋白酶(CT)、尿酸酶和干扰素-α2a缀合以保持蛋白生物活性。聚合物的超亲水性产生了使平衡移动的环境,并有利于底物和结合位点相互作用。已经证明pCB缀合的蛋白显示出与其周围环境的非特异性相互作用减少。发明人先前已经证明,非特异性相互作用的减少显示出显著增强蛋白循环时间和减少体内蛋白特异性抗体产生。
由于特异性DNA-sgRNA匹配比非特异性相互作用强得多,发明人假设pCB缀合能够减少非特异性相互作用并仍保持与在靶DNA链足够强的特异性相互作用。通过该策略,CRISPR/Cas9的脱靶效应可以被最小化。因此,将示例性核酸内切酶Cas9与pCB聚合物缀合,并已经检查所得缀合物的在靶和脱靶效率。为了评估pCB-缀合的CRISPR/Cas9系统的特异性,设计了一系列错配的sgRNA,其在多个sgRNA靶DNA界面内含有单、双或三取代。测试了不同的内源人基因。与未修饰的(野生型)Cas9相比,示例性的修饰的核酸内切酶(例如,本文公开的pCB缀合物)显示出降低的脱靶活性、但是类似水平的在靶基因编辑效率。因此,具有混合电荷部分的RNA引导的核酸内切酶,如Cas9的修饰可以提供用于基于CRISPR/Cas9系统的基因编辑的简单、安全且稳健的策略。
为了检验两性离子型pCB聚合物缀合对CRISPR/Cas9系统的脱靶效率的影响,制备了一系列的每个蛋白具有不同数目的聚合物链的示例性pCB-Cas9缀合物。通过使聚合物的N-羟基琥珀酰亚胺(NHS)酯基团与蛋白上的可用胺基反应来合成pCB-Cas9的缀合物。反应方案如图5所示。通过改变反应中Cas9和NHS-pCB之间的摩尔比来控制聚合物密度。分别以1:10、1:20和1:50的摩尔比合成表示为pCB10-Cas9、pCB20-Cas9和pCB50-Cas9的示例性修饰的核酸内切酶。在整个公开内容中,将天然(未缀合的)Cas9蛋白用于比较。天然Cas9和pCB-Cas9缀合物之间的尺寸差异显示于图6,其证实了聚合物-蛋白缀合物的成功合成。
在几乎所有情况下,通过与聚合物共价缀合对蛋白的表面修饰,如PEG化,降低缀合的蛋白的体外生物活性。因此,发明人首先测试了两性离子聚合物的存在是否会损害缀合后的在靶活性。对于这些实验,使用充分确立的Cas9-诱导的GFP破坏测定,其实现了被靶向的核酸酶活性的快速定量(Y.Fu,J.A.Foden,C.Khayter,M.L.Maeder,D.Reyon,J.K.Joung,J.D.Sander,《自然生物技术》(Nature biotechnology)2013,31,822,其公开内容通过引用并入本文)。
在该测定中,人HEK293-GFP细胞中的基因组GFP报告基因被靶向。通过测量人HEK293-GFP细胞中荧光信号的损失来定量活性,所述荧光信号的损失由在靶CRISPR/Cas9切割引起(图1A)。用50ng sgRNA和200ng天然Cas9/Cas9-等同物pCB-Cas9缀合物与CRISPRMAX(图7和8)在含有10%FBS的DMEM中处理细胞48h以诱导GFP报告基因的破坏。如图1B所示,发现示例性核酸内切酶pCB10-Cas9和pCB20-Cas9显示了与天然Cas9相当的编辑效率,其中约60%的细胞在处理后丧失其GFP表达。结果表明pCB聚合物的存在不损害CRISPR/Cas9系统的“在靶”编辑效率。然而,当用pCB50-Cas9处理时,仅发现40%的GFP阴性细胞(图1B)。这是由于存在更多的pCB聚合物,其可以在物理上阻碍DNA和CRISPR/Cas9RNP之间的结合。
为了探究pCB缀合物在降低脱靶活性中的潜力,随机产生具有一个、两个或三个错配的核苷酸的靶位点的变体sgRNA,并测试这些错配的sgRNA是否能够驱动人细胞中的脱靶GFP破坏(图1C)。如果pCB缀合可以减少脱靶,则pCB-Cas9缀合物将比天然Cas9更不耐受错配。如图1C所示,当使用错配的sgRNA时,天然Cas9仍然可以在人细胞中诱导实质性GFP基因破坏。相比之下,当使用错配的sgRNA时,pCB-Cas9缀合物显示GFP破坏效率的显著降低(图1C)。当sgRNA中存在一个、两个或三个核苷酸错配时,pCB10-Cas9诱导了35.6%、21.9%和5.6%的GFP破坏,而pCB20-Cas9分别导致了14.2%、8.9%和0%的GFP破坏。当存在2或3个核苷酸错配时,pCB50-Cas9不产生可检测的GFP破坏。这些数据表明当使用错配的sgRNA时,pCB缀合可显著减少脱靶基因编辑。考虑在靶和脱靶效率两者,选择显示完全的在靶效率和显著降低的脱靶效率的pCB20-Cas9用于下文描述的进一步研究。
为了进一步评价错配对pCB-Cas9的影响,设计了携带一个、两个或三个核苷酸突变的另外的sgRNA。如表1所示,天然Cas9在单错配情况下表现出显著的脱靶编辑(57.4%、60.6%和49.3%)。如上面所讨论的,这些脱靶编辑效率非常接近其在完全匹配情况下的在靶编辑效率(62.6%)。相比之下,使用相同的错配的sgRNA,示例性pCB20-Cas9缀合物显示出显著降低的脱靶编辑效率(14.2%、12.6%和6.8%)。该编辑效率比其完全匹配情况下的编辑效率(67.4%)低80%以上。当sgRNA具有两个或三个错配时,在另外两种情况下证实了该观察结果。当sgRNA中存在3个错配时,天然Cas9仍显示阳性编辑效率(12.4%、7.9%、9.3%)。相比之下,pCB-Cas9缀合物组没有观察到“脱靶”效率。这表明pCB-缀合的CRISPR/Cas9在DNA编辑中具有高分辨率并且可以在单碱基水平上区分错配。
表1.靶向GFP、EMX、VEGF和CLTA中的位点的Cas9:sgRNA的在靶和已知的脱靶底物。显示GFP、EMX、VEGF和CLTA的基因组在靶和脱靶位点的列表,其中在靶序列的突变以小写字母显示。
Figure BDA0003683380750000191
已知核酸酶的“脱靶”活性根本上是由Cas9/sgRNA复合物拥有的额外能量引起的,导致缺乏完全的特异性。这样的额外的能量主要来自非特异性力—特别是疏水和静电的。用不结垢的聚合物材料涂覆蛋白可以改变这些非特异性相互作用,并且是降低能量和促进特异性结合的关键。已知核酸酶的“脱靶”活性根本上是由Cas9/sgRNA复合物拥有的额外能量引起的,导致缺乏完全的特异性。这样的额外的能量主要来自非特异性力—特别是疏水和静电的。用不结垢的聚合物材料涂覆蛋白可以改变这些非特异性相互作用,并且是降低能量和促进特异性结合的关键。在过去几年中,基于天然存在的甜菜碱,如pCB的两性离子材料具有特别高的水合作用。结果,在不同的情况下,已经观察到在复杂的生物介质中的超低非特异性吸附。发明人假设pCB与Cas9的缀合可降低Cas9/sgRNA复合物与靶点DNA之间的非特异性结合力。如图2所示,对于天然Cas9,Cas9/sgRNA复合物拥有的能量比sgRNA和DNA之间的在靶结合所需的最小能量高得多。结果,即使存在一个或多个错配的核苷酸,RNP复合物仍具有足够的能量。使用pCB缀合物,上述非特异性结合,特别是疏水—疏水相互作用显著降低。当序列上存在错配的核苷酸时,复合物不能在没有足够能量的情况下结合双链DNA。结果,脱靶效应可被显著降低。此外,受益于聚合物的超亲水性,在周围形成紧密结合的水层,并且RNP与两性离子聚合物之间的非特异性相互作用可如之前所观察到的被最小化。因此,Cas9的生物活性可以在聚合物缀合后被保留,这对于保持在靶效率是非常重要的。
为了检查pCB-缀合的CRISPR/Cas9RNP是否可以减少对人细胞中其它DNA结构域的脱靶效应,选择VEGFA、EMX和CLTA基因中的三个新的基因组基因座,这是由于它们潜在的生物医学相关性和在Cas9脱靶研究中的广泛使用。如图3D所示,对于所有三个靶点,使用T7核酸内切酶I(T7EI)测定检测了CRISPR/pCB20-Cas9介导的在它们的内源基因座的插入缺失(indel)。对于这三种靶序列中的每一种,发明人检查了在其它研究中已经观察到的几个潜在脱靶位点的编辑效率。在该公开内容中,观察到类似的趋势。当使用天然CRISPR/Cas9编辑细胞时,在所选择的脱靶位点的突变率非常高,范围为9.4%至93.6%。相比之下,对于使用示例性pCB20-缀合的CRISPR/Cas9编辑的细胞,观察到的脱靶突变率的水平低得多,范围为2.4%至10.5%。值得注意的是,pCB-Cas9缀合物的编辑效率略高于天然Cas9的编辑效率。这证实了Cas9的生物活性在缀合后得以保留的假设。
在证实pCB缀合减少了HEK293-GFP细胞中CRISPR/Cas9的脱靶突变后,在其它类型的人细胞中评价该修饰的Cas9。在此,使用U2OS和K562细胞系,因为它们也广泛用于测试CRISPR/Cas9的在靶/脱靶活性。在U2OS和K562细胞编辑中使用天然Cas9或pCB-Cas9研究对三个靶点的编辑效率。如所预期的,当与天然Cas9相比时,pCB-Cas9缀合物在靶基因组基因座产生类似的或稍高的编辑效率(图3E和3F)。对于使用变体错配的脱靶检查,pCB-Cas9缀合物组在22个脱靶位点中的20个产生小于4%的插入缺失率。相比之下,天然Cas9产生了2.9%-24.7%脱靶插入缺失,其中6个高于10%。这些结果进一步证明了pCB-缀合的CRISPR/Cas9在不同细胞系中显示出降低的脱靶效应。
实施例2:示例性修饰的核酸内切酶(融合蛋白Cas9-EK)的制备和用于基因编辑和 脱靶减少的离体Cas9-EK mRNA递送。
在该实施例中,将编码来自酿脓链球菌的具有N和C端核定位信号(NLS)的Cas9核酸酶的人密码子优化的DNA克隆到pcDNA3.1载体中。商业合成编码具有10kDa或30kDa长度的多聚(EK)的DNA,并将其附加到Cas9基因的C端或C-和N端以产生Cas9-EK构建体(图8A-8C)。基于聚(EK)的长度和融合位置构建3种Cas9-EK质粒,Cas9-(EK)10、(EK)10-Cas9-(EK)10和Cas9-(EK)30。无聚(EK)序列的Cas9序列用作对照序列。由于质粒和转录物的组成型存在会导致高水平的不期望的脱靶基因编辑,通过转染体外转录的(IVT)sgRNA和Cas9 mRNA来使用无DNA的CRISPR基因编辑系统以实现其期望的基因编辑效果。IVT mRNA使基因组插入的风险最小化,并且它绕过了进入核用于转录的要求,导致基因组编辑的快速开始。此外,Cas9 mRNA递送提供了Cas9蛋白的瞬时表达,这可能潜在地降低脱靶效应。
Cas9和Cas9-EK mRNA通过体外转录产生。根据制造商的说明使用BbsI(NewEngland Biolabs)将编码Cas9和Cas9-EK的质粒线性化。纯化后,使用mMESSAGE
Figure BDA0003683380750000211
T7 Ultra转录试剂盒(Thermo Fisher)根据制造商的说明以37℃下孵育2小时来转录Cas9和Cas9-EKmRNA。加入TURBODNA酶以终止转录。该系统依赖于Cas9 mRNA在细胞中的翻译,因此需要在转染之前的Cas9和Cas9-EK mRNA的聚腺苷酸化(聚(A))以防止Cas9 mRNA在体内翻译发生之前降解。采用添加E-PAP酶开始聚腺苷酸化反应并在37℃下孵育30min。电泳图像(图9)中聚腺苷酸化后的条带位移证实存在聚(A)尾。模糊条带表明降解。
在获得mRNA后,首先通过将实验室制备的Cas9 mRNA与商品化的Cas9 mRNA进行比较来证实其在哺乳动物细胞中的活性。选择靶向GFP的gRNA(SEQ.ID NO:5)用于该分析。转染前一天,将细胞以每孔1-2×105个细胞的细胞密度接种在24孔板中。将0.5μg Cas9或Cas9-EK mRNA加入25μL的Opti-MEM中,然后加入50-100ng gRNA。同时,将2μL的Lipofectamine MessengerMax(ThermoFisher)稀释到25μL的Opti-MEM中,然后与mRNA/gRNA样品混合。将混合物孵育15min,然后加入细胞中。然后将全部溶液加到细胞中,并通过轻轻涡旋板来混合。将板在37℃下在5%CO2培养箱中孵育48h。用表达商品化Cas9或实验室制备的Cas9以及GFP gRNA的mRNA共转染HEK293-GFP细胞两天后,通过T7EI测定定量插入缺失突变的百分比。如图10所示,实验室制备的Cas9 mRNA具有与商业Cas9 mRNA相似的在靶编辑效率,这表明体外转录的Cas9 mRNA的成功合成。
为了研究Cas9-EK mRNA是否可以被gRNA编程以切割哺乳动物细胞中的染色体DNA,使用相同的测定来测试Cas9-(EK)10、(EK)10-Cas9-(EK)10和Cas9-(EK)30的基因编辑效率。如图11A所示,当靶向GFP序列时,所有三种Cas9-EK mRNA显示出与Cas9 mRNA相似的编辑水平。聚(EK)的存在不损害对所选择的在靶位点的在靶基因编辑效率。为了证实这种作用不是靶向位点特异性的,用基因组基因座VEGF(GGGTGGGGGGAGTTTGCTCC)(图11B)和EMX(GAGTCCGAGCAGAAGAAGAA)(图11C)进一步证实了类似的编辑频率。在图11D中总结和呈现定量化的数据。对于VEGF和EMX靶基因座,所有三种Cas9-EK融合体显示出与天然Cas9 mRNA相似水平的在靶编辑效率。
为了检查聚(EK)的存在是否可以降低人细胞中的脱靶效应,选择了VEGF和EMA靶基因座的几个潜在的脱靶位点,其已经在其它研究中被观察。结果示于表2中。对于Cas9-(EK)10,与天然Cas9相比,一些脱靶位点的脱靶活性类似或略微降低。不期望受理论束缚,认为这是由于不能减少gRNA和双链DNA之间的非特异性力的聚(EK)的长度不足。然而,(EK)10-Cas9-(EK)10和Cas9-(EK)30均显示出显著降低的脱靶编辑效率,范围为1.2%至3.5%。这些结果证明Cas9-EK对不同基因组基因座显示出降低的脱靶效应。
表2.由HEK293-GFP、U2OS和K562细胞中的天然CRISPR/Cas9和Cas9-EK融合体导致的在靶和脱靶DNA修饰。(N.D.,未检测到)
Figure BDA0003683380750000231
在已经证明聚(EK)融合减少HEK293-GFP细胞中CRISPR/Cas9的脱靶突变后,在其它类型的人细胞中评价该EK化的Cas9。在此,使用U2OS和K562细胞系,因为它们也广泛用于测试CRISPR/Cas9的在/脱靶活性。使用天然Cas9或Cas9-EK在U2OS和K562细胞编辑中研究了对两个靶点的编辑效率。如所预期的,当与靶基因组基因座处的天然Cas9相比时,Cas9-EK融合体产生类似的在靶编辑效率(表2)。对于使用变体错配的脱靶检验,Cas9-(EK)10显示与天然Cas9相似的脱靶基因编辑效率。然而,(EK)10-Cas9-(EK)10和Cas9-(EK)30显示显著降低的脱靶编辑效率,在36个脱靶位点中的29个产生小于3%的插入缺失率。相比之下,天然Cas9 mRNA产生2.5%-21.5%脱靶插入缺失,其中四个高于10%。这些结果进一步证明,聚(EK)融合的CRISPR/Cas9在不同细胞系中显示出降低的脱靶效应。
实施例3:与混合电荷多肽融合的CRISPR/Cas9系统的离体和体内mRNA递送。
示例性系统的功效可在离体系统中进一步证明。上述方案可用于具有突变的原代细胞的基因编辑。例如,共生同源γ-珠蛋白基因(HBG1/2)的再表达可以是通过诱导胎儿血红蛋白(HbF,α2γ2)来改善严重的β-珠蛋白障碍镰状细胞病(SCD)和β-地中海贫血的通用策略。已知BCL11A红系增强子处的核心序列是抑制成人阶段红系细胞中的HbF所需的,但在非红系细胞中不是必需的。在BCL11A红细胞增强子处的GATA1结合位点内的Cas9:sgRNA介导的切割可导致该基序的高度渗透破坏、BCL11A表达的降低和胎儿γ-珠蛋白的诱导。用从SCD患者或β-地中海贫血患者收获的人成人造血干细胞和祖细胞(HSPC)进行实验。Cas9/Cas9-(EK)n mRNA和sgRNA(SEQ.ID NO:21-24)如上所述被递送。编辑效率通过T7E1测定、位点特异性桑格测序和在靶和推定的脱靶位点的深度测序来评估。预期HSPC优先经历非同源末端连接修复。预期编辑的移植SCD HSC的红系后代表达治疗水平的HbF并抵抗镰状化,同时预期来自患有β-地中海贫血的患者的那些显示恢复的珠蛋白链平衡。在用CRISPR/Cas9系统编辑后,将人CD34+HSPC注射到免疫缺陷的NOD.Cg-KitW-41J Tyr+ Prkdcscid Il2rgtm1Wjl(NBSGW)小鼠中,以测试BCL11A增强子编辑对HSPC的影响。未照射的NBSGW雌性小鼠(4-5周龄)通过眼眶后注射输注重悬浮于DPBS中的0.2-0.8M CD34+ HSPC。在移植后16周分离骨髓用于人异种移植物分析。使用眼眶后注射来自初代受者的骨髓细胞进行连续移植。对于流式细胞术,进行骨髓细胞分析以测量人类移植百分比。
实施例4:与混合电荷多肽融合的CRISPR/Cas9系统的体内mRNA递送。
CRISPR/Cas9基因编辑可通过转化编码Cas9和sgRNA的DNA质粒实现,但质粒和转录物的组成性存在会导致高水平的不期望的脱靶基因编辑。许多研究人员正转向通过转染体外转录的sgRNA和Cas9 mRNA以实现其期望的基因编辑效果的无DNA的CRISPR基因编辑系统。在该实施例中,将编码来自酿脓链球菌的具有N和C端核定位信号(NLS)的Cas9核酸酶的人密码子优化的DNA克隆到pcDNA3.1载体(GenScript)中。编码具有10KDa或30KDa长度的聚(EK)的DNA序列是商业合成的并且附加到Cas9基因的3’-端或5’和3’端两者以产生Cas9-EK构建体。通过在小鼠Pcsk9外显子内搜索在靶序列来鉴定gRNA,小鼠Pcsk9外显子在小鼠基因组中显示大量脱靶位点(与在靶位点有两个或更少的错配)。根据制造商的说明,使用mMESSAGE
Figure BDA0003683380750000251
T7 Ultra转录试剂盒(ThermoFisher)通过体外转录产生Cas9和Cas9-EK mRNA。将Cas9或Cas9-EK mRNA和gRNA包封在脂质纳米颗粒(LNP)中用于全身递送。
对于体内Pcsk9基因编辑,9-11周龄的雄性小鼠接受尾静脉注射,其具有一致的Cas9与gRNA的比例,采用磷酸盐缓冲的盐水。在mRNA给予前(基线)、病毒给予后一周和终止时(mRNA给予后四天或三周)对外周血取样。在实验终点,在异氟烷麻醉下通过心脏穿刺使动物安乐死。解剖器官—包括肝、脾、肺、肾、肌肉、脑和睾丸,在液氮中速冻并在-80℃下储存直至进一步分析。在研究过程中从隐静脉和在终止时通过心脏穿刺将外周血收集在EDTA包被的毛细管中。用标准ELISA试剂盒,根据制造商的说明测定血浆中小鼠Pcsk9的水平。在处理后第4天和第3周从注射腺病毒的小鼠的肝组织提取基因组DNA用于插入缺失分析。通过深度测序分析在靶位点和各个鉴定的潜在脱靶位点。
总之,以上实施例证明CRISPR/Cas系统所面临的“脱靶”问题可以通过用混合电荷部分修饰来解决。在用混合电荷聚合物或混合电荷肽修饰后,示例性CRISPR/Cas9系统显示显著降低的“脱靶”效率。更重要的是,没有观察到在许多策略中通常注意到的降低的“在靶”频率。该技术可以提供简单和稳健的策略以改善许多的基于CRISPR/Cas9的生物和临床应用的效率和安全性。
虽然已经示出和描述了说明性实施方案,但是应当理解,在不脱离本发明的精神和范围的情况下,可以在其中进行各种改变。
序列表
<110> 华盛顿大学
江绍毅
Y·韩
S·罗中
袁哲凡
<120> 修饰的核酸内切酶和相关方法
<130> FIC22210028P
<150> US 62/913916
<151> 2019-10-11
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 4101
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga c 4101
<210> 2
<211> 4335
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga cgagaaggaa aaagagaagg aaaaggaaaa ggagaaagaa 4140
aaggagaaag agaaagagaa ggaaaaggag aaagagaagg agaaggaaaa agaaaaggag 4200
aaggaaaagg agaaggaaaa ggagaaggag aaggaaaagg aaaaagagaa ggagaaggag 4260
aaggagaagg agaaggagaa ggagaaggag aaggagaagg agaaggagaa ggagaaggag 4320
aaggagaagg agaag 4335
<210> 3
<211> 4569
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
gagaaggaaa aagagaagga aaaggaaaag gagaaagaaa aggagaaaga gaaagagaag 60
gaaaaggaga aagagaagga gaaggaaaaa gaaaaggaga aggaaaagga gaaggaaaag 120
gagaaggaga aggaaaagga aaaagagaag gagaaggaga aggagaagga gaaggagaag 180
gagaaggaga aggagaagga gaaggagaag gagaaggaga aggagaagga gaaggacaag 240
aagtacagca tcggcctgga catcggcacc aactctgtgg gctgggccgt gatcaccgac 300
gagtacaagg tgcccagcaa gaaattcaag gtgctgggca acaccgaccg gcacagcatc 360
aagaagaacc tgatcggagc cctgctgttc gacagcggcg aaacagccga ggccacccgg 420
ctgaagagaa ccgccagaag aagatacacc agacggaaga accggatctg ctatctgcaa 480
gagatcttca gcaacgagat ggccaaggtg gacgacagct tcttccacag actggaagag 540
tccttcctgg tggaagagga taagaagcac gagcggcacc ccatcttcgg caacatcgtg 600
gacgaggtgg cctaccacga gaagtacccc accatctacc acctgagaaa gaaactggtg 660
gacagcaccg acaaggccga cctgcggctg atctatctgg ccctggccca catgatcaag 720
ttccggggcc acttcctgat cgagggcgac ctgaaccccg acaacagcga cgtggacaag 780
ctgttcatcc agctggtgca gacctacaac cagctgttcg aggaaaaccc catcaacgcc 840
agcggcgtgg acgccaaggc catcctgtct gccagactga gcaagagcag acggctggaa 900
aatctgatcg cccagctgcc cggcgagaag aagaatggcc tgttcggaaa cctgattgcc 960
ctgagcctgg gcctgacccc caacttcaag agcaacttcg acctggccga ggatgccaaa 1020
ctgcagctga gcaaggacac ctacgacgac gacctggaca acctgctggc ccagatcggc 1080
gaccagtacg ccgacctgtt tctggccgcc aagaacctgt ccgacgccat cctgctgagc 1140
gacatcctga gagtgaacac cgagatcacc aaggcccccc tgagcgcctc tatgatcaag 1200
agatacgacg agcaccacca ggacctgacc ctgctgaaag ctctcgtgcg gcagcagctg 1260
cctgagaagt acaaagagat tttcttcgac cagagcaaga acggctacgc cggctacatt 1320
gacggcggag ccagccagga agagttctac aagttcatca agcccatcct ggaaaagatg 1380
gacggcaccg aggaactgct cgtgaagctg aacagagagg acctgctgcg gaagcagcgg 1440
accttcgaca acggcagcat cccccaccag atccacctgg gagagctgca cgccattctg 1500
cggcggcagg aagattttta cccattcctg aaggacaacc gggaaaagat cgagaagatc 1560
ctgaccttcc gcatccccta ctacgtgggc cctctggcca ggggaaacag cagattcgcc 1620
tggatgacca gaaagagcga ggaaaccatc accccctgga acttcgagga agtggtggac 1680
aagggcgctt ccgcccagag cttcatcgag cggatgacca acttcgataa gaacctgccc 1740
aacgagaagg tgctgcccaa gcacagcctg ctgtacgagt acttcaccgt gtataacgag 1800
ctgaccaaag tgaaatacgt gaccgaggga atgagaaagc ccgccttcct gagcggcgag 1860
cagaaaaagg ccatcgtgga cctgctgttc aagaccaacc ggaaagtgac cgtgaagcag 1920
ctgaaagagg actacttcaa gaaaatcgag tgcttcgact ccgtggaaat ctccggcgtg 1980
gaagatcggt tcaacgcctc cctgggcaca taccacgatc tgctgaaaat tatcaaggac 2040
aaggacttcc tggacaatga ggaaaacgag gacattctgg aagatatcgt gctgaccctg 2100
acactgtttg aggacagaga gatgatcgag gaacggctga aaacctatgc ccacctgttc 2160
gacgacaaag tgatgaagca gctgaagcgg cggagataca ccggctgggg caggctgagc 2220
cggaagctga tcaacggcat ccgggacaag cagtccggca agacaatcct ggatttcctg 2280
aagtccgacg gcttcgccaa cagaaacttc atgcagctga tccacgacga cagcctgacc 2340
tttaaagagg acatccagaa agcccaggtg tccggccagg gcgatagcct gcacgagcac 2400
attgccaatc tggccggcag ccccgccatt aagaagggca tcctgcagac agtgaaggtg 2460
gtggacgagc tcgtgaaagt gatgggccgg cacaagcccg agaacatcgt gatcgaaatg 2520
gccagagaga accagaccac ccagaaggga cagaagaaca gccgcgagag aatgaagcgg 2580
atcgaagagg gcatcaaaga gctgggcagc cagatcctga aagaacaccc cgtggaaaac 2640
acccagctgc agaacgagaa gctgtacctg tactacctgc agaatgggcg ggatatgtac 2700
gtggaccagg aactggacat caaccggctg tccgactacg atgtggacca tatcgtgcct 2760
cagagctttc tgaaggacga ctccatcgac aacaaggtgc tgaccagaag cgacaagaac 2820
cggggcaaga gcgacaacgt gccctccgaa gaggtcgtga agaagatgaa gaactactgg 2880
cggcagctgc tgaacgccaa gctgattacc cagagaaagt tcgacaatct gaccaaggcc 2940
gagagaggcg gcctgagcga actggataag gccggcttca tcaagagaca gctggtggaa 3000
acccggcaga tcacaaagca cgtggcacag atcctggact cccggatgaa cactaagtac 3060
gacgagaatg acaagctgat ccgggaagtg aaagtgatca ccctgaagtc caagctggtg 3120
tccgatttcc ggaaggattt ccagttttac aaagtgcgcg agatcaacaa ctaccaccac 3180
gcccacgacg cctacctgaa cgccgtcgtg ggaaccgccc tgatcaaaaa gtaccctaag 3240
ctggaaagcg agttcgtgta cggcgactac aaggtgtacg acgtgcggaa gatgatcgcc 3300
aagagcgagc aggaaatcgg caaggctacc gccaagtact tcttctacag caacatcatg 3360
aactttttca agaccgagat taccctggcc aacggcgaga tccggaagcg gcctctgatc 3420
gagacaaacg gcgaaaccgg ggagatcgtg tgggataagg gccgggattt tgccaccgtg 3480
cggaaagtgc tgagcatgcc ccaagtgaat atcgtgaaaa agaccgaggt gcagacaggc 3540
ggcttcagca aagagtctat cctgcccaag aggaacagcg ataagctgat cgccagaaag 3600
aaggactggg accctaagaa gtacggcggc ttcgacagcc ccaccgtggc ctattctgtg 3660
ctggtggtgg ccaaagtgga aaagggcaag tccaagaaac tgaagagtgt gaaagagctg 3720
ctggggatca ccatcatgga aagaagcagc ttcgagaaga atcccatcga ctttctggaa 3780
gccaagggct acaaagaagt gaaaaaggac ctgatcatca agctgcctaa gtactccctg 3840
ttcgagctgg aaaacggccg gaagagaatg ctggcctctg ccggcgaact gcagaaggga 3900
aacgaactgg ccctgccctc caaatatgtg aacttcctgt acctggccag ccactatgag 3960
aagctgaagg gctcccccga ggataatgag cagaaacagc tgtttgtgga acagcacaag 4020
cactacctgg acgagatcat cgagcagatc agcgagttct ccaagagagt gatcctggcc 4080
gacgctaatc tggacaaagt gctgtccgcc tacaacaagc accgggataa gcccatcaga 4140
gagcaggccg agaatatcat ccacctgttt accctgacca atctgggagc ccctgccgcc 4200
ttcaagtact ttgacaccac catcgaccgg aagaggtaca ccagcaccaa agaggtgctg 4260
gacgccaccc tgatccacca gagcatcacc ggcctgtacg agacacggat cgacctgtct 4320
cagctgggag gcgacgagaa ggaaaaagag aaggaaaagg aaaaggagaa agaaaaggag 4380
aaagagaaag agaaggaaaa ggagaaagag aaggagaagg aaaaagaaaa ggagaaggaa 4440
aaggagaagg aaaaggagaa ggagaaggaa aaggaaaaag agaaggagaa ggagaaggag 4500
aaggagaagg agaaggagaa ggagaaggag aaggagaagg agaaggagaa ggagaaggag 4560
aaggagaag 4569
<210> 4
<211> 4803
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga cgagaaggaa aaagagaagg aaaaggaaaa ggagaaagaa 4140
aaggagaaag agaaagagaa ggaaaaggag aaagagaagg agaaggaaaa agaaaaggag 4200
aaggaaaagg agaaggaaaa ggagaaggag aaggaaaagg aaaaagagaa ggagaaggag 4260
aaggagaagg agaaggagaa ggagaaggag aaggagaagg agaaggagaa ggagaaggag 4320
aaggagaagg agaaggagaa ggaaaaagag aaggaaaagg aaaaggagaa agaaaaggag 4380
aaagagaaag agaaggaaaa ggagaaagag aaggagaagg aaaaagaaaa ggagaaggaa 4440
aaggagaagg aaaaggagaa ggagaaggaa aaggaaaaag agaaggagaa ggagaaggag 4500
aaggagaagg agaaggagaa ggagaaggag aaggagaagg agaaggagaa ggagaaggag 4560
aaggagaagg agaaggaaaa agagaaggaa aaggaaaagg agaaagaaaa ggagaaagag 4620
aaagagaagg aaaaggagaa agagaaggag aaggaaaaag aaaaggagaa ggaaaaggag 4680
aaggaaaagg agaaggagaa ggaaaaggaa aaagagaagg agaaggagaa ggagaaggag 4740
aaggagaagg agaaggagaa ggagaaggag aaggagaagg agaaggagaa ggagaaggag 4800
aag 4803
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
gggcacgggc agcttgccgg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 6
gggtgggggg agtttgctcc 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
ggatggaggg agtttgctcc 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
gggagggtgg agtttgctcc 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
cgggggaggg agtttgctcc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
ggggagggga agtttgctcc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
gagtccgagc agaagaagaa 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
gaggccgagc agaagaaaga 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
gagtcctagc aggagaagaa 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
gagtctaagc agaagaagaa 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
gagttagagc agaagaagaa 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
gcagatgtag tgtttccaca 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
acatatgtag tatttccaca 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
ccagatgtag tattcccaca 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
ctagatgaag tgcttccaca 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
ctagatgaag tgcttccaca 20
<210> 21
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
aagaauggcu ucaagaggcu 20
<210> 22
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
ucuguaagaa uggcuucaag 20
<210> 23
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
ugguucauca ucuguaagaa 20
<210> 24
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
acagaugaug aaccagacca 20

Claims (60)

1.一种修饰的核酸内切酶,其包括核酸内切酶和与所述核酸内切酶共价连接的一个或多个混合电荷部分,其中每个混合电荷部分包括约10至约400个带正电荷的部分和约10至约400个带负电荷的部分,并且其中带正电荷的部分的数目与带负电荷的部分的数目的比率为约1:0.5至约1:2。
2.权利要求1所述的修饰的核酸内切酶,其中所述核酸内切酶是核酸引导的核酸酶系统蛋白。
3.权利要求1或2中任一项所述的修饰的核酸内切酶,其中所述核酸内切酶是CRISPR相关(Cas)蛋白。
4.权利要求1-3中任一项所述的修饰的核酸内切酶,其中所述核酸内切酶是Cas9、Cas12、Cas13、Cas14,或其突变体或变体。
5.权利要求1-4中任一项所述的修饰的核酸内切酶,其中所述核酸内切酶是Cas9或其突变体或变体。
6.权利要求1-5中任一项所述的修饰的核酸内切酶,其中所述混合电荷部分在约7.4的pH下基本上是电中性的。
7.权利要求1-6中任一项所述的修饰的核酸内切酶,其中所述核酸内切酶在CRISPR/Cas系统中具有活性,其中所述CRISPR/Cas系统相对于野生型CRISPR/Cas系统表现出降低的脱靶编辑活性和维持的在靶编辑活性。
8.权利要求7所述的修饰的核酸内切酶,其中与未修饰的核酸内切酶相比,所述脱靶编辑活性降低至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%或至少80%。
9.权利要求1-8中任一项所述的修饰的核酸内切酶,其中所述混合电荷部分与所述核酸内切酶的氨基酸的侧链、所述核酸内切酶的N端氨基和/或所述核酸内切酶的C端羧基共价连接。
10.权利要求1-9中任一项所述的修饰的核酸内切酶,其中所述混合电荷部分是分子量为约2kDa至约130kDa的肽。
11.权利要求10所述的修饰的核酸内切酶,其中所述的修饰的核酸内切酶是融合蛋白,其中所述混合电荷部分是由以下组成的混合电荷结构域:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;以及
c)任选的多个独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸;以及
其中带正电荷的氨基酸的数目与带负电荷的氨基酸的数目的比率为约1:0.5至约1:2。
12.权利要求10所述的修饰的核酸内切酶,其中所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。
13.权利要求10所述的修饰的核酸内切酶,其中所述多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。
14.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域不包括多个另外的氨基酸。
15.权利要求10所述的修饰的核酸内切酶,其中所述多个带正电荷的氨基酸是赖氨酸,并且多个带负电荷的氨基酸是谷氨酸。
16.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域包括随机序列。
17.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域包括序列(X1-X2-X3)n,其中X1是带正电荷的氨基酸,X2是带负电荷的氨基酸,并且X3不存在或是独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,其中n是约5至约50的整数。
18.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域包括多个赖氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。
19.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域包括多个组氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。
20.权利要求10所述的修饰的核酸内切酶,其中所述多个另外的氨基酸选自脯氨酸、丝氨酸和甘氨酸。
21.权利要求10所述的修饰的核酸内切酶,其中所述多个另外的氨基酸是多个脯氨酸。
22.权利要求10所述的修饰的核酸内切酶,其中所述混合电荷结构域包括多个赖氨酸、多个谷氨酸和多个脯氨酸。
23.权利要求1-9中任一项所述的修饰的核酸内切酶,其中所述混合电荷部分是分子量为约2kDa至约80kDa的合成聚合物。
24.权利要求23所述的修饰的核酸内切酶,其中所述聚合物选自聚(羧基甜菜碱)(PCB)、聚(磺基甜菜碱)(PSB)、聚(2-甲基丙烯酰氧乙基磷酸胆碱)(PMPC)和聚(氧化三甲胺)(TMAO)聚合物。
25.权利要求23或24中任一项所述的修饰的核酸内切酶,其中所述聚合物是聚(羧基甜菜碱)(PCB)。
26.一种核酸,其包括编码权利要求1-22中任一项所述的修饰的核酸内切酶的序列。
27.一种表达载体,其包括权利要求26所述的核酸和与其可操作连接的启动子。
28.一种细胞,其包括权利要求26所述的核酸或权利要求27所述的表达载体。
29.权利要求28所述的细胞,其中所述细胞是原核细胞或真核细胞。
30.权利要求28所述的细胞,其中所述细胞是哺乳动物细胞。
31.权利要求28所述的细胞,其中所述细胞在细胞培养物中。
32.权利要求28所述的细胞,其中所述细胞在生物体中。
33.一种编辑细胞或受试者中的多核苷酸的方法,所述方法包括向所述细胞或所述受试者中引入至少一种权利要求1-25中任一项所述的修饰的核酸内切酶、权利要求26所述的核酸或权利要求27所述的表达载体。
34.权利要求33所述的方法,其中所述多核苷酸是DNA或RNA。
35.权利要求33或34所述的方法,其中所述核酸是编码所述修饰的核酸内切酶的mRNA。
36.权利要求33-35中任一项所述的方法,其中所述修饰的核酸内切酶包括与核酸内切酶共价连接的混合电荷部分,其中所述混合电荷部分包括约10至约400个带正电荷的部分和约10至约400个带负电荷的部分,并且其中带正电荷的部分的数目与带负电荷的部分的数目的比率为约1:0.5至约1:2。
37.权利要求33-36中任一项所述的方法,其中所述核酸内切酶是核酸引导的核酸酶系统蛋白。
38.权利要求33-37中任一项所述的方法,其中所述核酸内切酶是CRISPR相关(Cas)蛋白。
39.权利要求33-38中任一项所述的方法,其中所述核酸内切酶是Cas9、Cas12、Cas13、Cas14,或其突变体或变体。
40.权利要求33-39中任一项所述的方法,其中所述核酸内切酶是Cas9或其突变体或变体。
41.权利要求34-40中任一项所述的方法,其中所述混合电荷部分在约7.4的pH下基本上是电中性的。
42.权利要求33-41中任一项所述的方法,其中所述核酸内切酶在CRISPR/Cas系统中具有活性,其中所述CRISPR/Cas系统相对于野生型CRISPR/Cas系统表现出降低的脱靶编辑活性和维持的在靶编辑活性。
43.权利要求42所述的修饰的核酸内切酶,其中与未修饰的核酸内切酶相比,所述脱靶编辑活性降低至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%或至少80%。
44.权利要求33-43中任一项所述的方法,其中所述混合电荷部分与所述核酸内切酶的氨基酸的侧链、所述核酸内切酶的N端氨基和/或所述核酸内切酶的C端羧基共价连接。
45.权利要求33-44中任一项所述的方法,其中所述混合电荷部分是分子量为约2kDa至约130kDa的肽。
46.权利要求45所述的方法,其中所述修饰的核酸内切酶是融合蛋白,其中所述混合电荷部分是由以下组成的混合电荷结构域:
a)多个带负电荷的氨基酸;
b)多个带正电荷的氨基酸;以及
c)任选的多个独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸;以及
其中带负电荷的氨基酸的数目与带正电荷的氨基酸的数目的比率为约1:0.5至约1:2。
47.权利要求46所述的方法,其中所述多个带负电荷的氨基酸独立地选自天冬氨酸、谷氨酸及其衍生物。
48.权利要求46所述的方法,其中所述多个带正电荷的氨基酸独立地选自赖氨酸、组氨酸、精氨酸及其衍生物。
49.权利要求46所述的方法,其中所述混合电荷结构域不包括多个另外的氨基酸。
50.权利要求46所述的方法,其中所述多个带正电荷的氨基酸是赖氨酸,并且多个带负电荷的氨基酸是谷氨酸。
51.权利要求46所述的方法,其中所述混合电荷结构域包括随机序列。
52.权利要求46所述的方法,其中所述混合电荷结构域包括序列(X1-X2-X3)n,其中X1是带负电荷的氨基酸,X2是带正电荷的氨基酸,并且X3不存在或是独立地选自脯氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、甘氨酸及其衍生物的另外的氨基酸,其中n是约5至约50的整数。
53.权利要求46所述的方法,其中所述混合电荷结构域包括多个赖氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。
54.权利要求46所述的方法,其中所述混合电荷结构域包括多个组氨酸和多个选自谷氨酸和天冬氨酸的带负电荷的氨基酸。
55.权利要求46所述的方法,其中所述多个另外的氨基酸选自脯氨酸、丝氨酸和甘氨酸。
56.权利要求46所述的方法,其中所述多个另外的氨基酸是多个脯氨酸。
57.权利要求46所述的方法,其中所述混合电荷结构域包括多个赖氨酸、多个谷氨酸和多个脯氨酸。
58.权利要求33-44中任一项所述的方法,其中所述混合电荷部分是分子量为约2kDa至约80kDa的合成聚合物。
59.权利要求58所述的方法,其中所述聚合物选自聚(羧基甜菜碱)(PCB)、聚(磺基甜菜碱)(PSB)、聚(2-甲基丙烯酰氧乙基磷酸胆碱)(PMPC)和聚(氧化四甲胺)(TMAO)聚合物。
60.权利要求58或59所述的方法,其中所述聚合物是聚(羧基甜菜碱)(PCB)。
CN202080085104.0A 2019-10-11 2020-10-09 修饰的核酸内切酶和相关方法 Pending CN114901303A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962913916P 2019-10-11 2019-10-11
US62/913916 2019-10-11
PCT/US2020/055095 WO2021072281A1 (en) 2019-10-11 2020-10-09 Modified endonucleases and related methods

Publications (1)

Publication Number Publication Date
CN114901303A true CN114901303A (zh) 2022-08-12

Family

ID=75437549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080085104.0A Pending CN114901303A (zh) 2019-10-11 2020-10-09 修饰的核酸内切酶和相关方法

Country Status (5)

Country Link
US (1) US20230203462A1 (zh)
EP (1) EP4041287A4 (zh)
JP (1) JP2022551931A (zh)
CN (1) CN114901303A (zh)
WO (1) WO2021072281A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023216037A1 (zh) * 2022-05-07 2023-11-16 上海鲸奇生物科技有限公司 Dna靶向基因编辑工具的开发

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102905730A (zh) * 2009-11-06 2013-01-30 华盛顿大学商业中心 两性离子聚合物生物缀合物以及相关的方法
US9526784B2 (en) * 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US11111508B2 (en) * 2015-10-30 2021-09-07 Brandeis University Modified CAS9 compositions and methods of use
CA3076976A1 (en) * 2017-09-22 2019-03-28 The Regents Of The University Of California Affinity-tagged photoswitches and methods of use thereof

Also Published As

Publication number Publication date
EP4041287A1 (en) 2022-08-17
EP4041287A4 (en) 2023-11-29
JP2022551931A (ja) 2022-12-14
WO2021072281A1 (en) 2021-04-15
WO2021072281A8 (en) 2022-06-09
US20230203462A1 (en) 2023-06-29

Similar Documents

Publication Publication Date Title
US20200239863A1 (en) Tracking and Manipulating Cellular RNA via Nuclear Delivery of CRISPR/CAS9
JP7094323B2 (ja) 最適化機能CRISPR-Cas系による配列操作のための系、方法および組成物
WO2017127807A1 (en) Crystal structure of crispr cpf1
KR102302679B1 (ko) 가이드 rna 및 엔도뉴클레아제를 유효성분으로 포함하는 암 치료용 약학적 조성물
CN101273141A (zh) 外源核酸序列的靶向整合和表达
US20230212612A1 (en) Genome editing system and method
US20230340439A1 (en) Synthetic miniature crispr-cas (casmini) system for eukaryotic genome engineering
JP2002525066A5 (zh)
US20210363206A1 (en) Proteins that inhibit cas12a (cpf1), a cripr-cas nuclease
WO2023102329A2 (en) Effector proteins and uses thereof
WO2023092132A1 (en) Effector proteins and uses thereof
WO2023028444A1 (en) Effector proteins and methods of use
CN109402115B (zh) 靶向Rett突变基因RNA的gRNA及Rett突变基因的检测方法、检测试剂盒
CN114901303A (zh) 修饰的核酸内切酶和相关方法
CN111051509A (zh) 用于电介质校准的含有c2cl核酸内切酶的组合物以及使用其进行电介质校准的方法
CN109295055B (zh) 基于C2c2的肿瘤相关突变基因的gRNA、检测方法、检测试剂盒
CN109897852A (zh) 基于C2c2的肿瘤相关突变基因的gRNA、检测方法、检测试剂盒
EP4165182A2 (en) Genetic modification
WO2021152402A1 (en) Nuclease-scaffold composition delivery platform
WO2023165613A1 (zh) 5&#39;→3&#39;核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法
Maloshenok et al. Visualizing the Nucleome Using the CRISPR–Cas9 System: From in vitro to in vivo
US20230313159A1 (en) Variants of cas nuclease
Han et al. Minimizing the off-target frequency of the CRISPR/Cas9 system via zwitterionic polymer conjugation and peptide fusion
WO2023077095A2 (en) Effector proteins, compositions, systems, devices, kits and methods of use thereof
WO2023122663A2 (en) Effector proteins and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination