CN106967697A - 一种Cas9核酸酶G915F及其用途 - Google Patents

一种Cas9核酸酶G915F及其用途 Download PDF

Info

Publication number
CN106967697A
CN106967697A CN201710344429.6A CN201710344429A CN106967697A CN 106967697 A CN106967697 A CN 106967697A CN 201710344429 A CN201710344429 A CN 201710344429A CN 106967697 A CN106967697 A CN 106967697A
Authority
CN
China
Prior art keywords
cas9
lys
leu
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710344429.6A
Other languages
English (en)
Other versions
CN106967697B (zh
Inventor
吴强
李金环
寿佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201710344429.6A priority Critical patent/CN106967697B/zh
Publication of CN106967697A publication Critical patent/CN106967697A/zh
Application granted granted Critical
Publication of CN106967697B publication Critical patent/CN106967697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Abstract

本发明属于生物技术领域,具体涉及一种Cas9核酸酶及用途。本发明的Cas9核酸酶(Cas9‑G915F),具有Cas9核酸酶活性,适用于CRISPR/Cas9系统,所述Cas9核酸酶(Cas9‑G915F)是将野生型Cas9核酸酶第915位的甘氨酸突变成苯丙氨酸获得。采用所述Cas9核酸酶(Cas9‑G915F)对DNA双链进行切割可产生突出断裂末端,以补平连接的方式可加入与突出断裂末端互补的碱基,能够实现对基因组DNA片段的特定位置的精准编辑。

Description

一种Cas9核酸酶G915F及其用途
技术领域
本发明属于生物技术领域,具体涉及一种Cas9核酸酶G915F及用途。
背景技术
自从人类基因组计划(Human Genome Project)和DNA元件百科全书(Encyclopedia of DNA Elements)项目的完成,科学家们分析和鉴定了大量的基因组中的基因和DNA调控元件[1,2]。在基因表达调控中起重要作用的DNA调控元件包括启动子、增强子、沉默子和绝缘子等。然而,多数调控元件的功能并没有得到实验的验证和阐明[2-8]。探索基因和DNA调控元件的功能,可以通过遗传学DNA片段编辑来进行研究。
早期的基因编辑和基因功能修饰是通过基因转座和转基因实现的[9-14]。伴随测序技术的发展,反向遗传学被应用于对基因组进行特定的突变[15,16]。特别是依赖于同源重组的基因打靶小鼠迅速地被应用到科学研究中[15,17,18]。此外,在小鼠和斑马鱼中DNA片段的反转和重复被应用于去研究特定的基因组结构变化[19-24]。
近几年,源于细菌和古菌的Ⅱ型成簇规律间隔短回文重复系统[Clusteredregularly interspaced short palindromic repeats(CRISPR)/CRISPR-associatednuclease 9(Cas9),CRISPR/Cas9]是新兴基因组编辑技术[25-27],由于它设计简单和操作方便,迅速地被应用到真核基因组编辑。我们利用CRISPR/Cas9系统在人细胞系和小鼠中实现了DNA片段遗传编辑(删除、反转和重复)[28]。通过Cas9和两个sgRNAs在基因组中进行两个位点靶向断裂后在CtIP等蛋白参与的修复系统作用下可以实现DNA片段的删除、反转(倒位)、重复、易位和插入(如果提供供体)等[29-32]。通过对DNA片段编辑的遗传操作,能够用来研究原钙粘蛋白和珠蛋白的基因表达调控和三维基因组结构[28,31-33]。
目前可以通过CRISPR/Cas9系统实现DNA片段的编辑,但是对于深入研究特定DNA区段的精准功能,有效地实现DNA片段的精准遗传编辑的Cas9核酸酶还有待发现。
发明内容
为了克服现有技术中所存在的问题,本发明的目的在于提供一种Cas9核酸酶及用途。
为了实现上述目的以及其他相关目的,本发明采用如下技术方案:
本发明的第一方面,提供一种Cas9核酸酶(Cas9-G915F),具有Cas9核酸酶活性,适用于CRISPR/Cas9系统,所述Cas9核酸酶(Cas9-G915F)是将野生型Cas9核酸酶第915位的甘氨酸突变成苯丙氨酸获得。
优选地,与野生型Cas9核酸酶相比,所述Cas9核酸酶(Cas9-G915F)对目的基因组DNA片段进行切割时产生的突出断裂末端与钝断裂末端的比例不同。
优选地,所述野生型Cas9核酸酶为SpCas9。
进一步地,所述野生型Cas9核酸酶的氨基酸序列如SEQ ID NO.7所示。
优选地,所述Cas9核酸酶(Cas9-G915F)含有如SEQ ID NO.9所示的氨基酸序列。
优选地,所述Cas9核酸酶(Cas9-G915F)的氨基酸序列如SEQ ID NO.9所示。
本发明的第二方面,提供一种多核苷酸,其编码所述Cas9核酸酶(Cas9-G915F)。
本发明的第三方面,提供一种表达载体,其含有前述多核苷酸。
本发明的第四方面,提供一种宿主细胞,其被前述表达载体所转化。
本发明的第五方面,提供一种制备所述Cas9核酸酶(Cas9-G915F)的方法,包括步骤:构建含有Cas9核酸酶(Cas9-G915F)编码多核苷酸的表达载体,然后将所述表达载体转化至宿主细胞中诱导表达,从表达产物中分离获得所述的Cas9核酸酶(Cas9-G915F)。
本发明的第六方面,提供前述Cas9核酸酶(Cas9-G915F)或其编码多核苷酸或含有所述编码多核苷酸的表达载体用于基因组DNA片段编辑或用于制备基因组DNA片段编辑工具的用途。
优选地,所述编辑包括单位点编辑和多位点编辑。所述多位点编辑的编辑位点数为两个及以上。
优选地,所述编辑的方式包括突变、删除、反转或倒位、重复、易位或插入。
本发明的第七方面,提供一种基因组DNA片段编辑工具,所述基因组DNA片段编辑工具为CRISPR/Cas9系统,所述CRISPR/Cas9系统包括前述Cas9核酸酶(Cas9-G915F)或其编码多核苷酸或含有所述编码多核苷酸的表达载体。
优选地,所述CRISPR/Cas9系统包括前述Cas9-G915F和针对目的DNA片段的一个或多个sgRNA。所述多个是指两个及以上。
本发明的第八方面,提供一种基因组DNA片段编辑方法,采用前述Cas9核酸酶(Cas9-G915F)以及与之配合的一个或多个sgRNA,利用CRISPR/Cas9系统对待编辑的基因组DNA片段进行编辑。
优选地,所述编辑包括单位点编辑和多位点编辑。所述多位点编辑的编辑位点数为两个及以上。
优选地,所述编辑的方式包括突变、删除、反转或倒位、重复、易位或插入。
优选地,将含有前述Cas9核酸酶(Cas9-G915F)编码多核苷酸的表达载体以及与之配合的一个或多个sgRNA一同转入细胞中,对待编辑的基因组DNA片段进行编辑。
本发明的第九方面,提供一种基因组DNA片段单位点编辑方法,利用CRISPR/Cas9系统,采用如权利要求1所述的Cas9核酸酶(Cas9-G915F)对DNA双链进行切割产生突出断裂末端,通过细胞自身修复系统,以补平连接的方式加入与突出断裂末端互补的碱基。
所述基因组DNA片段单位点编辑方法可以改变单位点编辑时碱基突变的特征。
与现有技术相比,本发明具有如下有益效果:
本发明的Cas9核酸酶(Cas9-G915F),适用于CRISPR/Cas9系统,所述Cas9核酸酶(Cas9-G915F)含有如SEQ ID NO.9所示的氨基酸序列,所述Cas9核酸酶(Cas9-G915F)与野生型Cas9核酸酶相比,对目的基因组DNA片段进行切割时产生的突出断裂末端及钝断裂末端的比例相对于野生型Cas9核酸酶不同。采用所述Cas9核酸酶(Cas9-G915F)对DNA双链进行切割可产生突出断裂末端,通过细胞自身修复系统,以补平连接的方式可加入与突出断裂末端互补的碱基,能够实现对基因组DNA片段的特定位置加入特定碱基的精准编辑。
附图说明
图1A:Cas9在两个sgRNAs介导下对DNA双链进行切割产生四个断裂末端,这些断裂末端在细胞修复系统的作用下产生DNA片段删除、反转和重复。
图1B:针对HS51位点的DNA片段删除、反转和重复情况。
图1C:DNA片段删除接头处存在“G”的加入。
图1D:DNA片段重复接头处存在“T”的加入。
图1E:DNA片段下游反转接头处存在“A”、“G”和“AG”的加入。
图1F:针对这两个特定序列的sgRNAs,Cas9切割方式比例特征。
图2A:Cas9核酸酶结构示意图。
图2B:β-globin RE2位点进行DNA片段编辑的两个sgRNAs的示意图。
图2C:通过检测DNA片段重复接头连接情况统计出各Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行切割时所产生的各种切割末端的占比。
图2D:针对上游sgRNA1,Cas9以及Cas9突变体对目的DNA片段的切割情况。
图2E:通过检测DNA片段删除接头连接情况统计出各Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行切割时所产生的各种切割末端的占比。
图2F:针对下游sgRNA2,Cas9以及Cas9突变体对目的DNA片段的切割情况。
图2G:Cas9以及Cas9突变体在DNA片段反转一侧接头处碱基加入的实际和预测比例。
图3A:在STM位点,针对上游sgRNA1,Cas9以及Cas9突变体对目的DNA片段的切割情况。
图3B:在STM位点,针对下游sgRNA2,Cas9以及Cas9突变体对目的DNA片段的切割情况。
具体实施方式
一、Cas9核酸酶
本发明的Cas9核酸酶(Cas9-G915F),具有Cas9核酸酶活性,适用于CRISPR/Cas9系统,所述Cas9核酸酶(Cas9-G915F)是将野生型Cas9核酸酶第915位的甘氨酸突变成苯丙氨酸获得。所述Cas9核酸酶(Cas9-G915F)与野生型Cas9核酸酶相比,对目的基因组DNA片段进行切割时产生的突出断裂末端与钝断裂末端的比例不同。进一步地,所述野生型Cas9核酸酶为SpCas9。进一步地,所述野生型Cas9核酸酶的氨基酸序列如SEQ ID NO.7所示。
进一步地,所述Cas9核酸酶(Cas9-G915F)含有如SEQ ID NO.9所示的氨基酸序列。本发明的一些实施方式中,例举了所述Cas9-G915F的氨基酸序列如SEQ ID NO.9所示。
二、编码Cas9核酸酶的多核苷酸
编码所述Cas9核酸酶(Cas9-G915F)的多核苷酸,可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。
编码所述Cas9核酸酶(Cas9-G915F)的多核苷酸,可以通过本领域技术人员熟知的任何适当的技术制备。所述技术见于本领域的一般描述,如《分子克隆实验指南》(J.萨姆布鲁克等,科学出版社,1995)。包括但不限于重组DNA技术、化学合成等方法。
本发明的一些实施方式中,例举了编码所述Cas9核酸酶(Cas9-G915F)的多核苷酸如SEQ ID NO.10所示。
三、表达载体
所述表达载体含有编码所述Cas9核酸酶(Cas9-G915F)的多核苷酸。本领域的技术人员熟知的方法能用于构建所述表达载体。这些方法包括重组DNA技术、DNA合成技术等。可将所述Cas9核酸酶(Cas9-G915F)的DNA有效连接到载体中的多克隆位点上,以指导mRNA合成进而表达蛋白。
四、宿主细胞
所述宿主细胞被表达所述Cas9核酸酶(Cas9-G915F)的表达载体所转化。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门菌、李斯特细菌;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS.293细胞、或Bowes黑素瘤细胞的动物细胞等。
五、制备Cas9核酸酶(Cas9-G915F)的方法
制备前述Cas9核酸酶(Cas9-G915F)的方法,包括步骤:构建含有Cas9核酸酶(Cas9-G915F)编码多核苷酸序列的表达载体,然后将所述表达载体转化至宿主细胞中诱导表达,从表达产物中分离获得所述的Cas9核酸酶(Cas9-G915F)。
本领域技术人员可根据Cas9核酸酶(Cas9-G915F)的性质来选择合适的表达载体和宿主细胞。
六、Cas9核酸酶(Cas9-G915F)或其编码多核苷酸或含有所述编码多核苷酸的表达载体的用途
本发明的Cas9核酸酶(Cas9-G915F)或其编码多核苷酸或含有所述编码多核苷酸的表达载体可用于基因组DNA片段编辑或用于制备基因组DNA片段编辑工具。
进一步地,所述编辑包括单位点编辑和多位点编辑。所述多位点编辑的编辑位点数为两个及以上。所述编辑的方式包括突变、删除、反转或倒位、重复、易位或插入。
七、基因组DNA片段编辑工具
本发明的基因组DNA片段编辑工具可以是CRISPR/Cas9系统,所述CRISPR/Cas9系统包括前述Cas9核酸酶(Cas9-G915F)或其编码多核苷酸或含有所述编码多核苷酸的表达载体。进一步地,所述CRISPR/Cas9系统还包括针对目的DNA片段的一个或多个sgRNA。所述sgRNA为针对目的DNA片段所设计,在sgRNA(Single-guide RNA)的介导下,Cas9-G915F能够在PAM(Protospacer adjacent motif)位点上游对DNA双链进行切割,形成DNA双链断裂,通过细胞自身修复系统,完成DNA片段的精准编辑。针对目的基因的sgRNA可以是一个或两个及以上。当sgRNA是一个的时候,可以实现对目的DNA片段的单位点编辑,当sgRNA是两个及以上的时候,可以实现对目的DNA片段的多位点编辑。
八、基因组DNA片段编辑方法
本发明的基因组DNA片段编辑方法,采用前述Cas9核酸酶(Cas9-G915F)以及与之配合的一个或多个sgRNA,利用CRISPR/Cas9系统对待编辑的基因组DNA片段进行编辑。所述编辑包括单位点编辑和多位点编辑。所述多位点编辑的编辑位点数为两个及以上。当sgRNA是一个的时候,可以实现对目的DNA片段的单位点编辑,当sgRNA是两个及以上的时候,可以实现对目的DNA片段的多位点编辑。进一步地,可将前述Cas9核酸酶(Cas9-G915F)编码多核苷酸的表达载体以及与之配合的一个或多个sgRNA一同转入细胞中,对待编辑的基因组DNA片段进行编辑。
九、基因组DNA片段单位点编辑方法
利用CRISPR/Cas9系统,采用本发明的Cas9核酸酶(Cas9-G915F)对DNA双链进行切割产生突出断裂末端,以补平连接的方式加入与突出断裂末端互补的碱基,可实现对基因组DNA片段的单位点编辑。所述基因组DNA片段单位点编辑方法可以改变单位点编辑时碱基突变的特征。
所述补平连接是指:所述突出断裂末端会先通过碱基互补配对加入与突出的末端互补的碱基补平为钝末端之后再连接。
如本发明的一些实施方式中所例举的,Cas9核酸酶G915F在sgRNA1的介导下,对基因组DNA片段(β-globin RE2位点)进行切割时,所产生的突出断裂末端U4,在细胞修复系统的作用下,所述突出断裂末端U4会先通过碱基互补配对加入与突出的末端C互补的碱基G补平为钝末端后再与连接接头连接。
Cas9核酸酶G915F在sgRNA2的介导下,对基因组DNA片段(β-globin RE2位点)进行切割时,所产生的突出断裂末端D4,在细胞修复系统的作用下,所述突出断裂末端D4会先通过碱基互补配对加入与突出的末端A互补的碱基T补平为钝末端后再与连接接头连接。
说明:
在本发明中,Cas9可作为Cas9核酸酶的简称使用,意思与Cas9核酸酶相同。在本发明中,Cas9-G915F、G915F、915F之间可替换使用,意思均为名称为G915F的Cas9核酸酶。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法,通常按照常规条件,或者按照各制造商所建议的条件。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
实施例1 研究DNA片段编辑接头的连接情况发现Cas9切割新机制
针对HS51位点,构建针对HS51位点的sgRNAs质粒:
(1)购买引物
从上海桑尼生物科技有限公司购买分别针对HS51位点和的sgRNAs靶向序列的有5’悬挂端“ACCG”和“AAAC”可以互补配对的正反向脱氧寡核苷酸;
针对上述HS51位点的sgRNAs靶向序列:
HS51 RE1 sgRNA1:GCCACACATCCAAGGCTGAC(SEQ ID NO.1)
HS51 RE1 sgRNA2:GAGATTTGGGGCGTCAGGAAG(SEQ ID NO.2)
(2)获得互补配对的带有悬挂端的双链DNA
1)用ddH2O将脱氧寡核苷酸溶解至100μM,并稀释至20μM;
2)将正反脱氧寡核苷酸加入如下反应体系:
反应条件:95℃水浴,5min,然后打开水浴锅盖子温度降至60℃左右,盖上盖子冷却至室温。
(3)酶切pGL3-U6-sgRNA-PGK-Puro vector
1)用BsaI限制性内切酶酶切载体质粒,反应体系如下:
反应条件:37℃,1.5小时;
2)胶回收纯化DNA酶切片段,按照胶回收试剂盒(Axygen)说明纯化。
(4)连接酶切后的载体与带有悬挂端的双链DNA
连接体系如下:
反应条件:室温反应1.5小时;
(5)转化连接产物
用Stbl3感受态转化连接产物,在含氨苄抗生素(Amp,100mg/L)LB平板培养过夜,37℃。
(6)挑取单克隆测序
1)从氨苄抗生素LB平板上挑取单菌落,LB(Amp,100mg/L)液体培养过夜;
2)质粒提取,按照质粒小抽试剂盒(Axygen)说明提取;
3)提取后的质粒送上海桑尼生物科技有限公司测序。
(7)测序成功质粒进行中抽
1)测序成功的质粒用Stbl3感受态重新转化,在含Amp(100mg/L)的LB平板培养过夜;
2)上午挑取单菌落在2ml LB(Amp,100mg/L)液体培养基中培养8小时,然后转接到200ml LB(Amp,100mg/L)液体培养基中培养过夜;
3)收集细菌,按照质粒中抽试剂盒(Qiagen)说明提取质粒。
2.人源化Cas9质粒制备
1)人源化Cas9质粒从北京大学席建中实验室获得;
2)用Stbl3感受态重新转化,在LB平板(Amp,100mg/L)培养过夜;
3)上午挑取单菌落在2ml LB(Amp,100mg/L)液体培养基中培养8小时,然后转接到200ml LB(Amp,100mg/L)液体培养基中培养过夜,进行质粒中抽。
3.用Lipofectamine 2000进行细胞转染
1)HEK293T细胞培养在培养瓶中,在37℃,含有5%CO2细胞培养箱中培养,待其长至培养瓶80~90%。
2)将长好的细胞在12孔板中用DMEM完全无抗培养基(加入10%胎牛血清,无青链霉素双抗)进行铺板,过夜培养。
3)待12孔板中的细胞长至80~90%时,将制备好的人源化Cas9质粒(800ng)和针对HS51位点的sgRNAs质粒(各600ng)通过Lipofectamine 2000进行细胞转染,每个样品各两个重复。
4)转染后两天,收集细胞,用基因组提取试剂盒(Genomic DNAPurification kit,Promega)提取基因组。
4.制备高通量测序文库
在DNA片段预期删除、反转和重复接头的精准连接位点上游大约30bp处设计引物,然后将引物5’端加上带有barcode的Illumina的测序接头,下游引物可以设计在远离拼接位点一些的位置并加上Illumina的测序接头,进行PCR扩增,然后使用罗氏PCR纯化试剂盒(Product No.:11732676001)进行纯化,DNA产物溶解在10mM Tris-HCL buffer(PH=8.5),等量混合后形成库,进行高通量测序。
高通量引物:
Hiseq-hHs51-aF:
ATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTGCAAGGAGATCCGTGTCGTC(SEQ ID NO.3)
Hiseq-hs51-aRa:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGGATGTTGTGGAAGGCGAGCAG(SEQ ID NO.4)
Hiseq-hs51-bFa:
CAAGCAGAAGACGGCATACGAGATGGACGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTTACATGACAGCTTCCGGTAG(SEQ ID NO.5)
Hiseq-hHs51-bR:
CAAGCAGAAGACGGCATACGAGATTTGACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTTTTTGGCTAACAACATAGTGCTTC(SEQ ID NO.6)。
5.高通量测序数据处理
高通量测序完成后,使用Linux程序将样品的测序结果从文库中通过barcode分出来,保存在各自的文件夹,然后进行BWA-MEM比对,比对后的序列通过Varscan2程序(V2.3.9)分析DNA片段的插入和删除突变,Varscan2程序参数如下:
本发明通过研究DNA片段编辑的末端连接情况发现Cas9切割新机制。
如图1A所示,采用两个sgRNAs形成的sgRNA组合及Cas9核酸酶对基因组DNA片段进行编辑时,Cas9核酸酶在两个sgRNAs介导下对基因组DNA双链进行切割产生四个断裂末端(DSB),这些断裂末端(DSB)在细胞修复系统(例如,MRN/CtIP)的作用下产生DNA片段删除、反转和重复等DNA片段编辑。
如图1B所示,针对基因组DNA片段HS51RE1(HS51位点),我们采用sgRNA1和sgRNA2形成的sgRNA组合及Cas9核酸酶对其进行编辑。而后,我们检测到了DNA片段删除、反转和重复,再利用高通量测序技术检测DNA片段删除、反转和重复连接接头的情况,除了与预期相符的精准连接(Joined precisely)外,DNA片段删除连接接头、反转下游连接接头和重复连接接头处都存在一定比例的碱基加入(Insertion)。
如图1C所示,利用高通量测序技术检测DNA片段删除连接接头的情况,与预期相符的精准连接(Joined precisely)比例占79.23%,删除接头处还存在“G”碱基的加入(Insertion,与预期的精准连接相比),其比例占11.13%。
与预期的精准连接相比,推测DNA片段删除连接接头处加入的“G”碱基是来源于模版DNA(HS51RE1,HS51位点)的PAM上游3bp附近(具体为PAM上游4bp处)的碱基。因此,推测Cas9核酸酶对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割;而Cas9核酸酶对与sgRNA非互补的DNA链进行切割时,可在PAM上游3bp处更远的4bp处进行切割。根据DNA片段删除连接接头处存在“G”碱基的加入(与预期的精准连接相比),推测Cas9核酸酶在sgRNA2介导下对基因组DNA片段进行切割时,有钝末端切割和突出末端切割,进而产生不同断裂末端。当Cas9核酸酶在sgRNA2介导下对基因组DNA片段进行了钝末端切割时,也就是Cas9核酸酶对与sgRNA互补的DNA链及非互补的DNA链进行切割时均是在PAM上游3bp处进行切割,产生了钝断裂末端“E3”。钝断裂末端“E3”在细胞修复系统的作用下产生DNA片段删除时,不会导致DNA片段删除连接接头处“G”碱基的加入,而是产生与预期相符的精准连接(Joined precisely)。当Cas9核酸酶在sgRNA2介导下对基因组DNA片段进行了突出末端切割时,也就是Cas9核酸酶对与sgRNA互补的DNA链进行切割时是在PAM上游3bp处进行切割,而对与sgRNA非互补的DNA链进行切割时是在PAM上游4bp处进行切割,从而产生了5’突出断裂末端“E4”。5’突出断裂末端“E4”在细胞修复系统的作用下产生DNA片段删除时,会导致DNA片段删除连接接头处“G”碱基的加入。
因此,我们认为:在Cas9核酸酶的切割下,产生的断裂末端中,钝断裂末端E3的比例=预期相符的精准连接(Joined precisely)的比例=79.23%。突出断裂末端E4的比例=“G”碱基的加入比例=11.13%。
但是,我们观察到,除了与预期相符的精准连接(Joined precisely)以及DNA片段删除连接接头处存在“G”碱基的加入这两大类情况以外,还有一类随机的碱基删除(Smalldeletion)。我们认为这类随机的碱基删除(Small deletion)是各断裂末端(钝断裂末端E3和突出断裂末端E4)在细胞修复系统的作用下随机产生的,各断裂末端以均等的概率来产生碱基删除(Small deletion),各断裂末端在细胞修复系统的作用下所产生的碱基删除(Small deletion)的数量与各断裂末端的数量成正比。
基于随机碱基删除现象的存在,我们认为,经过测序获得的各断裂末端的实测比例与其真实比例存在差距,需要进行修正还原,即以各种断裂末端的实测比例之和为基准,计算各断裂末端的比例,以此作为该断裂末端的占比。即对Cas9核酸酶的切割所产生的各断裂末端的比例进行标准化计算,钝断裂末端E3的比例为87.7%【计算方法为:79.23%÷(79.23%+11.13%)】。突出断裂末端E4的比例为12.3%【计算方法为:11.13%÷(79.23%+11.13%)】。亦即,Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行的切割方式中,钝末端切割的比例为87.7%,突出末端切割的比例为12.3%。
如图1D所示,利用高通量测序技术检测DNA片段重复连接接头的情况,与预期相符的精准连接(Joined precisely)的比例占8.96%,连接接头处存在“T”碱基的加入(Insertion,与预期的精准连接相比)的比例占82.92%。
与预期的精准连接相比,推测DNA片段重复连接接头处加入的“T”碱基是来源于模版DNA(HS51RE1,HS51位点)上的PAM上游3bp附近(具体为PAM上游4bp处)的碱基。因此,推测Cas9核酸酶对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割;而Cas9核酸酶对与sgRNA非互补的DNA链进行切割时,可在PAM上游3bp处更远的4bp处进行切割。根据DNA片段重复连接接头处检测到存在“T”碱基的加入(与预期的精准连接相比),推测Cas9核酸酶在sgRNA1介导下对基因组DNA片段进行切割时,有钝末端切割和突出末端切割,进而产生不同断裂末端。当Cas9核酸酶在sgRNA1介导下对基因组DNA片段进行了钝末端切割时,也就是Cas9核酸酶对与sgRNA互补的DNA链及非互补的DNA链进行切割时均是在PAM上游3bp处进行切割,产生了钝断裂末端“C3”。钝断裂末端“C3”在细胞修复系统的作用下产生DNA片段重复时,不会导致DNA片段重复连接接头处“T”碱基的加入,而是产生与预期相符的精准连接(Joined precisely)。当Cas9核酸酶在sgRNA1介导下对基因组DNA片段进行了突出末端切割时,也就是Cas9核酸酶对与sgRNA互补的DNA链进行切割时是在PAM上游3bp处进行切割,而对与sgRNA非互补的DNA链进行切割时是在PAM上游4bp处进行切割,从而产生了5’突出断裂末端“C4”。5’突出断裂末端“C4”在细胞修复系统的作用下产生DNA片段重复时,会导致DNA片段重复连接接头处“T”碱基的加入。
因此,我们认为:在Cas9核酸酶的切割下,产生的断裂末端中,钝断裂末端C3的比例=预期相符的精准连接(Joined precisely)的比例=8.96%。突出断裂末端C4的比例=“T”碱基的加入比例=82.92%。
但是,我们观察到,除了与预期相符的精准连接(Joined precisely)以及DNA片段重复连接接头处存在“T”碱基的加入这两大类情况以外,还有一类随机的碱基删除(Smalldeletion)。我们认为这类随机的碱基删除(Small deletion)是各断裂末端(钝断裂末端C3和突出断裂末端C4)在细胞修复系统的作用下随机产生的,各断裂末端以均等的概率来产生碱基删除(Small deletion),各断裂末端在细胞修复系统的作用下所产生的碱基删除(Small deletion)的数量与各断裂末端的数量成正比。
基于随机碱基删除现象的存在,我们认为,经过测序获得的各断裂末端的实测比例与其真实比例存在差距,需要进行修正还原,即以各种断裂末端的实测比例之和为基准,计算各断裂末端的比例,以此作为该断裂末端的占比。即对Cas9核酸酶的切割所产生的各断裂末端的比例进行标准化计算,钝断裂末端C3的比例为9.75%【计算方法为:8.96%÷(8.96%+82.92%)】。突出断裂末端C4的比例为90.25%【计算方法为:82.92%÷(8.96%+82.92%)】。亦即,Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行的切割方式中,钝末端切割的比例为9.75%,突出末端切割的比例为90.25%。
如图1E所示,根据Cas9核酸酶在sgRNA1和sgRNA2的介导下分别对基因组DNA片段进行切割的方式比例,预测产生的断裂末端的序列,进而推算出DNA片段反转下游连接接头处的碱基加入情况及比例。
当Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行突出末端切割,产生突出断裂末端“C4”,Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行钝末端切割,产生钝断裂末端“E3”,则在细胞修复系统的作用下,DNA片段反转下游接头处会出现“A”碱基的加入,且发生的比例为79.14%【计算方法为:“C4”突出断裂末端占比(90.25%)x“E3”钝断裂末端占比(87.7%)=79.14%】,与实验检测到的DNA片段反转下游接头处“A”碱基加入比例71.94%相近。
当Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行钝末端切割,产生钝断裂末端“C3”,Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行突出末端切割,产生突出断裂末端“E4”,则在细胞修复系统的作用下,DNA片段反转下游接头处会出现“G”碱基的加入,且发生的比例为1.19%【计算方法为:“C3”钝断裂末端占比(9.75%)x“E4”突出断裂末端占比(12.3%)=1.19%】,与实验检测到的DNA片段反转下游接头处“G”碱基加入比例8.54%相近。
当Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行突出末端切割,产生突出断裂末端“C4”,Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行突出末端切割,产生突出断裂末端“E4”,则在细胞修复系统的作用下,DNA片段反转下游接头处会出现“AG”碱基的加入,且发生的比例为11%【计算方法为:“C4”突出断裂末端占比(90.25%)x“E4”突出断裂末端占比(12.3%)=11%】,与实验检测到的DNA片段反转下游接头处“AG”碱基加入比例3.66%相近。
当Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行钝末端切割,产生钝断裂末端“C3”,Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行钝末端切割,产生钝断裂末端“E3”,则在细胞修复系统的作用下,DNA片段反转下游接头精准连接,且发生的比例为8.55%【计算方法为:“C3”钝断裂末端占比(9.75%)x“E3”钝断裂末端占比(87.7%)=8.55%】,与实验检测到的DNA片段反转下游接头精准连接比例6.67%相近。
综上所述,图1E的实验结果进一步证实了:Cas9核酸酶对与sgRNA非互补的DNA链进行切割时,可在PAM上游3bp处到更远碱基处进行切割。Cas9核酸酶在sgRNA介导下对基因组DNA片段进行切割时,有钝末端切割和突出末端切割,进而产生不同断裂末端。这些断裂末端在细胞修复系统的作用下,产生与预期相符的精准DNA片段编辑(特定碱基的精准编辑)或者与预期不符的基因编辑(随机的碱基删除)。
如图1F所示,sgRNA组合中,sgRNA的设计不同(靶序列不同),Cas9核酸酶在sgRNA的介导下对基因组DNA片段进行切割方式比例不同,产生的断裂末端比例不同。具体地,Cas9核酸酶在sgRNA1的介导下对基因组DNA片段进行切割时,钝末端切割方式的占比高于突出末端切割方式占比,产生的钝断裂末端占比高于5’突出断裂末端占比。然而Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行切割时,突出末端切割方式的占比高于钝末端切割方式占比,产生的5’突出断裂末端占比也高于钝断裂末端占比。
由于发现Cas9核酸酶在sgRNA介导下对基因组DNA片段进行切割的方式有钝末端切割和突出末端切割,当Cas9核酸酶在sgRNA介导下对基因组DNA片段进行突出末端切割,产生突出断裂末端时,按照补平连接的方式可加入与突出断裂末端互补的碱基,从而实现对基因组DNA片段特定位置的碱基加入。
实施例2 突变SpCas9获得切割方式改变的特定Cas9实现精准的DNA片段编辑
1.构建Cas9突变体
1)使用NEB突变试剂盒(Q5Site-Directed Mutagenesis Kit,#E0554S)构建Cas9突变体,首先进行PCR扩增,反应如下:
2)KLD(Kinase,Ligase&DpnI)处理,反应如下:
反应条件:室温10分钟
3)将2)中的反应产物全部用于感受态细菌Stbl3(50μl)的转化,在含氨苄抗生素(Amp,100mg/L)LB平板培养过夜,37℃。挑取单克隆,质粒提取后送测序。
SpCas9(Cas9WT)的氨基酸序列如SEQ ID NO.7所示,具体为:
SpCas9(Cas9WT)的编码核苷酸序列如SEQ ID NO.8所示,具体为:
如图2A所示,Cas9核酸酶含有RuvC和HNH功能域,RuvC功能域负责切割与sgRNA非互补的DNA链,HNH功能域负责切割与sgRNA互补的DNA链。
本发明要求保护的Cas9核酸酶突变体命名为Cas9-G915F(将SpCas9核酸酶第915位甘氨酸突变成苯丙氨酸),
Cas9-G915F的氨基酸序列SEQ ID NO.9所示,具体为:
Cas9-G915F的编码核苷酸序列如SEQ ID NO.10所示,具体为:
此外,以对SpCas9进行随机突变获得的突变体K775A、R778A、E779A、K918P作为对照,这些对照突变体与本发明的Cas9-G915F的序列均不同。
2.Cas9核酸酶突变体进行DNA片段编辑
(1)针对β-globin RE2(RRM21位点),构建RRM21位点(β-globin RE2)的sgRNAs。所述sgRNAs靶向序列:
β-globin RE2 sgRNA1:ACCCAATGACCTCAGGCTGT(SEQ ID NO.11);
β-globin RE2 sgRNA2:TCACTTGTTAGCGGCATCTG(SEQ ID NO.12);
从上海桑尼生物科技有限公司购买针对β-globin RE2(RRM21位点)的sgRNAs靶向序列的有5’悬挂端“ACCG”和“AAAC”可以互补配对的正反向脱氧寡核苷酸。
(2)获得互补配对的带有悬挂端的双链DNA
1)用ddH2O将脱氧寡核苷酸溶解至100μM,并稀释至20μM;
2)将正反脱氧寡核苷酸加入如下反应体系:
反应条件:95℃水浴,5min,然后打开水浴锅盖子温度降至60℃左右,盖上盖子冷却至室温。
(3)酶切pGL3-U6-sgRNA-PGK-Puro vector
1)用BsaI限制性内切酶酶切载体质粒,反应体系如下:
反应条件:37℃,1.5小时;
2)胶回收纯化DNA酶切片段,按照胶回收试剂盒(Axygen)说明纯化。
(4)连接酶切后的载体与带有悬挂端的双链DNA
连接体系如下:
反应条件:室温反应1.5小时;
(5)转化连接产物
用Stbl3感受态转化连接产物,在含氨苄抗生素(Amp,100mg/L)LB平板培养过夜,37℃。
(6)挑取单克隆测序
1)从氨苄抗生素LB平板上挑取单菌落,LB(Amp,100mg/L)液体培养过夜;
2)质粒提取,按照质粒小抽试剂盒(Axygen)说明提取;
3)提取后的质粒送上海桑尼生物科技有限公司测序。
(7)测序成功质粒进行中抽
1)测序成功的质粒用Stbl3感受态重新转化,在含Amp(100mg/L)的LB平板培养过夜;
2)上午挑取单菌落在2ml LB(Amp,100mg/L)液体培养基中培养8小时,然后转接到200ml LB(Amp,100mg/L)液体培养基中培养过夜;
3)收集细菌,按照质粒中抽试剂盒(Qiagen)说明提取质粒。
(8)用Lipofectamine 2000进行细胞转染
1)HEK293T细胞培养在培养瓶中,在37℃,含有5%CO2细胞培养箱中培养,待其长至培养瓶80~90%,将长好的细胞在12孔板中用DMEM完全无抗培养基进行铺板,过夜培养;
2)待12孔板中的细胞长至80~90%时,将制备好的Cas9和Cas9突变体质粒(800ng)与针对RRM21位点的sgRNAs质粒(各600ng)通过Lipofectamine 2000进行细胞转染,每个样品各两个重复。
3)转染后两天,收集细胞,用基因组提取试剂盒(Genomic DNAPurification kit,Promega)提取基因组。
(9)制备高通量测序文库
在DNA片段预期删除、反转和重复接头的精准连接位点上游大约30bp处设计引物,然后将引物5’端加上带有barcode的Illumina的测序接头,下游引物可以设计在远离拼接位点一些的位置并加上Illumina的测序接头,进行PCR扩增,然后使用罗氏PCR纯化试剂盒(Product No.:11732676001)进行纯化,DNA产物溶解在10mM Tris-HCL buffer(PH=8.5),等量混合后形成库,进行高通量测序。
Cas9突变引物:
Cas9-G915F-F:GGATAAAGCAttcTTCATCAAAAGGCAGC(SEQ ID NO.13);
Cas9-G915F-R:AACTCAGACAGGCCACCT(SEQ ID NO.14);
(10)高通量测序数据处理
高通量测序完成后,使用Linux程序将样品的测序结果从文库中通过barcode分出来,保存在各自的文件夹,然后进行BWA-MEM比对,比对后的序列通过Varscan2程序(V2.3.9)分析DNA片段的插入和删除突变,Varscan2程序参数如下:
针对β-globin RE2位点,利用高通量测序引物进行PCR扩增DNA片段删除、反转和重复,建库进行高通量测序。
高通量引物:
Hiseq-RRM-1F3:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTATATGGCATCCTAGCCTTAAGAAACTAG(SEQ ID NO.15)
Hiseq-RRM-1R2:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTACGACGCAGGAGCCGTATCATG(SEQ ID NO.16)
Hiseq-RRM-3F2:
CAAGCAGAAGACGGCATACGAGATAAGCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATAGCAATGAAATCTTGAAGGAGTG(SEQ ID NO.17)
Hiseq-RRM-3R2:
CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCACAGCCCTGCTCTATTACG(SEQ ID NO.18)。
参照上述实施例1的方法,采用两个sgRNAs形成的sgRNA组合及Cas9核酸酶对基因组DNA片段进行编辑后,可利用高通量测序技术检测DNA片段删除和重复的连接接头碱基加入情况,进而计算出Cas9核酸酶在各sgRNA介导下对基因组DNA片段进行切割时,钝末端切割方式和突出末端切割方式的占比。
具体地,野生型SpCas9核酸酶(简称Cas9WT,WT)(图2A)和G915F在sgRNA组合中各sgRNA介导下对基因组DNA片段β-globin RE2位点进行编辑的两个sgRNAs的示意图如图2B。
如图2C所示,利用高通量测序技术检测DNA片段重复连接接头的情况,除了与预期相符的精准连接(Joined precisely)以外,还存在与预期的精准连接相比,连接接头处加入了“C”碱基和“GC”碱基的情况。选用不同的Cas9核酸酶时,检测到的与预期相符的精准连接(Joined precisely)、“+C”碱基、“+GC”碱基的占比不同。以选用G915F这个Cas9核酸酶为例,检测到与预期相符的精准连接(Joined precisely)的占比为68.76%,“+C”碱基的占比为15.04%,“+GC”碱基的占比为0.20%。
鉴于DNA片段重复连接接头处检测到存在“C”碱基的加入(与预期的精准连接相比),我们推测DNA片段重复连接接头处加入的“C”碱基是来源于模版DNA(β-globin RE2位点)上的PAM(AGG)上游4bp处的碱基。并且,进一步推测G915F这个Cas9核酸酶在sgRNA1的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,而对与sgRNA非互补DNA链进行切割时,则是在PAM(AGG)上游4bp处进行突出末端切割,从而产生了突出断裂末端U4。突出断裂末端U4在细胞修复系统的作用下产生DNA片段重复时,导致了DNA片段重复连接接头处“C”碱基的加入。
同理,鉴于DNA片段重复连接接头处检测到存在“GC”碱基的加入(与预期的精准连接相比),我们推测DNA片段重复连接接头处加入的“GC”碱基是来源于模版DNA(β-globinRE2位点)上的PAM(AGG)上游4bp处和5bp的碱基。进一步推测G915F这个Cas9核酸酶在sgRNA1的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,而对与sgRNA非互补DNA链进行切割时,是在PAM(AGG)上游5bp处进行突出末端切割,从而产生了突出断裂末端U5。突出断裂末端U5在细胞修复系统的作用下产生DNA片段重复时,导致了DNA片段重复连接接头处“GC”碱基的加入。
而当G915F这个Cas9核酸酶在sgRNA1的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,对与sgRNA非互补DNA链进行切割时,是在PAM(AGG)上游3bp处进行钝末端切割,从而产生了钝断裂末端U3。钝断裂末端U3在细胞修复系统的作用下产生DNA片段重复时,不会导致DNA片段重复连接接头处碱基的加入,而是产生与预期相符的精准连接(Joined precisely)。
因此,我们认为:在Cas9核酸酶G915F的切割下,产生的断裂末端中,钝断裂末端U3的占比=预期相符的精准连接(Joined precisely)的比例=68.76%。突出断裂末端U4的比例=“C”碱基的加入比例=15.04%。突出断裂末端U5的比例=“GC”碱基的加入比例=0.20%。
但是,我们观察到,除了与预期相符的精准连接(Joined precisely)、“C”碱基的加入、以及“GC”碱基的加入这三大类情况以外,还有一类随机的碱基删除(Smalldeletion)。我们认为这类随机的碱基删除(Small deletion)是各断裂末端(钝断裂末端U3/突出断裂末端U4/突出断裂末端U5)在细胞修复系统的作用下随机产生的,各断裂末端以均等的概率来产生碱基删除(Small deletion),各断裂末端在细胞修复系统的作用下所产生的碱基删除(Small deletion)的数量与各断裂末端的数量成正比。
基于随机碱基删除现象的存在,我们认为,经过测序获得的各断裂末端的实测比例与其真实比例存在差距,需要进行修正还原,即以各种断裂末端的实测比例之和为基准,计算各断裂末端的比例,以此作为该断裂末端的占比。即对Cas9核酸酶G915F的切割所产生的各断裂末端的占比进行标准化计算,钝断裂末端U3的占比为81.86%【计算方法为:68.76%÷(68.76%+15.04%+0.20%)】。突出断裂末端U4的比例为17.90%【计算方法为:15.04%÷(68.76%+15.04%+0.20%)】。突出断裂末端U5的比例为0.24%【计算方法为:0.20%÷(68.76%+15.04%+0.20%)】。
亦即,Cas9核酸酶G915F在sgRNA1的介导下对基因组DNA片段进行的切割方式中,U3钝末端切割的比例为81.86%,U4突出末端切割的比例为17.90%,U5突出末端切割的比例为0.24%。
参照上述方法,再计算野生型Cas9核酸酶(简称Cas9WT,WT)在sgRNA1的介导下对基因组DNA片段进行的切割方式中,U3钝末端切割的占比X1、U4突出末端切割X2、U5突出末端切割的占比X3。结果,如图2D和下表2-1所示:
表2-1
可见,在sgRNA1的介导下,相比于SpCas9核酸酶(Cas9WT),G915F这个Cas9核酸酶突变体对与sgRNA1非互补的DNA链进行切割时,在PAM上游4bp处进行切割的比例明显提高(U4),在PAM上游3bp处进行切割的比例减少(U3)。
如图2E所示,利用高通量测序技术检测DNA片段删除连接接头的情况,除了与预期相符的精准连接(Joined precisely)以外,还存在与预期的精准连接相比,删除连接接头处加入了“T”碱基、“AT”碱基、“CAT”碱基的情况。选用不同的Cas9核酸酶时,检测到的与预期相符的精准连接(Joined precisely)、“+T”碱基、“+AT”碱基、“+CAT”碱基的占比不同。以选用G915F这个Cas9核酸酶为例,检测到与预期相符的精准连接(Joined precisely)的占比为14.77%,“+T”碱基的占比为17.77%,“+AT”碱基的占比为40.39%,“+CAT”碱基的占比为2.09%。
鉴于DNA片段删除连接接头处检测到存在“T”碱基的加入(与预期的精准连接相比),我们推测DNA片段删除连接接头处加入的“T”碱基是来源于模版DNA(β-globin RE2位点)上的PAM(TGG)上游4bp处的碱基。并且,进一步推测G915F这个Cas9核酸酶在sgRNA2的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,而对与sgRNA非互补DNA链进行切割时,则是在PAM(TGG)上游4bp处进行突出末端切割,从而产生了突出断裂末端D4。突出断裂末端D4在细胞修复系统的作用下产生DNA片段删除时,导致了DNA片段删除连接接头处“T”碱基的加入。
同理,鉴于DNA片段删除连接接头处检测到存在“AT”碱基的加入(与预期的精准连接相比),我们推测DNA片段删除连接接头处加入的“AT”碱基是来源于模版DNA(β-globinRE2位点)上的PAM(TGG)上游4bp和5bp处的碱基。进一步推测G915F这个Cas9核酸酶在sgRNA2的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,而对与sgRNA非互补DNA链进行切割时,是在PAM(TGG)上游5bp处进行突出末端切割,从而产生了突出断裂末端D5。突出断裂末端D5在细胞修复系统的作用下产生DNA片段删除时,导致了DNA片段删除连接接头处“AT”碱基的加入。
同理,鉴于DNA片段删除连接接头处检测到存在“CAT”碱基的加入(与预期的精准连接相比),我们推测DNA片段删除连接接头处加入的“CAT”碱基是来源于模版DNA(β-globin RE2位点)上的PAM(TGG)上游4bp、5bp、6bp处的碱基。进一步推测G915F这个Cas9核酸酶在sgRNA2的向导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,而对与sgRNA非互补DNA链进行切割时,是在PAM(TGG)上游6bp处进行突出末端切割,从而产生了突出断裂末端D6。突出断裂末端D5在细胞修复系统的作用下产生DNA片段删除时,导致了DNA片段删除连接接头处“CAT”碱基的加入。
而当G915F这个Cas9核酸酶在sgRNA2的介导下对基因组DNA片段(β-globin RE2位点)进行切割时,对与sgRNA互补的DNA链进行切割时,是在PAM上游3bp处进行切割,对与sgRNA非互补DNA链进行切割时,是在PAM(TGG)上游3bp处进行钝末端切割,从而产生了钝断裂末端D3。钝断裂末端D3在细胞修复系统的作用下产生DNA片段删除时,不会导致DNA片段删除连接接头处碱基的加入,而是产生与预期相符的精准连接(Joined precisely)。
因此,我们认为:在Cas9核酸酶G915F的切割下,产生的断裂末端中,钝断裂末端D3的占比=预期相符的精准连接(Joined precisely)的占比=14.77%。突出断裂末端D4的占比=“T”碱基的加入占比=17.77%。突出断裂末端D5的占比=“AT”碱基的加入占比=40.39%。突出断裂末端D6的占比=“CAT”碱基的加入占比=2.09%。
但是,我们观察到,除了与预期相符的精准连接(Joined precisely)、DNA片段删除连接接头处加入了“T”碱基、“+AT”碱基、“+CAT”碱基这四大类情况以外,还有一类随机的碱基删除(Small deletion)。我们认为这类随机的碱基删除(Small deletion)是各断裂末端(钝断裂末端D3/突出断裂末端D4/突出断裂末端D5/突出断裂末端D6)在细胞修复系统的作用下随机产生的,各断裂末端以均等的概率来产生碱基删除(Small deletion),各断裂末端在细胞修复系统的作用下所产生的碱基删除(Small deletion)的数量与各断裂末端的数量成正比。
基于随机碱基删除现象的存在,我们认为,经过测序获得的各断裂末端的实测比例与其真实比例存在差距,需要进行修正还原,即以各种断裂末端的实测比例之和为基准,计算各断裂末端的比例,以此作为该断裂末端的占比。即对Cas9核酸酶G915F的切割所产生的各断裂末端的占比进行标准化计算,钝断裂末端D3的占比为19.68%
【计算方法为:14.77%÷(14.77%+17.77%+40.39%+2.09%)】。
突出断裂末端D4的比例为23.69%
【计算方法为:17.77%÷(14.77%+17.77%+40.39%+2.09%)】。
突出断裂末端D5的比例为53.83%
【计算方法为:40.39%÷(14.77%+17.77%+40.39%+2.09%)】。
突出断裂末端D6的比例为2.79%
【计算方法为:2.09%÷(14.77%+17.77%+40.39%+2.09%)】。
亦即,Cas9核酸酶G915F在sgRNA2的介导下对基因组DNA片段进行的切割方式中,D3钝末端切割的占比为19.68%,D4突出末端切割的占比为23.69%,D5突出末端切割的占比为53.83%,D6突出末端切割的占比为2.79%。
参照上述方法,计算出野生型Cas9核酸酶在sgRNA2的介导下对基因组DNA片段进行的切割方式中,D3钝末端切割的占比Y1、D4突出末端切割的占比Y2、D5突出末端切割的占比Y3、D6突出末端切割的占比Y4。结果如图2F和表2-2所示:
表2-2
可见,在sgRNA2的介导下,相比于SpCas9核酸酶(Cas9WT),G915F突变体对基因组DNA片段中与sgRNA2非互补的DNA链进行切割时,在PAM上游5bp处进行切割的比例明显提高。
参照实施例1的方法,根据Cas9核酸酶在sgRNA1和sgRNA2的介导下分别对基因组DNA片段进行切割的方式比例,预测产生的断裂末端的序列,进而推算出DNA片段反转下游连接接头处的碱基加入情况及比例。结果如图2G所示,推算结果与实验检测到的碱基加入比例相近。更进一步证实了Cas9核酸酶在sgRNA组合的介导下,可以在PAM上游3bp处到更远碱基处切割非互补DNA链。
此外,还将本发明的Cas9核酸酶突变体Cas9-G915F及对照突变体K775A、R778A、E779A、K918P与针对STM位点(β-globin RE1)的两个sgRNAs一起转染人胚肾HEK293T细胞,转染48小时后收集基因组DNA,利用高通量测序引物进行PCR扩增DNA片段删除、反转和重复,建库进行高通量测序。根据DNA片段删除和重复的连接接头碱基加入情况,计算这些突变体在两个sgRNAs的向导下对基因组DNA片段进行切割的切割方式比例。
针对STM位点(β-globin RE1)的sgRNAs靶向序列:
β-globin RE1sgRNA1:GATTGTTGTTGCCTTGGAGTG(SEQ ID NO.19);
β-globin RE1sgRNA2:GCTGGTCCCCTGGTAACCTGG(SEQ ID NO.20);
正反向脱氧寡核苷酸:
β-globin RE1sgRNA1F:accgATTGTTGTTGCCTTGGAGTG(SEQ ID NO.21);
β-globin RE1sgRNA1R:aaacCACTCCAAGGCAACAACAAT(SEQ ID NO.22);
β-globin RE1sgRNA2F:accgCTGGTCCCCTGGTAACCTGG(SEQ ID NO.23);
β-globin RE1sgRNA2R:aaacCCAGGTTACCAGGGGACCAG(SEQ ID NO.24);
高通量引物:
Hiseq-hSTM-aF1:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTGCTTAGAGCCAGGACTAATTGC(SEQ ID NO.25);
Hiseq-hSTM-aR2:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGGTGTAGAAATGAGCAAATAAGT(SEQ ID NO.26);
Hiseq-hSTM-2F:
CAAGCAGAAGACGGCATACGAGATGATCGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGATTGAGTTCTGTTTGTTTCATCTAC(SEQ ID NO.27);
Hiseq-hSTM-2R:
CAAGCAGAAGACGGCATACGAGATAGTCAAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCTCTGCCTGAAAGGAGTC(SEQ ID NO.28)。
如图3A和3B所示,与野生型SpCas9核酸酶(简称Cas9WT)相比,对照突变体K775A、R778A、E779A和K918P在sgRNA1和sgRNA2的介导下对基因组DNA片段进行切割的方式没有明显的改变;而Cas9核酸酶突变体Cas9-G915F与野生型SpCas9核酸酶(简称Cas9WT)相比,在sgRNA1和sgRNA2的介导下对基因组DNA片段进行切割的方式发生了明显的改变。
综上所述,本发明的Cas9核酸酶(Cas9-G915F)与野生型Cas9核酸酶相比,对目的基因组DNA片段进行切割时产生的突出断裂末端与钝断裂末端的比例不同。采用本发明的Cas9核酸酶(Cas9-G915F)可以实现对对目的基因组DNA片段特定位置的切割并产生突出断裂末端,以补平连接的方式可加入与突出断裂末端互补的碱基,进而可实现特定位置的精准DNA片段编辑。
本申请的参考文献如下:
1.Stamatoyannopoulos,JA.(2012).What does our genome encode?GenomeRes,22:1602-1611.
2.The ENCODE Project Consortium.(2012).An integrated encyclopedia ofDNA elements in the human genome.Nature,489:57-74.
3.Banerji,J,L Olson,and W Schaffner.(1983).A lymphocyte-specificcellular enhancer is located downstream of the joining region inimmunoglobulin heavy chain genes.Cell,33:729-740.
4.Zhang,T,P Haws,and Q Wu.(2004).Multiple variable first exons:amechanism for cell-and tissue-specific gene regulation.Genome Res,14:79-89.
5.Neph,S,et al.(2012).An expansive human regulatory lexicon encodedin transcription factor footprints.Nature,489:83-90.
6.Shen,Y,et al.(2012).A map of the cis-regulatory sequences in themouse genome.Nature,488:116-120.
7.Thurman,RE,et al.(2012).The accessible chromatin landscape of thehuman genome.Nature,489:75-82.
8.de Laat,W and D Duboule.(2013).Topology of mammalian developmentalenhancers and their regulatory landscapes.Nature,502:499-506.
9.McClintock,B.(1950).The origin and behavior of mutable loci inmaize.Proc Natl Acad Sci U S A,36:344-355.
10.McClintock,B.(1984).The significance of responses of the genome tochallenge.Science,226:792-801.
11.Brinster,RL,et al.(1981).Somatic expression of herpes thymidinekinase in mice following injection of a fusion gene into eggs.Cell,27:223-231.
12.Harbers,K,D Jahner,and R Jaenisch.(1981).Microinjection of clonedretroviral genomes into mouse zygotes:integration and expression in theanimal.Nature,293:540-542.
13.Gordon,JW,et al.(1980).Genetic transformation of mouse embryos bymicroinjection of purified DNA.Proc Natl Acad Sci U S A,77:7380-7384.
14.Palmiter,RD,et al.(1982).Dramatic growth of mice that develop fromeggs microinjected with metallothionein-growth hormone fusion genes.Nature,300:611-615.
15.Capecchi,MR.(2005).Gene targeting in mice:functional analysis ofthe mammalian genome for the twenty-first century.Nat Rev Genet,6:507-512.
16.Carroll,D.(2014).Genome engineering with targetable nucleases.AnnuRev Biochem,83:409-439.
17.Smithies,O,et al.(1985).Insertion of DNA sequences into the humanchromosomal beta-globin locus by homologous recombination.Nature,317:230-234.
18.Thomas,KR and MR Capecchi.(1986).Introduction of homologous DNAsequences into mammalian cells induces mutations in the cognate gene.Nature,324:34-38.
19.Zheng,B,et al.(2000).Engineering mouse chromosomes with Cre-loxP:range,efficiency,and somatic applications.Mol Cell Biol,20:648-655.
20.Wu,S,et al.(2007).Toward simpler and faster genome-widemutagenesis in mice.Nat Genet,39:922-930.
21.Gupta,A,et al.(2013).Targeted chromosomal deletions and inversionsin zebrafish.Genome Res,23:1008-1017.
22.Xiao,A,et al.(2013).Chromosomal deletions and inversions mediatedby TALENs and CRISPR/Cas in zebrafish.Nucleic Acids Res,41:e141.
23.Kraft,K,et al.(2015).Deletions,Inversions,Duplications:Engineeringof Structural Variants using CRISPR/Cas in Mice.Cell Rep,10:833-839.
24.Wu,S,et al.(2008).A protocol for constructing gene targetingvectors:generating knockout mice for the cadherin family and beyond.NatureProtocol,3:1056-1076.
25.Jinek,M,et al.(2012).A programmable dual-RNA-guided DNAendonuclease in adaptive bacterial immunity.Science,337:816-821.
26.Cong,L,et al.(2013).Multiplex genome engineering using CRISPR/Cassystems.Science,339:819-823.
27.Mali,P,et al.(2013).RNA-guided human genome engineering viaCas9.Science,339:823-826.
28.Li,J,et al.(2015).Efficient inversions and duplications ofmammalian regulatory DNA elements and gene clusters by CRISPR/Cas9.J Mol CellBiol,7:284-298.
29.Sartori,AA,et al.(2007).Human CtIP promotes DNA endresection.Nature,450:509-514.
30.Anand,R,et al.(2016).Phosphorylated CtIP Functions as a Co-factorof the MRE11-RAD50-NBS1 Endonuclease in DNA End Resection.Mol Cell,64:940-950.
31.Li,J,J Shou,and Q Wu.(2015).DNA fragment editing of genomes byCRISPR/Cas9.Hereditas,37:992-1002.
32.Huang,H and Q Wu.(2016).CRISPR Double Cutting through theLabyrinthine Architecture of 3D Genomes.J Genet Genomics,43:273-288.
33.Guo,Y,et al.(2015).CRISPR Inversion of CTCF Sites Alters GenomeTopology and Enhancer/Promoter Function.Cell,162:900-910.
以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
SEQUENCE LISTING
<110> 上海交通大学
<120> 一种Cas9核酸酶G915F及其用途
<130> 171284
<160> 28
<170> PatentIn version 3.3
<210> 1
<211> 20
<212> DNA
<213> Artificial
<220>
<223> HS51 RE1sgRNA1
<400> 1
gccacacatc caaggctgac 20
<210> 2
<211> 21
<212> DNA
<213> Artificial
<220>
<223> HS51 RE1sgRNA2
<400> 2
gagatttggg gcgtcaggaa g 21
<210> 3
<211> 77
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hHs51-aF
<400> 3
atgatacggc gaccaccgag atctacactc tttccctaca cgacgctctt ccgatctgca 60
aggagatccg tgtcgtc 77
<210> 4
<211> 82
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hs51-aRa
<400> 4
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctaa 60
ggatgttgtg gaaggcgagc ag 82
<210> 5
<211> 87
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hs51-bFa
<400> 5
caagcagaag acggcatacg agatggacgg gtgactggag ttcagacgtg tgctcttccg 60
atctctttac atgacagctt ccggtag 87
<210> 6
<211> 89
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hHs51-bR
<400> 6
caagcagaag acggcatacg agatttgact gtgactggag ttcagacgtg tgctcttccg 60
atcttttttg gctaacaaca tagtgcttc 89
<210> 7
<211> 1401
<212> PRT
<213> Artificial
<220>
<223> SpCas9
<400> 7
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser
20 25 30
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
35 40 45
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
50 55 60
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
65 70 75 80
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
85 90 95
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
100 105 110
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
115 120 125
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
130 135 140
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
145 150 155 160
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
165 170 175
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
180 185 190
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
195 200 205
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
210 215 220
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
225 230 235 240
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
245 250 255
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
260 265 270
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
275 280 285
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
290 295 300
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
305 310 315 320
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
325 330 335
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
340 345 350
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
355 360 365
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
370 375 380
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
385 390 395 400
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
405 410 415
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
420 425 430
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
435 440 445
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
450 455 460
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
465 470 475 480
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
485 490 495
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
500 505 510
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
515 520 525
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
530 535 540
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
545 550 555 560
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
565 570 575
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
580 585 590
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
595 600 605
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
610 615 620
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
625 630 635 640
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
645 650 655
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
660 665 670
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg
675 680 685
Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
690 695 700
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
705 710 715 720
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser
725 730 735
Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
740 745 750
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met
755 760 765
Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
770 775 780
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
785 790 795 800
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
805 810 815
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
820 825 830
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn
835 840 845
Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu
850 855 860
Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
865 870 875 880
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met
885 890 895
Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
900 905 910
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu
915 920 925
Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
930 935 940
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
945 950 955 960
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
965 970 975
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
980 985 990
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
995 1000 1005
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1010 1015 1020
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1025 1030 1035
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1040 1045 1050
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1055 1060 1065
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1070 1075 1080
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1085 1090 1095
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1100 1105 1110
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1115 1120 1125
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1130 1135 1140
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1145 1150 1155
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1160 1165 1170
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1175 1180 1185
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1190 1195 1200
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1205 1210 1215
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1220 1225 1230
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1235 1240 1245
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1250 1255 1260
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1265 1270 1275
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1280 1285 1290
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1295 1300 1305
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1310 1315 1320
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1325 1330 1335
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1340 1345 1350
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1355 1360 1365
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1370 1375 1380
Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1385 1390 1395
Lys Lys Lys
1400
<210> 8
<211> 4206
<212> DNA
<213> Artificial
<220>
<223> SpCas9
<400> 8
atggccccaa agaagaagcg gaaggtcggt atccacggtg tcccagcagc catggacaag 60
aagtactcca ttgggctcga tatcggcaca aacagcgtcg gctgggccgt cattacggac 120
gagtacaagg tgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata 180
aagaagaacc tcattggcgc cctcctgttc gactccgggg agacggccga agccacgcgg 240
ctcaaaagaa cagcacggcg cagatatacc cgcagaaaga atcggatctg ctacctgcag 300
gagatcttta gtaatgagat ggctaaggtg gatgactctt tcttccatag gctggaggag 360
tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttgg caatatcgtg 420
gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgta 480
gacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa 540
tttcggggac acttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa 600
ctctttatcc aactggttca gacttacaat cagcttttcg aagagaaccc gatcaacgca 660
tccggagttg acgccaaagc aatcctgagc gctaggctgt ccaaatcccg gcggctcgaa 720
aacctcatcg cacagctccc tggggagaag aagaacggcc tgtttggtaa tcttatcgcc 780
ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccga agatgccaag 840
cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggc 900
gaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt 960
gatattctgc gagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag 1020
cgctatgatg agcaccacca agacttgact ttgctgaagg cccttgtcag acagcaactg 1080
cctgagaagt acaaggaaat tttcttcgat cagtctaaaa atggctacgc cggatacatt 1140
gacggcggag caagccagga ggaattttac aaatttatta agcccatctt ggaaaaaatg 1200
gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcg caaacagcgc 1260
actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatactc 1320
aggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc 1380
ctcacatttc ggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg 1440
tggatgactc gcaaatcaga agagaccatc actccctgga acttcgagga agtcgtggat 1500
aagggggcct ctgcccagtc cttcatcgaa aggatgacta actttgataa aaatctgcct 1560
aacgaaaagg tgcttcctaa acactctctg ctgtacgagt acttcacagt ttataacgag 1620
ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcct gtctggagag 1680
cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacag 1740
ctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg 1800
gaggatcgct tcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac 1860
aaggacttcc tggacaatga ggagaacgag gacattcttg aggacattgt cctcaccctt 1920
acgttgtttg aagataggga gatgattgaa gaacgcttga aaacttacgc tcatctcttc 1980
gacgacaaag tcatgaaaca gctcaagagg cgccgatata caggatgggg gcggctgtca 2040
agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcct ggattttctt 2100
aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacc 2160
tttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac 2220
atcgctaatc ttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc 2280
gtggatgaac tcgtcaaagt aatgggaagg cataagcccg agaatatcgt tatcgagatg 2340
gcccgagaga accaaactac ccagaaggga cagaagaaca gtagggaaag gatgaagagg 2400
attgaagagg gtataaaaga actggggtcc caaatcctta aggaacaccc agttgaaaac 2460
acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcag ggacatgtac 2520
gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccc 2580
cagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat 2640
agagggaaga gtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg 2700
cggcagctgc tgaacgccaa actgatcaca caacggaagt tcgataatct gactaaggct 2760
gaacgaggtg gcctgtctga gttggataaa gcaggcttca tcaaaaggca gcttgttgag 2820
acacgccaga tcaccaagca cgtggcccaa attctcgatt cacgcatgaa caccaagtac 2880
gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtc taagctggtc 2940
tcagatttca gaaaggactt tcagttttat aaggtgagag agatcaacaa ttaccaccat 3000
gcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag 3060
cttgaatctg aatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca 3120
aagtctgagc aggaaatagg caaggccacc gctaagtact tcttttacag caatattatg 3180
aattttttca agaccgagat tacactggcc aatggagaga ttcggaagcg accacttatc 3240
gaaacaaacg gagaaacagg agaaatcgtg tgggacaagg gtagggattt cgcgacagtc 3300
cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagt acagaccgga 3360
ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaa 3420
aaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta 3480
ctggttgtgg ccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg 3540
ctgggcatca caatcatgga gcgatcaagc ttcgaaaaaa accccatcga ctttctcgag 3600
gcgaaaggat ataaagaggt caaaaaagac ctcatcatta agcttcccaa gtactctctc 3660
tttgagcttg aaaacggccg gaaacgaatg ctcgctagtg cgggcgagct gcagaaaggt 3720
aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccag ccactatgaa 3780
aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaa 3840
cactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc 3900
gacgctaacc tcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg 3960
gagcaggcag aaaacattat ccacttgttt actctgacca acttgggcgc gcctgcagcc 4020
ttcaagtact tcgacaccac catagacaga aagcggtaca cctctacaaa ggaggtcctg 4080
gacgccacac tgattcatca gtcaattacg gggctctatg aaacaagaat cgacctctct 4140
cagctcggtg gagacaagcg tcctgctgct actaagaaag ctggtcaagc taagaaaaag 4200
aaataa 4206
<210> 9
<211> 1401
<212> PRT
<213> Artificial
<220>
<223> Cas9-G915F
<400> 9
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser
20 25 30
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
35 40 45
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
50 55 60
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
65 70 75 80
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
85 90 95
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
100 105 110
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
115 120 125
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
130 135 140
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
145 150 155 160
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
165 170 175
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
180 185 190
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
195 200 205
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
210 215 220
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
225 230 235 240
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
245 250 255
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
260 265 270
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
275 280 285
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
290 295 300
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
305 310 315 320
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
325 330 335
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
340 345 350
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
355 360 365
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
370 375 380
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
385 390 395 400
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
405 410 415
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
420 425 430
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
435 440 445
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
450 455 460
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
465 470 475 480
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
485 490 495
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
500 505 510
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
515 520 525
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
530 535 540
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
545 550 555 560
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
565 570 575
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
580 585 590
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
595 600 605
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
610 615 620
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
625 630 635 640
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
645 650 655
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
660 665 670
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg
675 680 685
Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
690 695 700
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
705 710 715 720
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser
725 730 735
Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys
740 745 750
Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met
755 760 765
Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
770 775 780
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
785 790 795 800
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
805 810 815
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
820 825 830
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn
835 840 845
Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu
850 855 860
Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
865 870 875 880
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met
885 890 895
Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
900 905 910
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu
915 920 925
Asp Lys Ala Phe Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
930 935 940
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
945 950 955 960
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
965 970 975
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
980 985 990
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
995 1000 1005
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1010 1015 1020
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1025 1030 1035
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1040 1045 1050
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1055 1060 1065
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1070 1075 1080
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1085 1090 1095
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1100 1105 1110
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1115 1120 1125
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1130 1135 1140
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1145 1150 1155
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1160 1165 1170
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1175 1180 1185
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1190 1195 1200
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1205 1210 1215
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1220 1225 1230
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1235 1240 1245
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1250 1255 1260
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1265 1270 1275
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1280 1285 1290
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1295 1300 1305
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1310 1315 1320
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1325 1330 1335
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1340 1345 1350
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1355 1360 1365
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1370 1375 1380
Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1385 1390 1395
Lys Lys Lys
1400
<210> 10
<211> 4206
<212> DNA
<213> Artificial
<220>
<223> Cas9-G915F
<400> 10
atggccccaa agaagaagcg gaaggtcggt atccacggtg tcccagcagc catggacaag 60
aagtactcca ttgggctcga tatcggcaca aacagcgtcg gctgggccgt cattacggac 120
gagtacaagg tgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata 180
aagaagaacc tcattggcgc cctcctgttc gactccgggg agacggccga agccacgcgg 240
ctcaaaagaa cagcacggcg cagatatacc cgcagaaaga atcggatctg ctacctgcag 300
gagatcttta gtaatgagat ggctaaggtg gatgactctt tcttccatag gctggaggag 360
tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttgg caatatcgtg 420
gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgta 480
gacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa 540
tttcggggac acttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa 600
ctctttatcc aactggttca gacttacaat cagcttttcg aagagaaccc gatcaacgca 660
tccggagttg acgccaaagc aatcctgagc gctaggctgt ccaaatcccg gcggctcgaa 720
aacctcatcg cacagctccc tggggagaag aagaacggcc tgtttggtaa tcttatcgcc 780
ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccga agatgccaag 840
cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggc 900
gaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt 960
gatattctgc gagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag 1020
cgctatgatg agcaccacca agacttgact ttgctgaagg cccttgtcag acagcaactg 1080
cctgagaagt acaaggaaat tttcttcgat cagtctaaaa atggctacgc cggatacatt 1140
gacggcggag caagccagga ggaattttac aaatttatta agcccatctt ggaaaaaatg 1200
gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcg caaacagcgc 1260
actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatactc 1320
aggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc 1380
ctcacatttc ggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg 1440
tggatgactc gcaaatcaga agagaccatc actccctgga acttcgagga agtcgtggat 1500
aagggggcct ctgcccagtc cttcatcgaa aggatgacta actttgataa aaatctgcct 1560
aacgaaaagg tgcttcctaa acactctctg ctgtacgagt acttcacagt ttataacgag 1620
ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcct gtctggagag 1680
cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacag 1740
ctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg 1800
gaggatcgct tcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac 1860
aaggacttcc tggacaatga ggagaacgag gacattcttg aggacattgt cctcaccctt 1920
acgttgtttg aagataggga gatgattgaa gaacgcttga aaacttacgc tcatctcttc 1980
gacgacaaag tcatgaaaca gctcaagagg cgccgatata caggatgggg gcggctgtca 2040
agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcct ggattttctt 2100
aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacc 2160
tttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac 2220
atcgctaatc ttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc 2280
gtggatgaac tcgtcaaagt aatgggaagg cataagcccg agaatatcgt tatcgagatg 2340
gcccgagaga accaaactac ccagaaggga cagaagaaca gtagggaaag gatgaagagg 2400
attgaagagg gtataaaaga actggggtcc caaatcctta aggaacaccc agttgaaaac 2460
acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcag ggacatgtac 2520
gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccc 2580
cagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat 2640
agagggaaga gtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg 2700
cggcagctgc tgaacgccaa actgatcaca caacggaagt tcgataatct gactaaggct 2760
gaacgaggtg gcctgtctga gttggataaa gcattcttca tcaaaaggca gcttgttgag 2820
acacgccaga tcaccaagca cgtggcccaa attctcgatt cacgcatgaa caccaagtac 2880
gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtc taagctggtc 2940
tcagatttca gaaaggactt tcagttttat aaggtgagag agatcaacaa ttaccaccat 3000
gcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag 3060
cttgaatctg aatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca 3120
aagtctgagc aggaaatagg caaggccacc gctaagtact tcttttacag caatattatg 3180
aattttttca agaccgagat tacactggcc aatggagaga ttcggaagcg accacttatc 3240
gaaacaaacg gagaaacagg agaaatcgtg tgggacaagg gtagggattt cgcgacagtc 3300
cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagt acagaccgga 3360
ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaa 3420
aaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta 3480
ctggttgtgg ccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg 3540
ctgggcatca caatcatgga gcgatcaagc ttcgaaaaaa accccatcga ctttctcgag 3600
gcgaaaggat ataaagaggt caaaaaagac ctcatcatta agcttcccaa gtactctctc 3660
tttgagcttg aaaacggccg gaaacgaatg ctcgctagtg cgggcgagct gcagaaaggt 3720
aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccag ccactatgaa 3780
aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaa 3840
cactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc 3900
gacgctaacc tcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg 3960
gagcaggcag aaaacattat ccacttgttt actctgacca acttgggcgc gcctgcagcc 4020
ttcaagtact tcgacaccac catagacaga aagcggtaca cctctacaaa ggaggtcctg 4080
gacgccacac tgattcatca gtcaattacg gggctctatg aaacaagaat cgacctctct 4140
cagctcggtg gagacaagcg tcctgctgct actaagaaag ctggtcaagc taagaaaaag 4200
aaataa 4206
<210> 11
<211> 20
<212> DNA
<213> Artificial
<220>
<223> β-globin RE2sgRNA1
<400> 11
acccaatgac ctcaggctgt 20
<210> 12
<211> 20
<212> DNA
<213> Artificial
<220>
<223> β-globin RE2sgRNA2
<400> 12
tcacttgtta gcggcatctg 20
<210> 13
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Cas9-G915F-F
<400> 13
ggataaagca ttcttcatca aaaggcagc 29
<210> 14
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Cas9-G915F-R
<400> 14
aactcagaca ggccacct 18
<210> 15
<211> 86
<212> DNA
<213> Artificial
<220>
<223> Hiseq-RRM-1F3
<400> 15
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctat 60
atggcatcct agccttaaga aactag 86
<210> 16
<211> 81
<212> DNA
<213> Artificial
<220>
<223> Hiseq-RRM-1R2
<400> 16
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctta 60
cgacgcagga gccgtatcat g 81
<210> 17
<211> 89
<212> DNA
<213> Artificial
<220>
<223> Hiseq-RRM-3F2
<400> 17
caagcagaag acggcatacg agataagcta gtgactggag ttcagacgtg tgctcttccg 60
atctatagca atgaaatctt gaaggagtg 89
<210> 18
<211> 85
<212> DNA
<213> Artificial
<220>
<223> Hiseq-RRM-3R2
<400> 18
caagcagaag acggcatacg agattcaagt gtgactggag ttcagacgtg tgctcttccg 60
atctgcacag ccctgctcta ttacg 85
<210> 19
<211> 21
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA1
<400> 19
gattgttgtt gccttggagt g 21
<210> 20
<211> 21
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA2
<400> 20
gctggtcccc tggtaacctg g 21
<210> 21
<211> 24
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA1F
<400> 21
accgattgtt gttgccttgg agtg 24
<210> 22
<211> 24
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA1R
<400> 22
aaaccactcc aaggcaacaa caat 24
<210> 23
<211> 24
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA2F
<400> 23
accgctggtc ccctggtaac ctgg 24
<210> 24
<211> 24
<212> DNA
<213> Artificial
<220>
<223> β-globin RE1sgRNA2R
<400> 24
aaacccaggt taccagggga ccag 24
<210> 25
<211> 81
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hSTM-aF1
<400> 25
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatcttg 60
cttagagcca ggactaattg c 81
<210> 26
<211> 83
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hSTM-aR2
<400> 26
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatcttg 60
ggtgtagaaa tgagcaaata agt 83
<210> 27
<211> 91
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hSTM-2F
<400> 27
caagcagaag acggcatacg agatgatcgt gtgactggag ttcagacgtg tgctcttccg 60
atctagattg agttctgttt gtttcatcta c 91
<210> 28
<211> 85
<212> DNA
<213> Artificial
<220>
<223> Hiseq-hSTM-2R
<400> 28
caagcagaag acggcatacg agatagtcaa gtgactggag ttcagacgtg tgctcttccg 60
atctcagctc tgcctgaaag gagtc 85

Claims (20)

1.一种Cas9核酸酶,具有Cas9核酸酶活性,适用于CRISPR/Cas9系统,所述Cas9核酸酶是将野生型Cas9核酸酶第915位的甘氨酸突变成苯丙氨酸获得。
2.根据权利要求1所述的Cas9核酸酶,其特征在于,所述Cas9核酸酶与野生型Cas9核酸酶相比,对目的基因组DNA片段进行切割时产生的突出断裂末端与钝断裂末端的比例不同。
3.根据权利要求1所述的Cas9核酸酶,其特征在于,所述野生型Cas9核酸酶为SpCas9。
4.根据权利要求3所述的Cas9核酸酶,其特征在于,所述野生型Cas9核酸酶的氨基酸序列如SEQ ID NO.7所示。
5.根据权利要求1所述的Cas9核酸酶,其特征在于,所述Cas9核酸酶含有如SEQ IDNO.9所示的氨基酸序列。
6.一种多核苷酸,其编码如权利要求1~5任一项所述的Cas9核酸酶。
7.一种表达载体,其含有如权利要求6所述的多核苷酸。
8.一种宿主细胞,其被如权利要求7所述的表达载体所转化。
9.一种制备如权利要求1~5任一项所述的Cas9核酸酶的方法,包括步骤:构建含有如权利要求1~5任一项所述Cas9核酸酶编码多核苷酸序列的表达载体,然后将所述表达载体转化至宿主细胞中诱导表达,从表达产物中分离获得所述的Cas9核酸酶。
10.如权利要求1~5任一项所述的Cas9核酸酶、或如权利要求6所述的多核苷酸或如权利要求7所述的表达载体用于基因组DNA片段编辑或用于制备基因组DNA片段编辑工具的用途。
11.根据权利要求10所述的用途,其特征在于,所述编辑包括单位点编辑和多位点编辑,所述多位点编辑的编辑位点数为两个及以上。
12.根据权利要求10所述的用途,其特征在于,所述编辑的方式包括突变、删除、反转或倒位、重复、易位或插入。
13.一种DNA基因组片段编辑工具,为CRISPR/Cas9系统,所述CRISPR/Cas9系统包括如权利要求1~5任一项所述的Cas9核酸酶、或如权利要求6所述的多核苷酸或如权利要求7所述的表达载体。
14.根据权利要求13所述的一种DNA片段编辑工具,其特征在于,所述CRISPR/Cas9系统还包括针对目的DNA片段的一个或多个sgRNA,所述多个是指两个及以上。
15.一种基因组DNA片段编辑方法,采用如权利要求1~4任一项所述Cas9核酸酶以及与之配合的一个或多个sgRNA,利用CRISPR/Cas9系统对待编辑的基因组DNA片段进行编辑。
16.根据权利要求15所述的基因组DNA片段编辑方法,其特征在于,所述编辑包括单位点编辑和多位点编辑,所述多位点编辑的编辑位点数为两个及以上。
17.根据权利要求15所述的基因组DNA片段编辑方法,所述编辑的方式包括突变、删除、反转或倒位、重复、易位或插入。
18.根据权利要求15所述的基因组DNA片段编辑方法,其特征在于,将如权利要求6所述的含有Cas9核酸酶编码多核苷酸的表达载体以及与之配合的一个或多个sgRNA一同转入细胞中,对待编辑的基因组DNA片段进行编辑。
19.一种基因组DNA片段单位点编辑方法,利用CRISPR/Cas9系统,采用如权利要求1~5任一项所述的Cas9核酸酶对DNA双链进行切割产生突出断裂末端,通过细胞自身修复系统,以补平连接的方式加入与突出断裂末端互补的碱基。
20.根据权利要求19所述的基因组DNA片段单位点编辑方法,其特征在于,所述方法可以改变单位点编辑时碱基突变的特征。
CN201710344429.6A 2017-05-16 2017-05-16 一种Cas9核酸酶G915F及其用途 Active CN106967697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710344429.6A CN106967697B (zh) 2017-05-16 2017-05-16 一种Cas9核酸酶G915F及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710344429.6A CN106967697B (zh) 2017-05-16 2017-05-16 一种Cas9核酸酶G915F及其用途

Publications (2)

Publication Number Publication Date
CN106967697A true CN106967697A (zh) 2017-07-21
CN106967697B CN106967697B (zh) 2021-03-26

Family

ID=59330661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710344429.6A Active CN106967697B (zh) 2017-05-16 2017-05-16 一种Cas9核酸酶G915F及其用途

Country Status (1)

Country Link
CN (1) CN106967697B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9999671B2 (en) 2013-09-06 2018-06-19 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US10113163B2 (en) 2016-08-03 2018-10-30 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US10167457B2 (en) 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10465176B2 (en) 2013-12-12 2019-11-05 President And Fellows Of Harvard College Cas variants for gene editing
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10704062B2 (en) 2014-07-30 2020-07-07 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
US11046948B2 (en) 2013-08-22 2021-06-29 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US11920181B2 (en) 2013-08-09 2024-03-05 President And Fellows Of Harvard College Nuclease profiling system
US10954548B2 (en) 2013-08-09 2021-03-23 President And Fellows Of Harvard College Nuclease profiling system
US11046948B2 (en) 2013-08-22 2021-06-29 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US10912833B2 (en) 2013-09-06 2021-02-09 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10682410B2 (en) 2013-09-06 2020-06-16 President And Fellows Of Harvard College Delivery system for functional nucleases
US11299755B2 (en) 2013-09-06 2022-04-12 President And Fellows Of Harvard College Switchable CAS9 nucleases and uses thereof
US9999671B2 (en) 2013-09-06 2018-06-19 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US10465176B2 (en) 2013-12-12 2019-11-05 President And Fellows Of Harvard College Cas variants for gene editing
US11124782B2 (en) 2013-12-12 2021-09-21 President And Fellows Of Harvard College Cas variants for gene editing
US10704062B2 (en) 2014-07-30 2020-07-07 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11578343B2 (en) 2014-07-30 2023-02-14 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US10167457B2 (en) 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US11214780B2 (en) 2015-10-23 2022-01-04 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US11702651B2 (en) 2016-08-03 2023-07-18 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US10947530B2 (en) 2016-08-03 2021-03-16 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US10113163B2 (en) 2016-08-03 2018-10-30 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US11820969B2 (en) 2016-12-23 2023-11-21 President And Fellows Of Harvard College Editing of CCR2 receptor gene to protect against HIV infection
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11932884B2 (en) 2017-08-30 2024-03-19 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11643652B2 (en) 2019-03-19 2023-05-09 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11795452B2 (en) 2019-03-19 2023-10-24 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Also Published As

Publication number Publication date
CN106967697B (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN106967697A (zh) 一种Cas9核酸酶G915F及其用途
CN106947750A (zh) 一种Cas9核酸酶Q920P及其用途
CN106957831A (zh) 一种Cas9核酸酶K918A及其用途
CN106987570A (zh) 一种Cas9核酸酶R780A及其用途
CN106939303A (zh) 一种Cas9核酸酶R919P及其用途
CN106957830B (zh) 一种Cas9核酸酶ΔF916及其用途
CN107012250B (zh) 一种适用于CRISPR/Cas9系统的基因组DNA片段编辑精准度的分析方法及应用
DeWitt et al. Genome editing via delivery of Cas9 ribonucleoprotein
RU2704283C9 (ru) Способы и композиции для модификации целевого локуса
Tischer et al. En passant mutagenesis: a two step markerless red recombination system
ES2666179T3 (es) Montaje de ADN mediado por nucleasas
CN102124112B (zh) 基于同源重组dna的克隆方法及组合物
JP6958917B2 (ja) 遺伝子ノックイン細胞の作製方法
WO2021226363A1 (en) Enzymes with ruvc domains
Veerappan et al. Rapid identification of causative insertions underlying Medicago truncatula Tnt1 mutants defective in symbiotic nitrogen fixation from a forward genetic screen by whole genome sequencing
Zhang et al. Rapid assembly of customized TALENs into multiple delivery systems
CN106987571A (zh) 一种Cas9核酸酶F916P及其用途
Testa et al. BAC engineering for the generation of ES cell-targeting constructs and mouse transgenes
Wilson et al. CRISPR-cas9-mediated genome editing in the filamentous ascomycete Huntiella omanensis
WO2023102176A1 (en) Crispr-associated transposases and methods of use thereof
WO2018015995A1 (ja) 長鎖一本鎖dnaを調製する方法
ES2923629T3 (es) Métodos para la introducción sin cicatrices de modificaciones dirigidas en vectores de direccionamiento
Bosch et al. Prime editing for precise genome engineering in Drosophila
CN107119077B (zh) CtIP抑制剂的新用途及一种精准的基因组DNA片段编辑方法
Jeong et al. Modification and production of BAC transgenes

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant