CN118048343A - Cas9核酸酶及其制备方法和用途 - Google Patents

Cas9核酸酶及其制备方法和用途 Download PDF

Info

Publication number
CN118048343A
CN118048343A CN202410236233.5A CN202410236233A CN118048343A CN 118048343 A CN118048343 A CN 118048343A CN 202410236233 A CN202410236233 A CN 202410236233A CN 118048343 A CN118048343 A CN 118048343A
Authority
CN
China
Prior art keywords
cas9 nuclease
dna
gene
cas9
nuclease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410236233.5A
Other languages
English (en)
Inventor
吴强
刘雨哲
李金环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202410236233.5A priority Critical patent/CN118048343A/zh
Publication of CN118048343A publication Critical patent/CN118048343A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及生物技术领域,特别是涉及一种Cas9核酸酶及其制备方法和用途。本发明提供的Cas9核酸酶包含野生型Cas9核酸酶在第915位和/或第976位发生一种或多种氨基酸突变所形成的多肽;所述野生型Cas9核酸酶的氨基酸序列如SEQ ID No.2所示。本发明提供中Cas9核酸酶(DE Cas9)与野生型Cas9核酸酶相比,采用DE Cas9对DNA双链进行切割可产生更大比例的DNA缺失(deletion),更少比例DNA插入(insertion),能够改变Cas9核酸酶DNA编辑和修复结果。

Description

Cas9核酸酶及其制备方法和用途
技术领域
本发明涉及生物技术领域,特别是涉及一种Cas9核酸酶及其制备方法和用途。
背景技术
自从人类基因组计划(Human Genome Project)和DNA元件百科全书(Encyclopedia of DNA Elements)项目的完成,科学家们分析和鉴定了大量的基因组中的基因和DNA调控元件[1,2]。在基因表达调控中起重要作用的DNA调控元件包括启动子、增强子、沉默子和绝缘子等。然而,多数调控元件的功能并没有得到实验的验证和阐明[2-8]。探索基因和DNA调控元件的功能,可以通过遗传学DNA片段编辑来进行研究。
早期的基因编辑和基因功能修饰是通过基因转座和转基因实现的[9-14]。伴随测序技术的发展反向遗传学被应用于对基因组进行特定的突变[15,16]。特别是依赖于同源重组的基因打靶小鼠迅速地被应用到科学研究中[15,17,18]。此外,在小鼠和斑马鱼中DNA片段的反转和重复被应用于去研究特定的基因组结构变化[19-24]。
近几年,源于细菌和古菌的Ⅱ型成簇规律间隔短回文重复系统[Clusteredregularly interspaced short palindromic repeats(CRISPR)/CRISPR-associatednuclease 9(Cas9)CRISPR/Cas9]是新兴基因组编辑技术[25-27],由于它设计简单和操作方便,迅速地被应用到真核基因组编辑。在CRISPR/Cas9基因组编辑技术中,sgRNA将Cas9蛋白引导至其靶位点,最后在靶位点产生双链DNA断裂(double-strand breaks,DSB),该断裂通过内源修复途径修复,包括非同源末端链接(nonhomologous end-joining,NHEJ)和微同源介导的末端连接(microhomology-mediated end joining,MMEJ),以及使用修复模版,其修复结果更准确的同源定向修复(homology-directed repair,HDR),最终可能产生不同的修复结果[28]。除了传统的CRISPR/Cas9诱导的双链DNA切割敲除外,新技术层出不穷,例如碱基编辑提供了一种策略,可以在没有DSB的情况下生成位点特异性和精确的点突变,由于其准确性和高效性在某些单碱基突变引起的遗传疾病的治疗中,显示出巨大潜力。但是,很多人类遗传疾病的基因突变不局限于单碱基突变,移码突变等也是其中一类非常重要的突变,同时通过碱基编辑器不能达到高效恢复正常序列的目的。近年来,Cas9核酸酶体外切割实验揭示了RuvC核酸酶结构域切割靶向DNA的非互补链具有多样性,可以断裂在PAM上游的-3,-4或更远位置,同时HNH核酸酶结构域在PAM上游的3bp固定位置对互补链进行切割,进而产生具有5’突出悬端,这种切割模式通过细胞内的DNA修复可能会产生DNA片段的缺失。利用这种切割特点,可以更加高效地对某些特定的碱基插入导致的疾病进行基因编辑并恢复为正常的基因型,这种方式无需额外添加模版,在疾病治疗中具有极大的应用前景。如何提高DNA片段缺失在编辑结果的比例,则是其中一个重要问题。
上述参考文献如下:
[1]LI J,SHOU J,GUO Y,et al.Efficient inversions and duplications ofmammalian regulatory DNA elements and gene clusters by CRISPR/Cas9[J].Journalof molecular cell biology,2015,7(4):284–298.DOI:10.1093/jmcb/mjv016.
[2]MALIP,YANG L,ESVELT K M,et al.RNA-guided human genome engineeringvia Cas9[J].Science(New York,N.Y.),2013,339(6121):823–826.DOI:10.1126/science.1232033.
[3]LE CONG,RAN F A,COX D,et al.Multiplex genome engineering usingCRISPR/Cas systems[J].Science(New York,N.Y.),2013,339(6121):819–823.DOI:10.1126/science.1231143.
[4]JINEK M,CHYLINSKI K,FONFARA I,et al.A programmabledual-RNA-guidedDNA endonuclease in adaptive bacterial immunity[J].Science(New York,N.Y.),2012,337(6096):816–821.DOI:10.1126/science.1225829.
[5]WU S,YING G,WU Q,et al.A protocol for constructing gene targetingvectors:generating knockout mice for the cadherin family and beyond[J].Natureprotocols,2008,3(6):1056–1076.DOI:10.1038/nprot.2008.70.
[6]KRAFT K,GEUER S,WILL A J,et al.Deletions,Inversions,Duplications:Engineering of Structural Variants using CRISPR/Cas in Mice[J].Cell reports,2015,10(5):833–839.DOI:10.1016/j.celrep.2015.01.016.
[7]An XIAO,WANG Z,HU Y,et al.Chromosomal deletions and inversionsmediated by TALENs and CRISPR/Cas in zebrafish[J].Nucleic acids research,2013,41(14):e141.DOI:10.1093/nar/gkt464.
[8]GUPTA A,HALL V L,KOK F O,et al.Targeted chromosomal deletions andinversions in zebrafish[J].Genome research,2013,23(6):1008–1017.DOI:10.1101/gr.154070.112.
[9]WU S,YING G,WU Q,et al.Toward simpler and faster genome-widemutagenesis in mice[J].Nature genetics,2007,39(7):922–930.DOI:10.1038/ng2060.
[10]ZHENG B,SAGE M,SHEPPEARD E A,et al.Engineering mouse chromosomeswith Cre-loxP:range,efficiency,and somatic applications[J].Molecular andcellular biology,2000,20(2):648–655.DOI:10.1128/MCB.20.2.648-655.2000.
[11]THOMAS K R,CAPECCHI M R.Introduction of homologous DNA sequencesinto mammalian cells induces mutations in the cognate gene[J].Nature,1986,324(6092):34–38.DOI:10.1038/324034a0.
[12]SMITHIES O,GREGG R G,BOGGS S S,et al.Insertion of DNA sequencesinto the human chromosomal beta-globin locus by homologous recombination[J].Nature,1985,317(6034):230–234.DOI:10.1038/317230a0.
[13]CARROLL D.Genome engineering with targetable nucleases[J].Annualreview of biochemistry,2014,83:409–439.DOI:10.1146/annurev-biochem-060713-035418.
[14]CAPECCHI M R.Gene targeting in mice:functional analysis of themammalian genome for the twenty-first century[J].Nature reviews.Genetics,2005,6(6):507–512.DOI:10.1038/nrg1619.
[15]PALMITER R D,BRINSTER R L,HAMMER R E,et al.Dramatic growth ofmice that develop from eggs microinjected with metallothionein-growth hormonefusion genes[J].Nature,1982,300(5893):611–615.DOI:10.1038/300611a0.
[16]GORDON J W,SCANGOS G A,PLOTKIN D J,et al.Genetic transformationof mouse embryos by microinjection of purified DNA[J].Proceedings of theNational Academy of Sciences of the United States of America,1980,77(12):7380–7384.DOI:10.1073/pnas.77.12.7380.
[17]HARBERS K,D,JAENISCH R.Microinjection of clonedretroviral genomes into mouse zygotes:integration and expression in theanimal[J].Nature,1981,293(5833):540–542.DOI:10.1038/293540a0.
[18]BRINSTER R L,CHEN H Y,TRUMBAUER M,et al.Somatic expression ofherpes thymidine kinase in mice following injection of a fusion gene intoeggs[J].Cell,1981,27(1 Pt2):223–231.DOI:10.1016/0092-8674(81)90376-7.
[19]MCCLINTOCK B.The significance of responses of the genome tochallenge[J].Science(New York,N.Y.),1984,226(4676):792–801.DOI:10.1126/science.15739260.
[20]MCCLINTOCK B.The origin and behavior of mutable loci in maize[J].Proceedings of the National Academy of Sciences of the United States ofAmerica,1950,36(6):344–355.DOI:10.1073/pnas.36.6.344.
[21]LAAT W de,DUBOULE D.Topology of mammalian developmental enhancersand their regulatory landscapes[J].Nature,2013,502(7472):499–506.DOI:10.1038/nature12753.
[22]THURMAN R E,RYNES E,HUMBERT R,et al.The accessible chromatinlandscape of the human genome[J].Nature,2012,489(7414):75–82.DOI:10.1038/nature11232.
[23]SHEN Y,YUE F,MCCLEARY D F,et al.A map of the cis-regulatorysequences in the mouse genome[J].Nature,2012,488(7409):116–120.DOI:10.1038/nature11243.
[24]NEPH S,VIERSTRA J,STERGACHIS A B,et al.An expansive humanregulatory lexicon encoded in transcription factor footprints[J].Nature,2012,489(7414):83–90.DOI:10.1038/nature11212.
[25]ZHANG T,HAWS P,WU Q.Multiple variable first exons:a mechanism forcell-and tissue-specific gene regulation[J].Genome research,2004,14(1):79–89.DOI:10.1101/gr.1225204.
[26]BANERJI J,OLSON L,SCHAFFNER W.Alymphocyte-specific cellularenhancer is located downstream of the joining region in immunoglobulin heavychain genes[J].Cell,1983,33(3):729–740.DOI:10.1016/0092-8674(83)90015-6.
[27]An integrated encyclopedia of DNAelements in the human genome[J].Nature,2012,489(7414):57–74.DOI:10.1038/nature11247.
[28]XUE C,GREENE E C.DNArepair pathway choices in CRISPR-Cas9mediated genome editing[J].Trends in genetics:TIG,2021,37(7):639–656.DOI:10.1016/j.tig.2021.02.008.
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种Cas9核酸酶及其制备方法和用途,用于解决现有技术中的问题。
为实现上述目的及其他相关目的,本发明提供一种Cas9核酸酶,所述Cas9核酸酶包含野生型Cas9核酸酶在第915位和/或第976位发生一种或多种氨基酸突变所形成的多肽;所述野生型Cas9核酸酶的氨基酸序列如SEQ ID No.2所示
优选地,所述Cas9核酸酶包含氨基酸序列如SEQ ID No.1的多肽。
本发明还提供一种分离的多核苷酸,所述多核苷酸编码前述Cas9核酸酶。
本发明还提供一种表达载体,所述表达载体包含前述多核苷酸和质粒骨架。
本发明还提供一种基因编辑系统,所述基因编辑系统包含前述Cas9核酸酶,以及gRNA或编码gRNA的核酸片段;或,包含前述多核苷酸,以及gRNA或编码gRNA的多核苷酸;或,包括前述表达载体,以及gRNA或编码gRNA的多核苷酸。
本发明还提供一种细胞,所述细胞含有前述多核苷酸、前述表达载体或前述基因编辑系统。
本发明还提供前述Cas9核酸酶的制备方法,所述制备方法为:将前述多核苷酸、前述表达载体或前述基因编辑系统导入工程细胞后,诱导外源基因表达,分离、纯化即获得所述Cas9核酸酶。
本发明还提供前述Cas9核酸酶、前述多核苷酸、前述表达载体或前述基因编辑系统在离体细胞或无细胞环境中对靶基因进行基因编辑的用途。
本发明还提供一种体外的基因编辑方法,所述基因编辑方法为:将靶基因与前述基因编辑系统接触,以实现靶基因的编辑。
如上所述,本发明的一种Cas9核酸酶及其制备方法和用途,具有以下有益效果:本发明提供中Cas9核酸酶(DE Cas9)与野生型Cas9核酸酶相比,采用DE Cas9对DNA双链进行切割可产生更大比例的DNA缺失(deletion),更少比例DNA插入(insertion),能够改变Cas9核酸酶DNA编辑和修复结果。
附图说明
图1显示为本发明中通过检测各Cas9核酸酶在ATN1 sgRNA4的介导下对基因组DNA片段进行切割时所产生的deletion的占比。
图2显示为本发明中通过检测各Cas9核酸酶在ATN1 sgRNA5的介导下对基因组DNA片段进行切割时所产生的deletion的占比。
图3显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA4的介导下对基因组DNA片段进行切割时所产生的deletion的占比。
图4显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA5的介导下对基因组DNA片段进行切割时所产生的deletion的占比。
图5显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA4的介导下对基因组DNA片段进行切割时所产生的各类indel的占比。
图6显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA5的介导下对基因组DNA片段进行切割时所产生的各类indel的占比。
图7显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA4的介导下对基因组DNA片段进行切割时所产生insertion的占比。
图8显示为本发明中通过检测DNA片段删除接头连接情况统计出WT-Cas9,G915F,R976A,DE Cas9核酸酶在sgRNA5的介导下对基因组DNA片段进行切割时所产生insertion的占比。
具体实施方式
本发明提供一种Cas9核酸酶,所述核酸酶包含野生型Cas9核酸酶在第915位和/或第976位发生一种或多种氨基酸突变所形成的多肽。所述野生型Cas9核酸酶的氨基酸序列如SEQ IDNo.2所示。
在一些具体实施方式中,编码所述野生型Cas9核酸酶的核酸分子包含核苷酸序列如SEQ ID No.4所示的核酸片段。
在一些具体实施方式中,所述氨基酸突变包含如下特征中的一种或多种:
I)甘氨酸突变为谷氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸(蛋氨酸)、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、苯丙氨酸、天门冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、赖氨酸、精氨酸或组氨酸;
II)精氨酸突变甘氨酸、谷氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸(蛋氨酸)、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、天门冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、赖氨酸、苯丙氨酸或组氨酸。
进一步地,所述氨基酸突变为甘氨酸突变为苯丙氨酸;和/或,精氨酸突变为丙氨酸。
更进一步地,所述氨基酸突变为野生型Cas9核酸酶在第915位由甘氨酸突变为苯丙氨酸;和/或,野生型Cas9核酸酶在第976位由精氨酸突变为丙氨酸。
在一些具体实施方式,所述Cas9核酸酶包含氨基酸序列如SEQ ID No.1所示的多肽。
本发明还提供一种分离的多核苷酸,所述多核苷酸编码前述Cas9核酸酶。
在一些具体实施方式中,所述多核苷酸包含核苷酸序列如SEQ ID No.3所示的核酸片段。
本发明还提供一种表达载体,所述表达载体包含前述多核苷酸和质粒骨架。
在一些具体实施方式中,所述质粒骨架包含可操作元件。具体地,所述可操作元件包含启动子、增强子、终止子、沉默子、核定位信号、ploy A结构、报告基因或转座子中的一种或多种。
在一些具体实施方式中,所述质粒骨架选自pLKO.1-CMV-tGFP、pLKO.1-puro-CMV-tGFP、pLKO.1-CMV-Neo、pLKO.1-Neo、pLKO.1-Neo-CMV-tGFP、pLKO.1-puro-CMV-TagCFP、pLKO.1-puro-CMV-TagYFP、pLKO.1-puro-CMV-TagRFP、pLKO.1-puro-CMV-TagFP635、pLKO.1-puro-UbC-TurboGFP、pLKO.1-puro-UbC-TagFP635、pLKO-puro-IPTG-1xLacO、pLKO-puro-IPTG-3xLacO、pLP1、pLP2、pLP/VSV-G、pENTR/U6、pLenti6/BLOCK-iT-DEST、pcDNA1.2/V5-GW/lacZ、pLenti6.2/N-Lumio/V5-DEST、pGCSIL-GFP、pAAV-CAG、pAAV-TRE、pAAV-EF1a、pAAV-GFAP、pAAV-Lgr5、pAAV-Sox2、pAAV-Syn或pAAV-CMV中的一种或多种。
本发明还提供一种基因编辑系统,所述基因编辑系统包含前述Cas9核酸酶和向导RNA(gRNA)或编码向导RNA(gRNA)的核酸片段;或,包含前述多核苷酸和gRNA或编码gRNA的多核苷酸;或,包括前述表达载体和gRNA或编码gRNA的多核苷酸。
本发明所述系统可以包含一个gRNA或同时包含多个gRNA。在一些实施方式中,所述系统同时包含多个gRNA以同时修饰相同靶标DNA或不同靶标DNA上的不同位置。在一些实施方案中,两个或更多个向导RNA靶向相同的基因或转录本或基因座。在一些实施方案中,两个或更多个向导RNA靶向不同的不相关基因座。在一些实施方案中,两个或更多个向导RNA靶向不同但相关的基因座。
本发明中,所述多核苷酸或所述表达载体可以通过人工合成方式进行合成,例如通过化学方法合成,从而使得能够容易地对其进行多种修饰。所述修饰可以采用本领域公知的任何修饰方式。在一些具体实施方案中,所述多核苷酸或所述表达载体包含一种或多种修饰,从而使得能够容易获得更多功能,例如增强转录活性,改变酶活性,提高其翻译或稳定性(例如增加其对蛋白水解、降解的抗性)或特异性,改变溶解性,改变递送,减少宿主细胞中的先天免疫应答。所述修饰可以采用本领域公知的任何修饰方式。在一些具体实施方式中,通过修饰引入细胞中的编码核酸酶的DNA或RNA,以编辑任何一个或多个基因组的基因座。所述修饰可以是单一修饰,或组合修饰。
本发明中,所述Cas9核酸酶,或编码Cas9核酸酶的多核苷酸适用任何生物或体外环境,包括但不限于是细菌(如大肠杆菌、肺炎克雷伯氏菌)、古细菌、真菌、原生生物、植物或动物。相应地,适用的靶细胞包括但不限于真核细胞和原核细胞,例如是细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、植物细胞或动物细胞;所述真核细胞包含哺乳动物细胞和植物细胞,所述原核细胞包括大肠杆菌和肺炎克雷伯氏菌。适用的靶细胞可以是任何类型的细胞,包括干细胞,体细胞等。本发明优选用于哺乳动物细胞HEK293T细胞。所述细胞可以是体内的或离体的。
本发明所述基因编辑系统中,Cas9核酸酶和gRNA可以在宿主细胞中形成复合物,识别靶向基因(如靶向DNA)序列上的PAM序列;所述基因编辑系统的靶向序列为PAM序列之前长度为20bp的核酸片段(如DNA片段)。在一些实施方案中,所述复合物可以选择性地调节宿主细胞中靶DNA的转录。基因编辑系统能够切割靶向DNA的双链,造成DNA断裂。
本发明中,还可以通过修饰、突变、DNA改组等方式形成核酸酶变体,使得核酸酶变体具有改善的所期望的特征,例如功能、活性、动力学、半衰期等。所述修饰例如可以是氨基酸的缺失、插入或取代,再例如可以是用来自不同核酸酶的同源或异源切割结构域(例如CRISPR-相关核酸酶的HNH结构域)置换核酸酶的“切割结构域”;通过本领域已知的DNA结合和/或DNA修饰蛋白的任何修饰方法,如甲基化作用、脱甲基作用、乙酰化作用等,例如可以改变前述核酸酶的DNA靶向性。所述DNA改组是指在不同来源的核酸酶的DNA序列之间交换序列片段,以产生编码具有RNA指导的内切核酸酶活性的合成蛋白的嵌合DNA序列。所述修饰、突变、DNA改组等可以是单一使用或组合使用。
本发明还提供一种组合物,其包含如前述Cas9核酸酶、前述多核苷酸、前述表达载体或前述基因编辑系统中的一种或多种。在一些具体实施方案中,所述组合物还包含药学上接受的载体、介质等。所述可接受的载体、介质例如无菌水或生理盐水、稳定剂、赋形剂、抗氧化剂(抗坏血酸等)、缓冲剂(磷酸、枸橼酸、其它的有机酸等)、防腐剂、表面活性剂(PEG、Tween等)、螯合剂(EDTA等)、粘合剂等。而且,也可含有其它低分子量的多肽;血清白蛋白、明胶或免疫球蛋白等蛋白质;甘氨酸、谷酰胺、天冬酰胺、精氨酸和赖氨酸等氨基酸;多糖和单糖等糖类或碳水化物;甘露糖醇或山梨糖醇等糖醇。当制备用于注射的水溶液时,例如生理盐水、含有葡萄糖或其它的辅助药物的等渗溶液,如D-山梨糖醇、D-甘露糖、D-甘露糖醇、氯化钠,可并用适当的增溶剂例如醇(乙醇等)、多元醇(丙二醇,PEG等)、非离子表面活性剂(吐温80,HCO-50)等。在一些实施方式中,组合物包含gRNA和用于稳定核酸的缓冲液。
本发明还提供一种细胞,所述细胞含有前述多核苷酸、前述表达载体或前述基因编辑系统。
在一些具体实施方式中,所述细胞选自原核细胞或真核细胞。具体地,所述原核细胞可以选自大肠杆菌、鼠伤寒沙门菌、肺炎克雷伯氏菌、卵形拟杆菌、空肠弯曲菌、腐生葡萄球菌、粪肠球菌、多形拟杆菌、普通拟杆菌、单形拟杆菌、干酪乳杆菌、脆弱拟杆菌、鲁氏不动杆菌、具核梭杆菌、乔氏拟杆菌、拟南芥拟杆菌、鼠李糖乳杆菌、马赛拟杆菌、粪副拟杆菌、死亡梭杆菌、短双歧杆菌或李斯特菌;或,所述真核细胞可以选自酵母细胞、链霉菌、果蝇S2或Sf9的昆虫细胞、CHO、COS.293细胞、或Bowes黑素瘤细胞。
本发明还提供前述Cas9核酸酶的制备方法,所述制备方法为:将前述多核苷酸、前述表达载体或前述基因编辑系统导入工程细胞后,诱导外源基因表达,分离、纯化即获得所述Cas9核酸酶。
在一些具体实施方式中,所述工程细胞选自原核细胞或真核细胞。具体地,所述原核细胞可以选自大肠杆菌、鼠伤寒沙门菌、肺炎克雷伯氏菌、卵形拟杆菌、空肠弯曲菌、腐生葡萄球菌、粪肠球菌、多形拟杆菌、普通拟杆菌、单形拟杆菌、干酪乳杆菌、脆弱拟杆菌、鲁氏不动杆菌、具核梭杆菌、乔氏拟杆菌、拟南芥拟杆菌、鼠李糖乳杆菌、马赛拟杆菌、粪副拟杆菌、死亡梭杆菌、短双歧杆菌或李斯特菌;或,所述真核细胞可以选自酵母细胞、链霉菌、果蝇S2或Sf9的昆虫细胞、CHO、COS.293细胞、或Bowes黑素瘤细胞。
在一些具体实施方式中,所述导入的方法可以选自DEAE-葡聚糖介导的转染、脂质体介导的转染、病毒或噬菌体感染、脂质转染法、转染、接合、原生质体融合、聚乙烯亚胺介导的转染、电穿孔、磷酸钙沉淀、基因枪、磷酸钙沉淀、显微注射、纳米颗粒介导的核酸递送中的一种或多种。
本发明还提供前述Cas9核酸酶、前述多核苷酸、前述表达载体或前述基因编辑系统在离体细胞或无细胞环境中对靶基因进行基因编辑或制备基因编辑工具中的用途。
在一些具体实施方式中,所述离体细胞选自细菌细胞、古细菌细胞、真菌细胞、原生生物细胞、病毒细胞、植物细胞和动物细胞中的一种或多种。
在一些具体实施方式中,所述基因编辑的功能选自基因切割、基因删除、基因插入、点突变、转录抑制或转录激活中的一种或多种。更具体地,所述基因编辑的功能选自:切割靶基因;或,操控靶基因的表达;或,遗传修饰靶基因;或,遗传修饰靶基因相关多肽;或,用于在靶基因的任何所需位置处的有意和受控的损伤;或,用于在靶基因的任何所需位置处的有意和受控的修复中的一种或多种。
在一些具体实施方式中,所述靶基因为靶DNA。在一些实施方式中,靶DNA可以是未与DNA相关蛋白结合的体外裸DNA。在一些实施方式中,靶DNA是体外细胞中的染色体DNA。在一些实施方式中,所述靶基因为靶RNA。在一些实施方式中,将靶DNA与包含前述核酸酶和gRNA的靶向复合物接触,gRNA通过包含与靶DNA互补的核苷酸序列,为靶向复合物提供靶特异性;前述Cas9核酸酶提供位点特异性编辑活性。在一些实施方式中,靶向复合物修饰靶DNA,从而导致例如DNA切割、DNA甲基化作用、DNA损伤、DNA修复等。在一些实施方式中,靶向复合物修饰与靶DNA相关多肽(例如,组蛋白、DNA-结合蛋白等),从而导致例如靶DNA相关多肽-组蛋白的甲基化、组蛋白乙酰化、组蛋白泛素化等。
本发明还提供一种体内或体外,疾病诊断或治疗目的或非疾病诊断或治疗目的的基因编辑方法,所述基因编辑方法为:将靶基因与前述基因编辑系统接触,以实现靶基因的编辑。其中体外或非疾病诊断或治疗目的的基因编辑方法可以为工业生产目的的基因编辑方法或科研目的的基因编辑方法。
在一些具体实施方式中,所述基因编辑方法包含如下步骤:
a.将前述Cas9核酸酶、前述多核苷酸、前述表达载体或前述基因编辑系统引入离体细胞或无细胞系统中;
b.引入gRNA也称sgRNA或适合于原位产生这种gRNA的核酸(例如,DNA);
c.使细胞或靶基因前述核酸酶、前述多核苷酸、前述表达载体或前述基因编辑系统、gRNA(sgRNA)或适合于原位产生这种gRNA的核酸接触,以在所述靶基因中产生一个或多个切割、切口或编辑;其中所述核酸酶通过其加工的或未加工形式的gRNA被引导至所述靶基因。
在一些具体实施方式中,以野生型Cas9核酸酶产生DNA缺失的效率为基准,所述基因编辑方法为前述Cas9核酸酶对DNA双链进行切割产生突出断裂末端,以产生更大比例的DNA缺失(deletion),更少比例DNA插入(insertion)的方法。
本发明中,术语“补平连接”通常是指:所述突出断裂末端会先通过碱基互补配对加入与突出的末端互补的碱基补平为钝末端之后再连接。
本发明中,术语“多核苷酸”和“寡核苷酸”可互换使用,并且它们是指任何长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸还是核糖核苷酸或其类似物。多核苷酸可以具有任何三维结构并且可以执行已知或未知的任何功能。多核苷酸的实例包括但不限于如下这些:基因或基因片段(包括探针,引物,EST或SAGE标签),外显子,内含子,信使RNA(mRNA),转运RNA,核糖体RNA,核酶,cDNA,dsRNA,siRNA,miRNA,重组多核苷酸,分支多核苷酸,质粒,载体,任何序列的分离的DNA,任何序列的分离的RNA,核酸探针和引物。多核苷酸也包含经过修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果多核苷酸上存在修饰,该修饰可以在组装多核苷酸之前或之后赋予。核苷酸序列可以被非核苷酸组分打断。多核苷酸可以在聚合后被进一步修饰,例如通过偶联被标记组分所标记。该术语同时指双链和单链多核苷酸分子。除非另有说明或要求,否则本发明公开的多核苷酸的任何实施方案包括其双链形式和已知或预测能构成双链形式的两条互补单链形式中的任一种。
本发明中,术语“肽”、“多肽”和“蛋白”在本发明中可互换地使用,且表示任何长度的氨基酸的聚合形式,其可以包括编码和非编码的氨基酸,化学或生物化学修饰或衍生的氨基酸,和具有修饰的肽主链的多肽。
本发明中,术语“编码”特定RNA的DNA序列是转录为RNA的DNA核酸序列。DNA多核苷酸可以编码被翻译成蛋白的RNA(mRNA),或者DNA多核苷酸可以编码不被翻译成蛋白质的RNA(例如,tRNA、rRNA或gRNA;也称为“非编码”RNA或“ncRNA”)。“蛋白编码序列”或编码特定蛋白或多肽的序列是在合适调节序列的控制下,在体内或体外转录成mRNA(在DNA的情况下)并翻译(在mRNA的情况下)成多肽的核酸序列。
本发明中,术语“靶DNA”是包含“靶位点”或“靶序列”的DNA多核苷酸。术语“靶位点”、“靶序列”、“靶原间隔区DNA”或“原间隔区样序列”在本发明中互换地用于表示存在于靶DNA中的核酸序列,如果存在足够的用于结合的条件,则gRNA的DNA-靶向区段将与其结合。RNA分子包含与靶DNA内的靶序列结合、杂交或互补的序列,从而将结合的多肽靶向至靶DNA内的特定位置(靶序列)。“切割”是指DNA分子的共价主链的断裂。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989 and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
本申请中所用核苷酸序列或氨基酸序列的信息如下:
SEQ ID No.1
MAPKKKRKVG IHGVPAAMDK KYSIGLDIGT NSVGWAVITD EYKVPSKKFK VLGNTDRHSIKKNLIGALLF DSGETAEATR LKRTARRRYT RRKNRICYLQ EIFSNEMAKV DDSFFHRLEE SFLVEEDKKHERHPIFGNIV DEVAYHEKYP TIYHLRKKLV DSTDKADLRL IYLALAHMIK FRGHFLIEGD LNPDNSDVDKLFIQLVQTYN QLFEENPINA SGVDAKAILS ARLSKSRRLE NLIAQLPGEK KNGLFGNLIA LSLGLTPNFKSNFDLAEDAK LQLSKDTYDD DLDNLLAQIG DQYADLFLAA KNLSDAILLS DILRVNTEIT KAPLSASMIKRYDEHHQDLT LLKALVRQQL PEKYKEIFFD QSKNGYAGYI DGGASQEEFY KFIKPILEKM DGTEELLVKLNREDLLRKQR TFDNGSIPHQ IHLGELHAIL RRQEDFYPFL KDNREKIEKI LTFRIPYYVG PLARGNSRFAWMTRKSEETI TPWNFEEVVD KGASAQSFIE RMTNFDKNLP NEKVLPKHSL LYEYFTVYNE LTKVKYVTEGMRKPAFLSGE QKKAIVDLLF KTNRKVTVKQ LKEDYFKKIE CFDSVEISGV EDRFNASLGT YHDLLKIIKDKDFLDNEENE DILEDIVLTL TLFEDREMIE ERLKTYAHLF DDKVMKQLKR RRYTGWGRLS RKLINGIRDKQSGKTILDFL KSDGFANRNF MQLIHDDSLT FKEDIQKAQV SGQGDSLHEH IANLAGSPAI KKGILQTVKVVDELVKVMGR HKPENIVIEM ARENQTTQKG QKNSRERMKR IEEGIKELGS QILKEHPVEN TQLQNEKLYLYYLQNGRDMY VDQELDINRL SDYDVDHIVP QSFLKDDSID NKVLTRSDKN RGKSDNVPSE EVVKKMKNYWRQLLNAKLIT QRKFDNLTKA ERGGLSELDK AFFIKRQLVE TRQITKHVAQ ILDSRMNTKY DENDKLIREVKVITLKSKLV SDFRKDFQFY KVAEINNYHH AHDAYLNAVV GTALIKKYPK LESEFVYGDY KVYDVRKMIAKSEQEIGKAT AKYFFYSNIM NFFKTEITLA NGEIRKRPLI ETNGETGEIV WDKGRDFATV RKVLSMPQVNIVKKTEVQTG GFSKESILPK RNSDKLIARK KDWDPKKYGG FDSPTVAYSV LVVAKVEKGK SKKLKSVKELLGITIMERSS FEKNPIDFLE AKGYKEVKKD LIIKLPKYSL FELENGRKRM LASAGELQKG NELALPSKYVNFLYLASHYE KLKGSPEDNE QKQLFVEQHK HYLDEIIEQI SEFSKRVILA DANLDKVLSA YNKHRDKPIREQAENIIHLF TLTNLGAPAA FKYFDTTIDR KRYTSTKEVL DATLIHQSIT GLYETRIDLS QLGGDKRPAATKKAGQAKKKK
SEQ ID No.2
MAPKKKRKVG IHGVPAAMDK KYSIGLDIGT NSVGWAVITD EYKVPSKKFK VLGNTDRHSIKKNLIGALLF DSGETAEATR LKRTARRRYT RRKNRICYLQ EIFSNEMAKV DDSFFHRLEE SFLVEEDKKHERHPIFGNIV DEVAYHEKYP TIYHLRKKLV DSTDKADLRL IYLALAHMIK FRGHFLIEGD LNPDNSDVDKLFIQLVQTYN QLFEENPINA SGVDAKAILS ARLSKSRRLE NLIAQLPGEK KNGLFGNLIA LSLGLTPNFKSNFDLAEDAK LQLSKDTYDD DLDNLLAQIG DQYADLFLAA KNLSDAILLS DILRVNTEIT KAPLSASMIKRYDEHHQDLT LLKALVRQQL PEKYKEIFFD QSKNGYAGYI DGGASQEEFY KFIKPILEKM DGTEELLVKLNREDLLRKQR TFDNGSIPHQ IHLGELHAIL RRQEDFYPFL KDNREKIEKI LTFRIPYYVG PLARGNSRFAWMTRKSEETI TPWNFEEVVD KGASAQSFIE RMTNFDKNLP NEKVLPKHSL LYEYFTVYNE LTKVKYVTEGMRKPAFLSGE QKKAIVDLLF KTNRKVTVKQ LKEDYFKKIE CFDSVEISGV EDRFNASLGT YHDLLKIIKDKDFLDNEENE DILEDIVLTL TLFEDREMIE ERLKTYAHLF DDKVMKQLKR RRYTGWGRLS RKLINGIRDKQSGKTILDFL KSDGFANRNF MQLIHDDSLT FKEDIQKAQV SGQGDSLHEH IANLAGSPAI KKGILQTVKVVDELVKVMGR HKPENIVIEM ARENQTTQKG QKNSRERMKR IEEGIKELGS QILKEHPVEN TQLQNEKLYLYYLQNGRDMY VDQELDINRL SDYDVDHIVP QSFLKDDSID NKVLTRSDKN RGKSDNVPSE EVVKKMKNYWRQLLNAKLIT QRKFDNLTKA ERGGLSELDK AGFIKRQLVE TRQITKHVAQ ILDSRMNTKY DENDKLIREVKVITLKSKLV SDFRKDFQFY KVREINNYHH AHDAYLNAVV GTALIKKYPK LESEFVYGDY KVYDVRKMIAKSEQEIGKAT AKYFFYSNIM NFFKTEITLA NGEIRKRPLI ETNGETGEIV WDKGRDFATV RKVLSMPQVNIVKKTEVQTG GFSKESILPK RNSDKLIARK KDWDPKKYGG FDSPTVAYSV LVVAKVEKGK SKKLKSVKELLGITIMERSS FEKNPIDFLE AKGYKEVKKD LIIKLPKYSL FELENGRKRM LASAGELQKG NELALPSKYVNFLYLASHYE KLKGSPEDNE QKQLFVEQHK HYLDEIIEQI SEFSKRVILA DANLDKVLSA YNKHRDKPIREQAENIIHLF TLTNLGAPAA FKYFDTTIDR KRYTSTKEVL DATLIHQSIT GLYETRIDLSQLGGDKRPAATKKAGQAKKKK
SEQ ID No.3
atggccccaa agaagaagcg gaaggtcggt atccacggtg tcccagcagc catggacaagaagtactcca ttgggctcga tatcggcaca aacagcgtcg gctgggccgt cattacggac gagtacaaggtgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata aagaagaacc tcattggcgccctcctgttc gactccgggg agacggccga agccacgcgg ctcaaaagaa cagcacggcg cagatatacccgcagaaaga atcggatctg ctacctgcag gagatcttta gtaatgagat ggctaaggtg gatgactctttcttccatag gctggaggag tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttggcaatatcgtg gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgtagacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa tttcggggacacttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa ctctttatcc aactggttcagacttacaat cagcttttcg aagagaaccc gatcaacgca tccggagttg acgccaaagc aatcctgagcgctaggctgt ccaaatcccg gcggctcgaa aacctcatcg cacagctccc tggggagaag aagaacggcctgtttggtaa tcttatcgcc ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccgaagatgccaag cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggcgaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt gatattctgcgagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag cgctatgatg agcaccaccaagacttgact ttgctgaagg cccttgtcag acagcaactg cctgagaagt acaaggaaat tttcttcgatcagtctaaaa atggctacgc cggatacatt gacggcggag caagccagga ggaattttac aaatttattaagcccatctt ggaaaaaatg gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcgcaaacagcgc actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatactcaggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc ctcacatttcggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg tggatgactc gcaaatcagaagagaccatc actccctgga acttcgagga agtcgtggat aagggggcct ctgcccagtc cttcatcgaaaggatgacta actttgataa aaatctgcct aacgaaaagg tgcttcctaa acactctctg ctgtacgagtacttcacagt ttataacgag ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcctgtctggagag cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacagctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg gaggatcgcttcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac aaggacttcc tggacaatgaggagaacgag gacattcttg aggacattgt cctcaccctt acgttgtttg aagataggga gatgattgaagaacgcttga aaacttacgc tcatctcttc gacgacaaag tcatgaaaca gctcaagagg cgccgatatacaggatgggg gcggctgtca agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcctggattttctt aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacctttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac atcgctaatcttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc gtggatgaac tcgtcaaagtaatgggaagg cataagcccg agaatatcgt tatcgagatg gcccgagaga accaaactac ccagaagggacagaagaaca gtagggaaag gatgaagagg attgaagagg gtataaaaga actggggtcc caaatccttaaggaacaccc agttgaaaac acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcagggacatgtac gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccccagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat agagggaagagtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg cggcagctgc tgaacgccaaactgatcaca caacggaagt tcgataatct gactaaggct gaacgaggtg gcctgtctga gttggataaagcattcttca tcaaaaggca gcttgttgag acacgccaga tcaccaagca cgtggcccaa attctcgattcacgcatgaa caccaagtac gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtctaagctggtc tcagatttca gaaaggactt tcagttttat aaggtggccg agatcaacaa ttaccaccatgcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag cttgaatctgaatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca aagtctgagc aggaaataggcaaggccacc gctaagtact tcttttacag caatattatg aattttttca agaccgagat tacactggccaatggagaga ttcggaagcg accacttatc gaaacaaacg gagaaacagg agaaatcgtg tgggacaagggtagggattt cgcgacagtc cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagtacagaccgga ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaaaaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta ctggttgtggccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg ctgggcatca caatcatggagcgatcaagc ttcgaaaaaa accccatcga ctttctcgag gcgaaaggat ataaagaggt caaaaaagacctcatcatta agcttcccaa gtactctctc tttgagcttg aaaacggccg gaaacgaatg ctcgctagtgcgggcgagct gcagaaaggt aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccagccactatgaa aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaacactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc gacgctaacctcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg gagcaggcag aaaacattatccacttgttt actctgacca acttgggcgc gcctgcagcc ttcaagtact tcgacaccac catagacagaaagcggtaca cctctacaaa ggaggtcctg gacgccacac tgattcatca gtcaattacg gggctctatgaaacaagaat cgacctctct cagctcggtg gagacaagcg tcctgctgct actaagaaag ctggtcaagctaagaaaaag aaataa
SEQ ID No.4
atggccccaa agaagaagcg gaaggtcggt atccacggtg tcccagcagc catggacaagaagtactcca ttgggctcga tatcggcaca aacagcgtcg gctgggccgt cattacggac gagtacaaggtgccgagcaa aaaattcaaa gttctgggca ataccgatcg ccacagcata aagaagaacc tcattggcgccctcctgttc gactccgggg agacggccga agccacgcgg ctcaaaagaa cagcacggcg cagatatacccgcagaaaga atcggatctg ctacctgcag gagatcttta gtaatgagat ggctaaggtg gatgactctttcttccatag gctggaggag tcctttttgg tggaggagga taaaaagcac gagcgccacc caatctttggcaatatcgtg gacgaggtgg cgtaccatga aaagtaccca accatatatc atctgaggaa gaagcttgtagacagtactg ataaggctga cttgcggttg atctatctcg cgctggcgca tatgatcaaa tttcggggacacttcctcat cgagggggac ctgaacccag acaacagcga tgtcgacaaa ctctttatcc aactggttcagacttacaat cagcttttcg aagagaaccc gatcaacgca tccggagttg acgccaaagc aatcctgagcgctaggctgt ccaaatcccg gcggctcgaa aacctcatcg cacagctccc tggggagaag aagaacggcctgtttggtaa tcttatcgcc ctgtcactcg ggctgacccc caactttaaa tctaacttcg acctggccgaagatgccaag cttcaactga gcaaagacac ctacgatgat gatctcgaca atctgctggc ccagatcggcgaccagtacg cagacctttt tttggcggca aagaacctgt cagacgccat tctgctgagt gatattctgcgagtgaacac ggagatcacc aaagctccgc tgagcgctag tatgatcaag cgctatgatg agcaccaccaagacttgact ttgctgaagg cccttgtcag acagcaactg cctgagaagt acaaggaaat tttcttcgatcagtctaaaa atggctacgc cggatacatt gacggcggag caagccagga ggaattttac aaatttattaagcccatctt ggaaaaaatg gacggcaccg aggagctgct ggtaaagctt aacagagaag atctgttgcgcaaacagcgc actttcgaca atggaagcat cccccaccag attcacctgg gcgaactgca cgctatactcaggcggcaag aggatttcta cccctttttg aaagataaca gggaaaagat tgagaaaatc ctcacatttcggatacccta ctatgtaggc cccctcgccc ggggaaattc cagattcgcg tggatgactc gcaaatcagaagagaccatc actccctgga acttcgagga agtcgtggat aagggggcct ctgcccagtc cttcatcgaaaggatgacta actttgataa aaatctgcct aacgaaaagg tgcttcctaa acactctctg ctgtacgagtacttcacagt ttataacgag ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc cagcattcctgtctggagag cagaagaaag ctatcgtgga cctcctcttc aagacgaacc ggaaagttac cgtgaaacagctcaaagaag actatttcaa aaagattgaa tgtttcgact ctgttgaaat cagcggagtg gaggatcgcttcaacgcatc cctgggaacg tatcacgatc tcctgaaaat cattaaagac aaggacttcc tggacaatgaggagaacgag gacattcttg aggacattgt cctcaccctt acgttgtttg aagataggga gatgattgaagaacgcttga aaacttacgc tcatctcttc gacgacaaag tcatgaaaca gctcaagagg cgccgatatacaggatgggg gcggctgtca agaaaactga tcaatgggat ccgagacaag cagagtggaa agacaatcctggattttctt aagtccgatg gatttgccaa ccggaacttc atgcagttga tccatgatga ctctctcacctttaaggagg acatccagaa agcacaagtt tctggccagg gggacagtct tcacgagcac atcgctaatcttgcaggtag cccagctatc aaaaagggaa tactgcagac cgttaaggtc gtggatgaac tcgtcaaagtaatgggaagg cataagcccg agaatatcgt tatcgagatg gcccgagaga accaaactac ccagaagggacagaagaaca gtagggaaag gatgaagagg attgaagagg gtataaaaga actggggtcc caaatccttaaggaacaccc agttgaaaac acccagcttc agaatgagaa gctctacctg tactacctgc agaacggcagggacatgtac gtggatcagg aactggacat caatcggctc tccgactacg acgtggatca tatcgtgccccagtcttttc tcaaagatga ttctattgat aataaagtgt tgacaagatc cgataaaaat agagggaagagtgataacgt cccctcagaa gaagttgtca agaaaatgaa aaattattgg cggcagctgc tgaacgccaaactgatcaca caacggaagt tcgataatct gactaaggct gaacgaggtg gcctgtctga gttggataaagcaggcttca tcaaaaggca gcttgttgag acacgccaga tcaccaagca cgtggcccaa attctcgattcacgcatgaa caccaagtac gatgaaaatg acaaactgat tcgagaggtg aaagttatta ctctgaagtctaagctggtc tcagatttca gaaaggactt tcagttttat aaggtgagag agatcaacaa ttaccaccatgcgcatgatg cctacctgaa tgcagtggta ggcactgcac ttatcaaaaa atatcccaag cttgaatctgaatttgttta cggagactat aaagtgtacg atgttaggaa aatgatcgca aagtctgagc aggaaataggcaaggccacc gctaagtact tcttttacag caatattatg aattttttca agaccgagat tacactggccaatggagaga ttcggaagcg accacttatc gaaacaaacg gagaaacagg agaaatcgtg tgggacaagggtagggattt cgcgacagtc cggaaggtcc tgtccatgcc gcaggtgaac atcgttaaaa agaccgaagtacagaccgga ggcttctcca aggaaagtat cctcccgaaa aggaacagcg acaagctgat cgcacgcaaaaaagattggg accccaagaa atacggcgga ttcgattctc ctacagtcgc ttacagtgta ctggttgtggccaaagtgga gaaagggaag tctaaaaaac tcaaaagcgt caaggaactg ctgggcatca caatcatggagcgatcaagc ttcgaaaaaa accccatcga ctttctcgag gcgaaaggat ataaagaggt caaaaaagacctcatcatta agcttcccaa gtactctctc tttgagcttg aaaacggccg gaaacgaatg ctcgctagtgcgggcgagct gcagaaaggt aacgagctgg cactgccctc taaatacgtt aatttcttgt atctggccagccactatgaa aagctcaaag ggtctcccga agataatgag cagaagcagc tgttcgtgga acaacacaaacactaccttg atgagatcat cgagcaaata agcgaattct ccaaaagagt gatcctcgcc gacgctaacctcgataaggt gctttctgct tacaataagc acagggataa gcccatcagg gagcaggcag aaaacattatccacttgttt actctgacca acttgggcgc gcctgcagcc ttcaagtact tcgacaccac catagacagaaagcggtaca cctctacaaa ggaggtcctg gacgccacac tgattcatca gtcaattacg gggctctatgaaacaagaat cgacctctct cagctcggtg gagacaagcg tcctgctgct actaagaaag ctggtcaagctaagaaaaag aaataa
实施例1 Cas9核酸酶DE Cas9切割模式的鉴定
1.构建Cas9突变体
Cas9突变引物:
DE Cas9-F:TTATAAGGTGGCCGAGATCAACAATTACCAC(SEQ ID NO.5);
DE Cas9-R:AACTGAAAGTCCTTTCTG(SEQ ID NO.6);
1)使用NEB突变试剂盒(Q5 Site-Directed Mutagenesis Kit,#E0554S)构建Cas9突变体,首先以Cas9突变体G915F为模版进行PCR扩增,反应如下:
反应条件:98℃,30sec;
98℃,10sec
60℃,20sec
72℃,6.5min
25个循环;
72℃,3min;
2)KLD(Kinase,Ligase&DpnI)处理,反应如下:
反应条件:室温10分钟
3)将2)中的反应产物全部用于感受态细菌Stbl3的转化,在含氨苄抗生素(Amp,100mg/L)LB平板培养过夜,37℃。挑取单克隆,质粒提取后送测序,其中正确的核酸酶DECas9的核苷酸序列如SEQ ID No.3所示。
此外,参照上述构建方法对SpCas9进行随机突变获得的突变体E766A+R780A,E766A+G915F,E766A+F916P,E766A+△F916,E766A+R919P,E766A+Q920P,E766A+R976A,G915F+F916P,G915F+△F916,G915F+R919P,G915F+Q920P,F916P+R919P,F916P+Q920P,F916P+R976A,△F916+R919P,△F916+Q920P,△F916+R976A,R919P+Q920P,R919P+R976A,Q920P-R976A作为对照,这些对照突变体与本发明的DE Cas9的序列均不同。
2.Cas9核酸酶突变体进行DNA片段编辑
(1)针对ATN1,构建sgRNAs。
所述sgRNAs靶向序列:
ATN1 sgRNA4:GGTGATGTGTTGAGACTGGT(SEQ ID NO.7);
ATN1 sgRNA5:GATGTGTTGAGACTGGTGGG(SEQ ID NO.8);
从生工生物工程(上海)股份有限公司购买针对ATN1的sgRNAs靶向序列的有5’悬挂端“ACCG”和“AAAC”可以互补配对的正反向脱氧寡核苷酸。
(2)获得互补配对的带有悬挂端的双链DNA
1)用ddH2O将脱氧寡核苷酸溶解至100μM,并稀释至20μM;
2)将正反脱氧寡核苷酸加入如下反应体系:
反应条件:95℃水浴,5min,然后打开水浴锅盖子温度降至60℃左右,盖上盖子冷却至室温。
(3)酶切pGL3-U6-sgRNA-PGK-Puro vector
1)用BsaI限制性内切酶酶切载体质粒,反应体系如下:
反应条件:37℃,1.5小时;
2)胶回收纯化DNA酶切片段,按照胶回收试剂盒(Axygen)说明纯化。
(4)连接酶切后的载体与带有悬挂端的双链DNA
连接体系如下:
反应条件:室温反应1.5小时;
(5)转化连接产物
用Stbl3感受态转化连接产物,在含氨苄抗生素(Amp,100mg/L)LB平板培养过夜,37℃。
(6)挑取单克隆测序
1)从氨苄抗生素LB平板上挑取单菌落,LB(Amp,100mg/L)液体培养过夜;
2)质粒提取,按照质粒小抽试剂盒(Axygen)说明提取;
3)提取后的质粒送擎科生物科技有限公司测序。
(7)测序成功质粒进行中抽
1)测序成功的质粒用Stbl3感受态重新转化,在含Amp(100mg/L)的LB平板培养过夜;
2)上午挑取单菌落在2ml LB(Amp,100mg/L)液体培养基中培养8小时,然后转接到200ml LB(Amp,100mg/L)液体培养基中培养过夜;
3)收集细菌,按照质粒中抽试剂盒(Qiagen)说明提取质粒。
(8)用Lipofectamine 3000进行细胞转染
1)HEK293T细胞培养在培养瓶中,在37℃,含有5%CO2细胞培养箱中培养,待其长至培养瓶80~90%,将长好的细胞在12孔板中用DMEM完全无抗培养基进行铺板,过夜培养;
2)待12孔板中的细胞长至80~90%时,将制备好的Cas9和Cas9突变体质粒(800ng)与sgRNAs质粒(各600ng)通过Lipofectamine 3000进行细胞转染,每个样品各两个重复。
3)转染后两天,收集细胞,用基因组提取试剂盒(Genomic DNAPurification kit,Promega)提取基因组。
(9)制备高通量测序文库
在DNA片段预期删除接头的精准连接位点下游大约30bp处设计引物,然后将引物5’端加上带有barcode的Illumina的测序接头,上游引物可以设计在远离拼接位点一些的位置并加上Illumina的测序接头,进行PCR扩增,然后使用beads进行纯化,DNA产物溶解在水中,等量混合后形成库,进行高通量测序。
(10)高通量测序数据处理
上述结果如下,采用单sgRNA及Cas9核酸酶对基因组DNA片段进行编辑时,Cas9核酸酶在sgRNA介导下对基因组DNA双链进行切割产生两个断裂末端,这些断裂末端(DSB)在细胞修复系统的作用下可能产生Indel。而后,我们检测到了DNA片段修复情况,再利用高通量测序技术检测DNA片段连接接头的情况,除了与预期相符的精准连接(Joinedprecisely)外,DNA片段连接接头处存在一定比例的indel,对indel的种类进行分析。
野生型SpCas9核酸酶(简称Cas9WT,WT)和DE Cas9以及其他Cas9突变体E766A+R780A,E766A+G915F,E766A+F916P,E766A+△F916,E766A+R919P,E766A+Q920P,E766A+R976A,G915F+F916P,G915F+△F916,G915F+R919P,G915F+Q920P,F916P+R919P,F916P+Q920P,F916P+R976A,△F916+R919P,△F916+Q920P,△F916+R976A,R919P+Q920P,R919P+R976A,Q920P+R976A在sgRNA的介导下对基因组ATN1位点进行编辑。利用高通量测序检测该位点的编辑结果,并统计编辑结果的比例(图1和图2),统计结果如表1所示:
表1:sgRNA4/sgRNA5介导ATN1位点产生Deletion占比
由上可知,在sgRNA的介导下,DE Cas9介导的DSB产生的deletion比例皆远高于WTCas9,说明DE Cas9核酸酶突变体对与sgRNA非互补的DNA链进行切割时,在PAM上游切割引发MMEJ修复途径比例明显提高,因此我们从中优选DE Cas9作为碱基删除核酸酶突变体。相比于SpCas9核酸酶(Cas9WT)、G915F核酸酶突变体、R976A核酸酶突变体,DE Cas9核酸酶突变体介导的DSB引起碱基删除的占比显著提高,在sgRNA4位点中,deletion在Cas9 WT中占31.30%,在G915F中占44.33%,在R976A中占52.75%,在DE Cas9中占56.68%;在sgRNA5位点中,deletion在Cas9 WT中占46.42%,在G915F中占43.82%,在R976A中占46.50%,在DECas9中占73.60%(图3和图4)。
除了deletion的比例改变,DE Cas9核酸酶突变体改变了Cas9的切割和修复模式(图5和图6),修复结果发生的变化如图所示,详细分析数据,也发现了DNA编辑indel中insertion的比例明显降低。如图7和图8及表2所示:
表2
选用的Cas9核酸酶 sgRNA4位点Insertion占比 sgRNA5位点Insertion占比
WT Cas9 66.61% 52.38%
G915F 52.20% 53.75%
R976A 45.33% 47.15%
DE Cas9 30.03% 23.75%
由上述结果可知,在sgRNA4位点中Insertion占比比例,在SpCas9核酸酶(Cas9WT)中占66.61%,在G915F核酸酶突变体中占52.20%,在R976A核酸酶突变体中占45.33%,相比之下,在DE Cas9核酸酶突变体中仅仅只占30.03%。在sgRNA5位点中Insertion占比比例,在SpCas9核酸酶(Cas9WT)中占52.38%,在G915F核酸酶突变体中占53.75%,在R976A核酸酶突变体中占47.15%,相比之下,在DE Cas9核酸酶突变体中仅仅只占23.75%。因此我们认为,在DE Cas9核酸酶突变体的切割下,该位点的切割和修复模式更倾向DNA片段的缺失,而非导致碱基插入的修复结果,因此DNA片段的缺失取代碱基加入,成为占据编辑结果的主导地位。
综上所述,本发明的Cas9核酸酶(DE Cas9)与野生型Cas9核酸酶相比,对目的基因组DNA片段进行切割产生的修复结果不同。采用本发明的Cas9核酸酶(DE Cas9)可以实现对目的基因组DNA片段特定位置的切割并产生更大比例的deletion,减少indel比例中的insertion,进而可实现特定位置的精准DNA片段编辑。
以上的实施例是为了说明本发明公开的实施方案,并不能理解为对本发明的限制。此外,本文所列出的各种修改以及发明中方法的变化,在不脱离本发明的范围和精神的前提下对本领域内的技术人员来说是显而易见的。虽然已结合本发明的多种具体优选实施例对本发明进行了具体的描述,但应当理解,本发明不应仅限于这些具体实施例。事实上,各种如上所述的对本领域内的技术人员来说显而易见的修改来获取发明都应包括在本发明的范围内。

Claims (12)

1.一种Cas9核酸酶,其特征在于,所述Cas9核酸酶包含野生型Cas9核酸酶在第915位和/或第976位发生一种或多种氨基酸突变所形成的多肽;所述野生型Cas9核酸酶的氨基酸序列如SEQ ID No.2所示。
2.根据权利要求1所述的Cas9核酸酶,其特征在于,所述氨基酸突变包含如下特征中的一种或多种:
I)甘氨酸突变为谷氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、苯丙氨酸、天门冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、赖氨酸、精氨酸或组氨酸;优选地,甘氨酸突变为苯丙氨酸;
II)精氨酸突变甘氨酸、谷氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、天门冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、赖氨酸、苯丙氨酸或组氨酸;优选地,精氨酸突变为丙氨酸。
3.根据权利要求1所述的Cas9核酸酶,其特征在于,所述Cas9核酸酶包含氨基酸序列如SEQ ID No.1的多肽。
4.一种分离的多核苷酸,其特征在于,所述多核苷酸编码如权利要求1-3任一所述的Cas9核酸酶。
5.根据权利要求4所述的多核苷酸,其特征在于,所述多核苷酸包含核苷酸序列如SEQIDNo.3所示的核酸片段。
6.一种表达载体,其特征在于,所述表达载体包含如权利要求4-5任一所述的多核苷酸和质粒骨架。
7.一种基因编辑系统,其特征在于,所述基因编辑系统包含如权利要求1-3任一所述的核酸酶,以及gRNA或编码gRNA的核酸片段;或,包含如权利要求4-5任一所述的多核苷酸,以及gRNA或编码gRNA的多核苷酸;或,包括如权利要求6所述表达载体,以及gRNA或编码gRNA的多核苷酸。
8.一种细胞,其特征在于,所述细胞含有如权利要求4-5任一所述的多核苷酸、如权利要求6所述的表达载体或如权利要求7所述的基因编辑系统。
9.如权利要求1-3任一所述的核酸酶、如权利要求4-5任一所述的多核苷酸、如权利要求6所述的表达载体或如权利要求7所述的基因编辑系统在离体细胞或无细胞环境中对靶基因进行基因编辑或制备基因编辑工具中的用途。
10.根据权利要求9所述的用途,其特征在于,所述基因编辑的功能选自基因切割、基因删除、基因插入、点突变、转录抑制或转录激活中的一种或多种。
11.一种体外的基因编辑方法,其特征在于,所述基因编辑方法为:将靶基因与如权利要求7所述的基因编辑系统接触,以实现靶基因的编辑。
12.根据权利要求11所述的基因编辑方法,其特征在于,以野生型Cas9核酸酶产生DNA缺失的效率为基准,所述基因编辑方法为如权利要求1-3任一所述的Cas9核酸酶对DNA双链进行切割产生突出断裂末端,以产生更大比例的DNA缺失,更少比例DNA插入的方法。
CN202410236233.5A 2024-03-01 2024-03-01 Cas9核酸酶及其制备方法和用途 Pending CN118048343A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410236233.5A CN118048343A (zh) 2024-03-01 2024-03-01 Cas9核酸酶及其制备方法和用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410236233.5A CN118048343A (zh) 2024-03-01 2024-03-01 Cas9核酸酶及其制备方法和用途

Publications (1)

Publication Number Publication Date
CN118048343A true CN118048343A (zh) 2024-05-17

Family

ID=91053341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410236233.5A Pending CN118048343A (zh) 2024-03-01 2024-03-01 Cas9核酸酶及其制备方法和用途

Country Status (1)

Country Link
CN (1) CN118048343A (zh)

Similar Documents

Publication Publication Date Title
US20230383290A1 (en) High-throughput precision genome editing
CN105646719B (zh) 一种高效定点转基因的工具及其应用
JP6190995B2 (ja) 簡便で高効率の遺伝子改変非ヒト哺乳動物の作製方法
EP3152312B1 (en) Methods and compositions for modifying a targeted locus
CN111742051A (zh) 延伸的单向导rna及其用途
US11713471B2 (en) Class II, type V CRISPR systems
JP2020120662A (ja) ヌクレアーゼ媒介dnaアセンブリ
CN110551759B (zh) 一种提高转基因细胞重组效率的组合物及方法
JP2019526248A (ja) プログラム可能cas9−リコンビナーゼ融合タンパク質およびその使用
EP3536796A1 (en) Gene knockout method
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
JP6958917B2 (ja) 遺伝子ノックイン細胞の作製方法
KR20190008998A (ko) Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법
EP3546575A1 (en) Genome editing method
JP7029741B2 (ja) ゲノム編集方法
JP2023540797A (ja) 塩基編集酵素
WO2023206871A1 (zh) 一种优化的CRISPR/SpCas12f1系统、工程化向导RNA及其应用
CN118048343A (zh) Cas9核酸酶及其制备方法和用途
CN118048344A (zh) 核酸酶及其制备方法和用途
EP3666898A1 (en) Gene knockout method
EP3775201B1 (en) Methods for scarless introduction of targeted modifications into targeting vectors
KR102515727B1 (ko) 중첩된 가이드핵산을 이용한 표적 핵산에 특정 핵산 서열을 삽입하기 위한 조성물 및 방법
WO2024055664A1 (zh) 一种优化的向导RNA、CRISPR/AcC2C9基因编辑系统及基因编辑方法
US20230295667A1 (en) Use of anti-crispr agents to control editing in human embryos
WO2023206872A1 (zh) 一种工程优化的核酸酶、向导rna、编辑系统和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination