CN112159801A - SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用 - Google Patents

SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用 Download PDF

Info

Publication number
CN112159801A
CN112159801A CN202011003871.0A CN202011003871A CN112159801A CN 112159801 A CN112159801 A CN 112159801A CN 202011003871 A CN202011003871 A CN 202011003871A CN 112159801 A CN112159801 A CN 112159801A
Authority
CN
China
Prior art keywords
sequence
slugcas9
gene editing
dna
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011003871.0A
Other languages
English (en)
Other versions
CN112159801B (zh
Inventor
王永明
胡子英
王帅
高思琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Publication of CN112159801A publication Critical patent/CN112159801A/zh
Application granted granted Critical
Publication of CN112159801B publication Critical patent/CN112159801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请涉及基因编辑技术领域,具体公开一种SlugCas9‑HF蛋白、含有该蛋白的重组载体、CRISPR/Cas9‑HF基因编辑系统及应用等。所述SlugCas9‑HF蛋白具有SEQ ID NO:1所示氨基酸序列或具有与SEQ ID NO:1至少80%相同、且至少保留了R247A、N415A、T421A及R656A中的一种或两种以上突变的氨基酸序列,所述该蛋白的重组载体是将编码SlugCas9‑HF蛋白氨基酸的基因序列连接到基础载体上而得,CRISPR/Cas9‑HF基因编辑系统由SlugCas9‑HF蛋白和sgRNA组成,其可以高特异性编辑靶基因,编辑效率高,脱靶率在2.87%以内。

Description

SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及 应用
技术领域
本申请属于基因编辑技术领域,具体涉及一种SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及其相关应用。
背景技术
CRISPR/Cas9是细菌和古细菌为抵御外源病毒或质粒入侵而进化的一种获得性免疫系统。在CRISPR/Cas9系统中,crRNA(CRISPR-derived RNA)、tracrRNA(trans-activating RNA)以及Cas9蛋白形成复合体后,识别靶位点的PAM(Protospacer AdjacentMotif)序列,crRNA会与靶向DNA序列形成互补结构,Cas9蛋白行使切割DNA的功能,使DNA发生断裂损伤。其中,tracrRNA和crRNA通过连接序列可以融合成为单链指导RNA(singleguide RNA,sgRNA)。当DNA发生断裂损伤后,细胞内的两种主要DNA损伤修复机制负责修复:非同源末端连接(Non-homologous end-joining,NHEJ)和同源重组(homologousrecombination,HR)。NHEJ修复的结果会引起碱基的缺失或插入,可以进行基因敲除;在提供同源模板的情况下,利用HR修复可以进行基因的定点插入和碱基的精确替换。
除了基础科研外,CRISPR/Cas9还具有广泛的临床应用前景。利用CRISPR/Cas9系统做基因治疗时,需要把Cas9和sgRNA导入到体内。目前做基因治疗最有效的表达载体是AAV病毒。但是AAV病毒包装的DNA一般不超过4.5kb。SpCas9因为PAM序列简单(识别NGG)和活性高而得到广泛应用。但是SpCas9蛋白有1368个氨基酸,加上sgRNA和启动子,无法有效的包装到AAV病毒中,限制了其在临床中的应用。为了克服这个问题,几个小的Cas9被发明出来了,包括SaCas9(PAM序列为NNGRRT);St1Cas9(PAM序列为NNAGAW);NmCas9(PAM序列为NNNNGATT);Nme2Cas9(PAM序列为NNNNCC);CjCas9(PAM序列为NNNNRYAC),但是这些Cas9或者容易脱靶(即非靶向位点切割),或者PAM序列复杂,或者编辑活性低,难以广泛应用。因此,寻找编辑活性高、特异性高,PAM序列简单的小型CRISPR/Cas9系统是解决上述问题的希望所在。
发明内容
针对上述问题,本申请提供一种SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用。
第一方面,本申请提供一种SlugCas9-HF蛋白,采用如下的技术方案:
一种SlugCas9-HF蛋白,是氨基酸修饰蛋白,在SlugCas9上引入R247A,N415A,T421A,R656A突变而得到的,所述的SlugCas9蛋白属于路邓葡萄球菌属(Staphylococcuslugdunensis),所述SlugCas9蛋白的UniProt的检索号为A0A133QCR3;
所述SlugCas9-HF蛋白为Staphylococcus lugdunensis Cas9-HiFi,为1054个氨基酸,其具有SEQ ID NO:1所示的氨基酸序列,或具有与SEQ ID NO:1所示至少80%相同、且至少保留了R247A、N415A、T421A及R656A中的一种或两种以上突变;
所述SlugCas9-HF蛋白包括无切割活性、或仅具有单链切割活性、或具有双链切割活性的SlugCas9-HF蛋白。
本申请同时还提供一种DNA序列,该DNA序列编码上述SlugCas9-HF蛋白的氨基酸序列。
通过采用上述技术方案,本申请的一种SlugCas9-HF蛋白,由于相比于相关技术中已有的Cas9蛋白,本申请的SlugCas9-HF蛋白仅为1054个氨基酸,其具有的氨基酸数更少,因此可以有效地包装到腺相关病毒载体中,从而解决了相关技术中由于Cas9较大而无法与sgRNA一起包装到腺相关病毒中的问题。
进一步,通过采用上述技术方案,本申请的一种SlugCas9-HF蛋白,由于其属于氨基酸修饰蛋白,即在相关技术中的SlugCas9上引入R247A,N415A,T421A,R656A突变而得到的,因此其制备方便,容易获得。
第二方面,本申请提供一种DNA序列,其编码SlugCas9-HF蛋白的氨基酸序列:优选所述的DNA序列具有如SEQ ID NO:2所示的核苷酸序列。
通过采用上述技术方案,本申请的一种DNA序列可以成功的编码SlugCas9-HF蛋白的氨基酸序列,优选的SEQ ID NO:2序列为SlugCas9-HF蛋白在人细胞中高表达的基因序列。
第三方面,本申请提供一种表达SlugCas9-HF蛋白的重组载体,采用如下的技术方案:
上述的表达SlugCas9-HF蛋白的重组载体,通过包括如下步骤的方法制备而成:
(1)、根据SlugCas9基因在UniProt上的检索号A0A133QCR3,下载其氨基酸序列,并引入R247A,N415A,T421A,R656A突变,突变后编码SlugCas9-HF蛋白的氨基酸序列;
(2)、将编码SlugCas9-HF蛋白的氨基酸序列进行密码子优化,得到编码SlugCas9-HF蛋白的基因序列,本申请的优选实施例中,在人细胞中高表达编码SlugCas9-HF蛋白的基因序列如SEQ ID NO:2所示;
(3)、将编码SlugCas9-HF蛋白的基因序列进行基因合成,然后构建至基础载体上,得到表达SlugCas9-HF蛋白的重组载体;
上述的基础载体为质粒、慢病毒、逆转录病毒、腺病毒或腺相关病毒,本申请仅以基础载体为pAAV2_ITR质粒进行举例说明,但不限制其他载体在本申请中的应用。
通过采用上述技术方案,本申请的一种表达SlugCas9-HF蛋白的重组载体,由于该重组载体含有编码SlugCas9-HF蛋白的基因序列并可进一步连接表达sgRNA的序列形成新的表达载体,然后将该新的表达载体递送到细胞中即可实现基因编辑,另外该新的表达载体可包装成腺相关病毒感染细胞进行基因编辑,因此,使用该含有SlugCas9-HF蛋白的重组载体可用于进行简单快捷的基因编辑操作。
第四方面,本申请提供一种含有上述的SlugCas9-HF蛋白的CRISPR/Cas9基因编辑系统,以下简称为CRISPR/Cas9-HF基因编辑系统,采用如下的技术方案:
一种CRISPR/Cas9-HF基因编辑系统,由SlugCas9-HF蛋白和single guide RNA(以下简称sgRNA)组成,其通过SlugCas9-HF蛋白和sgRNA共同作用实现对靶向DNA的识别、定位、切割和基因编辑;
所述sgRNA为在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列的最前面增加21个碱基得到核苷酸序列M或核苷酸序列N,所述增加的21个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合,本申请仅以3个在如SEQ ID NO:3所示的核苷酸序列的最前面增加21个碱基得到的核苷酸序列M进行举例说明,所得的3个核苷酸序列M的序列分别如SEQID NO:5(AGAGTAGGCTGGTAGATGGAG)、SEQ ID NO:6(GTCAGACATGAGATCACAGAT)和SEQ ID NO:7(GGCTCGGAGATCATCATTGCG)所示,但并不限制在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列的最前面增加其他任意由A、T、C或G四种碱基中的任何一种随机组合而成的21个碱基而得到核苷酸序列M或核苷酸序列N的应用;
或为与核苷酸序列M或核苷酸序列N至少80%相同的核苷酸序列;
或为基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列;
所述的基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列包括但不限定于基于核苷酸序列M或核苷酸序列N进行碱基磷酸化、碱基硫化、碱基甲基化或碱基羟基化、序列的缩短、序列的加长而得到的核苷酸序列。
通过采用上述技术方案,本申请的一种CRISPR/Cas9-HF基因编辑系统,由于SlugCas9-HF蛋白识别的PAM序列更简单,由此可以靶向基因组中更多的DNA序列,实现更多的基因编辑。
第五方面,本申请提供一种上述的CRISPR/Cas9-HF基因编辑系统在细胞内或体外环境中对靶向DNA进行基因编辑的应用,采用如下的技术方案:
上述的CRISPR/Cas9-HF基因编辑系统在细胞内或体外环境中对靶向DNA进行基因编辑的应用,其中所述的基因编辑包括对靶向DNA的基因敲除、定点碱基的改变、定点插入、基因转录水平的调控、DNA甲基化调控、DNA乙酰化修饰、组蛋白乙酰化修饰、碱基转换、引导编辑或染色质成像追踪等;其中所述碱基转换包括但不限定于碱基腺嘌呤到鸟嘌呤、或胞嘧啶到胸腺嘧啶、或胞嘧啶到尿嘧啶、或其它碱基之间的转换;
所述的靶向DNA为在GG碱基的前面增加23个核苷酸而得到的核苷酸序列,所述的23个核苷酸为A、T、C或G四种碱基中的任何一种随机组合而成,本申请仅以哺乳动物细胞HEK293T细胞中两个内源靶向DNA的序列如SEQ ID NO:8或SEQ ID NO:9所示为例进行说明,不限制其他的靶向DNA;
上述的细胞所述的细胞为真核细胞或原核细胞;
所述真核生物细胞包括哺乳动物细胞、植物细胞或酵母细胞;
所述哺乳动物细胞包括中国仓鼠卵巢细胞、幼仓鼠肾细胞、小鼠Sertoli细胞、小鼠乳腺瘤细胞、buffalo大鼠肝细胞、大鼠肝瘤细胞、由SV40转化的猴肾CVI系、猴肾细胞、犬肾细胞、人宫颈癌细胞、人肺细胞、人肝细胞、HIH/3T3细胞、人U2-OS骨肉瘤细胞、人A549细胞、人K562细胞、人HEK293细胞、人HEK293T细胞、人HCT116细胞或人MCF-7细胞,但是不限于此。
上述的CRISPR/SlugCas9-HF基因编辑系统对靶向DNA进行基因编辑的工作原理示意图图1所示,其中灰色椭圆形表示SlugCas9-HF蛋白,黑色弯曲状表示sgRNA序列,基因组上链中加深区域表示PAM序列,其工作过程具体如下:
首先由CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白识别细胞中待编辑或体外待切割的靶向DNA上的PAM序列,然后CRISPR/Cas9-HF基因编辑系统中的sgRNA中的5’端20bp或21bp序列与细胞内中待编辑或体外待切割的靶向DNA序列形成碱基互补配对,然后CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白对靶向DNA上的靶位点进行切割,使靶向DNA发生双链断裂,从而完成对靶向DNA进行的靶向切割;
所述的靶向DNA序列上的PAM序列为靶向DNA的核苷酸序列中的最后面4个核苷酸组成的序列;
当处于细胞中时,靶向DNA经切割、双链断裂后进一步通过细胞内的非同源末端连接修复或同源重组修复途径进行修复,从而实现CRISPR/Cas9-HF基因编辑系统对细胞中的靶向DNA进行的基因编辑。
上述的CRISPR/SlugCas9-HF基因编辑系统,由于可以根据待编辑的靶向DNA的核苷酸序列的需要,设计出能够与特定编辑需求的待编辑的靶向DNA的核苷酸序列进行碱基互补配对的sgRNA,因此原则上可以实现对任何基因的编辑,进一步,可以通过对sgRNA进行本领域所熟知的修饰,所述修饰包括但不限定于碱基的磷酸化、sgRNA序列的缩短、sgRNA序列的加长、碱基的硫化、碱基的甲基化、碱基的羟基化,从而进一步实现特定编辑需求的基因编辑。
上述的CRISPR/Cas9-HF基因编辑系统,能精确定位靶向DNA的核苷酸序列,并产生切割,使DNA发生双链断裂损伤,当处于细胞中时,通过细胞内的DNA损伤修复机制即非同源末端连接修复或同源重组修复途径进行修复,最终对细胞中靶向DNA实现基因编辑;
上述的CRISPR/Cas9-HF基因编辑系统精确定位靶向DNA的核苷酸序列,除了是指CRISPR/Cas9-HF基因编辑系统识别并结合靶向DNA的核苷酸序列,还可以是指CRISPR/Cas9-HF基因编辑系统将与SlugCas9-HF蛋白融合的其他蛋白或特异性识别sgRNA的蛋白带至靶向DNA的位置;
进一步,上述的精确定位靶向DNA的核苷酸序列是指CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白识别靶向DNA的核苷酸序列的3’端上的PAM序列后,CRISPR/Cas9-HF基因编辑系统中的sgRNA中的5’端20bp或21bp序列与靶向DNA的核苷酸序列形成碱基互补配对结构;;
进一步,上述的CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白还识别细胞中非靶向DNA上的PAM序列,然后sgRNA中的5’端20bp或21bp序列与细胞中非靶向DNA的核苷酸序列形成不完全碱基互补配对结构;
所述的非靶向DNA上的PAM序列与上述的靶向DNA上的PAM序列相同;
所述不完全碱基互补配对结构包括碱基配对结构和碱基错配结构(mismatch)或碱基凸出结构(bulge)等其他结构。在本申请中,所述非靶向DNA的核苷酸序列与sgRNA存在两个及两个以上碱基错配;
但是上述的CRISPR/Cas9-HF基因编辑系统对于含有不同碱基错配的非靶向DNA的核苷酸序列有较低的容忍度,所述的具有较低的容忍度是指CRISPR/Cas9-HF基因编辑系统极少或不能识别并结合非靶向DNA的核苷酸序列,或是指CRISPR/Cas9-HF基因编辑系统极少或不能将与SlugCas9-HF蛋白融合的其他蛋白或特异性识别sgRNA的蛋白带至非靶向DNA的核苷酸序列;
上述的非靶向DNA的核苷酸序列与靶向DNA的核苷酸序列的碱基数量相同,即都是在GG碱基的前面增加23个核苷酸组成的核苷酸序列,但是靶向DNA和非靶向DNA的核苷酸是不一致的。
上述的CRISPR/Cas9-HF基因编辑系统对靶向DNA进行基因编辑后,可以通过基因合成、分子克隆、细胞转染、PCR产物深度测序、流式细胞分析技术、生物信息学分析等技术检测出CRISPR/Cas9-HF基因编辑系统对靶向DNA的编辑效率及脱靶率,在本申请的优选实施例中,利用CRISPR/Cas9-HF基因编辑系统对哺乳动物细胞HEK293T中的靶向DNA进行基因编辑,特别是对哺乳动物HEK293T细胞中两个内源的靶向DNA进行基因编辑时,其编辑效率可达34.9%及51.6%。
上述哺乳动物HEK293T细胞中的两个内源序列的靶向DNA分别为如SEQ ID NO:8和SEQ ID NO:9所示的核苷酸序列。
进一步,本申请仅以哺乳动物细胞HEK293T中两个内源的靶向DNA的基因编辑进行举例说明,不作为CRISPR/Cas9-HF基因编辑系统对细胞内或体外环境中任何其他基因进行的基因编辑的限制。
上述的编辑效率是指CRISPR/Cas9-HF基因编辑系统在细胞中对靶向DNA进行编辑后,通过二代测序计算靶位点发生编辑的reads数在测序总reads数所占百分比作为CRISPR/Cas9-HF基因编辑系统对靶向DNA进行基因编辑的编辑效率,或是指CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统的HEK293T细胞系中对靶向DNA进行基因编辑后,通过流式分析计算得到的GFP阳性细胞百分比。
所述的脱靶率指CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白和含有碱基错配的mismatch sgRNA在含有靶向DNA的GFP报告系统的HEK293T细胞系中对靶向DNA进行基因编辑后,通过流式分析计算得到的GFP阳性细胞百分比。在本申请的一个优选实施例中,当CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统的HEK293T细胞系中对靶向DNA进行编辑后,编辑效率为17.6%,脱靶率在2.87%以内。
上述的一种CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统的HEK293T细胞系中检测其特异性的方法,包括通过SlugCas9-HF蛋白和识别靶向DNA序列的sgRNA(靶向DNA序列的sgRNA以下称为On-target sgRNA)或通过SlugCas9-HF蛋白和含有不同碱基错配的sgRNA(含有不同碱基错配的sgRNA以下称为mismatch sgRNA)识别定位含有靶向DNA的GFP报告系统的HEK293T细胞系中的靶向DNA序列并对靶向DNA序列进行基因编辑,通过流式分析统计GFP阳性细胞百分比,分别计算编辑效率和脱靶率,从而评估该CRISPR/Cas9-HF基因编辑系统的特异性,具体步骤为:
(1)、合成On-target sgRNA对应的寡核苷酸单链DNA;
合成含有不同碱基错配的sgRNA即mismatch sgRNA对应的寡核苷酸单链DNA,分别退火后连接至质粒pAAV2_SlugCas9-HF_ITR的BsaI酶切位点,分别得到表达SlugCas9-HF蛋白、On-target sgRNA的载体和表达SlugCas9-HF蛋白、mismatch sgRNA的载体,即为pAAV2_SlugCas9-HF-hU6-On target sgRNA质粒和pAAV2_SlugCas9-HF-hU6-mismatch sgRNA质粒;
(2)、将表达SlugCas9-HF蛋白、On-target sgRNA的载体及表达SlugCas9-HF蛋白、mismatch sgRNA的载体分别转染至含有靶向DNA的GFP报告系统的HEK293T细胞系中进行基因编辑;
上述的含有靶向DNA的GFP报告系统的HEK293T细胞系是指在起始密码子ATG和GFP编码序列之间插入特定的靶向DNA序列及PAM序列,造成GFP移码突变,然后通过慢病毒感染整合到HEK293T细胞中,得到含有靶向DNA的GFP报告系统的HEK293T细胞系;
该含有靶向DNA的GFP报告系统的HEK293T细胞系包含CMV-ATG-target site-CTGG-GFP核苷酸序列,该CMV-ATG-target site-CTGG-GFP核苷酸序列如SEQ ID NO:10所示,进一步,CMV-ATG-target site-CTGG-GFP核苷酸序列中的target site即靶位点的序列为如SEQ IDNO:11所示核苷酸序列;
(3)、将编辑后的含有靶向DNA的GFP报告系统的HEK293T细胞系进行流式分析统计GFP阳性细胞比率,分别计算CRISPR/Cas9-HF基因编辑系统的编辑效率及脱靶率。
当上述CRISPR/Cas9-HF基因编辑系统对靶向DNA进行切割后,细胞通过自身修复系统会使部分细胞恢复GFP阅读框,产生绿色荧光,通过流式分析统计GFP阳性细胞比率可以评估CRISPR/Cas9-HF基因编辑系统的编辑能力及特异性。
通过采用上述技术方案,本申请的一种CRISPR/Cas9-HF基因编辑系统在细胞或体外环境中对靶基因进行基因编辑,通过识别定位靶向DNA序列来对该靶向DNA序列进行基因编辑,该基因编辑系统由于SlugCas9-HF蛋白小、PAM序列简单,编辑活性高且脱靶率低,因此具有高效特异的优点。本申请通过实验验证该基因编辑系统对HEK293T细胞中内源的两个靶向DNA的编辑效率可达34.9%及51.6%,并且在GFP报告系统HEK293T细胞系中检测该基因编辑系统的编辑效率和脱靶率,可以看出CRISPR/Cas9-HF基因编辑系统相比于对照所用的CRISPR/Cas9基因编辑系统对基因的编辑活性高,其编辑效率相对提高了2.4%,脱靶率相对降低了5.89%,最高脱靶率仅为2.87%。由此进一步表明了本申请的CRISPR/Cas9-HF基因编辑系统可以高特异性编辑靶基因,具有编辑效率高、脱靶率低的特点,其可广泛应用于细胞中的基因编辑。
第五方面,本申请提供一种用于基因编辑的试剂盒,采用如下的技术方案:
一种用于基因编辑的试剂盒,包括SlugCas9-HF蛋白、表达载体、sgRNA;
所述的表达载体为含有编码SlugCas9-HF蛋白的DNA序列的质粒、慢病毒、逆转录病毒、腺病毒或腺相关病毒载体;所述的表达有SlugCas9-HF蛋白的载体优选为pAAV2_SlugCas9-HF_ITR质粒;
所述sgRNA为在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列的最前面积增加21个碱基得到核苷酸序列M或核苷酸序列N,所述的增加的21个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合;
或为与核苷酸序列M或核苷酸序列N至少80%相同的核苷酸序列;
或为基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列;
本申请仅以3个在如SEQ ID NO:3所示的核苷酸序列的最前面增加21个碱基得到的核苷酸序列M进行举例说明,所得的3个核苷酸序列M的序列分别如SEQ ID NO:5(AGAGTAGGCTGGTAGATGGAG)、SEQ ID NO:6(GTCAGACATGAGATCACAGAT)和SEQ ID NO:7(GGCTCGGAGATCATCATTGCG)所示,但并不限制在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列的最前面增加其他任意由A、T、C或G四种碱基中的任何一种随机组合而成的21个碱基而得到核苷酸序列M或核苷酸序列N的应用。
通过采用上述技术方案,本申请的一种基因编辑试剂盒,由于包含SlugCas9-HF蛋白、sgRNA及表达有SlugCas9-HF蛋白的表达载体,即具有进行基因编辑所需的所有组分,同时由于该试剂盒包含SlugCas9-HF蛋白小、可识别的靶向DNA的核苷酸序列的PAM序列简单,编辑活性高且脱靶率低,因此可用于实现高效特异的基因编辑。且可以根据待编辑的靶向DNA的核苷酸序列的需要,设计出能够与特定编辑需求的待编辑的靶向DNA的核苷酸序列进行碱基互补配对的sgRNA,因此原则上本申请的基因编辑试剂盒可以实现对任何基因的编辑。
综上所述,本申请的有益技术效果如下:
本申请的一种SlugCas9-HF蛋白,相比于相关技术中已有的Cas9蛋白,SlugCas9-HF蛋白仅为1054个氨基酸,其具有的氨基酸数更少,因此可以有效地包装到腺相关病毒载体中,从而解决了相关技术中由于Cas9较大而无法与sgRNA一起包装到腺相关病毒中的问题。
进一步,本申请的一种CRISPR/Cas9-HF基因编辑系统,由于SlugCas9-HF蛋白识别的PAM序列更简单,由此可以靶向基因组中更多的DNA序列,其在含有靶向DNA的HEK293T细胞中,通过二代测序计算该CRISPR/Cas9-HF基因编辑系统对靶位点DNA的编辑效率可达34.9%及51.6%,因此具有编辑效率较高的特点。
进一步,本申请的一种CRISPR/Cas9-HF基因编辑系统,在含有靶向DNA的GFP报告系统HEK293T细胞系中进行了验证,结果发现,该CRISPR/Cas9-HF基因编辑系统可以高特异性对靶向DNA进行编辑,脱靶率低,其最高脱靶率仅为2.87%。
进一步,本申请的一种CRISPR/Cas9-HF基因编辑系统,由于可以根据待编辑的靶向DNA的核苷酸序列的需要,设计出能够与特定编辑需求的待编辑的靶向DNA的核苷酸序列进行碱基互补配对的sgRNA,并一定程度上对sgRNA进行本领域所熟知的修饰,因此可以实现不同环境中不同基因编辑的需求,即在基因编辑领域具有广泛的使用前景。
进一步,本申请一种用于基因编辑的试剂盒,由于其含有的SlugCas9-HF蛋白小、PAM序列简单,编辑活性高且脱靶率低,因此可广泛的使用于基因编辑领域。
附图说明
图1、CRISPR/Cas9-HF基因编辑系统对靶向DNA进行切割的工作原理示意图;
图2、实施例1中的pAAV2_SlugCas9-HF_ITR质粒图谱示意图;
图3、实施例1中HEK293T细胞系中两个内源的靶向DNA序列被CRISPR/Cas9-HF基因编辑系统进行基因编辑后的编辑效率结果示意图;
图4、实施例2中CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统的HEK293T细胞系中的特异性检测结果示意图;
图5、实施例2的对照实施例中CRISPR/Cas9基因编辑系统在含有靶向DNA的GFP报告系统的HEK293T细胞系中的特异性检测结果示意图。
具体实施方式
下面通过具体的实施例并结合附图对本申请进行进一步阐述,但并不限制本申请。
除非特别说明,本申请采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下各实施例所用试剂和材料均为市购。
未注明具体条件的实验方法,通常按照常规条件,或制造厂商所建议条件实施。
实施例1
一种CRISPR/Cas9-HF基因编辑系统,包括SlugCas9-HF蛋白与sgRNA,所述sgRNA为在如SEQ ID NO:3所示的核苷酸序列的最前端分别增加21个碱基AGAGTAGGCTGGTAGATGGAG、GTCAGACATGAGATCACAGAT,分别得到的核苷酸序列M的序列,具体见SEQ ID NO:5、SEQ IDNO:6所示。
上述的一种CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的HEK293T细胞中对靶向DNA进行基因编辑的应用,具体包括如下步骤:
(1)、构建质粒pAAV2_SlugCas9-HF_ITR
①根据SlugCas9基因在UniProt上的检索号A0A133QCR3,下载其氨基酸序列,并做R247A,N415A,T421A,R656A突变,突变后得到编码SlugCas9-HF蛋白的氨基酸序列如SEQ IDNO:1所示;
②将上述所得的编码SlugCas9-HF蛋白的氨基酸序列进行密码子优化,获得在人细胞中高表达的编码SlugCas9-HF蛋白的基因序列,该基因序列如SEQ ID NO:2所示;
③将上述获得的如SEQ ID NO:2所示的编码SlugCas9-HF蛋白的基因序列进行基因合成,并构建至pAAV2_ITR质粒上,得到pAAV2_SlugCas9-HF_ITR质粒;
上述所得的pAAV2_SlugCas9-HF_ITR质粒的图谱示意图如图2所示,其中,包括AAV2ITR、CMV增强子、CMV启动子、SV40 NLS、SlugCas9-HF、nucleoplasmin NLS、3x HA、bGHpoly(A)、人U6启动子(hU6)、BsaI内切酶位点、sgRNA支架序列等元件;
(2)、线性化质粒pAAV2_SlugCas9-HF_ITR的制备
①在酶切体系中,用BsaI限制性内切酶将质粒pAAV2_SlugCas9-HF_ITR进行酶切反应,得到pAAV2_SlugCas9-HF_ITR线性化质粒片段;
上述的酶切线性化反应过程中控制温度37℃、时间为1h;
上述酶切体系中,酶切线性化反应所用的各物质的量,按50μL酶切体系计算,含有1μg质粒pAAV2_SlugCas9-HF_ITR、5μL 10xCutSmart缓冲液(购于NEB公司)、1μL BsaI限制性内切酶(购于NEB公司)和余量的水;
②将上述所得的pAAV2_SlugCas9-HF_ITR线性化质粒片段在体积百分比为1%的琼脂糖凝胶上电泳,电泳过程控制压力为120V、时间为30min;
③然后切除7427bp大小的DNA片段,用胶回收试剂盒(天根生化科技(北京)有限公司,DP209)依据厂家提供的步骤进行回收,最终用超纯水进行洗脱,得到线性化质粒pAAV2_SlugCas9-HF_ITR;
④将回收的线性化质粒pAAV2_SlugCas9-HF_ITR用NanoDropTM Lite分光光度计(Thermo Scientific)测定DNA浓度,备用或置于-20℃进行长期保存;
(3)、sgRNA对应的寡核苷酸单链DNA的合成;
在sgRNA序列最前面21个碱基对应的正义链和反义链上分别加上线性化质粒pAAV2_SlugCas9-HF_ITR两侧对应的粘性末端序列,并合成寡核苷酸单链DNA;
所述sgRNA如SEQ ID NO:5对应的寡核苷酸单链DNA为Oligo-F1:SEQ ID NO:12和Oligo-R1:SEQ ID NO:13所示;所述sgRNA如SEQ ID NO:6对应的寡核苷酸单链DNA为Oligo-F2:SEQ ID NO:14和Oligo-R2:SEQ ID NO:15所示;
(4)、步骤(3)所得的sgRNA对应的寡核苷酸单链DNA分别退火后,退火后将所得的产物分别通过DNA连接酶(购于NEB公司)连接至步骤(1)所得的线性化pAAV2_SlugCas9-HF_ITR质粒上,分别得到对应sgRNA的连接产物;
上述的退火反应,即将1μL 100μM oligo-F,1μL 100μM oligo-R,28μL水,震荡混匀后,放置于PCR仪中运行退火程序;退火程序如下:95℃_5min,85℃_1min,75℃_1min,65℃_1min,55℃_1min,45℃_1min,35℃_1min,25℃_1min,4℃保存,降温速率0.3℃/s;
上述的连接过程按DNA连接酶(购于NEB公司)操作说明书进行;
(5)、取1μL步骤(4)所得的对应sgRNA的连接产物加到大肠杆菌DH5α感受态细胞(购于上海唯地生物技术有限公司)中,冰上孵育30min,42℃热激1min,冰上孵育2min,加入900μLLB培养基,37℃培养1h进行大肠杆菌DH5α感受态细胞的活化复苏;将复苏后的大肠杆菌DH5α感受态细胞涂布在含有对应抗性的LB固体平板在37℃培养箱倒置培养,得到的大肠杆菌DH5α单克隆进行Sanger测序验证;
(6)、将测序验证连接正确的大肠杆菌DH5α,提取质粒,即得到含有表达上述sgRNA序列的质粒pAAV2_SlugCas9-HF-hU6-sgRNA备用;
(7)、将步骤(6)所得的质粒pAAV2_SlugCas9-HF-hU6-sgRNA采用脂质体方式转染至含有两个内源基因的靶向DNA的HEK293T细胞中;
所述的含有两个内源基因的靶向DNA为哺乳动物HEK293T细胞中的两个内源的靶向DNA序列,分别如SEQ ID NO:8和SEQ ID NO:9所示核苷酸序列。
上述的pAAV2_SlugCas9-HF-hU6-sgRNA质粒还可以用同时表达SlugCas9-HF蛋白和sgRNA的逆转录病毒、腺病毒或腺相关病毒等相关载体进行替代;
上述的转染过程包括如下步骤:
①第0天,根据转染所需,将含有靶向DNA的HEK293T细胞在6孔板进行铺板,细胞密度约30%左右;
②第1天,进行转染,转染过程如下:
取2μg待转染质粒pAAV2_SlugCas9-HF-hU6-sgRNA加入至100μLOpti-MEM培养基(购于Gibco公司)中,轻轻吹打混匀,得到稀释液A;
将转染试剂脂质体
Figure BDA0002695236020000121
2000(购于Invitrogen公司)或聚乙烯亚胺(以下简称PEI)(购于polysciences公司)轻弹混匀,吸取5μL
Figure BDA0002695236020000122
2000或PEI加入至的100μL Opti-MEM培养基(购于Gibco公司)中,轻轻混匀,室温静置5min,得到稀释液B;
将上述中得到的稀释液A和稀释液B进行混合,轻轻吹打混匀,得到含有转染试剂和待转染质粒pAAV2_SlugCas9-HF-hU6-sgRNA的混合液C室温静置20min,然后将含有转染试剂和待转染质粒pAAV2_SlugCas9-HF-hU6-sgRNA的混合液C加入到①中含有靶向DNA的HEK293T细胞培养基中,然后置于37℃,体积百分比浓度为5%的CO2培养箱中继续培养3天;
上述转染过程所用的脂质体
Figure BDA0002695236020000123
2000或PEI还可以采用阳离子多聚物、纳米颗粒、多功能信封式纳米或病毒载体等形式进行替换;
(8)、制备二代测序文库
①收集步骤(7)中成功完成转染后的含有靶向DNA的HEK293T细胞,用DNA试剂盒(天根生化科技(北京)有限公司,DP304)并依据该DNA试剂盒提供的步骤提取含有靶向DNA的HEK293T细胞的基因组DNA;
②进行PCR建库第一轮PCR,用2xQ5 Mastermix进行PCR反应,PCR引物F1为在SEQ IDNO:16所示的序列的第33-34个碱基中间插入4个碱基而得到的核苷酸序列,R1为在SEQ IDNO:17所示的序列的第31-32个碱基中间插入4个碱基而得到的核苷酸序列,所述的4个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合,两个内源序列的靶向DNA用同一对引物,反应体系如下:
试剂 25μL体系
10μM F1 1.25μL
10μM R1 1.25μL
2X Q5 master mix 12.5μL
基因组DNA 5μg
ddH<sub>2</sub>O 补足至25μL
PCR运行程序如下:
Figure BDA0002695236020000131
③进行PCR建库第二轮PCR,用2xQ5 Mastermix进行PCR反应,PCR引物如SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20所示,G4位点的一轮PCR产物用SEQ ID NO:18、SEQ ID NO:19所示引物扩增,G7位点的一轮PCR产物用SEQ ID NO:18、SEQ ID NO:20所示引物扩增,反应体系如下:
试剂 25μL体系
10μM F2 1.25μL
10μM R2 1.25μL
2X Q5 master mix 12.5μL
第一轮产物 3μL
ddH<sub>2</sub>O 7μL
PCR运行程序如下:
Figure BDA0002695236020000141
④将第二轮的PCR产物用胶回收试剂盒依据厂家提供的步骤,纯化406bp大小的DNA片段,二代测序文库制备完毕。
将上述所得的二代测序文库在高通量测序仪HiseqXTen(illumina)上进行双端测序,二代测序计算得到两个靶向DNA序列的编辑效率,如图3所示,图3中X轴表示G4和G7两个靶向DNA序列,G4为如SEQ ID NO:8所示核苷酸序列,G7为如SEQ ID NO:9所示核苷酸序列。Y轴表示编辑效率从图3中可以看出,本申请的CRISPR/Cas9-HF基因编辑系统对G4和G7两个靶向DNA的编辑效率分别为34.9%及51.6%,由此表明该CRISPR/Cas9-HF基因编辑系统的编辑活性较高。
实施例2
一种CRISPR/Cas9-HF基因编辑系统,包括通过SlugCas9-HF蛋白和sgRNA(以下称On-target sgRNA,以区别于mismatch sgRNA),还包括含有不同碱基错配的sgRNA,即mismatchsgRNA;
所述的SlugCas9-HF蛋白,其具有SEQ ID NO:1所示的氨基酸序列;
所述的On-target sgRNA为在如SEQ ID NO:3所示的核苷酸序列的最前端增加21个碱基(GGCTCGGAGATCATCATTGCG)得到核苷酸序列M,具体见SEQ ID NO:7。
利用上述的一种CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系检测其特异性,进而统计GFP阳性细胞百分比,从而计算编辑效率及脱靶率,具体包括如下步骤:
(1)、构建质粒pAAV2_SlugCas9-HF_ITR,同实施例1的步骤(1),直至得到质粒pAAV2_SlugCas9-HF_ITR;
(2)、线性化质粒pAAV2_SlugCas9-HF_ITR的制备,同实施例1的步骤(2),直至得到线性化质粒pAAV2_SlugCas9-HF_ITR,备用或置于-20℃进行长期保存;
(3)、On target sgRNA对应的寡核苷酸单链DNA和mismatch sgRNA对应的寡核苷酸单链DNA的合成;
在On target sgRNA或mismatch sgRNA序列最前面21个碱基对应的正义链和反义链上分别加上线性化质粒pAAV2_SlugCas9-HF_ITR两侧对应的粘性末端序列,并合成寡核苷酸单链DNA;
所述On target sgRNA对应的寡核苷酸单链DNA为Oligo-F3(对应的碱基序列见SEQ IDNO:21)和Oligo-R3(对应的碱基序列见SEQ ID NO:42);
所述的mismatch sgRNA对应的寡核苷酸单链DNA为Oligo-F4-23(对应的碱基序列见SEQ ID NO:22-41)和Oligo-R4-23(对应的碱基序列见SEQ ID NO:43-62);
(4)、步骤(3)所得的On target sgRNA对应的寡核苷酸单链DNA和不同mismatch sgRNA对应的寡核苷酸单链DNA分别退火后,退火后将所得的产物分别通过DNA连接酶(购于NEB公司)连接至步骤(2)所得的线性化pAAV2_SlugCas9-HF_ITR质粒上,分别得到对应On targetsgRNA的连接产物和对应不同mismatch sgRNA的连接产物;
上述的退火反应,即将1μL 100μM oligo-F,1μL 100μM oligo-R,28μL水,震荡混匀后,放置于PCR仪中运行退火程序;退火程序如下:95℃_5min,85℃_1min,75℃_1min,65℃_1min,55℃_1min,45℃_1min,35℃_1min,25℃_1min,4℃保存,降温速率0.3℃/s;
上述的连接过程按DNA连接酶(购于NEB公司)操作说明书进行;
(5)、取1μL步骤(4)所得的对应On target sgRNA的连接产物和对应不同mismatchsgRNA的连接产物分别加到大肠杆菌DH5α感受态细胞(购于上海唯地生物技术有限公司)中,冰上孵育30min,42℃热激1min,冰上孵育2min,加入900μL LB培养基,37℃培养1h进行大肠杆菌DH5α感受态细胞的活化复苏;
将复苏后的大肠杆菌DH5α感受态细胞涂布在含有对应抗性的LB固体平板在37℃培养箱倒置培养,得到的大肠杆菌DH5α单克隆进行Sanger测序验证;
(6)、将测序验证连接正确的大肠杆菌DH5α,提取质粒,即分别得到表达上述On targetsgRNA序列的质粒pAAV2_SlugCas9-HF-hU6-On target sgRNA和表达上述不同mismatchsgRNA序列的质粒pAAV2_SlugCas9-HF-hU6-mismatch sgRNA备用;
(7)、将步骤(6)所得的1个表达On target sgRNA序列的质粒pAAV2_SlugCas9-HF-hU6-On target sgRNA和20个表达上述不同mismatch sgRNA序列的质粒pAAV2_SlugCas9-HF-hU6-mismatch sgRNA采用脂质体方式分别转染至含有靶向DNA的GFP报告系统的HEK293T细胞系;
所述的含有靶向DNA的GFP报告系统的HEK293T细胞系指在起始密码子ATG和GFP编码序列之间插入特定的靶向DNA序列及PAM序列,造成GFP移码突变,然后通过慢病毒感染整合到HEK293T细胞中,得到含有靶向DNA的GFP报告系统的HEK293T细胞系,当CRISPR/Cas9-HF基因编辑系统对靶向DNA进行切割后,细胞通过自身修复系统会使部分细胞恢复GFP阅读框,产生绿色荧光,通过流式分析统计GFP阳性细胞比率可以评估基因编辑系统的编辑能力及特异性;
上述的转染过程包括如下步骤:
①第0天,根据转染所需,将含有靶向DNA的GFP报告系统的HEK293T细胞系在6孔板进行铺板,细胞密度控制在30%;
该含有靶向DNA的GFP报告系统的HEK293T细胞系中包含CMV-ATG-target site-CTGG-GFP的核苷酸序列如SEQ ID NO:10所示,CMV-ATG-target site-CTGG-GFP的核苷酸序列中的target site即靶位点的核苷酸序列如SEQ ID NO:11所示核苷酸序列;
②第1天,进行转染,转染过程如下:
分别取2μg待转染质粒pAAV2_SlugCas9-HF-hU6-On target sgRNA或2μg待转染质粒pAAV2_SlugCas9-HF-hU6-mismatch sgRNA加入至100μL Opti-MEM培养基(购于Gibco公司)中,轻轻吹打混匀,记为稀释液A;
Figure BDA0002695236020000161
2000(购于Invitrogen公司)或PEI(购于polysciences公司)轻弹混匀,吸取5μL
Figure BDA0002695236020000162
2000或PEI加入至的100μL Opti-MEM培养基中,轻轻混匀,室温静置5min,得到稀释液B;
将上述中得到的稀释液A和稀释液B进行混合,轻轻吹打混匀,得到的混合液室温静置20min,然后将混合液加入到①中含有靶向DNA的GFP报告系统的HEK293T细胞系中;
③将②中所得的加入混合液后的含有靶向DNA的GFP报告系统的HEK293T细胞系置于37℃,体积百分比浓度为5%的CO2培养箱中继续培养;
(8)、流式细胞分析技术分析含有SlugCas9-HF蛋白的CRISPR/Cas9基因编辑系统对靶向DNA的编辑效率及脱靶率;
收集步骤(7)中CO2培养箱中培养3天后即经过CRISPR/Cas9-HF基因编辑系统进行基因编辑的含有靶向DNA的GFP报告系统的HEK293T细胞系,采用流式细胞仪(BD BiosciencesFACSCalibur)对其特异性检测,并用FlowJo分析软件分析GFP阳性比率并作图,CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系中进行基因编辑后的特异性检测结果示意图如图4所示,图4中上方横条显示GFP报告系统示意图,在起始密码子ATG和GFP编码序列之间插入特定的靶向DNA序列及PAM序列CTGG,造成GFP移码突变,当CRISPR/Cas9-HF基因编辑系统对靶向DNA进行切割后,细胞通过自身修复系统会使部分细胞恢复GFP阅读框,产生绿色荧光,图4中下方的柱状图中的横轴代表GFP阳性比率,竖轴代表On-target sgRNA和mismatch sgRNA对应的寡聚核苷酸单链DNA序列,其中序号1表示On-target sgRNA对应的寡聚核苷酸单链DNA序列,序号2-21为mismatch sgRNA对应的寡聚核苷酸单链DNA序列,序列中下划线标注代表碱基错配的位置,从图4中可以看出,CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系中在靶位点的编辑效率为17.6%,序号2对应mismatch sgRNA和SlugCas9-HF蛋白在靶位点的脱靶率最高,为2.87%,由此表明了CRISPR/Cas9-HF基因编辑系统的编辑活性高,脱靶率低,特异性高。
实施例2的对照实施例
一种CRISPR/Cas9基因编辑系统,包括过SlugCas9蛋白和sgRNA(以下称On-targetsgRNA,以区别于mismatch sgRNA),还包括含有不同碱基错配的sgRNA,即mismatch sgRNA;
所述的SlugCas9蛋白,其具有SEQ ID NO:63所示的氨基酸序列;
所述的On-target sgRNA和mismatch sgRNA同实施例2。
利用上述的一种CRISPR/Cas9基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系检测其特异性,进而统计GFP阳性细胞百分比,从而计算编辑效率及脱靶率,具体包括如下步骤:
(1)、构建质粒pAAV2_SlugCas9_ITR
①根据SlugCas9基因在UniProt上的检索号A0A133QCR3,下载其氨基酸序列,编码SlugCas9蛋白的氨基酸序列如SEQ ID NO:63所示;
②将上述所得的SlugCas9蛋白的氨基酸序列进行密码子优化,获得了在人细胞中高表达的编码SlugCas9蛋白的基因序列,该编码SlugCas9蛋白的基因序列如SEQ ID NO:64所示;
③将上述获得的SlugCas9蛋白的基因序列进行基因合成,并构建至pAAV2_ITR质粒上,得到质粒pAAV2_SlugCas9_ITR;
(2)、线性化质粒pAAV2_SlugCas9_ITR的制备
①在酶切体系中,用BsaI限制性内切酶将质粒pAAV2_SlugCas9_ITR进行酶切线性化反应,得到pAAV2_SlugCas9_ITR线性化质粒片段;
上述的酶切线性化反应过程中控制温度37℃、时间为1h;
上述酶切体系中,酶切线性化反应所用的各物质的量,按50μL酶切体系计算,含有1μg质粒pAAV2_SlugCas9_ITR、5μL 10xCutSmart缓冲液(购于NEB公司)、1μL BsaI限制性内切酶(购于NEB公司)和余量的水;
②将上述所得的pAAV2_SlugCas9_ITR线性化质粒片段在体积百分比为1%的琼脂糖凝胶上电泳,电泳过程控制压力为120V、时间为30min;
③然后切除7427bp大小的DNA片段,用胶回收试剂盒(天根生化科技(北京)有限公司,DP209)并依据该胶回收试剂盒说明书的操作步骤进行回收,最终用超纯水进行洗脱,得到线性化质粒pAAV2_SlugCas9_ITR;
④将回收的线性化质粒pAAV2_SlugCas9_ITR用NanoDropTM Lite分光光度计NanoDrop(Thermo Scientific)测定DNA浓度,备用或置于-20℃进行长期保存;
(3)、On target sgRNA对应的寡核苷酸单链DNA和mismatch sgRNA对应的寡核苷酸单链DNA的合成;
在On target sgRNA和mismatch sgRNA序列最前面21个碱基对应的正义链和反义链上分别加上线性化质粒pAAV2_SlugCas9_ITR两侧对应的粘性末端序列,并合成寡核苷酸单链DNA。
所述On target sgRNA对应的寡核苷酸单链为Oligo-F3(对应的碱基序列见SEQID NO:21)和Oligo-R3(对应的碱基序列见SEQ ID NO:42);
所述的mismatch sgRNA对应的寡核苷酸单链DNA为Oligo-F4-23(对应的碱基序列见SEQ ID NO:22-41)和Oligo-R4-23(对应的碱基序列见SEQ ID NO:43-62);
(4)、步骤(3)所得的On target sgRNA对应的寡核苷酸单链DNA和不同mismatch sgRNA对应的寡核苷酸单链DNA分别退火后,退火后将所得的产物分别通过DNA连接酶(购于NEB公司)连接至步骤(2)所得的线性化pAAV2_SlugCas9_ITR质粒上,分别得到对应On targetsgRNA的连接产物和对应不同mismatch sgRNA的连接产物;
上述的退火反应,即将1μL 100μM oligo-F,1μL 100μM oligo-R,28μL水,震荡混匀后,放置于PCR仪中运行退火程序;退火程序如下:95℃_5min,85℃_1min,75℃_1min,65℃_1min,55℃_1min,45℃_1min,35℃_1min,25℃_1min,4℃保存,降温速率0.3℃/s;
上述的连接过程按DNA连接酶(购于NEB公司)操作说明书进行;
(5)、取1μL步骤(4)所得的对应On target sgRNA的连接产物和对应不同mismatchsgRNA的连接产物分别加到大肠杆菌DH5α感受态细胞(购于上海唯地生物技术有限公司)中,冰上孵育30min,42℃热激1min,冰上孵育2min,加入900μL LB培养基,37℃培养1h进行大肠杆菌DH5α感受态细胞的活化复苏;
将复苏后的大肠杆菌DH5α感受态细胞涂布在含有对应抗性的LB固体平板在37℃培养箱倒置培养,得到的大肠杆菌DH5α单克隆进行Sanger测序验证;
(6)、将测序验证连接正确的大肠杆菌DH5α,提取质粒,即分别得到表达上述On targetsgRNA序列的质粒pAAV2_SlugCas9-hU6-On target sgRNA和表达上述不同mismatch sgRNA序列的质粒pAAV2_SlugCas9-hU6-mismatch sgRNA备用;
(7)、将步骤(6)所得的1个表达On target sgRNA序列的质粒pAAV2_SlugCas9-hU6-Ontarget sgRNA和20个表达上述不同mismatch sgRNA序列的质粒pAAV2_SlugCas9-hU6-mismatch sgRNA采用脂质体方式分别转染至含有靶向DNA的GFP报告系统的HEK293T细胞系;
所述的含有靶向DNA的GFP报告系统的HEK293T细胞系指在起始密码子ATG和GFP编码序列之间插入特定的靶向DNA序列及PAM序列,造成GFP移码突变,然后通过慢病毒感染整合到HEK293T细胞中,得到含有靶向DNA的GFP报告系统的HEK293T细胞系,当CRISPR/Cas9基因编辑系统对靶向DNA进行切割后,细胞通过自身修复系统会使部分细胞恢复GFP阅读框,产生绿色荧光,通过流式分析统计GFP阳性细胞比率可以评估基因编辑系统的编辑能力及特异性;
上述的转染过程包括如下步骤:
①第0天,根据转染所需,将含有靶向DNA的GFP报告系统的HEK293T细胞系在6孔板进行铺板,细胞密度控制在30%;
该含有靶向DNA的GFP报告系统的HEK293T细胞系中包含CMV-ATG-target site-CTGG-GFP的核苷酸序列如SEQ ID NO:10所示,CMV-ATG-target site-CTGG-GFP的核苷酸序列中的target site即靶位点的核苷酸序列如SEQ ID NO:11所示;
②第1天,进行转染,转染过程如下:
分别取2μg待转染质粒pAAV2_SlugCas9-hU6-On target sgRNA或2μg待转染质粒pAAV2_SlugCas9-hU6-mismatch sgRNA加入至100μL Opti-MEM培养基(购于Gibco公司)中,轻轻吹打混匀,记为稀释液A;
Figure BDA0002695236020000201
2000(购于Invitrogen公司)或PEI(购于polysciences公司)轻弹混匀,吸取5μL
Figure BDA0002695236020000202
2000或PEI加入至的100μL Opti-MEM培养基中,轻轻混匀,室温静置5min,得到稀释液B;
将上述中得到的稀释液A和稀释液B进行混合,轻轻吹打混匀,得到的混合液室温静置20min,然后将混合液加入到①中含有靶向DNA的GFP报告系统的HEK293T细胞系中;
③将②中所得的加入混合液后的含有靶向DNA的GFP报告系统的HEK293T细胞系置于37℃,体积百分比浓度为5%的CO2培养箱中继续培养;
(8)、流式细胞分析技术分析CRISPR/Cas9基因编辑系统对靶向DNA的编辑效率及脱靶率;
收集步骤(7)中CO2培养箱中培养3天后即经过CRISPR/Cas9基因编辑系统进行基因编辑的含有靶向DNA的GFP报告系统的HEK293T细胞系,采用流式细胞仪(BD BiosciencesFACSCalibur)对其特异性检测,并用FlowJo分析软件分析GFP阳性比率并作图,CRISPR/Cas9基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系中进行基因编辑后的特异性检测结果示意图如图5所示,图5中上方横条显示GFP报告系统示意图,在起始密码子ATG和GFP编码序列之间插入特定的靶向DNA序列及PAM序列CTGG,造成GFP移码突变,当CRISPR/Cas9基因编辑系统对靶向DNA进行切割后,细胞通过自身修复系统会使部分细胞恢复GFP阅读框,产生绿色荧光,图5中下方的柱状图中的横轴代表GFP阳性细胞比率(所述的GFP阳性细胞比率,相对于ON-target sgRNA为编辑效率,相对于mismatch sgRNA为脱靶率),竖轴代表On-target sgRNA和mismatch sgRNA对应的寡聚核苷酸单链DNA序列,其中序号1表示On-target sgRNA对应的寡聚核苷酸单链DNA序列;序号2-21为mismatch sgRNA对应的寡聚核苷酸单链DNA序列,序列中下划线标注代表碱基错配的位置,从图5中可以看出,CRISPR/Cas9基因编辑系统在含有靶向DNA的GFP报告系统HEK293T细胞系中在靶位点的编辑效率为15.2%,序号2对应mismatch sgRNA和SlugCas9蛋白在靶位点的脱靶率最高,为8.76%。
通过上述实施例2和实施例2的对照实施例的最终结果进行对比可以看出,含有SlugCas9-HF蛋白的CRISPR/Cas9-HF基因编辑系统比含有SlugCas9蛋白的CRISPR/Cas9基因编辑系统对基因的编辑活性高,其编辑效率相对提高了2.4%,脱靶率低,其脱靶率相对降低了5.89%,最高脱靶率仅为2.87%。
上述具体实施方式只是对本申请的技术方案进行详细解释,本申请并不只仅仅局限于上述实施例,本领域技术人员应该明白,凡是依据上述原理及精神在本申请基础上的改进、替换、都应在本申请的保护范围内。
序列表
<110> 复旦大学
<120> SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用
<150> PCT/CN2020/101657
<151> 2020-07-13
<160> 64
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1054
<212> PRT
<213> SlugCas9-HF蛋白(“人工序列”)
<400> 1
Met Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn Ile Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg Arg Ile His Arg Leu
50 55 60
Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn Leu Leu Asp Gln Ser
65 70 75 80
Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile Arg Val Lys Gly Leu
85 90 95
Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile Ala Leu Leu His Ile
100 105 110
Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val Ile Asp Ser Asn Asp
115 120 125
Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Asn Lys Asn Ser
130 135 140
Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile Gln Leu Glu Arg Met
145 150 155 160
Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg Phe Lys Thr Ala Asp
165 170 175
Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val Gln Lys Asn Phe His
180 185 190
Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile Glu Leu Val Glu Met
195 200 205
Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly Ser Pro Tyr Gly Trp
210 215 220
Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu Met Gly His Cys Thr
225 230 235 240
Tyr Phe Pro Asp Glu Leu Ala Ser Val Lys Tyr Ala Tyr Ser Ala Asp
245 250 255
Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Gln Arg Asp
260 265 270
Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr His Ile Ile Glu Asn
275 280 285
Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Asn Glu
290 295 300
Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr Arg Ile Thr Lys Ser
305 310 315 320
Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr His Asp Leu Lys Ser
325 330 335
Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu Asp Val Leu Asp Gln
340 345 350
Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys Asp Ser Ile Lys Ser
355 360 365
Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu Glu Asp Lys Glu Asn
370 375 380
Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His Arg Leu Ser Leu Lys
385 390 395 400
Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr Ser Ser Arg Ala Gln
405 410 415
Met Glu Ile Phe Ala His Leu Asn Ile Lys Pro Lys Lys Ile Asn Leu
420 425 430
Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile Asp Glu Phe Ile Leu
435 440 445
Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala Ile Asn Leu Ile Asn
450 455 460
Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp Ile Ile Ile Glu Leu
465 470 475 480
Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys Phe Ile Asn Glu Met
485 490 495
Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile Asn Glu Ile Ile Gly
500 505 510
Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val Glu Lys Ile Arg Leu
515 520 525
His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ser Ile Pro
530 535 540
Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Val Asp His Ile
545 550 555 560
Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr His Asn Lys Val Leu
565 570 575
Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn Leu Thr Pro Tyr Gln
580 585 590
Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr Asn Gln Phe Lys Gln
595 600 605
His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg Ile Ser Lys Lys Lys
610 615 620
Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Lys Phe Glu Val Gln
625 630 635 640
Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Ala
645 650 655
Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser Ala Asn Asn Met Asn
660 665 670
Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr Asp Tyr Leu Arg Lys
675 680 685
Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly Tyr Lys His His Ala
690 695 700
Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Leu Phe Lys Glu Asn
705 710 715 720
Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu Lys Pro Glu Ile Glu
725 730 735
Ser Lys Gln Leu Asp Ile Gln Val Asp Ser Glu Asp Asn Tyr Ser Glu
740 745 750
Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile Lys Asp Phe Arg Asn
755 760 765
Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp Asn Ser Thr Tyr Ile
785 790 795 800
Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp Asn Thr Thr Leu Lys
805 810 815
Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu Met Tyr Gln His Asp
820 825 830
Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met Lys Gln Tyr Ala Asn
835 840 845
Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu Thr Gly Glu Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile Val Lys Ser Leu Lys
865 870 875 880
Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp Val Thr His Gln Phe
885 890 895
Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser Ile Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys Phe Ile Thr Ile Ser
915 920 925
Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr Tyr Ile Pro Glu Gln
930 935 940
Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile Asp Lys Asn Ala Lys
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Leu Asp Gly Glu
965 970 975
Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr Arg Asn Met Ile Glu
980 985 990
Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr Cys Glu Leu Asn Asn
995 1000 1005
Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile Gly Lys Lys Val Asn
1010 1015 1020
Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly Asn Val Phe Thr Asn
1025 1030 1035 1040
Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys Arg Gly Asn
1045 1050
<210> 2
<211> 3162
<212> DNA
<213> 人工序列(“人工序列”)
<400> 2
atgaaccaaa aattcatact gggactggac atcggaatca ccagcgtggg ctacggcctg 60
atcgactacg agacaaagaa tatcatcgat gccggcgtta gactgttccc cgaggccaac 120
gtggaaaaca acgagggaag aaggtccaaa cgtggaagca gaagactgaa gcgacgccgc 180
attcacagac ttgaacgggt gaagaagctg ctcgaggatt ataatctgct ggatcagtcc 240
cagattcctc agtctacaaa cccctacgcc atccgcgtga agggcctgtc tgaagccctg 300
agcaaggacg aactcgtgat tgccctgctc catatcgcca agagaagagg catccacaag 360
atcgacgtga tcgacagcaa cgacgacgtg gggaacgagc tcagcaccaa ggaacagctg 420
aataagaaca gcaagctgct gaaagacaaa tttgtgtgcc agatccagct ggaaagaatg 480
aatgagggcc aggtgcgggg agagaaaaac cggttcaaga ccgctgatat catcaaggaa 540
atcatccagc tgctgaatgt gcagaagaac ttccaccagc tggacgagaa cttcatcaac 600
aagtacatcg aactggttga gatgagacgg gaatacttcg agggccccgg caagggcagt 660
ccatatggct gggaaggcga ccctaaggct tggtacgaga cactgatggg ccactgcacc 720
tacttcccag atgagctggc tagcgtgaaa tacgcctaca gtgccgacct gttcaacgct 780
ctgaacgacc tgaacaacct ggtcatccaa agagatggac tgtctaagct cgagtatcat 840
gagaagtatc acatcatcga gaacgtgttc aagcagaaga agaaacctac actgaagcag 900
atcgccaatg agatcaatgt caaccctgaa gatatcaagg gctacagaat cacaaagtct 960
ggcaagcccc agtttaccga gtttaagctc taccacgacc tgaaaagcgt gctgtttgac 1020
cagagcatcc tggagaacga agacgtgctg gaccagatcg ctgagatcct gaccatctac 1080
caggacaagg atagcatcaa atctaagctg acggaactgg acatcctgct gaacgaggaa 1140
gataaggaaa acatcgccca gctgactggc tacaccggga cccaccggct cagcctgaaa 1200
tgcatccggc tggtcctgga agagcagtgg tattctagcc gggctcagat ggaaatcttc 1260
gcccacctga acattaagcc taagaagatc aacctgacag ccgccaacaa gatcccgaag 1320
gctatgatcg acgagttcat cctgagccct gtggtgaaga ggaccttcgg ccaggccatt 1380
aaccttatta acaagatcat agaaaagtac ggcgtgcctg aagatatcat catcgagctg 1440
gccagagaaa ataatagcaa ggacaagcag aagttcatca atgagatgca gaaaaagaac 1500
gagaacacca gaaagagaat taacgaaatc atcggcaagt atggcaacca gaacgccaag 1560
agactggtcg agaagattag actgcacgac gagcaggagg gcaagtgcct gtactcactg 1620
gaaagcatcc ctctggagga cctgctgaac aaccccaacc actacgaggt ggaccacatc 1680
attccaagat ctgtgtcctt cgacaactct taccacaaca aagtgctcgt gaagcagagc 1740
gagaactcca aaaaatccaa cctgacccct taccagtact ttaacagcgg caagtccaag 1800
ctctcttaca accagtttaa acaacacatc ctgaacctga gcaagtccca ggatagaatc 1860
agcaaaaaaa agaaagagta tctgctggaa gaacgggaca tcaacaagtt cgaggtgcaa 1920
aaagagttca tcaatagaaa cctggtggat acccggtacg ccacagccga gctgacaaac 1980
tacctgaagg cctacttcag cgccaacaat atgaacgtga aggtgaaaac gatcaacggc 2040
agcttcaccg attacctgcg gaaagtgtgg aagtttaaga aggaacggaa ccacggctac 2100
aagcaccacg ccgaggacgc cctgattatc gctaatgccg atttcctgtt caaagagaac 2160
aagaagctga aagccgtgaa ctctgtgctg gaaaaacctg agatcgagag caagcagctg 2220
gatatccagg tggatagcga ggataactac agcgaaatgt tcatcatccc taagcaggtc 2280
caggacatca aggacttcag aaacttcaag tacagccaca gagtggacaa gaagcctaac 2340
agacagctga tcaacgatac actgtacagc acccggaaga aggacaactc cacctacatc 2400
gtgcagacca tcaaagatat ctatgccaaa gataatacca ccctgaagaa gcagtttgac 2460
aagtcacccg agaagttcct catgtaccaa cacgatccgc ggaccttcga gaagttggaa 2520
gtgatcatga agcagtacgc taatgagaag aatcctctgg ccaagtacca cgaggaaaca 2580
ggcgagtacc tgaccaaata cagcaaaaaa aacaacggcc ctatcgtgaa aagcctgaag 2640
tacattggaa acaagctggg cagccaccta gatgtgaccc accagttcaa gagcagcacc 2700
aagaagttgg tgaagctgag catcaagcct tatagattcg acgtctacct gaccgacaag 2760
ggatataagt tcatcaccat cagctacctg gacgtgctga agaaagacaa ttactactac 2820
atacccgaac agaagtacga caagctcaaa ctgggcaagg ccatcgacaa aaacgccaag 2880
tttatcgcta gcttctacaa gaatgatctg atcaagctgg acggcgagat ctacaagatc 2940
atcggcgtga atagcgacac cagaaacatg atcgaactgg atctgcctga catcagatac 3000
aaagaatact gcgagctgaa caatatcaag ggcgaaccta gaatcaaaaa gaccatcggc 3060
aaaaaggtga atagcatcga aaaactgaca accgacgtgc tgggcaacgt gttcaccaac 3120
acccagtaca caaaacctca gctgctgttc aagcgaggaa at 3162
<210> 3
<211> 81
<212> RNA
<213> 人工序列(“人工序列”)
<400> 3
guuuuaguac ucuggaaaca gaaucuacua aaacaaggca aaaugccgug uuuaucucgu 60
caacuuguug gcgagauuuu u 81
<210> 4
<211> 81
<212> RNA
<213> 人工序列(“人工序列”)
<400> 4
guuuuaguac ucuggaaaca gaaucuacug aaacaagaca auaugucgug uuuaucccau 60
caauuuauug gugggauuuu u 81
<210> 5
<211> 102
<212> DNA/RNA
<213> 人工序列(“人工序列”)
<400> 5
agagtaggct ggtagatgga gguuuuagua cucuggaaac agaaucuacu aaaacaaggc 60
aaaaugccgu guuuaucucg ucaacuuguu ggcgagauuu uu 102
<210> 6
<211> 102
<212> DNA/RNA
<213> 人工序列(“人工序列”)
<400> 6
gtcagacatg agatcacaga tguuuuagua cucuggaaac agaaucuacu aaaacaaggc 60
aaaaugccgu guuuaucucg ucaacuuguu ggcgagauuu uu 102
<210> 7
<211> 102
<212> DNA/RNA
<213> 人工序列(“人工序列”)
<400> 7
ggctcggaga tcatcattgc gguuuuagua cucuggaaac agaaucuacu aaaacaaggc 60
aaaaugccgu guuuaucucg ucaacuuguu ggcgagauuu uu 102
<210> 8
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 8
agagtaggct ggtagatgga gttgg 25
<210> 9
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 9
gtcagacatg agatcacaga tgcgg 25
<210> 10
<211> 1656
<212> DNA
<213> 人工序列(“人工序列”)
<400> 10
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag tctagagatc cgacgccgcc 600
atctctaggc ccgcgccggc cccctcgcac agacttgtgg gagaagctcg gctactcccc 660
tgccccggtt aatttgcata taatatttcc tagtaactat agaggcttaa tgtgcgataa 720
aagacagata atctgttctt tttaatacta gctacatttt acatgatagg cttggatttc 780
tataagagat acaaatacta aattattatt ttaaaaaaca gcacaaaagg aaactcaccc 840
taactgtaaa gtaattgtgt gttttgagac tataaatatg catgcgagaa aagccttgtt 900
tgccaccatg gaacggctcg gagatcatca ttgcgctgga tcgtgagcaa gggcgaggag 960
ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 1020
ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagttc 1080
atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgacctac 1140
ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 1200
gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 1260
aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 1320
ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 1380
agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt gaacttcaag 1440
atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc 1500
cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccaag 1560
ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1620
gccgggatca ctctcggcat ggacgagctg tacaag 1656
<210> 11
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 11
ggctcggaga tcatcattgc gctgg 25
<210> 12
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 12
caccagagta ggctggtaga tggag 25
<210> 13
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 13
aaacctccat ctaccagcct actct 25
<210> 14
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 14
caccgtcaga catgagatca cagat 25
<210> 15
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 15
aaacatctgt gatctcatgt ctgac 25
<210> 16
<211> 51
<212> DNA
<213> 人工序列(“人工序列”)
<400> 16
acactctttc cctacacgac gctcttccga tcttgtcagg cagcagagct c 51
<210> 17
<211> 49
<212> DNA
<213> 人工序列(“人工序列”)
<400> 17
actggagttc agacgtgtgc tcttccgatc tggcgatggc ttcctggtc 49
<210> 18
<211> 45
<212> DNA
<213> 人工序列(“人工序列”)
<400> 18
aatgatacgg cgaccaccga gatctacact ctttccctac acgac 45
<210> 19
<211> 52
<212> DNA
<213> 人工序列(“人工序列”)
<400> 19
caagcagaag acggcatacg agatcactgt gtgactggag ttcagacgtg tg 52
<210> 20
<211> 52
<212> DNA
<213> 人工序列(“人工序列”)
<400> 20
caagcagaag acggcatacg agatattggc gtgactggag ttcagacgtg tg 52
<210> 21
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 21
caccggctcg gagatcatca ttgcg 25
<210> 22
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 22
caccaactcg gagatcatca ttgcg 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 23
caccgattcg gagatcatca ttgcg 25
<210> 24
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 24
caccggtccg gagatcatca ttgcg 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 25
caccggcctg gagatcatca ttgcg 25
<210> 26
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 26
caccggctta gagatcatca ttgcg 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 27
caccggctca aagatcatca ttgcg 25
<210> 28
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 28
caccggctcg aggatcatca ttgcg 25
<210> 29
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 29
caccggctcg ggaatcatca ttgcg 25
<210> 30
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 30
caccggctcg gaagtcatca ttgcg 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 31
caccggctcg gaggccatca ttgcg 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 32
caccggctcg gagactatca ttgcg 25
<210> 33
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 33
caccggctcg gagattgtca ttgcg 25
<210> 34
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 34
caccggctcg gagatcgcca ttgcg 25
<210> 35
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 35
caccggctcg gagatcacta ttgcg 25
<210> 36
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 36
caccggctcg gagatcattg ttgcg 25
<210> 37
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 37
caccggctcg gagatcatcg ctgcg 25
<210> 38
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 38
caccggctcg gagatcatca ccgcg 25
<210> 39
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 39
caccggctcg gagatcatca tcacg 25
<210> 40
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 40
caccggctcg gagatcatca ttatg 25
<210> 41
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 41
caccggctcg gagatcatca ttgta 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 42
aaaccgcaat gatgatctcc gagcc 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 43
aaaccgcaat gatgatctcc gagtt 25
<210> 44
<211> 24
<212> DNA
<213> 人工序列(“人工序列”)
<400> 44
aaaccgaatg atgatctccg aatc 24
<210> 45
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 45
aaaccgcaat gatgatctcc ggacc 25
<210> 46
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 46
aaaccgcaat gatgatctcc aggcc 25
<210> 47
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 47
aaaccgcaat gatgatctct aagcc 25
<210> 48
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 48
aaaccgcaat gatgatcttt gagcc 25
<210> 49
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 49
aaaccgcaat gatgatcctc gagcc 25
<210> 50
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 50
aaaccgcaat gatgattccc gagcc 25
<210> 51
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 51
aaaccgcaat gatgacttcc gagcc 25
<210> 52
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 52
aaaccgcaat gatggcctcc gagcc 25
<210> 53
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 53
aaaccgcaat gatagtctcc gagcc 25
<210> 54
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 54
aaaccgcaat gacaatctcc gagcc 25
<210> 55
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 55
aaaccgcaat ggcgatctcc gagcc 25
<210> 56
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 56
aaaccgcaat agtgatctcc gagcc 25
<210> 57
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 57
aaaccgcaac aatgatctcc gagcc 25
<210> 58
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 58
aaaccgcagc gatgatctcc gagcc 25
<210> 59
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 59
aaaccgcggt gatgatctcc gagcc 25
<210> 60
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 60
aaaccgtgat gatgatctcc gagcc 25
<210> 61
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 61
aaaccataat gatgatctcc gagcc 25
<210> 62
<211> 25
<212> DNA
<213> 人工序列(“人工序列”)
<400> 62
aaactacaat gatgatctcc gagcc 25
<210> 63
<211> 1054
<212> PRT
<213> 人工序列(“Cas9蛋白”)
<400> 63
Met Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn Ile Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg Arg Ile His Arg Leu
50 55 60
Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn Leu Leu Asp Gln Ser
65 70 75 80
Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile Arg Val Lys Gly Leu
85 90 95
Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile Ala Leu Leu His Ile
100 105 110
Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val Ile Asp Ser Asn Asp
115 120 125
Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Asn Lys Asn Ser
130 135 140
Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile Gln Leu Glu Arg Met
145 150 155 160
Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg Phe Lys Thr Ala Asp
165 170 175
Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val Gln Lys Asn Phe His
180 185 190
Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile Glu Leu Val Glu Met
195 200 205
Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly Ser Pro Tyr Gly Trp
210 215 220
Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu Met Gly His Cys Thr
225 230 235 240
Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr Ala Tyr Ser Ala Asp
245 250 255
Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Gln Arg Asp
260 265 270
Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr His Ile Ile Glu Asn
275 280 285
Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Asn Glu
290 295 300
Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr Arg Ile Thr Lys Ser
305 310 315 320
Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr His Asp Leu Lys Ser
325 330 335
Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu Asp Val Leu Asp Gln
340 345 350
Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys Asp Ser Ile Lys Ser
355 360 365
Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu Glu Asp Lys Glu Asn
370 375 380
Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His Arg Leu Ser Leu Lys
385 390 395 400
Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr Ser Ser Arg Asn Gln
405 410 415
Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro Lys Lys Ile Asn Leu
420 425 430
Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile Asp Glu Phe Ile Leu
435 440 445
Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala Ile Asn Leu Ile Asn
450 455 460
Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp Ile Ile Ile Glu Leu
465 470 475 480
Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys Phe Ile Asn Glu Met
485 490 495
Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile Asn Glu Ile Ile Gly
500 505 510
Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val Glu Lys Ile Arg Leu
515 520 525
His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ser Ile Pro
530 535 540
Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Val Asp His Ile
545 550 555 560
Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr His Asn Lys Val Leu
565 570 575
Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn Leu Thr Pro Tyr Gln
580 585 590
Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr Asn Gln Phe Lys Gln
595 600 605
His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg Ile Ser Lys Lys Lys
610 615 620
Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Lys Phe Glu Val Gln
625 630 635 640
Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg
645 650 655
Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser Ala Asn Asn Met Asn
660 665 670
Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr Asp Tyr Leu Arg Lys
675 680 685
Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly Tyr Lys His His Ala
690 695 700
Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Leu Phe Lys Glu Asn
705 710 715 720
Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu Lys Pro Glu Ile Glu
725 730 735
Ser Lys Gln Leu Asp Ile Gln Val Asp Ser Glu Asp Asn Tyr Ser Glu
740 745 750
Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile Lys Asp Phe Arg Asn
755 760 765
Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp Asn Ser Thr Tyr Ile
785 790 795 800
Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp Asn Thr Thr Leu Lys
805 810 815
Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu Met Tyr Gln His Asp
820 825 830
Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met Lys Gln Tyr Ala Asn
835 840 845
Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu Thr Gly Glu Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile Val Lys Ser Leu Lys
865 870 875 880
Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp Val Thr His Gln Phe
885 890 895
Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser Ile Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys Phe Ile Thr Ile Ser
915 920 925
Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr Tyr Ile Pro Glu Gln
930 935 940
Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile Asp Lys Asn Ala Lys
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Leu Asp Gly Glu
965 970 975
Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr Arg Asn Met Ile Glu
980 985 990
Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr Cys Glu Leu Asn Asn
995 1000 1005
Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile Gly Lys Lys Val Asn
1010 1015 1020
Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly Asn Val Phe Thr Asn
1025 1030 1035 1040
Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys Arg Gly Asn
1045 1050
<210> 64
<211> 3162
<212> DNA
<213> 人工序列(“人工序列”)
<400> 64
atgaaccaaa aattcatact gggactggac atcggaatca ccagcgtggg ctacggcctg 60
atcgactacg agacaaagaa tatcatcgat gccggcgtta gactgttccc cgaggccaac 120
gtggaaaaca acgagggaag aaggtccaaa cgtggaagca gaagactgaa gcgacgccgc 180
attcacagac ttgaacgggt gaagaagctg ctcgaggatt ataatctgct ggatcagtcc 240
cagattcctc agtctacaaa cccctacgcc atccgcgtga agggcctgtc tgaagccctg 300
agcaaggacg aactcgtgat tgccctgctc catatcgcca agagaagagg catccacaag 360
atcgacgtga tcgacagcaa cgacgacgtg gggaacgagc tcagcaccaa ggaacagctg 420
aataagaaca gcaagctgct gaaagacaaa tttgtgtgcc agatccagct ggaaagaatg 480
aatgagggcc aggtgcgggg agagaaaaac cggttcaaga ccgctgatat catcaaggaa 540
atcatccagc tgctgaatgt gcagaagaac ttccaccagc tggacgagaa cttcatcaac 600
aagtacatcg aactggttga gatgagacgg gaatacttcg agggccccgg caagggcagt 660
ccatatggct gggaaggcga ccctaaggct tggtacgaga cactgatggg ccactgcacc 720
tacttcccag atgagctgag aagcgtgaaa tacgcctaca gtgccgacct gttcaacgct 780
ctgaacgacc tgaacaacct ggtcatccaa agagatggac tgtctaagct cgagtatcat 840
gagaagtatc acatcatcga gaacgtgttc aagcagaaga agaaacctac actgaagcag 900
atcgccaatg agatcaatgt caaccctgaa gatatcaagg gctacagaat cacaaagtct 960
ggcaagcccc agtttaccga gtttaagctc taccacgacc tgaaaagcgt gctgtttgac 1020
cagagcatcc tggagaacga agacgtgctg gaccagatcg ctgagatcct gaccatctac 1080
caggacaagg atagcatcaa atctaagctg acggaactgg acatcctgct gaacgaggaa 1140
gataaggaaa acatcgccca gctgactggc tacaccggga cccaccggct cagcctgaaa 1200
tgcatccggc tggtcctgga agagcagtgg tattctagcc ggaatcagat ggaaatcttc 1260
acacacctga acattaagcc taagaagatc aacctgacag ccgccaacaa gatcccgaag 1320
gctatgatcg acgagttcat cctgagccct gtggtgaaga ggaccttcgg ccaggccatt 1380
aaccttatta acaagatcat agaaaagtac ggcgtgcctg aagatatcat catcgagctg 1440
gccagagaaa ataatagcaa ggacaagcag aagttcatca atgagatgca gaaaaagaac 1500
gagaacacca gaaagagaat taacgaaatc atcggcaagt atggcaacca gaacgccaag 1560
agactggtcg agaagattag actgcacgac gagcaggagg gcaagtgcct gtactcactg 1620
gaaagcatcc ctctggagga cctgctgaac aaccccaacc actacgaggt ggaccacatc 1680
attccaagat ctgtgtcctt cgacaactct taccacaaca aagtgctcgt gaagcagagc 1740
gagaactcca aaaaatccaa cctgacccct taccagtact ttaacagcgg caagtccaag 1800
ctctcttaca accagtttaa acaacacatc ctgaacctga gcaagtccca ggatagaatc 1860
agcaaaaaaa agaaagagta tctgctggaa gaacgggaca tcaacaagtt cgaggtgcaa 1920
aaagagttca tcaatagaaa cctggtggat acccggtacg ccacaagaga gctgacaaac 1980
tacctgaagg cctacttcag cgccaacaat atgaacgtga aggtgaaaac gatcaacggc 2040
agcttcaccg attacctgcg gaaagtgtgg aagtttaaga aggaacggaa ccacggctac 2100
aagcaccacg ccgaggacgc cctgattatc gctaatgccg atttcctgtt caaagagaac 2160
aagaagctga aagccgtgaa ctctgtgctg gaaaaacctg agatcgagag caagcagctg 2220
gatatccagg tggatagcga ggataactac agcgaaatgt tcatcatccc taagcaggtc 2280
caggacatca aggacttcag aaacttcaag tacagccaca gagtggacaa gaagcctaac 2340
agacagctga tcaacgatac actgtacagc acccggaaga aggacaactc cacctacatc 2400
gtgcagacca tcaaagatat ctatgccaaa gataatacca ccctgaagaa gcagtttgac 2460
aagtcacccg agaagttcct catgtaccaa cacgatccgc ggaccttcga gaagttggaa 2520
gtgatcatga agcagtacgc taatgagaag aatcctctgg ccaagtacca cgaggaaaca 2580
ggcgagtacc tgaccaaata cagcaaaaaa aacaacggcc ctatcgtgaa aagcctgaag 2640
tacattggaa acaagctggg cagccaccta gatgtgaccc accagttcaa gagcagcacc 2700
aagaagttgg tgaagctgag catcaagcct tatagattcg acgtctacct gaccgacaag 2760
ggatataagt tcatcaccat cagctacctg gacgtgctga agaaagacaa ttactactac 2820
atacccgaac agaagtacga caagctcaaa ctgggcaagg ccatcgacaa aaacgccaag 2880
tttatcgcta gcttctacaa gaatgatctg atcaagctgg acggcgagat ctacaagatc 2940
atcggcgtga atagcgacac cagaaacatg atcgaactgg atctgcctga catcagatac 3000
aaagaatact gcgagctgaa caatatcaag ggcgaaccta gaatcaaaaa gaccatcggc 3060
aaaaaggtga atagcatcga aaaactgaca accgacgtgc tgggcaacgt gttcaccaac 3120
acccagtaca caaaacctca gctgctgttc aagcgaggaa at 3162

Claims (21)

1.一种SlugCas9-HF蛋白,其特征在于所述的SlugCas9-HF蛋白具有SEQ ID NO:1所示的氨基酸序列,或具有与SEQ ID NO:1至少80%相同、且至少保留了R247A、N415A、T421A及R656A中的一种或两种以上突变的氨基酸序列。
2.一种DNA序列,其特征在于所述DNA序列编码如下氨基酸序列:
SEQ ID NO:1所示的氨基酸序列;
或与SEQ ID NO:1至少80%相同、且至少保留R247A、N415A、T421A及R656A中的一种或两种以上突变的氨基酸序列。
3.如权利要求2所述的DNA序列,其特征在于所述的DNA序列具有如SEQ ID NO:2所示的核苷酸序列。
4.一种表达SlugCas9-HF蛋白的重组载体,其特征在于所述的表达SlugCas9-HF蛋白的重组载体含有如权利要求2或3所述的DNA序列。
5.一种CRISPR/Cas9-HF基因编辑系统,其特征在于所述CRISPR/Cas9基因编辑系统由SlugCas9-HF蛋白和sgRNA组成;
所述的SlugCas9-HF蛋白具有SEQ ID NO:1所示的氨基酸序列,或具有与SEQ ID NO:1至少80%相同的氨基酸序列、且至少保留了R247A、N415A、T421A及R656A中的一种或两种以上突变;
所述sgRNA为在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列前增加21个碱基得到核苷酸序列M或核苷酸序列N,所述的21个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合;
或为与核苷酸序列M或核苷酸序列N至少80%相同的核苷酸序列;
或为基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列。
6.如权利要求5所述的CRISPR/Cas9-HF基因编辑系统,其特征在于所述的基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列为基于核苷酸序列M或核苷酸序列N的序列进行碱基磷酸化、碱基硫化、碱基甲基化、碱基羟基化、序列的缩短或序列的加长而得到的核苷酸序列。
7.如权利要求5所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑;
所述的靶向DNA存在于细胞内或体外环境中。
8.如权利要求7所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑,其特征在于所述的细胞为真核细胞或原核细胞;
所述真核生物细胞包括哺乳动物细胞或植物细胞或酵母细胞;
所述哺乳动物细胞包括中国仓鼠卵巢细胞、幼仓鼠肾细胞、小鼠Sertoli细胞、小鼠乳腺瘤细胞、buffalo大鼠肝细胞、大鼠肝瘤细胞、由SV40转化的猴肾CVI系、猴肾细胞、犬肾细胞、人宫颈癌细胞、人肺细胞、人肝细胞、HIH/3T3细胞、人U2-OS骨肉瘤细胞、人A549细胞、人K562 细胞、人 HEK293细胞、人HEK293T细胞、人HCT116细胞或人MCF-7细胞。
9.如权利要求7所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑,其特征在于所述的对存在于细胞内的靶向DNA进行的基因编辑包括对靶向DNA的基因敲除、定点碱基的改变、定点插入、基因转录水平的调控、DNA甲基化调控、DNA乙酰化修饰、组蛋白乙酰化修饰、碱基转换、引导编辑或染色质成像追踪;
所述的对体外的靶向DNA进行的基因编辑为对靶向DNA的切割。
10.如权利要求9所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑,其特征在于所述的碱基转换包括碱基腺嘌呤到鸟嘌呤的转换、胞嘧啶到胸腺嘧啶的转换或胞嘧啶到尿嘧啶的转换。
11.如权利要求7所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑,其特征在于所述的靶向DNA为在GG碱基的前面增加23个核苷酸而得到的核苷酸序列,所述的23个核苷酸为A、T、C或G四种碱基中的任何一种随机组合而成,所述靶向DNA的核苷酸序列中的最后面4个核苷酸为PAM序列。
12.如权利要求11所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑,其特征在于具体步骤如下:
首先将CRISPR/Cas9-HF基因编辑系统递送至细胞内或体外待切割的靶向DNA环境中,然后由CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白识别细胞中待编辑或体外待切割的靶向DNA上的PAM序列,然后CRISPR/Cas9-HF基因编辑系统中的sgRNA中的5’端20bp或21bp序列与细胞内中待编辑或体外待切割的靶向DNA序列形成碱基互补配对,然后CRISPR/Cas9-HF基因编辑系统中的SlugCas9-HF蛋白对靶向DNA上的靶位点进行切割,使靶向DNA发生双链断裂,从而实现对体外环境中的靶向DNA进行的靶向切割;
当处于细胞中时,进一步通过细胞内的非同源末端连接修复或同源重组修复途径进行修复,从而完成对细胞中的靶向DNA进行的基因编辑。
13.一种含有CRISPR/Cas9-HF基因编辑系统的表达载体,其特征在于所述的含有CRISPR/Cas9-HF基因编辑系统的表达载体为包括编码SlugCas9-HF蛋白的基因序列和sgRNA序列的质粒、慢病毒、逆转录病毒、腺病毒或腺相关病毒;
所述编码SlugCas9-HF蛋白的基因序列为如权利要求2或权利要求3所述的DNA序列;
所述sgRNA为在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列最前面增加21个碱基得到核苷酸序列M或核苷酸序列N,所述的21个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合;
或为与核苷酸序列M或核苷酸序列N至少80%相同的核苷酸序列;
或为基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列。
14.如权利要求13所述的含有CRISPR/Cas9-HF基因编辑系统的表达载体,其特征在于所述的包括编码SlugCas9-HF蛋白的基因序列和sgRNA序列的质粒为pAAV2_SlugCas9-HF-hU6-sgRNA质粒;
所述pAAV2_SlugCas9-HF-hU6-sgRNA质粒是将编码SlugCas9-HF蛋白的基因序列和sgRNA序列连接到基础载体pAAV2_ ITR质粒上而得到。
15.如权利要求14所述的含有CRISPR/Cas9-HF基因编辑系统的表达载体,其特征在于所述pAAV2_SlugCas9-HF-hU6-sgRNA质粒包括AAV2_ITR、CMV增强子、CMV启动子、SV40 NLS、SlugCas9-HF蛋白、nucleoplasmin NLS、3x HA、bGH poly(A)、人U6 启动子和sgRNA支架序列。
16.利用如权利要求7所述的CRISPR/Cas9-HF基因编辑系统对靶向DNA进行基因编辑的方法,其特征在于具体包括如下步骤:
(1)、首先将编码SlugCas9-HF蛋白的氨基酸序列进行密码子优化,得到编码SlugCas9- HF蛋白的基因序列;
然后采用基因合成方法合成编码SlugCas9-HF蛋白的基因序列;
然后按照DNA重组方法或采用DNA连接酶方法将上述所得的编码SlugCas9-HF蛋白的基因序列克隆到表达载体上,以获得含有编码SlugCas9-HF蛋白的基因序列的表达载体;
(2)、按照引物合成方法合成sgRNA序列对应的寡核苷酸单链DNA,即寡核苷酸正向链序列和寡核苷酸反向链序列,并在所述寡核苷酸正向链序列和寡核苷酸反向链序列退火后通过DNA连接酶连接至所述含有编码SlugCas9-HF蛋白的基因序列的表达载体的酶切位点,得到含有编码SlugCas9-HF蛋白的基因序列和sgRNA序列的表达载体;
(3)、首先将步骤(2)所得的含有编码SlugCas9-HF蛋白的基因序列和sgRNA序列的表达载体递送至含有靶向DNA的细胞中,然后将递送后的含有靶向DNA的细胞于温度37℃,体积百分比浓度为5% 的CO2培养箱中培养5-7天,从而完成CRISPR/Cas9-HF基因编辑系统在含有靶向DNA的细胞中的基因编辑。
17.如权利要求16所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑的方法,其特征在于步骤(1)中所述的表达载体为质粒、慢病毒、逆转录病毒、腺病毒或腺相关病毒。
18.如权利要求17所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑的方法,其特征在于步骤(1)中所述的质粒为pAAV2_ ITR。
19.如权利要求18所述的CRISPR/Cas9-HF基因编辑系统用于对靶向DNA进行基因编辑的方法,其特征在于步骤(2)得到的含有编码SlugCas9-HF蛋白的基因序列和sgRNA序列的表达载体为pAAV2_ SlugCas9-HF-hU6-sgRNA质粒。
20.一种用于基因编辑的试剂盒,其特征在于所述的用于基因编辑的试剂盒包括如权利要求1所述的SlugCas9-HF蛋白、表达载体、sgRNA;
所述的表达载体为含有如权利要求2或3所述的DNA序列的质粒、逆转录病毒、腺病毒或腺相关病毒载体;
所述sgRNA为在如SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列前增加21个碱基得到核苷酸序列M或核苷酸序列N,所述的21个碱基中的每个碱基为A、T、C或G四种碱基中的任何一种随机组合;
或为与核苷酸序列M或核苷酸序列N至少80%相同的核苷酸序列;
或为基于核苷酸序列M或核苷酸序列N改造得到的核苷酸序列。
21.如权利要求20所述的一种用于基因编辑的试剂盒,其特征在于所述的表达载体为pAAV2_ SlugCas9-HF_ITR质粒。
CN202011003871.0A 2020-07-13 2020-09-22 SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用 Active CN112159801B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/101657 2020-07-13
CN2020101657 2020-07-13

Publications (2)

Publication Number Publication Date
CN112159801A true CN112159801A (zh) 2021-01-01
CN112159801B CN112159801B (zh) 2022-11-15

Family

ID=73863191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011003871.0A Active CN112159801B (zh) 2020-07-13 2020-09-22 SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用

Country Status (1)

Country Link
CN (1) CN112159801B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403208A (zh) * 2021-06-15 2021-09-17 江西科技师范大学 高效鉴定米曲霉CRISPR/Cas9突变体的方法
CN116478961A (zh) * 2023-04-27 2023-07-25 北京因诺惟康医药科技有限公司 CRISPR/SprCas9基因编辑系统的开发及应用
WO2024003810A1 (en) * 2022-06-30 2024-01-04 Geneditbio Limited Guide rna with chemical modifications

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694573A (zh) * 2015-03-26 2015-06-10 中国科学院武汉病毒研究所 利用CRISPR/Cas9抑制HIV-1感染原代淋巴细胞的方法
CN104962595A (zh) * 2015-05-25 2015-10-07 广州美格生物科技有限公司 一种可用于胚胎注射制备敲除小鼠的Cas9蛋白的制备方法
US20160312198A1 (en) * 2015-03-03 2016-10-27 The General Hospital Corporation Engineered CRISPR-CAS9 NUCLEASES WITH ALTERED PAM SPECIFICITY
US20190249200A1 (en) * 2018-02-15 2019-08-15 Sigma-Aldrich Co., Llc Engineered cas9 systems for eukaryotic genome modification
CN110499334A (zh) * 2019-08-08 2019-11-26 复旦大学 CRISPR/SlugCas9基因编辑系统及其应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160312198A1 (en) * 2015-03-03 2016-10-27 The General Hospital Corporation Engineered CRISPR-CAS9 NUCLEASES WITH ALTERED PAM SPECIFICITY
CN107532161A (zh) * 2015-03-03 2018-01-02 通用医疗公司 具有改变的PAM特异性的工程化CRISPR‑Cas9核酸酶
CN104694573A (zh) * 2015-03-26 2015-06-10 中国科学院武汉病毒研究所 利用CRISPR/Cas9抑制HIV-1感染原代淋巴细胞的方法
CN104962595A (zh) * 2015-05-25 2015-10-07 广州美格生物科技有限公司 一种可用于胚胎注射制备敲除小鼠的Cas9蛋白的制备方法
US20190249200A1 (en) * 2018-02-15 2019-08-15 Sigma-Aldrich Co., Llc Engineered cas9 systems for eukaryotic genome modification
CN110499334A (zh) * 2019-08-08 2019-11-26 复旦大学 CRISPR/SlugCas9基因编辑系统及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YUANYAN TAN等: "Rationally engineered Staphylococcus aureus Cas9 nucleases with high genome-wide specificity", 《PROC NATL ACAD SCI U S A》 *
王子实等: "利用epiCRISPR载体表达双sgRNA实现高效的HDAC基因编辑", 《复旦学报(自然科学版)》 *
王玮玮等: "CRISPR/Cas9基因编辑系统研究进展及其在动物基因编辑研究中的应用", 《畜牧兽医学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403208A (zh) * 2021-06-15 2021-09-17 江西科技师范大学 高效鉴定米曲霉CRISPR/Cas9突变体的方法
WO2024003810A1 (en) * 2022-06-30 2024-01-04 Geneditbio Limited Guide rna with chemical modifications
CN116478961A (zh) * 2023-04-27 2023-07-25 北京因诺惟康医药科技有限公司 CRISPR/SprCas9基因编辑系统的开发及应用
CN116478961B (zh) * 2023-04-27 2023-09-15 北京因诺惟康医药科技有限公司 CRISPR/SprCas9基因编辑系统的开发及应用

Also Published As

Publication number Publication date
CN112159801B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
EP4012037A1 (en) Crispr/cas9 gene editing system and application thereof
CN112159801B (zh) SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用
CN113631708B (zh) 编辑rna的方法和组合物
CN113373130A (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
CN110551761B (zh) CRISPR/Sa-SepCas9基因编辑系统及其应用
CN110577971B (zh) CRISPR/Sa-SauriCas9基因编辑系统及其应用
CN110551762B (zh) CRISPR/ShaCas9基因编辑系统及其应用
CN110499335B (zh) CRISPR/SauriCas9基因编辑系统及其应用
CN113583999A (zh) Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用
CN110577969B (zh) CRISPR/Sa-SlugCas9基因编辑系统及其应用
CN114560946A (zh) 无pam限制的腺嘌呤单碱基编辑产品、方法和应用
CN114990093B (zh) 氨基酸序列小的蛋白序列mini rfx-cas13d
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
CN116656649A (zh) 一种is200/is60s转座子iscb突变蛋白及其应用
CN110577972B (zh) CRISPR/Sa-ShaCas9基因编辑系统及其应用
CN110551763B (zh) CRISPR/SlutCas9基因编辑系统及其应用
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
CN110577970B (zh) CRISPR/Sa-SlutCas9基因编辑系统及其应用
CN110551760B (zh) CRISPR/Sa-SeqCas9基因编辑系统及其应用
CN112979823A (zh) 一种用于治疗和/或预防β血红蛋白病的产品及融合蛋白
CN115261363B (zh) Apobec3a的rna脱氨酶活性测定方法及rna高活性的apobec3a变体
CN114736902B (zh) NNT基因去甲基化的sgRNA序列、编辑系统的构建方法及其应用
CN118086340A (zh) 微型碱基编辑器及其构建方法与应用
CN115678900A (zh) 缩小碱基编辑器的编辑窗口的方法、碱基编辑器及用途
CN113652411A (zh) Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant