CN117757774B - 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 - Google Patents
一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 Download PDFInfo
- Publication number
- CN117757774B CN117757774B CN202311513462.9A CN202311513462A CN117757774B CN 117757774 B CN117757774 B CN 117757774B CN 202311513462 A CN202311513462 A CN 202311513462A CN 117757774 B CN117757774 B CN 117757774B
- Authority
- CN
- China
- Prior art keywords
- cas9
- gene editing
- crispr
- protein
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 169
- 238000010362 genome editing Methods 0.000 title claims abstract description 90
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 58
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 37
- 108091079001 CRISPR RNA Proteins 0.000 claims abstract description 26
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 25
- 108091028113 Trans-activating crRNA Proteins 0.000 claims abstract description 22
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 4
- 239000002773 nucleotide Substances 0.000 claims abstract description 4
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 4
- 239000000203 mixture Substances 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 11
- 230000001737 promoting effect Effects 0.000 abstract description 4
- 210000001236 prokaryotic cell Anatomy 0.000 abstract description 3
- 238000010353 genetic engineering Methods 0.000 abstract description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 44
- 239000013612 plasmid Substances 0.000 description 28
- 125000006850 spacer group Chemical group 0.000 description 19
- 241000894006 Bacteria Species 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000005520 cutting process Methods 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000771763 Dialister sp. Species 0.000 description 2
- 241000260433 Dialister succinatiphilus Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000203069 Archaea Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101100275895 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) csnB gene Proteins 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 description 1
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 description 1
- 101150062179 II gene Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 101150117416 cas2 gene Proteins 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002856 computational phylogenetic analysis Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于基因工程技术领域,公开了一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。本发明筛选了一种Cas9蛋白,其氨基酸序列如SEQ ID NO.2所示。本发明还提供了一种编码Cas9蛋白的核苷酸序列。本发明提供了一种II型CRISPR/Cas9基因编辑系统,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
Description
本发明专利申请是基于2023年05月08日提交的发明名称为“一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用”的中国专利申请号2023105103003的分案申请。
技术领域
本发明涉及基因工程技术领域,具体涉及一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。
背景技术
CRISPR/Cas(Clustered Regularly Interspaced Palindromic Repeats/CRISPR-ass ociated proteins system)基因编辑技术作为第三代编辑工具,比第一代ZFNs(Zinc Finger Nucleases)和TALENs(Transcription Activator-like EffectorNucleases)相比,有着设计简单、成本较低和编辑效率高的优点,成为当今最主流的基因编辑系统。CRISPR/Cas系统是帮助细菌和古菌防御外来核酸入侵的自适应免疫系统,作用原理为:当某些细菌在遭到病毒入侵后,能够把病毒基因的一小段储存到自身DNA里面,当病毒再次入侵时,细菌能够根据记忆读取识别出病毒基因,并将其切断以沉默表达。
CRISPR/Cas基因编辑系统通过外源DNA的采集、crRNA的合成、靶向干扰这三个过程行使编辑功能。CRISPR array包含直接重复序列(Direct Repeat,DR),这些重复序列由外源DNA的独特间隔序列(Spacer)分离。CRISPR array被转录成长转录物(pre-crRNA,CRISPR RNA的前体),然后被加工处理以产生小的成熟的CRISPR RNA(crRNA),由间隔序列和部分相邻的直接重复组成。crRNA与Cas核酸内切酶形成复合物,在某些情况下,还与辅助蛋白形成复合物并用作靶向和切割外来核酸的指南,从而实现干扰。Cas-crRNA复合物的DNA识别需要靶位点附近存在原间隔物相邻基序(PAM,Proto-spacer Adjacent Motif),这有助于自我与非自我辨别。CRISPR/Cas基因编辑系统根据不同蛋白酶数量大致分为两类:I类系统使用多种Cas蛋白的复合物,如Cascade,而II类系统使用单一效应酶,如Cas9。目前,II型CRISPR/Cas基因编辑系统已成为基因编辑中重要的工具。
现有技术中,源自化脓链球菌(Streptococcus pyogene Cas,SpCas9)的II型系统因其切割效率高,成为现下应用最为广泛的基因编辑系统。这一系统通过识别序列为NGG的PAM靶向切割。然而,这一PAM要求也限制了SpCas9的应用,某些靶位点可能因存在较少GG而无法使用SpCas9进行识别与编辑。因此,基于现有II型CRISPR/Cas9系统存在的不足,急需开发新的CRISPR/Cas基因编辑系统。
发明内容
本发明的目的在于克服现有技术的不足之处而提供一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。
为实现上述目的,本发明采取的技术方案如下:
第一方面,本发明筛选了一种Cas9蛋白,所述Cas9蛋白的氨基酸序列如SEQ IDNO.1~3中任一种序列所示。
本发明筛选得到三种新型编辑系统的Cas9蛋白分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统可识别多种不同的PAM序列,HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围,克服了SpCas9的局限性。
第二方面,本发明提供一种编码Cas9蛋白的核苷酸序列,所述核苷酸序列如SEQID NO.10~12中任一种序列所示。
第三方面,本发明提供了一种II型CRISPR/Cas9基因编辑系统,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。
采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明的基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式,所述tracrRNA序列包括重复序列,所述重复序列如SEQ ID NO.7~9中任一种序列所示。进一步的,所述的tracrRNA序列如SEQ ID NO.14~16中任一种序列所示。
作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式,所述辅助蛋白的核苷酸序列如SEQ ID NO.4~6中任一种序列所示。
第四方面,本发明将所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。
第五方面,本发明将所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。
与现有技术相比,本发明的有益效果为:
(1)本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
(2)采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
附图说明
图1为本发明CRISPR/Cas9基因编辑系统的进化树、系统组成和蛋白生物信息学分析结果示意图。
图2为本发明三种CRISPR/Cas9基因编辑系统的原核PAM序列图。
图3为本发明三种CRISPR/Cas9基因编辑系统的原核干扰图。
图4为本发明三种CRISPR/Cas9基因编辑系统的NC确认原核干扰图。
图5为本发明三种CRISPR/Cas9基因编辑系统的scaffold结构图。
图6为本发明三种CRISPR/Cas9基因编辑系统的真核细胞spacer最适长度探究图。
图7为本发明所述三种CRISPR/Cas9基因编辑系统的GUIDE-seq在靶与脱靶检测图。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明所述Cas9核酸内切酶是一种DNA内切酶。本发明所述的碱基序列中的所述N,表示A、G、C、T中的任意一种。本发明所述的Cas9蛋白,是一种多结构域的DNA核酸内切酶,包括REC结构域、RuvC结构域、HNH结构域和PI结构域,它能识别在PAM5’端识别与sgRNA互补的DNA序列,分别通过HNH结构域切割与sgRNA互补的DNA链,RuvC结构域切割非互补链DNA。本发明所述的crRNA,以碱基互补的方式引导Cas蛋白识别入侵的DNA,5’端为间隔序列,与靶DNA互补,3’端为重复序列。本发明所述CRISPR/Cas9基因编辑系统还需要tracrRNA的参与,tracrRNA是单独转录的,tracrRNA与pre-crRNA通过剪辑互补配对结合,经过RNA酶III酶切处理将pre-crRNA的5’部分间隔序列和3’部分重复序列,形成成熟的crRNA,与tracrRNA结合形成tracrRNA-crRNA复合体,通过在crRNA下游和tracrRNA上游之间添加四个碱基的tetraloop(如“GAAA”、“TGAA”或“AAAC”序列)可以将tracrRNA和crRNA连接起来形成scaffold。通过调节tracrRNA的长度以及可识别间隔序列的长度能进一步优化Cas9核酸内切酶的切割功能。
实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1:三种新型CRISPR/Cas9基因编辑系统
利用宏基因组生物信息手段对II型CRISPR/Cas9基因编辑系统相关蛋白及其元件进行分析、预测、筛选,利用CRISPRCas Finder软件进行宏基因组注释,通过NUPACK软件预测crRNA和tracrRNA的二级结构,使用HHpred软件预测功能域,并利用FastTree软件构建系统发育树。提供了三种新II型CRISPR/Cas9基因编辑系统,包括Cas9蛋白、辅助蛋白、CRISPRRNA和tracrRNA,如图1所示。
本发明筛选得到三种新型编辑系统的Cas9蛋白,分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。HqCas9蛋白编码1353个氨基酸,其序列如SEQ ID NO.1所示;DspCas9蛋白编码1383个氨基酸,其序列如SEQ ID NO.2所示;DsuCas9蛋白编码1389个氨基酸,其序列如SEQ ID NO.3所示。将3种Cas9蛋白与已发表的其他14种II型CRISPR/Cas9基因编辑系统进行系统发育树分析,显示HqCas9、DspCas9、DsuCas9归为Type II A这一支,三种Cas9蛋白之间序列相似性较高,与FrCas9亲缘关系最近,进化树如图1A所示。
所得CRISPR/Cas9基因编辑系统由以下多个元件组成:基因编码的Cas9核酸内切酶,辅助蛋白Cas1、Cas2、Csn2、CRISPR array以及反式激活CRISPR RNA(trans-activatingcrRNA,tracrRNA)。本发明所述三种新型CRISPR/Cas9基因编辑系统的组成图如图1B所示、Cas9蛋白结构图如图1C所示。辅助蛋白Cas1,其序列如SEQ ID NO.4所示;辅助蛋白Cas2,其序列如SEQ ID NO.5所示;辅助蛋白Csn2,其序列如SEQ ID NO.6所示。三种辅助蛋白参与外源基因捕获,以及crRNA的成熟。
CRISPR array包括直接重复序列和间隔序列,这两种序列是间隔排列的,两个重复序列中间夹一个间隔序列,重复序列在同一细菌中的碱基组成和长度是相对保守的,在不同的细菌之间会有些许差异。本发明的三种新型CRISPR/Cas9基因编辑系统所对应的重复序列,依次如SEQ ID NO.7~9所示。
上述序列信息如下:
SEQ ID NO.1:
MQTKKVDEYYVGFDIGTNSVGYAVTDKNYNLIKHGGEPMWGSHVFEAASTAQERRTFRTARRRNDRKKQRIALVSEIFAPEIAKVDPRFFIRRRESALFRDDVDIKDRYVVFNDDDFTDKDYYDIYPTIHHLIYDLMSNKEKHDIRLVYMACAYLVAHRGHFLSEVSKDNIEDVLDFDVVYCNFLNVMDNYAEIPWKCDISKFKEILKKKQTVTNKEREFLQLLNEGKKFKTSEEDDVSREGLVKLLSGGTYELGKLFPKLTFEEKVSVSFNMAEEDFAMVLQQLGDEGDIISSLRNVYDWAILSDVLNGKNSVSEGKITVYEQHKKDLSFLKYFVKKYIPNRYYEVFRDGNIVGNYVSYSYNLKNVQNVSKFKGAKKDVFCDYIKKVVKDIKVDDEDKVEYEDMMFRLDTYSFIPKQVENDNRVIPYQLYYYELKRILDNASSYLEFLDEKDMDGYTSREKLLSIMEFRIPYYVGPLRTDNGQHGWMKRKAEGRIYPWNFEDKVDLDASEQEFINRMTNSCTYLPGETVVPKYSLLYCKFNVLNEINNIKINDCSIPIEHKQGIYKLFERYRKVTPKKIKDFLISNNLLHPEDVISGIDVTIKSSLKSYHDFKKLLESCVLKENQVEAIIERLTYSEDKGRILRWLHMEFPDLSDDDVKYISKLKYSDFGRLSRKLLVGIRGCNKDTGEVDSIMGMLWSTNDNMMKLLSNSYTFIEEIEAIKNEYYVEHPANLDSMLDEMYVSNAVRRPIHRTLDILSDIRKVCGKNPSKIFVEMARGGGEKGVRTKSRRDQISELYKNMDKAEVRELSEQLEGKTDNELQSEVLFLYFMQLGKCAYTQKTIDIDKLKTNIYNVDHIYPQSYVKDDSITNKVLVISEENGQKGDKYPISKDIREKMQPFWYRLLSNKLISEEKYRRLTRCTSFTEEELTGFINRQLVETHQSTKAVTTVFRTLFPDVEIVYSKAGLVSEFRKEFDMLKTRSVNDLHHAKDAYLNIVVGNVYHCRFTKNFYITQKYSLKTKTLFTHSVKLGDDVIWNGQESIGNVRKVLAKNNIHYTKYPFMRKGGLFDQMPVKAAAGLIPRKTGLDTEKYGGYNKSTATAFLLVKYKEKGKQEAMIMPVDYMYSEKVFSDNEYALKYSKENIKKIWGRTEDQVIDVSLPLGLRPIKINTMLSFDGFRACITGKANAGQKIGFTSMMPLVIGNEWENYIKKIDNYIEKKGKNKNITLNEKNDGICGEKNEKLYCILTDKIINNIYSIPFNSQQKILENGYDKFKKLDIERQVYFLQNLVLVLKSGRAGSCDMSAIGGSKNAATFAFGSKLSLWAKKFQKVYLIDNSSSGIYQNMSDNLLDIIK;
SEQ ID NO.2:
MMKEIKNYFIGLDMGTTSVGWAATDENYEIIKKNGKALWGIRLFDEAQTAADRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQKNSLFNDVDFDDKAYYKEYPTIYHLRYDLMTKDRPFDVRLVYLAVHHILKHRGHFLFDHFQVDENGVSGFEESFAAFGDALEHIKGESFDMGKEEEMKALCRDKKLGVRHKALALAQCLGRSKDKDFKAMMTLAAGGTALLSEVFKDEGLKDFSKNKVSFSDSQFENDKPEIIAELGDRYDLIAALHGLYNWSFLAELMRGHKYISEAKIEIYDKHKEDLALLKKVLKQDRSVYNLMFKEPGDKKPINYSAYVKACKTNGKKLPLPYGKFKYEEFIKTVKFCLKNLPDSPDKKNIENKLEEGSFLLKAVSVENGAIPYQLHLQELKIILSKAEAYLPFLKVRDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKQGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGENAQKLSPELKEKVLENLFKKHKHVSRRKFINYLVTEGIDKKEAESISGLDGDFKSSMSSLIDMKHILGNDFSREDAEKMIKDITIFGGDKKMLKKRLHREFSYLTSEQLTSLTRLSYDGWGRLSKELLVNLLPVEKSTGEVLVDKGSGEVLNIISAMEQTSYNLMELLSSRFGYATAIEERNREKEGNGTISYQDVEDMYISPAVKRPLWQALKIVREIVKILGKEPSKIFIEMARENGEKGKRTISRKARLQELYKKCRDDSRDWAKELAEKPEEDFRSDRLYLYYTQMGRSMYTGKPIDINQLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDIYPLGSALDGCHIQGEIHIQDIQREMRPFWHMLLEKGLISKEKYNRLSRTTPLSDTEKAAFIGRQLVETRQSTKACAELLSKAYPQARIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFDTRFTANPLHFLKGNHPVYSLNTEALYGHKVSRGGVDAWIPPEKDDEGHIMAGHEGTMGTVRKWMRKNNILFTRMPLEGKGGLFDQTIMKKGKGQVPLKGDSPVSDIEKYGGYNKASSAYFVLTSSKLKDETIYTIETIPLIIKRMIQTNKDKEDYIKRHWKDHGKKMVNPHICYGHIPVQSLLEINGFKVHLTGKSGKDFKLRNAEQLCISNDDAAVLKRVLKYNERSSLSKGKEALLITPFDNIQEVDLNRLYQVFEDKLTNQVYKVKLGKQASVLKKGEDKFNELPLEVKCRVIGEILHLFQCNAAIADLRLIGGAKNAGALTMNPRVSPEDHVYLIEQSVTGFFEKRILLAPYGGK;
SEQ ID NO.3:
MKEIKKIFIGLDMGTNSVGWTATDENYEVIKKNGKALWGIRLFDEAQTAEDRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQTNSLFNDVDFNDKAYYKKYPTIYHLRHALMTENHPFDVRLVYLAIHHILKHRGHFLFENFQTDEKGTSGFDESFAAFGSALDRIKGSSPDVRKADSMKDILKDKKLGVKEKAASLLQCLGQGKEKDFKAMMTLAAGGTASLSDIFNDEKLKDFEKNKVNFSSAQFEENEPDIMAELGDRYDLIAALHGFYNWSLLAELMGEYHYISEAKIAVYDKHKADLKVLKRVLKQRPDIYAKIFREPGSSANKNYSAYVGVCKVKGKKAAIEKCSYEDFTKTLKPCLKDMPDSNDKDYISRELNMGTFLPKSVSKENGVIPYQLHLQELKIILSKAEAYLPFLKVKDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKRGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGETMQKLPLRLKEKVMDNLFSRYKHVSRTKFIKYLVSEGIDKKEAESISGLDGDFKSSLSSLIDMKHILGNDFSRENAEKMIQDITIFGGDKKMLKNRLHREFSYLTPEQLTSLTQLSYDGWGRLSKEFLVNLLPAEGDSCEVLVDHTSGEVLNIISAMRQTSYNLMELLGSRFGYGQAIEERNKKEEGQGRITYKDVEDLYISPAVRRPLWQALKIVREIVKITGKEPSKIFIEMARENGEKGKRTISRKARLQALYKKCRDDTRDWAKELEGKSEEDFRSDRLYLYYTQMGRSMYTGKPIDINRLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDTYPLSSALDGCYISGQQIRIQDIQKEMRPFWHMLLEKELISKEKYNRLSRTIPLSDAEKAAFIGRQLVETRQSTKACAELLSKAYPQTRIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFNTRFTANPLHFLKGNHQAYSLNTEALYGHKVSRNGVDAWIPAEKDEKGQVMAGHEGTMGTVRKWMRKNNILFTRMPYEGKGGLFDQNIMKKEKGQVPIKGDSPISNIKKYGGYNKAKVAYFVLTQSKLNKKTVYTLEAIPLILKNSIQSNEDKETYIQKQWRKNGKKMEHPIVCLGHIPVQSLLEINGFKVHLSGKNGKDILLRNAEQLCINEADTAVLKKILKFNQRAAMSKKGEEIFINSFDNIQEEDLNRLYHVFEDKLTNQIYKVKLEKQAAVLKKGEETFNRLSPEQKCKLIGEILHLCQCKATHADLRLIGGAKKAGILTMGTQIYPKDHVYLIEQSVTGFFEKRILLAPFGEK;
SEQ ID NO.4:
MNQLVTGGISVLNKGEFIKKQILVYEPFLGDKMSYKNDNMVIRDGNGKIKYQVSCYRIFMVLIVGDVTITTGILRRQQKFGFRLCFLTLGLKVYSVIGPQLQGNTLLHCKQYAYDELTVGKSIIINKILNQRAALTRLRSKTEDVWECISLLEQYSKRLQNDSLNLQEIIGIEGMASKIYFPRIFSNTQWIGRKPRIKFDYINTLLDIGYNALFNFIDAILQVFGFDVYYGVLHTCFYMRKSLVCDIMEPMRPIVDWQIRKSINLKQFKQDDFVQVGKQYQLKYKKSTQYLQVFLEAILNYKEEIFVYVRDYYRSFMKNNPIEAYPVFKLEEL;
SEQ ID NO.5:
MIIVSYDISDDKLRTKFSKYLSRFGHRIQYSMFEIDNSERILNNIICDIHNQFEK KFSQEDSIYIFNLSKWCKIERFGYAKNETNDLLVLTGCKPRP;
SEQ ID NO.6:
MRFFHHIFSKPIIFRENKVNLLVIENKKLFANFVRDFSVQSRGEEGEILLSDDVSDLDFEKHAEVIADYFSLDFNGKKLSSKLITELKQSALYGFAGEAGELLGLLNSFGSKVISSVEFPLEWETVYDIGAVLKLFDYRLNVSSENFLEMLVDYMEVCSHFLKKDIFVLVNLKSYFDMEEIKLLYKEAFFRKWNLIVLEPSSSGSLHEYEDIVIIDKDICEIRLDNEEFL;
SEQ ID NO.7:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGA;
SEQ ID NO.8:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA;
SEQ ID NO.9:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA。
实施例2:原核PAM耗竭实验
本实施例通过原核PAM耗竭实验挖掘本发明实施例1的II型CRISPR/Cas9基因编辑系统Cas核酸酶识别间隔序列所需的PAM序列。HqCas9、DspCas9、DsuCas9的核苷酸序列分别如SEQ ID NO.10~12所示。
具体操作如下:
(1)在PAM library间隔序列(其序列如SEQ ID NO.14所示)的3’端添加6个位置随机碱基NNNNNN(共4096条插入片段),采用overlap PCR方法把library构建到pUC19骨架载体上,得到具有4096种不同PAM组合的PAM library质粒,但5’端间隔序列是一样的spacer-PAM混合质粒,经二代测序检测到6个位置的随机碱基丰度Gini值小于0.1,表明6个位置的随机碱基分布较均匀,PAM library质粒具有Amp抗性基因。
(2)构建原核表达的pET28a-Cas9质粒:分别在pET28a载体(addgene,108303)的EcoR I和BamH I酶切位点上插入本发明所述三种CRISPR/Cas9基因编辑系统,包括Cas9蛋白、sgRNA与tracrRNA,Cas9蛋白经大肠杆菌密码子优化,最后添加TAA终止密码子;在异源启动子J23119启动子后添加5’-重复序列-间隔序列(与PAM library间隔序列互补)-重复序列-3’,即组成sgRNA后接T7terminator;在异源启动子J23119启动子后添加鉴定出来的tracrRNA(其序列依次如SEQ ID NO.14~16所示),三种质粒具有Kana抗性基因。
(3)把含有pET28a-Cas9(或pET28a空载质粒)和PAM library质粒共同通过细菌电转进DH5α(全式金生物,CD201-01)感受态,37℃复苏1h后均匀涂抹在Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的固体培养皿上置于37℃培养18h后刮取全部单克隆至无抗性培养基中,离心提取含pET28a-Cas9(或pET28a空载质粒)和PAM library质粒的混合质粒。
(4)在混合质粒上,随机碱基的两端设计合适的引物对(library-NGS-F和library-NGS-R)含有间隔序列和PAM组合的位置进行PCR扩增及纯化,在产物两端加上接头(采用商业的illumina测序接头引物:Hieff NGS384 Dual Index Primer Kit forSet1(货号12613ES02)I5 primer:TAAGATTA)进行二代测序(I7primer:GAGATTCC),以pET28a空载对照组的PAM耗竭阈值为对照基准,利用Weblogo 3分析6个随机碱基的消耗,通过负向筛选的方式得到每个Cas9蛋白所识别的PAM序列。
PAM序列分析结果如图2所示,HqCas9、DspCas9、DsuCas9能分别识别序列为NGNGNC、NNNAA、NNNAA的PAM。
上述序列信息如下:
SEQ ID NO.10:
ATGCAGACCAAAAAAGTTGATGAATACTACGTGGGCTTCGATATCGGCACCAACTCCGTTGGCTACGCGGTGACCGATAAAAACTACAACCTGATTAAACACGGCGGTGAACCGATGTGGGGCTCCCACGTTTTCGAGGCGGCGAGCACCGCCCAGGAACGCCGTACCTTCCGCACCGCTCGCCGCCGTAACGATCGTAAAAAACAGCGTATCGCGCTGGTGTCTGAAATCTTCGCGCCGGAAATCGCGAAAGTGGACCCGCGTTTCTTCATCCGTCGCCGTGAATCCGCGCTGTTCCGCGAC
GACGTGGACATTAAAGATCGTTACGTGGTTTTCAACGACGACGATTTCACCGATAAAGACT
ACTACGATATCTACCCGACCATCCACCACCTGATCTACGACCTGATGAGCAACAAAGAAAA
ACACGATATTCGCCTGGTTTACATGGCGTGCGCCTACCTGGTGGCGCATCGCGGCCACTTCC
TGTCTGAAGTTTCTAAAGATAACATCGAAGATGTTCTGGACTTCGATGTCGTGTACTGTAAC
TTTCTGAACGTTATGGACAACTACGCGGAAATCCCGTGGAAATGCGATATTTCCAAATTCAA
AGAAATCCTGAAGAAAAAACAGACCGTGACCAACAAAGAACGTGAATTCCTCCAGCTGCTT
AACGAAGGTAAAAAATTCAAAACCAGCGAAGAGGATGATGTGTCTCGTGAAGGCCTGGTG
AAACTGCTGTCGGGTGGCACCTACGAACTGGGTAAACTGTTTCCGAAACTGACCTTTGAAG
AAAAAGTGAGCGTTAGCTTCAACATGGCGGAAGAAGATTTTGCGATGGTTCTGCAGCAGCT
GGGTGACGAAGGTGACATCATCTCCAGCCTGCGTAACGTTTACGATTGGGCGATCCTGAGC
GACGTGCTTAACGGCAAAAACAGCGTGTCTGAAGGCAAAATTACCGTCTACGAACAGCACA
AAAAAGATCTGTCTTTCCTGAAATACTTCGTGAAAAAATACATCCCGAACCGTTATTACGAA
GTTTTCCGTGATGGCAACATCGTTGGCAACTATGTGAGCTATAGCTACAACCTGAAAAACGT
TCAGAACGTATCCAAATTCAAAGGCGCCAAAAAAGACGTTTTCTGTGATTACATTAAAAAA
GTTGTTAAAGATATTAAAGTTGACGATGAAGATAAAGTTGAATACGAAGATATGATGTTCC
GCCTGGATACGTACAGCTTCATCCCGAAACAAGTTGAAAACGACAATCGTGTTATCCCGTA
CCAGCTGTACTACTACGAACTGAAACGTATCCTGGACAACGCGTCCTCTTACCTGGAATTTC
TGGACGAAAAAGATATGGACGGTTACACTTCGCGCGAAAAACTGCTGTCCATCATGGAATT
CCGTATCCCGTATTATGTGGGTCCGCTGCGTACCGATAACGGTCAGCACGGCTGGATGAAA
CGTAAAGCGGAAGGCCGTATCTACCCGTGGAACTTCGAAGATAAAGTGGATCTGGACGCTA
GCGAACAGGAATTTATTAACCGTATGACCAACTCTTGCACCTACCTGCCGGGTGAAACCGT
GGTGCCGAAATATAGCCTGCTGTACTGCAAATTCAACGTTCTGAACGAAATTAACAACATC
AAAATCAACGACTGTTCTATCCCGATCGAGCACAAACAGGGCATCTACAAACTGTTCGAAC
GCTACCGCAAAGTGACCCCGAAAAAGATTAAAGACTTCCTGATCTCTAACAACCTGCTGCA
CCCGGAAGATGTTATCAGCGGCATCGATGTTACCATCAAAAGCAGCCTGAAATCCTACCAC
GACTTCAAAAAACTGCTGGAAAGCTGTGTGCTGAAAGAAAACCAGGTGGAAGCTATCATCG
AACGCCTGACCTACAGCGAAGATAAAGGCCGTATCCTGCGTTGGCTGCACATGGAATTCCC
GGACCTGAGCGATGATGACGTTAAATACATCTCCAAACTGAAATACAGCGACTTCGGCCGC
CTGAGCCGCAAACTGCTGGTCGGCATCCGTGGCTGCAACAAAGACACCGGCGAAGTGGATA
GCATCATGGGCATGCTGTGGAGCACCAACGACAACATGATGAAACTGCTGTCTAACAGCTA
CACCTTTATCGAAGAAATCGAAGCGATCAAAAACGAATACTACGTTGAACACCCGGCGAAC
CTGGACAGCATGCTGGATGAAATGTACGTTAGTAACGCTGTGCGTCGTCCGATTCACCGTAC
CCTGGATATCCTGAGCGACATTCGCAAAGTTTGCGGCAAAAACCCGAGCAAAATCTTCGTT
GAAATGGCGCGCGGTGGTGGTGAAAAAGGTGTTCGTACCAAATCCCGCCGTGACCAGATCT
CTGAACTGTATAAAAACATGGATAAAGCGGAAGTGCGTGAACTGTCTGAACAGCTTGAAGG
TAAAACCGATAACGAATTACAGTCCGAAGTGCTGTTCCTGTACTTTATGCAATTGGGTAAAT
GCGCGTACACCCAGAAAACCATCGACATCGACAAGCTGAAAACCAACATTTACAACGTGGA
TCACATTTACCCGCAGTCTTACGTAAAAGATGATAGCATCACCAACAAAGTGCTGGTTATTA
GTGAAGAAAACGGCCAGAAAGGTGATAAATATCCGATCTCTAAAGACATCCGTGAAAAAA
TGCAGCCGTTCTGGTACCGTTTGCTGAGCAACAAACTGATTTCTGAAGAAAAATACCGCCG
CCTGACCCGCTGTACCTCCTTCACCGAAGAAGAACTGACCGGTTTCATTAACCGCCAGCTCG
TTGAAACCCACCAGTCCACCAAAGCGGTTACCACGGTTTTCCGTACTCTGTTCCCGGACGTG
GAGATCGTTTACTCTAAAGCGGGCCTGGTGTCCGAATTCCGTAAAGAATTCGACATGCTGA
AAACCCGTAGTGTGAACGATCTGCACCACGCCAAAGATGCGTATCTGAACATCGTCGTGGG
CAACGTTTACCATTGTCGTTTCACCAAAAACTTCTACATTACCCAGAAATACAGCCTGAAAA
CCAAAACCCTGTTCACCCATTCTGTTAAACTGGGTGATGACGTTATCTGGAACGGCCAGGA
GAGCATTGGTAACGTGCGTAAAGTGCTGGCGAAAAACAACATCCACTACACTAAATATCCG
TTCATGCGTAAAGGTGGCCTGTTCGACCAGATGCCGGTTAAAGCGGCGGCCGGTCTGATCC
CGCGTAAAACCGGCCTGGATACCGAAAAATACGGTGGTTATAACAAATCCACTGCTACCGC
ATTTCTGTTAGTGAAATACAAAGAAAAAGGCAAACAGGAAGCCATGATCATGCCGGTAGAC
TACATGTACAGCGAAAAAGTTTTCTCCGATAACGAATACGCCTTAAAATACTCCAAAGAAA
ATATCAAAAAGATCTGGGGTCGCACGGAAGATCAGGTGATCGATGTGTCTTTACCGCTGGG
CCTGCGTCCGATCAAAATTAACACCATGCTGAGCTTCGACGGCTTCCGCGCGTGCATCACCG
GCAAAGCAAACGCTGGTCAGAAAATTGGCTTCACCAGCATGATGCCGCTGGTGATCGGTAA
CGAATGGGAAAACTACATCAAAAAGATTGACAACTACATTGAGAAAAAAGGTAAAAACAA
AAACATCACCCTGAATGAAAAGAACGATGGCATCTGCGGCGAAAAGAACGAAAAACTGTA
CTGTATCCTGACTGACAAAATCATCAACAACATCTACTCGATCCCGTTCAACTCCCAGCAGA
AAATCCTGGAGAACGGCTACGACAAATTCAAAAAACTGGATATCGAACGCCAGGTGTACTT
CCTGCAGAACCTGGTTCTCGTTCTGAAATCGGGCCGTGCTGGTTCCTGTGATATGAGCGCAA
TCGGTGGCTCGAAAAACGCGGCGACCTTTGCGTTCGGTTCCAAGCTGAGCCTGTGGGCGAA
AAAATTCCAGAAAGTGTACCTGATCGATAACAGCAGCTCTGGCATCTACCAGAACATGAGCGATAACCTGCTGGACATCATCAAATAA;
SEQ ID NO.11:
ATGATGAAAGAAATTAAAAACTATTTTATTGGCCTGGATATGGGCACCACTAGTGTGG
GCTGGGCAGCCACTGATGAAAACTATGAAATTATTAAGAAGAATGGCAAAGCCCTGTGGGG
CATTAGACTGTTTGATGAAGCGCAGACTGCAGCAGATAGAAGAATGCATAGAATTGCAAGA
AGAAGAATTGAGAGAAGAAGCAGAAGAATTGACCTGCTGCAAGAACTTTTTGCCCAAGAA
ATTTGCAAAAAAGATCCTGGCTTTTATGAAAGACTGAATGAAAGTGGCCTGTATGAAGAAG
ATAAAACTGTGCATCAGAAAAACTCTCTGTTTAATGATGTGGATTTTGATGATAAAGCCTAT
TATAAAGAATATCCAACCATTTATCATCTGAGATATGATCTGATGACCAAAGATAGACCATT
TGATGTGAGACTGGTGTATCTGGCCGTGCATCATATTCTGAAACATAGAGGCCATTTTCTGT
TTGATCATTTTCAAGTGGATGAAAATGGTGTGAGTGGCTTTGAAGAAAGCTTTGCAGCCTTT
GGTGATGCCCTGGAACATATTAAAGGTGAAAGCTTTGATATGGGCAAAGAAGAAGAAATG
AAAGCCCTGTGCAGAGACAAGAAACTGGGTGTGAGACATAAAGCCCTGGCCCTGGCACAG
TGCCTTGGCAGAAGCAAAGACAAAGACTTTAAAGCCATGATGACCCTGGCAGCTGGTGGCA
CTGCCCTGCTGAGTGAAGTGTTTAAAGATGAAGGCCTGAAAGATTTTAGCAAAAACAAAGT
GAGCTTTAGTGATAGTCAGTTTGAAAATGATAAACCTGAAATTATTGCAGAACTGGGTGAT
AGATATGATCTGATTGCAGCCCTGCATGGCCTGTATAACTGGAGCTTTCTGGCAGAACTGAT
GAGAGGCCATAAATATATTAGTGAAGCCAAAATTGAAATTTATGATAAACATAAAGAAGAT
CTGGCCTTGCTGAAAAAAGTGCTGAAACAAGATAGAAGTGTGTATAACCTGATGTTCAAGG
AACCTGGTGATAAAAAACCTATTAACTATAGTGCCTATGTGAAAGCCTGCAAAACCAATGG
TAAAAAATTACCACTGCCATATGGCAAGTTTAAATATGAAGAATTTATTAAAACTGTGAAA
TTTTGCCTGAAAAACCTGCCTGATAGCCCTGATAAAAAAAACATTGAAAACAAACTGGAAG
AAGGCAGCTTTCTGCTGAAAGCAGTGAGTGTGGAAAATGGTGCCATTCCATATCAGCTGCA
TCTGCAAGAACTGAAAATTATTCTGTCTAAGGCAGAAGCCTATCTGCCATTTCTGAAAGTGA
GAGATCAGTATGGCACTGTGAGTGATAAAATTATTAGCCTGTTTACCTTTAGAATTCCATAT
TATGTGGGCCCAATTAATGAACATGCTGGCAGCTGCTGGGTGGTGAAAAAAGATAAACAAG
GCAAAGTGTATCCATGGAACTTTACTGAAAAAATTGACATTGAAAAAAGTGCAGAAGGCTT
TATTAGAAACCTGACCAACAAATGCACCTATCTGATTGGTGAAGATGTGCTGCCAAAAAAC
AGCCTGCTGTATAGTGAATTTACTGTGCTGAATGAACTGAACAATGTGAGAATTGGTGAAA
ATGCACAGAAACTGAGCCCTGAACTGAAAGAAAAAGTGCTGGAAAACCTGTTTAAAAAAC
ATAAACATGTGAGCAGAAGAAAATTTATTAACTATCTGGTGACTGAAGGCATTGATAAAAA
AGAAGCAGAAAGCATTAGTGGCCTGGATGGTGATTTTAAAAGCAGCATGAGCAGCCTGATT
GATATGAAACATATTCTGGGCAATGATTTTAGCAGAGAAGATGCAGAAAAAATGATTAAAG
ATATTACCATTTTTGGTGGTGATAAAAAAATGCTGAAAAAAAGACTGCATAGAGAATTTAG
CTATCTGACTAGTGAACAGCTGACTAGCCTGACTAGACTGAGCTATGATGGCTGGGGCAGA
CTGAGCAAGGAACTTCTGGTGAACCTGCTGCCTGTGGAAAAAAGCACTGGTGAAGTCCTGG
TGGATAAAGGCAGTGGTGAGGTGCTGAACATTATTAGTGCCATGGAACAGACTAGCTATAA
TCTGATGGAATTACTGAGCAGCAGATTTGGCTATGCCACTGCCATTGAAGAAAGAAACAGA
GAAAAAGAAGGCAATGGCACCATTAGCTATCAAGATGTGGAAGATATGTATATTAGCCCTG
CAGTGAAAAGACCACTGTGGCAAGCCCTGAAAATTGTGAGAGAAATTGTGAAAATTCTGGG
CAAAGAACCAAGCAAAATTTTTATTGAAATGGCAAGAGAAAATGGTGAAAAGGGCAAAAG
AACCATTAGCAGAAAAGCAAGACTTCAAGAGCTGTATAAGAAATGCAGAGATGATAGTAG
AGATTGGGCCAAAGAACTGGCAGAAAAACCTGAAGAAGATTTTAGAAGTGATAGACTGTA
TCTGTATTATACTCAGATGGGAAGAAGCATGTACACTGGCAAACCAATTGATATTAATCAG
CTGTTTGATAGAAATGTGTATGATATTGATCATATATATCCACAAAGCCTGACTGGTGATGA
CAGCCTGGACAACAGAGTGCTGGTGGAAAAAACTGTGAATGCCAAAAAAGGAGATATCTA
CCCCTTAGGTAGTGCCCTGGATGGCTGCCATATTCAAGGTGAAATTCATATTCAAGATATTC
AGAGAGAAATGAGACCATTTTGGCATATGCTGCTGGAAAAAGGCCTGATTAGTAAAGAAA
AATATAACAGACTGAGCAGAACCACCCCACTGAGTGATACTGAAAAAGCAGCCTTTATTGG
CAGACAGCTGGTGGAAACTAGACAGAGCACCAAAGCATGTGCAGAATTACTGAGCAAAGC
CTATCCACAAGCAAGAATTGTGTATACCAAAGCTGGCAATGCAAGCAGATTTAGACAGTAT
GGTGGCTTTATTAAAGTAAGAGACATGAATGATTATCATCATGCCAAAGATGCCTATCTGA
ACATTGTGGTGGGCAATGTGTTTGATACTAGATTTACCGCCAACCCACTGCATTTTCTGAAA
GGCAACCATCCTGTGTATAGCCTGAACACTGAAGCCCTGTATGGCCATAAAGTGAGCAGAG
GTGGTGTGGATGCCTGGATTCCACCTGAAAAAGATGATGAAGGCCATATTATGGCTGGCCA
TGAAGGCACCATGGGCACTGTGAGAAAATGGATGAGAAAAAACAACATTCTGTTTACTAGA
ATGCCATTGGAAGGCAAAGGTGGCCTGTTTGATCAGACCATTATGAAAAAAGGCAAAGGCC
AAGTGCCACTGAAAGGTGATAGCCCTGTGAGTGATATTGAAAAATATGGTGGCTATAACAA
AGCAAGCAGTGCCTATTTTGTGCTGACTAGCAGCAAACTGAAAGATGAAACCATTTATACC
ATTGAAACCATTCCACTGATTATTAAAAGAATGATTCAGACCAACAAAGATAAAGAAGATT
ATATTAAAAGACATTGGAAAGATCATGGCAAGAAAATGGTTAACCCACATATTTGCTATGG
CCATATTCCTGTGCAGAGCCTGCTGGAAATTAATGGCTTTAAAGTGCATCTGACTGGCAAAT
CTGGCAAGGACTTTAAGCTGAGAAATGCAGAACAGCTGTGCATTAGCAATGATGATGCAGC
AGTGCTGAAAAGAGTGCTGAAATATAATGAAAGAAGCAGCCTGAGTAAAGGCAAAGAAGC
CCTGCTGATTACCCCATTTGATAACATTCAAGAAGTGGATCTGAACAGACTGTATCAAGTGT
TTGAAGATAAACTGACCAACCAAGTGTATAAAGTGAAACTGGGCAAACAAGCAAGTGTGTT
AAAGAAGGGTGAAGATAAATTTAATGAACTCCCACTGGAAGTGAAATGCAGAGTGATTGGT
GAAATTCTGCATCTGTTTCAGTGCAATGCAGCCATTGCAGATCTGAGACTGATTGGTGGTGC
CAAAAATGCTGGTGCCCTGACCATGAACCCAAGAGTGAGCCCTGAAGATCATGTGTATCTG
ATTGAACAGAGTGTGACTGGCTTTTTTGAAAAAAGAATTCTGCTGGCCCCATATGGTGGCAAATAA;
SEQ ID NO.12:
ATGAAAGAAATTAAAAAGATCTTCATCGGTCTGGATATGGGCACCAACAGCGTGGGCT
GGACCGCGACCGATGAAAACTACGAAGTGATCAAAAAGAACGGTAAAGCGCTGTGGGGTA
TCCGTCTGTTCGATGAAGCACAGACCGCAGAAGATCGTCGTATGCACCGCATCGCGCGTCG
CCGCATCGAACGCCGCTCCCGTCGTATCGATCTGCTGCAGGAACTGTTCGCGCAGGAAATCT
GCAAAAAAGATCCGGGCTTCTACGAACGTCTGAACGAAAGCGGTCTGTACGAAGAAGATA
AAACTGTGCACCAGACCAACTCCCTGTTTAACGACGTGGATTTCAACGATAAAGCGTACTA
CAAAAAATACCCGACCATTTACCACCTGCGCCATGCGCTGATGACCGAAAACCACCCGTTC
GACGTTCGCCTGGTTTACCTGGCGATCCACCACATCCTGAAACATCGTGGTCACTTCCTGTT
CGAAAACTTCCAGACGGACGAAAAAGGCACCTCCGGCTTCGACGAATCTTTTGCTGCTTTC
GGCTCTGCGCTGGATCGTATTAAAGGCTCCTCACCAGATGTGCGTAAAGCCGACTCTATGA
AAGACATCCTGAAAGATAAAAAACTGGGTGTTAAAGAAAAAGCAGCGAGCCTGCTGCAGT
GCCTGGGCCAGGGCAAAGAAAAAGACTTCAAAGCTATGATGACCCTGGCGGCAGGCGGCA
CCGCGTCCCTGTCCGATATCTTCAACGACGAAAAACTGAAAGACTTCGAAAAGAACAAAGT
GAACTTCAGCTCTGCACAGTTCGAAGAAAACGAACCGGACATCATGGCGGAACTGGGCGAC
CGTTATGATCTGATCGCGGCCCTGCACGGCTTCTATAACTGGTCTCTGCTGGCAGAACTGAT
GGGTGAATACCATTACATCAGCGAAGCTAAAATTGCGGTGTACGACAAACACAAAGCGGAT
CTGAAAGTTCTGAAACGCGTTCTGAAACAGCGTCCGGACATCTACGCGAAAATCTTCCGCG
AACCGGGTTCCTCTGCGAACAAAAACTACAGCGCGTACGTGGGCGTTTGCAAAGTTAAAGG
CAAAAAAGCCGCGATCGAAAAATGTAGCTACGAAGATTTCACTAAAACCCTGAAACCGTGC
CTGAAAGATATGCCGGATTCTAACGACAAAGATTATATCTCTCGCGAACTGAACATGGGTA
CCTTCCTGCCGAAATCCGTTAGCAAAGAAAACGGCGTGATCCCGTACCAGCTGCACCTGCA
GGAACTGAAAATCATCCTGTCTAAAGCAGAAGCGTACCTGCCGTTCCTGAAAGTGAAAGAC
CAGTACGGCACCGTTTCCGACAAAATTATCTCCCTGTTCACCTTCCGTATCCCGTACTATGT
GGGTCCAATCAACGAACACGCGGGCTCCTGCTGGGTGGTTAAAAAAGATAAACGCGGTAA
AGTGTACCCGTGGAACTTCACCGAAAAAATCGATATCGAAAAGTCCGCGGAAGGCTTCATC
CGTAACCTGACCAACAAATGCACCTACCTGATCGGTGAGGATGTTCTGCCGAAAAACAGCC
TGCTGTACAGCGAATTCACCGTTCTGAACGAACTGAACAACGTGCGCATCGGCGAAACCAT
GCAGAAACTGCCGCTGCGTCTGAAAGAGAAAGTGATGGACAACCTGTTCAGCCGTTACAAA
CACGTGAGCCGCACCAAATTCATCAAATACCTGGTGAGCGAAGGCATCGATAAAAAAGAA
GCTGAAAGCATCTCTGGCCTGGACGGCGATTTCAAAAGCTCTCTGAGCTCCCTGATCGACAT
GAAACACATCCTGGGTAACGACTTCAGCCGTGAAAACGCGGAAAAAATGATCCAGGATATC
ACCATCTTCGGCGGCGATAAAAAGATGCTGAAAAACCGCCTGCACCGTGAATTCTCCTACC
TGACCCCGGAACAGCTGACCAGCCTGACCCAGCTGTCCTACGACGGCTGGGGCCGTCTGAG
CAAAGAATTCCTGGTTAACTTACTGCCGGCTGAAGGTGATAGCTGTGAAGTGCTGGTTGATC
ACACCAGCGGCGAAGTGCTGAACATTATCAGCGCGATGCGTCAGACCTCCTACAACCTGAT
GGAACTGCTGGGCAGCCGCTTCGGCTACGGCCAGGCGATCGAAGAACGTAACAAAAAAGA
AGAAGGCCAGGGCCGTATCACCTACAAAGACGTTGAGGATCTGTACATCAGCCCGGCGGTT
CGTCGTCCGCTGTGGCAGGCGCTGAAAATCGTGCGCGAAATCGTGAAAATCACCGGCAAAG
AACCGAGCAAAATCTTCATCGAAATGGCGCGTGAAAACGGTGAAAAAGGTAAACGTACCA
TCTCTCGCAAAGCTCGCCTGCAGGCTCTGTACAAAAAATGTCGTGATGACACCCGTGACTG
GGCGAAAGAACTGGAAGGCAAATCCGAAGAAGATTTTCGCTCTGATCGTCTGTATCTGTAC
TACACCCAGATGGGTCGCAGCATGTACACCGGTAAACCGATCGATATTAACCGTCTGTTCG
ATCGTAACGTGTATGACATTGATCACATTTACCCGCAGTCCCTGACCGGTGACGATAGCCTG
GATAACCGCGTACTGGTGGAAAAAACCGTTAACGCAAAGAAAGGTGACACCTACCCGCTGT
CTAGCGCACTGGATGGTTGCTACATTTCTGGTCAGCAGATTCGTATCCAGGATATCCAGAAA
GAAATGCGTCCGTTCTGGCACATGCTGCTGGAAAAAGAACTGATTTCTAAAGAAAAATACA
ACCGCCTGTCTCGCACCATCCCGCTGTCCGACGCGGAAAAAGCAGCGTTCATTGGTCGTCA
GCTGGTTGAGACCCGCCAGTCCACCAAAGCCTGCGCGGAACTGCTGTCTAAAGCGTATCCG
CAGACCCGTATCGTGTACACCAAAGCGGGCAACGCTAGCCGTTTCCGTCAATACGGTGGCT
TTATCAAAGTGCGTGATATGAACGACTACCACCACGCGAAAGATGCATATCTGAACATCGT
AGTTGGCAACGTTTTCAACACCCGTTTCACCGCCAACCCGCTGCACTTCCTGAAGGGTAACC
ACCAGGCTTACTCCCTGAACACCGAAGCGTTGTACGGTCATAAAGTATCCCGTAACGGCGT
GGATGCGTGGATCCCGGCGGAGAAAGATGAAAAAGGCCAGGTTATGGCAGGCCACGAAGG
CACCATGGGTACCGTTCGCAAATGGATGCGCAAAAACAACATCCTGTTTACCCGCATGCCG
TACGAAGGCAAAGGCGGCCTGTTCGACCAGAACATCATGAAAAAAGAAAAAGGCCAGGTG
CCGATCAAAGGTGATTCCCCGATTAGCAACATCAAAAAATACGGTGGCTATAACAAAGCCA
AAGTGGCGTATTTCGTTCTGACGCAGTCTAAACTGAACAAAAAGACCGTTTATACCCTGGA
AGCCATCCCGCTGATTCTGAAAAACAGCATTCAGTCCAACGAAGATAAAGAAACCTATATT
CAGAAACAGTGGCGTAAAAACGGTAAGAAAATGGAACATCCGATCGTTTGTCTGGGCCATA
TTCCGGTGCAGTCCCTGCTGGAAATTAACGGCTTCAAAGTGCACCTGTCAGGCAAAAACGG
TAAAGATATCCTGCTGCGCAACGCGGAACAGCTGTGTATCAACGAAGCAGATACCGCTGTT
CTGAAGAAAATCCTGAAATTCAACCAGCGTGCCGCGATGAGTAAAAAAGGCGAAGAAATC
TTCATCAACAGCTTCGATAACATCCAGGAAGAAGATCTGAACCGCCTGTACCACGTTTTCGA
AGATAAACTGACCAACCAGATCTACAAAGTTAAACTGGAAAAACAGGCTGCTGTGCTGAAA
AAAGGCGAAGAAACCTTCAACCGCCTGAGCCCAGAACAGAAATGTAAACTGATCGGTGAA
ATCCTGCACCTGTGCCAGTGCAAAGCTACTCACGCTGATCTGCGTCTGATTGGCGGCGCGAA
AAAAGCCGGCATCCTGACCATGGGTACCCAGATCTACCCGAAAGACCACGTTTACCTGATC
GAACAGTCCGTTACCGGCTTCTTCGAAAAACGTATCCTGCTGGCGCCGTTCGGTGAAAAATAA;SEQID NO.13:ATGGCGAATACTTTTAAAGTCAT;
SEQ ID NO.14:
ACATTACTCTCAAACTACAAATGTATTCATTTGATACATTTGATATCAAATTTTGAAAATCCAGCTTGCAACTGGTATGTAAATCCACATCTTTGTTATACATTCTTATACAATAAATATCAACACATATCTTTCCTAATACCATAACAATACCTATAACCTGAACTCCTATTCAAAATATTGACAATTCCCCTTTCATGATGTAATGTGTAAATGAATTTACATTGCGAGTTCAAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTTTTTACTTAGGATTTTTTATTATCATTATATATTGTATATTTCATTTTCTCGAATAGTATATATTTTATATTTTTGATTT;
SEQ ID NO.15:
AAACCGAACGAACACATTGACAAAACCGATAATGGTTTTACCACTATCAAGAATCACAACACTCTCAAACCTCAAATTGCATTTTCATGCATCGGTTCTCTGCAAGTGTATCCGCTTACACCGGGCGGCGCGACTCTTGGCAGTGTATCAAATGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAAAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGGATATACGCACAACAAAAGGCCCCATTATCTCATATCCCAAAAGACATGAAATAACAGAGCCTGAAAAAGCCTCTTTTGCCACCTTCCCTGCTGTCCTGTCCATCATCATAATCATCCCTTCTCTAATAATTAATATAAAAAGGATTTCCTATGAACTCATTTTATCATTAAACTCATTATATCATGAGTGACCGGTCTACGCCTTCTACCTAAAGCATGTTACCTTCTACTTCTATTATACTCAGAGGCATGACACACTCTGTCGCTCCGCGAAAAAATCCTGAATTTTTATCAAAAATTAATCTTACGAATAAAAGGAATGCCTATAATCCTCATCTGCAGAAGAAATCGGCAGCCTGATCTATCTCCTTTCTATATACAGAGGAGTCCCCTGAAAGCACAAAAACTTCCTGAATCTCCTGTGGCAGTGACCTGCCTTTAGAGTTTCAGGAAGTTTTTGCTCCTCACGGTTTCCCGCAAGGGCGGCAATCGGAATCGCCATTAGGGAAGCGCTGATTAAATCGTTATCGAATTTCATTCTTGTATTTTTATTCAATGCAAGGAATTAGTCGACGCGAATAGCGAGCTATTTAAGGAGACTGATGACGAAGCATTGGATAAAAATACATATGAAATTCGATTCTACGAATTAATCAGTGCTTCCTTAGGATTGCCATTTGCTGCATCTTTCCCATGCGCTTTATGTAAGCTAAGGAAACGCATGCCGAATGACCGTCACATAGCACCCGGTCATTTTCTTTATTATACTATTTTTTACAGCAGTCTGCTTTCTTTTTCTGTACATATTCTGTACATATCAAATCAAAAGTCCCCTGA;
SEQ ID NO.16:
TACTCTGCAAATTGTTACATAATCTTCTCCATTGAAATTTATTTTATAAGCAAAAAATAAGTCCTTCGGCAATAGAGCCAAATTGCAATCCACGCTTCCCTTGGGGTGCAGAAAAAAGGAGGCAGAAGCCGCCAAAGGTTCTGCCCCCTTTCAAATTGCATTTTCATGCAGCAGTTCTCCGCAAGTGTATCCGCTTACACCAGACGGCGCAGTTCCTGACAGTGTATCAAACCCTTCATCAGGCAGTCGATAAAAGGCAAATTGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAGAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGATTTGAGCCACAATAAAAGGTCCCGTTATTTCATATCTCAAAAGACATGAATAACA;
library-NGS-F引物的序列为:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTgtctacaatcggctcgatcga;
library-NGS-R引物的序列为:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTgcgcagaccaaaacgatctc。
实施例3:原核干扰实验一
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在原核生物中具有切割能力(即是否能够识别实施例2得到的PAM序列),并且验证本发明实施例2所鉴定的PAM的正确性。
具体操作如下:
(1)构建PAM-target单条质粒,将实施例2所构建的PAM library质粒的6位随机碱基替换为三种Cas9蛋白对应的PAM序列(HqCas9:AGCGAC;DspCas9:GGATAA;DsuCas9:GGATAA)。
(2)将PAM-target单条质粒分别电转入含有三种Cas9基因编辑系统的DH5α感受态中,以PAM空载质粒作为对照,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗板上的单克隆细菌数。
原核干扰结果如图3所示,从右向左为稀释方向,最右列为未稀释原菌液,稀释倍数越大单克隆长得越少。对照组为电转PAM空白质粒组,与Cas9基因编辑系统中的间隔序列不存在互补配对的靶序列,则Cas9蛋白无法行使切割功能,细菌具有双抗性基因则正常生长。实验组的PAM单条质粒中具有能与Cas9基因编辑系统中的间隔序列互补配对的靶点以及PAM,实验组的单克隆数量与对照组相比明显下降,说明Cas9蛋白能识别本实施例选定的PAM序列而发挥切割能力,使细菌不具备抗Amp能力而不能生长。该实验结果表明,本发明的HqCas9、DspCas9、DsuCas9能分别识别序列为AGCGAC、GGATAA、GGACAA的PAM序列,在原核系统中具备切割能力。
实施例4:原核干扰实验二
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统中发挥切割靶向DNA序列所需要的tracrRNA范围。
具体操作如下所示:
(1)把本发明实施例1的三种CRISPR/Cas9基因编辑系统中的非编码区域(Noncoding,NC)分为4段,分别通过Gibson方法组装进target质粒中,前面加上强异源启动子J23119,分别构建为target-NC 1-4质粒。
(2)构建pET28a-ΔCas9质粒:将实施例2得到的pET28a-Cas9质粒中删除所有的NC部分,保留Cas9蛋白、重复序列和间隔序列。
(3)把target-NC 1-4质粒分别电转进入含有pET28a-ΔCas9的大肠杆菌DH5α感受态中,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗平板上的单克隆细菌数。
原核干扰结果如图4所示,结果表明,HqCas9的NC4、DspCas9的NC2、DsuCas9的NC1所对应的生长菌落最少,说明这三段对应的NC区域是辅助Cas9核酸酶发挥有效切割效应的主要序列。
实施例5:预测CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构
为预测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构,通过模拟tracrRNA与重复序列转录后的RNA结合过程,预测两者结合后的RNA二级结构,通过使用在线软件NUPACK进行模拟,结果如图5所示,重复序列与tracrRNA之间通过“GAAA”进行连接。三种CRISPR/Cas9基因编辑系统发挥靶向切割所需要的scaffold序列如SEQ ID NO.17~19所示。
上述序列信息如下:
SEQ ID NO.17:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGAgaaaATGAATTTACATTGCGAGTTC AAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTT;
SEQ ID NO.18:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAA AGAGCTCCTTCGGGAGTTCTT;
SEQ ID NO.19:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAG AGAGCTCCTTCGGGAGTTCTT。
实施例6:dsODN插入实验一
本实施例通过dsODN插入实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中发挥靶向切割的最适间隔序列的长度。
具体操作如下:
(1)根据本发明实施例1的三种Cas9蛋白进行人源密码子优化,将对应的核苷酸序列克隆进PX330真核表达载体上(addgene,59909),获得PX330-蛋白真核表达质粒。
(2)在哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,以本实施例3所鉴定的能在原核生物中识别切割的PAM序列,寻找到合适的靶位点,序列格式为5’-不同长度的间隔序列(18~30bp)-直接重复序列-3’,通过Gibson方法克隆到PXZ载体上(addgene,160229),构建靶向同一靶位点、具有不同spacer长度的PXZ-target质粒,同时转染PX330-蛋白真核表达质粒与PXZ-target质粒。具体target序列见表1。
(3)在生长状态良好的HEK293T细胞24孔板中共转染PX330-蛋白真核质粒、PXZ-target质粒、1.2μL dsODN,72h后收细胞抽提DNA。
(4)在对应的基因靶点上游以及dsODN序列上设计一对引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的插入,通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在真核细胞环境下是否具有编辑能力,并比较不同长度的间隔序列对应的条带强弱。
表1碱基大小和序列
检测结果如图6所示,对应长度的PCR条带用红色三角标注,代表有dsODN的插入,说明这三种CRISPR/Cas9基因编辑系统在真核细胞中均具有靶向切割能力。根据条带强弱比较发现HqCas9的spacer最佳间隔序列识别长度是20~24bp,DspCas9的spacer最佳识别长度是21~24bp,DsuCas9的spacer最佳识别长度是22~24bp。
实施例7:dsODN的插入实验二
本实施例通过dsODN的插入实验,检测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中的在靶和脱靶情况以检测切割效果。
具体操作如下所示:
(a)构建位点质粒,实施例6的结果已表明三种Cas9的最适识别的spacer的长度,哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,寻找到合适的靶位点(见表2),序列格式为5’-与靶点互补的间隔序列-scaffold-3’,通过Gibson方法克隆到PXZ载体上,构建PXZ-target质粒。
表2靶位点及其序列
(b)同时电转实施例6制备的PX330-蛋白真核表达质粒、PXZ-target质粒和1.2μLdsODN,72h后收细胞抽提DNA。
(c)在对应的基因靶点上游以及dsODN序列上设计引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的插入,首先通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在该选择的靶位点上是否发生靶向切割。
(d)挑选能检测到dsODN-PCR条带的DNA进行GUIDE-seq建库,上机进行二代测序,通过生物信息学分析检测三种Cas9基因编辑系统的在靶切割以及脱靶情况。
GUIDE-seq检测结果如图7所示,三个蛋白在对应的多个靶位点上的在靶Reads数较高,脱靶位点较少或检测不到脱靶,说明本发明所述HqCas9、DspCas9、DsuCas9基因编辑系统均在真核生物中具备较强的切割效率和较好的切割特异性。
综上,本发明首次鉴定出三种全新的II型CRISPR/Cas9基因编辑系统,三种新型编辑系统的Cas9蛋白分别命名为HqCas9、DspCas9和DsuCas9,通过以上实施例证明本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
本发明选择原核和真核DNA来验证三种II型CRISPR/Cas9基因编辑系统的编辑能力。Cas9蛋白识别靶向序列需要与crRNA间隔序列互补的核苷酸序列、可以识别的PAM序列。首先,通过原核耗竭实验证明本发明的Cas9蛋白在原核生物中具有切割能力,获知了Cas9蛋白在原核系统中识别的PAM序列。再通过原核干扰实验和真核细胞实验验证了PAM的正确性。本发明通过人为设计crRNA中的间隔序列,得到的II型CRISPR/Cas9基因编辑系统可以靶向基因组中几乎所有感兴趣的DNA序列,产生位点特异的平末端双链断裂(DSB)。通过非同源末端修复DSB,在切割位点产生小的随机插入/缺失(indels)使目的基因失活;或者通过高保真同源修复,可以使用同源修复模板在DSB位点进行精确的基因组修饰。通过GUIDE-seq结果显示两个蛋白的编辑在靶数较高,说明编辑效率高,脱靶数少说明编辑精确率高。HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围。
本发明的三种II型CRISPR/Cas9基因编辑系统的发现进一步扩大了基因编辑工具的种类,为科学研究与疾病治疗提供了有力的研究工具,对推动将基因编辑应用于临床治疗具有重要的作用。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (5)
1.一种II型CRISPR/Cas9基因编辑系统,其特征在于,包括氨基酸序列如SEQ ID NO.2所示的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列;
所述的tracrRNA序列如SEQ ID NO.15所示。
2.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统,其特征在于,编码所述Cas9蛋白的核苷酸序列如SEQ ID NO.11所示。
3.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统,其特征在于,所述辅助蛋白的氨基酸序列如SEQ ID NO.5所示。
4.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。
5.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311513462.9A CN117757774B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310510300.3A CN116751764B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
CN202311513462.9A CN117757774B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310510300.3A Division CN116751764B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117757774A CN117757774A (zh) | 2024-03-26 |
CN117757774B true CN117757774B (zh) | 2024-08-06 |
Family
ID=87952200
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311513465.2A Active CN117448300B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
CN202310510300.3A Active CN116751764B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
CN202311513462.9A Active CN117757774B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311513465.2A Active CN117448300B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
CN202310510300.3A Active CN116751764B (zh) | 2023-05-08 | 2023-05-08 | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN117448300B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117866926B (zh) * | 2024-03-07 | 2024-08-16 | 珠海舒桐医疗科技有限公司 | 一种CRISPR-FrCas9蛋白突变体及应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331264A (zh) * | 2020-09-11 | 2021-02-05 | 中山大学附属第一医院 | 一种同源2型CRISPR/Cas基因编辑系统的构建方法 |
CN113234701A (zh) * | 2020-10-20 | 2021-08-10 | 珠海舒桐医疗科技有限公司 | 一种Cpf1蛋白及基因编辑系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110913881A (zh) * | 2017-03-14 | 2020-03-24 | 加利福尼亚大学董事会 | 工程化crispr cas9免疫隐身 |
US20210301269A1 (en) * | 2020-01-22 | 2021-09-30 | New York Genome Center, Inc. | Recombinant crispr-cas9 nucleases with altered pam specificity |
CN114075559B (zh) * | 2020-09-14 | 2023-11-17 | 珠海舒桐医疗科技有限公司 | 一种2型CRISPR/Cas9基因编辑系统及其应用 |
CN113234702B (zh) * | 2021-03-26 | 2023-02-10 | 珠海舒桐医疗科技有限公司 | 一种Lt1Cas13d蛋白及基因编辑系统 |
-
2023
- 2023-05-08 CN CN202311513465.2A patent/CN117448300B/zh active Active
- 2023-05-08 CN CN202310510300.3A patent/CN116751764B/zh active Active
- 2023-05-08 CN CN202311513462.9A patent/CN117757774B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331264A (zh) * | 2020-09-11 | 2021-02-05 | 中山大学附属第一医院 | 一种同源2型CRISPR/Cas基因编辑系统的构建方法 |
CN113234701A (zh) * | 2020-10-20 | 2021-08-10 | 珠海舒桐医疗科技有限公司 | 一种Cpf1蛋白及基因编辑系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117757774A (zh) | 2024-03-26 |
CN117448300B (zh) | 2024-04-30 |
CN116751764B (zh) | 2024-01-30 |
CN116751764A (zh) | 2023-09-15 |
CN117448300A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11155814B2 (en) | Methods for using DNA repair for cell engineering | |
AU2016274452A1 (en) | Thermostable Cas9 nucleases | |
CN109880851B (zh) | 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法 | |
EP3940078A1 (en) | Off-target single nucleotide variants caused by single-base editing and high-specificity off-target-free single-base gene editing tool | |
CN112430586B (zh) | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 | |
CN117757774B (zh) | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 | |
WO2023142594A1 (zh) | 一种精确无pam限制的腺嘌呤碱基编辑器及其应用 | |
WO2022199511A1 (zh) | 一种Lt1Cas13d蛋白及基因编辑系统 | |
CN116286737B (zh) | 无pam限制的核酸内切酶及其介导的基因编辑系统 | |
CN116179512A (zh) | 靶标识别范围广的核酸内切酶及其应用 | |
EP4116430A1 (en) | Method for detecting random off-target effect of single-base editing system | |
CN116179513B (zh) | 一种Cpf1蛋白及其在基因编辑中的应用 | |
CN116949011A (zh) | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 | |
CN113151277A (zh) | 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA | |
CN116751763B (zh) | 一种Cpf1蛋白、V型基因编辑系统及应用 | |
CN116836300A (zh) | 一种碱基编辑分子及其用途 | |
US20240368675A1 (en) | Pam-less endonuclease and gene editing system mediated by pam-less endonuclease | |
Gutierrez et al. | Genome-wide CRISPR-Cas9 screen in E. coli identifies design rules for efficient targeting | |
KR102685590B1 (ko) | 사이토신 교정 활성이 제거된 아데닌 염기교정 유전자가위 및 이의 용도 | |
US20240055077A1 (en) | SYSTEM AND METHOD FOR PREDICTING ACTIVITY AND SPECIFICITY OF 17 SMALL Cas9s USING DEEP LEARNING | |
WO2024093489A1 (zh) | 一种真核细胞持续进化的控制方法及其应用 | |
Zhu | Optimal gRNA design of different CRISPR-Cas systems for DNA and RNA editing | |
Wei et al. | A Novel White-to-Blue Colony Formation Assay to Select for Optimized sgRNAs | |
CN118871578A (zh) | 用于碱基编辑的脱氨酶及其变体 | |
CN116179600A (zh) | 一种精准敲除UCHL1基因的CRISPR/Cas9基因编辑系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |