CN117757774B - 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 - Google Patents

一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 Download PDF

Info

Publication number
CN117757774B
CN117757774B CN202311513462.9A CN202311513462A CN117757774B CN 117757774 B CN117757774 B CN 117757774B CN 202311513462 A CN202311513462 A CN 202311513462A CN 117757774 B CN117757774 B CN 117757774B
Authority
CN
China
Prior art keywords
cas9
gene editing
crispr
protein
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311513462.9A
Other languages
English (en)
Other versions
CN117757774A (zh
Inventor
田瑞
赵停停
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Shutong Medical Technology Co ltd
Original Assignee
Zhuhai Shutong Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Shutong Medical Technology Co ltd filed Critical Zhuhai Shutong Medical Technology Co ltd
Priority to CN202311513462.9A priority Critical patent/CN117757774B/zh
Publication of CN117757774A publication Critical patent/CN117757774A/zh
Application granted granted Critical
Publication of CN117757774B publication Critical patent/CN117757774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因工程技术领域,公开了一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。本发明筛选了一种Cas9蛋白,其氨基酸序列如SEQ ID NO.2所示。本发明还提供了一种编码Cas9蛋白的核苷酸序列。本发明提供了一种II型CRISPR/Cas9基因编辑系统,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。

Description

一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
本发明专利申请是基于2023年05月08日提交的发明名称为“一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用”的中国专利申请号2023105103003的分案申请。
技术领域
本发明涉及基因工程技术领域,具体涉及一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。
背景技术
CRISPR/Cas(Clustered Regularly Interspaced Palindromic Repeats/CRISPR-ass ociated proteins system)基因编辑技术作为第三代编辑工具,比第一代ZFNs(Zinc Finger Nucleases)和TALENs(Transcription Activator-like EffectorNucleases)相比,有着设计简单、成本较低和编辑效率高的优点,成为当今最主流的基因编辑系统。CRISPR/Cas系统是帮助细菌和古菌防御外来核酸入侵的自适应免疫系统,作用原理为:当某些细菌在遭到病毒入侵后,能够把病毒基因的一小段储存到自身DNA里面,当病毒再次入侵时,细菌能够根据记忆读取识别出病毒基因,并将其切断以沉默表达。
CRISPR/Cas基因编辑系统通过外源DNA的采集、crRNA的合成、靶向干扰这三个过程行使编辑功能。CRISPR array包含直接重复序列(Direct Repeat,DR),这些重复序列由外源DNA的独特间隔序列(Spacer)分离。CRISPR array被转录成长转录物(pre-crRNA,CRISPR RNA的前体),然后被加工处理以产生小的成熟的CRISPR RNA(crRNA),由间隔序列和部分相邻的直接重复组成。crRNA与Cas核酸内切酶形成复合物,在某些情况下,还与辅助蛋白形成复合物并用作靶向和切割外来核酸的指南,从而实现干扰。Cas-crRNA复合物的DNA识别需要靶位点附近存在原间隔物相邻基序(PAM,Proto-spacer Adjacent Motif),这有助于自我与非自我辨别。CRISPR/Cas基因编辑系统根据不同蛋白酶数量大致分为两类:I类系统使用多种Cas蛋白的复合物,如Cascade,而II类系统使用单一效应酶,如Cas9。目前,II型CRISPR/Cas基因编辑系统已成为基因编辑中重要的工具。
现有技术中,源自化脓链球菌(Streptococcus pyogene Cas,SpCas9)的II型系统因其切割效率高,成为现下应用最为广泛的基因编辑系统。这一系统通过识别序列为NGG的PAM靶向切割。然而,这一PAM要求也限制了SpCas9的应用,某些靶位点可能因存在较少GG而无法使用SpCas9进行识别与编辑。因此,基于现有II型CRISPR/Cas9系统存在的不足,急需开发新的CRISPR/Cas基因编辑系统。
发明内容
本发明的目的在于克服现有技术的不足之处而提供一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。
为实现上述目的,本发明采取的技术方案如下:
第一方面,本发明筛选了一种Cas9蛋白,所述Cas9蛋白的氨基酸序列如SEQ IDNO.1~3中任一种序列所示。
本发明筛选得到三种新型编辑系统的Cas9蛋白分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统可识别多种不同的PAM序列,HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围,克服了SpCas9的局限性。
第二方面,本发明提供一种编码Cas9蛋白的核苷酸序列,所述核苷酸序列如SEQID NO.10~12中任一种序列所示。
第三方面,本发明提供了一种II型CRISPR/Cas9基因编辑系统,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。
采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明的基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式,所述tracrRNA序列包括重复序列,所述重复序列如SEQ ID NO.7~9中任一种序列所示。进一步的,所述的tracrRNA序列如SEQ ID NO.14~16中任一种序列所示。
作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式,所述辅助蛋白的核苷酸序列如SEQ ID NO.4~6中任一种序列所示。
第四方面,本发明将所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。
第五方面,本发明将所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。
与现有技术相比,本发明的有益效果为:
(1)本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
(2)采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
附图说明
图1为本发明CRISPR/Cas9基因编辑系统的进化树、系统组成和蛋白生物信息学分析结果示意图。
图2为本发明三种CRISPR/Cas9基因编辑系统的原核PAM序列图。
图3为本发明三种CRISPR/Cas9基因编辑系统的原核干扰图。
图4为本发明三种CRISPR/Cas9基因编辑系统的NC确认原核干扰图。
图5为本发明三种CRISPR/Cas9基因编辑系统的scaffold结构图。
图6为本发明三种CRISPR/Cas9基因编辑系统的真核细胞spacer最适长度探究图。
图7为本发明所述三种CRISPR/Cas9基因编辑系统的GUIDE-seq在靶与脱靶检测图。
具体实施方式
为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明所述Cas9核酸内切酶是一种DNA内切酶。本发明所述的碱基序列中的所述N,表示A、G、C、T中的任意一种。本发明所述的Cas9蛋白,是一种多结构域的DNA核酸内切酶,包括REC结构域、RuvC结构域、HNH结构域和PI结构域,它能识别在PAM5’端识别与sgRNA互补的DNA序列,分别通过HNH结构域切割与sgRNA互补的DNA链,RuvC结构域切割非互补链DNA。本发明所述的crRNA,以碱基互补的方式引导Cas蛋白识别入侵的DNA,5’端为间隔序列,与靶DNA互补,3’端为重复序列。本发明所述CRISPR/Cas9基因编辑系统还需要tracrRNA的参与,tracrRNA是单独转录的,tracrRNA与pre-crRNA通过剪辑互补配对结合,经过RNA酶III酶切处理将pre-crRNA的5’部分间隔序列和3’部分重复序列,形成成熟的crRNA,与tracrRNA结合形成tracrRNA-crRNA复合体,通过在crRNA下游和tracrRNA上游之间添加四个碱基的tetraloop(如“GAAA”、“TGAA”或“AAAC”序列)可以将tracrRNA和crRNA连接起来形成scaffold。通过调节tracrRNA的长度以及可识别间隔序列的长度能进一步优化Cas9核酸内切酶的切割功能。
实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1:三种新型CRISPR/Cas9基因编辑系统
利用宏基因组生物信息手段对II型CRISPR/Cas9基因编辑系统相关蛋白及其元件进行分析、预测、筛选,利用CRISPRCas Finder软件进行宏基因组注释,通过NUPACK软件预测crRNA和tracrRNA的二级结构,使用HHpred软件预测功能域,并利用FastTree软件构建系统发育树。提供了三种新II型CRISPR/Cas9基因编辑系统,包括Cas9蛋白、辅助蛋白、CRISPRRNA和tracrRNA,如图1所示。
本发明筛选得到三种新型编辑系统的Cas9蛋白,分别来自:一种未注释细菌继而将其命名为HqCas9;Dialister sp.900538805细菌中的DspCas9;Dialistersuccinatiphilus细菌中的DsuCas9。HqCas9蛋白编码1353个氨基酸,其序列如SEQ ID NO.1所示;DspCas9蛋白编码1383个氨基酸,其序列如SEQ ID NO.2所示;DsuCas9蛋白编码1389个氨基酸,其序列如SEQ ID NO.3所示。将3种Cas9蛋白与已发表的其他14种II型CRISPR/Cas9基因编辑系统进行系统发育树分析,显示HqCas9、DspCas9、DsuCas9归为Type II A这一支,三种Cas9蛋白之间序列相似性较高,与FrCas9亲缘关系最近,进化树如图1A所示。
所得CRISPR/Cas9基因编辑系统由以下多个元件组成:基因编码的Cas9核酸内切酶,辅助蛋白Cas1、Cas2、Csn2、CRISPR array以及反式激活CRISPR RNA(trans-activatingcrRNA,tracrRNA)。本发明所述三种新型CRISPR/Cas9基因编辑系统的组成图如图1B所示、Cas9蛋白结构图如图1C所示。辅助蛋白Cas1,其序列如SEQ ID NO.4所示;辅助蛋白Cas2,其序列如SEQ ID NO.5所示;辅助蛋白Csn2,其序列如SEQ ID NO.6所示。三种辅助蛋白参与外源基因捕获,以及crRNA的成熟。
CRISPR array包括直接重复序列和间隔序列,这两种序列是间隔排列的,两个重复序列中间夹一个间隔序列,重复序列在同一细菌中的碱基组成和长度是相对保守的,在不同的细菌之间会有些许差异。本发明的三种新型CRISPR/Cas9基因编辑系统所对应的重复序列,依次如SEQ ID NO.7~9所示。
上述序列信息如下:
SEQ ID NO.1:
MQTKKVDEYYVGFDIGTNSVGYAVTDKNYNLIKHGGEPMWGSHVFEAASTAQERRTFRTARRRNDRKKQRIALVSEIFAPEIAKVDPRFFIRRRESALFRDDVDIKDRYVVFNDDDFTDKDYYDIYPTIHHLIYDLMSNKEKHDIRLVYMACAYLVAHRGHFLSEVSKDNIEDVLDFDVVYCNFLNVMDNYAEIPWKCDISKFKEILKKKQTVTNKEREFLQLLNEGKKFKTSEEDDVSREGLVKLLSGGTYELGKLFPKLTFEEKVSVSFNMAEEDFAMVLQQLGDEGDIISSLRNVYDWAILSDVLNGKNSVSEGKITVYEQHKKDLSFLKYFVKKYIPNRYYEVFRDGNIVGNYVSYSYNLKNVQNVSKFKGAKKDVFCDYIKKVVKDIKVDDEDKVEYEDMMFRLDTYSFIPKQVENDNRVIPYQLYYYELKRILDNASSYLEFLDEKDMDGYTSREKLLSIMEFRIPYYVGPLRTDNGQHGWMKRKAEGRIYPWNFEDKVDLDASEQEFINRMTNSCTYLPGETVVPKYSLLYCKFNVLNEINNIKINDCSIPIEHKQGIYKLFERYRKVTPKKIKDFLISNNLLHPEDVISGIDVTIKSSLKSYHDFKKLLESCVLKENQVEAIIERLTYSEDKGRILRWLHMEFPDLSDDDVKYISKLKYSDFGRLSRKLLVGIRGCNKDTGEVDSIMGMLWSTNDNMMKLLSNSYTFIEEIEAIKNEYYVEHPANLDSMLDEMYVSNAVRRPIHRTLDILSDIRKVCGKNPSKIFVEMARGGGEKGVRTKSRRDQISELYKNMDKAEVRELSEQLEGKTDNELQSEVLFLYFMQLGKCAYTQKTIDIDKLKTNIYNVDHIYPQSYVKDDSITNKVLVISEENGQKGDKYPISKDIREKMQPFWYRLLSNKLISEEKYRRLTRCTSFTEEELTGFINRQLVETHQSTKAVTTVFRTLFPDVEIVYSKAGLVSEFRKEFDMLKTRSVNDLHHAKDAYLNIVVGNVYHCRFTKNFYITQKYSLKTKTLFTHSVKLGDDVIWNGQESIGNVRKVLAKNNIHYTKYPFMRKGGLFDQMPVKAAAGLIPRKTGLDTEKYGGYNKSTATAFLLVKYKEKGKQEAMIMPVDYMYSEKVFSDNEYALKYSKENIKKIWGRTEDQVIDVSLPLGLRPIKINTMLSFDGFRACITGKANAGQKIGFTSMMPLVIGNEWENYIKKIDNYIEKKGKNKNITLNEKNDGICGEKNEKLYCILTDKIINNIYSIPFNSQQKILENGYDKFKKLDIERQVYFLQNLVLVLKSGRAGSCDMSAIGGSKNAATFAFGSKLSLWAKKFQKVYLIDNSSSGIYQNMSDNLLDIIK;
SEQ ID NO.2:
MMKEIKNYFIGLDMGTTSVGWAATDENYEIIKKNGKALWGIRLFDEAQTAADRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQKNSLFNDVDFDDKAYYKEYPTIYHLRYDLMTKDRPFDVRLVYLAVHHILKHRGHFLFDHFQVDENGVSGFEESFAAFGDALEHIKGESFDMGKEEEMKALCRDKKLGVRHKALALAQCLGRSKDKDFKAMMTLAAGGTALLSEVFKDEGLKDFSKNKVSFSDSQFENDKPEIIAELGDRYDLIAALHGLYNWSFLAELMRGHKYISEAKIEIYDKHKEDLALLKKVLKQDRSVYNLMFKEPGDKKPINYSAYVKACKTNGKKLPLPYGKFKYEEFIKTVKFCLKNLPDSPDKKNIENKLEEGSFLLKAVSVENGAIPYQLHLQELKIILSKAEAYLPFLKVRDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKQGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGENAQKLSPELKEKVLENLFKKHKHVSRRKFINYLVTEGIDKKEAESISGLDGDFKSSMSSLIDMKHILGNDFSREDAEKMIKDITIFGGDKKMLKKRLHREFSYLTSEQLTSLTRLSYDGWGRLSKELLVNLLPVEKSTGEVLVDKGSGEVLNIISAMEQTSYNLMELLSSRFGYATAIEERNREKEGNGTISYQDVEDMYISPAVKRPLWQALKIVREIVKILGKEPSKIFIEMARENGEKGKRTISRKARLQELYKKCRDDSRDWAKELAEKPEEDFRSDRLYLYYTQMGRSMYTGKPIDINQLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDIYPLGSALDGCHIQGEIHIQDIQREMRPFWHMLLEKGLISKEKYNRLSRTTPLSDTEKAAFIGRQLVETRQSTKACAELLSKAYPQARIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFDTRFTANPLHFLKGNHPVYSLNTEALYGHKVSRGGVDAWIPPEKDDEGHIMAGHEGTMGTVRKWMRKNNILFTRMPLEGKGGLFDQTIMKKGKGQVPLKGDSPVSDIEKYGGYNKASSAYFVLTSSKLKDETIYTIETIPLIIKRMIQTNKDKEDYIKRHWKDHGKKMVNPHICYGHIPVQSLLEINGFKVHLTGKSGKDFKLRNAEQLCISNDDAAVLKRVLKYNERSSLSKGKEALLITPFDNIQEVDLNRLYQVFEDKLTNQVYKVKLGKQASVLKKGEDKFNELPLEVKCRVIGEILHLFQCNAAIADLRLIGGAKNAGALTMNPRVSPEDHVYLIEQSVTGFFEKRILLAPYGGK;
SEQ ID NO.3:
MKEIKKIFIGLDMGTNSVGWTATDENYEVIKKNGKALWGIRLFDEAQTAEDRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQTNSLFNDVDFNDKAYYKKYPTIYHLRHALMTENHPFDVRLVYLAIHHILKHRGHFLFENFQTDEKGTSGFDESFAAFGSALDRIKGSSPDVRKADSMKDILKDKKLGVKEKAASLLQCLGQGKEKDFKAMMTLAAGGTASLSDIFNDEKLKDFEKNKVNFSSAQFEENEPDIMAELGDRYDLIAALHGFYNWSLLAELMGEYHYISEAKIAVYDKHKADLKVLKRVLKQRPDIYAKIFREPGSSANKNYSAYVGVCKVKGKKAAIEKCSYEDFTKTLKPCLKDMPDSNDKDYISRELNMGTFLPKSVSKENGVIPYQLHLQELKIILSKAEAYLPFLKVKDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKRGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGETMQKLPLRLKEKVMDNLFSRYKHVSRTKFIKYLVSEGIDKKEAESISGLDGDFKSSLSSLIDMKHILGNDFSRENAEKMIQDITIFGGDKKMLKNRLHREFSYLTPEQLTSLTQLSYDGWGRLSKEFLVNLLPAEGDSCEVLVDHTSGEVLNIISAMRQTSYNLMELLGSRFGYGQAIEERNKKEEGQGRITYKDVEDLYISPAVRRPLWQALKIVREIVKITGKEPSKIFIEMARENGEKGKRTISRKARLQALYKKCRDDTRDWAKELEGKSEEDFRSDRLYLYYTQMGRSMYTGKPIDINRLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDTYPLSSALDGCYISGQQIRIQDIQKEMRPFWHMLLEKELISKEKYNRLSRTIPLSDAEKAAFIGRQLVETRQSTKACAELLSKAYPQTRIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFNTRFTANPLHFLKGNHQAYSLNTEALYGHKVSRNGVDAWIPAEKDEKGQVMAGHEGTMGTVRKWMRKNNILFTRMPYEGKGGLFDQNIMKKEKGQVPIKGDSPISNIKKYGGYNKAKVAYFVLTQSKLNKKTVYTLEAIPLILKNSIQSNEDKETYIQKQWRKNGKKMEHPIVCLGHIPVQSLLEINGFKVHLSGKNGKDILLRNAEQLCINEADTAVLKKILKFNQRAAMSKKGEEIFINSFDNIQEEDLNRLYHVFEDKLTNQIYKVKLEKQAAVLKKGEETFNRLSPEQKCKLIGEILHLCQCKATHADLRLIGGAKKAGILTMGTQIYPKDHVYLIEQSVTGFFEKRILLAPFGEK;
SEQ ID NO.4:
MNQLVTGGISVLNKGEFIKKQILVYEPFLGDKMSYKNDNMVIRDGNGKIKYQVSCYRIFMVLIVGDVTITTGILRRQQKFGFRLCFLTLGLKVYSVIGPQLQGNTLLHCKQYAYDELTVGKSIIINKILNQRAALTRLRSKTEDVWECISLLEQYSKRLQNDSLNLQEIIGIEGMASKIYFPRIFSNTQWIGRKPRIKFDYINTLLDIGYNALFNFIDAILQVFGFDVYYGVLHTCFYMRKSLVCDIMEPMRPIVDWQIRKSINLKQFKQDDFVQVGKQYQLKYKKSTQYLQVFLEAILNYKEEIFVYVRDYYRSFMKNNPIEAYPVFKLEEL;
SEQ ID NO.5:
MIIVSYDISDDKLRTKFSKYLSRFGHRIQYSMFEIDNSERILNNIICDIHNQFEK KFSQEDSIYIFNLSKWCKIERFGYAKNETNDLLVLTGCKPRP;
SEQ ID NO.6:
MRFFHHIFSKPIIFRENKVNLLVIENKKLFANFVRDFSVQSRGEEGEILLSDDVSDLDFEKHAEVIADYFSLDFNGKKLSSKLITELKQSALYGFAGEAGELLGLLNSFGSKVISSVEFPLEWETVYDIGAVLKLFDYRLNVSSENFLEMLVDYMEVCSHFLKKDIFVLVNLKSYFDMEEIKLLYKEAFFRKWNLIVLEPSSSGSLHEYEDIVIIDKDICEIRLDNEEFL;
SEQ ID NO.7:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGA;
SEQ ID NO.8:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA;
SEQ ID NO.9:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA。
实施例2:原核PAM耗竭实验
本实施例通过原核PAM耗竭实验挖掘本发明实施例1的II型CRISPR/Cas9基因编辑系统Cas核酸酶识别间隔序列所需的PAM序列。HqCas9、DspCas9、DsuCas9的核苷酸序列分别如SEQ ID NO.10~12所示。
具体操作如下:
(1)在PAM library间隔序列(其序列如SEQ ID NO.14所示)的3’端添加6个位置随机碱基NNNNNN(共4096条插入片段),采用overlap PCR方法把library构建到pUC19骨架载体上,得到具有4096种不同PAM组合的PAM library质粒,但5’端间隔序列是一样的spacer-PAM混合质粒,经二代测序检测到6个位置的随机碱基丰度Gini值小于0.1,表明6个位置的随机碱基分布较均匀,PAM library质粒具有Amp抗性基因。
(2)构建原核表达的pET28a-Cas9质粒:分别在pET28a载体(addgene,108303)的EcoR I和BamH I酶切位点上插入本发明所述三种CRISPR/Cas9基因编辑系统,包括Cas9蛋白、sgRNA与tracrRNA,Cas9蛋白经大肠杆菌密码子优化,最后添加TAA终止密码子;在异源启动子J23119启动子后添加5’-重复序列-间隔序列(与PAM library间隔序列互补)-重复序列-3’,即组成sgRNA后接T7terminator;在异源启动子J23119启动子后添加鉴定出来的tracrRNA(其序列依次如SEQ ID NO.14~16所示),三种质粒具有Kana抗性基因。
(3)把含有pET28a-Cas9(或pET28a空载质粒)和PAM library质粒共同通过细菌电转进DH5α(全式金生物,CD201-01)感受态,37℃复苏1h后均匀涂抹在Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的固体培养皿上置于37℃培养18h后刮取全部单克隆至无抗性培养基中,离心提取含pET28a-Cas9(或pET28a空载质粒)和PAM library质粒的混合质粒。
(4)在混合质粒上,随机碱基的两端设计合适的引物对(library-NGS-F和library-NGS-R)含有间隔序列和PAM组合的位置进行PCR扩增及纯化,在产物两端加上接头(采用商业的illumina测序接头引物:Hieff NGS384 Dual Index Primer Kit forSet1(货号12613ES02)I5 primer:TAAGATTA)进行二代测序(I7primer:GAGATTCC),以pET28a空载对照组的PAM耗竭阈值为对照基准,利用Weblogo 3分析6个随机碱基的消耗,通过负向筛选的方式得到每个Cas9蛋白所识别的PAM序列。
PAM序列分析结果如图2所示,HqCas9、DspCas9、DsuCas9能分别识别序列为NGNGNC、NNNAA、NNNAA的PAM。
上述序列信息如下:
SEQ ID NO.10:
ATGCAGACCAAAAAAGTTGATGAATACTACGTGGGCTTCGATATCGGCACCAACTCCGTTGGCTACGCGGTGACCGATAAAAACTACAACCTGATTAAACACGGCGGTGAACCGATGTGGGGCTCCCACGTTTTCGAGGCGGCGAGCACCGCCCAGGAACGCCGTACCTTCCGCACCGCTCGCCGCCGTAACGATCGTAAAAAACAGCGTATCGCGCTGGTGTCTGAAATCTTCGCGCCGGAAATCGCGAAAGTGGACCCGCGTTTCTTCATCCGTCGCCGTGAATCCGCGCTGTTCCGCGAC
GACGTGGACATTAAAGATCGTTACGTGGTTTTCAACGACGACGATTTCACCGATAAAGACT
ACTACGATATCTACCCGACCATCCACCACCTGATCTACGACCTGATGAGCAACAAAGAAAA
ACACGATATTCGCCTGGTTTACATGGCGTGCGCCTACCTGGTGGCGCATCGCGGCCACTTCC
TGTCTGAAGTTTCTAAAGATAACATCGAAGATGTTCTGGACTTCGATGTCGTGTACTGTAAC
TTTCTGAACGTTATGGACAACTACGCGGAAATCCCGTGGAAATGCGATATTTCCAAATTCAA
AGAAATCCTGAAGAAAAAACAGACCGTGACCAACAAAGAACGTGAATTCCTCCAGCTGCTT
AACGAAGGTAAAAAATTCAAAACCAGCGAAGAGGATGATGTGTCTCGTGAAGGCCTGGTG
AAACTGCTGTCGGGTGGCACCTACGAACTGGGTAAACTGTTTCCGAAACTGACCTTTGAAG
AAAAAGTGAGCGTTAGCTTCAACATGGCGGAAGAAGATTTTGCGATGGTTCTGCAGCAGCT
GGGTGACGAAGGTGACATCATCTCCAGCCTGCGTAACGTTTACGATTGGGCGATCCTGAGC
GACGTGCTTAACGGCAAAAACAGCGTGTCTGAAGGCAAAATTACCGTCTACGAACAGCACA
AAAAAGATCTGTCTTTCCTGAAATACTTCGTGAAAAAATACATCCCGAACCGTTATTACGAA
GTTTTCCGTGATGGCAACATCGTTGGCAACTATGTGAGCTATAGCTACAACCTGAAAAACGT
TCAGAACGTATCCAAATTCAAAGGCGCCAAAAAAGACGTTTTCTGTGATTACATTAAAAAA
GTTGTTAAAGATATTAAAGTTGACGATGAAGATAAAGTTGAATACGAAGATATGATGTTCC
GCCTGGATACGTACAGCTTCATCCCGAAACAAGTTGAAAACGACAATCGTGTTATCCCGTA
CCAGCTGTACTACTACGAACTGAAACGTATCCTGGACAACGCGTCCTCTTACCTGGAATTTC
TGGACGAAAAAGATATGGACGGTTACACTTCGCGCGAAAAACTGCTGTCCATCATGGAATT
CCGTATCCCGTATTATGTGGGTCCGCTGCGTACCGATAACGGTCAGCACGGCTGGATGAAA
CGTAAAGCGGAAGGCCGTATCTACCCGTGGAACTTCGAAGATAAAGTGGATCTGGACGCTA
GCGAACAGGAATTTATTAACCGTATGACCAACTCTTGCACCTACCTGCCGGGTGAAACCGT
GGTGCCGAAATATAGCCTGCTGTACTGCAAATTCAACGTTCTGAACGAAATTAACAACATC
AAAATCAACGACTGTTCTATCCCGATCGAGCACAAACAGGGCATCTACAAACTGTTCGAAC
GCTACCGCAAAGTGACCCCGAAAAAGATTAAAGACTTCCTGATCTCTAACAACCTGCTGCA
CCCGGAAGATGTTATCAGCGGCATCGATGTTACCATCAAAAGCAGCCTGAAATCCTACCAC
GACTTCAAAAAACTGCTGGAAAGCTGTGTGCTGAAAGAAAACCAGGTGGAAGCTATCATCG
AACGCCTGACCTACAGCGAAGATAAAGGCCGTATCCTGCGTTGGCTGCACATGGAATTCCC
GGACCTGAGCGATGATGACGTTAAATACATCTCCAAACTGAAATACAGCGACTTCGGCCGC
CTGAGCCGCAAACTGCTGGTCGGCATCCGTGGCTGCAACAAAGACACCGGCGAAGTGGATA
GCATCATGGGCATGCTGTGGAGCACCAACGACAACATGATGAAACTGCTGTCTAACAGCTA
CACCTTTATCGAAGAAATCGAAGCGATCAAAAACGAATACTACGTTGAACACCCGGCGAAC
CTGGACAGCATGCTGGATGAAATGTACGTTAGTAACGCTGTGCGTCGTCCGATTCACCGTAC
CCTGGATATCCTGAGCGACATTCGCAAAGTTTGCGGCAAAAACCCGAGCAAAATCTTCGTT
GAAATGGCGCGCGGTGGTGGTGAAAAAGGTGTTCGTACCAAATCCCGCCGTGACCAGATCT
CTGAACTGTATAAAAACATGGATAAAGCGGAAGTGCGTGAACTGTCTGAACAGCTTGAAGG
TAAAACCGATAACGAATTACAGTCCGAAGTGCTGTTCCTGTACTTTATGCAATTGGGTAAAT
GCGCGTACACCCAGAAAACCATCGACATCGACAAGCTGAAAACCAACATTTACAACGTGGA
TCACATTTACCCGCAGTCTTACGTAAAAGATGATAGCATCACCAACAAAGTGCTGGTTATTA
GTGAAGAAAACGGCCAGAAAGGTGATAAATATCCGATCTCTAAAGACATCCGTGAAAAAA
TGCAGCCGTTCTGGTACCGTTTGCTGAGCAACAAACTGATTTCTGAAGAAAAATACCGCCG
CCTGACCCGCTGTACCTCCTTCACCGAAGAAGAACTGACCGGTTTCATTAACCGCCAGCTCG
TTGAAACCCACCAGTCCACCAAAGCGGTTACCACGGTTTTCCGTACTCTGTTCCCGGACGTG
GAGATCGTTTACTCTAAAGCGGGCCTGGTGTCCGAATTCCGTAAAGAATTCGACATGCTGA
AAACCCGTAGTGTGAACGATCTGCACCACGCCAAAGATGCGTATCTGAACATCGTCGTGGG
CAACGTTTACCATTGTCGTTTCACCAAAAACTTCTACATTACCCAGAAATACAGCCTGAAAA
CCAAAACCCTGTTCACCCATTCTGTTAAACTGGGTGATGACGTTATCTGGAACGGCCAGGA
GAGCATTGGTAACGTGCGTAAAGTGCTGGCGAAAAACAACATCCACTACACTAAATATCCG
TTCATGCGTAAAGGTGGCCTGTTCGACCAGATGCCGGTTAAAGCGGCGGCCGGTCTGATCC
CGCGTAAAACCGGCCTGGATACCGAAAAATACGGTGGTTATAACAAATCCACTGCTACCGC
ATTTCTGTTAGTGAAATACAAAGAAAAAGGCAAACAGGAAGCCATGATCATGCCGGTAGAC
TACATGTACAGCGAAAAAGTTTTCTCCGATAACGAATACGCCTTAAAATACTCCAAAGAAA
ATATCAAAAAGATCTGGGGTCGCACGGAAGATCAGGTGATCGATGTGTCTTTACCGCTGGG
CCTGCGTCCGATCAAAATTAACACCATGCTGAGCTTCGACGGCTTCCGCGCGTGCATCACCG
GCAAAGCAAACGCTGGTCAGAAAATTGGCTTCACCAGCATGATGCCGCTGGTGATCGGTAA
CGAATGGGAAAACTACATCAAAAAGATTGACAACTACATTGAGAAAAAAGGTAAAAACAA
AAACATCACCCTGAATGAAAAGAACGATGGCATCTGCGGCGAAAAGAACGAAAAACTGTA
CTGTATCCTGACTGACAAAATCATCAACAACATCTACTCGATCCCGTTCAACTCCCAGCAGA
AAATCCTGGAGAACGGCTACGACAAATTCAAAAAACTGGATATCGAACGCCAGGTGTACTT
CCTGCAGAACCTGGTTCTCGTTCTGAAATCGGGCCGTGCTGGTTCCTGTGATATGAGCGCAA
TCGGTGGCTCGAAAAACGCGGCGACCTTTGCGTTCGGTTCCAAGCTGAGCCTGTGGGCGAA
AAAATTCCAGAAAGTGTACCTGATCGATAACAGCAGCTCTGGCATCTACCAGAACATGAGCGATAACCTGCTGGACATCATCAAATAA;
SEQ ID NO.11:
ATGATGAAAGAAATTAAAAACTATTTTATTGGCCTGGATATGGGCACCACTAGTGTGG
GCTGGGCAGCCACTGATGAAAACTATGAAATTATTAAGAAGAATGGCAAAGCCCTGTGGGG
CATTAGACTGTTTGATGAAGCGCAGACTGCAGCAGATAGAAGAATGCATAGAATTGCAAGA
AGAAGAATTGAGAGAAGAAGCAGAAGAATTGACCTGCTGCAAGAACTTTTTGCCCAAGAA
ATTTGCAAAAAAGATCCTGGCTTTTATGAAAGACTGAATGAAAGTGGCCTGTATGAAGAAG
ATAAAACTGTGCATCAGAAAAACTCTCTGTTTAATGATGTGGATTTTGATGATAAAGCCTAT
TATAAAGAATATCCAACCATTTATCATCTGAGATATGATCTGATGACCAAAGATAGACCATT
TGATGTGAGACTGGTGTATCTGGCCGTGCATCATATTCTGAAACATAGAGGCCATTTTCTGT
TTGATCATTTTCAAGTGGATGAAAATGGTGTGAGTGGCTTTGAAGAAAGCTTTGCAGCCTTT
GGTGATGCCCTGGAACATATTAAAGGTGAAAGCTTTGATATGGGCAAAGAAGAAGAAATG
AAAGCCCTGTGCAGAGACAAGAAACTGGGTGTGAGACATAAAGCCCTGGCCCTGGCACAG
TGCCTTGGCAGAAGCAAAGACAAAGACTTTAAAGCCATGATGACCCTGGCAGCTGGTGGCA
CTGCCCTGCTGAGTGAAGTGTTTAAAGATGAAGGCCTGAAAGATTTTAGCAAAAACAAAGT
GAGCTTTAGTGATAGTCAGTTTGAAAATGATAAACCTGAAATTATTGCAGAACTGGGTGAT
AGATATGATCTGATTGCAGCCCTGCATGGCCTGTATAACTGGAGCTTTCTGGCAGAACTGAT
GAGAGGCCATAAATATATTAGTGAAGCCAAAATTGAAATTTATGATAAACATAAAGAAGAT
CTGGCCTTGCTGAAAAAAGTGCTGAAACAAGATAGAAGTGTGTATAACCTGATGTTCAAGG
AACCTGGTGATAAAAAACCTATTAACTATAGTGCCTATGTGAAAGCCTGCAAAACCAATGG
TAAAAAATTACCACTGCCATATGGCAAGTTTAAATATGAAGAATTTATTAAAACTGTGAAA
TTTTGCCTGAAAAACCTGCCTGATAGCCCTGATAAAAAAAACATTGAAAACAAACTGGAAG
AAGGCAGCTTTCTGCTGAAAGCAGTGAGTGTGGAAAATGGTGCCATTCCATATCAGCTGCA
TCTGCAAGAACTGAAAATTATTCTGTCTAAGGCAGAAGCCTATCTGCCATTTCTGAAAGTGA
GAGATCAGTATGGCACTGTGAGTGATAAAATTATTAGCCTGTTTACCTTTAGAATTCCATAT
TATGTGGGCCCAATTAATGAACATGCTGGCAGCTGCTGGGTGGTGAAAAAAGATAAACAAG
GCAAAGTGTATCCATGGAACTTTACTGAAAAAATTGACATTGAAAAAAGTGCAGAAGGCTT
TATTAGAAACCTGACCAACAAATGCACCTATCTGATTGGTGAAGATGTGCTGCCAAAAAAC
AGCCTGCTGTATAGTGAATTTACTGTGCTGAATGAACTGAACAATGTGAGAATTGGTGAAA
ATGCACAGAAACTGAGCCCTGAACTGAAAGAAAAAGTGCTGGAAAACCTGTTTAAAAAAC
ATAAACATGTGAGCAGAAGAAAATTTATTAACTATCTGGTGACTGAAGGCATTGATAAAAA
AGAAGCAGAAAGCATTAGTGGCCTGGATGGTGATTTTAAAAGCAGCATGAGCAGCCTGATT
GATATGAAACATATTCTGGGCAATGATTTTAGCAGAGAAGATGCAGAAAAAATGATTAAAG
ATATTACCATTTTTGGTGGTGATAAAAAAATGCTGAAAAAAAGACTGCATAGAGAATTTAG
CTATCTGACTAGTGAACAGCTGACTAGCCTGACTAGACTGAGCTATGATGGCTGGGGCAGA
CTGAGCAAGGAACTTCTGGTGAACCTGCTGCCTGTGGAAAAAAGCACTGGTGAAGTCCTGG
TGGATAAAGGCAGTGGTGAGGTGCTGAACATTATTAGTGCCATGGAACAGACTAGCTATAA
TCTGATGGAATTACTGAGCAGCAGATTTGGCTATGCCACTGCCATTGAAGAAAGAAACAGA
GAAAAAGAAGGCAATGGCACCATTAGCTATCAAGATGTGGAAGATATGTATATTAGCCCTG
CAGTGAAAAGACCACTGTGGCAAGCCCTGAAAATTGTGAGAGAAATTGTGAAAATTCTGGG
CAAAGAACCAAGCAAAATTTTTATTGAAATGGCAAGAGAAAATGGTGAAAAGGGCAAAAG
AACCATTAGCAGAAAAGCAAGACTTCAAGAGCTGTATAAGAAATGCAGAGATGATAGTAG
AGATTGGGCCAAAGAACTGGCAGAAAAACCTGAAGAAGATTTTAGAAGTGATAGACTGTA
TCTGTATTATACTCAGATGGGAAGAAGCATGTACACTGGCAAACCAATTGATATTAATCAG
CTGTTTGATAGAAATGTGTATGATATTGATCATATATATCCACAAAGCCTGACTGGTGATGA
CAGCCTGGACAACAGAGTGCTGGTGGAAAAAACTGTGAATGCCAAAAAAGGAGATATCTA
CCCCTTAGGTAGTGCCCTGGATGGCTGCCATATTCAAGGTGAAATTCATATTCAAGATATTC
AGAGAGAAATGAGACCATTTTGGCATATGCTGCTGGAAAAAGGCCTGATTAGTAAAGAAA
AATATAACAGACTGAGCAGAACCACCCCACTGAGTGATACTGAAAAAGCAGCCTTTATTGG
CAGACAGCTGGTGGAAACTAGACAGAGCACCAAAGCATGTGCAGAATTACTGAGCAAAGC
CTATCCACAAGCAAGAATTGTGTATACCAAAGCTGGCAATGCAAGCAGATTTAGACAGTAT
GGTGGCTTTATTAAAGTAAGAGACATGAATGATTATCATCATGCCAAAGATGCCTATCTGA
ACATTGTGGTGGGCAATGTGTTTGATACTAGATTTACCGCCAACCCACTGCATTTTCTGAAA
GGCAACCATCCTGTGTATAGCCTGAACACTGAAGCCCTGTATGGCCATAAAGTGAGCAGAG
GTGGTGTGGATGCCTGGATTCCACCTGAAAAAGATGATGAAGGCCATATTATGGCTGGCCA
TGAAGGCACCATGGGCACTGTGAGAAAATGGATGAGAAAAAACAACATTCTGTTTACTAGA
ATGCCATTGGAAGGCAAAGGTGGCCTGTTTGATCAGACCATTATGAAAAAAGGCAAAGGCC
AAGTGCCACTGAAAGGTGATAGCCCTGTGAGTGATATTGAAAAATATGGTGGCTATAACAA
AGCAAGCAGTGCCTATTTTGTGCTGACTAGCAGCAAACTGAAAGATGAAACCATTTATACC
ATTGAAACCATTCCACTGATTATTAAAAGAATGATTCAGACCAACAAAGATAAAGAAGATT
ATATTAAAAGACATTGGAAAGATCATGGCAAGAAAATGGTTAACCCACATATTTGCTATGG
CCATATTCCTGTGCAGAGCCTGCTGGAAATTAATGGCTTTAAAGTGCATCTGACTGGCAAAT
CTGGCAAGGACTTTAAGCTGAGAAATGCAGAACAGCTGTGCATTAGCAATGATGATGCAGC
AGTGCTGAAAAGAGTGCTGAAATATAATGAAAGAAGCAGCCTGAGTAAAGGCAAAGAAGC
CCTGCTGATTACCCCATTTGATAACATTCAAGAAGTGGATCTGAACAGACTGTATCAAGTGT
TTGAAGATAAACTGACCAACCAAGTGTATAAAGTGAAACTGGGCAAACAAGCAAGTGTGTT
AAAGAAGGGTGAAGATAAATTTAATGAACTCCCACTGGAAGTGAAATGCAGAGTGATTGGT
GAAATTCTGCATCTGTTTCAGTGCAATGCAGCCATTGCAGATCTGAGACTGATTGGTGGTGC
CAAAAATGCTGGTGCCCTGACCATGAACCCAAGAGTGAGCCCTGAAGATCATGTGTATCTG
ATTGAACAGAGTGTGACTGGCTTTTTTGAAAAAAGAATTCTGCTGGCCCCATATGGTGGCAAATAA;
SEQ ID NO.12:
ATGAAAGAAATTAAAAAGATCTTCATCGGTCTGGATATGGGCACCAACAGCGTGGGCT
GGACCGCGACCGATGAAAACTACGAAGTGATCAAAAAGAACGGTAAAGCGCTGTGGGGTA
TCCGTCTGTTCGATGAAGCACAGACCGCAGAAGATCGTCGTATGCACCGCATCGCGCGTCG
CCGCATCGAACGCCGCTCCCGTCGTATCGATCTGCTGCAGGAACTGTTCGCGCAGGAAATCT
GCAAAAAAGATCCGGGCTTCTACGAACGTCTGAACGAAAGCGGTCTGTACGAAGAAGATA
AAACTGTGCACCAGACCAACTCCCTGTTTAACGACGTGGATTTCAACGATAAAGCGTACTA
CAAAAAATACCCGACCATTTACCACCTGCGCCATGCGCTGATGACCGAAAACCACCCGTTC
GACGTTCGCCTGGTTTACCTGGCGATCCACCACATCCTGAAACATCGTGGTCACTTCCTGTT
CGAAAACTTCCAGACGGACGAAAAAGGCACCTCCGGCTTCGACGAATCTTTTGCTGCTTTC
GGCTCTGCGCTGGATCGTATTAAAGGCTCCTCACCAGATGTGCGTAAAGCCGACTCTATGA
AAGACATCCTGAAAGATAAAAAACTGGGTGTTAAAGAAAAAGCAGCGAGCCTGCTGCAGT
GCCTGGGCCAGGGCAAAGAAAAAGACTTCAAAGCTATGATGACCCTGGCGGCAGGCGGCA
CCGCGTCCCTGTCCGATATCTTCAACGACGAAAAACTGAAAGACTTCGAAAAGAACAAAGT
GAACTTCAGCTCTGCACAGTTCGAAGAAAACGAACCGGACATCATGGCGGAACTGGGCGAC
CGTTATGATCTGATCGCGGCCCTGCACGGCTTCTATAACTGGTCTCTGCTGGCAGAACTGAT
GGGTGAATACCATTACATCAGCGAAGCTAAAATTGCGGTGTACGACAAACACAAAGCGGAT
CTGAAAGTTCTGAAACGCGTTCTGAAACAGCGTCCGGACATCTACGCGAAAATCTTCCGCG
AACCGGGTTCCTCTGCGAACAAAAACTACAGCGCGTACGTGGGCGTTTGCAAAGTTAAAGG
CAAAAAAGCCGCGATCGAAAAATGTAGCTACGAAGATTTCACTAAAACCCTGAAACCGTGC
CTGAAAGATATGCCGGATTCTAACGACAAAGATTATATCTCTCGCGAACTGAACATGGGTA
CCTTCCTGCCGAAATCCGTTAGCAAAGAAAACGGCGTGATCCCGTACCAGCTGCACCTGCA
GGAACTGAAAATCATCCTGTCTAAAGCAGAAGCGTACCTGCCGTTCCTGAAAGTGAAAGAC
CAGTACGGCACCGTTTCCGACAAAATTATCTCCCTGTTCACCTTCCGTATCCCGTACTATGT
GGGTCCAATCAACGAACACGCGGGCTCCTGCTGGGTGGTTAAAAAAGATAAACGCGGTAA
AGTGTACCCGTGGAACTTCACCGAAAAAATCGATATCGAAAAGTCCGCGGAAGGCTTCATC
CGTAACCTGACCAACAAATGCACCTACCTGATCGGTGAGGATGTTCTGCCGAAAAACAGCC
TGCTGTACAGCGAATTCACCGTTCTGAACGAACTGAACAACGTGCGCATCGGCGAAACCAT
GCAGAAACTGCCGCTGCGTCTGAAAGAGAAAGTGATGGACAACCTGTTCAGCCGTTACAAA
CACGTGAGCCGCACCAAATTCATCAAATACCTGGTGAGCGAAGGCATCGATAAAAAAGAA
GCTGAAAGCATCTCTGGCCTGGACGGCGATTTCAAAAGCTCTCTGAGCTCCCTGATCGACAT
GAAACACATCCTGGGTAACGACTTCAGCCGTGAAAACGCGGAAAAAATGATCCAGGATATC
ACCATCTTCGGCGGCGATAAAAAGATGCTGAAAAACCGCCTGCACCGTGAATTCTCCTACC
TGACCCCGGAACAGCTGACCAGCCTGACCCAGCTGTCCTACGACGGCTGGGGCCGTCTGAG
CAAAGAATTCCTGGTTAACTTACTGCCGGCTGAAGGTGATAGCTGTGAAGTGCTGGTTGATC
ACACCAGCGGCGAAGTGCTGAACATTATCAGCGCGATGCGTCAGACCTCCTACAACCTGAT
GGAACTGCTGGGCAGCCGCTTCGGCTACGGCCAGGCGATCGAAGAACGTAACAAAAAAGA
AGAAGGCCAGGGCCGTATCACCTACAAAGACGTTGAGGATCTGTACATCAGCCCGGCGGTT
CGTCGTCCGCTGTGGCAGGCGCTGAAAATCGTGCGCGAAATCGTGAAAATCACCGGCAAAG
AACCGAGCAAAATCTTCATCGAAATGGCGCGTGAAAACGGTGAAAAAGGTAAACGTACCA
TCTCTCGCAAAGCTCGCCTGCAGGCTCTGTACAAAAAATGTCGTGATGACACCCGTGACTG
GGCGAAAGAACTGGAAGGCAAATCCGAAGAAGATTTTCGCTCTGATCGTCTGTATCTGTAC
TACACCCAGATGGGTCGCAGCATGTACACCGGTAAACCGATCGATATTAACCGTCTGTTCG
ATCGTAACGTGTATGACATTGATCACATTTACCCGCAGTCCCTGACCGGTGACGATAGCCTG
GATAACCGCGTACTGGTGGAAAAAACCGTTAACGCAAAGAAAGGTGACACCTACCCGCTGT
CTAGCGCACTGGATGGTTGCTACATTTCTGGTCAGCAGATTCGTATCCAGGATATCCAGAAA
GAAATGCGTCCGTTCTGGCACATGCTGCTGGAAAAAGAACTGATTTCTAAAGAAAAATACA
ACCGCCTGTCTCGCACCATCCCGCTGTCCGACGCGGAAAAAGCAGCGTTCATTGGTCGTCA
GCTGGTTGAGACCCGCCAGTCCACCAAAGCCTGCGCGGAACTGCTGTCTAAAGCGTATCCG
CAGACCCGTATCGTGTACACCAAAGCGGGCAACGCTAGCCGTTTCCGTCAATACGGTGGCT
TTATCAAAGTGCGTGATATGAACGACTACCACCACGCGAAAGATGCATATCTGAACATCGT
AGTTGGCAACGTTTTCAACACCCGTTTCACCGCCAACCCGCTGCACTTCCTGAAGGGTAACC
ACCAGGCTTACTCCCTGAACACCGAAGCGTTGTACGGTCATAAAGTATCCCGTAACGGCGT
GGATGCGTGGATCCCGGCGGAGAAAGATGAAAAAGGCCAGGTTATGGCAGGCCACGAAGG
CACCATGGGTACCGTTCGCAAATGGATGCGCAAAAACAACATCCTGTTTACCCGCATGCCG
TACGAAGGCAAAGGCGGCCTGTTCGACCAGAACATCATGAAAAAAGAAAAAGGCCAGGTG
CCGATCAAAGGTGATTCCCCGATTAGCAACATCAAAAAATACGGTGGCTATAACAAAGCCA
AAGTGGCGTATTTCGTTCTGACGCAGTCTAAACTGAACAAAAAGACCGTTTATACCCTGGA
AGCCATCCCGCTGATTCTGAAAAACAGCATTCAGTCCAACGAAGATAAAGAAACCTATATT
CAGAAACAGTGGCGTAAAAACGGTAAGAAAATGGAACATCCGATCGTTTGTCTGGGCCATA
TTCCGGTGCAGTCCCTGCTGGAAATTAACGGCTTCAAAGTGCACCTGTCAGGCAAAAACGG
TAAAGATATCCTGCTGCGCAACGCGGAACAGCTGTGTATCAACGAAGCAGATACCGCTGTT
CTGAAGAAAATCCTGAAATTCAACCAGCGTGCCGCGATGAGTAAAAAAGGCGAAGAAATC
TTCATCAACAGCTTCGATAACATCCAGGAAGAAGATCTGAACCGCCTGTACCACGTTTTCGA
AGATAAACTGACCAACCAGATCTACAAAGTTAAACTGGAAAAACAGGCTGCTGTGCTGAAA
AAAGGCGAAGAAACCTTCAACCGCCTGAGCCCAGAACAGAAATGTAAACTGATCGGTGAA
ATCCTGCACCTGTGCCAGTGCAAAGCTACTCACGCTGATCTGCGTCTGATTGGCGGCGCGAA
AAAAGCCGGCATCCTGACCATGGGTACCCAGATCTACCCGAAAGACCACGTTTACCTGATC
GAACAGTCCGTTACCGGCTTCTTCGAAAAACGTATCCTGCTGGCGCCGTTCGGTGAAAAATAA;SEQID NO.13:ATGGCGAATACTTTTAAAGTCAT;
SEQ ID NO.14:
ACATTACTCTCAAACTACAAATGTATTCATTTGATACATTTGATATCAAATTTTGAAAATCCAGCTTGCAACTGGTATGTAAATCCACATCTTTGTTATACATTCTTATACAATAAATATCAACACATATCTTTCCTAATACCATAACAATACCTATAACCTGAACTCCTATTCAAAATATTGACAATTCCCCTTTCATGATGTAATGTGTAAATGAATTTACATTGCGAGTTCAAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTTTTTACTTAGGATTTTTTATTATCATTATATATTGTATATTTCATTTTCTCGAATAGTATATATTTTATATTTTTGATTT;
SEQ ID NO.15:
AAACCGAACGAACACATTGACAAAACCGATAATGGTTTTACCACTATCAAGAATCACAACACTCTCAAACCTCAAATTGCATTTTCATGCATCGGTTCTCTGCAAGTGTATCCGCTTACACCGGGCGGCGCGACTCTTGGCAGTGTATCAAATGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAAAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGGATATACGCACAACAAAAGGCCCCATTATCTCATATCCCAAAAGACATGAAATAACAGAGCCTGAAAAAGCCTCTTTTGCCACCTTCCCTGCTGTCCTGTCCATCATCATAATCATCCCTTCTCTAATAATTAATATAAAAAGGATTTCCTATGAACTCATTTTATCATTAAACTCATTATATCATGAGTGACCGGTCTACGCCTTCTACCTAAAGCATGTTACCTTCTACTTCTATTATACTCAGAGGCATGACACACTCTGTCGCTCCGCGAAAAAATCCTGAATTTTTATCAAAAATTAATCTTACGAATAAAAGGAATGCCTATAATCCTCATCTGCAGAAGAAATCGGCAGCCTGATCTATCTCCTTTCTATATACAGAGGAGTCCCCTGAAAGCACAAAAACTTCCTGAATCTCCTGTGGCAGTGACCTGCCTTTAGAGTTTCAGGAAGTTTTTGCTCCTCACGGTTTCCCGCAAGGGCGGCAATCGGAATCGCCATTAGGGAAGCGCTGATTAAATCGTTATCGAATTTCATTCTTGTATTTTTATTCAATGCAAGGAATTAGTCGACGCGAATAGCGAGCTATTTAAGGAGACTGATGACGAAGCATTGGATAAAAATACATATGAAATTCGATTCTACGAATTAATCAGTGCTTCCTTAGGATTGCCATTTGCTGCATCTTTCCCATGCGCTTTATGTAAGCTAAGGAAACGCATGCCGAATGACCGTCACATAGCACCCGGTCATTTTCTTTATTATACTATTTTTTACAGCAGTCTGCTTTCTTTTTCTGTACATATTCTGTACATATCAAATCAAAAGTCCCCTGA;
SEQ ID NO.16:
TACTCTGCAAATTGTTACATAATCTTCTCCATTGAAATTTATTTTATAAGCAAAAAATAAGTCCTTCGGCAATAGAGCCAAATTGCAATCCACGCTTCCCTTGGGGTGCAGAAAAAAGGAGGCAGAAGCCGCCAAAGGTTCTGCCCCCTTTCAAATTGCATTTTCATGCAGCAGTTCTCCGCAAGTGTATCCGCTTACACCAGACGGCGCAGTTCCTGACAGTGTATCAAACCCTTCATCAGGCAGTCGATAAAAGGCAAATTGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAGAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGATTTGAGCCACAATAAAAGGTCCCGTTATTTCATATCTCAAAAGACATGAATAACA;
library-NGS-F引物的序列为:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTgtctacaatcggctcgatcga;
library-NGS-R引物的序列为:
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTgcgcagaccaaaacgatctc。
实施例3:原核干扰实验一
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在原核生物中具有切割能力(即是否能够识别实施例2得到的PAM序列),并且验证本发明实施例2所鉴定的PAM的正确性。
具体操作如下:
(1)构建PAM-target单条质粒,将实施例2所构建的PAM library质粒的6位随机碱基替换为三种Cas9蛋白对应的PAM序列(HqCas9:AGCGAC;DspCas9:GGATAA;DsuCas9:GGATAA)。
(2)将PAM-target单条质粒分别电转入含有三种Cas9基因编辑系统的DH5α感受态中,以PAM空载质粒作为对照,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗板上的单克隆细菌数。
原核干扰结果如图3所示,从右向左为稀释方向,最右列为未稀释原菌液,稀释倍数越大单克隆长得越少。对照组为电转PAM空白质粒组,与Cas9基因编辑系统中的间隔序列不存在互补配对的靶序列,则Cas9蛋白无法行使切割功能,细菌具有双抗性基因则正常生长。实验组的PAM单条质粒中具有能与Cas9基因编辑系统中的间隔序列互补配对的靶点以及PAM,实验组的单克隆数量与对照组相比明显下降,说明Cas9蛋白能识别本实施例选定的PAM序列而发挥切割能力,使细菌不具备抗Amp能力而不能生长。该实验结果表明,本发明的HqCas9、DspCas9、DsuCas9能分别识别序列为AGCGAC、GGATAA、GGACAA的PAM序列,在原核系统中具备切割能力。
实施例4:原核干扰实验二
本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统中发挥切割靶向DNA序列所需要的tracrRNA范围。
具体操作如下所示:
(1)把本发明实施例1的三种CRISPR/Cas9基因编辑系统中的非编码区域(Noncoding,NC)分为4段,分别通过Gibson方法组装进target质粒中,前面加上强异源启动子J23119,分别构建为target-NC 1-4质粒。
(2)构建pET28a-ΔCas9质粒:将实施例2得到的pET28a-Cas9质粒中删除所有的NC部分,保留Cas9蛋白、重复序列和间隔序列。
(3)把target-NC 1-4质粒分别电转进入含有pET28a-ΔCas9的大肠杆菌DH5α感受态中,37℃复苏1h后梯度稀释培养基,采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基,置于37℃培养18h后,观察双抗平板上的单克隆细菌数。
原核干扰结果如图4所示,结果表明,HqCas9的NC4、DspCas9的NC2、DsuCas9的NC1所对应的生长菌落最少,说明这三段对应的NC区域是辅助Cas9核酸酶发挥有效切割效应的主要序列。
实施例5:预测CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构
为预测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构,通过模拟tracrRNA与重复序列转录后的RNA结合过程,预测两者结合后的RNA二级结构,通过使用在线软件NUPACK进行模拟,结果如图5所示,重复序列与tracrRNA之间通过“GAAA”进行连接。三种CRISPR/Cas9基因编辑系统发挥靶向切割所需要的scaffold序列如SEQ ID NO.17~19所示。
上述序列信息如下:
SEQ ID NO.17:
GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGAgaaaATGAATTTACATTGCGAGTTC AAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTT;
SEQ ID NO.18:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAA AGAGCTCCTTCGGGAGTTCTT;
SEQ ID NO.19:
GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAG AGAGCTCCTTCGGGAGTTCTT。
实施例6:dsODN插入实验一
本实施例通过dsODN插入实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中发挥靶向切割的最适间隔序列的长度。
具体操作如下:
(1)根据本发明实施例1的三种Cas9蛋白进行人源密码子优化,将对应的核苷酸序列克隆进PX330真核表达载体上(addgene,59909),获得PX330-蛋白真核表达质粒。
(2)在哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,以本实施例3所鉴定的能在原核生物中识别切割的PAM序列,寻找到合适的靶位点,序列格式为5’-不同长度的间隔序列(18~30bp)-直接重复序列-3’,通过Gibson方法克隆到PXZ载体上(addgene,160229),构建靶向同一靶位点、具有不同spacer长度的PXZ-target质粒,同时转染PX330-蛋白真核表达质粒与PXZ-target质粒。具体target序列见表1。
(3)在生长状态良好的HEK293T细胞24孔板中共转染PX330-蛋白真核质粒、PXZ-target质粒、1.2μL dsODN,72h后收细胞抽提DNA。
(4)在对应的基因靶点上游以及dsODN序列上设计一对引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的插入,通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在真核细胞环境下是否具有编辑能力,并比较不同长度的间隔序列对应的条带强弱。
表1碱基大小和序列
检测结果如图6所示,对应长度的PCR条带用红色三角标注,代表有dsODN的插入,说明这三种CRISPR/Cas9基因编辑系统在真核细胞中均具有靶向切割能力。根据条带强弱比较发现HqCas9的spacer最佳间隔序列识别长度是20~24bp,DspCas9的spacer最佳识别长度是21~24bp,DsuCas9的spacer最佳识别长度是22~24bp。
实施例7:dsODN的插入实验二
本实施例通过dsODN的插入实验,检测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中的在靶和脱靶情况以检测切割效果。
具体操作如下所示:
(a)构建位点质粒,实施例6的结果已表明三种Cas9的最适识别的spacer的长度,哺乳动物细胞中,以HEK293T细胞为例,选取内源性基因,寻找到合适的靶位点(见表2),序列格式为5’-与靶点互补的间隔序列-scaffold-3’,通过Gibson方法克隆到PXZ载体上,构建PXZ-target质粒。
表2靶位点及其序列
(b)同时电转实施例6制备的PX330-蛋白真核表达质粒、PXZ-target质粒和1.2μLdsODN,72h后收细胞抽提DNA。
(c)在对应的基因靶点上游以及dsODN序列上设计引物(见表1)进行dsODN-PCR扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsODN的插入,首先通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在该选择的靶位点上是否发生靶向切割。
(d)挑选能检测到dsODN-PCR条带的DNA进行GUIDE-seq建库,上机进行二代测序,通过生物信息学分析检测三种Cas9基因编辑系统的在靶切割以及脱靶情况。
GUIDE-seq检测结果如图7所示,三个蛋白在对应的多个靶位点上的在靶Reads数较高,脱靶位点较少或检测不到脱靶,说明本发明所述HqCas9、DspCas9、DsuCas9基因编辑系统均在真核生物中具备较强的切割效率和较好的切割特异性。
综上,本发明首次鉴定出三种全新的II型CRISPR/Cas9基因编辑系统,三种新型编辑系统的Cas9蛋白分别命名为HqCas9、DspCas9和DsuCas9,通过以上实施例证明本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA),能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了SpCas9的局限性。
本发明选择原核和真核DNA来验证三种II型CRISPR/Cas9基因编辑系统的编辑能力。Cas9蛋白识别靶向序列需要与crRNA间隔序列互补的核苷酸序列、可以识别的PAM序列。首先,通过原核耗竭实验证明本发明的Cas9蛋白在原核生物中具有切割能力,获知了Cas9蛋白在原核系统中识别的PAM序列。再通过原核干扰实验和真核细胞实验验证了PAM的正确性。本发明通过人为设计crRNA中的间隔序列,得到的II型CRISPR/Cas9基因编辑系统可以靶向基因组中几乎所有感兴趣的DNA序列,产生位点特异的平末端双链断裂(DSB)。通过非同源末端修复DSB,在切割位点产生小的随机插入/缺失(indels)使目的基因失活;或者通过高保真同源修复,可以使用同源修复模板在DSB位点进行精确的基因组修饰。通过GUIDE-seq结果显示两个蛋白的编辑在靶数较高,说明编辑效率高,脱靶数少说明编辑精确率高。HqCas9识别的PAM序列为NGNGNC,相对比较复杂的PAM可以更精确的识别靶位点,提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近,第4位和第5位均为A,两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个AA出现,这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围。
本发明的三种II型CRISPR/Cas9基因编辑系统的发现进一步扩大了基因编辑工具的种类,为科学研究与疾病治疗提供了有力的研究工具,对推动将基因编辑应用于临床治疗具有重要的作用。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (5)

1.一种II型CRISPR/Cas9基因编辑系统,其特征在于,包括氨基酸序列如SEQ ID NO.2所示的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列;
所述的tracrRNA序列如SEQ ID NO.15所示。
2.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统,其特征在于,编码所述Cas9蛋白的核苷酸序列如SEQ ID NO.11所示。
3.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统,其特征在于,所述辅助蛋白的氨基酸序列如SEQ ID NO.5所示。
4.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。
5.权利要求1~3任一项所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。
CN202311513462.9A 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 Active CN117757774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311513462.9A CN117757774B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202310510300.3A CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN202311513462.9A CN117757774B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202310510300.3A Division CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Publications (2)

Publication Number Publication Date
CN117757774A CN117757774A (zh) 2024-03-26
CN117757774B true CN117757774B (zh) 2024-08-06

Family

ID=87952200

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202311513465.2A Active CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN202310510300.3A Active CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN202311513462.9A Active CN117757774B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202311513465.2A Active CN117448300B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
CN202310510300.3A Active CN116751764B (zh) 2023-05-08 2023-05-08 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Country Status (1)

Country Link
CN (3) CN117448300B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117866926B (zh) * 2024-03-07 2024-08-16 珠海舒桐医疗科技有限公司 一种CRISPR-FrCas9蛋白突变体及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331264A (zh) * 2020-09-11 2021-02-05 中山大学附属第一医院 一种同源2型CRISPR/Cas基因编辑系统的构建方法
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110913881A (zh) * 2017-03-14 2020-03-24 加利福尼亚大学董事会 工程化crispr cas9免疫隐身
US20210301269A1 (en) * 2020-01-22 2021-09-30 New York Genome Center, Inc. Recombinant crispr-cas9 nucleases with altered pam specificity
CN114075559B (zh) * 2020-09-14 2023-11-17 珠海舒桐医疗科技有限公司 一种2型CRISPR/Cas9基因编辑系统及其应用
CN113234702B (zh) * 2021-03-26 2023-02-10 珠海舒桐医疗科技有限公司 一种Lt1Cas13d蛋白及基因编辑系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331264A (zh) * 2020-09-11 2021-02-05 中山大学附属第一医院 一种同源2型CRISPR/Cas基因编辑系统的构建方法
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑系统

Also Published As

Publication number Publication date
CN117757774A (zh) 2024-03-26
CN117448300B (zh) 2024-04-30
CN116751764B (zh) 2024-01-30
CN116751764A (zh) 2023-09-15
CN117448300A (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
US11155814B2 (en) Methods for using DNA repair for cell engineering
AU2016274452A1 (en) Thermostable Cas9 nucleases
CN109880851B (zh) 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法
EP3940078A1 (en) Off-target single nucleotide variants caused by single-base editing and high-specificity off-target-free single-base gene editing tool
CN112430586B (zh) 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN117757774B (zh) 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
WO2023142594A1 (zh) 一种精确无pam限制的腺嘌呤碱基编辑器及其应用
WO2022199511A1 (zh) 一种Lt1Cas13d蛋白及基因编辑系统
CN116286737B (zh) 无pam限制的核酸内切酶及其介导的基因编辑系统
CN116179512A (zh) 靶标识别范围广的核酸内切酶及其应用
EP4116430A1 (en) Method for detecting random off-target effect of single-base editing system
CN116179513B (zh) 一种Cpf1蛋白及其在基因编辑中的应用
CN116949011A (zh) 经分离的Cas13蛋白、基于它的基因编辑系统及其用途
CN113151277A (zh) 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA
CN116751763B (zh) 一种Cpf1蛋白、V型基因编辑系统及应用
CN116836300A (zh) 一种碱基编辑分子及其用途
US20240368675A1 (en) Pam-less endonuclease and gene editing system mediated by pam-less endonuclease
Gutierrez et al. Genome-wide CRISPR-Cas9 screen in E. coli identifies design rules for efficient targeting
KR102685590B1 (ko) 사이토신 교정 활성이 제거된 아데닌 염기교정 유전자가위 및 이의 용도
US20240055077A1 (en) SYSTEM AND METHOD FOR PREDICTING ACTIVITY AND SPECIFICITY OF 17 SMALL Cas9s USING DEEP LEARNING
WO2024093489A1 (zh) 一种真核细胞持续进化的控制方法及其应用
Zhu Optimal gRNA design of different CRISPR-Cas systems for DNA and RNA editing
Wei et al. A Novel White-to-Blue Colony Formation Assay to Select for Optimized sgRNAs
CN118871578A (zh) 用于碱基编辑的脱氨酶及其变体
CN116179600A (zh) 一种精准敲除UCHL1基因的CRISPR/Cas9基因编辑系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant