CN117757774B

CN117757774B - 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

Info

Publication number: CN117757774B
Application number: CN202311513462.9A
Authority: CN
Inventors: 田瑞; 赵停停
Original assignee: Zhuhai Shutong Medical Technology Co ltd
Current assignee: Zhuhai Shutong Medical Technology Co ltd
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2024-08-06
Anticipated expiration: 2043-05-08
Also published as: CN117757774A; CN117448300B; CN116751764B; CN116751764A; CN117448300A

Abstract

本发明属于基因工程技术领域，公开了一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。本发明筛选了一种Cas9蛋白，其氨基酸序列如SEQ ID NO.2所示。本发明还提供了一种编码Cas9蛋白的核苷酸序列。本发明提供了一种II型CRISPR/Cas9基因编辑系统，包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下，在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类，对推动基因编辑应用于临床治疗具有重要的作用。

Description

一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用

本发明专利申请是基于2023年05月08日提交的发明名称为“一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用”的中国专利申请号2023105103003的分案申请。

技术领域

本发明涉及基因工程技术领域，具体涉及一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。

背景技术

CRISPR/Cas(Clustered Regularly Interspaced Palindromic Repeats/CRISPR-ass ociated proteins system)基因编辑技术作为第三代编辑工具，比第一代ZFNs(Zinc Finger Nucleases)和TALENs(Transcription Activator-like EffectorNucleases)相比，有着设计简单、成本较低和编辑效率高的优点，成为当今最主流的基因编辑系统。CRISPR/Cas系统是帮助细菌和古菌防御外来核酸入侵的自适应免疫系统，作用原理为：当某些细菌在遭到病毒入侵后，能够把病毒基因的一小段储存到自身DNA里面，当病毒再次入侵时，细菌能够根据记忆读取识别出病毒基因，并将其切断以沉默表达。

CRISPR/Cas基因编辑系统通过外源DNA的采集、crRNA的合成、靶向干扰这三个过程行使编辑功能。CRISPR array包含直接重复序列(Direct Repeat,DR)，这些重复序列由外源DNA的独特间隔序列(Spacer)分离。CRISPR array被转录成长转录物(pre-crRNA，CRISPR RNA的前体)，然后被加工处理以产生小的成熟的CRISPR RNA(crRNA)，由间隔序列和部分相邻的直接重复组成。crRNA与Cas核酸内切酶形成复合物，在某些情况下，还与辅助蛋白形成复合物并用作靶向和切割外来核酸的指南，从而实现干扰。Cas-crRNA复合物的DNA识别需要靶位点附近存在原间隔物相邻基序(PAM，Proto-spacer Adjacent Motif)，这有助于自我与非自我辨别。CRISPR/Cas基因编辑系统根据不同蛋白酶数量大致分为两类：I类系统使用多种Cas蛋白的复合物，如Cascade，而II类系统使用单一效应酶，如Cas9。目前，II型CRISPR/Cas基因编辑系统已成为基因编辑中重要的工具。

现有技术中，源自化脓链球菌(Streptococcus pyogene Cas，SpCas9)的II型系统因其切割效率高，成为现下应用最为广泛的基因编辑系统。这一系统通过识别序列为NGG的PAM靶向切割。然而，这一PAM要求也限制了SpCas9的应用，某些靶位点可能因存在较少GG而无法使用SpCas9进行识别与编辑。因此，基于现有II型CRISPR/Cas9系统存在的不足，急需开发新的CRISPR/Cas基因编辑系统。

发明内容

本发明的目的在于克服现有技术的不足之处而提供一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。

为实现上述目的，本发明采取的技术方案如下：

第一方面，本发明筛选了一种Cas9蛋白，所述Cas9蛋白的氨基酸序列如SEQ IDNO.1～3中任一种序列所示。

本发明筛选得到三种新型编辑系统的Cas9蛋白分别来自：一种未注释细菌继而将其命名为HqCas9；Dialister sp.900538805细菌中的DspCas9；Dialistersuccinatiphilus细菌中的DsuCas9。采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统可识别多种不同的PAM序列，HqCas9识别的PAM序列为NGNGNC，相对比较复杂的PAM可以更精确的识别靶位点，提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近，第4位和第5位均为A，两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析，平均每隔5bp就有一个AA出现，这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围，克服了SpCas9的局限性。

第二方面，本发明提供一种编码Cas9蛋白的核苷酸序列，所述核苷酸序列如SEQID NO.10～12中任一种序列所示。

第三方面，本发明提供了一种II型CRISPR/Cas9基因编辑系统，包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。

采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下，在原核细胞或真核细胞中行使基因编辑功能。本发明的基因编辑系统的发现扩大了基因编辑工具的种类，对推动基因编辑应用于临床治疗具有重要的作用。

作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式，所述tracrRNA序列包括重复序列，所述重复序列如SEQ ID NO.7～9中任一种序列所示。进一步的，所述的tracrRNA序列如SEQ ID NO.14～16中任一种序列所示。

作为本发明所述的II型CRISPR/Cas9基因编辑系统的优选实施方式，所述辅助蛋白的核苷酸序列如SEQ ID NO.4～6中任一种序列所示。

第四方面，本发明将所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。

第五方面，本发明将所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。

与现有技术相比，本发明的有益效果为：

(1)本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA)，能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能，极大的增加了可靶向的范围，克服了SpCas9的局限性。

(2)采用本发明Cas9蛋白的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下，在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类，对推动基因编辑应用于临床治疗具有重要的作用。

附图说明

图1为本发明CRISPR/Cas9基因编辑系统的进化树、系统组成和蛋白生物信息学分析结果示意图。

图2为本发明三种CRISPR/Cas9基因编辑系统的原核PAM序列图。

图3为本发明三种CRISPR/Cas9基因编辑系统的原核干扰图。

图4为本发明三种CRISPR/Cas9基因编辑系统的NC确认原核干扰图。

图5为本发明三种CRISPR/Cas9基因编辑系统的scaffold结构图。

图6为本发明三种CRISPR/Cas9基因编辑系统的真核细胞spacer最适长度探究图。

图7为本发明所述三种CRISPR/Cas9基因编辑系统的GUIDE-seq在靶与脱靶检测图。

具体实施方式

为更好地说明本发明的目的、技术方案和优点，下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。本发明所述Cas9核酸内切酶是一种DNA内切酶。本发明所述的碱基序列中的所述N，表示A、G、C、T中的任意一种。本发明所述的Cas9蛋白，是一种多结构域的DNA核酸内切酶，包括REC结构域、RuvC结构域、HNH结构域和PI结构域，它能识别在PAM5’端识别与sgRNA互补的DNA序列，分别通过HNH结构域切割与sgRNA互补的DNA链，RuvC结构域切割非互补链DNA。本发明所述的crRNA，以碱基互补的方式引导Cas蛋白识别入侵的DNA，5’端为间隔序列，与靶DNA互补，3’端为重复序列。本发明所述CRISPR/Cas9基因编辑系统还需要tracrRNA的参与，tracrRNA是单独转录的，tracrRNA与pre-crRNA通过剪辑互补配对结合，经过RNA酶III酶切处理将pre-crRNA的5’部分间隔序列和3’部分重复序列，形成成熟的crRNA，与tracrRNA结合形成tracrRNA-crRNA复合体，通过在crRNA下游和tracrRNA上游之间添加四个碱基的tetraloop(如“GAAA”、“TGAA”或“AAAC”序列)可以将tracrRNA和crRNA连接起来形成scaffold。通过调节tracrRNA的长度以及可识别间隔序列的长度能进一步优化Cas9核酸内切酶的切割功能。

实施例中所用的试验方法如无特殊说明，均为常规方法；所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例1：三种新型CRISPR/Cas9基因编辑系统

利用宏基因组生物信息手段对II型CRISPR/Cas9基因编辑系统相关蛋白及其元件进行分析、预测、筛选，利用CRISPRCas Finder软件进行宏基因组注释，通过NUPACK软件预测crRNA和tracrRNA的二级结构，使用HHpred软件预测功能域，并利用FastTree软件构建系统发育树。提供了三种新II型CRISPR/Cas9基因编辑系统，包括Cas9蛋白、辅助蛋白、CRISPRRNA和tracrRNA，如图1所示。

本发明筛选得到三种新型编辑系统的Cas9蛋白，分别来自：一种未注释细菌继而将其命名为HqCas9；Dialister sp.900538805细菌中的DspCas9；Dialistersuccinatiphilus细菌中的DsuCas9。HqCas9蛋白编码1353个氨基酸，其序列如SEQ ID NO.1所示；DspCas9蛋白编码1383个氨基酸，其序列如SEQ ID NO.2所示；DsuCas9蛋白编码1389个氨基酸，其序列如SEQ ID NO.3所示。将3种Cas9蛋白与已发表的其他14种II型CRISPR/Cas9基因编辑系统进行系统发育树分析，显示HqCas9、DspCas9、DsuCas9归为Type II A这一支，三种Cas9蛋白之间序列相似性较高，与FrCas9亲缘关系最近，进化树如图1A所示。

所得CRISPR/Cas9基因编辑系统由以下多个元件组成：基因编码的Cas9核酸内切酶，辅助蛋白Cas1、Cas2、Csn2、CRISPR array以及反式激活CRISPR RNA(trans-activatingcrRNA，tracrRNA)。本发明所述三种新型CRISPR/Cas9基因编辑系统的组成图如图1B所示、Cas9蛋白结构图如图1C所示。辅助蛋白Cas1，其序列如SEQ ID NO.4所示；辅助蛋白Cas2，其序列如SEQ ID NO.5所示；辅助蛋白Csn2，其序列如SEQ ID NO.6所示。三种辅助蛋白参与外源基因捕获，以及crRNA的成熟。

CRISPR array包括直接重复序列和间隔序列，这两种序列是间隔排列的，两个重复序列中间夹一个间隔序列，重复序列在同一细菌中的碱基组成和长度是相对保守的，在不同的细菌之间会有些许差异。本发明的三种新型CRISPR/Cas9基因编辑系统所对应的重复序列，依次如SEQ ID NO.7～9所示。

上述序列信息如下：

SEQ ID NO.1：

MQTKKVDEYYVGFDIGTNSVGYAVTDKNYNLIKHGGEPMWGSHVFEAASTAQERRTFRTARRRNDRKKQRIALVSEIFAPEIAKVDPRFFIRRRESALFRDDVDIKDRYVVFNDDDFTDKDYYDIYPTIHHLIYDLMSNKEKHDIRLVYMACAYLVAHRGHFLSEVSKDNIEDVLDFDVVYCNFLNVMDNYAEIPWKCDISKFKEILKKKQTVTNKEREFLQLLNEGKKFKTSEEDDVSREGLVKLLSGGTYELGKLFPKLTFEEKVSVSFNMAEEDFAMVLQQLGDEGDIISSLRNVYDWAILSDVLNGKNSVSEGKITVYEQHKKDLSFLKYFVKKYIPNRYYEVFRDGNIVGNYVSYSYNLKNVQNVSKFKGAKKDVFCDYIKKVVKDIKVDDEDKVEYEDMMFRLDTYSFIPKQVENDNRVIPYQLYYYELKRILDNASSYLEFLDEKDMDGYTSREKLLSIMEFRIPYYVGPLRTDNGQHGWMKRKAEGRIYPWNFEDKVDLDASEQEFINRMTNSCTYLPGETVVPKYSLLYCKFNVLNEINNIKINDCSIPIEHKQGIYKLFERYRKVTPKKIKDFLISNNLLHPEDVISGIDVTIKSSLKSYHDFKKLLESCVLKENQVEAIIERLTYSEDKGRILRWLHMEFPDLSDDDVKYISKLKYSDFGRLSRKLLVGIRGCNKDTGEVDSIMGMLWSTNDNMMKLLSNSYTFIEEIEAIKNEYYVEHPANLDSMLDEMYVSNAVRRPIHRTLDILSDIRKVCGKNPSKIFVEMARGGGEKGVRTKSRRDQISELYKNMDKAEVRELSEQLEGKTDNELQSEVLFLYFMQLGKCAYTQKTIDIDKLKTNIYNVDHIYPQSYVKDDSITNKVLVISEENGQKGDKYPISKDIREKMQPFWYRLLSNKLISEEKYRRLTRCTSFTEEELTGFINRQLVETHQSTKAVTTVFRTLFPDVEIVYSKAGLVSEFRKEFDMLKTRSVNDLHHAKDAYLNIVVGNVYHCRFTKNFYITQKYSLKTKTLFTHSVKLGDDVIWNGQESIGNVRKVLAKNNIHYTKYPFMRKGGLFDQMPVKAAAGLIPRKTGLDTEKYGGYNKSTATAFLLVKYKEKGKQEAMIMPVDYMYSEKVFSDNEYALKYSKENIKKIWGRTEDQVIDVSLPLGLRPIKINTMLSFDGFRACITGKANAGQKIGFTSMMPLVIGNEWENYIKKIDNYIEKKGKNKNITLNEKNDGICGEKNEKLYCILTDKIINNIYSIPFNSQQKILENGYDKFKKLDIERQVYFLQNLVLVLKSGRAGSCDMSAIGGSKNAATFAFGSKLSLWAKKFQKVYLIDNSSSGIYQNMSDNLLDIIK；

SEQ ID NO.2：

MMKEIKNYFIGLDMGTTSVGWAATDENYEIIKKNGKALWGIRLFDEAQTAADRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQKNSLFNDVDFDDKAYYKEYPTIYHLRYDLMTKDRPFDVRLVYLAVHHILKHRGHFLFDHFQVDENGVSGFEESFAAFGDALEHIKGESFDMGKEEEMKALCRDKKLGVRHKALALAQCLGRSKDKDFKAMMTLAAGGTALLSEVFKDEGLKDFSKNKVSFSDSQFENDKPEIIAELGDRYDLIAALHGLYNWSFLAELMRGHKYISEAKIEIYDKHKEDLALLKKVLKQDRSVYNLMFKEPGDKKPINYSAYVKACKTNGKKLPLPYGKFKYEEFIKTVKFCLKNLPDSPDKKNIENKLEEGSFLLKAVSVENGAIPYQLHLQELKIILSKAEAYLPFLKVRDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKQGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGENAQKLSPELKEKVLENLFKKHKHVSRRKFINYLVTEGIDKKEAESISGLDGDFKSSMSSLIDMKHILGNDFSREDAEKMIKDITIFGGDKKMLKKRLHREFSYLTSEQLTSLTRLSYDGWGRLSKELLVNLLPVEKSTGEVLVDKGSGEVLNIISAMEQTSYNLMELLSSRFGYATAIEERNREKEGNGTISYQDVEDMYISPAVKRPLWQALKIVREIVKILGKEPSKIFIEMARENGEKGKRTISRKARLQELYKKCRDDSRDWAKELAEKPEEDFRSDRLYLYYTQMGRSMYTGKPIDINQLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDIYPLGSALDGCHIQGEIHIQDIQREMRPFWHMLLEKGLISKEKYNRLSRTTPLSDTEKAAFIGRQLVETRQSTKACAELLSKAYPQARIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFDTRFTANPLHFLKGNHPVYSLNTEALYGHKVSRGGVDAWIPPEKDDEGHIMAGHEGTMGTVRKWMRKNNILFTRMPLEGKGGLFDQTIMKKGKGQVPLKGDSPVSDIEKYGGYNKASSAYFVLTSSKLKDETIYTIETIPLIIKRMIQTNKDKEDYIKRHWKDHGKKMVNPHICYGHIPVQSLLEINGFKVHLTGKSGKDFKLRNAEQLCISNDDAAVLKRVLKYNERSSLSKGKEALLITPFDNIQEVDLNRLYQVFEDKLTNQVYKVKLGKQASVLKKGEDKFNELPLEVKCRVIGEILHLFQCNAAIADLRLIGGAKNAGALTMNPRVSPEDHVYLIEQSVTGFFEKRILLAPYGGK；

SEQ ID NO.3：

MKEIKKIFIGLDMGTNSVGWTATDENYEVIKKNGKALWGIRLFDEAQTAEDRRMHRIARRRIERRSRRIDLLQELFAQEICKKDPGFYERLNESGLYEEDKTVHQTNSLFNDVDFNDKAYYKKYPTIYHLRHALMTENHPFDVRLVYLAIHHILKHRGHFLFENFQTDEKGTSGFDESFAAFGSALDRIKGSSPDVRKADSMKDILKDKKLGVKEKAASLLQCLGQGKEKDFKAMMTLAAGGTASLSDIFNDEKLKDFEKNKVNFSSAQFEENEPDIMAELGDRYDLIAALHGFYNWSLLAELMGEYHYISEAKIAVYDKHKADLKVLKRVLKQRPDIYAKIFREPGSSANKNYSAYVGVCKVKGKKAAIEKCSYEDFTKTLKPCLKDMPDSNDKDYISRELNMGTFLPKSVSKENGVIPYQLHLQELKIILSKAEAYLPFLKVKDQYGTVSDKIISLFTFRIPYYVGPINEHAGSCWVVKKDKRGKVYPWNFTEKIDIEKSAEGFIRNLTNKCTYLIGEDVLPKNSLLYSEFTVLNELNNVRIGETMQKLPLRLKEKVMDNLFSRYKHVSRTKFIKYLVSEGIDKKEAESISGLDGDFKSSLSSLIDMKHILGNDFSRENAEKMIQDITIFGGDKKMLKNRLHREFSYLTPEQLTSLTQLSYDGWGRLSKEFLVNLLPAEGDSCEVLVDHTSGEVLNIISAMRQTSYNLMELLGSRFGYGQAIEERNKKEEGQGRITYKDVEDLYISPAVRRPLWQALKIVREIVKITGKEPSKIFIEMARENGEKGKRTISRKARLQALYKKCRDDTRDWAKELEGKSEEDFRSDRLYLYYTQMGRSMYTGKPIDINRLFDRNVYDIDHIYPQSLTGDDSLDNRVLVEKTVNAKKGDTYPLSSALDGCYISGQQIRIQDIQKEMRPFWHMLLEKELISKEKYNRLSRTIPLSDAEKAAFIGRQLVETRQSTKACAELLSKAYPQTRIVYTKAGNASRFRQYGGFIKVRDMNDYHHAKDAYLNIVVGNVFNTRFTANPLHFLKGNHQAYSLNTEALYGHKVSRNGVDAWIPAEKDEKGQVMAGHEGTMGTVRKWMRKNNILFTRMPYEGKGGLFDQNIMKKEKGQVPIKGDSPISNIKKYGGYNKAKVAYFVLTQSKLNKKTVYTLEAIPLILKNSIQSNEDKETYIQKQWRKNGKKMEHPIVCLGHIPVQSLLEINGFKVHLSGKNGKDILLRNAEQLCINEADTAVLKKILKFNQRAAMSKKGEEIFINSFDNIQEEDLNRLYHVFEDKLTNQIYKVKLEKQAAVLKKGEETFNRLSPEQKCKLIGEILHLCQCKATHADLRLIGGAKKAGILTMGTQIYPKDHVYLIEQSVTGFFEKRILLAPFGEK；

SEQ ID NO.4：

MNQLVTGGISVLNKGEFIKKQILVYEPFLGDKMSYKNDNMVIRDGNGKIKYQVSCYRIFMVLIVGDVTITTGILRRQQKFGFRLCFLTLGLKVYSVIGPQLQGNTLLHCKQYAYDELTVGKSIIINKILNQRAALTRLRSKTEDVWECISLLEQYSKRLQNDSLNLQEIIGIEGMASKIYFPRIFSNTQWIGRKPRIKFDYINTLLDIGYNALFNFIDAILQVFGFDVYYGVLHTCFYMRKSLVCDIMEPMRPIVDWQIRKSINLKQFKQDDFVQVGKQYQLKYKKSTQYLQVFLEAILNYKEEIFVYVRDYYRSFMKNNPIEAYPVFKLEEL；

SEQ ID NO.5：

MIIVSYDISDDKLRTKFSKYLSRFGHRIQYSMFEIDNSERILNNIICDIHNQFEK KFSQEDSIYIFNLSKWCKIERFGYAKNETNDLLVLTGCKPRP；

SEQ ID NO.6：

MRFFHHIFSKPIIFRENKVNLLVIENKKLFANFVRDFSVQSRGEEGEILLSDDVSDLDFEKHAEVIADYFSLDFNGKKLSSKLITELKQSALYGFAGEAGELLGLLNSFGSKVISSVEFPLEWETVYDIGAVLKLFDYRLNVSSENFLEMLVDYMEVCSHFLKKDIFVLVNLKSYFDMEEIKLLYKEAFFRKWNLIVLEPSSSGSLHEYEDIVIIDKDICEIRLDNEEFL；

SEQ ID NO.7：

GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGA；

SEQ ID NO.8：

GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA；

SEQ ID NO.9：

GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAA。

实施例2：原核PAM耗竭实验

本实施例通过原核PAM耗竭实验挖掘本发明实施例1的II型CRISPR/Cas9基因编辑系统Cas核酸酶识别间隔序列所需的PAM序列。HqCas9、DspCas9、DsuCas9的核苷酸序列分别如SEQ ID NO.10～12所示。

具体操作如下：

(1)在PAM library间隔序列(其序列如SEQ ID NO.14所示)的3’端添加6个位置随机碱基NNNNNN(共4096条插入片段)，采用overlap PCR方法把library构建到pUC19骨架载体上，得到具有4096种不同PAM组合的PAM library质粒，但5’端间隔序列是一样的spacer-PAM混合质粒，经二代测序检测到6个位置的随机碱基丰度Gini值小于0.1，表明6个位置的随机碱基分布较均匀，PAM library质粒具有Amp抗性基因。

(2)构建原核表达的pET28a-Cas9质粒：分别在pET28a载体(addgene，108303)的EcoR I和BamH I酶切位点上插入本发明所述三种CRISPR/Cas9基因编辑系统，包括Cas9蛋白、sgRNA与tracrRNA，Cas9蛋白经大肠杆菌密码子优化，最后添加TAA终止密码子；在异源启动子J23119启动子后添加5’-重复序列-间隔序列(与PAM library间隔序列互补)-重复序列-3’，即组成sgRNA后接T7terminator；在异源启动子J23119启动子后添加鉴定出来的tracrRNA(其序列依次如SEQ ID NO.14～16所示)，三种质粒具有Kana抗性基因。

(3)把含有pET28a-Cas9(或pET28a空载质粒)和PAM library质粒共同通过细菌电转进DH5α(全式金生物，CD201-01)感受态，37℃复苏1h后均匀涂抹在Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的固体培养皿上置于37℃培养18h后刮取全部单克隆至无抗性培养基中，离心提取含pET28a-Cas9(或pET28a空载质粒)和PAM library质粒的混合质粒。

(4)在混合质粒上，随机碱基的两端设计合适的引物对(library-NGS-F和library-NGS-R)含有间隔序列和PAM组合的位置进行PCR扩增及纯化，在产物两端加上接头(采用商业的illumina测序接头引物：Hieff NGS384 Dual Index Primer Kit forSet1(货号12613ES02)I5 primer：TAAGATTA)进行二代测序(I7primer：GAGATTCC)，以pET28a空载对照组的PAM耗竭阈值为对照基准，利用Weblogo 3分析6个随机碱基的消耗，通过负向筛选的方式得到每个Cas9蛋白所识别的PAM序列。

PAM序列分析结果如图2所示，HqCas9、DspCas9、DsuCas9能分别识别序列为NGNGNC、NNNAA、NNNAA的PAM。

上述序列信息如下：

SEQ ID NO.10：

ATGCAGACCAAAAAAGTTGATGAATACTACGTGGGCTTCGATATCGGCACCAACTCCGTTGGCTACGCGGTGACCGATAAAAACTACAACCTGATTAAACACGGCGGTGAACCGATGTGGGGCTCCCACGTTTTCGAGGCGGCGAGCACCGCCCAGGAACGCCGTACCTTCCGCACCGCTCGCCGCCGTAACGATCGTAAAAAACAGCGTATCGCGCTGGTGTCTGAAATCTTCGCGCCGGAAATCGCGAAAGTGGACCCGCGTTTCTTCATCCGTCGCCGTGAATCCGCGCTGTTCCGCGAC

GACGTGGACATTAAAGATCGTTACGTGGTTTTCAACGACGACGATTTCACCGATAAAGACT

ACTACGATATCTACCCGACCATCCACCACCTGATCTACGACCTGATGAGCAACAAAGAAAA

ACACGATATTCGCCTGGTTTACATGGCGTGCGCCTACCTGGTGGCGCATCGCGGCCACTTCC

TGTCTGAAGTTTCTAAAGATAACATCGAAGATGTTCTGGACTTCGATGTCGTGTACTGTAAC

TTTCTGAACGTTATGGACAACTACGCGGAAATCCCGTGGAAATGCGATATTTCCAAATTCAA

AGAAATCCTGAAGAAAAAACAGACCGTGACCAACAAAGAACGTGAATTCCTCCAGCTGCTT

AACGAAGGTAAAAAATTCAAAACCAGCGAAGAGGATGATGTGTCTCGTGAAGGCCTGGTG

AAACTGCTGTCGGGTGGCACCTACGAACTGGGTAAACTGTTTCCGAAACTGACCTTTGAAG

AAAAAGTGAGCGTTAGCTTCAACATGGCGGAAGAAGATTTTGCGATGGTTCTGCAGCAGCT

GGGTGACGAAGGTGACATCATCTCCAGCCTGCGTAACGTTTACGATTGGGCGATCCTGAGC

GACGTGCTTAACGGCAAAAACAGCGTGTCTGAAGGCAAAATTACCGTCTACGAACAGCACA

AAAAAGATCTGTCTTTCCTGAAATACTTCGTGAAAAAATACATCCCGAACCGTTATTACGAA

GTTTTCCGTGATGGCAACATCGTTGGCAACTATGTGAGCTATAGCTACAACCTGAAAAACGT

TCAGAACGTATCCAAATTCAAAGGCGCCAAAAAAGACGTTTTCTGTGATTACATTAAAAAA

GTTGTTAAAGATATTAAAGTTGACGATGAAGATAAAGTTGAATACGAAGATATGATGTTCC

GCCTGGATACGTACAGCTTCATCCCGAAACAAGTTGAAAACGACAATCGTGTTATCCCGTA

CCAGCTGTACTACTACGAACTGAAACGTATCCTGGACAACGCGTCCTCTTACCTGGAATTTC

TGGACGAAAAAGATATGGACGGTTACACTTCGCGCGAAAAACTGCTGTCCATCATGGAATT

CCGTATCCCGTATTATGTGGGTCCGCTGCGTACCGATAACGGTCAGCACGGCTGGATGAAA

CGTAAAGCGGAAGGCCGTATCTACCCGTGGAACTTCGAAGATAAAGTGGATCTGGACGCTA

GCGAACAGGAATTTATTAACCGTATGACCAACTCTTGCACCTACCTGCCGGGTGAAACCGT

GGTGCCGAAATATAGCCTGCTGTACTGCAAATTCAACGTTCTGAACGAAATTAACAACATC

AAAATCAACGACTGTTCTATCCCGATCGAGCACAAACAGGGCATCTACAAACTGTTCGAAC

GCTACCGCAAAGTGACCCCGAAAAAGATTAAAGACTTCCTGATCTCTAACAACCTGCTGCA

CCCGGAAGATGTTATCAGCGGCATCGATGTTACCATCAAAAGCAGCCTGAAATCCTACCAC

GACTTCAAAAAACTGCTGGAAAGCTGTGTGCTGAAAGAAAACCAGGTGGAAGCTATCATCG

AACGCCTGACCTACAGCGAAGATAAAGGCCGTATCCTGCGTTGGCTGCACATGGAATTCCC

GGACCTGAGCGATGATGACGTTAAATACATCTCCAAACTGAAATACAGCGACTTCGGCCGC

CTGAGCCGCAAACTGCTGGTCGGCATCCGTGGCTGCAACAAAGACACCGGCGAAGTGGATA

GCATCATGGGCATGCTGTGGAGCACCAACGACAACATGATGAAACTGCTGTCTAACAGCTA

CACCTTTATCGAAGAAATCGAAGCGATCAAAAACGAATACTACGTTGAACACCCGGCGAAC

CTGGACAGCATGCTGGATGAAATGTACGTTAGTAACGCTGTGCGTCGTCCGATTCACCGTAC

CCTGGATATCCTGAGCGACATTCGCAAAGTTTGCGGCAAAAACCCGAGCAAAATCTTCGTT

GAAATGGCGCGCGGTGGTGGTGAAAAAGGTGTTCGTACCAAATCCCGCCGTGACCAGATCT

CTGAACTGTATAAAAACATGGATAAAGCGGAAGTGCGTGAACTGTCTGAACAGCTTGAAGG

TAAAACCGATAACGAATTACAGTCCGAAGTGCTGTTCCTGTACTTTATGCAATTGGGTAAAT

GCGCGTACACCCAGAAAACCATCGACATCGACAAGCTGAAAACCAACATTTACAACGTGGA

TCACATTTACCCGCAGTCTTACGTAAAAGATGATAGCATCACCAACAAAGTGCTGGTTATTA

GTGAAGAAAACGGCCAGAAAGGTGATAAATATCCGATCTCTAAAGACATCCGTGAAAAAA

TGCAGCCGTTCTGGTACCGTTTGCTGAGCAACAAACTGATTTCTGAAGAAAAATACCGCCG

CCTGACCCGCTGTACCTCCTTCACCGAAGAAGAACTGACCGGTTTCATTAACCGCCAGCTCG

TTGAAACCCACCAGTCCACCAAAGCGGTTACCACGGTTTTCCGTACTCTGTTCCCGGACGTG

GAGATCGTTTACTCTAAAGCGGGCCTGGTGTCCGAATTCCGTAAAGAATTCGACATGCTGA

AAACCCGTAGTGTGAACGATCTGCACCACGCCAAAGATGCGTATCTGAACATCGTCGTGGG

CAACGTTTACCATTGTCGTTTCACCAAAAACTTCTACATTACCCAGAAATACAGCCTGAAAA

CCAAAACCCTGTTCACCCATTCTGTTAAACTGGGTGATGACGTTATCTGGAACGGCCAGGA

GAGCATTGGTAACGTGCGTAAAGTGCTGGCGAAAAACAACATCCACTACACTAAATATCCG

TTCATGCGTAAAGGTGGCCTGTTCGACCAGATGCCGGTTAAAGCGGCGGCCGGTCTGATCC

CGCGTAAAACCGGCCTGGATACCGAAAAATACGGTGGTTATAACAAATCCACTGCTACCGC

ATTTCTGTTAGTGAAATACAAAGAAAAAGGCAAACAGGAAGCCATGATCATGCCGGTAGAC

TACATGTACAGCGAAAAAGTTTTCTCCGATAACGAATACGCCTTAAAATACTCCAAAGAAA

ATATCAAAAAGATCTGGGGTCGCACGGAAGATCAGGTGATCGATGTGTCTTTACCGCTGGG

CCTGCGTCCGATCAAAATTAACACCATGCTGAGCTTCGACGGCTTCCGCGCGTGCATCACCG

GCAAAGCAAACGCTGGTCAGAAAATTGGCTTCACCAGCATGATGCCGCTGGTGATCGGTAA

CGAATGGGAAAACTACATCAAAAAGATTGACAACTACATTGAGAAAAAAGGTAAAAACAA

AAACATCACCCTGAATGAAAAGAACGATGGCATCTGCGGCGAAAAGAACGAAAAACTGTA

CTGTATCCTGACTGACAAAATCATCAACAACATCTACTCGATCCCGTTCAACTCCCAGCAGA

AAATCCTGGAGAACGGCTACGACAAATTCAAAAAACTGGATATCGAACGCCAGGTGTACTT

CCTGCAGAACCTGGTTCTCGTTCTGAAATCGGGCCGTGCTGGTTCCTGTGATATGAGCGCAA

TCGGTGGCTCGAAAAACGCGGCGACCTTTGCGTTCGGTTCCAAGCTGAGCCTGTGGGCGAA

AAAATTCCAGAAAGTGTACCTGATCGATAACAGCAGCTCTGGCATCTACCAGAACATGAGCGATAACCTGCTGGACATCATCAAATAA；

SEQ ID NO.11：

ATGATGAAAGAAATTAAAAACTATTTTATTGGCCTGGATATGGGCACCACTAGTGTGG

GCTGGGCAGCCACTGATGAAAACTATGAAATTATTAAGAAGAATGGCAAAGCCCTGTGGGG

CATTAGACTGTTTGATGAAGCGCAGACTGCAGCAGATAGAAGAATGCATAGAATTGCAAGA

AGAAGAATTGAGAGAAGAAGCAGAAGAATTGACCTGCTGCAAGAACTTTTTGCCCAAGAA

ATTTGCAAAAAAGATCCTGGCTTTTATGAAAGACTGAATGAAAGTGGCCTGTATGAAGAAG

ATAAAACTGTGCATCAGAAAAACTCTCTGTTTAATGATGTGGATTTTGATGATAAAGCCTAT

TATAAAGAATATCCAACCATTTATCATCTGAGATATGATCTGATGACCAAAGATAGACCATT

TGATGTGAGACTGGTGTATCTGGCCGTGCATCATATTCTGAAACATAGAGGCCATTTTCTGT

TTGATCATTTTCAAGTGGATGAAAATGGTGTGAGTGGCTTTGAAGAAAGCTTTGCAGCCTTT

GGTGATGCCCTGGAACATATTAAAGGTGAAAGCTTTGATATGGGCAAAGAAGAAGAAATG

AAAGCCCTGTGCAGAGACAAGAAACTGGGTGTGAGACATAAAGCCCTGGCCCTGGCACAG

TGCCTTGGCAGAAGCAAAGACAAAGACTTTAAAGCCATGATGACCCTGGCAGCTGGTGGCA

CTGCCCTGCTGAGTGAAGTGTTTAAAGATGAAGGCCTGAAAGATTTTAGCAAAAACAAAGT

GAGCTTTAGTGATAGTCAGTTTGAAAATGATAAACCTGAAATTATTGCAGAACTGGGTGAT

AGATATGATCTGATTGCAGCCCTGCATGGCCTGTATAACTGGAGCTTTCTGGCAGAACTGAT

GAGAGGCCATAAATATATTAGTGAAGCCAAAATTGAAATTTATGATAAACATAAAGAAGAT

CTGGCCTTGCTGAAAAAAGTGCTGAAACAAGATAGAAGTGTGTATAACCTGATGTTCAAGG

AACCTGGTGATAAAAAACCTATTAACTATAGTGCCTATGTGAAAGCCTGCAAAACCAATGG

TAAAAAATTACCACTGCCATATGGCAAGTTTAAATATGAAGAATTTATTAAAACTGTGAAA

TTTTGCCTGAAAAACCTGCCTGATAGCCCTGATAAAAAAAACATTGAAAACAAACTGGAAG

AAGGCAGCTTTCTGCTGAAAGCAGTGAGTGTGGAAAATGGTGCCATTCCATATCAGCTGCA

TCTGCAAGAACTGAAAATTATTCTGTCTAAGGCAGAAGCCTATCTGCCATTTCTGAAAGTGA

GAGATCAGTATGGCACTGTGAGTGATAAAATTATTAGCCTGTTTACCTTTAGAATTCCATAT

TATGTGGGCCCAATTAATGAACATGCTGGCAGCTGCTGGGTGGTGAAAAAAGATAAACAAG

GCAAAGTGTATCCATGGAACTTTACTGAAAAAATTGACATTGAAAAAAGTGCAGAAGGCTT

TATTAGAAACCTGACCAACAAATGCACCTATCTGATTGGTGAAGATGTGCTGCCAAAAAAC

AGCCTGCTGTATAGTGAATTTACTGTGCTGAATGAACTGAACAATGTGAGAATTGGTGAAA

ATGCACAGAAACTGAGCCCTGAACTGAAAGAAAAAGTGCTGGAAAACCTGTTTAAAAAAC

ATAAACATGTGAGCAGAAGAAAATTTATTAACTATCTGGTGACTGAAGGCATTGATAAAAA

AGAAGCAGAAAGCATTAGTGGCCTGGATGGTGATTTTAAAAGCAGCATGAGCAGCCTGATT

GATATGAAACATATTCTGGGCAATGATTTTAGCAGAGAAGATGCAGAAAAAATGATTAAAG

ATATTACCATTTTTGGTGGTGATAAAAAAATGCTGAAAAAAAGACTGCATAGAGAATTTAG

CTATCTGACTAGTGAACAGCTGACTAGCCTGACTAGACTGAGCTATGATGGCTGGGGCAGA

CTGAGCAAGGAACTTCTGGTGAACCTGCTGCCTGTGGAAAAAAGCACTGGTGAAGTCCTGG

TGGATAAAGGCAGTGGTGAGGTGCTGAACATTATTAGTGCCATGGAACAGACTAGCTATAA

TCTGATGGAATTACTGAGCAGCAGATTTGGCTATGCCACTGCCATTGAAGAAAGAAACAGA

GAAAAAGAAGGCAATGGCACCATTAGCTATCAAGATGTGGAAGATATGTATATTAGCCCTG

CAGTGAAAAGACCACTGTGGCAAGCCCTGAAAATTGTGAGAGAAATTGTGAAAATTCTGGG

CAAAGAACCAAGCAAAATTTTTATTGAAATGGCAAGAGAAAATGGTGAAAAGGGCAAAAG

AACCATTAGCAGAAAAGCAAGACTTCAAGAGCTGTATAAGAAATGCAGAGATGATAGTAG

AGATTGGGCCAAAGAACTGGCAGAAAAACCTGAAGAAGATTTTAGAAGTGATAGACTGTA

TCTGTATTATACTCAGATGGGAAGAAGCATGTACACTGGCAAACCAATTGATATTAATCAG

CTGTTTGATAGAAATGTGTATGATATTGATCATATATATCCACAAAGCCTGACTGGTGATGA

CAGCCTGGACAACAGAGTGCTGGTGGAAAAAACTGTGAATGCCAAAAAAGGAGATATCTA

CCCCTTAGGTAGTGCCCTGGATGGCTGCCATATTCAAGGTGAAATTCATATTCAAGATATTC

AGAGAGAAATGAGACCATTTTGGCATATGCTGCTGGAAAAAGGCCTGATTAGTAAAGAAA

AATATAACAGACTGAGCAGAACCACCCCACTGAGTGATACTGAAAAAGCAGCCTTTATTGG

CAGACAGCTGGTGGAAACTAGACAGAGCACCAAAGCATGTGCAGAATTACTGAGCAAAGC

CTATCCACAAGCAAGAATTGTGTATACCAAAGCTGGCAATGCAAGCAGATTTAGACAGTAT

GGTGGCTTTATTAAAGTAAGAGACATGAATGATTATCATCATGCCAAAGATGCCTATCTGA

ACATTGTGGTGGGCAATGTGTTTGATACTAGATTTACCGCCAACCCACTGCATTTTCTGAAA

GGCAACCATCCTGTGTATAGCCTGAACACTGAAGCCCTGTATGGCCATAAAGTGAGCAGAG

GTGGTGTGGATGCCTGGATTCCACCTGAAAAAGATGATGAAGGCCATATTATGGCTGGCCA

TGAAGGCACCATGGGCACTGTGAGAAAATGGATGAGAAAAAACAACATTCTGTTTACTAGA

ATGCCATTGGAAGGCAAAGGTGGCCTGTTTGATCAGACCATTATGAAAAAAGGCAAAGGCC

AAGTGCCACTGAAAGGTGATAGCCCTGTGAGTGATATTGAAAAATATGGTGGCTATAACAA

AGCAAGCAGTGCCTATTTTGTGCTGACTAGCAGCAAACTGAAAGATGAAACCATTTATACC

ATTGAAACCATTCCACTGATTATTAAAAGAATGATTCAGACCAACAAAGATAAAGAAGATT

ATATTAAAAGACATTGGAAAGATCATGGCAAGAAAATGGTTAACCCACATATTTGCTATGG

CCATATTCCTGTGCAGAGCCTGCTGGAAATTAATGGCTTTAAAGTGCATCTGACTGGCAAAT

CTGGCAAGGACTTTAAGCTGAGAAATGCAGAACAGCTGTGCATTAGCAATGATGATGCAGC

AGTGCTGAAAAGAGTGCTGAAATATAATGAAAGAAGCAGCCTGAGTAAAGGCAAAGAAGC

CCTGCTGATTACCCCATTTGATAACATTCAAGAAGTGGATCTGAACAGACTGTATCAAGTGT

TTGAAGATAAACTGACCAACCAAGTGTATAAAGTGAAACTGGGCAAACAAGCAAGTGTGTT

AAAGAAGGGTGAAGATAAATTTAATGAACTCCCACTGGAAGTGAAATGCAGAGTGATTGGT

GAAATTCTGCATCTGTTTCAGTGCAATGCAGCCATTGCAGATCTGAGACTGATTGGTGGTGC

CAAAAATGCTGGTGCCCTGACCATGAACCCAAGAGTGAGCCCTGAAGATCATGTGTATCTG

ATTGAACAGAGTGTGACTGGCTTTTTTGAAAAAAGAATTCTGCTGGCCCCATATGGTGGCAAATAA；

SEQ ID NO.12：

ATGAAAGAAATTAAAAAGATCTTCATCGGTCTGGATATGGGCACCAACAGCGTGGGCT

GGACCGCGACCGATGAAAACTACGAAGTGATCAAAAAGAACGGTAAAGCGCTGTGGGGTA

TCCGTCTGTTCGATGAAGCACAGACCGCAGAAGATCGTCGTATGCACCGCATCGCGCGTCG

CCGCATCGAACGCCGCTCCCGTCGTATCGATCTGCTGCAGGAACTGTTCGCGCAGGAAATCT

GCAAAAAAGATCCGGGCTTCTACGAACGTCTGAACGAAAGCGGTCTGTACGAAGAAGATA

AAACTGTGCACCAGACCAACTCCCTGTTTAACGACGTGGATTTCAACGATAAAGCGTACTA

CAAAAAATACCCGACCATTTACCACCTGCGCCATGCGCTGATGACCGAAAACCACCCGTTC

GACGTTCGCCTGGTTTACCTGGCGATCCACCACATCCTGAAACATCGTGGTCACTTCCTGTT

CGAAAACTTCCAGACGGACGAAAAAGGCACCTCCGGCTTCGACGAATCTTTTGCTGCTTTC

GGCTCTGCGCTGGATCGTATTAAAGGCTCCTCACCAGATGTGCGTAAAGCCGACTCTATGA

AAGACATCCTGAAAGATAAAAAACTGGGTGTTAAAGAAAAAGCAGCGAGCCTGCTGCAGT

GCCTGGGCCAGGGCAAAGAAAAAGACTTCAAAGCTATGATGACCCTGGCGGCAGGCGGCA

CCGCGTCCCTGTCCGATATCTTCAACGACGAAAAACTGAAAGACTTCGAAAAGAACAAAGT

GAACTTCAGCTCTGCACAGTTCGAAGAAAACGAACCGGACATCATGGCGGAACTGGGCGAC

CGTTATGATCTGATCGCGGCCCTGCACGGCTTCTATAACTGGTCTCTGCTGGCAGAACTGAT

GGGTGAATACCATTACATCAGCGAAGCTAAAATTGCGGTGTACGACAAACACAAAGCGGAT

CTGAAAGTTCTGAAACGCGTTCTGAAACAGCGTCCGGACATCTACGCGAAAATCTTCCGCG

AACCGGGTTCCTCTGCGAACAAAAACTACAGCGCGTACGTGGGCGTTTGCAAAGTTAAAGG

CAAAAAAGCCGCGATCGAAAAATGTAGCTACGAAGATTTCACTAAAACCCTGAAACCGTGC

CTGAAAGATATGCCGGATTCTAACGACAAAGATTATATCTCTCGCGAACTGAACATGGGTA

CCTTCCTGCCGAAATCCGTTAGCAAAGAAAACGGCGTGATCCCGTACCAGCTGCACCTGCA

GGAACTGAAAATCATCCTGTCTAAAGCAGAAGCGTACCTGCCGTTCCTGAAAGTGAAAGAC

CAGTACGGCACCGTTTCCGACAAAATTATCTCCCTGTTCACCTTCCGTATCCCGTACTATGT

GGGTCCAATCAACGAACACGCGGGCTCCTGCTGGGTGGTTAAAAAAGATAAACGCGGTAA

AGTGTACCCGTGGAACTTCACCGAAAAAATCGATATCGAAAAGTCCGCGGAAGGCTTCATC

CGTAACCTGACCAACAAATGCACCTACCTGATCGGTGAGGATGTTCTGCCGAAAAACAGCC

TGCTGTACAGCGAATTCACCGTTCTGAACGAACTGAACAACGTGCGCATCGGCGAAACCAT

GCAGAAACTGCCGCTGCGTCTGAAAGAGAAAGTGATGGACAACCTGTTCAGCCGTTACAAA

CACGTGAGCCGCACCAAATTCATCAAATACCTGGTGAGCGAAGGCATCGATAAAAAAGAA

GCTGAAAGCATCTCTGGCCTGGACGGCGATTTCAAAAGCTCTCTGAGCTCCCTGATCGACAT

GAAACACATCCTGGGTAACGACTTCAGCCGTGAAAACGCGGAAAAAATGATCCAGGATATC

ACCATCTTCGGCGGCGATAAAAAGATGCTGAAAAACCGCCTGCACCGTGAATTCTCCTACC

TGACCCCGGAACAGCTGACCAGCCTGACCCAGCTGTCCTACGACGGCTGGGGCCGTCTGAG

CAAAGAATTCCTGGTTAACTTACTGCCGGCTGAAGGTGATAGCTGTGAAGTGCTGGTTGATC

ACACCAGCGGCGAAGTGCTGAACATTATCAGCGCGATGCGTCAGACCTCCTACAACCTGAT

GGAACTGCTGGGCAGCCGCTTCGGCTACGGCCAGGCGATCGAAGAACGTAACAAAAAAGA

AGAAGGCCAGGGCCGTATCACCTACAAAGACGTTGAGGATCTGTACATCAGCCCGGCGGTT

CGTCGTCCGCTGTGGCAGGCGCTGAAAATCGTGCGCGAAATCGTGAAAATCACCGGCAAAG

AACCGAGCAAAATCTTCATCGAAATGGCGCGTGAAAACGGTGAAAAAGGTAAACGTACCA

TCTCTCGCAAAGCTCGCCTGCAGGCTCTGTACAAAAAATGTCGTGATGACACCCGTGACTG

GGCGAAAGAACTGGAAGGCAAATCCGAAGAAGATTTTCGCTCTGATCGTCTGTATCTGTAC

TACACCCAGATGGGTCGCAGCATGTACACCGGTAAACCGATCGATATTAACCGTCTGTTCG

ATCGTAACGTGTATGACATTGATCACATTTACCCGCAGTCCCTGACCGGTGACGATAGCCTG

GATAACCGCGTACTGGTGGAAAAAACCGTTAACGCAAAGAAAGGTGACACCTACCCGCTGT

CTAGCGCACTGGATGGTTGCTACATTTCTGGTCAGCAGATTCGTATCCAGGATATCCAGAAA

GAAATGCGTCCGTTCTGGCACATGCTGCTGGAAAAAGAACTGATTTCTAAAGAAAAATACA

ACCGCCTGTCTCGCACCATCCCGCTGTCCGACGCGGAAAAAGCAGCGTTCATTGGTCGTCA

GCTGGTTGAGACCCGCCAGTCCACCAAAGCCTGCGCGGAACTGCTGTCTAAAGCGTATCCG

CAGACCCGTATCGTGTACACCAAAGCGGGCAACGCTAGCCGTTTCCGTCAATACGGTGGCT

TTATCAAAGTGCGTGATATGAACGACTACCACCACGCGAAAGATGCATATCTGAACATCGT

AGTTGGCAACGTTTTCAACACCCGTTTCACCGCCAACCCGCTGCACTTCCTGAAGGGTAACC

ACCAGGCTTACTCCCTGAACACCGAAGCGTTGTACGGTCATAAAGTATCCCGTAACGGCGT

GGATGCGTGGATCCCGGCGGAGAAAGATGAAAAAGGCCAGGTTATGGCAGGCCACGAAGG

CACCATGGGTACCGTTCGCAAATGGATGCGCAAAAACAACATCCTGTTTACCCGCATGCCG

TACGAAGGCAAAGGCGGCCTGTTCGACCAGAACATCATGAAAAAAGAAAAAGGCCAGGTG

CCGATCAAAGGTGATTCCCCGATTAGCAACATCAAAAAATACGGTGGCTATAACAAAGCCA

AAGTGGCGTATTTCGTTCTGACGCAGTCTAAACTGAACAAAAAGACCGTTTATACCCTGGA

AGCCATCCCGCTGATTCTGAAAAACAGCATTCAGTCCAACGAAGATAAAGAAACCTATATT

CAGAAACAGTGGCGTAAAAACGGTAAGAAAATGGAACATCCGATCGTTTGTCTGGGCCATA

TTCCGGTGCAGTCCCTGCTGGAAATTAACGGCTTCAAAGTGCACCTGTCAGGCAAAAACGG

TAAAGATATCCTGCTGCGCAACGCGGAACAGCTGTGTATCAACGAAGCAGATACCGCTGTT

CTGAAGAAAATCCTGAAATTCAACCAGCGTGCCGCGATGAGTAAAAAAGGCGAAGAAATC

TTCATCAACAGCTTCGATAACATCCAGGAAGAAGATCTGAACCGCCTGTACCACGTTTTCGA

AGATAAACTGACCAACCAGATCTACAAAGTTAAACTGGAAAAACAGGCTGCTGTGCTGAAA

AAAGGCGAAGAAACCTTCAACCGCCTGAGCCCAGAACAGAAATGTAAACTGATCGGTGAA

ATCCTGCACCTGTGCCAGTGCAAAGCTACTCACGCTGATCTGCGTCTGATTGGCGGCGCGAA

AAAAGCCGGCATCCTGACCATGGGTACCCAGATCTACCCGAAAGACCACGTTTACCTGATC

GAACAGTCCGTTACCGGCTTCTTCGAAAAACGTATCCTGCTGGCGCCGTTCGGTGAAAAATAA；SEQID NO.13：ATGGCGAATACTTTTAAAGTCAT；

SEQ ID NO.14：

ACATTACTCTCAAACTACAAATGTATTCATTTGATACATTTGATATCAAATTTTGAAAATCCAGCTTGCAACTGGTATGTAAATCCACATCTTTGTTATACATTCTTATACAATAAATATCAACACATATCTTTCCTAATACCATAACAATACCTATAACCTGAACTCCTATTCAAAATATTGACAATTCCCCTTTCATGATGTAATGTGTAAATGAATTTACATTGCGAGTTCAAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTTTTTACTTAGGATTTTTTATTATCATTATATATTGTATATTTCATTTTCTCGAATAGTATATATTTTATATTTTTGATTT；

SEQ ID NO.15：

AAACCGAACGAACACATTGACAAAACCGATAATGGTTTTACCACTATCAAGAATCACAACACTCTCAAACCTCAAATTGCATTTTCATGCATCGGTTCTCTGCAAGTGTATCCGCTTACACCGGGCGGCGCGACTCTTGGCAGTGTATCAAATGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAAAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGGATATACGCACAACAAAAGGCCCCATTATCTCATATCCCAAAAGACATGAAATAACAGAGCCTGAAAAAGCCTCTTTTGCCACCTTCCCTGCTGTCCTGTCCATCATCATAATCATCCCTTCTCTAATAATTAATATAAAAAGGATTTCCTATGAACTCATTTTATCATTAAACTCATTATATCATGAGTGACCGGTCTACGCCTTCTACCTAAAGCATGTTACCTTCTACTTCTATTATACTCAGAGGCATGACACACTCTGTCGCTCCGCGAAAAAATCCTGAATTTTTATCAAAAATTAATCTTACGAATAAAAGGAATGCCTATAATCCTCATCTGCAGAAGAAATCGGCAGCCTGATCTATCTCCTTTCTATATACAGAGGAGTCCCCTGAAAGCACAAAAACTTCCTGAATCTCCTGTGGCAGTGACCTGCCTTTAGAGTTTCAGGAAGTTTTTGCTCCTCACGGTTTCCCGCAAGGGCGGCAATCGGAATCGCCATTAGGGAAGCGCTGATTAAATCGTTATCGAATTTCATTCTTGTATTTTTATTCAATGCAAGGAATTAGTCGACGCGAATAGCGAGCTATTTAAGGAGACTGATGACGAAGCATTGGATAAAAATACATATGAAATTCGATTCTACGAATTAATCAGTGCTTCCTTAGGATTGCCATTTGCTGCATCTTTCCCATGCGCTTTATGTAAGCTAAGGAAACGCATGCCGAATGACCGTCACATAGCACCCGGTCATTTTCTTTATTATACTATTTTTTACAGCAGTCTGCTTTCTTTTTCTGTACATATTCTGTACATATCAAATCAAAAGTCCCCTGA；

SEQ ID NO.16：

TACTCTGCAAATTGTTACATAATCTTCTCCATTGAAATTTATTTTATAAGCAAAAAATAAGTCCTTCGGCAATAGAGCCAAATTGCAATCCACGCTTCCCTTGGGGTGCAGAAAAAAGGAGGCAGAAGCCGCCAAAGGTTCTGCCCCCTTTCAAATTGCATTTTCATGCAGCAGTTCTCCGCAAGTGTATCCGCTTACACCAGACGGCGCAGTTCCTGACAGTGTATCAAACCCTTCATCAGGCAGTCGATAAAAGGCAAATTGACACCCTCCCTGAAATGGAGTATCCTGTAGATGTCAGGATAACTTACCACTATCCGATCACAACACAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAGAGAGCTCCTTCGGGAGTTCTTTTTATTTGCCCGATTTGAGCCACAATAAAAGGTCCCGTTATTTCATATCTCAAAAGACATGAATAACA；

library-NGS-F引物的序列为：

ACACTCTTTCCCTACACGACGCTCTTCCGATCTgtctacaatcggctcgatcga；

library-NGS-R引物的序列为：

GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTgcgcagaccaaaacgatctc。

实施例3：原核干扰实验一

本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在原核生物中具有切割能力(即是否能够识别实施例2得到的PAM序列)，并且验证本发明实施例2所鉴定的PAM的正确性。

具体操作如下：

(1)构建PAM-target单条质粒，将实施例2所构建的PAM library质粒的6位随机碱基替换为三种Cas9蛋白对应的PAM序列(HqCas9：AGCGAC；DspCas9：GGATAA；DsuCas9：GGATAA)。

(2)将PAM-target单条质粒分别电转入含有三种Cas9基因编辑系统的DH5α感受态中，以PAM空载质粒作为对照，37℃复苏1h后梯度稀释培养基，采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基，置于37℃培养18h后，观察双抗板上的单克隆细菌数。

原核干扰结果如图3所示，从右向左为稀释方向，最右列为未稀释原菌液，稀释倍数越大单克隆长得越少。对照组为电转PAM空白质粒组，与Cas9基因编辑系统中的间隔序列不存在互补配对的靶序列，则Cas9蛋白无法行使切割功能，细菌具有双抗性基因则正常生长。实验组的PAM单条质粒中具有能与Cas9基因编辑系统中的间隔序列互补配对的靶点以及PAM，实验组的单克隆数量与对照组相比明显下降，说明Cas9蛋白能识别本实施例选定的PAM序列而发挥切割能力，使细菌不具备抗Amp能力而不能生长。该实验结果表明，本发明的HqCas9、DspCas9、DsuCas9能分别识别序列为AGCGAC、GGATAA、GGACAA的PAM序列，在原核系统中具备切割能力。

实施例4：原核干扰实验二

本实施例通过原核干扰实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统中发挥切割靶向DNA序列所需要的tracrRNA范围。

具体操作如下所示：

(1)把本发明实施例1的三种CRISPR/Cas9基因编辑系统中的非编码区域(Noncoding，NC)分为4段，分别通过Gibson方法组装进target质粒中，前面加上强异源启动子J23119，分别构建为target-NC 1-4质粒。

(2)构建pET28a-ΔCas9质粒：将实施例2得到的pET28a-Cas9质粒中删除所有的NC部分，保留Cas9蛋白、重复序列和间隔序列。

(3)把target-NC 1-4质粒分别电转进入含有pET28a-ΔCas9的大肠杆菌DH5α感受态中，37℃复苏1h后梯度稀释培养基，采用滴板法在含有Amp(100μg/mL)以及Kana(50μg/mL)双重抗性的培养皿上滴涂20μL培养基，置于37℃培养18h后，观察双抗平板上的单克隆细菌数。

原核干扰结果如图4所示，结果表明，HqCas9的NC4、DspCas9的NC2、DsuCas9的NC1所对应的生长菌落最少，说明这三段对应的NC区域是辅助Cas9核酸酶发挥有效切割效应的主要序列。

实施例5：预测CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构

为预测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统识别靶位点的RNA二级结构，通过模拟tracrRNA与重复序列转录后的RNA结合过程，预测两者结合后的RNA二级结构，通过使用在线软件NUPACK进行模拟，结果如图5所示，重复序列与tracrRNA之间通过“GAAA”进行连接。三种CRISPR/Cas9基因编辑系统发挥靶向切割所需要的scaffold序列如SEQ ID NO.17～19所示。

上述序列信息如下：

SEQ ID NO.17：

GTTTGAGAGTAATGTAAATTCATAGAGGTATAAGAgaaaATGAATTTACATTGCGAGTTC AAATAAAGTTTTTACCAAATCGCCGTTTTCCGGTTACACAGTGTGTGTATCAATCCTAAGTT；

SEQ ID NO.18：

GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CGAGTTCAAATAAAAATTCATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAA AGAGCTCCTTCGGGAGTTCTT；

SEQ ID NO.19：

GTTTGAGAGTGTTGTGATTCTTGATAGTGGTAAGAAATTACCACTATCCGATCACAACA CAAGTTCAAATAAAAATTTATTCAAATCGTCACTTCGGTGACCCCACAGTGTGTGGATAAG AGAGCTCCTTCGGGAGTTCTT。

实施例6：dsODN插入实验一

本实施例通过dsODN插入实验验证本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中发挥靶向切割的最适间隔序列的长度。

具体操作如下：

(1)根据本发明实施例1的三种Cas9蛋白进行人源密码子优化，将对应的核苷酸序列克隆进PX330真核表达载体上(addgene，59909)，获得PX330-蛋白真核表达质粒。

(2)在哺乳动物细胞中，以HEK293T细胞为例，选取内源性基因，以本实施例3所鉴定的能在原核生物中识别切割的PAM序列，寻找到合适的靶位点，序列格式为5’-不同长度的间隔序列(18～30bp)-直接重复序列-3’，通过Gibson方法克隆到PXZ载体上(addgene，160229)，构建靶向同一靶位点、具有不同spacer长度的PXZ-target质粒，同时转染PX330-蛋白真核表达质粒与PXZ-target质粒。具体target序列见表1。

(3)在生长状态良好的HEK293T细胞24孔板中共转染PX330-蛋白真核质粒、PXZ-target质粒、1.2μL dsODN，72h后收细胞抽提DNA。

(4)在对应的基因靶点上游以及dsODN序列上设计一对引物(见表1)进行dsODN-PCR扩增，跑琼脂糖胶检测是否出现目的条带，用来判断是否有dsODN的插入，通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在真核细胞环境下是否具有编辑能力，并比较不同长度的间隔序列对应的条带强弱。

表1碱基大小和序列

检测结果如图6所示，对应长度的PCR条带用红色三角标注，代表有dsODN的插入，说明这三种CRISPR/Cas9基因编辑系统在真核细胞中均具有靶向切割能力。根据条带强弱比较发现HqCas9的spacer最佳间隔序列识别长度是20～24bp，DspCas9的spacer最佳识别长度是21～24bp，DsuCas9的spacer最佳识别长度是22～24bp。

实施例7：dsODN的插入实验二

本实施例通过dsODN的插入实验，检测本发明实施例1的三种II型CRISPR/Cas9基因编辑系统在真核细胞中的在靶和脱靶情况以检测切割效果。

具体操作如下所示：

(a)构建位点质粒，实施例6的结果已表明三种Cas9的最适识别的spacer的长度，哺乳动物细胞中，以HEK293T细胞为例，选取内源性基因，寻找到合适的靶位点(见表2)，序列格式为5’-与靶点互补的间隔序列-scaffold-3’，通过Gibson方法克隆到PXZ载体上，构建PXZ-target质粒。

表2靶位点及其序列

(b)同时电转实施例6制备的PX330-蛋白真核表达质粒、PXZ-target质粒和1.2μLdsODN，72h后收细胞抽提DNA。

(c)在对应的基因靶点上游以及dsODN序列上设计引物(见表1)进行dsODN-PCR扩增，跑琼脂糖胶检测是否出现目的条带，用来判断是否有dsODN的插入，首先通过检测dsODN的插入情况验证本发明所述Cas9基因编辑系统在该选择的靶位点上是否发生靶向切割。

(d)挑选能检测到dsODN-PCR条带的DNA进行GUIDE-seq建库，上机进行二代测序，通过生物信息学分析检测三种Cas9基因编辑系统的在靶切割以及脱靶情况。

GUIDE-seq检测结果如图7所示，三个蛋白在对应的多个靶位点上的在靶Reads数较高，脱靶位点较少或检测不到脱靶，说明本发明所述HqCas9、DspCas9、DsuCas9基因编辑系统均在真核生物中具备较强的切割效率和较好的切割特异性。

综上，本发明首次鉴定出三种全新的II型CRISPR/Cas9基因编辑系统，三种新型编辑系统的Cas9蛋白分别命名为HqCas9、DspCas9和DsuCas9，通过以上实施例证明本发明的三种II型CRISPR/Cas9基因编辑系统可以识别特定的PAM序列(NGNGNC、NNNAA、NNNAA)，能够在crRNA的引导下在原核环境或真核细胞中行使基因编辑功能，极大的增加了可靶向的范围，克服了SpCas9的局限性。

本发明选择原核和真核DNA来验证三种II型CRISPR/Cas9基因编辑系统的编辑能力。Cas9蛋白识别靶向序列需要与crRNA间隔序列互补的核苷酸序列、可以识别的PAM序列。首先，通过原核耗竭实验证明本发明的Cas9蛋白在原核生物中具有切割能力，获知了Cas9蛋白在原核系统中识别的PAM序列。再通过原核干扰实验和真核细胞实验验证了PAM的正确性。本发明通过人为设计crRNA中的间隔序列，得到的II型CRISPR/Cas9基因编辑系统可以靶向基因组中几乎所有感兴趣的DNA序列，产生位点特异的平末端双链断裂(DSB)。通过非同源末端修复DSB，在切割位点产生小的随机插入/缺失(indels)使目的基因失活；或者通过高保真同源修复，可以使用同源修复模板在DSB位点进行精确的基因组修饰。通过GUIDE-seq结果显示两个蛋白的编辑在靶数较高，说明编辑效率高，脱靶数少说明编辑精确率高。HqCas9识别的PAM序列为NGNGNC，相对比较复杂的PAM可以更精确的识别靶位点，提高Cas9蛋白识别的精确性。DspCas9与DsuCas9所识别的PAM相近，第4位和第5位均为A，两个蛋白都可识别PAM为NNNAA的靶位点。通过对人类基因组上“AA”序列位点覆盖的长度频率进行分析，平均每隔5bp就有一个AA出现，这极大的增加了DspCas9与DsuCas9在人类基因组上的靶向范围。

本发明的三种II型CRISPR/Cas9基因编辑系统的发现进一步扩大了基因编辑工具的种类，为科学研究与疾病治疗提供了有力的研究工具，对推动将基因编辑应用于临床治疗具有重要的作用。

最后所应当说明的是，以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种II型CRISPR/Cas9基因编辑系统，其特征在于，包括氨基酸序列如SEQ ID NO.2所示的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列；

所述的tracrRNA序列如SEQ ID NO.15所示。

2.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统，其特征在于，编码所述Cas9蛋白的核苷酸序列如SEQ ID NO.11所示。

3.根据权利要求1所述的II型CRISPR/Cas9基因编辑系统，其特征在于，所述辅助蛋白的氨基酸序列如SEQ ID NO.5所示。

4.权利要求1～3任一项所述II型CRISPR/Cas9基因编辑系统在原核或真核生物基因编辑中的应用。

5.权利要求1～3任一项所述II型CRISPR/Cas9基因编辑系统在制备生物基因编辑制剂中的应用。