CN115704016A

CN115704016A - 一种利用dCas9-p450系统进行定点突变的方法

Info

Publication number: CN115704016A
Application number: CN202110927367.8A
Authority: CN
Inventors: 赵书红; 阮进学; 苏寅钰; 李新云; 赵广兴; 韩晓松; 熊友才; 庄荣志; 聂雄伟; 刘艳文; 王伟; 李长春; 谢胜松
Original assignee: Huazhong Agricultural University
Current assignee: Huazhong Agricultural University
Priority date: 2021-08-10
Filing date: 2021-08-10
Publication date: 2023-02-17

Abstract

本发明公开了一种利用dCas9‑p450系统进行定点突变的方法。本发明具体地公开了一种将细胞色素p450氧化酶(CYP)家族的关键酶CYP3A4蛋白与dCas9(dead Cas9)蛋白融合形成的融合蛋白及dCas9‑P450系统，所述dCas9‑P450系统包括重组载体dCas9‑p450、sgRNA表达载体、黄曲霉毒素B1(AFB1)，并公开了利用该系统将p450酶在特定基因组区域高表达，从而使得该区域的AFB1代谢成为AFBO，AFBO与靶位点DNA形成络合物，在靶位点定点引入随机突变的方法。利用该方法可以突变特定核苷酸序列，为基因功能研究提供可行的方法和强大、灵活的基因编辑工具。

Description

一种利用dCas9-p450系统进行定点突变的方法

技术领域

本发明属于动物基因编辑工程领域，涉及一种利用dCas9-p450系统进行定点突变的方法。

背景技术

黄曲霉毒素(aflatoxin，AFT)是一类化学结构类似的化合物，主要由黄曲霉和寄生曲霉产生，在天然污染的食品中以黄曲霉毒素B1(aflatoxin B1，AFB1)最为多见。实际上，AFB1本身并不具有毒性、致癌和突变等作用，其强致癌毒性来源于细胞色素p450氧化酶(Cytochrome P450，CYP)可以把AFB1转换成活性极强且极不稳定的AFB1-8，9-环氧化物(AFB1-8，9-epoxide，AFBO)。AFBO可以与细胞大分子物质，如DNA、RNA或蛋白质的多种亲核中心发生共价结合，形成络合物，引起DNA的错配修复机制，造成碱基损伤、DNA单链或双链断裂、DNA氧化修饰、姐妹染色体交换频率增加等一系列遗传性突变，从而产生致癌作用。CYP450家族成员介导AFB1代谢作用形成AFBO的最关键酶是细胞色素P450 3A4酶(简称CYP3A4)，CYP3A4是一种血红素蛋白，可以氧化外源有机小分子，如毒素或药物，以便使其排出体外。CYP3A4蛋白是低剂量AFB1暴露引起致癌过程中的关键因素。

CRISPR/Cas系统是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御系统，可用来对抗入侵的病毒及外源DNA。CRISPR/Cas9基因编辑系统由一个具有核酸内切酶活性的Cas9蛋白和一条单链向导RNA(single guide，sgRNA)组成。sgRNA与Cas9蛋白结合并引导Cas9蛋白靶向到靶位点进行切割，Cas9的两个切割结构域RuvC和HNH分别对DNA双链进行切割，导致双链断裂(double strand breaks，DSB)。机体自身会启动DNA修复机制，分别是非同源末端连接(non-homologous end joining，NHEJ)和同源重组(homology-directed repair，HR)修复机制。NHEJ是一种错配修复机制，DNA双链通过NHEJ修复会随机产生碱基插入或缺失(insertion and deletions，indels)。HR是一种精准的修复机制，在同源供体存在的情况下，供体中的外源基因片段通过同源重组方式整合到靶位点。

Cas9蛋白的RuvC和HNH结构域分别负责切割DNA双链的两条链，决定了Cas9的核酸酶切割活性，对这两个结构域进行点突变可以造成Cas9切割活性丧失。当RuvC(D10A突变)和HNH(H840A突变)结构域同时处于失活状态时(RuvC^-&HNH^-)，Cas9不具有核酸酶活性，称为dCas9(dead Cas9)。dCas9虽然没有切割DNA的能力，但仍然可以在sgRNA的引导下与特定的DNA序列结合。研究发现，如果在目标基因启动子区或增强子区设计sgRNA，则dCas9通过与其他蛋白融合后，能够发挥转录因子的作用，促进或抑制基因的表达。dCas9-VPR系统是指dCas9融合某些转录激活因子(单纯性疱疹病毒蛋白VP64、NF-κB的亚基p65和Epstein-Barr病毒R反式激活因子Rta5)，可靶向启动子和增强子区域，调节基因上调表达。当与sgRNA文库结合使用时，该系统还能够支持高通量的全基因组功能激活筛选。dCas9-KRAB系统是指dCas9与Kox1的转录阻遏物结构域KRAB(Krüppel-associated box)融合，依靠KRAB募集各种各样的组蛋白修饰因子，通过形成异染色质的方式可逆地抑制基因表达，可以高度特异地使内源性基因表达降低60-80％，并且dCas9-KRAB对细胞生长没有影响，使其成为无毒的基因沉默方法。由此，dCas9融合蛋白逐渐成为了研究生物学过程和途径的有力工具。单碱基编辑(Base Editor，BE)系统是指dCas9蛋白融合胞嘧啶脱氨酶或者腺嘌呤脱氨酶，从而在编辑窗口内实现C>T或者A>G的突变，BE已经被广泛应用于生命科学研究领域。此外，将组蛋白乙酰转移酶p300的催化核心与dCas9融合组成的dCas9-p300系统能够直接改变靶标基因附近的染色质状态。当靶向编码区或启动子区时，这个系统可成功诱导基因高表达。

发明内容

本发明的目的是提供一种DNA定点突变系统，该系统可在DNA靶位点引入随机突变。所要解决的技术问题不限于如所描述的技术主题，本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。

为实现上述目的，本发明首先提供了融合蛋白，名称为PdCas9-p450，所述融合蛋白PdCas9-p450包括dCas9蛋白和CYP3A4蛋白。

所述CYP3A4蛋白为细胞色素P450 3A4酶(简称CYP3A4)，CYP3A4是一种血红素蛋白，可以氧化外源有机小分子，如毒素或药物，以便使其排出体外。

进一步地，所述dCas9蛋白可为如下A1)或A2)：A1)氨基酸序列是SEQ ID No.1的蛋白质；A2)将SEQ ID No.1所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

和/或，所述CYP3A4蛋白可为如下B1)或B2：B1)氨基酸序列是SEQ ID No.2的蛋白质；B2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质。

进一步地，所述CYP3A4蛋白可与所述dCas9蛋白的C末端连接或所述CYP3A4蛋白与所述dCas9蛋白的C末端可通过接头(linker)连接。所述接头用于连接所述CYP3A4蛋白和所述dCas9蛋白。

在本发明的一个实施方案中，所述接头的氨基酸序列如SEQ ID No.3的第1369-1401位所示。进一步地，所述融合蛋白PdCas9-p450的氨基酸序列可如SEQ ID No.3所示。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化或点突变的方法，对本发明的编码融合蛋白PdCas9-p450的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明分离得到的融合蛋白PdCas9-p450的核苷酸序列75％或者75％以上同一性的核苷酸，只要编码融合蛋白PdCas9-p450且具有融合蛋白PdCas9-p450的功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。本文中，同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residuegap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。本文中，所述80％以上的同一性可为至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

本发明还提供了生物材料，所述生物材料可为下述任一种：C1)编码所述融合蛋白PdCas9-p450的核酸分子；C2)含有C1)所述核酸分子的表达盒；C3)含有C1)所述核酸分子的重组载体、或含有C2)所述表达盒的重组载体；C4)含有C1)所述核酸分子的重组微生物、或含有C2)所述表达盒的重组微生物、或含有C3)所述重组载体的重组微生物；C5)含有C1)所述核酸分子的重组细胞、或含有C2)所述表达盒的重组细胞、或含有C3)所述重组载体的重组细胞；C6)编码所述dCas9蛋白的核酸分子；C7)编码所述CYP3A4蛋白的核酸分子。

上述生物材料中，所述核酸分子可为下述任一种：

D1)编码序列是SEQ ID No.4的第1009-5112位所示的DNA分子；D2)编码序列是SEQID No.4的第5212-6720位所示的DNA分子；D3)编码序列是SEQ ID No.4的第1009-6720位所示的DNA分子；D4)与D1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述dCas9蛋白的DNA分子；D5)与D2)限定的核苷酸序列具有75％或75％以上同一性，且编码所述CYP3A4蛋白的DNA分子；D6)与D3)限定的核苷酸序列具有75％或75％以上同一性，且编码所述融合蛋白PdCas9-p450的DNA分子。

其中，SEQ ID No.4的第1009-6720位所示的DNA分子编码所述融合蛋白PdCas9-p450；SEQ ID No.4的第5212-6720位所示的DNA分子编码所述优化后的CYP3A4蛋白；SEQ IDNo.4的第1009-5112位所示的DNA分子编码所述dCas9蛋白；SEQ ID No.4的第5113-5211位所示的DNA分子编码所述接头(linker)。

上述生物材料中，所述重组载体还可包括以下可操作性相连的元件：CMV增强子、CMV启动子、bGH poly(A)终止信号但不限于此。进一步地，所述重组载体还可包括以下可操作性相连的元件：氨苄抗性基因、Neo抗性基因但不限于此。

术语“可操作性相连”指调控元件(例如但不限于，启动子、转录终止子等)与核酸(例如，编码序列或开放读码框)连接，使得核苷酸的转录被所述转录调控元件控制和调节。用于将调控元件可操作性地连接于核酸分子的技术为本领域已知的。

所述CMV增强子的核苷酸序列如SEQ ID No.4的第235-614位所示；所述CMV启动子的核苷酸序列如SEQ ID No.4的第615-818位所示；bGH poly(A)终止信号的核苷酸序列如SEQ ID No.4的第6801-7025位所示。

上述生物材料中，所述重组载体的核苷酸序列可为SEQ ID No.4。

所述重组载体的构建方法包括将所述CYP3A4蛋白的编码序列(CDS)进行密码子优化后，连接到所述dCas9蛋白的C末端。

所述重组载体为融合蛋白PdCas9-p450表达载体。

上述生物材料中，所述载体可为质粒、黏粒、噬菌体或病毒载体。

上述生物材料中，所述微生物可为酵母、细菌、藻或真菌。其中，细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽胞杆菌属(Bacillus)等。上述生物材料中，所述细胞可为动物细胞，具体可为HEK293T细胞。所述重组载体具体可为重组载体dCas9-p450，其核苷酸序列如SEQ ID No.4所示，图谱如图2所示。

本发明还提供了一种基因编辑系统(dCas9-p450系统)(组合物)，所述基因编辑系统包括所述重组载体dCas9-p450、sgRNA表达载体和黄曲霉毒素B1(AFB1)。

本发明还提供了利用所述基因编辑系统(dCas9-p450系统)进行定点突变的方法，所述方法包括以下步骤：用表达所述融合蛋白PdCas9-p450的重组载体和表达靶位点特异的sgRNA表达载体转染宿主细胞，用黄曲霉毒素B1(AFB1)诱导所述靶位点的核苷酸产生突变；所述sgRNA的靶标序列是5′-N_19-20PAM-3′，所述N_19-20为19-20个N，所述PAM为NGG；所述N为A、G、C或T。所述突变可为随机突变，如G突变为A或C或T,A突变为G或C或T。

在本发明的一个实施方案中，所述利用所述基因编辑系统(dCas9-p450系统)进行定点突变的方法包括以下步骤：

(1)构建所述重组载体dCas9-p450；(2)根据DNA的靶位点，构建sgRNA表达载体；

(3)将步骤(1)构建的重组载体dCas9-p450和步骤(2)构建的sgRNA表达载体共同转染宿主细胞；(4)用黄曲霉毒素B1(AFB1)诱导靶位点的核苷酸产生随机突变。

本发明还提供了所述融合蛋白PdCas9-p450，和/或，所述生物材料，和/或，所述基因编辑系统在基因编辑中的应用和/或在靶位点对DNA进行突变中的应用。

进一步地，所述突变可为随机突变。

在本发明的一个实施方案中，所述利用所述基因编辑系统进行定点突变的方法具体可包括以下步骤：(1)构建dCas9-p450重组表达载体(简称重组载体dCas9-p450或dCas9-p450)：将合成得到密码子优化的CYP3A4蛋白编码DNA通过接头(linker)连接dCas9(D10A&H840A)蛋白编码DNA，再连接CMV增强子和CMV启动子、Flag标签蛋白、SV40NLS核定位信号以及bGH poly(A)终止信号，构建得到dCas9-p450重组表达载体；(2)构建sgRNA表达载体：根据靶位点设计sgRNA寡合苷酸引物，连接在BsaI酶切的pGL3-U6-EGFP载体上，构建pGL3-U6-sgRNA-EGFP载体；(3)将步骤(1)构建的所述dCas9-p450重组表达载体和步骤(2)构建的sgRNA表达载体共同转染HEK293T细胞；(4)转染4-6h后，用含有4μg/mL的黄曲霉毒素B1(AFB1)的新鲜培养基换液，继续培养细胞至72h，检测靶位点的核苷酸突变情况。

本发明公开了一种体内DNA定点突变系统，具体地，将dCas9蛋白与p450蛋白进行融合形成融合蛋白PdCas9-p450，sgRNA引导融合蛋白PdCas9-p450结合到靶位点(目标区域)，在靶位点表达细胞色素p450氧化酶，在加入黄曲霉毒素B1(AFB1)后，p450氧化酶会将AFB1代谢成AFB1-8,9-环氧化物(AFB1-8,9-epoxide，AFBO)，AFBO与DNA碱基形成络合物，引发机体的修复机制，从而实现在靶位点引入随机突变，如图1所示。

本发明通过合成得到密码子优化的CYP3A4蛋白编码DNA，连接CMV增强子、CMV启动子，Flag标签蛋白，NLS核定位信号，dCas9(D10A&H840A)蛋白编码DNA和CYP3A4蛋白编码DNA，构建到骨架载体pCMV-BE3上，命名为dCas9-p450，重组载体dCas9-p450图谱如图2所示，重组载体dCas9-p450序列送公司合成后，转化至大肠杆菌，扩繁提取质粒，-20℃保存备用。

在本发明的一个实施方案中，根据所需突变位点设计3对sgRNA寡合苷酸引物，并在引物5’端加上BsaI酶切黏性末端，退火后连接到BsaI酶切的pGL3-U6-EGFP载体上，转化至大肠杆菌，挑取单克隆菌落，扩大培养后测序，将构建成功的载体命名为pGL3-U6-sgRNA-EGFP。

进一步地，采用脂质体转染方法(jetPRIME)将重组载体dCas9-p450和sgRNA表达载体共同转染HEK293T细胞，转染4-6h后更换含有4μg/mL AFB1的新鲜培养基，同时培养仅转染质粒不加AFB1培养基对照组、仅加AFB1培养基不转染质粒对照组以及不做处理的野生型对照组，在转染72h后同时收集所有细胞提取基因组DNA。

进一步地，设计相应的引物扩增细胞基因组的靶位点区域，纯化后进行高通量测序(deep sequence)，对靶区域进行分析得到突变类型和突变频率。

本发明的有益效果在于：本发明提供了一种借助CRISPR/cas9系统将p450酶在特定基因组区域高表达，从而使得该区域的AFB1代谢成为AFBO，AFBO与靶位点DNA形成络合物，在靶位点定点引入随机突变的方法。利用该方法可以突变特定核苷酸序列，为基因功能研究提供可行的方法和更强大、灵活的基因编辑工具。

附图说明

图1为本发明dCas9-p450定点突变的原理示意图。

图2为本发明序列合成的dCas9-p450载体元件图谱。

图3为本发明构建sgRNA表达载体pGL3-U6-sgRNA-EGFP的质粒图谱。

图4为本发明实施例中3个基因实验组靶目的区域高通量测序(deep sequence)结果图。

图5为本发明实施例中3个基因对照组靶目的区域高通量测序(deep sequence)结果图。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例1构建重组载体dCas9-p450

通过合成得到密码子优化的CYP3A4序列，连接CMV增强子、CMV启动子，Flag标签蛋白，NLS核定位信号，dCas9(D10A&H840A)蛋白序列和CYP3A4的CDS序列，构建到骨架载体pCMV-BE3(购自Addgene公司)上，命名为dCas9-p450，即为重组载体dCas9-p450，所述重组载体dCas9-p450为融合蛋白PdCas9-p450表达载体，重组载体dCas9-p450图谱如图2所示，重组载体dCas9-p450核苷酸序列如SEQ ID NO.4所示，其序列送苏州金唯智生物科技有限公司合成后，转化至大肠杆菌，扩繁提取质粒，-20℃保存备用。其中：SEQ ID No.4的第1009-5112位所示的DNA分子编码所述dCas9蛋白；SEQ ID No.4的第5212-6720位所示的DNA分子(对所述CYP3A4蛋白的编码DNA进行密码子优化后的DNA分子)编码所述CYP3A4蛋白；SEQ ID No.4的第5113-5211位所示的DNA分子编码所述接头(linker)；SEQ ID No.4的第1009-6720位所示的DNA分子编码所述融合蛋白PdCas9-p450；所述CMV增强子的核苷酸序列如SEQ ID No.4的第235-614位所示；所述CMV启动子的核苷酸序列如SEQ ID No.4的第615-818位所示；所述Flag标签蛋白的核苷酸序列如SEQ ID No.4的第907-972位所示；所述NLS核定位信号的核苷酸序列如SEQ ID No.4的第979-999和第6721-6741位所示。

实施例2构建sgRNA表达载体

在人基因组中随机选取GRIN2B、DYRK1A和PDCD1三个位点设计sgRNA，分别命名为GRIN2B-sgRNA、DYRK1A-sgRNA和PDCD1-sgRNA。各条sgRNA向导序列上下游序列分别在5’末端添加相应的BsaI酶切位点黏性末端碱基后送至公司合成。需合成的寡核苷酸序列如表1所示，划线部分为黏性末端碱基。将合成的sgRNA向导序列的寡核苷酸干粉离心后用ddH₂O溶解稀释至终浓度为10μM，然后把对应的上下游sgRNA引物各取5μL于PCR管中振荡混匀，简短离心，退火杂交，形成双链oligo，退火程序为95℃，10min；65℃，30min；

表1 3个基因sgRNA向导序列引物序列

利用Ligation Mix将退火后的产物，于16℃金属浴反应1h，连接到pGL3-U6-EGFP载体(Addgene#107721)BsaI酶切回收后的骨架中，得到3个位点的pGL3-U6-sgRNA-EGFP表达载体(图3)，分别为GRIN2B-sgRNA表达载体、DYRK1A-sgRNA表达载体和PDCD1-sgRNA表达载体。转化至大肠杆菌感受态细胞后，挑取单克隆，Sanger测序验证sgRNA是否成功连接。sgRNA表达载体成功连接后，利用菌液扩大培养，用去内毒素质粒提取试剂盒提取质粒后用于转染细胞。

实施例3基因编辑系统(dCas9-p450系统)突变效率验证

所述基因编辑系统(dCas9-p450系统)，包括实施例1的重组载体dCas9-p450、实施例2的sgRNA表达载体(pGL3-U6-sgRNA-EGFP表达载体)和黄曲霉毒素B1(AFB1)。利用dCas9-p450系统在HEK293T细胞上进行编辑，验证突变效率。

设置3个基因实验组：转染前，将HEK293T细胞铺板于12孔细胞培养皿中，待细胞汇合度达到80-90％时进行转染。按照1:1的比例，将实施例2构建的3个位点的sgRNA表达载体和实施例1构建的重组载体dCas9-p450各500ng采用脂质体转染方法(jetPRIME)共转染HEK293T细胞。转染4-6小时后，更换培养液，用含有4μg/mL AFB1的新鲜培养基培养(10％FBS+90％DMEM)，转染24h后利用荧光显微镜观察细胞发光情况。

同时设置如下三组细胞的对照处理组：仅有质粒转染未加AFB1培养基组(与3个基因实验组相比，区别仅在于质粒转染4-6小时后，更换为不含4μg/mL AFB1的新鲜培养基培养)、仅加入含有4μg/mL AFB1的培养基培养未转染质粒组(与3个基因实验组相比，区别仅在于未进行质粒转染)、未经任何处理的野生型组(与3个基因实验组相比，区别仅在于未进行质粒转染，用不含4μg/mL AFB1的新鲜培养基培养)，继续培养48h后收集所有细胞，分别提取细胞基因组DNA，设计相应引物扩增带有靶位点的目的片段(表4)。

PCR扩增程序和扩增体系如下：

表2 PCR扩增体系

表3 PCR扩增程序

表4扩增3个基因靶序列的引物序列表

基因名称	上游引物序列(5’-3’)	下游引物序列(5’-3’)
			GRIN2B	GGTTTGGTGCTCAATGAAAGG	CCACCTCGTCGGAAGTGC
DYRK1A	ACCTCACTTATCTTCTTGTAGGAGG	ACTGCCATTCCAATAGTCATTTCTG
			PDCD1	ACAGTTTCCCTTCCGCTCAC	GGACTGAGGGTGGAAGGTCC

利用胶回收试剂盒对所述PCR产物进行胶回收后进行高通量测序(deepsequence)分析，将实验组测序结果和对照组测序结果进行比较分析得出突变类型和突变频率(图4、图5)。

结果表明，仅加入含有4μg/mL AFB1的培养基培养未转染质粒组和未经任何处理的野生型组的各个基因的靶点没有任何突变，仅转染GRIN2B-sgRNA表达载体的实验组中只有一种突变类型，靶标序列5′到3′方向的第9位的G被替换成A，在总共910549个reads中，有1029个reads发生了这种突变，突变频率为0.1％。

仅转染DYRK1A-sgRNA表达载体的实验组只有一种突变类型，靶标序列5′到3′方向的第19位的G被替换成A，在总共994452个reads中，有1081个reads发生了这种突变，突变频率为0.1％。

仅转染PDCD1-sgRNA表达载体的实验组只有一种突变类型，靶标序列5′到3′方向的第4位的C被替换成T，在总共994452个reads中，有1081个reads发生了这种突变，突变频率为0.1％。

综上所述，本发明所构建的基因编辑系统(dCas9-p450系统)可以在特定基因组区域实现随机点突变的基因编辑的功能。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

SEQUENCE LISTING

<110> 华中农业大学

<120> 一种利用dCas9-p450系统进行定点突变的方法

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 1368

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 1

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 2

<211> 503

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 2

Met Ala Leu Ile Pro Asp Leu Ala Met Glu Thr Trp Leu Leu Leu Ala

1 5 10 15

Val Ser Leu Val Leu Leu Tyr Leu Tyr Gly Thr His Ser His Gly Leu

20 25 30

Phe Lys Lys Leu Gly Ile Pro Gly Pro Thr Pro Leu Pro Phe Leu Gly

35 40 45

Asn Ile Leu Ser Tyr His Lys Gly Phe Cys Met Phe Asp Met Glu Cys

50 55 60

His Lys Lys Tyr Gly Lys Val Trp Gly Phe Tyr Asp Gly Gln Gln Pro

65 70 75 80

Val Leu Ala Ile Thr Asp Pro Asp Met Ile Lys Thr Val Leu Val Lys

85 90 95

Glu Cys Tyr Ser Val Phe Thr Asn Arg Arg Pro Phe Gly Pro Val Gly

100 105 110

Phe Met Lys Ser Ala Ile Ser Ile Ala Glu Asp Glu Glu Trp Lys Arg

115 120 125

Leu Arg Ser Leu Leu Ser Pro Thr Phe Thr Ser Gly Lys Leu Lys Glu

130 135 140

Met Val Pro Ile Ile Ala Gln Tyr Gly Asp Val Leu Val Arg Asn Leu

145 150 155 160

Arg Arg Glu Ala Glu Thr Gly Lys Pro Val Thr Leu Lys Asp Val Phe

165 170 175

Gly Ala Tyr Ser Met Asp Val Ile Thr Ser Thr Ser Phe Gly Val Asn

180 185 190

Ile Asp Ser Leu Asn Asn Pro Gln Asp Pro Phe Val Glu Asn Thr Lys

195 200 205

Lys Leu Leu Arg Phe Asp Phe Leu Asp Pro Phe Phe Leu Ser Ile Thr

210 215 220

Val Phe Pro Phe Leu Ile Pro Ile Leu Glu Val Leu Asn Ile Cys Val

225 230 235 240

Phe Pro Arg Glu Val Thr Asn Phe Leu Arg Lys Ser Val Lys Arg Met

245 250 255

Lys Glu Ser Arg Leu Glu Asp Thr Gln Lys His Arg Val Asp Phe Leu

260 265 270

Gln Leu Met Ile Asp Ser Gln Asn Ser Lys Glu Thr Glu Ser His Lys

275 280 285

Ala Leu Ser Asp Leu Glu Leu Val Ala Gln Ser Ile Ile Phe Ile Phe

290 295 300

Ala Gly Tyr Glu Thr Thr Ser Ser Val Leu Ser Phe Ile Met Tyr Glu

305 310 315 320

Leu Ala Thr His Pro Asp Val Gln Gln Lys Leu Gln Glu Glu Ile Asp

325 330 335

Ala Val Leu Pro Asn Lys Ala Pro Pro Thr Tyr Asp Thr Val Leu Gln

340 345 350

Met Glu Tyr Leu Asp Met Val Val Asn Glu Thr Leu Arg Leu Phe Pro

355 360 365

Ile Ala Met Arg Leu Glu Arg Val Cys Lys Lys Asp Val Glu Ile Asn

370 375 380

Gly Met Phe Ile Pro Lys Gly Val Val Val Met Ile Pro Ser Tyr Ala

385 390 395 400

Leu His Arg Asp Pro Lys Tyr Trp Thr Glu Pro Glu Lys Phe Leu Pro

405 410 415

Glu Arg Phe Ser Lys Lys Asn Lys Asp Asn Ile Asp Pro Tyr Ile Tyr

420 425 430

Thr Pro Phe Gly Ser Gly Pro Arg Asn Cys Ile Gly Met Arg Phe Ala

435 440 445

Leu Met Asn Met Lys Leu Ala Leu Ile Arg Val Leu Gln Asn Phe Ser

450 455 460

Phe Lys Pro Cys Lys Glu Thr Gln Ile Pro Leu Lys Leu Ser Leu Gly

465 470 475 480

Gly Leu Leu Gln Pro Glu Lys Pro Val Val Leu Lys Val Glu Ser Arg

485 490 495

Asp Gly Thr Val Ser Gly Ala

500

<210> 3

<211> 1904

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 3

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly

1370 1375 1380

Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly

1385 1390 1395

Gly Ser Ser Met Ala Leu Ile Pro Asp Leu Ala Met Glu Thr Trp

1400 1405 1410

Leu Leu Leu Ala Val Ser Leu Val Leu Leu Tyr Leu Tyr Gly Thr

1415 1420 1425

His Ser His Gly Leu Phe Lys Lys Leu Gly Ile Pro Gly Pro Thr

1430 1435 1440

Pro Leu Pro Phe Leu Gly Asn Ile Leu Ser Tyr His Lys Gly Phe

1445 1450 1455

Cys Met Phe Asp Met Glu Cys His Lys Lys Tyr Gly Lys Val Trp

1460 1465 1470

Gly Phe Tyr Asp Gly Gln Gln Pro Val Leu Ala Ile Thr Asp Pro

1475 1480 1485

Asp Met Ile Lys Thr Val Leu Val Lys Glu Cys Tyr Ser Val Phe

1490 1495 1500

Thr Asn Arg Arg Pro Phe Gly Pro Val Gly Phe Met Lys Ser Ala

1505 1510 1515

Ile Ser Ile Ala Glu Asp Glu Glu Trp Lys Arg Leu Arg Ser Leu

1520 1525 1530

Leu Ser Pro Thr Phe Thr Ser Gly Lys Leu Lys Glu Met Val Pro

1535 1540 1545

Ile Ile Ala Gln Tyr Gly Asp Val Leu Val Arg Asn Leu Arg Arg

1550 1555 1560

Glu Ala Glu Thr Gly Lys Pro Val Thr Leu Lys Asp Val Phe Gly

1565 1570 1575

Ala Tyr Ser Met Asp Val Ile Thr Ser Thr Ser Phe Gly Val Asn

1580 1585 1590

Ile Asp Ser Leu Asn Asn Pro Gln Asp Pro Phe Val Glu Asn Thr

1595 1600 1605

Lys Lys Leu Leu Arg Phe Asp Phe Leu Asp Pro Phe Phe Leu Ser

1610 1615 1620

Ile Thr Val Phe Pro Phe Leu Ile Pro Ile Leu Glu Val Leu Asn

1625 1630 1635

Ile Cys Val Phe Pro Arg Glu Val Thr Asn Phe Leu Arg Lys Ser

1640 1645 1650

Val Lys Arg Met Lys Glu Ser Arg Leu Glu Asp Thr Gln Lys His

1655 1660 1665

Arg Val Asp Phe Leu Gln Leu Met Ile Asp Ser Gln Asn Ser Lys

1670 1675 1680

Glu Thr Glu Ser His Lys Ala Leu Ser Asp Leu Glu Leu Val Ala

1685 1690 1695

Gln Ser Ile Ile Phe Ile Phe Ala Gly Tyr Glu Thr Thr Ser Ser

1700 1705 1710

Val Leu Ser Phe Ile Met Tyr Glu Leu Ala Thr His Pro Asp Val

1715 1720 1725

Gln Gln Lys Leu Gln Glu Glu Ile Asp Ala Val Leu Pro Asn Lys

1730 1735 1740

Ala Pro Pro Thr Tyr Asp Thr Val Leu Gln Met Glu Tyr Leu Asp

1745 1750 1755

Met Val Val Asn Glu Thr Leu Arg Leu Phe Pro Ile Ala Met Arg

1760 1765 1770

Leu Glu Arg Val Cys Lys Lys Asp Val Glu Ile Asn Gly Met Phe

1775 1780 1785

Ile Pro Lys Gly Val Val Val Met Ile Pro Ser Tyr Ala Leu His

1790 1795 1800

Arg Asp Pro Lys Tyr Trp Thr Glu Pro Glu Lys Phe Leu Pro Glu

1805 1810 1815

Arg Phe Ser Lys Lys Asn Lys Asp Asn Ile Asp Pro Tyr Ile Tyr

1820 1825 1830

Thr Pro Phe Gly Ser Gly Pro Arg Asn Cys Ile Gly Met Arg Phe

1835 1840 1845

Ala Leu Met Asn Met Lys Leu Ala Leu Ile Arg Val Leu Gln Asn

1850 1855 1860

Phe Ser Phe Lys Pro Cys Lys Glu Thr Gln Ile Pro Leu Lys Leu

1865 1870 1875

Ser Leu Gly Gly Leu Leu Gln Pro Glu Lys Pro Val Val Leu Lys

1880 1885 1890

Val Glu Ser Arg Asp Gly Thr Val Ser Gly Ala

1895 1900

<210> 4

<211> 11201

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 4

gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60

ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120

cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180

ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240

gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780

gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840

ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900

gccatggact acaaagacca tgacggtgat tataaagatc atgacatcga ttacaaggat 960

gacgatgaca agatggcccc caagaagaag aggaaggtgg gccgcggaat ggataagaaa 1020

tactcaatag gcttagctat cggcacaaat agcgtcggat gggcggtgat cactgatgaa 1080

tataaggttc cgtctaaaaa gttcaaggtt ctgggaaata cagaccgcca cagtatcaaa 1140

aaaaatctta taggggctct tttatttgac agtggagaga cagcggaagc gactcgtctc 1200

aaacggacag ctcgtagaag gtatacacgt cggaagaatc gtatttgtta tctacaggag 1260

attttttcaa atgagatggc gaaagtagat gatagtttct ttcatcgact tgaagagtct 1320

tttttggtgg aagaagacaa gaagcatgaa cgtcatccta tttttggaaa tatagtagat 1380

gaagttgctt atcatgagaa atatccaact atctatcatc tgcgaaaaaa attggtagat 1440

tctactgata aagcggattt gcgcttaatc tatttggcct tagcgcatat gattaagttt 1500

cgtggtcatt ttttgattga gggagattta aatcctgata atagtgatgt ggacaaacta 1560

tttatccagt tggtacaaac ctacaatcaa ttatttgaag aaaaccctat taacgcaagt 1620

ggagtagatg ctaaagcgat tctttctgca cgattgagta aatcaagacg attagaaaat 1680

ctcattgctc agctccccgg tgagaagaaa aatggcttat ttgggaatct cattgctttg 1740

tcattgggtt tgacccctaa ttttaaatca aattttgatt tggcagaaga tgctaaatta 1800

cagctttcaa aagatactta cgatgatgat ttagataatt tattggcgca aattggagat 1860

caatatgctg atttgttttt ggcagctaag aatttatcag atgctatttt actttcagat 1920

atcctaagag taaatactga aataactaag gctcccctat cagcttcaat gattaaacgc 1980

tacgatgaac atcatcaaga cttgactctt ttaaaagctt tagttcgaca acaacttcca 2040

gaaaagtata aagaaatctt ttttgatcaa tcaaaaaacg gatatgcagg ttatattgat 2100

gggggagcta gccaagaaga attttataaa tttatcaaac caattttaga aaaaatggat 2160

ggtactgagg aattattggt gaaactaaat cgtgaagatt tgctgcgcaa gcaacggacc 2220

tttgacaacg gctctattcc ccatcaaatt cacttgggtg agctgcatgc tattttgaga 2280

agacaagaag acttttatcc atttttaaaa gacaatcgtg agaagattga aaaaatcttg 2340

acttttcgaa ttccttatta tgttggtcca ttggcgcgtg gcaatagtcg ttttgcatgg 2400

atgactcgga agtctgaaga aacaattacc ccatggaatt ttgaagaagt tgtcgataaa 2460

ggtgcttcag ctcaatcatt tattgaacgc atgacaaact ttgataaaaa tcttccaaat 2520

gaaaaagtac taccaaaaca tagtttgctt tatgagtatt ttacggttta taacgaattg 2580

acaaaggtca aatatgttac tgaaggaatg cgaaaaccag catttctttc aggtgaacag 2640

aagaaagcca ttgttgattt actcttcaaa acaaatcgaa aagtaaccgt taagcaatta 2700

aaagaagatt atttcaaaaa aatagaatgt tttgatagtg ttgaaatttc aggagttgaa 2760

gatagattta atgcttcatt aggtacctac catgatttgc taaaaattat taaagataaa 2820

gattttttgg ataatgaaga aaatgaagat atcttagagg atattgtttt aacattgacc 2880

ttatttgaag atagggagat gattgaggaa agacttaaaa catatgctca cctctttgat 2940

gataaggtga tgaaacagct taaacgtcgc cgttatactg gttggggacg tttgtctcga 3000

aaattgatta atggtattag ggataagcaa tctggcaaaa caatattaga ttttttgaaa 3060

tcagatggtt ttgccaatcg caattttatg cagctgatcc atgatgatag tttgacattt 3120

aaagaagaca ttcaaaaagc acaagtgtct ggacaaggcg atagtttaca tgaacatatt 3180

gcaaatttag ctggtagccc tgctattaaa aaaggtattt tacagactgt aaaagttgtt 3240

gatgaattgg tcaaagtaat ggggcggcat aagccagaaa atatcgttat tgaaatggca 3300

cgtgaaaatc agacaactca aaagggccag aaaaattcgc gagagcgtat gaaacgaatc 3360

gaagaaggta tcaaagaatt aggaagtcag attcttaaag agcatcctgt tgaaaatact 3420

caattgcaaa atgaaaagct ctatctctat tatctccaaa atggaagaga catgtatgtg 3480

gaccaagaat tagatattaa tcgtttaagt gattatgatg tcgatgccat tgttccacaa 3540

agtttcctta aagacgattc aatagacaat aaggtcttaa cgcgttctga taaaaatcgt 3600

ggtaaatcgg ataacgttcc aagtgaagaa gtagtcaaaa agatgaaaaa ctattggaga 3660

caacttctaa acgccaagtt aatcactcaa cgtaagtttg ataatttaac gaaagctgaa 3720

cgtggaggtt tgagtgaact tgataaagct ggttttatca aacgccaatt ggttgaaact 3780

cgccaaatca ctaagcatgt ggcacaaatt ttggatagtc gcatgaatac taaatacgat 3840

gaaaatgata aacttattcg agaggttaaa gtgattacct taaaatctaa attagtttct 3900

gacttccgaa aagatttcca attctataaa gtacgtgaga ttaacaatta ccatcatgcc 3960

catgatgcgt atctaaatgc cgtcgttgga actgctttga ttaagaaata tccaaaactt 4020

gaatcggagt ttgtctatgg tgattataaa gtttatgatg ttcgtaaaat gattgctaag 4080

tctgagcaag aaataggcaa agcaaccgca aaatatttct tttactctaa tatcatgaac 4140

ttcttcaaaa cagaaattac acttgcaaat ggagagattc gcaaacgccc tctaatcgaa 4200

actaatgggg aaactggaga aattgtctgg gataaagggc gagattttgc cacagtgcgc 4260

aaagtattgt ccatgcccca agtcaatatt gtcaagaaaa cagaagtaca gacaggcgga 4320

ttctccaagg agtcaatttt accaaaaaga aattcggaca agcttattgc tcgtaaaaaa 4380

gactgggatc caaaaaaata tggtggtttt gatagtccaa cggtagctta ttcagtccta 4440

gtggttgcta aggtggaaaa agggaaatcg aagaagttaa aatccgttaa agagttacta 4500

gggatcacaa ttatggaaag aagttccttt gaaaaaaatc cgattgactt tttagaagct 4560

aaaggatata aggaagttaa aaaagactta atcattaaac tacctaaata tagtcttttt 4620

gagttagaaa acggtcgtaa acggatgctg gctagtgccg gagaattaca aaaaggaaat 4680

gagctggctc tgccaagcaa atatgtgaat tttttatatt tagctagtca ttatgaaaag 4740

ttgaagggta gtccagaaga taacgaacaa aaacaattgt ttgtggagca gcataagcat 4800

tatttagatg agattattga gcaaatcagt gaattttcta agcgtgttat tttagcagat 4860

gccaatttag ataaagttct tagtgcatat aacaaacata gagacaaacc aatacgtgaa 4920

caagcagaaa atattattca tttatttacg ttgacgaatc ttggagctcc cgctgctttt 4980

aaatattttg atacaacaat tgatcgtaaa cgatatacgt ctacaaaaga agttttagat 5040

gccactctta tccatcaatc catcactggt ctttatgaaa cacgcattga tttgagtcag 5100

ctaggaggtg actctggagg atctagcgga ggatcctctg gcagcgagac accaggaaca 5160

agcgagtcag caacaccaga gagcagtggc ggcagcagcg gcggcagcag catggctctc 5220

atcccagact tggccatgga aacctggctt ctcctggctg tcagcctggt gctcctctat 5280

ctatatggaa cccattcaca tggacttttt aagaagcttg gaattccagg gcccacacct 5340

ctgccttttt tgggaaatat tttgtcctac cataagggct tttgtatgtt tgacatggaa 5400

tgtcataaaa agtatggaaa agtgtggggc ttttatgatg gtcaacagcc tgtgctggct 5460

atcacagatc ctgacatgat caaaacagtg ctagtgaaag aatgttattc tgtcttcaca 5520

aaccggaggc cttttggtcc agtgggattt atgaaaagtg ccatctctat agctgaggat 5580

gaagaatgga agagattacg atcattgctg tctccaacct tcaccagtgg aaaactcaag 5640

gagatggtcc ctatcattgc ccagtatgga gatgtgttgg tgagaaatct gaggcgggaa 5700

gcagagacag gcaagcctgt caccttgaaa gacgtctttg gggcctacag catggatgtg 5760

atcactagca catcatttgg agtgaacatc gactctctca acaatccaca agaccccttt 5820

gtggaaaaca ccaagaagct tttaagattt gattttttgg atccattctt tctctcaata 5880

acagtctttc cattcctcat cccaattctt gaagtattaa atatctgtgt gtttccaaga 5940

gaagttacaa attttttaag aaaatctgta aaaaggatga aagaaagtcg cctcgaagat 6000

acacaaaagc accgagtgga tttccttcag ctgatgattg actctcagaa ttcaaaagaa 6060

actgagtccc acaaagctct gtccgatctg gagctcgtgg cccaatcaat tatctttatt 6120

tttgctggct atgaaaccac gagcagtgtt ctctccttca ttatgtatga actggccact 6180

caccctgatg tccagcagaa actgcaggag gaaattgatg cagttttacc caataaggca 6240

ccacccacct atgatactgt gctacagatg gagtatcttg acatggtggt gaatgaaacg 6300

ctcagattat tcccaattgc tatgagactt gagagggtct gcaaaaaaga tgttgagatc 6360

aatgggatgt tcattcccaa aggggtggtg gtgatgattc caagctatgc tcttcaccgt 6420

gacccaaagt actggacaga gcctgagaag ttcctccctg aaagattcag caagaagaac 6480

aaggacaaca tagatcctta catatacaca ccctttggaa gtggacccag aaactgcatt 6540

ggcatgaggt ttgctctcat gaacatgaaa cttgctctaa tcagagtcct tcagaacttc 6600

tccttcaaac cttgtaaaga aacacagatc cccctgaaat taagcttagg aggacttctt 6660

caaccagaaa aacccgttgt tctaaaggtt gagtcaaggg atggcaccgt aagtggagcc 6720

cccaagaaga agaggaaagt ctgaatcggt aggaattcgc ggccgtctag acttaagttt 6780

aaaccgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 6840

ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 6900

ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 6960

ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 7020

tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc acgcgccctg 7080

tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 7140

cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 7200

ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 7260

gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 7320

atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 7380

ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 7440

gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaatta 7500

attctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc agcaggcaga 7560

agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc 7620

ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat agtcccgccc 7680

ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc 7740

tgactaattt tttttattta tgcagaggcc gaggccgcct ctgcctctga gctattccag 7800

aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctccc gggagcttgt 7860

atatccattt tcggatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa 7920

gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg 7980

gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc 8040

ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca 8100

gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc 8160

actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca 8220

tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat 8280

acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca 8340

cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg 8400

ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc 8460

gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct 8520

ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct 8580

acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac 8640

ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc 8700

tgagcgggac tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 8760

atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 8820

ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact 8880

tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 8940

aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 9000

atgtctgtat accgtcgacc tctagctaga gcttggcgta atcatggtca tagctgtttc 9060

ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 9120

gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 9180

ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 9240

ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 9300

cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 9360

cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 9420

accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 9480

acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 9540

cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 9600

acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 9660

atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 9720

agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 9780

acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 9840

gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 9900

gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 9960

gcaaacaaac caccgctggt agcggttttt ttgtttgcaa gcagcagatt acgcgcagaa 10020

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 10080

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 10140

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 10200

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 10260

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 10320

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 10380

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 10440

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 10500

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 10560

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 10620

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 10680

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 10740

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 10800

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 10860

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 10920

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 10980

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 11040

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 11100

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 11160

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt c 11201

Claims

1.融合蛋白，其特征在于，所述融合蛋白包括dCas9蛋白和CYP3A4蛋白。

2.根据权利要求1所述的融合蛋白，其特征在于，

所述dCas9蛋白为如下A1)或A2)：

A1)氨基酸序列是SEQ ID No.1的蛋白质；

A2)将SEQ ID No.1所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

和/或，所述CYP3A4蛋白为如下B1)或B2：

B1)氨基酸序列是SEQ ID No.2的蛋白质；

B2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质。

3.根据权利要求1或2所述的融合蛋白，其特征在于，所述CYP3A4蛋白与所述dCas9蛋白的C末端连接或所述CYP3A4蛋白与所述dCas9蛋白的C末端通过接头连接。

4.根据权利要求1-3任一项所述的融合蛋白，其特征在于，所述融合蛋白的氨基酸序列如SEQ ID No.3所示。

5.生物材料，其特征在于，所述生物材料为下述任一种：

C1)编码权利要求1-4中任一项所述融合蛋白的核酸分子；

C2)含有C1)所述核酸分子的表达盒；

C3)含有C1)所述核酸分子的重组载体、或含有C2)所述表达盒的重组载体；

C4)含有C1)所述核酸分子的重组微生物、或含有C2)所述表达盒的重组微生物、或含有C3)所述重组载体的重组微生物；

C5)含有C1)所述核酸分子的重组细胞、或含有C2)所述表达盒的重组细胞、或含有C3)所述重组载体的重组细胞；

C6)编码所述dCas9蛋白的核酸分子；

C7)编码所述CYP3A4蛋白的核酸分子。

6.根据权利要求5所述的生物材料，其特征在于，所述核酸分子为下述任一种：

D1)编码序列是SEQ ID No.4的第1009-5112位所示的DNA分子；

D2)编码序列是SEQ ID No.4的第5212-6720位所示的DNA分子；

D3)编码序列是SEQ ID No.4的第1009-6720位所示的DNA分子；

D4)与D1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述dCas9蛋白的DNA分子；

D5)与D2)限定的核苷酸序列具有75％或75％以上同一性，且编码所述CYP3A4蛋白的DNA分子；

D6)与D3)限定的核苷酸序列具有75％或75％以上同一性，且编码所述融合蛋白的DNA分子。

7.根据权利要求5或6所述的生物材料，其特征在于，所述重组载体的核苷酸序列为SEQID No.4。

8.一种基因编辑系统，其特征在于，所述基因编辑系统包括权利要求5-7中任一项所述的重组载体、sgRNA表达载体和黄曲霉毒素B1。

9.利用权利要求8所述的基因编辑系统进行定点突变的方法，其特征在于，所述方法包括以下步骤：用表达权利要求1-4中任一项所述融合蛋白的重组载体和表达靶位点特异的sgRNA表达载体转染宿主细胞，用黄曲霉毒素B1诱导所述靶位点的核苷酸产生突变。

10.权利要求1-4中任一项所述的融合蛋白，和/或，权利要求5-7中任一项所述的生物材料，和/或，权利要求8所述的基因编辑系统在基因编辑中的应用和/或在靶位点对DNA进行突变中的应用。