CN115704016A - 一种利用dCas9-p450系统进行定点突变的方法 - Google Patents

一种利用dCas9-p450系统进行定点突变的方法 Download PDF

Info

Publication number
CN115704016A
CN115704016A CN202110927367.8A CN202110927367A CN115704016A CN 115704016 A CN115704016 A CN 115704016A CN 202110927367 A CN202110927367 A CN 202110927367A CN 115704016 A CN115704016 A CN 115704016A
Authority
CN
China
Prior art keywords
leu
lys
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110927367.8A
Other languages
English (en)
Inventor
赵书红
阮进学
苏寅钰
李新云
赵广兴
韩晓松
熊友才
庄荣志
聂雄伟
刘艳文
王伟
李长春
谢胜松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Agricultural University
Original Assignee
Huazhong Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Agricultural University filed Critical Huazhong Agricultural University
Priority to CN202110927367.8A priority Critical patent/CN115704016A/zh
Publication of CN115704016A publication Critical patent/CN115704016A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种利用dCas9‑p450系统进行定点突变的方法。本发明具体地公开了一种将细胞色素p450氧化酶(CYP)家族的关键酶CYP3A4蛋白与dCas9(dead Cas9)蛋白融合形成的融合蛋白及dCas9‑P450系统,所述dCas9‑P450系统包括重组载体dCas9‑p450、sgRNA表达载体、黄曲霉毒素B1(AFB1),并公开了利用该系统将p450酶在特定基因组区域高表达,从而使得该区域的AFB1代谢成为AFBO,AFBO与靶位点DNA形成络合物,在靶位点定点引入随机突变的方法。利用该方法可以突变特定核苷酸序列,为基因功能研究提供可行的方法和强大、灵活的基因编辑工具。

Description

一种利用dCas9-p450系统进行定点突变的方法
技术领域
本发明属于动物基因编辑工程领域,涉及一种利用dCas9-p450系统进行定点突变的方法。
背景技术
黄曲霉毒素(aflatoxin,AFT)是一类化学结构类似的化合物,主要由黄曲霉和寄生曲霉产生,在天然污染的食品中以黄曲霉毒素B1(aflatoxin B1,AFB1)最为多见。实际上,AFB1本身并不具有毒性、致癌和突变等作用,其强致癌毒性来源于细胞色素p450氧化酶(Cytochrome P450,CYP)可以把AFB1转换成活性极强且极不稳定的AFB1-8,9-环氧化物(AFB1-8,9-epoxide,AFBO)。AFBO可以与细胞大分子物质,如DNA、RNA或蛋白质的多种亲核中心发生共价结合,形成络合物,引起DNA的错配修复机制,造成碱基损伤、DNA单链或双链断裂、DNA氧化修饰、姐妹染色体交换频率增加等一系列遗传性突变,从而产生致癌作用。CYP450家族成员介导AFB1代谢作用形成AFBO的最关键酶是细胞色素P450 3A4酶(简称CYP3A4),CYP3A4是一种血红素蛋白,可以氧化外源有机小分子,如毒素或药物,以便使其排出体外。CYP3A4蛋白是低剂量AFB1暴露引起致癌过程中的关键因素。
CRISPR/Cas系统是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御系统,可用来对抗入侵的病毒及外源DNA。CRISPR/Cas9基因编辑系统由一个具有核酸内切酶活性的Cas9蛋白和一条单链向导RNA(single guide,sgRNA)组成。sgRNA与Cas9蛋白结合并引导Cas9蛋白靶向到靶位点进行切割,Cas9的两个切割结构域RuvC和HNH分别对DNA双链进行切割,导致双链断裂(double strand breaks,DSB)。机体自身会启动DNA修复机制,分别是非同源末端连接(non-homologous end joining,NHEJ)和同源重组(homology-directed repair,HR)修复机制。NHEJ是一种错配修复机制,DNA双链通过NHEJ修复会随机产生碱基插入或缺失(insertion and deletions,indels)。HR是一种精准的修复机制,在同源供体存在的情况下,供体中的外源基因片段通过同源重组方式整合到靶位点。
Cas9蛋白的RuvC和HNH结构域分别负责切割DNA双链的两条链,决定了Cas9的核酸酶切割活性,对这两个结构域进行点突变可以造成Cas9切割活性丧失。当RuvC(D10A突变)和HNH(H840A突变)结构域同时处于失活状态时(RuvC-&HNH-),Cas9不具有核酸酶活性,称为dCas9(dead Cas9)。dCas9虽然没有切割DNA的能力,但仍然可以在sgRNA的引导下与特定的DNA序列结合。研究发现,如果在目标基因启动子区或增强子区设计sgRNA,则dCas9通过与其他蛋白融合后,能够发挥转录因子的作用,促进或抑制基因的表达。dCas9-VPR系统是指dCas9融合某些转录激活因子(单纯性疱疹病毒蛋白VP64、NF-κB的亚基p65和Epstein-Barr病毒R反式激活因子Rta5),可靶向启动子和增强子区域,调节基因上调表达。当与sgRNA文库结合使用时,该系统还能够支持高通量的全基因组功能激活筛选。dCas9-KRAB系统是指dCas9与Kox1的转录阻遏物结构域KRAB(Krüppel-associated box)融合,依靠KRAB募集各种各样的组蛋白修饰因子,通过形成异染色质的方式可逆地抑制基因表达,可以高度特异地使内源性基因表达降低60-80%,并且dCas9-KRAB对细胞生长没有影响,使其成为无毒的基因沉默方法。由此,dCas9融合蛋白逐渐成为了研究生物学过程和途径的有力工具。单碱基编辑(Base Editor,BE)系统是指dCas9蛋白融合胞嘧啶脱氨酶或者腺嘌呤脱氨酶,从而在编辑窗口内实现C>T或者A>G的突变,BE已经被广泛应用于生命科学研究领域。此外,将组蛋白乙酰转移酶p300的催化核心与dCas9融合组成的dCas9-p300系统能够直接改变靶标基因附近的染色质状态。当靶向编码区或启动子区时,这个系统可成功诱导基因高表达。
发明内容
本发明的目的是提供一种DNA定点突变系统,该系统可在DNA靶位点引入随机突变。所要解决的技术问题不限于如所描述的技术主题,本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。
为实现上述目的,本发明首先提供了融合蛋白,名称为PdCas9-p450,所述融合蛋白PdCas9-p450包括dCas9蛋白和CYP3A4蛋白。
所述CYP3A4蛋白为细胞色素P450 3A4酶(简称CYP3A4),CYP3A4是一种血红素蛋白,可以氧化外源有机小分子,如毒素或药物,以便使其排出体外。
进一步地,所述dCas9蛋白可为如下A1)或A2):A1)氨基酸序列是SEQ ID No.1的蛋白质;A2)将SEQ ID No.1所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
和/或,所述CYP3A4蛋白可为如下B1)或B2:B1)氨基酸序列是SEQ ID No.2的蛋白质;B2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质。
进一步地,所述CYP3A4蛋白可与所述dCas9蛋白的C末端连接或所述CYP3A4蛋白与所述dCas9蛋白的C末端可通过接头(linker)连接。所述接头用于连接所述CYP3A4蛋白和所述dCas9蛋白。
在本发明的一个实施方案中,所述接头的氨基酸序列如SEQ ID No.3的第1369-1401位所示。进一步地,所述融合蛋白PdCas9-p450的氨基酸序列可如SEQ ID No.3所示。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化或点突变的方法,对本发明的编码融合蛋白PdCas9-p450的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的融合蛋白PdCas9-p450的核苷酸序列75%或者75%以上同一性的核苷酸,只要编码融合蛋白PdCas9-p450且具有融合蛋白PdCas9-p450的功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。本文中,同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residuegap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。本文中,所述80%以上的同一性可为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
本发明还提供了生物材料,所述生物材料可为下述任一种:C1)编码所述融合蛋白PdCas9-p450的核酸分子;C2)含有C1)所述核酸分子的表达盒;C3)含有C1)所述核酸分子的重组载体、或含有C2)所述表达盒的重组载体;C4)含有C1)所述核酸分子的重组微生物、或含有C2)所述表达盒的重组微生物、或含有C3)所述重组载体的重组微生物;C5)含有C1)所述核酸分子的重组细胞、或含有C2)所述表达盒的重组细胞、或含有C3)所述重组载体的重组细胞;C6)编码所述dCas9蛋白的核酸分子;C7)编码所述CYP3A4蛋白的核酸分子。
上述生物材料中,所述核酸分子可为下述任一种:
D1)编码序列是SEQ ID No.4的第1009-5112位所示的DNA分子;D2)编码序列是SEQID No.4的第5212-6720位所示的DNA分子;D3)编码序列是SEQ ID No.4的第1009-6720位所示的DNA分子;D4)与D1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述dCas9蛋白的DNA分子;D5)与D2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述CYP3A4蛋白的DNA分子;D6)与D3)限定的核苷酸序列具有75%或75%以上同一性,且编码所述融合蛋白PdCas9-p450的DNA分子。
其中,SEQ ID No.4的第1009-6720位所示的DNA分子编码所述融合蛋白PdCas9-p450;SEQ ID No.4的第5212-6720位所示的DNA分子编码所述优化后的CYP3A4蛋白;SEQ IDNo.4的第1009-5112位所示的DNA分子编码所述dCas9蛋白;SEQ ID No.4的第5113-5211位所示的DNA分子编码所述接头(linker)。
上述生物材料中,所述重组载体还可包括以下可操作性相连的元件:CMV增强子、CMV启动子、bGH poly(A)终止信号但不限于此。进一步地,所述重组载体还可包括以下可操作性相连的元件:氨苄抗性基因、Neo抗性基因但不限于此。
术语“可操作性相连”指调控元件(例如但不限于,启动子、转录终止子等)与核酸(例如,编码序列或开放读码框)连接,使得核苷酸的转录被所述转录调控元件控制和调节。用于将调控元件可操作性地连接于核酸分子的技术为本领域已知的。
所述CMV增强子的核苷酸序列如SEQ ID No.4的第235-614位所示;所述CMV启动子的核苷酸序列如SEQ ID No.4的第615-818位所示;bGH poly(A)终止信号的核苷酸序列如SEQ ID No.4的第6801-7025位所示。
上述生物材料中,所述重组载体的核苷酸序列可为SEQ ID No.4。
所述重组载体的构建方法包括将所述CYP3A4蛋白的编码序列(CDS)进行密码子优化后,连接到所述dCas9蛋白的C末端。
所述重组载体为融合蛋白PdCas9-p450表达载体。
上述生物材料中,所述载体可为质粒、黏粒、噬菌体或病毒载体。
上述生物材料中,所述微生物可为酵母、细菌、藻或真菌。其中,细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽胞杆菌属(Bacillus)等。上述生物材料中,所述细胞可为动物细胞,具体可为HEK293T细胞。所述重组载体具体可为重组载体dCas9-p450,其核苷酸序列如SEQ ID No.4所示,图谱如图2所示。
本发明还提供了一种基因编辑系统(dCas9-p450系统)(组合物),所述基因编辑系统包括所述重组载体dCas9-p450、sgRNA表达载体和黄曲霉毒素B1(AFB1)。
本发明还提供了利用所述基因编辑系统(dCas9-p450系统)进行定点突变的方法,所述方法包括以下步骤:用表达所述融合蛋白PdCas9-p450的重组载体和表达靶位点特异的sgRNA表达载体转染宿主细胞,用黄曲霉毒素B1(AFB1)诱导所述靶位点的核苷酸产生突变;所述sgRNA的靶标序列是5′-N19-20PAM-3′,所述N19-20为19-20个N,所述PAM为NGG;所述N为A、G、C或T。所述突变可为随机突变,如G突变为A或C或T,A突变为G或C或T。
在本发明的一个实施方案中,所述利用所述基因编辑系统(dCas9-p450系统)进行定点突变的方法包括以下步骤:
(1)构建所述重组载体dCas9-p450;(2)根据DNA的靶位点,构建sgRNA表达载体;
(3)将步骤(1)构建的重组载体dCas9-p450和步骤(2)构建的sgRNA表达载体共同转染宿主细胞;(4)用黄曲霉毒素B1(AFB1)诱导靶位点的核苷酸产生随机突变。
本发明还提供了所述融合蛋白PdCas9-p450,和/或,所述生物材料,和/或,所述基因编辑系统在基因编辑中的应用和/或在靶位点对DNA进行突变中的应用。
进一步地,所述突变可为随机突变。
在本发明的一个实施方案中,所述利用所述基因编辑系统进行定点突变的方法具体可包括以下步骤:(1)构建dCas9-p450重组表达载体(简称重组载体dCas9-p450或dCas9-p450):将合成得到密码子优化的CYP3A4蛋白编码DNA通过接头(linker)连接dCas9(D10A&H840A)蛋白编码DNA,再连接CMV增强子和CMV启动子、Flag标签蛋白、SV40NLS核定位信号以及bGH poly(A)终止信号,构建得到dCas9-p450重组表达载体;(2)构建sgRNA表达载体:根据靶位点设计sgRNA寡合苷酸引物,连接在BsaI酶切的pGL3-U6-EGFP载体上,构建pGL3-U6-sgRNA-EGFP载体;(3)将步骤(1)构建的所述dCas9-p450重组表达载体和步骤(2)构建的sgRNA表达载体共同转染HEK293T细胞;(4)转染4-6h后,用含有4μg/mL的黄曲霉毒素B1(AFB1)的新鲜培养基换液,继续培养细胞至72h,检测靶位点的核苷酸突变情况。
本发明公开了一种体内DNA定点突变系统,具体地,将dCas9蛋白与p450蛋白进行融合形成融合蛋白PdCas9-p450,sgRNA引导融合蛋白PdCas9-p450结合到靶位点(目标区域),在靶位点表达细胞色素p450氧化酶,在加入黄曲霉毒素B1(AFB1)后,p450氧化酶会将AFB1代谢成AFB1-8,9-环氧化物(AFB1-8,9-epoxide,AFBO),AFBO与DNA碱基形成络合物,引发机体的修复机制,从而实现在靶位点引入随机突变,如图1所示。
本发明通过合成得到密码子优化的CYP3A4蛋白编码DNA,连接CMV增强子、CMV启动子,Flag标签蛋白,NLS核定位信号,dCas9(D10A&H840A)蛋白编码DNA和CYP3A4蛋白编码DNA,构建到骨架载体pCMV-BE3上,命名为dCas9-p450,重组载体dCas9-p450图谱如图2所示,重组载体dCas9-p450序列送公司合成后,转化至大肠杆菌,扩繁提取质粒,-20℃保存备用。
在本发明的一个实施方案中,根据所需突变位点设计3对sgRNA寡合苷酸引物,并在引物5’端加上BsaI酶切黏性末端,退火后连接到BsaI酶切的pGL3-U6-EGFP载体上,转化至大肠杆菌,挑取单克隆菌落,扩大培养后测序,将构建成功的载体命名为pGL3-U6-sgRNA-EGFP。
进一步地,采用脂质体转染方法(jetPRIME)将重组载体dCas9-p450和sgRNA表达载体共同转染HEK293T细胞,转染4-6h后更换含有4μg/mL AFB1的新鲜培养基,同时培养仅转染质粒不加AFB1培养基对照组、仅加AFB1培养基不转染质粒对照组以及不做处理的野生型对照组,在转染72h后同时收集所有细胞提取基因组DNA。
进一步地,设计相应的引物扩增细胞基因组的靶位点区域,纯化后进行高通量测序(deep sequence),对靶区域进行分析得到突变类型和突变频率。
本发明的有益效果在于:本发明提供了一种借助CRISPR/cas9系统将p450酶在特定基因组区域高表达,从而使得该区域的AFB1代谢成为AFBO,AFBO与靶位点DNA形成络合物,在靶位点定点引入随机突变的方法。利用该方法可以突变特定核苷酸序列,为基因功能研究提供可行的方法和更强大、灵活的基因编辑工具。
附图说明
图1为本发明dCas9-p450定点突变的原理示意图。
图2为本发明序列合成的dCas9-p450载体元件图谱。
图3为本发明构建sgRNA表达载体pGL3-U6-sgRNA-EGFP的质粒图谱。
图4为本发明实施例中3个基因实验组靶目的区域高通量测序(deep sequence)结果图。
图5为本发明实施例中3个基因对照组靶目的区域高通量测序(deep sequence)结果图。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1构建重组载体dCas9-p450
通过合成得到密码子优化的CYP3A4序列,连接CMV增强子、CMV启动子,Flag标签蛋白,NLS核定位信号,dCas9(D10A&H840A)蛋白序列和CYP3A4的CDS序列,构建到骨架载体pCMV-BE3(购自Addgene公司)上,命名为dCas9-p450,即为重组载体dCas9-p450,所述重组载体dCas9-p450为融合蛋白PdCas9-p450表达载体,重组载体dCas9-p450图谱如图2所示,重组载体dCas9-p450核苷酸序列如SEQ ID NO.4所示,其序列送苏州金唯智生物科技有限公司合成后,转化至大肠杆菌,扩繁提取质粒,-20℃保存备用。其中:SEQ ID No.4的第1009-5112位所示的DNA分子编码所述dCas9蛋白;SEQ ID No.4的第5212-6720位所示的DNA分子(对所述CYP3A4蛋白的编码DNA进行密码子优化后的DNA分子)编码所述CYP3A4蛋白;SEQ ID No.4的第5113-5211位所示的DNA分子编码所述接头(linker);SEQ ID No.4的第1009-6720位所示的DNA分子编码所述融合蛋白PdCas9-p450;所述CMV增强子的核苷酸序列如SEQ ID No.4的第235-614位所示;所述CMV启动子的核苷酸序列如SEQ ID No.4的第615-818位所示;所述Flag标签蛋白的核苷酸序列如SEQ ID No.4的第907-972位所示;所述NLS核定位信号的核苷酸序列如SEQ ID No.4的第979-999和第6721-6741位所示。
实施例2构建sgRNA表达载体
在人基因组中随机选取GRIN2B、DYRK1A和PDCD1三个位点设计sgRNA,分别命名为GRIN2B-sgRNA、DYRK1A-sgRNA和PDCD1-sgRNA。各条sgRNA向导序列上下游序列分别在5’末端添加相应的BsaI酶切位点黏性末端碱基后送至公司合成。需合成的寡核苷酸序列如表1所示,划线部分为黏性末端碱基。将合成的sgRNA向导序列的寡核苷酸干粉离心后用ddH2O溶解稀释至终浓度为10μM,然后把对应的上下游sgRNA引物各取5μL于PCR管中振荡混匀,简短离心,退火杂交,形成双链oligo,退火程序为95℃,10min;65℃,30min;
表1 3个基因sgRNA向导序列引物序列
Figure BDA0003204712330000051
Figure BDA0003204712330000061
利用Ligation Mix将退火后的产物,于16℃金属浴反应1h,连接到pGL3-U6-EGFP载体(Addgene#107721)BsaI酶切回收后的骨架中,得到3个位点的pGL3-U6-sgRNA-EGFP表达载体(图3),分别为GRIN2B-sgRNA表达载体、DYRK1A-sgRNA表达载体和PDCD1-sgRNA表达载体。转化至大肠杆菌感受态细胞后,挑取单克隆,Sanger测序验证sgRNA是否成功连接。sgRNA表达载体成功连接后,利用菌液扩大培养,用去内毒素质粒提取试剂盒提取质粒后用于转染细胞。
实施例3基因编辑系统(dCas9-p450系统)突变效率验证
所述基因编辑系统(dCas9-p450系统),包括实施例1的重组载体dCas9-p450、实施例2的sgRNA表达载体(pGL3-U6-sgRNA-EGFP表达载体)和黄曲霉毒素B1(AFB1)。利用dCas9-p450系统在HEK293T细胞上进行编辑,验证突变效率。
设置3个基因实验组:转染前,将HEK293T细胞铺板于12孔细胞培养皿中,待细胞汇合度达到80-90%时进行转染。按照1:1的比例,将实施例2构建的3个位点的sgRNA表达载体和实施例1构建的重组载体dCas9-p450各500ng采用脂质体转染方法(jetPRIME)共转染HEK293T细胞。转染4-6小时后,更换培养液,用含有4μg/mL AFB1的新鲜培养基培养(10%FBS+90%DMEM),转染24h后利用荧光显微镜观察细胞发光情况。
同时设置如下三组细胞的对照处理组:仅有质粒转染未加AFB1培养基组(与3个基因实验组相比,区别仅在于质粒转染4-6小时后,更换为不含4μg/mL AFB1的新鲜培养基培养)、仅加入含有4μg/mL AFB1的培养基培养未转染质粒组(与3个基因实验组相比,区别仅在于未进行质粒转染)、未经任何处理的野生型组(与3个基因实验组相比,区别仅在于未进行质粒转染,用不含4μg/mL AFB1的新鲜培养基培养),继续培养48h后收集所有细胞,分别提取细胞基因组DNA,设计相应引物扩增带有靶位点的目的片段(表4)。
PCR扩增程序和扩增体系如下:
表2 PCR扩增体系
Figure BDA0003204712330000062
表3 PCR扩增程序
Figure BDA0003204712330000063
表4扩增3个基因靶序列的引物序列表
基因名称 上游引物序列(5’-3’) 下游引物序列(5’-3’)
GRIN2B GGTTTGGTGCTCAATGAAAGG CCACCTCGTCGGAAGTGC
DYRK1A ACCTCACTTATCTTCTTGTAGGAGG ACTGCCATTCCAATAGTCATTTCTG
PDCD1 ACAGTTTCCCTTCCGCTCAC GGACTGAGGGTGGAAGGTCC
利用胶回收试剂盒对所述PCR产物进行胶回收后进行高通量测序(deepsequence)分析,将实验组测序结果和对照组测序结果进行比较分析得出突变类型和突变频率(图4、图5)。
结果表明,仅加入含有4μg/mL AFB1的培养基培养未转染质粒组和未经任何处理的野生型组的各个基因的靶点没有任何突变,仅转染GRIN2B-sgRNA表达载体的实验组中只有一种突变类型,靶标序列5′到3′方向的第9位的G被替换成A,在总共910549个reads中,有1029个reads发生了这种突变,突变频率为0.1%。
仅转染DYRK1A-sgRNA表达载体的实验组只有一种突变类型,靶标序列5′到3′方向的第19位的G被替换成A,在总共994452个reads中,有1081个reads发生了这种突变,突变频率为0.1%。
仅转染PDCD1-sgRNA表达载体的实验组只有一种突变类型,靶标序列5′到3′方向的第4位的C被替换成T,在总共994452个reads中,有1081个reads发生了这种突变,突变频率为0.1%。
综上所述,本发明所构建的基因编辑系统(dCas9-p450系统)可以在特定基因组区域实现随机点突变的基因编辑的功能。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
SEQUENCE LISTING
<110> 华中农业大学
<120> 一种利用dCas9-p450系统进行定点突变的方法
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 503
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 2
Met Ala Leu Ile Pro Asp Leu Ala Met Glu Thr Trp Leu Leu Leu Ala
1 5 10 15
Val Ser Leu Val Leu Leu Tyr Leu Tyr Gly Thr His Ser His Gly Leu
20 25 30
Phe Lys Lys Leu Gly Ile Pro Gly Pro Thr Pro Leu Pro Phe Leu Gly
35 40 45
Asn Ile Leu Ser Tyr His Lys Gly Phe Cys Met Phe Asp Met Glu Cys
50 55 60
His Lys Lys Tyr Gly Lys Val Trp Gly Phe Tyr Asp Gly Gln Gln Pro
65 70 75 80
Val Leu Ala Ile Thr Asp Pro Asp Met Ile Lys Thr Val Leu Val Lys
85 90 95
Glu Cys Tyr Ser Val Phe Thr Asn Arg Arg Pro Phe Gly Pro Val Gly
100 105 110
Phe Met Lys Ser Ala Ile Ser Ile Ala Glu Asp Glu Glu Trp Lys Arg
115 120 125
Leu Arg Ser Leu Leu Ser Pro Thr Phe Thr Ser Gly Lys Leu Lys Glu
130 135 140
Met Val Pro Ile Ile Ala Gln Tyr Gly Asp Val Leu Val Arg Asn Leu
145 150 155 160
Arg Arg Glu Ala Glu Thr Gly Lys Pro Val Thr Leu Lys Asp Val Phe
165 170 175
Gly Ala Tyr Ser Met Asp Val Ile Thr Ser Thr Ser Phe Gly Val Asn
180 185 190
Ile Asp Ser Leu Asn Asn Pro Gln Asp Pro Phe Val Glu Asn Thr Lys
195 200 205
Lys Leu Leu Arg Phe Asp Phe Leu Asp Pro Phe Phe Leu Ser Ile Thr
210 215 220
Val Phe Pro Phe Leu Ile Pro Ile Leu Glu Val Leu Asn Ile Cys Val
225 230 235 240
Phe Pro Arg Glu Val Thr Asn Phe Leu Arg Lys Ser Val Lys Arg Met
245 250 255
Lys Glu Ser Arg Leu Glu Asp Thr Gln Lys His Arg Val Asp Phe Leu
260 265 270
Gln Leu Met Ile Asp Ser Gln Asn Ser Lys Glu Thr Glu Ser His Lys
275 280 285
Ala Leu Ser Asp Leu Glu Leu Val Ala Gln Ser Ile Ile Phe Ile Phe
290 295 300
Ala Gly Tyr Glu Thr Thr Ser Ser Val Leu Ser Phe Ile Met Tyr Glu
305 310 315 320
Leu Ala Thr His Pro Asp Val Gln Gln Lys Leu Gln Glu Glu Ile Asp
325 330 335
Ala Val Leu Pro Asn Lys Ala Pro Pro Thr Tyr Asp Thr Val Leu Gln
340 345 350
Met Glu Tyr Leu Asp Met Val Val Asn Glu Thr Leu Arg Leu Phe Pro
355 360 365
Ile Ala Met Arg Leu Glu Arg Val Cys Lys Lys Asp Val Glu Ile Asn
370 375 380
Gly Met Phe Ile Pro Lys Gly Val Val Val Met Ile Pro Ser Tyr Ala
385 390 395 400
Leu His Arg Asp Pro Lys Tyr Trp Thr Glu Pro Glu Lys Phe Leu Pro
405 410 415
Glu Arg Phe Ser Lys Lys Asn Lys Asp Asn Ile Asp Pro Tyr Ile Tyr
420 425 430
Thr Pro Phe Gly Ser Gly Pro Arg Asn Cys Ile Gly Met Arg Phe Ala
435 440 445
Leu Met Asn Met Lys Leu Ala Leu Ile Arg Val Leu Gln Asn Phe Ser
450 455 460
Phe Lys Pro Cys Lys Glu Thr Gln Ile Pro Leu Lys Leu Ser Leu Gly
465 470 475 480
Gly Leu Leu Gln Pro Glu Lys Pro Val Val Leu Lys Val Glu Ser Arg
485 490 495
Asp Gly Thr Val Ser Gly Ala
500
<210> 3
<211> 1904
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
1370 1375 1380
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly
1385 1390 1395
Gly Ser Ser Met Ala Leu Ile Pro Asp Leu Ala Met Glu Thr Trp
1400 1405 1410
Leu Leu Leu Ala Val Ser Leu Val Leu Leu Tyr Leu Tyr Gly Thr
1415 1420 1425
His Ser His Gly Leu Phe Lys Lys Leu Gly Ile Pro Gly Pro Thr
1430 1435 1440
Pro Leu Pro Phe Leu Gly Asn Ile Leu Ser Tyr His Lys Gly Phe
1445 1450 1455
Cys Met Phe Asp Met Glu Cys His Lys Lys Tyr Gly Lys Val Trp
1460 1465 1470
Gly Phe Tyr Asp Gly Gln Gln Pro Val Leu Ala Ile Thr Asp Pro
1475 1480 1485
Asp Met Ile Lys Thr Val Leu Val Lys Glu Cys Tyr Ser Val Phe
1490 1495 1500
Thr Asn Arg Arg Pro Phe Gly Pro Val Gly Phe Met Lys Ser Ala
1505 1510 1515
Ile Ser Ile Ala Glu Asp Glu Glu Trp Lys Arg Leu Arg Ser Leu
1520 1525 1530
Leu Ser Pro Thr Phe Thr Ser Gly Lys Leu Lys Glu Met Val Pro
1535 1540 1545
Ile Ile Ala Gln Tyr Gly Asp Val Leu Val Arg Asn Leu Arg Arg
1550 1555 1560
Glu Ala Glu Thr Gly Lys Pro Val Thr Leu Lys Asp Val Phe Gly
1565 1570 1575
Ala Tyr Ser Met Asp Val Ile Thr Ser Thr Ser Phe Gly Val Asn
1580 1585 1590
Ile Asp Ser Leu Asn Asn Pro Gln Asp Pro Phe Val Glu Asn Thr
1595 1600 1605
Lys Lys Leu Leu Arg Phe Asp Phe Leu Asp Pro Phe Phe Leu Ser
1610 1615 1620
Ile Thr Val Phe Pro Phe Leu Ile Pro Ile Leu Glu Val Leu Asn
1625 1630 1635
Ile Cys Val Phe Pro Arg Glu Val Thr Asn Phe Leu Arg Lys Ser
1640 1645 1650
Val Lys Arg Met Lys Glu Ser Arg Leu Glu Asp Thr Gln Lys His
1655 1660 1665
Arg Val Asp Phe Leu Gln Leu Met Ile Asp Ser Gln Asn Ser Lys
1670 1675 1680
Glu Thr Glu Ser His Lys Ala Leu Ser Asp Leu Glu Leu Val Ala
1685 1690 1695
Gln Ser Ile Ile Phe Ile Phe Ala Gly Tyr Glu Thr Thr Ser Ser
1700 1705 1710
Val Leu Ser Phe Ile Met Tyr Glu Leu Ala Thr His Pro Asp Val
1715 1720 1725
Gln Gln Lys Leu Gln Glu Glu Ile Asp Ala Val Leu Pro Asn Lys
1730 1735 1740
Ala Pro Pro Thr Tyr Asp Thr Val Leu Gln Met Glu Tyr Leu Asp
1745 1750 1755
Met Val Val Asn Glu Thr Leu Arg Leu Phe Pro Ile Ala Met Arg
1760 1765 1770
Leu Glu Arg Val Cys Lys Lys Asp Val Glu Ile Asn Gly Met Phe
1775 1780 1785
Ile Pro Lys Gly Val Val Val Met Ile Pro Ser Tyr Ala Leu His
1790 1795 1800
Arg Asp Pro Lys Tyr Trp Thr Glu Pro Glu Lys Phe Leu Pro Glu
1805 1810 1815
Arg Phe Ser Lys Lys Asn Lys Asp Asn Ile Asp Pro Tyr Ile Tyr
1820 1825 1830
Thr Pro Phe Gly Ser Gly Pro Arg Asn Cys Ile Gly Met Arg Phe
1835 1840 1845
Ala Leu Met Asn Met Lys Leu Ala Leu Ile Arg Val Leu Gln Asn
1850 1855 1860
Phe Ser Phe Lys Pro Cys Lys Glu Thr Gln Ile Pro Leu Lys Leu
1865 1870 1875
Ser Leu Gly Gly Leu Leu Gln Pro Glu Lys Pro Val Val Leu Lys
1880 1885 1890
Val Glu Ser Arg Asp Gly Thr Val Ser Gly Ala
1895 1900
<210> 4
<211> 11201
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gccatggact acaaagacca tgacggtgat tataaagatc atgacatcga ttacaaggat 960
gacgatgaca agatggcccc caagaagaag aggaaggtgg gccgcggaat ggataagaaa 1020
tactcaatag gcttagctat cggcacaaat agcgtcggat gggcggtgat cactgatgaa 1080
tataaggttc cgtctaaaaa gttcaaggtt ctgggaaata cagaccgcca cagtatcaaa 1140
aaaaatctta taggggctct tttatttgac agtggagaga cagcggaagc gactcgtctc 1200
aaacggacag ctcgtagaag gtatacacgt cggaagaatc gtatttgtta tctacaggag 1260
attttttcaa atgagatggc gaaagtagat gatagtttct ttcatcgact tgaagagtct 1320
tttttggtgg aagaagacaa gaagcatgaa cgtcatccta tttttggaaa tatagtagat 1380
gaagttgctt atcatgagaa atatccaact atctatcatc tgcgaaaaaa attggtagat 1440
tctactgata aagcggattt gcgcttaatc tatttggcct tagcgcatat gattaagttt 1500
cgtggtcatt ttttgattga gggagattta aatcctgata atagtgatgt ggacaaacta 1560
tttatccagt tggtacaaac ctacaatcaa ttatttgaag aaaaccctat taacgcaagt 1620
ggagtagatg ctaaagcgat tctttctgca cgattgagta aatcaagacg attagaaaat 1680
ctcattgctc agctccccgg tgagaagaaa aatggcttat ttgggaatct cattgctttg 1740
tcattgggtt tgacccctaa ttttaaatca aattttgatt tggcagaaga tgctaaatta 1800
cagctttcaa aagatactta cgatgatgat ttagataatt tattggcgca aattggagat 1860
caatatgctg atttgttttt ggcagctaag aatttatcag atgctatttt actttcagat 1920
atcctaagag taaatactga aataactaag gctcccctat cagcttcaat gattaaacgc 1980
tacgatgaac atcatcaaga cttgactctt ttaaaagctt tagttcgaca acaacttcca 2040
gaaaagtata aagaaatctt ttttgatcaa tcaaaaaacg gatatgcagg ttatattgat 2100
gggggagcta gccaagaaga attttataaa tttatcaaac caattttaga aaaaatggat 2160
ggtactgagg aattattggt gaaactaaat cgtgaagatt tgctgcgcaa gcaacggacc 2220
tttgacaacg gctctattcc ccatcaaatt cacttgggtg agctgcatgc tattttgaga 2280
agacaagaag acttttatcc atttttaaaa gacaatcgtg agaagattga aaaaatcttg 2340
acttttcgaa ttccttatta tgttggtcca ttggcgcgtg gcaatagtcg ttttgcatgg 2400
atgactcgga agtctgaaga aacaattacc ccatggaatt ttgaagaagt tgtcgataaa 2460
ggtgcttcag ctcaatcatt tattgaacgc atgacaaact ttgataaaaa tcttccaaat 2520
gaaaaagtac taccaaaaca tagtttgctt tatgagtatt ttacggttta taacgaattg 2580
acaaaggtca aatatgttac tgaaggaatg cgaaaaccag catttctttc aggtgaacag 2640
aagaaagcca ttgttgattt actcttcaaa acaaatcgaa aagtaaccgt taagcaatta 2700
aaagaagatt atttcaaaaa aatagaatgt tttgatagtg ttgaaatttc aggagttgaa 2760
gatagattta atgcttcatt aggtacctac catgatttgc taaaaattat taaagataaa 2820
gattttttgg ataatgaaga aaatgaagat atcttagagg atattgtttt aacattgacc 2880
ttatttgaag atagggagat gattgaggaa agacttaaaa catatgctca cctctttgat 2940
gataaggtga tgaaacagct taaacgtcgc cgttatactg gttggggacg tttgtctcga 3000
aaattgatta atggtattag ggataagcaa tctggcaaaa caatattaga ttttttgaaa 3060
tcagatggtt ttgccaatcg caattttatg cagctgatcc atgatgatag tttgacattt 3120
aaagaagaca ttcaaaaagc acaagtgtct ggacaaggcg atagtttaca tgaacatatt 3180
gcaaatttag ctggtagccc tgctattaaa aaaggtattt tacagactgt aaaagttgtt 3240
gatgaattgg tcaaagtaat ggggcggcat aagccagaaa atatcgttat tgaaatggca 3300
cgtgaaaatc agacaactca aaagggccag aaaaattcgc gagagcgtat gaaacgaatc 3360
gaagaaggta tcaaagaatt aggaagtcag attcttaaag agcatcctgt tgaaaatact 3420
caattgcaaa atgaaaagct ctatctctat tatctccaaa atggaagaga catgtatgtg 3480
gaccaagaat tagatattaa tcgtttaagt gattatgatg tcgatgccat tgttccacaa 3540
agtttcctta aagacgattc aatagacaat aaggtcttaa cgcgttctga taaaaatcgt 3600
ggtaaatcgg ataacgttcc aagtgaagaa gtagtcaaaa agatgaaaaa ctattggaga 3660
caacttctaa acgccaagtt aatcactcaa cgtaagtttg ataatttaac gaaagctgaa 3720
cgtggaggtt tgagtgaact tgataaagct ggttttatca aacgccaatt ggttgaaact 3780
cgccaaatca ctaagcatgt ggcacaaatt ttggatagtc gcatgaatac taaatacgat 3840
gaaaatgata aacttattcg agaggttaaa gtgattacct taaaatctaa attagtttct 3900
gacttccgaa aagatttcca attctataaa gtacgtgaga ttaacaatta ccatcatgcc 3960
catgatgcgt atctaaatgc cgtcgttgga actgctttga ttaagaaata tccaaaactt 4020
gaatcggagt ttgtctatgg tgattataaa gtttatgatg ttcgtaaaat gattgctaag 4080
tctgagcaag aaataggcaa agcaaccgca aaatatttct tttactctaa tatcatgaac 4140
ttcttcaaaa cagaaattac acttgcaaat ggagagattc gcaaacgccc tctaatcgaa 4200
actaatgggg aaactggaga aattgtctgg gataaagggc gagattttgc cacagtgcgc 4260
aaagtattgt ccatgcccca agtcaatatt gtcaagaaaa cagaagtaca gacaggcgga 4320
ttctccaagg agtcaatttt accaaaaaga aattcggaca agcttattgc tcgtaaaaaa 4380
gactgggatc caaaaaaata tggtggtttt gatagtccaa cggtagctta ttcagtccta 4440
gtggttgcta aggtggaaaa agggaaatcg aagaagttaa aatccgttaa agagttacta 4500
gggatcacaa ttatggaaag aagttccttt gaaaaaaatc cgattgactt tttagaagct 4560
aaaggatata aggaagttaa aaaagactta atcattaaac tacctaaata tagtcttttt 4620
gagttagaaa acggtcgtaa acggatgctg gctagtgccg gagaattaca aaaaggaaat 4680
gagctggctc tgccaagcaa atatgtgaat tttttatatt tagctagtca ttatgaaaag 4740
ttgaagggta gtccagaaga taacgaacaa aaacaattgt ttgtggagca gcataagcat 4800
tatttagatg agattattga gcaaatcagt gaattttcta agcgtgttat tttagcagat 4860
gccaatttag ataaagttct tagtgcatat aacaaacata gagacaaacc aatacgtgaa 4920
caagcagaaa atattattca tttatttacg ttgacgaatc ttggagctcc cgctgctttt 4980
aaatattttg atacaacaat tgatcgtaaa cgatatacgt ctacaaaaga agttttagat 5040
gccactctta tccatcaatc catcactggt ctttatgaaa cacgcattga tttgagtcag 5100
ctaggaggtg actctggagg atctagcgga ggatcctctg gcagcgagac accaggaaca 5160
agcgagtcag caacaccaga gagcagtggc ggcagcagcg gcggcagcag catggctctc 5220
atcccagact tggccatgga aacctggctt ctcctggctg tcagcctggt gctcctctat 5280
ctatatggaa cccattcaca tggacttttt aagaagcttg gaattccagg gcccacacct 5340
ctgccttttt tgggaaatat tttgtcctac cataagggct tttgtatgtt tgacatggaa 5400
tgtcataaaa agtatggaaa agtgtggggc ttttatgatg gtcaacagcc tgtgctggct 5460
atcacagatc ctgacatgat caaaacagtg ctagtgaaag aatgttattc tgtcttcaca 5520
aaccggaggc cttttggtcc agtgggattt atgaaaagtg ccatctctat agctgaggat 5580
gaagaatgga agagattacg atcattgctg tctccaacct tcaccagtgg aaaactcaag 5640
gagatggtcc ctatcattgc ccagtatgga gatgtgttgg tgagaaatct gaggcgggaa 5700
gcagagacag gcaagcctgt caccttgaaa gacgtctttg gggcctacag catggatgtg 5760
atcactagca catcatttgg agtgaacatc gactctctca acaatccaca agaccccttt 5820
gtggaaaaca ccaagaagct tttaagattt gattttttgg atccattctt tctctcaata 5880
acagtctttc cattcctcat cccaattctt gaagtattaa atatctgtgt gtttccaaga 5940
gaagttacaa attttttaag aaaatctgta aaaaggatga aagaaagtcg cctcgaagat 6000
acacaaaagc accgagtgga tttccttcag ctgatgattg actctcagaa ttcaaaagaa 6060
actgagtccc acaaagctct gtccgatctg gagctcgtgg cccaatcaat tatctttatt 6120
tttgctggct atgaaaccac gagcagtgtt ctctccttca ttatgtatga actggccact 6180
caccctgatg tccagcagaa actgcaggag gaaattgatg cagttttacc caataaggca 6240
ccacccacct atgatactgt gctacagatg gagtatcttg acatggtggt gaatgaaacg 6300
ctcagattat tcccaattgc tatgagactt gagagggtct gcaaaaaaga tgttgagatc 6360
aatgggatgt tcattcccaa aggggtggtg gtgatgattc caagctatgc tcttcaccgt 6420
gacccaaagt actggacaga gcctgagaag ttcctccctg aaagattcag caagaagaac 6480
aaggacaaca tagatcctta catatacaca ccctttggaa gtggacccag aaactgcatt 6540
ggcatgaggt ttgctctcat gaacatgaaa cttgctctaa tcagagtcct tcagaacttc 6600
tccttcaaac cttgtaaaga aacacagatc cccctgaaat taagcttagg aggacttctt 6660
caaccagaaa aacccgttgt tctaaaggtt gagtcaaggg atggcaccgt aagtggagcc 6720
cccaagaaga agaggaaagt ctgaatcggt aggaattcgc ggccgtctag acttaagttt 6780
aaaccgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 6840
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 6900
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 6960
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 7020
tatggcttct gaggcggaaa gaaccagctg gggctctagg gggtatcccc acgcgccctg 7080
tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 7140
cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 7200
ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 7260
gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 7320
atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 7380
ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 7440
gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaatta 7500
attctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc agcaggcaga 7560
agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc 7620
ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat agtcccgccc 7680
ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc 7740
tgactaattt tttttattta tgcagaggcc gaggccgcct ctgcctctga gctattccag 7800
aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctccc gggagcttgt 7860
atatccattt tcggatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa 7920
gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg 7980
gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc 8040
ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca 8100
gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc 8160
actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca 8220
tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat 8280
acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca 8340
cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg 8400
ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc 8460
gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct 8520
ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct 8580
acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac 8640
ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc 8700
tgagcgggac tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 8760
atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 8820
ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccaact 8880
tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 8940
aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 9000
atgtctgtat accgtcgacc tctagctaga gcttggcgta atcatggtca tagctgtttc 9060
ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 9120
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 9180
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 9240
ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 9300
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 9360
cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 9420
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 9480
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 9540
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 9600
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 9660
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 9720
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 9780
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 9840
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 9900
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 9960
gcaaacaaac caccgctggt agcggttttt ttgtttgcaa gcagcagatt acgcgcagaa 10020
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 10080
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 10140
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 10200
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 10260
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 10320
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 10380
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 10440
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 10500
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 10560
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 10620
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 10680
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 10740
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 10800
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 10860
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 10920
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 10980
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 11040
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 11100
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 11160
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt c 11201

Claims (10)

1.融合蛋白,其特征在于,所述融合蛋白包括dCas9蛋白和CYP3A4蛋白。
2.根据权利要求1所述的融合蛋白,其特征在于,
所述dCas9蛋白为如下A1)或A2):
A1)氨基酸序列是SEQ ID No.1的蛋白质;
A2)将SEQ ID No.1所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
和/或,所述CYP3A4蛋白为如下B1)或B2:
B1)氨基酸序列是SEQ ID No.2的蛋白质;
B2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质。
3.根据权利要求1或2所述的融合蛋白,其特征在于,所述CYP3A4蛋白与所述dCas9蛋白的C末端连接或所述CYP3A4蛋白与所述dCas9蛋白的C末端通过接头连接。
4.根据权利要求1-3任一项所述的融合蛋白,其特征在于,所述融合蛋白的氨基酸序列如SEQ ID No.3所示。
5.生物材料,其特征在于,所述生物材料为下述任一种:
C1)编码权利要求1-4中任一项所述融合蛋白的核酸分子;
C2)含有C1)所述核酸分子的表达盒;
C3)含有C1)所述核酸分子的重组载体、或含有C2)所述表达盒的重组载体;
C4)含有C1)所述核酸分子的重组微生物、或含有C2)所述表达盒的重组微生物、或含有C3)所述重组载体的重组微生物;
C5)含有C1)所述核酸分子的重组细胞、或含有C2)所述表达盒的重组细胞、或含有C3)所述重组载体的重组细胞;
C6)编码所述dCas9蛋白的核酸分子;
C7)编码所述CYP3A4蛋白的核酸分子。
6.根据权利要求5所述的生物材料,其特征在于,所述核酸分子为下述任一种:
D1)编码序列是SEQ ID No.4的第1009-5112位所示的DNA分子;
D2)编码序列是SEQ ID No.4的第5212-6720位所示的DNA分子;
D3)编码序列是SEQ ID No.4的第1009-6720位所示的DNA分子;
D4)与D1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述dCas9蛋白的DNA分子;
D5)与D2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述CYP3A4蛋白的DNA分子;
D6)与D3)限定的核苷酸序列具有75%或75%以上同一性,且编码所述融合蛋白的DNA分子。
7.根据权利要求5或6所述的生物材料,其特征在于,所述重组载体的核苷酸序列为SEQID No.4。
8.一种基因编辑系统,其特征在于,所述基因编辑系统包括权利要求5-7中任一项所述的重组载体、sgRNA表达载体和黄曲霉毒素B1。
9.利用权利要求8所述的基因编辑系统进行定点突变的方法,其特征在于,所述方法包括以下步骤:用表达权利要求1-4中任一项所述融合蛋白的重组载体和表达靶位点特异的sgRNA表达载体转染宿主细胞,用黄曲霉毒素B1诱导所述靶位点的核苷酸产生突变。
10.权利要求1-4中任一项所述的融合蛋白,和/或,权利要求5-7中任一项所述的生物材料,和/或,权利要求8所述的基因编辑系统在基因编辑中的应用和/或在靶位点对DNA进行突变中的应用。
CN202110927367.8A 2021-08-10 2021-08-10 一种利用dCas9-p450系统进行定点突变的方法 Pending CN115704016A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110927367.8A CN115704016A (zh) 2021-08-10 2021-08-10 一种利用dCas9-p450系统进行定点突变的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110927367.8A CN115704016A (zh) 2021-08-10 2021-08-10 一种利用dCas9-p450系统进行定点突变的方法

Publications (1)

Publication Number Publication Date
CN115704016A true CN115704016A (zh) 2023-02-17

Family

ID=85180998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110927367.8A Pending CN115704016A (zh) 2021-08-10 2021-08-10 一种利用dCas9-p450系统进行定点突变的方法

Country Status (1)

Country Link
CN (1) CN115704016A (zh)

Similar Documents

Publication Publication Date Title
KR102606929B1 (ko) 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스
CN110656090B (zh) 一种表达质粒、用于包装容量增加的二代腺病毒的细胞株及其应用
KR102007061B1 (ko) 다중 면역 스크리닝 분석
KR100886312B1 (ko) 단백질-단백질의 상호작용을 분석하는 방법
CN113186167B (zh) 用于测定抗cd20单克隆抗体药物adcp生物学活性的方法
CN112626127B (zh) 一种重组慢病毒载体及其制备方法与应用
KR102614328B1 (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
KR20220002910A (ko) 효율적인 rna 트랜스-스플라이싱을 위한 삼중 나선 종결인자
CN113637724B (zh) SARS-CoV-2冠状病毒3C蛋白酶活性抑制剂的筛选方法及筛选试剂盒
KR20190076992A (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
CN113548984B (zh) 一种非天然氨基酸及其应用、包含其的重组蛋白以及重组蛋白偶联物
CN113584084A (zh) 一种人肝纤维化诱导模型的工具细胞株构建方法
CN115704016A (zh) 一种利用dCas9-p450系统进行定点突变的方法
CN112029797B (zh) 一种哺乳动物启动子活性评价质粒载体及应用
CN113582881B (zh) 一种非天然氨基酸及其应用、包含其的重组蛋白以及重组蛋白偶联物
US7790692B2 (en) Hepatocyte growth factor nucleic acid sequence to enhance musculocutaneous flap survival
CN115490769B (zh) 抗slc7a11蛋白的单克隆抗体、杂交瘤细胞系及用途
CN114807226A (zh) 一种表达犬il-12的重组质粒及表达犬il-12蛋白的细胞株的制备方法和应用
CN102698291A (zh) 一种可提高细胞免疫应答的布鲁菌抗原基因组合rob
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
US20080166748A1 (en) Method of Identifying Protein CAMs (Constitutively active mutants)
CN114231513B (zh) 一种可抑制蛋白酶体psmb5亚基活性的短肽及其在抗立克次体感染中的应用
CN113969287B (zh) 重组单纯疱疹病毒的亲和筛选细胞系及其构建方法和应用
CN114805537A (zh) 一种表达犬白介素6的重组质粒、稳定表达犬白介素6蛋白的细胞株及其制备方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination