CN108715861A - 一种碱基编辑工具及其应用 - Google Patents

一种碱基编辑工具及其应用 Download PDF

Info

Publication number
CN108715861A
CN108715861A CN201810388981.XA CN201810388981A CN108715861A CN 108715861 A CN108715861 A CN 108715861A CN 201810388981 A CN201810388981 A CN 201810388981A CN 108715861 A CN108715861 A CN 108715861A
Authority
CN
China
Prior art keywords
base
dna
artificial sequence
edit tool
ugi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810388981.XA
Other languages
English (en)
Other versions
CN108715861B (zh
Inventor
冯松杰
江雯
黄行许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810388981.XA priority Critical patent/CN108715861B/zh
Publication of CN108715861A publication Critical patent/CN108715861A/zh
Application granted granted Critical
Publication of CN108715861B publication Critical patent/CN108715861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety

Abstract

本发明提供了一种碱基编辑工具及其应用。所述的碱基编辑工具,其特征在于,包括:多拷贝的GCN4与D10A‑Cas9连接形成的GCN4‑D10A;胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv‑APOBEC‑UGI载体或胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI以及防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv‑APOBEC‑UGI‑GB1载体。以及靶向特异位点的sgRNA。本发明相较于普遍使用的碱基编辑工具,显著地增加了碱基编辑的窗口,进而扩大了碱基编辑在基因组的应用范围。

Description

一种碱基编辑工具及其应用
技术领域
本发明涉及一种新型碱基编辑工具,属于基因编辑领域,更具体地说涉及基于CRISPR系统与碱基脱氨酶结合进行特异性碱基替换的工具。
背景技术
基因编辑是通过在DNA上特定位点引入序列改变,达到基因的敲除或者外源DNA片段插入的技术手段。目前可编程的核酸酶主要包括三种,早期的锌指核糖核酸酶(ZFN)系统、类转录激活因子效应物核酸酶(TALEN)系统和现在普遍使用的CRISPR-Cas9系统1。CRISPR-Cas9基因编辑系统操作简单,仅需改变sgRNA的靶向序列就能在新的靶向位点上进行基因编辑,因此被迅速广泛应用于基因功能研究,细胞或动物水平的疾病造模以及基因治疗2-7
在基因编辑过程中,尽管CRISPR-Cas9能基于同源重组(HDR)机制在供体模板DNA的介导下引入碱基突变或者片段的插入,进而获得感兴趣的突变或者达到基因修复的目的。但CRISPR-Cas9也会通过非同源末端连接(NHEJ)引入不可控的插入或缺失突变(indels)。两种修复机制之间的竞争也导致同源重组效率不高。为了提高碱基突变的效率,一种通过将胞嘧啶脱氨酶融合在dCas9蛋白上,在不引起双链断裂的情况下高效的获得碱基定点突变的工具被研发出来。这种新型工具被称为碱基编辑工具8-12
尽管碱基编辑技术近年才出现,但已经被广泛用于许多领域。比如利用BE3 系统以碱基编辑方式成功修复了与乳腺癌相关基因TP53上的一个碱基突变,以及与阿兹海默症相关基因APOE4上的一个碱基突变8。碱基编辑工具在农作物中也具有碱基编辑效率,提供了一种新的育种策略13-15。由于碱基编辑工具能引起定点的突变,在sgRNA库的靶向作用下通过对内源基因主要结构或功能位点进行饱和突变,选取合适的筛选条件,可得到定向进化的蛋白。由于蛋白进化是在胞内进行,将碱基编辑工具用于蛋白进化操作更方便,真正筛选出特定功能的蛋白10,16。碱基编辑工具还能在不引起DNA双链断裂的情况下敲除基因,通过碱基编辑C-to-T使密码子CAG,CGA,CAA和TGG突变为终止密码子TAG,TGA和TAA,导致翻译提前终止达到基因敲除的目的。这种策略被称为iSTOP,这些可被突变成终止密码子的密码子被称为iSTOP-codon。由于不导致DNA双链断裂,利用iSTOP策略做基因敲除能避免在高拷贝位点产生过多DNA双链断裂(DSB)进而引起细胞死亡17,18
基于CRISPR-Cas9的碱基编辑工具扩展了CRISPR-Cas9在基因编辑的应用范围。但现有的碱基编辑工具,普遍存在由于编辑窗口小及PAM序列的限制无法对更多的感兴趣的位点进行编辑。虽然通过改造SpCas9识别不同的PAM可提高覆盖范围,但相较野生型SpCas9对PAM序列NGG的特异性识别,改造版本的SpCas9-BE3对其他PAM的识别效率仍然较低,导致在这些位点的编辑效率不够高效。
SunTag系统是一种信号放大系统,最早用于活细胞成像领域。通过在dCas9 羧基端融合10份拷贝GCN4抗原表位,招募scFv-GFP到靶向位点,极大放大了靶向位点的荧光信号,成像具有较高的信噪比19。基于SunTag系统的转录激活工具SPH将scFv-GFP替换为scFv-P65-HSF,通过靶向基因的启动子区激活基因表达20。另一种基于SunTag的表观遗传工具scFv-TET1通过在调控元件上主动去甲基化上调基因表达21
本发明利用SunTag系统的信号放大策略研发出新型碱基编辑工具BE-PLUS,通过招募10个拷贝的胞嘧啶脱氨酶rAPOBEC1和尿嘧啶糖基化酶抑制物UGI 到靶向位点来对特定位点进行碱基编辑。BE-PLUS保持高效的碱基编辑效率同时又扩大碱基编辑窗口,提高了碱基编辑的准确性。
参考文献
1 Kim,H.&Kim,J.S.A guide to genome engineering with programmablenucleases.Nat Rev Genet 15,321-334,doi:10.1038/nrg3686(2014).
2 Cho,S.W.,Kim,S.,Kim,J.M.&Kim,J.S.Targeted genome engineering inhuman cells with the Cas9 RNA-guided endonuclease.Nat Biotechnol 31,230-232,doi:10.1038/nbt.2507(2013).
3 Cong,L.et al.Multiplex genome engineering using CRISPR/Cassystems.Science 339, 819-823,doi:10.1126/science.1231143(2013).
4 Hwang,W.Y.et al.Efficient genome editing in zebrafish using aCRISPR-Cas system. Nat Biotechnol 31,227-229,doi:10.1038/nbt.2501(2013).
5 Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA-guidedediting of bacterial genomes using CRISPR-Cas systems.Nat Biotechnol 31,233-239, doi:10.1038/nbt.2508(2013).
6 Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-826,doi:10.1126/science.1232033(2013).
7 Jinek,M.et al.RNA-programmed genome editing in human cells.eLife 2,e00471, doi:10.7554/eLife.00471(2013).
8 Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R.Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533, 420-424,doi:10.1038/nature17946(2016).
9 Nishida,K.et al.Targeted nucleotide editing using hybridprokaryotic and vertebrate adaptive immune systems.Science 353,doi:10.1126/science.aaf8729(2016).
10 Hess,G.T.et al.Directed evolution using dCas9-targeted somatichypermutation in mammalian cells.Nat Methods 13,1036-1042,doi:10.1038/nmeth.4038(2016).
11 Chadwick,A.C.,Wang,X.&Musunuru,K.In Vivo Base Editing of PCSK9(Proprotein Convertase Subtilisin/Kexin Type 9)as a Therapeutic Alternativeto Genome Editing. Arteriosclerosis,thrombosis,and vascular biology 37,1741-1747, doi:10.1161/atvbaha.117.309881(2017).
12 Kim,D.et al.Genome-wide target specificities of CRISPR RNA-guidedprogrammable deaminases.Nat Biotechnol 35,475-480,doi:10.1038/nbt.3852(2017).
13 Lu,Y.&Zhu,J.K.Precise Editing of a Target Base in the Rice GenomeUsing a Modified CRISPR/Cas9 System.Molecular plant 10,523-525, doi:10.1016/i.molp.2016.11.013(2017).
14 Shimatani,Z.et a,.Targeted base editing in rice and tomato using aCRISPR-Cas9 cytidine deaminase fusion.Nat Biotechnol 35,441-443,doi:10.1038/nbt.3833(2017).
15 Zong,Y.et al.Precise base editing in rice,wheat and maize with aCas9-cytidine deaminase fusion.Nat Biotechnol 35,438-440,doi:10.1038/nbt.3811(2017).
16 Ma,Y.et al.Targeted AID-mediated mutagenesis(TAM)enables efficientgenomic diversification in mammalian cells.Nat Methods 13,1029-1035,doi:10.1038/nmeth.4027 (2016).
17 Billon,P.et al.CRISPR-Mediated Base Editing Enables EfficientDisruption of Eukaryotic Genes through Induction of STOP Codons.Molecularcell 67, 1068-1079.e1064,doi:10.1016/j.molcel.2017.08.008(2017).
18 Kuscu,C.et al.CRISPR-STOP:gene silencing through base-editing-induced nonsense mutations.Nat Methods 14,710-712,doi:10.1038/nmeth.4327(2017).
19 Tanenbaum,M.E.,Gilbert,L.A.,Qi,L.S.,Weissman,J.S.&Vale,R.D.Aprotein-tagging system for signal amplification in gene expression andfluorescence imaging.Cell 159,635-646,doi:10.1016/j.cell.2014.09.039(2014).
20 Zhou,H.et al.In vivo simultaneous transcriptional activation ofmultiple genes in the brain using CRISPR-dCas9-activator transgenicmice.Nature Neuroscience 21,440-446, doi:10.1038/s41593-017-0060-6(2018).
21 Choudhury,S.R.,Cui,Y.,Lubecka,K.,Stefanska,B.&Irudayaraj,J.CRISPR-dCas9 mediated TET1 targeting fbr selective DNA demethylation at BRCA1promoter. Oncotarget 7,46545-46556,doi:10.18632/oncotarget.10234(2016).
发明内容
本发明的目的是研发新型碱基工具,增加碱基编辑的窗口和准确性。
为了达到上述目的,本发明采用了如下技术方案:
一种碱基编辑工具(BE-PLUS),其特征在于,包括:①多拷贝的GCN4与 D10A-Cas9连接形成的GCN4-D10A载体;②胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv-APOBEC-UGI载体或胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI以及防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv-APOBEC-UGI-GB1载体。
优选地,所述的碱基编辑工具还包括sgRNA载体,更优选地,包括靶向特异位点的sgRNA。
优选地,所述的多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A为 10个拷贝的GCN4与D10A-Cas9连接。
优选地,所述的与D10A-Cas9连接的多拷贝GCN4招募scFv-APOBEC-UGI 或scFv-APOBEC-UGI-GB1载体,在sgRNA的引导下在靶向位点做碱基编辑,进而增加靶向位点碱基编辑的窗口和准确性。
本发明还提供了上述的碱基编辑工具在真核生物里做碱基编辑中的应用。
优选地,所述的应用包括但不限于:用于引入提前的终止密码子来做基因敲除、用于产生随机突变用于蛋白进化,药物靶点筛选或者基因组调控元件筛选中的至少一种。
与现有技术相比,本发明的有益效果是:
1、本发明的碱基工具BE-PLUS,可以增加碱基编辑的窗口和准确性。
2、本发明的碱基工具具有较宽的碱基编辑窗口,因此在基因组里拥有更大的碱基编辑范围。此外BE-PLUS还具有更高的碱基编辑准确性,产生更少的插入或缺失突变(indel)以及碱基编辑副产物C-to-A/G突变。
3、本发明的碱基工具BE-PLUS在脱靶位点碱基编辑效率更低。
4、本发明的碱基工具BE-PLUS在靶向位点以外非特异性突变更少,编辑的靶向特异性更高。
5、本发明的碱基工具BE-PLUS拥有更多用于诱导生成终止密码子的sgRNA 和codon,敲除更多的基因。通过生物信息学分析发现BE-PLUS能敲除更多的基因,而且拥有更多用于诱导终止密码子的sgRNA和密码子。在内源基因中的基因敲除结果也验证了BE-PLUS做敲除基因的优势。
附图说明
图1为BE-PLUS示意图。
图2为BE-PLUS在内源基因位点编辑的deep-seq测序分析结果。
图3为BE-PLUS在内源基因里的碱基编辑窗口。
图4为BE-PLUS在全基因组里的碱基编辑范围。
图5为BE-PLUS碱基编辑产生的indel水平。
图6a为BE-PLUS碱基编辑产物比例;图6b为碱基编辑副产物C-to-A/G的突变频率。
图7a-c为BE3和BE-PLUS在三个内源基因on-target及off-target位点胞嘧啶的碱基编辑频率。图7d为BE3和BE-PLUS系统在off-target位点的标准化突变效率。
图8a为BE-PLUS在非靶向位点的突变分布;图8b为靶向位点周围的突变效率。
图9为BE-PLUS用于诱导产生终止密码子的iSTOP-codon和sgRNA数量。
图10为BE-PLUS在内源基因引入终止密码子的测序结果。10a为PCR的Sanger 测序结果;10b为T-A克隆测序结果。
具体实施方式
如下通过实施例对本发明做进一步解释说明。所描述的实施例仅用于说明本发明的特征,不因此限制本发明。他人一些非本质替换或改进在本发明的保护范围内。实施例中未注明厂商的试剂或仪器均可通过市场购买获得。未详细注明的实验方法,按照常规条件或试剂厂商推荐的方法实施。
实施例1
1.BE-PLUS系统质粒的构建
由金唯智生物科技有限公司合成10份拷贝的GCN4序列(10XGCN4),克隆于pUC57载体里得到pUC57-10XGCN4载体,稀释至10μM作为PCR模板。设计正向引物带有NheI酶切位点GCTGGCTAGCACCATGGGACCCAAGAAAAAACGCAAGGTGGAAG,反向引物带有XbaI酶切位点GTCTCTAGACACCTTGCGCTTCTTCTTGGGTCC,加水溶解至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增10XGCN4 序列片段。扩增体系和PCR反应条件如所示:
PCR扩增产物经通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G) 纯化回收后取1μg,用NheI(NEB,R0131S)和XbaI(NEB,R0145S)做酶切,37℃孵育2h。另取pST1374-N-NLS-flag-linker-Cas9-D10A(Addgene#51130)载体1μg,用NheI(NEB,R0131S)和XbaI(NEB,R0145S)做酶切,37℃孵育2h。酶切体系如下:
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)做割胶回收,并通过T4连接酶(NEB,M0202S)连接,连接体系如下
连接产物在16℃孵育2h,转化涂板,经Sanger测序得到正确的GCN4-D10A 质粒,序列信息见SEQ ID NO:1。
由金唯智生物科技有限公司合成APOBEC-UGI-GB1的核苷酸序列10,并克隆至pUC57载体里得到pUC57-APOBEC-UGI-GB1载体,稀释至10μM作为 PCR模板。设计PCR正向引物 CGGCGGATCCAGCGGCAGCGAGACTCCCGGGACCTCAGAGTCCGCCACAC CCGAAAGT和反向引物AAGGGCCCTCCTGCAGCTCCACCGCTCGAGACTTTCCTCTTCTTCTTGG,稀释至10μM。使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增 APOBEC-UGI-GB1片段。PCR产物片段序列见附录序列表。PCR反应体系和条件如下所示:
APOBEC-UGI-GB1的扩增产物通过AxyPrep PCR Clean-up试剂盒(Axygen, AP-PCR-500G)纯化回收后取1μg,用BamHI-HF(NEB,R3136S)和XhoI(NEB, R0146S)做酶切,37℃孵育2h。另取pST1374-scFv载体1μg,用BamHI-HF(NEB, R3136S)和XhoI(NEB,R0146S)做酶切,37℃孵育2h。酶切体系如下所示:
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)做割胶回收,并通过T4连接酶(NEB,M0202S)连接,16℃孵育2h,转化涂板,经Sanger 测序得到scFv-APOBEC-UGI-GB1质粒,序列信息见附录序列表SEQ ID NO:2。
利用BE-PLUS针对人293FT细胞的7个内源基因位点(DNMT3B,EMX1, FAP,IDO1,MYOD1,PPEF2,IGF1)做碱基编辑,内源基因靶向位点序列如见附录序列表SEQ ID:3-9所示。根据靶向位点序列设计20个碱基互补配对的上下游引物,加灭菌水溶解至100μM。经退火后连接到pGL3-U6-sgRNA (Addgene#51133)载体上,以构建靶向特异性sgRNA。sgRNA的引物序列见附录序列表表SEQ ID:10-23所示。退火体系和退火程序如下所示:
利用BsaI(NEB,R0535S)对pGL3-U6-sgRNA(Addgene#51133)质粒进行酶切以得到线性化sgRNA载体。酶切体系如下所示:
酶切产物用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)做割胶回收得到线性化载体。取50ng线性化载体与3μl退火产物通过T4连接酶(NEB, M0202S)连接,16℃孵育2小时后并转化涂板,经Sanger测序得到正确的靶向特异性sgRNA。连接体系如下:
BE-PLUS示意图如图1所示。
2.BE-PLUS系统在内源基因位点的碱基编辑
利用上述的BE-PLUS系统转染293FT细胞,过程如下:
1)HEK293FT细胞(来自ATCC)复苏,在10cm培养皿(Coming,430167) 中培养,培养基为混有10%的胎牛血清(HyClone,SV30087)的DMEM(HyClone, SH30243.01)。培养温度为37℃,二氧化碳浓度为5%。多次传代后当细胞密度为80%时,细胞分盘至12孔板。12孔板使用前用1∶10稀释的多聚赖氨酸溶液 (Sigma,P4707-50ML)包被处理。
2)当细胞浓度为80%时,用10%血清的DMEM培养基换液,培养2小时使细胞状态恢复最佳。每孔转染的质粒的量分别是GCN4-D10A质粒1μg, scFv-APOBEC-UGI-GB1质粒1μg,内源基因的靶向sgRNA质粒0.5μg。将质粒混在100μl的Opti-MEM(Gibco,11058021)培养基。以BE3系统做阳性对照组,每孔加pCMV-BE3(Addgene#73021)2μg,sgRNA0.5μg。
3)将6μl的Lipofectamine 2000转染试剂(Thermo,11668019)混入100μl 的Opti-MEM培养基,静置5分钟。
4)将混有质粒的Opti-MEM加入混有Lipofectamine 2000的Opti-MEM,慢速吹打混匀,静置20分钟。
5)将混有质粒和Lipofectamine 2000的Opti-MEM分别加入12孔板。
6)转染6小时后用10%FBS的DMEM换液。
7)转染24小时后,用终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1) 做药杀处理。
8)转染72小时后收细胞,酚氯仿法抽取基因组DNA。
以7个内源基因靶向位点上下游各100bp分别设计并合成PCR引物,加水稀释至10μM。PCR引物序列见附录序列表SEQ ID:24-37所示。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)PCR扩增各基因组靶向位点片段。PCR反应体系和PCR程序如下所示:
PCR产物样品用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)做割胶回收,去除非特异性条带。BE3和GCN4-D10A两个碱基编辑工具作用下的 7个内源基因PCR样品各取100ng送deep-seq测序以验证各碱基编辑工具的突变效率。测序结果统计如图2所示。
3.BE-PLUS的碱基编辑窗口更宽
为了获得BE3和BE-PLUS在内源基因上的碱基编辑窗口,本发明系统分析了7个内源基因所有胞嘧啶的碱基编辑频率。BE3的碱基编辑窗口为C4-C8,而 BE-PLUS的碱基编辑窗口为C4-C16,如图3所示。因此在内源基因上,BE-PLUS 具有较大的碱基编辑窗口。
4.BE-PLUS在人类基因组里的编辑范围更大
由于BE-PLUS拥有扩大的碱基编辑窗口,推测基因组里更多的胞嘧啶可以被编辑,即BE-PLUS增加了全基因组范围可编辑的位点。为了验证该假设,将 BE3的碱基编辑窗口设置为C4-C8,BE-PLUS的编辑窗口设置为C4-C16,以 NGG作为PAM序列通过生物信息学分析人类基因组中能分别被BE3和 BE-PLUS编辑的所有胞嘧啶或鸟嘌呤,统计结果如图4所示。BE3限于碱基编辑的窗口只有C4-C8,只有20.4%的胞嘧啶或鸟嘌呤可以被编辑。而BE-PLUS 由于扩大了碱基编辑窗口,将可编辑的胞嘧啶或鸟嘌呤范围扩大至42.2%。因此 BE-PLUS扩大了碱基编辑在基因组的使用范围。
5.BE-PLUS在碱基编辑过程中产生indel水平更低
碱基编辑工具如BE3在碱基编辑时往往会产生插入或缺失(indels),为了确认BE-PLUS系统是否也会产生indel,从deep-seq数据中分析了BE3和BE-PLUS 两个碱基编辑系统在各内源基因里的indel水平。统计结果如图5所示。在 DNMT3B位点,BE-PLUS和BE3引起的indel水平为2.11%vs.17.63%,P值小于0.01;在EMX1位点为1.83%vs.5.28%,P值小于0.05;在FAP位点为0.3% vs.1.62%,P值小于0.05;在IDO1位点为0.42%vs.0.51%,P值小于0.05;在 MYOD位点为0.32%vs.4.44%,P值小于0.01;在PPEF2位点为0.34%vs.0.97%,P值小于0.0001;在IGF1位点为0.62%vs.2.91%,P值小于0.05。在IDO1位点,两个系统的indel水平都保持很低。但在另外6个位点上BE-PLUS的indel水平均显著小于BE3。
6.BE-PLUS碱基编辑的准确性更高
碱基编辑工具如BE3在C-to-T编辑过程中还会产生C-to-G或C-to-A副产物,进而影响碱基编辑的准确性。为了验证BE-PLUS是否也会产生C-to-G或C-to-A 副产物,本发明分析了BE2和BE-PLUS各位点胞嘧啶突变为腺嘌呤,鸟嘌呤和胸腺嘧啶的比例。分析结果如图6a所示,BE-PLUS在各位点产生的副产物成分和比例都要小于BE3。BE-PLUS和BE3的副产物比例为0.73%vs.2.63%,P值小于0.001,如图6b所示。BE-PLUS碱基编辑的副产物显著低于BE3,因此BE-PLUS 在碱基编辑过程中更准确。
7.分析BE-PLUS的off-target效应
为了进一步验证BE-PLUS的碱基编辑特性,本发明首先分析了BE-PLUS的 off-target效应。本发明随机挑选三个基因DNMT3B,EMX1和MYOD1的13个 off-target位点,序列如附录序列表SEQ ID:38-50所示。BE3和BE-PLUS (GNC4-D10A)在13个off-target位点的deep-seq测序统计结果如图7a-c所示。本发明可以看到,相对于DNMT3B和MYOD1位点on-target位点的高效碱基编辑,BE3和BE-PLUS在DNMT3B和MYOD1的off-target位点的编辑效率都很低。值得注意的是,在EMX1位点,BE3和BE-PLUS在off-target 2位点都有较高的碱基编辑发生。系统统计在所有off-target位点的突变频率,本发明发现 BE-PLUS和BE3的off-target效率为7.9%vs.11.1%,P值大于0.05,如图7d所示。因此BE-PLUS同样具有较低的off-target效应。
8.BE-PLUS拥有更高的靶向特异性
为了验证BE-PLUS是否会引起基因组本底水平的突变率升高。本发明分析了在7个on-target位点和13和off-target位点上下游各100bp距离的C-to-T和 G-to-A突变率。Deep-seq统计结果如图8a所示。在接近靶向位点附近,BE3非特异性突变较高,在其他位点,BE-PLUS和BE3具有相近的突变率。统计分析显示BE-PLUS和BE3的非靶向位点的突变率分别为0.013%vs.0.033%,P值小于0.001,如图8b所示。因此BE-PLUS在非靶向位点的碱基突变率更低。
9.BE-PLUS在内源基因敲除中具有优势
碱基编辑工具能在不引起DNA双链断裂的情况下敲除基因,通过碱基编辑 C-to-T使密码子CAG,CGA,CAA和TGG突变为终止密码子TAG,TGA和TAA,导致翻译提前终止达到基因敲除的目的,这种策略被称为iSTOP,这些可被突变成终止密码子的密码子被称为iSTOP-codon。BE-PLUS通过扩大碱基编辑的窗口进而扩大了碱基编辑在基因组中应用范围。本发明将BE3的碱基编辑窗口设置为C4-C8,BE-PLUS的编辑窗口设置为C4-C16,生物信息学分析全基因组BE3 和BE-PLUS可用的sgRNA和iSTOP-codon数量,如图9所示。
为了验证BE-PLUS在内源基因敲除的优势,本发明针对4个内源基因设计靶向sgRNA,通过iSTOP策略做基因敲除,iSTOP靶向位点序列如附录序列表 SEQ ID:51-54所示。根据靶向位点序列设计20个碱基互补配对的上下游引物,加灭菌水溶解至100μM。sgRNA上下游引物序列见附录序列表SEQ ID:55-62 所示。退火体系和退火程序如下所示:
取3μl退火产物与50ng线性化pGL3-U6-sgRNA载体通过T4连接酶(NEB, M0202S)连接,16℃孵育2小时后并转化涂板,经Sanger测序得到正确的靶向特异性sgRNA。连接体系如下:
将BE-PLUS系统与iSTOP-sgRNA一起转染293FT细胞,转染步骤如下:
1)HEK293FT细胞分盘至12孔板。12孔板使用前用1∶10稀释的多聚赖氨酸溶液(Sigma,P4707-50ML)包被处理。
2)当细胞浓度为80%时,用10%血清的DMEM培养基换液,培养2小时使细胞状态恢复最佳。每孔转染的质粒的量分别是GCN4-D10A质粒1μg,scFv-APOBEC-UGI-GB1质粒1μg,6内源基因的iSTOP-sgRNA质粒0.5μg。将质粒混在100μl的Opti-MEM(Gibco,11058021)培养基。以BE3系统做阳性对照组,每孔加pCMV-BE3(Addgene#73021)2μg,sgRNA 0.5μg。
3)将6μl的Lipofectamine 2000转染试剂(Thermo,11668019)混入100μl 的Opti-MEM培养基,静置5分钟。
4)将混有质粒的Opti-MEM加入混有Lipofectamine 2000的Opti-MEM,慢速吹打混匀,静置20分钟。
5)将混有质粒和Lipofectamine 2000的Opti-MEM分别加入12孔板。
6)转染6小时后用10%FBS的DMEM换液。
7)转染24小时后,用终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1) 做药杀处理。
8)转染72小时后收细胞,酚氯仿法抽取基因组DNA。
分别设计对各iSTOP-sgRNA靶向位点的PCR引物,PCR引物序列见附录序列表SEQID:63-70所示。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)扩增各基因组靶向位点片段。PCR反应体系和PCR程序如下所示:
PCR产物经通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G)纯化回收后取1μg,送Sanger测序分析,测序结果如图10a。
为进一步鉴定靶向位点终止密码子的形成,将PCR产物做T-A克隆测序。 T-A克隆步骤如下:
1)PCR纯化回收产物取500ng,用rTaq酶(Takara,R007B)做加A处理。37℃孵育30min,反应体系如下:
2)将加A产物通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G) 纯化回收后取1μl,与pMD19-T vector(TAKARA,3271)连接并转化涂板。
3)挑取单菌落,送Sanger测序,引物用通用引物M-1347,测序结果如图 10b所示。
综上,BE-PLUS是一种新型的碱基编辑工具,相较于普遍使用的碱基编辑工具,显著地增加了碱基编辑的窗口,进而扩大了碱基编辑在基因组的编辑范围。同时,BE-PLUS在碱基编辑过程中产生更少的indel和编辑副产物,因此BE-PLUS 拥有更高的碱基编辑准确性。BE-PLUS在非靶向位点的突变更少,编辑的靶向特异性更高。
序列表
<110> 上海科技大学
<120> 一种碱基编辑工具及其应用
<130> XXX
<160> 70
<170> SIPOSequenceListing 1.0
<210> 1
<211> 10602
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 1
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ccaagaaaaa acgcaaggtg gaagatccta agaaaaagcg gaaagtggac 960
ggcattggta gtgggagcaa cggcagcagc ggagaggaac tgctgagcaa gaactaccac 1020
ctggaaaacg aggtggccag actgaagaaa ggctctggct ctggcggaag cggttctggc 1080
ggatcaggat ctggaagtgg cggctctgga agcggaggtt ctggatctgg cgaagaactg 1140
ctgtctaaga attatcacct cgagaacgaa gtggctcggc tcaagaaagg cagtggcagc 1200
ggaggaagtg gatccggcgg tagtggtagt ggaagcggcg gatccggctc aggcggatct 1260
ggttcagggg aagaactcct ctccaaaaac taccatctcg agaatgaggt cgcccgcctg 1320
aaaaaaggat caggttccgg tggttctggc agcggtggtt caggctcagg cagcggcggt 1380
agcggtagcg gtggaagcgg aagcggagaa gaacttctca gcaaaaatta ccacttggag 1440
aatgaagttg caagactcaa aaaaggttcc ggcagtggcg gcagcggcag cggcggatct 1500
ggtagtggat ctggtggcag tggttcaggc ggaagtggta gcggagagga attgctctca 1560
aagaactatc atttggagaa cgaggttgca cgcttgaaga aaggcagcgg atcaggcgga 1620
tctggcagcg gtggatctgg ttctggatcc ggcggctccg gtagtggtgg aagtggctct 1680
ggggaagaat tgcttagcaa gaattatcat cttgaaaatg aggttgccag gcttaaaaaa 1740
ggcagtggct ccggcggatc cggaagcgga ggcagcggat ctggatctgg tggttcagga 1800
tctggcggtt ctggtagcgg ggaagaactg ttgagtaaaa actatcacct tgagaacgag 1860
gtcgcaaggt tgaaaaaagg atccggctct ggcggctccg gaagtggcgg atctggctcc 1920
ggtagcggag gatcaggatc cggcggaagc ggatcaggcg aggaactgct ttccaaaaat 1980
taccaccttg aaaacgaagt cgcccgcctc aagaaaggtt ctggcagcgg aggctctggc 2040
agtggtggta gcggaagtgg aagtggtggc agtggtagcg gtggatctgg aagcggcgag 2100
gaactcctgt caaagaatta ccatctcgaa aacgaggtcg caaggctcaa gaaaggctca 2160
ggatcaggcg gctctggatc cggcggttct ggttccggct caggtggaag tggatctggc 2220
ggctcaggtt ccggcgaaga attgctttcc aagaactacc atttggaaaa tgaagtcgct 2280
cgtttgaaga aaggttcagg ctccggccag cggccgcaag gtggaggtgg acccaagaag 2340
aagcgcaagg tgtctagaga caagaaatac tctattggac tggctatcgg gacaaactcc 2400
gttggctggg ccgtcataac cgacgagtat aaggtgccaa gcaagaaatt caaggtgctg 2460
ggtaatactg accgccattc aatcaagaag aacctgatcg gagcactcct cttcgactcc 2520
ggtgaaaccg ctgaagctac tcggctgaag cggaccgcaa ggcggagata cacccgccgc 2580
aagaatcgga tatgttatct gcaagagatc tttagcaacg aaatggctaa ggtggacgac 2640
tccttctttc accgcctgga agagagcttt ctggtggagg aggataagaa acacgagagg 2700
caccctatat tcggaaatat cgtggatgag gtggcttacc atgaaaagta tcctacaatc 2760
taccatctga ggaagaagct ggtggacagc accgataaag cagacctgag gctcatctat 2820
ctggccctgg ctcatatgat aaagtttaga ggacactttc tgatcgaggg cgacctgaat 2880
cccgataatt ccgatgtgga taaactcttc attcaactgg tgcagacata taaccaactg 2940
ttcgaggaga atcccataaa cgcttctggt gtggatgcca aggctattct gtccgctcgg 3000
ctgtccaagt cacgcagact ggagaatctg attgcccaac tgccaggaga aaagaagaac 3060
ggcctgtttg ggaacctcat cgccctgagc ctgggcctga cacctaactt caagtccaat 3120
tttgatctgg ccgaagatgc taaactccag ctctccaagg acacctatga cgatgatctg 3180
gacaacctgc tcgcacagat aggcgaccag tacgccgatc tctttctggc tgctaagaat 3240
ctctccgacg ccattctgct gagcgacata ctccgggtca acactgagat caccaaagca 3300
cctctgagcg cctccatgat aaaacgctat gatgaacacc atcaagacct gactctgctc 3360
aaagccctcg tgaggcaaca gctgccagag aagtacaaag agatattctt cgaccagagc 3420
aagaatggat atgccggata catcgatggc ggagcatcac aggaagaatt ttacaagttc 3480
atcaaaccaa tcctcgagaa gatggacggt actgaagagc tgctggtgaa gctgaacagg 3540
gaggacctgc tgaggaagca gaggaccttt gataatggct ccattccaca tcagatacac 3600
ctgggagagc tgcatgcaat cctccgcagg caggaggatt tctatccttt cctgaaggat 3660
aaccgggaga agatagagaa gatcctgacc ttcaggatcc cttattacgt cggccctctg 3720
gctagaggca actcccgctt cgcttggatg accaggaaat ctgaggagac aattactcct 3780
tggaacttcg aagaggtcgt ggataagggc gcaagcgccc agtcattcat cgaacggatg 3840
accaatttcg ataagaacct gcccaacgag aaggtcctgc ccaaacattc actcctgtac 3900
gagtatttca ccgtctataa cgagctgact aaagtgaagt acgtgaccga gggcatgagg 3960
aagcctgcct tcctgtccgg agagcagaag aaggctatcg ttgatctgct cttcaagact 4020
aatagaaagg tgacagtgaa gcagctcaag gaggattact ttaagaagat cgaatgcttt 4080
gactcagtgg aaatctctgg cgtggaggac cgctttaatg ccagcctggg cacttaccat 4140
gatctgctga agataatcaa agacaaagat ttcctcgata atgaggagaa cgaggacatc 4200
ctggaagata tcgtgctgac cctgactctg ttcgaggata gagagatgat cgaagagcgc 4260
ctgaagacct atgcccatct gtttgacgat aaagtcatga aacagctcaa gcggcggcgc 4320
tacactgggt ggggtagact ctccaggaaa ctcataaacg gcatccgcga caaacagagc 4380
ggaaagacca tcctggattt cctgaaatcc gacggattcg ctaacaggaa cttcatgcaa 4440
ctgattcacg atgactctct gacatttaaa gaggacatcc agaaggcaca ggtgagcggt 4500
caaggcgaca gcctgcacga gcacatcgcc aacctcgctg gatcacccgc cataaagaag 4560
ggaatactgc agacagtcaa ggtcgtggac gaactcgtca aagtgatggg tcggcacaag 4620
ccagagaata tcgttatcga aatggcaagg gagaaccaaa ccacccagaa gggccagaag 4680
aactctcggg aacggatgaa aagaatcgaa gagggaatta aggagctggg atctcagata 4740
ctgaaggagc accctgtgga gaatacacag ctccagaacg agaaactcta cctgtactac 4800
ctccagaacg ggcgggacat gtacgttgac caggaactcg acatcaaccg gctgtccgat 4860
tatgacgtgg accatattgt tccacagtcc ttcctcaaag atgactccat tgacaacaag 4920
gtgctgacca gatccgataa gaatcgcggt aagtctgaca atgttccatc agaagaggtg 4980
gtcaagaaga tgaagaatta ctggcggcag ctcctcaacg ccaaactgat cacccagcgg 5040
aagtttgaca atctgactaa ggcagaaaga ggaggtctga gcgaactcga caaggccggc 5100
tttattaaga ggcaactggt cgaaacacgc cagattacca aacacgtggc acaaatcctc 5160
gactctagga tgaacactaa gtacgatgag aacgataagc tgatcaggga agtgaaagtg 5220
ataactctga agagcaagct ggtgtctgac ttccggaagg actttcaatt ctacaaagtt 5280
cgcgaaataa acaattacca tcatgctcac gatgcctatc tcaatgctgt cgttggcacc 5340
gccctgatca agaaataccc taaactggag tctgagttcg tgtacggtga ctataaagtc 5400
tacgatgtga ggaagatgat agcaaagtct gagcaagaga ttggcaaagc caccgccaag 5460
tacttcttct actctaatat catgaatttc tttaagactg agataaccct ggctaacggc 5520
gaaatccgga agcgcccact gatcgaaaca aacggagaaa caggagaaat cgtgtgggat 5580
aaaggcaggg acttcgcaac tgtgcggaag gtgctgtcca tgccacaagt caatatcgtg 5640
aagaagaccg aagtgcagac cggcggattc tcaaaggaga gcatcctgcc aaagcggaac 5700
tctgacaagc tgatcgccag gaagaaagat tgggacccaa agaagtatgg cggtttcgat 5760
tcccctacag tggcttattc cgttctggtc gtggcaaaag tggagaaagg caagtccaag 5820
aaactcaagt ctgttaagga gctgctcgga attactatta tggagagatc cagcttcgag 5880
aagaatccaa tcgatttcct ggaagctaag ggctataaag aagtgaagaa agatctcatc 5940
atcaaactgc ccaagtactc tctctttgag ctggagaatg gtaggaagcg gatgctggcc 6000
tccgccggag agctgcagaa aggaaacgag ctggctctgc cctccaaata cgtgaacttc 6060
ctgtatctgg cctcccacta cgagaaactc aaaggtagcc ctgaagacaa tgagcagaag 6120
caactctttg ttgagcaaca taaacactac ctggacgaaa tcattgaaca gattagcgag 6180
ttcagcaagc gggttattct ggccgatgca aacctcgata aagtgctgag cgcatataat 6240
aagcacaggg acaagccaat tcgcgaacaa gcagagaata ttatccacct ctttactctg 6300
actaatctgg gcgctcctgc tgccttcaag tatttcgata caactattga caggaagcgg 6360
tacacctcta ccaaagaagt tctcgatgcc accctgatac accagtcaat taccggactg 6420
tacgagactc gcatcgacct gtctcagctc ggcggcgacg gttctgaatt cagcctgggc 6480
agcggctccc ccaagaagaa gcgcaaggtg accggtcatc atcaccatca ccattgagtt 6540
taaacccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 6600
tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 6660
gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 6720
caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 6780
tctatggctt ctgaggcgga aagaaccagc tggggctcta gggggtatcc ccacgcgccc 6840
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 6900
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 6960
ggctttcccc gtcaagctct aaatcggggc atccctttag ggttccgatt tagtgcttta 7020
cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc 7080
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 7140
ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt 7200
ttggggattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 7260
taattctgtg gaatgtgtgt cagttagggt gtggaaagtc cccaggctcc ccaggcaggc 7320
agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc 7380
tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac catagtcccg 7440
cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc tccgccccat 7500
ggctgactaa ttttttttat ttatgcagag gccgaggccg cctctgcctc tgagctattc 7560
cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct cccgggagct 7620
tgtatatcca ttttcggatc tgatcagcac gtgttgacaa ttaatcatcg gcatagtata 7680
tcggcatagt ataatacgac aaggtgagga actaaaccat ggccaagcct ttgtctcaag 7740
aagaatccac cctcattgaa agagcaacgg ctacaatcaa cagcatcccc atctctgaag 7800
actacagcgt cgccagcgca gctctctcta gcgacggccg catcttcact ggtgtcaatg 7860
tatatcattt tactggggga ccttgtgcag aactcgtggt gctgggcact gctgctgctg 7920
cggcagctgg caacctgact tgtatcgtcg cgatcggaaa tgagaacagg ggcatcttga 7980
gcccctgcgg acggtgtcga caggtgcttc tcgatctgca tcctgggatc aaagcgatag 8040
tgaaggacag tgatggacag ccgacggcag ttgggattcg tgaattgctg ccctctggtt 8100
atgtgtggga gggctaagca cttcgtggcc gaggagcagg actgacacgt gctacgagat 8160
ttcgattcca ccgccgcctt ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc 8220
ggctggatga tcctccagcg cggggatctc atgctggagt tcttcgccca ccccaacttg 8280
tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa 8340
gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat 8400
gtctgtatac cgtcgacctc tagctagagc ttggcgtaat catggtcata gctgtttcct 8460
gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt 8520
aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc 8580
gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 8640
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 8700
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 8760
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 8820
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 8880
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 8940
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 9000
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 9060
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 9120
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 9180
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 9240
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 9300
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 9360
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 9420
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 9480
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 9540
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 9600
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 9660
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 9720
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 9780
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 9840
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 9900
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 9960
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 10020
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 10080
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 10140
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 10200
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 10260
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 10320
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 10380
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 10440
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 10500
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 10560
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tc 10602
<210> 2
<211> 7236
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 2
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgggac ctaagaaaaa gaggaaggtg gcggccgctg actacaagga tgacgacgat 960
aaatctagaa tgggtcccga catcgtgatg acccagagcc ccagcagcct gagcgccagc 1020
gtgggcgacc gcgtgaccat cacctgccgc agcagcaccg gcgccgtgac caccagcaac 1080
tacgccagct gggtgcagga gaagcccggc aagctgttca agggcctgat cggcggcacc 1140
aacaaccgcg cccccggcgt gcccagccgc ttcagcggca gcctgatcgg cgacaaggcc 1200
accctgacca tcagcagcct gcagcccgag gacttcgcca cctacttctg cgccctgtgg 1260
tacagcaacc actgggtgtt cggccagggc accaaggtgg agctgaagcg cggcggcggc 1320
ggcagcggcg gcggcggcag cggcggcggc ggcagcagcg gcggcggcag cgaggtgaag 1380
ctgctggaga gcggcggcgg cctggtgcag cccggcggca gcctgaagct gagctgcgcc 1440
gtgagcggct tcagcctgac cgactacggc gtgaactggg tgcgccaggc ccccggccgc 1500
ggcctggagt ggatcggcgt gatctggggc gacggcatca ccgactacaa cagcgccctg 1560
aaggaccgct tcatcatcag caaggacaac ggcaagaaca ccgtgtacct gcagatgagc 1620
aaggtgcgca gcgacgacac cgccctgtac tactgcgtga ccggcctgtt cgactactgg 1680
ggccagggca ccctggtgac cgtgagcagc tacccatacg atgttccaga ttacgctggt 1740
ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggatcc 1800
agcggcagcg agactcccgg gacctcagag tccgccacac ccgaaagtat gagctcagag 1860
actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag 1920
gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg 1980
gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc 2040
aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt 2100
acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg 2160
tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac 2220
ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg 2280
actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa 2340
gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc 2400
atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca 2460
ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg 2520
gccaccgggt tgaaaggcgg aggtggaagc actaatctgt cagatattat tgaaaaggag 2580
accggaaagc aactggttat ccaggaatcc atcctcatgc tcccagagga ggtggaagaa 2640
gtcattggga acaagccgga aagcgatata ctcgtgcaca ccgcctacga cgagagcacc 2700
gacgagaatg tcatgcttct gactagcgac gcccctgaat acaagccttg ggctctggtc 2760
atacaggata gcaacggtga gaacaagatt aagatgctcg gaggaggagg aagcggagga 2820
ggaggtagcg gaggaggtgg aagccggacc gaagagtaca agcttatcct gaacggtaaa 2880
accctgaaag gtgaaaccac caccgaagct gttgacgctg ctaccgcgga aaaagttttc 2940
aaacagtacg ctaacgacaa cggtgttgac ggtgaatgga cctacgacga cgctaccaaa 3000
accttcacgg taaccgaagg tggtggtagc ggtggtggtg gtagtcccaa gaagaagagg 3060
aaagtctcga gcggtggagc tgcaggaggg cccttcgaag gtaagcctat ccctaaccct 3120
ctcctcggtc tcgattctac gcgtaccggt catcatcacc atcaccattg agtttaaacc 3180
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3240
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3300
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3360
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3420
gcttctgagg cggaaagaac cagctggggc tctagggggt atccccacgc gccctgtagc 3480
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 3540
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 3600
ccccgtcaag ctctaaatcg gggcatccct ttagggttcc gatttagtgc tttacggcac 3660
ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 3720
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 3780
actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgggg 3840
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattaattc 3900
tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccaggc aggcagaagt 3960
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 4020
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 4080
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 4140
ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag 4200
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata 4260
tccattttcg gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca 4320
tagtataata cgacaaggtg aggaactaaa ccatggccaa gcctttgtct caagaagaat 4380
ccaccctcat tgaaagagca acggctacaa tcaacagcat ccccatctct gaagactaca 4440
gcgtcgccag cgcagctctc tctagcgacg gccgcatctt cactggtgtc aatgtatatc 4500
attttactgg gggaccttgt gcagaactcg tggtgctggg cactgctgct gctgcggcag 4560
ctggcaacct gacttgtatc gtcgcgatcg gaaatgagaa caggggcatc ttgagcccct 4620
gcggacggtg tcgacaggtg cttctcgatc tgcatcctgg gatcaaagcg atagtgaagg 4680
acagtgatgg acagccgacg gcagttggga ttcgtgaatt gctgccctct ggttatgtgt 4740
gggagggcta agcacttcgt ggccgaggag caggactgac acgtgctacg agatttcgat 4800
tccaccgccg ccttctatga aaggttgggc ttcggaatcg ttttccggga cgccggctgg 4860
atgatcctcc agcgcgggga tctcatgctg gagttcttcg cccaccccaa cttgtttatt 4920
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 4980
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgt 5040
ataccgtcga cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga 5100
aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc 5160
tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc 5220
cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc 5280
ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 5340
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 5400
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 5460
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 5520
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 5580
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 5640
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 5700
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 5760
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 5820
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 5880
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 5940
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 6000
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 6060
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 6120
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 6180
aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt 6240
taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata 6300
gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc 6360
agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac 6420
cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag 6480
tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac 6540
gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc 6600
agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg 6660
gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc 6720
atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct 6780
gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc 6840
tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc 6900
atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc 6960
agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc 7020
gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca 7080
cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt 7140
tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt 7200
ccgcgcacat ttccccgaaa agtgccacct gacgtc 7236
<210> 3
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 3
agagcccccc ctcaaagaga ggg 23
<210> 4
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 4
tgcccctccc tccctggccc agg 23
<210> 5
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 5
gacaatgcac atcaccaata agg 23
<210> 6
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 6
aggtcatgga gatgtccgta agg 23
<210> 7
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 7
ccagcagctg gtcacaaagc tgg 23
<210> 8
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 8
gttcatactc actgtcgttg tgg 23
<210> 9
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 9
gagcgtctcc ggtccagccg tgg 23
<210> 10
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 10
accgagagcc ccccctcaaa gaga 24
<210> 11
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 11
aaacagagcc ccccctcaaa gaga 24
<210> 12
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 12
accgtgcccc tccctccctg gccc 24
<210> 13
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 13
aaacgggcca gggagggagg ggca 24
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 14
accggacaat gcacatcacc aata 24
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 15
aaactattgg tgatgtgcat tgtc 24
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 16
accgaggtca tggagatgtc cgta 24
<210> 17
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 17
aaactacgga catctccatg acct 24
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 18
accgccagca gctggtcaca aagc 24
<210> 19
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 19
aaacgctttg tgaccagctg ctgg 24
<210> 20
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 20
accgttcata ctcactgtcg ttg 23
<210> 21
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 21
aaaccaacga cagtgagtat gaa 23
<210> 22
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 22
accgagcgtc tccggtccag ccg 23
<210> 23
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 23
aaaccggctg gaccggagac gct 23
<210> 24
<211> 21
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 24
ctggtgtcag ggcctcaact g 21
<210> 25
<211> 22
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 25
ctgagtctcc acacaggtgc tg 22
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 26
ggggccccta accctatgta 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 27
ccaccggttg atgtgatggg 20
<210> 28
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 28
aggtgtaaac aaaatcttgc cat 23
<210> 29
<211> 23
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 29
tgttcaacca cttgtgatct tgc 23
<210> 30
<211> 25
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 30
gtcaattgct ccatttgttt tcagt 25
<210> 31
<211> 25
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 31
ttttgtcgtg ttatctaaac tttgc 25
<210> 32
<211> 21
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 32
cagggggaac accaaggaac a 21
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 33
actctgggcg ccacgtattg 20
<210> 34
<211> 21
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 34
gtgaggccaa ctggactact t 21
<210> 35
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 35
gctgtcacca gattcacggt 20
<210> 36
<211> 22
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 36
gcaggtgaag atgcacacca tg 22
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 37
tgagcagcac attgagaggg 20
<210> 38
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 38
tgactccacc ctcaaagaga tgg 23
<210> 39
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 39
agatccctcc ctcaaacaga ggg 23
<210> 40
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 40
aaatcccccc cttaaagaga tgg 23
<210> 41
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 41
acagccccca ctaaaagaga agg 23
<210> 42
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 42
aaagccaccc ctcaaagagc tgg 23
<210> 43
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 43
ataaccccca cacaaagaga ggg 23
<210> 44
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 44
ccagcatctg gtcacaaggc agg 23
<210> 45
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 45
gcagctgctg ttcacaaagc agg 23
<210> 46
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 46
gcaccagctg gtcagaaagc tgg 23
<210> 47
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 47
catccagctg ttcacaaagc tgg 23
<210> 48
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 48
tgccccgccc tccctggcct ggg 23
<210> 49
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 49
agcacccccc tccctggccc cgg 23
<210> 50
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 50
ggcccctgcc tccctggcca cgg 23
<210> 51
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 51
cagcttgaat cagagtagag tgg 23
<210> 52
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 52
cactgtgccc caccaccagc agg 23
<210> 53
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 53
tcccataagc ccagattcac cgg 23
<210> 54
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 54
ccgcggccca ccaccaggag tggg 24
<210> 55
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 55
accgcagctt gaatcagagt agag 24
<210> 56
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 56
aaacctctac tctgattcaa gctg 24
<210> 57
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 57
accgcactgt gccccaccac cagc 24
<210> 58
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 58
aaacgctggt ggtggggcac agtg 24
<210> 59
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 59
accgtcccat aagcccagat tcac 24
<210> 60
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 60
aaacgtgaat ctgggcttat ggga 24
<210> 61
<211> 25
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 61
accgccgcgg cccaccacca ggagt 25
<210> 62
<211> 25
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 62
aaacactcct ggtggtgggc cgcgg 25
<210> 63
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 63
agtgacttct gcatattaca ttgt 24
<210> 64
<211> 26
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 64
caatatatag gttctatgat tgcata 26
<210> 65
<211> 22
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 65
gctgccaact gtagttgaaa gg 22
<210> 66
<211> 22
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 66
ggctctctag atctgcagac tg 22
<210> 67
<211> 21
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 67
gtgccgcctt cctccttgtg c 21
<210> 68
<211> 26
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 68
caacaatgga acagctggta acgctc 26
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 69
gtgggtaagg tgggtcaggt 20
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence(人工序列)
<400> 70
ggtggtcata accatctcaa aggc 24

Claims (7)

1.一种碱基编辑工具,其特征在于,包括:多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A载体;胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI连于单链抗体scFv形成的scFv-APOBEC-UGI载体或胞嘧啶脱氨酶APOBEC和尿嘧啶糖基化酶抑制物UGI以及防止多聚化的热稳定性结构域GB1连于单链抗体scFv形成的scFv-APOBEC-UGI-GB1载体。
2.如权利要求1所述的碱基编辑工具,其特征在于,所述的碱基编辑工具还包括sgRNA载体。
3.如权利要求1所述的碱基编辑工具,其特征在于,所述的碱基编辑工具还包括靶向特异位点的sgRNA。
4.如权利要求1所述的碱基编辑工具,其特征在于,所述的多拷贝的GCN4与D10A-Cas9连接形成的GCN4-D10A为10个拷贝的GCN4与D10A-Cas9连接。
5.如权利要求1所述的碱基编辑工具,其特征在于,所述的与D10A-Cas9连接的多拷贝GCN4招募scFv-APOBEC-UGI或scFv-APOBEC-UGI-GB1载体,在sgRNA的引导下在靶向位点做碱基编辑,进而增加靶向位点碱基编辑的窗口和准确性。
6.如权利要求1所述的碱基编辑工具在真核生物里做碱基编辑中的应用。
7.如权利要求6所述的应用,其特征在于,包括:用于引入提前的终止密码子来做基因敲除、用于产生随机突变用于蛋白进化,药物靶点筛选或者基因组调控元件筛选中的至少一种。
CN201810388981.XA 2018-04-26 2018-04-26 一种碱基编辑工具及其应用 Active CN108715861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810388981.XA CN108715861B (zh) 2018-04-26 2018-04-26 一种碱基编辑工具及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810388981.XA CN108715861B (zh) 2018-04-26 2018-04-26 一种碱基编辑工具及其应用

Publications (2)

Publication Number Publication Date
CN108715861A true CN108715861A (zh) 2018-10-30
CN108715861B CN108715861B (zh) 2022-06-24

Family

ID=63899237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810388981.XA Active CN108715861B (zh) 2018-04-26 2018-04-26 一种碱基编辑工具及其应用

Country Status (1)

Country Link
CN (1) CN108715861B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109652381A (zh) * 2019-01-25 2019-04-19 苏州茂行生物科技有限公司 基于碱基编辑靶向cd133的car-t细胞制备方法及应用
CN109706121A (zh) * 2019-01-25 2019-05-03 苏州茂行生物科技有限公司 一种基于碱基编辑的通用型car-t细胞及其制备方法和应用
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
CN110423736A (zh) * 2019-08-16 2019-11-08 中国人民解放军陆军军医大学第一附属医院 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
CN112266420A (zh) * 2020-10-30 2021-01-26 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
CN113249362A (zh) * 2020-02-07 2021-08-13 辉大(上海)生物科技有限公司 经改造的胞嘧啶碱基编辑器及其应用
CN115380111A (zh) * 2020-01-30 2022-11-22 成对植物服务股份有限公司 用于碱基多样化的组合物、系统和方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017090724A1 (ja) * 2015-11-25 2017-06-01 国立大学法人 群馬大学 Dnaメチル化編集用キットおよびdnaメチル化編集方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017090724A1 (ja) * 2015-11-25 2017-06-01 国立大学法人 群馬大学 Dnaメチル化編集用キットおよびdnaメチル化編集方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SUMIYO MORITA等: "Targeted DNA demethylation in vivo using dCas9-peptide repeat and scFv-TET1 catalytic domain fusions", 《NATURE BIOTECHNOLOGY》 *
YUNG-HSIN HUANG等: "DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A", 《GENOME. BIOL.》 *
段金志: "CRISPR/Cas9系统位点特异性研究及建立CRISPR/dCas9动物模型", 《中国优秀博硕士学位论文全文数据库(博士)基础科学辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109652381A (zh) * 2019-01-25 2019-04-19 苏州茂行生物科技有限公司 基于碱基编辑靶向cd133的car-t细胞制备方法及应用
CN109706121A (zh) * 2019-01-25 2019-05-03 苏州茂行生物科技有限公司 一种基于碱基编辑的通用型car-t细胞及其制备方法和应用
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
CN110029096B (zh) * 2019-05-09 2023-05-12 上海科技大学 一种腺嘌呤碱基编辑工具及其用途
CN110423736A (zh) * 2019-08-16 2019-11-08 中国人民解放军陆军军医大学第一附属医院 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
CN115380111A (zh) * 2020-01-30 2022-11-22 成对植物服务股份有限公司 用于碱基多样化的组合物、系统和方法
CN113249362A (zh) * 2020-02-07 2021-08-13 辉大(上海)生物科技有限公司 经改造的胞嘧啶碱基编辑器及其应用
CN113249362B (zh) * 2020-02-07 2023-04-14 辉大(上海)生物科技有限公司 经改造的胞嘧啶碱基编辑器及其应用
CN112266420A (zh) * 2020-10-30 2021-01-26 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
CN112266420B (zh) * 2020-10-30 2022-08-09 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用

Also Published As

Publication number Publication date
CN108715861B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN108715861B (zh) 一种碱基编辑工具及其应用
AU2021250992B2 (en) Compositions and methods for directing proteins to specific loci in the genome
KR102648489B1 (ko) Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna
US20040105855A1 (en) Humanized antibodies against human 4-1BB
KR20220038706A (ko) 조작된 rna를 사용한 내인성 adar을 활용한 타겟 rna 편집
KR20170070238A (ko) 단백질 내로의 비-천연 아미노산의 혼입
KR20080094910A (ko) 신규 단백질 발현계
CN104651402B (zh) 通用型基因打靶载体
WO2008144052A2 (en) Bioluminescent imaging of stem cells
CZ24196A3 (en) Vaccine preparations
CN108531458A (zh) 治疗肿瘤的基因工程自然杀伤细胞产品
CN117222664A (zh) 用于破坏自身耐受的疫苗组合物
CN113652405A (zh) pSFV-p54复制子颗粒及其制备方法与应用
CN111727244B (zh) 循环肿瘤细胞的通用检测探针
CN113862299B (zh) 一种用于同源重组的载体及其应用
CN107384921B (zh) miR216a用于抑制骨肉瘤细胞的增殖、侵袭和迁移
EP4017988A1 (en) Methods and compositions for enhancing aav-mediated homologous recombination using ribonucleotide reductase inhibitors
CN115029347B (zh) 识别和调控肝肾细胞纤维化的分子监测序列、重组质粒、抑制病毒
CN111150748A (zh) 重组溶瘤病毒在制备治疗消化道癌药物中的用途
CN114533862B (zh) 一种鱼用dna疫苗及其制备方法与应用
KR20230142740A (ko) Omni-103 crispr 뉴클레아제
KR102468650B1 (ko) T7 RNA 중합효소 및 mRNA 캡핑 효소를 유도 발현하는 재조합 벡터 및 이의 용도
US20220307050A1 (en) Non-viral transgenesis
CN116887854A (zh) Omni-103 crispr核酸酶
US20050003344A1 (en) AAV2 Rep protein fusions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant