CN110467679A - 一种融合蛋白、碱基编辑工具和方法及其应用 - Google Patents

一种融合蛋白、碱基编辑工具和方法及其应用 Download PDF

Info

Publication number
CN110467679A
CN110467679A CN201910725037.3A CN201910725037A CN110467679A CN 110467679 A CN110467679 A CN 110467679A CN 201910725037 A CN201910725037 A CN 201910725037A CN 110467679 A CN110467679 A CN 110467679A
Authority
CN
China
Prior art keywords
amino acid
polypeptide
acid sequence
terminal
fusion protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910725037.3A
Other languages
English (en)
Other versions
CN110467679B (zh
Inventor
乔云波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN201910725037.3A priority Critical patent/CN110467679B/zh
Publication of CN110467679A publication Critical patent/CN110467679A/zh
Application granted granted Critical
Publication of CN110467679B publication Critical patent/CN110467679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/775Apolipopeptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector
    • C12N2710/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种融合蛋白,包括蛋白质内含子intein N片段或C片段和碱基编辑器的N端或C端片段,所述碱基编辑器为多肽ancBE4max‑NG或ABEmax‑NG,所述多肽ancBE4max‑NG包括APOBEC1多肽和SpCas9‑NG D10A nickase多肽,所述多肽ABEmax‑NG包括ecTad‑ecTadA*二聚体多肽和SpCas9‑NG D10A nickase多肽;以及含有上述融合蛋白的基因编辑工具或细胞表达系统及其应用。本发明提供了一种融合蛋白,所述融合蛋白是一种新的组合型胞嘧啶/腺嘌呤碱基编辑工具,可以识别NG作为PAM,拓宽了碱基编辑的靶向范围,并且发明的碱基编辑工具可适用于腺病毒的包装要求,可获得高滴度的腺病毒。

Description

一种融合蛋白、碱基编辑工具和方法及其应用
技术领域
本发明涉及基因编辑技术领域,尤其是一种基于腺病毒的碱基编辑工具和方法及其应用。
背景技术
基因编辑是通过在DNA上特定位点引入序列改变,达到基因序列改变或插入的技术手段。目前CRISPR/Cas9是应用最广的基因编辑技术1。该系统操作简单,仅需通过sgRNA的靶向序列就能在靶向位点上进行基因编辑,该技术被广泛应用于基因功能研究、疾病模拟以及基因治疗等。CRISPR/Cas9的原理是,在sgRNA的引导下Cas9到达指定DNA区域发挥酶切活性,CRISPR/Cas9系统的靶向识别需要靶位点旁边具有前间隔序列邻近基序(protospacer adjacent motif,PAM),然后对PAM上游3bp和4bp间进行切割,切割后造成DNA的双链断裂(DSB)激发自身的DNA修复机制。基于CRISPR/Cas9的发现使得基因操作非常简易,但是对内源基因的精准编辑还是个巨大的问题,通过NHEJ(Non-Homologous EndJoin,非同源重组末端修复)随机引入插入或缺失只能引入随机突变,而切割后提供同源重组的载体或者单链DNA的方法,效率低且耗时。同时,Cas9切割造成的DSB可能引起基因组的大片段缺失和影响基因组稳定性。
鉴于上述问题,哈佛大学的David Liu等利用部分切割活性缺失的Cas9-D10Anickase(nCas9)融合脱氨酶的方法可以实现不造成DSB的情况下对基因组单碱基进行点突变(C-to-T或A-to-G),目前开发的碱基编辑工具包括胞嘧啶碱基编辑工具(Cytosine BaseEditor,CBE)和腺嘌呤碱基编辑工具(Adenine Base Editor,ABE)两种2,3。其中胞嘧啶碱基编辑工具融合了nCas9和rat APOBEC1,腺嘌呤碱基编辑工具融合了nCas9和ecTad-ecTadA*二聚体片段。具体原理是,nCas9的融合蛋白在sgRNA的引导下到达靶向位点并与sgRNA互补的DNA链进行结合,胞嘧啶脱氨酶/腺嘌呤脱氨酶对sgRNA范围内的胞嘧啶/腺嘌呤进行脱氨,然后根据碱基互补配对原则,在DNA复制过程中最终达到C-to-T或A-to-G的目的。在经过核定位信号以及密码子的优化后,目前ancBE4max和ABEmax的效率最高,两者识别的PAM为NG,BE4max对应的编辑窗口是sgRNA5’端的4-8位,ABEmax对应的编辑窗口是sgRNA 5’端的4-7位4。然而,来自酿脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9)仅识别NGG序列的PAM,大幅限制了基因组中能够被靶向的范围。来自日本东京大学的濡木教授等人构建出一种SpCas9变体(SpCas9-NG),它能够识别NG序列作为PAM5,我们基于此构建的ancBE4ma-NG和ABEmax-NG得到了能够识别NG PAM的碱基编辑器,可以大幅扩展碱基编辑的使用范围而不受PAM限制。
单碱基基因突变,可导致发育、癌症等多种疾病,因此利用碱基编辑工具可修饰疾病的点突变以达到治疗或者缓解疾病的目的。目前,最为接受的体内基因编辑工具为腺病毒,然而碱基编辑器的质粒大小远远超出腺病毒的包装范围(4.7Kb)。因此,如何利用腺病毒进行体内碱基编辑是目前的一项重大科学难题。
参考文献
1Kim,H.&Kim,J.S.A guide to genome engineering with programmablenucleases.Nat Rev Genet 15,321-334,doi:10.1038/nrg3686(2014).
2Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R.Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424,doi:10.1038/nature17946(2016).
3Gaudelli,N.M.et al.Programmable base editing of A*T to G*C ingenomic DNA without DNA cleavage.Nature 551,464-471,doi:10.1038/nature24644(2017).
4Koblan,L.W.et al.Improving cytidine and adenine base editors byexpression optimization and ancestral reconstruction.Nat Biotechnol 36,843-846,doi:10.1038/nbt.4172(2018).
5Nishimasu,H.et al.Engineered CRISPR-Cas9nuclease withexpandedtargeting space.Science 361,1259-1262,doi:10.1126/science.aas9129(2018).
发明内容
基于上述问题,本发明的目的在于克服上述现有技术的不足之处而提供一种新的组合型胞嘧啶/腺嘌呤碱基编辑工具,可以识别NG作为PAM,拓宽了碱基编辑的靶向范围,并且本发明的碱基编辑工具可适用于腺病毒的包装要求,可获得高滴度的腺病毒。
为实现上述目的,本发明采取的技术方案包括如下几个方面:
在第一个方面,本发明提供了一种融合蛋白,包括蛋白质内含子intein N片段或C片段和碱基编辑器的N端或C端片段,所述碱基编辑器为多肽ancBE4max-NG或ABEmax-NG,所述多肽ancBE4max-NG包括APOBEC1多肽和SpCas9-NG D10A nickase多肽,所述多肽ABEmax-NG包括ecTad-ecTadA*二聚体多肽和SpCas9-NG D10A nickase多肽。需要说明的是,在下文的SEQ ID NO.17中分别示出了APOBEC1、SpCas9-NG D10A nickase、2*UGI相应的核苷酸序列,其中,APOBEC1碱基序列采用加粗和下划线显示,SpCas9-NG D10A nickase的碱基序列采用加粗和斜体示出,2*UGI相应的碱基序列采用下划线示出;在下文的SEQ ID NO.18中分别示出了ecTad-ecTadA*和SpCas9-NG相应的核苷酸序列,其中,ecTad-ecTadA*相应的碱基序列加粗和下划线示出,SpCas9-NG相应的碱基序列采用加粗和斜体示出。
在一些实施方案中,所述intein N片段的氨基酸序列为:
a)如SEQ ID NO.1所示的intein-N氨基酸序列;或
b)与SEQ ID NO.1具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列、且具有a)所限定的氨基酸序列的功能,优选为能够作为内含子进行氨基酸序列剪切和拼接的功能;
所述intein C片段的氨基酸序列为:
c)如SEQ ID NO.2所示的intein-C氨基酸序列;或
d)与SEQ ID NO.2相比具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列、且具有c)所限定的氨基酸序列的功能,优选为能够作为内含子进行氨基酸序列剪切和拼接的功能。
在一些实施方案中,所述碱基编辑器的N端片段为
e)由APOBEC1多肽和SpCas9-NG D10A nickase N端第2~573个氨基酸组成的多肽融合而成;
f)SEQ ID NO.3所示的氨基酸序列;或
g)与SEQ ID NO.3所示的氨基酸序列相比具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列,且具有e)或f)所限定的氨基酸序列所具有的功能。
在一些实施方案中,所述碱基编辑器的C端片段为
h)由SpCas9-NG D10A nickase片段C端第574~1368个氨基酸组成的多肽与2*UGI、3*FLAG、BPNLS多肽序列依次融合而成;
i)SEQ ID NO.4所示的氨基酸序列;或
j)与SEQ ID NO.4所示的氨基酸序列相比具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列,且具有h)或i)所限定的氨基酸序列所具有的功能,优选具有蛋白质水平剪切融合所得全长蛋白的胞嘧啶脱氨酶功能,更优选为能够识别NG作为PAM,N表示任意碱基。
在一些实施方案中,所述碱基编辑器的N端片段为
k)由ecTad-ecTadA*二聚体多肽片段和SpCas9-NG D10A nickase片段N端第2~573个氨基酸组成的多肽融合而成;
l)SEQ ID NO.5所示的氨基酸序列;或
m)与SEQ ID NO.5所示的氨基酸序列相比具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列,且具有k)或l)所限定的功能。
在一些实施方案中,所述碱基编辑器的C端片段为
n)由SpCas9-NG D10A nickase多肽C端第574~1368个氨基酸组成的多肽与多肽3*FLAG、BPNLS依次融合而成;
o)SEQ ID NO.6所示的氨基酸序列;或
p)与SEQ ID NO.6所示的氨基酸序列相比具有90%、91%、92%、93%、94%、95%、96%、97%、98%或99%以上序列一致性的氨基酸序列,且具有n)或o)所限定的功能,优选具有蛋白质水平剪切融合所得全长蛋白的腺嘌呤脱氨酶功能,更优选为能够识别NG作为PAM。
在一些实施方案中,所述融合蛋白自N端至C端依次包括ancAPOBEC1多肽片段、SpCas9-NG D10A nickase的N端第2~573个氨基酸组成的多肽片段和N-intein多肽。
在一些实施方案中,所述融合蛋白自N端至C端依次包括C-intein多肽片段、SpCas9-NG D10A nickase的C端第574~1368个氨基酸组成的多肽片段、2*UGI多肽、3*FLAG多肽和BPNLS多肽。
在一些实施方案中,所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚体多肽片段、SpCas9-NG D10A nickase的N端第2~573个氨基酸组成的多肽片段和N-intein多肽。
在一些实施方案中,所述融合蛋白自N端至C端依次包括C-intein多肽、SpCas9-NGD10A nickase的C端第574~1368个氨基酸组成的多肽片段、3*FLAG多肽、BPNLS多肽。
在一些实施方案中,所述融合蛋白还包括核定位信号多肽片段,
优选的,所述核定位信号多肽片段位于上述融合蛋白的N端和/或C端,
更优选的,所述核定位信号多肽片段的氨基酸序列如SEQ ID NO.7所示。
在一些实施方案中,所述融合蛋白氨基酸序列如SEQ ID NO.8~11任一项所示。
在第二个方面,本发明提供了一种腺病毒包装系统,包括上述的融合蛋白相应的氨基酸序列或/和所述融合蛋白对应的如SEQ ID NO.12~15任一项所示的核苷酸编码序列。需要说明的是,SEQ ID NO.8~11的氨基酸序列与SEQ ID NO.12~15的核苷酸序列是一一对应的。
在第三个方面,本发明提供了一种基因编辑工具,包括上述的腺病毒包装系统、sgRNA以及sgRNA包装载体,所述载体的核苷酸序列如SEQ ID NO.16所示。
在第四个方面,本发明提供了一种细胞表达系统,其中含有上述的基因编辑工具,所述细胞为宿主细胞,宿主细胞优选真核细胞或原核细胞,
更优选小鼠细胞或人细胞;
更优选为小鼠脑神经瘤细胞、人胚胎肾细胞或人宫颈癌细胞;
更优选为N2a细胞、HEK293FT细胞或Hela细胞。
在第五个方面,本发明提供了上述的融合蛋白、腺病毒包装系统、基因编辑工具或细胞表达系统在基因编辑中的应用。
在第六个方面,本发明提供了一种基于腺病毒的基因编辑方法,包括步骤:基于上述融合蛋白、腺病毒包装系统、基因编辑工具或细胞表达系统进行体外或体内基因编辑。
综上所述,本发明的有益效果为:
本发明提供了一种融合蛋白,所述融合蛋白是一种新的组合型胞嘧啶/腺嘌呤碱基编辑工具,可以识别NG作为PAM,拓宽了碱基编辑的靶向范围,并且本发明的碱基编辑工具可适用于腺病毒的包装要求,可获得高滴度的腺病毒,并在此基础上完成了本发明。
附图说明
图1为构建获得的N-ancBE4max-NG和C-ancBE4max-NG所示质粒结构示意图;
图2为构建获得的N-ABEmax-NG和C-ABEmax-NG所示质粒结构示意图;
图3为sgRNA的腺病毒(AAV)包装载体结构示意图;
图4为本发明实施例3实验结果示意图,其中,a为N-ancBE4max-NG+C-anc-BE4max-NG+sgRNA共同转染293T细胞以后的Sanger测序结果,第一列为靶向DNA序列示意图;第二列实验结果为未转染的负对照,第三列为靶向基因编辑的实验结果,箭头指示为C-to-T编辑位置;b为N-ABEmax-NG+C-ABEmax-NG+sgRNA共同转染293T细胞以后的Sanger测序结果,第一列为靶向DNA序列示意图;第二列实验结果为未转染的负对照,第三列为靶向基因编辑的实验结果,箭头指示为A-to-G编辑位置;
图5为本发明实施例4实验结果示意图,其中,a为N-ABEmax-NG病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果;b为C-ABEmax-NG病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果;c为AAV-sgRNA病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果。
具体实施方式
本发明通过将识别NGG的SpCas9或NG PAM的SpCas9-NG与ancBE4max或ABEmax相结合,得到ancBE4max-NG和ABEmax-NG四种编辑工具,并且利用intein的可在蛋白质水平进行剪切和拼接的特性,将全长的碱基编辑器在以Cas9573-574氨基酸中间位置分开,表达于两个腺病毒载体。经检测,分开表达的基因编辑工具,可获得良好的基因编辑效果,并且可获得高滴度的腺病毒。
本发明涉及生物技术领域,特别是涉及碱基编辑工具的体内基因编辑和基因突变校正用途。本发明提供两种融合蛋白,包括蛋白质内含子intein片段和碱基编辑器的N端或C端片段,所述intein片段包括N端和C端序列,所述碱基编辑器包括ancBE4max-NG和ABEmax-NG,共获得N-ancBE4max-NG、C-ancBE4max-NG、N-ABEmax-NG、C-ABEmax-NG四种AAV表达质粒。本发明提供的融合蛋白可以缩小碱基编辑工具的大小,使其适用于腺病毒(AAV)的包装范围,从而获得高滴度的碱基编辑工具的腺病毒,可以扩展碱基编辑的体内应用和治疗,具有良好的基因治疗前景和产业化前景。
为实现上述目的及其他相关目的,本发明一方面提供一种融合蛋白,包括包括蛋白质内含子intein N片段或C片段和碱基编辑器的N端或C端片段,所述碱基编辑器包括ancBE4max-NG和ABEmax-NG,所述ancBE4max-NG包括APOBEC1和SpCas9-NG D10A nickase片段,所述ABEmax-NG包括ecTad-ecTadA*二聚体片段和SpCas9-NG D10A nickase片段。
在本发明一些实施方式中,所述intein片段的氨基酸序列包括:
a)如SEQ ID NO.1所示的intein-N氨基酸序列和SEQ ID NO.2的intein-C氨基酸序列;或,
b)与SEQ ID NO.1或SEQ ID NO.2具有80%以上序列相似性的氨基酸序列、且具有a)所限定的氨基酸序列的功能,优选为能够作为内含子进行氨基酸序列剪切和拼接的特征。
在本发明一些实施方式中,所述N-ancBE4max-NG片段由ancAPOBEC1片段和SpCas9-NG D10A nickase片段N端(2-573)融合而成,其氨基酸序列包括:
c)如SEQ ID NO.3所示的氨基酸序列;或,
d)与SEQ ID NO.3具有80%以上序列相似性的氨基酸序列、且具有c)所限定的氨基酸序列的功能。
在本发明一些实施方式中,所述C-ancBE4max-NG片段由SpCas9-NG D10A nickase片段C端(574-1368)与2*UGI、3*FLAG、BPNLS依次融合而成,其氨基酸序列包括:
e)如SEQ ID NO.4所示的氨基酸序列;或,
f)与SEQ ID NO.4具有80%以上序列相似性的氨基酸序列、且具有e)所限定的氨基酸序列的功能,优选的具有e)的蛋白质水平剪切融合所得全长蛋白的胞嘧啶脱氨酶功能,优选为能够识别NG作为PAM。
在本发明一些实施方式中,所述N-ancABEmax-NG片段由ecTad-ecTadA*二聚体片段和SpCas9-NG D10A nickase片段N端(2-573)融合而成,其氨基酸序列包括:
g)如SEQ ID NO.5所示的氨基酸序列;或,
h)与SEQ ID NO.5具有80%以上序列相似性的氨基酸序列、且具有g)所限定的氨基酸序列的功能。
在本发明一些实施方式中,所述C-ancABEmax-NG片段由SpCas9-NG D10Anickase片段C端(574-1368)与3*FLAG、BPNLS依次融合而成融合而成,其氨基酸序列包括:
i)如SEQ ID NO.6所示的氨基酸序列;或,
j)与SEQ ID NO.6具有80%以上序列相似性的氨基酸序列、且具有i)所限定的氨基酸序列的功能,优选的具有g)和i)相应的蛋白质水平剪切融合所得全长蛋白的腺嘌呤脱氨酶功能,优选为能够识别NG作为PAM。
在本发明一些实施方式中,所述融合蛋白N-ancBE4max-NG自5’端至3’端依次包括ancAPOBEC1片段、SpCas9-NG D10A nickase的N端片段(2-573)、N-intein。
在本发明一些实施方式中,所述融合蛋白C-ancBE4max-NG自5’端至3’端依次包括C-intein、SpCas9-NG D10A nickase的C端片段(574-1368)、2*UGI、3*FLAG、BPNLS。其中,2*UGI指2个UGI肽段先后连接,3*FLAG表示3个FLAG肽段先后连接。
在本发明一些实施方式中,所述融合蛋白N-ABEmax-NG自5’端至3’端依次包括ecTadA-ecTadA*二聚体片段、SpCas9-NG D10A nickase的N端片段(2-573)、N-intein。
在本发明一些实施方式中,所述融合蛋白C-ABEmax-NG自5’端至3’端依次包括C-intein、SpCas9-NG D10A nickase的C端片段(574-1368)3*FLAG、BPNLS。
在本发明一些实施方式中,所述融合蛋白还包括核定位信号片段,优选的,所述核定位信号片段位于功能性元件(即融合蛋白)的N端和/或C端,优选的,所述核定位信号片段的氨基酸序列如SEQ ID NO.7所示。
在本发明一些实施方式中,所述融合蛋白N-ancBE4max-NG的氨基酸序列如SEQ IDNo.8所示;所述融合蛋白C-ancBE4max-NG的氨基酸序列如SEQ ID No.9所示;所述融合蛋白N-ABEmax-NG的氨基酸序列如SEQ ID No.10所示;所述融合蛋白C-ABEmax-NG的氨基酸序列如SEQ ID No.11所示。
在本发明一些实施方式中,所述融合蛋白N-ancBE4max-NG的腺病毒包装系统所包含的DNA序列如SEQ ID No.12所示;所述融合蛋白C-ancBE4max-NG的腺病毒包装系统所包含的DNA序列如SEQ ID No.13所示;所述融合蛋白N-ABEmax-NG的腺病毒包装系统所包含的DNA序列如SEQ ID No.14所示;所述融合蛋白C-ABEmax-NG的腺病毒包装系统所包含的DNA序列如SEQ ID No.15所示。
在本发明一些实施方式中,所述基因编辑工具还包括sgRNA腺病毒包装系统,所述sgRNA包装载体的DNA载体序列如SEQ ID No.16所示。
本发明另一方面提供一种构建体,所述构建体含有所述的分离的多核苷酸。
本发明另一方面提供一种表达系统,所述表达系统含有所述的构建体或基因组中整合有所述的多核苷酸。
在本发明一些实施方式中,所述表达系统的宿主细胞选自真核细胞或原核细胞,优选选自小鼠细胞、人细胞,更优选选自小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞,更优选选自N2a细胞、HEK293FT细胞、或Hela细胞等。
本发明另一方面提供所述的融合蛋白、所述的分离的多核苷酸、所述的构建体或所述的表达系统在基因编辑中的用途。
在本发明一些实施方式中,所述用途具体为在真核生物的基因编辑中的用途。
本发明另一方面提供一种碱基编辑体系,包括所述的融合蛋白,所述碱基编辑体系还包括sgRNA。
本发明另一方面提供一种基因编辑方法,包括:通过所述的融合蛋白、或所述的碱基编辑体系进行体外或者在体基因编辑。
本发明第一方面提供四种融合蛋白,包括蛋白质内含子intein片段和碱基编辑器的N端或C端片段,所述碱基编辑器包括ancBE4max-NG和ABEmax-NG。具体四种融合蛋白包括:
BPNLS-3*HA-ancBE4max-NG-N-intein、
C-intein-C-ancBE4max-NG-2*UGF-3*FLAG*BPNLS、
BPNLS-3*HA-N-ABEmax-NG-N-intein、
C-intein-C-ABEmax-NG-3*FLAG*BPNLS。
所述融合蛋白BPNLS-3*HA-ancBE4max-NG-N-intein和C-intein-C-ancBE4max-NG-2*UGF-3*FLAG*BPNLS可以在蛋白质水平通过intein识别剪切,形成全长的ancBE4max-NG,并以NG为PAM序列,与靶向靶点区域的sgRNA相配合,实现对靶点区域内sgRNA 5’端4-8位的C-to-T的高效碱基编辑,且突变的精准性高,邻近脱靶低;
所述融合蛋白BPNLS-3*HA-N-ABEmax-NG-N-intein和C-intein-C-ABEmax-NG-3*FLAG*BPNLS可以在蛋白质水平通过intein识别剪切,形成全长的ABEmax-NG,并以NG为PAM序列,与靶向靶点区域的sgRNA相配合,实现对靶点区域内sgRNA 5’端4-7位的A-to-G的高效碱基编辑,且突变的精准性高,邻近脱靶低。
本发明所提供的融合蛋白中,所述的取代、缺失或者添加可以是保守氨基酸取代。所述“保守氨基酸取代”具体可以是指氨基酸残基被其他具有相似侧链的氨基酸残基取代的情况。
本发明所提供的融合蛋白中,还可以包括核定位信号片段(NLS),所述核定位信号片段可以位于SEQ ID NO.3/4/5/6的N端或C端。所述核定位信号片段可以包括如SEQ IDNO.7所示的氨基酸序列。
本发明第二方面提供一种分离的多核苷酸,编码本发明第一方面所提供的融合蛋白。
本发明第三方面提供一种构建体,所述构建体含有本发明第二方面所提供的分离的多核苷酸。所述构建体通常可以通过将所述分离的多核苷酸插入合适的表达载体中构建获得,本领域技术人员可选择合适的表达载体,例如,所述表达载体可以是包括但不限于pCMV表达载体、pSV2表达载体、pGL3表达载体及其它慢病毒包装载体、腺病毒包装载体等。
本发明第四方面提供一种表达系统,所述表达系统含有本发明第三方面所提供的构建体或基因组中整合有外源的本发明第二方面所提供的分离的多核苷酸。所述表达系统可以是宿主细胞,所述宿主细胞可以表达如上所述的融合蛋白,所述融合蛋白可以与sgRNA相配合,从而可以将所述融合蛋白定位到目标区域,实现目标区域的碱基编辑。在本发明另一具体实施例中,所述宿主细胞可以是真核细胞和/或原核细胞,更具体可以是小鼠细胞、人细胞等,更具体可以是小鼠脑神经瘤细胞、人胚胎肾细胞、人宫颈癌细胞等,更具体可以是N2a细胞、HEK293FT细胞、Hela细胞等。
本发明第五方面提供本发明第一方面所提供的融合蛋白、或本发明第二方面所提供的分离的多核苷酸、或本发明第三方面所提供的构建体、或本发明第四方面所提供的表达系统在基因编辑中的用途,优选为真核生物的基因编辑中的用途,所述真核生物具体可以是后生动物,具体可以是包括但不限于小鼠等。所述用途具体可以是包括但不限于由A到G或者C到T的碱基编辑、利用本发明的碱基编辑工具进行小鼠疾病模型的构建或人类疾病的治疗等。
本发明第六方面提供一种碱基编辑体系,包括本发明第一方面所提供的融合蛋白,所述碱基编辑体系还包括sgRNA。所述sgRNA的序列通常可以与目标区域至少部分互补,从而可以与所述融合蛋白相配合,将所述融合蛋白定位到目标区域,实现靶点区域内sgRNA5’端4-8位C-to-T的碱基编辑或者4-7位的A-to-G的碱基编辑。本发明所提供的碱基编辑体系极大地拓宽了基因组可靶向的范围,可以将NG序列作为PAM,实现sgRNA靶点区域内的碱基编辑,同时缩小了构建载体的质粒大小,从而适用于慢病毒和腺病毒包装系统,适用于动物疾病模型的构建或疾病的基因突变校正治疗。此外,所述融合蛋白还具有编辑精准性高、邻近脱靶低等优点,具有良好的产业化前景。
本发明第七方面提供一种碱基编辑方法,包括:通过本发明第一方面所提供的融合蛋白、或本发明第六方面所提供的碱基编辑体系进行基因编辑。例如,所述基因编辑方法可以包括:在适当条件下培养本发明第四方面所提供的表达系统,从而表达所述融合蛋白,所述融合蛋白可以在与其配合的靶向目标区域的sgRNA存在的条件下,对靶标区域进行碱基编辑。
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。他人一些非本质替换或改进在本发明的保护范围内。实施例中未注明厂商的试剂或仪器均可通过市场购买获得。未详细注明的实验方法,按照常规条件或试剂厂商推荐的方法实施。
实施例1
首先构建ancBE4max-NG和ABEmax-NG质粒,通过Mut Express II FastMutagenesis Kit V2(Vazyme,C214-02)将7个氨基酸突变(R1335V/L1111R/D1135V/G1218R/E1219F/A1322R/T1337R)引入ancBE4max和ABEmax质粒,ancBE4max由商业公司全基因合成,ABEmax质粒购自Addgene(#112095)。产生的pCMV-ancBE4max-NG所包含的DNA序列如SEQ ID No.17所示;pCMV-ABEmax-NG所包含的DNA序列如SEQ ID No.18所示。
实施例2
在实施例1所得ancBE4max-NG和ABEmax-NG的基础上,构建如图1和2所示的pAAV-TRE-ancBE4max-NG 2-573-intein-N、pAAV-TRE-intein C-ancBE4max-NG 574-1368、pAAV-TRE-ABEmax-NG 2-573-intein-N、pAAV-TRE-intein C-ABEmax-NG 574-1368。
2.1pAAV-TRE-ancBE4max-NG 2-573-intein-N、pAAV-TRE-intein C-ancBE4max-NG 574-1368、pAAV-TRE-ABEmax-NG 2-573-intein-N、pAAV-TRE-intein C-ABEmax-NG574-1368质粒的构建
由金唯智生物科技有限公司合成序列如下表1的PCR引物,稀释至10μM作为PCR引物,使用原始的pAAV-TRE作为模板。
表1
使用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)分别扩增载体序列片段和ABEmax或者ancBEmax的N端或者C端片段。扩增体系(参见表2)和PCR反应条件如所示:
表2
20μl
2xbuffer 25μl
dNTP 1μl
For引物 1μl
Rev引物 1μl
10XGCN4模板 1μl
高保真酶 1μl
一共 50μl
PCR程序为:95℃、5min,1cycle;95℃、30S,62℃、30S,72℃、1.5min,30cycles;72℃、5min,4℃至∞。
PCR扩增产物经通过AxyPrep PCR Clean-up试剂盒(Axygen,AP-PCR-500G)纯化回收后取30-300ng,利用vazyme重组试剂盒进行重组,重组以后进行转化涂板和挑克隆鉴定。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G)并测定浓度。
2.2构建如图3所示的AAV-sgRNA质粒的构建
设计sgRNA并合成oligos,上游序列为:5’-accg-19-21nt-3’,下游序列为:5’-aaac-19-21nt-3’(可替换序列与上游序列互补配对),上下游序列通过程序(95℃,5min;95℃-85℃at-2℃/s;85℃-25℃at-0.1℃/s;hold at 4℃)退火,连接到经过BsaI(NEB:R0539L)线性化的pGL3-U6-sgRNA(Addgene#51133)载体上。线性化体系如下所示:pGL3-U6-sgRNA2μg;buffer(NEB:R0539L)6μL;BsaI 2μL;ddH2O补齐到60μL。37℃酶切过夜。连接体系如下:T4连接buffer(NEB:M0202L)1μL,线性化载体20ng,退火的oligo片段(10μM)5μL,T4连接酶(NEB:M0202L)0.5μL,ddH2O补齐到10μL.16℃连接过夜。连接的载体通过转化,挑菌,鉴定。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G)并测定浓度。
SgRNA构建到pGL3-U6成功以后,利用由金唯智生物科技有限公司合成如下表3所示序列的PCR引物,进行PCR反应扩增载体片段和含有目的sgRNA的片段,扩增成功以后,将两者的PCR纯化片段进行重组,获得含有靶向sgRNA的AAV表达载体。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G)并测定浓度。
表3
实施例3
利用上述实施例构建的N-ancBE4max-NG+C-anc-BE4max-NG、N-ABEmax-NG+C-ABEmax-NG系统转染HEK293T细胞,过程如下:
3.1HEK293T细胞(来自ATCC)复苏,在10cm培养皿(Corning,430167)中培养,培养基为混有10%的胎牛血清(HyClone,SV30087)的DMEM(HyClone,SH30243.01)。培养温度为37℃,二氧化碳浓度为5%。多次传代后当细胞密度为80%时,细胞分盘至12孔板。12孔板使用前用1:10稀释的多聚赖氨酸溶液(Sigma,P4707-50ML)包被处理。
3.2当细胞浓度为80%时,用10%血清的DMEM培养基换液,培养2小时使细胞状态恢复最佳。每孔转染的质粒的量分别是N-ancBE4max-NG 0.5ug、C-anc-BE4max-NG 0.5ug、sgRNA0.5ug或者N-ABEmax-NG 0.5ug、C-ABEmax-NG 0.5ug、sgRNA0.5ug共同转染293T细胞,将质粒混在100μl的Opti-MEM(Gibco,11058021)培养基。
3.3将4.5μl的Lipofectamine 2000转染试剂(Thermo,11668019)混入100μl的Opti-MEM培养基,静置5分钟。将混有质粒的Opti-MEM加入混有Lipofectamine 2000的Opti-MEM,慢速吹打混匀,静置20分钟。然后将混有质粒和Lipofectamine 2000的Opti-MEM分别加入12孔板。转染6小时后用10%FBS的DMEM换液。转染24小时后,用终浓度为2ng/ml的Puromycin(InvivoGen,nt-pr-1)做药杀处理。转染72小时后收细胞,酚氯仿法抽取基因组DNA。
3.4以选区的内源基因靶向位点上下游各100bp分别设计并合成PCR引物,加水稀释至10μM。用诺唯赞高保真酶试剂盒(Vazyme,p501-d2)PCR扩增各基因组靶向位点片段。PCR产物样品用AxyPrep DNA凝胶回收试剂盒(Axygen,AP-GX-250G)做割胶回收,去除非特异性条带。
测序结果统计如图4所示,其中A为N-ancBE4max-NG+C-anc-BE4max-NG+sgRNA共同转染293T细胞以后的Sanger测序结果,第一列为靶向DNA序列示意图;第二列实验结果为未转染的负对照,第三列为靶向基因编辑的实验结果,箭头指示为C-to-T编辑位置;b为N-ABEmax-NG+C-ABEmax-NG+sgRNA共同转染293T细胞以后的Sanger测序结果,第一列为靶向DNA序列示意图;第二列实验结果为未转染的负对照,第三列为靶向基因编辑的实验结果,箭头指示为A-to-G编辑位置。本实施例中的sg序列分别为:TGTCACAGTTAGCTCAGCCA(PAM为GGT)。由图4可见,组合得到的基因编辑工具N-ancBE4max-NG+C-anc-BE4max-NG可导致高效的C-to-T转换,而N-ABEmax-NG+C-ABEmax-NG可导致高效的A-to-G转换。
实施例4
利用上述实施例构建的pAAV-TRE-N-ABEmax-NG、pAAV-TRE-C-ABEmax-NG、AAV-sgRNA利用HEK293T细胞包装AAV病毒,过程如下:
4.1重组表达质粒同pHelper(携带腺病毒来源的基因)和pAAV-RC(携带AAV复制和衣壳基因)共转染进AAV-293细胞(提供AAV复制和包装所需的反式作用因子)。转染2到3天后重组AAV在包装细胞中组装完成。
4.2从被感染AAV-293细胞中收集AAV病毒颗粒,一般AAV颗粒会富集在包装细胞中,所以收集细胞而后裂解释放AAV颗粒到上清中可以回收大部分的AAV颗粒。这一步得到的病毒上清液随后用于感染各种哺乳动物类细胞系的感染实验。同时上清中的病毒也可以浓缩保留。
4.3浓缩并纯化第三步的病毒上清液,原上清液里面包含了许多细胞蛋白分子和碎片,通过2次CsCl密度梯度离心和1次超滤可以去除绝大部分的细胞蛋白和残留的CsCl离子。动物实验都需要纯化后的病毒才能够进行,否则会达不到所需剂量并引起副作用。感染宿主细胞后,基因表达前,单链病毒必须变成双链病毒。这个转变是重组基因表达的限制步骤,可以通过腺病毒双重感染或依托泊苷(喜树碱或丁酸钠)来加速。然而,加速基因表达的试剂对目标细胞是有毒的,如果残留到细胞上会杀死目标细胞。因此依托泊苷只能短期使用或为了提高病毒滴度时使用。
4.4用定量PCR法测定所得到病毒的滴度,这种方法可以得到被包装到颗粒中的AAV基因组的物理滴度值。AAV的感染滴度值因为感染细胞、AAV外壳蛋白和测试条件不同有很大差异,并且体外的实验数据不能反映体内的感染情况,所以在比较AAV时,定量PCR得到的物理滴度值是一个更客观的数值。图5显示为本发明实施例4实验结果示意图,其中,a为N-ABEmax-NG病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果;b为C-ABEmax-NG病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果;c为AAV-sgRNA病毒滴度测试扩增曲线和三种稀释浓度滴度测试结果。结果显示,本实施例获得了高于1E13滴度的病毒,证明通过intein将碱基编辑工具改造成两部分,从而获得高效用于内源性基因编辑的腺病毒。
综上所述,本发明有效克服了现有技术中的碱基编辑工具适用范围较窄和不适用于腺病毒包装等缺点,具高度产业利用价值。
本发明中涉及的核苷酸或氨基酸序列如下所示(其中SEQ ID NO.4、6、8、9、10、11序列最后的“*”表示终止密码子):
SEQ ID NO.1N-intein
CLAGDTLITLADGRRVPIRELVSQQNFSVWALNPQTYRLERARVSRAFCTGIKPVYRLTTRLGRSIRATANHRFLTPQGWKRVDELQPGDYLALPRRIPTAS
SEQ ID NO.2C-intein
AAACPELRQLAQSDVYWDPIVSIEPDGVEEVFDLTVPGPHNFVANDIIAHN
SEQ ID NO.3N-ancBE4max-NG
SSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEIKWGTSHKIWRHSSKNTTKHVEVNFIEKFTSERHFCPSTSCSITWFLSWSPCGECSKAITEFLSQHPNVTLVIYVARLYHHMDQQNRQGLRDLVNSGVTIQIMTAPEYDYCWRNFVNYPPGKEAHWPRYPPLWMKLYALELHAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
SEQ ID NO.4 C-ancBE4max-NG
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESIRPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIDRKVYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSSGGSRDYKDHDGDYKDHDIDYKDDDDKKRTADGSEFESPKKKRKVE*
SEQ ID NO.5 N-ABEmax-NG
SEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIE
SEQ ID NO.6 C-ABEmax-NG
CFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESIRPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIDRKVYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSRDYKDHDGDYKDHDIDYKDDDDKKRTADGSEFESPKKKRKVE*
SEQ ID NO.7 BPNLS
KRTADGSEFESPKKKRKVE
SEQ ID NO.8 BPNLS-3*HA-ancBE4max-NG-N-intein
MKRTADGSEFESPKKKRKVEYPYDVPDYAGYPYDVPDYAGSYPYDVPDYAKLMSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEIKWGTSHKIWRHSSKNTTKHVEVNFIEKFTSERHFCPSTSCSITWFLSWSPCGECSKAITEFLSQHPNVTLVIYVARLYHHMDQQNRQGLRDLVNSGVTIQIMTAPEYDYCWRNFVNYPPGKEAHWPRYPPLWMKLYALELHAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECLAGDTLITLADGRRVPIRELVSQQNFSVWALNPQTYRLERARVSRAFCTGIKPVYRLTTRLGRSIRATANHRFLTPQGWKRVDELQPGDYLALPRRIPTAS*
SEQ ID NO.9 C-intein-C-ancBE4max-NG-2*UGI-3*FLAG*BPNLS
MAAACPELRQLAQSDVYWDPIVSIEPDGVEEVFDLTVPGPHNFVANDIIAHNCFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESIRPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIDRKVYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSSGGSRDYKDHDGDYKDHDIDYKDDDDKKRTADGSEFESPKKKRKVE*
SEQ ID NO.10 BPNLS-3*HA-N-ABEmax-NG-N-intein
MKRTADGSEFESPKKKRKVEYPYDVPDYAGYPYDVPDYAGSYPYDVPDYAKLMSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECLAGDTLITLADGRRVPIRELVSQQNFSVWALNPQTYRLERARVSRAFCTGIKPVYRLTTRLGRSIRATANHRFLTPQGWKRVDELQPGDYLALPRRIPTAS*
SEQ ID NO.11 C-intein-C-ABEmax-NG-3*FLAG*BPNLS
MAAACPELRQLAQSDVYWDPIVSIEPDGVEEVFDLTVPGPHNFVANDIIAHNCFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESIRPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARFLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPRAFKYFDTTIDRKVYRSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSRDYKDHDGDYKDHDIDYKDDDDKKRTADGSEFESPKKKRKVE*
SEQ ID NO.12 BPNLS-3*HA-ancBE4max-NG-N-intein
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTctcgagTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGCTCGGTACCCGGGTCGAGTAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCCCGAATTcgccaccatgAAGAGAACAGCAGACGGAAGTGAATTTGAGTCTCCAAAGAAGAAGCGAAAAGTGGAATACCCATACGATGTTCCTGACTATGCGGGCTATCCCTATGACGTCCCGGACTATGCAGGTTCCTATCCATATGACGTTCCAGATTACGCTaagcttATGagcagtgaaaccggaccagtggcagtggacccaaccctgaggagacggattgagccccatgaatttgaagtgttctttgacccaagggagctgaggaaggagacatgcctgctgtacgagatcaagtggggcacaagccacaagatctggcgccacagctccaagaacaccacaaagcacgtggaagtgaatttcatcgagaagtttacctccgagcggcacttctgcccctctaccagctgttccatcacatggtttctgtcttggagcccttgcggcgagtgttccaaggccatcaccgagttcctgtctcagcaccctaacgtgaccctggtcatctacgtggcccggctgtatcaccacatggaccagcagaacaggcagggcctgcgcgatctggtgaattctggcgtgaccatccagatcatgacagccccagagtacgactattgctggcggaacttcgtgaattatccacctggcaaggaggcacactggccaagatacccacccctgtggatgaagctgtatgcactggagctgcacgcaggaatcctgggcctgcctccatgtctgaatatcctgcggagaaagcagccccagctgacatttttcaccattgctctgcagtcttgtcactatcagcggctgcctcctcatattctgtgggctacaggcctgaagtctggaggatctagcggaggatcctctggcagcgagacaccaggaacaagcgagtcagcaacaccagagagcagtggcggcagcagcggcggcagcgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagTGCCTGGCCGGCGACACCCTGATCACACTGGCTGATGGAAGGAGAGTGCCTATCAGAGAGCTGGTGAGCCAGCAGAACTTCTCCGTGTGGGCCCTGAACCCACAGACCTACAGACTGGAGAGGGCCAGAGTGTCTCGGGCTTTTTGTACAGGCATCAAGCCCGTGTACCGGCTGACCACACGGCTGGGACGCAGCATCAGGGCTACCGCTAACCACCGCTTCCTGACACCACAGGGCTGGAAGAGGGTGGACGAGCTGCAGCCAGGAGATTACCTGGCCCTGCCAAGGCGCATCCCTACCGCAAGCTAAtctagaTAAagatctAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTAGACACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO.13 C-intein-C-ancBE4max-NG-2*UGI-3*FLAG*BPNLS
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTctcgagTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGCTCGGTACCCGGGTCGAGTAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCCCGAATTcGCCACCATGGCTGCTGCTTGCCCAGAGCTGAGGCAGCTGGCTCAGAGCGACGTGTACTGGGACCCCATCGTGTCCATCGAGCCCGACGGCGTGGAGGAGGTGTTCGATCTGACCGTGCCCGGACCTCACAACTTTGTGGCTAACGACATCATCGCCCACAACtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagattacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctaaacgccgtcgtgggaaccgcactgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcagacccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgtgagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccagattcctgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctagagccttcaagtactttgacaccaccatcgaccggaaggtgtacagaagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgacagcggcgggagcggcgggagcggggggagcactaatctgagcgacatcattgagaaggagactgggaaacagctggtcattcaggagtccatcctgatgctgcctgaggaggtggaggaagtgatcggcaacaagccagagtctgacatcctggtgcacaccgcctacgacgagtccacagatgagaatgtgatgctgctgacctctgacgcccccgagtataagccttgggccctggtcatccaggattctaacggcgagaataagatcaagatgctgagcggaggatccggaggatctggaggcagcaccaacctgtctgacatcatcgagaaggagacaggcaagcagctggtcatccaggagagcatcctgatgctgcccgaagaagtcgaagaagtgatcggaaacaagcctgagagcgatatcctggtccataccgcctacgacgagagtaccgacgaaaatgtgatgctgctgacatccgacgccccagagtataagccctgggctctggtcatccaggattccaacggagagaacaaaatcaaaatgctgtctggcggctcatctggtggtTCTAGAGACTACAAGGACCACGATGGCGACTACAAGGATCACGACATCGATTACAAGGACGATGACGATAAGAAGCGGACAGCTGATGGCAGCGAGTTCGAGTCCCCCAAGAAGAAGAGGAAGGTGGAGTGAttctagaTAAagatctAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTAGACACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO.14 BPNLS-3*HA-N-ABEmax-NG-N-intein
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTctcgagTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGCTCGGTACCCGGGTCGAGTAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCCCGAATTcgccaccatgAAGAGAACAGCAGACGGAAGTGAATTTGAGTCTCCAAAGAAGAAGCGAAAAGTGGAATACCCATACGATGTTCCTGACTATGCGGGCTATCCCTATGACGTCCCGGACTATGCAGGTTCCTATCCATATGACGTTCCAGATTACGCTaagcttATGtctgaagtcgagtttagccacgagtattggatgaggcacgcactgaccctggcaaagcgagcatgggatgaaagagaagtccccgtgggcgccgtgctggtgcacaacaatagagtgatcggagagggatggaacaggccaatcggccgccacgaccctaccgcacacgcagagatcatggcactgaggcagggaggcctggtcatgcagaattaccgcctgatcgatgccaccctgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacagcaggatcggaagagtggtgttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcaccaccccggcatgaaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatttctttagaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcggaggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctccggaggatcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgcgatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaacgcaaaaaccggcgccgcaggctccctgatggacgtgctgcactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgctatttctttcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagTGCCTGGCCGGCGACACCCTGATCACACTGGCTGATGGAAGGAGAGTGCCTATCAGAGAGCTGGTGAGCCAGCAGAACTTCTCCGTGTGGGCCCTGAACCCACAGACCTACAGACTGGAGAGGGCCAGAGTGTCTCGGGCTTTTTGTACAGGCATCAAGCCCGTGTACCGGCTGACCACACGGCTGGGACGCAGCATCAGGGCTACCGCTAACCACCGCTTCCTGACACCACAGGGCTGGAAGAGGGTGGACGAGCTGCAGCCAGGAGATTACCTGGCCCTGCCAAGGCGCATCCCTACCGCAAGCTAAtctagaTAAagatctAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTAGACACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO.15 C-intein-C-ABEmax-NG-3*FLAG*BPNLS
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTctcgagTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGTTTACCACTCCCTATCAGTGATAGAGAAAAGTGAAAGTCGAGCTCGGTACCCGGGTCGAGTAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCCCGAATTcGCCACCATGGCTGCTGCTTGCCCAGAGCTGAGGCAGCTGGCTCAGAGCGACGTGTACTGGGACCCCATCGTGTCCATCGAGCCCGACGGCGTGGAGGAGGTGTTCGATCTGACCGTGCCCGGACCTCACAACTTTGTGGCTAACGACATCATCGCCCACAACtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcagacccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgtgagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccagattcctgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctagagccttcaagtactttgacaccaccatcgaccggaaggtgtacagaagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggtggtTCTAGAGACTACAAGGACCACGATGGCGACTACAAGGATCACGACATCGATTACAAGGACGATGACGATAAGAAGCGGACAGCTGATGGCAGCGAGTTCGAGTCCCCCAAGAAGAAGAGGAAGGTGGAGTGAttctagaTAAagatctAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTAGACACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO.16 sgRNA AAV vector
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTAAGCTTTGCAAAGATGGATAAAGTTTTAAACAGAGAGGAATCTCTCGAGgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccGTACTTAGGTTGGAAGGCCACGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGGTCGACTTTTTTAGAGCTAGAGCGCGTGCGCCAATTCTGCATCGAGccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcggggggggggggggggcgcgcgccgggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgtggctgcgtgaaagccttgaggggctccgggagggccctttgtgcggggggagcggctcggggctgtccgcggggggacggctgccttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaattggatcGAATTCGCCACCATGTCAAGACTGGACAAGAGCAAAGTCATAAACTCTGCTCTGGAATTACTCAATGAAGTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCTACCCTGTACTGGCACGTcAAGAACAAGCGGGCCCTGCTCGATGCCCTGGCAATCGAGATGCTGGACAGGCATCATACCCACTTCTGCCCCCTGGAAGGCGAGTCATGGCAAGACTTTCTGCGGAACAACGCCAAGTCATTCCGCTGTGCTCTCCTCTCACATCGCGACGGGGCTAAAGTGCATCTCGGCACCCGCCCAACAGAGAAACAGTACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAACGCACTGTACGCTCTGTCCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGATCAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCTATGCCCCCACTTCTGAGACAAGCAATTGAGCTGTTCGACCATCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGGCCGACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGGTGAGGATCCAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGACTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCAGATCTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTAGACACGTGGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCcGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO.17 pCMV-ancBE4max-NG(BPNLS-APOBEC1-SpCas9-NG D10A nickase-2*UGI)
atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcagcagtgaaaccggaccagtggcagtggacccaaccctgaggagacggattgagcccca tgaatttgaagtgttctttgacccaagggagctgaggaaggagacatgcctgctgtacgagatcaagtggggcaca agccacaagatctggcgccacagctccaagaacaccacaaagcacgtggaagtgaatttcatcgagaagtttacct ccgagcggcacttctgcccctctaccagctgttccatcacatggtttctgtcttggagcccttgcggcgagtgttc caaggccatcaccgagttcctgtctcagcaccctaacgtgaccctggtcatctacgtggcccggctgtatcaccac atggaccagcagaacaggcagggcctgcgcgatctggtgaattctggcgtgaccatccagatcatgacagccccag agtacgactattgctggcggaacttcgtgaattatccacctggcaaggaggcacactggccaagatacccacccct gtggatgaagctgtatgcactggagctgcacgcaggaatcctgggcctgcctccatgtctgaatatcctgcggaga aagcagccccagctgacatttttcaccattgctctgcagtcttgtcactatcagcggctgcctcctcatattctgt gggctacaggcctgaagtctggaggatctagcggaggatcctctggcagcgagacaccaggaacaagcgagtcagcaacaccagagagcagtggcggcagcagcggcggcagcgacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagattacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctaaacgccgtcgtgggaaccgcactgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcagacccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgtgagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccagattcctgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctagagccttcaagtactttgacaccaccatcgaccggaaggtgtacagaagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgacagcggcgggagcggcgggagcggggggagcactaatctgagc gacatcattgagaaggagactgggaaacagctggtcattcaggagtccatcctgatgctgcctgaggaggtggagg aagtgatcggcaacaagccagagtctgacatcctggtgcacaccgcctacgacgagtccacagatgagaatgtgat gctgctgacctctgacgcccccgagtataagccttgggccctggtcatccaggattctaacggcgagaataagatc aagatgctgagcggaggatccggaggatctggaggcagcaccaacctgtctgacatcatcgagaaggagacaggca agcagctggtcatccaggagagcatcctgatgctgcccgaagaagtcgaagaagtgatcggaaacaagcctgagag cgatatcctggtccataccgcctacgacgagagtaccgacgaaaatgtgatgctgctgacatccgacgccccagag tataagccctgggctctggtcatccaggattccaacggagagaacaaaatcaaaatgctgtctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctaggatgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggaagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc
SEQ ID NO.18 pCMV-ABEmax-NG(pCMV-ancBE4max-NG(BPNLS-ecTad-ecTadA*-SpCas9-NG)
atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaagtcgagtttagccacgagtattggatgaggcacgcactgaccctggcaaagcg agcatgggatgaaagagaagtccccgtgggcgccgtgctggtgcacaacaatagagtgatcggagagggatggaac aggccaatcggccgccacgaccctaccgcacacgcagagatcatggcactgaggcagggaggcctggtcatgcaga attaccgcctgatcgatgccaccctgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacag caggatcggaagagtggtgttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcac caccccggcatgaaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatt tctttagaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcgg aggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctccggagga tcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgcgatgaga gggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcct gcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgatt gacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcg tggtgtttggcgtgaggaacgcaaaaaccggcgccgcaggctccctgatggacgtgctgcactaccccggcatgaa tcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgctatttctttcggatgcct agacaggtgttcaatgctcagaagaaggcccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcagacccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgtgagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccagattcctgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctagagccttcaagtactttgacaccaccatcgaccggaaggtgtacagaagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (17)

1.一种融合蛋白,包括蛋白质内含子intein N片段或C片段和碱基编辑器的N端或C端片段,所述碱基编辑器为多肽ancBE4max-NG或ABEmax-NG,所述多肽ancBE4max-NG包括APOBEC1多肽和SpCas9-NG D10A nickase多肽,所述多肽ABEmax-NG包括ecTad-ecTadA*二聚体多肽和SpCas9-NG D10A nickase多肽。
2.权利要求1的融合蛋白,其中所述intein N片段的氨基酸序列为:
a)如SEQ ID NO.1所示的intein-N氨基酸序列;或
b)与SEQ ID NO.1具有90%以上序列一致性的氨基酸序列、且具有a)所限定的氨基酸序列的功能,优选为能够作为内含子进行氨基酸序列剪切和拼接的功能;
所述intein C片段的氨基酸序列为:
c)如SEQ ID NO.2所示的intein-C氨基酸序列;或
d)与SEQ ID NO.2相比具有90%以上序列一致性的氨基酸序列、且具有c)所限定的氨基酸序列的功能,优选为能够作为内含子进行氨基酸序列剪切和拼接的功能。
3.权利要求1的融合蛋白,其中所述碱基编辑器的N端片段为
e)由APOBEC1多肽和SpCas9-NG D10A nickase N端第2~573个氨基酸组成的多肽融合而成;
f)SEQ ID NO.3所示的氨基酸序列;或
g)与SEQ ID NO.3所示的氨基酸序列相比具有90%以上序列一致性的氨基酸序列,且具有e)或f)所限定的氨基酸序列所具有的功能。
4.权利要求1的融合蛋白,其中所述碱基编辑器的C端片段为h)由SpCas9-NG D10Anickase片段C端第574~1368个氨基酸组成的多肽与2*UGI、3*FLAG、BPNLS多肽序列依次融合而成;
i)SEQ ID NO.4所示的氨基酸序列;或
j)与SEQ ID NO.4所示的氨基酸序列相比具有90%以上序列一致性的氨基酸序列,且具有h)或i)所限定的氨基酸序列所具有的功能,优选具有蛋白质水平剪切融合所得全长蛋白的胞嘧啶脱氨酶功能,更优选为能够识别NG作为PAM,N表示任意碱基。
5.权利要求1的融合蛋白,其中所述碱基编辑器的N端片段为
k)由ecTad-ecTadA*二聚体多肽片段和SpCas9-NG D10A nickase片段N端第2~573个氨基酸组成的多肽融合而成;
l)SEQ ID NO.5所示的氨基酸序列;或
m)与SEQ ID NO.5所示的氨基酸序列相比具有90%以上序列一致性的氨基酸序列,且具有k)或l)所限定的功能。
6.权利要求1的融合蛋白,其中所述碱基编辑器的C端片段为
n)由SpCas9-NG D10A nickase多肽C端第574~1368个氨基酸组成的多肽与多肽3*FLAG、BPNLS依次融合而成;
o)SEQ ID NO.6所示的氨基酸序列;或
p)与SEQ ID NO.6所示的氨基酸序列相比具有90%以上序列一致性的氨基酸序列,且具有n)或o)所限定的功能,优选具有蛋白质水平剪切融合所得全长蛋白的腺嘌呤脱氨酶功能,更优选为能够识别NG作为PAM。
7.权利要求1的融合蛋白,其中所述融合蛋白自N端至C端依次包括ancAPOBEC1多肽片段、SpCas9-NG D10A nickase的N端第2~573个氨基酸组成的多肽片段和N-intein多肽。
8.权利要求1的融合蛋白,其中所述融合蛋白自N端至C端依次包括C-intein多肽片段、SpCas9-NG D10A nickase的C端第574~1368个氨基酸组成的多肽片段、2*UGI多肽、3*FLAG多肽和BPNLS多肽。
9.权利要求1的融合蛋白,其中所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚体多肽片段、SpCas9-NG D10A nickase的N端第2~573个氨基酸组成的多肽片段和N-intein多肽。
10.权利要求1的融合蛋白,其中所述融合蛋白自N端至C端依次包括C-intein多肽、SpCas9-NG D10A nickase的C端第574~1368个氨基酸组成的多肽片段、3*FLAG多肽、BPNLS多肽。
11.权利要求1的融合蛋白,还包括核定位信号多肽片段,
优选的,所述核定位信号多肽片段位于权利要求1~10任一项所述的融合蛋白的N端和/或C端,更优选的,所述核定位信号多肽片段的氨基酸序列如SEQ ID NO.7所示。
12.权利要求1的融合蛋白,其氨基酸序列如SEQ ID NO.8~11任一项所示。
13.一种腺病毒包装系统,包括权利要求1~12任一项所述的融合蛋白相应的氨基酸序列或/和所述的融合蛋白对应如SEQ ID NO.12~15任一项所示的核苷酸编码序列。
14.一种基因编辑工具,包括权利要求13的腺病毒包装系统、sgRNA以及sgRNA包装载体,所述载体的核苷酸序列如SEQ ID NO.16所示。
15.一种细胞表达系统,其中含有权利要求14的基因编辑工具,所述细胞为宿主细胞,宿主细胞优选真核细胞或原核细胞,
更优选小鼠细胞或人细胞;
更优选为小鼠脑神经瘤细胞、人胚胎肾细胞或人宫颈癌细胞;
更优选为N2a细胞、HEK293FT细胞或Hela细胞。
16.权利要求1~12的融合蛋白、权利要求13的腺病毒包装系统、权利要求14的基因编辑工具或权利要求15的细胞表达系统在基因编辑中的应用。
17.一种基于腺病毒的基因编辑方法,包括步骤:基于权利要求1~12的融合蛋白、权利要求13的腺病毒包装系统、权利要求14的基因编辑工具或权利要求15的细胞表达系统进行体外或体内基因编辑。
CN201910725037.3A 2019-08-06 2019-08-06 一种融合蛋白、碱基编辑工具和方法及其应用 Active CN110467679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910725037.3A CN110467679B (zh) 2019-08-06 2019-08-06 一种融合蛋白、碱基编辑工具和方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910725037.3A CN110467679B (zh) 2019-08-06 2019-08-06 一种融合蛋白、碱基编辑工具和方法及其应用

Publications (2)

Publication Number Publication Date
CN110467679A true CN110467679A (zh) 2019-11-19
CN110467679B CN110467679B (zh) 2021-04-23

Family

ID=68510316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910725037.3A Active CN110467679B (zh) 2019-08-06 2019-08-06 一种融合蛋白、碱基编辑工具和方法及其应用

Country Status (1)

Country Link
CN (1) CN110467679B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112251464A (zh) * 2020-10-19 2021-01-22 复旦大学附属中山医院 一种基因点突变的诱导方法
CN113201517A (zh) * 2021-05-12 2021-08-03 广州大学 一种胞嘧啶单碱基编辑器工具及其应用
CN113403294A (zh) * 2021-06-04 2021-09-17 广州大学 一种融合蛋白、碱基编辑工具及其应用
CN113549650A (zh) * 2021-07-05 2021-10-26 中国医学科学院血液病医院(中国医学科学院血液学研究所) 一种CRISPR-SaCas9基因编辑系统及其应用
CN114606265A (zh) * 2022-04-07 2022-06-10 吉林大学 一种能够实现单个aav病毒包被的迷你碱基编辑器
CN115704015A (zh) * 2021-08-12 2023-02-17 清华大学 基于腺嘌呤和胞嘧啶双碱基编辑器的靶向诱变系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106011104A (zh) * 2015-05-21 2016-10-12 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
US20180127780A1 (en) * 2016-10-14 2018-05-10 President And Fellows Of Harvard College Aav delivery of nucleobase editors
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN109021111A (zh) * 2018-02-23 2018-12-18 上海科技大学 一种基因碱基编辑器
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106011104A (zh) * 2015-05-21 2016-10-12 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US20180127780A1 (en) * 2016-10-14 2018-05-10 President And Fellows Of Harvard College Aav delivery of nucleobase editors
CN109021111A (zh) * 2018-02-23 2018-12-18 上海科技大学 一种基因碱基编辑器
CN110029096A (zh) * 2019-05-09 2019-07-19 上海科技大学 一种腺嘌呤碱基编辑工具及其用途

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
ALEXIS C. KOMOR等: "Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity", 《SCIENCE ADVANCES》 *
DONG-JIUNN JEFFERY TRUONG等: "Development of an intein-mediated split–Cas9 system for gene therapy", 《NUCLEIC ACIDS RESEARCH》 *
HIROSHI NISHIMASU等: "Engineered CRISPR-Cas9 nuclease with expanded targeting space", 《SCIENCE》 *
LUCAS F. RIBEIRO等: "Protein Engineering Strategies to Expand CRISPR-Cas9 Applications", 《INTERNATIONAL JOURNAL OF GENOMICS》 *
LUKAS VILLIGER等: "Treatment of a metabolic liver disease by in vivo genome base editing in adult mice", 《NATURE MEDICINE》 *
LUKE W. KOBLAN等: "Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction", 《NATURE BIOTECHNOLOGY》 *
SHISHENG HUANG等: "Developing ABEmax-NG with Precise Targeting and Expanded Editing Scope to Model Pathogenic Splice Site Mutations In Vivo", 《ISCIENCE》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112251464A (zh) * 2020-10-19 2021-01-22 复旦大学附属中山医院 一种基因点突变的诱导方法
CN112251464B (zh) * 2020-10-19 2023-09-12 复旦大学附属中山医院 一种基因点突变的诱导方法
CN113201517A (zh) * 2021-05-12 2021-08-03 广州大学 一种胞嘧啶单碱基编辑器工具及其应用
CN113201517B (zh) * 2021-05-12 2022-11-01 广州大学 一种胞嘧啶单碱基编辑器工具及其应用
CN113403294A (zh) * 2021-06-04 2021-09-17 广州大学 一种融合蛋白、碱基编辑工具及其应用
CN113403294B (zh) * 2021-06-04 2023-08-08 广州大学 一种融合蛋白、碱基编辑工具及其应用
CN113549650A (zh) * 2021-07-05 2021-10-26 中国医学科学院血液病医院(中国医学科学院血液学研究所) 一种CRISPR-SaCas9基因编辑系统及其应用
CN115704015A (zh) * 2021-08-12 2023-02-17 清华大学 基于腺嘌呤和胞嘧啶双碱基编辑器的靶向诱变系统
CN114606265A (zh) * 2022-04-07 2022-06-10 吉林大学 一种能够实现单个aav病毒包被的迷你碱基编辑器
CN114606265B (zh) * 2022-04-07 2024-01-30 吉林大学 一种能够实现单个aav病毒包被的迷你碱基编辑器

Also Published As

Publication number Publication date
CN110467679B (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
CN110467679A (zh) 一种融合蛋白、碱基编辑工具和方法及其应用
US10501728B2 (en) Engineered nucleic-acid targeting nucleic acids
EP3523430B1 (en) Engineered nucleic acid-targeting nucleic acids
US10858662B2 (en) Genome editing with split Cas9 expressed from two vectors
EP3371310B1 (en) Engineered nucleic-acid targeting nucleic acids
US11104897B2 (en) Compositions and methods for the treatment of nucleotide repeat expansion disorders
EP3178935B1 (en) Genome editing using campylobacter jejuni crispr/cas system-derived rgen
WO2016197354A1 (zh) CRISPR-Cas9特异性敲除猪PDX1基因的方法及用于特异性靶向PDX1基因的sgRNA
WO2016197361A1 (zh) CRISPR-Cas9特异性敲除猪GGTA1基因的方法及用于特异性靶向GGTA1基因的sgRNA
US20190194691A1 (en) Vector-Free Delivery of Gene Editing Proteins and Compositions to Cells and Tissues
AU2016274452A1 (en) Thermostable Cas9 nucleases
CN104080462A (zh) 用于修饰预定的靶核酸序列的组合物和方法
CN111684070A (zh) 用于a型血友病基因编辑的组合物和方法
CN107995927A (zh) 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
Park et al. Enhanced genome editing efficiency of CRISPR PLUS: Cas9 chimeric fusion proteins
Fehr Bacterial artificial chromosome-based lambda red recombination with the I-SceI homing endonuclease for genetic alteration of MERS-CoV
EP4227412A1 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof
CN105602972B (zh) 基于CRISPR-Cas9体外改造腺病毒载体的方法
WO2023016021A1 (zh) 一种碱基编辑工具及其构建方法
CN116004716A (zh) 一种复制型dCas9-FokI系统进行高效基因编辑的方法
WO2023232024A1 (en) System and methods for duplicating target fragments
JP7010941B2 (ja) Dna編集に用いられるシステムおよびその応用
US20220389418A1 (en) Rna-guided cas nucleases and uses thereof in diagnostics and therapy
WO2024089629A1 (en) Cas12 protein, crispr-cas system and uses thereof
JPWO2021138247A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant