CN109929839B - 拆分型单碱基基因编辑系统及其应用 - Google Patents

拆分型单碱基基因编辑系统及其应用 Download PDF

Info

Publication number
CN109929839B
CN109929839B CN201711368309.6A CN201711368309A CN109929839B CN 109929839 B CN109929839 B CN 109929839B CN 201711368309 A CN201711368309 A CN 201711368309A CN 109929839 B CN109929839 B CN 109929839B
Authority
CN
China
Prior art keywords
lys
leu
glu
nucleic acid
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711368309.6A
Other languages
English (en)
Other versions
CN109929839A (zh
Inventor
李大力
张晓辉
刘明耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bangyao Biological Technology Co ltd
East China Normal University
Original Assignee
Shanghai Bangyao Biological Technology Co ltd
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bangyao Biological Technology Co ltd, East China Normal University filed Critical Shanghai Bangyao Biological Technology Co ltd
Priority to CN201711368309.6A priority Critical patent/CN109929839B/zh
Priority to US16/955,453 priority patent/US20200347407A1/en
Priority to EP18892746.1A priority patent/EP3730616A4/en
Priority to PCT/CN2018/121779 priority patent/WO2019120193A1/zh
Publication of CN109929839A publication Critical patent/CN109929839A/zh
Application granted granted Critical
Publication of CN109929839B publication Critical patent/CN109929839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Abstract

本发明提供了拆分型单碱基基因编辑系统及其应用,具体地,本发明利用spCas9、saCas9蛋白结构信息及其拆分方法,分别发展了内含肽(intein)介导的拆分的BE3(split BE3)、KKH(split KKH),与未拆分的BE3、KKH工作系统的靶向基因突变效率相当,为可包装进AAV进行递送提供了可能,促进其在基因编辑、基因治疗及临床的广泛应用。

Description

拆分型单碱基基因编辑系统及其应用
技术领域
本发明涉及生物技术领域,具体地,涉及拆分型单碱基基因编辑系统及其应用。
背景技术
自2013年以来,以CRISPR/Cas9为代表的新一代基因编辑技术进入生物学领域的各个实验,正改变着传统的基因操作手段。
目前,单碱基基因编辑技术,已被报道可用于高效地进行基因组的基因突变或修复,疾病动物模型制作,基因治疗。已发现的单碱基基因编辑工具中,以BE3,KKH的应用最为广泛。但是BE3,KKH全长分别为6.1kb,5.3kb,超出了腺相关病毒(AAV)包装限度4.7kb,导致其无法包装进AAV进行递送达,阻碍了在基因编辑,基因治疗及临床广泛应用。
因此,本领域迫切需要开发可以维持相当的靶向基因突变效率的拆分的单碱基基因编辑系统。
发明内容
本发明的目的在于提供一种可以维持相当的靶向基因突变效率的拆分单碱基基因编辑系统。
本发明的目的在于还提供了拆分的单碱基基因编辑系统(split-BE3和split-KKH),分别拆分为N端和C端,其长度均小于腺相关病毒(AAV)包装限度4.7Kb,可以用AAV包装并递送,进一步扩大了base editor应用范围。另一方面提供了拆分的单基因基因编辑系统(split-BE3和split-KKH),可以首先加拆开的base editor的一端,根据需要,在一定时间内加入拆开的base editor的另一端,实现可控性诱导单碱基C到T编辑。
本发明第一方面提供了一种核酸构建物组合,包括第一核酸构建物和第二核酸构建物,其中,所述第一核酸构建物具有从5’-3’的式I结构:
P1-X1-X2-X3-Z-X4 (I);
其中,P1为第一启动子序列;
X1为胞嘧啶脱氨酶的编码序列;
X2为任选的连接序列;
X3为Cas9核酸酶的N端片段的编码序列或KKH核酸酶的N端片段的编码序列(Cas9n-N或KKH-N);
Z为第一融合肽N端片段的编码序列;
X4为polyA序列;
所述第二核酸构建物具有从5’-3’的式II结构:
P2-Z-Y1-Y2-Y3 (II);
其中,P2为第二启动子序列;
Z为第一融合肽C端片段的编码序列;
Y1为Cas9核酸酶的C端片段的编码序列或KKH核酸酶的C端片段的编码序列(Cas9n-C或KKH-C);
Y2为尿嘧啶糖苷酶抑制剂UGI的编码序列;
Y3为polyA序列;
并且,各“-”独立地为键或核苷酸连接序列。
在另一优选例中,所述的第一启动子和第二启动子各自独立地选自下组:CAG启动子、CMV启动子、或其组合。
在另一优选例中,所述第一启动子序列包括CAG启动子。
在另一优选例中,所述第二启动子序列包括CAG启动子。
在另一优选例中,所述连接序列选自下组:XTEN、GGS、(GGS)3、(GGS)7、或其组合。
在另一优选例中,所述胞嘧啶脱氨酶包括Apobec1。
在另一优选例中,所述Cas9核酸酶选自下组:Cas9、Cas9n、或其组合。
在另一优选例中,Cas9n的N端片段为Cas9n核酸酶(登录号(Gene ID):2828055)的2-573位氨基酸)。
在另一优选例中,Cas9n的C端片段为Cas9n核酸酶(登录号(Gene ID):2828055)的574-1368位氨基酸。
在另一优选例中,KKH的N端片段为KKH核酸酶的2-739位氨基酸(登录号(GeneID):2828033)。
在另有一优选例中,KKH的C端片段为KKH核酸酶的740-1053位氨基酸。
在另一优选例中,所述X3元件的来源选自下组:酿脓链球菌(Streptococcuspyogenes)、葡萄球菌(Staphylococcus aureus)、或其组合。
在另一优选例中,所述X3元件中,突变位点在Cas9n-N(SEQ ID NO.:1)的D10A位。
在另一优选例中,所述X3元件中,突变位点在KKH-N(SEQ ID NO.:2)的D10A位。
在另一优选例中,所述Y1元件中,在Cas9n-C(SEQ ID NO.:4)中无突变位点。
在另一优选例中,所述Y1元件中,突变位点在KKH-C(SEQ ID NO.:3)的E782K/N968K/R1015H位。
在另一优选例中,所述polyA序列各自独立地选自下组:BGH的polyA、SV40的polyA、或其组合。
在另一优选例中,所述第一核酸构建物的长度≤4.7kb,较佳地,≤4.5kb,更佳地,3.0-4.5kb。
在另一优选例中,所述第二核酸构建物的长度≤4.7kb,较佳地,≤4.5kb,更佳地,3.0-4.5kb。
在另一优选例中,所述的第一融合肽N端片段和第一融合肽C端片段共同构成具有活性的第一融合肽。
在另一优选例中,所述的第一融合肽选自下组:内含肽(Intein)、FRB/FKBP、DmC/FKBP、ABI/PYL、或其组合。
在另一优选例中,所述的第一融合肽N端片段为融合肽(如内含肽)的2-103位氨基酸。
在另一优选例中,所述第一融合肽C端片段为融合肽(如内含肽)的104-137位氨基酸。
本发明第二方面提供了一种载体组合,包括第一载体和第二载体,所述第一载体含有第一核酸构建物,所述第二载体含有所述第二核酸构建物,所述的第一核酸构建物和第二核酸构建物如本发明第一方面中所定义。
在另一优选例中,所述第一载体和第二载体为病毒载体。
在另一优选例中,所述第一载体和第二载体为AAV病毒载体。
在另一优选例中,在所述第一载体中,第一构建物位于第一载体的两端是倒转末端重复序列的表达盒中。
在另一优选例中,在所述第二载体中,第二构建物位于第二载体的两端是倒转末端重复序列的表达盒中。
在另一优选例中,所述载体组合还含有第三载体(用于检测目的),所述第三载体含有第三核酸构建物,所述第三核酸构建物具有式III所示的结构:
M1-L1-M2-M3 (III);
其中,M1为第三启动子序列;
L1:位于M1与M2之间的间隔序列;
M2为ACG三碱基序列;或ATG(N)3mTAC序列(m为0-20的正整数)
M3为具有式IV所示结构的核苷酸序列:N0-N1-N2-L2-N3-N4 (IV);其中,N0为含有基因编码位点的靶序列,N1为PAM序列,N2为自剪切蛋白的编码序列;L2为无或位于M1与M2之间的间隔肽编码序列;N3为外源蛋白的编码序列,所述编码序列不含起始密码子ATG且含有终止密码子;N4为任选的PolyA序列;
附加条件:
ACG情况下,L1、N0和N1均不含ATG和终止密码子;
并且,各“-”独立地为键或核苷酸连接序列。
在另一优选例中,所述的(N)3m不含终止密码子。
在另一优选例中,所述的核苷酸连接序列长度为1-60nt,优选为3的倍数。
在另一优选例中,在M2-M3中的各“-”为键。
在另一优选例中,所述第三启动子序列选自下组:U6、CMV、或其组合。
在另一优选例中,所述的PAM序列包括NGG或NNNRRT。
在另一优选例中,所述自剪切蛋白选自下组:T2A、P2A、E2A、F2AT、或其组合。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶、海肾荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、红色荧光蛋白、或其组合。
在另一优选例中,源自M2的ATG和N2、N3元件处于同一阅读框架。
在另一优选例中,所述polyA序列选自下组:BGH的polyA、SV40的polyA、或其组合。
本发明第三方面提供了一种基因工程细胞,所述细胞被本发明第一方面所述的构建物所转化;或被本发明第二方面所述的载体组合所转化或转染。
在另一优选例中,所述的载体组合包括第一病毒载体和第二病毒载体,较佳地,所述的第一病毒载体和第二病毒载体均为AAV病毒载体。
在另一优选例中,所述基因工程细胞为原核细胞或真核细胞。
在另一优选例中,所述原核细胞包括:大肠杆菌。
在另一优选例中,所述真核细胞选自下组:酵母细胞、植物细胞、哺乳动物细胞(如HEK293T细胞)、人细胞、或其组合。
在另一优选例中,所述的基因工程细胞是第一病毒载体和第二病毒载体通过病毒制备的。
本发明第四方面提供了一种在细胞内进行基因编辑的方法,包括步骤:
(i)提供一细胞以及第一载体和第二载体,其中所述第一载体含有第一核酸构建物,所述第二载体含有所述第二核酸构建物,所述的第一核酸构建物和第二核酸构建物如本发明第一方面中所定义,并且所述的第一载体和第二载体均为病毒载体;
(ii)用所述的病毒载体感染所述的细胞,从而在所述细胞内进行基因编辑。
在另一优选例中,在步骤(ii)中,还包括用编码gRNA的第三载体同时感染所述细胞。
在另一优选例中,所述的第一载体和/或第二载体还携带表达gRNA表达盒。
在另一优选例中,所述的方法是非诊断和非治疗性。
在另一优选例中,所述的基因编辑包括:定点切割、定点插入、定点重组。
在另一优选例中,所述的细胞来自以下物种:人、非人哺乳动物、家禽、植物。
在另一优选例中,所述的非人哺乳动物包括啮齿动物(如小鼠、大鼠、兔)、牛、猪、羊、马、狗、猫、非人灵长动物(如猴)。
在另一优选例中,所述的细胞包括:体细胞、干细胞、生殖细胞、非分裂细胞、或其组合。
在另一优选例中,所述的细胞包括:肾细胞、上皮细胞、内皮细胞、或其组合。
本发明第五方面提供了一种试剂盒,所述试剂盒包括:
(a1)第一容器,以及位于所述第一容器中的第一载体;和
(b1)第二容器,以及位于所述第二容器中的第二载体。
在另一优选例中,所述第一容器和第二容器是不同的容器。
在另一优选例中,所述试剂盒还含有说明书,所述说明书中记载了如下说明:将第一载体和第二载体感染细胞,从而在所述细胞内进行基因编辑的方法。
在另一优选例中,所述试剂盒还含有(c1)第三容器,以及含有编码gRNA的第三载体的第三容器。
在另一优选例中,所述的第一载体和/或第二载体还携带表达gRNA表达盒。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了BE3及U6-sgRNA-BE3示意图。其中,CMV:启动子;U6:人源U6启动子;Apobec1:胞嘧啶脱氨酶;XTEN:为linker;SpCas9n:D10A突变的切口的SpCas9;UGI:尿嘧啶糖苷酶抑制剂;BGH:PolyA序列.星号:为突变位点。
图2显示了KKH及U6-sgRNA-KKH示意图。其中,CMV:启动子;U6:人源U6启动子;Apobec1:胞嘧啶脱氨酶;XTEN:为linker;SaCas9n(KKH):除了D10A突变外,还带3个共它氨基酸突变的SaCas9;UGI:尿嘧啶糖苷酶抑制剂;BGH:PolyA序列;星号:为突变位点。
图3显示了Split BE3及U6-sgRNA-Split BE3示意图。其中,CMV:启动子;U6:人源U6启动子;Apobec1:胞嘧啶脱氨酶;XTEN:为linker;SpCas9n-N:D10A突变的切口的SpCas9的N端;SpCas9n-C:SpCas9n的C端;573,574:SpCas9第573,574位点氨基酸;UGI:尿嘧啶糖苷酶抑制剂;BGH:PolyA序列.星号:为突变位点。
图4显示了Spl it KKH及U6-sgRNA-Split KKH示意图。其中,CMV:启动子;U6:人源U6启动子;Apobec1:胞嘧啶脱氨酶;XTEN:为l inker;KKH-N:D10A突变的切口的SaCas9的N端;KKH-C:存在三个氨基酸突变的SaCas9的C端;739,740:SaCas9第739,740位点氨基酸;UGI:尿嘧啶糖苷酶抑制剂;BGH:PolyA序列.星号:为突变位点。
图5显示了CMV-T2A-luciferase报告系统示意图。其中,CMV:启动子;NheI,BamHI,为酶切位点;T2A:自剪接短肽;luciferase:海肾荧光素酶基因。ATG free:无起始密码子ATG;PA:PolyA序列。
图6显示了U6-spsgRNA-EF1α-GFP示意图。其中,U6:人源U6启动子;sg:代表可插入的SpCas9的靶点;EF1α:启动子:EGFP:增强绿色荧光蛋白;PA:PolyA序列。
图7显示了U6-sasgRNA-EF1α-GFP示意图。其中,U6:人源U6启动子;sa:代表可插入的SaCas9的靶点;EF1α:启动子:EGFP:增强绿色荧光蛋白;PA:PolyA序列。
图8显示了U6-sgRNA-BE3与U6-sgRNA Split-BE3的luciferase相对活性。其中,纵坐标:代表不同处理组luciferase相对于单转CMV-ACG-T2A-luciferase组的相对活性;横坐标,从左至右分别为N:U6-sg4-split-BE3-N单转组;C:U6-sg4-split-BE3-C单转组;Luc:CMV-ACG-T2A-luciferase组;N+C+Luc:U6-sg4-split-BE3-N,U6-sg4-spl it-BE3-C与CMV-ACG-T2A-luciferase共转组;PC:CMV-ATG-T2A-luciferase组(阳性对照组);FL+Luc:U6-sg4-BE3与CMV-ACG-T2A-luciferase共转组;Blank:阴性对照组。
图9显示了U6-sgRNA-KKH与U6-sgRNA Split-KKH的luciferase相对活性。其中,纵坐标:代表不同处理组luciferase相对于单转CMV-ACG-T2A-luciferase组的相对活性;横坐标,从左至右分别为N:U6-sg2-split-KKH-N单转组;C:U6-sg2-split-KKH-C单转组;Luc:CMV-ACG-T2A-luciferase组;N+C+Luc:U6-sg2-split-KKH-N,U6-sg2-split-KKH-C与CMV-ACG-T2A-luciferase共转组;PC:CMV-ATG-T2A-luciferase组(阳性对照组);FL+Luc:U6-sg2-KKH与CMV-ACG-T2A-luciferase共转组;Blank:阴性对照组。
图10显示了BE3与split BE3对内源基因EMX1-sgRNA4突变PCR产物测序峰图。其中,图上:代表BE3与U6-sgRNA4-EF1α-GFP共转组,72h流式分选后,PCR测序峰图;
图下:代表split-BE3与U6-sgRNA4-EF1α-GFP共转组,72h流式分选后,PCR测序峰图。
图11显示了KKH与split KKH对内源基因EMX1-KKH-sgRNA1突变PCR产物测序峰图。其中,图上:代表KKH与U6-sgRNA1-EF1α-GFP共转组,72h流式分选后,PCR测序峰图;
图下:代表split-KKH与U6-sgRNA1-EF1α-GFP共转组,72h流式分选后,PCR测序峰图。
图12显示了BE3与split BE3对内源基因EMX1突变效率检测。其中,纵坐标:代表单碱基C到T突变的百分数;横坐标:EMX1-BE3-sg4代表共转染BE3与U6-sgRNA4-EF1α-GFP组;EMX1-split-BE3-sg4代表共转染split-BE3-N,split-BE3-C与U6-sgRNA4-EF1α-GFP组。
图13显示了KKH与split KKH对内源基因EMX1突变效率检测。其中,纵坐标:代表单碱基C到T突变的百分数;横坐标:EMX1-KKH-sg1代表共转染KKH与U6-sgRNA1-EF1α-GFP组;EMX1-split-BE3-sg1代表共转染split-BE3-N,split-BE3-C与U6-sgRNA1-EF1α-GFP组。
具体实施方式
本发明人经过广泛而深入地研究,首次意外地发现,利用spCas9、saCas9现有蛋白结构信息及其拆分方法,分别发展了内含肽(intein)介导的拆分的BE3(split BE3)、KKH(split KKH),且拆分的BE3(split BE3)、KKH(split KKH)具有显著的靶向基因突变效率,与未拆分的BE3、KKH工作系统的靶向基因突变效率相当,为可包装进AAV进行递送提供了可能,促进其在基因编辑、基因治疗及临床的广泛应用。在此基础上,本发明人完成了本发明。
BE3工作系统
BE3,即Base editor 3,即通过胞嘧啶脱氨酶与源于酿脓链球菌(Streptococcuspyogenes)的带有D10A突变的spCas9(spCas9n)融合形成,它以NGG作为PAM并识别并特异结合DNA并在NGG上游16-19位实现胞嘧啶到胸腺嘧啶的单碱基突变(图1)。
KHH工作系统
KKH,即通过胞嘧啶脱氨酶与葡萄球菌(Staphylococcus aureus)SaCas9带有D10A突变,同时带有E782K/N968K/R1015H突变的saCas9(以后称为KKH)融合形成,以NNNRRT(R=A或G)作为PAM并识别并特异结合DNA并在PAM上游11-16位实现C到T的单碱基突变。
自剪切蛋白
自剪切蛋白2A是一类18-22个氨基酸组成的多肽。当其连接两个或多个蛋白时,其翻译的蛋白产物可以在2A高度保守的C端的甘氨酸与脯氨酸之间发生剪切
Figure BDA0001513214940000091
从而实现2A两端的蛋白产物各自独立行使功能。本发明所使用的自剪切蛋白来源为明脉扁刺蛾β四体病毒的T2A,另外还有来自于口蹄疫病毒的F2A,马鼻炎病毒的E2A,猪捷申1病毒的P2A。
在一优选实施方式中,自剪切蛋白为2A序列。2A序列是病毒里面来的,是一种18-22个氨基酸的短肽,它通过自我剪接在一个开放阅读框内表达多个蛋白,且自我剪接效率几乎达100%,常用的有T2A,P2A,F2A,E2A。
融合肽
在本发明中,所述融合肽没有特别限制,一种优选的融合肽选自下组:内含肽、FRB/FKBP、DmC/FKBP、ABI/PYL、或其组合。
在一优选实施方式中,所述融合肽为内含肽。内含肽是天然存在的中间序列,它能催化蛋白拼接反应使内含肽从而侧翼多肽成为带有天然肽键的串联物。内含肽基于拼接反应以及不同来源的多肽相耦合方式的在特定的时间的控制酶活功能。
本发明的构建物组合
本发明提供了一种核酸构建物组合,包括第一构建物和第二构建物,其是利用spCas9、saCas9现有蛋白结构信息及其拆分方法,分别发展了内含肽(intein)介导的拆分的BE3(split BE3)、KKH(split KKH),拆分的BE3(split BE3)、KKH(split KKH)对核酸构建物的带有ACG靶点的C突变为T,与未拆分的BE3、KKH工作系统的靶向基因突变效率相当,为可包装进AAV进行递送提供了可能,促进其在基因编辑、基因治疗及临床的广泛应用。本发明的构建物组合如本发明第一方面所述。
本发明的构建物组合中所用的各种元件都是本领域中已知的,因此本领域技术人员可以用常规方法,如PCR方法、全人工化学合成法、酶切方法获得相应的元件,然后通过熟知的DNA连接技术连接在一起,就形成了本发明的构建物组合。
将本发明的构建物组合(第一构建物和第二构建物)插入外源载体,就构成了本发明的载体组合(第一载体和第二载体)。
在一优选实施方式中,所述载体组合还含有第三载体(用于检测目的),所述第三载体含有第三核酸构建物,所述第三核酸构建物具有式III所示的结构:
M1-L1-M2-M3 (III);
其中,M1为第三启动子序列;
L1:位于M1与M2之间的间隔序列;
M2为ACG三碱基序列;或ATG(N)3mTAC序列(m为0-20的正整数)
M3为具有式IV所示结构的核苷酸序列:N0-N1-N2-L2-N3-N4 (IV);其中,N0为含有基因编码位点的靶序列,N1为PAM序列,N2为自剪切蛋白的编码序列;L2为无或位于M1与M2之间的间隔肽编码序列;N3为外源蛋白的编码序列,所述编码序列不含起始密码子ATG且含有终止密码子;N4为任选的PolyA序列;
附加条件:
ACG情况下,L1、N0和N1均不含ATG和终止密码子;
并且,各“-”独立地为键或核苷酸连接序列。
在本发明中,可以用多种检测方法进行检测,一种优选的方式为用上述第三载体进行检测。
具体地,本发明的构建物组合的构建流程和应用如下:
1.根据人的EMX1基因分别设计BE3,KKH靶点序列sgRNA4,sgRNA1,sgRNA2(表1),并根据其靶点设计其sgRNA oligo(表2,表3,表4).在BE3,KKH基础上设计U6-sgRNA-BE3,U6-sgRNA-KKH(图1,图2)。根据Spcas9及saCas9结构信息,用内含肽(intein)为融合连接肽,设计了拆分的BE3,在Spcas9的第573与574位氨基酸之间拆开,即U6-sgRNA-split BE3-N,U6-sgRNA-split BE3-C及split BE3-N与split BE3-C(图3);同时设计了拆分的KKH,在Sacas9的第739与740位氨基酸之间拆开,即U6-sasgRNA-split KKH-N与U6-sasgRNA-split KKH-C及split KKH-N与split KKH-C(图4)。设计了CMV-T2A-luciferase报告系统(图5)。同时设计表达具有spCas9 sacffold的sgRNA载体U6-spsgRNA-EF1α-GFP(图6)和表达具有saCas9sacffold的sgRNA载体U6-sasgRNA-EF1α-GFP(图7)。
2.依次构建上述质粒。
3.利用CMV-T2A-luciferase报告系统进行对比U6-sgRNA-BE3与U6-sgRNA-split-BE3,U6-sgRNA-KKH与U6-sgRNA-split-KKH,相对C到T的突变活性(图8,图9)。结果表明,BE3与split BE3相对C到T的突变活性持平;KKH与split KKH相对C到T的突变活性持平。
4.对比BE3与split-BE3-N/split-BE3-C,KKH与split-KKH-N/split-KKH-C对人的内源基因EMX1的C到T定点编辑效率。
即如下组合,进行转染293T,
BE3:U6-sgRNA4-EF1α-GFP=250ng:250ng,
Split BE3-N:Split BE3-C:U6-sgRNA4-EF1α-GFP=125ng:125ng:250ng
KKH:U6-sgRNA1-EF1α-GFP=250ng:250ng,
Split KKH-N:Split KKH-C:U6-sgRNA1-EF1α-GFP=125ng:125ng:250ng转染后72h后,通过流式分选,BE3及split BE3,KKH及split KKH转染组细胞,经过PCR测序双峰后(图10,图11),连pEasy-blunt挑单克隆100个测序,对比检测BE3与spl it BE3(图12),KKH与split KKH(图13)内源性基因EMX1单碱基C到T定点编辑效率。结果表明,BE3与split BE3对内源性基因C到T定点编辑效率持平;KKH与split KKH对内源性基因C到T定点编辑效率持平。
表1.人EMX1的带ACG的靶点序列
Figure BDA0001513214940000111
Figure BDA0001513214940000121
表2.EMX1-BE3-sgRNA4 oligo,TS-oligo及oligo-pc设计
Figure BDA0001513214940000122
表3.EMX1-KKH sgRNA2 oligo,TS oligo及oligo-pc设计
Figure BDA0001513214940000123
Figure BDA0001513214940000131
表4.EMX1-KKH sgRNA1 oligo设计
Figure BDA0001513214940000132
本发明的主要优点包括:
(1)本发明首次利用spCas9、saCas9现有蛋白结构信息及其拆分方法,分别发展了内含肽(intein)介导的拆分的BE3(split BE3)、KKH(split KKH),并且首次发现,拆分的BE3(split BE3)、KKH(split KKH)具有显著的靶向基因突变效率,与未拆分的BE3、KKH工作系统的靶向基因突变效率相当,为可包装进AAV进行递送提供了可能,促进其在基因编辑、基因治疗及临床的广泛应用。
(2)本发明的拆分的单碱基基因编辑系统(split-BE3和split-KKH),分别将BE3和KKH拆分为N端和C端,其长度均小于腺相关病毒(AAV)包装限度4.7Kb,可以用AAV包装并递送,进一步扩大了base editor的应用范围。
(3)本发明的拆分的单基因基因编辑系统(split-BE3和split-KKH),可以首先加拆开的base editor的一端,根据需要,在一定时间内加入拆开的base editor的另一端,实现可控性诱导单碱基C到T编辑。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明中所涉及的实验材料和试剂如无特殊说明均可从市售渠道获得。
实施例1利用CMV-T2A-luciferase检测Split-BE3,Split-KKH突变效率
1.BE3,U6-sgRNA-BE3,Split-BE3,U6-sgRNA-Split-BE3,KKH,U6-sgRNA–KKH,Split-KKH,U6-sgRNA-Split KKH,CMV-T2A-luciferase,U6-SpsgRNA-EF1α-GFP,U6-SasgRNA-EF1α-GFP质粒载体的设计与构建
1.1设计原理及原则:
1.1.1 BE3,KKH首先在BGH polyA上通过突变一个碱基使BbsI酶切位点去除,之后再分别在CMV启动子的前端克隆进U6-SpsgRNA和U6-SasgRNA,即成为U6-sgRNA-BE3(图1),U6-sgRNA–KKH(图2)并保持其带有BbsI酶切位点,使其通过BbsI酶切克隆进任意靶点。同理,在Split-BE3,Split-KKH经改造也成为能克隆进任意靶点U6-sgRNA-Split-BE3-N(图3),U6-sgRNA-Split-BE3-C(图3),U6-sgRNA-Split KKH-N(图4),U6-sgRNA-Split KKH-C(图4),这些均保持带有BbsI酶切位点,可通过BbsI酶切克隆进任意靶点。对于U6-SpsgRNA-EF1α-GFP,U6-SasgRNA-EF1α-GFP是将能表达SpCas9 sgRNA,SaCas9 sgRNA质粒克隆了GFP,即成为表达sgRNA也同时GFP,便于后续鉴定流式分析与分选。
1.1.2根据自剪接短肽-2A的工作原理,即2A前后连接的表达蛋白水平相当,选取了来自明脉扁刺蛾β四体病毒(Thosea asigna)的T2A作为自剪接多肽,设计了如下报告系统,CMV-T2A-luciferase(图5)。具体为CMV为启动子,其后无ATG且保留NheI,BamHI单酶切的多克隆位点,之后为T2A自剪接多肽,最后为无ATG的luciferse序列。
其使用设计原则为:根据base editor工作原理,将BE3带有PAM的靶点序列(23bp)或KKH带有PAM的靶点的序列(26bp)克隆至用NheI,BamHI双酶切的报告质粒中,且保持ACG在BE3或者KKH的突变窗口内,同时与T2A后的luciferase的读码框一致。若不足3的倍数应补足到3的倍数。同时注意ACG保持一致的读码框内其前面不出现ATG,其后不能出现终止密码子(TAG,TAA,TGA)。
1.2.根据CRISPR/Cas9及BE3,KKH工作原理设计人的EMX1基因分别设计BE3带ACG的靶点序列sgRNA4,KKH带ACG的靶点序列sgRNA2(表1),且ACG在其突变窗口内,并根据其靶点设计其sgRNA oligo,带有NGG或NNNRRT的靶点Target site ol igo(TS-oligo),对应靶点的阳性oligo(Oligo-pc)(表2,表3,表4)。
靶序列sgRNA oligo设计原则:CRISPR/Cas9中spCas9识别PAM(NGG),saCas9识别PAM(NNNRRT)同时需要20个碱基互补配对sgRNA为导向靶向结合,sgRNA以U6为启动子,需要G作为转录起始位点,同时U6-sgRNA-BE3,U6-sgRNA-split BE3-N,U6-sgRNA-split BE3-C,U6-sgRNA-KKH,U6-sgRNA-split KKH-N,U6-sgRNA-split KKH-C,U6-SpsgRNA-EF1α-GFP,U6-SasgRNA-EF1α-GFP均是以BbsI酶切位点连入靶点,因此,sgRNA oligo-up 5.端需要补充CACC,sgRNA oligo-up 5.端需要补充AAAC,具体设计序列如(表2,表3,表4)
靶序列luciferase oligo及luciferase阳性oligo设计原则:CMV-T2A-luciferase质粒中,可将靶点序列插入T2A前面,且保持ACG突变为ATG后与其后luciferase读码框保持一致。由于T2A前可用NheI,BamHI双酶切后,连入靶点序列。因此,luciferaseoligo-up,5.端需要补充CTAG,luciferase oligo-dn,5.端需要补充GATC。同时,luciferase阳性oligo仅是将靶点中ACG突变为ATG,其余设计原则同luciferase oligo。具体设计序列如(表2,3)。
1.3构建1.2中的质粒合成sgRNARNA oligo。
1.3.1将oligo用纯水溶解,终浓度为100μM。
1.3.2退火。两条互补oligo各取10μL混合,并放入沸水浴煮5min后自然降温至室温,约2小时。
1.3.3连接。将U6-SpsgRNA-EF1α-GFP(BbsI),U6-SasgRNA-EF1α-GFP(BbsI)用BbsI酶切后的载体与分别与annealed oligo按以下反应体系进行连接反应。
以碧云天的快速DNA连接试剂盒(D7006)为例。
Figure BDA0001513214940000151
Figure BDA0001513214940000161
室温连接60min后,取5μL转化至50μL感受态细菌中,涂卡那霉素抗性板,37℃培养过夜。
1.3.4从过夜培养的培养板中,挑取2个克隆,接种于4-5mL培养液,摇床37℃,220r/min培养过夜。
1.3.5摇菌培养过夜后,提取质粒,并用hU6测序验证,测序正确质粒。
2.U6-sgRNA-BE3与U6-sgRNA-Split BE3,U6-sgRNA-KKH与U6-sgRNA-Split KKH相对C到T突变活性检测
2.1质粒转染
第1天用293T细胞铺种96孔板
(1)消化HEK293T细胞,按照3×104cell/孔接种96孔板。
注:细胞复苏后,一般需传代2次后方可用于转染实验。
第2天转染
(2)观察各孔细胞状态。
注:要求转染前细胞密度应为80%-95%,且状态正常。
(3)为保证数据的准确性和实验的可重复性,用无菌水稀释质粒,将各组质粒浓度稀释至一致,或保证各组之间的质粒样品体积相同。组别设置如下:
Figure BDA0001513214940000162
Figure BDA0001513214940000171
Blank:空白对照,仅包括培养的细胞和培养基;1-5分别代表相对应图8或图9从左至右不同组的处理。
设置n=3孔/组。CMV-T2A-luciferase与CMV-T2A-luciferase(pc)质粒20ng/孔,U6-sgRNA-BE3与U6-sgRNA-KKH质粒180ng/孔,U6-sgRNA-split-BE3-N/C与U6-sgRNA-split-KKH-N/C每端90ng/孔,每个96孔质粒为200ng,不足用无关质粒补齐至200ng。Con组用无关质粒补齐至200ng/孔。
(4)向1.5mL EP管中加入DMEM(无血清,无抗生素)。
(5)将DNA质粒加入到第(4)步的EP管中,混匀。
(6)将PEI加入到上一步的EP管中,混匀,室温静置20分钟。
(7)将转染混合液加到96孔板中。轻轻敲击96孔板以混匀。
(8)37℃,5%CO2,培养24-48h后检测荧光素酶活性。
2.2 Luciferase活性检测
第3天荧光素酶活性检测
(9)配制Luciferase反应液底物,避光保存。
使用Promega公司的双荧光素酶报告系统试剂(E1960),将200μL 50x stop&
Figure BDA0001513214940000174
Substrate加入10ml stop&
Figure BDA0001513214940000175
Buffer中,分装于不透明的棕色的EP管中。
(10)24h后,从转染的96孔板中吸取30μL上清至白色不透明96孔板中。用排枪迅速加入Luciferase反应液底物,每孔25μL。迅速检测luciferase反应值,并记录
注:此步骤可在无菌条件下操作,吸出30μL培养液待检测,再补加30μL培养液至培养板继续培养,可用于检测转染48h后的荧光素酶表达水平。
3.数据分析
用GraphPad Prism 6计算每组的平均值。将CMV-ACG-T2A-luciferase组作为数值1,计算出各组的Relative luciferase activity(图8,图9),结果如表5和表6所示。
表5 EMX1-BE3-sg4 for Split BE3 VS BE3
Figure BDA0001513214940000181
N:U6-sg4-split-BE3-N单转组;C:U6-sg4-split-BE3-C单转组;Luc:CMV-ACG-T2A-luciferase组;N+C+Luc:
U6-sg4-split-BE3-N,U6-sg4-split-BE3-C与CMV-ACG-T2A-luciferase共转组;PC:CMV-ATG-T2A-luciferase组(阳性对照组);FL+Luc:U6-sg4-BE3与CMV-ACG-T2A-luciferase共转组;Blank:阴性对照组;
表5的结果表明,本发明的经拆分的核酸构建物组合(如N+C+Luc)可维持全长(如FL+Luc)相当的外源蛋白(如荧光蛋白)的相对表达水平,即荧光活性,并且本发明的经拆分的核酸构建物组合可包装入AAV进行后期的临床治疗。
表6 EMX1-KKH-sg2 for Split KKH VS KKH
Figure BDA0001513214940000182
N:U6-sg2-split-KKH-N单转组;C:U6-sg2-split-KKH-C单转组;Luc:CMV-ACG-T2A-luciferase组;N+C+Luc:
U6-sg2-split-KKH-N,U6-sg2-split-KKH-C与CMV-ACG-T2A-luciferase共转组;PC:CMV-ATG-T2A-luciferase组(阳性对照组);FL+Luc:U6-sg2-KKH与CMV-ACG-T2A-luciferase共转组;Blank:阴性对照组;
表6的结果表明,本发明的经拆分的核酸构建物组合(如N+C+Luc)可维持全长(如FL+Luc)相当的外源蛋白(如荧光蛋白)的相对表达水平,即荧光活性。并且本发明的经拆分的核酸构建物组合可包装入AAV进行后期的临床治疗。
实施例2 Split-BE3,Split-KKH对内源基因突变效率
1.Split BE3,Split KKH有关质粒设计与构建同实施例1。
1.1.质粒转染
第1天用293T细胞铺种24孔板
1.1.1消化HEK293T细胞,按照2.0×105cell/孔接种24孔板。
注:细胞复苏后,一般需传代2次后方可用于转染实验。
第2天转染
1.1.2观察各孔细胞状态。
注:要求转染前细胞密度应为80%-95%,且状态正常。
1.1.3为保证数据的准确性和实验的可重复性,用无菌水稀释质粒,将各组质
粒浓度稀释至一致,或保证各组之间的质粒样品体积相同。组别设置如下:
Blank:空白对照,仅包括培养的细胞和培养基;
处理组分别为:
BE3:U6-spsgRNA-EF1α-GFP=250ng:250ng,
Split BE3-N:Split BE3-C:U6-spsgRNA-EF1α-GFP=125ng:125ng:250ng
KKH:U6-sasgRNA-EF1α-GFP=250ng:250ng,
Split KKH-N:Split KKH-C:U6-sasgRNA-EF1α-GFP=125ng:125ng:250ng
设置n=3孔/组。
1.1.4向1.5mL EP管中加入DMEM(无血清,无抗生素)。
1.1.5将DNA质粒加入到第(4)步的EP管中,混匀。
1.1.6将PEI加入到上一步的EP管中,混匀,室温静置20分钟。
1.1.7将转染混合液加到24孔板中。轻轻敲击24孔板以混匀。
1.1.8 37℃,5%CO2,培养72h后,通过流式分选GFP阳性细胞。
第5天
1.1.9 72h后,流式分选GFP阳性细胞
1.1.10用天根细胞基因组提取试剂盒(DP304)提取分选的GFP阳性细胞基因组DNA
1.1.11对提取的细胞基因组PCR包括有目的靶点约400bp,PCR产物回收后测序,若存在双峰(图10,图11),连接pEasy-blunt载体,转化,涂板,挑克隆50个,送测序,统计目标区域C突变为T效率(图12,图13)。结果表明,本发明拆分的BE3或KKH的目标区域C突变为T效率分别为44%,56.7%,与未拆分的BE或KKH的目标区域C突变为T效率(分别为46.3%,63.6%)相当。
对比例1
采用实施例1的方法,不同在于,split BE3-N端或C端与表达sgRNA的质粒共转,以及split KKH-N端或C端与表达sgRNA的质粒共转。
结果表明,均未检测到任何内源性基因的突变。
对比例2
采用实施例1的方法,不同在于,split BE3-N及split KKH-N均无胞嘧啶脱氨酶APOBEC1时与相相应的C端,sgRNA质粒共转。
结果表明,均未检测到任何内源性基因的突变。
对比例3
采用实施例1的方法,不同在于,split BE3-N,C端无相应的内含肽(intein),以及split KKH-N,C端无相应的内含肽(intein),与sgRNA质粒共转。
结果表明,均未检测到任何内源性基因的突变。
对比例4
采用实施例1的方法,不同在于,split BE3-C及split KKH-C不融合糖苷酶抑制剂,与sgRNA质粒共转。
结果表明,内源性基因突变效率较低约10%,同时还存在较低的非预期突变,即胞嘧啶到腺嘌呤,鸟嘌呤的突变。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 华东师范大学
上海邦耀生物科技有限公司
<120> 拆分型单碱基基因编辑系统及其应用
<130> P2017-1922
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 958
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 1
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Ser Ser Glu Thr Gly Pro Val Ala
35 40 45
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
50 55 60
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
65 70 75 80
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
85 90 95
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
100 105 110
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
115 120 125
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
130 135 140
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
145 150 155 160
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
165 170 175
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
180 185 190
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
195 200 205
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
210 215 220
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
225 230 235 240
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
245 250 255
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu
260 265 270
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr
275 280 285
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
290 295 300
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
305 310 315 320
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
325 330 335
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
340 345 350
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
355 360 365
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
370 375 380
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
385 390 395 400
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
405 410 415
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
420 425 430
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
435 440 445
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
450 455 460
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
465 470 475 480
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
485 490 495
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
500 505 510
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser
515 520 525
Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp
530 535 540
Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn
545 550 555 560
Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala
565 570 575
Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn
580 585 590
Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr
595 600 605
Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln
610 615 620
Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn
625 630 635 640
Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr
645 650 655
Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu
660 665 670
Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe
675 680 685
Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala
690 695 700
Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg
705 710 715 720
Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly
725 730 735
Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
740 745 750
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly
755 760 765
Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn
770 775 780
Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr
785 790 795 800
Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly
805 810 815
Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val
820 825 830
Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
835 840 845
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Leu Ser Tyr Glu Thr Glu Ile
850 855 860
Leu Thr Val Glu Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys
865 870 875 880
Arg Ile Glu Cys Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr
885 890 895
Thr Gln Pro Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe
900 905 910
Glu Tyr Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His
915 920 925
Lys Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe
930 935 940
Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn
945 950 955
<210> 2
<211> 1125
<212> PRT
<213> 葡萄球菌(Staphylococcus aureus)
<400> 2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Ser Ser Glu Thr Gly Pro Val Ala
35 40 45
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
50 55 60
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
65 70 75 80
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
85 90 95
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
100 105 110
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
115 120 125
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
130 135 140
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
145 150 155 160
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
165 170 175
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
180 185 190
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
195 200 205
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
210 215 220
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
225 230 235 240
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
245 250 255
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu
260 265 270
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Lys Arg Asn
275 280 285
Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly Tyr Gly Ile
290 295 300
Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val Arg Leu Phe
305 310 315 320
Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser Lys Arg Gly
325 330 335
Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln Arg Val Lys
340 345 350
Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser Glu Leu Ser
355 360 365
Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser Gln Lys Leu
370 375 380
Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala Lys Arg Arg
385 390 395 400
Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly Asn Glu Leu
405 410 415
Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys
420 425 430
Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp Gly Glu Val
435 440 445
Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala
450 455 460
Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu Asp Gln Ser
465 470 475 480
Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr
485 490 495
Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu
500 505 510
Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro Glu Glu Leu
515 520 525
Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn
530 535 540
Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu
545 550 555 560
Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys Gln Lys Lys
565 570 575
Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val Asn Glu Glu
580 585 590
Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro Glu Phe Thr
595 600 605
Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu
610 615 620
Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr
625 630 635 640
Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn
645 650 655
Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly
660 665 670
Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu
675 680 685
Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg
690 695 700
Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln Lys Glu Ile
705 710 715 720
Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val Val Lys Arg
725 730 735
Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr
740 745 750
Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser
755 760 765
Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg Asn Arg Gln
770 775 780
Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn
785 790 795 800
Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met Gln Glu Gly
805 810 815
Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn
820 825 830
Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg Ser Val Ser
835 840 845
Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln Glu Glu Asn
850 855 860
Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp
865 870 875 880
Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu Asn Leu Ala
885 890 895
Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu
900 905 910
Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe Ile Asn Arg
915 920 925
Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu
930 935 940
Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile
945 950 955 960
Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys
965 970 975
Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile
980 985 990
Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala
995 1000 1005
Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu
1010 1015 1020
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu
1025 1030 1035
Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val
1040 1045 1050
Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala
1055 1060 1065
Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu
1070 1075 1080
Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met
1085 1090 1095
Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg
1100 1105 1110
Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn
1115 1120 1125
<210> 3
<211> 480
<212> PRT
<213> 葡萄球菌(Staphylococcus aureus)
<400> 3
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
35 40 45
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
50 55 60
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile
65 70 75 80
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
85 90 95
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
100 105 110
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
115 120 125
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
130 135 140
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
145 150 155 160
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
165 170 175
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
180 185 190
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
195 200 205
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
210 215 220
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
225 230 235 240
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
245 250 255
Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly
260 265 270
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
275 280 285
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
290 295 300
Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr
305 310 315 320
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu
325 330 335
Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly Gly Ser Pro
340 345 350
Lys Lys Lys Arg Lys Val Ser Ser Asp Tyr Lys Asp His Asp Gly Asp
355 360 365
Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Ser Gly
370 375 380
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
385 390 395 400
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
405 410 415
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
420 425 430
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
435 440 445
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
450 455 460
Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
465 470 475 480
<210> 4
<211> 939
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 4
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
35 40 45
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
50 55 60
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
65 70 75 80
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
85 90 95
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
100 105 110
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
115 120 125
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
130 135 140
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
145 150 155 160
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
165 170 175
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
180 185 190
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
195 200 205
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
210 215 220
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
225 230 235 240
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
245 250 255
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
260 265 270
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
275 280 285
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
290 295 300
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
305 310 315 320
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
325 330 335
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
340 345 350
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
355 360 365
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
370 375 380
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
385 390 395 400
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
405 410 415
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
420 425 430
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
435 440 445
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
450 455 460
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
465 470 475 480
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
485 490 495
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
500 505 510
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
515 520 525
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
530 535 540
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
545 550 555 560
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
565 570 575
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
580 585 590
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
595 600 605
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
610 615 620
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
625 630 635 640
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
645 650 655
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
660 665 670
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
675 680 685
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
690 695 700
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
705 710 715 720
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
725 730 735
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
740 745 750
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
755 760 765
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
770 775 780
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
785 790 795 800
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
805 810 815
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
820 825 830
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
835 840 845
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
850 855 860
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
865 870 875 880
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
885 890 895
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
900 905 910
Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
915 920 925
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
930 935
<210> 5
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
actacgtggt gggcgccgag cgg 23
<210> 6
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
cggatgcacg gtcagcgcgg ggtggt 26
<210> 7
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
ccgagacgca ggtaatcacc cccggt 26
<210> 8
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
caccgactac gtggtgggcg ccgag 25
<210> 9
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
aaacctcggc gcccaccacg tagtc 25
<210> 10
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
ctagactacg tggtgggcgc cgagcggaa 29
<210> 11
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
gatcttccgc tcggcgccca ccacgtagt 29
<210> 12
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
ctagactatg tggtgggcgc cgagcggaa 29
<210> 13
<211> 29
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
gatcttccgc tcggcgccca ccacatagt 29
<210> 14
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
caccggccga gacgcaggta atcacc 26
<210> 15
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
aaacggtgat tacctgcgtc tcggcc 26
<210> 16
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
ctagccgaga cgcaggtaat cacccccggt c 31
<210> 17
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
gatcgaccgg gggtgattac ctgcgtctcg g 31
<210> 18
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
ctagccgaga tgcaggtaat cacccccggt c 31
<210> 19
<211> 31
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
gatcgaccgg gggtgattac ctgcatctcg g 31
<210> 20
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
caccgggatg cacggtcagc gcgg 24
<210> 21
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
aaacccgcgc tgaccgtgca tccc 24

Claims (16)

1.一种核酸构建物组合,其特征在于,包括第一核酸构建物和第二核酸构建物,其中,所述第一核酸构建物具有从5’-3’的式I结构:
P1-X1-X2-X3-Z-X4 (I);
其中,P1为第一启动子序列;
X1为胞嘧啶脱氨酶Apobec1的编码序列;
X2为任选的连接序列;
X3为Cas9核酸酶的N端片段的编码序列或KKH核酸酶的N端片段的编码序列;
Z为第一融合肽N端片段的编码序列;
X4为polyA序列;
所述第二核酸构建物具有从5’-3’的式II结构:
P2-Z-Y1-Y2-Y3 (II);
其中,P2为第二启动子序列;
Z为第一融合肽C端片段的编码序列;
Y1为Cas9核酸酶的C端片段的编码序列或KKH核酸酶的C端片段的编码序列;
Y2为尿嘧啶糖苷酶抑制剂UGI的编码序列;
Y3为polyA序列;
并且,各“-”独立地为键或核苷酸连接序列;
所述的第一启动子和第二启动子各自独立地选自下组:CAG启动子、CMV启动子、或其组合;
所述连接序列选自下组:XTEN、GGS、(GGS)3、(GGS)7、或其组合;
所述Cas9核酸酶的N端片段为登录号为2828055的Cas9n核酸酶的2-573位氨基酸;
所述Cas9核酸酶的C端片段为登录号为2828055Cas9n核酸酶的574-1368位氨基酸;
所述KKH的N端片段为登录号为2828033的KKH核酸酶的2-739位氨基酸;
所述KKH的C端片段为登录号为2828033的KKH核酸酶的740-1053位氨基酸;
所述的第一融合肽为内含肽Intein;并且所述第一融合肽N端片段为内含肽Intein的2-103位氨基酸;所述第一融合肽C端片段为内含肽Intein的104-137位氨基酸;
所述polyA序列各自独立地选自下组:BGH的polyA、SV40的polyA、或其组合;
并且当所述第一核酸构建物中的X3为Cas9核酸酶的N端片段的编码序列时,则所述第二核酸构建物中的Y1为Cas9核酸酶的C端片段的编码序列;当所述第一核酸构建物中的X3为KKH核酸酶的N端片段的编码序列时,则所述第二核酸构建物中的Y1为KKH核酸酶的C端片段的编码序列。
2.如权利要求1所述的核酸构建物组合,其特征在于,所述的第一启动子和第二启动子各自独立地为CAG启动子。
3.如权利要求1所述的核酸构建物组合,其特征在于,所述连接序列为XTEN。
4.如权利要求1所述的核酸构建物组合,其特征的在于,所述X3元件的来源选自下组:酿脓链球菌(Streptococcus pyogenes)、葡萄球菌(Staphylococcus aureus)、或其组合。
5.如权利要求1所述的核酸构建物组合,其特征在于,所述第一核酸构建物的长度≤4.7kb。
6.如权利要求5所述的核酸构建物组合,其特征在于,所述第一核酸构建物的长度≤4.5kb。
7.如权利要求6所述的核酸构建物组合,其特征在于,所述第一核酸构建物的长度为3.0-4.5kb。
8.如权利要求1所述的核酸构建物组合,其特征在于,所述第二核酸构建物的长度≤4.7kb。
9.如权利要求8所述的核酸构建物的组合,其特征在于,所述第二核酸构建物的长度≤4.5kb。
10.如权利要求9所述的核酸构建物的组合,其特征在于,所述第二核酸构建物的长度为3.0-4.5kb。
11.如权利要求1所述的核酸构建物组合,其特征在于,所述核酸构建物组合含有第三核酸构建物,所述第三核酸构建物具有式III所示的结构:
M1-L1-M2-M3 (III);
其中,M1为第三启动子序列;
L1:位于M1与M2之间的间隔序列;
M2为ACG三碱基序列;或 ATG(N)3mTAC序列,其中m为0-20的正整数;
M3为具有式IV所示结构的核苷酸序列:N0-N1-N2-L2-N3-N4 (IV);其中,N0为含有基因编码位点的靶序列,N1为PAM序列,N2为自剪切蛋白的编码序列;L2为无或位于M1与M2之间的间隔肽编码序列;N3为外源蛋白的编码序列,所述编码序列不含起始密码子ATG且含有终止密码子;N4为任选的PolyA序列;
附加条件:
ACG情况下,L1、N0和N1均不含ATG和终止密码子;
并且,各“-”独立地为键或核苷酸连接序列。
12.一种基因工程细胞,其特征在于,所述细胞被权利要求1所述的构建物所转化。
13.一种在细胞内进行基因编辑的方法,其特征在于,包括步骤:
(i) 提供一细胞以及第一载体和第二载体,其中所述第一载体含有第一核酸构建物,所述第二载体含有所述第二核酸构建物,所述的第一核酸构建物和第二核酸构建物如权利要求1中所定义,并且所述的第一载体和第二载体均为病毒载体;
(ii) 用所述的病毒载体感染所述的细胞,从而在所述细胞内进行基因编辑。
14.如权利要求13所述的方法,其特征在于,在步骤(ii)中,还包括用编码gRNA的第三载体同时感染所述细胞。
15.一种试剂盒,其特征在于,所述试剂盒包括:
(a1) 第一容器,以及位于所述第一容器中的第一载体;和
(b1) 第二容器,以及位于所述第二容器中的第二载体;
所述第一载体含有第一核酸构建物,所述第二载体含有所述第二核酸构建物,所述的第一核酸构建物和第二核酸构建物如权利要求1中所定义。
16.如权利要求15所述的试剂盒,其特征在于,所述试剂盒还含有(c1)第三容器,以及含有编码gRNA的第三载体的第三容器。
CN201711368309.6A 2017-12-18 2017-12-18 拆分型单碱基基因编辑系统及其应用 Active CN109929839B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201711368309.6A CN109929839B (zh) 2017-12-18 2017-12-18 拆分型单碱基基因编辑系统及其应用
US16/955,453 US20200347407A1 (en) 2017-12-18 2018-12-18 Split single-base gene editing systems and application thereof
EP18892746.1A EP3730616A4 (en) 2017-12-18 2018-12-18 DIVIDED SINGLE BASE EDITING SYSTEMS AND THEIR APPLICATION
PCT/CN2018/121779 WO2019120193A1 (zh) 2017-12-18 2018-12-18 拆分型单碱基基因编辑系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711368309.6A CN109929839B (zh) 2017-12-18 2017-12-18 拆分型单碱基基因编辑系统及其应用

Publications (2)

Publication Number Publication Date
CN109929839A CN109929839A (zh) 2019-06-25
CN109929839B true CN109929839B (zh) 2021-02-12

Family

ID=66982970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711368309.6A Active CN109929839B (zh) 2017-12-18 2017-12-18 拆分型单碱基基因编辑系统及其应用

Country Status (4)

Country Link
US (1) US20200347407A1 (zh)
EP (1) EP3730616A4 (zh)
CN (1) CN109929839B (zh)
WO (1) WO2019120193A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321584B (zh) * 2017-12-27 2021-07-16 华东师范大学 一种简单定性/定量检测单碱基基因编辑技术工作效率的报告系统
CN111117985B (zh) * 2020-01-23 2022-07-26 中山大学 一种拆分Cas9的方法及其应用
CN112553246A (zh) * 2020-12-08 2021-03-26 安徽省农业科学院水稻研究所 一种基于CRISPR-SaCas9系统的高效基因组编辑载体及其应用
CN112708605A (zh) * 2021-01-14 2021-04-27 中山大学 一个Cas9蛋白拆分得到的蛋白组及其应用
KR20230158476A (ko) * 2021-02-19 2023-11-20 빔 테라퓨틱스, 인크. 유전자 요법을 위한 재조합 광견병 바이러스
CN114395585B (zh) * 2022-01-12 2024-03-08 中国科学院天津工业生物技术研究所 用于碱基编辑的组合物

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106011104A (zh) * 2015-05-21 2016-10-12 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
WO2017180694A1 (en) * 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2717175T3 (es) * 2013-02-01 2019-06-19 Selexis Sa Expresión mejorada de transgenes y procesamiento
US20190345483A1 (en) * 2016-05-12 2019-11-14 President And Fellows Of Harvard College AAV Split Cas9 Genome Editing and Transcriptional Regulation
JP2019524162A (ja) * 2016-08-18 2019-09-05 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア モジュラーAAV送達システムによるCRISPR−Casゲノム編集
WO2018071868A1 (en) * 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106011104A (zh) * 2015-05-21 2016-10-12 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
WO2017180694A1 (en) * 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Multifunctional AAV-CRISPR-Cas9 and Its Host Response;Wei Leong Chew等;《Nat Methods》;20160905;第13卷(第10期);全文 *
CRISPR/Cas9 System: A Powerful Technology for in Vivo and Ex Vivo Gene Therapy;Xiaohui Zhang等;《Science China.Life sciences》;20170420;第60卷(第5期);全文 *
CRISPR/Cas9系统: 一种强大的在体基因治疗工具;张晓辉等;《中国科学:生命科学》;20171116;第47卷(第11期);全文 *
EB1 and EB3 Regulate Microtubule Minus End Organization and Golgi Morphology;Chao Yang等;《The Journal of cell biology》;20170816;第216卷(第10期);全文 *
基因编辑之"新宠"—单碱基基因组编辑系统;魏瑜等;《遗传》;20171211;第39卷(第12期);全文 *

Also Published As

Publication number Publication date
US20200347407A1 (en) 2020-11-05
CN109929839A (zh) 2019-06-25
EP3730616A1 (en) 2020-10-28
EP3730616A4 (en) 2021-09-08
WO2019120193A1 (zh) 2019-06-27

Similar Documents

Publication Publication Date Title
CN109929839B (zh) 拆分型单碱基基因编辑系统及其应用
US10597648B2 (en) Engineered cascade components and cascade complexes
CN109306361B (zh) 一种新的a/t到g/c碱基定点转换的基因编辑系统
CN107109422B (zh) 使用由两个载体表达的拆分的Cas9的基因组编辑
US8501454B2 (en) Homologous recombination-based DNA cloning compositions
WO2017215619A1 (zh) 在细胞内产生点突变的融合蛋白、其制备及用途
CN109321584B (zh) 一种简单定性/定量检测单碱基基因编辑技术工作效率的报告系统
US20030027289A1 (en) Recombinase-based methods for producing expression vectors and compositions for use in practicing the same
CN113373130A (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
US10253321B2 (en) Methods, compositions and kits for a one-step DNA cloning system
CN114438055B (zh) 新型的crispr酶和系统以及应用
CN114672473A (zh) 一种优化的Cas蛋白及其应用
US20210363206A1 (en) Proteins that inhibit cas12a (cpf1), a cripr-cas nuclease
CN110408636B (zh) 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用
JP6871544B2 (ja) 興味対象の配列を含む分子構成要素からdnaベクターを生産する方法
WO2019173248A1 (en) Engineered nucleic acid-targeting nucleic acids
JP2022512868A (ja) C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法
US20130203116A1 (en) Expression and purification of fusion protein with multiple mbp tags
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
Liu et al. Electroporation of SUMO-His-Cre protein triggers a specific recombinase-mediated cassette exchange in HEK 293T cells
US20230193322A1 (en) CAS9 Fusion Proteins and Related Methods
CN112708605A (zh) 一个Cas9蛋白拆分得到的蛋白组及其应用
US20230242922A1 (en) Gene editing tools
CN116769754A (zh) 融合蛋白及其在基因编辑中的应用
CN117979987A (zh) 基因编辑工具

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant