CN109517841B - 一种用于核苷酸序列修饰的组合物、方法与应用 - Google Patents

一种用于核苷酸序列修饰的组合物、方法与应用 Download PDF

Info

Publication number
CN109517841B
CN109517841B CN201811478185.1A CN201811478185A CN109517841B CN 109517841 B CN109517841 B CN 109517841B CN 201811478185 A CN201811478185 A CN 201811478185A CN 109517841 B CN109517841 B CN 109517841B
Authority
CN
China
Prior art keywords
leu
lys
glu
arg
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811478185.1A
Other languages
English (en)
Other versions
CN109517841A (zh
Inventor
李大力
张晓辉
陈亮
刘明耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bangyao Biological Technology Co ltd
East China Normal University
Original Assignee
Shanghai Bangyao Biological Technology Co ltd
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bangyao Biological Technology Co ltd, East China Normal University filed Critical Shanghai Bangyao Biological Technology Co ltd
Priority to CN201811478185.1A priority Critical patent/CN109517841B/zh
Publication of CN109517841A publication Critical patent/CN109517841A/zh
Application granted granted Critical
Publication of CN109517841B publication Critical patent/CN109517841B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids

Abstract

本发明公开了一种用于核苷酸序列修饰的组合物、方法与应用,涉及基因编辑技术领域。该组合物包括第一载体和第二载体;其中,第一载体上具有如下表达元件:胞嘧啶脱氨酶表达元件、腺嘌呤脱氨酶表达元件以及突变型Cas酶表达元件;第二载体上具有如下表达元件:gRNA表达元件和尿嘧啶糖苷酶抑制剂表达元件。采用该组合物,可以对目标核苷酸序列上的位于PAM上游的第1‑16位的C碱基进行修饰,使其发生C/G到T/A的转变。相较于现有的基因编辑技术,该组合物和方法具有更宽广的工作窗口,同时具备不引入DSB、indels及脱靶效应极低、更加安全等优点。

Description

一种用于核苷酸序列修饰的组合物、方法与应用
技术领域
本发明涉及基因编辑技术领域,具体而言,涉及一种用于核苷酸序列修饰的组合物、方法与应用。
背景技术
自2013年以来,以CRISPR/Cas9为代表的新一代基因编辑技术进入生物学领域的各个实验,正改变着传统的基因操作手段。
2016年4月,David R Liu实验室首次报道了基于大鼠胞嘧啶脱氨酶(Apobec1)CRISPR/Cas9融合而成的单碱基基因编辑技术(cytosine base editor,CBE)(包括BE1,BE2,BE3)在基因组上实现单个碱基C/G到T/A转变的基因组定点编辑。其中,BE3因其高效性而被广泛用于基因组的基因突变或修复,疾病动物模型制作,基因治疗,基因功能筛选等。经典的CBE系统(指BE3)是基于spCas9改造而来,除了识别PAM(例如NGG)外,还存在一个“工作窗口”,即它距离PAM远端数起4-7位,且在5-7位比较高效。
已报道的文献,表明它的工作窗口受胞嘧啶脱氨酶的影响,他们也通过胞嘧啶脱氨酶功能域进行氨基酸突变进而筛选到编辑窗口能精确到1-2碱基的单碱基工具,其中以YE1(W90Y+R126E)为最优,保持与BE3相似编辑活性的同时,将编辑窗口精确到1-2个碱基,即可以靶向5-6位的胞嘧啶。后来,David R Liu也通过改变胞嘧啶氨酶与Cas9n(D10A)之间的不同的linker—GGS,(GGS)3,XTEN,(GGS)7,实验发现通过改变linker长度并未改变其工作窗口。其后David R Liu通过优化胞嘧啶脱氨酶与Cas9n(D10A)之间的linker长度为32AA,同时额外融合2个尿嘧啶糖苷酶抑制剂,提高了平均约1.5倍的C/G到T/A的编辑效率,同时提高了平均约2.3倍的产物纯度(降低非C到T的突变的效率),然而,其工作窗口依然为3-8,并未发生改变。其后,再无试图通过胞嘧啶脱氨酶与Cas9n(D10A)之间的linker改变其窗口的报道。而后改造的AID-BE3(见图1),即利用人源的胞嘧啶脱氨酶也同样可以实现3-8位C/G到T/A的突变,且5-7位效率最高,略高于BE3。因此,AID介导的Base edior要比Apobec1介导的Base edior具有相对较广且高效的工作窗口。然而,对于靶点20bp范围内,3-8以外的碱基,还不能通过spCas9介导的CBE靶向。而近期报道的BE-Plus是通过10×GCN4募集多个与Scfv融合表达的胞嘧啶脱氨酶,也能靶向4-16位的胞嘧啶,其高效工作窗口为7-13位C,实现了其高效工作窗口的平移,但其方法较为繁琐。这极大地限制了单碱基基因编辑系统的应用范围。
鉴于此,特提出本发明。
发明内容
本发明的目的在于提供一种用于核苷酸序列修饰的组合物,采用该组合物,可以对目标核苷酸序列上的位于PAM上游的第1-16位的C碱基进行修饰,使其发生C/G到T/A的转变。
本发明的另一目的在于提供一种修饰核苷酸序列的方法,采用该方法,可以对目标核苷酸序列上的位于PAM上游的第1-16位的C碱基进行修饰,使其发生C/G到T/A的转变,相较于现有的基因编辑技术,该方法具有更宽广的工作窗口。
本发明的另一目在于提供上述的组合物在基因修饰中的应用。
本发明是这样实现的:
一方面,本发明提供了一种用于核苷酸序列修饰的组合物,其包括:第一载体和第二载体;
其中,所述第一载体上具有如下表达元件:
胞嘧啶脱氨酶表达元件、腺嘌呤脱氨酶表达元件以及突变型Cas酶表达元件;
所述第二载体上具有如下表达元件:
gRNA表达元件和尿嘧啶糖苷酶抑制剂表达元件。
本发明通过在胞嘧啶脱氨酶和突变型Cas酶之间插入腺嘌呤脱氨酶,使得在组合物可以对对目标核苷酸序列上的位于PAM上游的第1-16位的C碱基进行修饰,使其发生C/G到T/A的转变。相较于现有的基因编辑系统,本发明提供的组合物具有更加宽广的工作窗口。可以对PAM上游的更大范围内的C碱基进行修饰,使其发生C/G到T/A的转变。同时具备不引入DSB、插入、缺失及脱靶效应极低、更加安全的优点。该组合物可以用于基因突变、基因修复、构建有基因突变导致的疾病动物模型、基因治疗、基因功能筛选、药物筛选和疾病诊断等需要进行C/G到T/A的转变的核苷酸修饰的领域。
胞嘧啶脱氨酶可以对目标核苷酸序列上位于PAM上游的胞嘧啶(C)脱氨,形成尿嘧啶(U),在尿嘧啶糖苷酶抑制剂存在的条件下,随着基因组的复制,原位于目标核苷酸序列上的胞嘧啶(C)的位点突变为胸腺嘧啶(T),进而实现在该位点的C/G到T/A的突变修饰,实现基因编辑的效果。
进一步地,在本发明的一些实施方案中,腺嘌呤脱氨酶为野生腺嘌呤脱氨酶、突变型腺嘌呤脱氨酶或其二者的组合。
腺嘌呤脱氨酶表达元件可以是仅表达野生腺嘌呤脱氨酶的编码序列或者是仅表达突变型腺嘌呤脱氨酶的编码序列,可以是同时表达野生腺嘌呤脱氨酶和突变型腺嘌呤脱氨酶的二聚体编码序列。
当然,无论是何种类型的腺嘌呤脱氨酶表达元件,其数量可以是一个或者是多个。
当然,腺嘌呤脱氨酶可以是人源的,或者是其他非人的动物例如小鼠、大鼠、马、兔、猴、猿等来源的。
进一步地,在本发明的一些实施方案中,突变型Cas酶为SpCas9n、VQR-Cas9n、SaCas9或其突变体。
突变型Cas酶的作用在于对双链核苷酸中的一条单链形成切口,不具有对双链切割形成DSB的活性,利用其形成单链切口的特性,可以使得胞嘧啶脱氨酶发挥碱基修饰作用。
突变型Cas酶的来源可以是来自酿酒酵母的SpCas9n,或者是识别PAM为NGAN的VQR-Cas9n,也可以是金黄色葡萄球菌的中saCas9或其突变体,其识别PAM为NNGRRT或NNNRRT,也可以是Cpf1或其它类型的突变体。只要其具有单链切口形成的活性不具有对双链切割形成DSB的活性即可。
进一步地,在本发明的一些实施方案中,所述gRNA的靶序列选自SEQ ID NO.1-5。
SEQ ID NO.1-4所示的靶序列人的内源基因PD-1的4个靶序列。SEQ ID NO.5所示的靶序列人的内源基因KCNS1的靶序列。采用该组合物,可以对PD-1基因上SEQ ID NO.1-4所示的靶序列和SEQ ID NO.5所示的靶序列位于PAM上游的第1-16位范围内的C碱基进行修饰。
应当理解到,除了上述的SEQ ID NO.1-5所示的靶序列外,本来领域技术人员可以采用本发明的组合物,通过设计不同的gRNA针对任何感兴趣的靶序列进行修饰,均属于本发明的保护范围。
进一步地,在本发明的一些实施方案中,野生型腺嘌呤脱氨酶的氨基酸序列如SEQID NO.6的第199-364位所示。
进一步地,在本发明的一些实施方案中,突变型腺嘌呤脱氨酶的氨基酸序列如SEQID NO.6的第397-562位所示。
进一步地,在本发明的一些实施方案中,胞嘧啶脱氨酶的氨基酸序列如SEQ IDNO.6的第1-182位所示。
进一步地,在本发明的一些实施方案中,所述突变型Cas酶为SpCas9n,其氨基酸序列如SEQ ID NO.6的第595-1961位所示。
另一方面,本发明提供了一种修饰核苷酸序列的方法,其包括:
给予对象施加上述的组合物。
另一方面,本发明提供了上述用于核苷酸序列修饰的组合物在基因突变、基因修复、构建有基因突变导致的疾病动物模型、基因治疗、基因功能筛选、药物筛选或疾病诊断中应用。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为实施例1中的第一载体的部分表达元件的结构示意图。
图2为实施例1中的第二载体的部分表达元件的结构示意图。
图3为实施例2中的针对PD-1-sg6靶点的PCR产物测序峰图。
图4为实施例2中的针对PD-1-sg7靶点的PCR产物测序峰图。
图5为实施例2中的针对PD-1-sg8靶点的PCR产物测序峰图。
图6为实施例2中的针对PD-1-sg10靶点的PCR产物测序峰图。
图7为实施例2中的针对KCNS1-sg1靶点的PCR产物测序峰图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
载体构建
(1)第一载体的构建
第一载体上的第一表达元件组如图1所示(图1中PW-CBE-AID),其包括有:胞嘧啶脱氨酶(AID)表达元件、野生型腺嘌呤脱氨酶(TadA)表达元件、突变型腺嘌呤脱氨酶(TadAE59A,其相较于TadA,其第59位的氨基酸残基由E突变为A)表达元件以及突变型Cas酶(SpCas9n)表达元件;各表达元件通过Linker连接。
其中,AID的氨基酸序列如SEQ ID NO.6的第1-182位所示,Linker1的氨基酸序列如SEQ ID NO.6的第183-198位所示,TadA的氨基酸序列如SEQ ID NO.6的第199-364位所示,Linker2的氨基酸序列如SEQ ID NO.6的第365-396位所示,TadAE59A的氨基酸序列如SEQ ID NO.6的第397-562位所示,Linker3的氨基酸序列如SEQ ID NO.6的第563-594位所示,SpCas9n的氨基酸序列如SEQ ID NO.6的第595-1961位所示,NLS的氨基酸序列如SEQ IDNO.6的第1966-1972位所示。
第一表达元件组的核酸序列如SEQ ID NO.7。
(2)第二载体的构建
第二载体上的第二表达元件组的结构参考图2,其包括有:gRNA表达元件、尿嘧啶糖苷酶抑制剂(UGI)表达元件以及通过2A即自剪接多肽连接的GFP荧光蛋白编码序列。其中,gRNA表达元件由U6启动子驱动。
第二表达元件组的核酸序列如SEQ ID NO.8所示。其中,第1-241位为U6启动子,第268-第343位为SgRNA scaffold序列(用于稳定sgRNA结构),第344-350位为U6终止子,第385-892位为CMV启动子序列,第930-950位为Sv40NLS序列,第1035-1268位为UGI序列,第1317-1370为T2A序列。该载体用BbsI酶切完后以后就可以将对应靶点的sgRNA序列连入。
在其他的实施例中,gRNA的表达序列可以根据不同的靶序列进行设计。设计出的具有不同gRNA表达元件的第二载体分别与第一载体组合,即可形成用于对目标核苷酸序列修饰的组合物。
上述第一表达元件组和第二表达元件组可以基因合成方法合成,并分别克隆至骨架载体Pcmv-BE3(购自addgene,#73021)和pCDNA3.1(购自addgene,#52535),或骨架载体上改造使其具有上述的表达元件组,以被驱动表达,进而对靶序列进行碱基修饰。
实施例2
验证实施例1的组合物的基因修饰的工作窗口
(1)从NCBI下载人的基因PD-1,KCNS1,其中PD-1设计了4个靶点,KCNS1设计了1个靶点(如表-1,表中下划线为PAM),类似于CRISPR/Cas9靶点oligo设计策略,sgRNA以U6为启动子,需要G作为转录起始位点,在针对各靶点的正向oligo的5`端添加CACC,反向oligo是靶点的互补链,在5`端添加AAAC(见表2)。
表1人的基因PD-1上的靶核苷酸序列
Figure BDA0001892818670000071
Figure BDA0001892818670000081
表2不同靶点的正向和反向oligo的序列
靶点名称 序列(5`-3`)
PD-1-sg6-up CACCGTCCAGGCATGCAGATCCCAC
PD-1-sg6-dn AAACGTGGGATCTGCATGCCTGGAC
PD-1-sg7-up CACCGTGCAGATCCCACAGGCGCCC
PD-1-sg7-dn AAACGGGCGCCTGTGGGATCTGCAC
PD-1-sg8-up CACCGACGACTGGCCAGGGCGCCTG
PD-1-sg8-dn AAACCAGGCGCCCTGGCCAGTCGTC
PD-1-sg10-up CACCGGGCGGTGCTACAACTGGGC
PD-1-sg10-dn AAACGCCCAGTTGTAGCACCGCCC
KCNS1-sg1-up CACCGCACTGTGCCCCACCACCAGC
KCNS1-sg1-dn AAACGCTGGTGGTGGGGCACAGTGC
表3靶点的PCR鉴定引物
Figure BDA0001892818670000082
(2)将表2中的各靶点的正向和反向oligo退化后分别连接经BbsI酶切后实施例1中的第二载体上。
(3)将步骤(2)中得到的带有gRNA表达序列的第二载体分别与第一载体按250ng:500ng比例行混合,形成用于修饰基因组载体系统,命名为:PW-CBE-AID,共转293T细胞,其中以已经报道的基因编辑系统AID-BE3作为对照组,120h后,分选收集GFP细胞,提细胞基因组DNA,PCR(引物见表-3)扩增出含靶点约200bp,测序,若存在套峰(图3-图7),再按照HiTOM试剂盒的要求准备样品送深度测序,分析其突变效率。
由图3可以看出,PW-CBE-AID可以使靶点PD-1-sg6上位于PAM上游的第2到第11位的C发生C到T的突变,且从峰图上看第7到11位C突变效率较高。相对于AID-BE3也可以实现第-1到第11位发生C到T的突变,且从峰图上看第2到7位C突变效率较高。
由图4可以看出,PW-CBE-AID可以使靶点PD-1-sg7上位于PAM上游的第3到第12位的C发生C到T的突变,且从峰图上看第8到12位C突变效率较高。相对于AID-BE3也可以实现第3到第9位发生C到T的突变,且从峰图上看第3到9位C突变效率较高。
由图5可以看出,PW-CBE-AID可以使靶点PD-1-sg8上位于PAM上游的第2到第10位的C发生C到T的突变,且从峰图上看第5到10位C突变效率较高。相对于AID-BE3也可以实现第2到第9位发生C到T的突变,且从峰图上看第2到5位C突变效率较高。
由图6可以看出,PW-CBE-AID可以使靶点PD-1-sg10上位于PAM上游的第4到第12位的C发生C到T的突变,且从峰图上看第9到12位C突变效率较高。相对于AID-BE3也可以实现第4到第12位发生C到T的突变,且从峰图上看第4位C突变效率较高。
由图7可以看出,PW-CBE-AID可以使靶点KCNS1-sg1上位于PAM上游的第3到第14位的C发生C到T的突变,且从峰图上看第8到14位C突变效率较高。相对于AID-BE3也可以实现第3到第8位发生C到T的突变,且从峰图上看第3位到第8位C突变效率较高。
因此,综上PW-AID-BE3的工作窗口为PAM上游的第1-14位中的C可随机产生突变,且9,10位效率最高,同时也保持着3-8位C可编辑到。相对于,AID-BE3的工作窗口为3-8位,且高效工作窗口为5-7,PW-AID-BE3的工作窗口更加宽广,同时其高活性工作窗口向靠近PAM处平移了4位。这样,PW-AID-BE3则极大可能编辑原来BE3或AID-BE3无法编辑到的位点。例如产生更多的终止密码子实现基因敲除或实现错义突变。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 华东师范大学、上海邦耀生物科技有限公司
<120> 一种用于核苷酸序列修饰的组合物、方法与应用
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<400> 1
tccaggcatg cagatcccac agg 23
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<400> 2
tgcagatccc acaggcgccc tgg 23
<210> 3
<211> 23
<212> DNA
<213> 人工序列
<400> 3
acgactggcc agggcgcctg tgg 23
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<400> 4
gggcggtgct acaactgggc tgg 23
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<400> 5
cactgtgccc caccaccagc agg 23
<210> 6
<211> 1972
<212> PRT
<213> 人工序列
<400> 6
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys
180 185 190
Val Gly Ser Ser Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp
195 200 205
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu
210 215 220
Val Pro Val Gly Ala Val Leu Val His Asn Asn Arg Val Ile Gly Glu
225 230 235 240
Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro Thr Ala His Ala Glu
245 250 255
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu
260 265 270
Ile Asp Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala
275 280 285
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg
290 295 300
Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His His
305 310 315 320
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
325 330 335
Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu
340 345 350
Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser
355 360 365
Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
370 375 380
Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu
385 390 395 400
Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg
405 410 415
Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val Leu Asn
420 425 430
Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp
435 440 445
Pro Thr Ala His Ala Ala Ile Met Ala Leu Arg Gln Gly Gly Leu Val
450 455 460
Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu
465 470 475 480
Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg
485 490 495
Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu
500 505 510
Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr
515 520 525
Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe
530 535 540
Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser
545 550 555 560
Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
565 570 575
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly
580 585 590
Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser
595 600 605
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
610 615 620
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
625 630 635 640
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
645 650 655
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
660 665 670
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
675 680 685
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
690 695 700
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
705 710 715 720
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
725 730 735
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
740 745 750
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
755 760 765
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
770 775 780
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
785 790 795 800
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
805 810 815
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
820 825 830
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
835 840 845
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
850 855 860
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
865 870 875 880
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
885 890 895
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
900 905 910
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
915 920 925
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
930 935 940
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
945 950 955 960
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
965 970 975
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
980 985 990
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
995 1000 1005
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
1010 1015 1020
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
1025 1030 1035
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
1040 1045 1050
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro
1055 1060 1065
Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
1070 1075 1080
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
1085 1090 1095
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
1100 1105 1110
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
1115 1120 1125
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
1130 1135 1140
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
1145 1150 1155
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
1160 1165 1170
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
1175 1180 1185
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
1190 1195 1200
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
1205 1210 1215
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
1220 1225 1230
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
1235 1240 1245
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
1250 1255 1260
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
1265 1270 1275
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
1280 1285 1290
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly
1295 1300 1305
Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
1310 1315 1320
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
1325 1330 1335
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
1340 1345 1350
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
1355 1360 1365
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
1370 1375 1380
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1385 1390 1395
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1400 1405 1410
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
1415 1420 1425
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1430 1435 1440
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1445 1450 1455
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1460 1465 1470
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1475 1480 1485
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1490 1495 1500
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1505 1510 1515
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1520 1525 1530
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1535 1540 1545
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1550 1555 1560
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1565 1570 1575
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1580 1585 1590
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1595 1600 1605
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1610 1615 1620
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1625 1630 1635
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1640 1645 1650
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1655 1660 1665
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1670 1675 1680
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1685 1690 1695
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1700 1705 1710
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1715 1720 1725
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1730 1735 1740
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1745 1750 1755
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1760 1765 1770
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1775 1780 1785
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1790 1795 1800
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1805 1810 1815
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1820 1825 1830
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1835 1840 1845
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1850 1855 1860
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1865 1870 1875
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1880 1885 1890
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1895 1900 1905
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1910 1915 1920
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1925 1930 1935
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1940 1945 1950
Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys
1955 1960 1965
Lys Arg Lys Val
1970
<210> 7
<211> 5919
<212> DNA
<213> 人工序列
<400> 7
atggacagcc tcttgatgaa ccggaggaag tttctttacc aattcaaaaa tgtccgctgg 60
gctaagggtc ggcgtgagac ctacctgtgc tacgtagtga agaggcgtga cagtgctaca 120
tccttttcac tggactttgg ttatcttcgc aataagaacg gctgccacgt ggaattgctc 180
ttcctccgct acatctcgga ctgggaccta gaccctggcc gctgctaccg cgtcacctgg 240
ttcacctcct ggagcccctg ctacgactgt gcccgacatg tggccgactt tctgcgaggg 300
aaccccaacc tcagtctgag gatcttcacc gcgcgcctct acttctgtga ggaccgcaag 360
gctgagcccg aggggctgcg gcggctgcac cgcgccgggg tgcaaatagc catcatgacc 420
ttcaaagatt atttttactg ctggaatact tttgtagaaa accacgaaag aactttcaaa 480
gcctgggaag ggctgcatga aaattcagtt cgtctctcca gacagcttcg gcgcatcctt 540
ttgccctctg gtggttctcc caagaagaag aggaaagtcg gtagttccgg atctagcgag 600
gtggagttca gccacgagta ctggatgaga cacgccctga ccctggctaa gagagcttgg 660
gatgagagag aggtgcccgt gggagctgtt ctggttcata acaacagggt gatcggcgag 720
ggatggaaca gacctatcgg gagacacgac ccaaccgctc atgctgaaat catggccctg 780
agacaaggag ggctggtgat gcaaaattac agactgatcg acgcaaccct gtacgtgacc 840
ctggagcctt gtgtgatgtg cgcaggagca atgatccact ccagaatcgg cagagtggtg 900
ttcggagcta gagatgccaa aaccggagcc gctggaagcc tgatggacgt tctgcatcac 960
cccggaatga atcacagagt ggagataacc gagggcattc tggccgacga gtgtgctgct 1020
ctgctgtctg atttcttcag aatgagaagg caggaaatca aggcccagaa aaaggcccaa 1080
agcagcaccg acagcggagg atctagcgga ggatcaagcg gaagcgagac tcctggaacc 1140
agcgaaagcg caaccccaga aagcagcgga ggaagtagcg gaggaagctc agaagtcgag 1200
ttcagccatg agtattggat gagacatgct ctgaccctgg caaagagagc aagagacgag 1260
agagaggtcc cagtgggagc agttctggtg ctgaacaaca gagtgatcgg ggaggggtgg 1320
aacagagcaa tcggactgca cgaccctaca gcacacgcag ccataatggc actgagacaa 1380
ggggggctcg tgatgcaaaa ctacaggctg atcgacgcca ccctgtacgt cacatttgag 1440
ccctgtgtga tgtgtgccgg agccatgatt cacagtagaa tcggccgggt ggtgttcggt 1500
gtgagaaacg ctaaaacagg cgccgccgga agcctgatgg atgttctgca ttaccccggc 1560
atgaatcacc gggtggagat cacagagggc atcctggctg acgaatgtgc cgctctgctg 1620
tgttacttct tcagaatgcc ccgacaagtg ttcaacgccc agaagaaagc ccagtcaagc 1680
accgactctg gcggatctag cggtggatct agcggctctg agacccctgg aacatccgaa 1740
tccgccactc cagagagcag cggaggctct tctggaggat cagataaaaa gtattctatt 1800
ggtttagcca tcggcactaa ttccgttgga tgggctgtca taaccgatga atacaaagta 1860
ccttcaaaga aatttaaggt gttggggaac acagaccgtc attcgattaa aaagaatctt 1920
atcggtgccc tcctattcga tagtggcgaa acggcagagg cgactcgcct gaaacgaacc 1980
gctcggagaa ggtatacacg tcgcaagaac cgaatatgtt acttacaaga aatttttagc 2040
aatgagatgg ccaaagttga cgattctttc tttcaccgtt tggaagagtc cttccttgtc 2100
gaagaggaca agaaacatga acggcacccc atctttggaa acatagtaga tgaggtggca 2160
tatcatgaaa agtacccaac gatttatcac ctcagaaaaa agctagttga ctcaactgat 2220
aaagcggacc tgaggttaat ctacttggct cttgcccata tgataaagtt ccgtgggcac 2280
tttctcattg agggtgatct aaatccggac aactcggatg tcgacaaact gttcatccag 2340
ttagtacaaa cctataatca gttgtttgaa gagaacccta taaatgcaag tggcgtggat 2400
gcgaaggcta ttcttagcgc ccgcctctct aaatcccgac ggctagaaaa cctgatcgca 2460
caattacccg gagagaagaa aaatgggttg ttcggtaacc ttatagcgct ctcactaggc 2520
ctgacaccaa attttaagtc gaacttcgac ttagctgaag atgccaaatt gcagcttagt 2580
aaggacacgt acgatgacga tctcgacaat ctactggcac aaattggaga tcagtatgcg 2640
gacttatttt tggctgccaa aaaccttagc gatgcaatcc tcctatctga catactgaga 2700
gttaatactg agattaccaa ggcgccgtta tccgcttcaa tgatcaaaag gtacgatgaa 2760
catcaccaag acttgacact tctcaaggcc ctagtccgtc agcaactgcc tgagaaatat 2820
aaggaaatat tctttgatca gtcgaaaaac gggtacgcag gttatattga cggcggagcg 2880
agtcaagagg aattctacaa gtttatcaaa cccatattag agaagatgga tgggacggaa 2940
gagttgcttg taaaactcaa tcgcgaagat ctactgcgaa agcagcggac tttcgacaac 3000
ggtagcattc cacatcaaat ccacttaggc gaattgcatg ctatacttag aaggcaggag 3060
gatttttatc cgttcctcaa agacaatcgt gaaaagattg agaaaatcct aacctttcgc 3120
ataccttact atgtgggacc cctggcccga gggaactctc ggttcgcatg gatgacaaga 3180
aagtccgaag aaacgattac tccatggaat tttgaggaag ttgtcgataa aggtgcgtca 3240
gctcaatcgt tcatcgagag gatgaccaac tttgacaaga atttaccgaa cgaaaaagta 3300
ttgcctaagc acagtttact ttacgagtat ttcacagtgt acaatgaact cacgaaagtt 3360
aagtatgtca ctgagggcat gcgtaaaccc gcctttctaa gcggagaaca gaagaaagca 3420
atagtagatc tgttattcaa gaccaaccgc aaagtgacag ttaagcaatt gaaagaggac 3480
tactttaaga aaattgaatg cttcgattct gtcgagatct ccggggtaga agatcgattt 3540
aatgcgtcac ttggtacgta tcatgacctc ctaaagataa ttaaagataa ggacttcctg 3600
gataacgaag agaatgaaga tatcttagaa gatatagtgt tgactcttac cctctttgaa 3660
gatcgggaaa tgattgagga aagactaaaa acatacgctc acctgttcga cgataaggtt 3720
atgaaacagt taaagaggcg tcgctatacg ggctggggac gattgtcgcg gaaacttatc 3780
aacgggataa gagacaagca aagtggtaaa actattctcg attttctaaa gagcgacggc 3840
ttcgccaata ggaactttat gcagctgatc catgatgact ctttaacctt caaagaggat 3900
atacaaaagg cacaggtttc cggacaaggg gactcattgc acgaacatat tgcgaatctt 3960
gctggttcgc cagccatcaa aaagggcata ctccagacag tcaaagtagt ggatgagcta 4020
gttaaggtca tgggacgtca caaaccggaa aacattgtaa tcgagatggc acgcgaaaat 4080
caaacgactc agaaggggca aaaaaacagt cgagagcgga tgaagagaat agaagagggt 4140
attaaagaac tgggcagcca gatcttaaag gagcatcctg tggaaaatac ccaattgcag 4200
aacgagaaac tttacctcta ttacctacaa aatggaaggg acatgtatgt tgatcaggaa 4260
ctggacataa accgtttatc tgattacgac gtcgatcaca ttgtacccca atcctttttg 4320
aaggacgatt caatcgacaa taaagtgctt acacgctcgg ataagaaccg agggaaaagt 4380
gacaatgttc caagcgagga agtcgtaaag aaaatgaaga actattggcg gcagctccta 4440
aatgcgaaac tgataacgca aagaaagttc gataacttaa ctaaagctga gaggggtggc 4500
ttgtctgaac ttgacaaggc cggatttatt aaacgtcagc tcgtggaaac ccgccaaatc 4560
acaaagcatg ttgcacagat actagattcc cgaatgaata cgaaatacga cgagaacgat 4620
aagctgattc gggaagtcaa agtaatcact ttaaagtcaa aattggtgtc ggacttcaga 4680
aaggattttc aattctataa agttagggag ataaataact accaccatgc gcacgacgct 4740
tatcttaatg ccgtcgtagg gaccgcactc attaagaaat acccgaagct agaaagtgag 4800
tttgtgtatg gtgattacaa agtttatgac gtccgtaaga tgatcgcgaa aagcgaacag 4860
gagataggca aggctacagc caaatacttc ttttattcta acattatgaa tttctttaag 4920
acggaaatca ctctggcaaa cggagagata cgcaaacgac ctttaattga aaccaatggg 4980
gagacaggtg aaatcgtatg ggataagggc cgggacttcg cgacggtgag aaaagttttg 5040
tccatgcccc aagtcaacat agtaaagaaa actgaggtgc agaccggagg gttttcaaag 5100
gaatcgattc ttccaaaaag gaatagtgat aagctcatcg ctcgtaaaaa ggactgggac 5160
ccgaaaaagt acggtggctt cgatagccct acagttgcct attctgtcct agtagtggca 5220
aaagttgaga agggaaaatc caagaaactg aagtcagtca aagaattatt ggggataacg 5280
attatggagc gctcgtcttt tgaaaagaac cccatcgact tccttgaggc gaaaggttac 5340
aaggaagtaa aaaaggatct cataattaaa ctaccaaagt atagtctgtt tgagttagaa 5400
aatggccgaa aacggatgtt ggctagcgcc ggagagcttc aaaaggggaa cgaactcgca 5460
ctaccgtcta aatacgtgaa tttcctgtat ttagcgtccc attacgagaa gttgaaaggt 5520
tcacctgaag ataacgaaca gaagcaactt tttgttgagc agcacaaaca ttatctcgac 5580
gaaatcatag agcaaatttc ggaattcagt aagagagtca tcctagctga tgccaatctg 5640
gacaaagtat taagcgcata caacaagcac agggataaac ccatacgtga gcaggcggaa 5700
aatattatcc atttgtttac tcttaccaac ctcggcgctc cagccgcatt caagtatttt 5760
gacacaacga tagatcgcaa acgatacact tctaccaagg aggtgctaga cgcgacactg 5820
attcaccaat ccatcacggg attatatgaa actcggatag atttgtcaca gcttgggggt 5880
gactctggtg gttctcccaa gaagaagagg aaagtctaa 5919
<210> 8
<211> 2093
<212> DNA
<213> 人工序列
<400> 8
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt aggcctgaat 360
tctgcagata tccatcacac tggccgttac ataacttacg gtaaatggcc cgcctggctg 420
accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc 480
aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 540
agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 600
gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat 660
ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg 720
tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag 780
tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt 840
gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctggtttagt 900
gaaccgtcag atccgctagc gccaccatgc ccaagaagaa gaggaaagtc tcgagcgact 960
acaaagacca tgacggtgat tataaagatc atgacatcga ttacaaggat gacgatgaca 1020
agtctggtgg ttctactaat ctgtcagata ttattgaaaa ggagaccggt aagcaactgg 1080
ttatccagga atccatcctc atgctcccag aggaggtgga agaagtcatt gggaacaagc 1140
cggaaagcga tatactcgtg cacaccgcct acgacgagag caccgacgag aatgtcatgc 1200
ttctgactag cgacgcccct gaatacaagc cttgggctct ggtcatacag gatagcaacg 1260
gtgagaacaa gattaagatg ctctctggtg gttctcccaa gaagaagagg aaagtcgagg 1320
gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggccca gtgagcaagg 1380
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1440
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1500
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1560
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1620
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1680
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1740
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1800
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1860
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1920
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1980
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 2040
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caaggaattc taa 2093

Claims (4)

1.一种用于核苷酸序列修饰的组合物,其特征在于,其包括:第一载体和第二载体;
其中,所述第一载体上具有如下表达元件:
胞嘧啶脱氨酶表达元件、腺嘌呤脱氨酶表达元件以及突变型Cas酶表达元件;其中,腺嘌呤脱氨酶为野生腺嘌呤脱氨酶和突变型腺嘌呤脱氨酶的组合;
胞嘧啶脱氨酶的氨基酸序列如SEQ ID NO.6的第1-182位所示;野生型腺嘌呤脱氨酶的氨基酸序列如SEQ ID NO.6的第199-364位所示,突变型腺嘌呤脱氨酶的氨基酸序列如SEQID NO.6的第397-562位所示;所述突变型Cas酶为SpCas9n,其氨基酸序列如SEQ ID NO.6的第595-1961位所示;
所述第二载体上具有如下表达元件:
gRNA表达元件和尿嘧啶糖苷酶抑制剂表达元件。
2.根据权利要求1所述的组合物,其特征在于,所述gRNA的靶序列选自SEQ ID NO.1-5。
3.一种修饰核苷酸序列的方法,所述方法以非疾病的诊断或治疗为目的,其特征在于,其包括:
给予对象施加权利要求1-2任一项所述的组合物。
4.权利要求1-2中任一项所述的用于核苷酸序列修饰的组合物在制备药物中的用途,所述药物用于基因突变、基因修复、构建有基因突变导致的疾病动物模型、基因治疗、基因功能筛选、药物筛选或疾病诊断。
CN201811478185.1A 2018-12-05 2018-12-05 一种用于核苷酸序列修饰的组合物、方法与应用 Active CN109517841B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811478185.1A CN109517841B (zh) 2018-12-05 2018-12-05 一种用于核苷酸序列修饰的组合物、方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811478185.1A CN109517841B (zh) 2018-12-05 2018-12-05 一种用于核苷酸序列修饰的组合物、方法与应用

Publications (2)

Publication Number Publication Date
CN109517841A CN109517841A (zh) 2019-03-26
CN109517841B true CN109517841B (zh) 2020-10-30

Family

ID=65794756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811478185.1A Active CN109517841B (zh) 2018-12-05 2018-12-05 一种用于核苷酸序列修饰的组合物、方法与应用

Country Status (1)

Country Link
CN (1) CN109517841B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017070632A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
GB2573062A (en) 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
KR20210143230A (ko) 2019-03-19 2021-11-26 더 브로드 인스티튜트, 인코퍼레이티드 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
CN111778233B (zh) * 2019-04-04 2023-11-21 辉大(上海)生物科技有限公司 一种新型的单碱基编辑技术及其应用
WO2020214842A1 (en) * 2019-04-17 2020-10-22 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
KR102258713B1 (ko) * 2019-07-31 2021-05-31 한양대학교 산학협력단 사이토신 염기교정용 조성물 및 이의 용도
CN114945670A (zh) * 2019-08-20 2022-08-26 上海蓝十字医学科学研究所 一种碱基编辑系统和其使用方法
WO2021155109A1 (en) * 2020-01-30 2021-08-05 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
CN114807155A (zh) * 2021-01-18 2022-07-29 华东师范大学 用于基因编辑的组合物及其应用
CN115704015A (zh) * 2021-08-12 2023-02-17 清华大学 基于腺嘌呤和胞嘧啶双碱基编辑器的靶向诱变系统
WO2023247753A1 (en) * 2022-06-23 2023-12-28 BASF Agricultural Solutions Seed US LLC Diversifying base editing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108707635A (zh) * 2018-05-29 2018-10-26 华东师范大学 用于核苷酸序列修饰的组合物、方法与应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108707635A (zh) * 2018-05-29 2018-10-26 华东师范大学 用于核苷酸序列修饰的组合物、方法与应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Programmable Single and Multiplex Base-Editing in Bombyx mori Using RNA-Guided Cytidine Deaminases;Yufeng Li;《G3 (Bethesda)》;20180319;第8卷(第5期);1701-1709 *
基因编辑之"新宠"—单碱基基因组编辑系统;魏瑜;《遗传》;20171211;第39卷(第12期);1115-1121 *

Also Published As

Publication number Publication date
CN109517841A (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN109517841B (zh) 一种用于核苷酸序列修饰的组合物、方法与应用
JP7075170B2 (ja) 延長された単一ガイドrna及びその用途
US11718846B2 (en) Genomic sequence modification method for specifically converting nucleic acid bases of targeted DNA sequence, and molecular complex for use in same
KR101906491B1 (ko) F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
CN110835634B (zh) 一种新型碱基转换编辑系统及其应用
CN108699116A (zh) 用于基因编辑的演化的cas9蛋白
CN116042611A (zh) 编辑rna的方法和组合物
CN107922949A (zh) 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
CN110835629B (zh) 一种新型碱基转换编辑系统的构建方法及其应用
CN110835632B (zh) 新型碱基转换编辑系统用于基因治疗的应用
EP3733842A1 (en) System and method for genome editing
JP7001272B2 (ja) ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体
CN116209755A (zh) 可编程核酸酶和使用方法
Laptev et al. The piggyBac transposon as a tool in genetic engineering
CN115703842A (zh) 高效率高精度的胞嘧啶c到鸟嘌呤g转变的碱基编辑器
KR20220039564A (ko) 신규의 개량된 염기 편집 또는 교정용 융합단백질 및 이의 용도
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
WO2019194320A1 (ja) エンジニアリングされたBlCas9ヌクレアーゼ
WO2023024089A1 (zh) 实现a到c和/或a到t碱基突变的碱基编辑系统及其应用
Savkovic-Stevanovic Nucleotides recombination states
US20230407278A1 (en) Compositions and methods for cas9 molecules with improved gene editing properties
CA3122278A1 (en) Homing endonuclease variants
CN117925730A (zh) 提高基因组序列修饰技术中的突变导入效率的方法、及其使用的分子复合体
MEYER Reversed genetics: a new approach to the elucidation of structure—function relationship

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant