CN110564752A - 差异代理技术在c·t碱基替换细胞富集中的应用 - Google Patents

差异代理技术在c·t碱基替换细胞富集中的应用 Download PDF

Info

Publication number
CN110564752A
CN110564752A CN201910938686.1A CN201910938686A CN110564752A CN 110564752 A CN110564752 A CN 110564752A CN 201910938686 A CN201910938686 A CN 201910938686A CN 110564752 A CN110564752 A CN 110564752A
Authority
CN
China
Prior art keywords
sequence
organism
sgrna
target
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910938686.1A
Other languages
English (en)
Other versions
CN110564752B (zh
Inventor
杨进孝
徐雯
杨永星
康桂婷
武莹
李璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN201910938686.1A priority Critical patent/CN110564752B/zh
Publication of CN110564752A publication Critical patent/CN110564752A/zh
Application granted granted Critical
Publication of CN110564752B publication Critical patent/CN110564752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了差异代理技术在C·T碱基替换细胞富集中的应用。本发明的差异代理技术载体包括如下试剂:sgRNA、C·T碱基替换系统和功能丧失的筛选剂抗性基因;sgRNA由靶向目标基因靶点序列的esgRNA和靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;C·T碱基替换系统在靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上C·T碱基替换细胞富集,大大提高C·T碱基替换效率。

Description

差异代理技术在C·T碱基替换细胞富集中的应用
技术领域
本发明涉及生物技术领域,具体涉及差异代理技术在C·T碱基替换细胞富集中的应用。
背景技术
CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。
2016年,David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor,CBE),分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey),原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine,C)碱基进行编辑,而不再通过产生DSB和启动HDR修复,大大提高了C替换为胸腺嘧啶(Thymine,T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过sgRNA定位到靶点,rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil,U),通过DNA的修复使得U与腺嘌呤(Adenine,A)配对,又通过DNA复制,最终使得T与A配对,从而实现了C到T的转换。在所测试的编辑器中,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor,UGI))的平均突变率较高,原因有二:一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase,UDG)催化清除DNA中U,二是SpCas9n(D10A)在非编辑链上产生切口,诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制,促使U:G错配更多的偏好性修复成U:A。
目前,在植物中通过报告基因介导的细胞富集技术富集C·T碱基替换细胞的研究非常有限,尚无利用转化过程中所使用的筛选标记在细胞水平上实现C·T碱基替换细胞的富集,进而提高C·T碱基替换效率的报道。
发明内容
本发明的目的是提供差异代理技术在C·T碱基替换的细胞富集中的应用,本发明的差异代理技术能够在细胞水平上实现C·T碱基替换细胞的富集,进而提高目标靶点的C·T碱基替换效率。
为了实现上述目的,本发明首先提供了一种成套试剂,所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;
所述sgRNA由靶向目标基因靶点序列的esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;
所述靶向目标基因靶点序列的esgRNA结构如下:所述目标基因靶点序列转录的RNA-esgRNA骨架;
所述靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA结构如下:所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架;
所述C·T碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料;
所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
所述sgRNA骨架为S1)或S2)或S3):
S1)将序列1第571-646位中的T替换为U得到的RNA分子;
S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
S3)与S1)或S2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子;
所述esgRNA骨架为T1)或T2)或T3):
T1)将序列11中的T替换为U得到的RNA分子;
T2)将T1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
T3)与T1)或T2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
上述成套试剂中,所述sgRNA具体可为tRNA-sgRNA;所述tRNA-sgRNA由靶向目标基因靶点序列的tRNA-esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA组成;
所述靶向目标基因靶点序列的tRNA-esgRNA结构如下:tRNA-所述目标基因靶点序列转录的RNA-esgRNA骨架;
所述靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA结构如下:tRNA-所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架;
所述tRNA为R1)或R2)或R3):
R1)将序列1第474-550位中的T替换为U得到的RNA分子;
R2)将R1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
R3)与R1)或R2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
上述成套试剂中,靶向所述目标基因靶点序列的个数可为一个或两个或多个;靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步可为20bp。
所述功能丧失的筛选剂抗性基因满足如下条件:所述功能丧失的筛选剂抗性基因功能或活性丧失,且通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。所述功能丧失的筛选剂抗性基因靶点序列可为功能丧失的筛选剂抗性基因序列上的靶点序列(位于功能丧失的筛选剂抗性基因序列内部),也可为额外添加在功能丧失的筛选剂抗性基因序列内部或5’端或3’端的靶点序列。当为了使功能丧失的筛选剂抗性基因在进行C·T碱基替换后可恢复功能而在其序列上额外添加了靶点靶序列(记作代理靶点靶序列)时,所述功能丧失的筛选剂抗性基因序列不仅包括功能丧失的筛选剂抗性基因本身,还包括代理靶点靶序列以及如果需要,为了保证添加代理靶点靶序列后筛选剂抗性基因能够在正常读码框内翻译再额外添加的一个或两个或多个碱基。
进一步的,所述功能丧失的筛选剂抗性基因可为将筛选剂抗性基因的起始密码子(如ATG)删除,且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列。所述代理靶点靶序列满足如下条件即可:通过C·T碱基替换系统对所述代理靶点靶序列进行C·T碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。代理靶点靶序列依次由功能丧失的筛选剂抗性基因靶点序列和PAM序列组成。需要注意的是,为了保证添加代理靶点靶序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,可在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间再添加一个或两个或多个碱基。
在本发明的一个具体实施例中,所述代理靶点靶序列为序列1第11305-11327位。所述功能丧失的筛选剂抗性基因靶点序列为序列1第11305-11324位。所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的向导下,可通过对所述代理靶点靶序列进行C·T碱基替换,使代理靶点靶序列第5位碱基C突变为碱基T,形成ATG,进而使筛选标记基因功能恢复。需要注意的是,为了保证添加代理靶点靶序列后,去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译,此处在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间又添加了一个碱基C。
在本发明的另一个具体实施例中,所述代理靶点靶序列为序列10。所述功能丧失的筛选剂抗性基因靶点序列为序列10第1-20位。所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的向导下,可通过对所述代理靶点靶序列进行C·T碱基替换,使代理靶点靶序列第7位碱基C突变为碱基T,形成ATG,进而使筛选标记基因功能恢复。
更进一步的,所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因,如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中,所述筛选剂抗性基因为潮霉素抗性基因。
上述成套试剂中,所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料。
上述成套试剂中,所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9,dCas9)或其变体、nickase切刻酶(Cas9 nickase,Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等),Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等),Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为SpCas9n蛋白质。在本发明的另一个具体实施例中,所述Cas9核酸酶为Cas9n,具体为HypaCas9n蛋白质。
所述胞嘧啶脱氨酶可为hAPOBE3A蛋白质、human AID蛋白质、PmCDA1蛋白质或rAPOBEC1蛋白质。在本发明的一个具体实施例中,所述胞嘧啶脱氨酶为PmCDA1蛋白质。在本发明的另一个具体实施例中,所述胞嘧啶脱氨酶为rAPOBEC1蛋白质。
进一步的,所述SpCas9n蛋白质为A1)或A2)或A3):
A1)氨基酸序列是序列2所示的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;
与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:
B1)编码所述SpCas9n的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;
所述HypaCas9n蛋白质为C1)或C2)或C3):
C1)氨基酸序列是序列7所示的蛋白质;
C2)将序列表中序列7所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质;
与所述HypaCas9n相关的生物材料为D1)至D5)中的任一种:
D1)编码所述HypaCas9n的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物;
D5)含有D1)所述核酸分子的转基因细胞系、或含有D2)所述表达盒的转基因细胞系;
所述PmCDA1蛋白质为E1)或E2)或E3):
E1)氨基酸序列是序列3所示的蛋白质;
E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质;
与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种:
F1)编码所述PmCDA1蛋白质的核酸分子;
F2)含有F1)所述核酸分子的表达盒;
F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;
F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;
F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;
所述rAPOBEC1蛋白质为G1)或G2)或G3):
G1)氨基酸序列是序列12所示的蛋白质;
G2)将序列表中序列12所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
G3)在G1)或G2)的N端或/和C端连接标签得到的融合蛋白质;
与所述rAPOBEC1蛋白质相关的生物材料为H1)至H5)中的任一种:
H1)编码所述rAPOBEC1蛋白质的核酸分子;
H2)含有H1)所述核酸分子的表达盒;
H3)含有H1)所述核酸分子的重组载体、或含有H2)所述表达盒的重组载体;
H4)含有H1)所述核酸分子的重组微生物、或含有H2)所述表达盒的重组微生物、或含有H3)所述重组载体的重组微生物;
H5)含有H1)所述核酸分子的转基因细胞系、或含有H2)所述表达盒的转基因细胞系;
所述UGI蛋白质为I1)或I2)或I3):
I1)氨基酸序列是序列4所示的蛋白质;
I2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
I3)在I1)或I2)的N端或/和C端连接标签得到的融合蛋白质;
与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种:
J1)编码所述UGI蛋白质的核酸分子;
J2)含有J1)所述核酸分子的表达盒;
J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体;
J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物;
J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系;
与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种:
K1)含有所述功能丧失的筛选剂抗性基因的表达盒;
K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体;
K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物;
K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。
为了使A1)、C1)、E1)、G1)、I1)中的蛋白质便于纯化,可在由序列表中序列2或序列3或序列4或序列7或序列12所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。
表、标签的序列
标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
上述A2)、C2)、E2)、G2)、I2)中的蛋白质,为与序列2或序列3或序列4或序列7或序列12所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、C2)、E2)、G2)、I2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)、C2)、E2)、G2)、I2)中的蛋白质的编码基因可通过将序列1的第3529-7797位(编码序列2所示的蛋白质)、序列1的第8089-8712位(编码序列3所示的蛋白质)、序列1的第8734-9030位(编码序列4所示的蛋白质)、序列6(编码序列7所示的蛋白质)或序列9的第1-687位(编码序列12所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。
更进一步的,B1)所述核酸分子为b1)或b2)或b3):
b1)序列表中序列1第3529-7797位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子;
D1)所述核酸分子为d1)或d2)或d3):
d1)序列表中序列6所示的cDNA分子或DNA分子;
d2)与d1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述HypaCas9n的cDNA分子或DNA分子;
d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述HypaCas9n的cDNA分子或DNA分子;
F1)所述核酸分子为f1)或f2)或f3):
f1)序列表中序列1第8089-8712位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述PmCDA1的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述PmCDA1的cDNA分子或DNA分子;
H1)所述核酸分子为h1)或h2)或h3):
h1)序列表中序列9第1-687位所示的cDNA分子或DNA分子;
h2)与h1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述rAPOBEC1的cDNA分子或DNA分子;
h3)在严格条件下与h1)或h2)限定的核苷酸序列杂交,且编码所述rAPOBEC1的cDNA分子或DNA分子;
J1)所述核酸分子为j1)或j2)或j3):
j1)序列表中序列1第8734-9030位所示的cDNA分子或DNA分子;
j2)与j1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述UGI的cDNA分子或DNA分子;
j3)在严格条件下与j1)或j2)限定的核苷酸序列杂交,且编码所述UGI的cDNA分子或DNA分子;
K1)所述功能丧失的筛选剂抗性基因为序列1第11305-12351位所示的DNA分子或将序列1第11305-12351位所示DNA分子中的第11305-11328替换为序列10,且保持其他序列不变后得到的序列。
其中,所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3、4、7或12所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒),是指能够在宿主细胞中表达SpCas9n蛋白质的DNA,该DNA不但可包括启动SpCas9n基因转录的启动子,还可包括终止SpCas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。
D2)所述的含有编码HypaCas9n蛋白质的核酸分子的表达盒(HypaCas9n基因表达盒),是指能够在宿主细胞中表达HypaCas9n蛋白质的DNA,该DNA不但可包括启动HypaCas9n基因转录的启动子,还可包括终止HypaCas9n基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述HypaCas9n基因表达盒的重组载体。
F2)所述的含有编码PmCDA1蛋白质的核酸分子的表达盒(PmCDA1基因表达盒),是指能够在宿主细胞中表达PmCDA1蛋白质的DNA,该DNA不但可包括启动PmCDA1基因转录的启动子,还可包括终止PmCDA1基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述PmCDA1基因表达盒的重组载体。
H2)所述的含有编码rAPOBEC1蛋白质的核酸分子的表达盒(rAPOBEC1基因表达盒),是指能够在宿主细胞中表达rAPOBEC1蛋白质的DNA,该DNA不但可包括启动rAPOBEC1基因转录的启动子,还可包括终止rAPOBEC1基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述rAPOBEC1基因表达盒的重组载体。
J2)所述的含有编码UGI蛋白质的核酸分子的表达盒(UGI基因表达盒),是指能够在宿主细胞中表达UGI蛋白质的DNA,该DNA不但可包括启动UGI基因转录的启动子,还可包括终止UGI基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述UGI基因表达盒的重组载体。
所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中,所述重组载体具体为DisSUGs-1重组表达载体或DisSUGs-2重组表达载体。
所述DisSUGs-1重组表达载体的序列为将序列1第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位的sgRNA核苷酸序列均替换为序列11(esgRNA核苷酸序列),且保持其他序列不变后得到的序列。
所述DisSUGs-2重组表达载体的序列为将DisSUGs-1重组表达载体中第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列:ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
所述微生物可为酵母、细菌、藻或真菌。其中,所述细菌可为农杆菌,如农杆菌EHA105。在本发明的具体实施例中,所述重组微生物具体为含有所述DisSUGs-1重组表达载体或所述DisSUGs-2重组表达载体的农杆菌EHA105。
所述转基因细胞系不包括繁殖材料。
上述成套试剂具有如下用途:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
上述sgRNA或与所述sgRNA相关的生物材料也属于本发明的保护范围。
为了实现上述目的,本发明还提供了上述成套试剂或上述sgRNA或与所述sgRNA相关的生物材料的新用途。
本发明提供了上述成套试剂或上述sgRNA或与所述sgRNA相关的生物材料在M1)-M6)任一种中的应用:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
为了实现上述目的,本发明还提供了N1)或N2)或N3)或N4)或N5)所述的方法:
N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述esgRNA、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述esgRNA、所述sgRNA和所述胞嘧啶脱氨酶均得到表达;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将上述Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N5)生物突变体的制备方法,包括如下步骤:按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生C·T碱基替换的生物体。
上述方法中,所述转录靶向目标基因靶点序列的esgRNA的DNA分子为转录靶向目标基因靶点序列的tRNA-esgRNA的DNA分子,所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子为转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子。进一步的,所述转录靶向目标基因靶点序列的tRNA-esgRNA的DNA分子或所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子转录后得到的tRNA-esgRNA或tRNA-sgRNA均为不成熟的RNA前体,该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点,就会得到多少个独立的成熟的RNA,每个成熟的RNA依次由所述靶点序列转录的RNA和所述esgRNA骨架(或sgRNA骨架)组成,或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述esgRNA骨架(或sgRNA骨架)组成。
上述方法中,所述N1)或N3)中,所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中,所述UGI的个数具体为一个。
上述方法中,所述N1)中,所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的esgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、所述胞嘧啶脱氨酶的编码基因和所述UGI的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的esgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述胞嘧啶脱氨酶的编码基因的表达盒和所述UGI的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。
在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内,所述重组表达载体具体为上述DisSUGs-1重组表达载体或上述DisSUGs-2重组表达载体。
上述成套试剂或应用或方法中,所述C·T碱基替换为碱基C突变为碱基T。所述碱基C可为位于所述靶点序列中任意位置的碱基C。
上述成套试剂或应用或方法中,所述生物体为P1)或P2)或P3)或P4):
P1)植物或动物;
P2)单子叶植物或双子叶植物;
P3)禾本科植物;
P4)水稻(如日本晴水稻);
所述生物细胞为Q1)或Q2)或Q3)或Q4):
Q1)植物细胞或动物细胞;
Q2)单子叶植物细胞或双子叶植物细胞;
Q3)禾本科植物细胞;
Q4)水稻细胞(如日本晴水稻细胞)。
本发明的差异代理技术原理如下:将优化的esgRNA应用于C·T碱基替换的细胞富集技术中,使用优化的esgRNA编辑基因组内源目标基因靶点序列,使用sgRNA编辑报告基因的代理靶点序列,进一步提高内源目标基因靶点序列的C·T碱基替换效率。
所述C·T碱基替换的细胞富集技术原理如下:以失活的筛选剂抗性基因为报告基因,建立一种C·T碱基替换的细胞富集技术,使得报告基因上发生了C·T碱基替换的细胞能够在含有筛选剂的培养基中生长出来,没有发生C·T碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上,如果同时对内源目标基因靶点进行C·T碱基替换编辑,在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的C·T碱基替换,从而实现对内源目标基因靶点发生C·T碱基替换的细胞的富集,进而提高内源目标基因靶点的C·T碱基替换效率。
本发明具有以下优点:
1、有多种不同类型的基因可以作为报告基因,在植物中进行C·T碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系,使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集,比其余的如荧光报告基因、内源除草剂抗性基因等,更具有广谱性、通用性。
2、技术设计简便,其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中,以满足不同作物的不同转化筛选体系的需求。
3、本发明的差异代理技术对基于不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器的细胞富集技术均适用,均可实现细胞水平上C·T碱基替换细胞富集,大大提高C·T碱基替换效率。
附图说明
图1为非细胞富集技术载体sgRNA-GT结构示意图。
图2为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT结构示意图。
图3为细胞富集技术的工作原理示意图。
图4为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在抗性愈伤中对靶点的C·T碱基替换效率比较。
图5为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。
图6为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在T0苗中对靶点的C·T碱基替换纯合替换效率比较。
图7为HypaCas9n&PmCDA1&UGI介导的细胞富集技术载体sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT和非细胞富集技术载体HypaCas9n-sgRNA-GT结构示意图。
图8为细胞富集技术载体sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT和非细胞富集技术载体HypaCas9n-sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。
图9为rAPOBEC1&Cas9n&UGI介导的细胞富集技术载体sgRNA-ATG-Hyg-ATG/r-sgRNA-GT和非细胞富集技术载体r-sgRNA-GT结构示意图。
图10为细胞富集技术载体sgRNA-ATG-Hyg-ATG/r-sgRNA-GT和非细胞富集技术载体r-sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。
图11为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT、DisSUGs和非细胞富集技术载体sgRNA-GT结构示意图。
图12为细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT与DisSUGs在T0苗中对靶点的C·T碱基替换效率比较。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
引物对T1由引物T1-F:5’-gtaagaaccaccagcgacac-3’和引物T1-R:5’-gtaattgtgcttggtgatgga-3’组成,用于扩增靶点ALS-T1。
引物对T2由引物T2-F:5’-aatatgccattcaggtgctgg-3’和引物T2-R:5’-atcataggcagcacatgctcc-3’组成,用于扩增靶点ALS-T2。
引物对T3由引物T3-F:5’-atggctacgaccgccgcgg-3’和引物T3-R:5’-gcctcaattttccctgtcacacgatc-3’组成,用于扩增靶点ALS-T3。
引物对T4由引物T4-F:5’-attgtggctcgtgctctacc-3’和引物T4-R:5’-agacacacccacaggaacatt-3’组成,用于扩增靶点DEP1。
引物对T5由引物T5-F:5’-cttcaaattctaatccccaatcc-3’和引物T5-R:5’-ggttgttgttgaggtttaggatc-3’组成,用于扩增靶点Waxy。
引物对T6由引物T6-F:5’-ttacgaactttataactttgtcgg-3’和引物T6-R:5’-atggaggcgatgaggaagac-3’组成,用于扩增靶点NRT1.1B-T1。
引物对T7由引物T7-F:5’-ctaatcctaccaattaacgagtcg-3’和引物T7-R:5’-accagttgaagaagcgcatc-3’组成,用于扩增靶点NRT1.1B-T2。
引物对T8由引物T8-F:5’-cctccatcctcctcaccg-3’和引物T8-R:5’-tgaccttgtggacgatggtg-3’组成,用于扩增靶点NRT1.1B-T3。
引物对T9由引物T9-F:5’-acatcgagatggagaagcgg-3’和引物T9-R:5’-ccatgctccaatcgatgaatac-3’组成,用于扩增靶点CDC48-T1。
引物对T10由引物T10-F:5’-agacaccatctgcattgttct-3’和引物T10-R:5’-ggatgtaagaaggcgacactag-3’组成,用于扩增靶点CDC48-T2。
引物对T11由引物T11-F:5’-gtagcttcaaattctaatcc-3’和引物T11-R:5’-ggaggccaccgaggacgtc-3’组成,用于扩增靶点Waxy-T2。
以下实施例中,C·T碱基替换是指靶点序列中任何位置的C突变为T。
C·T碱基替换效率=发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100%。
C·T碱基替换纯合替换效率=纯合突变的T0苗数/发生C·T碱基替换的T0苗总数×100%。纯合突变的T0苗定义为所有发生C·T碱基替换的位点均为纯合突变的T0苗。
日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。
恢复培养基:含有200mg/L特美汀的N6固体培养基。
筛选培养基:含有50mg/L潮霉素的N6固体培养基。
分化培养基:含有2mg/L KT、0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。
生根培养基:含有0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。
实施例1、C·T碱基替换的细胞富集技术的建立
一、C·T碱基替换的细胞富集技术载体的建立
将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。以Cas9核酸酶为SpCas9n,胞嘧啶脱氨酶为PmCDA1为例:sgRNA-GT载体的结构示意图如图1所示。
将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的细胞富集技术载体命名为sgRNA-ATG-Hyg-ATG/sgRNA-GT。以Cas9核酸酶为SpCas9n,胞嘧啶脱氨酶为PmCDA1为例:sgRNA-ATG-Hyg-ATG/sgRNA-GT载体的结构示意图如图2所示。
非细胞富集技术载体中含有完整的筛选剂抗性基因。细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行改造使其功能丧失,同时在sgRNA部分加入相应的代理靶点序列后得到的载体。
以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:非细胞富集技术载体中的筛选剂抗性基因为完整的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为功能丧失的潮霉素抗性基因Hygromycin(Hygromycin-ATG),功能丧失的潮霉素抗性基因Hygromycin(Hygromycin-ATG)为将完整的潮霉素抗性基因Hygromycin去掉ATG,且在5’端添加代理靶点靶序列(含有PAM)后得到的序列。
其中,代理靶点靶序列(Efemp1突变靶点)可为如下序列:gcaacgagtggtgtggtgcctgg(斜体所示的碱基为PAM序列),其为将来源于human cell的Efemp1基因的代理靶点原序列gcaaccagtggtgtggtgcctgg中的碱基C(下划线所示的碱基)突变为碱基G后得到的序列。
代理靶点靶序列(rAPOBEC1-sug)还可为如下序列:cggcgacggcgagcaagtggtgg(斜体所示的碱基为PAM序列)。
二、C·T碱基替换的细胞富集技术的工作原理
C·T碱基替换的细胞富集技术的工作原理如图3所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例:在细胞富集技术中,由于潮霉素抗性基因Hygromycin去掉ATG后,抗性功能丧失,在潮霉素筛选培养基中,植物无法长出抗性愈伤,当细胞富集技术中的C·T碱基替换系统(由Cas9核酸酶、胞嘧啶脱氨酶和UGI组成的C·T碱基替换系统)在sgRNA向导下将代理靶点靶序列(Efemp1突变靶点)中的C5突变为T5(第5位碱基C突变为碱基T)或代理靶点靶序列(rAPOBEC1-sug)中的C7突变为T7(第7位碱基C突变为碱基T),形成ATG后,能够使潮霉素抗性基因Hygromycin正常表达,抗性功能恢复,进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了C·T碱基替换,那么此细胞对应的内源基因发生C·T碱基替换的效率相对会更高,从而达到富集C·T碱基替换细胞的目的,实现提高植物内源靶点的C·T碱基替换效率。
实施例2、Cas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体为Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的非细胞富集技术载体sgRNA-GT及Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的细胞富集技术载体sgRNA-ATG-Hyg-ATG/sgRNA-GT。各载体均为环状质粒。两种重组表达载体各元件结构示意图分别如图1和图2所示。
根据含有的靶点序列不同,每种重组表达载体又各自分成两种,共有如下四种重组表达载体:sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体、sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体。
人工合成上述四种重组表达载体,四种重组表达载体的具体结构描述分别如下:
sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。其中,序列1的第131-467位为OsU3启动子的核苷酸序列,第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位、第1339-1415位均为tRNA的核苷酸序列,第551-570位、第724-743位、第897-916位、第1070-1089位、第1243-1262位分别为靶向OsALS、OsCDC48、OsNRT1.1B、OsWax、OsALS基因的五个靶点序列,第1416-1435位为报告基因代理靶点序列。第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位、第1436-1511位为sgRNA的核苷酸序列,第1512-1802位为OsU3终止子的核苷酸序列;序列1的第1809-3522位为OsUbq3启动子的核苷酸序列,第3529-7797位为SpCas9n蛋白质的编码序列(不含有终止密码子),编码序列2所示的SpCas9n蛋白质;序列1的第8089-8712位为PmCDA1蛋白质的编码序列(不含有终止密码子),编码序列3所示的PmCDA1蛋白质;序列1的第8734-9030位为UGI蛋白质的编码序列,编码序列4所示的UGI蛋白质;序列1的第9037-9231位为35S终止子的核苷酸序列,第9306-11298位为ZmUbi1启动子的核苷酸序列,第11305-11327位为代理靶点靶序列,第11329-12351位为去掉起始密码子的潮霉素磷酸转移酶的核苷酸序列,第12365-12617位为Nos终止子的核苷酸序列。sgRNA-ATG-Hyg-ATG/sgRNA-GT-1重组表达载体中六个靶点序列见表1,靶点分别为ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2、Efemp1。
sgRNA-ATG-Hyg-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的五个靶点序列ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2依次分别替换为如下五个靶点序列:ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
sgRNA-GT-1重组表达载体的序列为将序列1第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列,且保持其他序列不变后得到的序列。
sgRNA-GT-2重组表达载体的序列为将sgRNA-GT-1重组表达载体中的五个靶点序列ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2依次分别替换为如下五个靶点序列:ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。
表1
二、水稻阳性抗性愈伤的获得
将步骤一获得的sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体,sgRNA-GT-1载体和sgRNA-GT-2载体分别按照如下步骤1-8进行操作:
1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品,CAT#:AC1010),得到重组农杆菌。
2、完成步骤1后,采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。
3、完成步骤2后,将水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。
4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。
5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。
6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。
7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。
8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。
三、水稻阳性T0苗的获得
1、将步骤一获得的sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体,sgRNA-GT-1载体和sgRNA-GT-2载体分别按照步骤二的1-7进行操作,得到水稻抗性愈伤。
2、取步骤1得到的水稻抗性愈伤放入分化培养基上,25℃光照培养1个月左右,将分化出来的小苗移至生根培养基上,25℃光照培养2周,获取水稻T0苗。
3、分别提取步骤2得到的水稻T0苗的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻T0苗为水稻阳性T0苗;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻T0苗不为水稻阳性T0苗。
四、结果分析
一)、水稻愈伤中靶点的编辑情况
1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次,获得平均值和方差),对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于ALS-T2靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于ALS-T3靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T2靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T3靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于CDC48-T1靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物;对于CDC48-T2靶点,采用引物对T10进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数,计算得出C·T碱基替换效率,结果见图4。
结果表明:通过使用细胞富集技术载体(sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体),ALS-T1靶点中第3位C的C·T碱基替换效率从44%增加到75%;ALS-T2靶点中第4位C的C·T碱基替换效率从23%增加到68%;ALS-T3靶点中第3、4、5和6位C的平均C·T碱基替换效率从30%增加到75%;NRT1.1B-T3靶点中第3、4和5位C的平均C·T碱基替换效率从40%增加到75%;NRT1.1B-T2靶点中第8、9、11和12位C的平均C·T碱基替换效率从5%增加到15%;Waxy靶点中第11位C的C·T碱基替换效率从2.5%增加到20%;CDC48-T1靶点中第3和4位C的平均C·T碱基替换效率从36%增加到77%;CDC48-T2靶点中第3位C的C·T碱基替换效率从0增加到15%;NRT1.1B-T1靶点中第4位C的C·T碱基替换效率从44%增加到66%。综上所述,通过使用细胞富集技术大部分靶点的C·T碱基替换效率提升至非细胞富集技术的1.5-8倍。
二)、水稻T0苗中靶点的编辑情况
1、分别取步骤三所获得的sgRNA-ATG-Hyg-ATG/sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/sgRNA-GT-2载体,sgRNA-GT-1载体和sgRNA-GT-2载体的水稻阳性T0苗的基因组DNA作为模板,对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于ALS-T2靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于ALS-T3靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T2靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T3靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于CDC48-T1靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物;对于CDC48-T2靶点,采用引物对T10进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数,计算得出C·T碱基替换效率。
C·T碱基替换效率分析结果如图5所示。结果表明:在T0苗中,与非细胞富集技术相比,ALS-T1靶点的C·T碱基替换效率由40%增加到66.7%,ALS-T2靶点的C·T碱基替换效率由20.7%增加到63.3%,ALS-T3靶点的C·T碱基替换效率由23.3%增加到47.8%,NRT1.1B-T2靶点的C·T碱基替换效率由50%增加到60%,NRT1.1B-T3靶点的C·T碱基替换效率由30%增加到36.7%,CDC48-T1靶点的C·T碱基替换效率由39.3%增加到56.7%,CDC48-T2靶点的C·T碱基替换效率由13.3%增加到33.3%。除了Waxy和NRT1.1B-T1靶点的替换效率保持不变以外,细胞富集技术增加了大部分靶点的C·T碱基替换效率,平均C·T碱基替换效率从36%增加到49%。
C·T碱基替换纯合替换效率分析结果如图6所示。结果表明:在T0苗中,有5个靶点的纯合C·T碱基替换效率增加。具体的,ALS-T1的纯合替换效率由8.3%增加到45%,ALS-T2的纯合替换效率由16.7%增加到35.3%,ALS-T3的纯合替换效率由0增加到9.1%,NRT1.1B-T3的纯合替换效率由0增加到9.1%,CDC48-T1的纯合替换效率由18.2%增加到37.5%。其余靶点的纯合替换率几乎未改变。综上所述,与非细胞富集技术相比,细胞富集技术能够增加部分靶点的纯合替换效率。
实施例3、HypaCas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻T0苗基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体为HypaCas9n&PmCDA1&UGI(HypaCas9-PCBE)介导的C·T碱基替换的非细胞富集技术载体(命名为HypaCas9n-sgRNA-GT)及HypaCas9n&PmCDA1&UGI(HypaCas9-PCBE)介导的细胞富集技术载体(命名为sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT)。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图7所示。载体主要结构与Cas9n&PmCDA1&UGI介导的非细胞富集技术载体和细胞富集技术载体相似,二者区别仅在于使用HypaCas9n代替SpCas9n。HypaCas9n&PmCDA1&UGI介导的细胞富集技术工作原理与Cas9n&PmCDA1&UGI介导的细胞富集技术相同。
根据含有的靶点序列不同,每种重组表达载体又各自分成两种,共有如下四种重组表达载体:sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-1重组表达载体,sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-2重组表达载体,HypaCas9n-sgRNA-GT-1重组表达载体,HypaCas9n-sgRNA-GT-2重组表达载体。
人工合成上述四种重组表达载体,四种重组表达载体的具体结构描述分别如下:
sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-1重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列(编码序列7所示的HypaCas9n蛋白质),且保持其他序列不变后得到的序列。
sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-2重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列,且将第131-1802位替换为序列8,且保持其他序列不变后得到的序列。其中,序列8的第1-337位为OsU3启动子的核苷酸序列,第344-420位、第517-593位、第690-766位为tRNA序列,第441-516位、614-689位、787-862位为sgRNA序列,第421-440位为ALS-T3靶点序列,第594-613位为CDC48-T2靶点序列,第767-786位为Efemp1代理靶点序列,第863-1153位为OsU3终止子的核苷酸序列。对应的靶序列信息见表2。
HypaCas9n-sgRNA-GT-1重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列,且将第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列,且保持其他序列不变后得到的序列。
HypaCas9n-sgRNA-GT-2重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列,且将第131-1802位替换为序列8,且将第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列,且保持其他序列不变后得到的序列。
各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表2所示。
表2
二、水稻阳性T0苗的获得
1、将步骤一获得的sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-2载体,HypaCas9n-sgRNA-GT-1载体和HypaCas9n-sgRNA-GT-2载体分别按照实施例2中步骤二的1-7进行操作,得到水稻抗性愈伤。
2、取步骤1得到的水稻抗性愈伤按照实施例2中步骤2-3进行操作,得到水稻阳性T0苗及对应的基因组DNA。
三、结果分析
1、分别取步骤二所获得的sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-1载体,sgRNA-ATG-Hyg-ATG/HypaCas9n-sgRNA-GT-2载体,HypaCas9n-sgRNA-GT-1载体和HypaCas9n-sgRNA-GT-2载体的水稻阳性T0苗的基因组DNA作为模板,对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于ALS-T2靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于ALS-T3靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于CDC48-T1靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物;对于CDC48-T2靶点,采用引物对T10进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数,计算得出C·T碱基替换效率,结果见图8。
结果表明:在T0苗中,与HypaCas9n&PmCDA1&UGI介导的非细胞富集技术HypaCas9n-sgRNA-GT相比,HypaCas9n&PmCDA1&UGI介导的细胞富集技术对所测的7个靶点均有不同程度的增效。ALS-T1的碱基替换效率由20%增加到50%,ALS-T2的碱基替换效率由5%增加到18.2%,ALS-T3的碱基替换效率由5%增加到11.8%,Waxy的碱基替换效率由15.8%增加到18.2%,NRT1.1B-T1的碱基替换效率由55%增加到81.8%,CDC48-T1的碱基替换效率由15%增加到33%,CDC48-T2的碱基替换效率由0增加到5.9%。
实施例4、rAPOBEC1&Cas9n&UGI介导的细胞富集技术载体及其在水稻T0苗基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体为rAPOBEC1&Cas9n&UGI(rCBE)介导的C·T碱基替换的非细胞富集技术载体(命名为r-sgRNA-GT)及rAPOBEC1&Cas9n&UGI(rCBE)介导的C·T碱基替换的细胞富集技术载体(命名为sgRNA-ATG-Hyg-ATG/r-sgRNA-GT)。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图9所示。rAPOBEC1&Cas9n&UGI介导的细胞富集技术工作原理与Cas9n&PmCDA1&UGI介导的细胞富集技术相同。
人工合成如下重组表达载体:sgRNA-ATG-Hyg-ATG/r-sgRNA-GT重组表达载体、r-sgRNA-GT重组表达载体。两种重组载体的具体结构描述分别如下:
sgRNA-ATG-Hyg-ATG/r-sgRNA-GT重组表达载体的序列为将序列1第3529-8712位替换为序列9(rAPOBEC1融合SpCas9n序列),且将序列1第11305-11328位替换为序列10(rAPOBEC1代理靶点序列),且将序列1的第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列:ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2、rAPOBEC1-sug,且将序列1第1339-1511位所示的第六个靶点序列及其tRNA的核苷酸序列和sgRNA的核苷酸序列均删除,且保持其他序列不变后得到的序列。对应的靶点序列见表3。
r-sgRNA-GT重组表达载体的核苷酸序列为将序列1第3529-8712位替换为序列9(rAPOBEC1融合SpCas9n序列),且将序列1的第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列,且将序列1的第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列:ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2、rAPOBEC1-sug,且将序列1第1339-1511位所示的第六个靶点序列及其tRNA的核苷酸序列和sgRNA的核苷酸序列均删除,且保持其他序列不变后得到的序列。对应的靶点序列见表3。
各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表3所示。
表3
二、水稻阳性T0苗的获得
1、将步骤一获得的sgRNA-ATG-Hyg-ATG/r-sgRNA-GT载体和r-sgRNA-GT载体分别按照实施例2中步骤二的1-7进行操作,得到水稻抗性愈伤。
2、取步骤1得到的水稻抗性愈伤按照实施例2中步骤2-3进行操作,得到水稻阳性T0苗及对应的基因组DNA。
三、结果分析
1、分别取步骤二所获得的sgRNA-ATG-Hyg-ATG/r-sgRNA-GT载体和r-sgRNA-GT载体的水稻阳性T0苗的基因组DNA作为模板,对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于Waxy-T2靶点,采用引物对T11进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数,计算得出C·T碱基替换效率,结果见图10。
结果表明:在T0苗中,与非细胞富集技术r-sgRNA-GT相比,rAPOBEC1&Cas9n&UGI介导的细胞富集技术sgRNA-ATG-Hyg-ATG/r-sgRNA-GT对所测的4个靶点(ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2)均有不同程度的增效。Waxy靶点的替换效率由0增加到20%,NRT1.1B-T1靶点的替换效率由5%增加到30%,ALS-T1靶点的替换效率由9.1%增加到33.3%,Waxy-T2靶点的替换效率由6.7%增加到45%。
实施例5、优化的Cas9n&PmCDA1&UGI介导的细胞富集技术在水稻基因组编辑中的应用
为了提高Cas9n&PmCDA1&UGI介导的C·T碱基替换效率,对Cas9n&PmCDA1&UGI介导的细胞富集技术进行优化:将优化的esgRNA应用到Cas9n&PmCDA1&UGI介导的细胞富集技术中,使用优化的esgRNA编辑基因组内源靶点序列,使用sgRNA编辑报告基因的代理靶点序列,并将这个技术命名为差异代理技术,将差异代理技术载体命名为差异代理系统DisSUGs(Discriminated sgRNAs based SurroGate system)。差异代理系统DisSUGs的结构示意图见图11。
一、重组表达载体的构建
人工合成如下重组表达载体:DisSUGs-1重组表达载体、DisSUGs-2重组表达载体。两种重组表达载体均为环状质粒,具体结构描述分别如下:
DisSUGs-1重组表达载体的序列为将序列1第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位的sgRNA核苷酸序列分别替换为序列11(esgRNA核苷酸序列),且保持其他序列不变后得到的序列。
DisSUGs-2重组表达载体的序列为将DisSUGs-1重组表达载体中第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列:ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1,且保持其他序列不变后得到的序列。对应的靶序列信息见表1。
各载体的esgRNA或sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。
二、水稻阳性T0苗的获得
1、将步骤一获得的DisSUGs-1载体和DisSUGs-2载体分别按照实施例2中步骤二的1-7进行操作,得到水稻抗性愈伤。
2、取步骤1得到的水稻抗性愈伤按照实施例2中步骤2-3进行操作,得到水稻阳性T0苗及对应的基因组DNA。
三、水稻T0苗中靶点的编辑情况
1、分别取步骤二所获得的DisSUGs-1重组表达载体,DisSUGs-1重组表达载体的水稻阳性T0苗的基因组DNA作为模板,对于ALS-T1靶点,采用引物对T1进行PCR扩增,得到PCR扩增产物;对于ALS-T2靶点,采用引物对T2进行PCR扩增,得到PCR扩增产物;对于ALS-T3靶点,采用引物对T3进行PCR扩增,得到PCR扩增产物;对于DEP1靶点,采用引物对T4进行PCR扩增,得到PCR扩增产物;对于Waxy靶点,采用引物对T5进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T1靶点,采用引物对T6进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T2靶点,采用引物对T7进行PCR扩增,得到PCR扩增产物;对于NRT1.1B-T3靶点,采用引物对T8进行PCR扩增,得到PCR扩增产物;对于CDC48-T1靶点,采用引物对T9进行PCR扩增,得到PCR扩增产物;对于CDC48-T2靶点,采用引物对T10进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数,计算得出C·T碱基替换效率,结果见图12。
结果表明:与Cas9n&PmCDA1&UGI介导的细胞富集技术sgRNA-ATG-Hyg-ATG/sgRNA-GT相比,在差异代理技术中,测试的10个靶点中有9个靶点的T0苗的C替换为T的概率均升高。具体表现为:ALS-T1的替换效率由66.7%增加到78.6%,ALS-T2的替换效率不变,ALS-T3的替换效率由47.8%增加到76.9%,DEP1的替换效率由58.6%增加到76.9%,Waxy的替换效率由13.3%增加到30%,NRT1.1B-T1的替换效率由58.6%增加到73.3%,NRT1.1B-T2的替换效率由60%增加到76.9%,NRT1.1B-T3的替换效率由36.7%增加到42.3%,CDC48-T1的替换效率由56.7%增加到80.8%,CDC48-T2的替换效率由33.3%增加到65.4%。结果表明差异代理技术比Cas9n&PmCDA1&UGI介导的细胞富集技术sgRNA-ATG-Hyg-ATG/sgRNA-GT细胞富集效率更高。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110>北京市农林科学院
<120>差异代理技术在C·T碱基替换细胞富集中的应用
<160>12
<170>PatentIn version 3.5
<210>1
<211>19029
<212>DNA
<213>人工序列(Artificial Sequence)
<400>1
ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60
ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120
ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180
tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240
gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300
aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360
ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420
acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540
ggctggtgca cgcgtccatg gagatccacc gttttagagc tagaaatagc aagttaaaat 600
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 660
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 720
gcagaccagc cagcgtctgg cgcgttttag agctagaaat agcaagttaa aataaggcta 780
gtccgttatc aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag 840
tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcacggc 900
gacggcgagc aagtgggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 960
atcaacttga aaaagtggca ccgagtcggt gcaacaaagc accagtggtc tagtggtaga 1020
atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcat tgtaatcaac 1080
tccagtgtcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1140
tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg gtctagtggt agaatagtac 1200
cctgccacgg tacagacccg ggttcgattc ccggctggtg cagaacaacc aacatttggg 1260
tagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1320
gtggcaccga gtcggtgcaa caaagcacca gtggtctagt ggtagaatag taccctgcca 1380
cggtacagac ccgggttcga ttcccggctg gtgcagcaac gagtggtgtg gtgccgtttt 1440
agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 1500
cgagtcggtg cttttttttt tcgttttgca ttgagttttc tccgtcgcat gtttgcagtt 1560
ttattttccg ttttgcattg aaatttctcc gtctcatgtt tgcagcgtgt tcaaaaagta 1620
cgcagctgta tttcacttat ttacggcgcc acattttcat gccgtttgtg ccaactatcc 1680
cgagctagtg aatacagctt ggcttcacac aacactggtg acccgctgac ctgctcgtac 1740
ctcgtaccgt cgtacggcac agcatttgga attaaagggt gtgatcgata ctgcttgctg 1800
ctaagcttac aaattcgggt caaggcggaa gccagcgcgc caccccacgt cagcaaatac 1860
ggaggcgcgg ggttgacggc gtcacccggt cctaacggcg accaacaaac cagccagaag 1920
aaattacagt aaaaaaaaag taaattgcac tttgatccac cttttattac ctaagtctca 1980
atttggatca cccttaaacc tatcttttca atttgggccg ggttgtggtt tggactacca 2040
tgaacaactt ttcgtcatgt ctaacttccc tttcagcaaa catatgaacc atatatagag 2100
gagatcggcc gtatactaga gctgatgtgt ttaaggtcgt tgattgcacg agaaaaaaaa 2160
atccaaatcg caacaatagc aaatttatct ggttcaaagt gaaaagatat gtttaaaggt 2220
agtccaaagt aaaacttata gataataaaa tgtggtccaa agcgtaattc actcaaaaaa 2280
aatcaacgag acgtgtacca aacggagaca aacggcatct tctcgaaatt tcccaaccgc 2340
tcgctcgccc gcctcgtctt cccggaaacc gcggtggttt cagcgtggcg gattctccaa 2400
gcagacggag acgtcacggc acgggactcc tcccaccacc caaccgccat aaataccagc 2460
cccctcatct cctctcctcg catcagctcc acccccgaaa aatttctccc caatctcgcg 2520
aggctctcgt cgtcgaatcg aatcctctcg cgtcctcaag gtacgctgct tctcctctcc 2580
tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt ttgttgctag atccgattgg 2640
tggttagggt tgtcgatgtg attatcgtga gatgtttagg ggttgtagat ctgatggttg 2700
tgatttgggc acggttggtt cgataggtgg aatcgtggtt aggttttggg attggatgtt 2760
ggttctgatg attgggggga atttttacgg ttagatgaat tgttggatga ttcgattggg 2820
gaaatcggtg tagatctgtt ggggaattgt ggaactagtc atgcctgagt gattggtgcg 2880
atttgtagcg tgttccatct tgtaggcctt gttgcgagca tgttcagatc tactgttccg 2940
ctcttgattg agttattggt gccatgggtt ggtgcaaaca caggctttaa tatgttatat 3000
ctgttttgtg tttgatgtag atctgtaggg tagttcttct tagacatggt tcaattatgt 3060
agcttgtgcg tttcgatttg atttcatatg ttcacagatt agataatgat gaactctttt 3120
aattaattgt caatggtaaa taggaagtct tgtcgctata tctgtcataa tgatctcatg 3180
ttactatctg ccagtaattt atgctaagaa ctatattaga atatcatgtt acaatctgta 3240
gtaatatcat gttacaatct gtagttcatc tatataatct attgtggtaa tttcttttta 3300
ctatctgtgt gaagattatt gccactagtt cattctactt atttctgaag ttcaggatac 3360
gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc ctgttactat ctttttgaat 3420
acatgtatgt tctgttggaa tatgtttgct gtttgatccg ttgttgtgtc cttaatcttg 3480
tgctagttct taccctatct gtttggtgat tatttcttgc agtacgtaat ggactacaag 3540
gaccacgacg gggattacaa agaccacgac atagactaca aggatgacga tgacaaaatg 3600
gcaccgaaga aaaaaaggaa ggtcggaatc catggcgttc cagctgccga taagaaatat 3660
tccatcggac tcgccattgg cacgaatagc gtcggatggg ctgttattac tgatgagtac 3720
aaagttccgt ctaagaagtt caaggtgctg ggcaacacag accgccacag cataaagaaa 3780
aatctcatcg gtgcactcct tttcgatagt ggggagactg cagaagcgac aagattgaaa 3840
aggactgcga gaaggcgcta tacacggcgt aagaatagaa tctgctacct tcaggagatt 3900
ttctctaacg aaatggctaa ggtcgatgac agtttctttc atagacttga ggaatcgttc 3960
ttggttgagg aggataagaa acatgagagg cacccgatat ttggaaacat cgtggatgag 4020
gtcgcatatc atgaaaagta ccccacaatc taccacctga gaaagaaact cgttgattcc 4080
accgacaaag cggatttgag actcatctac ctcgctcttg cccatatgat aaagttccgc 4140
ggacactttc tgatcgaggg cgacctcaac cctgataata gcgacgtcga taagctcttc 4200
atccagttgg ttcaaaccta caatcagctc tttgaggaaa acccaattaa tgctagtgga 4260
gtggatgcaa aagcgatact gtcggccaga ctctccaaga gcagaaggtt ggagaacctg 4320
atcgctcaac ttcctggaga aaagaaaaac ggtctttttg ggaatttgat tgccttgtct 4380
ctgggcctca caccaaactt caagtcaaat tttgacctcg ctgaggatgc caaacttcag 4440
ttgtctaagg atacctatga tgacgatctt gacaatttgc tggcacaaat tggcgaccag 4500
tacgcggatc tgttcctcgc agcgaagaat ctgagtgatg ctattctcct ttcggacata 4560
ctcagggtta acactgagat cacaaaagca cctttgagtg cgtcgatgat taagcgctat 4620
gatgaacatc accaagacct cactttgctg aaggcccttg tgcggcagca attgccagag 4680
aagtacaaag aaatcttctt tgaccaatct aagaacggat acgctggcta tattgatgga 4740
ggagcttctc aggaggaatt ctataagttt atcaaaccta tacttgagaa gatggatggt 4800
acagaggaac tccttgttaa attgaacaga gaagatttgc tgcgcaagca acggaccttt 4860
gacaacggat caattccgca tcagatacac ctcggcgagc ttcatgccat ccttcgccgg 4920
caggaagatt tctacccctt tttgaaggac aaccgcgaga agatagaaaa aatccttacg 4980
ttccggattc cttactatgt gggtccattg gcaaggggga attcccgctt tgcgtggatg 5040
actcggaaaa gcgaggaaac tatcacaccg tggaacttcg aggaagttgt ggacaaggga 5100
gcttctgccc aatcattcat tgagaggatg actaacttcg ataagaacct gccgaacgag 5160
aaagttctcc ccaagcactc cctcctttac gagtatttca ccgtgtataa cgaacttacg 5220
aaggttaaat acgtgactga gggtatgagg aagccagcat tcttgagcgg ggaacaaaag 5280
aaagcgattg ttgatttgct gtttaaaact aatcgcaagg tgacagtcaa gcagctcaaa 5340
gaggattatt tcaagaaaat tgaatgtttc gactctgtgg agatatcagg agtcgaagat 5400
aggtttaacg cttcccttgg cacataccat gacctcctta agatcattaa ggacaaagat 5460
ttcctggata acgaggaaaa tgaggacatc ctcgaagata ttgttcttac cttgacgctg 5520
tttgaggatc gcgaaatgat cgaggaacgg cttaagacgt atgctcactt gttcgacgat 5580
aaggttatga agcagctcaa gcgtagaagg tacactggat ggggccgtct gtctagaaag 5640
ctcatcaacg gaatacgtga taaacaaagt ggcaagacaa ttttggattt tctgaagtcg 5700
gacggattcg ccaacagaaa ttttatgcag ctgattcatg acgatagtct caccttcaaa 5760
gaggacatac agaaggctca agtgagtggt caaggggatt cgctgcatga acacatcgca 5820
aacctcgcgg gttcaccggc cataaagaaa ggaatccttc aaactgttaa ggtcgttgat 5880
gagttggtta aagtgatggg taggcacaag cccgaaaaca tagtgatcga gatggctcgc 5940
gaaaatcaga ctacacaaaa agggcagaag aactctcgcg agcggatgaa aaggattgag 6000
gaaggaatca aggaactggg ctcacagatt ctcaaagagc atccagtcga aaacacacag 6060
ctgcaaaatg agaagctcta tctttactat ctccaaaatg gccgggacat gtatgttgat 6120
caggagcttg acatcaaccg tttgtccgac tatgatgtgg accacattgt cccgcaatct 6180
ttccttaagg acgattcaat cgataataag gtgttgaccc ggagcgataa aaaccgtgga 6240
aagtctgaca atgtcccttc agaggaagtg gttaagaaga tgaagaacta ctggagacaa 6300
ttgctgaatg caaaactgat cacacagaga aagttcgaca acctcaccaa agcagagaga 6360
ggtgggctca gtgaacttga taaagcgggc ttcattaagc gtcagctcgt tgagactaga 6420
cagatcacga agcatgtcgc gcagattttg gattcgcgga tgaacacgaa gtacgacgag 6480
aatgataaac tgatacgtga agtcaaggtt atcactctta agtccaaatt ggtgagcgat 6540
ttcagaaagg acttccaatt ctataaggtc agggagatca acaattatca tcacgctcac 6600
gatgcctacc ttaatgctgt tgtggggacc gcccttatta agaaataccc taaattggag 6660
tctgaattcg tttacgggga ttataaggtc tacgacgtta ggaaaatgat agctaagagt 6720
gagcaggaga tcggtaaagc aactgcgaag tatttctttt actcgaacat catgaatttc 6780
tttaagaccg agataacgct ggcaaatggc gaaattagaa agaggcctct catagagact 6840
aacggtgaga caggggaaat cgtctgggat aagggtaggg actttgcgac agtgcgcaag 6900
gtcctctcta tgccgcaagt taatattgtg aagaaaaccg aggtgcagac gggaggcttc 6960
tccaaggaaa gcatacttcc caaacggaac tctgataagt tgatcgctcg taagaaagat 7020
tgggacccta agaaatatgg tgggttcgat tccccaactg ttgcttacag cgtgctggtc 7080
gttgccaagg tcgagaaggg taaatccaag aaactcaaaa gcgttaagga actccttggg 7140
attactatca tggagagatc ttcattcgaa aagaatccta tcgactttct tgaggccaaa 7200
ggatataagg aagttaagaa agatctgata atcaaactcc caaagtactc attgtttgag 7260
ctggaaaacg gcaggaagcg catgcttgct tccgccggag agttgcagaa agggaacgag 7320
ttggctctgc cttctaagta tgttaacttc ctctatcttg cctctcatta cgagaagctc 7380
aaaggctcac cagaggacaa cgaacagaaa caactttttg tcgagcaaca taagcactat 7440
ttggatgaga ttatagaaca gatcagtgaa ttctcgaaaa gggttatcct tgcagatgcg 7500
aatcttgaca aggtgttgtc tgcatacaac aaacatagag ataagccgat cagggagcaa 7560
gcggaaaata tcattcacct cttcactctt acaaacttgg gtgctcccgc tgccttcaag 7620
tattttgata ccacgattga ccggaaacgt tacacctcaa cgaaggaggt gctggatgcc 7680
accctcatcc accaatctat taccggactc tacgagacta gaatcgatct ctcacagctc 7740
ggcggggata aaagaccagc agcgacgaaa aaggcaggac aggctaagaa gaagaaagag 7800
ctcggaggag gaggcacggg aggaggaggc tccgccgagt atgtgcgcgc gctcttcgac 7860
ttcaacggca atgacgagga ggatctccct ttcaagaagg gcgacatcct ccgcatccgc 7920
gataagccgg aggagcagtg gtggaacgca gaggactccg agggcaagcg gggcatgatc 7980
ctggtgccat acgtcgagaa gtacagcggc gattacaagg accacgatgg cgactacaag 8040
gatcatgaca tcgattacaa ggacgatgac gataagtccg gcgtcgacat gacggacgcg 8100
gagtatgtgc gcatccacga gaagctcgat atctacacct tcaagaagca gttcttcaac 8160
aataagaagt cggtgtccca tcggtgctac gtcctcttcg agctgaagcg caggggagag 8220
cgccgcgcct gcttctgggg ctacgcggtg aataagccgc agtcaggcac agagcgcggc 8280
atccacgccg agatcttctc gatccggaag gtcgaggagt acctccgcga caacccaggc 8340
cagttcacga tcaattggta ctccagctgg tccccttgcg cagattgcgc agagaagatc 8400
ctcgagtggt acaaccagga gctgaggggc aatggccata ccctcaagat ctgggcctgc 8460
aagctgtact acgagaagaa cgcgaggaat cagatcggcc tctggaacct gcgggataat 8520
ggcgtgggcc tcaacgtgat ggtgtccgag cactaccagt gctgccgcaa gatcttcatc 8580
cagtcctccc acaatcagct gaacgagaat aggtggctcg aaaagaccct gaagcgcgcc 8640
gagaagtgga ggagcgagct gtctatcatg atccaggtca agatcctgca caccacaaag 8700
tcaccggcgg tgggcggcgg cggcagcgaa ttctccggcg gcagcacgaa cctcagcgac 8760
atcatcgaga aggagacagg caagcagctc gtgatccagg agtctatcct catgctgcct 8820
gaggaggtgg aggaggtcat cggcaacaag ccggagtccg atatcctcgt gcacaccgcc 8880
tacgacgagt cgacagatga gaatgtcatg ctcctgacct ccgacgcacc agagtacaag 8940
ccatgggcgc tcgtgatcca ggattccaac ggcgagaata agatcaagat gctgtctggc 9000
ggctccccga agaagaagcg caaggtctag actagtctga aatcaccagt ctctctctac 9060
aaatctatct ctctctataa taatgtgtga gtagttccca gataagggaa ttagggttct 9120
tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 9180
aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg gggcgcccga 9240
cctgtactcg cgaaggttaa cttacagaga gtgtccgggc gcgcctggtg gatcgtccgc 9300
ctaggctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat 9360
gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 9420
atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 9480
aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 9540
attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 9600
tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 9660
ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 9720
attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 9780
agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 9840
aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 9900
gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 9960
gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 10020
gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 10080
ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 10140
ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 10200
cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa 10260
atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 10320
ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 10380
catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat 10440
gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 10500
cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 10560
tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 10620
gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 10680
cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat 10740
ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc 10800
gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt 10860
ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg 10920
gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 10980
gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 11040
tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 11100
tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 11160
gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 11220
gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 11280
ttggtgttac ttctgcagga gctcgcaacg agtggtgtgg tgcctggcaa aaagcctgaa 11340
ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg 11400
atgcagctct cggagggcga agaatctcgt gctttcagct tcgatgtagg agggcgtgga 11460
tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg 11520
cactttgcat cggccgcgct cccgattccg gaagtgcttg acattgggga gtttagcgag 11580
agcctgacct attgcatctc ccgccgttca cagggtgtca cgttgcaaga cctgcctgaa 11640
accgaactgc ccgctgttct acaaccggtc gcggaggcta tggatgcgat cgctgcggcc 11700
gatcttagcc agacgagcgg gttcggccca ttcggaccgc aaggaatcgg tcaatacact 11760
acatggcgtg atttcatatg cgcgattgct gatccccatg tgtatcactg gcaaactgtg 11820
atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg atgagctgat gctttgggcc 11880
gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt tcggctccaa caatgtcctg 11940
acggacaatg gccgcataac agcggtcatt gactggagcg aggcgatgtt cggggattcc 12000
caatacgagg tcgccaacat cttcttctgg aggccgtggt tggcttgtat ggagcagcag 12060
acgcgctact tcgagcggag gcatccggag cttgcaggat cgccacgact ccgggcgtat 12120
atgctccgca ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat 12180
gcagcttggg cgcagggtcg atgcgacgca atcgtccgat ccggagccgg gactgtcggg 12240
cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg atggctgtgt agaagtactc 12300
gccgatagtg gaaaccgacg ccccagcact cgtccgaggg caaagaaata gggccagtta 12360
ggccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct 12420
tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta 12480
atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta 12540
atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc 12600
atctatgtta ctagatctgt agccctgcag gacgcgttta attaagtgca cgcggccgcc 12660
tacttagtca agagcctcgc acgcgactgt cacgcggcca ggatcgcctc gtgagcctcg 12720
caatctgtac ctagtgttta aactatcagt gtttgacagg atatattggc gggtaaacct 12780
aagagaaaag agcgtttatt agaataacgg atatttaaaa gggcgtgaaa aggtttatcc 12840
gttcgtccat ttgtatgtgc atgccaacca cagggttccc ctcgggatca aagtactttg 12900
atccaacccc tccgctgcta tagtgcagtc ggcttctgac gttcagtgca gccgtcttct 12960
gaaaacgaca tgtcgcacaa gtcctaagtt acgcgacagg ctgccgccct gcccttttcc 13020
tggcgttttc ttgtcgcgtg ttttagtcgc ataaagtaga atacttgcga ctagaaccgg 13080
agacattacg ccatgaacaa gagcgccgcc gctggcctgc tgggctatgc ccgcgtcagc 13140
accgacgacc aggacttgac caaccaacgg gccgaactgc acgcggccgg ctgcaccaag 13200
ctgttttccg agaagatcac cggcaccagg cgcgaccgcc cggagctggc caggatgctt 13260
gaccacctac gccctggcga cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc 13320
acccgcgacc tactggacat tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc 13380
ctggcagagc cgtgggccga caccaccacg ccggccggcc gcatggtgtt gaccgtgttc 13440
gccggcattg ccgagttcga gcgttcccta atcatcgacc gcacccggag cgggcgcgag 13500
gccgccaagg cccgaggcgt gaagtttggc ccccgcccta ccctcacccc ggcacagatc 13560
gcgcacgccc gcgagctgat cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg 13620
cttggcgtgc atcgctcgac cctgtaccgc gcacttgagc gcagcgagga agtgacgccc 13680
accgaggcca ggcggcgcgg tgccttccgt gaggacgcat tgaccgaggc cgacgccctg 13740
gcggccgccg agaatgaacg ccaagaggaa caagcatgaa accgcaccag gacggccagg 13800
acgaaccgtt tttcattacc gaagagatcg aggcggagat gatcgcggcc gggtacgtgt 13860
tcgagccgcc cgcgcacgtc tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg 13920
atgccaagct ggcggcctgg ccggccagct tggccgctga agaaaccgag cgccgccgtc 13980
taaaaaggtg atgtgtattt gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga 14040
tgcgatgagt aaataaacaa atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa 14100
ccagaaaggc gggtcaggca agacgaccat cgcaacccat ctagcccgcg ccctgcaact 14160
cgccggggcc gatgttctgt tagtcgattc cgatccccag ggcagtgccc gcgattgggc 14220
ggccgtgcgg gaagatcaac cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg 14280
cgacgtgaag gccatcggcc ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc 14340
ggacttggct gtgtccgcga tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag 14400
cccttacgac atatgggcca ccgccgacct ggtggagctg gttaagcagc gcattgaggt 14460
cacggatgga aggctacaag cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat 14520
cggcggtgag gttgccgagg cgctggccgg gtacgagctg cccattcttg agtcccgtat 14580
cacgcagcgc gtgagctacc caggcactgc cgccgccggc acaaccgttc ttgaatcaga 14640
acccgagggc gacgctgccc gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact 14700
catttgagtt aatgaggtaa agagaaaatg agcaaaagca caaacacgct aagtgccggc 14760
cgtccgagcg cacgcagcag caaggctgca acgttggcca gcctggcaga cacgccagcc 14820
atgaagcggg tcaactttca gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg 14880
gtacgccaag gcaagaccat taccgagctg ctatctgaat acatcgcgca gctaccagag 14940
taaatgagca aatgaataaa tgagtagatg aattttagcg gctaaaggag gcggcatgga 15000
aaatcaagaa caaccaggca ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg 15060
ttggccaggc gtaagcggct gggttgtctg ccggccctgc aatggcactg gaacccccaa 15120
gcccgaggaa tcggcgtgac ggtcgcaaac catccggccc ggtacaaatc ggcgcggcgc 15180
tgggtgatga cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg caacgcatcg 15240
aggcagaagc acgccccggt gaatcgtggc aagcggccgc tgatcgaatc cgcaaagaat 15300
cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag ggcgacgagc 15360
aaccagattt tttcgttccg atgctctatg acgtgggcac ccgcgatagt cgcagcatca 15420
tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag gtgatccgct 15480
acgagcttcc agacgggcac gtagaggttt ccgcagggcc ggccggcatg gccagtgtgt 15540
gggattacga cctggtactg atggcggttt cccatctaac cgaatccatg aaccgatacc 15600
gggaagggaa gggagacaag cccggccgcg tgttccgtcc acacgttgcg gacgtactca 15660
agttctgccg gcgagccgat ggcggaaagc agaaagacga cctggtagaa acctgcattc 15720
ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac ggccgcctgg 15780
tgacggtatc cgagggtgaa gccttgatta gccgctacaa gatcgtaaag agcgaaaccg 15840
ggcggccgga gtacatcgag atcgagctag ctgattggat gtaccgcgag atcacagaag 15900
gcaagaaccc ggacgtgctg acggttcacc ccgattactt tttgatcgat cccggcatcg 15960
gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc agatggttgt 16020
tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc tgtttcaccg 16080
tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag gaggcggggc 16140
aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa gcatccgccg 16200
gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa aaaggtcgaa 16260
aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac attgggaacc 16320
ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac atgtaagtga 16380
ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa cttattaaaa 16440
ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc gaagagctgc 16500
aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg cgtcggccta 16560
tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta ccagggcgcg 16620
gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc ctgcctcgcg 16680
cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct 16740
tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc 16800
gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta 16860
actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc 16920
acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact 16980
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 17040
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 17100
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 17160
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 17220
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 17280
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 17340
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 17400
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 17460
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 17520
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 17580
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 17640
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 17700
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 17760
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gcattctagg tactaaaaca 17820
attcatccag taaaatataa tattttattt tctcccaatc aggcttgatc cccagtaagt 17880
caaaaaatag ctcgacatac tgttcttccc cgatatcctc cctgatcgac cggacgcaga 17940
aggcaatgtc ataccacttg tccgccctgc cgcttctccc aagatcaata aagccactta 18000
ctttgccatc tttcacaaag atgttgctgt ctcccaggtc gccgtgggaa aagacaagtt 18060
cctcttcggg cttttccgtc tttaaaaaat catacagctc gcgcggatct ttaaatggag 18120
tgtcttcttc ccagttttcg caatccacat cggccagatc gttattcagt aagtaatcca 18180
attcggctaa gcggctgtct aagctattcg tatagggaca atccgatatg tcgatggagt 18240
gaaagagcct gatgcactcc gcatacagct cgataatctt ttcagggctt tgttcatctt 18300
catactcttc cgagcaaagg acgccatcgg cctcactcat gagcagattg ctccagccat 18360
catgccgttc aaagtgcagg acctttggaa caggcagctt tccttccagc catagcatca 18420
tgtccttttc ccgttccaca tcataggtgg tccctttata ccggctgtcc gtcattttta 18480
aatataggtt ttcattttct cccaccagct tatatacctt agcaggagac attccttccg 18540
tatcttttac gcagcggtat ttttcgatca gttttttcaa ttccggtgat attctcattt 18600
tagccattta ttatttcctt cctcttttct acagtattta aagatacccc aagaagctaa 18660
ttataacaag acgaactcca attcactgtt ccttgcattc taaaacctta aataccagaa 18720
aacagctttt tcaaagttgt tttcaaagtt ggcgtataac atagtatcga cggagccgat 18780
tttgaaaccg cggtgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac 18840
cctccgcgag atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc 18900
atcggtaaca tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg 18960
actgatgggc tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt 19020
tggctggct 19029
<210>2
<211>1423
<212>PRT
<213>人工序列(Artificial Sequence)
<400>2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210>3
<211>208
<212>PRT
<213>人工序列(Artificial Sequence)
<400>3
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210>4
<211>98
<212>PRT
<213>人工序列(Artificial Sequence)
<400>4
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1 5 10 15
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
20 25 30
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
35 40 45
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
50 55 60
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
65 70 75 80
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
85 90 95
Lys Val
<210>5
<211>1026
<212>DNA
<213>人工序列(Artificial Sequence)
<400>5
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780
cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
aaatag 1026
<210>6
<211>4269
<212>DNA
<213>人工序列(Artificial Sequence)
<400>6
atggactaca aggaccacga cggggattac aaagaccacg acatagacta caaggatgac 60
gatgacaaaa tggcaccgaa gaaaaaaagg aaggtcggaa tccatggcgt tccagctgcc 120
gataagaaat attccatcgg actcgccatt ggcacgaata gcgtcggatg ggctgttatt 180
actgatgagt acaaagttcc gtctaagaag ttcaaggtgc tgggcaacac agaccgccac 240
agcataaaga aaaatctcat cggtgcactc cttttcgata gtggggagac tgcagaagcg 300
acaagattga aaaggactgc gagaaggcgc tatacacggc gtaagaatag aatctgctac 360
cttcaggaga ttttctctaa cgaaatggct aaggtcgatg acagtttctt tcatagactt 420
gaggaatcgt tcttggttga ggaggataag aaacatgaga ggcacccgat atttggaaac 480
atcgtggatg aggtcgcata tcatgaaaag taccccacaa tctaccacct gagaaagaaa 540
ctcgttgatt ccaccgacaa agcggatttg agactcatct acctcgctct tgcccatatg 600
ataaagttcc gcggacactt tctgatcgag ggcgacctca accctgataa tagcgacgtc 660
gataagctct tcatccagtt ggttcaaacc tacaatcagc tctttgagga aaacccaatt 720
aatgctagtg gagtggatgc aaaagcgata ctgtcggcca gactctccaa gagcagaagg 780
ttggagaacc tgatcgctca acttcctgga gaaaagaaaa acggtctttt tgggaatttg 840
attgccttgt ctctgggcct cacaccaaac ttcaagtcaa attttgacct cgctgaggat 900
gccaaacttc agttgtctaa ggatacctat gatgacgatc ttgacaattt gctggcacaa 960
attggcgacc agtacgcgga tctgttcctc gcagcgaaga atctgagtga tgctattctc 1020
ctttcggaca tactcagggt taacactgag atcacaaaag cacctttgag tgcgtcgatg 1080
attaagcgct atgatgaaca tcaccaagac ctcactttgc tgaaggccct tgtgcggcag 1140
caattgccag agaagtacaa agaaatcttc tttgaccaat ctaagaacgg atacgctggc 1200
tatattgatg gaggagcttc tcaggaggaa ttctataagt ttatcaaacc tatacttgag 1260
aagatggatg gtacagagga actccttgtt aaattgaaca gagaagattt gctgcgcaag 1320
caacggacct ttgacaacgg atcaattccg catcagatac acctcggcga gcttcatgcc 1380
atccttcgcc ggcaggaaga tttctacccc tttttgaagg acaaccgcga gaagatagaa 1440
aaaatcctta cgttccggat tccttactat gtgggtccat tggcaagggg gaattcccgc 1500
tttgcgtgga tgactcggaa aagcgaggaa actatcacac cgtggaactt cgaggaagtt 1560
gtggacaagg gagcttctgc ccaatcattc attgagagga tgactaactt cgataagaac 1620
ctgccgaacg agaaagttct ccccaagcac tccctccttt acgagtattt caccgtgtat 1680
aacgaactta cgaaggttaa atacgtgact gagggtatga ggaagccagc attcttgagc 1740
ggggaacaaa agaaagcgat tgttgatttg ctgtttaaaa ctaatcgcaa ggtgacagtc 1800
aagcagctca aagaggatta tttcaagaaa attgaatgtt tcgactctgt ggagatatca 1860
ggagtcgaag ataggtttaa cgcttccctt ggcacatacc atgacctcct taagatcatt 1920
aaggacaaag atttcctgga taacgaggaa aatgaggaca tcctcgaaga tattgttctt 1980
accttgacgc tgtttgagga tcgcgaaatg atcgaggaac ggcttaagac gtatgctcac 2040
ttgttcgacg ataaggttat gaagcagctc aagcgtagaa ggtacactgg atggggccgt 2100
ctgtctagaa agctcatcaa cggaatacgt gataaacaaa gtggcaagac aattttggat 2160
tttctgaagt cggacggatt cgccaacaga gcttttgcgg cactgattgc tgacgatagt 2220
ctcaccttca aagaggacat acagaaggct caagtgagtg gtcaagggga ttcgctgcat 2280
gaacacatcg caaacctcgc gggttcaccg gccataaaga aaggaatcct tcaaactgtt 2340
aaggtcgttg atgagttggt taaagtgatg ggtaggcaca agcccgaaaa catagtgatc 2400
gagatggctc gcgaaaatca gactacacaa aaagggcaga agaactctcg cgagcggatg 2460
aaaaggattg aggaaggaat caaggaactg ggctcacaga ttctcaaaga gcatccagtc 2520
gaaaacacac agctgcaaaa tgagaagctc tatctttact atctccaaaa tggccgggac 2580
atgtatgttg atcaggagct tgacatcaac cgtttgtccg actatgatgt ggaccacatt 2640
gtcccgcaat ctttccttaa ggacgattca atcgataata aggtgttgac ccggagcgat 2700
aaaaaccgtg gaaagtctga caatgtccct tcagaggaag tggttaagaa gatgaagaac 2760
tactggagac aattgctgaa tgcaaaactg atcacacaga gaaagttcga caacctcacc 2820
aaagcagaga gaggtgggct cagtgaactt gataaagcgg gcttcattaa gcgtcagctc 2880
gttgagacta gacagatcac gaagcatgtc gcgcagattt tggattcgcg gatgaacacg 2940
aagtacgacg agaatgataa actgatacgt gaagtcaagg ttatcactct taagtccaaa 3000
ttggtgagcg atttcagaaa ggacttccaa ttctataagg tcagggagat caacaattat 3060
catcacgctc acgatgccta ccttaatgct gttgtgggga ccgcccttat taagaaatac 3120
cctaaattgg agtctgaatt cgtttacggg gattataagg tctacgacgt taggaaaatg 3180
atagctaaga gtgagcagga gatcggtaaa gcaactgcga agtatttctt ttactcgaac 3240
atcatgaatt tctttaagac cgagataacg ctggcaaatg gcgaaattag aaagaggcct 3300
ctcatagaga ctaacggtga gacaggggaa atcgtctggg ataagggtag ggactttgcg 3360
acagtgcgca aggtcctctc tatgccgcaa gttaatattg tgaagaaaac cgaggtgcag 3420
acgggaggct tctccaagga aagcatactt cccaaacgga actctgataa gttgatcgct 3480
cgtaagaaag attgggaccc taagaaatat ggtgggttcg attccccaac tgttgcttac 3540
agcgtgctgg tcgttgccaa ggtcgagaag ggtaaatcca agaaactcaa aagcgttaag 3600
gaactccttg ggattactat catggagaga tcttcattcg aaaagaatcc tatcgacttt 3660
cttgaggcca aaggatataa ggaagttaag aaagatctga taatcaaact cccaaagtac 3720
tcattgtttg agctggaaaa cggcaggaag cgcatgcttg cttccgccgg agagttgcag 3780
aaagggaacg agttggctct gccttctaag tatgttaact tcctctatct tgcctctcat 3840
tacgagaagc tcaaaggctc accagaggac aacgaacaga aacaactttt tgtcgagcaa 3900
cataagcact atttggatga gattatagaa cagatcagtg aattctcgaa aagggttatc 3960
cttgcagatg cgaatcttga caaggtgttg tctgcataca acaaacatag agataagccg 4020
atcagggagc aagcggaaaa tatcattcac ctcttcactc ttacaaactt gggtgctccc 4080
gctgccttca agtattttga taccacgatt gaccggaaac gttacacctc aacgaaggag 4140
gtgctggatg ccaccctcat ccaccaatct attaccggac tctacgagac tagaatcgat 4200
ctctcacagc tcggcgggga taaaagacca gcagcgacga aaaaggcagg acaggctaag 4260
aagaagaaa 4269
<210>7
<211>1423
<212>PRT
<213>人工序列(Artificial Sequence)
<400>7
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Ala Phe Ala Ala Leu Ile
725 730 735
Ala Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210>8
<211>1153
<212>DNA
<213>人工序列(Artificial Sequence)
<400>8
gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg tgcagtcagg 60
gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg gaagccggga 120
acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt aggagaaaag 180
catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg ccggcccatt 240
acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc acatagatca 300
aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag caccagtggt 360
ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc ggctggtgca 420
cgcccccacc cggcctcgag gttttagagc tagaaatagc aagttaaaat aaggctagtc 480
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt ggtctagtgg 540
tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt gcaccctcaa 600
cagtatcatc aatgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc 660
aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag tggtagaata 720
gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcagcaa cgagtggtgt 780
ggtgccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 840
aaaagtggca ccgagtcggt gctttttttt ttcgttttgc attgagtttt ctccgtcgca 900
tgtttgcagt tttattttcc gttttgcatt gaaatttctc cgtctcatgt ttgcagcgtg 960
ttcaaaaagt acgcagctgt atttcactta tttacggcgc cacattttca tgccgtttgt 1020
gccaactatc ccgagctagt gaatacagct tggcttcaca caacactggt gacccgctga 1080
cctgctcgta cctcgtaccg tcgtacggca cagcatttgg aattaaaggg tgtgatcgat 1140
actgcttgct gct 1153
<210>9
<211>5004
<212>DNA
<213>人工序列(Artificial Sequence)
<400>9
atgtccagcg agacaggacc agtggcagtc gacccaacac tgcgcaggcg gatcgagcca 60
cacgagttcg aggtgttctt cgatccgagg gagctccgga aggagacatg cctcctgtac 120
gagatcaact ggggcggccg ccactctatc tggaggcata cctcacagaa cacaaataag 180
catgtggagg tcaacttcat cgagaagttc accacagagc ggtacttctg cccgaatacg 240
cgctgctcca tcacctggtt cctgtcgtgg tccccatgcg gagagtgctc gagggcaatc 300
acggagttcc tctcccgcta cccgcacgtc accctgttca tctacatcgc acggctctac 360
caccatgcgg acccgcggaa taggcagggc ctccgcgatc tgatctcttc aggcgtgaca 420
atccagatca tgacggagca ggagtcaggc tactgctgga ggaacttcgt caattacagc 480
ccatctaacg aggcacactg gccgcgctac ccgcatctct gggtgcgcct ctacgtgctc 540
gagctgtact gcatcatcct cggcctgccg ccatgcctca atatcctgcg caggaagcag 600
ccgcagctga cgttcttcac catcgccctc cagagctgcc actaccagcg gctccctccg 660
catatcctgt gggcgacagg cctcaagtca ggctcggaga cacctggcac gtccgagagc 720
gccaccccgg agtctatgga ctacaaggac cacgacgggg attacaaaga ccacgacata 780
gactacaagg atgacgatga caaaatggca ccgaagaaaa aaaggaaggt cggaatccat 840
ggcgttccag ctgccgataa gaaatattcc atcggactcg ccattggcac gaatagcgtc 900
ggatgggctg ttattactga tgagtacaaa gttccgtcta agaagttcaa ggtgctgggc 960
aacacagacc gccacagcat aaagaaaaat ctcatcggtg cactcctttt cgatagtggg 1020
gagactgcag aagcgacaag attgaaaagg actgcgagaa ggcgctatac acggcgtaag 1080
aatagaatct gctaccttca ggagattttc tctaacgaaa tggctaaggt cgatgacagt 1140
ttctttcata gacttgagga atcgttcttg gttgaggagg ataagaaaca tgagaggcac 1200
ccgatatttg gaaacatcgt ggatgaggtc gcatatcatg aaaagtaccc cacaatctac 1260
cacctgagaa agaaactcgt tgattccacc gacaaagcgg atttgagact catctacctc 1320
gctcttgccc atatgataaa gttccgcgga cactttctga tcgagggcga cctcaaccct 1380
gataatagcg acgtcgataa gctcttcatc cagttggttc aaacctacaa tcagctcttt 1440
gaggaaaacc caattaatgc tagtggagtg gatgcaaaag cgatactgtc ggccagactc 1500
tccaagagca gaaggttgga gaacctgatc gctcaacttc ctggagaaaa gaaaaacggt 1560
ctttttggga atttgattgc cttgtctctg ggcctcacac caaacttcaa gtcaaatttt 1620
gacctcgctg aggatgccaa acttcagttg tctaaggata cctatgatga cgatcttgac 1680
aatttgctgg cacaaattgg cgaccagtac gcggatctgt tcctcgcagc gaagaatctg 1740
agtgatgcta ttctcctttc ggacatactc agggttaaca ctgagatcac aaaagcacct 1800
ttgagtgcgt cgatgattaa gcgctatgat gaacatcacc aagacctcac tttgctgaag 1860
gcccttgtgc ggcagcaatt gccagagaag tacaaagaaa tcttctttga ccaatctaag 1920
aacggatacg ctggctatat tgatggagga gcttctcagg aggaattcta taagtttatc 1980
aaacctatac ttgagaagat ggatggtaca gaggaactcc ttgttaaatt gaacagagaa 2040
gatttgctgc gcaagcaacg gacctttgac aacggatcaa ttccgcatca gatacacctc 2100
ggcgagcttc atgccatcct tcgccggcag gaagatttct accccttttt gaaggacaac 2160
cgcgagaaga tagaaaaaat ccttacgttc cggattcctt actatgtggg tccattggca 2220
agggggaatt cccgctttgc gtggatgact cggaaaagcg aggaaactat cacaccgtgg 2280
aacttcgagg aagttgtgga caagggagct tctgcccaat cattcattga gaggatgact 2340
aacttcgata agaacctgcc gaacgagaaa gttctcccca agcactccct cctttacgag 2400
tatttcaccg tgtataacga acttacgaag gttaaatacg tgactgaggg tatgaggaag 2460
ccagcattct tgagcgggga acaaaagaaa gcgattgttg atttgctgtt taaaactaat 2520
cgcaaggtga cagtcaagca gctcaaagag gattatttca agaaaattga atgtttcgac 2580
tctgtggaga tatcaggagt cgaagatagg tttaacgctt cccttggcac ataccatgac 2640
ctccttaaga tcattaagga caaagatttc ctggataacg aggaaaatga ggacatcctc 2700
gaagatattg ttcttacctt gacgctgttt gaggatcgcg aaatgatcga ggaacggctt 2760
aagacgtatg ctcacttgtt cgacgataag gttatgaagc agctcaagcg tagaaggtac 2820
actggatggg gccgtctgtc tagaaagctc atcaacggaa tacgtgataa acaaagtggc 2880
aagacaattt tggattttct gaagtcggac ggattcgcca acagaaattt tatgcagctg 2940
attcatgacg atagtctcac cttcaaagag gacatacaga aggctcaagt gagtggtcaa 3000
ggggattcgc tgcatgaaca catcgcaaac ctcgcgggtt caccggccat aaagaaagga 3060
atccttcaaa ctgttaaggt cgttgatgag ttggttaaag tgatgggtag gcacaagccc 3120
gaaaacatag tgatcgagat ggctcgcgaa aatcagacta cacaaaaagg gcagaagaac 3180
tctcgcgagc ggatgaaaag gattgaggaa ggaatcaagg aactgggctc acagattctc 3240
aaagagcatc cagtcgaaaa cacacagctg caaaatgaga agctctatct ttactatctc 3300
caaaatggcc gggacatgta tgttgatcag gagcttgaca tcaaccgttt gtccgactat 3360
gatgtggacc acattgtccc gcaatctttc cttaaggacg attcaatcga taataaggtg 3420
ttgacccgga gcgataaaaa ccgtggaaag tctgacaatg tcccttcaga ggaagtggtt 3480
aagaagatga agaactactg gagacaattg ctgaatgcaa aactgatcac acagagaaag 3540
ttcgacaacc tcaccaaagc agagagaggt gggctcagtg aacttgataa agcgggcttc 3600
attaagcgtc agctcgttga gactagacag atcacgaagc atgtcgcgca gattttggat 3660
tcgcggatga acacgaagta cgacgagaat gataaactga tacgtgaagt caaggttatc 3720
actcttaagt ccaaattggt gagcgatttc agaaaggact tccaattcta taaggtcagg 3780
gagatcaaca attatcatca cgctcacgat gcctacctta atgctgttgt ggggaccgcc 3840
cttattaaga aataccctaa attggagtct gaattcgttt acggggatta taaggtctac 3900
gacgttagga aaatgatagc taagagtgag caggagatcg gtaaagcaac tgcgaagtat 3960
ttcttttact cgaacatcat gaatttcttt aagaccgaga taacgctggc aaatggcgaa 4020
attagaaaga ggcctctcat agagactaac ggtgagacag gggaaatcgt ctgggataag 4080
ggtagggact ttgcgacagt gcgcaaggtc ctctctatgc cgcaagttaa tattgtgaag 4140
aaaaccgagg tgcagacggg aggcttctcc aaggaaagca tacttcccaa acggaactct 4200
gataagttga tcgctcgtaa gaaagattgg gaccctaaga aatatggtgg gttcgattcc 4260
ccaactgttg cttacagcgt gctggtcgtt gccaaggtcg agaagggtaa atccaagaaa 4320
ctcaaaagcg ttaaggaact ccttgggatt actatcatgg agagatcttc attcgaaaag 4380
aatcctatcg actttcttga ggccaaagga tataaggaag ttaagaaaga tctgataatc 4440
aaactcccaa agtactcatt gtttgagctg gaaaacggca ggaagcgcat gcttgcttcc 4500
gccggagagt tgcagaaagg gaacgagttg gctctgcctt ctaagtatgt taacttcctc 4560
tatcttgcct ctcattacga gaagctcaaa ggctcaccag aggacaacga acagaaacaa 4620
ctttttgtcg agcaacataa gcactatttg gatgagatta tagaacagat cagtgaattc 4680
tcgaaaaggg ttatccttgc agatgcgaat cttgacaagg tgttgtctgc atacaacaaa 4740
catagagata agccgatcag ggagcaagcg gaaaatatca ttcacctctt cactcttaca 4800
aacttgggtg ctcccgctgc cttcaagtat tttgatacca cgattgaccg gaaacgttac 4860
acctcaacga aggaggtgct ggatgccacc ctcatccacc aatctattac cggactctac 4920
gagactagaa tcgatctctc acagctcggc ggggataaaa gaccagcagc gacgaaaaag 4980
gcaggacagg ctaagaagaa gaaa 5004
<210>10
<211>23
<212>DNA
<213>人工序列(Artificial Sequence)
<400>10
cggcgacggc gagcaagtgg tgg 23
<210>11
<211>86
<212>DNA
<213>人工序列(Artificial Sequence)
<400>11
gtttcagagc tatgctggaa acagcatagc aagttgaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210>12
<211>229
<212>PRT
<213>人工序列(Artificial Sequence)
<400>12
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225

Claims (10)

1.成套试剂,其包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料;
所述sgRNA由靶向目标基因靶点序列的esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成;
所述靶向目标基因靶点序列的esgRNA结构如下:所述目标基因靶点序列转录的RNA-esgRNA骨架;
所述靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA结构如下:所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架;
所述C·T碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料;
所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
所述sgRNA骨架为S1)或S2)或S3):
S1)将序列1第571-646位中的T替换为U得到的RNA分子;
S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子。
S3)与S1)或S2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子;
所述esgRNA骨架为T1)或T2)或T3):
T1)将序列11中的T替换为U得到的RNA分子;
T2)将T1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
T3)与T1)或T2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
2.根据权利要求1所述的成套试剂,其特征在于:所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因的起始密码子删除,且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列;所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述代理靶点靶序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复;
和/或,所述代理靶点靶序列为序列1第11305-11327位或序列10。
3.根据权利要求1或2所述的成套试剂,其特征在于:所述筛选剂抗性基因为潮霉素抗性基因。
4.根据权利要求1-3任一所述的成套试剂,其特征在于:所述sgRNA为tRNA-sgRNA;所述tRNA-sgRNA由靶向目标基因靶点序列的tRNA-esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA组成;
所述靶向目标基因靶点序列的tRNA-esgRNA结构如下:tRNA-所述目标基因靶点序列转录的RNA-esgRNA骨架;
所述靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA结构如下:tRNA-所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架;
所述tRNA为R1)或R2)或R3):
R1)将序列1第474-550位中的T替换为U得到的RNA分子;
R2)将R1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
R3)与R1)或R2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子。
5.根据权利要求1-4任一所述的成套试剂,其特征在于:所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料。
和/或,所述Cas9核酸酶为SpCas9n蛋白质或HypaCas9n蛋白质;
和/或,所述胞嘧啶脱氨酶为PmCDA1蛋白质或rAPOBEC1蛋白质;
和/或,所述SpCas9n蛋白质为A1)或A2)或A3):
A1)氨基酸序列是序列2所示的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;
与所述SpCas9n相关的生物材料为B1)至B5)中的任一种:
B1)编码所述SpCas9n的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系;
所述HypaCas9n蛋白质为C1)或C2)或C3):
C1)氨基酸序列是序列7所示的蛋白质;
C2)将序列表中序列7所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质;
与所述HypaCas9n相关的生物材料为D1)至D5)中的任一种:
D1)编码所述HypaCas9n的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物;
D5)含有D1)所述核酸分子的转基因细胞系、或含有D2)所述表达盒的转基因细胞系;
所述PmCDA1蛋白质为E1)或E2)或E3):
E1)氨基酸序列是序列3所示的蛋白质;
E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质;
与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种:
F1)编码所述PmCDA1蛋白质的核酸分子;
F2)含有F1)所述核酸分子的表达盒;
F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体;
F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物;
F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系;
所述rAPOBEC1蛋白质为G1)或G2)或G3):
G1)氨基酸序列是序列12所示的蛋白质;
G2)将序列表中序列12所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
G3)在G1)或G2)的N端或/和C端连接标签得到的融合蛋白质;
与所述rAPOBEC1蛋白质相关的生物材料为H1)至H5)中的任一种:
H1)编码所述rAPOBEC1蛋白质的核酸分子;
H2)含有H1)所述核酸分子的表达盒;
H3)含有H1)所述核酸分子的重组载体、或含有H2)所述表达盒的重组载体;
H4)含有H1)所述核酸分子的重组微生物、或含有H2)所述表达盒的重组微生物、或含有H3)所述重组载体的重组微生物;
H5)含有H1)所述核酸分子的转基因细胞系、或含有H2)所述表达盒的转基因细胞系;
所述UGI蛋白质为I1)或I2)或I3):
I1)氨基酸序列是序列4所示的蛋白质;
I2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
I3)在I1)或I2)的N端或/和C端连接标签得到的融合蛋白质;
与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种:
J1)编码所述UGI蛋白质的核酸分子;
J2)含有J1)所述核酸分子的表达盒;
J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体;
J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物;
J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系;
与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种:
K1)含有所述功能丧失的筛选剂抗性基因的表达盒;
K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体;
K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物;
K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。
6.权利要求1-5中任一所述的sgRNA或与所述sgRNA相关的生物材料。
7.权利要求1-5任一所述的成套试剂或权利要求6所述的sgRNA或与所述sgRNA相关的生物材料在M1)-M6)任一种中的应用:
M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞;
M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品;
M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率;
M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品;
M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换;
M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。
8.N1)或N2)或N3)或N4)或N5)所述的方法:
N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-5中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述esgRNA、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-5中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内,使所述Cas9核酸酶、所述esgRNA、所述sgRNA和所述胞嘧啶脱氨酶均得到表达;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-5中任一所述的Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法,包括如下步骤:将权利要求1-5中任一所述的Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内;所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下,可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复,进而富集筛选剂抗性基因发生C·T碱基替换的细胞,从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率;
N5)生物突变体的制备方法,包括如下步骤:按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑,获得生物突变体;所述生物突变体为发生C·T碱基替换的生物体。
9.根据权利要求1-5任一所述的成套试剂或权利要求7所述的应用或权利要求8所述的方法,其特征在于:所述C·T碱基替换为碱基C突变为碱基T。
10.根据权利要求1-5任一所述的成套试剂或权利要求7所述的应用或权利要求8所述的方法,其特征在于:所述生物体为P1)或P2)或P3)或P4):
P1)植物或动物;
P2)单子叶植物或双子叶植物;
P3)禾本科植物;
P4)水稻;
和/或,所述生物细胞为Q1)或Q2)或Q3)或Q4):
Q1)植物细胞或动物细胞;
Q2)单子叶植物细胞或双子叶植物细胞;
Q3)禾本科植物细胞;
Q4)水稻细胞。
CN201910938686.1A 2019-09-30 2019-09-30 差异代理技术在c·t碱基替换细胞富集中的应用 Active CN110564752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910938686.1A CN110564752B (zh) 2019-09-30 2019-09-30 差异代理技术在c·t碱基替换细胞富集中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910938686.1A CN110564752B (zh) 2019-09-30 2019-09-30 差异代理技术在c·t碱基替换细胞富集中的应用

Publications (2)

Publication Number Publication Date
CN110564752A true CN110564752A (zh) 2019-12-13
CN110564752B CN110564752B (zh) 2021-07-16

Family

ID=68783413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910938686.1A Active CN110564752B (zh) 2019-09-30 2019-09-30 差异代理技术在c·t碱基替换细胞富集中的应用

Country Status (1)

Country Link
CN (1) CN110564752B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110951736A (zh) * 2019-12-20 2020-04-03 北京市农林科学院 一种核定位信号f4nls及其在提高碱基编辑效率与拓展可编辑碱基范围中的应用
CN110964741A (zh) * 2019-12-20 2020-04-07 北京市农林科学院 一种核定位信号fnb及其在提高碱基编辑效率中的应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1174509A1 (en) * 1999-03-29 2002-01-23 Kansai Technology Licensing Organization Co., Ltd. Novel cytidine deaminase
CN108699116A (zh) * 2015-10-23 2018-10-23 哈佛大学的校长及成员们 用于基因编辑的演化的cas9蛋白
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法
WO2018218166A1 (en) * 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
CN109266686A (zh) * 2018-09-26 2019-01-25 北京市农林科学院 一种基因组核苷酸定点替换的方法
CN109456973A (zh) * 2018-12-28 2019-03-12 北京市农林科学院 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑系统编辑效率的方法
WO2019084062A1 (en) * 2017-10-23 2019-05-02 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1174509A1 (en) * 1999-03-29 2002-01-23 Kansai Technology Licensing Organization Co., Ltd. Novel cytidine deaminase
CN108699116A (zh) * 2015-10-23 2018-10-23 哈佛大学的校长及成员们 用于基因编辑的演化的cas9蛋白
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法
WO2018218166A1 (en) * 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
WO2019084062A1 (en) * 2017-10-23 2019-05-02 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
CN109266686A (zh) * 2018-09-26 2019-01-25 北京市农林科学院 一种基因组核苷酸定点替换的方法
CN109456973A (zh) * 2018-12-28 2019-03-12 北京市农林科学院 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
CN109679989A (zh) * 2018-12-29 2019-04-26 北京市农林科学院 一种提高碱基编辑系统编辑效率的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ARTEM G LADA等: "Recombination is responsible for the increased recovery of drug-resistant mutants with hypermutated genomes in resting yeast diploids expressing APOBEC deaminases.", 《FRONT GENET》 *
牛煦然等: "基因编辑技术及其在疾病治疗中的研究进展", 《遗传》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110951736A (zh) * 2019-12-20 2020-04-03 北京市农林科学院 一种核定位信号f4nls及其在提高碱基编辑效率与拓展可编辑碱基范围中的应用
CN110964741A (zh) * 2019-12-20 2020-04-07 北京市农林科学院 一种核定位信号fnb及其在提高碱基编辑效率中的应用
CN110964741B (zh) * 2019-12-20 2022-03-01 北京市农林科学院 一种核定位信号fnb及其在提高碱基编辑效率中的应用
CN110951736B (zh) * 2019-12-20 2023-03-14 北京市农林科学院 一种核定位信号f4nls及其在提高碱基编辑效率与拓展可编辑碱基范围中的应用

Also Published As

Publication number Publication date
CN110564752B (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN107043779B (zh) 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN111378051B (zh) Pe-p2引导编辑系统及其在基因组碱基编辑中的应用
KR102061438B1 (ko) 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체
CN107254485A (zh) 一种能够快速构建植物基因定点敲除载体的新反应体系
CN106929532B (zh) 人工创制玉米雄性不育系与高效的转育方法
CN110564752B (zh) 差异代理技术在c·t碱基替换细胞富集中的应用
WO2021032155A1 (zh) 一种碱基编辑系统和其使用方法
CN112279903B (zh) 一种提高水稻穗期稻瘟病抗性的基因及其用途
CN110229843B (zh) 陆地棉转化事件19pfa1-135-17及其特异性鉴定方法
CN111593031B (zh) 水稻ALS突变基因、含有该基因的植物转基因筛选载体pCALSm3及其应用
CN107417779B (zh) 一种植物耐铝相关蛋白GmGRPL及其编码基因与应用
CN110628794B (zh) 以失活的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
US10941412B2 (en) Citrus varieties resistant to Xanthomonas citri infection
WO2023216415A1 (zh) 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN114317596B (zh) 一种将植物基因组靶点序列中的a突变为g的方法
CN114317589B (zh) SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用
AU2011201470A1 (en) Reduction of spontaneous mutation rates in cells
CN111471684B (zh) 植物组成型启动子ALSpro及其应用
CN111411098B (zh) 水稻ALS突变基因、含有该基因的植物转基因筛选载体pCALSm2及其应用
CN106676129A (zh) 提高基因组编辑效率的方法
CN106755075A (zh) 提高基因组编辑效率的方法
CN109266631A (zh) 一种基因组定点敲除的方法
CN111560396B (zh) 植物转基因筛选载体pCALSm1及其应用
JP5818312B2 (ja) プラスミド除去用組み換えプラスミドおよびその利用
CN105154466B (zh) 一种双基因共表达重组载体及其构建方法和在三孢布拉霉中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant