CN109456973A - SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用 - Google Patents

SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用 Download PDF

Info

Publication number
CN109456973A
CN109456973A CN201811619478.7A CN201811619478A CN109456973A CN 109456973 A CN109456973 A CN 109456973A CN 201811619478 A CN201811619478 A CN 201811619478A CN 109456973 A CN109456973 A CN 109456973A
Authority
CN
China
Prior art keywords
sequence
lys
leu
glu
pmcda1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811619478.7A
Other languages
English (en)
Inventor
杨进孝
张成伟
武莹
冯峰
宋金岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN201811619478.7A priority Critical patent/CN109456973A/zh
Publication of CN109456973A publication Critical patent/CN109456973A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用。本发明通过将SpCas9n&PmCDA1&UGI碱基编辑系统导入生物体或生物细胞内,使系统中的SpCas9n、sgRNA、PmCDA1和UGI的编码基因均得到表达,实现基因组靶点序列的编辑;sgRNA靶向靶点序列;靶点序列的PAM序列为NAG,N为A、T、C或G。本发明利用SpCas9n&PmCDA1&UGI碱基编辑系统在植物中实现了更多的靶点序列中由C到T的替换,如PAM序列为NAG的靶点序列,扩展了PmCDA1介导的碱基替换系统的编辑范围,具有广泛的应用前景。

Description

SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的 应用
技术领域
本发明涉及生物技术领域中,SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用。
背景技术
CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。
2016年,David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor,CBE),分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey),原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine,C)碱基进行编辑,而不再通过产生DSB和启动HDR修复,大大提高了C替换为胸腺嘧啶(Thymine,T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过sgRNA定位到靶点,rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil,U),通过DNA的修复使得U与腺嘌呤(Adenine,A)配对,又通过DNA复制,最终使得T与A配对,从而实现了C到T的转换。在所测试的编辑器中,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor,UGI))的平均突变率较高,原因有二:一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase,UDG)催化清除DNA中U,二是SpCas9n(D10A)在非编辑链上产生切口,诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制,促使U:G错配更多的偏好性修复成U:A。
目前,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统已被广泛应用到水稻中,实现C到T的转换,但编辑的靶点主要局限在PAM(Protospacer Adjacent Motif)为NGG的序列,大大限制了可编辑的C的范围。
发明内容
本发明所要解决的技术问题是如何将生物体或生物细胞中PAM序列为NAG的靶点序列中的C突变为T。
为解决上述技术问题,本发明首先提供了一种基因组靶点序列的编辑方法,所述方法包括:将SpCas9n的编码基因、转录sgRNA的DNA分子、PmCDA1的编码基因和UGI的编码基因导入生物体或生物细胞内,使所述SpCas9n、所述sgRNA、所述PmCDA1和所述UGI的编码基因均得到表达,实现基因组靶点序列的编辑;
所述sgRNA靶向所述靶点序列;
所述靶点序列的PAM序列为NAG,N为A、T、C或G。
所述PAM序列为与所述靶点序列3′端相连的一段DNA序列。所述PAM序列中的N与所述靶点序列3′端相连。
所述SpCas9n可为如下A1)、A2)或A3):
A1)氨基酸序列是序列2的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质。
所述PmCDA1可为如下C1)、C2)或C3):
C1)氨基酸序列是序列3的蛋白质;
C2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质。
所述UGI可为如下E1)、E2)或E3):
E1)氨基酸序列是序列4的蛋白质;
E2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。
为了使A1)、C1)或E1)中的蛋白质便于纯化,可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。
表、标签的序列
标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
上述A2)、C2)或E2)中的蛋白质,为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、C2)或E2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)、C2)或E2)中的蛋白质的编码基因可通过将序列1的第3529-7797位、第8089-8712位或第8734-9030位所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连上表所示的标签的编码序列得到。序列1的第3529-7797位、第8089-8712位和第8734-9030位分别编码序列2、序列3和序列4所示的蛋白质。
所述sgRNA可如式I所示:
所述靶点序列转录的RNA-sgRNA骨架
(式I)
所述sgRNA骨架为将序列1的第571-646位中的T替换为U得到的RNA。
所述SpCas9n的编码基因可为如下b1)或b2)或b3):
b1)序列表中序列1的第3529-7797位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子。
所述PmCDA1的编码基因可为如下d1)或d2)或d3):
d1)序列表中序列1的第8089-8712位所示的cDNA分子或DNA分子;
d2)与d1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述PmCDA1的cDNA分子或DNA分子;
d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述PmCDA1的cDNA分子或DNA分子。
所述UGI的编码基因可为如下f1)或f2)或f3):
f1)序列表中序列1的第8734-9030位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述UGI的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述UGI的cDNA分子或DNA分子。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述SpCas9n、所述PmCDA1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述SpCas9n、所述PmCDA1或所述UGI的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述SpCas9n、所述PmCDA1或所述UGI且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
所述基因组靶点序列的编辑可为将所述靶点序列中的C突变为T。
所述方法具体可包括:将含有所述SpCas9n的编码基因的表达盒、所述转录sgRNA的DNA分子的表达盒、所述PmCDA1的编码基因的表达盒和所述UGI的编码基因的表达盒导入所述生物体或所述生物细胞中实现所述生物体或所述生物细胞内基因组靶点序列的编辑。
在本发明的实施例中,所述方法是通过将SpCas9n&PmCDA1&UGI载体导入所述生物体或所述生物细胞内实现基因组靶点序列的编辑的。所述SpCas9n&PmCDA1&UGI载体的序列为序列表中序列1。
本发明还提供了生物突变体的制备方法,所述方法包括:按照所述基因组靶点序列的编辑方法对生物体的基因组进行编辑,获得生物突变体。
上文中,所述生物体可为n1)或n2)或n3)或n4):
n1)植物或动物;n2)单子叶植物或双子叶植物;n3)禾本科植物;n4)水稻;
所述生物细胞可为o1)或o2)或o3)或o4):
o1)植物细胞或动物细胞;o2)单子叶植物细胞或双子叶植物细胞;o3)禾本科植物细胞;o4)水稻细胞。
本发明中,所述将生物体内或所述生物细胞内靶点序列中的C突变为T可为将所述靶点序列的非PAM端始的第1-6位间的C突变为T。
所述靶点序列的长度可为20bp。
本发明利用SpCas9n&PmCDA1&UGI碱基编辑系统在植物中实现了更多的靶点序列中由C到T的替换,如PAM序列为NAG的靶点序列,扩展了PmCDA1介导的碱基替换系统的编辑范围。本发明的SpCas9n&PmCDA1&UGI碱基编辑系统具有广泛的应用前景。
附图说明
图1为SpCas9n&PmCDA1&UGI碱基编辑系统对水稻愈伤中可编辑靶点的单位点C的C·T碱基替换效率分析结果。横坐标C后的数字表示从靶点中的非PAM序列一端(即5′端)的第一位核苷酸开始计数时C所处的核苷酸位数。
图2为SpCas9n&PmCDA1&UGI碱基编辑系统对水稻T0苗中可编辑靶点的单位点C的C·T碱基替换效率分析结果。横坐标C后的数字表示从靶点中的非PAM序列一端(即5′端)的第一位核苷酸开始计数时C所处的核苷酸位数。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
引物对W-T由引物W-T-F:5’-taagcacacacaaacttcgatc-3’和引物W-T-R:5’-aggagatgttgtggatgcag-3’组成,用于扩增靶点W-T1、W-T2、W-T3、W-T4、W-T5和W-T6。
以下实施例中,C·T碱基替换是指靶点序列中任何位置的C突变为T。
C·T碱基替换效率=发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100%。
单位点C的C·T碱基替换效率=目标单位点发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100%。
日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。
恢复培养基:含有200mg/L特美汀的N6固体培养基。
筛选培养基:含有50mg/L潮霉素的N6固体培养基。
分化培养基:含有0.5g/L谷氨酸、0.5g/L脯氨酸、2mg/L KT和0.2mg/L NAA的N6固体培养基。
生根培养基:含有0.5g/L谷氨酸、0.5g/L脯氨酸、0.2mg/L NAA的N6固体培养基。
实施例1、SpCas9n&PmCDA1&UGI碱基编辑系统可以将水稻基因组中C突变为T
一、重组表达载体的构建
人工合成如下重组载体SpCas9n&PmCDA1&UGI,该载体为环状质粒。
SpCas9n&PmCDA1&UGI的序列为序列表中序列1,该载体能表达序列表中序列2所示的蛋白质SpCas9n,序列3所示的蛋白质PmCDA1,序列4所示的蛋白质UGI,以及转录靶向OsWaxy基因的六个sgRNA(靶点记为W-T1、W-T2、W-T3、W-T4、W-T5和W-T6),这六个sgRNA的共同序列为sgRNA骨架,由序列1的第571-646位转录得到。其中,序列1的第1809-3522位为OsUbq3启动子序列,序列1的第3529-7797位为SpCas9n的编码序列,第8089-8712位为PmCDA1的编码序列,第8734-9030位为UGI的编码序列,序列1的第9037-9231位为35S终止子序列;序列1的第131-467位为OsU3启动子序列,第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位和第1339-1415位均为pre-tRNA的核苷酸序列,第551-646位、第724-819位、第897-992位、第1070-1165位、第1243-1338位和第1416-1511位分别转录靶向OsWaxy基因的六个sgRNA,第1512-1802位为OsU3终止子序列。
该载体转录的sgRNA的靶点序列及相应的PAM序列如表1所示。
表1
二、水稻阳性抗性愈伤及阳性T0苗的获得
将步骤一获得的SpCas9n&PmCDA1&UGI载体按照如下步骤1-10进行操作:
1、将载体导入农杆菌LBA4404(上海唯地生物技术有限公司的产品,CAT#为AC1030),得到重组农杆菌。
2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。
3、水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。
4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。
5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。
6、取步骤5得到的水稻愈伤,置于筛选培养基,28℃暗培养2周。
7、取步骤6得到的水稻愈伤,再次置于筛选培养基,28℃暗培养2周,得到水稻抗性愈伤。
8、提取步骤7得到的20-25块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。
9、取步骤7得到的水稻抗性愈伤放入分化培养基上,25℃光照培养1个月左右,将分化出来的小苗移至生根培养基上,25℃光照培养2周,获取水稻T0苗。
10、提取水稻T0苗的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻T0苗为水稻阳性T0苗;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻T0苗不为水稻阳性T0苗。
三、结果分析
一)、水稻愈伤中对OsWaxy基因上靶点的编辑
1、取步骤二中8所获得的15块水稻阳性抗性愈伤的基因组DNA作为模板,采用引物对W-T进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。
测序结果只针对各靶点区进行分析。
分别统计靶点W-T1、W-T2、W-T3、W-T4、W-T5和W-T6的发生C·T碱基替换的水稻阳性抗性愈伤数,计算得出C·T碱基替换效率,结果见表2。
结果表明,SpCas9n&PmCDA1&UGI碱基编辑系统在水稻中实现了对OsWaxy基因上3个PAM为NAG靶点的编辑,扩展了PmCDA1介导的碱基替换系统的编辑范围。进一步对可编辑靶点的单位点C的C·T碱基替换效率进行分析,结果见图1,结果表明SpCas9n&PmCDA1&UGI系统对PAM为NAG靶点编辑的活性窗口(即可发生C·T碱基替换的碱基的位置)主要为靶点序列内1-6bp(即靶点自5′端(即非PAM端)始的第1-6位核苷酸),编辑效率最高的C主要发生在C3(即靶点自5′端(即非PAM端)的第3位核苷酸)或C3附近位置。
表2
二)、在水稻T0苗中进行基因编辑
1、取步骤二中10所获得的水稻阳性T0苗的基因组DNA作为模板,采用引物对W-T进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。
测序结果只针对各靶点区进行分析。
分别统计W-T1、W-T2、W-T3、W-T4、W-T5和W-T6的发生C·T碱基替换的阳性T0苗数,计算得出C·T碱基替换效率且同时统计突变基因型及对应T0苗数,结果见表3。结果表明,SpCas9n&PmCDA1&UGI碱基编辑系统在水稻植株中实现了对OsWaxy基因上4个PAM为NAG靶点的编辑,即实现了对约66.7%(4/6)的PAM为NAG的靶点的碱基编辑,扩展了PmCDA1介导的碱基替换系统的编辑范围。所产生的突变类型主要为靶点内单个C和两个C的突变。进一步对可编辑靶点的单位点C的C·T碱基替换效率进行分析,结果见图2,结果表明SpCas9n&PmCDA1&UGI碱基编辑系统的活性窗口主要为靶点序列内1-6bp(除个别C·T碱基替换效率很低的C位点,包括W-T3的C13和W-T6的C12),编辑效率最高的C主要发生在C3或C3附近位置。
表3
注:表3中,“突变基因型及对应T0苗数”列中,括号内数字表示T0苗数,C和T后面的数字表示发生C·T碱基替换的C所处的核苷酸位数(自靶点中的非PAM序列一端(即5′端)的第一位核苷酸开始计数),“>”表示替换为。
<110> 北京市农林科学院
<120> SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 18995
<212> DNA
<213> 人工序列
<400> 1
ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60
ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120
ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180
tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240
gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300
aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360
ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420
acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540
ggctggtgca tgacactgga gttgattaca gttttagagc tagaaatagc aagttaaaat 600
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 660
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 720
gcacacggtc gactccacgc ttggttttag agctagaaat agcaagttaa aataaggcta 780
gtccgttatc aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag 840
tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcactcc 900
tcggtacgac cagtacgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 960
atcaacttga aaaagtggca ccgagtcggt gcaacaaagc accagtggtc tagtggtaga 1020
atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcaa gccacaacgc 1080
tggtatcccg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1140
tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg gtctagtggt agaatagtac 1200
cctgccacgg tacagacccg ggttcgattc ccggctggtg catggcacac tggcccactg 1260
gcgttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1320
gtggcaccga gtcggtgcaa caaagcacca gtggtctagt ggtagaatag taccctgcca 1380
cggtacagac ccgggttcga ttcccggctg gtgcaggcca gtgtgccagt cgttggtttt 1440
agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 1500
cgagtcggtg cttttttttt tcgttttgca ttgagttttc tccgtcgcat gtttgcagtt 1560
ttattttccg ttttgcattg aaatttctcc gtctcatgtt tgcagcgtgt tcaaaaagta 1620
cgcagctgta tttcacttat ttacggcgcc acattttcat gccgtttgtg ccaactatcc 1680
cgagctagtg aatacagctt ggcttcacac aacactggtg acccgctgac ctgctcgtac 1740
ctcgtaccgt cgtacggcac agcatttgga attaaagggt gtgatcgata ctgcttgctg 1800
ctaagcttac aaattcgggt caaggcggaa gccagcgcgc caccccacgt cagcaaatac 1860
ggaggcgcgg ggttgacggc gtcacccggt cctaacggcg accaacaaac cagccagaag 1920
aaattacagt aaaaaaaaag taaattgcac tttgatccac cttttattac ctaagtctca 1980
atttggatca cccttaaacc tatcttttca atttgggccg ggttgtggtt tggactacca 2040
tgaacaactt ttcgtcatgt ctaacttccc tttcagcaaa catatgaacc atatatagag 2100
gagatcggcc gtatactaga gctgatgtgt ttaaggtcgt tgattgcacg agaaaaaaaa 2160
atccaaatcg caacaatagc aaatttatct ggttcaaagt gaaaagatat gtttaaaggt 2220
agtccaaagt aaaacttata gataataaaa tgtggtccaa agcgtaattc actcaaaaaa 2280
aatcaacgag acgtgtacca aacggagaca aacggcatct tctcgaaatt tcccaaccgc 2340
tcgctcgccc gcctcgtctt cccggaaacc gcggtggttt cagcgtggcg gattctccaa 2400
gcagacggag acgtcacggc acgggactcc tcccaccacc caaccgccat aaataccagc 2460
cccctcatct cctctcctcg catcagctcc acccccgaaa aatttctccc caatctcgcg 2520
aggctctcgt cgtcgaatcg aatcctctcg cgtcctcaag gtacgctgct tctcctctcc 2580
tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt ttgttgctag atccgattgg 2640
tggttagggt tgtcgatgtg attatcgtga gatgtttagg ggttgtagat ctgatggttg 2700
tgatttgggc acggttggtt cgataggtgg aatcgtggtt aggttttggg attggatgtt 2760
ggttctgatg attgggggga atttttacgg ttagatgaat tgttggatga ttcgattggg 2820
gaaatcggtg tagatctgtt ggggaattgt ggaactagtc atgcctgagt gattggtgcg 2880
atttgtagcg tgttccatct tgtaggcctt gttgcgagca tgttcagatc tactgttccg 2940
ctcttgattg agttattggt gccatgggtt ggtgcaaaca caggctttaa tatgttatat 3000
ctgttttgtg tttgatgtag atctgtaggg tagttcttct tagacatggt tcaattatgt 3060
agcttgtgcg tttcgatttg atttcatatg ttcacagatt agataatgat gaactctttt 3120
aattaattgt caatggtaaa taggaagtct tgtcgctata tctgtcataa tgatctcatg 3180
ttactatctg ccagtaattt atgctaagaa ctatattaga atatcatgtt acaatctgta 3240
gtaatatcat gttacaatct gtagttcatc tatataatct attgtggtaa tttcttttta 3300
ctatctgtgt gaagattatt gccactagtt cattctactt atttctgaag ttcaggatac 3360
gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc ctgttactat ctttttgaat 3420
acatgtatgt tctgttggaa tatgtttgct gtttgatccg ttgttgtgtc cttaatcttg 3480
tgctagttct taccctatct gtttggtgat tatttcttgc agtacgtaat ggactacaag 3540
gaccacgacg gggattacaa agaccacgac atagactaca aggatgacga tgacaaaatg 3600
gcaccgaaga aaaaaaggaa ggtcggaatc catggcgttc cagctgccga taagaaatat 3660
tccatcggac tcgccattgg cacgaatagc gtcggatggg ctgttattac tgatgagtac 3720
aaagttccgt ctaagaagtt caaggtgctg ggcaacacag accgccacag cataaagaaa 3780
aatctcatcg gtgcactcct tttcgatagt ggggagactg cagaagcgac aagattgaaa 3840
aggactgcga gaaggcgcta tacacggcgt aagaatagaa tctgctacct tcaggagatt 3900
ttctctaacg aaatggctaa ggtcgatgac agtttctttc atagacttga ggaatcgttc 3960
ttggttgagg aggataagaa acatgagagg cacccgatat ttggaaacat cgtggatgag 4020
gtcgcatatc atgaaaagta ccccacaatc taccacctga gaaagaaact cgttgattcc 4080
accgacaaag cggatttgag actcatctac ctcgctcttg cccatatgat aaagttccgc 4140
ggacactttc tgatcgaggg cgacctcaac cctgataata gcgacgtcga taagctcttc 4200
atccagttgg ttcaaaccta caatcagctc tttgaggaaa acccaattaa tgctagtgga 4260
gtggatgcaa aagcgatact gtcggccaga ctctccaaga gcagaaggtt ggagaacctg 4320
atcgctcaac ttcctggaga aaagaaaaac ggtctttttg ggaatttgat tgccttgtct 4380
ctgggcctca caccaaactt caagtcaaat tttgacctcg ctgaggatgc caaacttcag 4440
ttgtctaagg atacctatga tgacgatctt gacaatttgc tggcacaaat tggcgaccag 4500
tacgcggatc tgttcctcgc agcgaagaat ctgagtgatg ctattctcct ttcggacata 4560
ctcagggtta acactgagat cacaaaagca cctttgagtg cgtcgatgat taagcgctat 4620
gatgaacatc accaagacct cactttgctg aaggcccttg tgcggcagca attgccagag 4680
aagtacaaag aaatcttctt tgaccaatct aagaacggat acgctggcta tattgatgga 4740
ggagcttctc aggaggaatt ctataagttt atcaaaccta tacttgagaa gatggatggt 4800
acagaggaac tccttgttaa attgaacaga gaagatttgc tgcgcaagca acggaccttt 4860
gacaacggat caattccgca tcagatacac ctcggcgagc ttcatgccat ccttcgccgg 4920
caggaagatt tctacccctt tttgaaggac aaccgcgaga agatagaaaa aatccttacg 4980
ttccggattc cttactatgt gggtccattg gcaaggggga attcccgctt tgcgtggatg 5040
actcggaaaa gcgaggaaac tatcacaccg tggaacttcg aggaagttgt ggacaaggga 5100
gcttctgccc aatcattcat tgagaggatg actaacttcg ataagaacct gccgaacgag 5160
aaagttctcc ccaagcactc cctcctttac gagtatttca ccgtgtataa cgaacttacg 5220
aaggttaaat acgtgactga gggtatgagg aagccagcat tcttgagcgg ggaacaaaag 5280
aaagcgattg ttgatttgct gtttaaaact aatcgcaagg tgacagtcaa gcagctcaaa 5340
gaggattatt tcaagaaaat tgaatgtttc gactctgtgg agatatcagg agtcgaagat 5400
aggtttaacg cttcccttgg cacataccat gacctcctta agatcattaa ggacaaagat 5460
ttcctggata acgaggaaaa tgaggacatc ctcgaagata ttgttcttac cttgacgctg 5520
tttgaggatc gcgaaatgat cgaggaacgg cttaagacgt atgctcactt gttcgacgat 5580
aaggttatga agcagctcaa gcgtagaagg tacactggat ggggccgtct gtctagaaag 5640
ctcatcaacg gaatacgtga taaacaaagt ggcaagacaa ttttggattt tctgaagtcg 5700
gacggattcg ccaacagaaa ttttatgcag ctgattcatg acgatagtct caccttcaaa 5760
gaggacatac agaaggctca agtgagtggt caaggggatt cgctgcatga acacatcgca 5820
aacctcgcgg gttcaccggc cataaagaaa ggaatccttc aaactgttaa ggtcgttgat 5880
gagttggtta aagtgatggg taggcacaag cccgaaaaca tagtgatcga gatggctcgc 5940
gaaaatcaga ctacacaaaa agggcagaag aactctcgcg agcggatgaa aaggattgag 6000
gaaggaatca aggaactggg ctcacagatt ctcaaagagc atccagtcga aaacacacag 6060
ctgcaaaatg agaagctcta tctttactat ctccaaaatg gccgggacat gtatgttgat 6120
caggagcttg acatcaaccg tttgtccgac tatgatgtgg accacattgt cccgcaatct 6180
ttccttaagg acgattcaat cgataataag gtgttgaccc ggagcgataa aaaccgtgga 6240
aagtctgaca atgtcccttc agaggaagtg gttaagaaga tgaagaacta ctggagacaa 6300
ttgctgaatg caaaactgat cacacagaga aagttcgaca acctcaccaa agcagagaga 6360
ggtgggctca gtgaacttga taaagcgggc ttcattaagc gtcagctcgt tgagactaga 6420
cagatcacga agcatgtcgc gcagattttg gattcgcgga tgaacacgaa gtacgacgag 6480
aatgataaac tgatacgtga agtcaaggtt atcactctta agtccaaatt ggtgagcgat 6540
ttcagaaagg acttccaatt ctataaggtc agggagatca acaattatca tcacgctcac 6600
gatgcctacc ttaatgctgt tgtggggacc gcccttatta agaaataccc taaattggag 6660
tctgaattcg tttacgggga ttataaggtc tacgacgtta ggaaaatgat agctaagagt 6720
gagcaggaga tcggtaaagc aactgcgaag tatttctttt actcgaacat catgaatttc 6780
tttaagaccg agataacgct ggcaaatggc gaaattagaa agaggcctct catagagact 6840
aacggtgaga caggggaaat cgtctgggat aagggtaggg actttgcgac agtgcgcaag 6900
gtcctctcta tgccgcaagt taatattgtg aagaaaaccg aggtgcagac gggaggcttc 6960
tccaaggaaa gcatacttcc caaacggaac tctgataagt tgatcgctcg taagaaagat 7020
tgggacccta agaaatatgg tgggttcgat tccccaactg ttgcttacag cgtgctggtc 7080
gttgccaagg tcgagaaggg taaatccaag aaactcaaaa gcgttaagga actccttggg 7140
attactatca tggagagatc ttcattcgaa aagaatccta tcgactttct tgaggccaaa 7200
ggatataagg aagttaagaa agatctgata atcaaactcc caaagtactc attgtttgag 7260
ctggaaaacg gcaggaagcg catgcttgct tccgccggag agttgcagaa agggaacgag 7320
ttggctctgc cttctaagta tgttaacttc ctctatcttg cctctcatta cgagaagctc 7380
aaaggctcac cagaggacaa cgaacagaaa caactttttg tcgagcaaca taagcactat 7440
ttggatgaga ttatagaaca gatcagtgaa ttctcgaaaa gggttatcct tgcagatgcg 7500
aatcttgaca aggtgttgtc tgcatacaac aaacatagag ataagccgat cagggagcaa 7560
gcggaaaata tcattcacct cttcactctt acaaacttgg gtgctcccgc tgccttcaag 7620
tattttgata ccacgattga ccggaaacgt tacacctcaa cgaaggaggt gctggatgcc 7680
accctcatcc accaatctat taccggactc tacgagacta gaatcgatct ctcacagctc 7740
ggcggggata aaagaccagc agcgacgaaa aaggcaggac aggctaagaa gaagaaagag 7800
ctcggaggag gaggcacggg aggaggaggc tccgccgagt atgtgcgcgc gctcttcgac 7860
ttcaacggca atgacgagga ggatctccct ttcaagaagg gcgacatcct ccgcatccgc 7920
gataagccgg aggagcagtg gtggaacgca gaggactccg agggcaagcg gggcatgatc 7980
ctggtgccat acgtcgagaa gtacagcggc gattacaagg accacgatgg cgactacaag 8040
gatcatgaca tcgattacaa ggacgatgac gataagtccg gcgtcgacat gacggacgcg 8100
gagtatgtgc gcatccacga gaagctcgat atctacacct tcaagaagca gttcttcaac 8160
aataagaagt cggtgtccca tcggtgctac gtcctcttcg agctgaagcg caggggagag 8220
cgccgcgcct gcttctgggg ctacgcggtg aataagccgc agtcaggcac agagcgcggc 8280
atccacgccg agatcttctc gatccggaag gtcgaggagt acctccgcga caacccaggc 8340
cagttcacga tcaattggta ctccagctgg tccccttgcg cagattgcgc agagaagatc 8400
ctcgagtggt acaaccagga gctgaggggc aatggccata ccctcaagat ctgggcctgc 8460
aagctgtact acgagaagaa cgcgaggaat cagatcggcc tctggaacct gcgggataat 8520
ggcgtgggcc tcaacgtgat ggtgtccgag cactaccagt gctgccgcaa gatcttcatc 8580
cagtcctccc acaatcagct gaacgagaat aggtggctcg aaaagaccct gaagcgcgcc 8640
gagaagtgga ggagcgagct gtctatcatg atccaggtca agatcctgca caccacaaag 8700
tcaccggcgg tgggcggcgg cggcagcgaa ttctccggcg gcagcacgaa cctcagcgac 8760
atcatcgaga aggagacagg caagcagctc gtgatccagg agtctatcct catgctgcct 8820
gaggaggtgg aggaggtcat cggcaacaag ccggagtccg atatcctcgt gcacaccgcc 8880
tacgacgagt cgacagatga gaatgtcatg ctcctgacct ccgacgcacc agagtacaag 8940
ccatgggcgc tcgtgatcca ggattccaac ggcgagaata agatcaagat gctgtctggc 9000
ggctccccga agaagaagcg caaggtctag actagtctga aatcaccagt ctctctctac 9060
aaatctatct ctctctataa taatgtgtga gtagttccca gataagggaa ttagggttct 9120
tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 9180
aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg gggcgcccga 9240
cctgtactcg cgaaggttaa cttacagaga gtgtccgggc gcgcctggtg gatcgtccgc 9300
ctaggctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat 9360
gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 9420
atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 9480
aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 9540
attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 9600
tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 9660
ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 9720
attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 9780
agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 9840
aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 9900
gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 9960
gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 10020
gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 10080
ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 10140
ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 10200
cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa 10260
atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 10320
ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 10380
catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat 10440
gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 10500
cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 10560
tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 10620
gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 10680
cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat 10740
ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc 10800
gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt 10860
ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg 10920
gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 10980
gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 11040
tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 11100
tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 11160
gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 11220
gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 11280
ttggtgttac ttctgcagga gctcatgaaa aagcctgaac tcaccgcgac gtctgtcgag 11340
aagtttctga tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa 11400
gaatctcgtg ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc 11460
tgcgccgatg gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc 11520
ccgattccgg aagtgcttga cattggggag tttagcgaga gcctgaccta ttgcatctcc 11580
cgccgttcac agggtgtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttcta 11640
caaccggtcg cggaggctat ggatgcgatc gctgcggccg atcttagcca gacgagcggg 11700
ttcggcccat tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc 11760
gcgattgctg atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg 11820
tccgtcgcgc aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg 11880
cacctcgtgc acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca 11940
gcggtcattg actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc 12000
ttcttctgga ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg 12060
catccggagc ttgcaggatc gccacgactc cgggcgtata tgctccgcat tggtcttgac 12120
caactctatc agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga 12180
tgcgacgcaa tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga 12240
agcgcggccg tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc 12300
cccagcactc gtccgagggc aaagaaatag gatcgttcaa acatttggca ataaagtttc 12360
ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 12420
gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 12480
attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 12540
taggataaat tatcgcgcgc ggtgtcatct atgttactag atctgtagcc ctgcaggacg 12600
cgtttaatta agtgcacgcg gccgcctact tagtcaagag cctcgcacgc gactgtcacg 12660
cggccaggat cgcctcgtga gcctcgcaat ctgtacctag tgtttaaact atcagtgttt 12720
gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa taacggatat 12780
ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 12840
gttcccctcg ggatcaaagt actttgatcc aacccctccg ctgctatagt gcagtcggct 12900
tctgacgttc agtgcagccg tcttctgaaa acgacatgtc gcacaagtcc taagttacgc 12960
gacaggctgc cgccctgccc ttttcctggc gttttcttgt cgcgtgtttt agtcgcataa 13020
agtagaatac ttgcgactag aaccggagac attacgccat gaacaagagc gccgccgctg 13080
gcctgctggg ctatgcccgc gtcagcaccg acgaccagga cttgaccaac caacgggccg 13140
aactgcacgc ggccggctgc accaagctgt tttccgagaa gatcaccggc accaggcgcg 13200
accgcccgga gctggccagg atgcttgacc acctacgccc tggcgacgtt gtgacagtga 13260
ccaggctaga ccgcctggcc cgcagcaccc gcgacctact ggacattgcc gagcgcatcc 13320
aggaggccgg cgcgggcctg cgtagcctgg cagagccgtg ggccgacacc accacgccgg 13380
ccggccgcat ggtgttgacc gtgttcgccg gcattgccga gttcgagcgt tccctaatca 13440
tcgaccgcac ccggagcggg cgcgaggccg ccaaggcccg aggcgtgaag tttggccccc 13500
gccctaccct caccccggca cagatcgcgc acgcccgcga gctgatcgac caggaaggcc 13560
gcaccgtgaa agaggcggct gcactgcttg gcgtgcatcg ctcgaccctg taccgcgcac 13620
ttgagcgcag cgaggaagtg acgcccaccg aggccaggcg gcgcggtgcc ttccgtgagg 13680
acgcattgac cgaggccgac gccctggcgg ccgccgagaa tgaacgccaa gaggaacaag 13740
catgaaaccg caccaggacg gccaggacga accgtttttc attaccgaag agatcgaggc 13800
ggagatgatc gcggccgggt acgtgttcga gccgcccgcg cacgtctcaa ccgtgcggct 13860
gcatgaaatc ctggccggtt tgtctgatgc caagctggcg gcctggccgg ccagcttggc 13920
cgctgaagaa accgagcgcc gccgtctaaa aaggtgatgt gtatttgagt aaaacagctt 13980
gcgtcatgcg gtcgctgcgt atatgatgcg atgagtaaat aaacaaatac gcaaggggaa 14040
cgcatgaagg ttatcgctgt acttaaccag aaaggcgggt caggcaagac gaccatcgca 14100
acccatctag cccgcgccct gcaactcgcc ggggccgatg ttctgttagt cgattccgat 14160
ccccagggca gtgcccgcga ttgggcggcc gtgcgggaag atcaaccgct aaccgttgtc 14220
ggcatcgacc gcccgacgat tgaccgcgac gtgaaggcca tcggccggcg cgacttcgta 14280
gtgatcgacg gagcgcccca ggcggcggac ttggctgtgt ccgcgatcaa ggcagccgac 14340
ttcgtgctga ttccggtgca gccaagccct tacgacatat gggccaccgc cgacctggtg 14400
gagctggtta agcagcgcat tgaggtcacg gatggaaggc tacaagcggc ctttgtcgtg 14460
tcgcgggcga tcaaaggcac gcgcatcggc ggtgaggttg ccgaggcgct ggccgggtac 14520
gagctgccca ttcttgagtc ccgtatcacg cagcgcgtga gctacccagg cactgccgcc 14580
gccggcacaa ccgttcttga atcagaaccc gagggcgacg ctgcccgcga ggtccaggcg 14640
ctggccgctg aaattaaatc aaaactcatt tgagttaatg aggtaaagag aaaatgagca 14700
aaagcacaaa cacgctaagt gccggccgtc cgagcgcacg cagcagcaag gctgcaacgt 14760
tggccagcct ggcagacacg ccagccatga agcgggtcaa ctttcagttg ccggcggagg 14820
atcacaccaa gctgaagatg tacgcggtac gccaaggcaa gaccattacc gagctgctat 14880
ctgaatacat cgcgcagcta ccagagtaaa tgagcaaatg aataaatgag tagatgaatt 14940
ttagcggcta aaggaggcgg catggaaaat caagaacaac caggcaccga cgccgtggaa 15000
tgccccatgt gtggaggaac gggcggttgg ccaggcgtaa gcggctgggt tgtctgccgg 15060
ccctgcaatg gcactggaac ccccaagccc gaggaatcgg cgtgacggtc gcaaaccatc 15120
cggcccggta caaatcggcg cggcgctggg tgatgacctg gtggagaagt tgaaggccgc 15180
gcaggccgcc cagcggcaac gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc 15240
ggccgctgat cgaatccgca aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat 15300
taggaagccg cccaagggcg acgagcaacc agattttttc gttccgatgc tctatgacgt 15360
gggcacccgc gatagtcgca gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga 15420
ccgacgagct ggcgaggtga tccgctacga gcttccagac gggcacgtag aggtttccgc 15480
agggccggcc ggcatggcca gtgtgtggga ttacgacctg gtactgatgg cggtttccca 15540
tctaaccgaa tccatgaacc gataccggga agggaaggga gacaagcccg gccgcgtgtt 15600
ccgtccacac gttgcggacg tactcaagtt ctgccggcga gccgatggcg gaaagcagaa 15660
agacgacctg gtagaaacct gcattcggtt aaacaccacg cacgttgcca tgcagcgtac 15720
gaagaaggcc aagaacggcc gcctggtgac ggtatccgag ggtgaagcct tgattagccg 15780
ctacaagatc gtaaagagcg aaaccgggcg gccggagtac atcgagatcg agctagctga 15840
ttggatgtac cgcgagatca cagaaggcaa gaacccggac gtgctgacgg ttcaccccga 15900
ttactttttg atcgatcccg gcatcggccg ttttctctac cgcctggcac gccgcgccgc 15960
aggcaaggca gaagccagat ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg 16020
agagttcaag aagttctgtt tcaccgtgcg caagctgatc gggtcaaatg acctgccgga 16080
gtacgatttg aaggaggagg cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa 16140
cctgatcgag ggcgaagcat ccgccggttc ctaatgtacg gagcagatgc tagggcaaat 16200
tgccctagca ggggaaaaag gtcgaaaagg tctctttcct gtggatagca cgtacattgg 16260
gaacccaaag ccgtacattg ggaaccggaa cccgtacatt gggaacccaa agccgtacat 16320
tgggaaccgg tcacacatgt aagtgactga tataaaagag aaaaaaggcg atttttccgc 16380
ctaaaactct ttaaaactta ttaaaactct taaaacccgc ctggcctgtg cataactgtc 16440
tggccagcgc acagccgaag agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct 16500
acgccccgcc gcttcgcgtc ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct 16560
acggccaggc aatctaccag ggcgcggaca agccgcgccg tcgccactcg accgccggcg 16620
cccacatcaa ggcaccctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 16680
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 16740
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 16800
gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 16860
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 16920
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 16980
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 17040
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 17100
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 17160
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 17220
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 17280
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 17340
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 17400
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 17460
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 17520
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 17580
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 17640
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 17700
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 17760
ggtcatgcat tctaggtact aaaacaattc atccagtaaa atataatatt ttattttctc 17820
ccaatcaggc ttgatcccca gtaagtcaaa aaatagctcg acatactgtt cttccccgat 17880
atcctccctg atcgaccgga cgcagaaggc aatgtcatac cacttgtccg ccctgccgct 17940
tctcccaaga tcaataaagc cacttacttt gccatctttc acaaagatgt tgctgtctcc 18000
caggtcgccg tgggaaaaga caagttcctc ttcgggcttt tccgtcttta aaaaatcata 18060
cagctcgcgc ggatctttaa atggagtgtc ttcttcccag ttttcgcaat ccacatcggc 18120
cagatcgtta ttcagtaagt aatccaattc ggctaagcgg ctgtctaagc tattcgtata 18180
gggacaatcc gatatgtcga tggagtgaaa gagcctgatg cactccgcat acagctcgat 18240
aatcttttca gggctttgtt catcttcata ctcttccgag caaaggacgc catcggcctc 18300
actcatgagc agattgctcc agccatcatg ccgttcaaag tgcaggacct ttggaacagg 18360
cagctttcct tccagccata gcatcatgtc cttttcccgt tccacatcat aggtggtccc 18420
tttataccgg ctgtccgtca tttttaaata taggttttca ttttctccca ccagcttata 18480
taccttagca ggagacattc cttccgtatc ttttacgcag cggtattttt cgatcagttt 18540
tttcaattcc ggtgatattc tcattttagc catttattat ttccttcctc ttttctacag 18600
tatttaaaga taccccaaga agctaattat aacaagacga actccaattc actgttcctt 18660
gcattctaaa accttaaata ccagaaaaca gctttttcaa agttgttttc aaagttggcg 18720
tataacatag tatcgacgga gccgattttg aaaccgcggt gatcacaggc agcaacgctc 18780
tgtcatcgtt acaatcaaca tgctaccctc cgcgagatca tccgtgtttc aaacccggca 18840
gcttagttgc cgttcttccg aatagcatcg gtaacatgag caaagtctgc cgccttacaa 18900
cggctctccc gctgacgccg tcccggactg atgggctgcc tgtatcgagt ggtgattttg 18960
tgccgagctg ccggtcgggg agctgttggc tggct 18995
<210> 2
<211> 1423
<212> PRT
<213> 人工序列
<400> 2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210> 3
<211> 208
<212> PRT
<213> 人工序列
<400> 3
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 4
<211> 98
<212> PRT
<213> 人工序列
<400> 4
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1 5 10 15
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
20 25 30
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
35 40 45
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
50 55 60
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
65 70 75 80
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
85 90 95
Lys Val

Claims (10)

1.基因组靶点序列的编辑方法,包括:将SpCas9n的编码基因、转录sgRNA的DNA分子、PmCDA1的编码基因和UGI的编码基因导入生物体或生物细胞内,使所述SpCas9n、所述sgRNA、所述PmCDA1和所述UGI的编码基因均得到表达,实现基因组靶点序列的编辑;
所述sgRNA靶向所述靶点序列;
所述靶点序列的PAM序列为NAG,N为A、T、C或G。
2.根据权利要求1所述的方法,其特征在于:
所述SpCas9n为如下A1)、A2)或A3):
A1)氨基酸序列是序列2的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质。
3.根据权利要求1或2所述的方法,其特征在于:
所述PmCDA1为如下C1)、C2)或C3):
C1)氨基酸序列是序列3的蛋白质;
C2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质。
4.根据权利要求1-3中任一所述的方法,其特征在于:
所述UGI为如下E1)、E2)或E3):
E1)氨基酸序列是序列4的蛋白质;
E2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。
5.根据权利要求1-4中任一所述的方法,其特征在于:
所述sgRNA如式I所示:
所述靶点序列转录的RNA-sgRNA骨架
(式I)
所述sgRNA骨架为将序列1的第571-646位中的T替换为U得到的RNA。
6.根据权利要求1-5中任一所述的方法,其特征在于:
所述SpCas9n的编码基因为如下b1)或b2)或b3):
b1)序列表中序列1的第3529-7797位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述SpCas9n的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述SpCas9n的cDNA分子或DNA分子。
7.根据权利要求1-6中任一所述的方法,其特征在于:
所述PmCDA1的编码基因为如下d1)或d2)或d3):
d1)序列表中序列1的第8089-8712位所示的cDNA分子或DNA分子;
d2)与d1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述PmCDA1的cDNA分子或DNA分子;
d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述PmCDA1的cDNA分子或DNA分子。
8.根据权利要求1-7中任一所述的方法,其特征在于:
所述UGI的编码基因为如下f1)或f2)或f3):
f1)序列表中序列1的第8734-9030位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述UGI的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述UGI的cDNA分子或DNA分子。
9.生物突变体的制备方法,包括:按照权利要求1-8中任一所述的方法对生物体的基因组进行编辑,获得生物突变体。
10.根据权利要求1-9中任一所述的方法,其特征在于:所述基因组靶点序列的编辑为将所述靶点序列中的C突变为T;
和/或,所述生物体为n1)或n2)或n3)或n4):
n1)植物或动物;
n2)单子叶植物或双子叶植物;
n3)禾本科植物;
n4)水稻;
所述生物细胞为o1)或o2)或o3)或o4):
o1)植物细胞或动物细胞;
o2)单子叶植物细胞或双子叶植物细胞;
o3)禾本科植物细胞;
o4)水稻细胞。
CN201811619478.7A 2018-12-28 2018-12-28 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用 Pending CN109456973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811619478.7A CN109456973A (zh) 2018-12-28 2018-12-28 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811619478.7A CN109456973A (zh) 2018-12-28 2018-12-28 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用

Publications (1)

Publication Number Publication Date
CN109456973A true CN109456973A (zh) 2019-03-12

Family

ID=65615275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811619478.7A Pending CN109456973A (zh) 2018-12-28 2018-12-28 SpCas9n&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用

Country Status (1)

Country Link
CN (1) CN109456973A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110551752A (zh) * 2019-08-30 2019-12-10 北京市农林科学院 xCas9n-epBE碱基编辑系统及其在基因组碱基替换中的应用
CN110564752A (zh) * 2019-09-30 2019-12-13 北京市农林科学院 差异代理技术在c·t碱基替换细胞富集中的应用
CN110669794A (zh) * 2019-09-30 2020-01-10 北京市农林科学院 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN110951742A (zh) * 2019-12-31 2020-04-03 北京市农林科学院 一种不产生dna双链断裂的实现植物基因替换的方法
CN111304242A (zh) * 2019-11-29 2020-06-19 北京市农林科学院 一种基于SaKKHn-pBE系统制备单突变体的方法
CN114317590A (zh) * 2020-09-30 2022-04-12 北京市农林科学院 一种将植物基因组中的碱基c突变为碱基t的方法
CN114672513A (zh) * 2022-04-12 2022-06-28 北京大学现代农业研究院 一种基因编辑系统及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN108795972A (zh) * 2017-05-05 2018-11-13 中国科学院遗传与发育生物学研究所 不使用转基因标记序列分离细胞的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HU ET AL.: "Evolved Cas9 variants with broad PAM compatibility and high DNA specificity", 《NATURE》 *
KEIJI NISHIDA ET AL.: "Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems", 《SCIENCE》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110551752A (zh) * 2019-08-30 2019-12-10 北京市农林科学院 xCas9n-epBE碱基编辑系统及其在基因组碱基替换中的应用
CN110551752B (zh) * 2019-08-30 2023-03-14 北京市农林科学院 xCas9n-epBE碱基编辑系统及其在基因组碱基替换中的应用
CN110564752A (zh) * 2019-09-30 2019-12-13 北京市农林科学院 差异代理技术在c·t碱基替换细胞富集中的应用
CN110669794A (zh) * 2019-09-30 2020-01-10 北京市农林科学院 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN110669794B (zh) * 2019-09-30 2021-07-16 北京市农林科学院 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN111304242A (zh) * 2019-11-29 2020-06-19 北京市农林科学院 一种基于SaKKHn-pBE系统制备单突变体的方法
CN110951742A (zh) * 2019-12-31 2020-04-03 北京市农林科学院 一种不产生dna双链断裂的实现植物基因替换的方法
CN110951742B (zh) * 2019-12-31 2022-10-21 北京市农林科学院 一种不产生dna双链断裂的实现植物基因替换的方法
CN114317590A (zh) * 2020-09-30 2022-04-12 北京市农林科学院 一种将植物基因组中的碱基c突变为碱基t的方法
CN114317590B (zh) * 2020-09-30 2024-01-16 北京市农林科学院 一种将植物基因组中的碱基c突变为碱基t的方法
CN114672513A (zh) * 2022-04-12 2022-06-28 北京大学现代农业研究院 一种基因编辑系统及其应用
CN114672513B (zh) * 2022-04-12 2024-04-02 北京大学现代农业研究院 一种基因编辑系统及其应用

Similar Documents

Publication Publication Date Title
CN109456973A (zh) SpCas9n&amp;PmCDA1&amp;UGI碱基编辑系统在植物基因编辑中的应用
CN108368517B (zh) 用于快速植物转化的方法和组合物
CN105838733A (zh) Cas9 介导的香石竹基因编辑载体和应用
KR102670917B1 (ko) 동시 유전자 편집 및 반수체 유도
CN101522902B (zh) 通过邻氨基苯甲酸合酶的叶绿体靶向表达产生高色氨酸玉蜀黍
CN111909953B (zh) 用于桑黄遗传表达的重组载体及构建方法和遗传转化方法
CN109679949B (zh) 调控miR156及其靶基因IPA1同时提高水稻抗病与产量的育种方法
CN107619833B (zh) 用于构建布鲁氏菌突变株的质粒pZF17-30及其构建方法和应用
CN107326043B (zh) 一种多功能载体的构建及使用方法
CN108165579B (zh) 一种优化的鉴定月季RhPDS基因的VIGS沉默体系的方法
CN109722436B (zh) 基于CRISPR-Cas9的基因组无痕编辑的载体与应用
CA2521752A1 (en) Plant cells and plants with increased tolerance to environmental stress
CN101818151B (zh) 一种大豆种子特异性启动子及其应用
CN114774427B (zh) 一种提高金银花中木犀草素含量的重组基因及其应用
CN110964741B (zh) 一种核定位信号fnb及其在提高碱基编辑效率中的应用
CN106755059B (zh) 一种用于基因工程的骨干质粒载体及应用
CN110872584B (zh) 大麦α-淀粉酶及其编码基因与应用
CN112708633B (zh) 含有玉米种子荧光报告基团的CRISPR-Cas9基因编辑系统及应用
CN113122556B (zh) 振荡型基因表达系统、构建方法及其在鼠李糖脂发酵中的应用
CN110923258A (zh) 一种真姬菇的遗传转化方法
CN110923235A (zh) 一种控制玉米籽粒灌浆的非编码基因及其应用
CN112011563A (zh) 一种基于ai-2群体感应自诱导蛋白表达载体及应用
CN110257444B (zh) 一种在植物细胞中生产中链脂肪酸的方法
CN110923262B (zh) 高粱α-淀粉酶及其编码基因与应用
CN114561388B (zh) 一种辣椒外源aba诱导型启动子、表达载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190312

RJ01 Rejection of invention patent application after publication