CN110577965B - xCas9n-epBE碱基编辑系统在基因编辑中的应用 - Google Patents

xCas9n-epBE碱基编辑系统在基因编辑中的应用 Download PDF

Info

Publication number
CN110577965B
CN110577965B CN201910812816.7A CN201910812816A CN110577965B CN 110577965 B CN110577965 B CN 110577965B CN 201910812816 A CN201910812816 A CN 201910812816A CN 110577965 B CN110577965 B CN 110577965B
Authority
CN
China
Prior art keywords
sequence
xcas9n
lys
leu
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910812816.7A
Other languages
English (en)
Other versions
CN110577965A (zh
Inventor
杨进孝
徐雯
刘亚
王飞鹏
袁爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy of Agriculture and Forestry Sciences
Original Assignee
Beijing Academy of Agriculture and Forestry Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy of Agriculture and Forestry Sciences filed Critical Beijing Academy of Agriculture and Forestry Sciences
Priority to CN201910812816.7A priority Critical patent/CN110577965B/zh
Publication of CN110577965A publication Critical patent/CN110577965A/zh
Application granted granted Critical
Publication of CN110577965B publication Critical patent/CN110577965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明公开了xCas9n‑epBE碱基编辑系统在基因编辑中的应用。本发明公开的xCas9n‑epBE碱基编辑系统包括xCas9n、PmCDA1、UGI和tRNA‑esgRNA;所述tRNA‑esgRNA靶向靶点序列;所述tRNA‑esgRNA如式I所示:tRNA‑所述靶点序列转录的RNA‑esgRNA骨架(式I)。通过实验证明:本发明的xCas9n‑epBE碱基编辑系统在植物基因组中实现了靶点序列的编辑,尤其是在PAM序列为NGT、NGA、NGG、GAA或GAT时实现了靶点序列中由碱基C到碱基T的替换。本发明的xCas9n‑epBE碱基编辑系统在植物或动物基因编辑中具有广泛的应用前景。

Description

xCas9n-epBE碱基编辑系统在基因编辑中的应用
技术领域
本发明涉及生物技术领域,具体涉及xCas9n-epBE碱基编辑系统在基因编辑中的应用。
背景技术
CRISPR-Cas9技术已经成为强有力的基因组编辑手段,被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上,切割产生DNA双链断裂(dsDNA break,DSB),而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种,一种是非同源末端连接(non-homologous end joining,NHEJ),另一种是同源重组(homology-directed repair,HDR)。通常情况下NHEJ占大多数,因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换,因为HDR效率低以及需要DNA模板,所以使用HDR实现碱基精确替换的应用受到很大的限制。
2016年,David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor,CBE),分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey),原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine,C)碱基进行编辑,而不再通过产生DSB和启动HDR修复,大大提高了C替换为胸腺嘧啶(Thymine,T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过向导RNA定位到靶点,rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil,U),通过DNA的修复使得U与腺嘌呤(Adenine,A)配对,又通过DNA复制,最终使得T与A配对,从而实现了C到T的转换。在所测试的编辑器中,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor,UGI)的平均突变率较高,原因有二:一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase,UDG)催化清除DNA中U,二是SpCas9n(D10A)在非编辑链上产生切口,诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制,促使U:G错配更多的偏好性修复成U:A。
目前,SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统已被广泛应用到水稻中,实现C到T的转换,但编辑的靶点主要局限在PAM(Protospacer Adjacent Motif)为NGG的序列,大大限制了可编辑的C的范围。在人细胞中,SpCas9的变体xCas9能够识别NG,GAA和GAT靶点,被成功的开发成CBE,大大拓展了基因组中可编辑的C的范围。研究人员也多次尝试使用xCas9开发新的水稻CBE,但是在水稻转基因T0苗中,除了能够编辑PAM为NGG的靶点外,其他的NG PAM(包括NGT、NGA和NGC)以及GAA和GAT PAM靶点均未实现编辑,限制了使用xCas9拓展水稻基因组中可编辑C范围的应用。
发明内容
本发明所要解决的技术问题是如何使用SpCas9的变体xCas9将生物体或生物细胞中PAM序列为NG(包括NGT、NGA和NGG)以及GAA和GAT的靶点序列中的C突变为T。
为了解决上述技术问题,本发明首先提供了一种基因组靶点序列的编辑方法。
本发明提供的基因组靶点序列的编辑方法为方法(一)或方法(二)或方法(三)或方法(四):
所述方法(一)包括如下步骤:将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子、PmCDA1的编码基因和UGI的编码基因导入生物体或生物细胞内,使所述xCas9n、所述tRNA-esgRNA、所述PmCDA1和所述UGI的编码基因均得到表达,实现基因组靶点序列的编辑;
所述方法(二)包括如下步骤:将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子和PmCDA1的编码基因导入生物体或生物细胞内,使所述xCas9n、所述tRNA-esgRNA和所述PmCDA1的编码基因均得到表达,实现基因组靶点序列的编辑;
所述方法(三)包括如下步骤:将xCas9n、tRNA-esgRNA、PmCDA1和UGI导入生物体或生物细胞内,实现基因组靶点序列的编辑;
所述方法(四)包括如下步骤:将xCas9n、tRNA-esgRNA和PmCDA1导入生物体或生物细胞内,实现基因组靶点序列的编辑;
所述tRNA-esgRNA靶向所述靶点序列;
所述tRNA-esgRNA如式I所示:tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I);
所述tRNA为m1)或m2)或m3):
m1)将序列1第474-550位中的T替换为U得到的RNA分子;
m2)将m1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子;
m3)与m1)或m2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子;
所述esgRNA骨架为n1)或n2)或n3):
n1)将序列1第571-656位中的T替换为U得到的RNA分子;
n2)将n1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子。
n3)与n1)或n2)限定的核苷酸序列具有75%或75%以上同一性且具有相同功能的RNA分子;
所述靶点序列的PAM序列为如下任一种:NGT、NGA、NGG、GAA、GAT;N为A、T、C或G。
所述PAM序列为与所述靶点序列3′端相连的一段DNA序列。所述PAM序列(NGT、NGA、NGG)中的N或PAM序列(GAA、GAT)中的G与所述靶点序列3′端相连。所述靶点序列大小可为15-25bp,进一步可为18-22bp,更进一步的可为20bp。
上述方法中,所述xCas9n可为xCas9n 3.6或xCas9n 3.7。在本发明的具体实施例中,所述xCas9n为xCas9n 3.7。
所述xCas9n 3.7为A1)或A2)或A3):
A1)氨基酸序列是序列2所示的蛋白质;
A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质。
所述PmCDA1为C1)或C2)或C3):
C1)氨基酸序列是序列3所示的蛋白质;
C2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质。
所述UGI为E1)或E2)或E3):
E1)氨基酸序列是序列4所示的蛋白质;
E2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。
为了使A1)、C1)或E1)中的蛋白质便于纯化,可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。
表、标签的序列
标签 残基 序列
Poly-Arg 5-6(通常为5个) RRRRR
Poly-His 2-10(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
上述A2)、C2)或E2)中的蛋白质,为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、C2)或E2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)、C2)或E2)中的蛋白质的编码基因可通过将序列1的第2857-7125位、第7417-8040位或第8062-8358位所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。序列1的第2857-7125位、第7417-8040位和第8062-8358位分别编码序列2、序列3和序列4所示的蛋白质。
所述xCas9n 3.7的编码基因为b1)或b2)或b3):
b1)序列表中序列1第2857-7125位所示的cDNA分子或DNA分子;
b2)与b1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述xCas9n 3.7的cDNA分子或DNA分子;
b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述xCas9n 3.7的cDNA分子或DNA分子。
所述PmCDA1的编码基因为d1)或d2)或d3):
d1)序列表中序列1第7417-8040位所示的cDNA分子或DNA分子;
d2)与d1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述PmCDA1的cDNA分子或DNA分子;
d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述PmCDA1的cDNA分子或DNA分子。
所述UGI的编码基因为f1)或f2)或f3):
f1)序列表中序列1第8062-8358位所示的cDNA分子或DNA分子;
f2)与f1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述UGI的cDNA分子或DNA分子;
f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述UGI的cDNA分子或DNA分子。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码所述xCas9n、所述PmCDA1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明的所述xCas9n、所述PmCDA1或所述UGI的核苷酸序列75%或者更高同一性的核苷酸,只要编码所述xCas9n、所述PmCDA1或所述UGI且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
上述方法中,所述转录tRNA-esgRNA的DNA分子转录后得到的所述tRNA-esgRNA为不成熟的RNA前体,该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点,就会得到多少个独立的成熟的RNA,每个成熟的RNA依次由所述靶点序列转录的RNA和所述esgRNA骨架组成,或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述esgRNA骨架组成。
上述方法中,所述方法(一)中,所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中,所述UGI的个数具体为一个。
上述方法中,所述方法(一)中,所述xCas9n的编码基因、所述转录tRNA-esgRNA的DNA分子、所述PmCDA1的编码基因和所述UGI的编码基因通过含有所述xCas9n的编码基因的表达盒、所述转录tRNA-esgRNA的DNA分子的表达盒、所述PmCDA1的编码基因的表达盒和所述UGI的编码基因的表达盒的重组表达载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内,也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。
在本发明的具体实施例中,上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内,所述重组表达载体具体为xCas9n-epBE-1重组表达载体、xCas9n-epBE-2重组表达载体、xCas9n-epBE-3重组表达载体、xCas9n-epBE-4重组表达载体、xCas9n-epBE-5重组表达载体或xCas9n-epBE-6重组表达载体。
所述xCas9n-epBE-1重组表达载体的序列为序列表中的序列1。所述xCas9n-epBE-1重组表达载体含有OsMPK2基因的如下两个靶点T1-1和T5-1,序列见表1。
所述xCas9n-epBE-2重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列,且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。
所述xCas9n-epBE-3重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第474-839位所示的DNA分子替换为序列8所示的DNA分子,且保持其他序列不变后得到的序列。所述xCas9n-epBE-3重组表达载体含有OsMPK5基因的如下四个靶点T4-1、T6-1、T1-2和T5-3,序列见表2。
所述xCas9n-epBE-4重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK2基因的另外两个靶点T4-2和T2-2的序列,且保持其他序列不变后得到的序列。OsMPK2基因的另外两个靶点T4-2和T2-2的序列见表2。
所述xCas9n-epBE-5重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列,且保持其他序列不变后得到的序列。OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列见表2。
所述xCas9n-epBE-6重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsWaxy基因的两个靶点T6-2和T6-3的序列,且保持其他序列不变后得到的序列。OsWaxy基因的两个靶点T6-2和T6-3的序列见表2。
为了解决上述技术问题,本发明还提供了一种生物突变体的制备方法。
本发明提供的生物突变体的制备方法包括如下步骤:按照上述基因组靶点序列的编辑方法对生物体的基因组靶点序列进行编辑,获得生物突变体。
上述任一所述方法中,所述靶点序列可为一个或两个或多个。
上述任一所述方法中,所述基因组靶点序列的编辑可为将所述靶点序列中的C突变为T。所述C可为位于所述靶点序列中任意位置的碱基C。
上述任一所述方法中,所述生物体为p1)或p2)或p3)或p4):p1)植物或动物;p2)单子叶植物或双子叶植物;p3)禾本科植物;p4)水稻(如日本晴水稻);
所述生物细胞为q1)或q2)或q3)或q4):q1)植物细胞或动物细胞;q2)单子叶植物细胞或双子叶植物细胞;q3)禾本科植物细胞;q4)水稻细胞(如日本晴水稻细胞)。
本发明提供了xCas9n-epBE碱基编辑系统在基因编辑中的应用。本发明的xCas9n-epBE碱基编辑系统包括xCas9n、PmCDA1、UGI和tRNA-esgRNA组成;所述tRNA-esgRNA靶向靶点序列;所述tRNA-esgRNA如式I所示:tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I)。通过实验证明:本发明的xCas9n-epBE碱基编辑系统在植物基因组中实现了靶点序列的编辑,尤其是在PAM序列为NGT、NGA、NGG、GAA或GAT时实现了靶点序列中由碱基C到碱基T的替换。本发明的xCas9n-epBE碱基编辑系统在植物或动物基因编辑中具有广泛的应用前景。
附图说明
图1为四种碱基编辑系统中各元件结构示意图。
图2为四种碱基编辑系统的C·T碱基替换效率。
图3为相应位置C发生C·T碱基替换的靶点数占相应位置恰好为C的所有可编辑靶点数的比例。
图4为相应位置C发生C·T碱基替换的阳性T0苗数占相应位置恰好为C的所有被编辑的阳性T0苗数的比例。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
引物对T1-1由引物T1-1-F:5’-tgtgacaaaatctagccatttttc-3’和引物T1-1-R:5’-caacattcccatgaacagatg-3’组成,用于扩增靶点T1-1。
引物对T1-2由引物T1-2-F:5’-tcaagtacatccactcggcg-3’和引物T1-2-R:5’-gccagtcaaagaagcagtgc-3’组成,用于扩增靶点T1-2。
引物对T2-1由引物T2-1-F:5’-tcaagctcctcaggcacctc-3’和引物T2-1-R:5’-cagcaagcacgagttggg-3’组成,用于扩增靶点T2-1。
引物对T2-2由引物T2-2-F:5’-tgtgacaaaatctagccatttttc-3’和引物T2-2-R:5’-gctgggatcaaacacaagc-3’组成,用于扩增靶点T2-2。
引物对T3-1由引物T3-1-F:5’-aacacggtcaccaacttcatc-3’和引物T3-1-R:5’-cccacatgaatgatgcatatg-3’组成,用于扩增靶点T3-1。
引物对T3-2由引物T3-2-F:5’-taagcacacacaaacttcgatc-3’和引物T3-2-R:5’-gcagacgaacacaacatcctc-3’组成,用于扩增靶点T3-2。
引物对T4-1由引物T4-1-F:5’-ttccctttttaatagctgccttc-3’和引物T4-1-R:5’-gtgttgttgtagcagttagtgacag-3’组成,用于扩增靶点T4-1。
引物对T4-2由引物T4-2-F:5’-tgtgacaaaatctagccatttttc-3’和引物T4-2-R:5’-tgccctgtaccatcgagtaac-3’组成,用于扩增靶点T4-2。
引物对T5-1由引物T5-1-F:5’-cataggttgaagctttggattatg-3’和引物T5-1-R:5’-gttcttcattggaaattcatctagtg-3’组成,用于扩增靶点T5-1。
引物对T5-2由引物T5-2-F:5’-tcaagctcctcaggcacctc-3’和引物T5-2-R:5’-cagcaagcacgagttggg-3’组成,用于扩增靶点T5-2。
引物对T5-3由引物T5-3-F:5’-tcaagtacatccactcggcg-3’和引物T5-3-R:5’-gccagtcaaagaagcagtgc-3’组成,用于扩增靶点T5-3。
引物对T6-1由引物T6-1-F:5’-ttccctttttaatagctgccttc-3’和引物T6-1-R:5’-gtgttgttgtagcagttagtgacag-3’组成,用于扩增靶点T6-1。
引物对T6-2由引物T6-2-F:5’-ttcaggtcatccttcgatttc-3’和引物T6-2-R:5’-gatacttctcctccatgctcttg-3’组成,用于扩增靶点T6-2。
引物对T6-3由引物T6-3-F:5’-gcgaagaactgggagaatgtg-3’和引物T6-3-R:5’-acacacataaattcagggtccg-3’组成,用于扩增靶点T6-3。
以下实施例中,C·T碱基替换是指靶点序列中任何位置的C突变为T。
C·T碱基替换效率=发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100%。
纯合突变体定义为所有发生C·T碱基替换的位点均为纯合突变的T0苗。反之则为杂合突变体。
日本晴水稻:参考文献:梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.;公众可以从北京市农林科学院获得。
恢复培养基:含有200mg/L特美汀的N6固体培养基。
筛选培养基:含有50mg/L潮霉素的N6固体培养基。
分化培养基:含有2mg/L KT、0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。
生根培养基:含有0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。
实施例1、四种碱基编辑系统载体的构建及其在水稻基因组编辑中的应用
一、重组表达载体的构建
本实施例中的重组表达载体分为如下四种:xCas9n-erBE重组表达载体、xCas9n-rBE重组表达载体、xCas9n-epBE重组表达载体和xCas9n-pBE重组表达载体。各载体均为环状质粒。
四种重组表达载体各元件结构示意图如图1所示。其中xCas9n-erBE重组表达载体和xCas9n-rBE重组表达载体均使用的是基于rAPOBEC1的tRNA系统,二者的区别仅在于sgRNA骨架结构的不同。xCas9n-epBE重组表达载体和xCas9n-pBE重组表达载体均使用的是基于PmCDA1的tRNA系统,二者的区别也仅在于sgRNA骨架结构的不同。
根据含有的靶点序列不同,每种重组表达载体又各自分成两种,共有如下八种重组表达载体:xCas9n-epBE-1重组表达载体、xCas9n-epBE-2重组表达载体、xCas9n-pBE-1重组表达载体、xCas9n-pBE-2重组表达载体、xCas9n-erBE-1重组表达载体、xCas9n-erBE-2重组表达载体、xCas9n-rBE-1重组表达载体和xCas9n-rBE-2重组表达载体。
人工合成上述八种重组表达载体,八种重组表达载体的具体结构描述分别如下:
xCas9n-epBE-1重组表达载体的序列为序列表中的序列1。其中,序列1的第131-467位为OsU3启动子的核苷酸序列,第474-550位和第657-733位均为tRNA的核苷酸序列,第551-656位和第734-839位分别为靶向OsMPK2基因的两个esgRNA的核苷酸序列,这两个esgRNA的共同sgRNA骨架(记为esgRNA骨架)的核苷酸序列为序列1的第571-656位或序列1的第754-839位,第840-1130位为OsU3终止子的核苷酸序列;序列1的第1137-2850位为OsUbq3启动子的核苷酸序列,第2857-7125位为xCas9n 3.7蛋白质的编码序列(不含有终止密码子),编码序列2所示的xCas9n 3.7蛋白质;序列1的第7417-8040位为PmCDA1蛋白质的编码序列(不含有终止密码子),编码序列3所示的PmCDA1蛋白质;序列1的第8062-8358位为UGI蛋白质的编码序列,编码序列4所示的UGI蛋白质;序列1的第8365-8559位为35S终止子的核苷酸序列;序列1的第8634-10626位为ZmUbi1启动子的核苷酸序列,第10633-11655位为潮霉素磷酸转移酶的编码序列,第11685-11900位为CaMV35S polyA的核苷酸序列。xCas9n-epBE-1重组表达载体中的两个靶点分别为T1-1和T5-1,序列见表1。
xCas9n-epBE-2重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列,且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。
xCas9n-pBE-1重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第571-656位和第754-839位所示的esgRNA骨架核苷酸序列均替换为序列5所示的sgRNA骨架(记为对照sgRNA骨架)的核苷酸序列,且保持其他序列不变后得到的序列。
xCas9n-pBE-2重组表达载体的序列为将xCas9n-pBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列,且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。
xCas9n-erBE-1重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第2857-8061位所示的DNA分子替换为序列6所示的DNA分子,且保持其他序列不变后得到的序列。其中,序列6第1-687位为rAPOBEC1蛋白质的编码序列(不含有终止密码子),编码序列7所示的rAPOBEC1蛋白质,第736-5004位为xCas9n 3.7蛋白质的编码序列(不含有终止密码子),编码序列2所示的xCas9n 3.7蛋白质。xCas9n-erBE-1重组表达载体中的两个靶点分别为T1-1和T5-1,序列见表1。
xCas9n-erBE-2重组表达载体的序列为将xCas9n-erBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列,且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。
xCas9n-rBE-1重组表达载体的序列为将xCas9n-erBE-1重组表达载体序列中序列1第571-656位和第754-839位所示的esgRNA骨架核苷酸序列均替换为序列5所示的对照sgRNA骨架核苷酸序列,且保持其他序列不变后得到的序列。
xCas9n-rBE-2重组表达载体的序列为将xCas9n-rBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK5基因的两个靶点T2-1和T5-2的序列,且保持其他序列不变后得到的序列。OsMPK5基因的两个靶点T2-1和T5-2的序列见表1。
各载体的sgRNA(esgRNA或对照sgRNA)的靶点核苷酸序列及相应的PAM序列如表1所示。
表1各载体的sgRNA(esgRNA或对照sgRNA)的靶点核苷酸序列及相应的PAM序列
Figure BDA0002185509010000081
二、水稻阳性抗性愈伤的获得
将步骤一获得的xCas9n-epBE-1重组表达载体,xCas9n-epBE-2重组表达载体,xCas9n-pBE-1重组表达载体,xCas9n-pBE-2重组表达载体,xCas9n-erBE-1重组表达载体,xCas9n-erBE-2重组表达载体,xCas9n-rBE-1重组表达载体和xCas9n-rBE-2重组表达载体分别按照如下步骤1-8进行操作:
1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品,CAT#:AC1010),得到重组农杆菌。
2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌,28℃,150rpm震荡培养至OD600为1.0-2.0,室温条件下,10000rpm离心1min,用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖,葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD600为0.2,得到农杆菌侵染液。
3、水稻品种日本晴成熟种子去壳脱粒,置于100mL三角瓶中,加入70%(v/v)乙醇水溶液浸泡30sec,再置于25%(v/v)次氯酸钠水溶液中,120rpm震荡灭菌30min,无菌水冲洗3次,用滤纸吸干水分,然后将种子胚朝下置于N6固体培养基上,28℃暗培养4-6周,得到水稻愈伤。
4、完成步骤3后,将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体,乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl:50ml)中浸泡10min,然后,放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上,21℃暗培养1天。
5、取步骤4得到的水稻愈伤放入恢复培养基上,25-28℃暗培养3天。
6、取步骤5得到的水稻愈伤,置于筛选培养基上,28℃暗培养2周。
7、取步骤6得到的水稻愈伤,再次置于筛选培养基上,28℃暗培养2周,得到水稻抗性愈伤。
8、分别提取20块水稻抗性愈伤的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻抗性愈伤为水稻阳性抗性愈伤;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。
三、结果分析
1、每载体分别取步骤二所获得的20块水稻阳性抗性愈伤的基因组DNA作为模板,对于T1-1靶点,采用引物对T1-1进行PCR扩增,得到PCR扩增产物;对于T2-1靶点,采用引物对T2-1进行PCR扩增,得到PCR扩增产物;对于T5-1靶点,采用引物对T5-1进行PCR扩增,得到PCR扩增产物;对于T5-2靶点,采用引物对T5-2进行PCR扩增,得到PCR扩增产物。
2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数,计算得出C·T碱基替换效率,结果见图2。
结果表明,xCas9n-erBE和xCas9-rBE碱基编辑系统对四个靶点均未实现C·T碱基替换,xCas9n-pBE也仅实现对T1-1靶点的编辑,而xCas9n-epBE表现最好,对四个靶点均成功实现C·T碱基替换,编辑效率范围为5%-70%。说明xCas9n-epBE是有效的碱基编辑系统,能够在水稻基因组中实现C·T碱基替换。
实施例2、xCas9n-epBE碱基编辑系统可实现对水稻基因组中PAM序列为NGG,NGT,NGA,GAA和GAT的靶点进行碱基编辑
一、重组表达载体的构建
人工合成如下重组表达载体:xCas9n-epBE-3重组表达载体,xCas9n-epBE-4重组表达载体,xCas9n-epBE-5重组表达载体和xCas9n-epBE-6重组表达载体。各载体均为环状质粒。
xCas9n-epBE-3重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中序列1第474-839位所示的DNA分子替换为序列8所示的DNA分子,且保持其他序列不变后得到的序列。其中,序列8的第1-77位、第184-260位、第367-443位和第550-626位均为tRNA的核苷酸序列,第78-183位、第261-366位、第444-549位和第627-732位分别为靶向OsMPK5基因的四个sgRNA的核苷酸序列,这四个sgRNA的共同sgRNA骨架(esgRNA骨架)的核苷酸序列为序列1的第571-656位。xCas9n-epBE-3重组表达载体中四个靶点分别为T4-1、T6-1、T1-2和T5-3,序列见表2。
xCas9n-epBE-4重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsMPK2基因的另外两个靶点T4-2和T2-2的序列,且保持其他序列不变后得到的序列。OsMPK2基因的另外两个靶点T4-2和T2-2的序列见表2。
xCas9n-epBE-5重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列,且保持其他序列不变后得到的序列。OsNRT1.1B基因的一个靶点T3-1的序列和OsWaxy基因的一个靶点T3-2的序列见表2。
xCas9n-epBE-6重组表达载体的序列为将xCas9n-epBE-1重组表达载体序列中OsMPK2基因的两个靶点T1-1和T5-1的序列分别替换为OsWaxy基因的两个靶点T6-2和T6-3的序列,且保持其他序列不变后得到的序列。OsWaxy基因的两个靶点T6-2和T6-3的序列见表2。
各载体的esgRNA的靶点核苷酸序列及相应的PAM序列如表2所示。
表2各载体的esgRNA的靶点核苷酸序列及相应的PAM序列
Figure BDA0002185509010000101
二、水稻植株中对靶点进行碱基编辑
1、将步骤一构建的xCas9n-epBE-3重组表达载体,xCas9n-epBE-4重组表达载体,xCas9n-epBE-5重组表达载体,xCas9n-epBE-6重组表达载体和实施例1步骤一构建的xCas9n-epBE-1重组表达载体,xCas9n-epBE-2重组表达载体,分别按照实施例1步骤二的1-7进行操作,得到水稻抗性愈伤。
2、取步骤1得到的水稻抗性愈伤放入分化培养基上,25℃光照培养1个月左右,将分化出来的小苗移至生根培养基上,25℃光照培养2周,获取水稻T0苗。
3、分别提取水稻T0苗的基因组DNA并以其作为模板,采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增,得到PCR扩增产物;将该PCR扩增产物进行琼脂糖凝胶电泳,然后进行如下判断:如果PCR扩增产物中含有约1150bp的DNA片段,则相应的水稻T0苗为水稻阳性T0苗;如果PCR扩增产物中不含有约1150bp的DNA片段,则相应的水稻T0苗不为水稻阳性T0苗。
4、各载体分别取步骤3所获得的水稻阳性T0苗的基因组DNA作为模板,对于T1-1靶点,采用引物对T1-1进行PCR扩增,得到PCR扩增产物;对于T1-2靶点,采用引物对T1-2进行PCR扩增,得到PCR扩增产物;对于T2-1靶点,采用引物对T2-1进行PCR扩增,得到PCR扩增产物;对于T2-2靶点,采用引物对T2-2进行PCR扩增,得到PCR扩增产物;对于T3-1靶点,采用引物对T3-1进行PCR扩增,得到PCR扩增产物;对于T3-2靶点,采用引物对T3-2进行PCR扩增,得到PCR扩增产物;对于T4-1靶点,采用引物对T4-1进行PCR扩增,得到PCR扩增产物;对于T4-2靶点,采用引物对T4-2进行PCR扩增,得到PCR扩增产物;对于T5-1靶点,采用引物对T5-1进行PCR扩增,得到PCR扩增产物;对于T5-2靶点,采用引物对T5-2进行PCR扩增,得到PCR扩增产物;对于T5-3靶点,采用引物对T5-3进行PCR扩增,得到PCR扩增产物;对于T6-1靶点,采用引物对T6-1进行PCR扩增,得到PCR扩增产物;对于T6-2靶点,采用引物对T6-2进行PCR扩增,得到PCR扩增产物;对于T6-3靶点,采用引物对T6-3进行PCR扩增,得到PCR扩增产物。
5、将步骤4得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计靶点T1-1、T1-2、T2-1、T2-2、T3-1、T3-2、T4-1、T4-2、T5-1、T5-2、T5-3、T6-1、T6-2和T6-3的发生C·T碱基替换的阳性T0苗数,计算得出C·T碱基替换效率,结果见表3。
结果表明,xCas9n-epBE碱基编辑系统,除了不能对两个PAM序列为NGC的T4-1和T4-2靶点编辑外,对其他PAM序列的靶点均能够有效编辑,得到C·T碱基替换的T0苗,碱基编辑效率为5%-64.3%。由此表明xCas9n-epBE碱基编辑系统可以对水稻基因组中PAM序列为NGG,NGT,NGA,GAA和GAT的靶点序列进行碱基编辑,实现C·T碱基替换,大大拓展了碱基编辑范围。
表3基因编辑效率分析结果
Figure BDA0002185509010000111
三、xCas9n-epBE碱基编辑系统的编辑窗口、编辑偏好性及创制的突变体类型分析
1、xCas9n-epBE碱基编辑系统的编辑窗口分析
将步骤二的5中得到的各载体各靶点的发生C·T碱基替换的阳性T0苗的靶点序列综合在一起进行分析,结果见表4。
结果表明,xCas9n-epBE碱基编辑系统的编辑窗口主要集中在靶点的1-7位(靶点5’端计为第1位),偶尔也会发生在其他位置。
2、xCas9n-epBE碱基编辑系统的编辑偏好性分析
进一步针对所有可编辑靶点及所获得的所有被编辑的阳性T0苗,分析不同位置C发生突变的情况,即分析xCas9n-epBE碱基编辑系统的编辑偏好性,结果见图3和图4。
结果表明,C2,C3,C4和C5的发生频率相当,且均高于C1,C6和C7,C10和C14与C1,C6和C7相当。
3、xCas9n-epBE碱基编辑系统创制的突变体类型分析
对xCas9n-epBE碱基编辑系统创制的突变体类型的分析结果见表5和表6。
结果表明,xCas9n-epBE碱基编辑系统所创制的突变体类型主要为单个C突变和两个C同时突变。
表4靶点突变情况
Figure BDA0002185509010000121
表5靶点中各突变类型所占比例
突变类型 靶点数 突变类型比例(%)
总数 15
仅单个C突变 4 26.7
仅两个C同时突变 4 26.7
单个C突变或两个C同时突变 4 26.7
两个C或三个C同时突变 1 6.7
单个C突变、两个C或三个C同时突变 1 6.7
仅多个C同时突变(大于三个C) 1 6.7
表6阳性T0苗中各突变类型所占比例
Figure BDA0002185509010000122
Figure BDA0002185509010000131
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。
序列表
<110>北京市农林科学院
<120>xCas9n-epBE碱基编辑系统在基因编辑中的应用
<160>8
<170>PatentIn version 3.5
<210>1
<211>18306
<212>DNA
<213>人工序列(Artificial Sequence)
<400>1
ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60
ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120
ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180
tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240
gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300
aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360
ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420
acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540
ggctggtgca acactgcagc tattgatatc gtttcagagc tatgctggaa acagcatagc 600
aagttgaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca 660
aagcaccagt ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt 720
cccggctggt gcacccttca tgagatatat gatgtttcag agctatgctg gaaacagcat 780
agcaagttga aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 840
tttttttttc gttttgcatt gagttttctc cgtcgcatgt ttgcagtttt attttccgtt 900
ttgcattgaa atttctccgt ctcatgtttg cagcgtgttc aaaaagtacg cagctgtatt 960
tcacttattt acggcgccac attttcatgc cgtttgtgcc aactatcccg agctagtgaa 1020
tacagcttgg cttcacacaa cactggtgac ccgctgacct gctcgtacct cgtaccgtcg 1080
tacggcacag catttggaat taaagggtgt gatcgatact gcttgctgct aagcttacaa 1140
attcgggtca aggcggaagc cagcgcgcca ccccacgtca gcaaatacgg aggcgcgggg 1200
ttgacggcgt cacccggtcc taacggcgac caacaaacca gccagaagaa attacagtaa 1260
aaaaaaagta aattgcactt tgatccacct tttattacct aagtctcaat ttggatcacc 1320
cttaaaccta tcttttcaat ttgggccggg ttgtggtttg gactaccatg aacaactttt 1380
cgtcatgtct aacttccctt tcagcaaaca tatgaaccat atatagagga gatcggccgt 1440
atactagagc tgatgtgttt aaggtcgttg attgcacgag aaaaaaaaat ccaaatcgca 1500
acaatagcaa atttatctgg ttcaaagtga aaagatatgt ttaaaggtag tccaaagtaa 1560
aacttataga taataaaatg tggtccaaag cgtaattcac tcaaaaaaaa tcaacgagac 1620
gtgtaccaaa cggagacaaa cggcatcttc tcgaaatttc ccaaccgctc gctcgcccgc 1680
ctcgtcttcc cggaaaccgc ggtggtttca gcgtggcgga ttctccaagc agacggagac 1740
gtcacggcac gggactcctc ccaccaccca accgccataa ataccagccc cctcatctcc 1800
tctcctcgca tcagctccac ccccgaaaaa tttctcccca atctcgcgag gctctcgtcg 1860
tcgaatcgaa tcctctcgcg tcctcaaggt acgctgcttc tcctctcctc gcttcgtttc 1920
gattcgattt cggacgggtg aggttgtttt gttgctagat ccgattggtg gttagggttg 1980
tcgatgtgat tatcgtgaga tgtttagggg ttgtagatct gatggttgtg atttgggcac 2040
ggttggttcg ataggtggaa tcgtggttag gttttgggat tggatgttgg ttctgatgat 2100
tggggggaat ttttacggtt agatgaattg ttggatgatt cgattgggga aatcggtgta 2160
gatctgttgg ggaattgtgg aactagtcat gcctgagtga ttggtgcgat ttgtagcgtg 2220
ttccatcttg taggccttgt tgcgagcatg ttcagatcta ctgttccgct cttgattgag 2280
ttattggtgc catgggttgg tgcaaacaca ggctttaata tgttatatct gttttgtgtt 2340
tgatgtagat ctgtagggta gttcttctta gacatggttc aattatgtag cttgtgcgtt 2400
tcgatttgat ttcatatgtt cacagattag ataatgatga actcttttaa ttaattgtca 2460
atggtaaata ggaagtcttg tcgctatatc tgtcataatg atctcatgtt actatctgcc 2520
agtaatttat gctaagaact atattagaat atcatgttac aatctgtagt aatatcatgt 2580
tacaatctgt agttcatcta tataatctat tgtggtaatt tctttttact atctgtgtga 2640
agattattgc cactagttca ttctacttat ttctgaagtt caggatacgt gtgctgttac 2700
tacctatctg aatacatgtg tgatgtgcct gttactatct ttttgaatac atgtatgttc 2760
tgttggaata tgtttgctgt ttgatccgtt gttgtgtcct taatcttgtg ctagttctta 2820
ccctatctgt ttggtgatta tttcttgcag tacgtaatgg actacaagga ccacgacggg 2880
gattacaaag accacgacat agactacaag gatgacgatg acaaaatggc accgaagaaa 2940
aaaaggaagg tcggaatcca tggcgttcca gctgccgata agaaatattc catcggactc 3000
gccattggca cgaatagcgt cggatgggct gttattactg atgagtacaa agttccgtct 3060
aagaagttca aggtgctggg caacacagac cgccacagca taaagaaaaa tctcatcggt 3120
gcactccttt tcgatagtgg ggagactgca gaagcgacaa gattgaaaag gactgcgaga 3180
aggcgctata cacggcgtaa gaatagaatc tgctaccttc aggagatttt ctctaacgaa 3240
atggctaagg tcgatgacag tttctttcat agacttgagg aatcgttctt ggttgaggag 3300
gataagaaac atgagaggca cccgatattt ggaaacatcg tggatgaggt cgcatatcat 3360
gaaaagtacc ccacaatcta ccacctgaga aagaaactcg ttgattccac cgacaaagcg 3420
gatttgagac tcatctacct cgctcttgcc catatgataa agttccgcgg acactttctg 3480
atcgagggcg acctcaaccc tgataatagc gacgtcgata agctcttcat ccagttggtt 3540
caaacctaca atcagctctt tgaggaaaac ccaattaatg ctagtggagt ggatgcaaaa 3600
gcgatactgt cggccagact ctccaagagc agaaggttgg agaacctgat cgctcaactt 3660
cctggagaaa agaaaaacgg tctttttggg aatttgattg ccttgtctct gggcctcaca 3720
ccaaacttca agtcaaattt tgacctcgct gaggatacca aacttcagtt gtctaaggat 3780
acctatgatg acgatcttga caatttgctg gcacaaattg gcgaccagta cgcggatctg 3840
ttcctcgcag cgaagaatct gagtgatgct attctccttt cggacatact cagggttaac 3900
actgagatca caaaagcacc tttgagtgcg tcgatgatta agctgtatga tgaacatcac 3960
caagacctca ctttgctgaa ggcccttgtg cggcagcaat tgccagagaa gtacaaagaa 4020
atcttctttg accaatctaa gaacggatac gctggctata ttgatggagg agcttctcag 4080
gaggaattct ataagtttat caaacctata cttgagaaga tggatggtac agaggaactc 4140
cttgttaaat tgaacagaga agatttgctg cgcaagcaac ggacctttga caacggaatc 4200
attccgcatc agatacacct cggcgagctt catgccatcc ttcgccggca ggaagatttc 4260
tacccctttt tgaaggacaa ccgcgagaag atagaaaaaa tccttacgtt ccggattcct 4320
tactatgtgg gtccattggc aagggggaat tcccgctttg cgtggatgac tcggaaaagc 4380
gaggaaacta tcacaccgtg gaacttcgag aaagttgtgg acaagggagc ttctgcccaa 4440
tcattcattg agaggatgac taacttcgat aagaacctgc cgaacgagaa agttctcccc 4500
aagcactccc tcctttacga gtatttcacc gtgtataacg aacttacgaa ggttaaatac 4560
gtgactgagg gtatgaggaa gccagcattc ttgagcgggg atcaaaagaa agcgattgtt 4620
gatttgctgt ttaaaactaa tcgcaaggtg acagtcaagc agctcaaaga ggattatttc 4680
aagaaaattg aatgtttcga ctctgtggag atatcaggag tcgaagatag gtttaacgct 4740
tcccttggca cataccatga cctccttaag atcattaagg acaaagattt cctggataac 4800
gaggaaaatg aggacatcct cgaagatatt gttcttacct tgacgctgtt tgaggatcgc 4860
gaaatgatcg aggaacggct taagacgtat gctcacttgt tcgacgataa ggttatgaag 4920
cagctcaagc gtagaaggta cactggatgg ggccgtctgt ctagaaagct catcaacgga 4980
atacgtgata aacaaagtgg caagacaatt ttggattttc tgaagtcgga cggattcgcc 5040
aacagaaatt ttattcagct gattcatgac gatagtctca ccttcaaaga ggacatacag 5100
aaggctcaag tgagtggtca aggggattcg ctgcatgaac acatcgcaaa cctcgcgggt 5160
tcaccggcca taaagaaagg aatccttcaa actgttaagg tcgttgatga gttggttaaa 5220
gtgatgggta ggcacaagcc cgaaaacata gtgatcgaga tggctcgcga aaatcagact 5280
acacaaaaag ggcagaagaa ctctcgcgag cggatgaaaa ggattgagga aggaatcaag 5340
gaactgggct cacagattct caaagagcat ccagtcgaaa acacacagct gcaaaatgag 5400
aagctctatc tttactatct ccaaaatggc cgggacatgt atgttgatca ggagcttgac 5460
atcaaccgtt tgtccgacta tgatgtggac cacattgtcc cgcaatcttt ccttaaggac 5520
gattcaatcg ataataaggt gttgacccgg agcgataaaa accgtggaaa gtctgacaat 5580
gtcccttcag aggaagtggt taagaagatg aagaactact ggagacaatt gctgaatgca 5640
aaactgatca cacagagaaa gttcgacaac ctcaccaaag cagagagagg tgggctcagt 5700
gaacttgata aagcgggctt cattaagcgt cagctcgttg agactagaca gatcacgaag 5760
catgtcgcgc agattttgga ttcgcggatg aacacgaagt acgacgagaa tgataaactg 5820
atacgtgaag tcaaggttat cactcttaag tccaaattgg tgagcgattt cagaaaggac 5880
ttccaattct ataaggtcag ggagatcaac aattatcatc acgctcacga tgcctacctt 5940
aatgctgttg tggggaccgc ccttattaag aaatacccta aattggagtc tgaattcgtt 6000
tacggggatt ataaggtcta cgacgttagg aaaatgatag ctaagagtga gcaggagatc 6060
ggtaaagcaa ctgcgaagta tttcttttac tcgaacatca tgaatttctt taagaccgag 6120
ataacgctgg caaatggcga aattagaaag aggcctctca tagagactaa cggtgagaca 6180
ggggaaatcg tctgggataa gggtagggac tttgcgacag tgcgcaaggt cctctctatg 6240
ccgcaagtta atattgtgaa gaaaaccgag gtgcagacgg gaggcttctc caaggaaagc 6300
atacttccca aacggaactc tgataagttg atcgctcgta agaaagattg ggaccctaag 6360
aaatatggtg ggttcgattc cccaactgtt gcttacagcg tgctggtcgt tgccaaggtc 6420
gagaagggta aatccaagaa actcaaaagc gttaaggaac tccttgggat tactatcatg 6480
gagagatctt cattcgaaaa gaatcctatc gactttcttg aggccaaagg atataaggaa 6540
gttaagaaag atctgataat caaactccca aagtactcat tgtttgagct ggaaaacggc 6600
aggaagcgca tgcttgcttc cgccggagtt ttgcagaaag ggaacgagtt ggctctgcct 6660
tctaagtatg ttaacttcct ctatcttgcc tctcattacg agaagctcaa aggctcacca 6720
gaggacaacg aacagaaaca actttttgtc gagcaacata agcactattt ggatgagatt 6780
atagaacaga tcagtgaatt ctcgaaaagg gttatccttg cagatgcgaa tcttgacaag 6840
gtgttgtctg catacaacaa acatagagat aagccgatca gggagcaagc ggaaaatatc 6900
attcacctct tcactcttac aaacttgggt gctcccgctg ccttcaagta ttttgatacc 6960
acgattgacc ggaaacgtta cacctcaacg aaggaggtgc tggatgccac cctcatccac 7020
caatctatta ccggactcta cgagactaga atcgatctct cacagctcgg cggggataaa 7080
agaccagcag cgacgaaaaa ggcaggacag gctaagaaga agaaagagct cggaggagga 7140
ggcacgggag gaggaggctc cgccgagtat gtgcgcgcgc tcttcgactt caacggcaat 7200
gacgaggagg atctcccttt caagaagggc gacatcctcc gcatccgcga taagccggag 7260
gagcagtggt ggaacgcaga ggactccgag ggcaagcggg gcatgatcct ggtgccatac 7320
gtcgagaagt acagcggcga ttacaaggac cacgatggcg actacaagga tcatgacatc 7380
gattacaagg acgatgacga taagtccggc gtcgacatga cggacgcgga gtatgtgcgc 7440
atccacgaga agctcgatat ctacaccttc aagaagcagt tcttcaacaa taagaagtcg 7500
gtgtcccatc ggtgctacgt cctcttcgag ctgaagcgca ggggagagcg ccgcgcctgc 7560
ttctggggct acgcggtgaa taagccgcag tcaggcacag agcgcggcat ccacgccgag 7620
atcttctcga tccggaaggt cgaggagtac ctccgcgaca acccaggcca gttcacgatc 7680
aattggtact ccagctggtc cccttgcgca gattgcgcag agaagatcct cgagtggtac 7740
aaccaggagc tgaggggcaa tggccatacc ctcaagatct gggcctgcaa gctgtactac 7800
gagaagaacg cgaggaatca gatcggcctc tggaacctgc gggataatgg cgtgggcctc 7860
aacgtgatgg tgtccgagca ctaccagtgc tgccgcaaga tcttcatcca gtcctcccac 7920
aatcagctga acgagaatag gtggctcgaa aagaccctga agcgcgccga gaagtggagg 7980
agcgagctgt ctatcatgat ccaggtcaag atcctgcaca ccacaaagtc accggcggtg 8040
ggcggcggcg gcagcgaatt ctccggcggc agcacgaacc tcagcgacat catcgagaag 8100
gagacaggca agcagctcgt gatccaggag tctatcctca tgctgcctga ggaggtggag 8160
gaggtcatcg gcaacaagcc ggagtccgat atcctcgtgc acaccgccta cgacgagtcg 8220
acagatgaga atgtcatgct cctgacctcc gacgcaccag agtacaagcc atgggcgctc 8280
gtgatccagg attccaacgg cgagaataag atcaagatgc tgtctggcgg ctccccgaag 8340
aagaagcgca aggtctagac tagtctgaaa tcaccagtct ctctctacaa atctatctct 8400
ctctataata atgtgtgagt agttcccaga taagggaatt agggttctta tagggtttcg 8460
ctcatgtgtt gagcatataa gaaaccctta gtatgtattt gtatttgtaa aatacttcta 8520
tcaataaaat ttctaattcc taaaaccaaa atccagtggg gcgcccgacc tgtactcgcg 8580
aaggttaact tacagagagt gtccgggcgc gcctggtgga tcgtccgcct aggctgcagt 8640
gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 8700
aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 8760
acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 8820
gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 8880
gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 8940
aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 9000
gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 9060
aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 9120
gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 9180
gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 9240
aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 9300
gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 9360
ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 9420
ggcctcctcc tcctctcacg gcaccggcag ctacggggga ttcctttccc accgctcctt 9480
cgctttccct tcctcgcccg ccgtaataaa tagacacccc ctccacaccc tctttcccca 9540
acctcgtgtt gttcggagcg cacacacaca caaccagatc tcccccaaat ccacccgtcg 9600
gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc ccccctctct accttctcta 9660
gatcggcgtt ccggtccatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt 9720
agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg 9780
tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct 9840
ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt 9900
ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt 9960
catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg 10020
gagtagaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt 10080
gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag 10140
gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg 10200
ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact 10260
gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt 10320
catagttacg agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg 10380
tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc 10440
ttgagtacct atctattata ataaacaagt atgttttata attattttga tcttgatata 10500
cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc 10560
tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt 10620
ctgcaggagc tcatgaaaaa gcctgaactc accgcgacgt ctgtcgagaa gtttctgatc 10680
gaaaagttcg acagcgtctc cgacctgatg cagctctcgg agggcgaaga atctcgtgct 10740
ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg taaatagctg cgccgatggt 10800
ttctacaaag atcgttatgt ttatcggcac tttgcatcgg ccgcgctccc gattccggaa 10860
gtgcttgaca ttggggagtt tagcgagagc ctgacctatt gcatctcccg ccgttcacag 10920
ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg ctgttctaca accggtcgcg 10980
gaggctatgg atgcgatcgc tgcggccgat cttagccaga cgagcgggtt cggcccattc 11040
ggaccgcaag gaatcggtca atacactaca tggcgtgatt tcatatgcgc gattgctgat 11100
ccccatgtgt atcactggca aactgtgatg gacgacaccg tcagtgcgtc cgtcgcgcag 11160
gctctcgatg agctgatgct ttgggccgag gactgccccg aagtccggca cctcgtgcac 11220
gcggatttcg gctccaacaa tgtcctgacg gacaatggcc gcataacagc ggtcattgac 11280
tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg ccaacatctt cttctggagg 11340
ccgtggttgg cttgtatgga gcagcagacg cgctacttcg agcggaggca tccggagctt 11400
gcaggatcgc cacgactccg ggcgtatatg ctccgcattg gtcttgacca actctatcag 11460
agcttggttg acggcaattt cgatgatgca gcttgggcgc agggtcgatg cgacgcaatc 11520
gtccgatccg gagccgggac tgtcgggcgt acacaaatcg cccgcagaag cgcggccgtc 11580
tggaccgatg gctgtgtaga agtactcgcc gatagtggaa accgacgccc cagcactcgt 11640
ccgagggcaa agaaatagag tagatgccga ccgggatctg tcgatcgaca agctcgagtt 11700
tctccataat aatgtgtgag tagttcccag ataagggaat tagggttcct atagggtttc 11760
gctcatgtgt tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct 11820
atcaataaaa tttctaattc ctaaaaccaa aatccagtac taaaatccag atcccccgaa 11880
ttaattcggc gttaattcag cctgcaggac gcgtttaatt aagtgcacgc ggccgcctac 11940
ttagtcaaga gcctcgcacg cgactgtcac gcggccagga tcgcctcgtg agcctcgcaa 12000
tctgtaccta gtgtttaaac tatcagtgtt tgacaggata tattggcggg taaacctaag 12060
agaaaagagc gtttattaga ataacggata tttaaaaggg cgtgaaaagg tttatccgtt 12120
cgtccatttg tatgtgcatg ccaaccacag ggttcccctc gggatcaaag tactttgatc 12180
caacccctcc gctgctatag tgcagtcggc ttctgacgtt cagtgcagcc gtcttctgaa 12240
aacgacatgt cgcacaagtc ctaagttacg cgacaggctg ccgccctgcc cttttcctgg 12300
cgttttcttg tcgcgtgttt tagtcgcata aagtagaata cttgcgacta gaaccggaga 12360
cattacgcca tgaacaagag cgccgccgct ggcctgctgg gctatgcccg cgtcagcacc 12420
gacgaccagg acttgaccaa ccaacgggcc gaactgcacg cggccggctg caccaagctg 12480
ttttccgaga agatcaccgg caccaggcgc gaccgcccgg agctggccag gatgcttgac 12540
cacctacgcc ctggcgacgt tgtgacagtg accaggctag accgcctggc ccgcagcacc 12600
cgcgacctac tggacattgc cgagcgcatc caggaggccg gcgcgggcct gcgtagcctg 12660
gcagagccgt gggccgacac caccacgccg gccggccgca tggtgttgac cgtgttcgcc 12720
ggcattgccg agttcgagcg ttccctaatc atcgaccgca cccggagcgg gcgcgaggcc 12780
gccaaggccc gaggcgtgaa gtttggcccc cgccctaccc tcaccccggc acagatcgcg 12840
cacgcccgcg agctgatcga ccaggaaggc cgcaccgtga aagaggcggc tgcactgctt 12900
ggcgtgcatc gctcgaccct gtaccgcgca cttgagcgca gcgaggaagt gacgcccacc 12960
gaggccaggc ggcgcggtgc cttccgtgag gacgcattga ccgaggccga cgccctggcg 13020
gccgccgaga atgaacgcca agaggaacaa gcatgaaacc gcaccaggac ggccaggacg 13080
aaccgttttt cattaccgaa gagatcgagg cggagatgat cgcggccggg tacgtgttcg 13140
agccgcccgc gcacgtctca accgtgcggc tgcatgaaat cctggccggt ttgtctgatg 13200
ccaagctggc ggcctggccg gccagcttgg ccgctgaaga aaccgagcgc cgccgtctaa 13260
aaaggtgatg tgtatttgag taaaacagct tgcgtcatgc ggtcgctgcg tatatgatgc 13320
gatgagtaaa taaacaaata cgcaagggga acgcatgaag gttatcgctg tacttaacca 13380
gaaaggcggg tcaggcaaga cgaccatcgc aacccatcta gcccgcgccc tgcaactcgc 13440
cggggccgat gttctgttag tcgattccga tccccagggc agtgcccgcg attgggcggc 13500
cgtgcgggaa gatcaaccgc taaccgttgt cggcatcgac cgcccgacga ttgaccgcga 13560
cgtgaaggcc atcggccggc gcgacttcgt agtgatcgac ggagcgcccc aggcggcgga 13620
cttggctgtg tccgcgatca aggcagccga cttcgtgctg attccggtgc agccaagccc 13680
ttacgacata tgggccaccg ccgacctggt ggagctggtt aagcagcgca ttgaggtcac 13740
ggatggaagg ctacaagcgg cctttgtcgt gtcgcgggcg atcaaaggca cgcgcatcgg 13800
cggtgaggtt gccgaggcgc tggccgggta cgagctgccc attcttgagt cccgtatcac 13860
gcagcgcgtg agctacccag gcactgccgc cgccggcaca accgttcttg aatcagaacc 13920
cgagggcgac gctgcccgcg aggtccaggc gctggccgct gaaattaaat caaaactcat 13980
ttgagttaat gaggtaaaga gaaaatgagc aaaagcacaa acacgctaag tgccggccgt 14040
ccgagcgcac gcagcagcaa ggctgcaacg ttggccagcc tggcagacac gccagccatg 14100
aagcgggtca actttcagtt gccggcggag gatcacacca agctgaagat gtacgcggta 14160
cgccaaggca agaccattac cgagctgcta tctgaataca tcgcgcagct accagagtaa 14220
atgagcaaat gaataaatga gtagatgaat tttagcggct aaaggaggcg gcatggaaaa 14280
tcaagaacaa ccaggcaccg acgccgtgga atgccccatg tgtggaggaa cgggcggttg 14340
gccaggcgta agcggctggg ttgtctgccg gccctgcaat ggcactggaa cccccaagcc 14400
cgaggaatcg gcgtgacggt cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg 14460
gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg 14520
cagaagcacg ccccggtgaa tcgtggcaag cggccgctga tcgaatccgc aaagaatccc 14580
ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac 14640
cagatttttt cgttccgatg ctctatgacg tgggcacccg cgatagtcgc agcatcatgg 14700
acgtggccgt tttccgtctg tcgaagcgtg accgacgagc tggcgaggtg atccgctacg 14760
agcttccaga cgggcacgta gaggtttccg cagggccggc cggcatggcc agtgtgtggg 14820
attacgacct ggtactgatg gcggtttccc atctaaccga atccatgaac cgataccggg 14880
aagggaaggg agacaagccc ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt 14940
tctgccggcg agccgatggc ggaaagcaga aagacgacct ggtagaaacc tgcattcggt 15000
taaacaccac gcacgttgcc atgcagcgta cgaagaaggc caagaacggc cgcctggtga 15060
cggtatccga gggtgaagcc ttgattagcc gctacaagat cgtaaagagc gaaaccgggc 15120
ggccggagta catcgagatc gagctagctg attggatgta ccgcgagatc acagaaggca 15180
agaacccgga cgtgctgacg gttcaccccg attacttttt gatcgatccc ggcatcggcc 15240
gttttctcta ccgcctggca cgccgcgccg caggcaaggc agaagccaga tggttgttca 15300
agacgatcta cgaacgcagt ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc 15360
gcaagctgat cgggtcaaat gacctgccgg agtacgattt gaaggaggag gcggggcagg 15420
ctggcccgat cctagtcatg cgctaccgca acctgatcga gggcgaagca tccgccggtt 15480
cctaatgtac ggagcagatg ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag 15540
gtctctttcc tgtggatagc acgtacattg ggaacccaaa gccgtacatt gggaaccgga 15600
acccgtacat tgggaaccca aagccgtaca ttgggaaccg gtcacacatg taagtgactg 15660
atataaaaga gaaaaaaggc gatttttccg cctaaaactc tttaaaactt attaaaactc 15720
ttaaaacccg cctggcctgt gcataactgt ctggccagcg cacagccgaa gagctgcaaa 15780
aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg 15840
cggccgctgg ccgctcaaaa atggctggcc tacggccagg caatctacca gggcgcggac 15900
aagccgcgcc gtcgccactc gaccgccggc gcccacatca aggcaccctg cctcgcgcgt 15960
ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 16020
ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 16080
tgtcggggcg cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact 16140
atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca 16200
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc 16260
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 16320
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 16380
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 16440
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 16500
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 16560
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 16620
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 16680
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 16740
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 16800
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 16860
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 16920
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 16980
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 17040
agtggaacga aaactcacgt taagggattt tggtcatgca ttctaggtac taaaacaatt 17100
catccagtaa aatataatat tttattttct cccaatcagg cttgatcccc agtaagtcaa 17160
aaaatagctc gacatactgt tcttccccga tatcctccct gatcgaccgg acgcagaagg 17220
caatgtcata ccacttgtcc gccctgccgc ttctcccaag atcaataaag ccacttactt 17280
tgccatcttt cacaaagatg ttgctgtctc ccaggtcgcc gtgggaaaag acaagttcct 17340
cttcgggctt ttccgtcttt aaaaaatcat acagctcgcg cggatcttta aatggagtgt 17400
cttcttccca gttttcgcaa tccacatcgg ccagatcgtt attcagtaag taatccaatt 17460
cggctaagcg gctgtctaag ctattcgtat agggacaatc cgatatgtcg atggagtgaa 17520
agagcctgat gcactccgca tacagctcga taatcttttc agggctttgt tcatcttcat 17580
actcttccga gcaaaggacg ccatcggcct cactcatgag cagattgctc cagccatcat 17640
gccgttcaaa gtgcaggacc tttggaacag gcagctttcc ttccagccat agcatcatgt 17700
ccttttcccg ttccacatca taggtggtcc ctttataccg gctgtccgtc atttttaaat 17760
ataggttttc attttctccc accagcttat ataccttagc aggagacatt ccttccgtat 17820
cttttacgca gcggtatttt tcgatcagtt ttttcaattc cggtgatatt ctcattttag 17880
ccatttatta tttccttcct cttttctaca gtatttaaag ataccccaag aagctaatta 17940
taacaagacg aactccaatt cactgttcct tgcattctaa aaccttaaat accagaaaac 18000
agctttttca aagttgtttt caaagttggc gtataacata gtatcgacgg agccgatttt 18060
gaaaccgcgg tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 18120
ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 18180
ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 18240
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 18300
ctggct 18306
<210>2
<211>1423
<212>PRT
<213>人工序列(Artificial Sequence)
<400>2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Thr Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Leu Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ile
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Lys Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Asp Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Ile Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1010 1015 1020
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1025 1030 1035
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1040 1045 1050
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1055 1060 1065
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1070 1075 1080
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1085 1090 1095
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1100 1105 1110
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1115 1120 1125
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1130 1135 1140
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1145 1150 1155
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1160 1165 1170
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1175 1180 1185
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1190 1195 1200
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1205 1210 1215
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1220 1225 1230
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Val Leu Gln Lys Gly Asn
1250 1255 1260
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1265 1270 1275
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1280 1285 1290
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1295 1300 1305
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1310 1315 1320
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1325 1330 1335
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1340 1345 1350
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1355 1360 1365
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1370 1375 1380
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1385 1390 1395
Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr
1400 1405 1410
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1415 1420
<210>3
<211>208
<212>PRT
<213>人工序列(Artificial Sequence)
<400>3
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210>4
<211>98
<212>PRT
<213>人工序列(Artificial Sequence)
<400>4
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1 5 10 15
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
20 25 30
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
35 40 45
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
50 55 60
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
65 70 75 80
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
85 90 95
Lys Val
<210>5
<211>76
<212>DNA
<213>人工序列(Artificial Sequence)
<400>5
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210>6
<211>5010
<212>DNA
<213>人工序列(Artificial Sequence)
<400>6
atgtccagcg agacaggacc agtggcagtc gacccaacac tgcgcaggcg gatcgagcca 60
cacgagttcg aggtgttctt cgatccgagg gagctccgga aggagacatg cctcctgtac 120
gagatcaact ggggcggccg ccactctatc tggaggcata cctcacagaa cacaaataag 180
catgtggagg tcaacttcat cgagaagttc accacagagc ggtacttctg cccgaatacg 240
cgctgctcca tcacctggtt cctgtcgtgg tccccatgcg gagagtgctc gagggcaatc 300
acggagttcc tctcccgcta cccgcacgtc accctgttca tctacatcgc acggctctac 360
caccatgcgg acccgcggaa taggcagggc ctccgcgatc tgatctcttc aggcgtgaca 420
atccagatca tgacggagca ggagtcaggc tactgctgga ggaacttcgt caattacagc 480
ccatctaacg aggcacactg gccgcgctac ccgcatctct gggtgcgcct ctacgtgctc 540
gagctgtact gcatcatcct cggcctgccg ccatgcctca atatcctgcg caggaagcag 600
ccgcagctga cgttcttcac catcgccctc cagagctgcc actaccagcg gctccctccg 660
catatcctgt gggcgacagg cctcaagtca ggctcggaga cacctggcac gtccgagagc 720
gccaccccgg agtctatgga ctacaaggac cacgacgggg attacaaaga ccacgacata 780
gactacaagg atgacgatga caaaatggca ccgaagaaaa aaaggaaggt cggaatccat 840
ggcgttccag ctgccgataa gaaatattcc atcggactcg ccattggcac gaatagcgtc 900
ggatgggctg ttattactga tgagtacaaa gttccgtcta agaagttcaa ggtgctgggc 960
aacacagacc gccacagcat aaagaaaaat ctcatcggtg cactcctttt cgatagtggg 1020
gagactgcag aagcgacaag attgaaaagg actgcgagaa ggcgctatac acggcgtaag 1080
aatagaatct gctaccttca ggagattttc tctaacgaaa tggctaaggt cgatgacagt 1140
ttctttcata gacttgagga atcgttcttg gttgaggagg ataagaaaca tgagaggcac 1200
ccgatatttg gaaacatcgt ggatgaggtc gcatatcatg aaaagtaccc cacaatctac 1260
cacctgagaa agaaactcgt tgattccacc gacaaagcgg atttgagact catctacctc 1320
gctcttgccc atatgataaa gttccgcgga cactttctga tcgagggcga cctcaaccct 1380
gataatagcg acgtcgataa gctcttcatc cagttggttc aaacctacaa tcagctcttt 1440
gaggaaaacc caattaatgc tagtggagtg gatgcaaaag cgatactgtc ggccagactc 1500
tccaagagca gaaggttgga gaacctgatc gctcaacttc ctggagaaaa gaaaaacggt 1560
ctttttggga atttgattgc cttgtctctg ggcctcacac caaacttcaa gtcaaatttt 1620
gacctcgctg aggataccaa acttcagttg tctaaggata cctatgatga cgatcttgac 1680
aatttgctgg cacaaattgg cgaccagtac gcggatctgt tcctcgcagc gaagaatctg 1740
agtgatgcta ttctcctttc ggacatactc agggttaaca ctgagatcac aaaagcacct 1800
ttgagtgcgt cgatgattaa gctgtatgat gaacatcacc aagacctcac tttgctgaag 1860
gcccttgtgc ggcagcaatt gccagagaag tacaaagaaa tcttctttga ccaatctaag 1920
aacggatacg ctggctatat tgatggagga gcttctcagg aggaattcta taagtttatc 1980
aaacctatac ttgagaagat ggatggtaca gaggaactcc ttgttaaatt gaacagagaa 2040
gatttgctgc gcaagcaacg gacctttgac aacggaatca ttccgcatca gatacacctc 2100
ggcgagcttc atgccatcct tcgccggcag gaagatttct accccttttt gaaggacaac 2160
cgcgagaaga tagaaaaaat ccttacgttc cggattcctt actatgtggg tccattggca 2220
agggggaatt cccgctttgc gtggatgact cggaaaagcg aggaaactat cacaccgtgg 2280
aacttcgaga aagttgtgga caagggagct tctgcccaat cattcattga gaggatgact 2340
aacttcgata agaacctgcc gaacgagaaa gttctcccca agcactccct cctttacgag 2400
tatttcaccg tgtataacga acttacgaag gttaaatacg tgactgaggg tatgaggaag 2460
ccagcattct tgagcgggga tcaaaagaaa gcgattgttg atttgctgtt taaaactaat 2520
cgcaaggtga cagtcaagca gctcaaagag gattatttca agaaaattga atgtttcgac 2580
tctgtggaga tatcaggagt cgaagatagg tttaacgctt cccttggcac ataccatgac 2640
ctccttaaga tcattaagga caaagatttc ctggataacg aggaaaatga ggacatcctc 2700
gaagatattg ttcttacctt gacgctgttt gaggatcgcg aaatgatcga ggaacggctt 2760
aagacgtatg ctcacttgtt cgacgataag gttatgaagc agctcaagcg tagaaggtac 2820
actggatggg gccgtctgtc tagaaagctc atcaacggaa tacgtgataa acaaagtggc 2880
aagacaattt tggattttct gaagtcggac ggattcgcca acagaaattt tattcagctg 2940
attcatgacg atagtctcac cttcaaagag gacatacaga aggctcaagt gagtggtcaa 3000
ggggattcgc tgcatgaaca catcgcaaac ctcgcgggtt caccggccat aaagaaagga 3060
atccttcaaa ctgttaaggt cgttgatgag ttggttaaag tgatgggtag gcacaagccc 3120
gaaaacatag tgatcgagat ggctcgcgaa aatcagacta cacaaaaagg gcagaagaac 3180
tctcgcgagc ggatgaaaag gattgaggaa ggaatcaagg aactgggctc acagattctc 3240
aaagagcatc cagtcgaaaa cacacagctg caaaatgaga agctctatct ttactatctc 3300
caaaatggcc gggacatgta tgttgatcag gagcttgaca tcaaccgttt gtccgactat 3360
gatgtggacc acattgtccc gcaatctttc cttaaggacg attcaatcga taataaggtg 3420
ttgacccgga gcgataaaaa ccgtggaaag tctgacaatg tcccttcaga ggaagtggtt 3480
aagaagatga agaactactg gagacaattg ctgaatgcaa aactgatcac acagagaaag 3540
ttcgacaacc tcaccaaagc agagagaggt gggctcagtg aacttgataa agcgggcttc 3600
attaagcgtc agctcgttga gactagacag atcacgaagc atgtcgcgca gattttggat 3660
tcgcggatga acacgaagta cgacgagaat gataaactga tacgtgaagt caaggttatc 3720
actcttaagt ccaaattggt gagcgatttc agaaaggact tccaattcta taaggtcagg 3780
gagatcaaca attatcatca cgctcacgat gcctacctta atgctgttgt ggggaccgcc 3840
cttattaaga aataccctaa attggagtct gaattcgttt acggggatta taaggtctac 3900
gacgttagga aaatgatagc taagagtgag caggagatcg gtaaagcaac tgcgaagtat 3960
ttcttttact cgaacatcat gaatttcttt aagaccgaga taacgctggc aaatggcgaa 4020
attagaaaga ggcctctcat agagactaac ggtgagacag gggaaatcgt ctgggataag 4080
ggtagggact ttgcgacagt gcgcaaggtc ctctctatgc cgcaagttaa tattgtgaag 4140
aaaaccgagg tgcagacggg aggcttctcc aaggaaagca tacttcccaa acggaactct 4200
gataagttga tcgctcgtaa gaaagattgg gaccctaaga aatatggtgg gttcgattcc 4260
ccaactgttg cttacagcgt gctggtcgtt gccaaggtcg agaagggtaa atccaagaaa 4320
ctcaaaagcg ttaaggaact ccttgggatt actatcatgg agagatcttc attcgaaaag 4380
aatcctatcg actttcttga ggccaaagga tataaggaag ttaagaaaga tctgataatc 4440
aaactcccaa agtactcatt gtttgagctg gaaaacggca ggaagcgcat gcttgcttcc 4500
gccggagttt tgcagaaagg gaacgagttg gctctgcctt ctaagtatgt taacttcctc 4560
tatcttgcct ctcattacga gaagctcaaa ggctcaccag aggacaacga acagaaacaa 4620
ctttttgtcg agcaacataa gcactatttg gatgagatta tagaacagat cagtgaattc 4680
tcgaaaaggg ttatccttgc agatgcgaat cttgacaagg tgttgtctgc atacaacaaa 4740
catagagata agccgatcag ggagcaagcg gaaaatatca ttcacctctt cactcttaca 4800
aacttgggtg ctcccgctgc cttcaagtat tttgatacca cgattgaccg gaaacgttac 4860
acctcaacga aggaggtgct ggatgccacc ctcatccacc aatctattac cggactctac 4920
gagactagaa tcgatctctc acagctcggc ggggataaaa gaccagcagc gacgaaaaag 4980
gcaggacagg ctaagaagaa gaaagagctc 5010
<210>7
<211>229
<212>PRT
<213>人工序列(Artificial Sequence)
<400>7
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210>8
<211>732
<212>DNA
<213>人工序列(Artificial Sequence)
<400>8
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcatca ggccgacgat gacgcacgtt tcagagctat gctggaaaca 120
gcatagcaag ttgaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 180
tgcaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg 240
ttcgattccc ggctggtgca gccaagcgca cgctccggga gtttcagagc tatgctggaa 300
acagcatagc aagttgaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 360
cggtgcaaca aagcaccagt ggtctagtgg tagaatagta ccctgccacg gtacagaccc 420
gggttcgatt cccggctggt gcacgacatg atgacggagt acggtttcag agctatgctg 480
gaaacagcat agcaagttga aataaggcta gtccgttatc aacttgaaaa agtggcaccg 540
agtcggtgca acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga 600
cccgggttcg attcccggct ggtgcacacc ttcaacccgc tgcagagttt cagagctatg 660
ctggaaacag catagcaagt tgaaataagg ctagtccgtt atcaacttga aaaagtggca 720
ccgagtcggt gc 732

Claims (7)

1.基因组靶点序列的编辑方法,为方法(一)或方法(二)或方法(三)或方法(四):
所述方法(一)包括如下步骤:将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子、PmCDA1的编码基因和UGI的编码基因导入植物或植物细胞内,使所述xCas9n、所述tRNA-esgRNA、所述PmCDA1和所述UGI的编码基因均得到表达,实现基因组靶点序列的编辑;
所述方法(二)包括如下步骤:将xCas9n的编码基因、转录tRNA-esgRNA的DNA分子和PmCDA1的编码基因导入植物体或植物细胞内,使所述xCas9n、所述tRNA-esgRNA和所述PmCDA1的编码基因均得到表达,实现基因组靶点序列的编辑;
所述方法(三)包括如下步骤:将xCas9n、tRNA-esgRNA、PmCDA1和UGI导入植物或植物细胞内,实现基因组靶点序列的编辑;
所述方法(四)包括如下步骤:将xCas9n、tRNA-esgRNA和PmCDA1导入植物或植物细胞内,实现基因组靶点序列的编辑;
所述tRNA-esgRNA靶向所述靶点序列;
所述tRNA-esgRNA如式I所示:tRNA-所述靶点序列转录的RNA-esgRNA骨架(式I);
所述tRNA为将序列1第474-550位中的T替换为U得到的RNA分子;
所述esgRNA骨架为将序列1第571-656位中的T替换为U得到的RNA分子;
所述靶点序列的PAM序列为如下任一种:TGT、GGT、GAA、GAT;
所述xCas9n为氨基酸序列是序列2所示的蛋白质;
所述PmCDA1为氨基酸序列是序列3所示的蛋白质;
所述UGI为氨基酸序列是序列4所示的蛋白质。
2.根据权利要求1所述的方法,其特征在于:所述xCas9n的编码基因为序列1第2857-7125位所示的DNA分子。
3.根据权利要求1所述的方法,其特征在于:所述PmCDA1的编码基因为序列1第7417-8040位所示的DNA分子。
4.根据权利要求1所述的方法,其特征在于:所述UGI的编码基因为序列1第8062-8358位所示的DNA分子。
5.根据权利要求1所述的方法,其特征在于:所述基因组靶点序列的编辑为将所述靶点序列中的C突变为T。
6.根据权利要求1所述的方法,其特征在于:所述植物为p1)或p2)或p3):
p1)单子叶植物或双子叶植物;
p2)禾本科植物;
p3)水稻;
所述植物细胞为q1)或q2)或q3):
q1)单子叶植物细胞或双子叶植物细胞;
q2)禾本科植物细胞;
q3)水稻细胞。
7.植物突变体的制备方法,包括如下步骤:按照权利要求1-6任一所述的方法对植物的基因组靶点序列进行编辑,获得植物突变体。
CN201910812816.7A 2019-08-30 2019-08-30 xCas9n-epBE碱基编辑系统在基因编辑中的应用 Active CN110577965B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910812816.7A CN110577965B (zh) 2019-08-30 2019-08-30 xCas9n-epBE碱基编辑系统在基因编辑中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910812816.7A CN110577965B (zh) 2019-08-30 2019-08-30 xCas9n-epBE碱基编辑系统在基因编辑中的应用

Publications (2)

Publication Number Publication Date
CN110577965A CN110577965A (zh) 2019-12-17
CN110577965B true CN110577965B (zh) 2022-12-20

Family

ID=68812394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910812816.7A Active CN110577965B (zh) 2019-08-30 2019-08-30 xCas9n-epBE碱基编辑系统在基因编辑中的应用

Country Status (1)

Country Link
CN (1) CN110577965B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114317590B (zh) * 2020-09-30 2024-01-16 北京市农林科学院 一种将植物基因组中的碱基c突变为碱基t的方法
CN114317518B (zh) * 2020-09-30 2024-01-12 北京市农林科学院 SpRYn-CBE碱基编辑系统在植物基因组碱基替换中的应用
CN112538477B (zh) * 2020-12-02 2022-09-16 北京市农林科学院 xCas9基因编辑系统在基因组编辑中的应用
CN114686454B (zh) * 2020-12-31 2024-04-26 北京市农林科学院 Pe-p3引导编辑系统及其在基因组碱基编辑中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Evolved Cas9 variants with broad PAM compatibility and high DNA specificity;Johnny H. Hu等;《Nature》;20180228;第556卷(第7699期);57-63 *

Also Published As

Publication number Publication date
CN110577965A (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
CN110577965B (zh) xCas9n-epBE碱基编辑系统在基因编辑中的应用
CN106939316B (zh) 利用CRISPR/Cas9系统定点敲除水稻OsPDCD5基因第二外显子的方法
CN109722439B (zh) 烟草mlo2、mlo6和mlo12基因在制备抗白粉菌烟草品种中的应用及其方法
CN113512577A (zh) 用于核酸组装和高通量测序的方法
CN110724685A (zh) 转基因耐盐耐除草剂玉米sr801外源插入旁侧序列及其应用
CN109355306B (zh) 陆地棉转化事件icr24-397及其特异性鉴定方法
AU2005252598B8 (en) Transformation vectors
CN114438104A (zh) 一种调控番茄果实糖含量的SlGRAS9基因及在培育高糖含量番茄中的应用
CN109266686A (zh) 一种基因组核苷酸定点替换的方法
KR20220091472A (ko) 유전자 변형 식물 및 이를 제조하는 방법
CN109666693B (zh) Mg132在碱基编辑系统编辑受体基因组中的应用
CN109666694B (zh) Scr7在碱基编辑系统编辑受体基因组中的应用
CN114763556B (zh) 一种基因编辑效率提高的引导碱基编辑系统及其应用
CN111560373B (zh) 植物组成型启动子OsUbipro及其应用
CN109265562B (zh) 一种切刻酶及其在基因组碱基替换中的应用
CN112680474A (zh) 一种荧光标记CRISPR/SpCas9系统介导的基因替换体系及其在植物中的应用
CN110229823B (zh) 陆地棉转化事件19c006-59-11及其特异性鉴定方法
CN113881670B (zh) 抗大豆花叶病毒的转基因植物构建方法
CN108728389B (zh) 一株用于生产2,3,5,6-四甲基吡嗪的大肠杆菌工程菌及其应用
CN114686454B (zh) Pe-p3引导编辑系统及其在基因组碱基编辑中的应用
CN113430194B (zh) 一种基于CRISPR/Cas9的白桦基因编辑方法
CN113462697B (zh) 一种降解型抗草甘膦基因、植物表达载体、降解型抗草甘膦转基因水稻的培育方法和应用
EP3889267A1 (en) (be-)curtovirus replicon-mediated genome editing in plants
CN113215160A (zh) 一种植物来源启动子、表达载体及应用
CN113490747A (zh) 用于提高基因组工程化效率的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant