CN108486146A - LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用 - Google Patents

LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用 Download PDF

Info

Publication number
CN108486146A
CN108486146A CN201810217936.8A CN201810217936A CN108486146A CN 108486146 A CN108486146 A CN 108486146A CN 201810217936 A CN201810217936 A CN 201810217936A CN 108486146 A CN108486146 A CN 108486146A
Authority
CN
China
Prior art keywords
lbcpf1
sequence
plant
mutant
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810217936.8A
Other languages
English (en)
Other versions
CN108486146B (zh
Inventor
夏兰琴
李少雅
赵云德
张欣
王文生
杜文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority to CN201810217936.8A priority Critical patent/CN108486146B/zh
Publication of CN108486146A publication Critical patent/CN108486146A/zh
Application granted granted Critical
Publication of CN108486146B publication Critical patent/CN108486146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明公开了LbCpf1‑RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用。本发明以OsPDS基因和OsSBEIIb基因为靶基因,构建了靶向一个基因的双位点和两个基因的系列载体,并利用农杆菌转化方法将载体导入水稻愈伤中,利用LbCpf1‑RR突变体成功获得了目的基因敲除的水稻植株。LbCpf1‑RR突变体与蛋白质LbCpf1的唯一不同在于:第532位的氨基酸由G变为R,第595位的氨基酸由K变为R。本发明提供的LbCpf1‑RR突变体由于扩充了其识别的PAM位点序列,所以扩大了CRISPR/Cpf1系统在水稻基因组中的编辑范围,对于推进此系统在植物基因组编辑领域中的应用有重要意义。本发明具有重大的应用价值。

Description

LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的 应用
技术领域
本发明涉及生物技术领域,具体涉及LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用。
背景技术
CRISPR/Cas9介导的基因组编辑技术已经成为分子生物学中最强大的工具之一,且被广泛应用于植物和农作物功能基因改良。CRISPR/Cas9系统首次在细菌中发现,由sgRNA和Cas9蛋白两部分组成(Jinek et al.,2012)。Cas9蛋白通过自身的核酸内切酶活性,对任何紧随PAM(NGG)的20bp的靶点序列进行编辑,从而引起靶位点基因组DNA序列双链断裂(double-strand breaks,DSBs),然后通过非同源末端连接(non-homologous endjoining,NHEJ)或同源重组介导的修复(homology-directed repair,HDR)两种方式引入突变。目前,常用的Cas9蛋白为SpCas9及其各种突变体,识别的PAM序列分别为“NGG”、“NGA”或“NGCG”。
CRISPR/Cpf1系统和CRISPR/Cas9系统同属Ⅱ类CRISPR系统,但前者仅需要一条更短的crRNA即可实现基因编辑,更有潜力实现更简单、更精确的基因组工程操作。CRISPR/Cpf1系统一经建立便被应用于人类与动物细胞系及水稻、烟草、大豆、拟南芥等不同植物基因组的定点敲除和功能分析研究中,并且获得较高的诱导突变率和可稳定遗传的基因组编辑植株(Endo et al.,2016;Hu et al.,2016;Kim et al.,2017;Tang et al.,2017;Wanget al.,2017;Xu et al.,2017)。CRISPR/Cpf1系统由crRNA和Cpf1蛋白两部分组成,Cpf1蛋白对“TTTN”的PAM位点进行识别,在crRNA的引导下对基因组DNA的靶位点进行切割(Zetsche et al.,2015)。与CRISPR/Cas9系统相比,CRISPR/Cpf1系统有如下优势:Cpf1只需单个RNA,即crRNA(CRISPR RNA),crRNA长度为43nt,且切割无需tracrRNA的帮助,因而组装更加简单;因其识别的PAM位点为“TTTN”,因此可识别富含AT的5’和3’UTR区域;一次可对多种靶位点进行编辑,实现简单的基因多重编辑,同时具有更高的编辑效率和较低的脱靶效应。但识别的PAM位点序列的限制,不利于CRISPR/Cpf1的更为广泛的应用。最近一项在人类细胞中的研究表明,通过对Cpf1蛋白进行突变,改变其识别的PAM位点序列,从而克服了PAM位点的限制(Gao et al.,2017),但是突变的Cpf1蛋白在植物中是否仍具有核酸酶活性,需要进一步研究。
发明内容
本发明要解决的技术问题是如何扩大CRISPR/Cpf1系统在植物基因组中的编辑范围。
为解决上述技术问题,本发明首先提供了一种表达盒甲。所述表达盒甲中由启动子甲启动LbCpf1-RR突变体的编码基因表达。
所述LbCpf1-RR突变体可为a1)或a2)或a3)或a4):
a1)氨基酸序列是序列表中序列4自N端起第41至1267位所示的蛋白质;
a2)在a1)所示蛋白质的N末端添加一个甲硫氨酸残基,得到的蛋白质;
a3)氨基酸序列是序列表中序列4所示的蛋白质;
a4)在a1)或a2)或a3)所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质。
所述表达盒甲自5’端至3’端依次可包括如下原件:所述启动子甲、所述LbCpf1-RR突变体的编码基因和终止子。
所述LbCpf1-RR突变体的编码基因可为b1)或b2)或b3)或b4)或b5):
b1)编码区为序列表中序列1自5'末端起第1137至4817位的反向互补序列所示的DNA分子;
b2)核苷酸序列为序列表中序列1自5'末端起第1137至4817位的反向互补序列所示的DNA分子;
b3)核苷酸序列为序列表中序列1自5'末端起第1089至4937位的反向互补序列所示的DNA分子;
b4)与b1)或b2)或b3)限定的核苷酸序列具有75%或75%以上同一性,且编码LbCpf1-RR突变体的DNA分子;
b5)与b1)或b2)或b3)限定的核苷酸序列杂交,且编码LbCpf1-RR突变体的DNA分子。
所述启动子甲具体可为Ubi启动子。所述Ubi启动子的核苷酸序列可为序列表序列1自5'末端起第4940至6925位的反向互补序列所示的DNA分子。
所述终止子具体可为Nos终止子。所述Nos终止子的核苷酸序列可为序列表序列1自5'末端起第817至1069位的反向互补序列所示的DNA分子。
所述表达盒甲中还可包括一个以上Flag标签和/或一个以上核定位信号。
所述表达盒甲中具体可包括3个Flag标签(即3×Flag标签)、核定位信号甲和核定位信号乙。
所述表达盒甲自5’端至3’端依次可包括如下原件:所述Ubi启动子、所述3×Flag标签、所述核定位信号乙、所述LbCpf1-RR突变体的编码基因、所述核定位信号甲和Nos终止子。所述3×Flag标签的核苷酸序列具体可如序列表序列1自5'末端第4869至4937位的反向互补序列所示的DNA分子。所述核定位信号乙的核苷酸序列具体可如序列表序列1自5'末端第4818至4868位的反向互补序列所示的DNA分子。所述核定位信号甲的核苷酸序列具体可如序列表序列1自5'末端1089至1136位的反向互补序列所示的DNA分子。
所述表达盒甲的核苷酸序列具体可如序列表序列1自5'末端第817至6925位的反向互补序列所示。
所述启动LbCpf1-RR突变体的编码基因表达具体可为启动LbCpf1-RR突变体的编码基因在植物中的表达。
含有上述任一所述表达盒甲的重组质粒也属于本发明的保护范围。
所述重组质粒还可包括表达盒乙;所述表达盒乙中可由启动子乙启动crRNA转录。
所述表达盒乙自5’端至3’端依次可包括启动子乙和M个crRNA区段;每个crRNA区段自5’端至3’端依次包括核酸酶甲的核苷酸序列、crRNA的编码基因和核酸酶乙的核苷酸序列;每相邻两个crRNA区段之间具有N个脱氧核糖核苷酸组成的间隔序列;M为1以上且5以下的自然数;N为10以上且15以下的自然数。
所述核酸酶甲具体可为Hammerhead(HH)型核酸酶。所述核酸酶乙具体可为丁型肝炎病毒(HDV)核酸酶。Hammerhead(HH)型核酸酶的核苷酸序列具体可如序列表序列1自5'末端第394至436位所示。丁型肝炎病毒(HDV)核酸酶的核苷酸序列具体可如序列表序列1自5'末端第481至548位所示。
所述crRNA可与靶基因上的靶标片段特异结合。所述靶标片段可具有结构1:
5’-TTTV-NX-3’或结构2:5’-TYCV-NX-3’,其中N为A、G、C或T,X为23,V为A、C或G,Y为C或T。
所述表达盒乙自5’端至3’端具体可由启动子乙和2个crRNA区段组成。所述crRNA区段的核苷酸序列具体可如序列表中序列1、序列2或序列3自5’末端起第458至480位所示。所述crRNA区段的核苷酸序列具体可如序列表中序列1、序列2或序列3自5’末端起第623至645位所示。
所述启动子乙具体可为OsU3启动子。所述OsU3启动子的核苷酸序列如序列表序列1自5'末端起第13至392位所示。
上述任一所述重组质粒的核苷酸序列具体可如序列表中序列1、序列2或序列3所示。
本发明还保护定向编辑植物或农作物基因组的方法,具体可为方法c1)或方法c2)或方法c3)或方法c4)。
所述方法c1)可包括如下步骤:通过将上述任一所述重组质粒导入出发植物,实现出发植物中靶基因的定向编辑。
所述方法c2)可包括如下步骤:(1)根据出发植物中预期进行定向编辑的靶基因设计crRNA;(2)将所述crRNA的编码基因插入上述任一所述重组质粒,得到重组质粒甲;(3)将所述重组质粒甲导入所述出发植物,实现出发植物中靶基因的定向编辑。
所述方法c3)可包括如下步骤:(1)根据出发植物中预期进行定向编辑的靶基因设计crRNA;(2)构建表达所述crRNA的重组载体;(3)将所述重组载体和编码所述LbCpf1-RR突变体的基因导入所述出发植物,实现出发植物中靶基因的定向编辑。
所述方法c4)可包括如下步骤:利用CRISPR/Cpf1系统对待编辑植物或农作物进行基因组编辑,其中核酸酶为上述任一所述LbCpf1-RR突变体。
本发明还保护一种定向编辑植物或农作物基因组的系统,该系统中的Cpf1核酸酶为上述任一所述LbCpf1-RR突变体。
上述系统中的LbCpf1-RR突变体是通过表达LbCpf1-RR突变体的重组质粒导入的。所述表达LbCpf1-RR突变体的重组质粒具体可为上述任一所述重组质粒。
本发明还保护如下d1)或d2)或d3)或d4):d1)所述LbCpf1-RR突变体在植物基因编辑中的应用;d2)上述任一所述表达盒甲在植物基因编辑中的应用;d3)上述任一所述重组质粒在植物基因编辑中的应用;d4)所述系统在植物基因编辑中的应用。
本发明还保护所述LbCpf1-RR突变体。
上述任一所述植物或上述任一所述农作物可为e1)或e2)或e3)或e4)或e5):e1)单子叶植物;e2)双子叶植物;e3)禾本科植物;e4)水稻;e5)水稻品种Kitaake。
上文中,当向水稻中插入核苷酸序列为序列表中序列1所示的重组质粒时,靶基因为OsPDS基因。上文中,当向水稻中插入核苷酸序列为序列表中序列2所示的重组质粒时,靶基因为OsSBEIIb基因。上文中,当向水稻中插入核苷酸序列为序列表中序列3所示的重组质粒时,靶基因为OsPDS基因和OsSBEIIb基因。
本发明的发明人以OsPDS基因和OsSBEIIb基因为靶基因,构建了靶向一个基因的双位点和两个基因的系列载体,并利用农杆菌转化方法将载体导入水稻愈伤中,利用LbCpf1-RR突变体成功获得了目的基因敲除的水稻植株,利用LbCpf1-RVR突变体未获得编辑水稻植株。LbCpf1-RR突变体与蛋白质LbCpf1的唯一不同在于:第532位的氨基酸由G变为R,第595位的氨基酸由K变为R。LbCpf1-RVR突变体与蛋白质LbCpf1的唯一不同在于:第532位由G变为R,第538位由K变为V,第542位由Y变为R。由此可见,本发明提供的LbCpf1-RR突变体由于扩充了其识别的PAM位点序列,所以扩大了CRISPR/Cpf1系统在水稻基因组中的编辑范围,对于推进此系统在植物基因组编辑领域中的应用有重要意义。本发明具有重大的应用价值。
附图说明
图1为三个表达载体的框架图。
图2为T0代转基因水稻的基因型鉴定;WT为野生型kitaake,M为DNA Marker,电泳图片上的数字为T0代转基因水稻植株的编号,灰色阴影部分为PAM序列和靶点序列,PAM序列用下划线标注,野生型kitaake不可被T7EI切开;
A为部分T0代OsPDS基因编辑的水稻植株的基因型鉴定结果;17和67仅在Target 1(PDS 1)位置突变:17一条链有79bp缺失,另一条链为野生型;67为嵌合体类型,第一种类型为10bp缺失,第二种类型为38bp缺失,第三种类型为野生型;21只在Target 2(PDS 2)位置有突变,一条链有10bp缺失,另一条链为野生型;34在Target 1(PDS 1)和Target 2(PDS 2)位置均有突变,导致两个Targets之间287bp的缺失;
B为部分T0代OsSBEIIb基因编辑的水稻植株的基因型鉴定结果;22、41-7和54仅在Target 1(SBEIIb 1)位置有突变:22一条链为87bp缺失,另一条链为野生型;41-7一条链为9bp缺失,另一条链为86bp缺失;54为嵌合体类型,第一种类型为7bp缺失,第二种类型为37bp缺失,第三种类型为野生型;41-4在Target 1(SBEIIb 1)和Target 2(SBEIIb 2)位置均有突变,一条链在Target 1(SBEIIb 1)位置有37bp缺失,在Target 2位置(SBEIIb 2)有19bp缺失,另一条链为野生型;
C为部分T0代OsPDS/OsSBEIIb编辑的水稻植株的基因型鉴定结果;53只在OsPDS基因的Target(PDS 1)位置有突变,一条链为13bp缺失,另一条链为野生型;12和56只在OsSBEIIb基因的Target(SBEIIb 1)位置有突变:12为嵌合体类型,第一种类型为9bp缺失,第二种类型为7bp缺失,第三种类型为野生型;56一条链为16bp缺失,另一条链为7bp缺失;62在两个基因的靶点位置均有突变,在OsPDS基因位置,一条链有15bp缺失伴随着10bp插入,另一条链为野生型,在OsSBEIIb基因位置,一条链为12bp缺失,另一条链为野生型。
图3为T0代转基因水稻植株基因分析汇总;其中,Bi为双等位,HE为杂合体,Chi为嵌合体,WT为野生型。
图4为水稻基因组中LbCpf1-RR突变体的潜在靶点分析。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
下述实施例中所用的实验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
以下实施例中的定量实验,均设置三次重复实验,结果取平均值。
下述实施例中的用于水稻转化的水稻材料为Kitaake(Oryza sativa L.),由中国农业科学院作物科学研究所提供。
质粒pCXUN-Cas9记载与如下文献中:He et al.,2017和Sun et al.,2016。
质粒pRS316-RCR-GFP记载与如下文献中:Zhang et al.,2017。
LbCpf1-OsU6载体记载与如下文献中:Wang et al.,2017。
下述实施例中所用的内切酶、试剂盒和PCR酶均购自试剂公司。其它试剂均为国产分析纯。NB固体培养基和MS固体培养基均为北京西美杰科技有限公司的产品。
下述实施例中的引物、DNA合成及测序均由华大公司完成。
下述实施例中的AAM培养基(pH5.2)是将MS salts&vitamins盐、蔗糖、MES、葡萄糖、酪蛋白氨基酸、乙酰丁香酮和100mL 10×AA amino acids混匀得到的培养基,其中各溶质在AAM培养基中的浓度分别为4.3g/L MS salts&vitamins盐、68.5g/L蔗糖、0.5g/L MES、36g/L葡萄糖、500mg/L酪蛋白氨基酸、40mg/L乙酰丁香酮。上述10×AA amino acids溶液为将L-谷氨酰胺、L-天(门)冬氨酸、L-精氨酸、甘氨酸和水混匀得到的溶液,其中各溶质在10×AA amino acids溶液中的浓度为:8.76g/L L-谷氨酰胺、2.66g/L L-天(门)冬氨酸、1.74g/L L-精氨酸和75mg/L甘氨酸。
下述实施例中所用的引物如表1。
表1.引物序列
实施例1、LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
本实施例中靶标基因、靶点名称和序列如表2所示。
表2
一、表达载体的构建
1、质粒pCXUN-LbCpf1(RR)的构建
(1)用限制性内切酶BamHI和HindIII双酶切质粒pCXUN-Cas9,得到约9282bp的载体骨架1。
(2)用限制性内切酶BamHI和HindIII双酶切LbCpf1-OsU6载体,得到约5846bp的Ubi-LbCpf1表达盒。
(3)将载体骨架1和Ubi-LbCpf1表达盒用T4连接酶连接,得到质粒pCXUN-LbCpf1。
(4)以质粒pCXUN-LbCpf1为模板,利用三个引物对(第一个引物对由BstEII-F和LbCpf1(RR)-532-R组成,第二个引物对由LbCpf1(RR)-532-F和LbCpf1(RR)-595-R组成,第二个引物对由LbCpf1(RR)-595-F和AscI-R组成)分别进行第一轮PCR扩增,然后将三个PCR扩增产物按照摩尔比1:1:1进行混合并作为模板,采用BstEII-F和AscI-R组成的引物对进行第二轮PCR扩增,获得含有G532R和K595R突变位点的LbCpf1基因片段。
(5)用限制性内切酶BstEII和AscI双酶切LbCpf1基因片段,得到约1112bp的DNA片段1。
(6)用限制性内切酶BstEII和AscI双酶切质粒pCXUN-LbCpf1,得到约14016bp的载体骨架2。
(7)将DNA片段1和载体骨架2用T4连接酶连接,得到质粒pCXUN-LbCpf1(RR)。
2、RCR片段的获得
(1)RCR1(RR-PDS1)的获得
以质粒pRS316-RCR-GFP为模板,采用RR-PDS1-F和RCR-common-R组成的引物对进行第一轮PCR扩增,得到第一轮PCR扩增产物。以第一轮PCR扩增产物为模板,采用RCRF1和RCR-common-R组成的引物对进行第二轮PCR扩增,得到RCR1(RR-PDS1)。
(2)RCR2(RR-PDS2)的获得
以质粒pRS316-RCR-GFP为模板,采用RR-PDS2-F和RCR-common-R组成的引物对进行第一轮PCR扩增,得到第一轮PCR扩增产物。以第一轮PCR扩增产物为模板,采用RCRF1和RCR-common-R组成的引物对进行第二轮PCR扩增,得到RCR2(RR-PDS2)。
(3)RCR1(RR-SBEIIb1)的获得
以质粒pRS316-RCR-GFP为模板,采用RR-SBEIIb1-F和RCR-common-R组成的引物对进行第一轮PCR扩增,得到第一轮PCR扩增产物。以第一轮PCR扩增产物为模板,采用RCRF1和RCR-common-R组成的引物对进行第二轮PCR扩增,得到RCR1(RR-SBEIIb1)。
(4)RCR2(RR-SBEIIb2)的获得
以质粒pRS316-RCR-GFP为模板,采用RR-SBEIIb2-F和RCR-common-R组成的引物对进行第一轮PCR扩增,得到第一轮PCR扩增产物。以第一轮PCR扩增产物为模板,采用RCRF1和RCR-common-R组成的引物对进行第二轮PCR扩增,得到RCR2(RR-SBEIIb2)。
3、OsU3-RCR1-RCR2(PDS)表达盒、OsU3-RCR1-RCR2(SBEIIb)表达盒和OsU3-RCR1(PDS)-RCR2(SBEIIb)表达盒的获得
(1)以pCXUN-Cas9-OsU3(Sun et al.,2016)为模板,采用OsU3F和OsU3-RCR1R组成的引物对进行第一轮PCR扩增,得到第一轮PCR扩增产物(即获得OsU3启动子序列)。
(2)以RCR1(RR-PDS1)或RCR1(RR-SBEIIb1)为模板,采用RCR-Common-F和RCR1-10random-R组成的引物对进行第二轮PCR扩增,得到第二轮PCR扩增产物。
(3)将第一轮PCR扩增产物和第二轮PCR扩增产物按照摩尔比1:1进行混合并作为模板,采用OsU3F和RCR1-10random-R组成的引物对进行第三轮PCR扩增,得到第三轮PCR扩增产物(即获得OsU3-RCR1表达盒)。
(4)以RCR2(RR-PDS2)或RCR2(RR-SBEIIb2)为模板,采用RCR2-10random-F和SacI-RCR2R组成的引物对进行第四轮PCR扩增,得到第四轮PCR扩增产物。
(5)将第三轮PCR扩增产物和第四轮PCR扩增产物按照摩尔比1:1进行混合并作为模板,采用SacI-OsU3F和SacI-RCR2R组成的引物对进行第五轮PCR扩增,得到第五轮PCR扩增产物。第五轮PCR扩增产物即为获得的OsU3-RCR1-RCR2表达盒。OsU3-RCR1-RCR2表达盒有三个,分别为OsU3-RCR1-RCR2(PDS)表达盒、OsU3-RCR1-RCR2(SBEIIb)表达盒和OsU3-RCR1(PDS)-RCR2(SBEIIb)表达盒。
4、三个表达载体的构建
(1)重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)的构建
采用限制性内切酶SacI酶切质粒pCXUN-LbCpf1(RR),获得约15128bp的载体骨架。将载体骨架和OsU3-RCR1-RCR2(PDS)表达盒用同源重组酶(北京全式金生物技术有限公司的产品)连接,得到重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)。
将重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)进行测序。测序结果表明,重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)(环形)的核苷酸序列如序列表中序列1所示。序列表中序列1自5’末端起,第13至713位为OsU3-RCR1-RCR2(PDS)表达盒的核苷酸序列,第13至392位为OsU3启动子的核苷酸序列,“第394至436位”和“第559至601位”均为Hammerhead(HH)型核酸酶的核苷酸序列,“第481至548位”和“第646至713位”为丁型肝炎病毒(HDV)核酸酶的核苷酸序列,第458至480位为PDS1靶点的核苷酸序列,第623至645位为PDS2靶点的核苷酸序列,第817至1069位为Nos终止子的核苷酸序列的反向互补序列;第1089至1136位为核定位信号(nuclear localization signal,NLS)甲的反向互补序列,第1137至4817位为编码LbCpf1-RR突变体的核苷酸序列的反向互补序列,第4818至4868位为核定位信号(nuclear localization signal,NLS)乙的反向互补序列,第4869至4937位为3×Flag标签的反向互补序列,第4940至6925位为Ubi启动子的核苷酸序列的反向互补序列。
(2)重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)的构建
按照步骤(1)的方法,将OsU3-RCR1-RCR2(PDS)表达盒替换为OsU3-RCR1-RCR2(SBEIIb)表达盒,其它步骤均不变,得到重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)的构建。
将重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)进行测序。
测序结果表明,重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)与重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)的唯一不同在于:将OsU3-RCR1-RCR2(PDS)表达盒替换为OsU3-RCR1-RCR2(SBEIIb)表达盒。OsU3-RCR1-RCR2(SBEIIb)表达盒的核苷酸序列如序列表中序列2所示。
(3)重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)的构建
按照步骤(1)的方法,将OsU3-RCR1-RCR2(PDS)表达盒替换为OsU3-RCR1(PDS)-RCR2(SBEIIb)表达盒,其它步骤均不变,得到重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)的构建。
将重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)进行测序。
测序结果表明,重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)与重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)的唯一不同在于:将OsU3-RCR1-RCR2(PDS)表达盒替换为OsU3-RCR1(PDS)-RCR2(SBEIIb)表达盒。OsU3-RCR1(PDS)-RCR2(SBEIIb)表达盒的核苷酸序列如序列表中序列3所示。
重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)、重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)和重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)的载体框架图见图1。
上述三个表达载体中,编码LbCpf1-RR突变体的核苷酸序列、核定位信号1的核苷酸序列、核定位信号2的核苷酸序列和3×Flag标签的核苷酸序列融合,形成序列表中序列1第1089至4937位所示的融合基因,表达序列表中序列4所示融合蛋白(需要说明的是,融合蛋白中LbCpf1-RR突变体的起始氨基酸甲硫氨酸进行了删除)。
LbCpf1-RR突变体与蛋白质LbCpf1的唯一不同在于:第532位的氨基酸由G变为R,第595位的氨基酸由K变为R。
二、重组农杆菌的获得
分别将步骤一获得的重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)、重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(SBEIIb)和重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)导入农杆菌EHA105,得到重组农杆菌1、重组农杆菌2和重组农杆菌3。
三、T0代转基因水稻植株的获得
1、分别将重组农杆菌1、重组农杆菌2和重组农杆菌3的单克隆接种至10mL含50mg/L卡那霉素和50mg/L利福平的LB液体培养基,28℃振荡培养16h,收集农杆菌并用AAM培养基重悬,得到OD600nm值为0.3-0.5的农杆菌悬浮液。
2、选取饱满的kitaake水稻种子,剥去种皮,灭菌洗涤后,均匀的点入含2mg/L 2,4-D的NB固体培养基中,28℃黑暗培养40-50d以诱导愈伤组织的产生。
3、将步骤2形成的愈伤组织置于步骤1制备的农杆菌悬浮液中侵染5min,侵染后用滤纸吸干表面菌液并转移到共培养基上在25℃下培养3d。
4、完成步骤3后,将所述愈伤组织转移至含70mg/L潮霉素和2mg/L 2,4-D的NB固体培养基(即筛选培养基)上,在28℃条件下持续光照2周。
5、完成步骤4后,取生长良好呈嫩黄色的阳性愈伤组织,用无菌镊子转移至含70mg/L潮霉素、1mg/L NAA、5mg/L ABA和2mg/L kinetin的NB固体培养基(即NB预分化培养基)上,28℃条件下持续光照培养2周。
6、完成步骤5后,取生长旺盛的愈伤组织,用无菌镊子转移至含70mg/L潮霉素、0.02mg/L NAA和2mg/L kinetin的MS固体培养基(即MS分化培养基)上,在28℃条件下持续光照培养。待分化出来的幼苗长至2-5mm时,将分化苗转入不含激素和抗生素的MS固体培养基中,在28℃条件下持续光照培养2-3周,之后移入土中置于温室中生长(培养条件为:温度28-30℃,光照为16h光照/8h黑暗),分别得到T0代OsPDS基因编辑的水稻植株、T0代OsSBEIIb基因编辑的水稻植株和T0代OsPDS/OsSBEIIb基因编辑的水稻植株。
T0代OsPDS基因编辑的水稻植株、T0代OsSBEIIb基因编辑的水稻植株和T0代OsPDS/OsSBEIIb基因编辑的水稻植株均为T0代转基因水稻植株。
四、T0代转基因水稻的基因型鉴定
T0代转基因水稻植株为T0代转OsPDS水稻植株、T0代转OsSBEIIb水稻植株或T0代转OsPDS/OsSBEIIb水稻植株。
1、分别以T0代转基因水稻植株的基因组DNA为模板,采用引物对PDS(由T7E1-PDSF和T7E1-PDSR组成)或引物对SBEⅡb(由T7E1-SBEⅡbF和T7E1-SBEⅡbR组成)进行PCR扩增,得到PCR扩增产物。将该PCR扩增产物用T7E1进行酶切,电泳,检测是否产生突变。
按照上述方法,将T0代转基因水稻植株替换为野生型kitaake(即未转基因的kitaake),其它步骤均不变,作为对照。
2、分别以T0代转基因水稻植株的基因组DNA为模板,采用引物对PDS-Test(由PDS-RR-TestF和PDS-RR-TestR组成)或引物对SBEⅡb-Test(由SBEIIb-RR-TestF和SBEIIb-RR-TestR组成)进行PCR扩增,得到PCR扩增产物。将该PCR扩增产物进行测序,然后采用网站(http://dsdecode.scgene.com/)分析测序结果中的编辑类型。
按照上述方法,将T0代转基因水稻植株替换为野生型kitaake(即未转基因的kitaake),其它步骤均不变,作为对照。
T0代OsPDS基因编辑的水稻植株的实验结果见图3和图2中A。结果如下:共获得99棵T0代转PDS水稻单株,其中51棵检测到OsPDS基因的编辑。只在Target1(PDS 1)位点有编辑的植株为20棵,其中19棵为杂合体,1棵为双等位植株。只在Target2(PDS 2)位点有编辑的植株数为22棵,其中19棵为杂合体,3棵为嵌合体。在Target1(PDS 1)和Target2(PDS2)位点均有编辑的植株数为9棵,但只在1棵植株中检测到两个靶点间序列全部缺失的现象。
T0代OsSBEIIb基因编辑的水稻植株的实验结果见图3和图2中B。结果如下:共获得90棵T0代转OsSBEIIb水稻单株,其中29棵检测到OsSBEIIb基因的编辑。只在Target1(SBEIIb1)位点有编辑的植株为28棵,其中25棵为杂合体,3棵为嵌合体。在Target1(SBEIIb1)和Target2(SBEIIb 2)位点均有编辑的植株数为1棵。
T0代OsPDS/OsSBEIIb基因编辑的水稻植株的实验结果见图3和图2中C。结果如下:共获得97棵T0代转OsPDS/OsSBEIIb水稻单株,其中42棵检测到OsSBEIIb基因和OsPDS基因的编辑。只在OsPDS基因有编辑的植株为17棵,其中16棵为杂合体,1棵为嵌合体。只在OsSBEIIb基因有编辑的植株数为16棵,其中12棵为杂合体,2棵为双等位植株,2棵为嵌合体。OsPDS基因和OsSBEIIb基因均有编辑的植株数为9棵。
五、水稻基因组的生物信息学分析
对水稻基因组序列进行生物信息学分析,分析PAM位点为“TTTV”的序列和PAM位点为“TYCV”的序列在水稻基因组中的分别占比及各占比之和。
对水稻基因组中的近55986个注释基因进行生物信息学分析,其中含有PAM位点为“TTTV”(V为A或C或G)的基因约占96.03%。含有PAM位点为“TYCV”(Y为C或T,V为A或C或G)的基因约占99.60%,含有两者之一的基因约占99.75%(图4)。
结果表明,将LbCpf1-RR突变体应用于CRISPR/Cpf1系统,扩大了CRISPR/Cpf1系统植物基因编辑的应用范围。
六、脱靶分析
1、取步骤四获得的T0代OsPDS基因编辑的水稻植株中在RR-PDS1靶点有编辑的植株22棵,进行靶标RR-PDS1的脱靶情况的鉴定。靶标RR-PDS1存在两个可能脱靶的位点,PDS1-OFF1和PDS1-OFF2。具体步骤为:提取植株的基因组DNA,采用用于扩增各个脱靶位点的引物对进行PCR扩增,然后将PCR扩增产物进行测序。
2、取步骤四获得的T0代OsPDS基因编辑的水稻植株中在RR-PDS 2靶点有编辑的植株20棵,进行靶标RR-PDS2的脱靶情况的鉴定。靶标RR-PDS2存在两个可能脱靶的位点,PDS2-OFF1和PDS2-OFF2。具体步骤同步骤1。
3、取步骤四获得的T0代OsSBEIIb基因编辑的水稻植株中在RR-SBEIIb 1靶点有编辑的植株25棵,进行靶标RR-SBEⅡb1的脱靶情况的鉴定。靶标RR-SBEⅡb1存在两个可能脱靶的位点,SBEⅡb1-OFF1和SBEⅡb1-OFF2。具体步骤同步骤1。
4、取步骤四获得的T0代OsSBEIIb基因编辑的水稻植株中检测到OsSBEIIb基因的编辑的植株29棵,进行靶标RR-SBEⅡb2的脱靶情况的鉴定。靶标RR-SBEⅡb2只存在一个可能脱靶的位点,SBEⅡb2-OFF1。
用于扩增各个脱靶位点的引物对详见表2。
实验结果见表3。结果表明,本实施例的各个靶点不存在脱靶情况。
表3.靶点脱靶分析
注:PAM位点用下划线表示,错配碱基用斜体表示。
实施例2、LbCpf1-RVR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
本实施例中靶标基因、靶点名称和序列如表4所示。
表4
一、表达载体的构建
人工合成重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1-RCR2(PDS)。
重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1-RCR2(PDS)与重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)的唯一不同在于:将OsU3-RCR1-RCR2(PDS)表达盒替换为表达盒甲,将编码LbCpf1-RR突变体的核苷酸序列替换为编码LbCpf1-RVR突变体的核苷酸序列。表达盒甲的核苷酸序列如序列表中序列5所示。
重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1-RCR2(SBEIIb)与重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)的唯一不同在于:将OsU3-RCR1-RCR2(PDS)表达盒替换为表达盒乙,将编码LbCpf1-RR突变体的核苷酸序列替换为编码LbCpf1-RVR突变体的核苷酸序列。表达盒乙的核苷酸序列如序列表中序列7所示。
重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)与重组载体pCXUN-LbCpf1(RR)-OsU3-RCR1-RCR2(PDS)的唯一不同在于:将OsU3-RCR1-RCR2(PDS)表达盒替换为表达盒丙,将编码LbCpf1-RR突变体的核苷酸序列替换为编码LbCpf1-RVR突变体的核苷酸序列。表达盒丙的核苷酸序列如序列表中序列8所示。
编码LbCpf1-RVR突变体的核苷酸序列如序列表中序列6所示。
上述三个表达载体中,编码LbCpf1-RVR突变体的核苷酸序列、核定位信号甲的核苷酸序列、核定位信号乙的核苷酸序列和3×Flag标签的核苷酸序列融合,形成融合基因,表达含有LbCpf1-RVR突变体的融合蛋白(需要说明的是,融合蛋白中LbCpf1-RVR突变体的起始氨基酸甲硫氨酸进行了删除)。LbCpf1-RVR突变体与蛋白质LbCpf1的唯一不同在于:第532位由G变为R,第538位由K变为V,第542位由Y变为R。
二、重组农杆菌的获得
分别将步骤一获得的重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1-RCR2(PDS)、重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1-RCR2(SBEIIb)和重组载体pCXUN-LbCpf1(RVR)-OsU3-RCR1(PDS)-RCR2(SBEIIb)导入农杆菌EHA105,得到重组农杆菌甲、重组农杆菌乙和重组农杆菌丙。
三、T0代转基因水稻植株的获得
按照实施例1中步骤三的步骤,分别将重组农杆菌1替换为重组农杆菌甲、重组农杆菌乙和重组农杆菌丙,其它步骤均不变,以期得到T0代OsPDS基因编辑的水稻植株、T0代OsSBEIIb基因编辑的水稻植株和T0代OsPDS/OsSBEIIb基因编辑的水稻植株。
四、T0代转基因水稻的基因型鉴定
T0代转基因水稻植株为T0代OsPDS基因编辑的水稻植株、T0代OsSBEIIb基因编辑的水稻植株或T0代OsPDS/OsSBEIIb基因编辑的水稻植株。
1、同实施例1步骤四中1。
2、分别以T0代转基因水稻植株的基因组DNA为模板,采用引物对PDS-Test(由PDS-RVR-TestF:5’-ACTAAACCATTACAGGTCGTGATTGC-3’和PDS-RVR-TestR:5’-CAGTGCTGGCGGTAATAACCTAAAT-3’组成)或引物对SBEⅡb-Test(由SBEIIb-RVR-TestF:5’-CTCTGGGTTCTAAGCCCTTTTGGT-3’和SBEIIb-RVR-TestR:5’-ATTCACTGTAGTTCCCCGTAAATGCT-3’组成)进行PCR扩增,得到PCR扩增产物。将该PCR扩增产物进行测序,然后采用网站(http://dsdecode.scgene.com/)分析测序结果中的编辑类型。
按照上述方法,将T0代转基因水稻植株替换为野生型kitaake(即未转基因的kitaake),其它步骤均不变,作为对照。
实验结果表明,将LbCpf1-RVR突变体应用于CRISPR/Cpf1系统,未能检测到进行基因编码的水稻植株。
<110> 中国农业科学院作物科学研究所
<120> LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 15830
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
gaattcgagc tcaaggaatc tttaaacata cgaacagatc acttaaagtt cttctgaagc 60
aacttaaagt tatcaggcat gcatggatct tggaggaatc agatgtgcag tcagggacca 120
tagcacaaga caggcgtctt ctactggtgc taccagcaaa tgctggaagc cgggaacact 180
gggtacgttg gaaaccacgt gatgtgaaga agtaagataa actgtaggag aaaagcattt 240
cgtagtgggc catgaagcct ttcaggacat gtattgcagt atgggccggc ccattacgca 300
attggacgac aacaaagact agtattagta ccacctcggc tatccacata gatcaaagct 360
gatttaaaag agttgtgcag atgatccgtg gcaaaattac tgatgagtcc gtgaggacga 420
aacgagtaag ctcgtctaat ttctactaag tgtagatgtg tcactccgtc caacccattc 480
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 540
aatgggacga atacgaccaa attactgatg agtccgtgag gacgaaacga gtaagctcgt 600
ctaatttcta ctaagtgtag atggactgtg aaccttgccg acctcggccg gcatggtccc 660
agcctcctcg ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gaccggtacc 720
cctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 780
gtcacgacgt tgtaaaacga cggccagtga attcccgatc tagtaacata gatgacaccg 840
cgcgcgataa tttatcctag tttgcgcgct atattttgtt ttctatcgcg tattaaatgt 900
ataattgcgg gactctaatc ataaaaaccc atctcataaa taacgtcatg cattacatgt 960
taattattac atgcttaacg taattcaaca gaaattatat gataatcatc gcaagaccgg 1020
caacaggatt caatcttaag aaactttatt gccaaatgtt tgaacgatcg gggaaattcg 1080
gatccttact ttttcttttt tgcctggccg gcctttttcg tggccgccgg ccttttgtgc 1140
ttcacgctgg tctgggcgta ctccagccac tccttgttag agatggcgat cttcacctta 1200
tccagcttct cgtcctcggc cttcttgaac tggccgatgg cccacagcac ctttctggcg 1260
atgttatagg cgccattggc gtcggcgttc tttggcagga tggcattctc ctgggcctca 1320
tagttccggc tatcgtagaa gatgccgtcg gagttcttca cagggctgat cagaaaatcc 1380
acgtcggtgc ggcctgtgat gctgttccgc atctgcagca tcaggctcat cagggccata 1440
aagctagagt agaaggcctt gtcggactgc tcgcacagca gggctctgat atcgccctgc 1500
tgataattga tgccgtactt gttgaacagc tccttatagg cgctggtcag gcacacctcc 1560
tcccagtcga acacgttgtt cttcttagga ttccggaaga ttctgatccg gttgccgtag 1620
gagtacagct tccacttctt gatgtaatcg gcgtctgtgc gagagaagtt cttatagtcc 1680
agggcaaact cgaacagatc ctcctcgggc acgtacatga tcctgtcaaa ggagctgatg 1740
aacttcttgg aatcggcgat gctggtatac ttggttttca gcaggttcac aaagccggta 1800
gatggatcga tcttggatgt cagccaggca gggatgtaaa agatgaagcc gttctgggta 1860
gacatggact taaagctctc gaacttattg gtgatctgat agcccttcag ggcgccgcct 1920
gttgcacaag gattagactt cttgtccacc atgtagttca gcttatcgat cagcatcttc 1980
tcgaacttct gatacacctg cttctccacc ttcacgcggc tattcttaaa gccagagttc 2040
aggtcctcca gggcgatcac ggcatcgtac ttctccacca gctcgcagat cttgtgcacc 2100
acctgagaga tatagccggc cttcagctcc ttgatattct cgatggaggt ccagttctgg 2160
cgggcctcga acctctcctt ctccttcttg tccagcagag agtggtaatc tgtcttgatc 2220
ctgatgccgt tgaagttgtt gatgatctcg ttcagggaat actgctccac gatgttgccc 2280
ttgccgtcca ccaccacgat atacagcaga ttgcgctcgc ccctatcgat gccgatcaca 2340
taggggttat cgtcgtgctt cagcagcacg cgcacctctg tattgatctt gaagatgttc 2400
ttggggcact tattgatggc gattgggatg tgcagctcgt actggtcctc agaaaacctc 2460
ttatccttat acacgtcgta ggacagggtt gtggttttct tgggattatc tggattcttg 2520
ttggcgatag gggagttggc tgggtgcacc accagctcct ccttcttcag ggaggcgcgc 2580
ctcatgaaca gctctgctcc tccgctcagc ctgatctgtc cgtgattgtt ctcgtcaaac 2640
agcagcttga agtacatggt gtgcagattg ggtgtgccgt gagacttatc ggaaaagtcc 2700
ttgttataga tctggaacat atacagcttg ccctcctcca ccagcttatc cacctccttc 2760
ttgctggcag actcgaagct caccttatag ccctgctcct ccacctctct gtaaaagccg 2820
gcgatgtcct tatacttctc tgtctcagaa aagttgaaat cgtaggcatt ggaccacttt 2880
ggataccggg agatgctatc cttaaagaag tcgatcagct tgtgacagtc attcaggtta 2940
aacatatcgc ccttcttgaa tgtgccattc ttgtagatct tctggatgtc ctcgctgggg 3000
ttatagtagg ccatccactt cttagaaaag aacacccgtg gcagcatctt attagggccg 3060
ggcagcagct tatagttgat cttctcgtaa ttgccgttca catcgtcctt gtcgatcttc 3120
tgcaggcact tggcgtactt cttatccatg atggccagat agtacttgga gccgtatctc 3180
aggatggtgg cccgatagtc tgtctcctta tccttgtccc agccccgcat gaactgaggg 3240
ttctgaaaat acagcttgaa cttatcctta gagtagggct tctgggtcac ataattgcgg 3300
atggcatcgt agatgtggtc caccttcagc aggatgtcgt aggccagcac aaaatcgcca 3360
tagaaggact cgtccctgtt tgtctccttg ccctcgccaa agaaggcctt gatgtaattc 3420
tcgaagctct tcacagaatc cagcaggtcc ttcatgatgg ccaccacggc gtcgttcttc 3480
ttcaggctct tctccagcac aaaatcggcg tcgaacagct tctcagagga gccatacacc 3540
ttgtagatct catccacctt ctggatgatg atctccttca gcttctccac cacagacaga 3600
tcggcgtcgg cgtactcctg cagctgctcc agagaaaagg agccgatctt cttgaaggac 3660
tttctccgat cgtcctcgta cttctcggtc accacggcct tcttcttcag gtggatatcg 3720
tcatactcgg cattccactt gtcccggatc acgttccact cgccgaagat atccttggag 3780
attgtgctga tggcggggcc gttcttcaca aagatgccgg cgctagagta ctcgtcaaaa 3840
ttcttgaaca gcttctccag cttcttgatg gagctgaaga tctcgctgtt cttgttcagg 3900
gtgtttctaa acacctccag cacctcctca tcggatgtat agccctcgcc gtagaagctc 3960
agagactccc gatcgctcag cacctgctta tacagtggct taaacttagg cagcttctgc 4020
ttggttttct gattatacag gttgatgtac tcgttcaggc ccttgatctt ctcgccgctc 4080
tcggtcacga agccgccgat gatggcgtta tacacgtcga tgccctcctg tgtcagcaca 4140
aagttaaaga actcgccctc aaagaaatcc tccacatcat agtcgctgtt caggatcttc 4200
tccttgatct cctgcacctc gtgcttatca aagatggcgt ccaccttctc gaagatgtcc 4260
atattagaga tgtagcgggt cagattctcg ttgatacacc tgaaggcgat ggatgtgctc 4320
ttggcctcct cggaaaacat attctctctg ttatcaaaga agccggtgaa ggctgtggta 4380
aagccattga agctgttcac cagggcgatc tcgtccttat cgtccaggaa ctctggcagg 4440
attgtctcga tgatatcctt cttaaacagg gacttgtagc cctcgttgcc cttgaaggcc 4500
ttggcgatct ccttccgcag attgatctcc aggttctcca gctccttatt ctccttctcg 4560
gttctggttt tcttccggaa caggctgatg taattgttca gattcttcag cttgatgctg 4620
tgcagcacgt cgttgataaa agacagatag tagcgatcca gcagcttctt cacgccctta 4680
taatcctcgg ctctcttctc gtcctccacc agcagccgct tattgtcgat gttctcctgg 4740
gtcttgccca cagggatggc cttgaacctc agggtcttag acagggagta gcagtttgta 4800
aacttctcca gcttgctggc tgctgggact ccgtggatac cgaccttccg cttcttcttt 4860
ggggccatct tatcgtcatc gtctttgtaa tcaatatcat gatccttgta gtctccgtcg 4920
tggtccttat agtccatggc tgcagaagta acaccaaaca acagggtgag catcgacaaa 4980
agaaacagta ccaagcaaat aaatagcgta tgaaggcagg gctaaaaaaa tccacatata 5040
gctgctgcat atgccatcat ccaagtatat caagatcaaa ataattataa aacatacttg 5100
tttattataa tagataggta ctcaaggtta gagcatatga atagatgctg catatgccat 5160
catgtatatg catcagtaaa acccacatca acatgtatac ctatcctaga tcgatatttc 5220
catccatctt aaactcgtaa ctatgaagat gtatgacaca cacatacagt tccaaaatta 5280
ataaatacac caggtagttt gaaacagtat tctactccga tctagaacga atgaacgacc 5340
gcccaaccac accacatcat cacaaccaag cgaacaaaaa gcatctctgt atatgcatca 5400
gtaaaacccg catcaacatg tatacctatc ctagatcgat atttccatcc atcatcttca 5460
attcgtaact atgaatatgt atggcacaca catacagatc caaaattaat aaatccacca 5520
ggtagtttga aacagaattc tactccgatc tagaacgacc gcccaaccag accacatcat 5580
cacaaccaag acaaaaaaaa gcatgaaaag atgacccgac aaacaagtgc acggcatata 5640
ttgaaataaa ggaaaagggc aaaccaaacc ctatgcaacg aaacaaaaaa aatcatgaaa 5700
tcgatcccgt ctgcggaacg gctagagcca tcccaggatt ccccaaagag aaacactggc 5760
aagttagcaa tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa cgctagcagc 5820
acggatctaa cacaaacacg gatctaacac aaacatgaac agaagtagaa ctaccgggcc 5880
ctaaccatgg accggaacgc cgatctagag aaggtagaga gggggggggg gggaggacga 5940
gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatct ggttgtgtgt 6000
gtgtgcgctc cgaacaacac gaggttgggg aaagagggtg tggagggggt gtctatttat 6060
tacggcgggc gaggaaggga aagcgaagga gcggtgggaa aggaatcccc cgtagctgcc 6120
gtgccgtgag aggaggagga ggccgcctgc cgtgccggct cacgtctgcc gctccgccac 6180
gcaatttctg gatgccgaca gcggagcaag tccaacggtg gagcggaact ctcgagaggg 6240
gtccagaggc agcgacagag atgccgtgcc gtctgcttcg cttggcccga cgcgacgctg 6300
ctggttcgct ggttggtgtc cgttagactc gtcgacggcg tttaacaggc tggcattatc 6360
tactcgaaac aagaaaaatg tttccttagt ttttttaatt tcttaaaggg tatttgttta 6420
atttttagtc actttatttt attctatttt atatctaaat tattaaataa aaaaactaaa 6480
atagagtttt agttttctta atttagaggc taaaatagaa taaaatagat gtactaaaaa 6540
aattagtcta taaaaaccat taaccctaaa ccctaaatgg atgtactaat aaaatggatg 6600
aagtattata taggtgaagc tatttgcaaa aaaaaaggag aacacatgca cactaaaaag 6660
ataaaactgt agagtcctgt tgtcaaaata ctcaattgtc ctttagacca tgtctaactg 6720
ttcatttata tgattctcta aaacactgat attattgtag tactatagat tatattattc 6780
gtagagtaaa gtttaaatat atgtataaag atagataaac tgcacttcaa acaagtgtga 6840
caaaaaaaat atgtggtaat tttttataac ttagacatgc aatgctcatt atctctagag 6900
aggggcacga ccgggtcacg ctgcaaagct tggcactggc cgtcgtttta caacgtcgtg 6960
actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca 7020
gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 7080
atggcgaatg ctagagcagc ttgagcttgg atcagattgt cgtttcccgc cttcagttta 7140
aactatcagt gtttgacagg atatattggc gggtaaacct aagagaaaag agcgtttatt 7200
agaataacgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc 7260
atgccaacca cagggttccc ctcgggatca aagtactttg atccaacccc tccgctgcta 7320
tagtgcagtc ggcttctgac gttcagtgca gccgtcttct gaaaacgaca tgtcgcacaa 7380
gtcctaagtt acgcgacagg ctgccgccct gcccttttcc tggcgttttc ttgtcgcgtg 7440
ttttagtcgc ataaagtaga atacttgcga ctagaaccgg agacattacg ccatgaacaa 7500
gagcgccgcc gctggcctgc tgggctatgc ccgcgtcagc accgacgacc aggacttgac 7560
caaccaacgg gccgaactgc acgcggccgg ctgcaccaag ctgttttccg agaagatcac 7620
cggcaccagg cgcgaccgcc cggagctggc caggatgctt gaccacctag ccctggcgac 7680
gttgtgacag tgaccaggct agaccgcctg gcccgcagca cccgcgacct actggacatt 7740
gccgagcgca tccaggaggc cggcgcgggc ctgcgtagcc tggcagagcc gtgggccgac 7800
accaccacgc cggccggccg catggtgttg accgtgttcg ccggcattgc cgagttcgag 7860
cgttccctaa tcatcgaccg cacccggagc gggcgcgagg ccgccaaggc ccgaggcgtg 7920
aagtttggcc cccgccctac cctcaccccg gcacagatcg cgcacgcccg cgagctgatc 7980
gaccaggaag gccgcaccgt gaaagaggcg gctgcactgc ttggcgtgca tcgctcgacc 8040
ctgtaccgcg cacttgagcg cagcgaggaa gtgacgccca ccgaggccag gcggcgcggt 8100
gccttccgtg aggacgcatt gaccgaggcc gacgccctgg cggccgccga gaatgaacgc 8160
caagaggaac aagcatgaaa ccgcaccagg acggccagga cgaaccgttt ttcattaccg 8220
aagagatcga ggcggagatg atcgcggccg ggtacgtgtt cgagccgccc gcgcacgtct 8280
caaccgtgcg gctgcatgaa atcctggccg gtttgtctga tgccaagctg gcggcctggc 8340
cggccagctt ggccgctgaa gaaaccgagc gccgccgtct aaaaaggtga tgtgtatttg 8400
agtaaaacag cttgcgtcat gcggtcgctg cgtatatgat gcgatgagta aataaacaaa 8460
tacgcaaggg gaacgcatga aggttatcgc tgtacttaac cagaaaggcg ggtcaggcaa 8520
gacgaccatc gcaacccatc tagcccgcgc cctgcaactc gccggggccg atgttctgtt 8580
agtcgattcc gatccccagg gcagtgcccg cgattgggcg gccgtgcggg aagatcaacc 8640
gctaaccgtt gtcggcatcg accgcccgac gattgaccgc gacgtgaagg ccatcggccg 8700
gcgcgacttc gtagtgatcg acggagcgcc ccaggcggcg gacttggctg tgtccgcgat 8760
caaggcagcc gacttcgtgc tgattccggt gcagccaagc ccttacgaca tatgggcaac 8820
cgccgacctg gtggagctgg ttaagcagcg cattgaggtc acggatggaa ggctacaagc 8880
ggcctttgtc gtgtcgcggg cgatcaaagg cacgcgcatc ggcggtgagg ttgccgaggc 8940
gctggccggg tacgagctgc ccattcttga gtcccgtatc acgcagcgcg tgagctaccc 9000
aggcactgcc gccgccggca caaccgttct tgaatcagaa cccgagggcg acgctgcccg 9060
cgaggtccag gcgctggccg ctgaaattaa atcaaaactc atttgagtta atgaggtaaa 9120
gagaaaatga gcaaaagcac aaacacgcta agtgccggcc gtccgagcgc acgcagcagc 9180
aaggctgcaa cgttggccag cctggcagac acgccagcca tgaagcgggt caactttcag 9240
ttgccggcgg aggatcacac caagctgaag atgtacgcgg tacgccaagg caagaccatt 9300
accgagctgc tatctgaata catcgcgcag ctaccagagt aaatgagcaa atgaataaat 9360
gagtagatga attttagcgg ctaaaggagg cggcatggaa aatcaagaac aaccaggcac 9420
cgacgccgtg gaatgcccca tgtgtggagg aacgggcggt tggccaggcg taagcggctg 9480
ggttgtctgc cggccctgca atggcactgg aacccccaag cccgaggaat cggcgtgacg 9540
gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct gggtgatgac ctggtggaga 9600
agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga ggcagaagca cgccccggtg 9660
aatcgtggca agcggccgct gatcgaatcc gcaaagaatc ccggcaaccg ccggcagccg 9720
gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca accagatttt ttcgttccga 9780
tgctctatga cgtgggcacc cgcgatagtc gcagcatcat ggacgtggcc gttttccgtc 9840
tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta cgagcttcca gacgggcacg 9900
tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg ggattacgac ctggtactga 9960
tggcggtttc ccatctaacc gaatccatga accgataccg ggaagggaag ggagacaagc 10020
ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa gttctgccgg cgagccgatg 10080
gcggaaagca gaaagacgac ctggtagaaa cctgcattcg gttaaacacc acgcacgttg 10140
ccatgcagcg tacgaagaag gccaagaacg gccgcctggt gacggtatcc gagggtgaag 10200
ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg gcggccggag tacatcgaga 10260
tcgagctagc tgattggatg taccgcgaga tcacagaagg caagaacccg gacgtgctga 10320
cggttcaccc cgattacttt ttgatcgatc ccggcatcgg ccgttttctc taccgcctgg 10380
cacgccgcgc cgcaggcaag gcagaagcca gatggttgtt caagacgatc tacgaacgca 10440
gtggcagcgc cggagagttc aagaagttct gtttcaccgt gcgcaagctg atcgggtcaa 10500
atgacctgcc ggagtacgat ttgaaggagg aggcggggca ggctggcccg atcctagtca 10560
tgcgctaccg caacctgatc gagggcgaag catccgccgg ttcctaatgt acggagcaga 10620
tgctagggca aattgcccta gcaggggaaa aaggtcgaaa aggtctcttt cctgtggata 10680
gcacgtacat tgggaaccca aagccgtaca ttgggaaccg gaacccgtac attgggaacc 10740
caaagccgta cattgggaac cggtcacaca tgtaagtgac tgatataaaa gagaaaaaag 10800
gcgatttttc cgcctaaaac tctttaaaac ttattaaaac tcttaaaacc cgcctggcct 10860
gtgcataact gtctggccag cgcacagccg aagagctgca aaaagcgcct acccttcggt 10920
cgctgcgctc cctacgcccc gccgcttcgc gtcggcctat cgcggccgct ggccgctcaa 10980
aaatggctgg cctacggcca ggcaatctac cagggcgcgg acaagccgcg ccgtcgccac 11040
tcgaccgccg gcgcccacat caaggcaccc tgcctcgcgc gtttcggtga tgacggtgaa 11100
aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg 11160
agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg 11220
acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca tcagagcaga 11280
ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat 11340
accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 11400
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 11460
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 11520
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 11580
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 11640
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 11700
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 11760
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 11820
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 11880
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 11940
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 12000
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 12060
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 12120
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 12180
gttaagggat tttggtcatg cattctaggt actaaaacaa ttcatccagt aaaatataat 12240
attttatttt ctcccaatca ggcttgatcc ccagtaagtc aaaaaatagc tcgacatact 12300
gttcttcccc gatatcctcc ctgatcgacc ggacgcagaa ggcaatgtca taccacttgt 12360
ccgccctgcc gcttctccca agatcaataa agccacttac tttgccatct ttcacaaaga 12420
tgttgctgtc tcccaggtcg ccgtgggaaa agacaagttc ctcttcgggc ttttccgtct 12480
ttaaaaaatc atacagctcg cgcggatctt taaatggagt gtcttcttcc cagttttcgc 12540
aatccacatc ggccagatcg ttattcagta agtaatccaa ttcggctaag cggctgtcta 12600
agctattcgt atagggacaa tccgatatgt cgatggagtg aaagagcctg atgcactccg 12660
catacagctc gataatcttt tcagggcttt gttcatcttc atactcttcc gagcaaagga 12720
cgccatcggc ctcactcatg agcagattgc tccagccatc atgccgttca aagtgcagga 12780
cctttggaac aggcagcttt ccttccagcc atagcatcat gtccttttcc cgttcaacat 12840
cataggtggt ccctttatac cggctgtccg tcatttttaa atataggttt tcattttctc 12900
ccaccagctt atatacctta gcaggagaca ttccttccgt atcttttacg cagcggtatt 12960
tttcgatcag ttttttcaat tccggtgata ttctcatttt agccatttat tatttccttc 13020
ctcttttcta cagtatttaa agatacccca agaagctaat tataacaaga cgaactccaa 13080
ttcactgttc cttgcattct aaaaccttaa ataccagaaa acagcttttt caaagttgtt 13140
ttcaaagttg gcgtataaca tagtatcgac ggagccgatt ttgaaaccgc ggtgatcaca 13200
ggcagcaacg ctctgtcatc gttacaatca acatgctacc ctccgcgaga tcatccgtgt 13260
ttcaaacccg gcagcttagt tgccgttctt ccgaatagca tcggtaacat gagcaaagtc 13320
tgccgcctta caacggctct cccgctgacg ccgtcccgga ctgatgggct gcctgtatcg 13380
agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt ggctggctgg tggcaggata 13440
tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg gacgttttta 13500
atgtactgaa ttaacgccga attaattcgg gggatctgga ttttagtact ggattttggt 13560
tttaggaatt agaaatttta ttgatagaag tattttacaa atacaaatac atactaaggg 13620
tttcttatat gctcaacaca tgagcgaaac cctataggaa ccctaattcc cttatctggg 13680
aactactcac acattattat ggagaaactc gagcttgtcg atcgacagat ccggtcggca 13740
tctactctat ttctttgccc tcggacgagt gctggggcgt cggtttccac tatcggcgag 13800
tacttctaca cagccatcgg tccagacggc cgcgcttctg cgggcgattt gtgtacgccc 13860
gacagtcccg gctccggatc ggacgattgc gtcgcatcga ccctgcgccc aagctgcatc 13920
atcgaaattg ccgtcaacca agctctgata gagttggtca agaccaatgc ggagcatata 13980
cgcccggagt cgtggcgatc ctgcaagctc cggatgcctc cgctcgaagt agcgcgtctg 14040
ctgctccata caagccaacc acggcctcca gaagaagatg ttggcgacct cgtattggga 14100
atccccgaac atcgcctcgc tccagtcaat gaccgctgtt atgcggccat tgtccgtcag 14160
gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc agtcctcggc 14220
ccaaagcatc agctcatcga gagcctgcgc gacggacgca ctgacggtgt cgtccatcac 14280
agtttgccag tgatacacat ggggatcagc aatcgcgcat atgaaatcac gccatgtagt 14340
gtattgaccg attccttgcg gtccgaatgg gccgaacccg ctcgtctggc taagatcggc 14400
cgcagcgatc gcatccatag cctccgcgac cggttgtaga acagcgggca gttcggtttc 14460
aggcaggtct tgcaacgtga caccctgtgc acggcgggag atgcaatagg tcaggctctc 14520
gctaaactcc ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg caaagtgccg 14580
ataaacataa cgatctttgt agaaaccatc ggcgcagcta tttacccgca ggacatatcc 14640
acgccctcct acatcgaagc tgaaagcacg agattcttcg ccctccgaga gctgcatcag 14700
gtcggagacg ctgtcgaact tttcgatcag aaacttctcg acagacgtcg cggtgagttc 14760
aggctttttc atatctcatt gccccccgga tctgcgaaag ctcgagagag atagatttgt 14820
agagagagac tggtgatttc agcgtgtcct ctccaaatga aatgaacttc cttatataga 14880
ggaaggtctt gcgaaggata gtgggattgt gcgtcatccc ttacgtcagt ggagatatca 14940
catcaatcca cttgctttga agacgtggtt ggaacgtctt ctttttccac gatgctcctc 15000
gtgggtgggg gtccatcttt gggaccactg tcggcagagg catcttgaac gatagccttt 15060
cctttatcgc aatgatggca tttgtaggtg ccaccttcct tttctactgt ccttttgatg 15120
aagtgacaga tagctgggca atggaatccg aggaggtttc ccgatattac cctttgttga 15180
aaagtctcaa tagccctttg gtcttctgag actgtatctt tgatattctt ggagtagacg 15240
agagtgtcgt gctccaccat gttatcacat caatccactt gctttgaaga cgtggttgga 15300
acgtcttctt tttccacgat gctcctcgtg ggtgggggtc catctttggg accactgtcg 15360
gcagaggcat cttgaacgat agcctttcct ttatcgcaat gatggcattt gtaggtgcca 15420
ccttcctttt ctactgtcct tttgatgaag tgacagatag ctgggcaatg gaatccgagg 15480
aggtttcccg atattaccct ttgttgaaaa gtctcaatag ccctttggtc ttctgagact 15540
gtatctttga tattcttgga gtagacgaga gtgtcgtgct ccaccatgtt ggcaagctgc 15600
tctagccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 15660
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 15720
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 15780
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 15830
<210> 2
<211> 701
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420
cgtctaattt ctactaagtg tagatagcat cctcaaccta aaagaccagg ccggcatggt 480
cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540
acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600
aagtgtagat tgcctggatc aagtactctg tgcggccggc atggtcccag cctcctcgct 660
ggcgccggct gggcaacatg cttcggcatg gcgaatggga c 701
<210> 3
<211> 701
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420
cgtctaattt ctactaagtg tagatgtgtc actccgtcca acccattcgg ccggcatggt 480
cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540
acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600
aagtgtagat tgcctggatc aagtactctg tgcggccggc atggtcccag cctcctcgct 660
ggcgccggct gggcaacatg cttcggcatg gcgaatggga c 701
<210> 4
<211> 1283
<212> PRT
<213> 人工序列
<220>
<223>
<400> 4
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Ser Lys Leu Glu Lys Phe Thr Asn
35 40 45
Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly
50 55 60
Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu
65 70 75 80
Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr
85 90 95
Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn
100 105 110
Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys
115 120 125
Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile
130 135 140
Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys
145 150 155 160
Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu
165 170 175
Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly
180 185 190
Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr
195 200 205
Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser
210 215 220
Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu
225 230 235 240
Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu
245 250 255
Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly
260 265 270
Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly
275 280 285
Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys
290 295 300
Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu
305 310 315 320
Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp
325 330 335
Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu
340 345 350
Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp
355 360 365
Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser
370 375 380
Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys
385 390 395 400
Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val
405 410 415
Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly
420 425 430
Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser
435 440 445
Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile
450 455 460
Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val
465 470 475 480
Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys
485 490 495
Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe
500 505 510
Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp
515 520 525
Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp
530 535 540
Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe
545 550 555 560
Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Arg Gly Trp Asp Lys Asp
565 570 575
Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr
580 585 590
Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile
595 600 605
Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu
610 615 620
Leu Pro Gly Pro Asn Lys Met Leu Pro Arg Val Phe Phe Ser Lys Lys
625 630 635 640
Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys
645 650 655
Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His
660 665 670
Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp
675 680 685
Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp
690 695 700
Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser
705 710 715 720
Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly
725 730 735
Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser
740 745 750
His Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp
755 760 765
Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe
770 775 780
Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala
785 790 795 800
Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr
805 810 815
Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln
820 825 830
Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile
835 840 845
Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn
850 855 860
Pro Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile
865 870 875 880
Val Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn
885 890 895
Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His
900 905 910
Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn
915 920 925
Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser
930 935 940
Gln Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val
945 950 955 960
Ile Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys
965 970 975
Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys
980 985 990
Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly
995 1000 1005
Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys
1010 1015 1020
Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp
1025 1030 1035
Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu
1040 1045 1050
Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser
1055 1060 1065
Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu
1070 1075 1080
Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr
1085 1090 1095
Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile
1100 1105 1110
Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val
1115 1120 1125
Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile
1130 1135 1140
Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser
1145 1150 1155
Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met
1160 1165 1170
Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe
1175 1180 1185
Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser
1190 1195 1200
Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala
1205 1210 1215
Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala
1220 1225 1230
Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val
1235 1240 1245
Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr
1250 1255 1260
Ser Val Lys His Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1265 1270 1275
Ala Lys Lys Lys Lys
1280
<210> 5
<211> 701
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420
cgtctaattt ctactaagtg tagataacgg caaaatatct ggcagatggg ccggcatggt 480
cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540
acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600
aagtgtagat aagcccagtt tcataccaat ctcggccggc atggtcccag cctcctcgct 660
ggcgccggct gggcaacatg cttcggcatg gcgaatggga c 701
<210> 6
<211> 3849
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
ctttttcttt tttgcctggc cggccttttt cgtggccgcc ggccttttgt gcttcacgct 60
ggtctgggcg tactccagcc actccttgtt agagatggcg atcttcacct tatccagctt 120
ctcgtcctcg gccttcttga actggccgat ggcccacagc acctttctgg cgatgttata 180
ggcgccattg gcgtcggcgt tctttggcag gatggcattc tcctgggcct catagttccg 240
gctatcgtag aagatgccgt cggagttctt cacagggctg atcagaaaat ccacgtcggt 300
gcggcctgtg atgctgttcc gcatctgcag catcaggctc atcagggcca taaagctaga 360
gtagaaggcc ttgtcggact gctcgcacag cagggctctg atatcgccct gctgataatt 420
gatgccgtac ttgttgaaca gctccttata ggcgctggtc aggcacacct cctcccagtc 480
gaacacgttg ttcttcttag gattccggaa gattctgatc cggttgccgt aggagtacag 540
cttccacttc ttgatgtaat cggcgtctgt gcgagagaag ttcttatagt ccagggcaaa 600
ctcgaacaga tcctcctcgg gcacgtacat gatcctgtca aaggagctga tgaacttctt 660
ggaatcggcg atgctggtat acttggtttt cagcaggttc acaaagccgg tagatggatc 720
gatcttggat gtcagccagg cagggatgta aaagatgaag ccgttctggg tagacatgga 780
cttaaagctc tcgaacttat tggtgatctg atagcccttc agggcgccgc ctgttgcaca 840
aggattagac ttcttgtcca ccatgtagtt cagcttatcg atcagcatct tctcgaactt 900
ctgatacacc tgcttctcca ccttcacgcg gctattctta aagccagagt tcaggtcctc 960
cagggcgatc acggcatcgt acttctccac cagctcgcag atcttgtgca ccacctgaga 1020
gatatagccg gccttcagct ccttgatatt ctcgatggag gtccagttct ggcgggcctc 1080
gaacctctcc ttctccttct tgtccagcag agagtggtaa tctgtcttga tcctgatgcc 1140
gttgaagttg ttgatgatct cgttcaggga atactgctcc acgatgttgc ccttgccgtc 1200
caccaccacg atatacagca gattgcgctc gcccctatcg atgccgatca cataggggtt 1260
atcgtcgtgc ttcagcagca cgcgcacctc tgtattgatc ttgaagatgt tcttggggca 1320
cttattgatg gcgattggga tgtgcagctc gtactggtcc tcagaaaacc tcttatcctt 1380
atacacgtcg taggacaggg ttgtggtttt cttgggatta tctggattct tgttggcgat 1440
aggggagttg gctgggtgca ccaccagctc ctccttcttc agggaggcgc gcctcatgaa 1500
cagctctgct cctccgctca gcctgatctg tccgtgattg ttctcgtcaa acagcagctt 1560
gaagtacatg gtgtgcagat tgggtgtgcc gtgagactta tcggaaaagt ccttgttata 1620
gatctggaac atatacagct tgccctcctc caccagctta tccacctcct tcttgctggc 1680
agactcgaag ctcaccttat agccctgctc ctccacctct ctgtaaaagc cggcgatgtc 1740
cttatacttc tctgtctcag aaaagttgaa atcgtaggca ttggaccact ttggataccg 1800
ggagatgcta tccttaaaga agtcgatcag cttgtgacag tcattcaggt taaacatatc 1860
gcccttcttg aatgtgccat tcttgtagat cttctggatg tcctcgctgg ggttatagta 1920
ggccatccac ttcttagaaa agaacacctt tggcagcatc ttattagggc cgggcagcag 1980
cttatagttg atcttctcgt aattgccgtt cacatcgtcc ttgtcgatct tctgcaggca 2040
cttggcgtac ttcttatcca tgatggccag atagtacttg gagccgtatc tcaggatggt 2100
ggcccggcgg tctgtctcca catccttgtc ccagccccgc atgaactgag ggttctgaaa 2160
atacagcttg aacttatcct tagagtaggg cttctgggtc acataattgc ggatggcatc 2220
gtagatgtgg tccaccttca gcaggatgtc gtaggccagc acaaaatcgc catagaagga 2280
ctcgtccctg tttgtctcct tgccctcgcc aaagaaggcc ttgatgtaat tctcgaagct 2340
cttcacagaa tccagcaggt ccttcatgat ggccaccacg gcgtcgttct tcttcaggct 2400
cttctccagc acaaaatcgg cgtcgaacag cttctcagag gagccataca ccttgtagat 2460
ctcatccacc ttctggatga tgatctcctt cagcttctcc accacagaca gatcggcgtc 2520
ggcgtactcc tgcagctgct ccagagaaaa ggagccgatc ttcttgaagg actttctccg 2580
atcgtcctcg tacttctcgg tcaccacggc cttcttcttc aggtggatat cgtcatactc 2640
ggcattccac ttgtcccgga tcacgttcca ctcgccgaag atatccttgg agattgtgct 2700
gatggcgggg ccgttcttca caaagatgcc ggcgctagag tactcgtcaa aattcttgaa 2760
cagcttctcc agcttcttga tggagctgaa gatctcgctg ttcttgttca gggtgtttct 2820
aaacacctcc agcacctcct catcggatgt atagccctcg ccgtagaagc tcagagactc 2880
ccgatcgctc agcacctgct tatacagtgg cttaaactta ggcagcttct gcttggtttt 2940
ctgattatac aggttgatgt actcgttcag gcccttgatc ttctcgccgc tctcggtcac 3000
gaagccgccg atgatggcgt tatacacgtc gatgccctcc tgtgtcagca caaagttaaa 3060
gaactcgccc tcaaagaaat cctccacatc atagtcgctg ttcaggatct tctccttgat 3120
ctcctgcacc tcgtgcttat caaagatggc gtccaccttc tcgaagatgt ccatattaga 3180
gatgtagcgg gtcagattct cgttgataca cctgaaggcg atggatgtgc tcttggcctc 3240
ctcggaaaac atattctctc tgttatcaaa gaagccggtg aaggctgtgg taaagccatt 3300
gaagctgttc accagggcga tctcgtcctt atcgtccagg aactctggca ggattgtctc 3360
gatgatatcc ttcttaaaca gggacttgta gccctcgttg cccttgaagg ccttggcgat 3420
ctccttccgc agattgatct ccaggttctc cagctcctta ttctccttct cggttctggt 3480
tttcttccgg aacaggctga tgtaattgtt cagattcttc agcttgatgc tgtgcagcac 3540
gtcgttgata aaagacagat agtagcgatc cagcagcttc ttcacgccct tataatcctc 3600
ggctctcttc tcgtcctcca ccagcagccg cttattgtcg atgttctcct gggtcttgcc 3660
cacagggatg gccttgaacc tcagggtctt agacagggag tagcagtttg taaacttctc 3720
cagcttgctg gctgctggga ctccgtggat accgaccttc cgcttcttct ttggggccat 3780
cttatcgtca tcgtctttgt aatcaatatc atgatccttg tagtctccgt cgtggtcctt 3840
atagtccat 3849
<210> 7
<211> 701
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420
cgtctaattt ctactaagtg tagatcaatg caagatggtg gctcgagggg ccggcatggt 480
cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540
acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600
aagtgtagat tgtaccatca aaaccgttca accggccggc atggtcccag cctcctcgct 660
ggcgccggct gggcaacatg cttcggcatg gcgaatggga c 701
<210> 8
<211> 701
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aaaattactg atgagtccgt gaggacgaaa cgagtaagct 420
cgtctaattt ctactaagtg tagataacgg caaaatatct ggcagatggg ccggcatggt 480
cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa tgggacgaat 540
acgaccaaat tactgatgag tccgtgagga cgaaacgagt aagctcgtct aatttctact 600
aagtgtagat caatgcaaga tggtggctcg aggggccggc atggtcccag cctcctcgct 660
ggcgccggct gggcaacatg cttcggcatg gcgaatggga c 701

Claims (10)

1.一种表达盒甲;所述表达盒甲中由启动子甲启动LbCpf1-RR突变体的编码基因表达;
所述LbCpf1-RR突变体为a1)或a2)或a3)或a4):
a1)氨基酸序列是序列表中序列4自N端起第41至1267位所示的蛋白质;
a2)在a1)所示蛋白质的N末端添加一个甲硫氨酸残基,得到的蛋白质;
a3)氨基酸序列是序列表中序列4所示的蛋白质;
a4)在a1)或a2)或a3)所示的蛋白质的N端或/和C端连接标签得到的融合蛋白质。
2.如权利要求1所述的表达盒甲,其特征在于:所述表达盒甲自5’端至3’端依次包括如下原件:所述启动子甲、所述LbCpf1-RR突变体的编码基因和终止子。
3.如权利要求1或2所述的表达盒甲,其特征在于:所述LbCpf1-RR突变体的编码基因为b1)或b2)或b3)或b4)或b5):
b1)编码区为序列表中序列1自5'末端起第1137至4817位的反向互补序列所示的DNA分子;
b2)核苷酸序列为序列表中序列1自5'末端起第1137至4817位的反向互补序列所示的DNA分子;
b3)核苷酸序列为序列表中序列1自5'末端起第1089至4937位的反向互补序列所示的DNA分子;
b4)与b1)或b2)或b3)限定的核苷酸序列具有75%或75%以上同一性,且编码LbCpf1-RR突变体的DNA分子;
b5)与b1)或b2)或b3)限定的核苷酸序列杂交,且编码LbCpf1-RR突变体的DNA分子。
4.含有权利要求1至3任一所述表达盒甲的重组质粒。
5.如权利要求4所述的重组质粒,其特征在于:所述重组质粒还包括表达盒乙;所述表达盒乙中由启动子乙启动crRNA转录。
6.如权利要求5所述的重组质粒,其特征在于:所述表达盒乙自5’端至3’端依次包括启动子乙和M个crRNA区段;每个crRNA区段自5’端至3’端依次包括核酸酶甲的核苷酸序列、crRNA的编码基因和核酸酶乙的核苷酸序列;每相邻两个crRNA区段之间具有N个脱氧核糖核苷酸组成的间隔序列;M为1以上且5以下的自然数;N为10以上且15以下的自然数。
7.一种定向编辑植物或农作物基因组的方法,为方法c1)或方法c2)或方法c3)或方法c4):
方法c1)包括如下步骤:通过将权利要求5所述重组质粒导入出发植物,实现出发植物中靶基因的定向编辑;
方法c2)包括如下步骤:(1)根据出发植物中预期进行定向编辑的靶基因设计crRNA;(2)将所述crRNA的编码基因插入权利要求6所述重组质粒,得到重组质粒甲;(3)将所述重组质粒甲导入所述出发植物,实现出发植物中靶基因的定向编辑;
方法c3)包括如下步骤:(1)根据出发植物中预期进行定向编辑的靶基因设计crRNA;(2)构建表达所述crRNA的重组载体;(3)将所述重组载体和编码权利要求1中所述LbCpf1-RR突变体的基因导入所述出发植物,实现出发植物中靶基因的定向编辑;
方法c4)包括如下步骤:利用CRISPR/Cpf1系统对待编辑植物或农作物进行基因组编辑,其中核酸酶为权利要求1中所述LbCpf1-RR突变体。
8.一种定向编辑植物或农作物基因组的CRISPR/Cpf1系统,其特征在于:Cpf1核酸酶为权利要求1中所述LbCpf1-RR突变体。
9.d1)或d2)或d3)或d4):
d1)权利要求1中所述LbCpf1-RR突变体在植物基因编辑中的应用;
d2)权利要求1至3任一所述表达盒甲在植物基因编辑中的应用;
d3)权利要求4至6任一所述重组质粒在植物基因编辑中的应用;
d4)权利要求8所述系统在植物基因编辑中的应用。
10.权利要求1中所述LbCpf1-RR突变体。
CN201810217936.8A 2018-03-16 2018-03-16 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用 Active CN108486146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810217936.8A CN108486146B (zh) 2018-03-16 2018-03-16 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810217936.8A CN108486146B (zh) 2018-03-16 2018-03-16 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用

Publications (2)

Publication Number Publication Date
CN108486146A true CN108486146A (zh) 2018-09-04
CN108486146B CN108486146B (zh) 2021-02-19

Family

ID=63339418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810217936.8A Active CN108486146B (zh) 2018-03-16 2018-03-16 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用

Country Status (1)

Country Link
CN (1) CN108486146B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109825532A (zh) * 2019-03-04 2019-05-31 中国科学院昆明植物研究所 CRISPR/Cas12a基因编辑系统在小立碗藓基因编辑中的应用
CN110117621A (zh) * 2019-05-24 2019-08-13 青岛农业大学 一种碱基编辑器及其制备方法和应用
US10465176B2 (en) 2013-12-12 2019-11-05 President And Fellows Of Harvard College Cas variants for gene editing
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10682410B2 (en) 2013-09-06 2020-06-16 President And Fellows Of Harvard College Delivery system for functional nucleases
US10704062B2 (en) 2014-07-30 2020-07-07 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
CN111534641A (zh) * 2020-04-01 2020-08-14 上海科技大学 一种核酸检测试剂盒、检测方法及应用
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
CN112481292A (zh) * 2019-09-10 2021-03-12 中国种子集团有限公司 创制OsNRR基因突变体的方法及其应用
US10947530B2 (en) 2016-08-03 2021-03-16 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11046948B2 (en) 2013-08-22 2021-06-29 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑系统
CN113249499A (zh) * 2021-02-26 2021-08-13 王伟佳 一种伤寒沙门氏菌的检测试剂盒、其制备方法及其应用
US11214780B2 (en) 2015-10-23 2022-01-04 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
WO2022061748A1 (zh) * 2020-09-25 2022-03-31 中国科学院微生物研究所 广谱识别PAM序列的FnCpf1突变体及其应用
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN115851784A (zh) * 2022-08-02 2023-03-28 安徽农业大学 一种利用Lbcpf1变体构建的植物胞嘧啶碱基编辑系统及其应用
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US11999947B2 (en) 2023-02-24 2024-06-04 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
CN107012164A (zh) * 2017-01-11 2017-08-04 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
CN107142271A (zh) * 2017-06-28 2017-09-08 安徽省农业科学院水稻研究所 在基因打靶中具有高突变效率的PL‑LbCpf1‑RR基因及其应用
WO2017184768A1 (en) * 2016-04-19 2017-10-26 The Broad Institute Inc. Novel crispr enzymes and systems
CN107312790A (zh) * 2017-06-26 2017-11-03 中国科学技术大学 一种可编程的多位点特异性的转录抑制系统及其应用
CN110283840A (zh) * 2019-04-11 2019-09-27 华中农业大学 陆地棉基因组的精确高效编辑方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160208243A1 (en) * 2015-06-18 2016-07-21 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2017184768A1 (en) * 2016-04-19 2017-10-26 The Broad Institute Inc. Novel crispr enzymes and systems
CN110382692A (zh) * 2016-04-19 2019-10-25 博德研究所 新型crispr酶以及系统
CN107012164A (zh) * 2017-01-11 2017-08-04 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
CN107312790A (zh) * 2017-06-26 2017-11-03 中国科学技术大学 一种可编程的多位点特异性的转录抑制系统及其应用
CN107142271A (zh) * 2017-06-28 2017-09-08 安徽省农业科学院水稻研究所 在基因打靶中具有高突变效率的PL‑LbCpf1‑RR基因及其应用
CN110283840A (zh) * 2019-04-11 2019-09-27 华中农业大学 陆地棉基因组的精确高效编辑方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
CHAO LEI等: "The CCTL (Cpf1-assisted Cutting and Taq DNA ligase-assisted Ligation) method for efficient editing of large DNA constructs in vitro", 《NUCLEIC ACIDS RESEARCH》 *
LINYI GAO等: "Engineered Cpf1 variants with altered PAM specificities", 《NATURE BIOTECHNOLOGY》 *
MUGUI WANG等: "Multiplex Gene Editing in Rice Using the CRISPR-Cpf1 System", 《MOLECULAR PLANT》 *
NCBI: "type V CRISPR-associated protein Cpf1 [Lachnospiraceae bacterium ND2006]", 《GENBANK DATABASE》 *
SHAOYA LI等: "Expanding the Scope of CRISPR/Cpf1-Mediated Genome Editing in Rice", 《MOLECULAR PLANT》 *
XU TANG等: "A CRISPR-Cpf1 system for efficient genome editing and transcriptional repression in plants", 《NATURE PLANTS》 *
ZHAOHUI ZHONG等: "Plant Genome Editing Using FnCpf1 and LbCpf1 Nucleases at Redefined and Altered PAM Sites", 《MOLECULAR PLANT》 *
刘浩等: "基因编辑技术在水稻分子育种上的应用", 《淮阴工学院学报》 *

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10954548B2 (en) 2013-08-09 2021-03-23 President And Fellows Of Harvard College Nuclease profiling system
US10508298B2 (en) 2013-08-09 2019-12-17 President And Fellows Of Harvard College Methods for identifying a target site of a CAS9 nuclease
US11920181B2 (en) 2013-08-09 2024-03-05 President And Fellows Of Harvard College Nuclease profiling system
US11046948B2 (en) 2013-08-22 2021-06-29 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US11299755B2 (en) 2013-09-06 2022-04-12 President And Fellows Of Harvard College Switchable CAS9 nucleases and uses thereof
US10912833B2 (en) 2013-09-06 2021-02-09 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US10597679B2 (en) 2013-09-06 2020-03-24 President And Fellows Of Harvard College Switchable Cas9 nucleases and uses thereof
US10682410B2 (en) 2013-09-06 2020-06-16 President And Fellows Of Harvard College Delivery system for functional nucleases
US10858639B2 (en) 2013-09-06 2020-12-08 President And Fellows Of Harvard College CAS9 variants and uses thereof
US11124782B2 (en) 2013-12-12 2021-09-21 President And Fellows Of Harvard College Cas variants for gene editing
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US10465176B2 (en) 2013-12-12 2019-11-05 President And Fellows Of Harvard College Cas variants for gene editing
US10704062B2 (en) 2014-07-30 2020-07-07 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11578343B2 (en) 2014-07-30 2023-02-14 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11214780B2 (en) 2015-10-23 2022-01-04 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US10947530B2 (en) 2016-08-03 2021-03-16 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11702651B2 (en) 2016-08-03 2023-07-18 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11306324B2 (en) 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11820969B2 (en) 2016-12-23 2023-11-21 President And Fellows Of Harvard College Editing of CCR2 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11932884B2 (en) 2017-08-30 2024-03-19 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN109825532A (zh) * 2019-03-04 2019-05-31 中国科学院昆明植物研究所 CRISPR/Cas12a基因编辑系统在小立碗藓基因编辑中的应用
CN109825532B (zh) * 2019-03-04 2019-12-10 中国科学院昆明植物研究所 CRISPR/Cas12a基因编辑系统在小立碗藓基因编辑中的应用
US11643652B2 (en) 2019-03-19 2023-05-09 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11447770B1 (en) 2019-03-19 2022-09-20 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
US11795452B2 (en) 2019-03-19 2023-10-24 The Broad Institute, Inc. Methods and compositions for prime editing nucleotide sequences
CN110117621B (zh) * 2019-05-24 2021-07-16 青岛农业大学 一种碱基编辑器及其制备方法和应用
CN110117621A (zh) * 2019-05-24 2019-08-13 青岛农业大学 一种碱基编辑器及其制备方法和应用
US12006520B2 (en) 2019-06-14 2024-06-11 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
CN112481292A (zh) * 2019-09-10 2021-03-12 中国种子集团有限公司 创制OsNRR基因突变体的方法及其应用
CN111534641A (zh) * 2020-04-01 2020-08-14 上海科技大学 一种核酸检测试剂盒、检测方法及应用
CN112176107B (zh) * 2020-04-01 2021-06-11 上海科技大学 一种核酸检测试剂盒、检测方法及应用
CN111534641B (zh) * 2020-04-01 2021-06-04 上海科技大学 一种核酸检测试剂盒、检测方法及应用
CN112176107A (zh) * 2020-04-01 2021-01-05 上海科技大学 一种核酸检测试剂盒、检测方法及应用
US11912985B2 (en) 2020-05-08 2024-02-27 The Broad Institute, Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022061748A1 (zh) * 2020-09-25 2022-03-31 中国科学院微生物研究所 广谱识别PAM序列的FnCpf1突变体及其应用
CN113234701A (zh) * 2020-10-20 2021-08-10 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑系统
CN113234701B (zh) * 2020-10-20 2022-08-16 珠海舒桐医疗科技有限公司 一种Cpf1蛋白及基因编辑系统
CN113249499B (zh) * 2021-02-26 2022-04-05 王伟佳 一种伤寒沙门氏菌的检测试剂盒、其制备方法及其应用
CN113249499A (zh) * 2021-02-26 2021-08-13 王伟佳 一种伤寒沙门氏菌的检测试剂盒、其制备方法及其应用
WO2022179494A1 (zh) * 2021-02-26 2022-09-01 王伟佳 一种伤寒沙门氏菌的检测试剂盒、其制备方法及其应用
CN115851784A (zh) * 2022-08-02 2023-03-28 安徽农业大学 一种利用Lbcpf1变体构建的植物胞嘧啶碱基编辑系统及其应用
US11999947B2 (en) 2023-02-24 2024-06-04 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof

Also Published As

Publication number Publication date
CN108486146B (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN108486146B (zh) LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN108997484B (zh) 小麦TaWox5基因在提高小麦转化效率中的应用
KR20170098953A (ko) 일시적인 유전자 발현을 통해 완전한 식물에서 부위-특이적인 변형을 수행하는 방법
CN111534535B (zh) 一种构建麦角硫因生产菌的方法
CN109576300B (zh) 玉米转化事件HiII-AtAAP1-1及其特异性鉴定方法与应用
CN106661583A (zh) 非生物胁迫条件下改良农艺性状的植物和方法
CN111154764B (zh) 一种通过基因组编辑提高水稻抗病性的方法及其使用的sgRNA
CN113234738A (zh) 鄞红葡萄ABA8ox3基因过表达载体及其构建方法和应用
CN108531502A (zh) 柑桔衰退病毒侵染性克隆的构建及接种方法
KR20230163460A (ko) 식물에서의 증가된 형질전환성 및 반수체 유도
CN114317598A (zh) 病毒诱导的基因沉默载体及其应用和柑橘病害防控的方法
CN101709300B (zh) 水稻人工miRNA基因干涉载体快速构建方法
CN108559759A (zh) 三元穿梭载体及利用其构建clbv侵染性克隆的方法
CN110669794B (zh) 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN110938650B (zh) 一种mRNA可变剪切-荧光素酶报告系统及其应用
CN101646773A (zh) 具有改良生长特性的木本植物及其产生方法
CN112553246A (zh) 一种基于CRISPR-SaCas9系统的高效基因组编辑载体及其应用
KR102170566B1 (ko) 목적 유전자의 발현을 조기 종결하기 위한 벡터 및 이를 포함하는 균주
CN110724689B (zh) Cas9介导的麻竹基因编辑载体和应用
US6563023B2 (en) Identification and characterization of a CURLY phenotype (CUR) in plants
CN109750059B (zh) 水稻β-淀粉酶BA2及其编码基因与应用
CN112980709B (zh) 一种工程菌株及其构建方法和应用
KR102399035B1 (ko) 산업 균주 내 온-타겟 효율의 감소 없이 오프-타겟이 없는 사이토신 염기 편집기를 발현하는 벡터 및 이의 용도
US20040158889A1 (en) Efficient system for RNA silencing
CN113136397B (zh) 一种提高草原龙胆基因编辑效率的重组载体及其制备方法与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant