CN107937432B - 一种基于crispr系统的基因组编辑方法及其应用 - Google Patents

一种基于crispr系统的基因组编辑方法及其应用 Download PDF

Info

Publication number
CN107937432B
CN107937432B CN201711194336.6A CN201711194336A CN107937432B CN 107937432 B CN107937432 B CN 107937432B CN 201711194336 A CN201711194336 A CN 201711194336A CN 107937432 B CN107937432 B CN 107937432B
Authority
CN
China
Prior art keywords
intron
gene
cas9
artificial sequence
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711194336.6A
Other languages
English (en)
Other versions
CN107937432A (zh
Inventor
谢卡斌
陈凯园
丁丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong Agricultural University
Original Assignee
Huazhong Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong Agricultural University filed Critical Huazhong Agricultural University
Priority to CN201711194336.6A priority Critical patent/CN107937432B/zh
Publication of CN107937432A publication Critical patent/CN107937432A/zh
Application granted granted Critical
Publication of CN107937432B publication Critical patent/CN107937432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Abstract

本发明提供了一种基于CRISPR系统的基因组编辑方法,属于基因编辑技术领域,本发明所述的方法利用内含子来表达CRISPR基因组编辑系统中的引导RNA分子,其原理是将一个或多个tRNA‑gRNA或crRNA串联单元置于编码基因的内含子中,并且可以将该内含子与Cas9或Cpf1形成融合基因后用一个启动子驱动。所述方法巧妙利用了细胞内源的mRNA剪接系统和tRNA加工系统,不需要添加其他元件,不仅安全性更高,而且可以更加简单;而利用一个启动子实现多个引导RNA与Cas9或Cpf1的同步表达,简化了已有的CRISPR编辑系统,同时提高了CRISPR编辑系统的同时编辑多个靶位点的效率和能力。

Description

一种基于CRISPR系统的基因组编辑方法及其应用
技术领域
本发明属于基因组编辑技术领域,具体涉及一种基于CRISPR系统的基因 组编辑方法。
背景技术
基因组编辑技术是利用人工设计和改造的核酸酶对基因组进行精确地定 点修饰,包括对基因组进行靶向基因敲入(Knock-in)、基因功能敲除(Knock-out) 以及有目的地片段替换。
CRISPR/Cas9(Clustered,Regularly Interspaced,Short Palindromic Repeat/CRISPR Associated Protein 9System)系统的发现和应用为生物学的基 础理论研究和转化应用提供了简单、强大的基因组编辑平台,因此迅速成为 遗传操作的主流工具,并广泛地用于基础研究、疾病治疗、作物遗传改良等 不同的领域。
CRISPR/Cas是细菌和古细菌中的一种适应性免疫系统,能特异地降解入 侵噬菌体或外源质粒的DNA,其中CRISPR是“成簇和规律间隔的短回文序列” 的简称,而Cas是指与CRISPR RNA结合的蛋白。在2012年,Jinek等解开 了化脓链球菌Streptococcus pyogenes的II型CRISPR/Cas9系统作用机制,并 证明Cas9核酸酶(本文专指Strepcococcuspyogenes的Cas9)可以在一个人 造的小RNA分子(称为gRNA,即Guide RNA)的引导下去靶向切割DNA 双链。利用Cas9/gRNA标靶特定的DNA位点需要满足2个条件:(1)gRNA 的5’端20nt(Nucleotides)的引导序列(称为Spacer或Guide sequence)与靶 DNA位点的序列(称为Protospacer)互补匹配;(2)靶位点必需存在PAM (Protospacer-adjacentmotif),其中使用最广的化脓链球菌Cas9的PAM序列为 5’-NGG-3’。在使用CRISPR/Cas9进行基因组编辑时,一般用Pol II(RNA Polymerase II,II型RNA聚合酶)启动子表达含核定位信号的Cas9,用Pol III(RNA Polymerase III)启动子表达gRNA,Cas9/gRNA复合体识别靶DNA后 在PAM前面的第3个和第4个脱氧核酸之间切割DNA双链,形成DSB(Double stranded DNAbreak,双链DNA断裂)。
除CRISPR/Cas9外,CRISPR/Cpf1也被开发为一个DNA编辑的平台。2015 年美国麻省理工大学的Zhang Feng实验室首先发现了II类CRISPR系统第5 亚家族的成员Cpf1核酸内切酶,并证实了来自氨基酸球菌属 Acidaminococcus、毛螺科菌属Lachnospiraceae和弗朗西斯氏菌属Franisella novicida的AsCpf1、LbCpf1和FnCpf1三个高度同源蛋白都具有RNA引导的 DNA内切酶的活性,而且AsCpf1和LbCpf1用于动物的基因组编辑效率接近 原来的CRISPR/Cas9系统。与Cas9不同,Cpf1通过CRISPR RNA(crRNA) 的引导去靶向切割DNA序列,其中靶序列位于crRNA的3’-端。与Cas9比 较,Cpf1的引导RNA更短,但引导序列(即DNA靶位点)更长(~24nt);特 异性高、容易实现多位点编辑,基因组编辑的范围大;更易于引入的indel, 从而提高knock-out的效率。
基于CRISPR的基因组编辑载体都需要两个组分,一是CRISPR系统的核 酸酶,比如常用的Cas9和Cpf1;二是引导RNA,如gRNA(用于引导Cas9) 和crRNA(用于引导Cpf1)。在一般的载体系统中,Cas9和Cpf1可以用常 见的RNA聚合酶II型的启动子表达(Pol II);而gRNA和crRNA用Pol III 型的启动子表达。在已有的CRISPR技术中,引导RNA的表达采用PolIII启 动子,Pol III启动子数量有限而且表达引导RNA的第一个碱基是固定的;Pol III启动子为组成型表达的,无法构建诱导表达或时空特异表达的基因组编辑 技术;Cas9和gRNA用不同的启动子表达,无法同步控制两者的表达量。
发明内容
有鉴于此,本发明的目的在于提供一种基于CRISPR系统利用内含子表达 gRNA和Cas9核酸酶的高效率的多重基因编辑方法。
为了实现上述发明目的,本发明提供以下技术方案:
一种基于CRISPR系统CRISPR/Cas9的基因组编辑方法,包括以下步骤: 1)将1个或多个重复的tRNA-gRNA串联单元置于编码基因的内含子中获得 inPTG内含子;2)将获得的inPTG内含子与含Cas9核酸酶基因的外显子融 合成一个inPTG-Cas9基因;3)利用单个启动子来驱动inPTG-Cas9融合基因 的表达,获得表达载体;4)将所述含inPTG-Cas9融合基因表达元件的载体 导入受体细胞进行转录表达,获得Cas9核酸酶和多个gRNA;5)所述gRNA 与Cas9核酸酶共同作用编辑受体细胞基因组序列。
优选的,步骤3)中所述启动子为Pol II型启动子。
优选的,所述Pol II型启动子为UBI10启动子、PR5启动子或PR1启动 子。
优选的,步骤4)中所述载体为pRGEB33载体,所述pRGEB33载体的 内含子的序列如SEQ ID NO.7所示.
优选的,步骤4)中所述载体为pRGEB34载体,所述pRGEB34载体的 内含子的序列如SEQ ID NO.8所示。
优选的,所述内含子中插入BsaⅠ酶切位点用于PTG片段的克隆。
本发明还提供了一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法, 包括以下步骤:1)将一个或多个重复的tRNA-crRNA串联单元(polycistronic tRNA-crRNA,简称PTC)置于编码基因的内含子中获得intron(PTC)内含子; 2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形 成一个intron(PTC)-Cpf1融合基因;3)在所述intron(PTC)-Cpf1融合基因序 列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;4)将所述启动 子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得 Cpf1核酸酶和多个crRNA;5)所述crRNA与Cpf1核酸酶共同作用编辑受 体细胞基因组序列。
优选的,所述转录表达Cpf1的过程中,利用剪接复合体剪切所述 intron(PTC)-Cpf1融合基因中的包含PTC的内含子,然后利用tRNA加工系统 切割其中的tRNA元件,释放多个crRNA。
优选的,步骤1)中所述多个重复的tRNA-crRNA串联单元可替换为多个 crRNA串联单元。
优选的,所述替换后利用表达的Cpf1蛋白切割crRNA串联单元,释放多 个crRNA。
优选的,所述编辑包括为基因敲除、靶向基因激活/抑制、单碱基替换。
本发明的有益效果:本发明所述的方法将多个tRNA-gRNA/crRNA串联单 元置于编码基因的内含子中,并且将inPTG与Cas9/Cpf1形成融合基因,巧妙 利用了细胞内源的mRNA剪接系统和tRNA加工系统,不需要添加其他元件, 安全性更高;利用一个启动子实现多个gRNA/crRNA与Cas9/Cpf1的同步表达, 简化了已有的CRISPR编辑系统,提高了CRISPR编辑系统的编辑效率和编辑能 力,可以同时高效率的编辑多个靶位点。
附图说明
图1为PTG结构产生多个gRNA示意图;
图2为内含子剪接示意图;
图3为利用内含子表达gRNA示意图;
图4为UBI10基因,U3p::PTG-UBI10p::Cas9(pRGEB32)和 UBI10p::inPTG-Cas9(pRGEB33andpRGEB34)的结构示意图;
图5为pRGEB33载体示意图;
图6为pRGEB34载体示意图;
图7为实施例1中UBI10p::Cas9和UBI10p::inPTG-Cas9的RT-PCR结果
图8为实施例1中RT-PCR产物测序结果;
图9为实施例1中WesternBlotting检测UBI10p::Cas9和 UBI10p::inPTG-Cas9在水稻原生质体中Cas9的表达水平;
图10为实施例1中在水稻原生质体中表达inPTG4/10-Cas9后,PCR检 测靶基因DNA片段被剪切的效率;
图11为实施例1中在水稻原生质体中表达inPTG3/6-Cas9后,PCR检测 靶基因DNA片段被剪切的效率;
图12为实施例1中在水稻原生质体中表达inPTG7-Cas9后,PCR检测靶 基因DNA片段被剪切的效率;
图13实施例2中inPTG10-Cas9转基因植株出现白化表型(T0代);
图14为实施例2中敲除MPK1和MPK5的inPTG7-Cas9转基因株系的突 变情况;
图15为为实施例2中inPTG3/6/7/10-Cas9转基因植株突变频率;
图16为实施例3中pRGEB33T载体结构示意图;
图17为实施例3中PTG和PTGt结构的表达载体编辑MPK1、MPK2和 MPK5的效率;
图18为实施例3中pRGEB33T与其他载体在水稻原生质体中编辑MPK1 和MPK5的效率;
图19为实施例4中PR1p::inPTG-Cas9和PR5p::inPTG-Cas9载体结构图;
图20为实施例4中在水稻原生质体中用PR1p和PR5p驱动inPTG4-Cas9 的表达,比较MPK2被编辑效率;
图21为实施例5中CRISPR-Cpf1介导的基因组编辑结构示意图;
图22为实施例5中表达Cpf1和crRNAs的载体结构图;
图23为实施例5中设计两个crRNAs靶向敲除水稻PDS基因;
图24为实施例5中PTCPDS和CAPDS结构示意图;
图25为实施例5中UBI10p::intron(CAPDS)-Cpf1内含子剪切示意图;
图26为实施例5中比较FnCpf1和LbCpf1(分别表示为Fn和Lb)以两 种crRNA表达结构(PTC和CA)分别由U3p表达或在内含子中表达时,靶 基因被编辑剪切的效率;
图27为实施例5中Westernblotting检测U3p::crRNA-UBI10p::Cpf1和 UBI10p::intron(crRNA)-Cpf1在水稻原生质体中Cpf1蛋白水平的差异;
图28为实施例6中设计crRNAs敲除MPK2和MPK5示意图;
图29为实施例6中比较FnCpf1和LbCpf1利用不同的CAMPK表达结构, 在水稻原生质体中编辑MPK1和MPKI5的效率。
具体实施方式
CRISPR系统用于基因组编辑的原理
CRISPR靶向编辑基因组序列的原理是利用Cas9(或Cpf1)和靶位点特 异的gRNA(或crRNA)切割基因组,在设计的靶位点处形成DSB(Double strandbreak),然后利用生物体内的DSB修复过程来对DNA序列进行不同的 修改。(1)通过NHEJ(Non-homologousendjoining)的DSB修复在靶位点会 引入小的核酸插入或缺失(Insertion and deletion,indel)。Indel的引入造成靶基 因蛋白翻译产生移码,从而破坏基因功能。除了通过引入indel外来敲除基因 功能外,CRISPR/Cas9还可以用来对染色体进行其他的遗传操作。比如,用 Cas9和一对gRNA来精确地删除一段染色体DNA。基于CRISPR/Cas9的靶 向基因敲除技术最早在拟南芥、水稻、烟草、小麦、大麦、玉米、大豆、马 铃薯、番茄等模式植物和重要农作物中建立,随后在多种不同的植物中都得 到了验证。(2)靶向基因敲入/替换(Knock-in)。Knock-in依赖的是DSB的同 源重组修复(Homology-directed repair,HDR)修复途径:当Cas9/gRNA切割 靶位点后,如果细胞中有与靶位点序列同源的DNA供体(DNAdonor)片段时,位于供体DNA上的基因片段会通过HDR重组整合到DSB的位置。
如图1所示,在已有的PTG(polycistronic-tRNA-gRNA)技术中,PTG 用Pol III启动子表达后,细胞内的核糖核酸酶P和Z能识别和精确切割其中 的tRNA序列,(所述tRNA序列如SEQ ID No.10所示),从而释放出多个 gRNA,引导Cas9靶向不同的基因位点。
真核生物的基因一般由内含子和外显子组成,其中内含子在基因转录过 程中或转录后由细胞内的剪接(splicing)复合体精确剪切。如图2所示,内 含子含保守的5’剪接位点(Donorsite)、分支位点(branch site)和3’剪接位 点(Acceptor site),在剪接复合体的作用下,形成套索结构的RNA,内含子 部分从而被剪切掉。基于上述特点,本发明提供了一种基于CRISPR系统 CRISPR/Cas9的基因组编辑方法,如图3所示,设计思路如下:将多个 tRNA-gRNA串联单元(polycistronic tRNA-gRNA,简称PTG)置于编码基因 的内含子中,当插入了PTG的内含子(intronic PTG,简称为inPTG)被剪接 复合体从mRNA前体中切割下来以后,细胞内的核糖核酸酶P和Z能识别并 精确切割inPTG中的tRNA元件,从而释放出位于tRNA之间的gRNA,而内 含子中的tRNA-gRNA不会影响基因外显子的表达和翻译。为了进一步简化 CRISPR载体系统,可以将包含有inPTG的内含子与编码Cas9的外显子融合 为一个基因,这样的融合基因可以同时表达出Cas9蛋白和gRNA。
本发明提供的基于CRISPR系统CRISPR/Cas9的基因组编辑方法具体的 包括以下步骤:1)将一个或多个重复的tRNA-gRNA串联单元置于编码基因 的内含子中获得inPTG内含子;2)将获得的inPTG内含子与含Cas9核酸酶 基因的外显子融合成一个inPTG-Cas9基因;3)利用单个启动子来驱动 inPTG-Cas9融合基因的表达,获得表达载体;4)将所述含inPTG-Cas9融合 基因表达元件的载体导入受体细胞进行转录表达,获得Cas9核酸酶和多个 gRNA;5)所述gRNA与Cas9核酸酶共同作用编辑受体细胞基因组序列。
在本发明中,将一个或多个重复的tRNA-gRNA串联单元置于编码基因的 内含子中获得inPTG。所述多个重复的tRNA-gRNA串联单元的种类数根据需 要编辑的基因个数确定。在本发明中,所述inPTG可插入载体基因的不同位 置。
本发明在获得inPTG后,将获得的inPTG与Cas9核酸酶基因的编码区融 合形成inPTG-Cas9融合基因。本发明对所述的融合基因的制备方法没有特殊 限定,采用本领域常规方法即可。
本发明在获得inPTG-Cas9融合基因后,在所述inPTG-Cas9融合基因序 列前添加启动子获得启动子-inPTG-Cas9融合基因序列。在本发明中所述的启 动子优选的为Pol II型启动子;所述为Pol II型启动子优选的为UBI10启动子、 PR5启动子或PR1启动子。所述启动子的添加采用本领域常规的方法即可, 无其他特殊要求。
本发明将所述获得的启动子-inPTG-Cas9融合基因置于载体中,导入受体 细胞进行转录表达,获得多个gRNA和Cas9核酸酶;在所述转录过程中,利 用剪接复合体将所述inPTG-Cas9融合基因切割,然后利用tRNA加工系统切 割其中的tRNA元件,释放多个gRNA,所述Cas9核酸酶基因正常转录表达。 在本发明中所述tRNA加工系统包括核糖核酸酶P和Z,所述核糖核酸酶P 和Z能够精确识别和切割其中的tRNA序列,从而释放gRNA。
在本发明中,所述载体优选的为pRGEB33载体或pRGEB34载体。所述 pRGEB33载体或pRGEB34载体是在pRGEB32载体的基础上进行改进获得 的;所述pRGEB32载体的U3p序列如Seq ID No.1所示;所述pRGEB33载 体或pRGEB34载体的UBI10p(Seq ID No.2)、exon1(Seq ID No.3)、exon2(Seq ID No.5)以及Cas9序列(Seq ID No.6)同pRGEB32相同;所述pRGEB33载体或 pRGEB34载体内含子序列与pRGEB32不同,所述pRGEB32载体的序列内含 子如SEQ ID NO.4所示,所述pRGEB33载体的序列如SEQ ID No.7所示,所 述pRGEB34载体的序列如SEQ ID No.8所示。在本发明中所述的pRGEB33 载体的内含子中插入两个BsaⅠ酶切位点用于PTG片段的克隆。本发明中另 外一个方案是由UBI10内源的内含子(序列如SEQ IDNo.4)替换加入了BsaI 酶切位点的内含子,同时在重组Cas9基因的3’-UTR区插入含有两个BsaI 酶切位点的内含子,以利于PTG的克隆。
在本发明中,所述表达的gRNA与Cas9核酸酶共同作用编辑受体细胞基 因组。所述编辑优选的包括为基因敲除、靶向基因激活/抑制和单碱基替换。 在本发明中,所述的受体细胞包括微生物、动物和植物细胞。
本发明还提供了一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法, 包括以下步骤1)将一个或多个重复的tRNA-crRNA串联单元(polycistronic tRNAcrRNA,简称为PTC)置于编码基因的内含子中获得intron(PTC)内含子; 2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形 成一个intron(PTC)-Cpf1融合基因;3)在所述intron(PTC)-Cpf1融合基因序 列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;4)将所述启动 子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得 Cpf1核酸酶和多个crRNA;5)所述crRNA与Cpf1核酸酶共同作用编辑受 体细胞基因组序列。
在本发明中,将一个或多个重复的tRNA-crRNA串联单元置于编码基因 的内含子中获得intron(PTC)。所述多个重复的tRNA-crRNA串联单元的种类 数根据需要编辑的基因个数确定,优选的为1~6个,更优选的为2~3个。在 本发明中,所述intron(PTC)可插入载体基因的不同位置。在本发明中,所述 的多个tRNA-crRNA串联单元可替换为多个crRNA串联单元。
本发明在获得intron(PTC)后,将获得的intron(PTC)与Cpf1核酸酶基因的 编码区融合形成intron(PTC)-Cas9融合基因。本发明对所述的融合基因的制备 方法没有特殊限定,采用本领域常规方法即可。
本发明在获得intron(PTC)-Cpf1融合基因后,在所述intron(PTC)-Cpf1融 合基因序列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列。在本发 明中所述的启动子优选的为Pol II型启动子;所述为Pol II型启动子优选的为 UBI10启动子。
本发明将所述获得的启动子-intron(PTC)-Cpf1融合基因置于载体中,导入 受体细胞进行转录表达,获得多个crRNA和Cpf1核酸酶。在本发明中,所述 的多个tRNA-crRNA串联单元在转录过程中,优选的利用剪接复合体剪切所 述intron(PTC)-Cpf1融合基因的内含子,然后利用tRNA加工系统切割其中的 tRNA元件,释放多个crRNA。在本发明中,所述tRNA加工系统包括核糖核 酸酶P和Z,所述核糖核酸酶P和Z能够精确识别和切割其中的tRNA序列, 从而释放crRNA。在本发明中将多个tRNA-crRNA串联单元替换为多个crRNA 串联单元后,所述转录表达过程中,利用Cpf1核酸酶切割inCA-Cpf1融合基 因内含子中的crRNAarray,获得多个crRNA。
在本发明中,所述表达的crRNA与Cpf1核酸酶共同作用编辑受体细胞基 因组。所述编辑优选的包括为基因敲除、靶向基因激活/抑制和单碱基替换。 在本发明中,所述的受体细胞优选的为植物细胞。
下面结合实施例对本发明提供的一种基于CRISPR系统的基因组编辑方 法进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
inPTG-Cas9用于水稻多位点编辑
设计如下:将多个tRNA-gRNA串联单元(polycistronic tRNA-gRNA,简 称PTG)置于编码基因的内含子中。将包含有inPTG的内含子与编码Cas9 的外显子融合为一个基因,这样的融合基因可以同时表达出Cas9蛋白和 gRNA。当inPTG-Cas9系统在植物中表达时,剪切下来的内含子中的PTG片 段被RNase P和Z识别和加工,将单个的gRNA释放出来,而内含子的剪接 并不影响Cas9基因的转录和翻译,这样一个inPTG-Cas9的融合基因可以同 时高效率的编辑多个靶位点。
1.载体说明
为了实现inPTG的表达,我们对水稻的UBI10基因进行改造,将PTG序 列结构插入到UBI 10的内含子中(如图3所示)。UBI10基因的5’-UTR后 有一个962bp的intron(序列如SEQ ID No.4),具有内含子的标志序列 5’-GU…A…AG-3’。根据内含子的特点,可以将PTG片段克隆到内含子剪接 的Donor site和branch site之间,从而不会影响内含子的剪切。
根据UBI10基因的特点,我们构建了pRGEB33和pRGEB34载体。UBI10 基因,传统的U3p::PTG-UBI10p::Cas9(pRGEB32)和UBI10p::inPTG-Cas9 (pRGEB33andpRGEB34)的结构示意图如图4和图5所示;图4中方框代表 外显子,线代表内含子,角形代表Bsa I双酶切位点。红色字体的碱基 (GGTCTC)代表Bsa I识别位点,小箭头表示RT-PCR引物的位置。其中pRGEB33和pRGEB34载体利用水稻UBI10p(UBI10启动子)来表达融合了 UBI10的5’-UTR(exon1)(SEQ ID No.33)、intron以及部分exon2(SEQ ID No.5) 序列的Cas9,并在其内含子中插入两个BsaⅠ酶切位点用于PTG片段的克隆。 这样就可以利用UBI10p同时驱动inPTG与Cas9的表达 (UBI10p::inPTG-Cas9)。pRGEB33和pRGEB34两个载体的区别在于 pRGEB33的内含子为982bp的全长内含子(SEQ ID:7),pRGEB34是在 pRGEB33的基础上将内含子截短为146bp(SEQ ID:8)。
2.PTG片段合成和克隆。
以MPK1、MPK2、MPK5、PDS为靶基因,分别在每个基因上设计两个 靶位点(靶位点序列见表2),并依次构建了PTG3(SEQ ID No.11)、PTG4(SEQ ID No.12)、PTG6(SEQ IDNo.13)、PTG10(SEQ ID No.15)分别用于四个基因的 敲除。另构建了包含4个gRNA的PTG7(SEQ IDNo.14),用于同时敲除MPK1 和MPK5。
PTG构建过程如下:
(1)根据表1所示(引物序列见表3),利用PCR扩增出每个PTG所 需用于组装的初级片段,以1ngpGTR为模板,加入2μl 10μM F/R引物,25μl 2x Hi-Fi MIX(MCLAB),补足水至50μl。PCR程序为:98℃预变性3mi;98℃ 变性15s,60℃退火20s,72℃延伸20s,共35个循环;最后72℃延伸5min。
表1.PCR反应配制表
Figure BDA0001481671530000101
表2.Cas9靶位点信息(Seq ID No.25~Seq ID No.38)
Figure BDA0001481671530000111
表3:构建CRISPR-Cas9gRNA所用引物(Seq ID No.39~Seq ID No.59)
Figure BDA0001481671530000112
Figure BDA0001481671530000121
(2)将PCR产物用PCR产物纯化试剂盒(OMEGA)纯化后,测定浓 度。然后利用GoldenGate克隆的方法将每个PTG所包含的初级片段连接起 来。连接反应如下:20ul的反应体系包含10μl 2xT7DNAligase buffer(NEB), 2μl BSA(1mg/ml),0.5μl T7DNAligase(3000U/μl,NEB),0.5μl Bsa I(10U/μl, NEB),用于组装的初级片段(每个片段相同的量,25-50ng),补水至20μl。 反应条件为:37℃,5min,然后20℃,10min,30个循环;最后20℃孵育1 小时。
(3)PCR扩增连接产物。将上一步Golden Gate反应的产物稀释10倍后 取1μl作为模板,50μl的PCR体系分别加入1μl S5AD5-F/R(10uM),25μl 2x Taq Mix(Tsingke),补水至50μl。PCR程序为:94℃预变性2min,94℃变性 30s,60℃退火30s,72℃延伸30s,共35个循环,最后72℃延伸5min。
(4)纯化PCR扩增的连接产物。PCR产物中加入1/10体积NaAc(3M) 和2.5倍体积的无水乙醇,充分混匀后-20度保存30min,接着4度12000rpm 离心10min;加入1ml 75%乙醇,4度12000rpm离心10min;弃上清,沉淀 晾干后加水溶解。
(5)纯化后的产物FokI(NEB)酶切并回收目的片段
用FokI酶切纯化后的DNA,37℃孵育10h左右;接着用1%的琼脂糖凝 胶电泳分离酶切后的DNA,回收目的片段,并用凝胶回收试剂盒(OMEGA) 纯化。
(6)pRGEB32、pRGEB33、pRGEB34载体BsaI酶切并纯化。
(7)用T4DNA连接酶连接酶切后的载体骨架与PTG片段,连接产物 转化DH5α
(9)提取质粒后,测序确定插入正确的片段。
表5:载体构建所用引物(Seq ID No.60~Seq ID No.79)
Figure BDA0001481671530000122
Figure BDA0001481671530000131
PTG插入到内含子中(inPTG)对于内含子剪接的影响
为了检测PTG插入内含子后,内含子能否被正确的剪接并且不影响Cas9 的翻译,我们将PTG6和PTG10分别插入到pRGEB33和pRGEB34载体中, 构建四个载体用于接下来的检测。
利用PEG法将上述四个载体(UBI10p::inPTG6/10-Cas9)质粒与原有的 pRGEB32-PTG10(U3p::PTG10-UBI10p::Cas9)质粒转化水稻原生质体,GFP质 粒作为原生质体转化的阳性对照和基因编辑的阴性对照。25℃培养20小时后 观察GFP的转化效率,24h后收集原生质体。原生质体制备及转化的步骤如 下:
水稻原生质体制备步骤:
(1)水稻种子经消毒,在MS培养基中28℃,16h光照8h黑暗培养8-9d。
(2)配制10ml Digestion Solution(1.5%Cellulase R10,0.75%MacerozymeR10,10mM PH5.7MES,0.6M Mannitol),55℃水浴10min后置于冰上冷却 至室温,加入10μlCaCl2(1M),3μlβ-ME,100μl BSA(10%)。
(3)用刀片将水稻茎部切成0.5mm左右长的小段,立即转入10ml Mannitol(0.6M)中,黑暗放置10min后弃去Mannitol。
(4)加入配好的10ml Digestion Solution,锡箔纸包裹避光,置于摇床上(40rpm)酶解7h左右。
(5)加入10mlW5(2mM PH5.7MES,154mM NaCl,5mM KCl,125mM CaCl2)终止酶解反应,然后置于摇床上60rpm孵育20min。
(6)孔径为50μm的细胞筛过滤上述酶解液
(7)300g离心3min,弃上清;加入10mlW5,重悬原生质体。
(8)将重悬的原生质体黑暗放置1h,之后100g离心3min,弃上清。
(9)加入MMG Solution(4mM PH5.7MES,0.6M Mannitol,15mM MgCl2) 使原生质体浓度达到0.5x107/ml。
质粒转化:
(1)在圆底管中依次加入5-10μg中提质粒(加水补足10μl),100μl原 生质体(0.5x107/ml),110μl PEG-CaCl2(0.6M Mannitol,100mM CaCl2,40% PEG4000),轻弹混匀,静置20min。
(2)在静置后加入440μlW5,300g离心3min。
(3)弃上清,加入400μlWI Solution(4mM PH5.7MES,0.6M Mannitol, 4mMKCl2),重悬原生质体,转入24孔细胞培养板,25℃左右避光培养。
(4)培养20~36h后收集原生质体用于RNA、DNA或蛋白抽提。
提取原生质体RNA:
(1)原生质体培养24h后收集到1.5ml RNase-Free EP管中,300g离心 3min,弃上清。
(2)总RNA抽提使用TRIzol试剂(Life Technologies)按厂家说明书操 作完成。
RNA反转录步骤:
(1)去除RNA中DNA:在1.5ml RNase Free管中加入100ng从原生质 体中提取的RNA,加入1.5μl 10x DNase I buffer,0.25μl DNase I(Takara,5U/μl),补足DEPC-H2O至15μl,室温静置10min
(2)加入1.5μl RNase-Free EDTA(25mM),70℃处理10min。
(3)cDNA第一条链的合成:处理后的RNA加入1μl dNTP(10mM),1μl oligo-dT(100μM),70℃水浴5min后,立即置于冰上。待冷却后中加入2μl 10x RTbuffer(NEB),0.5μl M-Mulv反转录酶(NEB,200U/μl),0.5μl RNase Inhibitor(neb,40U/μl),42℃反应1h
(4)最后90℃,10min失活反转录酶。
以pRGEB32-PTG6/PTG10以及pRGEB33/34-PTG6/PTG10转化的原生质 体的cDNA为模板,利用内含子两侧外显子上的引物,通过RT-PCR扩增跨 内含子的片段,PCR体系:以1μlcDNA为模板,exon1-qF/exon2-qR(10uM) 各0.5μl(引物序列见表6),10μl 2x Hi-Fi MIX(MCLAB),补水至20μl。PCR 反应程序:98℃预变性2min,98℃变性10s,60℃退火10s,72℃延伸20min, 共35个循环,最后72℃延伸5min。
表6:RT-PCR所用引物(Seq ID No.80~Seq ID No.83)
Figure BDA0001481671530000151
RT-PCR反应产物经琼脂糖凝胶检测,结果见图7,阴性对照正常,且无 非特异扩增;图7中RT:反转录;“-”代表未加反转录酶的阴性对照;“+ “代表加了反转录酶的RT-PCR结果。产物经测序结果见图8,图8表明四个 载体的内含子都被完全剪切掉。红色字体为内含子的供体位点和受体位点, 证明了内含子在mRNA的加工过程中都能够被正确剪接,表明inPTG片段插 入到内含子中不会影响基因内含子的正常剪接。
PTG插入到内含子中(inPTG)对于Cas9表达的影响
在确定内含子能够被正确剪接之后,我们还需要验证inPTG结构是否会影 响Cas9蛋白的表达。
利用PEG法将pRGEB32-PTG10、pRGEB33-PTG10、pRGEB34-PTG10载 体质粒分别转化水稻原生质体,24h后收集原生质体。提取原生质体中的总蛋 白,通过WesternBlotting比较pRGEB32,pRGEB33和pRGEB34三个不同载 体Cas9蛋白的表达水平。提取原生质体中的总蛋白步骤如下:
提取原生质体中的总蛋白
(1)将培养24h后的原生质体收集到1.5ml EP管中,300g离心3min,弃上 清。
(2)原生质体沉淀中加入50μl RIPA(50mM Tris pH7.6,150mM NaCl,1% TritonX-100,0.1%SDS,10%glycerol,1mM PMSF),短暂涡旋后4℃, 14000rpm离心10min后,将上清液转入新EP管中。
Western Blotting:
(1)15μl原生质体中提取的总蛋白,加入4μl 5x SDS sample buffer,2μl DTT(1M),混匀。混匀后95℃处理5min
(2)将20μl处理后的样品用7.5%SDS-PAGE电泳分离,电流15-30mA,电 泳1h。(3)电泳完成后,根据厂家说明书,利用Bio-rad的蛋白转膜系统将 蛋白转到PVDF膜。
(4)转膜结束后,将PVDF膜转入H2O中清洗2次,每次5min。
(5)封闭:将PVDF膜转入含5%脱脂奶粉的TBST溶液中(10mM Tris pH7.6,150mMNaCl,0.1%Tween20),室温孵育1h。
(5)用1xTBST清洗PVDF膜3遍,每次10min。
(6)一抗孵育:在蛋白孵育盒中加入12ml 1xTBST,1:1000加入FLAG抗体 (Sigma-Aldrich),室温孵育1h。
(12)用1xTBST洗PVDF膜3次,每次10min。
(13)二抗孵育:在蛋白孵育盒中加入12ml 1xTBST,1:10000加入HRP标 记的二抗(Sigma-Aldrich),将PVDF膜转入室温孵育1h。
(14)用1xTBST清洗PVDF膜3次,每次10min。
(15)最后使用SuperSignalTMWest Femto Maximum Sensitivity Substrate(Pierce)检测特异蛋白条带。
经WesternBlotting检测,检测结果见图9,inPTG-Cas9结构的 pRGEB33/34-inPTG10都检测到了Cas9的表达,说明PTG插入到内含子中, Cas9依然能正常表达。但从表达量上来看,两个inPTG的载体相比较于 pRGEB32-PTG10,Cas9的表达量有一定的下降,但Cas9表达量的下降是否 会影响到载体的编辑效率,有待于检测。
不同载体的基因编辑效率比较
为了比较pRGEB32、pRGEB33、pRGEB34三个载体间基因编辑效率,我 们将PTG3/4/6/7/10分别插入到三个载体骨架中。
利用PEG法将UBI10p::inPTG3/4/6/7/10-Cas9质粒载体与原有的 U3p::PTG3/4/6/7/10-UBI10p::Cas9质粒载体以及GFP质粒转化水稻原生质体, GFP质粒作为原生质体转化的阳性对照。原生质体在室温培养20小时后观察 GFP的转化效率,36h后收集原生质体,用CTAB法提取原生质体的DNA, 步骤如下:(1)将原生质体转入1.5ml EP管中,300g离心3min,弃上清。
(2)将收集的原生质体细胞中加入500μl 65℃预热的2x CTAB,颠倒混匀。 然后65℃水浴20min。
(3)加入500μl苯酚:氯仿:异戊醇(25:24:1),40rpm旋转混合30min。
(4)12000rpm离心5min,将上清转入新EP管中。
(5)加入1/10体积的3MNaAc和等体积的异丙醇,充分颠倒混匀,放入-20℃ 1h。
(6)12000rpm离心5min,弃上清。
(7)加入1ml 75%乙醇,12000rpm离心2min,弃上清。
(8)沉淀晾干后加入30μl H2O,溶解DNA。
接下来,用野生型水稻的基因组DNA作为阴性对照,PCR扩增包含每个 基因两个靶位点的DNA片段,引物见表7,PCR反应体系:以200ng基因组 DNA为模板,加入5μl 5x GreenGO Buffer(Fermentas),2μl dNTP(2.5mM, Takara),0.5μl F/R,0.1μl Ex Taq(5U/μl,Takara),补水至25μl。PCR反应程序: 98℃预变性20s,98℃变性10s,60℃退火30s,72℃延伸1min/Kb,共35个 循环,最后72℃延伸5min。
表7:基因型鉴定所用引物(Seq ID No.84~Seq ID No.97)
Figure BDA0001481671530000171
Figure BDA0001481671530000181
通常我们对一个基因设计两个靶位点,这样可以利用Cas9和一对gRNA 切除基因中的一段序列,因此通过PCR扩增包含两个靶位点的片段,就可以 检测基因组编辑的效率:利用琼脂糖凝胶电泳检测,能够直接观测到两条DNA 条带:没有被编辑的DNA条带以及被成功编辑的DNA条带。
通过Image J软件计算成功被编辑的条带占总DNA量(没有被基因编辑的 条带和成功被基因编辑的条带的DNA量的总和)的百分比,即编辑效率(在 原生质体转化效率相同的情况下,为方便分析,暂不把转化效率计算在内)。 结果见图10,在水稻原生质体中表达inPTG4/10-Cas9后,PCR检测靶基因 DNA片段被剪切的效率(Del%),以原有的U3p::PTG-UBI10p::Cas9载体和 野生型基因组DNA作为对照。经计算,PTG10和inPTG10的编辑效率分别 为1.4%和1.6%,PTG4和inPTG4的编辑效率分别为25%和30.9%;即PDS 和MPK2在inPTG-Cas9载体中的编辑效率优于U3::PTG-UBI10p::Cas9的载 体。但是PTG3和inPTG3的编辑效率分别为21.3%和11%,PTG6和inPTG6 的编辑效率分别为6%和4.4%(见图11),表明MPK1和MPK5在inPTG-Cas9 载体中的编辑效率略低于U3::PTG-UBI10p::Cas9的载体。在包含4个gRNA 的PTG7/inPTG7片段中,MPK1靶基因的编辑效率在inPTG-Cas9载体中略低 于U3::PTG-UBI10p::Cas9的载体,而在inPTG-Cas9载体中MPK5靶基因的 编辑效率高于U3::PTG-UBI10p::Cas9载体(见图12)。
因此,综上所述,inPTG-Cas9载体结构与U3::PTG-UBI10p::Cas9同样具 有高效的多基因编辑能力,两者效率相差不大。此外,pRGEB33和pRGEB34 两个载体间的编辑效率没有明显区别,表明缩短内含子的长度并不影响 inPTG-Cas9的编辑效率。
实施例2 在水稻中验证inPTG-Cas9编辑效率
我们进一步在水稻植株中验证inPTG-Cas9的编辑效率。用农杆菌介导转 化的方法分别将pRGEB33-inPTG3/6/7/10载体转入到中花11水稻植株中。
pRGEB33-inPTG10用于PDS基因的敲除,当PDS基因被敲除时,水稻 植株会出现白化现象。在转基因植株中,在27株敲除PDS的T0代转基因植 株中,有12株植株出现了白化苗(见图13),结果表明inPTG10-Cas9具有 较高的编辑效率。
利用PCR/RE的方法检测转基因水稻中MPK1,MPK5,PDS编辑情况。 用CTAB法提取转基因水稻叶片的基因组DNA,以野生型水稻的基因组DNA 作为对照,用引物(见引物序列表7)扩增包含靶位点的基因组DNA,利用限制 性内切酶酶切PCR产物。因为Cas9剪切位点位于PAM前第三和第四个碱基 之间,如果这个区域有限制性内切酶识别序列,当靶位点被编辑之后,酶切 位点就会被破坏,利用限制性内切酶酶切时无法切开被破坏的位点,而未被 编辑的则会被切开,通过琼脂糖凝胶电泳即可检测出目的基因是否被编辑。
水稻为二倍体植物,转基因植株会出现单等位基因突变、双等位基因突变 和没有突变三种情况。若酶切后只存在一条条带,且该条带大小与未被酶切 的野生型DNA扩增条带相同,则该植株为双等位基因突变;若酶切后只有两 条条带,两条条带大小与酶切后的野生型DNA片段相同,则该植株没有突变; 若酶切后出现三条条带,既存在与未被酶切的野生型DNA条带大小相同的条 带,也存在与酶切后的野生型DNA条带大小相同的条带,该植株为单等位基 因突变。
MPK1用Blp I酶切检测(图15),MPK5用Sac I和Kpn I酶切检测(图 15),PDS用EcoRI酶切检测。酶切结果显示,77%(17/22)的inPTG3-Cas9 转基因植株发生了突变,其中73%(16/22)为双等位基因突变,4%(1/22)为 单等位基因突变。inPTG6-Cas9转基因植株中,由Sac I酶切的靶位点71% (22/31)发生了突变,其中13%(4/31)为双等位基因突变,58%(18/31)为 单等位基因突变,由Kpn I酶切的靶位点84%(26/31)发生了突变,其中61%(19/31)为双等位基因突变,23%(7/31)为单等位基因突变;敲除PDS的 转基因植株中,85%(23/27)发生了突变,其中11%(3/27)为双等位基因 突变,74%(20/27)为单等位基因突变;inPTG7-Cas9转基因植株中,敲除 MPK1基因的效率为50%(4/8),且均为双等位基因突变,敲除MPK5基因 的效率为62.5%(5/8)(图14)。
图14中a为通过PCR酶切检测gRNA1/2/3靶位点的突变情况。红 色箭头表示靶位点产生突变未被酶切的DNA,黑色箭头表示被酶切的 野生型DNA。
图14中b为inPTG7-Cas9部分转基因株系的靶位点被编辑的情况。
综上所述,50%-84%的inPTG-Cas9转基因植株发生了突变, inPTG3/6/7/10-Cas9转基因植株突变频率结果见图15,其中73%为双等位基 因突变,而原有的U3p::PTG-UBI10p::Cas9转基因植株的突变效率为 47%-100%。这两者之间的微小差别可能是由于水稻转化的不同引起的。根据 inPTG-Cas9在水稻中的编辑效率,表明inPTG-Cas9能够在水稻中高效稳定地 进行多位点编辑。
实施例3 inPTG的内含子可以放在基因的不同位置
设计inPTG-Cas9使用的是水稻内源UBI10基因的结构来表达Cas9和内含 子中的gRNA。由于基因的内含子位置并不是固定的,因此inPTG是可以在 重组基因的不同位置表达的。为了验证我们的设想,我们构建了新的结构将 inPTG插入到Cas9基因的3’-UTR区(UBI10p::Cas9-inPTG)。同时,在PTG 最后一个gRNA后加入tRNA(inPTG-tRNA),以提高最后一个靶位点从内含 子中剪切下来效率。
1、载体说明
在载体pRGEB33基础上,用UBI10内源的内含子(SEQ ID:4)替换加入了 BsaⅠ酶切位点的内含子,同时在重组Cas9基因的3’-UTR区插入含有两个 BsaⅠ酶切位点的内含子(SEQ ID:9),用于PTG的克隆,载体命名为 pRGEB33T,pRGEB33T载体结构示意图见图16。
用Golden Gate克隆方法在PTG3/4/6最后一个gRNA后加入一个tRNA,分 别命名为PTG3t(SEQ ID:16),PTG4t(SEQ ID:17),PTG3t(SEQ ID:18)并构 建到载体pRGEB33中,同时PTG7构建到pRGEB33T中 (UBI10p::Cas9-inPTG7)。
2、不同载体的基因编辑效率比较
首先比较PTG和PTGt对于编辑效率的影响,以MPK1、MPK2、MPK5 为靶基因,对应的PTG(t)名称分别为PTG3(t),PTG4(t),PTG6(t),PTG和PTGt 结构的表达载体编辑MPK1、MPK2和MPK5的效率见图17;另外为比较 pRGEB33与pRGEB33T,以PTG7分别构建在pRGEB32、pRGEB33T、 pRGEB33、pRGEB34的载体进行基因编辑效率比较(结果见图19)。
利用PEG法将UBI10p::inPTG3/4/6/3t/4t/6t-Cas9、UBI10p::Cas9-inPTG7以 及GFP质粒转化水稻原生质体,GFP质粒作为原生质体转化的阳性对照。原 生质体25℃培养20小时后观察GFP的转化效率,36h后收集原生质体。
提取水稻原生质体的基因组DNA,用野生型水稻的基因组DNA作为阴性 对照,扩增包含靶序列的DNA片段,并用琼脂糖凝胶进行电泳(PCR反应同 前,引物见表7)。
通过Image J计算编辑效率发现,inPTG3t的编辑效率为14.4%略高于PTG3 的编辑效率为14.1%;inPTG4t的编辑效率为30.7%高于inPTG4的编辑效率 为24%;而inPTG6t(4.2%)和inPTG6(7%)效率都较低,inPTG6效率略 高于inPTG6t(图17)。因此总体而言,inPTGt的编辑效率要好于inPTG。
比较pRGEB33T与pRGEB33载体的编辑效率我们发现(图18),检测 MPK1基因的编辑效率,pRGEB33T的编辑效率(6.9%)高于pRGEB32/33/34; 检测MPK5基因的编辑效率,pRGEB33T的编辑效率(7.1%)也高于 pRGEB32/33/34。因此,结果表明pRGEB33T载体的编辑效率比pRGEB33载 体。
因此,结果验证了inPTG可以在基因的不同位置表达,并且本实验中inPTG 在重组Cas9基因的3’-UTR区表达的结构比在内含子中表达效率更高。
实施例4:利用inPTG-Cas9可以选择不同的PolⅡ启动子来同时表达Cas9和 gRNAs
inPTG-Cas9系统的优势在于,来自于一个基因的PolⅡ启动子可以同时驱 动Cas9和gRNAs的表达,因此可以根据需要很简便地更换不同用途的PolⅡ 启动子。本实验以MAP2为靶基因,设计两个用于敲除MPK2的gRNA构建 PTG4,并使用两个病原菌诱导性基因PR1(Os01g0382000)和PR5 (Os12g0628600)的启动子驱动inPTG4-Cas9的表达,通过对MPK2基因的 编辑情况的检测,验证了不同的PolⅡ启动子可以用于inPTG-Cas9的表达。
1.载体说明
pRGEB3341载体和pRGEB3345载体(结构示意图见图19)分别由PR1 启动子(PR1p)和PR5启动子(PR5p)驱动inPTG-Cas9的表达,两个载体中含 有两个BsaⅠ酶切位点的内含子以及Cas9序列相同,载体详述如下:
pRGEB3341载体表达框元件包括:PR1启动子(Seq ID No.19)、来源 于水稻Ubiquitin10(UBI10)基因的部分5’-UTR外显子序列,以及内含子和第 二个外显子部分序列,其中内含子经过改造含有两个BsaⅠ酶切位点用于PTG 序列的克隆(同pRGEB33内含子)、Cas9基因序列与pRGEB32相同。PR1 启动子从Kitaake水稻基因组中PCR扩增获得,引物为Pro-PR1b-F和 Pro-PR1b-R,通过HindⅢ和NruⅠ酶切后构建到载体中。
pRGEB3345载体表达框元件包括PR5启动子(Seq ID No.20),其他部 分与pRGEB3341载体除启动子之外的序列相同。PR5启动子从Kitaake水稻 基因组中PCR扩增获得,引物为Pro-PR5-F和Pro-PR5-R,并利用overlap extension PCR将启动子中的一个BsaⅠ酶切位点突变,最后通过HindⅢ和 NruⅠ酶切后构建到载体中。
PTG4(Seq ID No.12)是由tRNA(SEQ ID:10)分别和两个用于敲除MPK2 的gRNA5和gRNA6串联构成的。通过用BsaⅠ酶切pRGEB3341和 pRGEB3345,将PTG4分别插入到两个载体的内含子中,构建成 pRGEB3341-inPTG4和pRGEB3345-inPTG4。
2.不同载体基因编辑效率的比较
利用PEG-CaCl2转化法将pRGEB33-inPTG4、pRGEB3341-inPTG4和 pRGEB3345-inPTG4转化水稻原生质体,GFP质粒作为原生质体转化的阳性 对照,25℃培养36h后收集原生质体。由于在MPK2上设计了两个靶位点, 当两个位点都被编辑后,可能出现中间片段丢失的情况,因此可以通过PCR 从两个靶位点外侧相向扩增,被编辑的DNA扩增的片段会比野生型的DNA 扩增的片段小。利用PCR对不同载体的基因编辑效率进行检测和比较,具体 步骤如下:
首先,利用CTAB法提取原生质体的基因组DNA,用引物MPK2-F和 MPK2-R2(表7)扩增包含靶序列的目的片段,经琼脂糖凝胶电泳检测,结 果如图20所示:野生型“WT”扩增的目的条带单一,没有非特异扩增;三个 不同启动子驱动inPTG4-Cas9的载体转化原生质体后都检测到了编辑后被切 除了507bp后的条带。通过Image J软件计算被剪切后的DNA片段占总DNA 量的百分比,即反映了该样品被编辑的效率。pRGEB33-inPTG4、 pRGEB3341-inPTG4和pRGEB3345-inPTG4转化的原生质体目的基因剪切的 频率依次是33%、29%、31%。三者的编辑效率比较一致,说明利用inPTG-Cas9 系统可以根据需求很简便地选择不同目的的PolⅡ启动子来同时表达Cas9和 gRNAs。
实施例5:利用内含子表达crRNA,使Cpf1具有高效的多位点编辑能力 1.CRISPR/Cpf1说明
CRISPR/Cpf1是一种比CRISPR/Cas9更为简单的CRISPR系统,与Cas9 不同的是,Cpf1能够独立地将前体CRISPR RNA(pre-crRNA)剪切加工,然后 利用加工后产生的成熟crRNA特异地靶向和切割DNA双链,因而也就不需 要来自宿主细胞的核糖核酸酶和tracrRNA。
CRISPR-Cpf1介导的基因组编辑结构示意图见图21:左图表示Cpf1在 crRNA的引导下靶向目标DNA位点,并对靶基因进行剪切。crRNA由5’端 的直接重复序列(DR,茎环区域)和3’端的引导序列组成。右图表示Cpf1 具有切割前体crRNA的活性。图中剪刀所示位置为Cpf1的剪切位点。
2.载体说明
利用Lachnospiraceae bacteriumND2006(LbCpf1)(Seq ID No.21)和密码 子优化的Francisellanovicida(FnCpf1)(Seq ID No.22)构建用于植物中基因 编辑的载体,表达Cpf1和crRNAs的载体结构图见图22;用U3启动子(p32Lb 和p32Fn)表达crRNAs或在内含子中(p33Lb和p33Fn)表达crRNAs。多个 crRNAs能够以polycistronic tRNA-crRNA(PTC)或者crRNAarray(CA)结 构被识别加工。图中三角形表示crRNAs插入到双Bsa I的克隆位点中。
其中p32Fn/p32Lb是由水稻U3启动子(同pRGEB32)驱动crRNA的表 达,由UBI10启动子(同pRGEB32)驱动Cpf1(Fn/Lb)的表达。载体中使用 的UBI10启动子,包括UBI10的启动子片段、5’-UTR的外显子和内含子以及 第二个外显子部分序列。
p33Fn/p33Lb是由UBI10启动子同时驱动位于内含子中的crRNA和 Cpf1(Fn/Lb)的表达。载体中的UBI10启动子(同pRGEB33)是在p32Fn/p32Lb 的UBI10启动子基础上在内含子中加上两个BsaⅠ酶切位点,用于crRNA的 克隆。
为了比较不同的载体的编辑效率,如图23所示,以水稻PDS为靶基因, 设计两个靶位点crRNA1和crRNA2,并且以polycistronic tRNA-crRNA(PTC) 和crRNAarray(CA)两种构建策略(图24)使Cpf1具有同时编辑多个位点能 力。其中,PTCPDS(Seq ID No.23)的结构是tRNA-crRNA1-tRNA-crRNA2, 利用内源tRNA加工使多个crRNA被剪切释放出来;而CAPDS(SeqID No.24) 的结构是crRNA1-crRNA2-DR(direct repeat),它是利用Cpf1的能够剪切 pre-crRNA的能力,从而产生多个crRNA,实现多位点编辑。PTCPDS由引物 PDS-OLF1、PDS-OLR1、PDS-OLF2、PDS-OLR2通过overlap extension PCR 构建,CAPDS由引物M1、M2、M3、M4、M5通过overlap extensionPCR构建, 将两种crRNA表达的序列分别构建到p32Fn/p32Lb和p33Fn/p33Lb中,即U3p:: (PTCPDS/CAPDS)-UBI10p::Cpf1(Fn/Lb)和UBI10p::intron(PTCPDS/CAPDS)-Cpf1 (Fn/Lb),共8个载体。
3.crRNAarray插入到内含子中对于内含子剪接的影响
为了确定crRNAarray插入到载体内含子中,是否会对内含子的正常剪接 造成影响,从而影响到下游Cpf1的表达。实验通过对p33Fn-CAPDS(即 UBI10p::intron(CAPDS)-FnCpf1)和p33Lb-CAPDS(即UBI10p::intron (CAPDS)-LbCpf1)转录的mRNA进行分析,利用reverse transcription PCR (RT-PCR)检测内含子是否正常剪接。详述如下:
将p33Fn-CAPDS和p33Lb-CAPDS质粒分别转化到水稻原生质体中,25℃培 养24h后收集原生质体。利用TRIzol法提取原生质体的总RNA,总RNA经 DNaseⅠ(NEB)处理后,使用iScriptTM cDNA Synthesis Kit(Bio-Rad)以及 oligo-dT引物合成cDNA。以转p33Fn-CAPDS原生质体的cDNA为模板,用引 物exon1-qF和33Fn-qR扩增跨5‘-UTR内含子的片段,正常剪接后的片段大 小为228bp;以转p33Lb-CAPDS原生质体的cDNA为模板,用引物exon1-qF 和33Lb-qR(表6)扩增跨5‘-UTR内含子的片段,正常剪接后的片段大小为 201bp。扩增的片段通过琼脂糖凝胶电泳检测,结果如图25所示,其中a为 在(CAPDS)-Cpf1内含子两端的外显子上设计引物进行RT-PCR,扩增内含子 被剪切后的mRNA。其中b为RT-PCR产物的测序结果,内含子被正确剪接。 红色字体表示RNA剪接时内含子的供体为点和受体位点。
图25a所示,片段大小和预期一致。接下来用pEASY-Blunt克隆载体克 隆PCR扩增的目的片段。目的片段克隆后经测序分析(图25b),CAPDS插入 到p33Fn和p33Lb的内含子中都未影响到内含子的正常剪接。
4.不同crRNA表达方式编辑效率的比较
利用PEG-CaCl2转化法,将2中所述的8个载体转化到水稻原生质体中, GFP质粒作为原生质体转化的阳性对照,25℃培养36h后收集原生质体。利 用CTAB法提取原生质体的基因组DNA,通过引物OsPDSC-F和OsPDSC-R (表7)扩增含有两个靶位点的目的片段,经琼脂糖凝胶电泳检测,结果如图 26所示:野生型“WT”扩增的目的条带单一,没有非特异扩增。被编辑的DNA 扩增的片段会比野生型的DNA扩增的片段小1277bp左右。通过Image J软件 计算编辑后的DNA片段占总DNA量的百分比,比较8个载体的编辑效率。
通过琼脂糖凝胶电泳检测,八个载体都能够使PDS产生编辑,其中CAPDS结构的载体产生的目的基因的剪切频率(约19-39%)明显高于PTCPDS结构的 (约2-5%),而CAPDS在内含子中表达产生的剪切频率(FnCpf139%,LbCpf1 21%)与用U3启动子表达CAPDS所产生的剪切频率(FnCpf119%,LbCpf1 33%)差异不大,都有较高的剪切效率。
5.crRNA表达方式不同的载体,Cpf1表达量的比较
为了进一步分析在内含子中表达crRNA是否会影响到Cpf1的表达,使用WesternBlot分析了p32Fn-CAPDS和p33Fn-CAPDS中FnCpf1的表达情况,以及 p32Lb-CAPDS和p33Lb-CAPDS中LbCpf1的表达情况,详述如下:
首先,以PEG-CaCl2转化法,将用于分析的四个载体质粒转化到水稻原 生质体中,25℃培养12h后收集原生质体,使用RIPAbuffer(50mM Tris pH 7.5, 100mM NaCl,1%SDS,1%Triton X-100,10%glycerol)提取原生质体的总蛋 白,2μg左右提取的蛋白使用7%的SDS-PAGE电泳分离,然后将蛋白转移至 PVDF膜上。FnCp1融合了FLAG标签,LbCpf1融合的是HA的标签,因此FnCpf1用anti-FLAG抗体(Sigma-Aldrich)孵育,LbCpf1用anti-HA抗体(Sigma-Aldrich)孵育,一抗孵育后,接着用辣根过氧化物酶标记的anti-mouse 二抗(Sigma-Aldrich)进行孵育。在孵育结束后,使用SuperSignalTMWestFemto MaximumSensitivity Substrate(Pierce)检测特异蛋白条带。
Western blotting检测U3p::crRNA-UBI10p::Cpf1和 UBI10p::intron(crRNA)-Cpf1在水稻原生质体中Cpf1蛋白水平的差异结果如 图27所示,“loading“表示蛋白上样量对照。CAPDS由U3p驱动表达或插入 内含子中表达时,FnCpf1以及LbCpf1的表达量在两种情况下差异不大。因 此,crRNAarray在内含子中表达并不影响Cpf1的表达。
实施例6:验证intron(CA)-Cpf1高效的多基因编辑能力
intron(CA)-Cpf1具有在多个位点高效编辑的能力,前边的研究验证了在 一个基因的多个位点可以同时产生高效编辑,因此,接下来我们以MPK2和 MPK5为靶基因,验证intron(CA)-Cpf1多基因多位点编辑的能力。
1.载体说明
分别在MPK2和MPK5上设计两个靶位点,
设计crRNAs敲除MPK2和MPK5示意图见图28,其中a为每一个基因 设计了两个crRNAs靶向敲除,红色部分表明Cpf1的PAM序列。B为同时敲 除MPK2和MPK5的多个crRNA表达结构crRNAarray(CAMPK)结构示意 图。
MPK2的两个靶位点为crRNA3和crRNA4,MPK5的两个靶位点为 crRNA5和crRNA6。将两个基因的四个crRNA构建成crRNAarray串联的形 式CAMPK,即crRNA3-crRNA4-crRNA5-crRNA6-DR。接着将CAMPK分别构建 到p32Fn/p32Lb和p33Fn/p33Lb中,即U3p::CAMPK-UBI10p::Cpf1(Fn/Lb)和 UBI10p::intron(CAMPK)-Cpf1(Fn/Lb),共4个载体。
2.不同crRNA表达方式编辑效率的比较
利用PEG-CaCl2转化法,将上述的4个载体转化到水稻原生质体 中,GFP质粒作为原生质体转化的阳性对照,25℃培养36h后收集原 生质体。利用CTAB法提取原生质体的基因组DNA,通过引物MPK2-CF 和MPK2-CR(表7)扩增MPK2基因中包含靶位点的片段,通过引物MPK5-CF和MPK5-CR(表7)扩增MPK5基因中包含靶位点的片段。 经琼脂糖凝胶电泳检测,结果如图29所示:两个基因野生型“WT”扩 增的目的条带单一,没有非特异扩增。MPK2被编辑的DNA扩增的片 段会比野生型的DNA扩增的片段小436bp左右,MPK5被编辑的DNA 扩增的片段会比野生型的DNA扩增的片段小522bp左右。通过Image J软件计算编辑后的DNA片段占总DNA量的百分比,分别比较两个 基因的两种crRNA表达方式的编辑效率。
CAMPK在4种载体中表达时都可以使MPK2和MPK5同时被编辑(图29), 不过LbCPf1(9-32%)的剪切效率明显高于FnCpf1(2-9%),而对比两种LbCpf1 表达结构,CAMPK在内含子中表达时两个基因的剪切效率都明显高于用U3p 表达CAMPK,其中MPK2(32%VS 12%),MPK5(18%VS 9%)。因此,对于 Cpf1来说,在内含子中表达crRNAarray的方式是一种更高效的多基因编辑策 略。
由上述实施例可知,本发明提供的基于CRISPR系统的基因组编辑方法不 需要添加其他元件,安全性更高;利用一个启动子实现多个gRNA/crRNA与 Cas9/Cpf1的同步表达,简化了已有的CRISPR编辑系统,可采用不同的启动子, 扩大了启动子的选择范围,增强了在该方法植物中的通用性;提高了CRISPR 编辑系统的编辑效率和编辑能力,可以同时高效率的编辑多个靶位点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润 饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 华中农业大学
<120> 一种基于CRISPR系统的基因组编辑方法及其应用
<160> 97
<170> SIPOSequenceListing 1.0
<210> 1
<211> 381
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc a 381
<210> 2
<211> 671
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
acaaattcgg gtcaaggcgg aagccagcgc gccaccccac gtcagcaaat acggaggcgc 60
ggggttgacg gcgtcacccg gtcctaacgg cgaccaacaa accagccaga agaaattaca 120
gtaaaaaaaa agtaaattgc actttgatcc accttttatt acctaagtct caatttggat 180
cacccttaaa cctatctttt caatttgggc cgggttgtgg tttggactac catgaacaac 240
ttttcgtcat gtctaacttc cctttcagca aacatatgaa ccatatatag aggagatcgg 300
ccgtatacta gagctgatgt gtttaaggtc gttgattgca cgagaaaaaa aaatccaaat 360
cgcaacaata gcaaatttat ctggttcaaa gtgaaaagat atgtttaaag gtagtccaaa 420
gtaaaactta tagataataa aatgtggtcc aaagcgtaat tcactcaaaa aaaatcaacg 480
agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 540
ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 600
agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 660
ctcctctcct c 671
<210> 3
<211> 81
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gcatcagctc cacccccgaa aaatttctcc ccaatctcgc gaggctctcg tcgtcgaatc 60
gaatcctctc gcgtcctcaa g 81
<210> 4
<211> 962
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt 60
ttgttgctag atccgattgg tggttagggt tgtcgatgtg attatcgtga gatgtttagg 120
ggttgtagat ctgatggttg tgatttgggc acggttggtt cgataggtgg aatcgtggtt 180
aggttttggg attggatgtt ggttctgatg attgggggga atttttacgg ttagatgaat 240
tgttggatga ttcgattggg gaaatcggtg tagatctgtt ggggaattgt ggaactagtc 300
atgcctgagt gattggtgcg atttgtagcg tgttccatct tgtaggcctt gttgcgagca 360
tgttcagatc tactgttccg ctcttgattg agttattggt gccatgggtt ggtgcaaaca 420
caggctttaa tatgttatat ctgttttgtg tttgatgtag atctgtaggg tagttcttct 480
tagacatggt tcaattatgt agcttgtgcg tttcgatttg atttcatatg ttcacagatt 540
agataatgat gaactctttt aattaattgt caatggtaaa taggaagtct tgtcgctata 600
tctgtcataa tgatctcatg ttactatctg ccagtaattt atgctaagaa ctatattaga 660
atatcatgtt acaatctgta gtaatatcat gttacaatct gtagttcatc tatataatct 720
attgtggtaa tttcttttta ctatctgtgt gaagattatt gccactagtt cattctactt 780
atttctgaag ttcaggatac gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc 840
ctgttactat ctttttgaat acatgtatgt tctgttggaa tatgtttgct gtttgatccg 900
ttgttgtgtc cttaatcttg tgctagttct taccctatct gtttggtgat tatttcttgc 960
ag 962
<210> 5
<211> 2
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
at 2
<210> 6
<211> 4312
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagt aagaattcgc ggccgcactc gagatatcta gacccagctt tc 4312
<210> 7
<211> 982
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt 60
ttgttgctag atccgattgg tggttagggt tgtcgatgtg attatcgtga gatgtttagg 120
ggttgtagat ctgatggttg tgatttgggc acggttggtt cgataggtgg aatcgtggtt 180
aggttttggg attggatgtt ggttctgatg attgggggga atttttacgg ttagatgaat 240
tgttggatga ttcgattggg gaaatcggtg tagatctgtt ggggaattgt ggaactagtc 300
atgcctgagt gattggtgcg atttgtagcg tgttccatct tgtaggcctt gttgcgagca 360
tgttcagatc tactgttccg ctcttgattg agttattggt gccatgggtt ggtgcaaaca 420
caggctttaa tatgttatat ctgttttgtg tttgatgtag atctgtaggg tagttcttct 480
tagacatggt tcaattatgt agcttgtgcg tttcgatttg atttcatatg ttcacagatt 540
agataatgat gaactctttt aattaattgt caatggtaaa taggaagtct tgtcgctata 600
tctgtcataa tgatctcatg ttactatctg ccagtaattt atgctaagaa ctatattaga 660
atatcatgtt acaatctgta gtaatatcat gttacaatct gtagttcatc tatataatct 720
attgtggtaa tttcttttta ctatctgtgt gaagattatt gccactagtt cattctactt 780
atttctgaag ttcaggatac gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc 840
ctgttactat ctttttgaat acatgtatgt tctgttggaa tatggcagga gaccgaggtc 900
tcggtttgct gtttgatccg ttgttgtgtc cttaatcttg tgctagttct taccctatct 960
gtttggtgat tatttcttgc ag 982
<210> 8
<211> 146
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gtacgctgct tctcctctcc tcgcttcgtt tcgattcgat ttcggacggc aggagaccga 60
ggtctcggtt tgctgtttga tccgttgttg tgtccttaat cttgtgctag ttcttaccct 120
atctgtttgg tgattatttc ttgcag 146
<210> 9
<211> 1084
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cagctgggag gcgacaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 60
aagtaagaat tcgcggccgc actcgagata ttcaaggtac gctgcttctc ctctcctcgc 120
ttcgtttcga ttcgatttcg gacgggtgag gttgttttgt tgctagatcc gattggtggt 180
tagggttgtc gatgtgatta tcgtgagatg tttaggggtt gtagatctga tggttgtgat 240
ttgggcacgg ttggttcgat aggtggaatc gtggttaggt tttgggattg gatgttggtt 300
ctgatgattg gggggaattt ttacggttag atgaattgtt ggatgattcg attggggaaa 360
tcggtgtaga tctgttgggg aattgtggaa ctagtcatgc ctgagtgatt ggtgcgattt 420
gtagcgtgtt ccatcttgta ggccttgttg cgagcatgtt cagatctact gttccgctct 480
tgattgagtt attggtgcca tgggttggtg caaacacagg ctttaatatg ttatatctgt 540
tttgtgtttg atgtagatct gtagggtagt tcttcttaga catggttcaa ttatgtagct 600
tgtgcgtttc gatttgattt catatgttca cagattagat aatgatgaac tcttttaatt 660
aattgtcaat ggtaaatagg aagtcttgtc gctatatctg tcataatgat ctcatgttac 720
tatctgccag taatttatgc taagaactat attagaatat catgttacaa tctgtagtaa 780
tatcatgtta caatctgtag ttcatctata taatctattg tggtaatttc tttttactat 840
ctgtgtgaag attattgcca ctagttcatt ctacttattt ctgaagttca ggatacgtgt 900
gctgttacta cctatctgaa tacatgtgtg atgtgcctgt tactatcttt ttgaatacat 960
gtatgttctg ttggaatatg gcaggagacc gaggtctcgg tttgctgttt gatccgttgt 1020
tgtgtcctta atcttgtgct agttcttacc ctatctgttt ggtgattatt tcttgcagat 1080
tcta 1084
<210> 10
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 11
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaatc caggcgacgc tgagccagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tggcccaccg gggtataaaa gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 12
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcagaa cccggtcgcc tcaaggagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca gaatgcgcag actcgtcagg gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 13
<211> 357
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttttt 357
<210> 14
<211> 703
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcaac aaagcaccag 360
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 420
tgcaatccag gcgacgctga gccagtttta gagctagaaa tagcaagtta aaataaggct 480
agtccgttat caacttgaaa aagtggcacc gagtcggtgc aacaaagcac cagtggtcta 540
gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcatgg 600
cccaccgggg tataaaagtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 660
tatcaacttg aaaaagtggc accgagtcgg tgcttttttt ttt 703
<210> 15
<211> 356
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaca agccaggaga attcagcgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca cactgcatgg ataactcatc gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttt 356
<210> 16
<211> 432
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaatc caggcgacgc tgagccagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tggcccaccg gggtataaaa gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 360
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 420
gcattttttt tt 432
<210> 17
<211> 433
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcagaa cccggtcgcc tcaaggagtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca gaatgcgcag actcgtcagg gttttagagc tagaaatagc aagttaaaat 300
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 360
ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 420
gcattttttt ttt 433
<210> 18
<211> 434
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaga tgtcgtagag caggtacgtt ttagagctag aaatagcaag 120
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcaacaaag 180
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 240
ggctggtgca tctacatcgc cacggagctc agttttagag ctagaaatag caagttaaaa 300
taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcaac aaagcaccag 360
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 420
tgcatttttt tttt 434
<210> 19
<211> 1443
<212> DNA
<213> Oryza sativa
<400> 19
gcttgggcag ctggaggaga aagaagacat atatatatag gggtgggact ttagtcccgg 60
ttggtgttac caaccaggac taaagatcac gggggggggg gggggggggc gacaggccct 120
agtagcattt gaaccaggac taaagattaa atatgtcaaa catggtcaaa catgttatac 180
catgttgatc atgcatgtag ctaagtgcga tttatatctt atacatttgc ataaaatttt 240
tgaataagac gaatggttaa acatatgaga aaaagtcaac ggcgttttct attaaaaaac 300
ggaggtagta ttacttagta ttcatgcatg tatgcatgga catgcagcct tcgagtgcac 360
agcgagtttt tgtatagtga aaaaaaaatg atgagatgga aggaaaggat ggcatacgtt 420
cggtggggag gggaattcgg aggttttatt ttttttttgg taagtacacg cgcgcacgta 480
catactactg aaggagaaga ggtggggccc tggtgtcttg ttagttttaa ggttaatcta 540
atctaacggt ttataatatt ggattcacca acttaaatga aaacgaaggg acacatgttt 600
tgcttttttc tcagaatttt ttgaatttct ctaatttatt agaacgccac atgacggctt 660
gagagtgttt gtaggaagtt taatggacgt ttagtatata ataatagata gaatttcttg 720
gatttctcta atttattaga gcgccacatg acggcttgag agcgtttgta tgaagtttaa 780
tgtactttta gtatataata gatagataga tagatagata gaagatagtt tttgtatgag 840
ttgttcgatg ttttacgctc ccaaatatat taatacattg gatcaccatt ttaaatttat 900
tatagataag tttaatacga aaatttcaga tttgttttct taatttttat gaacaacatt 960
tgcatacaac atctggtcgt aataactacg ttgaatatta ccctcttgat gacttgacta 1020
attttagaca aaagatggtc acccacccag cttttcattg aaagtataag agttcataca 1080
gtgcaaaaag gaacaaaggt aaaataaaag gaaagtaaaa atcccaagtc ctgcgtacaa 1140
atctatagtt caagacatac acatcgcctt ccaaccgagg tcgagttgcc ccggtgccat 1200
gtcttattcg tggaattcta tgtccaagtg catactttgc gggggtaaaa ttttctacac 1260
gtatgttgcc aaaatttctg ctaagttttt cgtggccaac tcgagaaaat tcttacacag 1320
ccagtctata aatactcaca catttcacaa aaaaatactt gcaacatcaa agctacacag 1380
gtagaatcat cgaccgtaag taagtactac tcctacgtac attaagtgtg agcttgatta 1440
act 1443
<210> 21
<211> 1637
<212> DNA
<213> Oryza sativa
<400> 21
ggaagttata ttacgtctac caacctattt tacccgtcat ttaattaatt tggtcgtctt 60
cttctggcga ccgatcggat cgatcacatc tcgcgtatct atttccacac atgttttgca 120
caaaactaca agggatcgat tggccagcca gccggaaatt gaagactatt ctgcagagga 180
ctcatcctct aagtcgaggc atgcaaaact aaaacaaagt gaattaaaaa aaaggaagtt 240
gtagtcaaga aaatttctag acaactacta acaaacaaca aaactttttt tatagggaaa 300
caaacaacaa aactaactaa atgaaacaga ttatgtgtct tagatacatt aatttagaac 360
tattcaacat gcctgataac actgttttgc agtgaattaa ttacgaacca ttcaacattt 420
ctttaaccaa tataaataac atggcaattc tagctagtat gtattctgca cgcacgtatg 480
catcacgtat gtgctcccct ttaaaaaaat tgatgcttga aaaaaagttc ggtgaaattt 540
ttaaaatttt aacaatctat aatttttcaa atagttagtt aatttaaata cgaaagaata 600
gtgcacatat atttgcctta aatcataata tcatatcata aacttaaact tattatatta 660
ggttttataa ataatttaaa atataggtaa aattttggcc aaatctcctc aacgcatcaa 720
atcaaataat tatgaacaga tggaaatgga caatttgtag ttaggtatgg acacacacct 780
ccagataact atatatactt tactcggtca gaatctgtca tactgatgtg gtcatcgaga 840
aggtcttaaa aacataatta ggaataaata gcgtggtgac cttcatgcac ccagttctga 900
atactgcata ataggaataa aaatcatgac tgtagtacca tgaatacact ggctagtaaa 960
aatctgagct aactagtagt attaattgat tggattggtt gtgtgcatta tttcatctaa 1020
acgtagtact ctgaatcaag tttttgcatg cggtatggcg ccgcctatga tcaaaggcgt 1080
gaaaatagat gattttcgtt agcggtccca catccgcatg taaaactcgg ttttatgcgg 1140
gactctaaac cacgtacaaa aatcaatttt cataaaagga gcctagcaag tgacctgcat 1200
gcaaataccc ttttaggcga acaaaatgaa aatcaagtcc aacttaccct atcacagatc 1260
atggattcac aaaccacgaa aaaaaacata gatttaaata attggtcctc tttaatacct 1320
tcctgttaag atctctagat aaaaccgctt gcaaaagtaa aggttttcgc aggatgtcct 1380
ctttagatgt cctgcttgta aatagatacc tcccattatg tttacatatg gggttttaag 1440
tagctagtga ttaaatctct ctctctcaca catctccatc tagattaatt tgcacacaat 1500
tatctactag ctaaaaagaa gagaattttc aacactatag catctataaa tacgcatgcc 1560
ccttcatccc ttctccttcc aaagcatctc gatcctacca catcgttaag aaagtcgtat 1620
agtagagtaa attgtta 1637
<210> 21
<211> 3822
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
atgagcaagc tggagaagtt tacaaactgc tactccctgt ctaagaccct gaggttcaag 60
gccatccctg tgggcaagac ccaggagaac atcgacaata agcggctgct ggtggaggac 120
gagaagagag ccgaggatta taagggcgtg aagaagctgc tggatcgcta ctatctgtct 180
tttatcaacg acgtgctgca cagcatcaag ctgaagaatc tgaacaatta catcagcctg 240
ttccggaaga aaaccagaac cgagaaggag aataaggagc tggagaacct ggagatcaat 300
ctgcggaagg agatcgccaa ggccttcaag ggcaacgagg gctacaagtc cctgtttaag 360
aaggatatca tcgagacaat cctgccagag ttcctggacg ataaggacga gatcgccctg 420
gtgaacagct tcaatggctt taccacagcc ttcaccggct tctttgataa cagagagaat 480
atgttttccg aggaggccaa gagcacatcc atcgccttca ggtgtatcaa cgagaatctg 540
acccgctaca tctctaatat ggacatcttc gagaaggtgg acgccatctt tgataagcac 600
gaggtgcagg agatcaagga gaagatcctg aacagcgact atgatgtgga ggatttcttt 660
gagggcgagt tctttaactt tgtgctgaca caggagggca tcgacgtgta taacgccatc 720
atcggcggct tcgtgaccga gagcggcgag aagatcaagg gcctgaacga gtacatcaac 780
ctgtataatc agaaaaccaa gcagaagctg cctaagttta agccactgta taagcaggtg 840
ctgagcgatc gggagtctct gagcttctac ggcgagggct atacatccga tgaggaggtg 900
ctggaggtgt ttagaaacac cctgaacaag aacagcgaga tcttcagctc catcaagaag 960
ctggagaagc tgttcaagaa ttttgacgag tactctagcg ccggcatctt tgtgaagaac 1020
ggccccgcca tcagcacaat ctccaaggat atcttcggcg agtggaacgt gatccgggac 1080
aagtggaatg ccgagtatga cgatatccac ctgaagaaga aggccgtggt gaccgagaag 1140
tacgaggacg atcggagaaa gtccttcaag aagatcggct ccttttctct ggagcagctg 1200
caggagtacg ccgacgccga tctgtctgtg gtggagaagc tgaaggagat catcatccag 1260
aaggtggatg agatctacaa ggtgtatggc tcctctgaga agctgttcga cgccgatttt 1320
gtgctggaga agagcctgaa gaagaacgac gccgtggtgg ccatcatgaa ggacctgctg 1380
gattctgtga agagcttcga gaattacatc aaggccttct ttggcgaggg caaggagaca 1440
aacagggacg agtccttcta tggcgatttt gtgctggcct acgacatcct gctgaaggtg 1500
gaccacatct acgatgccat ccgcaattat gtgacccaga agccctactc taaggataag 1560
ttcaagctgt attttcagaa ccctcagttc atgggcggct gggacaagga taaggagaca 1620
gactatcggg ccaccatcct gagatacggc tccaagtact atctggccat catggataag 1680
aagtacgcca agtgcctgca gaagatcgac aaggacgatg tgaacggcaa ttacgagaag 1740
atcaactata agctgctgcc cggccctaat aagatgctgc caaaggtgtt cttttctaag 1800
aagtggatgg cctactataa ccccagcgag gacatccaga agatctacaa gaatggcaca 1860
ttcaagaagg gcgatatgtt taacctgaat gactgtcaca agctgatcga cttctttaag 1920
gatagcatct cccggtatcc aaagtggtcc aatgcctacg atttcaactt ttctgagaca 1980
gagaagtata aggacatcgc cggcttttac agagaggtgg aggagcaggg ctataaggtg 2040
agcttcgagt ctgccagcaa gaaggaggtg gataagctgg tggaggaggg caagctgtat 2100
atgttccaga tctataacaa ggacttttcc gataagtctc acggcacacc caatctgcac 2160
accatgtact tcaagctgct gtttgacgag aacaatcacg gacagatcag gctgagcgga 2220
ggagcagagc tgttcatgag gcgcgcctcc ctgaagaagg aggagctggt ggtgcaccca 2280
gccaactccc ctatcgccaa caagaatcca gataatccca agaaaaccac aaccctgtcc 2340
tacgacgtgt ataaggataa gaggttttct gaggaccagt acgagctgca catcccaatc 2400
gccatcaata agtgccccaa gaacatcttc aagatcaata cagaggtgcg cgtgctgctg 2460
aagcacgacg ataaccccta tgtgatcggc atcgataggg gcgagcgcaa tctgctgtat 2520
atcgtggtgg tggacggcaa gggcaacatc gtggagcagt attccctgaa cgagatcatc 2580
aacaacttca acggcatcag gatcaagaca gattaccact ctctgctgga caagaaggag 2640
aaggagaggt tcgaggcccg ccagaactgg acctccatcg agaatatcaa ggagctgaag 2700
gccggctata tctctcaggt ggtgcacaag atctgcgagc tggtggagaa gtacgatgcc 2760
gtgatcgccc tggaggacct gaactctggc tttaagaata gccgcgtgaa ggtggagaag 2820
caggtgtatc agaagttcga gaagatgctg atcgataagc tgaactacat ggtggacaag 2880
aagtctaatc cttgtgcaac aggcggcgcc ctgaagggct atcagatcac caataagttc 2940
gagagcttta agtccatgtc tacccagaac ggcttcatct tttacatccc tgcctggctg 3000
acatccaaga tcgatccatc taccggcttt gtgaacctgc tgaaaaccaa gtataccagc 3060
atcgccgatt ccaagaagtt catcagctcc tttgacagga tcatgtacgt gcccgaggag 3120
gatctgttcg agtttgccct ggactataag aacttctctc gcacagacgc cgattacatc 3180
aagaagtgga agctgtactc ctacggcaac cggatcagaa tcttccggaa tcctaagaag 3240
aacaacgtgt tcgactggga ggaggtgtgc ctgaccagcg cctataagga gctgttcaac 3300
aagtacggca tcaattatca gcagggcgat atcagagccc tgctgtgcga gcagtccgac 3360
aaggccttct actctagctt tatggccctg atgagcctga tgctgcagat gcggaacagc 3420
atcacaggcc gcaccgacgt ggattttctg atcagccctg tgaagaactc cgacggcatc 3480
ttctacgata gccggaacta tgaggcccag gagaatgcca tcctgccaaa gaacgccgac 3540
gccaatggcg cctataacat cgccagaaag gtgctgtggg ccatcggcca gttcaagaag 3600
gccgaggacg agaagctgga taaggtgaag atcgccatct ctaacaagga gtggctggag 3660
tacgcccaga ccagcgtgaa gcacaaaagg ccggcggcca cgaaaaaggc cggccaggca 3720
aaaaagaaaa agggatccta cccatacgat gttccagatt acgcttatcc ctacgacgtg 3780
cctgattatg catacccata tgatgtcccc gactatgcct aa 3822
<210> 22
<211> 4065
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gattataagg atcatgatgg agattacaag gatcacgata ttgattataa ggatgatgat 60
gataagatgg ctcctaagaa gaagagaaag gttggcattc atggtgtgcc ggctgcctct 120
atctaccagg agttcgttaa taagtactct ttgtcaaaga ccctcaggtt tgagcttatt 180
cctcaaggca agactttgga aaacatcaag gccagaggtc ttattttgga tgatgagaag 240
agggctaagg attacaagaa ggccaagcag atcattgata agtaccacca attctttatc 300
gaggaaattc tttcttcagt gtgcatctca gaagatctcc ttcagaatta ctctgatgtc 360
tatttcaagt tgaagaagtc agatgatgat aacctccaga aggattttaa gtctgctaag 420
gatactatca agaagcaaat ttcagagtac atcaaggatt ctgaaaagtt taagaatttg 480
ttcaaccaga atctcattga tgccaagaag ggccaagagt cagatctcat cctttggttg 540
aagcaatcta aggataatgg tatcgaactt ttcaaggcta actcagatat cacagatatt 600
gatgaggcct tggaaatcat taagtctttt aagggctgga ctacatattt taagggtttc 660
catgagaaca gaaagaatgt ctactcttca aacgatattc ctacttctat catctacagg 720
atcgttgatg ataatttgcc aaagttcctc gagaacaagg ctaagtacga atctctcaag 780
gataaggctc cagaggccat taattacgaa cagatcaaga aggatcttgc cgaggaattg 840
acattcgata ttgattacaa gacctcagag gttaaccaga gagtgttttc tttggatgag 900
gtgttcgaaa tcgctaactt caacaattat ctcaaccaat caggcattac caagttcaat 960
actatcattg gtggcaagtt tgtcaacgga gagaatacaa agaggaaggg cattaacgaa 1020
tacatcaatt tgtactctca gcaaattaac gataagacac tcaagaagta caagatgtca 1080
gtgcttttca agcagatctt gtctgatacc gagtctaagt catttgtcat tgataagctc 1140
gaagatgatt cagatgttgt gaccactatg cagtcttttt acgagcaaat cgctgccttc 1200
aagacagttg aggaaaagtc aattaaggaa accctttctt tgctcttcga tgatttgaag 1260
gctcaaaagc tcgatctttc aaagatctat ttcaagaacg ataagtcact taccgatttg 1320
tctcagcaag tgtttgatga ttactctgtc attggtactg ctgttcttga gtatattaca 1380
cagcaaatcg ccccgaagaa ccttgataat ccttcaaaga aggagcagga attgatcgct 1440
aagaagactg agaaggccaa gtacttgtct ctcgaaacta tcaagctcgc tttggaggag 1500
ttcaacaagc atagagatat tgataagcaa tgcaggtttg aggaaatcct cgccaacttc 1560
gctgccatcc cgatgatttt tgatgagatc gctcagaaca aggataatct tgcccaaatc 1620
tcaattaagt atcagaacca aggaaagaag gatcttttgc aggcttctgc cgaagatgat 1680
gttaaggcta ttaaggatct ccttgatcag accaacaatt tgctccataa gctcaagatc 1740
ttccacattt ctcaatcaga ggataaggct aacatccttg ataaggatga acacttctac 1800
ttggttttcg aggaatgtta tttcgagctt gccaacattg tgccgttgta caacaagatc 1860
agaaactaca tcactcagaa gccttactca gatgagaagt ttaagctcaa cttcgaaaat 1920
tctacccttg ctaacggttg ggataagaat aaggagccag ataacactgc catcctcttc 1980
attaaggatg ataagtacta tcttggagtg atgaataaga agaacaataa gatcttcgat 2040
gataaggcta ttaaggagaa caagggcgaa ggttacaaga agatcgttta caagctcttg 2100
cctggagcta ataagatgtt gccaaaggtg ttcttttcag ccaagtctat taagttctac 2160
aacccatctg aggatatcct cagaattagg aatcattcaa cacacaccaa gaacggatct 2220
ccgcagaagg gctacgagaa gtttgagttc aacatcgagg attgcagaaa gtttattgat 2280
ttctataagc aatctatctc aaagcatcct gagtggaagg attttggctt cagattttca 2340
gatactcaga ggtacaactc tattgatgag ttctataggg aggttgaaaa tcaaggttac 2400
aagctcacat tcgagaacat ctctgaatca tacattgatt ctgtcgttaa ccagggaaag 2460
ctctaccttt tccaaatcta caacaaggat ttttcagctt actctaaggg cagaccaaat 2520
ctccacactc tttattggaa ggccctcttc gatgagagga atcttcagga tgtggtctac 2580
aagttgaacg gagaggctga actcttttat agaaagcaat caattccaaa gaagatcaca 2640
catccggcca aggaggctat cgccaacaag aataaggata atcctaagaa ggagtctgtg 2700
ttcgaatacg atcttattaa ggataagagg tttacagagg ataagttctt tttccactgt 2760
ccaatcacca ttaacttcaa gtcttcaggc gctaacaagt ttaatgatga gatcaatctc 2820
cttttgaagg aaaaggccaa cgatgttcat atcctctcta ttgatagagg agagaggcac 2880
ctcgcttact atacacttgt ggatggaaag ggcaatatca ttaagcagga tactttcaac 2940
atcattggca atgataggat gaagacaaac taccatgata agctcgctgc cattgaaaag 3000
gatagagatt cagccaggaa ggattggaag aagatcaaca atattaagga gatgaaggaa 3060
ggctacctct ctcaagttgt gcacgagatt gctaagctcg ttatcgaata taatgccatt 3120
gtcgttttcg aggatctcaa tttcggtttt aagagaggaa ggtttaaggt cgaaaagcag 3180
gtttaccaaa agctcgagaa gatgcttatc gaaaagttga actatctcgt ctttaaggat 3240
aacgagttcg ataagaccgg tggagttttg agggcttacc agctcacagc cccgtttgaa 3300
accttcaaga agatgggcaa gcaaactgga atcatctact atgtcccggc tggattcacc 3360
tctaagatct gccctgtgac tggctttgtc aatcagctct accctaagta tgagtctgtt 3420
tcaaagtctc aagaattttt ctcaaagttc gataagatct gttacaatct tgataagggt 3480
tacttcgagt tttctttcga ttacaagaac ttcggagata aggctgccaa gggaaagtgg 3540
actattgctt cattcggatc tagacttatc aacttcagaa actctgataa gaaccataac 3600
tgggatacca gagaggtcta tccaactaag gagttggaaa agctccttaa ggattactct 3660
atcgagtatg gtcacggaga atgcattaag gctgccatct gtggagagtc agataagaag 3720
tttttcgcta agttgacttc tgtgctcaat acaatccttc agatgagaaa ctcaaagact 3780
ggtacagaac ttgattactt gatttctccg gtggctgatg tcaacggaaa cttcttcgat 3840
tctaggcagg cccctaagaa tatgccacaa gatgctgatg ccaacggcgc ctaccacatc 3900
ggactcaagg gccttatgtt gctcggtagg attaagaaca atcaagaggg aaagaagttg 3960
aatctcgtga ttaagaacga ggaatatttt gagttcgtcc agaacagaaa caataagagg 4020
cctgctgcca caaagaaggc tggtcaagct aagaagaaga agtga 4065
<210> 23
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgcaaat ttctactgtt gtagatgagt gaaatctctt gtcttaagga 120
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 180
gattcccggc tggtgcaaat ttctactgtt gtagatccat gccaaacaag ccaggagaat 240
tttttttttt 250
<210> 24
<211> 115
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aatttctact gttgtagatg agtgaaatct cttgtcttaa ggaaatttct actgttgtag 60
atccatgcca aacaagccag gagaataatt tctactgttg tagatttttt ttttt 115
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
atccaggcga cgctgagcca 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tggcccaccg gggtataaaa 20
<210> 27
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ttgggcggcg atcgatcgat gcgc 24
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
atctgcagtg cggttgtgaa tgcg 24
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gaacccggtc gcctcaagga 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gaatgcgcag actcgtcagg 20
<210> 31
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
agacgaggga gatggtggcg ataa 24
<210> 32
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ctgtaccaga tcctgcgggg gctc 24
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
agatgtcgta gagcaggtac 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tctacatcgc cacggagctc a 21
<210> 35
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gagtgaaatc tcttgtctta agga 24
<210> 36
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccatgccaaa caagccagga gaat 24
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acaagccagg agaattcagc 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cactgcatgg ataactcatc 20
<210> 39
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
taggtctccg acgctgagcc agttttagag ctagaa 36
<210> 40
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atggtctcac gtcgcctgga ttgcaccagc cgggaa 36
<210> 41
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
taggtctcca ccggggtata aaagttttag agctagaa 38
<210> 42
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cgggtctcac ggtgggccat gcaccagccg gg 32
<210> 43
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
taggtctccg tcgcctcaag gagttttaga gctagaa 37
<210> 44
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cgggtctcac gaccgggttc tgcaccagcc ggg 33
<210> 45
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
taggtctccc agactcgtca gggttttaga gctagaa 37
<210> 46
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cgggtctcat ctgcgcattc tgcaccagcc ggg 33
<210> 47
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
taggtctcct agagcaggta cgttttagag ctagaa 36
<210> 48
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
atggtctcat ctacgacatc ttgcaccagc cgggaa 36
<210> 49
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
taggtctccc cacggagctc agttttagag ctagaa 36
<210> 50
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
atggtctcag tggcgatgta gatgcaccag ccgggaa 37
<210> 51
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
taggtctccc aggagaattc agcgttttag agctagaa 38
<210> 52
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
cgggtctcac ctggcttgtt gcaccagccg gg 32
<210> 53
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
taggtctcca tggataactc atcgttttag agctagaa 38
<210> 54
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
cgggtctcac catgcagtgt gcaccagccg gg 32
<210> 55
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
cgggtctcag gcaggatggg cagtctgggc aacaaagcac cagtgg 46
<210> 56
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
taggtctcca aacggatgag cgacagcaaa caaaaaaaaa agcaccgact cg 52
<210> 57
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
taggtctcca aacggatgag cgacagcaaa caaaaaaaaa atgcaccagc cggg 54
<210> 58
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
cgggtctcag gcaggatggg cagtctgggc a 31
<210> 59
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
taggtctcca aacggatgag cgacagcaaa c 31
<210> 60
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
gaccatgatt acgccaagct tacaaattcg ggtcaaggcg g 41
<210> 61
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
cgagacctcg gtctcctgcc gtccgaaatc gaatcg 36
<210> 62
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ggagaccgag gtctcggttt gctgtttgat ccgttg 36
<210> 63
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
cgagacctcg gtctcctgcc atattccaac agaacataca 40
<210> 64
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
caaacttgtt gataactatc tgcaagaaat aatcaccaaa c 41
<210> 65
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ttgaagcttg cttgggcagc 20
<210> 66
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
cctcgcgaag ttaatcaagc tcacactt 28
<210> 67
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ccaaagcttg gaagttatat tacgtctac 29
<210> 68
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
cctcgcgata acaatttact ctactata 28
<210> 69
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gccgcactcg agatattcaa ggtacgctgc ttctcct 37
<210> 70
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
tacaagaaag ctgggttaga atctgcaaga aataatcacc aaac 44
<210> 71
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
agctaagaag aagaagtgag aattcgcggc cgcac 35
<210> 72
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ctccatcatg atccttataa tccatggtta agtatttcct tag 43
<210> 73
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
tgtccccgac tatgcctaag aattcgcggc cgcactc 37
<210> 74
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tgctcatggt ggcggtaccc atggttaagt atttccttag ag 42
<210> 75
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
agtaccacct cggctatcca ca 22
<210> 76
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ggacctgcag gcatgcacgc gctaaaaacg gactagc 37
<210> 77
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
acttctagaa tctgcaagaa ataatcacca aac 33
<210> 78
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
tacgtgtgct gttactacct atctg 25
<210> 79
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
aatcctctcg cgtcctcaag 20
<210> 80
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ctcgtcgtcg aatcgaatcc tc 22
<210> 81
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
cccagcccac agagttggtg 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
gcacaccatg aatgccaacc 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
cagggatggc cttgaacctc 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
tttccatttg acgactggac 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tctggccaag ttagcatttc 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
tgatacgcgt cgatgagtgg 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
gtgatgaggc gcatctggtg 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
gcaaccaact aactctcccg 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
tgtgaacatc ccctcaggac 20
<210> 90
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
gttagggtcg gcacagcatc tcca 24
<210> 91
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
ctgcgcctaa aaatcgaggg tgggt 25
<210> 92
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
agggtagtga agagcaaacc g 21
<210> 93
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
tatgccagcc aatgagccaa 20
<210> 94
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
gccaccttcc ttcctcatcc g 21
<210> 95
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
gttgctcggc ttcaggtcgc 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ggtagaaatg ccatgcggga 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
attcagccga acctcaccac 20

Claims (11)

1.一种基于CRISPR系统CRISPR/Cas9的基因组编辑方法,包括以下步骤:
1)将1个或多个重复的tRNA-gRNA串联单元置于编码基因的内含子中获得inPTG内含子;
2)将获得的inPTG内含子与含Cas9核酸酶基因的外显子融合成一个inPTG-Cas9基因;
3)利用单个启动子来驱动inPTG-Cas9融合基因的表达,获得表达载体;
4)将含inPTG-Cas9融合基因表达元件的载体导入受体细胞进行转录表达,获得Cas9核酸酶和多个gRNA;
5)所述gRNA与Cas9核酸酶共同作用编辑受体细胞基因组序列。
2.根据权利要求1所述的基因组编辑方法,其特征在于,步骤3)中所述启动子为Pol II型启动子。
3.根据权利要求2所述的基因组编辑方法,其特征在于,所述Pol II型启动子为UBI10启动子、PR5启动子或PR1启动子。
4.根据权利要求1所述的基因组编辑方法,其特征在于,所述步骤4)中载体为pRGEB33载体,所述pRGEB33载体的内含子的序列如SEQ ID NO.7所示。
5.根据权利要求1所述的基因组编辑方法,其特征在于,所述步骤4)中载体为pRGEB34载体,所述pRGEB34载体的内含子的序列如SEQ ID NO.8所示。
6.根据权利要求4或5所述的基因组编辑方法,其特征在于,所述内含子中插入BsaI酶切位点用于PTG片段的克隆。
7.一种基于CRISPR系统CRISPR/Cpf1的基因组编辑方法,包括以下步骤:
1)将1个或多个重复的tRNA-crRNA串联单元置于编码基因的内含子中获得intron(PTC)内含子;
2)将获得的intron(PTC)内含子与含Cpf1核酸酶基因编码区的外显子融合形成一个intron(PTC)-Cpf1融合基因;
3)在所述intron(PTC)-Cpf1融合基因序列前添加启动子获得启动子-intron(PTC)-Cpf1融合基因序列;
4)将所述启动子-intron(PTC)-Cpf1融合基因置于载体中,导入受体细胞进行转录表达,获得Cpf1核酸酶和多个crRNA;
5)所述crRNA与Cpf1核酸酶共同作用编辑受体细胞基因组序列。
8.根据权利要求7所述的基因组编辑方法,其特征在于,所述转录表达外显子的Cpf1核酸酶的过程中,利用剪接复合体剪切所述intron(PTC)-Cpf1融合基因中的包含tRNA-crRNA的内含子,然后利用tRNA加工系统切割其中的tRNA元件,释放多个crRNA。
9.根据权利要求7所述的基因组编辑方法,其特征在于,步骤1)中所述多个tRNA-crRNA串联单元替换为多个crRNA串联单元。
10.根据权利要求9所述的基因组编辑方法,其特征在于,所述替换后利用表达的Cpf1蛋白切割crRNA串联单元,释放多个crRNA。
11.权利要求1~5、7~10任意一项所述的基因组编辑方法,其特征在于,所述编辑包括为基因敲除、靶向基因激活/抑制、单碱基替换。
CN201711194336.6A 2017-11-24 2017-11-24 一种基于crispr系统的基因组编辑方法及其应用 Active CN107937432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711194336.6A CN107937432B (zh) 2017-11-24 2017-11-24 一种基于crispr系统的基因组编辑方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711194336.6A CN107937432B (zh) 2017-11-24 2017-11-24 一种基于crispr系统的基因组编辑方法及其应用

Publications (2)

Publication Number Publication Date
CN107937432A CN107937432A (zh) 2018-04-20
CN107937432B true CN107937432B (zh) 2020-05-01

Family

ID=61948795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711194336.6A Active CN107937432B (zh) 2017-11-24 2017-11-24 一种基于crispr系统的基因组编辑方法及其应用

Country Status (1)

Country Link
CN (1) CN107937432B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN109652378B (zh) * 2018-12-29 2020-04-24 广州百暨基因科技有限公司 一种功能增强的通用型car-t细胞及其制备方法和用途
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
CN112442512A (zh) * 2019-08-30 2021-03-05 华中农业大学 基于tRNA-gRNA-cRNA进行日本青鳉胚胎和细胞的基因编辑系统
CN111518839B (zh) * 2020-05-07 2022-12-09 上海市第一妇婴保健院 一种等位特异性位点编辑方法
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CN111979258B (zh) * 2020-08-04 2022-04-19 华中农业大学 一种高通量的基因编辑方法
CN112359057B (zh) * 2020-10-23 2022-11-22 浙江大学 CRISPR/Cas12a基因编辑系统在84K杨树基因编辑中的应用
CN114672513B (zh) * 2022-04-12 2024-04-02 北京大学现代农业研究院 一种基因编辑系统及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015138855A1 (en) * 2014-03-14 2015-09-17 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
CN105255937A (zh) * 2015-08-14 2016-01-20 西北农林科技大学 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用
CN106318947A (zh) * 2016-10-17 2017-01-11 北京大北农科技集团股份有限公司 基因组编辑系统及其用途
CN107012164A (zh) * 2017-01-11 2017-08-04 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
CN107027313A (zh) * 2014-10-17 2017-08-08 宾州研究基金会 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015138855A1 (en) * 2014-03-14 2015-09-17 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
CN107027313A (zh) * 2014-10-17 2017-08-08 宾州研究基金会 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
CN105255937A (zh) * 2015-08-14 2016-01-20 西北农林科技大学 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用
CN106318947A (zh) * 2016-10-17 2017-01-11 北京大北农科技集团股份有限公司 基因组编辑系统及其用途
CN107012164A (zh) * 2017-01-11 2017-08-04 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system;Kabin Xie等;《PNAS》;20150317;第112卷(第11期);第3570-3575页 *
Discovery of rice essential genes by characterizing a CRISPR-edited mutation of closely related rice MAP kinase genes;Bastian Minkenberg等;《The Plant Journal》;20161016;第89卷;第636-648页 *
High-efficiency CRISPR/Cas9 multiplex gene editing using the glycine tRNA-processing system-based strategy in maize;Weiwei Qi等;《BMC Biotechnology》;20161231;第16卷(第58期);第1-8页 *
Optimizing multiplex CRISPR/Cas9-based genome editing for wheat;Wei Wang等;《bioRxiv》;20160502;第1-27页 *
Recent Advances in Genome Editing Using CRISPR/Cas9;Yuduan Ding等;《Frontiers in Plant Science》;20160524;第7卷;第1-12页 *
植物CRISPR基因组编辑技术的新进展;李红,谢卡斌;《生物工程学报》;20171025;第33卷(第10期);第1700-1711页 *

Also Published As

Publication number Publication date
CN107937432A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107937432B (zh) 一种基于crispr系统的基因组编辑方法及其应用
JP6960951B2 (ja) 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング
US11702667B2 (en) Methods and compositions for multiplex RNA guided genome editing and other RNA technologies
US20230049124A1 (en) Improved methods for modification of target nucleic acids
Ding et al. Engineering introns to express RNA guides for Cas9-and Cpf1-mediated multiplex genome editing
CN108513579B (zh) 新颖的rna导向性核酸酶及其用途
KR102127418B1 (ko) 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법
JP2021166513A (ja) 配列操作のためのCRISPR−Cas成分系、方法および組成物
CN115216459A (zh) 新型crispr相关转座酶及其用途
WO2015052231A2 (en) Multiplex editing system
CN111373041A (zh) 用于基因组编辑和调节转录的crispr/cas系统和方法
EP3676378A1 (en) Methods and compositions comprising crispr-cpf1 and paired guide crispr rnas for programmable genomic deletions
Zhong et al. Intron-based single transcript unit CRISPR systems for plant genome editing
US11104910B2 (en) Compositions and methods for regulating gene expression for targeted mutagenesis
CN114045303B (zh) 一套用于水稻的人工基因编辑系统
CN113811612A (zh) 用于通过基因沉默的有害生物防治的数个植物细胞中的dsRNA的产生
CN111902541A (zh) 增加细胞中感兴趣的核酸分子表达水平的方法
JP7452884B2 (ja) Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット
CN114891791B (zh) 特异性靶向犬Rosa26基因的sgRNA及其应用
Koltun et al. Expressão transiente de CRISPR em soja para triagem simplificada de gRNA na planta
Koltun et al. CRISPR-transient expression in soybean for simplified gRNA screening in planta
He et al. * National Key Laboratory of Crop Genetic Improvement and National Center of Plant Gene Research (Wuhan), Huazhong Agricultural University, Wuhan, China
Bi Gene editing of rice miRNA and argonaute genes
WO2024076688A2 (en) Synthetic genomic safe harbors and methods thereof
CN112997966A (zh) 一种基于CRISPR/Cas9技术敲入miRNA-125a的小鼠模型及构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant