CN106232803A - 用于定点基因组修饰的组合物和方法 - Google Patents

用于定点基因组修饰的组合物和方法 Download PDF

Info

Publication number
CN106232803A
CN106232803A CN201580016648.0A CN201580016648A CN106232803A CN 106232803 A CN106232803 A CN 106232803A CN 201580016648 A CN201580016648 A CN 201580016648A CN 106232803 A CN106232803 A CN 106232803A
Authority
CN
China
Prior art keywords
seq
promoter
sequence
snrna
recombinant dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580016648.0A
Other languages
English (en)
Inventor
B·布罗沃-托兰德
A·Y·库拉诺夫
R·库恩
R·J·劳伦斯
E·D·纳吉
L·赖默奎斯
V·维纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Co
Monsanto Technology LLC
Original Assignee
Monsanto Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Co filed Critical Monsanto Co
Publication of CN106232803A publication Critical patent/CN106232803A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells

Abstract

本公开提供新型玉米、番茄和大豆U6、U3、U2、U5和7SL snRNA启动子,所述启动子用于植物中的CRISPR/Cas介导的靶向基因修饰。本公开还提供使用U6、U3、U2、U5和7SL启动子驱动sgRNA多核苷酸的表达的方法,其于植物中的靶向基因修饰的CRISPR/Cas系统中发挥作用。本公开还提供将平末端DNA片段插入基因组切割位点的基因组修饰方法。

Description

用于定点基因组修饰的组合物和方法
相关申请的交叉引用
本专利申请要求提交于2014年2月27日的美国临时专利申请号61/945,700的优先权。
序列表的并入
序列表包含于名称为“MONS350WO_ST25.txt”的文件中,其大小为238千字节(在MS-Windows中计算),创建于2015年2月27日,该序列表据此以电子方式提交并且以引用方式并入本文。
技术领域
本公开涉及生物技术领域。更具体地讲,本公开提供将重组平末端双链DNA片段引入植物的基因组的方法,该方法通过将双链断裂和新型植物启动子(该启动子有益于例如用于CRISPR介导的基因组修饰的非蛋白质编码小RNA的表达)引入基因组来进行。
背景技术
位点特异性重组在许多广泛的生物技术相关领域中具有应用潜力。包含DNA结合域和DNA切割域的大范围核酸酶、锌指核酸酶(ZFN)和转录激活因子样效应因子核酸酶(TALEN)能够进行基因组修饰。虽然大范围核酸酶、ZFN和TALEN具有有效性和特异性,但这些技术需要通过被选为进行修饰的每个基因组位点的一个或多个元件的蛋白质工程生成。成簇规律间隔的短回文重复序列(CRISPR)应用的最新进展示出了与类似系统(大范围核酸酶、ZFN和TALEN)同样强大的基因组修饰方法,但具有快速工程化的优势。
成簇规律间隔的短回文重复序列(CRISPR)系统构成原核生物中靶向入侵噬菌体的核酸内切的后天免疫系统。该系统由蛋白质元件(Cas)以及使该蛋白值靶向特异性核酸内切基因座的向导RNA(gRNA)构成。该系统已成功工程化为靶向哺乳动物、斑马鱼、果蝇、线虫、细菌、酵母和植物基因组的特异性核酸内切基因座。
发明简述
在一个方面,本发明提供包含snRNA启动子(选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子)的重组DNA构建体;该启动子可操作地连接至编码单向导RNA(sgRNA)的序列,其中所述snRNA启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283;或其片段,其中该片段的长度为至少140bp。
在一个实施方案中,所述U6启动子的序列可包含SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201或SEQ ID NO:283中的任一者,或其片段,其中该片段的长度为至少140bp。在另一个实施方案中,所述U6启动子的序列可包含SEQ ID NO:7。在另一个实施方案中,所述U6启动子的序列可包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20。在又一个实施方案中,所述U3启动子的序列可包含SEQ ID NO:167-171或SEQ ID NO:178-182中的任一者,或其片段;其中该片段的长度为至少140bp。在又一个实施方案中,所述U2启动子的序列包含SEQID NO:183-187、SEQ ID NO:192-199或SEQ ID NO:247-275中的任一者,或其片段;其中该片段的长度为至少140bp。在另一个实施方案中,所述U5启动子的序列包含SEQ ID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中该片段的长度为至少140bp。在另一个实施方案中,所述7SL启动子的序列包含SEQ ID NO:172-177中的任一者,或其片段;其中该片段的长度为至少140bp。该重组DNA构建体还可包含转录终止序列。
该重组DNA构建体还可包含编码启动子的序列,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列。在重组DNA构建体的某些实施方案中,Cas核酸内切酶基因产物可另外可操作地连接至核定位序列(NLS)。另外,在所设想的重组DNA构建体的某些实施方案中,编码所述Cas核酸内切酶的序列可选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ ID NO:136。
本发明的另一个方面提供包含snRNA启动子(选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子)的重组DNA构建体;该启动子可操作地连接至表示非编码RNA的序列,其中所述snRNA启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283,或其片段,其中该片段的长度为至少140bp。在一些实施方案中,非编码RNA选自由以下组成的组:微RNA(miRNA)、miRNA前体、小干扰RNA(siRNA)、小RNA(长度为22-26nt)以及编码其的前体、异染色质siRNA(hc-siRNA)、Piwi相互作用RNA(piRNA)、发夹状双链RNA(发夹状dsRNA)、反式作用siRNA(ta-siRNA)和天然存在的反义siRNA(nat-siRNA)。
本发明的某些实施方案还包括此类重组DNA构建体,其中所述U3启动子的序列包含SEQ ID NO:167-171和SEQ ID NO:178-182中的任一者,或其片段;其中该片段的长度为至少140bp。在重组DNA构建体的另一个实施方案中,所述U2启动子的序列包含SEQ ID NO:183-187、SEQ ID NO:192-199或SEQ ID NO:247-275中的任一者,或其片段;其中该片段的长度为至少140bp。在重组DNA构建体的又一个实施方案中,所述U5启动子的序列包含SEQID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中该片段的长度为至少140bp。另外,本发明提供此类实施方案,其中所述U6启动子的序列可包含SEQ ID NO:1-20、SEQ ID NO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201或SEQ ID NO:283中的任一者,或其片段;其中该片段的长度为至少140bp。另一个实施方案包括此类重组DNA构建体,其中所述7SL启动子的序列包含SEQ ID NO:172-177中的任一者,或其片段;其中该片段的长度为至少140bp。
本发明的另一个方面提供包含上述重组DNA构建体的细胞。在某些实施方案中,该细胞是植物细胞。
本发明还提供将双链断裂引入细胞的基因组的方法,其包括将以下构建体引入所述细胞:a)至少一种根据权利要求1所述的重组DNA构建体;和b)第二重组DNA构建体,该第二重组DNA构建体包含编码启动子的序列,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列,该Cas核酸内切酶基因产物可操作地连接至核定位序列(NLS)。在此类方法的一个实施方案中,U6启动子的序列包含SEQ ID NO:7。在该方法的另一个实施方案中,U6启动子包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20。在该方法的又一个实施方案中,编码所述Cas核酸内切酶的序列选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ ID NO:136。
本发明还提供将双链断裂引入细胞的基因组的方法,其包括将至少一种重组DNA构建体引入该所述细胞,该构建体包括包含snRNA启动子的重组DNA构建体,该snRNA启动子选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;该snRNA启动子可操作地连接至编码单向导RNA(sgRNA)的序列,其中该所述snRNA启动子的序列包含SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283;或其片段,其中该片段的长度为至少140bp,并且还包含编码启动子的序列,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列。
在该方法的某些实施方案中,所述U6启动子的序列包含SEQ ID NO:7。在其它实施方案中,U6启动子包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19和SEQ ID NO:20。在该方法的一些实施方案中,编码Cas核酸内切酶的序列选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ ID NO:136。
本发明的另一个方面提供基因组修饰的方法,其包括:a)将双链断裂引入植物细胞的基因组中的选择位点,以及b)将重组平末端双链DNA片段引入所述植物细胞,其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。该方法可包括基因组修饰,诸如生成修饰连锁障碍、连接两个或更多个QTL、破坏两个或更多个QTL的连锁、基因插入、基因置换、基因转换、基因缺失或断裂、转基因事件选择、转基因性状供体选择、转基因置换或至少一种所关注的核酸的靶向插入。在该方法的一些实施方案中,双链断裂通过核酸内切酶引入。在某些实施方案中,核酸内切酶可选自由以下组成的组:TALEN核酸内切酶;CRISPR核酸内切酶;包含″LAGLIDADG”、“GIY-YIG”、“His-Cys框”或HNH序列基序的大范围核酸酶;以及锌指核酸酶。在特定实施方案中,核酸内切酶是TALEN核酸内切酶,并且将TALEN表达构建体引入植物细胞,其中将约0.1pmol的每个TALEN表达构建体引入植物细胞。
另外,在该方法中,植物细胞可以是原生质体,或可以已经、或正在植物细胞培养物中生长。在该方法的某些实施方案中,植物细胞选自由以下组成的组:大豆植物细胞;玉米植物细胞;稻米植物细胞;小麦植物细胞;草坪植物细胞;棉花植物细胞;和芥花籽(canola)植物细胞。在该方法的其它实施方案中,重组平末端双链DNA片段不包含与基因组中的选择位点同源的区域。
设想了此类方法的实施方案,其中将约0.03至约0.3fmol的重组平末端双链DNA片段引入所述植物细胞。在特定实施方案中,将约0.15fmol的重组平末端双链DNA片段引入所述植物细胞。另外,平末端双链DNA片段可包含在5’末端或3’末端或5’和3’末端二者上,与包含基因组中的所述双链断裂的一个或两个末端的序列微同源的区域。一些实施方案包括此类方法,其中该微同源区域选自:长度为1bp、2bp、3bp、4,bp、5bp、6bp、7bp、8bp、9bp或10bp的序列。在该方法的具体实施方案中,微同源区域的长度为3bp。
该方法可包括在上述步骤a)中通过为所述细胞提供核酸内切酶来引入双链断裂,该核酸内切酶设计为靶向所述细胞的基因组中的选择靶标位点。另外,该核酸内切酶可由编码该核酸内切酶的至少一种重组DNA构建体提供。在一个实施方案中,该核酸内切酶通过将编码该核酸内切酶的mRNA或该核酸内切酶递送至植物细胞来提供。在特定实施方案中,该核酸内切酶选自由以下组成的组:TALEN核酸内切酶;锌指核酸内切酶;大范围核酸酶;和CRISPR核酸内切酶。另外的实施方案可包括在步骤a)中通过为所述细胞提供编码启动子的重组DNA构建体,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;和包含U6、U3、U2、U5或7SL启动子的重组DNA构建体,该U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,该单向导RNA设计为靶向所述细胞的染色体中的选择靶标位点,来引入双链断裂。在特定实施方案中,Cas核酸内切酶基因产物可另外可操作地连接至至少一个核定位序列(NLS)。
在该方法的某些实施方案中,所述U6、U3、U2、U5或7SL启动子的序列可包含SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283,或其片段;其中该片段的长度为至少140bp并且包含转录终止序列。在特定实施方案中,U6启动子可包含选自由以下组成的组的序列:SEQ ID NO:1-20、SEQ ID NO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201和SEQ ID NO:283,或其片段;其中该片段的长度为至少140bp,包含转录终止序列。在替代实施方案中,U6启动子可包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20。在另外的实施方案中,所述U3启动子的序列可包含SEQ ID NO:167-171或SEQ ID NO:178-182中的任一者,或其片段;其中该片段的长度为至少140bp。在又一个实施方案中,所述U5启动子的序列包含SEQID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中该片段的长度为至少140bp。另外,所述U2启动子的序列可包含SEQ ID NO:183-187、SEQ ID NO:192-199或SEQID NO:247-275中的任一者,或其片段;其中该片段的长度为至少140bp。在又一个实施方案中,所述7SL启动子的序列包含SEQ ID NO:172-177中的任一者,或其片段,其中该片段的长度为至少140bp。
还设想了实施方案,其中重组DNA构建体编码启动子,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;并且重组DNA构建体包含U6、U3、U2、U5或7SL启动子,该U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,该单向导RNA设计为靶向所述细胞的染色体中的选择靶标位点,在相同的构建体上。该方法的其它实施方案可包括使用在至少两个构建体上的编码启动子的重组DNA构建体,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;和包含U6、U3、U2、U5或7SL启动子的重组DNA构建体,该U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,该单向导RNA设计为靶向所述细胞的染色体中的选择靶标位点。
本发明的另一个方面包括包含平末端双链DNA片段的靶向重组定点整合的植物细胞。还提供包含平末端双链DNA片段的靶向重组定点整合的植物、植物部分或植物种子。
本发明的又一个方面包括:基因组修饰的方法,其包括:a)通过将双链断裂引入细胞的基因组来将双链断裂引入植物细胞的基因组,包括将以下构建体引入所述细胞:a)至少一种根据权利要求1所述的重组DNA构建体;和b)第二重组DNA构建体,该第二重组DNA构建体包含编码启动子的序列,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列,该Cas核酸内切酶基因产物可操作地连接至核定位序列(NLS);以及b)将重组平末端双链DNA片段引入所述植物细胞,其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。
本发明的另一个方面包括基因组修饰的方法,其包括:a)将双链断裂引入上述植物细胞的基因组,以及b)将重组平末端双链DNA片段引入所述植物细胞,其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。
本发明的又一个方面包括包含至少第一表达盒的重组DNA构建体,该第一表达盒包含U6、U3、U2、U5或7SL启动子,该U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,其中所述启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283中的任一者,或其片段;其中该片段的长度为至少140bp。在某些实施方案中,重组DNA构建体还包含至少第二表达盒,其中编码第一sgRNA的序列不同于编码第二sgRNA的序列。该重组DNA构建体还可包括此类构建体,其中可操作地连接至编码第一sgRNA的序列的启动子不同于可操作地连接至编码第二sgRNA的序列的启动子。在某些实施方案中,该构建体包含侧面左和右同源臂(HA),该同源臂中的每个的长度为约200-1200bp。在特定实施方案中,同源臂的长度为约230至约1003bp。
本发明的另一个方面提供通过检测整合DNA片段来对核酸酶活性进行定量的方法,该方法通过使用数字PCR或定量PCR确定同源重组(HR)介导的靶向整合率来进行。
本发明的又一个方面包括重组DNA构建体,其包含:a)第一snRNA启动子,其选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;该第一snRNA启动子可操作地连接至编码非编码RNA的序列,和b)第二snRNA启动子,其选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;该第二snRNA启动子可操作地连接至编码非编码RNA的序列,其中第一snRNA启动子和第二snRNA启动子是不同的。在某些实施方案中,编码第一snRNA启动子的序列和编码第二snRNA启动子的序列各自包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283,或其片段;其中该片段的长度为至少140bp。另外,在某些实施方案中,还提供其中第一和第二snRNA启动子是U6启动子,并且编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ IDNO:1-8、SEQ ID NO:17-20和SEQ ID NO:200-201的重组DNA构建体。
因此,还提供其中第一和第二snRNA启动子是U6启动子,并且编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:12-16、SEQ ID NO:160-166和SEQ ID NO:283的重组DNA构建体。或者,提供其中第一和第二snRNA启动子是U6启动子,并且编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:9-11和SEQID NO:146-149的重组DNA构建体。
还设想了其中第一和第二snRNA启动子是U2启动子,并且编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:183-187和SEQ ID NO:192-199的重组DNA构建体。另外,本发明的某些实施方案包括其中第一和第二snRNA启动子是U2启动子,并且编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:247-275的重组DNA构建体。
又一个实施方案包括其中第一和第二snRNA启动子是U3启动子,并且编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:178-182的重组DNA构建体组成的组。本发明的又一个实施方案包括其中第一和第二snRNA启动子是U3启动子,并且编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:167-171的重组DNA构建体组成的组。
或者,该重组DNA构建体可包含第一和第二snRNA启动子,所述第一和第二snRNA启动子是U5启动子,并且其中编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:188-191组成的组。或者,提供其中第一和第二snRNA启动子是U5启动子,并且编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:276-282的重组DNA构建体组成的组。
本发明的某些实施方案提供其中第一和第二snRNA启动子是7SL启动子,并且编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:175-177的重组DNA构建体组成的组。在其它实施方案中,其中第一和第二snRNA启动子是7SL启动子,并且编码第一和第二snRNA启动子的序列各自选自由SEQ ID NO:172-174的重组DNA构建体组成的组。
还设想了实施方案,其中重组DNA构建体包含第一snRNA启动子(该第一snRNA启动子是U6启动子),还存在第二snRNA启动子,并且选自由以下组成的组:U3启动子、U2启动子、U5启动子和7SL启动子。其它实施方案包括其中第一snRNA启动子是U3启动子,并且第二snRNA启动子选自由以下组成的组:U6启动子、U2启动子、U5启动子和7SL启动子的重组DNA构建体。或者,在重组DNA构建体中,第一snRNA启动子是U2启动子,并且第二snRNA启动子可选自由以下组成的组:U6启动子、U3启动子、U5启动子和7SL启动子;或第一snRNA启动子是U5启动子,并且第二snRNA启动子选自由以下组成的组:U6启动子、U2启动子、U3启动子和7SL启动子。另外,重组DNA构建体可包含第一snRNA启动子和第二snRNA启动子,该第一snRNA启动子是7SL启动子,并且该第二snRNA启动子可选自由以下组成的组:U6启动子、U2启动子、U3启动子和U5启动子。
本发明的其它设想实施方案包括上述重组DNA构建体,其中编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:1-8、SEQ ID NO:17-20、SEQ ID NO:200-201、SEQ ID NO:183-187、SEQ ID NO:192-199、SEQ ID NO:178-182、SEQ ID NO:188-191和SEQ ID NO:175-177。在重组DNA构建体的某些实施方案中,编码第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:12-16、SEQ ID NO:160-166、SEQ ID NO:283、SEQ ID NO:247-275、SEQ ID NO:167-171、SEQ ID NO:276-282和SEQ ID NO:172-174。
重组DNA构建体还可包含表示一个或多个另外的snRNA启动子的序列,该snRNA启动子选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;该snRNA启动子可操作地连接至编码非编码RNA的序列,其中第一snRNA启动子、第二snRNA启动子和一个或多个另外的snRNA启动子中的每个是不同的。在重组DNA构建体的特定实施方案中,表示所述一个或多个另外的snRNA启动子的序列选自由以下组成的组:SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ IDNO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283;或其片段,其中该片段的长度为至少140bp。另外,该重组DNA构建体可包含3个、4个、5个、6个、7个、8个、9个或10个snRNA启动子。
在重组DNA构建体的一些实施方案中,非编码RNA是靶向植物细胞的染色体中的不同选择靶标位点的sgRNA。该重组DNA构建体还可包含编码启动子的序列,该启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列。
本发明的又一个方面提供基因组修饰的方法,其包括:a)通过为所述细胞提供成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶和重组DNA构建体来将双链断裂引入植物细胞的基因组中的两个或更多个选择位点,其中该非编码RNA是靶向植物细胞的染色体中的不同选择靶标位点的sgRNA,以及b)将一个或多个外源性双链DNA片段引入所述植物细胞;其中所述外源性双链DNA片段通过内源性DNA修复并入所述双链断裂。在一些实施方案中,所述一个或多个外源性双链DNA片段是平末端的。在该方法的某些实施方案中,所述一个或多个外源性双链DNA片段包含与基因组中的选择位点同源的区域。在其它实施方案中,外源性双链DNA片段包含与基因组中的不同选择位点同源的区域。
附图说明
以下附图形成本说明书的一部分,且并入以进一步展示本公开的某些方面。通过结合本文提供的特定实施方案的具体实施方式参考一个或多个这些附图可更好地理解本公开。
图1:四个天然玉米U6小核RNA(snRNA)基因的核苷酸序列比对,包括其染色体1、2、3和8的推定启动子。(A)和(B)共有序列、保守性百分比和序列标识(所示核苷酸的大小与序列保守性直接成比例)在比对下方提供。(B)实心箭头表示转录起始位点;转录起始位点的上游是“TATA框”、上游序列元件(USE)和单子叶植物特异性启动子(MSP)元件,它们各自以粗实线框标记;3’末端的七个胸腺嘧啶碱基链(多聚-T)是转录终止信号。图1.A和图1.B中的序列对应如下:ZmU6_Ch1以SEQ ID NO:98表示;ZmU6_Ch2以SEQ ID NO:99表示;ZmU6_Ch3以SEQ ID NO:100表示;ZmU6_Ch8以SEQ ID NO:101表示。
图2:示出了修饰GUS(β-葡糖醛酸酶)报告基因,该基因具有编码序列(GUUS)的直接重复,该编码序列被CRISPR切割的靶标位点(TS)切断。
图3:在GUUS报告基因构建体与CRISPR构建体一起共轰击后检测玉米愈伤组织中的GUS活性,该CRISPR构建体设计为将双链断裂(DSB)引入Zm7基因组靶标位点。
图4:在GUUS报告基因构建体与CRISPR构建体一起共轰击后检测玉米愈伤组织中的GUS活性,该CRISPR构建体设计为将DSB引入Zm231基因组靶标位点。不同基因组靶标和单向导RNA(sgRNA)间隔序列Zml4用作阴性对照。还示出了代表性愈伤组织的荧光显微图像,该愈伤组织与具有GUUS报告基因构建体的绿色荧光蛋白(GFP)表达载体、Cas9表达载体和包含各种sgRNA盒的载体一起共轰击。
图5:示出了(A)寡核苷酸整合分析;(B)用于插入玉米基因组靶标位点的无微同源的平末端寡核苷酸;(C)用于插入玉米基因组靶标位点的含微同源末端的平末端寡核苷酸;(D)在寡核苷酸整合分析的测试(上部插图)和阴性对照样品(底部插图)中,跨越寡核苷酸-染色体接头的PCR扩增子的片段分析谱(其中箭头表示预期峰值);以及(E)Zm_L70c玉米基因组靶标位点处的寡核苷酸-染色体接头的DNA序列,确认全长(整合1;SEQ ID NO:103)和截短的寡核苷酸(整合2;SEQ ID NO:104)的整合,预期序列以SEQ ID NO:102表示。
图6:示出了sgRNA(包括与天然玉米基因组靶标位点互补的间隔序列和人工环(5’-CCAAAAGG-3’,SEQ ID NO:105))及其预测二级结构,其设计用于嗜热链球菌(Streptococcus thermophilus)Cas9介导的靶向。
图7:示出了(A)通过多重CRISPR活性移除选择性标记基因,然后靶向整合所关注的基因(GOI);以及(B)评估多个QTL候选基因的基因连锁的CRISPR/Cas多重系统。因为优势可能性(LOD)是基因连锁的统计学量度;所以LOD为3意指间隔中存在QTL比不存在QTL的可能性高1000x。
图8.示出使用CRISPR构建体(靶向玉米中的天然染色体靶标(Zm7))转化玉米原生质体后24和48小时检测的靶向整合率百分比(Y-轴),以及加入转染混合物的平末端双链DNA片段的滴定(pmol)(X-轴)的数据的图示。不加入Cas9表达构建体运行阴性对照。
图9.整合率(Y-轴)随加入玉米原生质体的转染混合物的SpCas9表达构建体的量(单位pmol)(X-轴)的变化的图示。
图10.平末端双链DNA片段靶向整合进玉米原生质体(用CRISPR/Cas9和sgRNA表达构建体转化)的染色体的序列确认。对于所有插图10A、B、C,顶部序列是实验中包括的靶标位点和平末端双链DNA片段(加下划线的序列)的一个接头的预期序列。10A.CRISPR/Cas9构建体靶向的玉米染色体位点Zm7,并且具有由SEQ ID NO:115和SEQ ID NO:116表示的退火DNA片段形成的平末端双链DNA片段。10B.CRISPR/Cas9构建体靶向的玉米染色体位点L70c,并且具有由SEQ ID NO:45和SEQ ID NO:46表示的退火DNA片段形成的无微同源序列的平末端双链DNA片段。10C.CRISPR/Cas9构建体靶向的玉米染色体位点L70c,并且在DNA片段的每个末端具有由SEQ ID NO:121和SEQ ID NO:122表示的退火DNA片段形成的含3bp微同源序列的平末端双链DNA片段。
图11.整合率(Y-轴)随加入玉米原生质体的转染混合物的靶向玉米染色体位点L70.4的TALEN表达构建体的量(单位pmol)(X-轴)的变化的图示。
图12.NHEJ和HR介导的靶向整合和高通量筛选的PCR引物位置的示意图。通过非同源性末端接合(NHEJ)进行的DNA片段的靶向整合如图12A所示,通过同源重组(HR)进行的DNA片段的靶向整合如图12B所示。
图13.用于同源性整合的构建体的示意图。平末端DNA箭头表示对应于用于NHEJ分析的90bp平末端双链DNA片段的90bp序列,LHA是指左同源臂,RHA是指右同源臂,Zm7是指CRISPR/Cas9+sgRNA靶向的靶标位点Zm7。每个同源臂的长度以bp表示。A.靶向具有长度分别为240和230bp的LHA和RHA的玉米染色体位点Zm7的HR盒构建体的示意图。B.靶向具有长度分别为240和1003bp的LHA和RHA的玉米染色体位点Zm7的HR盒构建体的示意图。
图14.用于同源性整合的构建体的示意图。在图中,平末端DNA箭头表示对应于用于NHEJ分析的90bp平末端双链DNA片段的90bp序列,LHA是指左同源臂,RHA是指右同源臂,L70.4是指TALEN对靶向的玉米染色体中的靶标位点L70.4。每个同源臂的长度以bp表示。A.靶向具有长度均为230bp的LHA和RHA的玉米染色体位点L70.4的HR盒构建体的示意图。B.靶向具有长度分别为1027bp和230bp的LHA和RHA的玉米染色体位点L70.4的HR盒构建体的示意图。
图15. 15A.示出使用StCas9CRISPR构建体(靶向天然玉米染色体靶标位点L70e、L70f和L70g)转化玉米原生质体的靶向整合率百分比的数据的图示。对照缺乏转染混合物中的StCas9表达盒构建体。15B.在L70f靶标位点预期整合平末端双链DNA片段(SEQ ID NO:144)和靶标位点整合DNA片段序列的插入缺失的一个实例(SEQ ID NO:145)的序列比对。
图16. 16A.使用具有玉米染色体8U6启动子或在CRISPR/Cas9系统中驱动sgRNA表达的三个单独的嵌合U6启动子之一的构建体靶向三个不同的玉米染色体靶标位点的染色体整合率。靶向整合使用MGB TaqMan探针通过ddPCR分析测定。16B.使用具有玉米染色体8U6启动子或在CRISPR/Cas9系统中驱动sgRNA表达的三个单独的嵌合U6启动子之一的构建体靶向三个不同的玉米染色体靶标位点的染色体整合率。靶向整合使用插入染料通过ddPCR分析测定。
图17. 17A.检测通过NHEJ进行的番茄转化酶抑制剂靶标位点2(TS2)的CRISPR/Cas9诱导的突变,导致限制性核酸内切酶位点SmlI的突变的PCR筛选策略示意图。17B.在琼脂糖凝胶上运行的PCR扩增子的照片,示出了未消化的扩增子和SmlI消化的扩增子,以检测番茄转化酶抑制剂靶标位点2的CRISPR/Cas9诱导的突变。17C.通过NHEJ进行的番茄转化酶抑制剂靶标位点2的CRISPR/Cas9诱导的突变的PCR扩增子序列的多序列比对。
图18. 18A.示出通过具有U6、U3和7SL启动子的重组表达构建体分析大豆子叶原生质体的归一化GUS mRNA水平数据的图示。18B.示出通过具有U6、U3、7SL、U2或U5启动子的重组表达构建体分析玉米叶原生质体的归一化GUS mRNA水平数据的图示。
图19.通过重组表达构建体分析玉米叶原生质体的归一化GUS表达水平数据的图示,该重组表达构建体编码1)GUS表达构建体、2)死亡Cas9-TALE-AD表达构建体和3)具有7SL、U6、U3、U2或U5启动子的重组sgRNA表达构建体。
发明详述
本公开提供玉米(Zea mays)和其它植物的新型启动子及其使用方法,包括使用一个或多个基因的转基因表达进行的植物基因组的靶向基因修饰,涉及存在于多个细菌中的成簇规律间隔的短回文重复序列(CRISPR)系统。例如,在一个实施方案中,本公开提供编码至少一个表达盒的DNA构建体,该表达盒包括本文公开的U6启动子和编码单向导RNA(sgRNA)的序列。还提供了引发CRISPR系统修饰靶标基因组的方法,正如使用此类系统修饰植物的基因组互补序列。因此本公开提供允许在植物内插入、移除或修饰基因、基因座、连锁障碍和染色体的工具和方法。还公开了U3、U2、U5和7SL启动子及其使用方法,包括植物基因组的靶向基因修饰。
在另一个实施方案中,本公开提供编码至少一个表达盒的DNA构建体,该表达盒包括本文公开的启动子和编码非蛋白质编码小RNA(npcRNA)的序列。这些构建体用于靶向npcRNA分子的核表达。
CRISPR系统构成原核生物的后天免疫系统,该系统靶向入侵噬菌体的DNA和RNA的核酸内切(如Westra等,Annu Rev Genet,46:311-39,2012所评述)。有三种已知类型的CRISPR系统,I型、II型和III型。CRISPR系统依赖于用于序列特异性检测的小RNA和靶向要破坏的外源核酸。细菌CRISPR系统的元件是CRISPR相关的(Cas)基因以及由基因组靶向序列(前间隔序列)间隔短回文重复序列构成的一个或多个CRISPR阵列。前间隔序列/重复序列元件转录为前体CRISPR RNA(pre-crRNA)分子,然后酶切,该酶切由反式作用CRISPR RNA(tracrRNA)分子和pre-crRNA回文重复序列之间的杂交引发。所得的crRNA:tracrRNA分子由一个拷贝的间隔序列和一个重复序列、具有Cas核酸酶的复合物组成。然后CRISPR/Cas复合物涉及与crRNA间隔序列互补的DNA序列(前间隔序列),而该RNA-Cas蛋白复合物通过两条链的酶切(双链断裂;DSB)使靶标DNA沉默。
天然细菌II型CRISPR系统需要用于外源性DNA的靶向切割的四个分子元件:Cas核酸内切酶(如,Cas9)、管家RNaseIII、CRISPR RNA(crRNA)和反式作用CRISPR RNA(tracrRNA)。后两个元件形成dsRNA复合物,并结合Cas9,得到RNA引导的DNA核酸内切酶复合物。对于真核生物中的靶向基因组修饰,该系统简化为两个元件:Cas9核酸内切酶和嵌合crRNA-tracrRNA,称为向导RNA(gRNA)或者单向导RNA(sgRNA)。实验最初在真核系统中进行,确定RNaseIII元件不是实现靶向DNA切割必须的。Cas9最小双元件系统具有唯一的元件sgRNA,使该靶向基因组修饰的CRISPR系统更具性价比,并且比其它的靶向平台(诸如,大范围核酸酶、锌指核酸酶或TALE-核酸酶(需要蛋白质工程对每个靶向DNA位点进行修饰))更具灵活性。另外,sgRNA易于设计和生成为CRISPR系统提供了多个靶向基因组修饰应用优势。例如,为一个或多个基因组靶标位点设计的CRISPR/Cas复合物元件(Cas核酸内切酶、sgRNA以及任选地用于整合进基因组的外源性DNA)可在一次转化中多重化,或CRISPR/Cas复合物元件的引入可以是空间上和/或时间上分离的。
sgRNA的表达策略
在某些实施方案中,本公开提供启动子和编码sgRNA的序列的新型组合,以允许将双链DNA切割事件特异性引入内源性DNA(即,基因组)。在一个实施方案中,玉米的U6启动子可操作地连接至sgRNA编码基因,以便组成型表达转化细胞中的sgRNA。例如,当所得的sgRNA转录物保留在细胞核中,并且因此最佳地定位于细胞内,以引导细胞核加工时,这可为所期望的。例如,当CRISPR的活性较低或查找和切割靶标位点的频率较低时,这也可为所期望的。当对于所关注的给定物种,特定细胞类型诸如生殖细胞的启动子未知时,也可为所期望的。在另一个实施方案中,U3、U2、U5或7SL启动子可操作地连接至sgRNA编码基因,以用于转化细胞中的sgRNA表达。
在另一个实施方案中,可使用包含本文提供的任何U6启动子的全部或一部分的嵌合启动子表达sgRNA。或者,可利用包含任何这些启动子的全部或一部分的U3、U2、U5或7SL嵌合启动子。例如,可操作地连接至玉米染色体8的U6启动子的3’部分(SEQ ID NO:7)(包括USE元件和TATA框(SEQ ID NO:17))、sgRNA的克隆上游序列的玉米染色体1的U6启动子的5’部分(SEQ ID NO:1)(包括一个MSP元件),可用于在不同的环境条件下诱导CRISPR介导的切割。
具有不同序列的多个U6启动子可用于使载体稳定性问题最小化,这通常与序列重复相关。另外,染色体中的高度重复区域可导致遗传不稳定性和沉默。因此,靶向基因修饰的CRISPR/Cas系统中的多个U6(或其它公开的)启动子的使用可促进相同转化构建体中多个sgRNA盒的载体叠堆,其中可优化不同的sgRNA转录物水平,以便有效靶向单个靶标位点。嵌合U6启动子可产生具有改善或者修饰表达水平的新型功能形式,并且设计了四个代表性嵌合玉米U6启动子(SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20)。
所公开的U6启动子也可驱动其它非蛋白质编码RNA(npcRNA)的表达。非蛋白质编码小RNA的非限制性实例包括微RNA(miRNA)、miRNA前体、小干扰RNA(siRNA)、小RNA(长度为22-26nt)以及编码其的前体、异染色质siRNA(hc-siRNA)、Piwi相互作用RNA(piRNA)、发夹状双链RNA(发夹状dsRNA)、反式作用siRNA(ta-siRNA)和天然存在的反义siRNA(nat-siRNA)。
还可鉴定另外的小核RNA(snRNA)基因的启动子和转录元件(类似于U6启动子,并且可被RNA聚合酶II或RNA聚合酶III转录),诸如U3、U2、U5和7SL启动子。这些替代启动子可用于盒设计,尤其是在这些另外的元件可促进CRISPR系统转录物的细胞核保持的情况下。可用于CRISPR盒设计的另外的基因转录元件包括内含子嵌入元件和植物特异性RNA聚合酶IV和V启动子的转录元件。
Cas相关基因的表达策略
本公开通过提供例如sgRNA(包括用于通过至少一个Cas蛋白靶向核酸内切酶切割的基因组靶标位点内的前间隔序列的间隔序列,其中该基因组靶标位点是天然的或转基因的)的转录,从而提供用于序列特异性或序列引导的CRISPR介导的切割的新型启动子,以进行分子育种。此外,可定制CRISPR系统,以催化一个或多个基因组靶标位点处的切割。在某些实施方案中,此类定制CRISPR系统可具有使其受到遗传修饰的性质,使得可操作该系统的Cas核酸内切酶蛋白识别、结合和/或催化活性。
本公开的一个方面是将包含编码U6玉米启动子或其它公开的启动子诸如U3、U2、U5或7SL启动子的一个或多个盒的表达载体引入植物细胞,该启动子可操作地连接至sgRNA(包括与基因组靶标位点内的前间隔序列互补的一个拷贝的间隔序列),和编码Cas相关的基因的表达载体,以修饰植物细胞,这样植物细胞或由此类细胞构成的植物将随后表现出有益性状。在一个非限制性实例中,该性状是诸如提高产率、对生物或非生物胁迫的耐受性、除草剂耐性或其它农学性能改善的性状。生成此类由其衍生的植物细胞的能力取决于使用本文所述的转化载体盒引入CRISPR系统。
编码Cas相关的基因的表达载体可包含启动子。在某些实施方案中,该启动子是组成型启动子、组织特异性启动子、发育调控的启动子或细胞周期调控的启动子。某些设想的启动子包括仅在生殖细胞或繁殖细胞等等中表达的启动子。此类发育调控的启动子具有将CRISPR系统限制为仅在其中DNA遗传到后续世代的那些细胞中表达的优点。因此,CRISPR介导的遗传修饰(即,染色体或游离体dsDNA切割)仅限于涉及将其基因组从一代传输到下一代的细胞。如果CRISPR系统的广泛表达具有基因毒性或具有其它不期望的效果,这可为有用的。此类启动子的实例包括编码DNA连接酶、重组酶、复制酶等等的基因的启动子。
核酸内切酶是切割多核苷酸链内的磷酸二酯键的酶。仅切割特定核苷酸序列的核酸内切酶的实例是本领域熟知的,并且可包括例如限制性核酸内切酶。然而,靶向基因组工程作为经典的植物育种的替代形式的要求需要高度可定制的基因组编辑工具。CRISPR相关的II型原核后天免疫系统提供了此类替代形式。因此,本文提供的DNA构建体可识别靶标宿主基因组内所关注的特定核苷酸序列,并且允许该位点的突变或整合。在具体实施方案中,DNA构建体包含一个或多个玉米U6启动子,或其表达高水平的编码sgRNA的序列的嵌合体。表达靶向Cas相关的基因产物(该基因产物对特定基因组序列具有核酸内切酶活性,使得特定基因组序列被切割并生成双链断裂,该双链断裂由双链断裂修复途径修复,该途径可包括例如非同源性末端接合、同源重组、合成依赖性链退火(SDSA)、单链退火(SSA)或其组合,从而使天然基因座断裂)的sgRNA的DNA构建体可为特别有用的。
在一个实施方案中,CRISPR系统包含至少一个编码CRISPR核酸内切酶的Cas相关基因,和一个包含一个拷贝的与内源性基因组靶标位点内的前间隔序列互补的间隔序列的sgRNA。
在特定实施方案中,Cas相关基因可包括任何II型CRISPR系统核酸内切酶。此类Cas相关基因产物可具有使其受到遗传修饰的性质,使得可操作其核酸酶活性及其对crRNA、tracrRNA和/或sgRNA的识别和结合。
本公开还提供CRISPR介导的双链DNA切割的用途,从而以组织或细胞类型特异性方式遗传改变所关注的基因或基因产物的表达和/或活性,以改善产率或提供另一个有利的性状,其中所关注的核酸在自然界中可以是内源性的或转基因的。因此,在一个实施方案中,CRISPR系统被工程化为介导所关注的基因特定位点处的断裂。所关注的基因包括改变表达水平/蛋白质活性为所期望的那些基因。这些DNA切割事件可在基因内的编码序列或调控元件中。
本公开提供将II型CRISPR系统引入细胞。示例性II型Cas相关的基因包括编码具有核酸酶活性的多肽,诸如酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌或慢生根瘤菌属(Bradyrhizobium sp.)的Cas9的天然的和工程化的(即,修饰的,包括密码子优化的)核苷酸序列。
催化活性CRISPR相关基因(如,Cas9核酸内切酶)可引入靶标细胞或由靶标细胞产生。如本文所公开,可使用各种方法实施。
CRISPR的瞬时表达
在一些实施方案中,将sgRNA和/或Cas相关基因瞬时引入细胞。在某些实施方案中,提供足量的所引入的sgRNA和/或Cas相关基因,以修饰细胞,但在所设想的时期过后或在一个或多个细胞分裂后不再持续。在此类实施方案,不需要另外的步骤来从修饰的细胞移除或分离sgRNA和/或Cas相关基因。在本公开的又一个实施方案中,还将双链DNA片段以及sgRNA和/或Cas相关基因瞬时引入细胞。在此类实施方案中,提供足量的所引入的双链DNA片段,以修饰细胞,但在所设想的时期过后或在一个或多个细胞分裂后不再持续。
在另一个实施方案中,将编码Cas相关基因的mRNA引入细胞。在此类实施方案中,翻译mRNA以生成足量的II型CRISPR系统核酸内切酶,以修饰细胞(在存在至少一种sgRNA的情况下),但在所设想的时期过后或在一个或多个细胞分裂后不再持续。在此类实施方案,不需要另外的步骤来从修饰的细胞移除或分离Cas相关基因。
在本公开的一个实施方案中,在体外制备催化活性Cas相关基因产物,然后引入细胞,包括原核或真核细胞。制备Cas相关基因产物的方法取决于其类型和性质,并且是本领域的技术人员已知的。例如,如果Cas相关基因产物是大型单体DNA核酸酶,则Cas相关基因产物的活性形式可通过细菌表达体外翻译,通过酵母细胞,在昆虫细胞中,或通过在本领域中描述的其它蛋白质制备技术制备。在表达后,分离、再折叠(如果需要的话)、纯化以及任选地处理Cas相关基因产物,以移除任何纯化标记,诸如His-标记。一旦获得粗制的、部分纯化的或更完全纯化的Cas相关基因产物,即可通过电穿孔,通过用Cas相关基因产物涂覆的颗粒轰击,通过化学转染或通过一些其它跨细胞膜转运方式将蛋白质引入例如植物细胞。将核酸引入细菌和动物细胞的方法同样是本领域熟知的。也可使用纳米颗粒递送蛋白质,该纳米颗粒可递送活性蛋白质和核酸的组合。一旦引入足量的Cas相关基因产物,从而提供有效量的体内核酸酶活性,以及适当的sgRNA,即可切割游离体或基因组靶标位点内的前间隔序列。还可认识到,本领域的技术人员可创建失活的,但通过天然加工机器体内活化的Cas相关基因产物;此类Cas相关基因产物也是本公开所设想的。
在另一个实施方案中,创建瞬时表达sgRNA和/或Cas相关基因的构建体并引入细胞。在又一个实施方案中,载体将生成足量的sgRNA和/或Cas相关基因,以便通过CRISPR介导的切割有效修饰一个或多个所需的游离体或基因组靶标位点。例如,本公开设想了可通过轰击、电穿孔、化学转染或通过一些其它跨植物细胞膜方式转运来制备载体。此类载体可具有许多可用性质。例如,在一个实施方案中,载体可在细菌宿主中复制,使得该载体可以足以进行瞬时表达的量制备和纯化。在另一个实施方案中,载体可编码耐药性基因,以允许在宿主中选择载体,或该载体也可包含表达盒,以在植物中提供sgRNA和/或Cas相关基因的表达。在另一个实施方案中,表达盒可包含启动子区域、5’未翻译区域、任选的内含子(以协助表达)、多个克隆位点(以允许快速引入编码sgRNA和/或Cas相关基因的序列)和3’UTR。在特定实施方案中,表达盒中的启动子可以是玉米的U6启动子。在其它实施方案中,启动子可以是玉米的嵌合U6启动子。在一些实施方案中,在表达盒的一个或每个末端包括独特的限制性位点,以允许制备和分离线性表达盒可为有利的,然后该表达盒可不含其它载体元件。在某些实施方案中,未翻译的前导序列区域可以是植物来源的未翻译区域。当表达盒转化或转染到单子叶植物细胞时,设想使用植物来源的内含子。
在其它实施方案中,载体中的一个或多个元件包括与游离体或基因组靶标位点内包含的前间隔序列互补的间隔序列。这有利于表达盒内CRISPR介导的修饰,以便能够移除和/或插入元件,诸如启动子和转基因。
在另一个方法中,可使用细菌或病毒载体宿主将瞬时表达载体引入细胞。例如,农杆菌(Agrobacterium)是可用于将瞬时表达载体引入宿主细胞的此类细菌载体。当使用细菌、病毒或其它载体宿主系统时,瞬时表达载体包含在宿主载体系统内。例如,如果使用农杆菌宿主系统,则瞬时表达盒在一个或多个T-DNA边界的侧面,并克隆至二元载体。本领域中鉴定了多种此类载体系统(如Hellens等,2000所评述)。
在由此足量瞬时引入sgRNA和/或Cas相关基因,以修饰细胞的实施方案中,可利用选择修饰细胞的方法。在一种此类方法中,包含选择性标记的第二核酸分子与瞬时sgRNA和/或Cas相关基因共引入。在该实施方案中,共引入的标记可以是在靶标位点引入标记的分子策略的一部分。例如,共引入的标记可用于通过插入基因组靶标位点之间而使靶标基因断裂。在另一个实施方案中,共引入的核酸可用于生成目测标记蛋白,使得可通过一些其它方式细胞分选或分离转染的细胞。在又一个实施方案中,共引入的标记可随机整合或通过第二sgRNA:Cas蛋白质复合物引导整合进与主要基因组靶标位点无关的位点。在又一个实施方案中,共引入的分子可通过双链断裂修复途径靶向特定的基因座,该途径可包括例如在基因组靶标位点处的非同源性末端接合、同源重组、合成依赖性链退火(SDSA)、单链退火(SSA)或其组合。在上述实施方案中,可使用共引入的标记鉴定或选择可能暴露至sgRNA和/或Cas相关基因,因此可能被CRISPR修饰的细胞。
CRISPR的稳定表达
在另一个实施方案中,将CRISPR表达载体稳定转化至细胞,以使用载体内编码的sgRNA和Cas相关基因产物切割宿主基因组中基因组靶标位点处或附近的DNA序列。在该实施方案中,转化载体的设计为sgRNA和/或Cas相关基因表达的时间和条件提供了灵活性。此外,转化载体可设计为包含选择性或可见标记,该标记提供了分离或有效地选择包含CRISPR和/或被CRISPR修饰的细胞系的方式。
细胞转化系统在本领域中有所描述,并且描述包括多种转化载体。例如,对于植物转化,两种主要方法包括农杆菌介导的转化和粒子枪轰击介导的(即,基因枪)转化。在两种情况下,CRISPR通过表达盒引入。该盒可包含一个或多个以下元件:可用于表达sgRNA和/或Cas相关基因的启动子元件;提高表达的5’未翻译区域;在某些细胞类型诸如单子叶植物细胞中进一步提高表达的内含子元件;提供合适的限制性位点,以插入sgRNA和/或Cas相关基因序列和其它所需元件的多克隆位点;以及提供表达转录物的有效终止的3’未翻译区域。在特定实施方案中,表达盒中的启动子将是玉米的U6启动子。在其它实施方案中,启动子将是玉米的嵌合U6启动子。
对于颗粒轰击或用原生质体转化,表达盒可以是分离的线性片段或可以是可包含细菌复制元件、细菌选择性标记或其它元件的大型构建体的一部分。sgRNA和/或Cas相关基因表达盒可以物理连接至标记盒,或可与编码标记盒的第二核酸分子混合。该标记盒由必要的元件构成,以表达允许有效选择转化细胞的目测或选择性标记。就农杆菌介导的转化而言,该表达盒可邻近或在侧面的T-DNA边界之间,并且包含在二元载体内。在另一个实施方案中,该表达盒可在T-DNA的外部。表达盒存在于细胞中可通过阳性或阴性选择方案操作。此外,选择性标记盒也可在相同的T-DNA边界内或邻近相同的T-DNA边界,或可以在二元载体上的第二T-DNA内的别处(如,2T-DNA系统)。
在另一个实施方案中,被CRISPR瞬时或稳定修饰的细胞与未修饰的细胞一起传代。该细胞可细分为独立的克隆来源品系,或可用于再生独立来源的植物。由此类细胞再生的单个植物或克隆群体可用于生成独立来源的品系。在任何这些阶段中,可利用分子测定法筛选修饰的细胞、植物或品系。修饰的细胞、植物或品系继续增殖,而未修饰的细胞、植物或品系则弃去。在这些实施方案中,细胞中存在活性CRISPR是确保总体工艺的效率必需的。
转化方法
转化或转染细胞的方法是本领域熟知的。使用农杆菌或DNA涂覆颗粒转化植物的方法是本领域熟知的,并且并入本文。据信,与现有公开内容一起使用的合适的宿主细胞转化方法实际上包括可将DNA引入细胞的任何方法,例如农杆菌介导的转化(美国专利号5,563,055、5,591,616、5,693,512、5,824,877、5,981,840和6,384,301)和DNA涂覆颗粒的加速(美国专利号5,015,580、5,550,318、5,538,880、6,160,208、6,399,861和6,403,865)等。通过诸如这些技术的应用,可稳定转化实际上任何物种的细胞。
各种选择转化细胞的方法已有所描述。例如,可利用耐药性标记诸如新霉素磷酸转移酶蛋白赋予卡那霉素抗性,或使用5-烯醇丙酮莽草酸磷酸合酶赋予草甘膦耐性。在另一个实施方案中,使用类胡萝卜素合酶创建可目测鉴定的橙色颜料。这三种示例性方法各自可有效地用于分离转化和/或被CRISPR修饰的细胞或植物或其组织。
当编码选择性或筛选性标记的核酸序列插入基因组靶标位点时,该标记可用于检测是否存在CRISPR或其活性。一旦细胞被CRISPR修饰,这可为有用的,并且恢复不再包含CRISPR的经遗传修饰的细胞,或从此类修饰细胞再生的植物是所期望的。在其它实施方案中,该标记可有意设计为整合到基因组靶标位点,使其可用于追踪与CRISPR无关的修饰细胞。该标记可以是提供可目测检测的表型的基因,诸如在种子中,以允许快速鉴定携带或缺乏CRISPR表达盒的种子。
本公开提供了从前间隔序列内的基因组靶标位点处具有修复双链断裂的细胞再生植物的方法。该再生物可用于繁殖另外的植物。
本公开另外提供了包括具有一个或多个CRISPR相关基因和sgRNA表达盒的新型U6启动子和U3、U2、U5和7SL启动予以及其组合的新型植物转化载体和表达盒。本公开还提供使用CRISPR介导的切割特异性修饰获得植物细胞、整株植物以及种子或胚芽的方法。本公开还涉及包含CRISPR相关的Cas核酸内切酶表达构建体和sgRNA表达盒的新型植物细胞。
使用平末端寡核苷酸靶向
在某些实施方案中,可利用CRISPR/Cas9系统使平末端双链DNA片段靶向插入所关注的基因组靶标位点。CRISPR介导的核酸内切酶活性可将双链断裂(DSB)引入选择基因组靶标位点的前间隔序列以及DNA修复(诸如微同源驱动的非同源性末端接合DNA修复),使平末端双链DNA片段插入DSB。平末端双链DNA片段可使用DNA片段的5′和3′末端的1-10bp微同源设计,其对应于基因组靶标位点中的前间隔序列的切割位点处的5′和3′侧面序列。
使用定制CRISPR进行分子育种
在一些实施方案中,利用基因组知识进行基因组的靶向遗传改变。至少一种sgRNA可设计为靶向基因组的至少一个区域,使该区域从基因组断裂。本公开的该方面可特别用于遗传改变。所得的植物可具有修饰表型或其它性质,取决于所改变的一个或多个基因。此前表征的突变等位基因或引入的转基因可靶向CRISPR介导的修饰,以创建具有改善的突变体或转基因品系。
在另一个实施方案中,缺失或断裂靶向的基因可以是此前引入靶标植物或细胞的转基因。这具有允许引入改善型式的转基因或允许编码选择性标记的序列断裂的优点。在又一个实施方案中,通过CRISPR靶向断裂的基因是引入相同的载体或表达盒上的至少一个转基因,作为所关注的另一个/其它转基因,并且驻留在相同的基因座,作为另一个转基因。本领域的技术人员理解,该类型的CRISPR介导的修饰可导致另外的序列的缺失或插入。因此,在某些实施方案中,生成其中发生缺失的多种植物或细胞,以及在CRISPR介导的修饰后,使用标准技术鉴定基因组具有最小改变的特定植物或细胞,从而筛选此类植物或细胞可为优选的。此类筛选可利用基因型和/或表型信息。在此类实施方案中,特定转基因可以是断裂的,同时其余的转基因保持完整。这避免了必须创建包含所需的转基因而不包含不期望的转基因的新转基因品系。
在另一个方面,本公开包括将所关注的DNA片段插入植物的基因组的特定位点的方法,其中所关注的DNA片段来自植物的基因组,或相对于该植物是异源性的。本公开允许选择或靶向用于核酸(即,转基因)叠堆的基因组(即,大范围基因座)的特定区域。因此,基因组的靶向区域可显示至少一个转基因与至少一个表型性状相关的所关注单倍型的连锁,并且也可导致有助于转基因叠堆和转基因性状整合的连锁障碍的发展,和/或在连锁障碍的发展的同时还允许常规性状整合。
使用定制CRISPR进行性状整合
通过CRISPR介导的切割定向插入所关注的DNA片段的至少一个基因组前间隔序列位点,允许待加入植物基因组的相同位点或不同位点的所关注的多个核酸(即,性状叠堆)的靶向整合。可根据基础育种值、该位置的转基因性能、该位置的基础重组率、该连锁障碍的现有转基因或其它因素的知识选择靶向整合位点。一旦组装成叠堆植物,即可用作与在育种流水线中推进的种质杂交的性状供体,或直接在育种流水线中推进。
本公开包括将至少一种所关注的核酸插入至少一个位点的方法,其中所关注的核酸来自植物的基因组,诸如QTL或等位基因,或来源于转基因。因此,基因组的靶向区域可显示至少一个转基因与至少一个表型性状相关的所关注的单倍型的连锁(如美国专利申请公开号2006/0282911所述),有助于转基因叠堆和转基因性状整合的连锁障碍的发展,有助于QTL或单倍型叠堆和常规性状整合的连锁障碍的发展等等。
在本公开的另一个实施方案中,可通过利用基因组序列信息的知识以及设计本领域描述的定制sgRNA的能力,使用多个独特的sgRNA修饰一条染色体上包含的一个连锁障碍内的特定基因座的多个等位基因。根据需要设计或工程化基因组靶标位点特异性的或可涉及基因组靶标位点的sgRNA,该基因组靶标位点在包含非靶标等位基因的基因座上游。另外设计或工程化基因组靶标位点特异性的或可涉及基因组靶标位点的第二sgRNA,该基因组靶标位点在包含非靶标等位基因的靶标基因座下游。sgRNA可设计为使得它们互补其中与包含靶标等位基因的非靶标基因座无同源性的基因组区域。可使用上述方法之一将两种sgRNA引入细胞。
执行靶向整合的能力依赖于sgRNA:Cas蛋白复合物的作用和Cas相关基因产物的核酸内切酶活性。该优点提供了工程化所关注的植物(包括包含至少一种基因组修饰的植物或细胞)的方法。
可将定制sgRNA用于CRISPR系统,生成至少一种性状供体,以创建然后与所关注的至少一种第二植物杂交的定制基因组修饰事件,该第二植物包括其中CRISPR递送可与用于基因组编辑的所关注sgRNA结合的植物。在其它方面,一种或多种所关注的植物使用CRISPR系统和至少一种所关注的用于定向插入的双链DNA片段直接转化。已经认识到,该方法可在各种细胞、组织和发育类型,包括植物配子中执行。还期望本文所述的一个或多个元件可与特定细胞、组织、植物部分和/或发育阶段特异性启动子,诸如减数分裂特异性启动子的使用组合。
此外,本公开设想了已存在于基因组内的转基因元件靶向缺失或断裂。这允许例如引入改善型式的转基因,或允许选择性标记移除。在又一个实施方案中,通过CRISPR介导的切割靶向断裂的基因是引入相同的载体或表达盒上的至少一个转基因,作为所关注的另一个/其它转基因,并且驻留在相同的基因座,作为另一个转基因。
因此,在一个方面,本公开提供修饰细胞中所关注的基因座的方法,其包括(a)鉴定DNA序列内至少一个所关注的基因座;(b)在所关注的基因座内或邻近所关注的基因座,创建修饰的核苷酸序列,根据本公开,该核苷酸序列包括第一sgRNA的基因组靶标位点内的前间隔序列;(c)将sgRNA和Cas相关基因引入至少一种细胞,其中该sgRNA和/或Cas相关基因瞬时或稳定表达;(d)分析细胞DNA中的CRISPR介导的修饰,该DNA构成所关注的基因座或在所关注的基因座侧面;以及(e)将细胞或其子代细胞鉴定为所关注的所述基因座中包含修饰。
另一个方面提供修饰细胞中所关注的多个基因座的方法,其包括:(a)鉴定基因组内所关注的多个基因座;(b)鉴定每个所关注的基因座内的多个基因组前间隔序列位点;(c)根据本公开将多个sgRNA和至少一个Cas相关基因引入至少一个细胞,其中该细胞包含基因组前间隔序列位点,sgRNA和Cas相关基因瞬时或稳定表达,并且创建包括至少一个CRISPR介导的切割事件的一个或多个修饰基因座;(d)分析细胞DNA中的CRISPR介导的修饰,该DNA构成每个所关注的基因座或在每个所关注的基因座的侧面;以及(e)鉴定细胞或其子代细胞在所述所关注的基因座包含修饰核苷酸序列。
本公开还设想了根据本公开通过两个或更多个sgRNA和Cas相关基因连续修饰所关注的基因座。通过第二CRISPR介导的基因组修饰的作用可保持、进一步修饰或移除通过此类第一CRISPR介导的基因组修饰的作用添加的基因或其它序列。
因此,本发明包括修饰作物中的所关注的基因座的方法,该作物诸如玉蜀黍(粟米;玉米)、大豆(Glycine max)、棉花(陆地棉(Gossypium hirsutum);棉属(Gossypiumsp.))、花生(Arachis hypogaea)、大麦(Hordeum vulgare);燕麦(Avena sativa);鸭茅(Dactylis glomerata);稻米(Oryza sativa,包括印度(indica)和日本(japonica)变种);高粱(Sorghum bicolor);甘蔗(Saccharum sp.);高羊茅(Festuca arundinacea);草坪草物种(如以下物种:匍匐翦股颖(Agrostis stolonifera)、草地早熟禾(Poa pratensis)、钝叶草(Stenotaphrum secundatum));小麦(Triticum aestivum);苜蓿(Medicago sativa);芸苔属(Brassica)成员,包括西兰花、卷心菜、胡萝卜、花椰菜、白菜;黄瓜、菜豆、茄子、烟草、茴香、四季豆、葫芦、韭葱、莴苣、甜瓜、秋葵、洋葱、豌豆、胡椒、番瓜、萝卜、菠菜、南瓜、甜玉米、番茄、西瓜、观赏植物以及其它水果、蔬菜、块茎、油籽和根类作物,其中油籽作物包括大豆、芥花籽、油菜籽、油棕、向日葵、橄榄、玉米、棉籽、花生、亚麻籽、红花和椰子。
基因组修饰可包括修饰连锁障碍、连接两个或更多个QTL、破坏两个或更多个QTL的连锁、基因插入、基因置换、基因转换、基因缺失或断裂、转基因事件选择、转基因性状供体选择、转基因置换或至少一种所关注的核酸的靶向插入。
定义
所提供的定义和方法限定了本公开,并引导了本领域的普通技术人员实施本公开。除非另外指明,术语根据相关领域的普通技术人员所用的常规用途理解。分子生物学中常见术语的定义还可见于Alberts等,Molecular Biology of The Cell,第5版,GarlandScience Publishing,Inc.:New York,2007;Rieger等,Glossary of Genetics:Classicaland Molecular,第5版,Springer-Verlag:New York,1991;King等,A Dictionary ofGenetics,第6版,Oxford University Press:New York,2247;以及Lewin,Genes IX,Oxford University Press:New York,2007。使用37CFR§1.822所示的DNA碱基命名法。
如本文所用,“CRISPR相关基因”是指编码成簇规律间隔的短回文重复序列(CRISPR)相关系统(Cas)的多肽元件的核酸序列。实例包括但不限于Cas3和Cas9,它们分别编码CRISPR I型和II型系统的核酸内切酶。
如本文所用,“单向导RNA(sgRNA)”是指可定制DNA元件编码的crRNA:tracrRNA融合杂交单链RNA分子,该可定制DNA元件通常包含一个拷贝的间隔序列,该间隔序列与基因组靶标位点的前间隔序列,以及CRISPR复合物的相关Cas核酸内切酶的结合域互补。
如本文所用,“基因组靶标位点”是指位于被选为靶向突变和/或双链断裂的宿主基因组中的前间隔序列和前间隔序列邻近基序(PAM)。
如本文所用,“前间隔序列”是指可通过CRISPR系统核酸内切酶的酶切介导的突变和/或双链断裂靶向的短DNA序列(12至40bp),该酶切通过与crRNA或sgRNA中的间隔序列的互补碱基配对引导。
如本文所用,“前间隔序列邻近基序(PAM)”包括紧邻基因组靶标位点中的前间隔序列的3至8bp序列。
如本文所用,“微同源”是指不同的多核苷酸分子中存在相同的碱基短序列(1至10bp)。
如本文所用,“密码子优化的”是指修改为采用特定植物的密码子使用偏爱性的多核苷酸序列。修改的多核苷酸序列仍编码与原序列相同或基本上类似的多肽,但使用以更大的频率存在于特定植物中的密码子核苷酸三联体。
如本文所用,“非蛋白质编码RNA(npcRNA)”是指此类非编码RNA(ncRNA),它是前体小非蛋白质编码RNA,或完全加工的非蛋白质编码RNA,这些非编码RNA是未翻译成蛋白质的功能性RNA分子。
如本文所用,术语“嵌合”是指两种或更多种不同的多核苷酸分子的部分融合的产物,或指通过已知元件或其它多核苷酸分子的操纵生成的基因表达元件。新型嵌合调控元件可通过多种方法设计或工程化。在本公开的一个实施方案中,嵌合启动子可通玉米染色体1的U6启动子的5′部分(其包括至少一个单子叶植物特异性启动子(MSP)元件)与玉米染色体8的U6启动子的3′部分(其包括上游序列元件(USE)和TATA框)的融合生成。所得的嵌合启动子相对于第一或第二启动子可具有新型表达性质。
如本文所用,“启动子”是指位于基因的开放阅读框(或蛋白质编码区)的翻译起始密码子上游或5′,并且涉及识别和结合RNA聚合酶I、II或III和其它蛋白质(反式作用转录因子)以引发转录的核酸序列。“植物启动子”是在植物细胞中发挥功能的天然或非天然启动子。组成型启动子在整个植物发育过程中在植物的大部分或所有组织中发挥功能。组织、器官或细胞特异性启动子分别仅在或主要在特定组织、器官或细胞类型中表达。启动子可显示出“增强”表达,即与植物的其它部分相比,在植物的一种细胞类型、组织或植物部分中高水平表达,而不是在给定组织、植物部分或细胞类型中“特异性”表达。时间调控的启动子仅在或主要在植物发育的某些时期期间或在一天的某些时间发挥功能,正如例如与昼夜节律相关的基因的情况。诱导性启动子响应于内源性或外源性刺激的存在,例如通过化合物(化学诱导剂)或响应于环境、激素、化学和/或发育信号选择性表达可操作地连接的DNA序列。诱导型或调控的启动子包括例如光、热、应力、溢流或干旱、植物激素、创伤或化学诸如乙醇、茉莉酮酸酯、水杨酸或安全剂调控的启动子。
如本文所用,“表达盒”是指包含至少第一多核苷酸序列的多核苷酸序列,该第一多核苷酸序列能够引发可操作地连接的第二多核苷酸序列,以及任选地可操作地连接至该第二多核苷酸序列的转录终止序列的转录。
回文序列是无论在一条链上从5′至3′还是在与其形成双螺旋的互补链上从3′至5′阅读均相同的核酸序列。如果核苷酸序列等于其反向互补序列,则被认为是回文序列。回文序列可形成发夹状。
在一些实施方案中,用于对本公开的某些实施方案进行描述并提出权利要求的表示成分、性质(诸如分子量)、反应条件等的量的数字应被理解为在一些情况下通过术语“约”来修饰。在一些实施方案中,术语“约”用于指明某一值包括用于确定该值的设备或方法的平均值的标准偏差。在一些实施方案中,在书面说明书和所附权利要求书中所示的数字参数为近似值,其可以根据待通过特定实施方案获得的所需性质而变化。在一些实施方案中,数值参数应按照所报告的有效数位的数目并且通过应用惯常的四舍五入法来解释。尽管本公开的一些实施方案以宽范围示出的数字范围和参数为近似值,但是在具体实例中所示的数值尽可能可行地加以精确报告。在本公开的一些实施方案中展示的数值可包含因存在于其相应测试测量中的标准偏差而必然导致的某些误差。本文的值的范围的表述仅仅旨在用作单独地引用落入该范围内的每个单独值的速记方法。除非本文另外指明,每个单独值并入本说明书中,就如其在本文中被单独地陈述一样。
在一些实施方案中,在描述特定实施方案背景下(尤其是在以下某些权利要求项的背景下)使用的术语“一”、“一个/种”、“该/所述”和类似的提法可被理解为涵盖单数和复数,除非另外具体指明。在一些实施方案中,如本文(包括权利要求书)所用的术语“或”用于表示“和/或”,除非明确表示仅指代备选项或备选项相互排斥。
术语“包含/含有”、“具有”和“包括”是开放式连系动词。这些动词的一者或多者的任何形式或时态诸如“包含”、“含有”、“具有”、“包括”也是开放式的。例如,“包含”、“具有”或“包括”一个或多个步骤的任何方法不限于只具有那一个或多个步骤,并且还可以涵盖其它未列出的步骤。相似地,“包含”、“具有”或“包括”一个或多个特征的任何组合物或装置不限于只具有那一个或多个特征并可以涵盖其它未列出的特征。
本文所述的所有方法可以按任何合适的次序进行,除非本文另外指明或者明显与上下文矛盾。相对于本文的某些实施方案提供的任何和所有实例或示例性语言(例如,“诸如”)的使用仅是为了更好地阐述本公开并且不对本公开的范围加以限制,而本公开的范围仅由权利要求书限定。本说明书中的语言不应理解为是表示实践本公开所必需的任何不受权利要求书保护的元件。
在本文所公开的本公开的替代元件或实施方案的分组不应视为限制性的。每个组成员可被单独地或与该组的其它成员或本文中存在的其它元件的任何组合引用和要求保护。出于便利或专利性的原因,组的一个或多个成员可包括在一个组内或从该组内删除。
已经详细地描述了本公开,将显而易见的是,在不脱离所附权利要求书限定的本公开范围的情况下,修改、变型和等同实施方案是可能的。此外,应当认识到,本公开中的所有实例均作为非限制性实例提供。
具体实施方式
包括以下实施例以展示本公开的实施方案。本领域的技术人员应当理解,可对特定实施方案作出多个变化,该实施方案可在不脱离本公开的概念、精神和范围的情况下进行公开且仍获得相同或类似的结果。更具体地讲,显而易见的是,化学上和生理上相关的某些试剂可代替本文所述的试剂,同时实现相同或类似的结果。本领域的技术人员显而易见的所有此类类似的代替和修饰被认为是在所附权利要求限定的本公开的精神、范围和概念内。
实施例1
表达sgRNA的启动子的鉴定
为了允许使用基于CRISPR的基因靶向系统在玉米、大豆和番茄中进行基因组工程化,鉴定了这三个基因组原生的新型U6启动子。在玉米、大豆和番茄基因组中BLAST搜索高度保守的U6基因后,选择这些推定U6基因上游的200-600bp序列测试启动子功能(表1)。鉴定玉米B73基因组的四个U6启动子,每个启动子分别在染色体1(SEQ ID NO:1)、染色体2(SEQ ID NO:3)、染色体3(SEQ ID NO:5)和染色体8(SEQ ID NO:7)上。这四个玉米U6启动子和对应的U6基因的多序列比对汇编如图1A和B所示。对于这些玉米U6启动子中的每个,提供保守的U6启动子基序(如,TATA框、上游序列元件(USE)和单子叶植物特异性启动子(MSP)元件)(Connelly,Mol.Cell Biol.14:5910-5919,1994)(图1B)。多聚-T片段后的鸟嘌呤核碱基在这四个基因中是保守的,并且在转录中可具有显著作用。共有序列、保守性百分比和序列标识(所示核苷酸的大小与序列保守性直接成比例)在比对下方提供(图1)。根据多序列比对,这些U6启动子的保守基序在邻近转录起始位点的140bp内。根据这些保守U6启动子基序的近似性,选择每个玉米染色体U6启动子(染色体1(SEQ ID NO:2)、染色体2(SEQ ID NO:4)、染色体3(SEQ ID NO:6)和染色体8(SEQ ID NO:8))的转录起始位点200bp近侧上游序列在sgRNA表达盒中测试有效启动子活性。
除四个玉米U6启动子之外,还设计了嵌合U6启动子。使用染色体1、2和8的玉米U6启动子的不同组合设计四个嵌合玉米U6启动子,每个嵌合启动子的长度为397bp。确定嵌合体的断点,以使得不同染色体起源的保守元件(如,USE、MSP和TATA框)在新嵌合U6启动子中混合,但保持与天然玉米U6启动子的相对间距。例如,包括MSP和USE的U6启动子的5’末端来源于一个染色体,而包括TATA框和一个或多个MSP元件的3’末端来源于第二染色体。虽然染色体2的玉米U6启动子不是其天然形式的很强启动子,但其包括超过一个MSP元件。因此,主要包括染色体1和/或8序列的嵌合体还可包括一个或多个染色体2MSP元件。特别地,嵌合体1的5’部分(SEQ ID NO:17)来源于玉米染色体1的U6启动子(SEQ ID NO:1)(包括一个MSP元件),该嵌合体的3’部分来源于玉米染色体8的U6启动子(SEQ ID NO:7)(包括USE元件和TATA框)。相似地,嵌合体2的5’部分(SEQ ID NO:18)来源于玉米染色体1的U6启动子(SEQID NO:1)(包括一个MSP元件),该嵌合体的3’部分来源于玉米染色体8的U6启动子(SEQ IDNO:7)(包括第二MSP元件、USE元件和TATA框)。嵌合体3的5’部分(SEQ ID NO:19)来源于玉米染色体8的U6启动子(SEQ ID NO:7)(包括一个MSP元件),该嵌合体的3’部分来源于玉米染色体1的U6启动子(SEQ ID NO:1)(包括第二MSP元件、USE元件和TATA框)。另外,对于嵌合体3,从SEQ ID NO:7的100bp开始有3bp缺失,并且嵌合体的5’末端始于5’-AAG-3’。嵌合体4(SEQ ID NO:20)来源于玉米染色体8的U6启动子(SEQ ID NO:7)(包括MSP元件、USE元件和TATA框)。然而,该嵌合体还包括来源于玉米染色体1和2的U6启动子的两个另外的MSP元件(对于总共3个MSP元件)。
表1.玉米、番茄和大豆的U6启动子,它们的染色体来源和长度。
实施例2
允许在植物中进行基因组工程化的Cas9基因的鉴定
使用酿脓链球菌Cas9序列(SEQ ID NO:28是具有NLS的Cas9的多肽序列,并且SEQID NO:96是无NLS的Cas9的多肽序列)在未成熟的玉米胚胎中进行报告基因构建体的CRISPR介导的定点靶向。对于表达,密码子优化的Cas9的核苷酸序列设计为能够在植物中表达的表达载体。该Cas9表达载体包含驱动Cas9开放阅读框表达的35S启动子、并入Cas9编码区的3’末端的NLS序列和Nos转录终止序列(SEQ ID NO:29)。
Cas9蛋白(SEQ ID NO:26)和编码其的核苷酸序列的单子叶植物密码子优化型式(SEQ ID NO:27)从植物相关细菌慢生根瘤菌鉴定,并且可用于提高植物中CRISPR/Cas介导的基因组修饰的稳健性。Cas9蛋白(SEQ ID NO:69)及其单子叶植物密码子优化型式(SEQID NO:68)从嗜热链球菌鉴定,并且可用于提高植物中CRISPR/Cas介导的基因组修饰的稳健性。还可从植物相关细菌(如,共生性或病原性细菌)鉴定另外的Cas9基因。
实施例3
单向导RNA盒设计
设计一组靶向称为Zm7(5’-GCCGGCCAGCATTTGAAACATGG-3’,SEQ ID NO:22)的玉米基因组靶标位点中的前间隔序列的单向导RNA(sgRNA)表达盒。不同的表达盒包括玉米:染色体1(SEQ ID NO:30)、染色体2(SEQ ID NO:32)、染色体3(SEQ ID NO:34)或染色体8(SEQID NO:36)的397bp U6启动子中的一者;或玉米:染色体1(SEQ ID NO:31)、染色体2(SEQ IDNO:33)、染色体3(SEQ ID NO:35)或染色体8(SEQ ID NO:37)的200bp U6启动子中的一者。每个表达盒还包含i)U6多聚-T终止子,它在四个玉米U6基因的每个中是保守的;ii)sgRNA,其包括对应于Zm7基因组靶标位点的前间隔序列(SEQ ID NO:22)的一个拷贝的间隔序列5’-GCCGGCCAGCATTTGAAACA-3’(SEQ ID NO:23);以及iii)sgRNA的保守3’域,它提供了Cas核酸内切酶结合域,并且以U6多聚-T片段(SEQ ID NO:21)结束。
相似地,使用四个玉米U6397bp启动子(SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34或SEQ ID NO:36;参见表2)中的一者,以及与称为Zm231(SEQ ID NO:24)的玉米基因组靶标位点的前间隔序列互补的sgRNA的间隔序列设计一组sgRNA盒。表3列出了包含Zm7、Zm231和Zm14靶标位点的sgRNA的DNA和RNA序列的对应SEQ ID NO。使用玉米染色体8的玉米U6397bp启动子(SEQ ID NO:36),以及与称为Zm14(SEQ ID NO:24)的玉米基因组靶标位点的前间隔序列互补的sgRNA的间隔序列设计阴性对照sgRNA盒。该阴性对照sgRNA盒使用不与Zm231玉米基因组靶标位点的前间隔序列互补的sgRNA的间隔序列设计。包括包含与Zm14玉米基因组靶标位点互补的间隔序列的sgRNA不会导致Zm231玉米靶标前间隔序列位点的前间隔序列的CRISPR/Cas介导的切割。这些Zm231和Zm14 sgRNA盒以SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO:40、SEQ ID NO:41和SEQ ID NO:42表示(表2)。这些sgRNA盒中的每个还包含sgRNA序列的3’末端的U6多聚-T片段。
表2.具有所示玉米U6启动子和包含与所示玉米基因组靶标位点的前间隔序列互补的间隔序列的sgRNA的盒。
表3.包含与玉米基因组靶标位点Zm7、Zm231和Zm14的前间隔序列互补的间隔序列的酿脓链球菌sgRNA的DNA和RNA序列。
实施例4
CRISPR在玉米中的活性-修饰GUS报告基因分析
为测定CRISPR/Cas介导的基因靶向效率在玉米中的活性,使用未成熟的玉米胚胎中的报告基因的瞬时表达系统。除上述sgRNA盒之外,该设计掺入了包含酿脓链球菌的Cas9核酸内切酶的表达盒(SEQ ID NO:28),该表达盒包含核定位信号(NLS)序列,并且为在玉米中表达进行了密码子优化。
这些实验的报告基因构建体是包含修饰β-葡糖醛酸酶(GUS)编码序列的盒,其中用于靶向CRISPR切割的玉米基因组靶标位点(前间隔序列和PAM)(如,Zm7(SEQ ID NO:22)、Zm231(SEQ ID NO:44)或Zm14(SEQ ID NO:43))被工程化至报告基因,在GUS编码序列的内部直接重复序列周围(图2)。当使用CRISPR元件的表达载体共递送时,如果CRISPR系统切割前间隔序列,则同源重组DNA修复的内源性植物单链退火(SSA)途径将重构功能性GUS基因。这些修饰GUS报告基因构建体命名为GU-Zm7-US、GU-Zm231-US或GU-Zm14-US,分别涉及插入GUS基因Zm7、Zm231和Zm14的玉米基因组靶标位点。修饰GUS报告基因盒中的一者使用其它CRISPR元件的表达载体(如,sgRNA盒中的一者)和编码Cas9核酸内切酶的表达盒(SEQ IDNO:28)共递送。使用标准方案混合表达盒并且共涂覆于0.6M金颗粒上。然后用这些制备的金颗粒轰击预培养3天的未成熟的玉米胚胎。在轰击后使胚胎在培养中维持3-5天,然后使用X-Gluc(5-溴-4-氯-3-吲哚基葡糖苷酸)和标准实验室方案进行组织化学染色。
如果CRISPR介导的Cas9核酸内切酶活性出现在修饰报告基因构建体中的前间隔序列位点,则使用组织化学染色和X-Gluc将GUS活性检测为蓝色焦点(图3和4)。
单独的表达盒设计为包含驱动sgRNA表达的四个玉米U6启动子(来自染色体1、2、3和8)中的一者,该sgRNA包含与玉米Zm7基因组靶标位点的前间隔序列互补的间隔序列(图3)。为制备表达分析的样品,用0.6pmol Zm7-sgRNA构建体中的一者和0.3pmol其它构建体(Cas9表达盒和Zm7修饰报告基因构建体(GU-Zm7-US))中的每个涂覆0.6μM金颗粒。一旦制备涂覆金颗粒,即可使用标准方案将1/4的混合物用于轰击3天的未成熟的玉米胚胎。每组评估的构建体轰击超过50个未成熟的玉米愈伤组织,并且在轰击后5天进行染色。在染色后,拍摄代表性愈伤组织的照片(多个愈伤组织的概览和单个愈伤组织的近距离视图)(图3)。修饰报告基因构建体GU-Zm7-US设计为包含Zm7基因组靶标位点(SEQ ID NO:22),sgRNA设计为包含一个拷贝的Zm7间隔序列(SEQ ID NO:23)。将Zm7-sgRNA间隔序列并入具有四个的397bp玉米U6启动子(来自染色体1(SEQ ID NO:30)、染色体2(SEQ ID NO:32)、染色体3(SEQ ID NO:34)或染色体8(SEQ ID NO:36))中的一者的表达盒。用于转化的阴性对照包括具有Zm7基因组靶标位点并且:(1)缺乏Cas9核酸内切酶表达盒和Zm7-sgRNA表达盒;或(2)仅缺乏Zm7-sgRNA表达盒的修饰报告基因构建体GU-Zm7-US(图3)。对于这两种对照,未检测到蓝色部分,表明修饰报告基因构建体未发生CRISPR介导的切割。四个不同的397bp玉米U6启动子驱动Zm7-sgRNA盒表达的评估结果显示,虽然所有四个397bp玉米U6启动子均可发挥作用(即,愈伤组织中检测到蓝色部分),但不同启动子的功效不同(如愈伤组织中蓝色部分的大小和数量所证实)。玉米染色体8的U6启动子显示出最大功效,然后是染色体1的U6启动子。染色体2和3的U6启动子显示出彼此类似的功效(Chr 8>Chr 1>Chr2≈Chr3)。
该玉米表达系统中CRISPR/Cas9系统的特异性通过测试修饰GUUS报告基因构建体中基因组靶标位点内的前间隔序列和不同的sgRNA构建体中包括的间隔序列之间的错配来评估(图4)。如上述实验中所示,使用一个或多个构建体;0.3pmol单个修饰GUUS报告基因构建体(GUUS靶标)、0.16pmol Cas9核酸内切酶表达盒、0.3pmol单个sgRNA盒和0.03pmol表达绿色荧光蛋白(GFP)的转化对照构建体涂覆0.6μM金颗粒(图4)。一旦制备涂覆金颗粒,即可使用标准方案将1/4的混合物用于轰击3天的未成熟的玉米胚胎。每组评估的构建体轰击超过50个未成熟的玉米愈伤组织。在轰击后使组织在培养中维持3天。在第1天和第3天(再次)通过荧光显微法确定GFP表达,以验证轰击和转化一致。在第3天进行荧光显微法后,对愈伤组织进行X-Gluc染色并拍摄代表性愈伤组织的荧光和光显微图(图4)。所有愈伤组织的荧光染色表明转化良好。
转化中所用的阴性对照包括具有Zm231基因组靶标位点(1)缺乏Cas9核酸内切酶表达盒和任何sgRNA表达盒;或(2)具有含染色体8的玉米U6启动子的Zm231-sgRNA表达盒,但缺乏Cas9核酸内切酶表达盒的修饰报告基因构建体GU-Zm231-US(图4)。这些对照均未显示出X-Gluc染色检测的蓝色部分,表明修饰报告基因构建体未发生CRISPR介导的切割(图4)。
还可使用对照评估CRISPR/Cas9系统的特异性,该对照包括修饰GUUS报告基因构建体中前间隔序列位点和sgRNA间隔序列之间的错配。特别地,错配在具有Zm231基因组靶标位点的修饰报告基因构建体GU-Zm231-US和(1)具有Zm14间隔序列和染色体8的玉米U6启动子的sgRNA表达盒;或(2)具有Zm231间隔序列和染色体8的玉米U6启动子的sgRNA表达盒之间(图4)。
最后,将每个397bp玉米U6启动子(染色体1、2、3和8)用于生成具有Zm231基因组靶标位点的sgRNA表达盒。这些启动子中的每个与Zm231基因组靶标位点制备的修饰报告基因构建体GU-Zm231-US共转化。结果表明,当sgRNA间隔序列与报告基因构建体的基因组靶标位点错配时,很少检测到GUS活性。相比之下,当sgRNA间隔序列与报告基因构建体的基因组靶标位点匹配时,可检测到多个大的蓝色焦点(图4)。玉米染色体8的U6启动子可具有较高功效(基于如下假设:功效与蓝色焦点更多、大小更大、染色强度更深有关),然后是玉米染色体1的U6启动子。玉米染色体2和3的U6启动子显示出彼此类似的功效(Chr 8>Chr 1>Chr2≈Chr3)。
玉米染色体8的U6启动子驱动的sgRNA一致地显示出高活性。这些发现暗示,不同的玉米U6启动子具有不同的活性,并且强调U6启动子的有效性来源于靶向基因组修饰的CRISPR/Cas系统中的玉米染色体8。
实施例5
平末端寡核苷酸整合
评估CRISPR/Cas9系统的平末端双链DNA片段插入三个基因组靶标位点(称为玉米基因组内的Zm_L70a(SEQ ID NO:47)、Zm_L70c(SEQ ID NO:59)和Zm_L70d(SEQ ID NO:61))中的一者的靶向功效。这三个基因组靶标位点中的每个均为玉米基因组独特的。如果CRISPR元件能够具有核酸内切酶活性,并且将双链断裂(DSB)引入选择基因组靶标位点的前间隔序列,则内源性玉米非同源性末端接合DNA修复系统将使平末端双链DNA片段插入DSB。
使互补寡核苷酸预先退火,形成平末端双链DNA片段,这些片段与CRISPR构建体一起共转化至玉米原生质体(图5A)。寡核苷酸对设计为(1)不包含微同源区域(参见图5B),或(2)每个末端(5’和3’)包含与对应的5’和3’侧面序列微同源的3bp,该5’和3’侧面序列位于基因组靶标位点中前间隔序列的切割位点处(图5C)。微同源序列可促进通过基因组靶标位点处微同源驱动的非同源性末端接合机制进行的平末端双链DNA片段整合。两个无微同源序列的寡核苷酸对序列为SEQ ID NO:45和SEQ ID NO:46。三个寡核苷酸对中的每个包含与它们各自的基因组靶标位点的微同源,将这三个寡核苷酸对与以下寡核苷酸成对组合进行退火:(1)SEQ ID NO:62和SEQ ID NO:63(与Zm_L70a微同源);(2)SEQ ID NO:64和SEQ IDNO:65(与Zm_L70c微同源);和(3)SEQ ID NO:66和SEQ ID NO:67(与Zm_L70d微同源),形成平末端双链DNA片段。
对于这些平末端双链DNA片段的整合分析,所用的CRISPR构建体包括上述Cas9核酸内切酶表达盒,以及三个sgRNA表达盒中的一者。三个sgRNA表达盒各自被玉米染色体8的U6启动子397bp型式(SEQ ID NO:7)驱动,并且包含基因组靶标位点:Zm_L70a(SEQ ID NO:48)、Zm_L70c(SEQ ID NO:58)和Zm_L70d(SEQ ID NO:60)对应的间隔序列。对于这些分析,CRISPR元件和寡核苷酸的不同组合如下所述混合:0.6pmol Cas9表达盒、1.6pmol sgRNA表达盒中的一者和35pmol预先退火的寡核苷酸对,并且使用PEG介导的标准方案转化至包含约320,000个细胞的玉米叶原生质体悬浮液等分试样。两天后,收集玉米原生质体并分析特定L70基因组靶标位点的平末端双链DNA片段插入,该位点在每种情况下由所选的独特sgRNA靶向(表4)。在玉米原生质体转化期间,阴性对照为Cas9表达盒缺失。
为检测玉米染色体的平末端双链DNA片段插入,提取DNA并使用多对引物(表5)进行高通量热扩增(PCR)。由于平末端双链DNA片段可以任一方向插入染色体DNA切割的CRISPR,所以引物设计为一条链的平末端双链DNA片段和两个侧面基因组区域,其中每个引物对跨越插入位点的接头。在Life Technologies(Grand Island,NY)的片段分析平台(ABI3730 DNA分析仪)上分离PCR扩增子。该平台比基于凝聚的电泳法更灵敏,并且具有单bp分辨率,以确认扩增子是否来源于所关注的模板,并且它们是否为实验处理条件特异性的。
表4.包含与玉米基因组靶标位点L70a、L70c、L70d的前间隔序列互补的间隔序列的酿脓链球菌sgRNA的DNA和RNA序列。
一个代表性片段分析谱如图5D所示(实验T3、表5)。使用Zm_L70c基因组靶标位点处的引物(SEQ ID NO:49,所插入平末端双链DNA片段特异性引物,以及SEQ ID NO:55,侧面基因组DNA特异性引物)扩增从玉米原生质体提取的DNA,显示出预期大小的主峰和多个类似大小的另外的峰(箭头),该原生质体使用Cas9、sgRNA(包含与Zm_L70c玉米基因组靶标位点的前间隔序列互补的间隔序列(SEQ ID NO:83))以及无微同源的平末端双链DNA片段转化(图5D,顶部插图)。相比之下,从阴性对照转化提取的DNA未见扩增产物(图5D,底部插图)。该PCR谱与非同源性末端接合错误修复的双链断裂一致,导致在修复位点引入短插入缺失。
为确认平末端双链DNA片段并入基因组靶标位点,克隆PCR扩增子并测序(表5)。缺乏Cas9蛋白的阴性对照不生成PCR产物。十个实验中的七个显示出预期模式:测试样品得到预期大小的阳性PCR产物,而对照样品无PCR产物。显示阳性PCR产物的七个实验包括显示出含有和不含微同源的平末端双链DNA片段均发生整合的实验。实验T1和T7不能检测测试或对照样品中的靶向整合。克隆六个实验的PCR产物并测序,确认预期的DNA片段-染色体接头发生平末端双链DNA片段整合。测序结果显示,平末端双链DNA片段整合的位点同时存在全长和截短的DNA片段(插入缺失)(参见,例如图5E、实验T1)。序列与片段分析一致(图5D),并显示CRISPR/Cas9可靶向玉米原生质体中切割的天然的序列特异性的染色体基因座。这些结果还显示出含有和不含微同源区域的平末端双链DNA片段的成功整合。
其中*=样品被污染。
实施例6
使用嗜热链球菌的CRISPR/Cas9复合物基因进行靶向基因组修饰
期望使用来源于嗜热链球菌而不是酿脓链球菌的CRISPR复合物基因实现一些植物(如,作物)的CRISPR介导的基因组修饰可为可取的。发明人开发了编码具有两个核定位信号(NLS)的密码子优化的核苷酸序列的表达盒(SEQ ID NO:136),该核定位信号是嗜热链球菌的Cas9蛋白的核定位信号(SEQ ID NO:69)。StCas9设计为编码氨基酸位置2-11和1133-1142(SEQ ID NO:135)处的N-末端和C-末端核定位信号(NLS)(SEQ ID NO:120)。另外,DNA表达盒(SEQ ID NO:136)包括核苷酸位置507-695处的内含子。设计了一系列独特的嗜热链球菌单向导RNA(sgRNA)。嗜热链球菌sgRNA设计为将天然嗜热链球菌crRNA和tracrRNA与茎环(5’-CCAAAAGG-3’;SEQ ID NO:105)连接,以及包含与选自Zm_L70e(SEQ IDNO:72)、Zm_L70f(SEQ ID:73)、Zm_L70g(SEQ ID NO:74)或Zm_L70h(SEQ ID NO:75)的玉米基因组靶标位点的前间隔序列互补的间隔序列。在每个这些基因组靶标位点的3’末端处的七个核苷酸代表嗜热链球菌特异性前间隔序列邻近基序(PAM,5’-NNAGAAW-3’;SEQ ID NO:106)。图6示出了该嗜热链球菌sgRNA(SEQ ID NO:70)预测二级结构,该sgRNA具有与玉米Zm_L70h基因组靶标位点的前间隔序列(SEQ ID NO:75)互补的一个拷贝的间隔序列(SEQID NO:71)和茎环接头(5’-CCAAAAGG-3’;SEQ ID NO:105)。表6列出了编码嗜热链球菌sgRNA的DNA和RNA序列的对应SEQ ID NO,该sgRNA包含与玉米基因组靶标位点Zm_L70e、Zm_L70f、Zm_L70g和Zm_L70h的前间隔序列互补的间隔序列。
表6.嗜热链球菌sgRNA的DNA和RNA序列,该sgRNA包含与玉米基因组靶标位点Zm_L70e、Zm_L70f、Zm_L70g和Zm_L70h的前间隔序列互补的间隔序列。
嗜热链球菌Cas9介导的基因组修饰分析基本上如实施例5所述。特别地,使用0.8pmol嗜热链球菌Cas9(SEQ ID NO:136)表达构建体,以及1.6pmol玉米染色体8的U6启动子的397bp型式(SEQ ID NO:7)(包含基因组靶标位点对应的间隔序列)驱动的sgRNA表达构建体:位点L70e的sgRNA构建体(SEQ ID NO:107)、位点L70f的sgRNA构建体(SEQ ID NO:108)和位点L70g的sgRNA构建体(SEQ ID NO:109)中的一者,以及50pmol SEQ ID NO:115和SEQ IDNO:116编码的预先退火的平末端双链DNA片段转染320,000个玉米原生质体。为测试转化效率,包括2.5ug编码绿色荧光蛋白(GFP)的构建体。在收集时,收集转染原生质体的等分试样,在PE成像系统(PerkinElmer,Waltham,MA)上计算转染频率,该系统计算GFP阳性细胞/总细胞的比率。在玉米原生质体转化期间的StCas9表达盒缺失作为阴性对照。在转染后48小时收集原生质体,并使用BioRad QX200TM Droplet DigitalTM PCR(ddPCRTM)系统(BioRad,Hercules,CA)和探针通过定量高通量PCR分析基因组靶标位点L70e或L70f或L70g的平末端双链DNA片段插入。为测定靶向整合率百分比,将一组TaqMan引物和探针与ddPCR系统一起用于检测染色体靶标位点处插入平末端双链DNA片段的接头的模板拷贝数。玉米染色体位点L70e、L70f、L70g和L70h的接头特异性引物和探针如表7所示。为使转染原生质体等分试样中DNA的量归一化,将ddPCR系统与第二组TaqMan引物和探针(SEQID NO:132和SEQ ID NO:134编码的引物;SEQ ID NO:133编码的探针)一起用于测定玉米基因组中和靶标位点外部独特的位点的模板拷贝数。靶向整合率百分比的计算为靶标位点特异性模板拷贝数除以玉米基因组特异性模板拷贝数除以转化频率(通过使用PE成像系统(PerkinElmer,Waltham,MA)进行GFP阳性细胞与总细胞计数来确定)。图中展示的数据点通过四次生物平行测定的平均值确定。结果展示于图15中,该结果显示位点L70e,L70f,and L70g中的每个的整合率百分比高于对应的对照。
对来自原生质体实验的靶向接头对应的PCR扩增子测序,以确定所选靶标位点的平末端双链DNA片段整合。图15B示出了L70f靶标位点处平末端双链DNA片段的预期整合(SEQ ID NO:144)以及一些DNA片段序列缺失的靶标位点整合的一个实施例(SEQ ID NO:145)的比对。虽然这些测序结果显示出插入缺失,但结果确认DNA片段整合至L70f靶标位点。
表7.PCR扩增具有插入DNA片段的玉米染色体靶标位点处的接头的引物和探针的SEQ ID NO。
实施例7
通过sgRNA多重化靶向多个独特的基因组位点
与其它基因组工程化平台相比,CRISPR系统的关键优点是,涉及单个和独特的基因组靶标位点的多个sgRNA可以单个元件递送,以实现靶向。或者,涉及单个和独特的基因组靶标位点的多个sgRNA可在单个表达载体中多重化(即,叠堆),以实现靶向。可需要多个靶向核酸内切的应用的一个实例包括从转基因事件移除标记基因(图7A)。CRISPR系统可用于从转基因插入物移除选择性标记,留下所关注的基因。
其中可使用此类CRISPR/Cas系统的应用的另一个实施例是,存在多个靶向核酸内切的需要的情况,诸如使候选基因彼此分离的QTL区域中缺乏减数分裂重组阻碍数量性状背后的因果基因的鉴定的情况。这可通过使用同时靶向所关注的基因的多个CRISPR构建体进行转化来防止。这些构建体可通过移码突变敲除候选基因或通过缺失将它们移除。此类转化也可导致允许鉴定因果基因的完整和突变基因座的随机组合(图7B)。
实施例8
整合率随平末端DNA片段浓度和时间而变化
使用基本上如实施例5所述的玉米原生质体系统确定分析混合物中包括的平末端双链DNA片段的最佳浓度,以实现最高靶向整合率百分比。对于这些分析,编码酿脓链球菌Cas9的表达构建体修饰为包括编码区中位置469-657的内含子(SEQ ID NO:119)。另外,蛋白质序列(SEQ ID NO:118)包含两个NLS序列(SEQ ID NO:120),一个在氨基末端(SEQ IDNO:118的氨基酸2至11),一个在羧基末端(SEQ ID NO:118的氨基酸1379至1388)。
对于该分析,使用0.8pmol酿脓链球菌Cas9(SEQ ID NO:119)表达构建体,以及1.6pmol玉米染色体8的U6启动子的397bp型式(SEQ ID NO:7)(包含基因组靶标位点对应的间隔序列)驱动的sgRNA表达构建体:Zm7(SEQ ID NO:23),以及1、5、10、25、50和100 pmol预先退火的平末端双链DNA片段(SEQ ID NO:115和SEQ ID NO:116)转染320,000个玉米原生质体。对于转化效率,包括2.5ug编码绿色荧光蛋白(GFP)的构建体,并测定每320,000个玉米原生质体的GFP阳性原生质体的数量。在玉米原生质体转化期间的Cas9表达盒缺失作为阴性对照。在转染后24小时和48小时收集原生质体,并使用BioRad QX200TM DropletDigitalTM PCR(ddPCRTM)系统(BioRad,Hercules,CA)和探针通过定量高通量PCR分析Zm7基因组靶标位点的平末端双链DNA片段插入。为测定靶向整合率百分比,将一组Taqman引物(SEQ ID NO:137和SEQ ID NO:143表示)和探针(以SEQ ID NO:138表示)与ddPCR系统一起用于检测染色体Zm7靶标位点处插入平末端双链DNA片段的接头的模板拷贝数。为使转染原生质体等分试样中DNA的量归一化,将ddPCR系统与第二组Taqman引物和探针(SEQ ID NO:132和SEQ ID NO:134编码的引物;SEQ ID NO:133编码的探针)一起用于测定玉米基因组中和靶标位点外部独特的位点的模板拷贝数。靶向整合率百分比的计算为靶标位点特异性模板拷贝数除以玉米基因组特异性模板拷贝数除以转化频率(通过使用PEOperetta成像系统(PerkinElmer,Waltham,MA)进行GFP阳性细胞与总细胞计数来确定)。图中展示的数据点通过四次生物平行测定的平均值确定。结果展示于图8中,该结果显示靶向整合率百分比的峰值使用50pmol平末端双链DNA片段并温育48小时获得。
实施例9
整合率随Cas9核酸内切酶浓度而变化
使用基本上如实施例8所述的玉米原生质体系统建立原生质体转染混合物中包括的编码酿脓链球菌Cas9的表达构建体的最佳浓度,以实现与平末端双链DNA片段的最高靶向整合率百分比。对于这些分析,编码修饰酿脓链球菌Cas9的表达构建体如实施例8所述。对于该分析,使用0.1pmol或0.4pmol或0.8pmol或1.6pmol酿脓链球菌Cas9(SEQ ID NO:119)表达构建体,以及1.6pmol玉米染色体8的U6启动子的397bp型式(SEQ ID NO:7)(包含基因组靶标位点对应的间隔序列)驱动的sgRNA表达构建体:Zm7(SEQ ID NO:23),50pmol预先退火的平末端双链DNA片段(SEQ ID NO:115和SEQ ID NO:116),以及编码GFP的构建体转染320,000个玉米原生质体。在转染后48小时收集玉米原生质体,并使用ddPCR系统和Taqman探针如实施例8所述评估靶向整合百分比。Cas9表达构建体滴定分析结果展示于图9中,图中示出靶向整合率百分比在测试表达构建体浓度pmol的全范围内线性增加。
实施例10
平末端双链DNA片段插入的序列确认
对实施例5和实施例8中详述的原生质体实验的靶向接头对应的PCR扩增子测序,以确认平末端双链DNA片段整合至选择靶标位点Zm7或L70c。
对于CRISPR/Cas9构建体靶向的玉米染色体位点Zm7,以及SEQ ID NO:115和SEQID NO:116编码的退火寡核苷酸形成的平末端双链DNA片段(参见实施例8),通过琼脂糖凝胶纯化PCR扩增子并测序。预期序列如SEQ ID NO:123所展示,并示于图10A中。测序结果显示了平末端双链DNA片段的碱基对完全插入靶标位点的至少一个事件(SEQ ID NO:124)。结果还显示了染色体或接头的DNA插入物侧具有短缺失的事件,如SEQ ID NO:125所示(参见图10A)。
对于CRISPR/Cas9构建体靶向的玉米染色体位点L70c,以及SEQ ID NO:45和SEQID NO:46编码的退火寡核苷酸形成的无微同源序列的平末端双链DNA片段(参见实施例5),通过琼脂糖凝胶纯化PCR扩增子并测序。预期序列如SEQ ID NO:126所展示,并示于图10B中。测序结果显示了平末端双链DNA片段的碱基对完全插入靶标位点检测到的至少一个事件(SEQ ID NO:127)。结果还显示了染色体或接头的DNA插入物侧具有短缺失的事件的实例,如SEQ ID NO:128所示(参见图10B)。
对于CRISPR/Cas9构建体靶向的玉米染色体位点L70c,以及SEQ ID NO:121和SEQID NO:122编码的退火寡核苷酸形成的DNA片段的每个末端具有3bp微同源序列的平末端双链DNA片段(参见实施例5),通过琼脂糖凝胶纯化PCR扩增子并测序。预期序列如SEQ ID NO:129所展示,并示于图10C中。测序结果显示了在平末端双链DNA片段的接头处碱基对完全插入靶标位点检测到的至少一个事件(SEQ ID NO:130)。结果还显示了染色体或接头的DNA插入物侧(SEQ ID NO:131)和/或DNA插入物本身(SEQ ID NO:130和SEQ ID NO:131)具有短缺失的事件的实例,如图所示(参见图10C)。
这些结果表明,平末端双链DNA片段并入CRISPR/Cas9系统创建的靶标位点处的双链断裂(DSB)。DNA片段通过非同源性末端接合(NHEJ)并入,该非同源性末端接合是自然界中愈合大多数体细胞双链断裂的易错DNA修复机制。与内源性NHEJ修复机制一致的是,结果显示平末端双链DNA片段通过CRISPR/Cas9元件创建的DSB处的短缺失并入,如SEQ ID NO:123和SEQ ID NO:125的比较(图10A),以及SEQ ID NO:126和SEQ ID NO:128的比较(图10B),以及SEQ ID NO:129和SEQ ID NO:131的比较(图10C)(最后一对的插入DNA片段内部也具有2bp缺失)所示。平末端双链DNA片段以碱基对完全的方式并入CRISPR/Cas9元件创建的DSB,如SEQ ID NO:123和SEQ ID NO:124的比较(图10A),以及SEQ ID NO:126和SEQ IDNO:127的比较(图10B),以及SEQ ID NO:129和SEQ ID NO:130的比较(图10C)(尽管最后一对的插入DNA片段内部具有2bp缺失)所示。
实施例11
整合率随TALEN核酸内切酶浓度而变化
使用基本上如实施例8所述的玉米原生质体系统建立转染混合物中所需的编码一对TALEN核酸内切酶的表达构建体的最佳浓度,以实现平末端双链DNA片段的最高靶向整合率百分比。
对于这些分析,测试一对具有TALEN编码盒的表达构建体。玉米染色体中TALEN对的靶向位点是L70.4。对于TALEN分析,使用0、0.01、0.02、0.05、0.1、0.2和0.4pmol每个包含TALEN编码盒的构建体进行玉米原生质体转化。还包括50pmol预先退火的平末端双链DNA片段(SEQ ID NO:115和SEQ ID NO:116)和2.5ug编码GFP的构建体。在转染后48小时收集玉米原生质体,并且基本上如前述实施例所述通过高通量PCR分析评估靶向整合百分比。TALEN表达构建体滴定分析结果展示于图11中,图中示出了转染反应中包括的约0.1pmol每个TALEN表达构建体的靶向整合率百分比平稳曲线。
实施例12
通过同源重组进行靶向整合-CRISPR/Cas9
通过所需的引入DNA序列的靶向整合进行基因组修饰将发生在染色体中的双链断裂(DSB)位点。DNA序列的整合通过非同源性末端接合(NHEJ)机制或使用宿主细胞的DNA修复机制的同源重组介导。宿主细胞基因组中特定位点的DSB可使用核酸内切酶诸如工程化大范围核酸酶、工程化TALEN或CRISPR/Cas9系统实现。
NHEJ和HR介导的靶向整合的高通量(HTP)测试法示意图如图12所示。通过非同源性末端接合(NHEJ)进行的DNA片段的靶向整合如图12A所示,通过同源重组(HR)进行的DNA片段的靶向整合如图12B所示。对于HR,将包含具有侧面左和右同源臂(分别为左HA和右HA)的DNA片段的盒的重组DNA构建体引入宿主细胞。在NHEJ或HR靶向整合后,设计引物(以图12A和12B中的成对短箭头表示)进行HTP PCR分析,以检测其中一个引物在插入DNA片段内部,第二个引物位于侧面染色体区域的靶向事件。
使用以上实施例所述的玉米原生质体系统测定同源重组(HR)介导的靶向整合率。靶标位点Zm7被CRISPR/Cas9核酸酶和靶向玉米Zm7位点的sgRNA靶向,如实施例8所述。除编码CRISPR/Cas9和sgRNA盒的构建体之外,还以4ug的浓度或6ug的浓度包括包含同源重组盒的构建体。如上所述,还转染编码GFP的构建体,并使用GFP阳性细胞的百分比计算靶向整合率。对照不包含编码SpCas9核酸内切酶的构建体。
包含同源重组盒的重组DNA构建体被设计为具有用于NHEJ分析的90bp平末端双链DNA片段对应的90bp序列(由序列SEQ ID NO:115和SEQ ID NO:116编码),该序列侧面具有左和右同源臂(HA)。左HA根据用于靶向整合的双链断裂(DSB)位点5’-侧的侧面序列设计。右HA根据用于靶向整合的双链断裂(DSB)位点3’-侧的侧面序列设计。对于Zm7位点,左HA的长度为240bp,并且包括两个单独的右HA序列,一个的长度为230bp,另一个的长度为1003bp(分别参见图13A和13B)。
转染原生质体,并在48小时后收集,通过高通量PCR分析整合,一个引物设计为DNA片段序列(由序列SEQ ID NO:115和SEQ ID NO:116编码)的区域,另一个引物在左同源臂侧面的染色体区域中。使用Zm7靶向构建体(图13A和13B)成功引入HR的预期PCR扩增子的大小为411bp。在常规定量PCR(qPCR)中,大于约160bp的扩增子不能定量测定,因此不推荐使用。当前实验清晰表明,显著较长的PCR扩增子也可用于ddPCR系统,这开辟了定量生物学的很多新机遇。
玉米染色体位点Zm7的HR介导的重组率展示于表8和图15中。当左HA和右HA分别为240bp和230bp时,具有同源臂盒的构建体的浓度为4ug或6ug,测试样品和对照之间的整合率百分比无统计学上显著的差异。当左HA为240bp,右HA为1003bp(在表8中以SL表示)时,具有同源臂盒的构建体的浓度为4ug,测试样品和对照之间的整合率百分比无统计学上显著的差异。相比之下,当左HA为240bp,右HA为1003bp(在表8中以SL表示)时,具有同源臂盒的构建体的浓度为6ug,测试样品和对照之间的整合率百分比具有统计学上显著(p<0.05)的差异。此结果显示,靶向整合可通过DSB位点处HR的机制实现,该位点被玉米基因组中的CRISPR/Cas9系统靶向。
表8.玉米原生质体(在染色体位点Zm7处具有CRISPR/Cas9系统介导的DSB)的HR介导的整合率。
**根据学生t-检验,测试在统计上高于(p<0.05)相应的对照。
实施例13
通过同源重组进行靶向整合-TALEN
使用以上实施例所述的玉米原生质体系统测定同源重组(HR)介导的靶向整合率。靶标位点L70.4被一对编码TALEN对的重组DNA构建体靶向,该TALEN对涉及靶向玉米L70.4位点,如实施例11所述。除编码TALEN盒的构建体之外,还以4ug的浓度或6ug的浓度包括包含同源重组盒的构建体。如上所述,还转染编码GFP的构建体,并使用GFP阳性细胞的百分比计算靶向整合率。对照不包含编码TALEN的构建体。
包含同源重组盒的重组DNA构建体被设计为具有用于NHEJ分析的90bp平末端双链DNA片段对应的90bp序列(由序列SEQ ID NO:115和SEQ ID NO:116编码),该序列侧面具有左和右同源臂(HA)。左HA根据用于靶向整合的双链断裂(DSB)位点5’-侧的侧面序列设计。右HA根据用于靶向整合的双链断裂(DSB)位点3’-侧的侧面序列设计。对于L70.4位点,右HA的长度为230bp,并且包括两个单独的左HA序列,一个的长度为230bp,另一个的长度为1027bp(分别参见图14A和14B)。
转染原生质体,并在48小时后收集,使用ddPCR系统和Taqman探针通过定量、高通量PCR分析整合,一个引物设计为DNA片段序列(由序列SEQ ID NO:115和SEQ ID NO:116编码)的区域,另一个引物在左同源臂侧面的染色体区域中。使用图14A的L70.4靶向构建体成功引入HR的预期PCR扩增子的大小为383bp。使用图14B的L70.4靶向构建体成功引入HR的预期PCR扩增子的大小为1208bp。
具有两个单独的模板DNA构建体的玉米染色体位点L70.4的HR介导的重组率展示于表9中。当左HA和右HA均为230bp(在表9中以SS表示)时,具有同源臂盒的构建体的浓度为4ug,测试样品和对照之间的整合率百分比具有统计学上显著(p<0.05)的差异。当左HA和右HA均为230bp(在表9中以SS表示)时,具有同源臂盒的构建体的浓度为6ug,测试样品和对照之间的整合率百分比无统计学上显著的差异。当左HA为1027bp,右HA为230bp(在表9中以LS表示)时,具有同源臂盒的构建体的浓度为4ug或6ug,测试样品和对照之间的整合率百分比无统计学上显著的差异。此结果显示,靶向整合可通过DSB位点处HR的机制实现,该位点被玉米基因组中的涉及特异性位点的TALEN靶向。
表9.玉米原生质体(在染色体位点L70.4处具有TALEN介导的DSB)的HR介导的整合率。
**根据学生t-检验,测试在统计上高于(p<0.05)相应的对照。
实施例14
使用嵌合U6启动子在玉米基因组中靶向
嵌合U6启动子被确定为可有效驱动sgRNA构建体的表达,并导致玉米染色体中预选位点处双链平末端DNA片段的靶向整合。在玉米原生质体分析中使用定量染色体切割分析进行这些实验,如实施例5和实施例6所述。并入sgRNA构建体的U6启动子为:a)SEQ IDNO:7编码的397bp玉米染色体8U6启动子、b)SEQ ID NO:18编码的397bp ch1:ch8嵌合U6启动子、b)SEQ ID NO:19编码的397bp ch8:ch1嵌合U6启动予以及c)SEQ ID NO:20编码的397bp ch8:ch2:ch1:ch8嵌合U6启动子。玉米染色体靶标位点为L70a、L70c和L70d,如实施例5所述。CRISPR/Cas9系统利用表达盒,其酿脓链球菌Cas9修饰为包含两个NLS序列和内含子,并且由SEQ ID NO:119编码。双链平末端DNA片段由SEQ ID NO:115和SEQ ID NO:116编码。
在一个分析中,在使用CRISPR/Cas9系统元件转染玉米原生质体后48小时,使用TaqMan探针进行定量分析。结果(参见图16A)显示了靶标位点L70a的靶向整合率,其中包含ch8 U6启动子的sgRNA构建体或包含嵌合ch1:ch8 U6启动子的sgRNA构建体产生约相等的靶向整合率百分比。靶标位点L70c的靶向整合率,包含嵌合ch8:ch1 U6启动子的sgRNA构建体产生的靶向整合率为包含ch8 U6启动子的sgRNA构建体的约两倍。靶标位点L70d的靶向整合率,包含ch8 U6启动子的sgRNA构建体具有的靶向整合率比包含嵌合ch8∶ch2∶ch1∶ch8U6启动子的sgRNA构建体更高。
在另一个分析中,在使用CRISPR/Cas9系统元件转染玉米原生质体后48小时,使用(BioRad,Hercules,CA)插入染料进行定量分析。结果(参见图16B)显示,包含ch8 U6启动子的sgRNA构建体的靶向整合率与包含嵌合ch1:ch8 U6启动子的sgRNA构建体在靶标位点L70a处,以及包含嵌合ch8:ch1 U6启动子的sgRNA构建体在靶标位点L70c处,以及包含嵌合ch8:ch2:ch1:ch8 U6启动子的sgRNA构建体在靶标位点L70d处的靶向整合率几乎相等。这些数据表明,EvaGreen插入染料检测的靶向整合率比使用MGB TaqMan探针检测的靶向整合率高约十倍。这种偏差主要是由于分析的化学性质的差异。TaqMan分析仅使用两个引物和内部探针,其中一个引物和探针位于插入DNA片段序列上。遗憾的是,用于转染的双链平末端DNA片段通常在原生质体中发生内源性核酸外切酶降解,这导致了DNA片段与其中TaqMan探针结合的截短的位点整合。这些截短的整合事件不可通过TaqMan分析检测。在另一个方面,位于插入DNA片段序列内的TaqMan引物结合位点位于插入DNA片段的更内部,并且即使截成最短的插入DNA片段也保持完整。由于使用插入Evagreen染料的分析不需要内部探针,只需要TaqMan引物,所以该分析不受寡核苷酸降解的影响,因此可检测的整合比TaqMan分析更多。另外,两种测定靶向整合百分比的方法在三个染色体靶标位点和三种不同的驱动sgRNA表达的嵌合U6启动子显示出类似的方式。
这些结果显示,sgRNA构建体包含Ch8::Ch1嵌合启动子时,玉米染色体位点L70c处的靶向整合率显著稍高于sgRNA构建体包含ch8 U6启动子时的靶向整合率(图16A和16B)。这些结果还显示,sgRNA构建体包含Ch1::Ch8嵌合启动子时,玉米染色体位点L70a处的靶向整合率约等于sgRNA构建体包含ch8 U6启动子时的靶向整合率(图16A和16B)。最后,这些结果显示,sgRNA构建体包含ch8:ch2:ch1:ch8嵌合启动子时,玉米染色体位点L70d处的靶向整合率低于sgRNA构建体包含ch8 U6启动子时的靶向整合率(图16A和16B)。总之,三个嵌合启动子中的至少两个相当于或超过玉米中最佳非嵌合启动子。这些启动子将用于多重靶向实验,其中表达元件的多样性是必不可少的。
实施例15
在番茄转化酶抑制剂中靶向突变
CRISPR/Cas9系统用于在NHEJ不完全修复靶向双链断裂后,通过引入靶向移码点突变来敲除番茄的质体外转化酶抑制剂基因(INVINHl)。在早期研究中,通过RNAi敲除该基因显示出果糖含量升高和种子重量增加(Jin等Plant Cell 21:2072-2089,2009)。通过靶向诱变或RNA干扰降低或消除转化酶抑制剂活性还用于提高其它庄稼物种的产率和/或质量性状(Braun等J Exp Bot 65:1713-1735,2014)。
对于这些实验,使用包含编码SpCas9的盒且一个NLS位于C-末端的表达构建体(SEQ ID NO:28)和一个编码sgRNA盒的表达构建体转染番茄原生质体,其中表达由4个单独的番茄U6启动子中的一者驱动:SEQ ID NO:146编码的启动子1(它是SEQ ID NO:10的片段)、SEQ ID NO:147编码的启动子2(它是SEQ ID NO:11的片段)、SEQ ID NO:148编码的启动子3(它是SEQ ID NO:9的片段)或SEQ ID NO:149编码的启动子4。sgRNA靶向无SmlI位点的转化酶抑制剂位点(位点1)或具有SmlI限制性核酸内切酶位点的转化酶抑制剂基因中的位点(标记为位点2)。位点2sgRNA由SEQ ID NO:150编码。靶标位点2内的CRISPR/Cas9切割位点包含SmlI限制性核酸内切酶位点。在CRISPR/Cas9诱导靶标位点2处的双链断裂时,NHEJ修复将导致该位点的插入缺失,因此有效地移除了SmlI限制性核酸内切酶位点。SmlI位点的此突变在靶向事件的筛选期间得到利用,该筛选通过扩增380bp扩增子(SEQ IDNO:159)并使PCR扩增子经受SmlI消化来进行。如果SmlI位点不突变,则扩增子可被消化为181bp和199bp的两个片段。如果SmlI位点突变,则PCR扩增子不能被消化。该PCR方案如图17A所示。
用靶向番茄转化酶抑制剂的CRISPR/Cas9系统转染番茄原生质体,在48小时后收集并提取基因组DNA。CRISPR/Cas9系统的阴性对照为编码Cas9核酸内切酶的表达构建体缺失。靶标位点的阴性对照为靶向位点1的sgRNA的使用,并且不期望该sgRNA的SmlI位点突变。使用引物SEQ ID NO:157和SEQ ID NO:158进行PCR扩增,不消化或用SmlI消化所得的PCR扩增子。反应在琼脂糖凝胶上运行,结果如图17B所示。靶向位点1的sgRNA的阴性对照和Cas9核酸内切酶的缺失仅产生SmlI位点完整的PCR扩增子。当sgRNA靶向位点2时,sgRNA盒包含番茄U6启动子1或番茄U6启动子2或番茄U6启动子3的情况下,SmlI位点是突变的,如全长PCR扩增子所证实(参见图17B,箭头示出了无SmlI位点的扩增子)。靶向位点2并且具有U6启动子4的sgRNA构建体表观上未显示出靶向。
为确认无SmlI位点的PCR扩增子实际上是由于CRISPR/Cas9诱导的NHEJ突变,凝胶纯化并合并这些表观突变的扩增子,然后对它们进行测序。图17C的多序列比对显示,这些无SmlI位点的PCR扩增子来自番茄转化酶抑制剂的靶标位点2,并且包含插入缺失,与CRISPR/Cas9诱导的突变一致。特别地,在多序列比对中,SEQ ID NO:151表示无突变的PCR扩增子区域(SEQ ID NO:159)。SEQ ID NO:152和153示出了其中切割位点处具有1bp插入的插入缺失。SEQ ID NO:154示出了切割位点处具有3bp缺失的插入缺失。SEQ ID NO:155示出了切割位点处具有4bp缺失的插入缺失。SEQ ID NO:156示出了切割位点处具有6bp缺失的插入缺失。总之,这些结果表明,使用番茄U6启动子1(SEQ ID NO:146)或番茄U6启动子2(SEQ ID NO:147)或番茄U6启动子3(SEQ ID NO:148)驱动sgRNA的CRISPR/Cas9系统包括番茄转化酶抑制剂基因靶标位点2的突变。
实施例16
驱动sgRNA表达的启动子
为鉴定和选择可用于驱动引入双子叶植物和单子叶植物的表达盒的sgRNA表达的另外启动子,针对大豆和玉米基因组使用BLAST比较编码U6、U3、U5、U2和7SL小核RNA(snRNA)的序列鉴定RNA聚合酶II(Pol II)和RNA聚合酶III(Pol III)启动子(SEQ ID NO:160-201和SEQ ID NO:247-283)(参见表10)。根据该生物信息学比对区域,使用紧邻相应的snRNA编码区的5’末端上游的200或更多个核苷酸作为驱动引入植物细胞的表达盒的sgRNA表达的推定启动子进行测试。
表10.snRNA基因上游的推定启动子序列的SEQ ID NO和来源(番茄或大豆或玉米)。
实施例17
归一化RNA转录物水平分析
为评估表10中列出的启动子驱动sgRNA表达的功效,制备包含编码推定启动子中的一者(SEQ ID NO:154和SEQ ID NO:160-201)的盒的一系列构建体,该推定启动子可操作地连接至β-葡糖醛酸酶(GUS)开放阅读框的221bp片段,以及Pol III启动子(7SL、U6和U3)的多聚(T)7终止子或pol II U2和U5启动子的序列5’-ACAATTCAAAACAAGTTTTAT-3’(SEQ IDNO:237)(表10)。将包含启动子-GUS片段融合的重组构建体(0.5pmol)与300ng作为编码使用CaMV启动子表达的海肾荧光素酶(RLUC)的转化对照的质粒一起转染到大豆子叶原生质体(SEQ ID NO:202-217)或玉米叶原生质体(SEQ ID NO:218-236)。在转染后18小时收集转染原生质体,并通过使用与GUS片段互补的探针和引物的TaqMan分析测定RNA水平。用于归一化TaqMan分析的内参包括(1)设定为RNA浓度的对照的18S引物对/探针和(2)作为转化对照的RLUC荧光。
在大豆子叶原生质体中,所有测试启动子产生的归一化GUS mRNA水平显著高于对照(无GUS构建体)(单因素方差分析学生t-检验,p值<0.05)(图18A)。最低的归一化GUSmRNA水平为使用包含U3a启动子(SEQ ID NO:167)的构建体(SEQ ID NO:210)。最高的归一化GUS mRNA水平为使用包含7SL_CR10启动子(SEQ ID NO:174)的构建体(SEQ ID NO:210)。具有该分析的所有测试启动子的归一化GUS mRNA水平比无DNA阴性对照的表达水平高11-31倍的范围。任一类启动子(U6、U3或7SL)的性能均不超过其它类别,但U3启动子通常在实验中观察的较低表达范围内。Liang等(J.Genetics and Genomics 41∶63-68,2014)成功地使用U3启动子在玉米中驱动sgRNA。因此,虽然这些数据表明U3启动子低于U6或7SL,但它们仍是可用于在大豆中驱动sgRNA表达的候选物。这些数据暗示,此处鉴定的U6、U3或7SL启动子中的任一者将是使重组表达构建体驱动植物细胞中的sgRNA表达的良好候选物。
在玉米叶原生质体中,所有测试启动子产生的归一化GUS mRNA水平显著高于对照(单因素方差分析学生t-检验,p值<0.05),表达水平值比阴性对照高26倍至141倍的范围内(图18B)。U6Chr08启动子构建体(SEQ ID NO:235)产生最高的归一化GUS mRNA表达水平,U2snRNA_I启动子构建体(SEQ ID NO:227)产生最低的归一化GUS mRNA表达水平,它们之间差异为大约5.5倍。U2snRNA_P启动子构建体(SEQ ID NO:226)也突出地具有高归一化GUS mRNA表达水平。所有其余的启动子在相同的相对范围内,它们之间的差异小于2倍(图18B)。这些数据暗示,此处鉴定的U6、U3、7S1、U2或U5启动子中的任一者将是使重组表达构建体驱动植物细胞中的sgRNA表达的良好候选物。
实施例18
sgRNA表达的GUS表达分析
为确定sgRNA表达水平的差异如何影响Cas9活性,使用依赖于报告基因构建体(转染至玉米叶原生质体)中GUS开放阅读框上游的最小启动子的转录活化分析。对于该分析,嗜热链球菌Cas9核酸酶在天然蛋白质序列的氨基酸位置D9A和H599A处是突变的,有效地创建了无核酸内切酶切割活性的Cas9(也称为‘死亡Cas9’)。另外,该死亡Cas9修饰为编码SEQID NO:239的氨基酸位置2-11的一个NLS域(SEQ ID NO:120)和SEQ ID NO:239的氨基酸位置1135-1471的TALE蛋白的活化域。SEQ ID NO:238表示的死亡Cas9的多核苷酸序列包括位置507-695的内含子。报告基因构建体的构建如下:其中uidA(GUS)报告基因由序列SEQ IDNO:246的核苷酸位置80-98、117-135和154-172具有三个邻近的sgRNA结合位点(SEQ IDNO:240)的最小CaMV启动子驱动。还构建了一组sgRNA(基于Cong等2013Science 339∶819的sgRNA)表达构建体,该表达构建体由每种类别的snRNA基因的一个启动子,即U6、7SL、U2、U5和U3(表11)构成,并且可使死亡Cas9-TALE-AD靶向GUS报告基因构建体的一个或多个sgRNA结合位点。U6和7SL启动子通常引发G的转录,U2、U5和U3启动子通常引发A的转录。为确保sgRNA的正确转录起始,对于具有U6或7SL启动子的构建体,G插入启动子和间隔序列之间。对于具有U2、U5或U3启动子的构建体,A插入启动子和间隔序列之间。当死亡Cas9-TALE-AD和sgRNA复合物结合GUS报告基因构建体时,TALE活化域起到活化最小CaMV启动子的转录因子的作用,提高GUS转录物的表达,并最终提高GUS蛋白表达水平。
表11.sgRNA表达构建体对应的SEQ ID NO。
对于该分析,用0.8pmol死亡Cas9-TALE-AD表达盒、0.5pmol GUS表达盒、1.6pmolsgRNA表达盒中的一者、650ng荧光素酶表达盒和300ng海肾荧光素酶(RLUC)表达盒转染玉米叶原生质体。在18小时后收集转染的原生质体,使用4-甲基伞形酮-β-D-葡糖苷酸(MUG,Sigma,St.Louis,MO)荧光测定分析法测定GUS活性,并测定荧光素酶和RLUC活性作为对照,相对于转染对照进行归一化。GUS的活性是死亡Cas9-TALE-AD结合报告基因质粒频率的读数。与对照相比,每种类别驱动sgRNA的snRNA启动子得到更高的归一化GUS活性(图19)。U3CR08b(图19中的U3_8B)启动子产生最高的归一化GUS活性,约为对照的10X。两个启动子7SLCR07和U6Chr08均得到约相同的归一化GUS活性,约为对照的4X。两个启动子U2snRNA_I(图19中的Us_I)和U5snRNA_E(图19中的U5_e)的归一化GUS活性各自为或稍大于对照的2X。这些结果表明,7SL、U6、U3、U2和U5snRNA启动子可作为用于基因组修饰的CRISPR/Cas9系统的sgRNA表达构建体的良好至优异候选物。
使用死亡Cas9-TALE-AD分析观察到的归一化GUS表达的差异不反映玉米叶原生质体分析所示的归一化GUS mRNA水平,如实施例17所详述。

Claims (97)

1.一种包含snRNA启动子的重组DNA构建体,所述snRNA启动子选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;所述启动子可操作地连接至编码单向导RNA(sgRNA)的序列,其中所述snRNA启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283;或其片段,其中所述片段的长度为至少140bp。
2.根据权利要求1所述的重组DNA构建体,其中所述U6启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201或SEQ ID NO:283中的任一者,或其片段,其中所述片段的长度为至少140bp。
3.根据权利要求2所述的重组DNA构建体,其中所述U6启动子的序列包含SEQ ID NO:7。
4.根据权利要求2所述的重组DNA构建体,其中所述U6启动子的序列包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20。
5.根据权利要求1所述的重组DNA构建体,其中所述U3启动子的序列包含SEQ ID NO:167-171或SEQ ID NO:178-182中的任一者,或其片段;其中所述片段的长度为至少140bp。
6.根据权利要求1所述的重组DNA构建体,其中所述U2启动子的序列包含SEQ ID NO:183-187、SEQ ID NO:192-199或SEQ ID NO:247-275中的任一者,或其片段;其中所述片段的长度为至少140bp。
7.根据权利要求1所述的重组DNA构建体,其中所述U5启动子的序列包含SEQ ID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中所述片段的长度为至少140bp。
8.根据权利要求1所述的重组DNA构建体,其中所述7SL启动子的序列包含SEQ ID NO:172-177中的任一者,或其片段;其中所述片段的长度为至少140bp。
9.根据权利要求1所述的重组DNA构建体,还包含转录终止序列。
10.根据权利要求1所述的重组DNA构建体,还包含编码启动子的序列,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列。
11.根据权利要求10所述的重组DNA构建体,其中所述Cas核酸内切酶基因产物还可操作地连接至核定位序列(NLS)。
12.根据权利要求10所述的重组DNA构建体,其中编码所述Cas核酸内切酶的序列选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ IDNO:136。
13.一种包含snRNA启动子的重组DNA构建体,所述启动子选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;所述启动子可操作地连接至表示非编码RNA的序列,其中所述snRNA启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283,或其片段,其中所述片段的长度为至少140bp。
14.根据权利要求13所述的重组DNA构建体,其中所述非编码RNA选自由以下组成的组:微RNA(miRNA)、miRNA前体、小干扰RNA(siRNA)、小RNA(长度为22-26nt)以及编码其的前体、异染色质siRNA(hc-siRNA)、Piwi相互作用RNA(piRNA)、发夹状双链RNA(发夹状dsRNA)、反式作用siRNA(ta-siRNA)和天然存在的反义siRNA(nat-siRNA)。
15.根据权利要求13所述的重组DNA构建体,其中所述U3启动子的序列包含SEQ ID NO:167-171和SEQ ID NO:178-182中的任一者,或其片段;其中所述片段的长度为至少140bp。
16.根据权利要求13所述的重组DNA构建体,其中所述U2启动子的序列包含SEQ ID NO:183-187、SEQ ID NO:192-199或SEQ ID NO:247-275中的任一者,或其片段;其中所述片段的长度为至少140bp。
17.根据权利要求13所述的重组DNA构建体,其中所述U5启动子的序列包含SEQ ID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中所述片段的长度为至少140bp。
18.根据权利要求13所述的重组DNA构建体,其中所述U6启动子的序列包含SEQ ID NO:1-20、SEQ ID NO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201或SEQ ID NO:283中的任一者,或其片段;其中所述片段的长度为至少140bp。
19.根据权利要求13所述的重组DNA构建体,其中所述7SL启动子的序列包含SEQ IDNO:172-177中的任一者,或其片段;其中所述片段的长度为至少140bp。
20.一种细胞,其包含根据权利要求1所述的重组DNA构建体。
21.根据权利要求20所述的细胞,其中所述细胞是植物细胞。
22.一种将双链断裂引入所述细胞的基因组的方法,所述方法包括将以下引入所述细胞:
a)至少一种根据权利要求1所述的重组DNA构建体;和
b)第二重组DNA构建体,所述第二重组DNA构建体包含编码启动子的序列,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列,所述Cas核酸内切酶基因产物可操作地连接至核定位序列(NLS)。
23.根据权利要求22所述的方法,其中所述U6启动子的序列包含SEQ ID NO:7。
24.根据权利要求22所述的方法,其中所述U6启动子包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20的。
25.根据权利要求22所述的方法,其中编码所述Cas核酸内切酶的序列选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ ID NO:136。
26.一种将双链断裂引入所述细胞的基因组的方法,所述方法包括将至少一种根据权利要求10所述的重组DNA构建体引入所述细胞。
27.根据权利要求26所述的方法,其中所述U6启动子的序列包含SEQ ID NO:7。
28.根据权利要求26所述的方法,其中所述U6启动子包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20的。
29.根据权利要求26所述的方法,其中编码所述Cas核酸内切酶的序列选自由以下组成的组:SEQ ID NO:27、SEQ ID NO:68和SEQ ID NO:97、SEQ ID NO:119和SEQ ID NO:136。
30.一种基因组修饰方法,所述方法包括:
a)将双链断裂引入所述植物细胞的基因组中的选择位点,以及
b)将重组平末端双链DNA片段引入所述植物细胞,
其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。
31.根据权利要求30所述的方法,其中所述基因组修饰包括修饰连锁障碍、连接两个或更多个QTL、破坏两个或更多个QTL的连锁、基因插入、基因置换、基因转换、基因缺失或断裂、转基因事件选择、转基因性状供体选择、转基因置换或至少一种所关注的核酸的靶向插入。
32.根据权利要求30所述的方法,其中所述双链断裂通过核酸内切酶引入。
33.根据权利要求32所述的方法,其中所述核酸内切酶选自由以下组成的组:TALEN核酸内切酶;CRISPR核酸内切酶;包含"LAGLIDADG”、“GIY-YIG”、“His-Cys框”或HNH序列基序的大范围核酸酶;以及锌指核酸酶。
34.根据权利要求30所述的方法,其中所述植物细胞是原生质体或在植物细胞培养物中生长。
35.根据权利要求30所述的方法,其中所述植物细胞选自由以下组成的组:大豆植物细胞;玉米植物细胞;稻米植物细胞;小麦植物细胞;草坪植物细胞;棉花植物细胞;和芥花籽植物细胞。
36.根据权利要求30所述的方法,其中所述重组平末端双链DNA片段不包含与所述基因组中的所述选择位点同源的区域。
37.根据权利要求30所述的方法,其中将约0.03至约0.3fmol的重组平末端双链DNA片段引入所述植物细胞。
38.根据权利要求37所述的方法,其中将约0.15fmol的重组平末端双链DNA片段引入所述植物细胞。
39.根据权利要求30所述的方法,其中所述平末端双链DNA片段包含在5’末端或3’末端或5’和3’末端二者上,与包含所述基因组中的所述双链断裂的一个或两个末端的序列微同源的区域。
40.根据权利要求39所述的方法,其中所述微同源区域选自:长度为1bp、2bp、3bp、4,bp、5bp、6bp、7bp、8bp、9bp或10bp的序列。
41.根据权利要求40所述的方法,其中所述微同源区域的长度为3bp。
42.根据权利要求30所述的方法,其中在步骤a)中通过为所述细胞提供核酸内切酶来引入双链断裂,所述核酸内切酶设计为靶向所述细胞的所述基因组中的选择靶标位点。
43.根据权利要求42所述的方法,其中所述核酸内切酶由至少一种编码所述核酸内切酶的重组DNA构建体提供。
44.根据权利要求42所述的方法,其中所述核酸内切酶通过将编码所述核酸内切酶的mRNA或所述核酸内切酶递送至所述植物细胞来提供。
45.根据权利要求42所述的方法,其中所述核酸内切酶选自由以下组成的组:TALEN核酸内切酶;锌指核酸内切酶;大范围核酸酶;和CRISPR核酸内切酶。
46.根据权利要求30所述的方法,其中在步骤a)中通过为所述细胞提供编码启动子的重组DNA构建体,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;和包含U6、U3、U2、U5或7SL启动子的重组DNA构建体,所述U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,所述单向导RNA设计为靶向所述细胞的所述染色体中的选择靶标位点,来引入双链断裂。
47.根据权利要求46所述的方法,其中所述Cas核酸内切酶基因产物还可操作地连接至至少一个核定位序列(NLS)。
48.根据权利要求46所述的方法,其中所述U6、U3、U2、U5或7SL启动子的序列包含SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283,或其片段;其中所述片段的长度为至少140bp并且包含转录终止序列。
49.根据权利要求48所述的方法,其中所述U6启动子包含选自由以下组成的组的序列:SEQ ID NO:1-20、SEQ ID NO:146-149、SEQ ID NO:160-166、SEQ ID NO:200-201和SEQ IDNO:283,或其片段;其中所述片段的长度为至少140bp,包含转录终止序列。
50.根据权利要求48所述的方法,其中所述U6启动子的序列包含SEQ ID NO:7。
51.根据权利要求48所述的方法,其中所述U6启动子包含选自由以下组成的组的序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20。
52.根据权利要求48所述的方法,其中所述U3启动子的序列包含SEQ ID NO:167-171或SEQ ID NO:178-182中的任一者,或其片段;其中所述片段的长度为至少140bp。
53.根据权利要求48所述的方法,其中所述U5启动子的序列包含SEQ ID NO:188-191或SEQ ID NO:276-282中的任一者,或其片段;其中所述片段的长度为至少140bp。
54.根据权利要求48所述的方法,其中所述U2启动子的序列包含SEQ ID NO:183-187、SEQ ID NO:192-199或SEQ ID NO:247-275中的任一者,或其片段;其中所述片段的长度为至少140bp。
55.根据权利要求48所述的方法,其中所述7SL启动子的序列包含SEQ ID NO:172-177中的任一者,或其片段,其中所述片段的长度为至少140bp。
56.根据权利要求46所述的方法,其中所述重组DNA构建体编码启动子,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;并且所述重组DNA构建体包含U6、U3、U2、U5或7SL启动子,所述U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,所述单向导RNA设计为在相同的构建体上靶向所述细胞的所述染色体中的选择靶标位点。
57.根据权利要求46所述的方法,其中所述重组DNA构建体编码启动子,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列;并且所述重组DNA构建体包含U6、U3、U2、U5或7SL启动子,所述U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,所述单向导RNA设计为在至少两个构建体上靶向所述细胞的所述染色体中的选择靶标位点。
58.一种植物细胞,其包含平末端双链DNA片段的靶向重组定点整合。
59.一种植物、植物部分、植物种子,其包含平末端双链DNA片段的靶向重组定点整合。
60.一种基因组修饰方法,所述方法包括:
a)通过根据权利要求22所述的方法将双链断裂引入所述植物细胞的基因组;以及
b)将重组平末端双链DNA片段引入所述植物细胞,
其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。
61.一种基因组修饰方法,所述方法包括:
a)通过根据权利要求26所述的方法将双链断裂引入所述植物细胞的基因组;以及
b)将重组平末端双链DNA片段引入所述植物细胞,
其中所述重组平末端双链DNA片段通过内源性DNA修复并入所述双链断裂。
62.一种包含至少第一表达盒的重组DNA构建体,所述第一表达盒包含U6、U3、U2、U5或7SL启动子,所述U6、U3、U2、U5或7SL启动子可操作地连接至编码单向导RNA(sgRNA)的序列,其中所述启动子的序列包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283中的任一者,或其片段;其中所述片段的长度为至少140bp。
63.根据权利要求62所述的重组DNA构建体,还包含至少第二表达盒,其中编码所述第一sgRNA的序列不同于编码所述第二sgRNA的序列。
64.根据权利要求63所述的重组DNA构建体,其中可操作地连接至编码所述第一sgRNA的序列的所述启动子不同于可操作地连接至编码所述第二sgRNA的序列的所述启动子。
65.根据权利要求62所述的构建体,包含侧面左和右同源臂(HA),所述同源臂中的每个的长度为约200-1200bp。
66.根据权利要求65所述的构建体,其中所述同源臂的长度为约230至约1003bp。
67.一种通过检测整合DNA片段来对所述核酸酶活性进行定量的方法,所述方法包括:通过使用数字PCR或定量PCR确定同源重组(HR)介导的靶向整合率。
68.根据权利要求33所述的方法,其中所述核酸内切酶是TALEN核酸内切酶,并且将TALEN表达构建体引入所述植物细胞,其中将约0.1pmol的每个TALEN表达构建体引入所述植物细胞。
69.一种重组DNA构建体,所述构建体包含:
a)第一snRNA启动子,其选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;所述第一snRNA启动子可操作地连接至编码非编码RNA的序列;和
b)第二snRNA启动子,其选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;所述第二snRNA启动子可操作地连接至编码非编码RNA的序列,其中所述第一snRNA启动子和所述第二snRNA启动子是不同的。
70.根据权利要求69所述的重组DNA构建体,其中编码所述第一snRNA启动子的序列和编码所述第二snRNA启动子的序列各自包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283或其片段;其中所述片段的长度为至少140bp。
71.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U6启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:1-8、SEQ ID NO:17-20和SEQ ID NO:200-201。
72.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U6启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:12-16、SEQ ID NO:160-166和SEQ ID NO:283。
73.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U6启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:9-11和SEQ ID NO:146-149。
74.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U2启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:183-187和SEQID NO:192-199组成的组。
75.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U2启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:247-275组成的组。
76.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U3启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:178-182组成的组。
77.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U3启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:167-171组成的组。
78.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U5启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:188-191组成的组。
79.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是U5启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:276-282组成的组。
80.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是7SL启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:175-177组成的组。
81.根据权利要求69所述的重组DNA构建体,其中所述第一和第二snRNA启动子是7SL启动子,并且编码所述第一和第二snRNA启动子的序列各自选自由SEQ ID NO:172-174组成的组。
82.根据权利要求69所述的重组DNA构建体,其中所述第一snRNA启动子是U6启动子,并且所述第二snRNA启动子选自由以下组成的组:U3启动子、U2启动子、U5启动子和7SL启动子。
83.根据权利要求69所述的重组DNA构建体,其中所述第一snRNA启动子是U3启动子,并且所述第二snRNA启动子选自由以下组成的组:U6启动子、U2启动子、U5启动子和7SL启动子。
84.根据权利要求69所述的重组DNA构建体,其中所述第一snRNA启动子是U2启动子,并且所述第二snRNA启动子选自由以下组成的组:U6启动子、U3启动子、U5启动子和7SL启动子。
85.根据权利要求69所述的重组DNA构建体,其中所述第一snRNA启动子是U5启动子,并且所述第二snRNA启动子选自由以下组成的组:U6启动子、U2启动子、U3启动子和7SL启动子。
86.根据权利要求69所述的重组DNA构建体,其中所述第一snRNA启动子是7SL启动子,并且所述第二snRNA启动子选自由以下组成的组:U6启动子、U2启动子、U3启动子和U5启动子。
87.根据权利要求82至权利要求86中任一项所述的重组DNA构建体,其中编码所述第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:1-8、SEQ ID NO:17-20、SEQ ID NO:200-201、SEQ ID NO:183-187、SEQ ID NO:192-199、SEQ ID NO:178-182、SEQID NO:188-191和SEQ ID NO:175-177。
88.根据权利要求82至权利要求86中任一项所述的重组DNA构建体,其中编码所述第一和第二snRNA启动子的序列各自选自由以下组成的组:SEQ ID NO:12-16、SEQ ID NO:160-166、SEQ ID NO:283、SEQ ID NO:247-275、SEQ ID NO:167-171、SEQ ID NO:276-282和SEQID NO:172-174。
89.根据权利要求69至权利要求88中任一项所述的重组DNA构建体,还包含表示一个或多个另外的snRNA启动子的序列,所述snRNA启动子选自由以下组成的组:U6启动子、U3启动子、U2启动子、U5启动子和7SL启动子;所述snRNA启动子可操作地连接至编码非编码RNA的序列,其中所述第一snRNA启动子、所述第二snRNA启动子和所述一个或多个另外的snRNA启动子中的每个是不同的。
90.根据权利要求89所述的重组DNA构建体,其中表示所述一个或多个另外的snRNA启动子的序列选自由以下组成的组:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:146-149、SEQ ID NO:160-201或SEQ ID NO:247-283;或其片段,其中所述片段的长度为至少140bp。
91.根据权利要求69至权利要求90中任一项所述的重组DNA构建体,其中所述重组DNA构建体包含3个、4个、5个、6个、7个、8个、9个或10个snRNA启动子。
92.根据权利要求69至权利要求91中任一项所述的重组DNA构建体,其中所述非编码RNA是靶向植物细胞的染色体中的不同选择靶标位点的sgRNA。
93.根据权利要求69至权利要求92中任一项所述的重组DNA构建体,还包含编码启动子的序列,所述启动子可操作地连接至编码成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶基因产物的序列。
94.一种基因组修饰方法,所述方法包括:
a)通过为所述细胞提供成簇规律间隔的短回文重复序列(CRISPR)相关的Cas核酸内切酶和根据权利要求92所述的重组DNA构建体来将双链断裂引入所述植物细胞的基因组中的两个或更多个选择位点,以及
b)将一个或多个外源性双链DNA片段引入所述植物细胞,
其中所述外源性双链DNA片段通过内源性DNA修复并入所述双链断裂。
95.根据权利要求94所述的方法,其中所述一个或多个外源性双链DNA片段是平末端的。
96.根据权利要求94或权利要求95所述的方法,其中所述一个或多个外源性双链DNA片段包含与所述基因组中的选择位点同源的区域。
97.根据权利要求96所述的方法,其中外源性双链DNA片段包含与所述基因组中的不同选择位点同源的区域。
CN201580016648.0A 2014-02-27 2015-02-27 用于定点基因组修饰的组合物和方法 Pending CN106232803A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461945700P 2014-02-27 2014-02-27
US61/945,700 2014-02-27
PCT/US2015/018104 WO2015131101A1 (en) 2014-02-27 2015-02-27 Compositions and methods for site directed genomic modification

Publications (1)

Publication Number Publication Date
CN106232803A true CN106232803A (zh) 2016-12-14

Family

ID=54009672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580016648.0A Pending CN106232803A (zh) 2014-02-27 2015-02-27 用于定点基因组修饰的组合物和方法

Country Status (6)

Country Link
US (3) US11186843B2 (zh)
EP (2) EP3971283A1 (zh)
CN (1) CN106232803A (zh)
CA (2) CA2940217C (zh)
ES (1) ES2898460T3 (zh)
WO (1) WO2015131101A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107043778A (zh) * 2017-03-14 2017-08-15 广西大学 真菌基因定点插入突变的近原位回补方法
CN107164402A (zh) * 2017-05-31 2017-09-15 未名兴旺系统作物设计前沿实验室(北京)有限公司 一种基于CRISPR‑Cas9系统的基因编辑载体及其应用
CN108034657A (zh) * 2018-01-31 2018-05-15 山东省葡萄研究院 一种葡萄snRNA U6 基因及其引物和应用
CN110129363A (zh) * 2019-06-11 2019-08-16 先正达作物保护股份公司 提高番茄CRISPR/Cas9基因编辑效率的方法
CN110475866A (zh) * 2017-01-30 2019-11-19 科沃施种子欧洲股份两合公司 用于基因组工程的与核酸内切酶相连的修复模板
CN111019967A (zh) * 2019-11-27 2020-04-17 南京农业大学 GmU3-19g-1和GmU6-16g-1启动子在大豆多基因编辑系统中的应用
CN114703187A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.7及其克隆与应用
CN114703189A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.3及其克隆与应用
CN114703188A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.6及其克隆与应用
CN114790456A (zh) * 2021-01-24 2022-07-26 东北林业大学 野菊u6基因及其应用

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
EP3611268A1 (en) 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
LT3066201T (lt) 2013-11-07 2018-08-10 Editas Medicine, Inc. Su crispr susiję būdai ir kompozicijos su valdančiomis grnr
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
PL3102722T3 (pl) 2014-02-04 2021-03-08 Jumpcode Genomics, Inc. Frakcjonowanie genomu
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3262175A4 (en) 2015-02-25 2018-10-31 Jumpcode Genomics, Inc. Methods and compositions for in silico long read sequencing
CA2976387A1 (en) * 2015-03-27 2016-10-06 E I Du Pont De Nemours And Company Soybean u6 small nuclear rna gene promoters and their use in constitutive expression of small rna genes in plants
WO2016183402A2 (en) * 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
IL241462A0 (en) 2015-09-10 2015-11-30 Yeda Res & Dev Heterologous engineering of betalain pigments in plants
US11692182B2 (en) 2015-10-09 2023-07-04 Monsanto Technology Llc RNA-guided DNA nucleases and uses thereof
US20180282763A1 (en) 2015-10-20 2018-10-04 Pioneer Hi-Bred International, Inc. Restoring function to a non-functional gene product via guided cas systems and methods of use
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
US11118189B2 (en) 2015-12-02 2021-09-14 Ceres, Inc. Methods for genetic modification of plants
DK3386550T3 (da) * 2015-12-07 2021-04-26 Arc Bio Llc Fremgangsmåder til fremstilling og anvendelse af guide nukleinsyrer
EP3397757A4 (en) 2015-12-29 2019-08-28 Monsanto Technology LLC NEW TRANSPOSASES ASSOCIATED WITH CRISPR AND USES THEREOF
US11339427B2 (en) 2016-02-12 2022-05-24 Jumpcode Genomics, Inc. Method for target specific RNA transcription of DNA sequences
AU2017217868B2 (en) * 2016-02-12 2023-05-25 Jumpcode Genomics, Inc. Method for target specific RNA transcription of DNA sequence
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
AU2017288960B2 (en) 2016-07-01 2019-12-12 Carlsberg A/S Method to screen for a mutant within a population of organisms by applying a pooling and splitting approach
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
EP3498834A4 (en) * 2016-08-10 2020-06-17 Genahead Bio, Inc. METHOD FOR MODIFYING A TARGET SITE IN THE GENOME OF A EUKARYOTE CELL, AND METHOD FOR DETECTING THE PRESENCE OR ABSENCE OF A NUCLEIC ACID SEQUENCE TO BE DETECTED AT A TARGET SITE
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
IL247752A0 (en) 2016-09-11 2016-11-30 Yeda Res & Dev Compositions and methods for modulating gene expression for site-directed mutagenesis
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US20190264218A1 (en) 2016-11-04 2019-08-29 Flagship Pioneering Innovations V, Inc. Novel Plant Cells, Plants, and Seeds
CN108203714B (zh) * 2016-12-20 2021-03-02 华中农业大学 一种棉花基因的编辑方法
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11859219B1 (en) 2016-12-30 2024-01-02 Flagship Pioneering Innovations V, Inc. Methods of altering a target nucleotide sequence with an RNA-guided nuclease and a single guide RNA
CN110268064A (zh) * 2017-01-11 2019-09-20 耶达研究及发展有限公司 同源染色体之间的靶向重组及其用途
WO2018140899A1 (en) * 2017-01-28 2018-08-02 Inari Agriculture, Inc. Novel plant cells, plants, and seeds
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
ES2693895A1 (es) 2017-06-12 2018-12-14 Consejo Superior De Investigaciones Científicas (Csic) Vectores binarios y usos de los mismos
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
MX2020001178A (es) 2017-07-31 2020-09-25 Regeneron Pharma Celulas madre embrionarias de raton transgenico con cas y ratones y usos de los mismos.
AU2018309708A1 (en) 2017-07-31 2020-02-06 Regeneron Pharmaceuticals, Inc. CRISPR reporter non-human animals and uses thereof
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019046703A1 (en) 2017-09-01 2019-03-07 Novozymes A/S METHODS OF ENHANCING GENOME EDITION IN FUNGI
US11603536B2 (en) 2017-09-29 2023-03-14 Inari Agriculture Technology, Inc. Methods for efficient maize genome editing
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US11220694B1 (en) 2018-01-29 2022-01-11 Inari Agriculture, Inc. Rice cells and rice plants
US11926835B1 (en) 2018-01-29 2024-03-12 Inari Agriculture Technology, Inc. Methods for efficient tomato genome editing
US11802288B1 (en) 2018-01-29 2023-10-31 Inari Agriculture Technology, Inc. Methods for efficient soybean genome editing
WO2019204767A1 (en) * 2018-04-20 2019-10-24 Dana-Farber Cancer Institute, Inc. Multifunctional nucleic acid reporter constructs
US11866719B1 (en) 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
US11414669B2 (en) 2018-09-06 2022-08-16 Monsanto Technology Llc Compositions and methods for genome editing in planta
BR112021005791A2 (pt) 2018-09-26 2021-07-27 Greenlight Biosciences, Inc. controle de insetos coleópteros
AU2019377855A1 (en) 2018-11-08 2021-06-03 Greenlight Biosciences, Inc. Control of insect infestation
AU2019398351A1 (en) 2018-12-14 2021-06-03 Pioneer Hi-Bred International, Inc. Novel CRISPR-Cas systems for genome editing
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
US11692197B2 (en) 2019-05-06 2023-07-04 Inari Agriculture Technology, Inc. Delivery of biological molecules to plant cells
SG11202112092TA (en) 2019-06-25 2021-11-29 Inari Agriculture Technology Inc Improved homology dependent repair genome editing
CA3149635A1 (en) * 2019-08-05 2021-02-11 Monsanto Technology Llc Compositions and methods for chromosome rearrangement
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US20240011043A1 (en) 2020-07-31 2024-01-11 Inari Agriculture Technology, Inc. Generation of plants with improved transgenic loci by genome editing
US11242534B1 (en) 2020-07-31 2022-02-08 Inari Agriculture Technology, Inc. INHT31 transgenic soybean
EP4172341A1 (en) * 2020-07-31 2023-05-03 Inari Agriculture Technology, Inc. Generation of plants with improved transgenic loci by genome editing
US20220372502A1 (en) * 2021-04-30 2022-11-24 Monsanto Technology Llc Plant regulatory elements and uses thereof
US20230048564A1 (en) 2021-07-22 2023-02-16 Arbor Biotechnologies, Inc. Crispr-associated transposon systems and methods of using same
WO2024005863A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299739A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299733A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005864A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
WO2003068797A1 (en) 2002-02-14 2003-08-21 City Of Hope Methods for producing interfering rna molecules in mammalian cells and therapeutic uses for such molecules
AP2693A (en) 2005-05-27 2013-07-16 Monsanto Technology Llc Soybean event MON89788 and methods for detection thereof
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
KR20230065381A (ko) 2012-07-25 2023-05-11 더 브로드 인스티튜트, 인코퍼레이티드 유도 dna 결합 단백질 및 게놈 교란 도구 및 이의 적용
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
KR101706085B1 (ko) 2012-10-23 2017-02-14 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
WO2014093635A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
DK3620534T3 (da) 2013-03-14 2021-12-06 Caribou Biosciences Inc Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer
DK3004349T3 (en) 2013-05-29 2018-06-06 Cellectis Sa A method for producing precise DNA cleavage using CAS9 nickase activity
CA2913869C (en) 2013-05-29 2023-01-24 Cellectis New compact scaffold of cas9 in the type ii crispr system
WO2014194190A1 (en) 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
EP3611268A1 (en) * 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KABIN XIE等: "RNA-Guided Genome Editing in Plants Using a CRISPR-Cas System", 《MOLECULAR PLANT》 *
KHAOULA BELHAJ等: "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system", 《PLANT METHODS》 *
STELLA VERETNIK等: "Nucleotide sequence of a maize U6 gene", 《NUCLEIC ACIDS RESEARCH》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110475866A (zh) * 2017-01-30 2019-11-19 科沃施种子欧洲股份两合公司 用于基因组工程的与核酸内切酶相连的修复模板
CN107043778A (zh) * 2017-03-14 2017-08-15 广西大学 真菌基因定点插入突变的近原位回补方法
CN107164402A (zh) * 2017-05-31 2017-09-15 未名兴旺系统作物设计前沿实验室(北京)有限公司 一种基于CRISPR‑Cas9系统的基因编辑载体及其应用
CN107164402B (zh) * 2017-05-31 2020-10-16 未名兴旺系统作物设计前沿实验室(北京)有限公司 一种基于CRISPR-Cas9系统的基因编辑载体及其应用
CN108034657A (zh) * 2018-01-31 2018-05-15 山东省葡萄研究院 一种葡萄snRNA U6 基因及其引物和应用
CN110129363A (zh) * 2019-06-11 2019-08-16 先正达作物保护股份公司 提高番茄CRISPR/Cas9基因编辑效率的方法
CN111019967A (zh) * 2019-11-27 2020-04-17 南京农业大学 GmU3-19g-1和GmU6-16g-1启动子在大豆多基因编辑系统中的应用
CN114790456A (zh) * 2021-01-24 2022-07-26 东北林业大学 野菊u6基因及其应用
CN114703187A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.7及其克隆与应用
CN114703189A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.3及其克隆与应用
CN114703188A (zh) * 2022-03-31 2022-07-05 东北林业大学 一种水曲柳U6基因启动子proFmU6.6及其克隆与应用
CN114703189B (zh) * 2022-03-31 2023-05-23 东北林业大学 一种水曲柳U6基因启动子proFmU6.3及其克隆与应用

Also Published As

Publication number Publication date
WO2015131101A1 (en) 2015-09-03
US20170166912A1 (en) 2017-06-15
CA3194412A1 (en) 2015-09-03
CA2940217C (en) 2023-06-13
ES2898460T3 (es) 2022-03-07
CA2940217A1 (en) 2015-09-03
US11566254B2 (en) 2023-01-31
EP3971283A1 (en) 2022-03-23
US11186843B2 (en) 2021-11-30
EP3110945A1 (en) 2017-01-04
US20230212596A1 (en) 2023-07-06
US20220135991A1 (en) 2022-05-05
US11952578B2 (en) 2024-04-09
EP3110945A4 (en) 2017-10-25
EP3110945B1 (en) 2021-09-08

Similar Documents

Publication Publication Date Title
US11952578B2 (en) Compositions and methods for site directed genomic modification
Mao et al. Gene editing in plants: progress and challenges
Kui et al. Building a genetic manipulation tool box for orchid biology: identification of constitutive promoters and application of CRISPR/Cas9 in the orchid, Dendrobium officinale
Wang et al. Egg cell-specific promoter-controlled CRISPR/Cas9 efficiently generates homozygous mutants for multiple target genes in Arabidopsis in a single generation
Osakabe et al. Site-directed mutagenesis in Arabidopsis using custom-designed zinc finger nucleases
Raizada et al. Somatic and germinal mobility of the RescueMu transposon in transgenic maize
AU2017248614B2 (en) Method for changing the intercellular mobility of an mRNA
CN107027313A (zh) 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
US20210348179A1 (en) Compositions and methods for regulating gene expression for targeted mutagenesis
Kurokawa et al. A simple heat treatment increases SpCas9-mediated mutation efficiency in Arabidopsis
Hus et al. A CRISPR/Cas9-based mutagenesis protocol for Brachypodium distachyon and its allopolyploid relative, Brachypodium hybridum
Rinne et al. Loss of MAR1 function is a marker for co-selection of CRISPR-induced mutations in plants
CN106414742A (zh) 玉米调节元件及其用途
US10941412B2 (en) Citrus varieties resistant to Xanthomonas citri infection
US20230348919A1 (en) Methods for the production of genome edited plants
TW201643251A (zh) 用於轉殖基因表現之植物啟動子
TWI686477B (zh) 特異性造成植物葉綠體基因變異的轉殖載體、套組、方法及利用其產生之轉殖植物細胞與農桿菌
US20220372502A1 (en) Plant regulatory elements and uses thereof
JP2022544084A (ja) 染色体再編成のための組成物および方法
CN117242181A (zh) 植物调控元件及其用途
BR112020009457A2 (pt) promotor de proteína relacionada à patogênese de planta para expressão transgênica
BR112020022745A2 (pt) métodos e composições para edição visada de polinucleotídeos

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination