CN112585269A - 改善植物中基因组工程化和再生的方法ii - Google Patents

改善植物中基因组工程化和再生的方法ii Download PDF

Info

Publication number
CN112585269A
CN112585269A CN201980053177.9A CN201980053177A CN112585269A CN 112585269 A CN112585269 A CN 112585269A CN 201980053177 A CN201980053177 A CN 201980053177A CN 112585269 A CN112585269 A CN 112585269A
Authority
CN
China
Prior art keywords
polypeptide
nucleic acid
enhancer
seq
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980053177.9A
Other languages
English (en)
Inventor
孔吉祥
孟玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Publication of CN112585269A publication Critical patent/CN112585269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H4/00Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
    • A01H4/008Methods for regeneration to complete plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • C12N15/821Non-antibiotic resistance markers, e.g. morphogenetic, metabolic markers

Abstract

本文件涉及用于真核细胞中的基因组工程化的方法和材料,以及尤其涉及通过共同递送一个或多个加强子多肽和加强基因的组合与基因组工程化组分来提高基因组工程化(即转化或基因组编辑)效率的方法。

Description

改善植物中基因组工程化和再生的方法II
技术领域
本文描述了再生加强子(booster)基因和多肽的新组合,以及用于真核细胞中基因组工程化的方法和材料,以及尤其是通过共同递送加强子多肽和加强基因与基因组工程化组件来提高基因组工程化(即,转化或基因组编辑)效率的方法。
发明背景
传统育种已提供了驯养的植物和动物,而现代生物技术(尤其是基因组工程化)正在扩大育种能力,并实现仅用传统近缘种(close species)的杂交无法实现的改善。利用生物技术,已将诸如高产、除草剂耐受性和昆虫抗性的多种性状导入作物,导致全球农业和粮食安全的巨大进步。但是,此类生物技术产品中存在外来DNA会引发生物安全和环境问题。
通过分离出任何整合的DNA,基因组编辑技术可用于生成靶基因组的位点特异性修饰,而在最终植物中不存在外来DNA。此外,通过瞬时表达,基因组编辑涉及瞬时编辑活性,以产生位点特异性修饰,而在过程的任何点没有DNA整合。基因组编辑的植物,特别是源自瞬时活性的那些,与常规的基因组修饰的植物有显著地不同,并且可能不会作为经遗传修饰的(GM)植物受到监管。基因组编辑技术(特别通过瞬时编辑方法)可以在农业中提供高度准确、安全和强大的植物育种和开发工具。
然而,基于瞬时活性的基因组工程化面临更多挑战。与稳定转化相比,瞬时工程化通常会导致更少的修饰的细胞。在没有整合的可选择标志物时,鉴定工程化的细胞并在再生的植物中实现同质(homogenous)修饰是高度挑战的。这些挑战阻碍瞬时基因编辑作为改良植物的育种工具的常规实施。因此,非常需要增强基因组工程化效率的新方法和材料。
发明内容
在第一方面,提供了编码第一加强子多肽和第二加强子多肽的核酸,其中所述第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和其中所述第二加强子多肽包含SEQ ID NO:4、6或8中任一个的氨基酸序列,或与SEQ ID NO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
在本发明的第一方面的一个实施方案中,编码第一加强子多肽的核酸包含选自以下的编码序列:
(i)包含SEQ ID NO:1的核苷酸序列的核酸;
(ii)包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(iii)在严格杂交条件下与(i)或(ii)中定义的核酸的互补链杂交的核酸;和
编码第二加强子多肽的核酸包含选自以下的编码序列:
(I)包含SEQ ID NO:3、5或7中任一个的核苷酸序列的核酸;
(II)包含与SEQ ID NO:3、5或7中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(III)在严格杂交条件下与(I)或(II)中定义的核酸的互补链杂交的核酸。在第二方面,提供了编码第三加强子多肽和第二加强子多肽的核酸,其中第三加强子多肽包含SEQID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和其中第二加强子多肽包含SEQ ID NO:4、6或8中任一个的氨基酸序列,或与SEQ ID NO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列,其中在第三加强子多肽翻译后,前述第一加强子多肽的表达被激活;其中第一加强子多肽包含SEQID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
在本发明第二方面的一个实施方案中,编码第三加强子多肽的核酸包含选自以下的编码序列:
(i)包含SEQ ID NO:15、17或19中任一个的核苷酸序列的核酸;
(ii)包含与SEQ ID NO:15、17或19中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(iii)在严格杂交条件下与(i)或(ii)中定义的核酸的互补链杂交的核酸;和
编码第二加强子多肽的核酸包含选自以下的编码序列:
(I)包含SEQ ID NO:3、5或7中任一个的核苷酸序列的核酸;
(II)包含与SEQ ID NO:3、5或7中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(III)在严格杂交条件与(I)或(II)中定义的核酸的互补链杂交的核酸。
在另一方面,提供了重组基因,其包含在第一和/或第二方面中如上所定义的核酸。
在本发明的一些实施方案中,编码第一加强子多肽的核酸可操作地连接至天然启动子或第一异源启动子,并且编码第二加强子多肽的核酸可操作地连接至天然启动子或第二异源启动子;其中编码第一加强子多肽的核酸和编码第二加强子多肽的核酸可操作地连接至一个异源启动子。
在本发明的一些实施方案中,编码第二加强子多肽的核酸可操作地连接至该天然启动子或第一异源启动子,且编码第三加强子多肽的核酸可操作地连接至天然启动子或第二异源启动子;或编码第二加强子多肽的核酸和编码第三加强子多肽的核酸可操作地连接至一个异源启动子。
在本发明的一些实施方案中,异源启动子可以是强组成型启动子、组织特异性启动子、发育特异性启动子或诱导型启动子。
在另一方面,提供了一种DNA构建体,优选地为载体,其包含上述核酸或重组基因。
在另一方面,提供了一种植物细胞,其包含核酸、重组基因或DNA构建体,特别地作为转基因或作为异源多肽或异源核酸。
本发明的另一方面是包含上述植物细胞的植物、其部分或种子。
在本发明的另一方面,提供了一种在植物细胞中遗传修饰的方法,所述方法包含
(a)将以下导入植物细胞
(i)选自以下的组分:
(i.a)上述核酸、重组基因和/或DNA构建体;或
(i.b1)编码第一加强子多肽的核酸;包含编码第一加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接;DNA构建体,优选地为载体,其包含编码上述所定义的第一加强子多肽的核酸,或上述第一加强子多肽;和
(i.b2)编码上述所定义的第二加强子多肽的核酸;包含编码第二加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,或DNA构建体,优选地为载体,其包含编码上述第二加强子多肽的核酸,或上述所定义的第二加强子多肽;或
(i.c1)编码适合于瞬时提高上述第一加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第一加强子多肽的表达的定点转录激活子;其中编码第一加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子;其中编码第二加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;和
(ii)感兴趣的转基因和/或基因组工程化组分;
(b)任选地,在允许第一和第二加强子多肽的翻译的条件下,培养植物细胞,优选地,其中与其中未导入(i.a)、(i.b1)和(i.b2)、(i.c1)和(i.c2)、或(i.d)的植物细胞相比翻译提高;和
(c)任选地,在允许在加强子多肽存在时通过感兴趣的转基因的整合或通过基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养植物细胞。
可选的,提供了一种在植物细胞中遗传修饰的方法,所述方法包括:
(a)将以下导入植物细胞
(i)选自以下的组分:
(i.a)上述核酸、重组基因和/或DNA构建体;或
(i.b1)编码第三加强子多肽的核酸;包含编码第三加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,DNA构建体,优选地为载体,其包含编码上述所定义的第三加强子多肽的核酸,或上述第三加强子多肽;和
(i.b2)编码上述所定义的第二加强子多肽的核酸;包含编码第二加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,或DNA构建体,优选地为载体,其包含编码上述第二加强子多肽的核酸,或上述所定义的第二加强子多肽,或
(i.c1)编码适合于瞬时提高上述第三加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第三加强子多肽的表达的定点转录激活子;其中编码第三加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子;其中编码第二加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;和
(ii)感兴趣的转基因和/或基因组工程化组分;
(b)任选地,在允许第三和第二加强子多肽的翻译的条件下,培养植物细胞,优选地,其中与其中未导入(i.a)、(i.b1)和(i.b2)、(i.c1)和(i.c2)、或(i.d)的植物细胞相比翻译提高;和
(c)任选地,在允许在加强子多肽存在时通过感兴趣的转基因的整合或通过基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养植物细胞。
在上述方法的一个实施方案中,来自步骤(i)组分的第一加强子多肽和第二加强子多肽,或第三加强子多肽和第二加强子多肽在植物细胞中是瞬时存在的,是瞬时有活性的或是瞬时表达的或其中组分(i)在植物细胞中是瞬时存在的,是瞬时有活性的或是瞬时表达的。
在上述方法的另一个实施方案中,将组分导入植物细胞的步骤(i)额外地包括向植物细胞导入PLT5多肽、KWS-RBP1多肽、KWS-RPB2多肽、RKD4多肽和RKD2多肽,和/或一个或多个选自编码PLT5多肽、KWS-RBP1多肽、KWS-RPB2多肽、RKD4多肽和RKD2多肽的核酸,和/或一个或多个适合于瞬时提高内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达的定点转录激活子,和/或编码这种定点转录激活子的核酸。
在上述方法的另一个实施方案中,PLT5多肽、KWS-RBP1多肽、KWS-RPB2多肽、RKD4多肽和RKD2多肽在植物细胞中是瞬时存在的,是瞬时有活性的或是瞬时表达的,或其中编码PLT5多肽、KWS-RBP1多肽、KWS-RPB2多肽、RKD4多肽和RKD2多肽的核酸在植物细胞中是瞬时存在的,是瞬时有活性的或是瞬时表达的。
在上述方法的另一个实施方案中,将第一和第二加强子多肽以及PLT5多肽导入该植物细胞中,并任选地被瞬时共同表达;和/或将第一和第二加强子多肽以及KWS-RBP1多肽导入植物细胞中,并任选地被瞬时共同表达;和/或将第一和第二加强子多肽和RKD4多肽导入植物细胞中,并任选地被瞬时共同表达,和/或将第一和第二加强子多肽和RKD2多肽导入植物细胞中,并任选地被瞬时共同表达。
在上述方法的另一个实施方案中,将第三和第二加强子多肽以及PLT5多肽导入植物细胞中,并任选地被瞬时共同表达;和/或将第三和第二加强子多肽以及KWS-RBP1多肽导入植物细胞中,并任选地被瞬时共同表达;和/或将第三和第二加强子多肽以及KWS-RBP2多肽导入植物细胞中,并任选地被瞬时共同表达;和/或将第三和第二加强子多肽和RKD4多肽导入植物细胞中,并任选地被瞬时共同表达,和/或将第三和第二加强子多肽和RKD2多肽导入植物细胞中,并任选地被瞬时共同表达。
在上述方法的另一个实施方案中,PLT5多肽包含SEQ ID NO:10或12的氨基酸序列,或与SEQ ID NO:10或12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码PLT5多肽的核酸编码SEQ ID NO:10或12的氨基酸序列,或编码与SEQ ID NO:10或12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或KWS-RBP1多肽包含SEQ ID NO:14的氨基酸序列,或与SEQ IDNO:14具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码KWS-RBP1多肽的核酸编码SEQ ID NO:14的氨基酸序列,或编码与SEQ IDNO:14具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或KWS-RBP2多肽包含SEQ ID NO:50的氨基酸序列,或与SEQ ID NO:50具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码KWS-RBP1多肽的核酸编码SEQ ID NO:50的氨基酸序列,或编码与SEQ ID NO:50具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或RKD4多肽包含SEQ ID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码RKD4多肽的核酸编码SEQ ID NO:16、18或20的氨基酸序列,或编码与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或RKD2多肽包含SEQ ID NO:22、24或26的氨基酸序列,或与SEQ ID NO:22、24或26具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或编码RKD2多肽的核酸编码SEQ ID NO:22、24或26的氨基酸序列,或编码与SEQ ID NO:22、24或26具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
在上述方法的另一个实施方案中,编码PLT5多肽的核酸包含具有选自以下的编码序列的核酸:
(i)包含SEQ ID NO:9或11的核苷酸序列的核酸;
(ii)包含与SEQ ID NO:9或11具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列;
(iii)在严格杂交条件下与(i)或(ii)中定义的核酸的互补链杂交的核酸;
其中编码KWS-RBP1多肽的核酸包含具有选自以下的编码序列的核酸:
(I)包含SEQ ID NO:13的核苷酸序列的核酸;
(II)包含与SEQ ID NO:13具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;
(III)在严格杂交条件下与(I)或(III)中定义的核酸的互补链杂交的核酸;
编码KWS-RBP2多肽的核酸包含具有选自以下的编码序列的核酸:
(A)包含SEQ ID NO:49的核苷酸序列的核酸;
(B)包含与SEQ ID NO:49具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;
(C)在严格杂交条件下与(A)或(B)中定义的核酸的互补链杂交的核酸;
编码RKD4多肽的核酸包含具有选自以下的编码序列的核酸:
(1)包含SEQ ID NO:15、17或19的核苷酸序列的核酸;
(2)包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(3)在严格杂交条件下与(1)或(2)中定义的核酸的互补链杂交的核酸;
编码RKD2多肽的核酸包含具有选自以下的编码序列的核酸:
a)包含SEQ ID NO:21、23或25的核苷酸序列的核酸;
b)包含与SEQ ID NO:21、23或25具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
c)在严格杂交条件下与a)或b)中定义的核酸的互补链杂交的核酸。
在上述方法的另一个实施方案中,基因组工程化组分包含
a)诱导双链断裂(DSB)的酶或编码其的核酸,其中DSB诱导酶任选地识别所述细胞的基因组中的预定位点,并且其中DSB诱导酶任选地是修复核酸分子;
b)诱导单链断裂(SSB)的酶或编码其的核酸,其中SSB诱导酶任选地识别所述细胞的基因组中的预定位点,并且其中SSB诱导酶任选地是修复核酸分子;
c)碱基编辑器酶,其任选地与解除武装的DSB诱导酶或解除武装的SSB诱导酶融合,其中碱基编辑器酶优选地识别所述细胞的基因组中的预定位点;或
d)影响DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与解除武装的DSB诱导酶或解除武装的SSB诱导酶融合,其中所述酶任选地识别所述细胞的基因组中的预定位点。
在上述方法的另一个实施方案中,基因组工程化组分包含DSB诱导酶或SSB诱导酶或其变体,其是CRISPR/Cas内切核酸酶,CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶,锌指核酸酶(ZFN),归巢内切核酸酶,大范围核酸酶或TAL效应物核酸酶。
在上述方法的另一个实施方案中,基因组工程化组分的活性包含在植物细胞的基因组中诱导一个或多个双链断裂,在植物细胞的基因组中诱导一个或多个单链断裂,在植物细胞的基因组中诱导一个或多个碱基编辑事件,或在植物细胞的基因组中诱导一个或多个DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化。在诱导一个或多个双链断裂或一个或多个单链断裂之后为非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂的同源性定向修复。
在上述方法的另一个实施方案中,转基因选自编码对非生物胁迫具有抗性或耐受性的基因,非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或涝渍,编码除草剂抗性的基因,除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和Dicamba的抗性,编码对生物胁迫具有抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因,或编码与产量相关的性状的基因,所述与产量相关的性状包括倒伏抗性、开花时间、抗裂荚性(shattering resistance)、种子颜色、胚乳组分或营养成分。
在上述方法的另一个实施方案中,所述基因组的修饰选自i)取代至少一个核苷酸;ii)缺失至少一个核苷酸;iii)插入至少一个核苷酸;iv)DNA甲基化的改变;v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变;和vi)i)-v)的任何组合。
在一些实施方案中,所述方法有效地促进细胞增殖或细胞再生,优选地在遗传修饰/基因组修饰之后,或所述方法有效地提高转基因植物、基因编辑的植物或碱基编辑的植物的再生效率。
在一些实施方案中,所述方法有效地诱导来自单个细胞(优选胚性细胞、体细胞或原生质体)或来自愈伤组织细胞的直接或间接胚胎发生,优选地在遗传修饰/基因组修饰之后。
在一些实施方案中,所述方法有效地提高转基因向植物细胞中的稳定转化效率或有效地提高转基因植物的生成的效率。
在一些实施方案中,所述方法有效地提高基因组工程化组分编辑植物细胞的基因组的效率或有效地提高转基因的、基因编辑的或碱基编辑的植物的生成的效率。
在一些实施方案中,所述方法有效地改善衍生自顽抗基因型(recalcitrantgenotypes)的植物的再生效率,有效地改善从非常规组织类型再生植物的效率,或有效地加速再生过程,优选地在遗传修饰/基因组修饰之后。
在上述方法的另一个实施方案中,所述定点转录激活子或编码其的核酸包含至少一个识别结构域和至少一个激活结构域,其中定点转录激活子被配置为提高来自内源性核酸的第一加强子多肽、来自内源性核酸的第二加强子多肽、来自内源性核酸的第三加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过结合至位于与第一内源性加强子多肽、第二内源性加强子多肽、第三内源性加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的起始密码子有一定距离的调控区域。
在上述方法的另一个实施方案中,至少一个识别结构域是选自以下的分子或分子的片段:至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌指结构域、和至少一个解除武装的归巢内切核酸酶或其任何组合。
在上述方法的另一个实施方案中,至少一个解除武装的CRISPR/核酸酶系统选自CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCms1系统、CRISPR/dCasX系统或CRISPR/dCasY系统或其任何组合,其中至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。在上述方法的一个实施方案中,至少一个激活结构域是酸性转录激活结构域,优选地至少一个激活结构域是来自水稻白叶枯病菌(Xanthomonas oryzae)的TAL效应物基因、来自单纯疱疹的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
本发明的另一方面,一种用于改善植物再生效率或提高植物细胞再生能力的方法,其包含将上述所定义的(i)的组分、核酸、重组基因或上述所定义的DNA构建体导入植物细胞。
在本发明的另一方面,提供了根据上述用于在植物细胞中遗传修饰的方法获得或可获得的经遗传修饰的植物细胞。
另一个方面是植物或部分植物,其包含上述经遗传修饰的植物细胞。
另一个方面是用至少上述用于在植物细胞中遗传修饰的方法的(i)的组分、上述所定义的核酸、重组基因或DNA构建体所包被的微粒。
在另一个实施方案中,微粒进一步被基因组工程化组分包被。
本发明的另一方面是一种用于通过微弹轰击对植物基因组遗传修饰的试剂盒,所述试剂盒包含(I)一个或多个上述微粒,和(II)用于包被上述所定义的微粒的工具。
在一个实施方案中,试剂盒进一步包含用于用基因组工程化组分包被微粒的工具。
在另一方面,本发明提供一种用于产生经遗传修饰的植物的方法,其包含以下步骤:(a)根据如上所述的用于在植物细胞中遗传修饰的任何方法来遗传修饰植物细胞,和(b)从步骤(a)的修饰的植物细胞再生植物。
在一个实施方案中,所产生的植物不包含在步骤(a)中导入的基因组工程化组分、加强基因和加强子多肽的任一项。
另一个方面是通过上述用于产生经遗传修饰的植物的方法获得或可获得的经遗传修饰的植物或其部分。
本发明的另一方面是上述(i)的组分、核酸、重组基因或DNA构建体用于改善植物再生的效率或提高植物细胞的再生能力的用途。
附图简述
图1显示加强基因表达载体pABM-BdEF1(SEQ ID NO:30)的图谱。BdEF1和nos-T分别定义来自短柄草属(Brachypodium)EF1基因的强组成型启动子和nos终止子。BamHI和HindIII说明了克隆位点。
图2显示玉米WUS2表达构建体pABM-BdEF1_ZmWUS2(SEQ ID NO:28)的图谱。玉米WUS2基因(ZmWUS2)由来自短柄草属的强组成型EF1启动子(pBdEF1)驱动。
图3显示玉米PLT7表达构建体pABM-BdEF1_ZmPLT7(SEQ ID NO:26)的图谱。玉米PLT7基因(ZmPLT7)由来自短柄草属的强组成型EF1启动子(pBdEF1)驱动。
图4显示KWS-RBP1表达构建体pABM-BdEF1-KWS-RBP1(SEQ ID NO:27)的图谱。KWS-RBP1基因由来自短柄草属的强组成型EF1启动子(pBdEF1)驱动。
图5显示小麦RKD4表达构建体pABM-BdEF1-TaRKD4(SEQ ID NO:28)的图谱。小麦RKD4(TaRKD4基因由来自短柄草属的强组成型EF1启动子(pBdEF1)驱动。
图6显示基因组编辑CRISPR Cpf1表达构建体pGEP359(SEQ ID NO:29)的图谱。tDTomato定义tdTomato基因(tDT)。ZmLpCpf1定义毛螺菌科(Lachnospiraceae)细菌CRISPR/Cpf1(LbCpf1)基因的玉米密码子优化的CDS。
图7显示基因组编辑CRISPR RNA构建体pGEP324(SEQ ID NO:30)的图谱。crGEP05定义靶向玉米HMG13基因的crRNA5。ZmUbi1定义来自玉米泛素1基因的启动子和内含子。Tnos定义nos终止子。
图8显示玉米PLT5表达构建体pABM-BdEF1_ZmPLT5(SEQ ID NO:25)的图谱。玉米PLT5基因(ZmPLT5)由来自短柄草属的强组成型EF1启动子(pBdEF1)驱动。
图9显示在加强子基因与pGEP359(图6)和pGEP324(图7)质粒共同轰击后18小时,A188未成熟胚的荧光图像。图像是轰击后18小时拍摄的。
图10显示在A188未成熟胚中促进胚胎发生的ZmWUS2和ZmPLT7的瞬时共同表达。图像显示用加强基因构建体和tDT构建体共同轰击后1个月,从玉米A188胚诱导的胚胎发生结构(B)。图10A显示仅用tDT构建体共同轰击后1个月的玉米A188胚。
图11显示在A188未成熟胚中促进胚胎发生的ZmWUS2和ZmPLT7的瞬时共同表达。图像显示用加强基因构建体共同轰击后7天和1个月从玉米A188胚诱导的胚胎发生结构。红色荧光图像(星号)显示从玉米A188胚产生的表达tDT的结构。通过双目显微镜获得其他图像作为参考。
图12显示仅用Tdt、用Tdt和PLT7、用Tdt和WUS2以及用Tdt、WUS2和PLT7轰击后1个月,具有Tdt形成的胚性结构的量化。
图13显示从玉米A188基因型的稳定转化再生的成株:(A)正常A188植物(非转基因)、(B)ZmWUS2的稳定转基因整合和(C、D)ZmWUS2和ZmPLT7的稳定转基因整合。
图14显示ZmPLT7的瞬时表达促进玉米Hi II胚中共同递送的tDT报告基因的稳定转化。红色荧光图像显示共同轰击后10天从玉米Hi II胚产生的稳定的表达tDT的结构(图14A和14B)。图14C显示ZmPLT7的递送使Hi II未成熟胚中tDT报告基因的稳定转化频率提高了超过20%。结果是轰击后10天获取的。
图15显示从玉米Hi II基因型的稳定转化再生的成株:(A)正常A188植物(非转基因)、(B)ZmPLT7的稳定转基因整合。
图16显示玉米WUS2(ZmWUS2)启动子报告构建体pAMK-ZmWUS2-tDT-nosT(SEQ IDNO:29)的图谱。tDToma定义荧光tDT报告基因,其由玉米WUSCHEL2启动子(pZmWUS2)驱动。
图17显示小麦TaRKD4基因通过玉米未成熟胚IE(上图)和叶(下图)中的瞬时共同轰击而激活玉米WUS2启动子。图17A显示仅玉米WUS2启动子报告构建体(图16;SEQ ID NO:29)(仅pZmWUS2报告)。图17B显示玉米WUS启动子报告构建体和小麦RKD4构建体(图5)的共同轰击(pZmWUS2报告和TaRKD4)。图像是轰击后44小时拍摄的。
发明详述
定义
除非另有定义,否则本文使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。
如在本申请的上下文中使用的,术语“约”是指所述值的+/-10%,优选地指所述值的+/-5%。例如,应将约100个核苷酸(nt)理解为90nt和110nt之间的值,优选地为95nt和105nt之间。
如本文所用,术语“加强子”、“加强子基因”、“加强子多肽”、“加强多肽”、“加强基因”和“加强因子”是指蛋白质/肽或编码蛋白质/多肽的(多)核酸片段,其可导致改善的基因组工程化和/或改善的转化的或基因编辑的植物细胞的植物再生。这样的蛋白质/多肽可以提高植物细胞的性能或能力(所述植物细胞优选地衍生自体细胞组织、胚性组织、愈伤组织或原生质体)以在整个植物(优选地在可育植物)中再生。因此,它们可以调节体细胞胚的形成(体细胞胚胎发生)和/或它们可以提高植物细胞的增殖速率。示例性的加强子多肽包括但不限于根据本发明的第一加强子多肽(例如SEQ ID NO:2)和第二加强子多肽(SEQ IDNO:4、6和8)或根据本发明的第三加强子多肽(例如SEQ ID NO:16、18和20)和第二加强子多肽(SEQ ID NO:4、6和8)及其变体。转化的或基因编辑的植物细胞的再生可包括体细胞胚胎发生的过程,其是一种人工过程,其中植物或胚衍生自单个体细胞或一组体细胞。体细胞胚是从通常不参与胚发育的植物细胞(即如萌芽(bud)、叶、芽(shoot)等植物组织)形成的。该过程的应用可包括:克隆繁殖遗传上均一的植物材料;消除病毒;提供用于遗传转化的源组织;从单个细胞(诸如原生质体)生成完整植物;发展合成种子技术。可以培养衍生自感受态的源组织的细胞以形成愈伤组织。可以操纵组织培养基中的植物生长调节剂(例如生长素或细胞分裂素)以诱导愈伤组织形成,以及随后改变组织培养基中的植物生长调节剂(例如生长素或细胞分裂素)以诱导从愈伤组织形成胚。已经以直接或间接两种方式描述了体细胞胚胎发生。当胚直接从外植体组织开始产生相同克隆时发生直接胚胎发生。当外植体产生未分化或部分分化的细胞(即愈伤组织),然后其维持或分化成植物组织(如叶,茎或根)时,发生间接胚胎发生。
根据本公开内容使用的术语“转基因的(transgenic)”是指包含基因或遗传构建体的植物、植物细胞、组织、器官或材料,其包含自另一生物体通过自然手段或通过转化技术的手段已转移至植物、植物细胞、组织器官或材料中的“转基因”。术语“转基因”包含核酸序列(包括DNA或RNA)或氨基酸序列,或其组合或混合。因此,术语“转基因”不限于通常被识别为“基因”的序列,即编码蛋白质的序列。它也可以指,例如,非编码蛋白质的DNA或RNA序列。因此,术语“转基因的”通常意味着相应的核酸或氨基酸序列不是天然存在于相应的靶细胞(包括植物、植物细胞、组织、器官或材料)的。因此,本文所用的术语“转基因”或“转基因的”是指这样的核酸序列或氨基酸序列,其从一个生物体的基因组获得或合成产生,并然后通过分子生物学,遗传学等人工技术其以瞬时或稳定方式导入另一个生物体。如本文所用,“植物材料”是指可以在任何发育阶段期间从植物获得的任何材料。植物材料可以以植物原位(in planta)获得或从植物或其植物组织或器官的体外培养物中获得。因此,术语包含植物细胞、组织和器官以及发育的植物结构以及亚细胞组分,如核酸、多肽以及可以在植物细胞或区室内找到和/或可以由植物产生或可以从处于任何发育阶段的任何植物细胞、组织或植物的提取物中获得的所有化学植物物质或代谢物。术语还包含植物材料的衍生物(例如原生质体),其衍生自植物材料所包含的至少一个植物细胞。因此,术语还包含植物的分生组织细胞或分生组织。
本文使用的术语“基因组工程化”是指用于植物细胞的任何遗传信息或基因组的遗传修饰的策略和技术,其包含基因组转化、基因组编辑。因此,“基因组编辑”是指用于对植物细胞的任何遗传信息或基因组的靶向、特异性修饰的技术。因此,术语既包含基因编码区域的基因编辑,还包含除基因组的基因编码区域以外的区域的编辑。它还包含植物细胞的核(如果存在)以及其他遗传信息的编辑或工程化。此外,“基因组工程化”还包含表观遗传编辑或工程化,即靶向修饰,例如甲基化、组蛋白修饰或可能引起基因表达中的可遗传改变的非编码RNA的靶向修饰。
如本文所用,术语“基因组编辑”是指用于植物细胞的任何遗传信息或基因组的靶向、特异性修饰的策略和技术。因此,这些术语既包含基因编辑,也包含除基因组的基因编码区域以外的区域的编辑,例如内含子序列、非编码RNA、miRNA、调节元件序列(如启动子、终止子、转录激活子结合位点、顺式或反式作用元件)。额外地,“基因组编辑”可以包含针对单个核碱基的靶向取代的碱基编辑。它可以进一步包含植物细胞的核基因组以及其他遗传信息(即线粒体基因组或叶绿体基因组以及miRNA、前体mRNA或mRNA)的编辑。此外,“基因组编辑”可以包含可能导致基因表达中的可遗传改变的表观遗传编辑或工程化,即靶向修饰,例如DNA甲基化或组蛋白修饰(诸如组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化)的靶向修饰。“基因组编辑”还可包含可能导致基因表达中的可遗传改变的非编码RNA的表观遗传编辑或工程化。
如本文所用,“碱基编辑器(base editor)”是指具有与其衍生的蛋白质相同催化活性的蛋白质或其片段,该蛋白质或其片段单独或以分子复合物(在本文中称为碱基编辑复合物)提供时具有介导靶向碱基修饰的能力,即如果碱基转变(conversion)未引起沉默突变而是引起由包含待用碱基编辑器转变的位置的密码子所编码的氨基酸的转变,感兴趣的碱基的转变导致感兴趣的点突变,进而能导致靶向突变。
如本文所用,“调节元件”是指这样的核苷酸序列,其不是编码蛋白质的核苷酸序列的一部分,而是介导编码蛋白质的核苷酸序列的表达。调节元件包括例如启动子、顺式调节元件、增强子、内含子或终止子。根据调节元件的类型,它位于编码蛋白质的核苷酸序列之前(即其5')或之后(即其3')的核酸分子上。调节元件在活植物细胞中起作用。术语“可操作地连接”是指调节元件以这种方式与编码蛋白质的核苷酸序列连接,即,相对于编码蛋白质的核苷酸序列以这种方式定位在例如核酸分子上,使得在活细胞中可发生在调节元件的控制下的编码蛋白的核苷酸序列的表达。
如本文所用,“上游”表示核酸分子上更靠近所述核酸分子的5'端的位置。同样地,术语“下游”是指核酸分子上更靠近所述核酸分子的3'端的位置。为避免疑问,核酸分子及其序列通常以其5'至3'方向(从左至右)表示。
如本文所用,“侧翼区域”是具有与位于预选位点侧翼(即上游或下游)的DNA区域的核苷酸序列同源的核苷酸序列的修复核酸分子的区域。
如本文所用,“瞬时表达”是指这样的现象,其中转移的蛋白/多肽和编码蛋白/多肽的核酸片段在细胞中瞬时表达的和/或瞬时有活性的,并不久随细胞生长而关闭和/或削弱。
如本文所用,“双链DNA断裂诱导酶”、“诱导双链断裂的酶”或“DSBI酶”是能够在被称为“识别位点”或“预定位点”的特定核苷酸序列处诱导双链DNA断裂的酶。因而,“单链DNA或RNA断裂诱导酶”、“诱导单链断裂的酶”或“SSBI酶”是能够在被称为“识别位点”或“预定位点”的特定核苷酸序列处诱导单链DNA或RNA断裂的酶。
如本文所用,“修复核酸分子”是单链或双链DNA分子或RNA分子,其用作修饰切割位点附近或切割位点处的预选位点处的基因组DNA或RNA的模板。如本文所用,“用作修饰基因组DNA的模板”是指通过在位于预选位点侧翼的靶基因组中的侧翼区域和相应的同源区域之间的同源重组,任选地与修复核酸分子的两端中的一端处的非同源末端连接(NHEJ)组合(例如在只有一个侧翼区域的情况下),而在预定位点复制或整合修复核酸分子。
如本文所用,“基因组的修饰”是指基因组已经在至少一个核苷酸或通过至少一次表观遗传编辑而被改变。
如本文所用,“预选位点”、“预定位点”或“预定义位点”表示在基因组(例如,核基因组或叶绿体基因组)中的特定核苷酸序列,在该位置期望插入、取代和/或缺失一个或多个核苷酸。
如本文所用,“植物激素”或“植物生长调节剂”指促进植物细胞分裂和/或植物形态发生的天然存在或合成的任何材料和化学物质。如本文所用,“再生”是指单个或多个细胞增殖并发育成组织、器官最终为整个植物的过程。
如本文所用,术语“载体”或“质粒(载体)”是指这样的构建体,其尤其包含用于导入或转化,转染或转导进任何根据本公开的真核细胞(包括植物、植物细胞、组织、器官或材料)中的质粒或(质粒)载体、粘粒、人工酵母染色体或细菌人工染色体(YAC和BAC)、噬菌粒、基于细菌噬菌体的载体、表达盒、分离的单链或双链核酸序列(其包含线性或环状形式的序列)、或氨基酸序列、病毒载体(包括修饰的病毒)及其组合或混合。
在重组基因的背景下的“重组体”可以包含调节序列和/或定位序列。根据本发明的重组构建体或DNA构建体可以整合进载体(包括质粒载体)或可以是载体(包括质粒载体),和/或其可以例如以单链或双链核酸的形式从载体结构中分离存在。其导入后,例如通过利用生物或物理手段的转化或转染,重组基因或DNA构建体也可例如以双链或单链DNA的形式保持在染色体外,即未整合进靶细胞的基因组。可选地,重组基因或DNA构建体可以稳定地整合进靶细胞的基因组,包括靶细胞的核基因组或其他遗传元件,包括质体(如线粒体或叶绿体)的基因组。
加强子多肽及编码加强子多肽的核酸
在第一方面,提供了编码第一加强子多肽和第二加强子多肽的核酸,其中第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和其中第二加强子多肽包含SEQ ID NO:4、6或8中任一个的氨基酸序列,或与SEQ ID NO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
在第二方面,提供了编码第三加强子多肽和第二加强子多肽的核酸,其中第三加强子多肽包含SEQ ID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和其中第二加强子多肽包含SEQ ID NO:4、6或8中任一项的氨基酸序列,或与SEQ ID NO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列,其中在第三加强子多肽翻译后,前述第一加强子多肽的表达被激活;其中第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
发明人表明第一和第二加强子多肽的组合以及第三和第二加强子多肽的组合介导意想不到的强加强子效应。通过与其他加强子多肽进一步组合,甚至可进一步增强这种效应,尤其在递送转基因和/或基因组工程化组分后的再生早期。这种加强效应不会损害植物发育,以及再生的植物在成年期显示出有利的植物生长并且可育。这样,可以通过杂交和选择在下一代中分离出加强子基因或加强子多肽的整合。
在本文公开的各种方法中,可瞬时提供或共同表达任何单个加强子多肽或加强子多肽的组合。加强子多肽本身可被导入植物细胞,或者可选地,编码加强子多肽的多核苷酸可以被导入植物细胞。关于组合,可以将一个加强子多肽与编码其他加强子多肽或相同加强子多肽的核苷酸一起导入植物细胞。例如,可以将包含SEQ ID NO:2序列的第一加强子多肽与包含SEQ ID NO:3、5或7核苷酸序列的核酸(其编码第二加强子多肽)一起导入植物细胞。
根据第一方面,还提供了编码包含SEQ ID NO:2的氨基酸序列的第一加强子多肽和包含SEQ ID NO:4、6或8的氨基酸序列的第二加强子多肽的核酸。还提供了编码包含以下的第一加强子和第二加强子多肽的核酸,其中第一加强子多肽包含与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列并且其中第二加强子多肽包含SEQ ID NO:4、6或8中任一项的氨基酸序列或与SEQ ID NO:4、6或8的任一项具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。核酸可包含包含与SEQ ID NO:3、5或7组合的SEQ ID NO:1的核苷酸序列的核酸。核酸可包含编码与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的第一加强子多肽的核苷酸序列和编码与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的第二加强子多肽的核苷酸序列。可选地,核酸可以在严格杂交条件下与包含SEQ ID NO:1核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交,以及在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
根据第二方面,还提供了编码包含SEQ ID NO:16、18或20的氨基酸序列的第三加强子多肽和包含SEQ ID NO:4、6或8的氨基酸序列的第二加强子多肽的核酸。还提供了编码包含以下的第三加强子和第二加强子多肽的核酸,其中第三加强子多肽包含与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列并且其中第二加强子多肽包含SEQ ID NO:4、6或8中任一项的氨基酸序列或与SEQID NO:4、6或8的任一项具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。核酸可包含包含与SEQ ID NO:3、5或7组合的SEQ ID NO:15、17或19的核苷酸序列的核酸。核酸可包含编码与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的第三加强子多肽的核苷酸序列和编码与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的第二加强子多肽的核苷酸序列。可选地,核酸可以在严格杂交条件下与包含SEQ ID NO:15、17或19的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交,以及在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
根据第一方面,提供了包含编码第一加强子多肽和第二加强子多肽的核酸的重组基因,其中第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列以及第二加强子多肽包含SEQ ID NO:4、6或8的氨基酸序列或与SEQ ID NO:4、6或8具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。核酸可可操作地与一个或多个调节元件连接。调节元件可以是启动子、顺式调节元件、增强子、内含子或终止子。调节元件可以是核酸序列的5'。调节元件可以是核酸序列的3'。核酸可包含包含SEQID NO:1的核苷酸序列与SEQ ID NO:3、5或7的核苷酸序列组合的核酸。核酸可包含与SEQID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列和与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。核酸可以在严格杂交条件下与包含SEQ ID NO:1的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交,以及核酸可以在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
根据第二方面,提供了包含编码第三加强子多肽和第二加强子多肽的核酸的重组基因,其中第三加强子多肽包含SEQ ID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列,并且第二加强子多肽包含SEQ ID NO:4、6或8的氨基酸序列,或与SEQ ID NO:4、6或8具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。核酸可可操作地与一个或多个调节元件连接。调节元件可以是启动子、顺式调节元件、增强子、内含子或终止子。调节元件可以是核酸序列的5'。调节元件可以是核酸序列的3'。核酸可包含包含SEQ ID NO:15、17或19的核苷酸序列与SEQ ID NO:3、5或7的核苷酸序列组合的核酸。核酸可包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列和与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。核酸可以在严格杂交条件下与包含SEQ ID NO:15、17或19的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交,以及核酸可以在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
在一些实施方案中,核酸与异源启动子可操作地连接。异源启动子可以是强组成型启动子(诸如双35S启动子(d35S))、组织特异性启动子、发育特异性启动子或诱导型启动子。异源启动子可以是来自EF1基因的启动子(诸如短柄草属(Brachypodium)EF1基因(pBdEF1,SEQ ID NO:30)、来自泛素1基因的启动子(诸如玉米泛素1基因)、WUSCHEL2启动子(诸如玉米WUSHCEL2启动子(pZmWUS2))。异源启动子可以是美国专利号6,528,701描述的泛素启动子,该专利以引用的方式并入本文。可以使用的各种组织特异性启动子描述于美国专利号7,763,774和7,767,801,其各自通过引用并入本文。
还提供了包含任何以上核酸或重组基因的DNA构建体,优选地为载体。核酸可包含包含SEQ ID NO:1的核苷酸序列的编码第一加强子多肽的核酸和包含SEQ ID NO:3、5或7的核苷酸序列的编码第二加强子多肽的核酸。核酸可包含包含SEQ ID NO:15、17或19的核苷酸序列的编码第三加强子多肽的核酸和包含SEQ ID NO:3、5或7的核苷酸序列的编码第二加强子多肽的核酸。编码第一加强子多肽的核酸可包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。编码第二加强子多肽的核酸可包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。编码第三加强子多肽的核酸可包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。可选地,核酸可以在严格杂交条件下与包含SEQ ID NO:1的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。此外,核酸可以在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。此外,核酸可以在严格杂交条件下与包含SEQ ID NO:15、17或19的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。在一些实施方案中,DNA构建体是质粒。
植物细胞
在另一方面,提供了一种植物细胞,其包含本文所述的第一和第二加强子多肽、第三和第二加强子多肽、核酸、重组基因和DNA构建体。在一些实施方案中,第一加强子多肽包含SEQ ID NO:2的氨基酸序列及第二加强子多肽包含SEQ ID NO:4、6或8的氨基酸序列。在一些实施方案中,第三加强子多肽包含SEQ ID NO:16、18或20的氨基酸序列及第二加强子多肽包含SEQ ID NO:4、6或8的氨基酸序列。在一些实施方案中,第一加强子多肽包含与SEQID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。在另一些实施方案中,第二加强子多肽包含与SEQ ID NO:4、6或8具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。在一些实施方案中,第三加强子多肽包含与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。核酸可包含包含SEQ ID NO:1的核苷酸序列的核酸和包含SEQ ID NO:3、5或7的核苷酸序列的核酸,或核酸可包含包含SEQ ID NO:15、17或19的核苷酸序列的核酸和包含SEQ ID NO:3、5或7的核苷酸序列的核酸。核酸可包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列和与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列,或核酸可包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列和与SEQ IDNO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。核酸可以在严格杂交条件下与包含SEQ ID NO:1的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。此外,核酸可以在严格杂交条件下与包含SEQ ID NO:3、5或7的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:3、5或7具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。此外,核酸可以在严格杂交条件下与包含SEQ ID NO:15、17或19的核苷酸序列的核酸的互补链杂交或在严格杂交条件下与包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。还提供了包含植物细胞的植物、植物的一部分、种子、胚或愈伤组织。
植物细胞可以是任何类型的植物材料的部分或衍生自任何类型的植物材料,优选地为芽、下胚轴、子叶、茎、叶、叶柄、根、胚、愈伤组织、花、配子体或其部分,或可以是原生质体或衍生自原生质体。可以使用分离的植物细胞以及植物材料,即含有植物细胞的整个植物或植物的部分。
植物的一部分或多个部分可以与整个完整的植物附着或分开。这样的植物部分包括但不限于植物的器官、组织和细胞,及优选地为种子。
植物细胞、植物部分或植物可以来自任何植物物种,无论是单子叶植物还是双子叶植物。优选地,可以经受本发明的方法和用途的植物是选自以下属的植物:大麦属(Hordeum)、高粱属(Sorghum)、甘蔗属(Saccharum)、玉蜀黍属(Zea)、狗尾草属(Setaria)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、黑小麦属(Triticale)、苹果属(Malus)、短柄草属(Brachypodium)、山羊草属(Aegilops)、胡萝卜属(Daucus)、甜菜属(Beta)、桉属(Eucalyptus)、烟草属(Nicotiana)、茄属(Solanum)、咖啡属(Coffea)、葡萄属(Vitis)、Erythrante、螺旋狸藻属(Genlisea)、黄瓜属(Cucumis)、Marus、拟南芥属(Arabidopsis)、须弥芥属(Crucihimalaya)、碎米荠属(Cardamine)、独行菜属(Lepidium)、荠属(Capsella)、Olmarabidopsis、筷子芥属(Arabis)、芸苔属(Brassica)、芝麻菜属(Eruca)、萝卜属(Raphanus)、柑橘属(Citrus)、麻风树属(Jatropha)、杨属(Populus)、苜蓿属(Medicago)、鹰咀豆属(Cicer)、木豆属(Cajanus)、菜豆属(Phaseolus)、大豆属(Glycine)、棉属(Gossypium)、黄芪属(Astragalus)、莲属(Lotus)、蝴蝶草属(Torenia)、葱属(Allium)或向日葵属(Helianthus)。更优选地,植物选自以下:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、两色高粱(Sorghum bicolor)、甘蔗(Saccharumofficinarium)、包括玉米(Zea mays)的玉蜀黍属物种(Zea spp.)、小米(Setariaitalica)、小粒稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryzaaustraliensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malusdomestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、包括甜菜(Beta vulgaris)的甜菜属物种(Beta spp.)、小胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotianatomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、螺旋狸藻(Genlisea aurea)、黄瓜(Cucumis sativus)、Marus notabilis、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、喜马拉雅鼠耳芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine nexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursapastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜状苜蓿(Medicago truncatula)、山下鹰嘴豆(Cicer yamashitae)、Cicer bijugum、鹰嘴豆(Cicer arietinum)、网状鹰嘴豆(Cicer reticulatum)、Cicerjudaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉花(Gossypium sp.)、紫云英(Astragalussinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和/或韭菜(Allium tuberosum)。特别优选地是甜菜(Betavulgaris)、玉米(Zea mays)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、黑麦(Secale cereale)、向日葵(Helianthus annuus)、马铃薯(Solanum tuberosum)、两色高粱(Sorghum bicolor)、芜菁(Brassica rapa)、欧洲油菜(Brassica napus)、芥菜(Brassicajuncacea)、甘蓝(Brassica oleracea)、萝卜(Raphanus sativus)、水稻(Oryza sativa)、大豆(Glycine max)和/或棉花(Gossypium sp.)。
经遗传修饰的植物细胞可以是整个植物的部分或其一部分。因此,本发明还涉及包含上述经遗传修饰的植物细胞的植物或植物部分。
在允许在至少一个加强因子存在下通过整合感兴趣的转基因和基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养已(共同)导入基因组工程化组分的植物细胞。
植物细胞的遗传修饰
还提供了一种在植物细胞中遗传修饰的方法。方法包含向植物细胞导入(i)选自以下的组分:
(i.a)上述核酸、重组基因和/或DNA构建体;或
(i.b1)编码第一加强子多肽的核酸;包含编码第一加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,DNA构建体,优选地为载体,其包含编码上述所定义的第一加强子多肽的核酸,或上述第一加强子多肽;和
(i.b2)编码上述所定义的第二加强子多肽的核酸;包含编码第二加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,或DNA构建体,优选地为载体,其包含编码上述第二加强子多肽的核酸,或上述所定义第二加强子多肽;或
(i.c1)编码适合于瞬时提高上述第一加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第一加强子多肽的表达的定点转录激活子;其中编码第一加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子;其中编码第二加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;和
(ii)转基因和/或基因组工程化组分。可以在允许从核酸、重组基因或DNA构建体合成加强子多肽的条件下培养植物细胞。可以在允许在加强子多肽存在时通过基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养植物细胞。
可选地,提供了一种在植物细胞中遗传修饰的方法。方法包含向植物细胞导入(i)选自以下的组分:
(i.a)上述该核酸、重组基因和/或DNA构建体;或
(i.b1)编码第三加强子多肽的核酸;包含编码第三加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,DNA构建体,优选地为载体,其包含编码上述所定义的第三加强子多肽的核酸,或上述第三加强子多肽;和
(i.b2)编码上述所定义的第二加强子多肽的核酸;包含编码第二加强子多肽的核酸的重组基因,其优选地与上述所定义的启动子可操作地连接,或DNA构建体,优选的为载体,其包含编码上述第二加强子多肽的核酸,或上述所定义的第二加强子多肽;或
(i.c1)编码适合于瞬时提高上述第三加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第三加强子多肽的表达的定点转录激活子;其中编码第三加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高上述第二加强子多肽的表达的定点转录激活子;其中编码第二加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;和
(ii)转基因和/或基因组工程化组分。可以在允许从核酸、重组基因或DNA构建体合成加强子多肽的条件下培养植物细胞。可以在允许在加强子多肽存在下通过基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养植物细胞。
基因组工程化组分可以作为蛋白质和/或作为编码基因组工程化组分的核酸导入,特别是作为DNA诸如质粒DNA、RNA、mRNA或RNP。基因组工程化可用于制备转基因的、基因编辑的或碱基编辑的植物材料。
对于待修饰的植物细胞,可以使用基于生物学方法的转化方法,诸如农杆菌属转化或病毒载体介导的植物转化。一种常见的生物学手段是用农杆菌属物种转化,其几十年来已用于各种不同的植物材料。病毒载体介导的植物转化也可以用于将遗传物质导入感兴趣的细胞。农杆菌属介导的转化是指使用根癌农杆菌(Agrobacterium tumefaciens)(一种作为天然遗传工程化载体起作用的土壤细菌)将外来DNA递送到植物细胞中的方法。根癌农杆菌可侵袭植物并将外来DNA转移进非常广泛的植物。
可选地,可以使用基于物理递送方法的转化方法,如粒子轰击或显微注射。粒子轰击包括基因枪法转染(biolistic transfection)或微粒介导的基因转移,其是指将包含感兴趣的核酸或遗传构建体的包被的微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。物理导入手段适合于导入核酸,即RNA和/或DNA,以及蛋白质。粒子轰击和显微注射已进化为将遗传物质导入感兴趣的植物细胞或组织的突出技术。Helenius等人,“Genedelivery into intact plants using the HeliosTM Gene Gun”,Plant MolecularBiology Reporter,2000,18(3):287-288公开了一种粒子轰击作为将材料导入植物细胞的物理方法。因此,存在多种植物转化方法以将遗传构建体形式的遗传物质导入感兴趣的植物细胞,包含植物生物技术领域技术人员已知的并且可以用于将编码至少一个与壁相关的激酶的至少一个基因导入植物细胞、组织、器官或完整植物中至少一个的至少一个细胞中的生物和物理手段。
如本文所用,术语“粒子轰击”,也称为“基因枪法转染”或“微粒介导的基因转移”,是指一种用于将包含加强基因、加强子多肽、基因组工程化组分和/或转基因的包被的微粒或纳米颗粒转移进靶细胞或组织中的物理递送方法。微米或纳米颗粒起射弹的作用,并使用合适的装置(通常称为基因枪)在高压下发射到感兴趣的靶结构上。通过粒子轰击的转化使用包被有感兴趣的构建体的金属微弹,然后使用称为“基因枪”的设备(Sandford等,1987)以足够快的高速(~1500km/h)将其发射到靶细胞上,以使其穿透靶组织细胞壁,但不够严酷以导致细胞死亡。对于原生质体,其细胞壁被完全去除,条件在理论上是不同的。至少一个微弹上的沉淀的构建体在轰击后释放到细胞中。微弹的加速是通过高压放电或压缩气体(氦气)来实现的。关于所使用的金属颗粒,其必须是无毒的,无反应的,并且其直径小于靶细胞的直径。最常用的是金或钨。从基因枪及其相关系统的制造商和供应商可以公开获得大量有关其一般用途的信息。
在微弹轰击的一个特别优选的实施方案中,一种或多种加强基因、加强子多肽、基因组工程化组分和/或转基因是通过包含具有0.4-1.6微米(μm)范围大小,优选0.4-1.0μm范围大小的金颗粒的微载体共同递送的。在示例性方法中,每一次轰击使用10-1000μg的金颗粒,优选50-300μg。
可以例如使用Bio-Rad PDS-1000/He粒子枪或手持式Helios基因枪系统将加强基因、加强子多肽、基因组工程化组分和/或转基因递送进靶细胞中。当使用PDS-1000/He粒子枪系统时,轰击破裂压力为450psi至2200psi,优选为450-1100psi,而Helios基因枪系统的破裂压力为100-600psi。可以将一种以上的化学物质或构建体与基因组工程化组分同时共同递送进靶细胞中。
可以将上述用于转化和转染的递送方法同时应用于导入本发明的工具。同样,存在用于将感兴趣的核酸或氨基酸构建体特异性地导入植物细胞的特异性转化或转染方法,包括电穿孔、显微注射、纳米颗粒和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以导入遗传构建体和/或核酸和/或蛋白质,尤其包含用磷酸钙转染、使用脂质体(例如阳离子脂质体)转染或使用阳离子聚合物(包括DEAD-右旋糖酐或聚乙烯亚胺)转染或其组合。以上递送技术(单独或组合)可用于体内(包括植物原位(in planta))或体外方法。
在一些实施方案中,基因组工程化组分包含:
a)诱导双链断裂(DSB)的酶或编码其的核酸,以及任选地修复核酸分子,其中DSB诱导酶任选地识别所述细胞的基因组中的预定位点;
b)诱导单链断裂(SSB)的酶或编码其的核酸,以及任选地修复核酸分子,其中SSB诱导酶任选地识别所述细胞的基因组中的预定位点;
c)碱基编辑器酶,其任选地与解除武装的DSB诱导酶或SSB诱导酶融合,其中碱基编辑器酶优选地识别所述细胞的基因组中的预定位点;或
d)影响DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与解除武装的DSB诱导酶或SSB诱导酶融合,其中酶优选地识别所述细胞的基因组中的预定位点。
为了能有在预定的靶位点的断裂,所述酶优选包括结合/识别结构域和切割结构域。能够诱导双链或单链断裂的特定酶是核酸酶或切口酶及其变体,包括不再包含核酸酶或切口酶功能而是作为识别分子与另一种酶组合起作用的分子。近年来,已经开发了许多合适的核酸酶,特别是定制的内切核酸酶,其包含大范围核酸酶、锌指核酸酶、TALE核酸酶、Argonaute核酸酶(其衍生自例如利用格氏嗜盐碱杆菌(Natronobacterium gregoryi))和CRISPR核酸酶(包含例如作为成簇的规律间隔短回文重复(CRISPR)系统的部分的Cas9、Cpf1、Csm1、CasX或CasY核酸酶)。因此,在本发明的一个优选方面,基因组工程化组分包含DSB诱导酶或SSB诱导酶或其变体,其选自CRISPR/Cas内切核酸酶,优选地为CRISPR/Cas9内切核酸酶,CRISPR/Cpf1内切核酸酶,或CRISPR/Csm1内切核酸酶,锌指核酸酶(ZFN),归巢内切核酸酶,大范围核酸酶和TAL效应物核酸酶。
稀有切割(rare-cleaving)内切核酸酶是具有优选为约14至70个连续的核苷酸的识别位点的DSBI/SSBI酶,并因此即使在较大基因组(诸如大多数植物基因组)中,具有非常低的切割频率。归巢内切核酸酶,也称为大范围核酸酶,构成此类稀有切割内切核酸酶的家族。它们可由内含子、独立基因或间插序列(intervening sequence)编码,并呈现出惊人的结构和功能特性,使它们与更经典的限制性酶区分开,通常与细菌限制性修饰II型系统区分开。它们的识别位点具有一般的不对称性,这与大多数限制性酶识别位点的特征性二重对称性(characteristic dyad symmetry)相反。由内含子或内含肽编码的几种归巢内切核酸酶已显示促进其各自的遗传元件向等位基因无内含子或无内含肽位点归巢。通过在无内含子或无内含肽等位基因中进行位点特异性双链断裂,这些核酸酶产生重组发生末端,所述重组发生末端参与基因转变过程,所述过程复制编码序列,并导致在DNA水平插入内含子或间插序列。在WO03/004659的表I(第17至20页)(其通过引用并入本文)中提供其他稀有切割大范围核酸酶及其各自的识别位点的列表。
此外,存在设计基本上识别所选的任何靶核苷酸序列的定制的稀有切割内切核酸酶的方法。简而言之,可以利用设计为识别特异性核苷酸序列的锌指结构域和诸如Fokl的来自天然限制性酶的非特异性DNA切割结构域之间的杂合体来制备嵌合限制性酶。此类方法在例如以下中进行描述:WO03/080809,WO94/18313或WO95/09233以及Isalan等,(2001),A rapid,generally applicable method to engineer zinc fingers illustrated bytargeting the HIV-1promoter.Nature biotechnology,19(7):656;Liu等,(1997),Design of polydactyl zinc-finger proteins for unique addressing withincomplex genomes,Proceedings of the National Academy of Sciences,94(11):5525-5530。
专门设计的内切核酸酶的另一个示例包括TALE核酸酶(TALEN),其基于融合到核酸酶的催化结构域(例如,FokI或其变体)的来自黄单胞菌(Xanthomonas)细菌属的转录激活因子样效应物(TALE)。这些TALE的DNA结合特异性由串联排列的34/35个氨基酸重复单元的重复可变二残基(RVD)定义,使得一个RVD特异性地识别靶DNA中的一个核苷酸。可以组装重复单元以基本上识别任何靶序列,并且可以将重复单元与核酸酶的催化结构域融合以产生序列特异性内切核酸酶(参见例如,Boch等,(2009),Breaking the code of DNAbinding specificity of TAL-type III effectors,Science,326(5959),509-1512;Moscou&Bogdanove(2009)。A simple cipher governs DNA recognition by TALeffectors,Science,326(5959),1501-1501;以及WO2010/079430、WO2011/072246、WO2011/154393、WO2011/146121、WO2012/001527、WO2012/093833、WO2012/104729、WO2012/138927、WO2012/138939)。WO2012/138927还描述单体(紧凑型)TALEN和具有各种催化结构域的TALE及其组合。
最近,已经描述了一种新型的可定制内切核酸酶系统;即所谓的CRISPR/Cas系统。在其自然环境中的CRISPR系统描述了一种分子复合物,其包含至少一个与可产生特异性DNA双链断裂的Cas核酸酶或另一种CRISPR核酸酶如Cpf1核酸酶或Csm1核酸酶(Zetsche等,“Cpf1 Is a Single RNA-Guides Endonuclease of a Class 2CRISPR-Cas System”,Cell,163,pp.1-13,October 2015;US 2017/0233756A1)组合的小的且单独的非编码RNA。目前,CRISPR系统分为两类,包括五种类型的CRISPR系统,例如用Cas9作为效应物的II型系统,以及用Cpf1作为效应物分子的V型系统(Makarova等,Nature Rev.Microbiol.,2015)。在人工CRISPR系统中,可以将合成的非编码RNA和CRISPR核酸酶和/或任选地修饰的CRISPR核酸酶(经修饰作为切口酶或缺乏任何核酸酶功能而作用)与至少一种组合crRNA和/或tracrRNA的功能的合成或人工向导RNA或gRNA组合使用(Makarova等,2015,同上)。在天然系统中CRISPR/Cas介导的免疫应答需要CRISPR-RNA(crRNA),其中控制CRISPR核酸酶特异性激活的该向导RNA的成熟在迄今为止已表征的多种CRISPR系统之间存在显著差异。首先,将入侵DNA(也称为间隔区)整合到CRISPR基因座近端的两个相邻重复区域之间。II型CRISPR系统将Cas9核酸酶编码为干扰步骤的关键酶,该系统既包含crRNA,且又包含反式激活RNA(tracrRNA)作为向导基序。这些杂交并形成双链(ds)RNA区域,其被RNAseIII识别并可以被切割以形成成熟的crRNA。然后,这些反过来又与Cas分子缔合,以便将核酸酶特异性地引导至靶核酸区域。重组gRNA分子既可包含可变DNA识别区域,且也可包含Cas相互作用区域,并因此可以独立于特异性靶核酸和期望的Cas核酸酶而被专门设计。
作为另一种安全机制,PAM(与前间隔区域邻近基序)必须存在于靶核酸区域中;这些是与来自Cas9/RNA复合物识别的DNA直接相连的DNA序列。针对来自酿脓链球菌(Streptococcus pyogenes)的Cas9的PAM序列已被描述为“NGG”或“NAG”(标准IUPAC核苷酸代码)(Jinek等,“A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity”,Science 2012,337:816-821)。针对来自金黄色葡萄球菌(Staphylococcus aureus)的Cas9的PAM序列是“NNGRRT”或“NNGRR(N)”。其他变体CRISPR/Cas9系统是已知的。因此,脑膜炎奈瑟氏菌(Neisseria meningitidis)Cas9在PAM序列NNNNGATT处切割。嗜热链球菌(Streptococcus thermophilus)Cas9在PAM序列NNAGAAW处切割。最近,已经描述了用于弯曲杆菌(Campylobacter)的CRISPR系统的另一种PAM基序NNNNRYAC(WO2016/021973A1)。对于Cpf1核酸酶,已经描述了与通常由Cas9系统识别的富G的PAM相反,没有tracrRNA的Cpf1-crRNA复合物经由短的富T的PAM进行的有效地识别和切割靶DNA(Zetsche等,同上)。此外,通过使用修饰的CRISPR多肽,可以获得特异性单链断裂。Cas切口酶与各种重组gRNA的组合使用还可通过双DNA切口的方式诱导高度特异性DNA双链断裂。此外,通过使用两个gRNA,可以优化DNA结合的特异性,并因而可以优化DNA切割。同时,其他最初针对细菌描述的CRISPR效应物,如CasX和CasY效应物是可得到的并且代表其他效应物,其可用于基因组工程化目的(Burstein等,“New CRISPR-Cas systems fromuncultivated microbes”,Nature,2017,542,237-241)。
DSBI/SSBI酶的切割位点与DNA或RNA上诱导断裂的确切位置有关。切割位点可包含或可不包含在DSBI/SSBI酶的识别位点中(可与DSBI/SSBI酶的识别位点重叠或可不与DSBI/SSBI酶的识别位点重叠),并因此据说DSBI/SSBI酶的切割位点位于其识别位点处或附近。DSBI/SSBI酶的识别位点,有时也称为结合位点,是由DSBI/SSBI酶(特异性)识别并确定其结合特异性的核苷酸序列。例如,TALEN或ZNF单体具有分别由其RVD重复或ZF重复确定的识别位点,而其切割位点由其核酸酶结构域(例如,FokI)确定,并且通常位于识别位点之外。在二聚TALEN或ZFN的情况下,切割位点位于相应单体的两个识别/结合位点之间,在此发生切割的该间插DNA或RNA区域称为间隔区域。
本领域技术人员将能够选择识别特定识别位点并在预选/预定位点处或附近的切割位点处诱导DSB或SSB的DSBI/SSBI酶,或工程化此类DSBI/SSBI酶。可选地,可以使用任何常规转化方法或通过与在其基因组中具有DSBI/SSBI酶识别位点的生物体杂交,将DSBI/SSBI酶识别位点导入靶基因组中,并然后可以在DSBI/SSBI酶的切割位点处或附近导入任何期望的核酸。
在各种实施方案中,在基因组的修饰中包含以下一种或多种:i)至少一个核苷酸的取代;ii)至少一个核苷酸的缺失;iii)至少一个核苷酸的插入;iv)DNA甲基化的改变;以及v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变。
在一些实施方案中,基因组工程化组分的活性诱导植物细胞的基因组中的一个或多个双链断裂、诱导植物细胞的基因组中的一个或多个单链断裂、诱导植物细胞的基因组中的一个或多个碱基编辑事件或植物细胞的基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的一种或多种。
在一些实施方案中,在诱导一个或多个双链断裂或一个或多个单链断裂之后是非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂的同源性定向修复。NHEJ和HDR是修复断裂的两个主要及独特的途径。同源重组需要作为模板的同源序列(例如修复核酸分子或“供体”)的存在以指导细胞修复过程,并且修复的结果是无错误且可预测的。在用于同源重组的模板(修复核酸分子或“供体”)序列缺失时,细胞通常尝试通过非同源末端连接(NHEJ)过程修复断裂。
在该实施方案的特别优选的方面,将修复核酸分子额外地导入植物细胞中。修复核酸分子是单链或双链DNA分子或RNA分子,其用作修饰切割位点处或附近的预选位点处的基因组DNA或RNA的模板。在一些实施方案中,修复核酸分子用作修饰基因组DNA的模板,其中通过在预选位点侧翼靶基因组中的侧翼区域和相应的同源区域之间的同源重组,任选地与修复核酸分子的两端中的一端处的非同源末端连接(NHEJ)组合(例如在只有一个侧翼区域的情况下),而在预定位点复制或整合修复核酸分子。通过同源重组的整合允许修复核酸分子精确地连接至靶基因组直至核苷酸水平,而NHEJ可导致修复核酸分子与基因组DNA之间的连接处的小插入/缺失。
在本文所描述方面的各种实施方案中,基因组的修饰发生在基因组中已经在至少一个核苷酸被改变。基因组的修饰发生可以通过插入转基因而发生,所述转基因优选地为包含感兴趣的转基因的表达盒,取代至少一个核苷酸和/或缺失至少一个核苷酸和/或插入至少一个核苷酸,只要与修饰前的预选基因组靶位点的核苷酸序列相比导致至少一个核苷酸的总改变,从而允许鉴定修饰,例如通过本领域技术人员熟知的诸如测序或PCR分析等的技术。
基因组的修饰可发生在预选位点、预定位点或预定义位点,即在基因组(例如,核基因组或叶绿体基因组)中的特定核苷酸序列,在该位置期望插入、取代和/或缺失一个或多个核苷酸。例如,预选位点、预定位点或预定义位点可以是在先前导入的外来DNA、RNA或转基因中或与之连接的内源基因座或特定核苷酸序列。预选位点可以是特定的核苷酸位置,在该位置(在该位置之后)意在制造一个或多个核苷酸的插入。预选位点还可以包含待交换(取代)或缺失的一个或多个核苷酸的序列。
在各种实施方案中,选择侧翼区域的长度和序列相同性百分比,以使得能够在所述侧翼区域与它们在预选位点上游或下游的相应DNA区域之间同源重组。与一个或多个修复核酸分子的侧翼DNA区域具有同源性的位于预选位点侧翼的一个或多个DNA区域也被称为一个或多个基因组DNA中的同源区域。
为了具有足够的重组同源性,修复核酸分子的侧翼DNA区域的长度可有所不同,并且长度应为至少约10nt、至少约15nt、至少约20nt、至少约25nt、至少约30nt、至少约40nt或至少约50nt。然而,侧翼区域可以尽实际可能地长(例如,高达约100-150kb,例如完整的细菌人工染色体(BAC))。优选地,侧翼区域将为约50nt至约2000nt,例如约100nt、约200nt、约500nt或约1000nt。此外,位于感兴趣的DNA侧翼的区域不必与同源区域(位于预选位点侧翼的DNA区域)相同,并且可与预选位点侧翼的DNA区域具有约80%至约100%的序列相同性,优选地具有约95%至约100%的序列相同性。侧翼区域越长,对同源性的要求越不严格。此外,为了在不改变相邻DNA序列的DNA序列的情况下实现预选位点处的靶DNA序列的交换,侧翼DNA序列应优选与在预选位点侧翼的上游和下游DNA区域相同。
为了在预选位点处进行靶序列修饰,必须选择侧翼区域,使得上游侧翼区域的3'端和/或下游侧翼区域的5'端与预定义位点的端部对齐。这样,上游侧翼区域的3'端确定预定义位点的5'端,而下游侧翼区域的5'端确定预定义位点的3'端。
预选位点位于所述裂解(和/或识别)位点之外或远离所述裂解(和/或识别)位点,使得欲进行基因组修饰的位点(预选位点)不包含裂解位点和/或DSBI/SSBI酶的识别位点,使得预选位点与裂解(和/或识别)位点不重叠。因此,在这方面之外/远离是指裂解(和/或识别)位点的上游或下游。
在各种实施方案中,根据本发明的至少一种碱基编辑器与至少一种位点特异性DSBI/SSBI酶复合物或至少一种修饰的位点特异性DSBI/SSBI酶复合物或任选地与该至少一种位点特异性DSBI/SSBI酶复合物的组分暂时或永久连接。连接可以是共价和/或非共价的。可以将本文公开的任何碱基编辑器或位点特异性DSBI/SSBI酶复合物或其催化活性片段,或碱基编辑器复合物的任何组分或位点特异性DSBI/SSBI酶复合物的任何组分可作为核酸片段导入细胞,所述核酸片段代表或编码DNA、RNA或蛋白质效应物,或其可以作为DNA、RNA和/或蛋白质或其任何组合导入。
碱基编辑器是具有介导靶向的碱基修饰(即,导致感兴趣的点突变的感兴趣的碱基的转变)能力的蛋白质或其片段。优选地,在本发明的上下文中,将至少一个碱基编辑器暂时或永久地融合至至少一个DSBI/SSBI酶,或任选地融合至至少一个DSBI/SSBI的组分。融合可以是共价和/或非共价的。多个出版物已显示靶向的碱基转变(主要从胞嘧啶(C)转变为胸腺嘧啶(T)),其使用与胞苷脱氨酶结构域(载脂蛋白B mRNA编辑催化多肽(APOBEC1)(例如来自大鼠的APOBEC))连接的CRISPR/Cas9切口酶或非功能性核酸酶。由胞嘧啶脱氨酶催化胞嘧啶(C)的脱氨基,并产生具有胸腺嘧啶(T)的碱基配对特性的尿嘧啶(U)。大多数已知的胞苷脱氨酶作用于RNA上,并且已知接受DNA的少数实例需要单链(ss)DNA。对dCas9-靶DNA复合物的研究揭示,在形成Cas9-向导RNA-DNA“R-环”复合物后,被取代的DNA链的至少九个核苷酸(nt)不配对(Jore et等,Nat.Struct.Mol.Biol.,18,529-536(2011))。确实,在Cas9 R-环复合物的结构中,被取代的DNA链上的前间隔序列的前11个nt是无序的,其表明它们的运动不被高度限制。还已经推测,Cas9切口酶诱导的在非模板链的胞嘧啶中的突变可能是由细胞胞嘧啶脱氨酶对它们的可及性引起。有理由认为,R-环中此ssDNA片段的子集可以作为dCas9-连接的胞苷脱氨酶的有效底物以实现DNA中C到U的直接可编程转变(Komor等,同上)。最近,Goudelli et al.,Programmable base editing of A·T to G·C ingenomic DNA without DNA cleavage,Nature,2017,551(7681),464,描述了介导基因组DNA中的A·T至G·C转变的腺嘌呤碱基编辑器(ABE)。
在本领域中已经鉴定了影响DNA甲基化的酶以及组蛋白修饰酶。组蛋白翻译后修饰在调节染色质结构和基因表达中起重要作用。例如,在Sterner DE,Berger SL(2000年6月):“Acetylation of histones and transcription-related factors”,Microbiol.Mol.Biol.Rev.64(2):435–59中描述的用于组蛋白乙酰化的酶。影响组蛋白甲基化的酶描述于Zhang Y.,Reinberg D(2001):“Transcription regulation by histonemethylation:interplay between different covalent modifications of the corehistone tails”,Genes Dev.15(18):2343–60。组蛋白的泛素化描述于Shilatifard A(2006):“Chromatin modifications by methylation and ubiquitination:implications in the regulation of gene expression”,Annu.Rev.Biochem.75:243–69。用于组蛋白磷酸化的酶描述于Nowak SJ.,Corces VG.(2004年4月):“Phosphorylationof histone H3:a balancing act between chromosome condensation andtranscriptional activation”,Trends genet.20(4):214–20。用于组蛋白SUMO化的酶描述于Nathan D.,Ingvarsdottir K.,Sterner DE.等,(2006年4月):“Histone sumoylationis a negative regulator in Saccharomyces cerevisiae and shows dynamicinterplay with positive-acting histone modifications”,Genes Dev.20(8):966–76。用于组蛋白核糖基化的酶描述于Hassa PO.,Haenni SS.,Elser M,Hottiger MO.(2006年9月):“Nuclear ADP-ribosylation reactions in mammalian cells:where are we todayand where are we going?”,Microbiol.Mol.Biol.Rev.70(3):789–829。组蛋白瓜氨酸化被例如称为肽基精氨酸脱亚胺酶4(PAD4,也称为PADI4)的酶催化,其将组蛋白精氨酸(Arg)和单甲基精氨酸残基两者转化为瓜氨酸。
可将影响DNA甲基化的酶和组蛋白修饰酶与解除武装的DSB或SSB诱导酶融合,其优选识别所述细胞的基因组中的预定位点。
示例性转基因
在植物细胞中遗传修饰的方法的各种实施方案中,转基因选自编码对非生物胁迫具有抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或涝渍,编码除草剂抗性的基因,所述除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和Dicamba的抗性,编码对生物胁迫具有抗性或耐受性的基因,所述对生物胁迫具有抗性或耐受性的基因包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因,或编码与产量相关的性状的基因,所述性状包括倒伏抗性、开花时间、抗裂荚性、种子颜色、胚乳组分或营养成分。
在植物细胞中遗传修饰的方法的各种实施方案中,所述方法有效地促进细胞增殖或细胞再生,或有效地提高转基因的、基因编辑的或碱基编辑的植物的再生效率。所述方法优选在遗传修饰/基因组修饰后有效。在植物细胞中遗传修饰的方法的各种实施方案中,所述方法有效地诱导来自单个细胞(优选胚性细胞、体细胞或原生质体)或来自愈伤组织细胞或来自愈伤组织细胞的直接或间接(体细胞)胚胎发生。所述方法优选在遗传修饰/基因组修饰后有效。在各种实施方案中,所述方法有效地提高转基因进入植物细胞的稳定转化效率,或者有效地提高产生转基因植物的效率。在各种实施方案中,所述方法有效地提高基因组工程化组分编辑植物细胞的基因组的效率,或者有效地提高产生转基因的、基因编辑的或碱基编辑的植物的效率。
在一些实施方案中,所述方法有效地改善衍生自顽抗基因型的植物的再生的效率,有效地改善从非常规组织类型的植物的再生的效率,或有效地加速再生过程,优选地在遗传修饰/基因组的修饰之后。
加强子多肽和加强基因的瞬时表达
还提供了植物细胞中瞬时表达第一和第二加强子多肽和/或编码第一和第二加强子多肽的核酸以及第三和第二加强子多肽和/或编码第三和第二加强子多肽的核酸的方法。所述方法包含向植物细胞导入:(i)在用于在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、第一和第二加强子多肽、第三和第二加强子多肽和/或本文所述的核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分。
在一些实施方案中,一个或多个加强子多肽和加强基因瞬时共同表达。共同表达可能有效地促进细胞增殖。这种共同表达可能有效地促进细胞再生。共同表达可以有效地诱导从单个细胞的胚胎发生,并因此提供无需选择而再生同质性植物的能力。共同表达可以通过与基因组编辑组分共同递送来改善基因组编辑效率。共同表达可以包含瞬时共同导入第一和第二加强子多肽、第三和第二加强子多肽、在用于在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、本文所述的核酸、重组基因或DNA构建体、以及一个或多个编码另一个加强子多肽的核酸(例如PLT5(SEQ ID NO:9-12),KWS-RBP-1(SEQ ID NO:13和14),KWS-RBP-2(SEQ ID NO:49和50),RKD4(SEQ ID NO:15-20),和RKD2(SEQ ID NO:21-26))。
第一和第二加强子多肽/第三和第二加强子多肽与一个或多个加强基因的瞬时共同递送可以如美国临时申请No.62/685,626(通过引用整体并入本文)中进行。
在各种实施方案中,如美国临时申请No.62/685,626中所述,可以递送其他加强因子诸如化学物质HDACi和植物激素。
在一些实施方案中,加强子多肽在植物细胞中是瞬时存在的、是瞬时有活性的和/或是瞬时表达的。在一些实施方案中,编码加强子多肽的核酸在植物细胞中是瞬时存在的、是瞬时有活性的和/或是瞬时表达的。除本文所述第一和第二加强子多肽、核酸、重组基因或DNA构建体外,可还向植物细胞导入选自PLT5多肽、KWS-RBP-1多肽、KWS-RPB-2多肽、RKD4多肽和RKD2多肽的一种或多种多肽和/或选自编码PLT5多肽、KWS-RBP-1多肽、KWS-RPB-2多肽、RKD4多肽和RKD2多肽的核酸的一种或多种核酸和/或适合于瞬时提高内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达的一种或多种定点转录激活子,和/或编码这种定点转录激活子的核酸。
瞬时表达可以通过加强子蛋白质/多肽或编码蛋白质/多肽的核酸片段的瞬时转化/转染来进行,优选地在强组成型启动子下表达。编码第一和第二加强子多肽的核酸、编码第三和第二加强子多肽的核酸、编码PLT5多肽的核酸、编码KWS-RBP1多肽的核酸、编码KWS-RBP2多肽的核酸的瞬时表达和/或适合于瞬时提高第一和第二加强子多肽、第三和第二加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达的一个或多个定点转录激活子的瞬时表达也可通过在组织和发育特异性启动子或诱导型启动子的控制下稳定转化加强基因来实现。加强基因可以被表达且然后瞬时有活性的。然后,当植物细胞发育改变或诱导条件被消除时,可以很快关闭并削弱加强基因。例如,来自短柄草属EF1基因的强组成型启动子pBdEF1(SEQ ID NO:30)可用于驱动加强基因用于瞬时转化(参见,例如实施例1)。
瞬时表达可产生自瞬时转染、瞬时转化和稳定转化中的任何一种。“瞬时转化”和“瞬时转染”包含将外来材料[即核酸片段、蛋白质、核糖核蛋白(RNP)等]转移进宿主细胞,导致基因表达和/或活性而无需整合和稳定遗传外来材料。外来组分不是永久性地并入细胞基因组中,而是提供暂时的作用导致基因组的修饰。瞬时转化事件可能不能传递给下一代,及因此是不可遗传的。“稳定转化”是指转移的核酸片段被整合到宿主细胞的基因组(包括核和细胞器基因组)中导致核酸片段的稳定遗传的事件。
例如,瞬时表达可用于瞬时基因组编辑。在植物细胞中基因组工程化组分的瞬时活性和/或瞬时存在可导致在植物细胞的基因组中导入一个或多个双链断裂、在植物细胞的基因组中导入一个或多个单链断裂、在植物细胞的基因组中导入一个或多个碱基编辑事件、或在植物细胞的基因组中导入DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的一个或多个。在植物细胞的基因组中所产生的修饰可以例如选自至少一个核苷酸的取代,至少一个核苷酸的缺失,至少一个核苷酸的插入,DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。
定点转录激活子意指美国临时申请No.62/609,508(其通过引用并入本文)中描述的合成转录因子。合成转录因子可以包含至少一个识别结构域和至少一个基因表达调节结构域,特别是激活结构域,其中合成转录因子被配置为调节植物或植物细胞的基因组中内源基因的表达。这种内源基因优选是(天然)形态发生基因,其编码参与植物发育过程如根形成或芽形成的多肽。在一些实施方案中,内源性形态发生基因选自编码第一加强子多肽的内源核酸和编码第二加强子多肽的内源核酸,与编码PLT5多肽的内源核酸、编码RKD4多肽的内源核酸、编码RKD2多肽的内源核酸的组合。在一些实施方案中,至少一个识别结构域是选自以下的分子或以下分子的片段:至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌指结构域和至少一种解除武装的归巢内切核酸酶,或其任何组合。
在一些实施方案中,至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dCasX系统或CRISPR/dCasY系统、或其任何组合,并且其中至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在一些实施方案中,至少一个激活结构域选自酸性转录激活结构域,优选地,其中至少一个激活结构域来自水稻白叶枯病菌的TAL效应物基因,来自单纯疱疹的VP16或四聚体VP64,VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在一些实施例中,激活结构域是VP64。
在一些实施方案中,合成转录因子被配置为通过结合至位于与起始密码子一定距离的调控区域来调节形态发生基因的表达,优选地调节形态发生基因的转录。在优选的实施方案中,合成转录因子被配置为通过结合至位于与起始密码子一定距离的调控区域来提高形态发生基因的表达,优选地提高形态发生基因的转录。
在一些实施方案中,定点转录激活子/合成转录因子或编码其的核酸包含至少一个识别结构域和至少一个激活结构域,其中定点转录激活子被配置为提高第一和第二加强子多肽或第三和第二加强子多肽的表达。此外,定点转录激活子可以被配置为提高内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达。定点转录激活子/合成转录因子可优选结合至位于与编码第一和第二加强子多肽或第三和第二加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的内源性核酸的起始密码子一定距离的调控区域。
如本文所用的,“调控区域”是指至少一个识别结构域与形态发生基因处或附近的基因组中靶序列的结合位点。取决于本文进一步公开的至少一个激活结构域和至少一个识别结构域的性质,可存在两个分立的调控区域,或可存在重叠的调控区域,其中合成转录因子的不同结构域可以以模块化的方式进行组装。
在某些实施方案中,至少一个识别结构域可靶向相对于感兴趣的基因的起始密码子的至少一个序列(识别位点),所述序列可以是相对于感兴趣的基因的起始密码子的至少1000bp上游(-)或下游(+)、-700bp至+700bp、-550bp至+500bp或-550bp至+425bp。在某些实施方案中,识别启动子附近的识别结构域可能是优选的,而这表示以下特异性合成转录因子的优点:合成转录因子的靶向范围相对于常规或天然存在的转录因子是高度扩展的。由于识别和/或激活结构域可以被专门设计和构建以特异性识别和靶向调控的热点。
在某些实施方案中,至少一个识别位点可以是相对于感兴趣的基因的起始密码子的-169bp至-4bp、-101bp至-48bp、-104至-42bp或-175至+450bp(分别为上游(-)或下游(+)),以提供最佳的空间结合环境,以允许最佳的调控(优选地是转录激活)活性。特别是对于基于CRISPR的合成转录因子,其与作为识别部分的向导RNA一起起作用,结合位点也可位于感兴趣的基因的编码区域内(感兴趣的基因的起始密码子的下游)。
在其他实施方案中,合成转录因子的识别结构域可结合至感兴趣的基因的5'和/或3'非翻译区域(UTR)。在实施方案中,在采用不同的识别结构域的情况下,至少两个识别结构域可结合至形态发生基因的不同靶区域,包括5'和/或3'UTR,但是它们也可以在基因区域之外结合,但是仍然在至其最多1到1500bp的特定距离内。识别结构域可以结合的一个优选的区域位于感兴趣的形态发生基因的起始密码子上游约-4bp至约-300bp,优选地约-40bp至约-170bp。此外,识别结构域的长度和因此感兴趣的基因组中的相应的识别位点的长度可取决于合成转录因子和所应用的识别结构域的性质而变化。基于至少一个识别结构域的分子特征,这还将确定相应的至少一个识别位点的长度。例如,在单个锌指可以为约8bp至约20bp,其中三至六个锌指基序之间的阵列可能是优选的,在这种情况下,单个TALE识别位点可以为约11至约30bp,或更多。基于CRISPR的合成转录因子的gRNA的识别位点包含与感兴趣的基因组区域杂交的gRNA的靶向序列或“间隔子”序列,而gRNA包含其他结构域,包括与解除武装的CRISPR效应物相互作用的结构域。基于解除武装的CRISPR效应物的合成转录因子的识别位点将包含PAM基序,因为PAM序列对于任何CRISPR效应物的靶标结合都是必需的,并且确切的序列取决于CRISPR效应物(即,解除武装的CRISPR效应物)的种类。
加强基因和加强多肽的导入
加强子和/或基因组工程化组分可以作为蛋白质/多肽或作为编码蛋白质/多肽的核酸,特别是作为蛋白质/多肽或诸如质粒DNA的DNA、RNA、mRNA或RNP而被导入。
加强子可以与一个或多个基因组工程化组分共同递送。如本文所用,“共同递送”或“共同-递送”和“共同导入”或“共同-导入”可互换使用。就本发明而言,“共同导入”是指这样的过程,其中至少两个不同的组分同时被递送进同一植物细胞中。因此,基因组工程化组分和加强因子被一起导入同一植物细胞。优选地,通过分开的构建体导入两种类型的组分,加强子和感兴趣的基因。可以通过粒子轰击、显微注射、农杆菌属介导的转化、电穿孔、电融合、农杆菌渗入或真空渗入来共同导入进植物细胞。
再生加强基因
据信转化的细胞的可再生性比野生型细胞低。由于细胞内存在外来DNA,转化的细胞容易经受程序性细胞死亡。递送(例如轰击破坏)引起的应激也可能引发细胞死亡。因此,促进细胞分裂对于修饰的细胞的再生是必需的。此外,基因组工程化效率很大程度上由宿主细胞状态控制。经历快速细胞分裂的细胞(像植物分生组织中的那些)是基因组工程化的最合适受体。促进细胞分裂将可能会提高DNA复制和分裂过程中的DNA整合或修饰,并因而提高基因组工程化效率。
已经设计了编码第一和第二加强子多肽的核酸、编码第三和第二加强子多肽的核酸、本文所述的重组基因或DNA构建体以改善基因组工程化组分的活性。当将第一和第二加强子多肽或第三和第二加强子多肽导入植物细胞或在植物细胞中它们的量与转基因一起提高时,加强子多肽可以提高转基因和转基因编码的多肽的表达。当将加强子多肽与基因组工程化组分和转基因一起导入植物细胞时,基因组工程化组分的活性可能提高。这种提高可以导致转基因更有效地整合进植物细胞的基因组中。一个或多个加强基因可以与第一和第二加强子多肽或与第三和第二加强子多肽共同表达。一个或多个加强基因可以与第一和第二加强子多肽或与第三和第二加强子多肽共同转染。
基于它们在促进细胞分裂和植物形态发生中的功能来选择这样的额外的加强基因。每个候选基因均由强组成型启动子克隆和驱动,并通过在玉米细胞中瞬时表达来评估而无需选择。额外加强基因的实例是PLT5(PLETHORA5;SEQ ID NO:9和11)、KWS-RBP1(SEQID NO:13)、KWS-RBP2(SEQ ID NO:49)、RKD4(SEQ ID NO:15、17和19)和RKD2(SEQ ID NO:21、23和25)。
PLT(PLETHORA),也称为AIL(AINTEGUMENT-LIKE)基因,是转录调节物AP2家族的成员。转录因子AP2家族成员在植物的细胞增殖和胚胎发生中起重要作用(El Ouakfaoui,S.,Schnell,J.,Abdeen,A.,Colville,A.,Labbé,H.,Han,S.,Baum,B.,Laberge,S.,Miki,B(2010)Control of somatic embryogenesis and embryo development byAP2transcription factors.PLANT MOLECULAR BIOLOGY 74(4-5):313-326.)。PLT基因主要在芽和根的发育组织中表达,且是干细胞稳态、细胞分裂和再生,以及器官原基模式化所必需的。
PLT家族包含有六个成员的AP2子分支。四个PLT成员,PLT1/AIL3、PLT2/AIL4、PLT3/AIL6和BBM/PLT4/AIL2在根尖分生组织(RAM)中部分重叠表达,并且是在干细胞微环境内在正确的位置表达QC(静止中心)标志物所需的。这些基因对维持根尖分生组织的细胞分裂和防止细胞分化起冗余作用。
三个PLT基因,PLT3/AIL6,PLT5/AIL5和PLT7/AIL7在芽尖分生组织(shoot apicalmeristem)(SAM)中表达,它们在侧生器官(lateral organ)的定位和外生长(outgrowth)中起冗余作用。PLT3、PLT5和PLT7通过控制两个不同的发育事件来调节拟南芥中的新生芽再生。PLT3、PLT5和PLT7是在分生组织的外围维持高水平的PIN1表达所需的,并调节SAM中央区域的局部生长素生成,这是叶序转换(phyllotactic transition)的基础。这三个基因功能的累积丧失导致中间细胞团、愈伤组织不能形成芽祖细胞,而诱导PLT5或PLT7则可以以激素非依赖性方式使芽再生。PLT3,PLT5,PLT7调节并需要芽促进因子CUP-SHAPEDCOTYLEDON2(CUC2)来完成芽形成程序。PLT3,PLT5和PLT7也在侧根生成细胞(lateral rootfounder cells)中表达,在侧根生成细胞中它们冗余地激活PLT1和PLT2的表达,并接着调节侧根形成。
额外的加强基因可以来自本领域已知的任何数量的植物。这样的植物包括但不限于玉米、拟南芥和小麦。在一些实施方案中,加强基因是玉米PLT5。在一些实施方案中,加强基因是拟南芥PLT5。在一些实施方案中,额外的加强基因可以是人工合成的KWS-RBP1或KWS-RBP2。在一些实施方案中,加强基因是小麦RKD4。在一些实施方案中,加强基因是拟南芥RKD4。在一些实施方案中,加强基因是玉米RKD4。在一些实施方案中,加强基因是小麦RKD2。在一些实施方案中,加强基因是拟南芥RKD2。在一些实施方案中,加强基因是玉米RKD2。
在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和PLT5多肽(由PLT5加强基因编码)导入植物细胞中,并且任选地是瞬时共同表达的。在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和KWS-RBP1多肽(由KWS-RBP1多核苷酸编码)导入植物细胞中,并且任选地是瞬时共同表达的。在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和KWS-RBP2多肽(由KWS-RBP2多核苷酸编码)导入植物细胞中,并且任选地是瞬时共同表达的。在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和RKD4多肽(由RKD4多核苷酸编码)导入植物细胞中,并且任选地是瞬时共同表达的。在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和RKD2多肽(由RKD2多核苷酸编码)导入植物细胞中,并且任选地是瞬时共同表达的。在一些实施方案中,将编码根据本发明的第一/第三和第二加强子多肽的核酸和PLT5多肽(由PLT5加强基因编码)、KWS-RBP1多肽(由KWS-RBP1多核苷酸编码)、RKD4多肽(由RKD4多核苷酸编码)和/或RKD2多肽(由RKD2多核苷酸编码)导入植物细胞中,并且任选地是瞬时共同表达的。由PLT5加强基因编码的多肽可包含与SEQ ID NO:10具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。由PLT5加强基因编码的多肽可包含SEQ ID NO:10的序列。由PLT5加强基因编码的多肽可以包含与SEQ ID NO:12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。由PLT5加强基因编码的多肽可以包含SEQ ID NO:12的序列。
玉米PLT5加强基因编码的多肽可包含与SEQ ID NO:10具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。玉米PLT5加强基因编码的多肽可包含SEQ ID NO:10的序列。
拟南芥PLT5加强基因编码的多肽可包含与SEQ ID NO:12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。拟南芥PLT5加强基因编码的多肽可包含SEQ ID NO:12的序列。
KWS-RBP1加强基因编码的多肽可包含与SEQ ID NO:14具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。KWS-RBP1加强基因编码的多肽可包含SEQ ID NO:14的序列。
KWS-RBP2加强基因编码的多肽可包含与SEQ ID NO:50具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。KWS-RBP2加强基因编码的多肽可包含SEQ ID NO:50的序列。
RKD4加强基因编码的多肽可包含与SEQ ID NO:16具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD4加强基因编码的多肽可包含SEQ ID NO:16的序列。RKD4加强基因编码的多肽可包含与SEQ ID NO:18具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD4加强基因编码的多肽可包含SEQ ID NO:18的序列。RKD4加强基因编码的多肽可包含与SEQ IDNO:20具有至少60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD4加强基因编码的多肽可包含SEQ ID NO:20的序列。
小麦RKD4加强基因编码的多肽可包含与SEQ ID NO:16具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。小麦RKD4加强基因编码的多肽可包含SEQ ID NO:16的序列。
拟南芥RKD4加强基因编码的多肽可包含与SEQ ID NO:18具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。拟南芥RKD4加强基因编码的多肽可包含SEQ ID NO:18的序列。
玉米RKD4加强基因编码的多肽可包含与SEQ ID NO:20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。玉米RKD4加强基因编码的多肽可包含SEQ ID NO:20的序列。
RKD2加强基因编码的多肽可包含与SEQ ID NO:22具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD2加强基因编码的多肽可包含SEQ ID NO:22的序列。RKD2加强基因编码的多肽可包含与SEQ ID NO:24具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD2加强基因编码的多肽可包含SEQ ID NO:24的序列。RKD2加强基因编码的多肽可包含与SEQ IDNO:26具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。RKD2加强基因编码的多肽可包含SEQ ID NO:26的序列。
小麦RKD2加强基因编码的多肽可包含与SEQ ID NO:22具有至少60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。小麦RKD2加强基因编码的多肽可包含SEQ ID NO:22的序列。
拟南芥RKD2加强基因编码的多肽可包含与SEQ ID NO:24具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。拟南芥RKD2加强基因编码的多肽可包含SEQ ID NO:24的序列。
玉米RKD2加强基因编码的多肽可包含与SEQ ID NO:26具有至少60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。玉米RKD2加强基因编码的多肽可包含SEQ ID NO:26的序列。
在一些实施方案中,编码PLT5多肽的核酸包含含有SEQ ID NO:9或11的核苷酸序列的核酸。在一些实施方案中,编码PLT5多肽的核酸包含含有与SEQ ID NO:9或11具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸。在一些实施方案中,编码PLT5多肽的核酸包含与含有与SEQ ID NO:9或11具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交的核酸,或包含与含有SEQ ID NO:9或11的核苷酸序列的核酸的互补链杂交的核酸。
在一些实施方案中,编码KWS-RBP1多肽的核酸包含含有SEQ ID NO:13的核苷酸序列的核酸。在一些实施方案中,编码KWS-RBP1多肽的核酸包含含有与SEQ ID NO:13具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸。在一些实施方案中,编码KWS-RBP1多肽的核酸包含与含有与SEQ ID NO:13具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交的核酸,或包含与含有SEQ ID NO:13的核苷酸序列的核酸的互补链杂交的核酸。
在一些实施方案中,编码KWS-RBP2多肽的核酸包含含有SEQ ID NO:49的核苷酸序列的核酸。在一些实施方案中,编码KWS-RBP2多肽的核酸包含含有与SEQ ID NO:49具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸。在一些实施方案中,编码KWS-RBP2多肽的核酸包含与含有与SEQ ID NO:49具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链杂交的核酸,或包含与含有SEQ ID NO:49的核苷酸序列的核酸的互补链杂交的核酸。
在一些实施方案中,编码RKD4多肽的核酸包含含有SEQ ID NO:15、17或19的核苷酸序列的核酸。在一些实施方案中,编码RKD4多肽的核酸包含含有与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸。在一些实施方案中,编码RKD4多肽的核酸包含与含有与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交的核酸,或包含与含有SEQ ID NO:15、17或19的核苷酸序列的核酸的互补链杂交的核酸。
在一些实施方案中,编码RKD2多肽的核酸包含含有SEQ ID NO:21、23或25的核苷酸序列的核酸。在一些实施方案中,编码RKD2多肽的核酸包含含有与SEQ ID NO:21、23或25具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸。在一些实施方案中,编码RKD2多肽的核酸包含与含有与SEQ ID NO:21、23或25具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交的核酸,或包含与含有SEQ ID NO:21、23或25的核苷酸序列的核酸的互补链杂交的核酸。
为了本发明的目的,两个相关核苷酸或氨基酸序列的“序列相同性”(以百分比表示)是指在两个具有相同残基(x100)的最优比对序列中的位置数除以比较的位置数。缺口,即在一个序列中存在而另一个序列不存在的残基的比对中的位置,被认为是具有非相同残基的位置。通过Needleman和Wunsch算法(Needleman和Wunsch 1970)进行两个序列的比对。上面的计算机辅助序列比对可以使用标准软件程序诸如在European Molecular BiologyOpen Software Suite(EMBOSS)如版本6.3.1.2(Trends in genetics 16(6),276(2000))(其默认参数例如为对于蛋白质矩阵=EBLOSUM62,gapopen=10.0以及gapextend=0.5)中实施的NEEDLE程序方便地进行。
如本文所用,术语“杂交”是指通过互补核苷酸的碱基配对在两个核酸分子之间杂交体的形成。术语“在严格条件下杂交”是指在特定条件下的杂交。这样的条件的一个实例包括这样的条件,在该条件下,基本上的互补链(即由具有至少80%互补性的核苷酸序列组成的链)与给定的链杂交,而较低互补链不杂交。可选地,这些条件是指钠盐浓度、温度和洗涤条件的特定杂交条件。例如,高度严格的条件包含在42℃、50%甲酰胺、5x SSC(150mMNaCl、15mM柠檬酸三钠)、50mM磷酸钠、5x Denhardt溶液、10x硫酸葡聚糖、20mg/ml剪切的鲑鱼精子DNA中孵育并在约65℃的0.2x SSC(SSC代表0.15M氯化钠和0.015M柠檬酸三钠缓冲液)中洗涤。可选地,高度严格的条件可意指在68℃于0.25M磷酸钠、pH7.2、7%SDDS、1mMEDTA和1%BSA中杂交16小时,并在68℃用2x SSC和0.1%SDDS洗涤两次。进一步可选地,高度严格的杂交条件例如是:在65℃在4×SSC中杂交,并然后在65℃在0.1×SSC中多次洗涤总共约1小时,或在68℃在0.25M磷酸钠、pH7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,并然后在68℃用2x SSC和0.1%SDS洗涤两次。
表观遗传调控化学物质
表观遗传调控化学物质,例如蛋白质脱乙酰基酶抑制剂(ii.1)可以与基因组工程化组分共同导入。根据本发明所用的示例性表观遗传调控化学物质包括但不限于组蛋白脱乙酰基酶抑制剂(HDACi)诸如曲古抑菌素A(TSA)和DNA甲基转移酶抑制剂。
据假设共同递送的表观遗传调控化学物质(ii.1)(特别是HDACi)松弛植物的染色质结构,促进轰击的细胞中对基因组工程化组分的DNA可及性,因而接着促进基因组工程化(即转化和基因组编辑)效率。这种假设的原因是:遗传物质的基本结构和功能单元是核小体,其中带负电荷的DNA包裹在带正电荷的组蛋白八聚体和相关的连接子组蛋白周围。核小体单元进一步折叠并堆积成染色质(Andrews,A.J.,和Luger,K.(2011).Nucleosomestructure(s)and stability:Variations on a theme.Annu.Rev.Biophys.40:99–117)。DNA可及性很大程度上取决于核小体和染色质的紧密度。染色质重塑酶可动态修饰组蛋白的赖氨酸或其他氨基酸,其导致它们电荷以及与DNA和其他蛋白质的相互作用的改变,并导致染色质折叠或解折叠(Bannister AJ.,Kouzarides T.(2011)Regulation of chromatinby histone modifications.Cell Res 21:381–95)。通过添加或去除乙酰基,组蛋白中赖氨酸残基的乙酰化和脱乙酰化通常参与真核生物中染色质结构的可逆调节,并介导染色质可及性和基因表达调控。组蛋白脱乙酰基酶(HDAC)是从位于组蛋白的N末端尾部的赖氨酸残基去除乙酰基的酶,其使组蛋白带更多正电荷,并因此允许组蛋白更紧地包裹DNA。抑制HDAC可能有助于染色质解折叠,并使DNA更易接近。
染色质重塑和其他表观遗传修饰无疑在调控细胞全能和再生中起重要作用(Zhang,H.,和Ogas,J.(2009).An epigenetic perspective on developmentalregulation of seed genes.Mol.Plant 2:610–627)。已经显示组蛋白脱乙酰基酶(HDAC)活性的抑制与植物再生和小孢子胚胎发生有关(Miguel,C.,和L.Marum,2011.Anepigenetic view of plant cells cultured in vitro:somaclonal variation andbeyond.J.Exp.Bot.62:3713–3725.,Li Hui et al.(2014)The Histone DeacetylaseInhibitor Trichostatin A Promotes Totipotency in the Male Gametophyte PLANTCELL,26:195–209)。HDAC活性或下游HDAC介导的途径的抑制在起始应激诱导的单倍体胚胎发生中起主要作用。一种这样的HDACi是曲古抑菌素A(TSA)。已证明TSA在欧洲油菜的雄配子体中诱导大量的胚胎发生细胞增殖。TSA处理导致培养的小孢子和花粉中高频率的孢子体细胞分裂。
可以使用多种方法以在一种或多种表观遗传调控化学物质例如蛋白脱乙酰酶抑制剂特别是HDACi存在下,来进一步提高基因组工程化效率。这样的HDACi可以是曲古抑菌素A(TSA)、N-羟基-7-(4-二甲基氨基苯甲酰基)-氨基庚酰胺(M344)、辛二酰苯胺异羟肟酸(SAHA)或其他。这些HDACI选自基于异羟肟酸(HA)的化学物质,其目标是锌依赖性HDAC。
植物激素
在多个实施方案中,将一种或多种植物激素,例如生长素和细胞分裂素,例如2,4-D、6-苄基氨基嘌呤(6-BA)和玉米素,与一种或多种加强基因、加强子多肽、基因组工程化组分和转基因共同递送。
植物体细胞能够通过体细胞胚胎发生或器官发生而在体外培养中恢复细胞分裂并再生为整个植物,这主要取决于植物激素诸如生长素和细胞分裂素。在本发明中,发现植物激素促进细胞增殖,提高植物细胞对基因组工程化的敏感性,并因此改善基因组工程化(即转化和基因组编辑)的效率。
生长素之一是2,4-二氯苯氧基乙酸(2,4-D),其对于单子叶植物例如玉米和小麦中的体细胞胚胎发生和细胞再生几乎是必不可少的。同时,细胞分裂素例如6苄基氨基嘌呤(6-BA)或玉米素对植物器官发生、和芽分生组织的萌生和发育是必需的。改善基因组工程化效率的方法可以包括与基因组工程化组分共同递送一种或多种植物激素(2,4-D、6-BA、玉米素等)。
基因组工程化组分和至少一种表观遗传调控的化学物质和植物激素可以共同导入一个植物细胞中。
如本文所用,“共同递送”或“共同-递送”和“共同导入”或“共同-导入”可互换使用。就本发明而言,“共同导入”是指这样的过程,其中至少两个不同的组分同时被递送进同一植物细胞中。因此,可以将基因组工程化组分和至少一种表观遗传调控化学物质和植物激素一起导入同一植物细胞中。
可以通过粒子轰击、显微注射、农杆菌属介导的转化、电穿孔、农杆菌渗入或真空渗入来进行共同导入进植物细胞。根据本发明,基于物理递送(如粒子轰击、显微注射、电穿孔、纳米颗粒和细胞穿透肽(CPP))的方法特别优选用于共同导入加强基因、加强子多肽、基因组工程化组分和/或转基因。特别优选的是通过粒子轰击共同导入。
植物细胞再生为完整植物
根据本发明的另一方面,经遗传修饰的植物细胞可以再生为完整(可育)植物。因此,在本发明的优选方面,在植物细胞的遗传修饰之后是再生植物的步骤。因此,本发明提供了一种产生经遗传修饰的植物的方法,包括以下步骤:
a)根据上述用于在植物细胞中遗传修饰的任何方法对植物细胞遗传修饰,和
b)从步骤a)的修饰的植物细胞再生植物,
单个细胞或多细胞增殖并发育成组织、器官、及最后是整个植物。在一些实施方案中,产生的植物不包含在步骤a)中导入或共同导入的任何基因组工程化组分、加强基因和加强子多肽。再生植物的步骤b)可以例如包含在再生培养基上培养来自步骤a)的经遗传修饰的植物细胞。
植物再生的效率或提高植物细胞再生能力的效率可以通过将在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、第一和第二加强子多肽、第三和第二加强子多肽、或编码其的核酸,与本文所述的任何加强子多肽、加强基因、核酸、重组基因和DNA构建体组合导入植物细胞中来改善。
产生经遗传修饰的植物
本发明还提供了通过上述产生经遗传修饰的植物或其后代植物的方法获得或可获得的经遗传修饰的植物。经遗传修饰的植物可包含本文所述的任何经遗传修饰的植物细胞。
在各种实施方案中,所产生的植物不包含导入或共同导入用于产生所产生的植物的植物细胞中的任何基因组工程化组分、加强基因和加强子多肽。
本发明还提供了无需常规选择的衍生自上述经遗传修饰的细胞的植物或种子。如本文所用,“常规选择”是指通过使用整合的选择标志物例如抗生素(例如卡那霉素、潮霉素)或除草剂(例如草丁膦(phosphinothricin)、草甘膦)抗性基因,从野生型细胞中选择和纯化转化的细胞的任何方法。没有常规选择,此类植物或种子可能没有任何整合的基因组工程化组分,并因此导致无转基因的遗传修饰的植物。
遗传修饰可以是植物细胞基因组中的永久且可遗传的改变。可以使用含有微弹轰击、农杆菌属转化、电穿孔等的当前可用方法来进行植物组织培养和基因组工程化。可以通过使用可见报告基因,例如红色荧光tDTomato基因(tDT)(其编码异常亮的红色荧光蛋白,激发最大值为554nm,以及发射最大值为581nm)来监测转化和转基因表达。基因组编辑效率可以例如通过下一代测序(NGS)、qPCR、标记毛细管电泳分析和Droplet Digital PCR来分析。通过Sanger测序进一步证实位点特异性修饰。
培养步骤
在加强基因、加强子多肽和一种或多种转基因存在下,通过基因组工程化组分的活性,在允许所述植物细胞的基因组的遗传修饰的条件下,可培养已导入或共同导入了加强基因、加强子多肽、基因组工程化组分和/或转基因的植物细胞。
如本文所用,“基因组的遗传修饰”包括任何类型的操作,使得内源核苷酸已被改变以包括突变诸如缺失、插入、转换(transition)、颠换(transversion)或其组合。例如,可以缺失内源编码区域。此类突变可导致多肽具有与内源多核苷酸编码的氨基酸序列不同的氨基酸序列。遗传修饰的另一个实例是调控序列诸如启动子的改变以导致提高或减少可操作连接的内源编码区域的表达。
“适合”植物基因组的遗传修饰发生的条件诸如多核苷酸的切割,或“适合”条件是不能阻止此类事件发生的条件。因此,这些条件允许、增强、促进和/或有助于事件。根据各个基因组工程化组分(i),这些条件可不同。
在本发明的方法中,优选用基因组工程化组分(i)和至少一种化合物(ii)瞬时转化植物细胞。如本文所用,“瞬时转化”是指外来材料[即核酸片段、蛋白质、核糖核蛋白(RNP)等]转移进宿主细胞而导致基因表达和/或活性,而没有整合和稳定遗传外来材料。因此,基因组工程化组分(i)在植物细胞中是瞬时有活性的和/或是瞬时存在的。基因组工程化组分不是永久性地并入细胞基因组中而是提供暂时的作用以导致基因组的修饰。例如,基因组工程化组分在植物细胞中的瞬时活性和/或瞬时存在可导致在植物细胞的基因组中导入一个或多个双链断裂、在植物细胞的基因组中导入一个或多个单链断裂、在植物细胞的基因组中导入一个或多个碱基编辑事件、或在植物细胞的基因组中导入以下的一个或多个:DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化。
优选地在导入一个或多个双链断裂或一个或多个单链断裂之后为非同源末端连接(NHEJ)和/或为通过同源重组机制对一个或多个断裂的同源定向修复(HDR)。
植物细胞的基因组中的所得修饰可以例如选自转基因(优选地为包含感兴趣的基因的表达盒)的插入,至少一个核苷酸的取代,至少一个核苷酸的缺失,至少一个核苷酸的插入,DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。根据本发明的一个特别优选的方面,没有与所应用的基因编辑机制/系统有关的外源遗传物质被稳定地整合进植物细胞的基因组中。
遗传修饰可以是植物细胞基因组中的永久且可遗传的改变。
任选的预处理
在各种实施方案中,可以包括用美国临时申请No.62/685,626(通过引用并入本文)中描述的一种或多种化学物质对植物材料的预处理。因此,用于在植物细胞中遗传修饰的方法可以进一步包含对植物细胞预处理的步骤,所述预处理包含在含有(1)表观遗传调控化学物质或其活性衍生物,特别是组蛋白脱乙酰基酶抑制剂(HDACi)或DNA甲基转移酶抑制剂,或(2)植物激素或其活性衍生物,或其任何组合的培养基中培养植物细胞或包含其的植物材料。
在预处理步骤之后,从含有化合物(1)和(2)中的至少一种的培养基中提取处理过的植物细胞,并用于共同导入。
作为示例,对于组蛋白脱乙酰基酶抑制剂TSA,HDACi预处理的持续时间为10分钟至2天,优选2.0小时至24小时。用于预处理的TSA浓度为1.0nM至1000nM,优选10nM至100nM。此后,将处理过的植物材料转移至无HDACi的培养基中,并立即用于TSA共同导入(延长时间的TSA预处理可能会造成非选择性地增强细胞再生,这可能会提高回收被轰击和修饰的细胞的难度)。
相似的预处理条件可以应用于所有类型的化合物(1)和(2)。植物组织培养和基因组工程化可以使用目前可用的方法进行。可以使用红色荧光报告基因tdTomato(其编码异常亮的红色荧光蛋白,其激发最大值为554nm且发射最大值为581nm)或绿色荧光报告基因mNeonGreen(其编码最亮的单体绿色或黄色荧光蛋白,其最大激发波长为506nm,且最大发射波长为517nm)来监测瞬时转化和转基因表达。基因组编辑效率可以例如通过下一代测序(NGS)来分析。
微粒
在另一方面,提供了一种至少用在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、第一和第二加强子多肽、第三和第二加强子多肽、上述核酸、重组基因和DNA构建体所包被的微粒。在一些实施方案中,微粒进一步用基因组工程化组分包被。
在另一方面,提供了一种通过微弹轰击对植物基因组遗传修饰的试剂盒,包括
(I)一种或多种微粒,以及
(II)用于包被微粒的工具。
在一些实施方案中,试剂盒还包括用于用基因组工程化组分包被微粒的工具。
在各种实施方案中,微粒至少用以下包被:
(i)在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、第一和第二加强子多肽、第三和第二加强子多肽、或编码第一和第二加强子多肽的核酸;
(ii)转基因;和/或基因组工程化组分。
微弹轰击的一个特别优选的实施方案中,通过包含具有0.4-1.6微米(μm)范围大小,优选0.4-1.0μm范围大小的金颗粒的微载体,在植物细胞中遗传修饰的方法的上下文中所描述的步骤(i)的组分、第一和第二加强多肽或第三和第二加强多肽、和/或一种或多种加强基因可以与基因组工程化组分共同递送。在示例性方法中,每一次轰击使用包被在10-1000μg金颗粒,优选50-300μg金颗粒上的10ng-10μg DNA,优选50-1000ng DNA。可使用每一个样品板最多10次轰击(发射),优选1-4次发射将外来分子递送进植物细胞中。
可以将加强因子(例如,加强多肽或编码这种加强多肽的多核苷酸)和基因组工程化组分递送进靶细胞中,例如使用Bio-Rad PDS-1000/He粒子枪或手持式Helios基因枪系统。当使用PDS-1000/He粒子枪系统时,轰击破裂压力为450psi至2200psi,优选为450psi至1100psi,而Helios基因枪系统的破裂压力为100psi至600psi。可以同时将一种以上的化学物质或构建体与基因组工程化组分共同递送到进细胞中。
微粒包被可以进一步包含一个或多个包被层。例如,微粒可含有包含加强因子的第一包被层和包含基因组工程化组分和转基因的第二包被层。可选地,微粒可含有包含第一/第三和第二加强因子以及转基因或基因组工程化组分的包被层。
此外,本发明提供了一种通过微弹轰击对植物基因组遗传修饰的试剂盒,其包括
(I)一种或多种微粒,以及
(II)用于用至少基因组工程化组分以及(1)表观遗传调控化学物质,例如DNA甲基转移酶抑制剂或蛋白质脱乙酰基酶抑制剂或其活性衍生物,特别是组蛋白脱乙酰基酶抑制剂(HDACi),和/或(2)植物激素或其活性衍生物包被微粒的工具。
本发明的另一方面是如上所述的微粒在植物细胞的基因枪法转化中的用途。
本发明的主题还是通过上述方法获得或可获得的植物细胞。因此,本发明的一个实施方案是通过上述在植物细胞中遗传修饰的方法获得或可获得的经遗传修饰的植物细胞。与原始植物细胞相比,这些植物细胞中的遗传修饰例如可包括转基因(优选地为包含感兴趣的基因的表达盒)的插入,至少一个核苷酸的取代,至少一个核苷酸的缺失,至少一个核苷酸的插入,DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。优选地,经遗传修饰的植物细胞不包含任何稳定整合进植物细胞基因组中的外源遗传物质。
经遗传修饰的植物细胞可以是整个植物的部分或其部分。因此,本发明还涉及包含上述经遗传修饰的植物细胞的植物或植物部分。
根据本发明的另一方面,经遗传修饰的植物细胞可以再生为完整(可育)植物。因此,在本发明的优选方面,在植物细胞的遗传修饰之后是再生植物的步骤。因此,本发明提供了一种产生经遗传修饰的植物的方法,包括以下步骤:
a)根据上述用于在植物细胞中遗传修饰的方法对植物细胞遗传修饰,和
b)从步骤a)的修饰的植物细胞再生植物。
再生植物的步骤b)可以例如包含在再生培养基上培养来自步骤a)的经遗传修饰的植物细胞。
再生技术依赖于组织培养生长培养基中某些植物激素的处理,偶尔依赖于可以导入的抗微生物剂(biocide)和/或除草剂标志物。再生可以得自植物体细胞、愈伤组织细胞或胚性细胞以及衍生自不同外植体(例如愈伤组织、未成熟或成熟的胚、叶、芽、根、花、小孢子、胚性组织、分生组织、器官或其任何部分)的原生质体。此种再生技术在Klee(1987)Ann.Rev.of Plant Phys.38:467486中有一般描述。从培养的原生质体的植物再生描述于Evans等,Protoplasts Isolation and Culture,Handbook of Plant cell Culture,pp.124-176,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC Press,Boca Raton,1985。要从转化的或基因编辑的细胞中获得完整的植物,可以在一系列含有营养和激素的介质中在受控的环境条件下生长细胞,该过程称为组织培养。一旦生成完整植物并产生种子,就开始评估后代。
本发明还提供通过上述产生经遗传修饰的植物或其后代植物的方法获得或可获得的经遗传修饰的植物。
本发明的另一主题是衍生自上述经遗传修饰的植物的植物细胞或种子。
本发明的另一主题是无需基于标志物基因的选择而衍生自上述经遗传修饰的细胞的植物、植物细胞或种子。如本文所用,“基于标志物基因的选择”是指通过使用整合的选择标志物(基因),例如抗生素抗性基因(例如卡那霉素抗性基因、潮霉素抗性基因)或除草剂抗性基因(例如膦丝菌素抗性基因、草甘膦抗性基因)从野生型细胞中选择,鉴定和/或纯化修饰的细胞,特别是转化的、基因编辑的或碱基编辑的细胞的任何过程。没有这样的选择,这种植物、植物细胞或种子可能不具有任何整合的基因组工程化组分,并这可以产生(i)无转基因的经遗传修饰的植物或(ii)仅整合了感兴趣的转基因的修饰的植物。
除非在实施例中另有说明,否则所有重组DNA技术均根据如在以下中所述的标准方案进行:Sambrook等(1989),(1989)Molecular Cloning:A Laboratory Manual,SecondEdition,Cold Spring Harbor Laboratory Press,NY;以及Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols,USA的第1卷和第2卷。BIOSScientific Publications(UK)和Blackwell Scientific Publications,UK联合出版的R.D.D.Cray的Plant Molecular Biology Labfax(1993)中描述了用于植物分子研究的标准材料和方法。标准分子生物学技术的其他参考包括Sambrook and Russell(2001)Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring HarborLaboratory Press,NY,Brown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)的第I卷和第II卷。用于聚合酶链反应的标准材料和方法可参见Dieffenbach和Dveksler(1995)PCR Primer:A Laboratory Manual,Cold Spring HarborLaboratory Press,以及McPherson等,(2000)PCR-Basics:From Background to Bench,First Edition,Springer Verlag,Germany。
序列
SEQ ID NO: 描述
1 ZmWUS2的cDNA
2 ZmWUS2的蛋白质
3 ZmPLT7(基因型A188)的cDNA
4 ZmPLT7(基因型A188)的蛋白质
5 ZmPLT7(基因型B73)的cDNA
6 ZmPLT7(基因型B73)的蛋白质
7 AtPLT7的cDNA
8 AtPLT7的蛋白质
9 ZmPLT5的cDNA
10 ZmPLT5的蛋白质
11 AtPLT5的cDNA
12 AtPLT5的蛋白质
13 KWS-RBP1的cDNA
14 KWS-RBP1的蛋白质
15 TaRKD4的cDNA
16 TaRKD4的蛋白质
17 AtRKD4的cDNA
18 AtRKD4的蛋白质
19 ZmRKD4的cDNA
20 ZmRKD4的蛋白质
21 TaRKD2的cDNA
22 TaRKD2的蛋白质
23 AtRKD2的cDNA
24 AtRKD2的蛋白质
25 ZmRKD2的cDNA
26 ZmRKD2的蛋白质
27 pABM-BdEF1_ZmPLT7
28 pABM-BdEF1_WUS2
29 pAMK-ZmWUS2-tDT-nosT
30 pABM-BdEF1
31 BdEF1的启动子
32 pABM-BdEF1_ZmPLT5
33 pABM-BdEF1_KWS-RBP1
34 pABM-BdEF1_TaRKD4
35 pGEP359
36 pGEP324
37 BdEF1::ZmPLT5_表达盒
38 BdEF1::ZmPLT7_表达盒
39 BdEF1::KWS-RBP1_表达盒
40 BdEF1::TaRKD4_表达盒
41 BdEF1::ZmWUS2_表达盒
42 pUbi::LpCpf1_表达盒
43 pUbi::crRNA5_表达盒
44 LbCpf1的cDNA
45 LbCpf1的蛋白质
46 crRNA5_靶_HMG13
47 crRNA5_靶_序列
48 pZmWUS2::tDT-nosT表达盒
49 KWS-RBP2
50 KWS-RBP2的蛋白质
51 pABM-BdEF1_KWS-RBP2
52 BdEF1::KWS-RBP2_表达_盒
本文引用或援引的所有专利、专利申请和出版物或公共公开内容(包括互联网上的出版物)均通过引用以其全文并入本文。
实施例
通过以下实施例进一步说明本发明。然而,应当理解,本发明不限于这些实施例。在说明书中任何地方使用这些和其他实施例仅是说明性的,且绝不限制本发明或任何示例性术语的范围和含义。同样,本发明不限于这里描述的任何特定的优选实施方案。实际上,在阅读本说明书后,本发明的许多修改和变化对本领域技术人员而言是显而易见的,并且在不脱离本发明的精神或范围的情况下,可以进行这种变化。因此,本发明仅由所附权利要求的条款以及那些权利要求所赋予的等价物的全部范围来限制。
实施例1.通过共同轰击的加强基因和感兴趣的基因(GOI)的瞬时共同表达。
基因克隆和构建体制备
使用从基因型A188的玉米未成熟胚中分离的总RNA通过RT-PCR克隆了玉米WUS2(ZmWUS2)和PLT7(ZmPLT7)基因。小麦RKD4和RKD2以及KWS-RBP1基因自其蛋白质序列进行了玉米密码子优化,并通过Integrated DNA Technologies(IDT,San Diego,CA,USA)合成。加强基因片段在BamHI和HindIII的克隆位点克隆到表达载体pABM-BdEF1(图1)中,并在BdEF1启动子(pBdFE1)和nos终止子(nos-T)的控制下表达。pBdFE1是来自短柄草属(Brachypodium)的强组成型启动子。测序确认的构建体图谱显示在图2至5和8中。
制备用以轰击的玉米未成熟胚
授粉后9-12天,收获具有0.8-1.8mm,优选1.0-1.5mm大小的未成熟胚的玉米穗(即A188或Hi II)。将穗用70%乙醇消毒10-15分钟。在层流罩(laminar hood)中短暂风干后,用鲨鱼解剖刀从穗上除去上部~1/3的玉米粒,并然后用刮刀小心地将未成熟的胚从玉米粒中取出。将新鲜的分离的胚置于胚子叶面朝上的渗透培养平板(见下文)中的轰击靶区域上。轰击前,用石蜡膜包裹平板并将其在25℃黑暗中孵育4小时。
粒子共同轰击
使用粒子轰击枪和具有大小为0.4或0.6微米(μm)的金颗粒将DNA递送到玉米未成熟胚的胚子叶细胞中。将加强基因质粒与感兴趣的基因(GOI)预混合,例如,具有CRISPR核酸酶Cpf1和tDT报告基因的基因组编辑构建体pGEP359(图6),以及含有靶向HMG13的CRISPR向导RNA crRNA5的pGEP324(图7)。对于10次发射,将总体积为100微升(μl)的50%(v/v)甘油中的1mg金颗粒(每次发射100μg金颗粒)吸移到透明的低滞留微离心管中。将混合物超声处理15秒以悬浮金颗粒。在低速涡旋的同时,向每个100μl金颗粒中依次添加以下:(a)最多10μl DNA(1.0-10.0μg预混合的总DNA,每次每个发射100-1000ng),(b)100μl的2.5M CaCl2(在冰上预冷),以及(c)40μl的0.1M冷亚精胺。
盖上盖子并在0-10℃涡旋管2-30分钟,并旋转降下DNA包被的金颗粒。用500μl100%乙醇洗涤两次后,将沉淀重悬于120μl的100%乙醇中。低速涡旋时,将10μl的共同包被的金颗粒从管中以宽口的20μl吸头平均地吸移到大载体的中心。由于此时颗粒倾向于形成团块,尽快将金颗粒置于大载体上,随后空气干燥。使用Bio-Rad PDS-1000/He粒子枪进行轰击。轰击条件是:28mm/Hg真空,450或650psi破裂片,6mm的间隙距离,样品平台在距腔室底部60mm距离的第二位置,每个样品(玉米未成熟胚)平板三次发射。
轰击后观察和胚培养
轰击后,胚在渗透培养基上再保留16个小时。轰击后16-20小时,使用荧光显微镜在激发最大值554nm且发射最大值581nm针对tDT表达检查瞬时转化。选择在荧光显微镜下具有密集荧光信号的胚(图9),并将其从N6OSM转移到N6-5Ag平板上(每个平板~15个胚),其中将胚子叶正面朝上以诱导愈伤组织(参见下文)。
渗透培养基:N6盐、N6维生素、1.0mg/L的2,4-D、100mg/L的酪蛋白、0.7g/L的L-脯氨酸、0.2M的甘露醇(36.4g/L)、0.2M的山梨醇(36.4g/L)、20g/L蔗糖、15g/L细菌琼脂、pH5.8。
N6-5Ag:N6盐、N6维生素、1.0mg/L的2,4-D、100mg/L的酪蛋白、2.9g/L的L-脯氨酸、20g/L的蔗糖、5g/L的葡萄糖、5mg/L的AgNO3、8g/L的琼脂、pH 5.8。
实施例2.在玉米A188未成熟胚中ZmWUS2和ZmPLT7的组合的瞬时共同表达促进早期胚胎发生和再生。
在以上实施例1中描述了瞬时共同递送、胚制备和培养。对于每次轰击,将四个预混合的DNA质粒包被在100μg大小为0.4μm的金颗粒上,并在650psi的破裂压力共同导入A188未成熟胚的胚子叶细胞中。对于一次轰击,如下将四种质粒进行预混:
-100ng加强ZmPLT5或ZmPLT7(图2和图3)
-200ng KWS-RBP1(图4)
-100ng pGEP359(图6)
-150ng pGEP324(图7)
选择在荧光显微镜下具有密集荧光信号的胚(图9),并将其从N6OSM转移到N6-5Ag上以诱导胚性愈伤组织。选择的胚在N6-5Ag平板中以胚子叶面朝上(每个平板大约15个胚)在27℃黑暗中培养14在黑暗中。通过在解剖显微镜下观察来监测胚胎发生的愈伤组织的诱导。具体地,通过在荧光显微镜下目视观察来通过在轰击后5-7天的诱导胚形成的能力测量对细胞分裂和再生的加强作用。
图10显示通过微弹轰击的共同表达ZmWUS2和ZmPLT7显著促进玉米A188未成熟胚中的胚胎发生结构诱导并加速了组织的生长。如图11可以所见,在粒子轰击后7天(A)和在粒子轰击后1个月(A)形成并出现的多个胚性结构。
图12显示具有Tdt形成的胚性结构的定量。已经证明,单独的PLT7或单独的WUS2的瞬时表达导致每个胚的胚性结构数量/发育略有提高,但是与单个加强子基因相比,ZmWUS2和ZmPLT7的共同表达诱导了更多的胚性结构的生成。
这种对胚的水平的强烈加强作用也对整个转基因植物的再生效率有效。包括Pat-Tdt的构建体pBdEF1-ZmPLT7(SEQ ID NO:27)在玉米基因型A188中的稳定整合是不可能的,尚未成功产生转基因植物。包括Pat-Tdt的构建体pBdEF1-ZmWUS2(SEQ ID NO:28)在玉米基因型A188中的稳定整合导致转基因植物的低水平效率。与此相反,包括Pat-Tdt的pBdEF1-ZmPLT7(SEQ ID NO:27)和pBdEF1-ZmWUS2(SEQ ID NO:28)在玉米基因型A188中的稳定整合显著提高了转基因植物再生的效率。
具有单个ZmWUS2构建体的所产生的转基因植物,以及用ZmWUS2和PLT7的共同转化所产生的转基因植物导致没有任何有害的表型的植物。它们与正常的A188玉米植物相当(见图13)。
实施例3.在玉米Hi未成熟胚中ZmPLT7的瞬时表达改善共同递送的报告基因的稳定转化
实施例1和2描述了玉米胚的制备、瞬时轰击和胚性愈伤组织的诱导。将胚在N6-5Ag培养基中于27℃在黑暗中培养14天。通过在荧光显微镜下观察将tDT荧光用于监测胚胎发生的愈伤组织的诱导和稳定转化。具体地,加强作用是通过没有选择的在轰击后12天提高tDT报告基因的转化频率(TF)的能力来测量的。
来自图14中新产生的胚性结构的强而均匀的tDT荧光信号表明tDT基因的整合和稳定转化。稳定转化频率定义为从最初使用的100个胚中诱导出的具有至少一个稳定的tDT荧光结构的胚数。轰击后10天测量稳定转化频率。
与没有加强子的对照相比,ZmPLT7基因(SEQ ID NO:27)的瞬时表达导致tDT基因的转化频率提高了23%。图14的结果表明,ZmPLT7的瞬时表达促进玉米Hi II未成熟胚中稳定转化频率。
Hi II基因型中成功地稳定转化了ZmPLT7基因。具有单个ZmPLT7构建体的转基因植物显示与正常A188玉米植物相当的外观(参见图15)。
实施例4.小麦RKD4激活玉米WUSCHEL(WUS)表达。
同源框结构域转录因子WUSCHEL(WUS)在建立和维持芽分生组织中起重要作用。为了鉴定促进内源性WUS2表达的加强因子,玉米WUSCHEL 2启动子报告构建体(pAMK-ZmWUS2-tDT-noT)(SEQ ID NO:29;图16)用于说明玉米WUS2启动子活性。玉米WUS2启动子(pZmWUS2)驱动tDT报告基因在该报告构建体中的表达(图16)。WUS2启动子报告构建体分别在玉米未成熟胚和叶段中与加强因子共同轰击。
从体外培养的10-14天大的玉米A188幼苗中制备长度为1-2cm的新鲜叶段,并近轴面朝上地放置在渗透培养基上4小时。为了共同轰击,将两个质粒(100ng ZmWUS2启动子报告(图16)和100ng加强构建体(例如TaRKD4)(图5))预混合并包被在100μg大小为0.4μm的金颗粒上。如实施例1和实施例2中所述进行未成熟胚的制备、轰击和轰击后培养。轰击后16小时开始使用荧光显微镜监测显示tDT表达的红色荧光。
WUS在植物芽尖分生组织(SAM)的组织中心(OC)中特异性转录并控制SAM中的干细胞身份。
在轰击后培养期间(16小时至7天)的任何时间,仅使用ZmWUS2启动子报告(仅pZmWUS2报告)的轰击不会导致轰击的叶样品产生任何tDT荧光信号。但是,当与小麦RKD4构建体共同轰击时(图5),轰击后约36小时在叶段中检测到tDT信号,并且轰击后约44小时达到峰值(图17B的底部图)。与仅使用WUS启动子报告子进行的对照轰击相比,在未成熟的胚中仅观察到了微弱的tDT信号(图17A的上面的图),在用WUS启动子报告子和小麦RKD4构建体共同轰击的胚中观察到了异常强的红色荧光信号(图17B的上面的图)。这些结果表明小麦RKD4强烈激活玉米WUS2基因。图像是轰击后44小时拍摄的。
RKD4的这种观察到的作用可以与例如ZmPLT7的瞬时表达结合以导致根据本发明的ZmWUS2和ZmPLT7的共同表达。
实施例5.在玉米中ZmWUS2和ZmPLT7与基因组编辑组分的共同表达促进瞬时基因组编辑。
对于胚制备、轰击和轰击后胚培养进行实施例1和实施例2中所述的过程。在N6-5Ag培养基中诱导愈伤组织14天(Hi II)或18天(A188)之后,从轰击的胚的胚子叶表面挑选迅速生长的胚胎发生的愈伤组织,并转移到MRM1培养基上(见下文)进行胚的成熟。在黑暗中于25℃在MRM1培养基中培养约两周后,将成熟的胚移至MSO培养基(见下文)上以在25℃的光照下在植物托盘中进行胚的萌发。在MSO培养基中培养约10天后,再生的小植株已准备好进行分子分析并转移到土壤中。从再生小植株的所有叶中收集大约5mm的叶尖用于DNA提取。通过Taqman qPCR、标志物毛细管电泳从再生植物中筛选出位点特异性基因组修饰,并通过Digital PCR、下一代测序(NGS)和Sanger测序进行确认。通过qPCR检查DNA整合。
没有加强子,通过具有选择的瞬时表达(仅GE),使用Cpf1(pGEP359)和crRNA5(pGEP324)的基因组编辑不会导致任何可检测的编辑事件。但是,通过与ZmWUS2和ZmPLT7共同表达,可以实现高达1%的瞬时基因组编辑效率。这些结果表明ZmWUS2和ZmPLT7的共同表达改善了瞬时基因组编辑。
培养基
MRM1:MS盐+MS维生素+100mg/L肌醇+6%蔗糖+9g/L细菌琼脂、pH 5.8
MS0:MS盐+MS维生素+2g/L的肌醇+2%蔗糖+8g/L的细菌琼脂、pH 5.8
***
本发明不限于本文所述的具体实施方案的范围。实际上,除了本文描述的那些之外,根据前述描述和附图,本发明的各种修改对于本领域技术人员将变得明显。这样的修改旨在落入所附权利要求的范围内。还应理解,所有值都是近似值,并提供用以描述。
在整个本申请中援引了专利、专利申请、出版物、产品描述和方案,出于所有目的,其公开内容通过引用整体并入本文。
序列表
<110> 科沃施种子欧洲股份两合公司
<120> 改善植物II中基因组工程工程化和再生的方法II
<130> KWS0311PCT
<150> US 62/685,626
<151> 2018-06-15
<150> US 62/728,401
<151> 2018-09-07
<160> 52
<170> PatentIn version 3.5
<210> 1
<211> 909
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence of ZmWUS2
<400> 1
atggcggcca atgcgggcgg cggtggagcg ggaggaggca gcggcagcgg cagcgtggct 60
gcgccggcgg tgtgccgccc cagcggctcg cggtggacgc cgacgccgga gcagatcagg 120
atgctgaagg agctctacta cggctgcggc atccggtcgc ccagctcgga gcagatccag 180
cgcatcaccg ccatgctgcg gcagcacggc aagatcgagg gcaagaacgt cttctactgg 240
ttccagaacc acaaggcccg cgagcgccag aagcgccgcc tcaccagcct cgacgtcaac 300
gtgcccgccg ccggcgcggc cgacgccacc accagccaac tcggcgtcct ctcgctgtcg 360
tcgccgccgc cttcaggcgc ggcgcctccc tcgcccaccc tcggcttcta cgccgccggc 420
aatggcggcg gatcggctgt gctgctggac acgagttccg actggggcag cagcggcgct 480
gccatggcca ccgagacatg cttcctccag gactacatgg gcgtgacgga cacgggcagc 540
tcgtcgcagt ggccacgctt ctcgtcgtcg gacacgataa tggcggcggc cgcggcgcgg 600
gcggcgacga cgcgggcgcc cgagacgctc cctctcttcc cgacctgcgg cgacgacggc 660
ggcagcggta gcagcagcta cttgccgttc tggggtgccg cgtccacaac tgccggcgcc 720
acttcttccg ttgcgatcca gcagcaacac cagctgcagg agcagtacag cttttacagc 780
aacagcaaca gcacccagct ggccggcacc ggcaaccaag acgtatcggc aacagcagca 840
gcagccgccg ccctggagct gagcctcagc tcatggtgct ccccttaccc tgctgcaggg 900
agtatgtga 909
<210> 2
<211> 302
<212> PRT
<213> Zea mays
<400> 2
Met Ala Ala Asn Ala Gly Gly Gly Gly Ala Gly Gly Gly Ser Gly Ser
1 5 10 15
Gly Ser Val Ala Ala Pro Ala Val Cys Arg Pro Ser Gly Ser Arg Trp
20 25 30
Thr Pro Thr Pro Glu Gln Ile Arg Met Leu Lys Glu Leu Tyr Tyr Gly
35 40 45
Cys Gly Ile Arg Ser Pro Ser Ser Glu Gln Ile Gln Arg Ile Thr Ala
50 55 60
Met Leu Arg Gln His Gly Lys Ile Glu Gly Lys Asn Val Phe Tyr Trp
65 70 75 80
Phe Gln Asn His Lys Ala Arg Glu Arg Gln Lys Arg Arg Leu Thr Ser
85 90 95
Leu Asp Val Asn Val Pro Ala Ala Gly Ala Ala Asp Ala Thr Thr Ser
100 105 110
Gln Leu Gly Val Leu Ser Leu Ser Ser Pro Pro Pro Ser Gly Ala Ala
115 120 125
Pro Pro Ser Pro Thr Leu Gly Phe Tyr Ala Ala Gly Asn Gly Gly Gly
130 135 140
Ser Ala Val Leu Leu Asp Thr Ser Ser Asp Trp Gly Ser Ser Gly Ala
145 150 155 160
Ala Met Ala Thr Glu Thr Cys Phe Leu Gln Asp Tyr Met Gly Val Thr
165 170 175
Asp Thr Gly Ser Ser Ser Gln Trp Pro Arg Phe Ser Ser Ser Asp Thr
180 185 190
Ile Met Ala Ala Ala Ala Ala Arg Ala Ala Thr Thr Arg Ala Pro Glu
195 200 205
Thr Leu Pro Leu Phe Pro Thr Cys Gly Asp Asp Gly Gly Ser Gly Ser
210 215 220
Ser Ser Tyr Leu Pro Phe Trp Gly Ala Ala Ser Thr Thr Ala Gly Ala
225 230 235 240
Thr Ser Ser Val Ala Ile Gln Gln Gln His Gln Leu Gln Glu Gln Tyr
245 250 255
Ser Phe Tyr Ser Asn Ser Asn Ser Thr Gln Leu Ala Gly Thr Gly Asn
260 265 270
Gln Asp Val Ser Ala Thr Ala Ala Ala Ala Ala Ala Leu Glu Leu Ser
275 280 285
Leu Ser Ser Trp Cys Ser Pro Tyr Pro Ala Ala Gly Ser Met
290 295 300
<210> 3
<211> 1470
<212> DNA
<213> Artificial Sequence A188
<220>
<223> cDNA of ZmPLT7
<400> 3
atggacatgg acatgagctc agcttatccc caccattggc tctccttctc cctctccaac 60
aactaccacc atggcctact cgaggccttc tctaactcct ccggtactcc tcttggagac 120
gagccgggcg cagtggagga gtccccgagg acggtggagg acttcctcgg cggcgtcggt 180
ggcgccggcg ccccgccgca gccggcggct gctgcagatc aggatcacca gcttgtgtgc 240
ggcgagctgg gcagcatcac agccaggttc ttgcgccact acccggcggc gccagctggg 300
acgacggtgg agaaccccgg cgcggtgacc gtggcggcca tgtcgtcgac ggacgtggcg 360
ggggcggagt ccgaccaggc gaggcggccc gccgagacgt tcggccagcg cacatccatc 420
taccgtggcg tcaccaggca ccggtggaca gggagatatg aggcgcactt gtgggacaac 480
agctgccgcc gggagggcca aagccgcaaa ggacgccaag tctacctagg aggctatgac 540
aaggaggaga aggcggctag agcttacgac ctcgccgcgc tcaagtactg ggggcctaca 600
accacgacca acttcccggt gtccaactac gagaaggagc tggaggagat gaagtccatg 660
acgcggcagg agttcatcgc gtcgttgcgc aggaagagca gcggcttctc acgaggcgcc 720
tccatctaca gaggagtcac aaggcatcat cagcacggcc ggtggcaggc gaggatcggc 780
agggtggccg gaaacaagga cctgtacttg ggcactttca gtactcagga agaggcggcg 840
gaggcgtacg acatcgctgc gatcaagttc cgcgggctca acgccgtcac caacttcgac 900
atgagccgct acgacgtgga gagcatcctc agcagcgacc tccccgtcgg gggcggagcc 960
accgggcgcg ccgccaagtt cccgttggac tcgctgcagc cggggagcgc tgctgcgatg 1020
atgctcgccg gggctgctgc cgcttcgcag gccaccatgc cgccgtccga gaaggactac 1080
tggtctctgc tcgccctgca ctaccagcag cagcaggagc aggagcggca gttcccggct 1140
tctgcttacg aggcttacgg ctccggcggc gtgaacgtgg acttcacgat gggcaccagt 1200
agcggcaaca acaacaacaa caccggcagc ggcgtcatgt ggggcgccac cactggtgca 1260
gtagtagtgg gacagcaaga cagcagcggc aagcagggca acggctatgc cagcaacatt 1320
ccttatgctg ctgctgctgc tatggtttct ggatctgctg gctacgaggg ctccaccggc 1380
gacaatggaa cctgggttac tacgactatt accagcagca acaccggcac ggctccccac 1440
tactacaact atctcttcgg gatggagtag 1470
<210> 4
<211> 489
<212> PRT
<213> Zea mays A188
<400> 4
Met Asp Met Asp Met Ser Ser Ala Tyr Pro His His Trp Leu Ser Phe
1 5 10 15
Ser Leu Ser Asn Asn Tyr His His Gly Leu Leu Glu Ala Phe Ser Asn
20 25 30
Ser Ser Gly Thr Pro Leu Gly Asp Glu Pro Gly Ala Val Glu Glu Ser
35 40 45
Pro Arg Thr Val Glu Asp Phe Leu Gly Gly Val Gly Gly Ala Gly Ala
50 55 60
Pro Pro Gln Pro Ala Ala Ala Ala Asp Gln Asp His Gln Leu Val Cys
65 70 75 80
Gly Glu Leu Gly Ser Ile Thr Ala Arg Phe Leu Arg His Tyr Pro Ala
85 90 95
Ala Pro Ala Gly Thr Thr Val Glu Asn Pro Gly Ala Val Thr Val Ala
100 105 110
Ala Met Ser Ser Thr Asp Val Ala Gly Ala Glu Ser Asp Gln Ala Arg
115 120 125
Arg Pro Ala Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val
130 135 140
Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn
145 150 155 160
Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu
165 170 175
Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala
180 185 190
Ala Leu Lys Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Ser
195 200 205
Asn Tyr Glu Lys Glu Leu Glu Glu Met Lys Ser Met Thr Arg Gln Glu
210 215 220
Phe Ile Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala
225 230 235 240
Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln
245 250 255
Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr
260 265 270
Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile
275 280 285
Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr
290 295 300
Asp Val Glu Ser Ile Leu Ser Ser Asp Leu Pro Val Gly Gly Gly Ala
305 310 315 320
Thr Gly Arg Ala Ala Lys Phe Pro Leu Asp Ser Leu Gln Pro Gly Ser
325 330 335
Ala Ala Ala Met Met Leu Ala Gly Ala Ala Ala Ala Ser Gln Ala Thr
340 345 350
Met Pro Pro Ser Glu Lys Asp Tyr Trp Ser Leu Leu Ala Leu His Tyr
355 360 365
Gln Gln Gln Gln Glu Gln Glu Arg Gln Phe Pro Ala Ser Ala Tyr Glu
370 375 380
Ala Tyr Gly Ser Gly Gly Val Asn Val Asp Phe Thr Met Gly Thr Ser
385 390 395 400
Ser Gly Asn Asn Asn Asn Asn Thr Gly Ser Gly Val Met Trp Gly Ala
405 410 415
Thr Thr Gly Ala Val Val Val Gly Gln Gln Asp Ser Ser Gly Lys Gln
420 425 430
Gly Asn Gly Tyr Ala Ser Asn Ile Pro Tyr Ala Ala Ala Ala Ala Met
435 440 445
Val Ser Gly Ser Ala Gly Tyr Glu Gly Ser Thr Gly Asp Asn Gly Thr
450 455 460
Trp Val Thr Thr Thr Ile Thr Ser Ser Asn Thr Gly Thr Ala Pro His
465 470 475 480
Tyr Tyr Asn Tyr Leu Phe Gly Met Glu
485
<210> 5
<211> 1458
<212> DNA
<213> Zea mays B73
<400> 5
atggacatgg acatgagctc agcttatccc caccattggc tctccttctc cctctccaac 60
aactaccacc atggcctact cgaagccttc tctaactcct ccggtactcc tcttggagac 120
gagcagggcg cagtggagga gtccccgagg acggtggagg acttcctcgg cggcgtcggt 180
ggcgccggcg ccccgccgca gccggcggcg gctgcagatc aggatcacca gcttgtgtgc 240
ggcgagctgg gcagcatcac agccaggttc ttgcgccact acccggcggc gccagctggg 300
acgacggtgg agaaccccgg cgcggtgacc gtggcggcca tgtcgtcgac ggacgtggcc 360
ggggcggagt ccgaccaggc gaggcggccc gccgagacgt tcggccagcg cacatccatc 420
taccgtggcg tcaccaggca ccggtggacg gggagatatg aggcgcacct gtgggacaac 480
agctgccgcc gggagggcca aagccgcaaa ggacggcaag gaggctatga caaggaggag 540
aaggcggcta gagcttacga cctcgccgcg ctcaagtact gggggcctac aaccacgacc 600
aacttcccgg tgtccaacta cgagaaggag ctggaggaga tgaagtccat gacgcggcag 660
gagttcatcg cgtcgttgcg caggaagagc agcggcttct cacgaggcgc ctccatctac 720
agaggagtca caaggcatca tcagcacggc cggtggcagg cgaggatcgg cagggtggcc 780
ggaaacaagg acctgtactt gggcactttc agtactcagg aagaggcggc ggaggcgtac 840
gacatcgctg cgatcaagtt ccgcgggctc aacgccgtca ccaactttga catgagccgc 900
tacgacgtgg agagcatcct cagcagcgac ctccccgtcg ggggcggagc tagcggtcgc 960
gcccccgcca agttcccgtt ggactcgctg cagccgggga gcgctgccgc catgatgctc 1020
gccggggctg ctgccgcttc gcaggccacc atgccgccgt ccgagaagga ctactggtct 1080
ctgctcgccc tgcactacca gcagcagcag gagcaggagc ggcagttccc ggcttctgct 1140
tacgaggctt acggctccgg cggcgtgaac gtggacttca cgatgggcac cagtagcggc 1200
aacaacaaca acaacaccgg cagcggcgtc atgtggggcg ccaccactgg tgcagtagta 1260
gtgggacagc aagacagcag cggcaagcag ggcaacggct atgccagcaa cattccttat 1320
gctgctgctg ctatggtttc tggatctgct ggctacgagg gctccaccgg cgacaatgga 1380
acctgggtta ctacgactac cagcagcaac accggcacgg ctccccacta ctacaactat 1440
ctcttcggga tggagtag 1458
<210> 6
<211> 485
<212> PRT
<213> Zea mays B73
<400> 6
Met Asp Met Asp Met Ser Ser Ala Tyr Pro His His Trp Leu Ser Phe
1 5 10 15
Ser Leu Ser Asn Asn Tyr His His Gly Leu Leu Glu Ala Phe Ser Asn
20 25 30
Ser Ser Gly Thr Pro Leu Gly Asp Glu Gln Gly Ala Val Glu Glu Ser
35 40 45
Pro Arg Thr Val Glu Asp Phe Leu Gly Gly Val Gly Gly Ala Gly Ala
50 55 60
Pro Pro Gln Pro Ala Ala Ala Ala Asp Gln Asp His Gln Leu Val Cys
65 70 75 80
Gly Glu Leu Gly Ser Ile Thr Ala Arg Phe Leu Arg His Tyr Pro Ala
85 90 95
Ala Pro Ala Gly Thr Thr Val Glu Asn Pro Gly Ala Val Thr Val Ala
100 105 110
Ala Met Ser Ser Thr Asp Val Ala Gly Ala Glu Ser Asp Gln Ala Arg
115 120 125
Arg Pro Ala Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val
130 135 140
Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn
145 150 155 160
Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr
165 170 175
Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys
180 185 190
Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Ser Asn Tyr Glu
195 200 205
Lys Glu Leu Glu Glu Met Lys Ser Met Thr Arg Gln Glu Phe Ile Ala
210 215 220
Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr
225 230 235 240
Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile
245 250 255
Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr
260 265 270
Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg
275 280 285
Gly Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Glu
290 295 300
Ser Ile Leu Ser Ser Asp Leu Pro Val Gly Gly Gly Ala Ser Gly Arg
305 310 315 320
Ala Pro Ala Lys Phe Pro Leu Asp Ser Leu Gln Pro Gly Ser Ala Ala
325 330 335
Ala Met Met Leu Ala Gly Ala Ala Ala Ala Ser Gln Ala Thr Met Pro
340 345 350
Pro Ser Glu Lys Asp Tyr Trp Ser Leu Leu Ala Leu His Tyr Gln Gln
355 360 365
Gln Gln Glu Gln Glu Arg Gln Phe Pro Ala Ser Ala Tyr Glu Ala Tyr
370 375 380
Gly Ser Gly Gly Val Asn Val Asp Phe Thr Met Gly Thr Ser Ser Gly
385 390 395 400
Asn Asn Asn Asn Asn Thr Gly Ser Gly Val Met Trp Gly Ala Thr Thr
405 410 415
Gly Ala Val Val Val Gly Gln Gln Asp Ser Ser Gly Lys Gln Gly Asn
420 425 430
Gly Tyr Ala Ser Asn Ile Pro Tyr Ala Ala Ala Ala Met Val Ser Gly
435 440 445
Ser Ala Gly Tyr Glu Gly Ser Thr Gly Asp Asn Gly Thr Trp Val Thr
450 455 460
Thr Thr Thr Ser Ser Asn Thr Gly Thr Ala Pro His Tyr Tyr Asn Tyr
465 470 475 480
Leu Phe Gly Met Glu
485
<210> 7
<211> 1497
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of AtPLT7
<400> 7
atggctcctc caatgacgaa ttgcttaacg ttttctctgt caccaatgga gatgttgaaa 60
tcaactgatc agtctcactt ctcttcttct tacgacgatt cttctactcc ttatctcatc 120
gataacttct atgctttcaa agaagaagct gagatagaag ctgctgctgc ttcaatggcg 180
gattcaacaa ccttatctac ttttttcgat cattctcaga ctcagattcc aaagctggaa 240
gatttcctcg gtgattcctt tgtccgttac tctgataacc aaacagagac ccaagactct 300
tcttctctca ctccattcta cgatccacgt caccgcaccg ttgccgaagg agttacaggg 360
ttcttctctg atcatcatca gccagatttc aagacgataa actcgggacc agaaatcttc 420
gatgactcaa caacttccaa catcggtggt actcatctct ccagtcacgt ggtggagtca 480
tcaacgacgg cgaagttagg gtttaacggt gattgcacca ccaccggagg agttttgtct 540
ctaggggtta acaacacatc agatcaacct ttgagctgta acaatggcga gagaggtgga 600
aacagtaaca agaagaaaac agtttctaag aaggaaacat cagatgattc aaagaagaag 660
attgtcgaaa cattgggaca aagaacttca atttatcgtg gagtcacccg acatagatgg 720
actggaagat acgaagcgca tctatgggat aacagctgta ggagggaagg tcaagccaga 780
aaaggacgtc aagtgtactt aggtggatat gacaaggaag atagagcagc tagagcctat 840
gacttggcag ctttaaaata ctggggttct actgctacta caaattttcc ggtctcgagt 900
tattcaaaag aacttgagga aatgaatcac atgaccaagc aagagtttat tgcatctctt 960
aggaggaaaa gtagcggttt ttcgagagga gcttcaatat atagaggtgt cacaaggcat 1020
catcaacaag gtcgctggca agcaagaatc ggccgtgtcg caggaaacaa agatctttac 1080
ctcggaacct ttgcaaccga agaggaagca gcagaggctt atgacattgc agccataaag 1140
ttcagaggaa tcaacgcagt aactaacttt gagatgaaca ggtatgacat tgaagctgtc 1200
atgaatagtt ctttacctgt aggaggagca gctgcgaaac gccacaaact caaactcgct 1260
cttgaatctc cttcttcatc atcctctgac cataacctcc aacaacaaca gttgcttccg 1320
tcctcttctc cctcggatca aaaccctaac tcaatcccat gtggcattcc atttgagcct 1380
tcagttctct attaccacca gaacttcttt cagcattatc ctttggtctc tgactctaca 1440
attcaagctc ctatgaacca agctgagttt ttcttgtggc ctaaccagtc ttactaa 1497
<210> 8
<211> 498
<212> PRT
<213> Zea mays
<400> 8
Met Ala Pro Pro Met Thr Asn Cys Leu Thr Phe Ser Leu Ser Pro Met
1 5 10 15
Glu Met Leu Lys Ser Thr Asp Gln Ser His Phe Ser Ser Ser Tyr Asp
20 25 30
Asp Ser Ser Thr Pro Tyr Leu Ile Asp Asn Phe Tyr Ala Phe Lys Glu
35 40 45
Glu Ala Glu Ile Glu Ala Ala Ala Ala Ser Met Ala Asp Ser Thr Thr
50 55 60
Leu Ser Thr Phe Phe Asp His Ser Gln Thr Gln Ile Pro Lys Leu Glu
65 70 75 80
Asp Phe Leu Gly Asp Ser Phe Val Arg Tyr Ser Asp Asn Gln Thr Glu
85 90 95
Thr Gln Asp Ser Ser Ser Leu Thr Pro Phe Tyr Asp Pro Arg His Arg
100 105 110
Thr Val Ala Glu Gly Val Thr Gly Phe Phe Ser Asp His His Gln Pro
115 120 125
Asp Phe Lys Thr Ile Asn Ser Gly Pro Glu Ile Phe Asp Asp Ser Thr
130 135 140
Thr Ser Asn Ile Gly Gly Thr His Leu Ser Ser His Val Val Glu Ser
145 150 155 160
Ser Thr Thr Ala Lys Leu Gly Phe Asn Gly Asp Cys Thr Thr Thr Gly
165 170 175
Gly Val Leu Ser Leu Gly Val Asn Asn Thr Ser Asp Gln Pro Leu Ser
180 185 190
Cys Asn Asn Gly Glu Arg Gly Gly Asn Ser Asn Lys Lys Lys Thr Val
195 200 205
Ser Lys Lys Glu Thr Ser Asp Asp Ser Lys Lys Lys Ile Val Glu Thr
210 215 220
Leu Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp
225 230 235 240
Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu
245 250 255
Gly Gln Ala Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys
260 265 270
Glu Asp Arg Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp
275 280 285
Gly Ser Thr Ala Thr Thr Asn Phe Pro Val Ser Ser Tyr Ser Lys Glu
290 295 300
Leu Glu Glu Met Asn His Met Thr Lys Gln Glu Phe Ile Ala Ser Leu
305 310 315 320
Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly
325 330 335
Val Thr Arg His His Gln Gln Gly Arg Trp Gln Ala Arg Ile Gly Arg
340 345 350
Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ala Thr Glu Glu
355 360 365
Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Ile
370 375 380
Asn Ala Val Thr Asn Phe Glu Met Asn Arg Tyr Asp Ile Glu Ala Val
385 390 395 400
Met Asn Ser Ser Leu Pro Val Gly Gly Ala Ala Ala Lys Arg His Lys
405 410 415
Leu Lys Leu Ala Leu Glu Ser Pro Ser Ser Ser Ser Ser Asp His Asn
420 425 430
Leu Gln Gln Gln Gln Leu Leu Pro Ser Ser Ser Pro Ser Asp Gln Asn
435 440 445
Pro Asn Ser Ile Pro Cys Gly Ile Pro Phe Glu Pro Ser Val Leu Tyr
450 455 460
Tyr His Gln Asn Phe Phe Gln His Tyr Pro Leu Val Ser Asp Ser Thr
465 470 475 480
Ile Gln Ala Pro Met Asn Gln Ala Glu Phe Phe Leu Trp Pro Asn Gln
485 490 495
Ser Tyr
<210> 9
<211> 1485
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of PLT5
<400> 9
atggacacct cgcaccacta tcatccatgg ctcaacttct ccctcgccca ccactgtgac 60
ctcgaggagg aggagagggg cgcggccgcc gagctggccg cgatagccgg cgccgcgccg 120
ccgccgaagc tggaggactt cctcggcgga ggcgtcgcca ccggtggtcc ggaggcggtg 180
gcgcccgcgg agatgtacga ctcggacctc aagttcatag ccgccgccgg gttccttggc 240
ggctcggcgg cggcggcggc gacgtcgccg ctgtcctccc tcgaccaggc cggttccaag 300
ctggccttgc ctgcggcggc ggctgctccg gcgccggagc agaggaaggc cgtcgactcc 360
tttgggcagc gcacgtccat ctaccgcggc gtcacacggc accggtggac tggcaggtac 420
gaggcacatc tgtgggacaa cagctgccga cgcgaagggc agagccgcaa gggccgccaa 480
gtatatttgg gtggctatga taaggaggag aaggctgcca gggcgtatga tcttgcagct 540
ttgaagtact ggggttctag caccaccacc aactttccgg ttgctgagta tgagaaggag 600
gtcgaggaga tgaagaacat gacgcgacaa gagtttgttg cttcccttcg aaggaagagc 660
agtggattct ctcggggtgc ttccatctac agaggtgtaa ccagacatca ccagcatgga 720
cggtggcagg cgaggatcgg aagggtggcc ggtaacaagg acctctacct tgggacgttc 780
agcaccgagg aggaagctgc agaggcctac gacatagcgg ccatcaagtt cagaggcctg 840
aacgccgtca caaacttcga gatcagccgg tacaacgtgg agaccataat gagcagcaac 900
cttccagtcg cgagcatgtc gtcgtcgtcg gcggcggcgg cgggtggccg gagcagcaag 960
gcgctggagt cccctccgtc cggctcgctt gacggcggcg gcggcatgcc agtcgtcgaa 1020
ggcagcacgg caccgccgct gttcattccg gtgaagtacg accagcagca gcaggagtac 1080
ctgtcgatgc tcgcgttgca gcaccaccac cagcagcaac aagcagggaa cctgttgcag 1140
gggccgctag tagggttcgg cggcctctac tcctccgggg tgaacctgga tttcgccaac 1200
tcccacggca cggcggctcc gtcgtcgatg gcccaccact gctacgccaa tggcaccgcg 1260
tccgcctcgc atgagcacca gcaccagcac cagatgcagc agggcggcga gaacgagacg 1320
cagccgcagc cgcagcagag ctccagcagc tgctcctccc tgccattcgc caccccggtc 1380
gctttcaatg ggtcctatga aagctccatc acggcggcag gcccctttgg atactcctac 1440
ccaaatgtgg cagcctttca gacgccgatc tatggaatgg aatga 1485
<210> 10
<211> 492
<212> PRT
<213> Zea mays
<400> 10
Met Asp Thr Ser His His Tyr His Pro Trp Leu Asn Phe Ser Leu Ala
1 5 10 15
His His Cys Asp Leu Glu Glu Glu Glu Arg Gly Ala Ala Ala Glu Leu
20 25 30
Ala Ala Ile Ala Gly Ala Ala Pro Pro Pro Lys Leu Glu Asp Phe Leu
35 40 45
Gly Gly Gly Val Ala Thr Gly Gly Pro Glu Ala Val Ala Pro Ala Glu
50 55 60
Met Tyr Asp Ser Asp Leu Lys Phe Ile Ala Ala Ala Gly Phe Leu Gly
65 70 75 80
Gly Ser Ala Ala Ala Ala Ala Thr Ser Pro Leu Ser Ser Leu Asp Gln
85 90 95
Ala Gly Ser Lys Leu Ala Leu Pro Ala Ala Ala Ala Ala Pro Ala Pro
100 105 110
Glu Gln Arg Lys Ala Val Asp Ser Phe Gly Gln Arg Thr Ser Ile Tyr
115 120 125
Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu
130 135 140
Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln
145 150 155 160
Glu Ser Glu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr
165 170 175
Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ser Ser Thr Thr Thr Asn Phe
180 185 190
Pro Val Ala Glu Tyr Glu Lys Glu Val Glu Glu Met Lys Asn Met Thr
195 200 205
Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser
210 215 220
Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly
225 230 235 240
Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr
245 250 255
Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile
260 265 270
Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile
275 280 285
Ser Arg Tyr Asn Val Glu Thr Ile Met Ser Ser Asn Leu Pro Val Ala
290 295 300
Ser Met Ser Ser Ser Ala Ala Ala Ala Ala Gly Gly Arg Ser Ser Lys
305 310 315 320
Ala Leu Glu Ser Pro Pro Ser Gly Ser Leu Asp Gly Gly Gly Gly Met
325 330 335
Pro Val Val Glu Ala Ser Thr Ala Pro Pro Leu Phe Ile Pro Val Lys
340 345 350
Tyr Asp Gln Gln Gln Gln Glu Tyr Leu Ser Met Leu Ala Leu Gln Gln
355 360 365
His His Gln Gln Gln Gln Ala Gly Asn Leu Leu Gln Gly Pro Leu Val
370 375 380
Gly Phe Gly Gly Leu Tyr Ser Ser Gly Val Asn Leu Asp Phe Ala Asn
385 390 395 400
Ser His Gly Thr Ala Ala Pro Ser Ser Met Ala His His Cys Tyr Ala
405 410 415
Asn Gly Thr Ala Ser Ala Ser His Glu His Gln His Gln Met Gln Gln
420 425 430
Gly Gly Glu Asn Glu Thr Gln Pro Gln Pro Gln Gln Ser Ser Ser Ser
435 440 445
Cys Ser Ser Leu Pro Phe Ala Thr Pro Val Ala Phe Asn Gly Ser Tyr
450 455 460
Glu Ser Ser Ile Thr Ala Ala Gly Pro Phe Gly Tyr Ser Tyr Pro Asn
465 470 475 480
Val Ala Ala Phe Gln Thr Pro Ile Tyr Gly Met Glu
485 490
<210> 11
<211> 1677
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of AtPLT5
<400> 11
atgaagaaca ataacaacaa atcttcttct tcttctagct atgattcttc tttgtctcct 60
tcttcttcat cctcctccca ccagaactgg ctctctttct ctctctccaa caataacaac 120
aacttcaatt cttcctcaaa ccctaatctc acttcctcca catcagatca tcatcatcct 180
cacccttctc acctctctct ctttcaagct ttctccactt ctccagtcga acggcaagat 240
gggtcaccgg gagtttcacc cagcgatgcc acggcggttc tttccgtata ccccggcggt 300
cctaaacttg agaacttcct cggcggagga gcctcaacga cgacaacaag accaatgcaa 360
caagtgcaat ctcttggcgg cgttgtcttc tcttccgacc tacagccacc gcttcatcct 420
ccgtccgccg ccgagatcta cgactctgag ctcaagtcaa tagccgctag cttcctagga 480
aactactccg gtggacactc gtcggaggtc tctagcgtac ataaacaaca accgaatcct 540
ctagctgtct cagaggcttc gcctactccg aagaagaacg tagagagttt tggacaacgt 600
acctcgattt atagaggagt cacaagacat agatggactg gaagatacga agctcatcta 660
tgggataata gttgccgaag agaaggccaa agcagaaaag gaagacaagt ttatttaggt 720
ggttatgata aggaagataa agcagctaga gcttacgacc ttgcagctct taagtattgg 780
ggtcctacaa ctacgactaa tttcccgata tcaaattacg aatctgaact tgaagaaatg 840
aaacacatga ctcgacaaga gttcgttgct tctttaagac ggaaaagcag tggattctct 900
aggggtgcct ccatgtacag aggcgtcact agacatcatc agcatggtcg atggcaggca 960
cgaattggaa gagttgcagg caacaaagac ctttatcttg gcacatttag cactcaagag 1020
gaagctgcag aagcttatga tatagcagcg atcaaattcc gcggtctaaa tgcagtcacc 1080
aatttcgaca tcagtcgata tgatgtcaaa tcaattgcta gctgtaatct ccctgtgggt 1140
ggactaatgc ctaaaccttc tccagcaacc gcagcggctg acaaaaccgt tgatctttct 1200
ccatccgact ctccatctct aaccacaccg tccctcacgt tcaatgtggc aacaccggtc 1260
aatgaccatg gaggaacttt ttaccacact ggtataccaa tcaaaccaga cccggctgat 1320
cattattggt ccaacatctt tggattccag gcaaacccga aagcagaaat gcgaccatta 1380
gcaaactttg ggtcggatct tcataaccct tctcctggtt atgctataat gccggtaatg 1440
caggaaggtg aaaacaactt tggtggtagt tttgttgggt ctgatgggta taacaatcat 1500
tccgctgcat cgaacccggt ctcagcaatt ccgctgtcct cgacaactac aatgagtaac 1560
ggtaacgaag ggtatggtgg aaacataaac tggattaata acaacatttc aagttcttac 1620
caaactgcaa aatcaaatct ctctgttttg cacacaccgg tttttgggtt ggaatga 1677
<210> 12
<211> 558
<212> PRT
<213> Zea mays
<400> 12
Met Lys Asn Asn Asn Asn Lys Ser Ser Ser Ser Ser Ser Tyr Asp Ser
1 5 10 15
Ser Leu Ser Pro Ser Ser Ser Ser Ser Ser His Gln Asn Trp Leu Ser
20 25 30
Phe Ser Leu Ser Asn Asn Asn Asn Asn Phe Asn Ser Ser Ser Asn Pro
35 40 45
Asn Leu Thr Ser Ser Thr Ser Asp His His His Pro His Pro Ser His
50 55 60
Leu Ser Leu Phe Gln Ala Phe Ser Thr Ser Pro Val Glu Arg Gln Asp
65 70 75 80
Gly Ser Pro Gly Val Ser Pro Ser Asp Ala Thr Ala Val Leu Ser Val
85 90 95
Tyr Pro Gly Gly Pro Lys Leu Glu Asn Phe Leu Gly Gly Gly Ala Ser
100 105 110
Thr Thr Thr Thr Arg Pro Met Gln Gln Val Gln Ser Leu Gly Gly Val
115 120 125
Val Phe Ser Ser Asp Leu Gln Pro Pro Leu His Pro Pro Ser Ala Ala
130 135 140
Glu Ile Tyr Asp Ser Glu Leu Lys Ser Ile Ala Ala Ser Phe Leu Gly
145 150 155 160
Asn Tyr Ser Gly Gly His Ser Ser Glu Val Ser Ser Val His Lys Gln
165 170 175
Gln Pro Asn Pro Leu Ala Val Ser Glu Ala Ser Pro Thr Pro Lys Lys
180 185 190
Asn Val Glu Ser Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr
195 200 205
Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser
210 215 220
Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu Gly
225 230 235 240
Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala
245 250 255
Leu Lys Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Ile Ser Asn
260 265 270
Tyr Glu Ser Glu Leu Glu Glu Met Lys His Met Thr Arg Gln Glu Phe
275 280 285
Val Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser
290 295 300
Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala
305 310 315 320
Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe
325 330 335
Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys
340 345 350
Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Ile Ser Arg Tyr Asp
355 360 365
Val Lys Ser Ile Ala Ser Cys Asn Leu Pro Val Gly Gly Leu Met Pro
370 375 380
Lys Pro Ser Pro Ala Thr Ala Ala Ala Asp Lys Thr Val Asp Leu Ser
385 390 395 400
Pro Ser Asp Ser Pro Ser Leu Thr Thr Pro Ser Leu Thr Phe Asn Val
405 410 415
Ala Thr Pro Val Asn Asp His Gly Gly Thr Phe Tyr His Thr Gly Ile
420 425 430
Pro Ile Lys Pro Asp Pro Ala Asp His Tyr Trp Ser Asn Ile Phe Gly
435 440 445
Phe Gln Ala Asn Pro Lys Ala Glu Met Arg Pro Leu Ala Asn Phe Gly
450 455 460
Ser Asp Leu His Asn Pro Ser Pro Gly Tyr Ala Ile Met Pro Val Met
465 470 475 480
Gln Glu Gly Glu Asn Asn Phe Gly Gly Ser Phe Val Gly Ser Asp Gly
485 490 495
Tyr Asn Asn His Ser Ala Ala Ser Asn Pro Val Ser Ala Ile Pro Leu
500 505 510
Ser Ser Thr Thr Thr Met Ser Asn Gly Asn Glu Gly Tyr Gly Gly Asn
515 520 525
Ile Asn Trp Ile Asn Asn Asn Ile Ser Ser Ser Tyr Gln Thr Ala Lys
530 535 540
Ser Asn Leu Ser Val Leu His Thr Pro Val Phe Gly Leu Glu
545 550 555
<210> 13
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence of KWS_RBP1
<400> 13
atggagtcgg gctccgggac ggctgctggc tctggctatg tttacagaca gccaggatca 60
acgcggtgga acccgacagc tgaacaactg tccttgctta gagaaatcta ctaccgcaac 120
ggattgcgga ccccgaccgc ggacgaaatc agacaaatca gctcaaagct ctcaaggtac 180
ggaaaaatag agggcaaaaa cgtttacaac tggttccaga atagacgcgc aagagaaaag 240
cgcaagcaac ggctctctac aatcggctgt gatccagcac tgatcgagat ggggaatgtc 300
gcttcactgg aattcggtac tgagagcgcc ctggaatcgc tgtcgtcagg accatcctca 360
gaactccgcg aagcgccaac gagaaaattt tacgaaaaaa agacggttgg agagaactca 420
actataataa acccagtgga acaaaactgt accctttcct gcggaacgtc ccaagagttc 480
cagtatgcgg tcgattctcg gcgcgtcatg aaagctatgg aggaaaagca ggcgacggac 540
gatgaacccg acggaaataa atggactgag tcaaacagac acgtcaagat tctccagctt 600
ttcccgctcc acaataacga ggatcagaca ttgataaaga gcgacaaaga aatctattgt 660
ttgggctcgt gcgagaagaa aatggatttg tcaccgctgg gtcattcagg ctctcagcgc 720
gcttcggccc ttgacttgtg cctttcattg ggcaacgaat cttgtgggct gcatgataat 780
tga 783
<210> 14
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> protein of KWS_RBP1
<400> 14
Met Glu Ser Gly Ser Gly Thr Ala Ala Gly Ser Gly Tyr Val Tyr Arg
1 5 10 15
Gln Pro Gly Ser Thr Arg Trp Asn Pro Thr Ala Glu Gln Leu Ser Leu
20 25 30
Leu Arg Glu Ile Tyr Tyr Arg Asn Gly Leu Arg Thr Pro Thr Ala Asp
35 40 45
Glu Ile Arg Gln Ile Ser Ser Lys Leu Ser Arg Tyr Gly Lys Ile Glu
50 55 60
Gly Lys Asn Val Tyr Asn Trp Phe Gln Asn Arg Arg Ala Arg Glu Lys
65 70 75 80
Arg Lys Gln Arg Leu Ser Thr Ile Gly Cys Asp Pro Ala Leu Ile Glu
85 90 95
Met Gly Asn Val Ala Ser Leu Glu Phe Gly Thr Glu Ser Ala Leu Glu
100 105 110
Ser Leu Ser Ser Gly Pro Ser Ser Glu Leu Arg Glu Ala Pro Thr Arg
115 120 125
Lys Phe Tyr Glu Lys Lys Thr Val Gly Glu Asn Ser Thr Ile Ile Asn
130 135 140
Pro Val Glu Gln Asn Cys Thr Leu Ser Cys Gly Thr Ser Gln Glu Phe
145 150 155 160
Gln Tyr Ala Val Asp Ser Arg Arg Val Met Lys Ala Met Glu Glu Lys
165 170 175
Gln Ala Thr Asp Asp Glu Pro Asp Gly Asn Lys Trp Thr Glu Ser Asn
180 185 190
Arg His Val Lys Ile Leu Gln Leu Phe Pro Leu His Asn Asn Glu Asp
195 200 205
Gln Thr Leu Ile Lys Ser Asp Lys Glu Ile Tyr Cys Leu Gly Ser Cys
210 215 220
Glu Lys Lys Met Asp Leu Ser Pro Leu Gly His Ser Gly Ser Gln Arg
225 230 235 240
Ala Ser Ala Leu Asp Leu Cys Leu Ser Leu Gly Asn Glu Ser Cys Gly
245 250 255
Leu His Asp Asn
260
<210> 15
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of TaRKD4
<400> 15
atggagatgc aacaacaata cttcgggggg gacggcgatg cggactggtt ccatcaactc 60
gcattgcttc ccccacttcc aatctcatcg tctctccccc cactcccgat gtcagagggc 120
tcatgtctcc ctatggcagc agcagctgca gctgcactcc cccttggcga ttgctcgagc 180
gccctcatga tacgccctga ggaacagatg tcttgccttc caatgaaccc ctctccagcg 240
gtcgtcgacg atgtctactc ttcctacgca ccgaacaatg tcgacgtgtt gccgccattc 300
ccggcaggac ttgacgacgc tctgttgatg gagtcttttt ctgacatcga cctcgaggag 360
tttgctgacg catttggcca caagatcaag acagaacccc tcgacgatgc catggtcccc 420
gcggaccacg acttcgcggc tcaagcccaa caggcctgcc ctgtggtcat catgaatcag 480
caacaactca acgcacccag agacgtgcgc ctgctcattg acccggatga tgatgacagc 540
accgtggtgg ccgggggcta tgaagctgca gcggtggggt gcgccgagca gaaacaggtc 600
aggccagcac cacgtagggt gagaaagagc tcaggcggcg caagaccagc cgcgggagga 660
aagtccctcg atcacatcgg attcgaggaa ctcaggacct atttctatat gccaatcacc 720
aaggcagcga gggaaatgaa cgtggggctg acagtcctga agaagagatg ccgggaactg 780
ggggtggcgc gctggccaca cagaaagatg aagtctctga gaagcctgat cctcaacatt 840
caggagatgg ggaagggcgc aacatctccc gcagccgtgc agggggaact tgaagcgctt 900
gagaggtatt gcgccattat ggaggagaac ccggctatag agctcaccga gcaaacgaag 960
aagctcaggc aggcttgttt caaagagaat tataagcggc gtagagccgc cgcttctgtt 1020
aatcttctcg atcactgcta taacgatctg gcatctcatg agcagcaaat gcctctccca 1080
caaatgggat tctttggatt ttag 1104
<210> 16
<211> 367
<212> PRT
<213> Triticum aestivum
<400> 16
Met Glu Met Gln Gln Gln Tyr Phe Gly Gly Asp Gly Asp Ala Asp Trp
1 5 10 15
Phe His Gln Leu Ala Leu Leu Pro Pro Leu Pro Ile Ser Ser Ser Leu
20 25 30
Pro Pro Leu Pro Met Ser Glu Gly Ser Cys Leu Pro Met Ala Ala Ala
35 40 45
Ala Ala Ala Ala Leu Pro Leu Gly Asp Cys Ser Ser Ala Leu Met Ile
50 55 60
Arg Pro Glu Glu Gln Met Ser Cys Leu Pro Met Asn Pro Ser Pro Ala
65 70 75 80
Val Val Asp Asp Val Tyr Ser Ser Tyr Ala Pro Asn Asn Val Asp Val
85 90 95
Leu Pro Pro Phe Pro Ala Gly Leu Asp Asp Ala Leu Leu Met Glu Ser
100 105 110
Phe Ser Asp Ile Asp Leu Glu Glu Phe Ala Asp Ala Phe Gly His Lys
115 120 125
Ile Lys Thr Glu Pro Leu Asp Asp Ala Met Val Pro Ala Asp His Asp
130 135 140
Phe Ala Ala Gln Ala Gln Gln Ala Cys Pro Val Val Ile Met Asn Gln
145 150 155 160
Gln Gln Leu Asn Ala Pro Arg Asp Val Arg Leu Leu Ile Asp Pro Asp
165 170 175
Asp Asp Asp Ser Thr Val Val Ala Gly Gly Tyr Glu Ala Ala Ala Val
180 185 190
Gly Cys Ala Glu Gln Lys Gln Val Arg Pro Ala Pro Arg Arg Val Arg
195 200 205
Lys Ser Ser Gly Gly Ala Arg Pro Ala Ala Gly Gly Lys Ser Leu Asp
210 215 220
His Ile Gly Phe Glu Glu Leu Arg Thr Tyr Phe Tyr Met Pro Ile Thr
225 230 235 240
Lys Ala Ala Arg Glu Met Asn Val Gly Leu Thr Val Leu Lys Lys Arg
245 250 255
Cys Arg Glu Leu Gly Val Ala Arg Trp Pro His Arg Lys Met Lys Ser
260 265 270
Leu Arg Ser Leu Ile Leu Asn Ile Gln Glu Met Gly Lys Gly Ala Thr
275 280 285
Ser Pro Ala Ala Val Gln Gly Glu Leu Glu Ala Leu Glu Arg Tyr Cys
290 295 300
Ala Ile Met Glu Glu Asn Pro Ala Ile Glu Leu Thr Glu Gln Thr Lys
305 310 315 320
Lys Leu Arg Gln Ala Cys Phe Lys Glu Asn Tyr Lys Arg Arg Arg Ala
325 330 335
Ala Ala Ser Val Asn Leu Leu Asp His Cys Tyr Asn Asp Leu Ala Ser
340 345 350
His Glu Gln Gln Met Pro Leu Pro Gln Met Gly Phe Phe Gly Phe
355 360 365
<210> 17
<211> 897
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of AtRKD4
<400> 17
atggctgatc acacaaccaa agaacagaag tcattctcat tcctagctca ttctccatcc 60
tttgatcaca gctccttaag ttatccttta ttcgactggg aagaagatct tcttgctctc 120
caagaaaact ctggctctca agcatttcct tttactacaa cttctctgcc tttacctgat 180
cttgaaccct tgtctgaaga tgtactcaat tcatacagct ctgcgtcatg gaacgaaaca 240
gagcaaaaca gaggagatgg cgcttcatcg gagaagaaga gggaaaatgg aacagtgaaa 300
gagacaacta agaagaggaa aatcaatgag agacacagag aacatagcgt gagaatcatc 360
agcgatatta ctacctacac aactagttca gctccaacga cattgtcaaa ggaaactgtc 420
tctcgctact tctacatgcc cataactcag gctgcaatag cacttaacgt tggtttaact 480
ctactaaaaa ggagatgtcg cgaattgggt attcgccgat ggcctcatcg taaacttatg 540
agcttaaaca ctttgatcag taacgtcaag gagctgcaga agatggaagg cgaagagaat 600
gcagaaaaac tgcaggacgc gttggagatg cttgagaagg agaagaggac aattgaggat 660
ttgccggatt tggagtttaa ggacaagaca aagaggctaa gacaagcttg tttcaaggct 720
aaccacaaga ggaagaagaa gagaagtctc aagtccgatc agtctcaagt accctcgtgt 780
tcaagcagcg gatcagttcc tagtgatgag tcggttgatg aagcaggaat ggagagtgat 840
gaagaaatga agtatctctt gtgtggtttc tcaagtgaat ttactagtgg tttgtga 897
<210> 18
<211> 298
<212> PRT
<213> Arabidopsis thaliana
<400> 18
Met Ala Asp His Thr Thr Lys Glu Gln Lys Ser Phe Ser Phe Leu Ala
1 5 10 15
His Ser Pro Ser Phe Asp His Ser Ser Leu Ser Tyr Pro Leu Phe Asp
20 25 30
Trp Glu Glu Asp Leu Leu Ala Leu Gln Glu Asn Ser Gly Ser Gln Ala
35 40 45
Phe Pro Phe Thr Thr Thr Ser Leu Pro Leu Pro Asp Leu Glu Pro Leu
50 55 60
Ser Glu Asp Val Leu Asn Ser Tyr Ser Ser Ala Ser Trp Asn Glu Thr
65 70 75 80
Glu Gln Asn Arg Gly Asp Gly Ala Ser Ser Glu Lys Lys Arg Glu Asn
85 90 95
Gly Thr Val Lys Glu Thr Thr Lys Lys Arg Lys Ile Asn Glu Arg His
100 105 110
Arg Glu His Ser Val Arg Ile Ile Ser Asp Ile Thr Thr Tyr Thr Thr
115 120 125
Ser Ser Ala Pro Thr Thr Leu Ser Lys Glu Thr Val Ser Arg Tyr Phe
130 135 140
Tyr Met Pro Ile Thr Gln Ala Ala Ile Ala Leu Asn Val Gly Leu Thr
145 150 155 160
Leu Leu Lys Arg Arg Cys Arg Glu Leu Gly Ile Arg Arg Trp Pro His
165 170 175
Arg Lys Leu Met Ser Leu Asn Thr Leu Ile Ser Asn Val Lys Glu Leu
180 185 190
Gln Lys Met Glu Gly Glu Glu Asn Ala Glu Lys Leu Gln Asp Ala Leu
195 200 205
Glu Met Leu Glu Lys Glu Lys Arg Thr Ile Glu Asp Leu Pro Asp Leu
210 215 220
Glu Phe Lys Asp Lys Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Ala
225 230 235 240
Asn His Lys Arg Lys Lys Lys Arg Ser Leu Lys Ser Asp Gln Ser Gln
245 250 255
Val Pro Ser Cys Ser Ser Ser Gly Ser Val Pro Ser Asp Glu Ser Val
260 265 270
Asp Glu Ala Gly Met Glu Ser Asp Glu Glu Met Lys Tyr Leu Leu Cys
275 280 285
Gly Phe Ser Ser Glu Phe Thr Ser Gly Leu
290 295
<210> 19
<211> 1185
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of ZmRKD4
<400> 19
atggcgatgg tgccatgcgg cgatgacacc gactggtgcc acgtgctgga caacttcaac 60
ctgttgctgt gttcgtcgtc ctgctcgccg aatgctatgg ccaacagagc ggaagactgt 120
ctgccgatat ctgctgctcc acccggaccc ggccatcatc agagctgctg caaaaacgaa 180
gtcgtcctcg aagcctcttg tgatggcgcg tttgctgcag ccgactgctt gtcttcggct 240
ctgacgaacc tgcagaggga ggacgacagt ttctatttgc ccatgtactc tgcgccaccc 300
gcagtcggcg atgagtactt ctccgatcta ctcgcgcccg atgccgacgg cattgacgag 360
gcgctcctga tgccgttcag cgacatcgat cttcaggtct tcgacagtga cgacgagcac 420
aggcctcctg tcgaccaaat ggttaatatg atcccgccgg cggttcttca tcatccctcc 480
accgccggga cgcaaaatgg aggtgccgtt catgctcatc agaaggccat ggcggtcatc 540
gatgactcct gtttccgacg aggagccagt ggtgtcgaga tggccgtcgt caggcatcat 600
ggtgagcctc gtcaaggaag ctcttccgtg gcgccagtgc cgccaccgtc actgccgggg 660
acgcgtgcaa ggaggagcga cggccgatca gctcgggcgg ggaagacgac gaagctggac 720
tacatcggct tcgacgagct gcggaagtac ttctgcatgc ccatcaccag ggcggcgagg 780
gagatgaacg tcgggctcac cgtgctcaag aagcgctgcc gcgagctcgg cgtggcgcgg 840
tggcctcacc ggaagatgaa gagcctcaag tccctcatgg ccaacgtcca ggaaatgggg 900
aacgtcatgt cctcggtggc tgtgcagcag gagcttgcgg cgctcgagac gtactgcacg 960
ctcatggagg acaatccctg gatcgagctc acggacagga ccaagaagct gcgccaggcg 1020
tgcttcaagg agaggtacaa gcgtaggagg gcggccgaag tcaacgtcat ggatatggat 1080
cgcatctact gctttggcca gcatcaccac cagcagctgc tgcctccgac gacaagcagt 1140
tctgacgacc gccatggcca gtgcagccgt tcctttggct actga 1185
<210> 20
<211> 394
<212> PRT
<213> Zea mays
<400> 20
Met Ala Met Val Pro Cys Gly Asp Asp Thr Asp Trp Cys His Val Leu
1 5 10 15
Asp Asn Phe Asn Leu Leu Leu Cys Ser Ser Ser Cys Ser Pro Asn Ala
20 25 30
Met Ala Asn Arg Ala Glu Asp Cys Leu Pro Ile Ser Ala Ala Pro Pro
35 40 45
Gly Pro Gly His His Gln Ser Cys Cys Lys Asn Glu Val Val Leu Glu
50 55 60
Ala Ser Cys Asp Gly Ala Phe Ala Ala Ala Asp Cys Leu Ser Ser Ala
65 70 75 80
Leu Thr Asn Leu Gln Arg Glu Asp Asp Ser Phe Tyr Leu Pro Met Tyr
85 90 95
Ser Ala Pro Pro Ala Val Gly Asp Glu Tyr Phe Ser Asp Leu Leu Ala
100 105 110
Pro Asp Ala Asp Gly Ile Asp Glu Ala Leu Leu Met Pro Phe Ser Asp
115 120 125
Ile Asp Leu Gln Val Phe Asp Ser Asp Asp Glu His Arg Pro Pro Val
130 135 140
Asp Gln Met Val Asn Met Ile Pro Pro Ala Val Leu His His Pro Ser
145 150 155 160
Thr Ala Gly Thr Gln Asn Gly Gly Ala Val His Ala His Gln Lys Ala
165 170 175
Met Ala Val Ile Asp Asp Ser Cys Phe Arg Arg Gly Ala Ser Gly Val
180 185 190
Glu Met Ala Val Val Arg His His Gly Glu Pro Arg Gln Gly Ser Ser
195 200 205
Ser Val Ala Pro Val Pro Pro Pro Ser Leu Pro Gly Thr Arg Ala Arg
210 215 220
Arg Ser Asp Gly Arg Ser Ala Arg Ala Gly Lys Thr Thr Lys Leu Asp
225 230 235 240
Tyr Ile Gly Phe Asp Glu Leu Arg Lys Tyr Phe Cys Met Pro Ile Thr
245 250 255
Arg Ala Ala Arg Glu Met Asn Val Gly Leu Thr Val Leu Lys Lys Arg
260 265 270
Cys Arg Glu Leu Gly Val Ala Arg Trp Pro His Arg Lys Met Lys Ser
275 280 285
Leu Lys Ser Leu Met Ala Asn Val Gln Glu Met Gly Asn Val Met Ser
290 295 300
Ser Val Ala Val Gln Gln Glu Leu Ala Ala Leu Glu Thr Tyr Cys Thr
305 310 315 320
Leu Met Glu Asp Asn Pro Trp Ile Glu Leu Thr Asp Arg Thr Lys Lys
325 330 335
Leu Arg Gln Ala Cys Phe Lys Glu Arg Tyr Lys Arg Arg Arg Ala Ala
340 345 350
Glu Val Asn Val Met Asp Met Asp Arg Ile Tyr Cys Phe Gly Gln His
355 360 365
His His Gln Gln Leu Leu Pro Pro Thr Thr Ser Ser Ser Asp Asp Arg
370 375 380
His Gly Gln Cys Ser Arg Ser Phe Gly Tyr
385 390
<210> 21
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of TaRKD2
<400> 21
atggagatgc agcagtactt cggcggctgc ggcgatggcg atgctgactg gttccatcag 60
ctcgccttgc tcccgccttt gccggtctct tcgtctctgc cgcctctccc catgagcgag 120
ggcagctgct tacctatggc cgccgccgcc ccaacgcttc ctcttgggga ttgctcatca 180
gctctcatga ttaggccgga agaacagatg ggctgcctgc agatgatacc tccacaggct 240
gttgccgatg atgagtacag cagctacgcc accaacaatg tcgacgtcct cccgccgttt 300
cctgcaggtc tcgatgatcc cacggcaggc ctcgacgacg cgctgctcat ggagtccttc 360
agagacatcg acctggagga gttcgccgac gccgtcggcc ccaagattaa gaccgagcct 420
ctcgacgacg ccatggtgcc ggcggatcac gatttcgcgg cgcaagtgca acaggcgcgc 480
cccgtggtga tcatgaacca gcagcagctg aatgcgccac acggcgtgcg cctgctcaat 540
gatcccgacg acgatgactc agctgtcgtc gccgggggct atgaggcggc ggccgttggg 600
tgcgctgagc agaagcgggt gaggccggcg ccacgtcgtg tgcggaagag cagcggtggg 660
tcacgccctg ccgccggtgg gaaaagcctc gatcacatag ggtttgagga gctgcgtacg 720
tatttctaca tgcctatcac caaggcggcg cgggagatga acgtcggtct caccgtgctc 780
aagaagcgct gccgtgagct cggtgtcgcc cgttggcctc accggaagat gaagagcctc 840
aggtctctca tccttaacat ccaggacatg gggaagggcg ccacgtcgcc ggcggcggtg 900
caaggggagc tggaggcgct tgagaggtat tgtgccataa tggaggagaa cccggcgatc 960
gagctgacgg agcagaccaa gaagctgagg caggcctgct ttaaggagaa ctacaagagg 1020
aggagagcgg cggcctccgt caacttgctc gagcattgct acaacgactt gggcagtcat 1080
gagcagcaga tgccattgcc acagatgggt ttctttgggt tctaa 1125
<210> 22
<211> 374
<212> PRT
<213> Triticum aestivum
<400> 22
Met Glu Met Gln Gln Tyr Phe Gly Gly Cys Gly Asp Gly Asp Ala Asp
1 5 10 15
Trp Phe His Gln Leu Ala Leu Leu Pro Pro Leu Pro Val Ser Ser Ser
20 25 30
Leu Pro Pro Leu Pro Met Ser Glu Gly Ser Cys Leu Pro Met Ala Ala
35 40 45
Ala Ala Pro Thr Leu Pro Leu Gly Asp Cys Ser Ser Ala Leu Met Ile
50 55 60
Arg Pro Glu Glu Gln Met Gly Cys Leu Gln Met Ile Pro Pro Gln Ala
65 70 75 80
Val Ala Asp Asp Glu Tyr Ser Ser Tyr Ala Thr Asn Asn Val Asp Val
85 90 95
Leu Pro Pro Phe Pro Ala Gly Leu Asp Asp Pro Thr Ala Gly Leu Asp
100 105 110
Asp Ala Leu Leu Met Glu Ser Phe Arg Asp Ile Asp Leu Glu Glu Phe
115 120 125
Ala Asp Ala Val Gly Pro Lys Ile Lys Thr Glu Pro Leu Asp Asp Ala
130 135 140
Met Val Pro Ala Asp His Asp Phe Ala Ala Gln Val Gln Gln Ala Arg
145 150 155 160
Pro Val Val Ile Met Asn Gln Gln Gln Leu Asn Ala Pro His Gly Val
165 170 175
Arg Leu Leu Asn Asp Pro Asp Asp Asp Asp Ser Ala Val Val Ala Gly
180 185 190
Gly Tyr Glu Ala Ala Ala Val Gly Cys Ala Glu Gln Lys Arg Val Arg
195 200 205
Pro Ala Pro Arg Arg Val Arg Lys Ser Ser Gly Gly Ser Arg Pro Ala
210 215 220
Ala Gly Gly Lys Ser Leu Asp His Ile Gly Phe Glu Glu Leu Arg Thr
225 230 235 240
Tyr Phe Tyr Met Pro Ile Thr Lys Ala Ala Arg Glu Met Asn Val Gly
245 250 255
Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp
260 265 270
Pro His Arg Lys Met Lys Ser Leu Arg Ser Leu Ile Leu Asn Ile Gln
275 280 285
Asp Met Gly Lys Gly Ala Thr Ser Pro Ala Ala Val Gln Gly Glu Leu
290 295 300
Glu Ala Leu Glu Arg Tyr Cys Ala Ile Met Glu Glu Asn Pro Ala Ile
305 310 315 320
Glu Leu Thr Glu Gln Thr Lys Lys Leu Arg Gln Ala Cys Phe Lys Glu
325 330 335
Asn Tyr Lys Arg Arg Arg Ala Ala Ala Ser Val Asn Leu Leu Glu His
340 345 350
Cys Tyr Asn Asp Leu Gly Ser His Glu Gln Gln Met Pro Leu Pro Gln
355 360 365
Met Gly Phe Phe Gly Phe
370
<210> 23
<211> 771
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of AtRKD2
<400> 23
atgagttcgt caaaacattc ctctgttttt aactattctg ctctgtttct atcactgttt 60
cttcaacaaa tggatcagaa ctctcttcat catctcgatt ctccaaaaat cgaaaacgag 120
tatgaaccag attcgttata cgacatgtta gataagttgc ctccgcttga ttctctccta 180
gatatggaag atttgaaacc aaatgcaggg ttgcactttc agttccatta caatagcttt 240
gaagatttct tcgaaaacat tgaagtggat aacacaattc catctgatat tcacttgttg 300
acacaagagc cctacttctc aagtgactcc tcttcctctt caccattggc tatccaaaac 360
gacggtctca tttccaacgt gaaagttgaa aaggtaacag ttaagaagaa gaggaacctt 420
aagaaaaaga ggcaagacaa attggagatg tctgagatca aacaattttt cgataggccg 480
atcatgaaag cggctaaaga actgaacgtg ggactcactg tgttgaagaa gcgatgcagg 540
gaattaggaa tttaccggtg gcctcaccgg aagctcaaga gtctaaactc tcttataaag 600
aatctcaaga atgttggaat ggaagaggaa gtgaagaact tggaggaaca taggtttctt 660
attgaacaag aacctgatgc agaactcagt gatggaacca agaagctaag gcaagcttgt 720
ttcaaagcca attataagag aagaaaatca cttggtgatg attattattg a 771
<210> 24
<211> 256
<212> PRT
<213> Arabidopsis thaliana
<400> 24
Met Ser Ser Ser Lys His Ser Ser Val Phe Asn Tyr Ser Ala Leu Phe
1 5 10 15
Leu Ser Leu Phe Leu Gln Gln Met Asp Gln Asn Ser Leu His His Leu
20 25 30
Asp Ser Pro Lys Ile Glu Asn Glu Tyr Glu Pro Asp Ser Leu Tyr Asp
35 40 45
Met Leu Asp Lys Leu Pro Pro Leu Asp Ser Leu Leu Asp Met Glu Asp
50 55 60
Leu Lys Pro Asn Ala Gly Leu His Phe Gln Phe His Tyr Asn Ser Phe
65 70 75 80
Glu Asp Phe Phe Glu Asn Ile Glu Val Asp Asn Thr Ile Pro Ser Asp
85 90 95
Ile His Leu Leu Thr Gln Glu Pro Tyr Phe Ser Ser Asp Ser Ser Ser
100 105 110
Ser Ser Pro Leu Ala Ile Gln Asn Asp Gly Leu Ile Ser Asn Val Lys
115 120 125
Val Glu Lys Val Thr Val Lys Lys Lys Arg Asn Leu Lys Lys Lys Arg
130 135 140
Gln Asp Lys Leu Glu Met Ser Glu Ile Lys Gln Phe Phe Asp Arg Pro
145 150 155 160
Ile Met Lys Ala Ala Lys Glu Leu Asn Val Gly Leu Thr Val Leu Lys
165 170 175
Lys Arg Cys Arg Glu Leu Gly Ile Tyr Arg Trp Pro His Arg Lys Leu
180 185 190
Lys Ser Leu Asn Ser Leu Ile Lys Asn Leu Lys Asn Val Gly Met Glu
195 200 205
Glu Glu Val Lys Asn Leu Glu Glu His Arg Phe Leu Ile Glu Gln Glu
210 215 220
Pro Asp Ala Glu Leu Ser Asp Gly Thr Lys Lys Leu Arg Gln Ala Cys
225 230 235 240
Phe Lys Ala Asn Tyr Lys Arg Arg Lys Ser Leu Gly Asp Asp Tyr Tyr
245 250 255
<210> 25
<211> 936
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of ZmRKD2
<400> 25
atgacgggcc tcgacgaggc gctcatgctg ccgttcaccg acatcgatct tgaggccttc 60
gacaacgccg aagagcaaaa gcctcctgtc gaccaaatgg ttatgatgcc gccgacggtt 120
gaacaccccg ccgccgccgg gacgcgagcc ccaatcatca ttgatggtac ggcgaccgtt 180
ggccaaaatg taggtggtgg tgtcgtccac gctcatcaga aggcggccat gacgaccata 240
gaggactcca gctgcttccg acgaggagcc agctgtgtcg acgacgacat ggccgtcgtc 300
attcaccatg tcgagcgtcg tcgtcaagca ggctctaccg ccgtggcgct attgccgccg 360
ccgcagccgt cactgccgcg gccgcgtgca agggcgagcg gcggcgcggg cgagcggtca 420
gctccggcgg ccgccgggaa gacgaggatg gaccacatcg gcttcgacga gctgcgcaag 480
tacttctaca tgcccatcac cagggcggcc agggagatga acgtggggct caccgtgctc 540
aagaagcgct gccgcgagct cggcgtggcg cggtggcctc accggaagat gaagagcctc 600
aagtccctca tggccaacgt acaggaaatg gggaacggca tgtcgccggt ggctgtgcag 660
catgagcttg cggcgctgga gacgtactgc gcgctcatgg aggagaaccc atggatcgag 720
ctcacggacc ggacgaagag gctgcggcag gcctgcttca aggagagcta caagcggagg 780
aaggcggccg caggcaacgc tatcgagacg gatcacattg tctacagctt tggacagcat 840
cgtcgttaca agcagcagct gctgcctccg ccaactgcgg gtagtaccag tgctgacgac 900
cgccatggcc agagcagccg tttcttttgc tactga 936
<210> 26
<211> 311
<212> PRT
<213> Zea mays
<400> 26
Met Thr Gly Leu Asp Glu Ala Leu Met Leu Pro Phe Thr Asp Ile Asp
1 5 10 15
Leu Glu Ala Phe Asp Asn Ala Glu Glu Gln Lys Pro Pro Val Asp Gln
20 25 30
Met Val Met Met Pro Pro Thr Val Glu His Pro Ala Ala Ala Gly Thr
35 40 45
Arg Ala Pro Ile Ile Ile Asp Gly Thr Ala Thr Val Gly Gln Asn Val
50 55 60
Gly Gly Gly Val Val His Ala His Gln Lys Ala Ala Met Thr Thr Ile
65 70 75 80
Glu Asp Ser Ser Cys Phe Arg Arg Gly Ala Ser Cys Val Asp Asp Asp
85 90 95
Met Ala Val Val Ile His His Val Glu Arg Arg Arg Gln Ala Gly Ser
100 105 110
Thr Ala Val Ala Leu Leu Pro Pro Pro Gln Pro Ser Leu Pro Arg Pro
115 120 125
Arg Ala Arg Ala Ser Gly Gly Ala Gly Glu Arg Ser Ala Pro Ala Ala
130 135 140
Ala Gly Lys Thr Arg Met Asp His Ile Gly Phe Asp Glu Leu Arg Lys
145 150 155 160
Tyr Phe Tyr Met Pro Ile Thr Arg Ala Ala Arg Glu Met Asn Val Gly
165 170 175
Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp
180 185 190
Pro His Arg Lys Met Lys Ser Leu Lys Ser Leu Met Ala Asn Val Gln
195 200 205
Glu Met Gly Asn Gly Met Ser Pro Val Ala Val Gln His Glu Leu Ala
210 215 220
Ala Leu Glu Thr Tyr Cys Ala Leu Met Glu Glu Asn Pro Trp Ile Glu
225 230 235 240
Leu Thr Asp Arg Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Glu Ser
245 250 255
Tyr Lys Arg Arg Lys Ala Ala Ala Gly Asn Ala Ile Glu Thr Asp His
260 265 270
Ile Val Tyr Ser Phe Gly Gln His Arg Arg Tyr Lys Gln Gln Leu Leu
275 280 285
Pro Pro Pro Thr Ala Gly Ser Thr Ser Ala Asp Asp Arg His Gly Gln
290 295 300
Ser Ser Arg Phe Phe Cys Tyr
305 310
<210> 27
<211> 6552
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1_ZmPLT7
<400> 27
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300
ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120
acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180
ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320
ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380
gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440
ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500
gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560
ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620
ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680
taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740
ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800
gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860
tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920
gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980
gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040
gttttctaat ccctgttact tcgatgctgc agtttggatc catggacatg gacatgagct 5100
cagcttatcc ccaccattgg ctctccttct ccctctccaa caactaccac catggcctac 5160
tcgaggcctt ctctaactcc tccggtactc ctcttggaga cgagccgggc gcagtggagg 5220
agtccccgag gacggtggag gacttcctcg gcggcgtcgg tggcgccggc gccccgccgc 5280
agccggcggc tgctgcagat caggatcacc agcttgtgtg cggcgagctg ggcagcatca 5340
cagccaggtt cttgcgccac tacccggcgg cgccagctgg gacgacggtg gagaaccccg 5400
gcgcggtgac cgtggcggcc atgtcgtcga cggacgtggc gggggcggag tccgaccagg 5460
cgaggcggcc cgccgagacg ttcggccagc gcacatccat ctaccgtggc gtcaccaggc 5520
accggtggac agggagatat gaggcgcact tgtgggacaa cagctgccgc cgggagggcc 5580
aaagccgcaa aggacgccaa gtctacctag gaggctatga caaggaggag aaggcggcta 5640
gagcttacga cctcgccgcg ctcaagtact gggggcctac aaccacgacc aacttcccgg 5700
tgtccaacta cgagaaggag ctggaggaga tgaagtccat gacgcggcag gagttcatcg 5760
cgtcgttgcg caggaagagc agcggcttct cacgaggcgc ctccatctac agaggagtca 5820
caaggcatca tcagcacggc cggtggcagg cgaggatcgg cagggtggcc ggaaacaagg 5880
acctgtactt gggcactttc agtactcagg aagaggcggc ggaggcgtac gacatcgctg 5940
cgatcaagtt ccgcgggctc aacgccgtca ccaacttcga catgagccgc tacgacgtgg 6000
agagcatcct cagcagcgac ctccccgtcg ggggcggagc caccgggcgc gccgccaagt 6060
tcccgttgga ctcgctgcag ccggggagcg ctgctgcgat gatgctcgcc ggggctgctg 6120
ccgcttcgca ggccaccatg ccgccgtccg agaaggacta ctggtctctg ctcgccctgc 6180
actaccagca gcagcaggag caggagcggc agttcccggc ttctgcttac gaggcttacg 6240
gctccggcgg cgtgaacgtg gacttcacga tgggcaccag tagcggcaac aacaacaaca 6300
acaccggcag cggcgtcatg tggggcgcca ccactggtgc agtagtagtg ggacagcaag 6360
acagcagcgg caagcagggc aacggctatg ccagcaacat tccttatgct gctgctgctg 6420
ctatggtttc tggatctgct ggctacgagg gctccaccgg cgacaatgga acctgggtta 6480
ctacgactat taccagcagc aacaccggca cggctcccca ctactacaac tatctcttcg 6540
ggatggagta ga 6552
<210> 28
<211> 5611
<212> DNA
<213> Artificial Sequence
<220>
<223> pAMK-ZmWUS2-tDT-nosT
<400> 28
aggccttgaa gacaaatcca ctagtcctgc aggggatccc ttcaccgcca ttgcaaaaat 60
tgtcaataaa tatttagagt gggtggcatc agaaaaacat ctctagtgga ctctcttcct 120
atcatagcta ctcgggctgt agatagaacg agggcacaag agttgggtgg cgtaggttta 180
ctcgtgacct caactctttt ggctgtgtct tacgtctaag atgggtttgg catgtgagaa 240
acataggtct aagcaattca tgttagggct gttgcattgt tgttgcatca accaaatgtc 300
cagatagcag ttcatgctac atctagttga aaaccctcat cattaggcgg aacatgtgtt 360
cttttttagc atagtcaaag tcagattgcg gcactcgctc atccacggaa agaattttcc 420
ctgtgcaggc atctcgatca aaagacgcaa attaattttt gaatagcgat ataacaatat 480
ctaattaacg tttcttgttt tctgcgaaat gtctttcatc ataaaatgag tcatctcgat 540
gagcccaagt gacatagccc aacaccccac cccaccaata aaagtgaaga aaacatgttg 600
ggaaaactat accaagtaaa atacgagttg ttctaaagaa aaagtaaagt acgagttaga 660
tcgcaccctg tcctggagtg tggcttgatg atccaactcc tagcattgta tccctgtttt 720
tggatgatgt aactattatt tacaatgaat aaagaggtgt tttactagta aaaaaatctt 780
gaggggagga gaaaataatg gaggtctttt ttcaaaccga tggactatta tttttagtga 840
aagagaataa tattattgga aaaattattc tatccactta ttttatattg gcagaataca 900
aagaatggtg gggtccacgc ggaacttgcg gcccccgaaa cctatcgagg gcgcggtacc 960
caagcaagga acggaggaaa cttgcggggc ccgaaaccta gtgataaaag gcatatcatc 1020
cacacgatga agatctgacg gaccatatct cccaccacgg aaagccatca gacgaggatc 1080
agacggccag gaaggaaccc tagcgcccgc cggtgccaat ataaagcgcc actctctctc 1140
gtcttaagcc ccagcctctc cattcccctc tccctctcgc cgccgccgtc tccttctcct 1200
actcccttcg aggtgtgttg ttcatccgtc ccgaatccat ccatcccctc ttcagatgtg 1260
ttgttcatgg ctctaatagc tctagatctg cttgtttgtg ttgtttagct ctagatctac 1320
tcgcgcgcgc ttctctctcg atctcctgta gaacaatttt ggttggtttt ttgtgcatat 1380
ccatggtaat tttgtctgca atatggagga ggctttctaa gctcctacgt agcatcgatc 1440
tttagaattc cctcggtttc tgtttatttc ttcgcgaggg ctctctgtta tctgtaggag 1500
tagctgtaag cgcggttcgt tacggattaa tcgtcatgct tagttgaacc tatcggtcga 1560
aggatttgtg tgggttgtcg tgtagaattg acaccatcta cttactgtac tgatatgccg 1620
atctgtagga tactcttcat tacttttgtt tactgctagt tgtggtgtag atttagcatt 1680
ctcaaaccca tgctgtagcg tttctaatat tgttacatag atctaccggt gcctgttaat 1740
tgtattcgat cgggcgtttc tacatctgtc cgcccaccta gttttatatg tggtaatcaa 1800
aattgcgttg acttcgtgat gctgtctgtg tactgttttt aatcgctctt acttagatga 1860
tcaacatggt gatggttacg atttactgtt ttctaatccc tgttacttcg atgctgcagt 1920
ttattaatgg cggccaatgc gggcggcggt ggagcgggag gaggcagcgg cagcggcagc 1980
gtggctgcgc cggcggtgtg ccgccccagc ggctcgcggt ggacgccgac gccggagcag 2040
atcaggatgc tgaaggagct ctactacggc tgcggcatcc ggtcgcccag ctcggagcag 2100
atccagcgca tcaccgccat gctgcggcag cacggcaaga tcgagggcaa gaacgtcttc 2160
tactggttcc agaaccacaa ggcccgcgag cgccagaagc gccgcctcac cagcctcgac 2220
gtcaacgtgc ccgccgccgg cgcggccgac gccaccacca gccaactcgg cgtcctctcg 2280
ctgtcgtcgc cgccgccttc aggcgcggcg cctccctcgc ccaccctcgg cttctacgcc 2340
gccggcaatg gcggcggatc ggctgtgctg ctggacacga gttccgactg gggcagcagc 2400
ggcgctgcca tggccaccga gacatgcttc ctccaggact acatgggcgt gacggacacg 2460
ggcagctcgt cgcagtggcc acgcttctcg tcgtcggaca cgataatggc ggcggccgcg 2520
gcgcgggcgg cgacgacgcg ggcgcccgag acgctccctc tcttcccgac ctgcggcgac 2580
gacggcggca gcggtagcag cagctacttg ccgttctggg gtgccgcgtc cacaactgcc 2640
ggcgccactt cttccgttgc gatccagcag caacaccagc tgcaggagca gtacagcttt 2700
tacagcaaca gcaacagcac ccagctggcc ggcaccggca accaagacgt atcggcaaca 2760
gcagcagcag ccgccgccct ggagctgagc ctcagctcat ggtgctcccc ttaccctgct 2820
gcagggagta tgtgaattgc aaagacaagc gaatcatcag cacaaaaggt aaacaggaac 2880
acactgcaaa gggtagtaca aaactcataa ccatgtatgc cttacattcg atgttccata 2940
aaaaaattaa gtcttaatag catcacggtt tcaacgaaag taataatact tcatgaccag 3000
gcaaacattg ccatcataga ttacttgttc acgcgacaac tgcaaggatg tcaacaagac 3060
gagatatttt aagcttccac gaggtaacca acaagcaagc acagcaccag acagatagaa 3120
gatccaatgc attggtcctg caggccccgg gctatctttg tcttccggcc gccatggcca 3180
gatcgtaccc aattcgccct atagtgagtc gtattacaat tcactggccg tcgttttaca 3240
acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 3300
tttcgccagc tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct 3360
tcctcgctca ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag 3420
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 3480
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 3540
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 3600
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 3660
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 3720
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 3780
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 3840
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 3900
gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 3960
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4020
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 4080
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 4140
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 4200
aaagtatata tgagtaaact tggtctgaca gttattagaa aaattcatcc agcagacgat 4260
aaaacgcaat acgctggcta tccggtgccg caatgccata cagcaccaga aaacgatccg 4320
cccattcgcc gcccagttct tccgcaatat cacgggtggc cagcgcaata tcctgataac 4380
gatccgccac gcccagacgg ccgcaatcaa taaagccgct aaaacggcca ttttccacca 4440
taatgttcgg caggcacgca tcaccatggg tcaccaccag atcttcgcca tccggcatgc 4500
tcgctttcag acgcgcaaac agctctgccg gtgccaggcc ctgatgttct tcatccagat 4560
catcctgatc caccaggccc gcttccatac gggtacgcgc acgttcaata cgatgtttcg 4620
cctgatgatc aaacggacag gtcgccgggt ccagggtatg cagacgacgc atggcatccg 4680
ccataatgct cactttttct gccggcgcca gatggctaga cagcagatcc tgacccggca 4740
cttcgcccag cagcagccaa tcacggcccg cttcggtcac cacatccagc accgccgcac 4800
acggaacacc ggtggtggcc agccagctca gacgcgccgc ttcatcctgc agctcgttca 4860
gcgcaccgct cagatcggtt ttcacaaaca gcaccggacg accctgcgcg ctcagacgaa 4920
acaccgccgc atcagagcag ccaatggtct gctgcgccca atcatagcca aacagacgtt 4980
ccacccacgc tgccgggcta cccgcatgca ggccatcctg ttcaatcata ctcttccttt 5040
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 5100
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccaccta 5160
aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt 5220
ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat 5280
agggttgagt ggccgctaca gggcgctccc attcgccatt caggctgcgc aactgttggg 5340
aagggcgttt cggtgcgggc ctcttcgcta ttacgccagc tggcacgaca ggtttcccga 5400
ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc 5460
ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca 5520
atttcacaca ggaaacagct atgaccatga ttacgccaag ctcgaaatta accctcacta 5580
aagggaacaa aagctggact agaggccctt a 5611
<210> 29
<211> 4610
<212> DNA
<213> Artificial Sequence
<220>
<223> construct of pAMK-ZmWus2-tDT-nosT
<400> 29
aggccttgaa gacaaatcca ctagtggatc ccgagatttc catcgcacaa gacacgaaaa 60
aatcccgatc aatttaacga acattgtttt gcattataga ttatattgtt tacagaatga 120
agttaactaa aaccttaacc ttttgcagat aaatctctaa atagtgccgt actgtataca 180
ctcgagattt ccaccgcaca agacatgaga aaattccggt cgatttgaca aagactgggt 240
gttattaatt agaggaagca gatccagcca catgttgtct cacatctgat cccccacgta 300
tagtcgtata cgtttggccc aaacctagct cgatccatgt atgaaacacg tctcgtctcg 360
ccttctacct cctttttcta tcacaggaga ttaaagtgag agagagaggg cgctcaatga 420
actgcggcat tgaacaatgg agctgcaaga gcaatgatgc actagctagt gtaatgcagt 480
gcatgcatgg tagattggta gcttgccttt gcagtttgca ccaggcacca gcagcagcta 540
gaagacgaca gacgacaggg gtttggctgc taggttgcgg aagggcagtt accagttgcc 600
acaaggggag cctggccctc tgcatcctcc tcatgatagc tctgtctctc tctctcacag 660
acacacacac agagactctt ccaaattccg aagcggccaa tgcaatgcaa gagccagccc 720
ccggccgtgt gtcaacttca cttgtctctc tccaaaagat atcgtatcac ccatggccat 780
gacccccctc ccccagcccc aacctatatc acctagcgca gctacgctct cttctcccgc 840
tctcgctctc tgcatgctag ctaccttcta gctatctagc ctctaggtcc aatgcactcc 900
ctccttataa acaaggaacc ctccttcgcc tctcttgcca tagaccggac accggagagg 960
tcactgcaca ggagcgctca ggaaggccgc tgcgctgaga tagaggcatt atctcaacac 1020
aacatataca aaacaaacga atctcaagca atcaagcatt ctacttctat tgcagcaatt 1080
taaatcattt cttttaaagc aaaagcaatt ttctgaaaat tttcaccatt tacgaacgat 1140
agggcgcgat cccgccacca tggtgagcaa gggcgaggag gtcatcaaag agttcatgcg 1200
cttcaaggtg cgcatggagg gctccatgaa cggccacgag ttcgagatcg agggcgaggg 1260
cgagggccgc ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc 1320
cctgcccttc gcctgggaca tcctgtcccc ccagttcatg tacggctcca aggcgtacgt 1380
gaagcacccc gccgacatcc ccgattacaa gaagctgtcc ttccccgagg gcttcaagtg 1440
ggagcgcgtg atgaacttcg aggacggcgg tctggtgacc gtgacccagg actcctccct 1500
gcaggacggc acgctgatct acaaggtgaa gatgcgcggc accaacttcc cccccgacgg 1560
ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc accgagcgcc tgtacccccg 1620
cgacggcgtg ctgaagggcg agatccacca ggccctgaag ctgaaggacg gcggccacta 1680
cctggtggag ttcaagacca tctacatggc caagaagccc gtgcaactgc ccggctacta 1740
ctacgtggac accaagctgg acatcacctc ccacaacgag gactacacca tcgtggaaca 1800
gtacgagcgc tccgagggcc gccaccacct gttcctgtac ggcatggacg agctgtacaa 1860
gtaaatgccg aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa 1920
tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt 1980
aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc 2040
gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt 2100
atcgcgcgcg gtgtcatcta tgttactaga tcgctcgaag atcccccggg ctatctttgt 2160
cttccggccg ccatggccag atcgtaccca attcgcccta tagtgagtcg tattacaatt 2220
cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc 2280
gccttgcagc acatccccct ttcgccagct gcattaacat ggtcatagct gtttccttgc 2340
gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa 2400
gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2460
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2520
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2580
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2640
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2700
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2760
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2820
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2880
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2940
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3000
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3060
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3120
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 3180
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttattagaaa 3240
aattcatcca gcagacgata aaacgcaata cgctggctat ccggtgccgc aatgccatac 3300
agcaccagaa aacgatccgc ccattcgccg cccagttctt ccgcaatatc acgggtggcc 3360
agcgcaatat cctgataacg atccgccacg cccagacggc cgcaatcaat aaagccgcta 3420
aaacggccat tttccaccat aatgttcggc aggcacgcat caccatgggt caccaccaga 3480
tcttcgccat ccggcatgct cgctttcaga cgcgcaaaca gctctgccgg tgccaggccc 3540
tgatgttctt catccagatc atcctgatcc accaggcccg cttccatacg ggtacgcgca 3600
cgttcaatac gatgtttcgc ctgatgatca aacggacagg tcgccgggtc cagggtatgc 3660
agacgacgca tggcatccgc cataatgctc actttttctg ccggcgccag atggctagac 3720
agcagatcct gacccggcac ttcgcccagc agcagccaat cacggcccgc ttcggtcacc 3780
acatccagca ccgccgcaca cggaacaccg gtggtggcca gccagctcag acgcgccgct 3840
tcatcctgca gctcgttcag cgcaccgctc agatcggttt tcacaaacag caccggacga 3900
ccctgcgcgc tcagacgaaa caccgccgca tcagagcagc caatggtctg ctgcgcccaa 3960
tcatagccaa acagacgttc cacccacgct gccgggctac ccgcatgcag gccatcctgt 4020
tcaatcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 4080
agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 4140
ccccgaaaag tgccacctaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt 4200
tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat 4260
caaaagaata gaccgagata gggttgagtg gccgctacag ggcgctccca ttcgccattc 4320
aggctgcgca actgttggga agggcgtttc ggtgcgggcc tcttcgctat tacgccagct 4380
ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 4440
agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 4500
gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc 4560
tcgaaattaa ccctcactaa agggaacaaa agctggacta gaggccctta 4610
<210> 30
<211> 5100
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1
<400> 30
gatcccccgg gctgcaggaa ttcaagctta cgcgtgtcga ctcgaatttc cccgatcgtt 60
caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 120
tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 180
tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 240
aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 300
tagatcgctc gacgcggccg ccatggccag atcgtaccca attcgcccta tagtgagtcg 360
tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 420
caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 480
cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 540
ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 600
aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 660
ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 720
gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 780
tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 840
cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 900
gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 960
ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 1020
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 1080
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 1140
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 1200
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 1260
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 1320
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 1380
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 1440
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 1500
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 1560
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 1620
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 1680
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 1740
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 1800
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 1860
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 1920
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 1980
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 2040
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 2100
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 2160
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 2220
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 2280
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 2340
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 2400
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 2460
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 2520
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 2580
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 2640
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 2700
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 2760
ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 2820
ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 2880
ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 2940
tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 3000
cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 3060
tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 3120
caggaaacag ctatgaccat gattacgcca agctcgaaat taaccctcac taaagggaac 3180
aaaagctgga ctagaggccc ttaaggcctt actagacttc accgccattg caaaaattgt 3240
caataaatat ttagagtggg tggcatcaga aaaacatctc tagtggactc tcttcctatc 3300
atagctactc gggctgtaga tagaacgagg gcacaagagt tgggtggcgt aggtttactc 3360
gtgacctcaa ctcttttggc tgtgtcttac gtctaagatg ggtttggcat gtgagaaaca 3420
taggtctaag caattcatgt tagggctgtt gcattgttgt tgcatcaacc aaatgtccag 3480
atagcagttc atgctacatc tagttgaaaa ccctcatcat taggcggaac atgtgttctt 3540
ttttagcata gtcaaagtca gattgcggca ctcgctcatc cacggaaaga attttccctg 3600
tgcaggcatc tcgatcaaaa gacgcaaatt aatttttgaa tagcgatata acaatatcta 3660
attaacgttt cttgttttct gcgaaatgtc tttcatcata aaatgagtca tctcgatgag 3720
cccaagtgac atagcccaac accccacccc accaataaaa gtgaagaaaa catgttggga 3780
aaactatacc aagtaaaata cgagttgttc taaagaaaaa gtaaagtacg agttagatcg 3840
caccctgtcc tggagtgtgg cttgatgatc caactcctag cattgtatcc ctgtttttgg 3900
atgatgtaac tattatttac aatgaataaa gaggtgtttt actagtaaaa aaatcttgag 3960
gggaggagaa aataatggag gtcttttttc aaaccgatgg actattattt ttagtgaaag 4020
agaataatat tattggaaaa attattctat ccacttattt tatattggca gaatacaaag 4080
aatggtgggg tccacgcgga acttgcggcc cccgaaacct atcgagggcg cggtacccaa 4140
gcaaggaacg gaggaaactt gcggggcccg aaacctagtg ataaaaggca tatcatccac 4200
acgatgaaga tctgacggac catatctccc accacggaaa gccatcagac gaggatcaga 4260
cggccaggaa ggaaccctag cgcccgccgg tgccaatata aagcgccact ctctctcgtc 4320
ttaagcccca gcctctccat tcccctctcc ctctcgccgc cgccgtctcc ttctcctact 4380
cccttcgagg tgtgttgttc atccgtcccg aatccatcca tcccctcttc agatgtgttg 4440
ttcatggctc taatagctct agatctgctt gtttgtgttg tttagctcta gatctactcg 4500
cgcgcgcttc tctctcgatc tcctgtagaa caattttggt tggttttttg tgcatatcca 4560
tggtaatttt gtctgcaata tggaggaggc tttctaagct cctacgtagc atcgatcttt 4620
agaattccct cggtttctgt ttatttcttc gcgagggctc tctgttatct gtaggagtag 4680
ctgtaagcgc ggttcgttac ggattaatcg tcatgcttag ttgaacctat cggtcgaagg 4740
atttgtgtgg gttgtcgtgt agaattgaca ccatctactt actgtactga tatgccgatc 4800
tgtaggatac tcttcattac ttttgtttac tgctagttgt ggtgtagatt tagcattctc 4860
aaacccatgc tgtagcgttt ctaatattgt tacatagatc taccggtgcc tgttaattgt 4920
attcgatcgg gcgtttctac atctgtccgc ccacctagtt ttatatgtgg taatcaaaat 4980
tgcgttgact tcgtgatgct gtctgtgtac tgtttttaat cgctcttact tagatgatca 5040
acatggtgat ggttacgatt tactgttttc taatccctgt tacttcgatg ctgcagtttg 5100
<210> 31
<211> 1883
<212> DNA
<213> Brachypodium distachyon
<400> 31
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag ttt 1883
<210> 32
<211> 6567
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1_ZmPLT5
<400> 32
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300
ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120
acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180
ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320
ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380
gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440
ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500
gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560
ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620
ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680
taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740
ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800
gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860
tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920
gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980
gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040
gttttctaat ccctgttact tcgatgctgc agtttggatc catggacacc tcgcaccact 5100
atcatccatg gctcaacttc tccctcgccc accactgtga cctcgaggag gaggagaggg 5160
gcgcggccgc cgagctggcc gcgatagccg gcgccgcgcc gccgccgaag ctggaggact 5220
tcctcggcgg aggcgtcgcc accggtggtc cggaggcggt ggcgcccgcg gagatgtacg 5280
actcggacct caagttcata gccgccgccg ggttccttgg cggctcggcg gcggcggcgg 5340
cgacgtcgcc gctgtcctcc ctcgaccagg ccggttccaa gctggccttg cctgcggcgg 5400
cggctgctcc ggcgccggag cagaggaagg ccgtcgactc ctttgggcag cgcacgtcca 5460
tctaccgcgg cgtcacacgg caccggtgga ctggcaggta cgaggcacat ctgtgggaca 5520
acagctgccg acgcgaaggg cagagccgca agggccgcca agtatatttg ggtggctatg 5580
ataaggagga gaaggctgcc agggcgtatg atcttgcagc tttgaagtac tggggttcta 5640
gcaccaccac caactttccg gttgctgagt atgagaagga ggtcgaggag atgaagaaca 5700
tgacgcgaca agagtttgtt gcttcccttc gaaggaagag cagtggattc tctcggggtg 5760
cttccatcta cagaggtgta accagacatc accagcatgg acggtggcag gcgaggatcg 5820
gaagggtggc cggtaacaag gacctctacc ttgggacgtt cagcaccgag gaggaagctg 5880
cagaggccta cgacatagcg gccatcaagt tcagaggcct gaacgccgtc acaaacttcg 5940
agatcagccg gtacaacgtg gagaccataa tgagcagcaa ccttccagtc gcgagcatgt 6000
cgtcgtcgtc ggcggcggcg gcgggtggcc ggagcagcaa ggcgctggag tcccctccgt 6060
ccggctcgct tgacggcggc ggcggcatgc cagtcgtcga aggcagcacg gcaccgccgc 6120
tgttcattcc ggtgaagtac gaccagcagc agcaggagta cctgtcgatg ctcgcgttgc 6180
agcaccacca ccagcagcaa caagcaggga acctgttgca ggggccgcta gtagggttcg 6240
gcggcctcta ctcctccggg gtgaacctgg atttcgccaa ctcccacggc acggcggctc 6300
cgtcgtcgat ggcccaccac tgctacgcca atggcaccgc gtccgcctcg catgagcacc 6360
agcaccagca ccagatgcag cagggcggcg agaacgagac gcagccgcag ccgcagcaga 6420
gctccagcag ctgctcctcc ctgccattcg ccaccccggt cgctttcaat gggtcctatg 6480
aaagctccat cacggcggca ggcccctttg gatactccta cccaaatgtg gcagcctttc 6540
agacgccgat ctatggaatg gaatgaa 6567
<210> 33
<211> 5865
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1_KWS_RBP1
<400> 33
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300
ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120
acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180
ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320
ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380
gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440
ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500
gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560
ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620
ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680
taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740
ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800
gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860
tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920
gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980
gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040
gttttctaat ccctgttact tcgatgctgc agtttggatc catggagtcg ggctccggga 5100
cggctgctgg ctctggctat gtttacagac agccaggatc aacgcggtgg aacccgacag 5160
ctgaacaact gtccttgctt agagaaatct actaccgcaa cggattgcgg accccgaccg 5220
cggacgaaat cagacaaatc agctcaaagc tctcaaggta cggaaaaata gagggcaaaa 5280
acgtttacaa ctggttccag aatagacgcg caagagaaaa gcgcaagcaa cggctctcta 5340
caatcggctg tgatccagca ctgatcgaga tggggaatgt cgcttcactg gaattcggta 5400
ctgagagcgc cctggaatcg ctgtcgtcag gaccatcctc agaactccgc gaagcgccaa 5460
cgagaaaatt ttacgaaaaa aagacggttg gagagaactc aactataata aacccagtgg 5520
aacaaaactg taccctttcc tgcggaacgt cccaagagtt ccagtatgcg gtcgattctc 5580
ggcgcgtcat gaaagctatg gaggaaaagc aggcgacgga cgatgaaccc gacggaaata 5640
aatggactga gtcaaacaga cacgtcaaga ttctccagct tttcccgctc cacaataacg 5700
aggatcagac attgataaag agcgacaaag aaatctattg tttgggctcg tgcgagaaga 5760
aaatggattt gtcaccgctg ggtcattcag gctctcagcg cgcttcggcc cttgacttgt 5820
gcctttcatt gggcaacgaa tcttgtgggc tgcatgataa ttgaa 5865
<210> 34
<211> 6186
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1_TaRKD4
<400> 34
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300
ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120
acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180
ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320
ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380
gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440
ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500
gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560
ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620
ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680
taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740
ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800
gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860
tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920
gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980
gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040
gttttctaat ccctgttact tcgatgctgc agtttggatc catggagatg caacaacaat 5100
acttcggggg ggacggcgat gcggactggt tccatcaact cgcattgctt cccccacttc 5160
caatctcatc gtctctcccc ccactcccga tgtcagaggg ctcatgtctc cctatggcag 5220
cagcagctgc agctgcactc ccccttggcg attgctcgag cgccctcatg atacgccctg 5280
aggaacagat gtcttgcctt ccaatgaacc cctctccagc ggtcgtcgac gatgtctact 5340
cttcctacgc accgaacaat gtcgacgtgt tgccgccatt cccggcagga cttgacgacg 5400
ctctgttgat ggagtctttt tctgacatcg acctcgagga gtttgctgac gcatttggcc 5460
acaagatcaa gacagaaccc ctcgacgatg ccatggtccc cgcggaccac gacttcgcgg 5520
ctcaagccca acaggcctgc cctgtggtca tcatgaatca gcaacaactc aacgcaccca 5580
gagacgtgcg cctgctcatt gacccggatg atgatgacag caccgtggtg gccgggggct 5640
atgaagctgc agcggtgggg tgcgccgagc agaaacaggt caggccagca ccacgtaggg 5700
tgagaaagag ctcaggcggc gcaagaccag ccgcgggagg aaagtccctc gatcacatcg 5760
gattcgagga actcaggacc tatttctata tgccaatcac caaggcagcg agggaaatga 5820
acgtggggct gacagtcctg aagaagagat gccgggaact gggggtggcg cgctggccac 5880
acagaaagat gaagtctctg agaagcctga tcctcaacat tcaggagatg gggaagggcg 5940
caacatctcc cgcagccgtg cagggggaac ttgaagcgct tgagaggtat tgcgccatta 6000
tggaggagaa cccggctata gagctcaccg agcaaacgaa gaagctcagg caggcttgtt 6060
tcaaagagaa ttataagcgg cgtagagccg ccgcttctgt taatcttctc gatcactgct 6120
ataacgatct ggcatctcat gagcagcaaa tgcctctccc acaaatggga ttctttggat 6180
tttaga 6186
<210> 35
<211> 10427
<212> DNA
<213> Artificial Sequence
<220>
<223> pGEP359
<400> 35
actgctgcag tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg 60
tctaagttat aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta 120
tctatcttta tacatatatt taaactttac tctacgaata atataatcta tagtactaca 180
ataatatcag tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa 240
ttgagtattt tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct 300
ttttttttgc aaatagcttc acctatataa tacttcatcc attttattag tacatccatt 360
tagggtttag ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta 420
ttttagcctc taaattaaga aaactaaaac tctattttag tttttttatt taataattta 480
gatataaaat agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta 540
aaaaaactaa ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg 600
tcgatcgacg agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt cgggccaagc 660
gaagcagacg gcacggcatc tctgtcgctg cctctggacc cctctcgaga gttccgctcc 720
accgttggac ttgctccgct gtcggcatcc agaaattgcg tggcggagcg gcagacgtga 780
gccggcacgg caggcggcct cctcctcctc tcacggcacc ggcagctacg ggggattcct 840
ttcccaccgc tccttcgctt tcccttcctc gcccgccgta ataaatagac accccctcca 900
caccctcttt ccccaacctc gtgttgttcg gagcgcacac acacacaacc agatctcccc 960
caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc 1020
tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag ttctacttct 1080
gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg 1140
gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg 1200
aatcctggga tggctctagc cgttccgcag acgggatcga tctaggatag gtatacatgt 1260
tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1320
taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1380
atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1440
tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1500
tacttctgca ggtcgaagct tgaagcaaac atggcatcta gcatggcacc aaagaaaaaa 1560
aggaaagttt ccaaacttga aaaatttaca aactgctact ccctttccaa gacgcttagg 1620
tttaaagcga tccccgttgg caagacccaa gagaatatcg ataacaaaag acttctggtc 1680
gaagatgaaa aaagggccga agactacaag ggggtcaaga agttgctcga tcgctattat 1740
ctttccttta tcaacgatgt gcttcattca atcaaactga agaacttgaa taactacatt 1800
agccttttca gaaagaaaac gaggactgaa aaggagaaca aggaacttga gaatcttgaa 1860
ataaaccttc gcaaagaaat tgcaaaagcc ttcaagggga acgaaggata taaatctctt 1920
ttcaaaaaag acattataga aacaattttg cctgagtttc ttgacgacaa ggatgaaatt 1980
gcgctcgtca atagctttaa cggatttaca actgccttca cagggttctt cgacaatagg 2040
gagaatatgt ttagcgagga ggcaaaaagc acatccatcg cattcagatg catcaatgaa 2100
aatcttaccc ggtacatatc gaatatggac atatttgaaa aagtggatgc aatattcgat 2160
aagcacgaag tccaggagat aaaggaaaag atactgaata gcgactatga tgtcgaagat 2220
tttttcgaag gtgagttctt caactttgtc ctgactcaag aaggcattga tgtctataat 2280
gcaataattg gaggttttgt gactgagtct ggcgagaaga taaagggctt gaacgagtat 2340
atcaatctct acaaccagaa gactaagcaa aagttgccta aatttaaacc gctttacaag 2400
caagttttga gcgaccggga aagcctttcc ttttacggtg aaggatacac gagcgatgaa 2460
gaagtcctcg aagtcttccg caacacactc aacaagaact cagaaatctt ttcctcaatt 2520
aaaaaattgg agaagctttt caagaacttc gatgaatact cttcggcggg gatttttgtg 2580
aagaacggcc cggcaatttc cacaatatct aaagacattt tcggagaatg gaacgtgata 2640
agagacaagt ggaatgcgga gtatgatgac atacacctga agaagaaggc agttgtgact 2700
gaaaaatacg aagatgacag gagaaaaagc tttaaaaaga tcgggtcctt ttcactggaa 2760
cagctgcagg agtatgccga cgccgatctt tcggttgtcg aaaagctcaa agaaataatt 2820
atccagaagg tcgatgaaat ctacaaggtg tacggctcaa gcgagaagct ctttgatgct 2880
gacttcgtgt tggagaagtc tcttaaaaaa aacgacgcag tcgtcgcgat aatgaaagat 2940
ttgctggatt cagtgaaatc cttcgagaat tatatcaaag ccttcttcgg cgaggggaag 3000
gagacaaaca gggatgagtc cttctatgga gacttcgttc tggcttacga catccttctt 3060
aaggtcgacc acatctatga cgcaattcgg aactatgtga cgcagaagcc gtattcgaaa 3120
gataagttca agctctattt ccaaaaccct caatttatgg gtgggtggga taaagacaaa 3180
gagaccgatt accgggcaac aattttgcgg tacgggtcta aatattacct cgctataatg 3240
gataagaaat acgctaaatg tctccagaaa attgacaaag atgacgtcaa cggcaattat 3300
gaaaaaatca attataaact ccttcctggc ccaaataaaa tgctcccgaa ggtgtttttt 3360
tccaaaaagt ggatggccta ttataatcca tcagaggata ttcagaaaat ctataaaaat 3420
gggaccttta agaagggtga catgtttaac ctgaacgatt gccacaagct tatagatttt 3480
ttcaaagact ctattagccg ctatcccaaa tggtctaatg cttatgattt caacttctct 3540
gaaactgaaa agtacaaaga tattgcagga ttctaccgcg aagttgaaga acaaggttat 3600
aaggtttcct ttgagtctgc gtccaagaaa gaggtcgata agttggtcga agaagggaaa 3660
ttgtatatgt ttcaaattta caataaagac ttttccgaca agtcccatgg tacacctaat 3720
ctgcatacca tgtacttcaa actgctgttc gatgagaata atcacggtca gattcgcctg 3780
agcggagggg cggaactctt catgaggaga gcatcgttga aaaaagagga gctcgtcgtg 3840
catccggcta acagccccat tgctaacaag aatccggata atccaaagaa gactactacc 3900
ctctcctatg acgtctataa ggataagaga ttctctgagg accagtacga gttgcacatc 3960
cctattgcga taaataaatg ccctaagaac atctttaaaa tcaatactga ggtcagagtc 4020
ctgcttaagc acgacgacaa cccgtatgtg atcgggattg ataggggtga aaggaacttg 4080
ctttatattg tggttgtcga tggaaaaggt aatatagtgg aacaatactc tctgaatgaa 4140
attatcaaca acttcaatgg cattaggatc aagaccgact atcattctct gttggacaag 4200
aaagagaaag agcgcttcga ggcacggcaa aactggacgt ctattgagaa catcaaggag 4260
cttaaggctg gttacatttc tcaggttgtg cacaaaattt gcgaactggt cgagaaatat 4320
gatgccgtta tcgcacttga agatctcaac agcggattta agaattctcg ggtgaaagtc 4380
gaaaaacagg tgtatcaaaa attcgaaaag atgctgatcg acaagctcaa ttatatggtt 4440
gataaaaaga gcaacccatg cgccacgggg ggtgcgctta agggctatca gattacgaac 4500
aaatttgaat ccttcaagtc aatgtcgacg caaaatgggt ttatattcta tataccggcg 4560
tggcttacat ctaaaataga tcctagcact gggttcgtga acctgctgaa aaccaagtac 4620
acttcaatcg cagattctaa aaaatttata agcagcttcg acagaatcat gtatgtgccc 4680
gaggaagacc tcttcgagtt tgcccttgat tacaaaaatt tctcaagaac ggatgcagac 4740
tacataaaga agtggaagct gtactcttat gggaaccgga ttcggatatt cagaaatccg 4800
aaaaaaaaca atgtctttga ttgggaggaa gtttgtctta cctctgctta caaagagctg 4860
ttcaataaat atggcattaa ttaccagcaa ggtgatatcc gggcgctcct ttgcgaacag 4920
tctgacaaag ctttctattc ttcatttatg gcgctcatgt cattgatgct gcagatgagg 4980
aatagcatta cggggaggac tgatgttgac tttctgatct cgcccgtgaa aaattctgat 5040
ggaatcttct acgattccag gaattatgag gcccaggaaa atgctatcct tcccaagaac 5100
gcagacgcaa atggcgcgta caatatagct cgcaaggttt tgtgggctat aggccaattc 5160
aagaaagccg aagacgaaaa gctggacaaa gttaagattg ctatatctaa caaagagtgg 5220
cttgagtatg cgcaaacatc tgttaaacac aaacgccccg cggctacaaa gaaggctggc 5280
caggcaaaga agaagaagtg agtcgaccga tcgttcaaac atttggcaat aaagtttctt 5340
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 5400
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 5460
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 5520
ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgatcccggg atatcgcggc 5580
cgcgtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 5640
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 5700
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 5760
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 5820
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 5880
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 5940
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 6000
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 6060
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 6120
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 6180
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 6240
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 6300
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 6360
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 6420
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 6480
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 6540
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 6600
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 6660
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 6720
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 6780
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 6840
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 6900
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 6960
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 7020
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 7080
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 7140
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 7200
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 7260
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 7320
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 7380
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 7440
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg tagcggcacg 7500
tctaattcgg gggatctgga ttttagtact ggattttggt tttaggaatt agaaatttta 7560
ttgatagaag tattttacaa atacaaatac atactaaggg tttcttatat gctcaacaca 7620
tgagcgaaac cctataggaa ccctaattcc cttatctggg aactactcac acattattat 7680
ggagaaactc gagcttgtcg atcgacatga tcagggagct ctcaggtacc tctagacttg 7740
tacagctcgt ccatgccgta caggaacagg tggtggcggc cctcggagcg ctcgtactgt 7800
tccacgatgg tgtagtcctc gttgtgggag gtgatgtcca gcttggtgtc cacgtagtag 7860
tagccgggca gttgcacggg cttcttggcc atgtagatgg tcttgaactc caccaggtag 7920
tggccgccgt ccttcagctt cagggcctgg tggatctcgc ccttcagcac gccgtcgcgg 7980
gggtacaggc gctcggtgga ggcctcccag cccatggtct tcttctgcat tacggggccg 8040
tcggggggga agttggtgcc gcgcatcttc accttgtaga tcagcgtgcc gtcctgcagg 8100
gaggagtcct gggtcacggt caccagaccg ccgtcctcga agttcatcac gcgctcccac 8160
ttgaagccct cggggaagga cagcttcttg taatcgggga tgtcggcggg gtgcttcacg 8220
tacgccttgg agccgtacat gaactggggg gacaggatgt cccaggcgaa gggcaggggg 8280
ccgcccttgg tcaccttcag cttggcggtc tgggtgccct cgtaggggcg gccctcgccc 8340
tcgccctcga tctcgaactc gtggccgttc atggagccct ccatgcgcac cttgaagcgc 8400
atgaactctt tgatgacctc ctcgcccttg ctcaccatgg tggcgggatc gcgccctatc 8460
gttcgtaaat ggtgaaaatt ttcagaaaat tgcttttgct ttaaaagaaa tgatttaaat 8520
tgctgcaata gaagtagaat gcttgattgc ttgagattcg tttgttttgt atatgttgtg 8580
ttgagaggat cctctagagt cgacctgcag aagtaacacc aaacaacagg gtgagcatcg 8640
acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 8700
atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 8760
acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 8820
gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 8880
atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 8940
aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 9000
cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaagcatct ctgtatatgc 9060
atcagtaaaa cccgcatcaa catgtatacc tatcctagat cgatatttcc atccatcatc 9120
ttcaattcgt aactatgaat atgtatggca cacacataca gatccaaaat taataaatcc 9180
accaggtagt ttgaaacaga attctactcc gatctagaac gaccgcccaa ccagaccaca 9240
tcatcacaac caagacaaaa aaaagcatga aaagatgacc cgacaaacaa gtgcacggca 9300
tatattgaaa taaaggaaaa gggcaaacca aaccctatgc aacgaaacaa aaaaaatcat 9360
gaaatcgatc ccgtctgcgg aacggctaga gccatcccag gattccccaa agagaaacac 9420
tggcaagtta gcaatcagaa cgtgtctgac gtacaggtcg catccgtgta cgaacgctag 9480
cagcacggat ctaacacaaa cacggatcta acacaaacat gaacagaagt agaactaccg 9540
ggccctaacc atggaccgga acgccgatct agagaaggta gagagggggg gggaggacga 9600
gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatcc actagttcta 9660
gagcggccgc caccgcggtg gaattctcga ggtcctctcc aaatgaaatg aacttcctta 9720
tatagaggaa gggtcttgcg aaggatagtg ggattgtgcg tcatccctta cgtcagtgga 9780
gatatcacat caatccactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 9840
gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 9900
agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 9960
tttgatcaag tgaccgatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 10020
ttgttgaaaa gtctcaatag ccctttggtc ttctgagact gtatctttga tattcttgga 10080
gtagacgaga gtgtcgtgct ccaccatgtt atcacatcaa ttcacttgct ttgaagacgt 10140
ggttggaacg tcttcttttt ccacgatgct cctcgtgggt gggggtccat ctttgggacc 10200
actgtcggca gaggcatctt gaacgatagc ctttccttta tcgcaatgat ggcatttgta 10260
ggtgccacct tccttttcta ctgtcctttt gatcaagtga cagatagctg ggcaatggaa 10320
tccgaggagg tttcccgata ttaccctttg ttgaaaagtc tcaatagccc tttggtcttc 10380
tgagacttgc aggcaagcaa gcatgaatgc ctgggcgcgc cgatatc 10427
<210> 36
<211> 3841
<212> DNA
<213> Artificial Sequence
<220>
<223> pGEP324
<400> 36
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatctc gtcacgattc ccctctcctg 1620
gggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 37
<211> 3663
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::ZmPLT5_expression_cassette
<400> 37
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttggatcca tggacacctc gcaccactat catccatggc 1920
tcaacttctc cctcgcccac cactgtgacc tcgaggagga ggagaggggc gcggccgccg 1980
agctggccgc gatagccggc gccgcgccgc cgccgaagct ggaggacttc ctcggcggag 2040
gcgtcgccac cggtggtccg gaggcggtgg cgcccgcgga gatgtacgac tcggacctca 2100
agttcatagc cgccgccggg ttccttggcg gctcggcggc ggcggcggcg acgtcgccgc 2160
tgtcctccct cgaccaggcc ggttccaagc tggccttgcc tgcggcggcg gctgctccgg 2220
cgccggagca gaggaaggcc gtcgactcct ttgggcagcg cacgtccatc taccgcggcg 2280
tcacacggca ccggtggact ggcaggtacg aggcacatct gtgggacaac agctgccgac 2340
gcgaagggca gagccgcaag ggccgccaag tatatttggg tggctatgat aaggaggaga 2400
aggctgccag ggcgtatgat cttgcagctt tgaagtactg gggttctagc accaccacca 2460
actttccggt tgctgagtat gagaaggagg tcgaggagat gaagaacatg acgcgacaag 2520
agtttgttgc ttcccttcga aggaagagca gtggattctc tcggggtgct tccatctaca 2580
gaggtgtaac cagacatcac cagcatggac ggtggcaggc gaggatcgga agggtggccg 2640
gtaacaagga cctctacctt gggacgttca gcaccgagga ggaagctgca gaggcctacg 2700
acatagcggc catcaagttc agaggcctga acgccgtcac aaacttcgag atcagccggt 2760
acaacgtgga gaccataatg agcagcaacc ttccagtcgc gagcatgtcg tcgtcgtcgg 2820
cggcggcggc gggtggccgg agcagcaagg cgctggagtc ccctccgtcc ggctcgcttg 2880
acggcggcgg cggcatgcca gtcgtcgaag gcagcacggc accgccgctg ttcattccgg 2940
tgaagtacga ccagcagcag caggagtacc tgtcgatgct cgcgttgcag caccaccacc 3000
agcagcaaca agcagggaac ctgttgcagg ggccgctagt agggttcggc ggcctctact 3060
cctccggggt gaacctggat ttcgccaact cccacggcac ggcggctccg tcgtcgatgg 3120
cccaccactg ctacgccaat ggcaccgcgt ccgcctcgca tgagcaccag caccagcacc 3180
agatgcagca gggcggcgag aacgagacgc agccgcagcc gcagcagagc tccagcagct 3240
gctcctccct gccattcgcc accccggtcg ctttcaatgg gtcctatgaa agctccatca 3300
cggcggcagg cccctttgga tactcctacc caaatgtggc agcctttcag acgccgatct 3360
atggaatgga atgaaagctt acgcgtgtcg actcgaattt ccccgatcgt tcaaacattt 3420
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 3480
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3540
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3600
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgct 3660
cga 3663
<210> 38
<211> 3648
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::ZmPLT7_expression_cassette
<400> 38
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttggatcca tggacatgga catgagctca gcttatcccc 1920
accattggct ctccttctcc ctctccaaca actaccacca tggcctactc gaggccttct 1980
ctaactcctc cggtactcct cttggagacg agccgggcgc agtggaggag tccccgagga 2040
cggtggagga cttcctcggc ggcgtcggtg gcgccggcgc cccgccgcag ccggcggctg 2100
ctgcagatca ggatcaccag cttgtgtgcg gcgagctggg cagcatcaca gccaggttct 2160
tgcgccacta cccggcggcg ccagctggga cgacggtgga gaaccccggc gcggtgaccg 2220
tggcggccat gtcgtcgacg gacgtggcgg gggcggagtc cgaccaggcg aggcggcccg 2280
ccgagacgtt cggccagcgc acatccatct accgtggcgt caccaggcac cggtggacag 2340
ggagatatga ggcgcacttg tgggacaaca gctgccgccg ggagggccaa agccgcaaag 2400
gacgccaagt ctacctagga ggctatgaca aggaggagaa ggcggctaga gcttacgacc 2460
tcgccgcgct caagtactgg gggcctacaa ccacgaccaa cttcccggtg tccaactacg 2520
agaaggagct ggaggagatg aagtccatga cgcggcagga gttcatcgcg tcgttgcgca 2580
ggaagagcag cggcttctca cgaggcgcct ccatctacag aggagtcaca aggcatcatc 2640
agcacggccg gtggcaggcg aggatcggca gggtggccgg aaacaaggac ctgtacttgg 2700
gcactttcag tactcaggaa gaggcggcgg aggcgtacga catcgctgcg atcaagttcc 2760
gcgggctcaa cgccgtcacc aacttcgaca tgagccgcta cgacgtggag agcatcctca 2820
gcagcgacct ccccgtcggg ggcggagcca ccgggcgcgc cgccaagttc ccgttggact 2880
cgctgcagcc ggggagcgct gctgcgatga tgctcgccgg ggctgctgcc gcttcgcagg 2940
ccaccatgcc gccgtccgag aaggactact ggtctctgct cgccctgcac taccagcagc 3000
agcaggagca ggagcggcag ttcccggctt ctgcttacga ggcttacggc tccggcggcg 3060
tgaacgtgga cttcacgatg ggcaccagta gcggcaacaa caacaacaac accggcagcg 3120
gcgtcatgtg gggcgccacc actggtgcag tagtagtggg acagcaagac agcagcggca 3180
agcagggcaa cggctatgcc agcaacattc cttatgctgc tgctgctgct atggtttctg 3240
gatctgctgg ctacgagggc tccaccggcg acaatggaac ctgggttact acgactatta 3300
ccagcagcaa caccggcacg gctccccact actacaacta tctcttcggg atggagtaga 3360
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 3420
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 3480
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 3540
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 3600
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcga 3648
<210> 39
<211> 2961
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::KWS_RBP1_expression_cassette
<400> 39
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttggatcca tggagtcggg ctccgggacg gctgctggct 1920
ctggctatgt ttacagacag ccaggatcaa cgcggtggaa cccgacagct gaacaactgt 1980
ccttgcttag agaaatctac taccgcaacg gattgcggac cccgaccgcg gacgaaatca 2040
gacaaatcag ctcaaagctc tcaaggtacg gaaaaataga gggcaaaaac gtttacaact 2100
ggttccagaa tagacgcgca agagaaaagc gcaagcaacg gctctctaca atcggctgtg 2160
atccagcact gatcgagatg gggaatgtcg cttcactgga attcggtact gagagcgccc 2220
tggaatcgct gtcgtcagga ccatcctcag aactccgcga agcgccaacg agaaaatttt 2280
acgaaaaaaa gacggttgga gagaactcaa ctataataaa cccagtggaa caaaactgta 2340
ccctttcctg cggaacgtcc caagagttcc agtatgcggt cgattctcgg cgcgtcatga 2400
aagctatgga ggaaaagcag gcgacggacg atgaacccga cggaaataaa tggactgagt 2460
caaacagaca cgtcaagatt ctccagcttt tcccgctcca caataacgag gatcagacat 2520
tgataaagag cgacaaagaa atctattgtt tgggctcgtg cgagaagaaa atggatttgt 2580
caccgctggg tcattcaggc tctcagcgcg cttcggccct tgacttgtgc ctttcattgg 2640
gcaacgaatc ttgtgggctg catgataatt gaaagcttac gcgtgtcgac tcgaatttcc 2700
ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 2760
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 2820
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 2880
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 2940
ctatgttact agatcgctcg a 2961
<210> 40
<211> 3282
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::TaRKD4_expression_cassette
<400> 40
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttggatcca tggagatgca acaacaatac ttcggggggg 1920
acggcgatgc ggactggttc catcaactcg cattgcttcc cccacttcca atctcatcgt 1980
ctctcccccc actcccgatg tcagagggct catgtctccc tatggcagca gcagctgcag 2040
ctgcactccc ccttggcgat tgctcgagcg ccctcatgat acgccctgag gaacagatgt 2100
cttgccttcc aatgaacccc tctccagcgg tcgtcgacga tgtctactct tcctacgcac 2160
cgaacaatgt cgacgtgttg ccgccattcc cggcaggact tgacgacgct ctgttgatgg 2220
agtctttttc tgacatcgac ctcgaggagt ttgctgacgc atttggccac aagatcaaga 2280
cagaacccct cgacgatgcc atggtccccg cggaccacga cttcgcggct caagcccaac 2340
aggcctgccc tgtggtcatc atgaatcagc aacaactcaa cgcacccaga gacgtgcgcc 2400
tgctcattga cccggatgat gatgacagca ccgtggtggc cgggggctat gaagctgcag 2460
cggtggggtg cgccgagcag aaacaggtca ggccagcacc acgtagggtg agaaagagct 2520
caggcggcgc aagaccagcc gcgggaggaa agtccctcga tcacatcgga ttcgaggaac 2580
tcaggaccta tttctatatg ccaatcacca aggcagcgag ggaaatgaac gtggggctga 2640
cagtcctgaa gaagagatgc cgggaactgg gggtggcgcg ctggccacac agaaagatga 2700
agtctctgag aagcctgatc ctcaacattc aggagatggg gaagggcgca acatctcccg 2760
cagccgtgca gggggaactt gaagcgcttg agaggtattg cgccattatg gaggagaacc 2820
cggctataga gctcaccgag caaacgaaga agctcaggca ggcttgtttc aaagagaatt 2880
ataagcggcg tagagccgcc gcttctgtta atcttctcga tcactgctat aacgatctgg 2940
catctcatga gcagcaaatg cctctcccac aaatgggatt ctttggattt tagaagctta 3000
cgcgtgtcga ctcgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat 3060
tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 3120
atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 3180
tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 3240
aattatcgcg cgcggtgtca tctatgttac tagatcgctc ga 3282
<210> 41
<211> 3080
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::ZmWUS2_expression_cassette
<400> 41
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttattaatg gcggccaatg cgggcggcgg tggagcggga 1920
ggaggcagcg gcagcggcag cgtggctgcg ccggcggtgt gccgccccag cggctcgcgg 1980
tggacgccga cgccggagca gatcaggatg ctgaaggagc tctactacgg ctgcggcatc 2040
cggtcgccca gctcggagca gatccagcgc atcaccgcca tgctgcggca gcacggcaag 2100
atcgagggca agaacgtctt ctactggttc cagaaccaca aggcccgcga gcgccagaag 2160
cgccgcctca ccagcctcga cgtcaacgtg cccgccgccg gcgcggccga cgccaccacc 2220
agccaactcg gcgtcctctc gctgtcgtcg ccgccgcctt caggcgcggc gcctccctcg 2280
cccaccctcg gcttctacgc cgccggcaat ggcggcggat cggctgtgct gctggacacg 2340
agttccgact ggggcagcag cggcgctgcc atggccaccg agacatgctt cctccaggac 2400
tacatgggcg tgacggacac gggcagctcg tcgcagtggc cacgcttctc gtcgtcggac 2460
acgataatgg cggcggccgc ggcgcgggcg gcgacgacgc gggcgcccga gacgctccct 2520
ctcttcccga cctgcggcga cgacggcggc agcggtagca gcagctactt gccgttctgg 2580
ggtgccgcgt ccacaactgc cggcgccact tcttccgttg cgatccagca gcaacaccag 2640
ctgcaggagc agtacagctt ttacagcaac agcaacagca cccagctggc cggcaccggc 2700
aaccaagacg tatcggcaac agcagcagca gccgccgccc tggagctgag cctcagctca 2760
tggtgctccc cttaccctgc tgcagggagt atgtgaattg caaagacaag cgaatcatca 2820
gcacaaaagg taaacaggaa cacactgcaa agggtagtac aaaactcata accatgtatg 2880
ccttacattc gatgttccat aaaaaaatta agtcttaata gcatcacggt ttcaacgaaa 2940
gtaataatac ttcatgacca ggcaaacatt gccatcatag attacttgtt cacgcgacaa 3000
ctgcaaggat gtcaacaaga cgagatattt taagcttcca cgaggtaacc aacaagcaag 3060
cacagcacca gacagataga 3080
<210> 42
<211> 5561
<212> DNA
<213> Artificial Sequence
<220>
<223> pUbi::LpCpf1_expression_cassette
<400> 42
ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600
tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag 660
cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg 720
ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg 780
gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc 840
caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc 900
ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa 960
tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc 1020
taccttctct agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc 1080
atgtttgtgt tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg 1140
cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc 1200
ctgggatggc tctagccgtt ccgcagacgg gatcgatcta ggataggtat acatgttgat 1260
gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac 1320
cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat 1380
acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg 1440
ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact 1500
tctgcaggtc gaagcttgaa gcaaacatgg catctagcat ggcaccaaag aaaaaaagga 1560
aagtttccaa acttgaaaaa tttacaaact gctactccct ttccaagacg cttaggttta 1620
aagcgatccc cgttggcaag acccaagaga atatcgataa caaaagactt ctggtcgaag 1680
atgaaaaaag ggccgaagac tacaaggggg tcaagaagtt gctcgatcgc tattatcttt 1740
cctttatcaa cgatgtgctt cattcaatca aactgaagaa cttgaataac tacattagcc 1800
ttttcagaaa gaaaacgagg actgaaaagg agaacaagga acttgagaat cttgaaataa 1860
accttcgcaa agaaattgca aaagccttca aggggaacga aggatataaa tctcttttca 1920
aaaaagacat tatagaaaca attttgcctg agtttcttga cgacaaggat gaaattgcgc 1980
tcgtcaatag ctttaacgga tttacaactg ccttcacagg gttcttcgac aatagggaga 2040
atatgtttag cgaggaggca aaaagcacat ccatcgcatt cagatgcatc aatgaaaatc 2100
ttacccggta catatcgaat atggacatat ttgaaaaagt ggatgcaata ttcgataagc 2160
acgaagtcca ggagataaag gaaaagatac tgaatagcga ctatgatgtc gaagattttt 2220
tcgaaggtga gttcttcaac tttgtcctga ctcaagaagg cattgatgtc tataatgcaa 2280
taattggagg ttttgtgact gagtctggcg agaagataaa gggcttgaac gagtatatca 2340
atctctacaa ccagaagact aagcaaaagt tgcctaaatt taaaccgctt tacaagcaag 2400
ttttgagcga ccgggaaagc ctttcctttt acggtgaagg atacacgagc gatgaagaag 2460
tcctcgaagt cttccgcaac acactcaaca agaactcaga aatcttttcc tcaattaaaa 2520
aattggagaa gcttttcaag aacttcgatg aatactcttc ggcggggatt tttgtgaaga 2580
acggcccggc aatttccaca atatctaaag acattttcgg agaatggaac gtgataagag 2640
acaagtggaa tgcggagtat gatgacatac acctgaagaa gaaggcagtt gtgactgaaa 2700
aatacgaaga tgacaggaga aaaagcttta aaaagatcgg gtccttttca ctggaacagc 2760
tgcaggagta tgccgacgcc gatctttcgg ttgtcgaaaa gctcaaagaa ataattatcc 2820
agaaggtcga tgaaatctac aaggtgtacg gctcaagcga gaagctcttt gatgctgact 2880
tcgtgttgga gaagtctctt aaaaaaaacg acgcagtcgt cgcgataatg aaagatttgc 2940
tggattcagt gaaatccttc gagaattata tcaaagcctt cttcggcgag gggaaggaga 3000
caaacaggga tgagtccttc tatggagact tcgttctggc ttacgacatc cttcttaagg 3060
tcgaccacat ctatgacgca attcggaact atgtgacgca gaagccgtat tcgaaagata 3120
agttcaagct ctatttccaa aaccctcaat ttatgggtgg gtgggataaa gacaaagaga 3180
ccgattaccg ggcaacaatt ttgcggtacg ggtctaaata ttacctcgct ataatggata 3240
agaaatacgc taaatgtctc cagaaaattg acaaagatga cgtcaacggc aattatgaaa 3300
aaatcaatta taaactcctt cctggcccaa ataaaatgct cccgaaggtg tttttttcca 3360
aaaagtggat ggcctattat aatccatcag aggatattca gaaaatctat aaaaatggga 3420
cctttaagaa gggtgacatg tttaacctga acgattgcca caagcttata gattttttca 3480
aagactctat tagccgctat cccaaatggt ctaatgctta tgatttcaac ttctctgaaa 3540
ctgaaaagta caaagatatt gcaggattct accgcgaagt tgaagaacaa ggttataagg 3600
tttcctttga gtctgcgtcc aagaaagagg tcgataagtt ggtcgaagaa gggaaattgt 3660
atatgtttca aatttacaat aaagactttt ccgacaagtc ccatggtaca cctaatctgc 3720
ataccatgta cttcaaactg ctgttcgatg agaataatca cggtcagatt cgcctgagcg 3780
gaggggcgga actcttcatg aggagagcat cgttgaaaaa agaggagctc gtcgtgcatc 3840
cggctaacag ccccattgct aacaagaatc cggataatcc aaagaagact actaccctct 3900
cctatgacgt ctataaggat aagagattct ctgaggacca gtacgagttg cacatcccta 3960
ttgcgataaa taaatgccct aagaacatct ttaaaatcaa tactgaggtc agagtcctgc 4020
ttaagcacga cgacaacccg tatgtgatcg ggattgatag gggtgaaagg aacttgcttt 4080
atattgtggt tgtcgatgga aaaggtaata tagtggaaca atactctctg aatgaaatta 4140
tcaacaactt caatggcatt aggatcaaga ccgactatca ttctctgttg gacaagaaag 4200
agaaagagcg cttcgaggca cggcaaaact ggacgtctat tgagaacatc aaggagctta 4260
aggctggtta catttctcag gttgtgcaca aaatttgcga actggtcgag aaatatgatg 4320
ccgttatcgc acttgaagat ctcaacagcg gatttaagaa ttctcgggtg aaagtcgaaa 4380
aacaggtgta tcaaaaattc gaaaagatgc tgatcgacaa gctcaattat atggttgata 4440
aaaagagcaa cccatgcgcc acggggggtg cgcttaaggg ctatcagatt acgaacaaat 4500
ttgaatcctt caagtcaatg tcgacgcaaa atgggtttat attctatata ccggcgtggc 4560
ttacatctaa aatagatcct agcactgggt tcgtgaacct gctgaaaacc aagtacactt 4620
caatcgcaga ttctaaaaaa tttataagca gcttcgacag aatcatgtat gtgcccgagg 4680
aagacctctt cgagtttgcc cttgattaca aaaatttctc aagaacggat gcagactaca 4740
taaagaagtg gaagctgtac tcttatggga accggattcg gatattcaga aatccgaaaa 4800
aaaacaatgt ctttgattgg gaggaagttt gtcttacctc tgcttacaaa gagctgttca 4860
ataaatatgg cattaattac cagcaaggtg atatccgggc gctcctttgc gaacagtctg 4920
acaaagcttt ctattcttca tttatggcgc tcatgtcatt gatgctgcag atgaggaata 4980
gcattacggg gaggactgat gttgactttc tgatctcgcc cgtgaaaaat tctgatggaa 5040
tcttctacga ttccaggaat tatgaggccc aggaaaatgc tatccttccc aagaacgcag 5100
acgcaaatgg cgcgtacaat atagctcgca aggttttgtg ggctataggc caattcaaga 5160
aagccgaaga cgaaaagctg gacaaagtta agattgctat atctaacaaa gagtggcttg 5220
agtatgcgca aacatctgtt aaacacaaac gccccgcggc tacaaagaag gctggccagg 5280
caaagaagaa gaagtgagtc gaccgatcgt tcaaacattt ggcaataaag tttcttaaga 5340
ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag 5400
catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga 5460
gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat 5520
aaattatcgc gcgcggtgtc atctatgtta ctagatcgat c 5561
<210> 43
<211> 1945
<212> DNA
<213> Artificial Sequence
<220>
<223> pUbi::crRNA5_expression_cassette
<400> 43
gacgcgccct gtagcggcct gcagtgcagc gtgacccggt cgtgcccctc tctagagata 60
atgagcattg catgtctaag ttataaaaaa ttaccacata ttttttttgt cacacttgtt 120
tgaagtgcag tttatctatc tttatacata tatttaaact ttactctacg aataatataa 180
tctatagtac tacaataata tcagtgtttt agagaatcat ataaatgaac agttagacat 240
ggtctaaagg acaattgagt attttgacaa caggactcta cagttttatc tttttagtgt 300
gcatgtgttc tccttttttt ttgcaaatag cttcacctat ataatacttc atccatttta 360
ttagtacatc catttagggt ttagggttaa tggtttttat agactaattt ttttagtaca 420
tctattttat tctattttag cctctaaatt aagaaaacta aaactctatt ttagtttttt 480
tatttaataa tttagatata aaatagaata aaataaagtg actaaaaatt aaacaaatac 540
cctttaagaa attaaaaaaa ctaaggaaac atttttcttg tttcgagtag ataatgccag 600
cctgttaaac gccgtcgatc gacgagtcta acggacacca accagcgaac cagcagcgtc 660
gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc 720
gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg 780
agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg caccggcagc 840
tacgggggat tcctttccca ccgctccttc gctttccctt cctcgcccgc cgtaataaat 900
agacaccccc tccacaccct ctttccccaa cctcgtgttg ttcggagcgc acacacacac 960
aaccagatct cccccaaatc cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc 1020
tccccccccc cccctctcta ccttctctag atcggcgttc cggtccatgg ttagggcccg 1080
gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct 1140
agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta acttgccagt 1200
gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga tcgatctagg 1260
ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat 1320
ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa 1380
ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt 1440
tagccctgcc ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc 1500
ctgttgtttg gtgttacttc tgcagggatc caaattactg atgagtccgt gaggacgaaa 1560
cgagtaagct cgtctaattt ctactaagtg tagatctcgt cacgattccc ctctcctggg 1620
gccggcatgg tcccagcctc ctcgctggcg ccggctgggc aacatgcttc ggcatggcga 1680
atgggaccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 1740
gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta ataattaaca 1800
tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 1860
tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg 1920
tgtcatctat gttactagat cgatc 1945
<210> 44
<211> 3771
<212> DNA
<213> Artificial Sequence
<220>
<223> codon-optimized LbCpf1
<400> 44
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgg gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ataggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggcaaaga agaagaagtg a 3771
<210> 45
<211> 1256
<212> PRT
<213> Lachnospiraceae bacterium
<400> 45
Met Ala Ser Ser Met Ala Pro Lys Lys Lys Arg Lys Val Ser Lys Leu
1 5 10 15
Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys
20 25 30
Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu
35 40 45
Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys
50 55 60
Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser
65 70 75 80
Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys
85 90 95
Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn
100 105 110
Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys
115 120 125
Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu
130 135 140
Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr
145 150 155 160
Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu
165 170 175
Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu
180 185 190
Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile
195 200 205
Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser
210 215 220
Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val
225 230 235 240
Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe
245 250 255
Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn
260 265 270
Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu
275 280 285
Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu
290 295 300
Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu
305 310 315 320
Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu
325 330 335
Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn
340 345 350
Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn
355 360 365
Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys
370 375 380
Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser
385 390 395 400
Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala
405 410 415
Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln
420 425 430
Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe
435 440 445
Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val
450 455 460
Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn
465 470 475 480
Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu
485 490 495
Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val
500 505 510
Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr
515 520 525
Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly
530 535 540
Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg
545 550 555 560
Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys
565 570 575
Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys
580 585 590
Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val
595 600 605
Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile
610 615 620
Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn
625 630 635 640
Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser
645 650 655
Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr
660 665 670
Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln
675 680 685
Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys
690 695 700
Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp
705 710 715 720
Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe
725 730 735
Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly
740 745 750
Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu
755 760 765
Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn
770 775 780
Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg
785 790 795 800
Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys
805 810 815
Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu
820 825 830
Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg
835 840 845
Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu
850 855 860
Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile
865 870 875 880
Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe
885 890 895
Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys
900 905 910
Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu
915 920 925
Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys
930 935 940
Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys
945 950 955 960
Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro
965 970 975
Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe
980 985 990
Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile
995 1000 1005
Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val
1010 1015 1020
Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys
1025 1030 1035
Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp
1040 1045 1050
Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1055 1060 1065
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg
1070 1075 1080
Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp
1085 1090 1095
Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys
1100 1105 1110
Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys
1115 1120 1125
Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met
1130 1135 1140
Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp
1145 1150 1155
Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe
1160 1165 1170
Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro
1175 1180 1185
Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val
1190 1195 1200
Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu
1205 1210 1215
Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr
1220 1225 1230
Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala Ala Thr Lys Lys
1235 1240 1245
Ala Gly Gln Ala Lys Lys Lys Lys
1250 1255
<210> 46
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA5_target_HMG13_referrence_A188
<400> 46
gaaccctgag agctgcttta tgaccggccc catattatta ctatctactt tgacttttcc 60
cttaatgacg acttattatt tgatttactc gtcacgattc ccctctcctg gtcgaacttt 120
tcaggtgggg aaagctgctg gcgacaggtg gaaatccctg agcgagtcgg taagctccat 180
cttctgtact aaagtagtag t 201
<210> 47
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> crRNA5_target_sequence
<400> 47
taatttctac taagtgtaga t 21
<210> 48
<211> 2107
<212> DNA
<213> Artificial Sequence
<220>
<223> pZmWUS2::tDT-nosT_expression_cassette
<400> 48
cgagatttcc atcgcacaag acacgaaaaa atcccgatca atttaacgaa cattgttttg 60
cattatagat tatattgttt acagaatgaa gttaactaaa accttaacct tttgcagata 120
aatctctaaa tagtgccgta ctgtatacac tcgagatttc caccgcacaa gacatgagaa 180
aattccggtc gatttgacaa agactgggtg ttattaatta gaggaagcag atccagccac 240
atgttgtctc acatctgatc ccccacgtat agtcgtatac gtttggccca aacctagctc 300
gatccatgta tgaaacacgt ctcgtctcgc cttctacctc ctttttctat cacaggagat 360
taaagtgaga gagagagggc gctcaatgaa ctgcggcatt gaacaatgga gctgcaagag 420
caatgatgca ctagctagtg taatgcagtg catgcatggt agattggtag cttgcctttg 480
cagtttgcac caggcaccag cagcagctag aagacgacag acgacagggg tttggctgct 540
aggttgcgga agggcagtta ccagttgcca caaggggagc ctggccctct gcatcctcct 600
catgatagct ctgtctctct ctctcacaga cacacacaca gagactcttc caaattccga 660
agcggccaat gcaatgcaag agccagcccc cggccgtgtg tcaacttcac ttgtctctct 720
ccaaaagata tcgtatcacc catggccatg acccccctcc cccagcccca acctatatca 780
cctagcgcag ctacgctctc ttctcccgct ctcgctctct gcatgctagc taccttctag 840
ctatctagcc tctaggtcca atgcactccc tccttataaa caaggaaccc tccttcgcct 900
ctcttgccat agaccggaca ccggagaggt cactgcacag gagcgctcag gaaggccgct 960
gcgctgagat agaggcatta tctcaacaca acatatacaa aacaaacgaa tctcaagcaa 1020
tcaagcattc tacttctatt gcagcaattt aaatcatttc ttttaaagca aaagcaattt 1080
tctgaaaatt ttcaccattt acgaacgata gggcgcgatc ccgccaccat ggtgagcaag 1140
ggcgaggagg tcatcaaaga gttcatgcgc ttcaaggtgc gcatggaggg ctccatgaac 1200
ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 1260
gccaagctga aggtgaccaa gggcggcccc ctgcccttcg cctgggacat cctgtccccc 1320
cagttcatgt acggctccaa ggcgtacgtg aagcaccccg ccgacatccc cgattacaag 1380
aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggt 1440
ctggtgaccg tgacccagga ctcctccctg caggacggca cgctgatcta caaggtgaag 1500
atgcgcggca ccaacttccc ccccgacggc cccgtaatgc agaagaagac catgggctgg 1560
gaggcctcca ccgagcgcct gtacccccgc gacggcgtgc tgaagggcga gatccaccag 1620
gccctgaagc tgaaggacgg cggccactac ctggtggagt tcaagaccat ctacatggcc 1680
aagaagcccg tgcaactgcc cggctactac tacgtggaca ccaagctgga catcacctcc 1740
cacaacgagg actacaccat cgtggaacag tacgagcgct ccgagggccg ccaccacctg 1800
ttcctgtacg gcatggacga gctgtacaag taaatgccga atttccccga tcgttcaaac 1860
atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 1920
taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 1980
atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 2040
aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 2100
cgctcga 2107
<210> 49
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA of KWS-RBP2
<400> 49
atggaatcgg gctccggcac ggcggcaggg tctggttatg tctatcggca gagcggaagc 60
acccggtgga atccaacagc agaacagttg tcgctgctca aggaacttta ttaccggaat 120
ggaattcgga caccgtcggc agatcaaatt aggcaaattt cggcccggct gtccagatac 180
ggcaaaatag aagggaaaaa cgtcttttac tggtttcaaa atcataaagc acgggaacgg 240
cagaagaaaa gactttccac ggtcggctgc gaccctgctc tcatagaaat gggtaacgtc 300
gcgagcttgg aatttgggac cgaaagcgct cttgaatctc tcagctcagg cccgtccagc 360
gagttgcgcg aggctcctac ccgcaagttt tatgagaaga aaaccgttgg tgagaacagc 420
accataatca atcctgttga gcagaactgc acactttctt gcggtacttc gcaggaattt 480
cagtatgctg ttgatagccg ccgggtgatg aaggcaatgg aagagaagca agcaacggat 540
gatgaaccgg acggaaacaa atggacggag tcgaacaggc atgtgaagac cctccctctt 600
ttccccttgc ataataatga agatcagacc ttgatcaagt cggacaagga aatttattgc 660
cttgggagct gtgaaaaaaa aatggatctg tccccattgg gacactcggg ctctcagagg 720
gcgtcggcac tggatttgtg cctgtctttg ggtaatgaat cttgtggcct ccacgacaat 780
tga 783
<210> 50
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> KWS-RBP2 protein
<400> 50
Met Glu Ser Gly Ser Gly Thr Ala Ala Gly Ser Gly Tyr Val Tyr Arg
1 5 10 15
Gln Ser Gly Ser Thr Arg Trp Asn Pro Thr Ala Glu Gln Leu Ser Leu
20 25 30
Leu Lys Glu Leu Tyr Tyr Arg Asn Gly Ile Arg Thr Pro Ser Ala Asp
35 40 45
Gln Ile Arg Gln Ile Ser Ala Arg Leu Ser Arg Tyr Gly Lys Ile Glu
50 55 60
Gly Lys Asn Val Phe Tyr Trp Phe Gln Asn His Lys Ala Arg Glu Arg
65 70 75 80
Gln Lys Lys Arg Leu Ser Thr Val Gly Cys Asp Pro Ala Leu Ile Glu
85 90 95
Met Gly Asn Val Ala Ser Leu Glu Phe Gly Thr Glu Ser Ala Leu Glu
100 105 110
Ser Leu Ser Ser Gly Pro Ser Ser Glu Leu Arg Glu Ala Pro Thr Arg
115 120 125
Lys Phe Tyr Glu Lys Lys Thr Val Gly Glu Asn Ser Thr Ile Ile Asn
130 135 140
Pro Val Glu Gln Asn Cys Thr Leu Ser Cys Gly Thr Ser Gln Glu Phe
145 150 155 160
Gln Tyr Ala Val Asp Ser Arg Arg Val Met Lys Ala Met Glu Glu Lys
165 170 175
Gln Ala Thr Asp Asp Glu Pro Asp Gly Asn Lys Trp Thr Glu Ser Asn
180 185 190
Arg His Val Lys Thr Leu Pro Leu Phe Pro Leu His Asn Asn Glu Asp
195 200 205
Gln Thr Leu Ile Lys Ser Asp Lys Glu Ile Tyr Cys Leu Gly Ser Cys
210 215 220
Glu Lys Lys Met Asp Leu Ser Pro Leu Gly His Ser Gly Ser Gln Arg
225 230 235 240
Ala Ser Ala Leu Asp Leu Cys Leu Ser Leu Gly Asn Glu Ser Cys Gly
245 250 255
Leu His Asp Asn
260
<210> 51
<211> 5865
<212> DNA
<213> Artificial Sequence
<220>
<223> pABM-BdEF1_KWS_RBP2
<400> 51
agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300
ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360
ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420
ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480
ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540
taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600
ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660
cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720
gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780
taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840
tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900
cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120
acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180
ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240
atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300
acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360
tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420
gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480
tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540
gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600
caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660
aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720
caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780
ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840
atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900
aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960
tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020
ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080
gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140
ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200
tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260
cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320
ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380
gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440
ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500
gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560
ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620
ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680
taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740
ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800
gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860
tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920
gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980
gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040
gttttctaat ccctgttact tcgatgctgc agtttggatc catggaatcg ggctccggca 5100
cggcggcagg gtctggttat gtctatcggc agagcggaag cacccggtgg aatccaacag 5160
cagaacagtt gtcgctgctc aaggaacttt attaccggaa tggaattcgg acaccgtcgg 5220
cagatcaaat taggcaaatt tcggcccggc tgtccagata cggcaaaata gaagggaaaa 5280
acgtctttta ctggtttcaa aatcataaag cacgggaacg gcagaagaaa agactttcca 5340
cggtcggctg cgaccctgct ctcatagaaa tgggtaacgt cgcgagcttg gaatttggga 5400
ccgaaagcgc tcttgaatct ctcagctcag gcccgtccag cgagttgcgc gaggctccta 5460
cccgcaagtt ttatgagaag aaaaccgttg gtgagaacag caccataatc aatcctgttg 5520
agcagaactg cacactttct tgcggtactt cgcaggaatt tcagtatgct gttgatagcc 5580
gccgggtgat gaaggcaatg gaagagaagc aagcaacgga tgatgaaccg gacggaaaca 5640
aatggacgga gtcgaacagg catgtgaaga ccctccctct tttccccttg cataataatg 5700
aagatcagac cttgatcaag tcggacaagg aaatttattg ccttgggagc tgtgaaaaaa 5760
aaatggatct gtccccattg ggacactcgg gctctcagag ggcgtcggca ctggatttgt 5820
gcctgtcttt gggtaatgaa tcttgtggcc tccacgacaa ttgaa 5865
<210> 52
<211> 2961
<212> DNA
<213> Artificial Sequence
<220>
<223> BdEF1::KWS_RBP2_expression_cassette
<400> 52
cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60
tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120
gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180
gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240
ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300
tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360
catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420
tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480
cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540
aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600
aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660
ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720
ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780
atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840
attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900
acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960
agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020
gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080
tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140
ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200
tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260
gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320
tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380
agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440
gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500
ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560
acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620
ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680
gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740
agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800
taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860
ctgttacttc gatgctgcag tttggatcca tggaatcggg ctccggcacg gcggcagggt 1920
ctggttatgt ctatcggcag agcggaagca cccggtggaa tccaacagca gaacagttgt 1980
cgctgctcaa ggaactttat taccggaatg gaattcggac accgtcggca gatcaaatta 2040
ggcaaatttc ggcccggctg tccagatacg gcaaaataga agggaaaaac gtcttttact 2100
ggtttcaaaa tcataaagca cgggaacggc agaagaaaag actttccacg gtcggctgcg 2160
accctgctct catagaaatg ggtaacgtcg cgagcttgga atttgggacc gaaagcgctc 2220
ttgaatctct cagctcaggc ccgtccagcg agttgcgcga ggctcctacc cgcaagtttt 2280
atgagaagaa aaccgttggt gagaacagca ccataatcaa tcctgttgag cagaactgca 2340
cactttcttg cggtacttcg caggaatttc agtatgctgt tgatagccgc cgggtgatga 2400
aggcaatgga agagaagcaa gcaacggatg atgaaccgga cggaaacaaa tggacggagt 2460
cgaacaggca tgtgaagacc ctccctcttt tccccttgca taataatgaa gatcagacct 2520
tgatcaagtc ggacaaggaa atttattgcc ttgggagctg tgaaaaaaaa atggatctgt 2580
ccccattggg acactcgggc tctcagaggg cgtcggcact ggatttgtgc ctgtctttgg 2640
gtaatgaatc ttgtggcctc cacgacaatt gaaagcttac gcgtgtcgac tcgaatttcc 2700
ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 2760
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 2820
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 2880
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 2940
ctatgttact agatcgctcg a 2961

Claims (40)

1.编码第一加强子多肽和第二加强子多肽的核酸,
其中所述第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和
其中所述第二加强子多肽包含SEQ ID NO:4、6或8中任一个的氨基酸序列,或与SEQ IDNO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或
编码第三加强子多肽和第二加强子多肽的核酸,
其中所述第三加强子多肽包含SEQ ID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;和
其中所述第二加强子多肽包含SEQ ID NO:4、6或8中任一项的氨基酸序列,或与SEQ IDNO:4、6或8中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列,
其中在所述第三加强子多肽翻译后,所述第一加强子多肽的表达被激活;其中所述第一加强子多肽包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
2.权利要求1的核酸,其中编码所述第一加强子多肽的核酸包含选自以下的编码序列:
(i)包含SEQ ID NO:1的核苷酸序列的核酸;
(ii)包含与SEQ ID NO:1具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(iii)在严格杂交条件下与(i)或(ii)中定义的核酸的互补链杂交的核酸;和
其中编码所述第二加强子多肽的核酸包含选自以下的编码序列:
(I)包含SEQ ID NO:3、5或7中任一个的核苷酸序列的核酸;
(II)包含与SEQ ID NO:3、5或7中的任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(III)在严格杂交条件下与(I)或(II)中定义的核酸的互补链杂交的核酸,
其中编码所述第三加强子多肽的核酸包含选自以下的编码序列:
(1)包含SEQ ID NO:15、17或19中任一个的核苷酸序列的核酸;
(2)包含与SEQ ID NO:15、17或19中任一个具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(3)在严格杂交条件下与(1)或(2)中定义的核酸的互补链杂交的核酸。
3.一种重组基因,其包含权利要求1或2的核酸。
4.权利要求3的重组基因,其中编码所述第一加强子多肽的核酸可操作地连接至天然启动子或第一异源启动子,并且编码所述第二加强子多肽的核酸可操作地连接至天然启动子或第二异源启动子;或其中编码所述第一加强子多肽的核酸和编码所述第二加强子多肽的核酸可操作地连接至一个异源启动子;或
其中编码所述第二加强子多肽的核酸可操作地连接至天然启动子或第一异源启动子,且编码所述第三加强子多肽的核酸可操作地连接至天然启动子或第二异源启动子;或其中编码所述第二加强子多肽的核酸和编码所述第三加强子多肽的核酸可操作地连接至一个异源启动子。
5.权利要求4的重组基因,其中所述异源启动子是强组成型启动子、组织特异性启动子、发育特异性启动子或诱导型启动子。
6.一种DNA构建体,优选地为载体,其包含权利要求1或2的核酸或权利要求3至5中任一项的重组基因。
7.一种植物细胞,其包含权利要求1或2的核酸,权利要求3至5中任一项的重组基因或权利要求6的DNA构建体。
8.一种植物、其一部分或种子,其包含权利要求7的细胞。
9.一种在植物细胞中遗传修饰的方法,所述方法包含
(a)将以下导入所述植物细胞
(i)选自以下的组分:
(i.a)权利要求1或2的核酸,权利要求3至5中任一项的重组基因或权利要求6的DNA构建体;或
(i.b1)编码权利要求1中定义的第一加强子多肽的核酸;包含编码所述第一加强子多肽的核酸的重组基因,其优选地与权利要求4或5中定义的启动子可操作地连接;DNA构建体,优选地为载体,其包含编码权利要求1中定义的第一加强子多肽的核酸,或权利要求1中定义的第一加强子多肽;和
(i.b2)编码权利要求1中定义的第二加强子多肽的核酸;包含编码所述第二加强子多肽的核酸的重组基因,其优选地与权利要求4或5中定义的启动子可操作地连接,或DNA构建体,优选地为载体,其包含编码权利要求1中定义的第二加强子多肽的核酸,或权利要求1中定义的第二加强子多肽;或
(i.c1)编码适合于瞬时提高权利要求1中定义的第一加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高权利要求1中定义的第一加强子多肽的表达的定点转录激活子;其中编码所述第一加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高权利要求1中定义的第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高权利要求1中定义的第二加强子多肽的表达的定点转录激活子;其中编码所述第一加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;和
(ii)感兴趣的转基因和/或基因组工程化组分;
(b)任选地,在允许所述第一加强子多肽和所述第二加强子多肽翻译的条件下,培养所述植物细胞,优选地与其中未导入(i.a)、(i.b1)和(i.b2)、(i.c1)和(i.c2)、或(i.d)的植物细胞相比所述翻译提高;和
(c)任选地,在允许在所述加强子多肽存在时通过所述感兴趣的转基因的整合或通过所述基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养所述植物细胞;或
所述方法包含
(a)将以下导入植物细胞
(ii)选自以下的组分:
(i.a)权利要求1或2的核酸,权利要求3至5中任一项的重组基因或权利要求6的DNA构建体;或
(i.b1)编码权利要求1中定义的第三加强子多肽的核酸;包含编码所述第三加强子多肽的核酸的重组基因,其优选地与权利要求4或5中定义的启动子可操作地连接,DNA构建体,优选地为载体,其包含编码权利要求1中定义的第三加强子多肽的核酸,或权利要求1中定义的第三加强子多肽;和
(i.b2)编码权利要求1中定义的第二加强子多肽的核酸;包含编码所述第二加强子多肽的核酸的重组基因,其优选地与权利要求4或5中定义的启动子可操作地连接,或DNA构建体,优选地为载体,其包含编码权利要求1中定义的第二加强子多肽的核酸,或权利要求1中定义的第二加强子多肽,或
(i.c1)编码适合于瞬时提高权利要求1中定义的第三加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高权利要求1中定义的第三加强子多肽的表达的定点转录激活子;其中编码所述第三加强子多肽的核酸是内源核酸;和
(i.c2)编码适合于瞬时提高权利要求1中定义的第二加强子多肽的表达的定点转录激活子的核酸,或适合于瞬时提高权利要求1中定义的第二加强子多肽的表达的定点转录激活子;其中编码所述第二加强子多肽的核酸是内源核酸;或
(i.d)(i.b1)和(i.c2)的组合,或(i.b2)和(i.c1)的组合;或
(iii)感兴趣的转基因和/或基因组工程化组分;
(b)任选地,在允许所述第三加强子多肽和所述第二加强子多肽翻译的条件下,培养所述植物细胞,优选地与其中未导入(i.a)、(i.b1)和(i.b2)、(i.c1)和(i.c2)、或(i.d)的植物细胞相比所述翻译提高;和
(c)任选地,在允许在所述加强子多肽存在时通过所述感兴趣的转基因的整合或通过所述基因组工程化组分的活性来遗传修饰所述植物细胞的基因组的条件下,培养所述植物细胞。
10.权利要求9的方法,其中来自(i)的组分的第一加强子多肽和第二加强子多肽或第二加强子多肽和第三加强子多肽在所述植物细胞中是瞬时存在的、是瞬时有活性的或是瞬时表达的,或其中组分(i)在所述植物细胞中是瞬时存在的、是瞬时有活性的或是瞬时表达的。
11.权利要求9或10的方法,其中在步骤(i)中,额外地将一个或多个选自PLT5多肽、KWS-RBP1多肽、RKD4多肽和RKD2多肽的多肽,和/或一个或多个选自编码PLT5多肽、KWS-RBP1多肽、RKD4多肽和RKD2多肽的核酸的核酸,和/或一个或多个适合于瞬时提高内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达的定点转录激活子,和/或编码这种定点转录激活子的核酸导入所述植物细胞。
12.权利要求11的方法,其中所述PLT5多肽、所述KWS-RBP1多肽、所述RKD4多肽和所述RKD2多肽在所述植物细胞中是瞬时存在的、是瞬时有活性的或是瞬时表达的,或其中编码所述PLT5多肽、所述KWS-RBP1多肽、所述RKD4多肽和所述RKD2多肽的核酸在所述植物细胞中是瞬时存在的、是瞬时有活性的或是瞬时表达的。
13.权利要求12的方法,其中将所述第一加强子多肽和所述第二加强子多肽以及所述PLT5多肽导入所述植物细胞中,并任选地是瞬时共同表达的;和/或其中将所述第一加强子多肽和所述第二加强子多肽以及所述KWS-RBP1多肽导入所述植物细胞中,并任选地是瞬时共同表达的;和/或其中将所述第一加强子多肽和所述第二加强子多肽和所述RKD4多肽导入所述植物细胞中,并任选地是瞬时共同表达的,和/或其中将所述第一加强子多肽和所述第二加强子多肽和所述RKD2多肽导入所述植物细胞中,并任选地是瞬时共同表达的。
14.权利要求11至13中任一项的方法,其中所述PLT5多肽包含SEQ ID NO:10或12的氨基酸序列,或与SEQ ID NO:10或12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码所述PLT5多肽的核酸编码SEQ ID NO:10或12的氨基酸序列,或编码与SEQ ID NO:10或12具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中所述KWS-RBP1多肽包含SEQ ID NO:14的氨基酸序列,或与SEQ ID NO:14具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码所述KWS-RBP1多肽的核酸编码SEQ ID NO:14的氨基酸序列,或编码与SEQ ID NO:14具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中所述KWS-RBP2多肽包含SEQ ID NO:50的氨基酸序列,或与SEQ ID NO:50具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码所述KWS-RBP2多肽的核酸编码SEQ ID NO:50的氨基酸序列,或编码与SEQ ID NO:50具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中所述RKD4多肽包含SEQ ID NO:16、18或20的氨基酸序列,或与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码所述RKD4多肽的核酸编码SEQ ID NO:16、18或20的氨基酸序列,或编码与SEQ ID NO:16、18或20具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中所述RKD2多肽包含SEQ ID NO:22、24或26的氨基酸序列,或与SEQ ID NO:22、24或26具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列;或其中编码所述RKD2多肽的核酸编码SEQ ID NO:22、24或26的氨基酸序列,或编码与SEQ ID NO:22、24或26具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列。
15.权利要求11至14中任一项的方法,其中编码所述PLT5多肽的核酸包含具有选自以下的编码序列的核酸:
(i)包含SEQ ID NO:9或11的核苷酸序列的核酸;
(ii)包含与SEQ ID NO:9或11具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;
(iii)在严格杂交条件下与(i)或(ii)中定义的核酸的互补链杂交的核酸;
其中编码所述KWS-RBP1多肽的核酸包含具有选自以下的编码序列的核酸:
(I)包含SEQ ID NO:13的核苷酸序列的核酸;
(II)包含与SEQ ID NO:13具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;
(III)在严格杂交条件下与(I)或(III)中定义的核酸的互补链杂交的核酸;
其中编码所述KWS-RBP2多肽的核酸包含具有选自以下的编码序列的核酸:
(A)包含SEQ ID NO:49的核苷酸序列的核酸;
(B)包含与SEQ ID NO:49具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;
(C)在严格杂交条件下与(A)或(B)中定义的核酸的互补链杂交的核酸;
其中编码所述RKD4多肽的核酸包含具有选自以下的编码序列的核酸:
(1)包含SEQ ID NO:15、17或19的核苷酸序列的核酸;
(2)包含与SEQ ID NO:15、17或19具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
(3)在严格杂交条件下与(1)或(2)中定义的核酸的互补链杂交的核酸;
其中编码所述RKD2多肽的核酸包含具有选自以下的编码序列的核酸:
a)包含SEQ ID NO:21、23或25的核苷酸序列的核酸;
b)包含与SEQ ID NO:21、23或25具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸;和
c)在严格杂交条件下与a)或b)中定义的核酸的互补链杂交的核酸。
16.权利要求9至15中任一项的方法,其中所述基因组工程化组分包含
a)诱导双链断裂(DSB)的酶或编码其的核酸,其中所述DSB诱导酶任选地识别所述细胞的基因组中的预定位点,并且其中所述DSB诱导酶任选地是修复核酸分子;
b)诱导单链断裂(SSB)的酶或编码其的核酸,其中所述SSB诱导酶任选地识别所述细胞的基因组中的预定位点,并且其中所述SSB诱导酶任选地是修复核酸分子;
c)碱基编辑器酶,其任选地与解除武装的DSB诱导酶或解除武装的SSB诱导酶融合,其中所述碱基编辑器酶任选地识别所述细胞的基因组中的预定位点;或
d)影响DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与解除武装的DSB诱导酶或解除武装的SSB诱导酶融合,其中所述酶任选地识别所述细胞的基因组中的预定位点。
17.权利要求9至16中任一项的方法,其中包含DSB诱导酶或SSB诱导酶或其变体的所述基因组工程化组分是CRISPR/Cas内切核酸酶、CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶或TAL效应物核酸酶。
18.权利要求9至17中任一项的方法,其中步骤(c)中的所述基因组工程化组分的活性包含在所述植物细胞的基因组中诱导一个或多个双链断裂,在所述植物细胞的基因组中诱导一个或多个单链断裂,在所述植物细胞的基因组中诱导一个或多个碱基编辑事件,或在所述植物细胞的基因组中诱导一个或多个DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化。
19.权利要求18的方法,其中在诱导一个或多个双链断裂或一个或多个单链断裂之后为非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)的断裂的同源性定向修复。
20.权利要求9至19中任一项的方法,其中步骤(a)(ii)中的转基因选自编码对非生物胁迫具有抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或涝渍,编码除草剂抗性的基因,所述除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和Dicamba的抗性,编码对生物胁迫具有抗性或耐受性的基因,所述对生物胁迫具有抗性或耐受性的基因包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因,或编码与产量相关的性状的基因,所述与产量相关的性状包括倒伏抗性、开花时间、抗裂荚性、种子颜色、胚乳组分或营养成分。
21.权利要求9至20中任一项的方法,其中在步骤(c)中,所述基因组的修饰选自
i)取代至少一个核苷酸;
ii)缺失至少一个核苷酸;
iii)插入至少一个核苷酸;
iv)DNA甲基化的改变;
v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的改变;和
vi)i)-v)的任何组合。
22.权利要求9至21中任一项的方法,其中所述方法有效地促进细胞增殖或细胞再生,优选地在遗传修饰之后有效地促进细胞增殖或细胞再生。
23.权利要求9至22中任一项的方法,其中所述方法有效地从单个细胞诱导胚胎发生,优选地在遗传修饰之后有效地从单个细胞诱导胚胎发生。
24.权利要求9至23中任一项的方法,其中所述方法有效地提高转基因向所述植物细胞中的稳定转化效率。
25.权利要求9至24中任一项的方法,其中所述方法有效地提高所述基因组工程化组分编辑所述植物细胞的基因组的效率。
26.权利要求11至25中任一项的方法,其中所述定点转录激活子或编码其的核酸包含至少一个识别结构域和至少一个激活结构域,其中所述定点转录激活子被配置为提高来自内源性核酸的第一加强子多肽、来自内源性核酸的第二加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过结合至位于与第一内源性加强子多肽、第二内源性加强子多肽、内源性PLT5多肽、内源性RKD4多肽或内源性RKD2多肽的起始密码子有一定距离的调控区域。
27.权利要求26的方法,其中所述至少一个识别结构域是选自以下的分子或分子的片段:至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌指结构域、和至少一个解除武装的归巢内切核酸酶或其任何组合。
28.权利要求27的方法,其中所述至少一个解除武装的CRISPR/核酸酶系统选自CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dCasX系统或CRISPR/dCasY系统或其任何组合,其中所述至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
29.权利要求26的方法,其中所述至少一个激活结构域是酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自水稻白叶枯病菌的TAL效应物基因、来自单纯疱疹的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
30.一种用于改善植物再生的效率或提高植物细胞的再生能力的方法,其包含将权利要求9中定义的(i)的组分、权利要求1或2的核酸、权利要求3至5中任一项的重组基因或权利要求6的DNA构建体导入所述植物细胞。
31.根据权利要求9至30中任一项的方法获得或可获得的经遗传修饰的植物细胞。
32.植物或植物部分,其包含权利要求31的经遗传修饰的植物细胞。
33.一种用至少权利要求9中定义的(i)的组分、权利要求1或2的核酸、权利要求3至4中任一项的重组基因或权利要求6的DNA构建体包被的微粒。
34.权利要求33的微粒,其中所述微粒进一步被基因组工程化组分包被。
35.一种用于通过微弹轰击来对植物基因组遗传修饰的试剂盒,所述试剂盒包含
(I)一个或多个微粒,和
(II)用于包被权利要求33或34的微粒的工具。
36.权利要求37的试剂盒,其进一步包含用于用基因组工程化组分包被所述微粒的工具。
37.一种产生经遗传修饰的植物的方法,其包含以下步骤:
(a)根据权利要求9-29中任一项的方法遗传修饰植物细胞,和
(b)从步骤(a)的修饰的植物细胞再生植物。
38.权利要求37的方法,其中所产生的植物不含有在步骤(a)中导入的所述基因组工程化组分、所述加强基因和所述加强子多肽的任一项。
39.通过权利要求37或权利要求38的方法获得或可获得的经遗传修饰的植物或其部分,或其后代植物。
40.权利要求9中定义的(i)的组分、权利要求1或2的核酸、权利要求3至5中任一项的重组基因或权利要求6的DNA构建体用于改善植物再生的效率或提高植物细胞的再生能力的用途。
CN201980053177.9A 2018-06-15 2019-06-14 改善植物中基因组工程化和再生的方法ii Pending CN112585269A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862685626P 2018-06-15 2018-06-15
US62/685,626 2018-06-15
US201862728401P 2018-09-07 2018-09-07
US62/728,401 2018-09-07
PCT/EP2019/065647 WO2019238911A1 (en) 2018-06-15 2019-06-14 Methods for improving genome engineering and regeneration in plant ii

Publications (1)

Publication Number Publication Date
CN112585269A true CN112585269A (zh) 2021-03-30

Family

ID=66951941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980053177.9A Pending CN112585269A (zh) 2018-06-15 2019-06-14 改善植物中基因组工程化和再生的方法ii

Country Status (7)

Country Link
US (1) US20210277407A1 (zh)
EP (1) EP3807301A1 (zh)
CN (1) CN112585269A (zh)
AU (1) AU2019285085B2 (zh)
BR (1) BR112020025311A2 (zh)
CA (1) CA3103500A1 (zh)
WO (1) WO2019238911A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114807161A (zh) * 2022-03-11 2022-07-29 湖南农业大学 水稻多元醇转运基因OsPLT5及其多元醇转运体、应用和扩增引物

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220025388A1 (en) * 2018-06-15 2022-01-27 KWS SAAT SE & Co. KGaA Methods for improving genome engineering and regeneration in plant
EP4086353A4 (en) * 2020-01-03 2024-03-06 Kaneka Corp METHOD FOR PLANT MODIFICATION
WO2021170787A1 (en) * 2020-02-28 2021-09-02 KWS SAAT SE & Co. KGaA Method for rapid genome modification in recalcitrant plants
EP4110929A1 (en) * 2020-02-28 2023-01-04 KWS SAAT SE & Co. KGaA Immature inflorescence meristem editing
EP4019638A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
EP4019639A1 (en) 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750487A (zh) * 2008-12-02 2010-06-23 博阳生物科技(上海)有限公司 干法光激化学发光免疫检测试剂盒及其制备与应用
CN102892888A (zh) * 2009-12-30 2013-01-23 先锋国际良种公司 在植物中导入并调节表达基因的方法和组合物
CN102939383A (zh) * 2009-12-30 2013-02-20 先锋国际良种公司 用于靶向多核苷酸修饰的方法和组合物
CN104039818A (zh) * 2012-01-06 2014-09-10 先锋国际良种公司 用于调节植物中rkd多肽的表达或活性的方法和组合物
WO2017074547A1 (en) * 2015-10-30 2017-05-04 Pioneer Hi-Bred International, Inc. Methods and compositions for rapid plant transformation

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
CA2154581C (en) 1993-02-12 2008-12-16 Srinivasan Chandrasegaran Functional domains in flavobacterium okeanokoites (foki) restriction endonuclease
US6528701B1 (en) 1999-03-02 2003-03-04 Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College Rice ubiquitin-derived promoters
US20080229439A1 (en) * 1999-05-06 2008-09-18 La Rosa Thomas J Nucleic acid molecules and other molecules associated with transcription in plants and uses thereof for plant improvement
EP1207204A1 (de) 2000-11-16 2002-05-22 KWS Saat AG Gewebespezifische Promotoren aus der Zuckerrübe
DE10131786A1 (de) 2001-07-04 2003-01-16 Sungene Gmbh & Co Kgaa Rekombinationssysteme und Verfahren zum Entfernen von Nukleinsäuresequenzen aus dem Genom eukaryotischer Organismen
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
DE102004043207C5 (de) 2004-09-03 2010-09-09 Südzucker AG Mannheim/Ochsenfurt Wurzel- und xylemparenchymspezifischer Promotor
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
PL2510096T5 (pl) 2009-12-10 2018-06-29 Regents Of The University Of Minnesota Modyfikacja DNA zależna od efektora TAL
AU2011256838B2 (en) 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
EP2582845A2 (en) 2010-06-15 2013-04-24 Cellectis Method for improving cleavage of dna by endonuclease sensitive to methylation
KR101556359B1 (ko) 2011-01-03 2015-10-01 주식회사 툴젠 디자인된 tal 이펙터 뉴클레아제를 통한 게놈 엔지니어링
ES2728436T3 (es) 2011-04-05 2019-10-24 Cellectis Método para la generación de TALE-nucleasas compactas y usos de la mismas
EP3178935B1 (en) 2014-08-06 2022-12-21 Toolgen Incorporated Genome editing using campylobacter jejuni crispr/cas system-derived rgen
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750487A (zh) * 2008-12-02 2010-06-23 博阳生物科技(上海)有限公司 干法光激化学发光免疫检测试剂盒及其制备与应用
CN102892888A (zh) * 2009-12-30 2013-01-23 先锋国际良种公司 在植物中导入并调节表达基因的方法和组合物
CN102939383A (zh) * 2009-12-30 2013-02-20 先锋国际良种公司 用于靶向多核苷酸修饰的方法和组合物
CN104039818A (zh) * 2012-01-06 2014-09-10 先锋国际良种公司 用于调节植物中rkd多肽的表达或活性的方法和组合物
WO2017074547A1 (en) * 2015-10-30 2017-05-04 Pioneer Hi-Bred International, Inc. Methods and compositions for rapid plant transformation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAVID KOSZEGI等: "Members of the RKD transcription factor family induce an egg cell-like gene expression program", 《THE PLANT JOURNAL》, vol. 67, no. 2, pages 286 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114807161A (zh) * 2022-03-11 2022-07-29 湖南农业大学 水稻多元醇转运基因OsPLT5及其多元醇转运体、应用和扩增引物
CN114807161B (zh) * 2022-03-11 2024-04-09 湖南农业大学 水稻多元醇转运基因OsPLT5及其多元醇转运体、应用和扩增引物

Also Published As

Publication number Publication date
AU2019285085A1 (en) 2021-01-07
EP3807301A1 (en) 2021-04-21
US20210277407A1 (en) 2021-09-09
BR112020025311A2 (pt) 2021-03-09
AU2019285085B2 (en) 2024-04-18
CA3103500A1 (en) 2019-12-19
WO2019238911A1 (en) 2019-12-19

Similar Documents

Publication Publication Date Title
CN112585269A (zh) 改善植物中基因组工程化和再生的方法ii
CN112566924A (zh) 改善植物中基因组工程化和再生的方法
CN101889088B (zh) 从植物基因组中切除核酸序列的方法
CN108368517B (zh) 用于快速植物转化的方法和组合物
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
US6074877A (en) Process for transforming monocotyledonous plants
CN109563505A (zh) 用于真核细胞的组装系统
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
CN113631704A (zh) 可用于基因编辑的多肽及使用方法
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
BRPI0620552A2 (pt) polinucleotìdeo isolado, polipeptìdeo delta-9 elongase, construção recombinante, célula vegetal, método para transformar uma célula, método para produção de uma planta transgênica, sementes transgênicas, método para fabricar ácidos graxos poliinsaturados de cadeia longa, óleos, método para produzir pelo menos um ácido graxo poliinsaturado, plantas de semente oleaginosa, sementes, alimentos, fragmento de ácido nucléico isolado e progênies de plantas
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
CN108431229A (zh) 糖转运蛋白修饰的酵母菌株和用于生物制品生产的方法
CN111836825A (zh) 优化的植物crispr/cpf1系统
CN113874501A (zh) 使用碱基编辑器进行靶向诱变
AU2016349822A1 (en) Algal mutants with increased lipid productivity
CN109400688A (zh) OsHAP2C及其编码基因在调控水稻白叶枯病抗性中的应用
CN101646766A (zh) Δ17去饱和酶及其用于制备多不饱和脂肪酸的用途
CN101918560B (zh) 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法
CN101868545B (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法
KR20180137558A (ko) 유전자내 식물 형질전환을 위한 구조체 및 벡터
CN101410522B (zh) 繁殖去除构筑体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination