CN112204147A - 基于Cpf1的植物转录调控系统 - Google Patents

基于Cpf1的植物转录调控系统 Download PDF

Info

Publication number
CN112204147A
CN112204147A CN201880090026.6A CN201880090026A CN112204147A CN 112204147 A CN112204147 A CN 112204147A CN 201880090026 A CN201880090026 A CN 201880090026A CN 112204147 A CN112204147 A CN 112204147A
Authority
CN
China
Prior art keywords
brassica
transcription factor
gene
synthetic transcription
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880090026.6A
Other languages
English (en)
Inventor
M·拉布斯
A·赫梅尔
梅钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Publication of CN112204147A publication Critical patent/CN112204147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H4/00Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • C12N15/8207Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated by mechanical means, e.g. microinjection, particle bombardment, silicon whiskers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8217Gene switch
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明涉及基因表达的靶向调控,更具体地涉及合成转录因子(STF),其包含至少一个基于CRISPR/Cpf1系统的高靶向特异性工程化识别结构域,还包含至少一个激活或沉默结构域以调控目的基因的表达,优选地调控真核生物特别是植物的形态发生基因的转录。本发明还公开了使用STF以提高转化频率,优化成功的基因组编辑方法,提供单倍体或双单倍体生物,以及/或者提供适于一般转化但也适于育种目的的组合物的方法。

Description

基于Cpf1的植物转录调控系统
技术领域
本发明涉及基因表达的靶向调控,更具体地涉及合成转录因子(STF),其包含至少一个基于CRISPR/Cpf1系统的高靶向特异性工程识别结构域,还包含至少一个激活或沉默结构域以调控目的基因的表达,优选地调控真核生物特别是植物的形态发生基因的转录。本发明还公开了使用STF提高转化频率,优化成功的基因组编辑方法,提供单倍体或双单倍体生物,以及/或者提供适于一般转化但也适于育种目的的组合物的方法。这些方法和用途依赖于包含基因表达调控结构域(例如,激活结构域或沉默结构域)的STF的协同增效作用,使得可以重编程细胞并诱导细胞分裂和/或再生,同时转化所述细胞或编辑所述细胞的基因组。
背景技术
在真核细胞中有效转化和精确修饰遗传物质的能力使其在农产品开发、基础研究和其它技术领域中具有广泛的高价值应用。从根本上讲,基因组工程或基因编辑(GE)通过在真核基因组和原核基因组中特定位置引入预定义的遗传变异来提供此功能。同时,存在大量的用于在特定发育阶段转化不同真核或原核细胞的方法。此外,某些细胞类型或基因型的转化或转染效率有时仍然非常低,必须建立针对源自不同基因型的不同细胞进行微调的高特异性方法。
此外,以高靶向方式修饰且特异性调控(即,激活或抑制)基因表达的能力在植物生物技术方面具有很高的价值。
例如,虽然目前可以对主要的单子叶作物进行转化,但该方法通常局限于每个物种的一种或两种基因型,往往在农艺学上较差,且效率较差是这些方法难于农业实施。
全球人口增长将迫使世界粮食产量在未来几十年内翻一番,同时气候变化也为植物育种者带来了新的挑战,因此非常需要具有生物胁迫或非生物胁迫抗性(例如,对新兴植物病原体的抗性或干旱抗性)的优化的作物植物。依靠经典育种和选择技术可能无法有效应对急剧增长的需求,也无法在未来几十年应对生态社会学变化实现持续供应。因此,必须开发新的策略和生物技术措施,建立植物可以更好地适应不利环境条件的性状。
目前,玉米是世界上最重要的粮食和饲料作物之一,也是生物能源。同时,自20世纪90年代中期建立首例转基因苏云金芽孢杆菌(Bt)玉米产品以来,玉米已成为生物技术创新的最重要目标作物之一。尽管玉米基因组具有复杂性(与模型植物相比),但同时市场上玉米的生物技术性状比其他作物都多。自首次成功报道使用劳动密集型和耗费时间的原生质体转化方法(Rhodes等,1988a)以来,转基因玉米的生产已取得了巨大进展。微粒轰击转化(Fromm等,1990;Gordon-Kamm等,1990)和农杆菌介导转化(Ishida等,1996)技术的发展使转基因玉米的生产变得更简单、更可靠。在Hi-II中以BAR作为选择性标记(Frame等,2000)以及在优良自交系CG00526中以PMI作为选择性标记(Wright等,2001),建立高产生物弹射击转化系统。利用自交系A188(Ishida等,1996;Negrotto等,2000)、Hi-II(Zhao等,2001)和A188/Hi-II杂交(Li等,2003)报道了有效的农杆菌介导转化系统。在过去的几年中,基因组工程技术的进步使得在玉米基因组中的特异性染色体靶位点进行修饰和插入转基因成为可能(Shukla等,2009;Gao等,2010;Liang等,2014;综述:Que等,《植物科学前沿》(Front.Plant.Sci.),2014,5,379)。然而,以上技术都不能提供适用于不同基因型的可靠且可转移的结果,更不用说用于不同植物。
过去几十年来,植物生物技术领域的进步是在转基因农作物建立的基础上取得的。但是,社会经济和监管因素越来越表明,对于某些国家和地区而言,非转基因植物和植物产品的开发变得越来越重要。
形态发生通常是指导致生物体发育的生物过程。它与控制细胞生长和细胞分化一样,是发育生物学的三个基本方面之一,三者在进化发育生物学中是统一的。参与形态发生的重要的一类分子是转录因子蛋白,其通过与DNA相互作用来决定细胞的命运。这些分子可以由主调节基因编码,并且可以激活或去激活其它基因的转录;反过来,这些次级基因产物可以在基因调控网络的调控级联反应中调控其他基因的表达。在该级联的末尾,是控制细胞行为(例如,细胞迁移)或更普遍地控制其特性(例如,细胞粘着或细胞运动、细胞增殖和细胞凋亡)的分子类别。
目前,Lowe等人的小组(Lowe等,“形态发生调控子Baby boom和Wuschel改善单子叶转化”(Morphogenic Regulators Baby boom and Wuschel Improve MonocotTransformation),《植物细胞》(Plant Cell),2016,第28卷:1998-2015)报道了一种涉及过表达玉米(Zea mays)形态发生基因Baby boom(BBM)和玉米Wuschel(WUS)基因的转化方法,在许多之前不可转化的玉米自交系中产生了高转化频率。Lowe等发现,以前难以转化的自交系中BBM和WUS的过表达导致转基因愈伤组织的再生能力增强。WUS和BBM在植物发育中的作用已经在前面进行了描述(US7,256,322B2或US 2013/0254935A1)。
但是,目前,上述方法和其它方法都依赖于形态发生基因的异源过表达,例如在此类系统通常在其内不表达的细胞区室中,或者依赖于提供携带稳定地掺入其基因组的各个基因的转基因作物植物。另一种策略是例如使用诱导型和/或组织特异性启动子在时间或空间上调控靶基因的表达。但是,不受控制的过表达会导致表型变化,从而可能影响作物植物的适应性和产量效率,因此在农业中使用这种方法不具吸引力。因此,仍然非常需要确定新的策略来利用内源基因(包括形态发生因子)的功能,从而避免在目的细胞或细胞系统中过表达异源基因。
许多植物细胞都具有仅从单个细胞或组织就可再生完整生物的能力。此过程通常称为全能性。整个植物的再生过程似乎与形态发生过程密切相关。体外培养的植物组织和细胞进行形态发生的能力会导致形成离散器官甚至整个植物,这为体外植物生物学在基础植物学、生物化学、育种和新作物植物发育的研究方面的众多应用提供了机会。
单倍体是含有配子染色体数(n)的植物。它们可以自然产生,也可以是各种诱导技术的结果。自1992年Blakeslee首次描述曼陀罗(Datura stramonium)的这种现象(Blakeslee等,1922)以来,单倍体植物的自发发育就已经是公知了;随后在普通烟草(Nicotiana tabacum)、小麦(Triticum aestivum)和几个其它物种中也有类似的报道(Forster等,2007)。然而,单倍体的自发发生较为罕见,因此实用价值有限。
由二倍体物种产生的单倍体,又称一倍体,在孢子体期仅包含一组染色体。与供体植物相比,它们更小并且表现出更低的植物生命力,并且由于它们的染色体在减数分裂过程中无法配对,因此是不育的。为了通过种子繁殖它们并将其纳入育种计划,必须通过自发或诱导的染色体加倍来恢复它们的繁殖力。所获得的加倍单倍体或双单倍体在所有位点都是纯合的,可代表新品种(自花授粉作物)或用于生产杂交品种的亲本自交系(异花授粉作物)。实际上,异花授粉物种通常表现出高度的近交衰退。对于这些物种,诱导过程本身不仅可以作为生产纯合品系的快速方法,而且可以作为消除表达强近交衰退的基因型的选择工具。可以预期选择与营养生长相关的隐性有害基因引起的性状。因此,单倍体和双单倍体植物系统对于植物育种策略非常重要,但是对诸如形态发生途径的发育途径之间的相互作用及其在单倍体植物系统产生中的潜在影响却知之甚少。
此外,在转化携带高价值基因型的优良种质时,存在着严重的问题,因为可从所述优良植物衍生的各植物或植物部分或可体外培养细胞通常是非常难以进行转化和/或转染的。这一事实使得目标植物的发育或育种变得非常复杂、耗时且昂贵,因为必须采用许多附加的育种和/或分子生物学步骤才能成功地将优良事件转移到目的遗传背景中。
因此,本发明的目的是开发新的策略,以在其天然细胞环境中诱导内源基因,优选地为形态发生基因,从而通过已知技术改善转化困难或甚至非常难以进行转化/转染的作物植物的再生。此外,其目的是统一最新基因编辑技术可实现的高精度,以提供可调节方法来调控形态发生基因(优选地以瞬时的方式),从而使得靶细胞或组织的转化和再生能力更好,而不会过度影响细胞的内源性形态发生系统,其中该方法应配置为可以在与基因型无关的情况下提高转化/转染率。
基于人工调控基因表达(主要是转录调控)的开发,另一个目的是提供针对转录控制具有沉默能力的合成转录因子,以提供有效的组合物来控制异常表达基因的转录和表达。
再一个目的是基于形态发生基因的靶向修饰,建立提供单倍体和双单倍体植物细胞、细胞系统和整个生物体的新策略,从而为各种相关作物植物提供用于产生双单倍体的起始材料,所述双单倍体为完全纯合品系,表示植物育种和植物生物技术中的宝贵工具。
已经利用具有已知可以在被募集到启动子区域时激活或抑制基因转录的转录效应物结构域的失活CRISPR核酸内切酶融合构建体,开发了转录调控工具。到目前为止,基于CRISPR/Cas9的转录激活和抑制系统已经可用于哺乳动物细胞和植物细胞系统(Chen等(2013),RNA向导的转录激活子系统CRISPR-on对内源基因的多重激活(Multiplexedactivation of endogenous genes by CRISPR-on,an RNA-guided transcriptionalactivator system),《细胞研究》(Cell Research),23:1163-1171;Lowder等(2015),用于植物基因组多重编辑与转录调控的CRISPR/Cas9工具箱(A CRISPR/Cas9 toolbox formultiplexed plant genome editing and transcriptional regulation),《植物生理学》(Plant Physiology),169:971-985;Lowder等(2017),多重CRISPR-Act2.0和mTALE-Act系统对植物进行稳健的转录激活(Robust transcriptional activation in plants usingmultiplexed CRISPR-Act2.0 and mTALE-Act systems),《分子植物》(Molecular Plant),11:245-256;以及Li等(2017),对植物和动物细胞有效的Cas9驱动基因激活子(A potentCas9-driven gene activator for plant and animal cells),《自然植物》(NaturePlants),3:930-936)。
与基于Cas9的转录激活系统相比,基于Cpf1的转录激活系统具有多个优势。它们可用于靶向富含AT的启动子区域,而基于Cas9的系统则对富含GC的区域具有特异性。由于Cpf1的RNAse活性能够从单一转录物加工多个crRNA,因此基于Cpf1的转录调控系统相对于众所周知的基于Cas9的系统具有优势,即,它可以轻松应用于多重基因调控。
然而,基于Cpf1的转录激活系统目前仅适用于哺乳动物细胞系统(Tak等(2017),使用基于CRISPR/Cpf1的转录因子进行诱导和多重基因调控(Inducible and multiplexgene regulation using CRISPR/Cpf1 based transcription factors),《自然方法》(Nature Methods),14(12):1163-1166;以及Liu等(2017),利用基于CRISPR/Cpf1的可调转录因子的工程细胞信号传导(Engineering cell signaling using tunable CRISPR/Cpf1based transcription factors),《自然-通信》(Nature Communications),8(1):2095),尽管已经在拟南芥(Arabidopsis)中证明了基于Cpf1的转录抑制(Tang等(2017),用于植物中有效基因组编辑和转录阻遏的CRISPR/Cpf1系统(A CRISPR/Cpf1system for efficientgenome editing and transcriptional repression in plants),《自然植物》(NaturePlants),3:17018)。到目前为止,在植物中尚未显示出基于Cpf1的转录激活,这表明,转录抑制结构域(如Tang等中使用的那个)简单地由转录激活结构域替换是不可能的,并且需要精心配置和测试正确的接头和激活结构域序列。因此,根据现有技术并不能确定在基于Cpf1的系统中简单地用激活结构域替换抑制结构域是否会引起内源基因表达的激活。相反,现有技术表明,需要大量的修饰和实验来提供可用于植物细胞的基于Cpf1的转录激活子。
特别地,因此本发明的目的是提供一种基于Cpf1的转录激活(或抑制)系统,其可用于多种作物植物中以靶向富含AT的启动子区域,优选内源基因的启动子区域。该系统应易于用于多重化,即,通过使用向导RNA阵列同时靶向多个基因组区域。此外,应可以在无转基因环境中暂时使用该系统。此外,本发明的另一个目的是,建立通过特异性靶向形态发生基因以增强表达来改善转化效率和基因组修饰技术的方法。
发明内容
一方面,上述目的通过提供一种合成转录因子或编码其的核苷酸序列而实现,其包含至少一个识别结构域和至少一个基因表达调控结构域,尤其是激活结构域,其中,该合成转录因子配置为调控细胞系统中形态发生基因的表达。
还提供了一种合成转录因子,其中该至少一个识别结构域是至少一个解除武装(disarmed)的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在一个实施方案中,提供了一种合成转录因子,其中该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在另一个实施方案中,提供了一种合成转录因子,其中该至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌(Xanthomonas oryzae)的无毒基因、单纯疱疹病毒的VP16(SEQ ID NO:259)或四聚体VP64(SEQ ID NO:260)、VPR(SEQ ID NO:261)、SAM(SEQ ID NO:262;SEQ ID NO:263)、Scaffold(SEQ ID NO:264;SEQ ID NO:265)、Suntag(SEQ ID NO:266;SEQ ID NO:267)、P300(SEQ ID NO:268)、VP160(SEQ ID NO:269)或其任何组合。在本发明的优选实施方案中,该激活结构域是VPR。
在又一个实施方案中,提供了一种合成转录因子,其中该至少一个激活结构域相对于该至少一个识别结构域位于N-末端和/或C-末端。
在一个实施方案中,提供了一种合成转录因子,其中该形态发生基因选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
在另一个实施方案中,提供了一种合成转录因子,其中该形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在另一个实施方案中,提供了一种合成转录因子,其中该合成转录因子配置为通过结合至位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在又一个实施方案中,提供了一种合成转录因子,其中该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在另一个实施方案中,提供了一种合成转录因子,其中该细胞系统选自至少一个真核细胞或真核生物体,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在一个实施方案中,提供了一种合成转录因子,其中,该植物的至少一部分选自由叶、茎、根、初生胚根(emerged radicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在另一个实施方案中,提供了一种合成转录因子,其中,该至少一个植物细胞、该至少一个植物或植物的至少一部分源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Orizasativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
一方面,提供了一种用于提高细胞系统中转化效率的方法,其中,该方法包括以下步骤:(a)提供细胞系统;(b)在该细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;以及(c)在该细胞系统中引入至少一个目的核苷酸序列;(d)可选地:在获得该细胞系统后代的条件下培养该细胞系统;其中该至少一个合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个基因表达调控结构域,特别是至少一个激活结构域,其中该合成转录因子配置为调控该细胞系统中形态发生基因的表达,优选地是调控该细胞系统中形态发生基因的转录;并且其中,该至少一个合成转录因子或编码其的核苷酸序列的引入与该至少一个目的核苷酸序列的引入平行进行,或序贯进行。
在一个实施方案中,提供了一种方法,其中,(a)该至少一个合成转录因子或编码其的序列,或该至少一个合成转录因子的至少一种组分或编码其的序列;以及(b)该至少一个目的核苷酸序列,通过独立地选自生物和/或物理方法的方法被引入该细胞系统中,该方法包括转染、转化,其中包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化、使用化学试剂进行转染(包括聚乙二醇转染)、电穿孔、细胞融合或其任何组合。
在又一个实施方案中,提供了一种方法,其中该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在另一个实施方案中,提供了一种方法,其中该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在另一个实施方案中,提供了一种方法,其中该至少一个合成转录因子的至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在本发明的优选实施方案中,该激活结构域是VPR(SEQ ID NO:276)。
在又一个实施方案中,提供了一种方法,其中该至少一个合成转录因子的至少一个激活结构域相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在另一个实施方案中,提供了一种方法,其中该至少一个形态发生基因选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
在另一个实施方案中,提供了一种方法,其中该至少一个形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在另一个实施方案中,提供了一种方法,其中该合成转录因子配置为通过结合至位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在一个实施方案中,提供了一种方法,其中该合成转录因子和/或该至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在另一个实施方案中,提供了一种方法,其中该细胞系统选自至少一个真核细胞或真核生物体,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在另一个实施方案中,提供了一种方法,其中,该植物的至少一部分选自由叶、茎、根、初生胚根(emerged radicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在又一个实施方案中,提供了一种方法,其中,该至少一个植物细胞、该至少一个植物或植物的至少一部分源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Alliumcepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
另一方面,提供了一种在预定位置修饰细胞系统的遗传物质的方法,其中,该方法包括以下步骤:(a)提供细胞系统;(b)将至少一个合成转录因子或编码其的序列引入该细胞系统中,(c)再将以下各项引入该细胞系统中:(i)至少一个位点特异性核酸酶或编码其的序列,其中该位点特异性核酸酶在预定位置诱导双链断裂;(ii)可选的:至少一个目的核苷酸序列,优选地侧翼为与细胞系统遗传物质中预定位置相邻的一个或多个核苷酸序列互补的一个或多个同源序列;以及(e)可选地:确定修饰存在于细胞系统的遗传物质中的预定位置;以及(f)获得在细胞系统遗传物质的预定位置处包含修饰的细胞系统;其中该至少一种合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该至少一个合成转录因子配置为调控该细胞系统中的至少一个形态发生基因的表达,优选地为调控该细胞系统中的至少一个形态发生基因的转录;并且其中该至少一个合成转录因子或编码其的核苷酸序列的引入,与该至少一个位点特异性核酸酶或编码其的序列以及该可选的至少一个目的核苷酸序列的引入平行进行,或序贯进行。
在该方面的另一个实施方案中,提供了一种方法,其中该方法还包括在获得所修饰的细胞系统的遗传修饰后代的条件下培养该细胞系统的步骤。
在预定位置修饰细胞系统遗传物质的方法的另一个实施方案中,提供了一种方法,其中,(i)至少一种合成转录因子或编码其的序列,或该至少一种合成转录因子的至少一种组分或编码其的序列;以及(ii)该至少一个位点特异性核酸酶或包含其的序列;以及可选的(iii)该至少一个目的核苷酸序列通过独立地选自生物方法和/或物理方法的方法引入该细胞系统,包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),电穿孔,细胞融合或其任何组合。
在一个实施方案中,提供了一种方法,其中该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在另一个实施方案中,提供了一种方法,其中该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
还提供了上述方法的实施方案,其中该至少一个合成转录因子的至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在本发明的优选实施方案中,该激活结构域是VPR(SEQID NO:276)。
在一个实施方案中,提供了一种方法,其中该至少一个合成转录因子的至少一个激活结构域相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在另一个实施方案中,提供了一种方法,其中该至少一个形态发生基因选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
在另一个实施方案中,提供了一种方法,其中该至少一个形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在另一个实施方案中,提供了一种方法,其中该合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在又一个实施方案中,提供了一种方法,其中该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个的序列,或包含与SEQ ID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在另一个实施方案中,提供了一种方法,其中该细胞系统选自至少一个真核细胞或真核生物体,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在又一个实施方案中,提供了一种方法,其中预定位置处的至少一个目的核苷酸序列侧翼的一个或多个核苷酸序列与邻近预定位置(位于预定位置的上游和/或下游)的一个或多个核苷酸序列在各个邻近区域的全长上至少85%至100%互补。
在本发明的另一个方面,提供了一种产生单倍体或双单倍体细胞系统或生物体的方法,其中该方法包括以下步骤:(a)提供单倍体细胞系统;(b)在该单倍体细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;(c)在获得至少一种单倍体或双单倍体生物体的条件下培养该单倍体细胞系统;以及(d)可选地,选择步骤(c)中获得的至少一个单倍体或双单倍体生物体,其中该至少一个合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该至少一个合成转录因子配置为调控该单倍体细胞系统中的至少一个形态发生基因的表达,优选地为调控该单倍体细胞系统中的至少一个形态发生基因的转录。
在一个实施方案中,提供了一种方法,其中上述方法的步骤(a)的单倍体细胞系统是单倍体胚,或者其中,上述方法的步骤(c)的至少一个单倍体或双单倍体生物体是通过从(b)的单倍体细胞系统产生至少一个单倍体胚的中间步骤获得的。
在一个实施方案中,提供了一种方法,其中该至少一个合成转录因子或编码其的序列,或者该至少一个合成转录因子的至少一个组分或编码其的序列通过独立选自生物和或物理方法的方法引入该单倍体细胞系统中,该方法包括转染、转化,其中包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),电穿孔,细胞融合或其任何组合。
在另一个实施方案中,提供了一种方法,其中该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在又一个实施方案中,提供了一种方法,其中该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在另一个实施方案中,提供了一种方法,其中该至少一个合成转录因子的至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在本发明的优选实施方案中,该激活结构域是VPR(SEQ ID NO:276)。
在另一个实施方案中,提供了一种方法,其中该至少一个合成转录因子的至少一个激活结构域相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在又一个实施方案中,提供了一种方法,其中该至少一个形态发生基因选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
在另一个实施方案中,提供了一种方法,其中该至少一个形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在一个实施方案中,提供了一种方法,其中该合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在另一个实施方案中,提供了一种方法,其中该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在又一个实施方案中,提供了一种方法,其中该至少一个单倍体细胞系统选自至少一个真核细胞或真核生物体,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
还提供了通过本文提供的任何一种方法获得的细胞系统或其后代。
在另一方面,提供了一种通过本文提供的任何一种方法获得的单倍体或双单倍体细胞系统或生物体。
在另一方面,提供了本文提供的合成转录因子或编码其的序列在本文提供的任何方法中的用途。
在另一方面,提供了一种合成转录因子或编码其的核苷酸序列,其包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子配置为调控细胞系统中内源基因的表达,优选地为调控细胞系统中内源基因的转录。
在另一方面,提供了一种用于提高细胞系统中至少一个内源基因表达的方法,其中该方法包括以下步骤:
(a)提供细胞系统;
(b)在该细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;
其中该至少一个合成转录因子或其编码的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中,该合成转录因子配置为提高该细胞系统中的至少一个内源基因的表达,优选地为提高该细胞系统中的至少一个内源基因的转录。
本发明的其他方面和实施方案可以从随后的具体实施方式、附图、序列表以及所附权利要求中得出。
附图及序列的简要说明
图1.用于靶向基因激活修饰的合成转录因子(STF)的示例性实施例。(A)示出了经由TAL转录因子的靶向基因激活。TAL转录因子由与例如转录激活因子样效应物(TALE)的DNA结合结构域融合的激活结构域(例如,VP64)组成。(B)示出了经由CRISPR/dCas9和/或CRISPR/dCpf1转录系统的靶向基因激活。CRISPR/dCas9和CRISPR/dCpf1转录因子系统包含与激活结构域(例如,VP64)融合的解除武装的核酸酶(例如,dCas9或dCpf1)。DNA结合由与解除武装的核酸酶相关的向导RNA介导。在与目的形态发生基因的转录起始位点非常接近的基因组靶位点结合后,STF通过激活结构域将RNA聚合酶II复合物(即,转录复合物)募集到形态发生基因的启动子区域(基因的转录在此进行)中。
图2.通过基因编辑机器与对形态发生基因具有特异性的示例性合成转录因子(STF)共转染改进基因编辑的示意图。通过基因编辑机器(例如,CRSPR/Cpf1或CRSIPR/Cas9)的修饰(诸如INDEL或用修复模板替换靶基因)会产生基因修饰的植物细胞。基因编辑机器与对BBM和WUS具有特异性的一种或多种STF的瞬时共转染可确保靶细胞的恢复并增加被编辑植物的再生。
图3.靶向内源性Wuschel(WUS)和Babyboom(BBM)基因的Tal效应物结合位点的设计。这些位点与起始密码子的距离不同。(A)内源性WUS的结合位点(其示出部分如SEQ IDNO:315所示)的长度为18个碱基对,并且还包含起始的T核碱基(TALE 1、2、3)。(B)内源性BBM的结合位点(其示出部分如SEQ ID NO:316所示)的长度为24个碱基对,并且还包含起始的T核碱基(TALE 4、5、6)。
图4.TALE转录因子对内源性WUS和BBM的瞬时表达。在玉米原生质体测定系统中测试了由TAL转录因子对基因表达的诱导。通过使用基于PEG的转化系统,用包含靶向WUS或BBM的TALE转录因子的载体构建体转化玉米原生质体。实验一式三份进行,并重复四次作为生物学重复。24小时后,使用市售试剂盒从提取的原生质体RNA中产生cDNA。使用SYBRGreen qRT-PCR方法确定内源性WUS和BBM的表达。(A)结果表明,合成转录因子TALE1是内源性WUS的最强诱导物,显示出内源性WUS基因表达的平均倍数变化为60。(B)结果表明,合成转录因子TALE5是内源性BBM的最强诱导物,显示出内源性BBM基因表达平均变化490倍。
图5.瞬时TALE转录因子诱导的内源性ZmWUS的表型功能的评估。为了评估合成转录因子对再生和胚胎形成的影响,用荧光标记tdTomato(tdT)、TALE1和PLT7通过粒子轰击转化玉米A188的愈伤组织。将构建体递送至单个细胞,并且在检测到tdT的红色荧光信号时通过荧光显微镜确认细胞增殖的诱导(参见白色圆圈和箭头)。
图6.实施例13中制备的pGEP767(A)、pGEP761(B)和pGEP772(C)的质粒图。
图7:实施例14中的ZmBBM基因(A)(其示出部分如SEQ ID NO:317所示)和ZmWUS2基因(B)(其示出部分如SEQ ID NO:318所示)的向导RNA设计。选定的TTTV、TYCV和TATV PAM用相应的箭头标记。设计的向导RNA如黑色箭头所示。在转录激活中测试的那些以圆圈突出显示。
图8:表达向导RNA的最终构建体的代表pGEP667的质粒图(此处为:crGEP186)。
图9:如实施例15中确定的WUS2和BBM表达的转录激活。通过使用靶向WUS2启动子区域的向导RNA,所测试的向导(crGEP186和crGEP201)引起WUS2表达的显著激活(A)。同样地,靶向BBM启动子区域的两个向导RNA(crGEP210和crGEP211)引起BBM表达的显著激活(B)。将仅用LbCpf1-VPR表达载体转化的样品中BBM和WUS2的表达水平用作对照。
图10:如实施例14中设计的靶向ZmBBM和ZmWUS2的向导RNA序列。
表1:序列表中公开序列的简要说明
Figure BDA0002643914670000131
Figure BDA0002643914670000141
定义
术语“位点特异性DNA修饰酶”、“序列特异性DNA修饰酶”、“基因编辑酶”、“基因组编辑酶”和“基因组工程化酶”在本文中可互换使用,是指用于在至少一个位置对活生物的任何遗传或表观遗传信息或基因组进行靶向特异性修饰或靶向随机修饰的酶或酶复合物。酶的序列特异性性质是指,它们可以被靶向以编辑基因,还可以编辑除基因组的基因编码区域以外的区域。它还包括细胞的细胞核(如果存在)以及其他遗传信息的编辑或工程化。此外,遗传信息的修饰包括对包含在核或核外基因组(包括DNA或RNA基因组)中的核酸碱基进行编辑、工程改造、突变或破坏的靶向修饰。它还可以包括从基因组表达的信息的靶向修饰,例如RNA信息。此类酶包括但不限于,核酸外切酶、核酸内切酶、切口酶、解旋酶、聚合酶、连接酶和脱氨酶,包括胞苷、腺嘌呤或其他碱基编辑器。表观遗传信息的修饰包括甲基化、组蛋白修饰或可能导致基因表达遗传变化的非编码RNA的靶向修饰。
如本文所使用的,“碱基编辑器”是指包含至少一种蛋白或其片段的蛋白或复合物,其具有介导靶向碱基修饰的能力,即,目的碱基的转换(conversion)导致目的点突变。优选地,在本发明的上下文中,至少一个碱基编辑器包括用于将碱基编辑器靶向核酸序列的特异性位点的至少一个核酸识别结构域和在特异性靶位点执行至少一个核碱基转换的至少一个核酸编辑结构域。该核酸识别结构域还可包含至少一个核酸分子(例如,向导RNA)或任何其他单链或双链核酸分子。因此,“碱基编辑”是指携带不同于之前的核碱基的至少一个特异性核苷酸。基于以上所述,根据本发明的“预定位置”是指细胞系统的基因组材料中或待修饰的目的细胞的基因组内的位置或位点,其中将引入靶向编辑。除核酸识别结构域和核酸编辑结构域外,碱基编辑器还可包含除核酸识别结构域和核酸编辑结构域之外的其它组分,例如间隔子、定位信号和抑制自然发生的DNA或RNA修复机制的组分,以确保期望的编辑结果。术语“核酸识别结构域”是指碱基编辑器的组分,其通过将碱基编辑器引导至预定位置内的靶位点来确保碱基编辑器的位点特异性。利用向导RNA(gRNA)或单链向导RNA(sgRNA)特异性识别细胞系统的核酸分子内的靶序列的核酸识别结构域可以是CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)的合成融合体。
如本文所使用的,“CRISPR核酸酶”是已经在天然CRISPR系统中鉴定出的任何核酸酶,其随后已从其天然环境中分离出来,并且优选地已被修饰或组合成目的重组构建体以适合作为靶向基因组工程的工具。只要原始野生型CRISPR核酸酶提供DNA识别,即结合特性,就可以使用并可选地重编程或突变以适合于根据本发明的各种实施方案。所述DNA识别可以是PAM(前间区临近基序)依赖性的。具有优化和工程设计的PAM识别模式的CRISPR核酸酶可用于特定应用并创建。PAM识别代码的扩展可适合于将位点特异性效应物复合物靶向目标靶位点,而与野生型基于CRISPR的核酸酶的原始PAM特异性无关。CRISPR核酸酶还包含天然存在的CRISPR效应物序列或编码它们的相应序列的突变体或催化活性片段或融合体。CRISPR核酸酶尤其还可以指,在其天然环境中具有核酸内切酶功能的CRISPR多肽的CRISPR切口酶或甚至核酸酶缺陷变体。
术语“核酸编辑结构域”是指碱基编辑器的组件,其启动核苷酸转换以产生所需的编辑。核酸编辑结构域的催化功能可以是胞苷脱氨酶或腺嘌呤脱氨酶功能。
通常,碱基编辑器由至少一个核酸识别结构域和使胞苷或腺嘌呤脱氨基的至少一个核酸编辑结构域组成。使胞苷脱氨基的核酸编辑结构域能够将C转换为T(G转换为A),它们被称为BE;使腺嘌呤脱氨基的核酸编辑结构域可以将A转换为G(T转换为C),它们被称为ABE。
碱基编辑器通常由胞苷脱氨酶结构域(例如,APOBEC1、APOBEC3A、APOBEC3G、PmCDA1、AID)、接头(通常为XTEN)、CRISPR结构域(d/nCas9、dCpf1、CasX、CasY或其他合适的结构域)和尿嘧啶DNA糖基化酶抑制剂(UGI)组成。在经修饰的系统中,UGI结构域或NLS的数量可以变化,接头的长度也可以变化。其还可包括其他结构域,例如,Gam(例如,在BE4中)。存在胞苷脱氨酶结构域中可能存在具有氨基酸点突变的变体,例如YE-BE3、YEE-BE3,其用于不同的编辑窗口,也可能存在用于不同PAM识别的CRISPR结构域突变的变体,例如VQR-BE3、EQR-BE3、VRER-BE3和SaKKH-BE3。在BE-PLUS系统中,CRISPR结构域和胞苷脱氨酶结构域不被表达为融合蛋白,而是使用Suntag系统连接在一起以扩大编辑范围。有关优选碱基编辑器的更多详细信息,包括基于胞苷脱氨酶的DNA碱基编辑器、基于腺嘌呤脱氨酶的DNA碱基编辑器,可以从Eid A等人那里获得(Ayman Eid、Sahar Alshareef和Magdy M.Mahfouz(2018),CRISPR碱基编辑器:无双链断裂的基因组编辑(CRISPR base editors:genomeediting without double-strand breaks),《生物化学杂志》(Biochemical Journal)(2018)475 1955–1964)。
根据本公开,术语“与……缔合”应被广义地解释,因此,根据本发明暗示了,提供一个分子(包含天然存在和/或合成的构建基块的DNA、RNA、氨基酸)与另一个分子物理缔合,该缔合具有共价或非共价性质。例如,修复模板可以与CRISPR核酸酶的gRNA缔合,其中该缔合可具有非共价性质(互补碱基配对),或者该分子可以通过共价键彼此物理连接。
如本文所用的,术语“催化活性片段”是指氨基酸序列,是指衍生自给定模板氨基酸序列的核心序列或编码其的核酸序列,其包含模板序列的全部或部分活性位点,前提是所得到的催化活性片段仍然具有表征模板序列的活性,天然酶或其变体的活性位点负责该模板序列。所述修饰适合于产生较小体积的氨基酸序列,该氨基酸序列仍具有与模板序列相同的活性,从而使催化活性片段成为对空间要求较低的更多功能或更稳定的工具。
“共价连接”或“共价键”是化学键,涉及彼此共价连接的分子或序列的原子之间电子对的共享。“非共价”相互作用与共价键的不同之处在于它不涉及电子共享,而是涉及分子/序列之间或分子/序列内电磁相互作用的更分散的变化。因此,非共价相互作用或附着包括静电相互作用、范德华力、π效应和疏水效应。在核酸分子的上下文中特别重要的是作为静电相互作用的氢键。氢键(H键)是偶极-偶极相互作用的一种特定类型,其涉及部分正氢原子与未共价键合至所述氢原子的高负电性,部分负氧,氮,硫或氟原子之间的相互作用。因此,本文所用的任何“缔合”或“物理缔合”表示共价或非共价相互作用或附着。对于分子复合物,例如,由CRISPR核酸酶、gRNA和修复模板(RT)形成的复合物,可以存在更多的共价和非共价相互作用,以连接并缔合目标分子复合物的不同成分。
术语“CRISPR多肽”、“CRISPR核酸内切酶”、“CRISPR核酸酶”、“CRISPR蛋白”、“CRISPR效应物”或“CRISPR酶”在本文中可互换使用,是指任何天然存在的或人工的氨基酸序列,或编码该序列的核酸序列,作为位点特异性DNA核酸酶或切口酶,其中,“CRISPR多肽”来自任何生物的CRISPR系统,其可以克隆并用于靶向基因组工程。术语“CRISPR核酸酶”或”CRISPR多肽”还包含天然存在的CRISPR效应物序列或编码该序列的相应序列的突变体或催化活性片段或融合体。因此,“CRISPR核酸酶”或”CRISPR多肽”也可以是指例如在其天然环境中具有核酸内切酶功能的CRISPR多肽的CRISPR切口酶或甚至核酸酶缺陷变体。优选地,本发明的公开内容依赖于核酸酶缺陷型CRISPR核酸酶,其仍然具有其固有的由同源CRISPRRNA辅助的DNA识别和结合特性。
本文公开的核酸序列可以是“密码子优化的”。“密码子优化”表示,从供体生物合成产生或分离的DNA或RNA适应于不同受体生物的密码子使用,以提高转录速率、mRNA加工和/或稳定性,以及/或翻译速率,和/或所述重组核酸在目的细胞或生物体中的后续蛋白质折叠。技术人员充分意识到以下事实:由于密码子简并性,靶核酸可以在一个位置被修饰,而这种修饰在翻译后仍会在该位置导致相同的氨基酸序列,这是通过密码子优化实现的,同时考虑了靶细胞或生物体的物种特定密码子使用情况。继而,本文定义的核酸序列可与编码相同蛋白质但已被密码子优化的不同序列具有一定程度的相同性。
如本文所用的,“互补”或“互补性”描述了两个(c)DNA之间、两个RNA之间或RNA与(c)DNA核酸区域之间的关系。由DNA或RNA的核碱基定义,两个核酸区域可以根据锁与钥匙模型相互杂交。为此,Watson-Crick碱基配对的原理分别具有碱基腺嘌呤和胸腺嘧啶/尿嘧啶以及鸟嘌呤和胞嘧啶作为互补碱基。此外,本文所用的术语“互补”也包括非Watson-Crick配对,如反式Watson-Crick、Hoogsteen、反式Hoogsteen和Wobble配对,只要各个碱基对可彼此建立氢键,即,基于所述互补性,两条不同的核酸链可以彼此杂交。
如在本申请的上下文中使用的,术语“约”可以表示所列数值的+/-10%,优选地是所列数值的+/-5%。例如,然后应将约100个核苷酸(nt)理解为介于90和110nt之间的值,优选地介于95和105之间。
本文在原核或真核细胞,优选动物细胞且更优选植物或植物细胞或植物材料的上下文中使用的术语“衍生物”或“子代”或“后代”涉及此细胞或材料的子代,其由自然生殖繁殖(包括有性和无性繁殖)产生。本领域技术人员众所周知,所述繁殖可以导致由自然现象导致的生物体基因组突变,所述自然现象产生的子代或后代在基因组上与亲本有机体或细胞不同,其仍然属于同一属/种,并具有与亲本重组宿主细胞基本相同的特性。由繁殖或再生过程中的自然现象产生的此类衍生物或子代或后代因此被本公开的术语所涵盖,并且当将“衍生物”或“子代”或“后代”与各自的父母或祖先进行比较时,本领域技术人员可以容易地识别。此外,在物质或核酸或氨基酸分子的上下文中且不指复制中的细胞或生物体的术语“衍生物”可表示通过化学和/或生物技术手段衍生自原始物质或分子的物质或分子。所得的衍生物将具有允许技术人员清楚地定义该衍生物源自的原始或母体分子的特征。此外,该衍生物可能具有其他或不同的生物学功能,但原始分子的衍生物或“活性片段”仍将共享母体分子的至少一个生物学功能,及时该衍生物或活性片段可能比亲本序列短/长,并且与各个亲本序列相比可包含某些突变、缺失或插入。
如本文所用的,“真核细胞”是指具有真核、核膜和细胞器的细胞,所述细胞属于原生生物界、植物界、真菌界或动物界中的任何一个。真核生物体可包括单细胞和多细胞生物体。根据本发明的优选真核细胞和生物体是植物细胞。
如本文所用的,“融合体”可以指包含一个或多个非天然序列(例如,部分)的蛋白质和/或核酸。因此,可以以融合分子的形式提供根据本发明的任何核酸序列或氨基酸序列。融合体可以在修饰蛋白的N-末端或C-末端,或两者兼而有之,也可以在分子内作为单独的结构域。对于核酸分子,融合分子可以连接在5'或3'端,或两者之间的任何合适位置。融合体可以是转录和/或翻译融合体。融合体可包含一个或多个相同的非天然序列。融合体可包含一个或多个不同的非天然序列。融合体可以是嵌合体。融合体可包含核酸亲和标签。融合体可包含条形码。融合体可包含肽亲和标签。融合体可以提供如本文所公开的至少一个合成转录因子的亚细胞定位(例如,用于靶向(例如,位点特异性核酸酶)至细胞核的核定位信号(NLS)、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、内质网(ER)滞留信号等)。融合体可以提供可用于追踪或纯化的非天然序列(例如,亲和标签)。融合体可以是小分子,例如生物素;也可以是染料,例如alexa fluor染料、Cyanine3染料、Cyanine5染料。融合体可以提高或降低稳定性。在一些实施方案中,融合体可包含可检测标记,包括可提供可检测信号的部分。可提供可检测信号的合适的可检测标记和/或部分可包括但不限于,酶、放射性同位素、特异性结合对的成员;荧光基团;荧光报道因子或荧光蛋白;量子点等。融合体可包含FRET对的成员,或荧光基团/量子点供体/受体对。融合体可包含酶。合适的酶可包括但不限于,辣根过氧化物酶、荧光素酶、β-25半乳糖苷酶等。融合体可包含荧光蛋白。合适的荧光蛋白可包括但不限于,绿色荧光蛋白(GFP)(例如,来自维多利亚多管发光水母(Aequoria victoria)的GFP、来自鳗鲡(Anguilla japonica)的荧光蛋白,或其突变体或衍生物)、红色荧光蛋白、黄色荧光蛋白、黄绿色荧光蛋白(例如,衍生自cephalochordate Branchiostoma lanceolatum的四聚体荧光蛋白的mNeonGreen),其是多种荧光和彩色蛋白中的任何一种。融合体可包含纳米颗粒。合适的纳米颗粒可包括荧光或发光纳米颗粒,以及磁性纳米颗粒或纳米金刚石,其任选地连接至纳米颗粒。可以检测纳米颗粒的任何光学或磁力特性或特征。融合体可包含解旋酶、核酸酶(例如,Fokl)、核酸内切酶、核酸外切酶(例如,5'核酸外切酶和/或3'核酸外切酶)、连接酶、切口酶、核酸酶-解旋酶(例如,Cas3)、DNA甲基转移酶(例如,Dam)或DNA去甲基化酶、组蛋白甲基转移酶、组蛋白去甲基化酶、乙酰基转移酶(包括例如但不限于,组蛋白乙酰基转移酶)、去乙酰化酶(包括例如但不限于,组蛋白去乙酰化酶)、磷酸酶、激酶、转录(共)激活子、转录(共)因子、RNA聚合酶亚基、转录阻遏物、DNA结合蛋白、DNA结构蛋白、长非编码RNA、DNA修复蛋白(例如,涉及单链和/或双链断裂修复的蛋白,例如,参与碱基切除修复、核苷酸切除修复、错配修复、NHEJ、HR、微同源介导的末端连接(MMEJ)和/或替代性非同源末端连接(ANHEJ)的蛋白,例如但不限于,HR调节子和HR复合物组装信号)、标记蛋白、报告蛋白、荧光蛋白、配体结合蛋白(例如,mCherry或重金属结合蛋白)、信号肽(例如,Tat信号序列)、靶向蛋白或肽、亚细胞定位序列(例如,核定位序列、叶绿体定位序列)和/或抗体表位或其任何组合。
如本文所用的,“基因”是指编码基因产物的DNA区域,以及调控该基因产物的产生的所有DNA区域,无论这些调控序列是否与编码和/或转录序列相邻。因此,基因包括但不限于,启动子序列、终止子、翻译调控序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起始点、基质附着位点和基因座控制区域。
本文所用的术语“基因表达”或“表达”是指将基因中包含的信息转换为“基因产物”。“基因产物”可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA),或是通过翻译mRNA产生的蛋白。基因产物还包括通过诸如加帽、多聚腺苷酸化、甲基化和编辑等过程修饰的RNA,以及通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、肉豆蔻酰化(myristilation)和糖基化修饰的蛋白。
术语“基因激活”或“基因表达(的)增强/激活/上调”是指导致基因产物产量增加的任何过程。基因产物可以是RNA(包括但不限于mRNA、rRNA、tRNA和结构RNA)或蛋白。因此,基因激活包括那些提高基因转录和/或mRNA翻译的过程。提高转录的基因激活过程的实例包括但不限于,促进转录起始复合物形成的那些、提高转录起始速率的那些、提高转录持续性的那些,以及减轻转录阻遏(例如通过阻断转录阻遏物的结合)的那些。基因激活可以构成例如对阻遏的抑制,以及在现有水平之上表达的刺激。提高翻译的基因激活过程的实例包括提高翻译起始的那些、提高翻译延伸的那些,以及提高mRNA稳定性的那些。通常,基因激活包括基因产物产量的任何可检测增加,优选地为基因产物的产量增加约2倍,更优选地为约2倍至约5倍或它们之间的任何整数值,更优选地为约5倍至约10倍或它们之间的任何整数值,更优选地为约10倍至约20倍或它们之间的任何整数值,再更优选地为约20倍至约50倍或它们之间的任何整数值,更优选地为约50倍至约100倍或它们之间的任何整数值,更优选地为100倍或以上。
相反,术语“基因阻遏”或“抑制/阻遏/沉默/下调基因表达”是指导致基因产物产量减少的任何过程。基因产物可以是RNA(包括但不限于,mRNA、rRNA、tRNA和结构RNA)或蛋白。因此,基因阻遏包括减少基因转录和/或mRNA翻译的那些过程。减少转录的基因阻遏过程的实例包括但不限于,抑制转录起始复合物形成的那些、降低转录起始速率的那些、降低转录伸长率的那些、降低转录持续性的那些,以及拮抗转录激活(例如通过阻断转录激活子的结合)的那些。基因阻遏可以造成例如防止激活,以及将表达抑制在现有水平之上。降低翻译的基因阻遏过程的实例包括但不限于,降低翻译起始的那些、降低翻译延伸的那些,以及降低mRNA稳定性的那些。转录阻遏包括基因转录的可逆和不可逆失活。通常,基因阻遏包括基因产物产量的任何可检测的减少,优选地基因产物地产量减少约2倍,更优选地为约2倍至约5倍或它们之间的任何整数值,更优选地为约5倍至约10倍或它们之间的任何整数值,更优选地为约10倍至约20倍或它们之间的任何整数值,再更优选地为约20倍至约50倍或它们之间的任何整数值,更优选地为约50倍至约100倍或它们之间的任何整数值,更优选地为100倍或以上。最优选地,基因阻遏导致基因表达的完全抑制,因此没有可检测的基因产物。
本文使用的术语“遗传构建体”或“重组构建体”、“载体”或“质粒(载体)”(例如,在待引入细胞系统中的至少一个核酸序列的上下文中)是指包括以下内容的构建体:质粒或(质粒)载体、粘粒、人工酵母染色体或细菌人工染色体(YAC和BAC)、噬菌粒、基于细菌噬菌体的载体、表达盒、分离的单链或双链核酸序列(包括DNA和RNA序列(呈线性或环状形式)或氨基酸序列)、病毒载体(包括修饰的病毒),及其组合或混合物,用于引入或转化、转染或转导至根据本发明的任何原核或真核靶细胞(包括植物、植物细胞、器官或材料)。因此,在生物材料(如细胞或载体)中的“重组”是指人工生产的材料。根据本公开的重组构建体可包含核酸或氨基酸序列形式的效应物结构域,其中,效应物结构域代表可以在靶细胞中发挥作用的分子,并且包括转基因、单链或双链RNA分子(包括向导RNA((s)gRNA)、miRNA或siRNA)或氨基酸序列,尤其包括酶或其催化活性片段、结合蛋白、抗体、转录因子、核酸酶(优选位点特异性核酸酶)等。此外,重组构建体可包含调控序列和/或定位序列。重组构建体可以整合到载体(包括质粒载体)中,并且/或者它可以从载体结构中分离出来,例如以多肽序列的形式或作为非载体连接的单链或双链核酸形式存在。引入后,例如通过生物或物理方法进行转化或转染,遗传构建体可以在染色体外存在,即,未整合到靶细胞的基因组中,例如以双链或单链DNA、双链或单链RNA形式或作为氨基酸序列存在。可替换地,根据本公开的遗传构建体或其部分可以稳定地整合到靶细胞的基因组中,包括靶细胞的核基因组或其它遗传元件,包括质体(如线粒体或叶绿体)的基因组。在此使用的术语质粒载体是指最初从质粒获得的遗传构建体。质粒通常是指呈双链核酸序列形式的循环自主复制染色体外元件。在基因工程领域中,通过插入例如编码对抗生素或除草剂具有抗性的基因,以及编码靶核酸序列、定位序列、调控序列、标签序列、标记基因(包括抗生素标记或荧光标记)、可选编码的序列、易于识别的序列等的基因等,对这些质粒进行常规修饰。原始质粒的结构组分(如复制起点)得以保留。根据本发明的某些实施方案,定位序列可包括核定位序列(NLS)、质体定位序列,优选地为线粒体定位序列或叶绿体定位序列。所述定位序列对于植物生物技术领域的技术人员而言是可用的。用于不同目的靶细胞的多种质粒载体是可商购的,并且其修饰是相应领域技术人员公知的。
本文所用的“基因组”既包括基因(编码区域)、非编码DNA,也包括线粒体和/或叶绿体的遗传物质(如果存在)或编码病毒或病毒一部分的基因组材料。生物体的“基因组”或“遗传物质”通常由DNA组成,其中,病毒的基因组可以由RNA(单链或双链)组成。
术语“基因组编辑”、“基因编辑”和“基因组工程”在本文可互换使用,并且是指用于在至少一个位置上对活生物的任何遗传信息或基因组进行靶向特异性修饰的策略和技术。因此,这些术语既包括基因编辑,也包括对除基因组的基因编码区域以外的区域的编辑。它还包括细胞核(如果存在)以及细胞其他遗传信息的编辑或工程化。此外,术语“基因组编辑”、“基因编辑”和“基因组工程”还包括表观遗传编辑或工程化,即,例如非编码RNA进行靶向修饰,例如甲基化、组蛋白修饰,可能引起基因表达的遗传变化。
如本文所用的,“种质”是用于描述遗传资源或更准确地描述生物体的DNA和该物质的集合的术语。在育种技术中,“种质”一词用来表示可以产生新植物或植物品种的遗传物质的集合。
术语“向导RNA”、“gRNA”、“CRISPR核酸序列”、“单链向导RNA”或“sgRNA”在本文中可互换使用,并且是指CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)的合成融合体,或者该术语是指仅由crRNA和/或tracrRNA组成的单个RNA分子,或者该术语是指只包含crRNA或tracrRNA部分的gRNA。因此,tracr和crRNA部分(如果按相应的CRISPR多肽的需要存在)不一定必须存在于一个共价连接的RNA分子上,但是它们也可以由两个单独的RNA分子组成,它们可以缔合或可以通过非共价或共价相互作用而缔合,以提供根据本发明的gRNA。例如,在单个RNA引导的核酸内切酶(如Cpf1)的情况下(参见Zetsche等,2015),crRNA作为单链向导核酸序列可足以介导DNA靶向。
本文使用的术语“杂交”是指互补核酸(即,DNA和/或RNA)的配对,其使用核酸链通过碱基配对与互补链结合以形成杂交复合物的任何方法实现。杂交和杂交强度(即核酸之间缔合的强度)受以下因素影响:核酸之间的互补性程度和长度、所涉及条件的严格性、所形成的杂交体的Tm,以及核酸中的G:C比。术语杂交复合物是指由于互补的G和C碱基之间以及互补的A和T/U碱基之间的氢键的形成而在两个核酸序列之间形成的复合物。可以在两个DNA核酸分子之间、两个RNA核酸分子之间,或DNA和RNA核酸分子之间形成杂交复合物或相应的杂交构建体。对于所有基因座,核酸分子可以是在体外或体内产生的天然存在的核酸分子和/或人工或合成的核酸分子。如上所述的杂交,例如可以在DNA、RNA和DNA/RNA序列之间形成的Watson-Crick碱基对,是由特定的氢键模式决定的,因此该氢键模式表示根据本发明的非共价连接形式。在杂交的情况下,术语“严格杂交条件”应理解为是指主要仅在同源核酸分子之间发生杂交的那些条件。在这方面,术语“杂交条件”不仅是指核酸实际团聚过程中普遍存在的实际条件,而且还指后续洗涤步骤期间普遍存在的条件。严格杂交条件的实例是主要仅那些具有至少70%,优选至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.50%序列相同性的核酸分子进行杂交。严格的杂交条件为:例如,在65℃下4xSSC,随后在65℃下在0.1xSSC下多次洗涤约1小时。如本文所用的,术语“严格杂交条件”还可以意指:在68℃下在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,随后用2×SSC和0.1%SDS在68℃下洗涤两次。优选地,杂交在严格条件下进行。
术语“形态发生”和“形态形成”在本文中通常在基因的上下文中可互换使用,其中,由所述基因编码的基因产物参与形态发生,即,引起生物体形成其形状的生物学过程。该术语还用于直接或间接参与细胞或生物形态发生过程的任何因素,包括合成或天然存在的转录因子。此外,这些术语在导致整个植物再生的细胞途径的上下文中使用。
关于序列或分子的术语“核苷酸”和“核酸”在本文可互换使用,是指天然或合成来源的单链或双链DNA或RNA。因此,术语核苷酸序列用于任何与其长度无关的DNA或RNA序列,因此该术语包括任何核苷酸序列,该核苷酸序列包含至少一个核苷酸,但也包括任何种类的较大的寡核苷酸或多聚核苷酸。因此,该术语是指天然和/或合成的脱氧核糖核酸(DNA)和/或核糖核酸(RNA)序列,其可以任选地包含合成的核酸类似物。根据本公开的核酸可以任选地被密码子优化。密码子优化意味着,DNA或RNA的密码子使用适于目的细胞或生物体的密码子使用,以提高所述重组核酸在目的细胞或生物体中的转录速率。技术人员应充分意识到以下事实:由于密码子简并性,靶核酸可以在一个位置被修饰,而这种修饰在翻译后仍会在该位置导致相同氨基酸序列,这是通过密码子优化考虑靶细胞或生物体的物种特异性密码子使用实现的。根据本申请的核酸序列可对以下非限制性生物体列表进行特定的密码子优化:大麦(Hordeum vulgare)、高粱(Sorghum bicolor)、黑麦(Secale cereale)、黑小麦(Triticale)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setariaitalica)、水稻(Oryza sativa)、小粒野生稻(Oryza minuta)、澳洲野生稻(Oryzaaustraliensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、球茎大麦(Hordeum bulbusum)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、苹果(Malusdomestica)、甜菜(Beta vulgaris)、向日葵(Helianthus annuus)、胡萝卜(Daucusglochidiatus)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucuscarota)、巨桉(Eucalyptus grandis)、Erythranthe guttata、Genlisea aurea、美花烟草(Nicotiana sylvestris)、普通烟草(Nicotiana tabacum)、绒毛状烟草(Nicotianatomentosiformis)、本氏烟(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、拟南芥(Arabidopsis thaliana)、琴叶拟南芥(Arabidopsis lyrata)、Arabidopsis arenosa、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa-pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsuta)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracea)、芜菁(Brassica rapa)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、萝卜(Raphanus sativus)、芝麻菜(Eruca vesicaria sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、大豆(Glycine max)、Gossypium ssp.或毛果杨(Populus trichocarpa)。
如本文所用的,“非天然的”或“非天然存在的”或“人工的”或“合成的”可指未在天然核酸或蛋白中发现的核酸或多肽序列,或任何其他生物分子(如生物素或荧光素)。非天然可以指代亲和标签。非天然可以指融合。非天然可以指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非天然序列可以显示和/或编码也可以通过与非天然序列融合的核酸和/或多肽序列显示的活性(例如,酶活性、转移酶活性、乙酰基转移酶活性、激酶活性、泛素化酶活性等)。非天然核酸或多肽序列可以通过基因工程与天然存在的核酸或多肽序列(或其变体)连接,以产生嵌合核酸,和/或编码嵌合核酸和/或多肽的多肽序列。非天然序列可以指3'杂交延伸序列,或附着于分子的核定位信号(NLS)。因此,本文所用的“合成转录因子”是指包含并非自然界中天然存在的至少两个结构域—识别结构域和激活结构域的分子。
本文所用的“生物体”是指单个的真核或原核生命形式,尤其包括动物、植物、真菌或单细胞生命形式。在本发明的上下文中,生物体优选地是植物或植物的一部分。
如本文所用的,术语“粒子轰击”,也称为“生物弹转染”或“生物弹轰击”或“微粒介导的基因转移”,是指用于将包含目的核酸或遗传构建体的包被微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。微粒或纳米颗粒起射弹的作用,并使用合适的装置(通常称为“基因枪”)在高压下发射到目的靶结构上。通过粒子轰击进行的转化使用覆盖有目的基因的金属微粒,然后使用称为“基因枪”的设备(Sandford等,1987)以足以穿透靶组织的细胞壁但不足以造成细胞死亡的力道和速度将其发射到靶细胞上。对于原生质体,其细胞壁被完全去除,其条件在逻辑上是不同的。至少一个微粒上的沉淀的核酸或遗传构建体在轰击后释放到细胞中,并整合到基因组中,或根据上述定义瞬时表达。微粒的加速是通过高压放电或压缩气体(氦气)来实现的。关于所用的金属颗粒,其必须无毒、无反应,并且其直径小于靶细胞的直径。最常用的是金或钨。从基因枪及涉及到其一般用途的相关系统的制造商和供应商可以公开获得大量信息。
本文所用的术语“植物”或“植物细胞”是指植物生物体、植物器官、分化和未分化的植物组织、植物细胞、种子及其衍生物和后代。植物细胞包括但不限于,例如来自种子的细胞、来自成熟和未成熟细胞或器官的细胞,该成熟和未成熟细胞或器官包括处于不同分化状态的胚、分生组织、幼苗、愈伤组织、叶、花、根、枝、雄或雌配子体、孢子体、花粉、花粉管和小孢子、原生质体、大型藻类和微藻类。不同的真核细胞(例如,植物细胞)可具有任何程度的倍性,即,它们可以是单倍体、二倍体、四倍体、六倍体或多倍体。优选地,本文所使用的植物细胞、植物或植物的一部分源自或属于选自由以下各项所构成的组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、黑麦(Secale cereale)、苹果(Malusdomestica)、二穗短柄草(Brachypodium distachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotianatomentosiformis)、普通烟草(Nicotiana tabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morusnotabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassicanigra)、芝麻菜(Eruca vesicaria subsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Alliumfistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
“启动子”是指能够控制编码序列(即,基因或其部分)或功能性RNA(即,不经翻译而具有活性的RNA)(例如miRNA、siRNA、反向重复RNA或发夹形成RNA)的表达的DNA序列。启动子通常位于基因的5'部分。启动子结构存在于整个生物界中,即,存在于细菌、古细菌和真核生物中,它们具有不同的结构。启动子序列通常由相对于调控序列的近端和远端元件组成,后者通常被称为增强子。启动子可具有广谱活性,但是它们也可具有组织或发育阶段特异性活性。例如,它们可以在根、种子和分生组织细胞等细胞中有活性。启动子可以以组成型的方式有活性,或者可以被诱导。诱导可以被多种环境条件和刺激物刺激。存在强启动子和弱启动子,强启动子可以使调控序列高度转录。通常,启动子受到高度调控。本公开的启动子可包括天然存在于细胞中的内源启动子,或来自另一物种的人工或转基因启动子,或人工或嵌合启动子,即,该组合物中不是天然存在且由不同启动子元件组成的启动子。转录过程始于RNA聚合酶(RNAP)与启动子区域中DNA的结合,而启动子区域紧邻转录起始位点(TSS)。典型的启动子序列被认为包含一些相对于TSS位于特异性位点的序列基序。例如,观察到原核启动子具有两个六聚体基序,其相对于TSS位于-10(Pribnow box)或-35位置处或附近。此外,在-35区域的上游可以有富含AT的UP(上游)元素。原核启动子被σ因子识别为转录因子。真核启动子的结构通常更复杂,并且它们具有几个不同的序列基序,例如TATAbox、INR box、BRE、CCAAT-box和GC-box(Bucher P.,《分子生物学杂志》(J.Mol.Biol.),1990年4月20日;212(4):563-78)。真核细胞具有三个RNAP,分别为聚合酶I、II、III。RNAP I产生核糖体RNA(rRNA),RNAP II产生信使RNA(mRNA)和小核RNA(snRNA),RNAP III产生转移RNA(tRNA)、snRNA和5S-RNA。
如本文所用的,术语“调控序列”是指可指导目的核酸序列的转录和/或翻译和/或修饰的核酸或氨基酸序列。调控序列可包括顺式或反式序列。示例性调控序列包含启动子、增强子、终止子、操纵子、转录因子、转录因子结合位点、内含子等。
本文所用的术语“终止子”是指位于编码序列下游(即,3'方向)的DNA序列,可包括多聚腺苷酸化信号和其他序列,即,编码能够影响mRNA加工和/或基因表达的调控序列的其它序列。多聚腺苷酸化信号的特征通常在于,它在mRNA前体的3'末端添加了聚A-核苷酸。
如本文所用,术语“瞬时”或“瞬时引入”是指根据本公开的至少一个核酸和/或氨基酸序列(优选地并入递送载体和/或重组构建体中)借助或不借助递送载体瞬时引入目标结构,例如植物细胞或细胞系统,其中该至少一个核酸或核苷酸序列在适当的反应条件下引入从而使得该至少一个核酸序列不会整合到目标结构的内源性核酸材料中,基因组作为一个整体使得该至少一个核酸序列不会整合到靶细胞的内源性DNA中。结果,在瞬时导入的情况下,所导入的遗传构建体将不会遗传至目标结构(例如,植物细胞)的后代。该至少一个核酸和/或氨基酸序列或由其转录、翻译、加工、翻译后修饰或复合物构建产生的产物仅是暂时存在的,即以瞬时的方式,以组成型或诱导型形式存在,因此,仅在靶细胞中活跃以在有限的时间内发挥其作用。因此,通过瞬时引入而引入的至少一个序列将不会遗传于细胞的后代。然而,由以瞬时方式引入的至少一个序列或效应物介导的效果可以潜在地遗传给靶细胞的后代。因此,“稳定”的引入意味着将核酸或核苷酸序列整合到目的靶细胞或细胞系统的基因组中,其中,该基因组包括核基因组以及其他细胞器所包含的基因组。
如本文在氨基酸或核酸序列的上下文中所使用的术语“变体”旨在表示基本上相似的序列。对于核酸序列,变体包括在天然多聚核苷酸内的一个或多个内部位点缺失和/或添加一个或多个核苷酸,以及/或者在天然多聚核苷酸内的一个或多个位点取代一个或多个核苷酸。如本文所用的,“天然”多聚核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于核酸序列,保守变体包括那些由于遗传密码的简并性而编码与本公开的参考序列相同的氨基酸序列的序列。因此,给定核酸序列的变体也将包括合成衍生的核酸序列,例如通过使用定点诱变产生,但仍编码与参考序列相同的蛋白的那些。通常,本公开的特定多聚核苷酸的变体将与由本节下面部分进一步描述的序列比对程序和参数确定的特定核酸序列具有至少约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列相同性。
“变体”氨基酸序列、多肽或蛋白(所述术语在本文中可互换使用)是指通过在天然蛋白的一个或多个内部位点处缺失或添加一个或多个氨基酸,和/或在天然蛋白的一个或多个位点处取代一个或多个氨基酸,而衍生自天然氨基酸序列的氨基酸序列。根据本公开的变体氨基酸序列具有生物活性,即,它们仍然拥有天然蛋白的所需生物活性。本公开的天然氨基酸序列的活性变体将与由本节下面部分进一步描述的序列比对程序和参数确定的天然氨基酸序列的氨基酸序列具有至少约65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列相同性。
每当本公开涉及核酸或氨基酸序列彼此的相同性百分比时,这些值都限定为通过用于核酸的EMBOSS Water Pairwise Sequence Alignment(核苷酸)程序(www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html)或用于氨基酸序列的EMBOSSWater PairwiseSequence Alignment(蛋白)程序(www.ebi.ac.uk/Tools/psa/emboss_water/)获得的那些值。如本文所使用的比对或序列比较是指彼此比较的两个序列在全长上的比对。由欧洲生物信息研究所(European Bioinformatics Institute,EBI)欧洲分子生物学实验室(European Molecular Biology Laboratory,EMBL)提供的那些局部序列比对工具使用改良的Smith-Waterman算法(参见www.ebi.ac.uk/Tools/psa/,以及Smith,T.F.&Waterman,M.S.,“常见分子子序列的鉴定(Identification of common molecular subsequences)”,《分子生物学杂志》(Journal of Molecular Biology),1981 147(1):195-197)。进行比对时,会使用EMBL-EBI定义的默认参数。这些参数是(i)用于氨基酸序列:矩阵=BLOSUM62,缺口开放罚分=10,缺口延伸罚分=0.5,或(ii)用于核酸序列:矩阵=DNAfull,缺口开放罚分=10,缺口延伸罚分=0.5。本领域技术人员应充分意识到以下事实:例如,如果相应的序列要在相比于与分子所来源的原始生物体的另一个生物体中使用,则编码蛋白的序列可以“密码子优化”。
具体实施方式
本领域技术人员应当理解,本文描述的方面和实施方案不应被解释为限于公开它们的特定上下文,而是整个说明书中描述的方面和实施方案可以彼此组合,与具体上下文无关。
本发明基于以下发现:通过使用明确定义的合成转录因子(STF)对内源基因的基因表达进行选择性调控,为针对目的基因的特定时间和空间调控提供了合适的工具。反过来,这为优化转化和基因组编辑方法提供了基础,因此在转化/编辑中提供了更高的频率,从而可以改进农业生物技术中的方法。
例如,不使用编码形态发生基因的核苷酸序列(例如BBM和WUS)作为分离的或异源的表达盒,可以使用专门设计的合成转录调控因子,例如TAL效应物或解除武装的CRISPR/核酸酶系统等,诱导内源性形态发生基因的表达以重新编程细胞,并在特定时间点以瞬时方式诱导细胞分裂和再生,而无需将转基因形态发生效应物或编码其的序列引入目的细胞或植物中。这些主要发现被扩展到建立包含至少一个激活或沉默结构域的合成转录因子(STF),从而以可诱导的方式特异性地上调或下调靶基因的表达。接着,所述专门设计的人工STF的直接作用随后被用于多种分子生物学方法中,以协同地从调控作用中受益,以优化转化、基因编辑或靶向沉默,其中,这些方法可用于植物育种和潜在的治疗应用。
在本发明的一个方面,建立了通过使用对BBM和WUS具有特异性的合成转录因子诱导细胞分裂和植物细胞再生从而产生植物的方法,这些发现随后被外推到基于各种合成转录因子的其它方法和用途中。反过来,这些特异性转录因子使得可以提供通过利用对内源性形态发生基因具有特异性的合成转录因子(其在大多数植物物种(包括已知难以进行转化和再生的那些物种或变体)中可重编程细胞并诱导细胞分裂)提高转基因植物转化和/或再生效率的方法,以显著提高各种物种以及各种不同细胞类型(包括那些在标准设置下非常难以进行转化的细胞类型)的转化效率。因此,本发明涉及对目的形态发生基因具有特异性,靶向调控,优选地靶向激活的分子工具,即,本发明设计特异性合成转录因子和编码其的序列,本发明还涉及使用这些特异性合成或人工转录因子以靶向的方式优化基于转化和转染的植物生物技术方法(特别是基于基因组编辑的方法)的方法,或用于优化难以转化的植物细胞的转化速率的方法。
在本发明的上下文中首次证明,基于Cpf1的转录激活系统可以成功地用于植物中以调节内源靶基因的表达。有利地,所提供的手段和方法使得可以靶向具有富含AT的启动子区域的靶内源基因,这在以前是不可能的。通过提供专门设计的向导RNA阵列,该系统易于用于同时靶向多个基因组区域,并且可以在不引入转基因的情况下瞬时调控表达。
一方面,公开了一种合成转录因子(STF)或编码其的核苷酸序列,其可包含至少一个识别结构域和至少一个基因表达调控结构域,特别是至少一个激活结构域,其中,该合成转录因子可配置为调控细胞系统中形态发生基因的表达。
如本文所公开的,对任何内源基因(优选地为形态发生基因)的表达的“调控”包括如上所述的基因激活和基因阻遏。可以通过确定靶基因的表达间接或直接影响的任何参数来测定这种调控。此类参数包括例如,RNA或蛋白水平的变化;蛋白活性的变化;产物水平的变化;下游基因表达的变化;诸如例如荧光素酶、CAT、β-半乳糖苷酶或GFP的报道基因的转录或活性的变化(参见,例如,Mistili&Spector(1997),《自然生物技术》(NatureBiotechnology)15:961-964)。对于形态发生基因,还可以通过视觉手段监测基因表达的调控,包括显微镜检查、植物发育观察等,监测基因表达的任何功能作用的变化。根据本发明的各个方面,如本文所公开的合成转录因子将优选地在转录水平上起作用,并因此将调控至少一个目的基因(优选目的形态发生基因)的转录。在某些实施方案中,可以将至少一个合成转录因子专门设计为上调目的基因(优选目的形态发生基因)的转录。
如本文所用的,“细胞系统”是指包含待修饰目的细胞的全部或部分基因组的至少一个元件。因此,该细胞系统可以是任何体内或体外系统,还包括无细胞系统。因此,该细胞系统包含并提供待以合适方式修饰的靶基因组或基因组序列,即以可遗传修饰或操作的形式。因此,该细胞系统可选自例如真核细胞,包括植物细胞,或者该细胞系统可包含如上定义的遗传构建体,该遗传构建体包含待以高靶向方式修饰的真核细胞的基因组的全部或一部分。该细胞系统可以提供为分离的细胞或载体,或者该细胞系统可由组织、器官、材料或整个生物体中的细胞网络组成(以体内方式或者作为分离的体外系统)。因此,在本文中,细胞系统的“遗传物质”可以理解为生物体基因组的全部或一部分(生物体作为整体或一部分存在于待修饰的细胞系统中)。
一方面,本发明提供了一种细胞系统,其可通过根据上述方面和实施方案中的任何一个所述的方法来获得。
在根据本发明各个方面的一个实施方案中,可以将合成转录因子设计为调控形态发生基因的转录,其中,该形态发生基因可选自由BBM、WUS(Zuo等,2002,《植物学杂志》(Plant J.),30(3):349-359)(包括WUS2(Nardmann和Werr,2006,《分子生物学与进化》(Mol.Biol.Evol.),23:22492-22502))、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5或PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
根据本发明的各个方面和实施方案,该形态发生基因可选自具有以下编码序列的序列:NM_001112491.1(SEQ ID NO:199)、NM_127349.4(SEQ ID NO:200)、NC_025817.2、KT285832.1(SEQ ID NO:201)、KT285833.1(SEQ ID NO:202)、KT285834.1(SEQ ID NO:203)、KT285835.1(SEQ ID NO:204)、KT285836.1(SEQ ID NO:205)、KT285837.1(SEQ IDNO:206)、XM_008676474.2(SEQ ID NO:207)、CM007649.1、NM_103997.4(SEQ ID NO:208)、XM_010675298.2(SEQ ID NO:209)、XM_010675704.2(SEQ ID NO:210)、AB458519.1(SEQ IDNO:211)、AB458518.1(SEQ ID NO:212)、AK451358.1(SEQ ID NO:213)、AK335319.1(SEQ IDNO:214)、KU593504.1(SEQ ID NO:215)或KU593503.1(SEQ ID NO:216)。
在另一个实施方案中,提供了一种合成转录因子,其中该形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一项所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一项所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
特别地,已将Wuschel(WUS)多肽鉴定为在顶端分生组织的起始和维持中发挥关键角色,该分生组织含有一群多能干细胞(Endrizzi等,1996,《植物学杂志》(Plant Journal)10:967-979)。WUS基因的拟南芥植物突变体包含干细胞,这些干细胞被错误指定并且似乎正在分化。WUS编码同源域蛋白,其充当转录调控因子(Mayer等,1998,《细胞》(Cell)95:805-815,US 2004/166563A1)。一般认为,拟南芥芽分生组织的干细胞群体通过促进器官启动的CLAVATA(CLV)基因与干细胞身份鉴定所需的WUS基因之间的调控环得以维持的,其中CLV基因在转录水平上抑制WUS。WUS表达可能足以诱导分生组织细胞鉴定和干细胞标志物CLV3的表达(Brand等(2000),《科学》(Science),289:617-619;Schoof等(2000),《细胞》(Cell)100:635-644)。拟南芥中WUS的组成型表达已经示出会导致叶片不定芽增殖(植物中)(US 2004/166563A1)。
其他WUS/WOX同源盒多肽及编码其的基因是技术人员公知的,并且可以被合成转录因子和/或使用本文公开的方法靶向。WUS同源盒多肽可选自WUS1、WUS2、WUS3、WOX2A、WOX4、WOX5或WOX9多肽(van der Graaff等,2009,《基因组生物学》(Genome Biology),10:248)或其同系物。WUS同源盒多肽可以是单子叶植物WUSAVOX同源盒多肽。在各个方面,WUS同源盒多肽可以是大麦、玉米、小米、燕麦、大米、黑麦、Setaria sp.、高粱、甘蔗、柳枝稷、黑小麦、草皮草或小麦WUSAVOX同源盒多肽。可替换地,WUS同源盒多肽可以是双子叶植物WUS同源盒多肽(参见WO 2017/074547 A1)。
此外,AP2/ERF蛋白质家族是一类植物特异性推定转录因子,已被证明可调控多种发育过程,并且其特征是存在AP2/ERF DNA结合结构域。根据AP2/ERF蛋白包含一个(ERF亚族)还是两个(AP2亚族)DNA结合域,可以将其细分为两个不同的亚族。涉及到多种关键植物细胞功能的AP2家族成员之一是Baby Boom(BBM)蛋白。来自拟南芥的BBM蛋白优先在种子中表达,并且已显示出在调控胚胎特异性途径中起着核心作用。已经表明,BBM的过表达会诱导幼苗上的体细胞胚和子叶样结构的自发形成。参见Boutiler等(2002),《植物细胞》(ThePlant Cell),14:1737-1749。因此,AP2(APETALA2)蛋白家族的成员在胚胎形成过程中促进细胞增殖和形态发生。这种活性在促进植物无融合生殖中具有潜在用途。
根据本发明的另一个形态发生靶标是胚珠发育蛋白2(ODP2)。它也是AP2蛋白家族的成员。本发明的ODP2多肽包含两个预测的APETALA2(AP2)结构域,并且是AP2蛋白家族的成员(PFAM登录号为PF00847)。玉米ODP2多肽的AP2结构域位于SEQ ID NO:2的约氨基酸S273到N343和约S375到R437之间。已证明AP2家族的推定转录因子可调控广泛的发育过程,并且该家族成员的特征是存在AP2 DNA结合结构域。预计该保守核将形成结合DNA的两亲性α螺旋。AP2结构域首先在APETALA2中鉴定,APETALA2是一种调控分生组织身份、花器官规格、种皮发育和花同源异型基因表达的拟南芥蛋白。现在已经在多种蛋白中发现了AP2结构域。
因此,AP2家族的形态发生效应物在各种重要的生物学事件(包括发育、植物再生、细胞分裂等)中起着至关重要的作用,这些形态发生效应物在鉴定和表征新型AP2家族成员并开发调控胚胎形成、转化效率和产量相关性状(包括植物中油含量、淀粉含量等)的新方法的农学发展领域具有重要价值,并且这些形态发生效应物是本发明所述的合成转录因子和相关方法的相关靶标。
已经进行了许多尝试来利用WUS、BBM和其他形态发生基因的调控提高转化效率、刺激植物细胞(包括干细胞)生长、刺激器官发生、刺激体细胞胚形成、诱导无融合生殖,以及为细胞提供阳性选择。刺激器官发生和/或体细胞胚形成的能力可用于产生无融合生殖的植物。无融合生殖具有经济潜力,因为它可以使任何基因型(无论其杂合程度如何)都能繁殖出真正的后代,这个生殖过程可以绕过雌性减数分裂和配子配合,而产生与母本在遗传上相同的胚胎。通过无融合生殖,自适应或杂种基因型的后代将在整个生命周期中保持其遗传保真度。除固定杂种优势外,无融合生殖还可以使无法在生产杂种的有效雄性不育或繁殖力恢复系统的农作物中实现商业化杂种生产。无融合生殖可以使杂交发育更加有效。它还简化了杂交生产,并增加了雄性不育性良好的植物物种的遗传多样性。
尽管如此,目前调控植物细胞内源性形态发生基因库的所有方法仍依赖于提供编码目的形态发生基因的基因来过表达相应的形态发生基因。因此,当前的方法依赖于目的形态发生基因的稳定或瞬时引入和/或过表达。相反,本发明确定了一种解决方案,专门设计合成转录因子来调控目的形态发生基因的转录水平,优选以瞬时和/或可调节的方式,而无需引入形态发生基因产物的外源性转基因序列或编码该产物的序列。这位提供用于提高植物(甚至难以进行转化的植物)转化效率的方法,例如,复杂基因组编辑方法,以及提供用于提高单倍体或双单倍体生物体或细胞系统的方法奠定了基础。
各种不同的分子均可用作根据本发明的所述至少一个识别结构域。根据本文公开的各个方面和实施方案,识别结构域代表蛋白结构域(任选地作为融合分子),其具有位点特异性DNA识别并因此具有结合和/或相互作用活性。识别结构域可以是天然存在的蛋白的结构域,或者该识别结构域可以是此蛋白的片段。优选地,所述至少一个识别结构域已经被特异性地工程化,以优化其结合至目标形态发生基因的区域或目标形态发生基因周围的区域的靶标特异性。
根据本发明,可以使用一个以上的识别结构域来提高靶标特异性和/或结合特征,从而优化对至少一个目的形态发生基因的调控。
在一个实施方案中,合成转录因子可包含选自由至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌指结构域和至少一个解除武装的归巢核酸内切酶或其任何组合所构成的组的分子的至少一个识别结构域或片段。
在另一个实施方案中,合成转录因子可包含选自CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCasX系统或CRISPR/dCasY系统或其任何组合的至少一个解除武装的CRISPR/核酸酶系统,其中该至少一个解除武装的CRISPR/核酸酶系统(如果存在)包含至少一个向导RNA。
天然存在的DNA结合转录因子通常至少包含两个结构域:DNA结合结构域(DBD)和转录激活结构域(TAD)(Latchman,2008;Ptashne和Gann,2002)。
黄单胞菌属(genus Xanthomonas)中植物病原细菌的TAL效应物,通过结合宿主DNA并激活效应物特异性宿主基因,在疾病或触发防御中起重要作用(参见例如,Gu等(2005),《自然》(Nature),435:1122;
Figure BDA0002643914670000291
等(2007),《科学》(Science),318:645)。特异性取决于不完整的效应物可变数目,通常是34个氨基酸重复(Schornack等(2006),《植物生理学》(J.Plant Physiol.),163:256)。多态性主要在重复位置12和13处,其在本文中称为重复可变双残基(RVD)。TAL效应物的RVD以直接、线性的方式对应于其靶位点的核苷酸,一个RVD对应一个核苷酸,但具有一定的简并性,并且没有明显的背景依赖性。这一发现代表了一种蛋白质-DNA识别的有价值机制,该机制能够预测新的靶标特异性TAL效应物的靶位点。因此,TAL效应物可以在研究和生物技术中用作靶向嵌合核酸酶,促进GE方法的同源重组。TAL效应物本身不包含核酸酶结构域。所谓的转录激活因子样效应物核酸酶(TALEN)代表结合TAL效应物功能和核酸酶功能以允许插入位点特异性DNA裂解的人工或合成分子。例如,TAL效应物可以通过C-末端核定位结构域进入宿主细胞核,并且可以通过与宿主基因的启动子区域中的效应物结合元件结合而特异性地激活相应的宿主基因。高度保守的33-35个氨基酸重复序列的中央结构域(每个重复序列均在位置12和13包含高变二核苷酸或RVD)负责识别特异性宿主基因启动子序列。每个TAL效应物都以右旋超螺旋缠绕在DNA周围,从而将每个RVD的第二个残基置于主沟中,并与正向链中的单个核苷酸接触。这些相互作用限定了每种TAL效应物的特异性。然后,C-末端酸性激活结构域可能通过直接结合宿主RNA聚合酶复合物来激活或增强相应内源基因的表达。
TAL效应物识别特异性DNA序列的模块化机制使得可以在TAL效应物的识别结构域中鉴定和设计人工重复阵列,从而设计能够特异性诱导目的内源基因表达的TAL效应物。
天然TALE的基因组靶位点的计算分析表明,转录起始位点(TSS)周围-300至+200bp的表观核心启动子区域优先出现(Grau等,PLoS Comput Biol.,2013;9)。先前基于TALE AvrBs3、AvrXa7和AvrXa27的研究表明,它们将靶基因的天然TSS移至TALE与DNA结合的位置下游40–60bp附近。将Bs3启动子中的AvrBs3-box移到更上游的位置会导致TSS随之向上游移动。这些观察结果表明,TALE控制着与TATA结合蛋白功能类似的转录的发生和位置(Kay等,《科学》(Science),2007;318:648–651)。
因此,根据本发明的各个方面和实施方案,TAL效应物结合结构域表示合适的识别结构域,因为可以针对目的靶位点微调结合和识别特异性。因此,可以以高靶向性的方式调控目的形态发生基因的表达,优选地为转录,因为可以将至少一种定制的TAL效应物设计为合成转录因子的至少一个识别结构域。
TAL效应物在其自然环境中起异源转录因子作用(Yang等,2006),通过细菌III型分泌系统递送到宿主细胞中(Szurek等,2002),在宿主细胞中C-末端核定位信号将它们引导至细胞核(Gurlebeck等,2005;Szurek等,2001、2002;Van den Ackerveken等,1996;Yang和Gabriel,1995)。高度保守的33-35个氨基酸重复序列的中央结构域(每个重复序列在12和13位含有高变残基(RVD))引导识别称为效应物结合元件(EBE)的特异性宿主基因启动子序列(Boch等,2009;Moscou和Bogdanove,2009)。每个TAL效应物将DNA包裹在右手超螺旋中,将每个RVD的第二个残基定位在大沟中,并与正向链中的单个核苷酸接触(Deng等,2012;Mak等,2012)。这些相互作用以可预测的方式共同定义了构成EBE的相邻核苷酸的数量和身份。然后,C-末端酸性激活结构域(AD)可能通过直接与宿主RNA聚合酶复合物结合来激活或增强转录(参见Hummel等,《分子植物病理学》(Molecular Plant Pathology),2017,18(1),55-66)。
与现有技术的教导相反,本发明部分基于以下发现:对位于相对于目的基因(优选为形态发生基因,例如BBM和WUS)的起始密码子的特异性上游或下游位置的内源性核苷酸序列具有特异性的基于合成TAL效应物的转录因子、基于解除武装的ZFP的转录因子,或基于解除武装的CRISPR的转录因子,可诱导植物细胞在所述基因的转录和表达,从而提高此植物的再生频率。值得注意的是,如果靶向TATA-box以外的非经典调控区域或启动子区域,则可以提高该效率,而天然存在的转录因子以及可商购的转录因子通常通过结合至目的基因的启动子区域内的区域来发挥其功能。有证据表明,与直接靶向TATA区域相比,靠近TATAbox的转录激活更高。因此,基于各种不同的TAL效应物、CRISPR、锌指或归巢核酸内切酶识别结构域的本发明的转录因子包括不同的结构,从而使得可以更好和更精确地调控和调节目的形态发生基因。
因此,本发明的合成转录因子和方法的一个优点是,如果正确地设计为包括最佳识别和激活区域,则合成转录因子也可以作用于无TATA的基因上或TATA区域之外。在某些实施方案中,至少一个识别结构域也可靶向目的基因的TATA区域。
例如,TAL效应物DNA结合结构域可以对靶DNA具有特异性,其中,该DNA结合结构域包含多个DNA结合重复序列,每个重复序列包含决定靶DNA中碱基对识别的RVD,其中,每个DNA结合重复序列负责识别靶DNA中的一个碱基对,并且其中,TALEN包含以下RVD中的一个或多个:HD,用于识别C;NG,用于识别T;NI,用于识别A;NN,用于识别G或A;NS,用于识别A或C或G或T;N*,用于识别C或T;HG,用于识别T;H*,用于识别T;IG,用于识别T;NK,用于识别G;HA,用于识别C;ND,用于识别C;HI,用于识别C;HN,用于识别G;NA,用于识别G;SN,用于识别G或A;以及YG,用于识别T。TALEN可包含以下RVD中的一个或多个:HA,用于识别C;ND,用于识别C;HI,用于识别C;HN,用于识别G;NA,用于识别G;SN,用于识别G或A;YG,用于识别T;和NK,用于识别G,以及以下中的一个或多个:HD,用于识别C;NG,用于识别T;NI,用于识别A;NN,用于识别G或A;NS,用于识别A或C或G或T;N*,用于识别C或T;HG,用于识别T;H*,用于识别T;以及IG,用于识别T。
锌指蛋白(ZFP)是可以以序列特异性方式与DNA结合的蛋白。锌指首次在非洲爪蟾(Xenopus laevis)的卵母细胞的转录因子TFIIIA中鉴定出。表征这些蛋白质的一类(Cys2His2类)的示例性基序是Xaa-Cys-Xaa-Cys-Xaa-His-Xaa-His(SEQ ID NO:313),其中Xaa是任何氨基酸。这些蛋白的单个指具有简单的ββα结构,可围绕中心锌离子折叠,而串联的指可沿DNA的大沟接触3–4个碱基对的相邻亚位点(Pabo等(2001),“新型Cys2His2锌指蛋白的设计与选择(Design and selection of novel Cys2His2 zinc finger proteins)”,《生物化学年鉴》(Ann.Rev.Biochem.),70:313–40)。单个锌指结构域的长度约为30个氨基酸,一些结构研究表明,其包含一个β转角(包含两个不变的半胱氨酸残基)和一个α螺旋(包含两个不变的组氨酸残基),并由两种胱氨酸和两种组氨酸通过锌原子的配位而保持一种特殊的构象。几种其它类别的锌指蛋白也是已知的,例如,包含由位于N-末端的β发夹和位于C-末端的α-螺旋(它们各自为锌结合提供两个配体)组成的基序的高音谱号类(treble-clef class),尽管N-末端的β发夹和C-末端的α-螺旋之间可能存在不同长度或构型的环和第二个β发夹,或褶皱特征为两个β发夹形成两个结构相似的锌结合亚位点的锌带状ZFP。
出于基因组编辑(GE)的目的,分子生物学技术可用于改变锌指的DNA结合特异性,而这种工程化锌指的串联重复序列可用于靶向所需的基因组DNA序列(Jamieson等,“工程化锌指蛋白的药物发现(Drug discovery with engineered zinc-finger proteins)”,《自然综述·药物发现》(Nature Reviews.Drug Discovery),2(5):361–8)。将第二个蛋白结构域(如转录激活子或阻遏物)融合到结合在给定基因启动子附近的一系列工程化锌指上,可用于改变该基因的转录。工程化锌指阵列与切割或以其他方式修饰DNA的蛋白结构域之间的融合也可用于将那些活性靶向所需的基因组位点。工程化锌指阵列的最常见应用包括锌指转录因子和锌指核酸酶。典型的工程化锌指阵列具有3至6个单独的锌指基序,并结合长度为9个碱基对(bp)到18bp的靶位点。
大范围核酸酶是特征为具有较大识别位点(12至40个碱基对的双链DNA序列)的内切脱氧核糖核酸酶。因此,该位点在任何给定的基因组中通常仅出现一次。大范围核酸酶可用于在哺乳动物细胞和植物中实现很高水平的基因靶向效率(Rouet等,《分子细胞生物学》(MoI.Cell.Biol.),1994,14,8096-106;Choulika等,《分子细胞生物学》(MoI.Cell.Biol.)1995,15,1968-73)。在大范围核酸酶中,归巢核酸内切酶的LAGLIDADG家族在过去几年中已成为研究基因组和基因组工程的重要工具。
解除武装(即,核酸酶缺陷)的归巢核酸内切酶(HE)代表根据本发明的合适类别的识别结构域。HE是广泛的天然大范围核酸酶家族,包括数百种蛋白(Chevalier和Stoddard,《核酸研究》(Nucleic Acids Res.),2001,29,3757-74)。这些蛋白由可移动的遗传元件编码,并通过称为“归巢”的过程传播:核酸内切酶切割不存在可移动元件的同源等位基因,从而刺激同源重组事件,将可移动的DNA复制到受体基因座中(Kostriken等,《细胞》(Cell);1983,35,167-74;Jacquier和Dujon,《细胞》(Cell),1985,41,383-94)。鉴于它们的天然功能以及在功效和特异性方面的卓越裂解特性,HE提供了理想的支架以衍生出用于基因组工程的新型核酸内切酶。HE的一个家族称为LAGLIDADG家族。LAGLIDADG(SEQ ID NO:314)指整个家族中实际上保守的唯一序列,并且在该蛋白中以一个或(更经常地)两个拷贝被发现。具有单一基序的蛋白(例如,I-Crel)形成同型二聚体,并切割回文或假回文DNA序列,而较大的双基序蛋白(例如,l-Scel)是单体,并裂解非回文靶标。已经结晶了七个不同的LAGLIDADG蛋白,它们表现出非常惊人的核心结构保守性,这与在一级序列水平上缺乏相似性形成了鲜明的对比(Jurica等,《分子细胞》(Mol.Cell.),1998,2,469-76;Chevalier等,《自然结构与分子生物学》(Nat.Struct.Biol.),2001,8,312-6;Chevalier等,《分子生物学杂志》(J.MoI.Biol.),2003,329,253-69)。对与其天然靶标结合的l-Cre结构的分析表明,在每个单体中,八个残基(Y33、Q38、N30、K28、Q26、Q44、R68和R70)与七个碱基在±3、4、5、6、7、9和10处建立直接相互作用(Jurica等,1998)。此外,一些残留与几个碱基建立了水介导接触;例如,位置8和-8处的S40和N30和碱基对(Chevalier等,2003)。催化核心是中心,由两个对称单体/结构域组成。具有修饰的切割位点的HE是本领域技术人员公知的,并且可用于将解除武装的HE定义为根据本发明的至少一个识别结构域。
根据本发明的各个方面和实施方案,锌指蛋白和从其衍生的结构域可以用作至少一个识别结构域,该至少一个识别结构域可设计为实现根据本发明的合成转录因子的识别特性。
除TAL效应物、解除武装的ZFP和大范围核酸酶外,非功能性CRISPR/核酸酶系统也可用于特异性靶向形态发生基因,并促进植物细胞的再生。在这些系统中,使用CRISPR核酸酶,例如Cas9、Cfp1、CasX和/或CasY,其中,核酸酶活性已关闭,以避免切割目标基因组序列。非功能性CRISPR/核酸酶系统的靶特异性由对目的内源性形态发生基因的上游核苷酸启动子区域具有特异性的crRNA和/或sgRNA确定。然后,与CRISPR/核酸酶系统融合的激活结构域将转录机制募集到基因基因组,从而诱导目的内源性形态发生基因的表达。值得注意的是,使用至少一个向导RNA可以显著提高靶特异性,因为这种CRISPR核酸序列还有助于识别目的基因组靶DNA。此外,解除武装的CRISPR核酸酶和向导RNA的双重识别特性使得在设计根据本发明的合成转录因子识别结构域时可以具有更高程度的灵活性,这反过来又提供了对目的形态发生基因的更好的识别以及因此更好的调控活性。
在本发明的优选实施方案中,该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
CRISPR系统在其天然环境中描述了一种分子复合物,该分子复合物包含与Cas核酸酶或另一个CRISPR核酸酶(如Cpf1核酸酶(Zetsche等,2015,同上))组合的至少一个小型单个非编码RNA,其可产生特异性DNA双链断裂。目前,CRISPR系统分为2类,包括五种类型的CRISPR系统,例如,使用Cas9作为效应物的II型系统和使用Cpf1作为效应物分子的V型系统(Makarova等,《然微生物学综述》(Nature Rev.Microbiol.),2015)。在人工CRISPR系统中,合成非编码RNA和CRISPR核酸酶和/或可选地修饰的CRISPR核酸酶(进行修饰以充当切口酶或缺乏任何核酸酶功能),可与结合crRNA和/或tracrRNA的功能的至少一个合成或人工向导RNA或gRNA一起使用(Makarova等,2015,同上)。在天然系统中由CRISPR/Cas介导的免疫应答需要CRISPR-RNA(crRNA),其中,这种控制CRISPR核酸酶特异性激活的向导RNA的成熟度在迄今已被鉴定的各种CRISPR系统之间存在显著差异。首先,将侵袭性DNA(也称为间隔子)整合到CRISPR基因座近端的两个相邻重复区域之间。例如,II型CRISPR系统可以将Cas9核酸酶编码为干扰步骤的关键酶,该系统既包含crRNA,也包含反式激活RNA(tracrRNA)作为向导基序。这些杂交并形成双链(ds)RNA区域,其被RNAseIII识别,并可以被切割以形成成熟的crRNA。然后,这些反过来又与Cas分子缔合,以便将核酸酶特异性地引导至靶核酸区域。重组gRNA分子既可包含可变DNA识别区域,也可包含Cas相互作用区域,因此可以独立于特异性靶核酸和所需的Cas核酸酶进行专门设计。作为另一个安全机制,靶核酸区域中必须存在PAM(与前间隔序列相邻的基序);这些是直接来自Cas9/RNA复合物识别的DNA的DNA序列。酿脓链球菌Cas9的PAM序列已被描述为“NGG”或“NAG”(标准IUPAC核苷酸代码)(Jinek等,“适应性细菌免疫中的可编程双RNA向导的DNA核酸内切酶(Aprogrammable dual-RNA-guided DNAendonuclease in adaptive bacterial immunity)”,《科学》(Science)2012,337:816-821)。金黄色葡萄球菌Cas9的PAM序列是“NNGRRT”或“NNGRR(N)”。其它变体CRISPR/Cas9系统也是已知的。因此,脑膜炎双球菌Cas9在PAM序列NNNNGATT处裂解。嗜热链球菌Cas9在PAM序列NNAGAAW处裂解。最近,已经描述了用于弯曲杆菌的CRISPR系统的另一种PAM基序NNNNRYAC(WO 2016/021973A1)。对于Cpf1核酸酶,已经描述了,与Cas9系统识别的通常富含G的PAM相比,没有tracrRNA的Cpf1-crRNA复合物可有效识别和切割由富含短T的PAM进行的靶DNA(Zetsche等,同上)。此外,通过使用修饰的CRISPR多肽,可获得特定的单链断裂。Cas切口酶与各种重组gRNA的组合使用还可通过双DNA切口诱导高度特异性DNA双链断裂。此外,通过使用两个gRNA,可以优化DNA结合以及DNA切割的特异性。同时,最初针对细菌描述的其它CRISPR效应物(如CasX和CasY效应物)是可用的,并且代表了其它效应物,其可用于基因组工程目的(Burstein等,“来自未培养微生物的新型CRISPR-Cas系统(NewCRISPR-Cas systems from uncultivated microbes)”,《自然》(Nature),2017,542,237-241)。
目前,例如,已经修饰了依赖Cas9的II型系统或其变体或任何嵌合形式作为核酸内切酶,用于基因组工程。合成CRISPR系统由两个部分组成,一个是“向导RNA”(gRNA),在本文中也称为“单链向导RNA”(sgRNA)或“CRISPR核酸序列”;另一个是非特异性CRISPR相关核酸内切酶,该合成CRISPR系统可用于通过共表达对待靶向基因具有特异性且能够与核酸内切酶Cas9缔合的gRNA而产生敲除细胞或动物。值得注意的是,gRNA是一种人工分子,其包含与Cas或任何其它CRISPR效应蛋白或其变体或催化活性片段相互作用的一个结构域,以及与目的靶核酸相互作用并因此代表crRNA和tracrRNA的合成融合体(作为“单链向导RNA”(sgRNA)或简称“gRNA”)的另一个结构域。该基因组靶标可以是约20个核苷酸DNA序列,前提是该靶标应紧邻PAM序列的上游。PAM序列对于目标结合非常重要,确切的序列取决于Cas9的种类,并例如读取酿脓链球菌衍生的Cas9的5'NGG 3'或5'NAG3'(标准IUPAC核苷酸代码)(Jinek等,《科学》(Science),2012,同上)。金黄色葡萄球菌Cas9的PAM序列为NNGRRT或NNGRR(N)。许多其他变体CRISPR/Cas9系统也是已知的,尤其包括切割PAM序列NNNNGATT的脑膜炎双球菌Cas9。切割PAM序列NNAGAAW的嗜热链球菌Cas9。使用修饰的Cas核酸酶,可以将靶向单链断裂引入目标靶序列中。可以使用双切口系统引入这种Cas切口酶与不同重组gRNA高位点特异性DNA双链断裂的组合使用。使用一种或多种gRNA还可提高总体特异性并减少脱靶效应。
为了本发明的目的,特别感兴趣的Cas或Cpf1核酸酶的第三变体是核酸酶缺陷的Cas9(dCas9)或dCpf1(Qui等,2013,《细胞》(Cell),154,442-451)。Cas9的HNH结构域中的H840A突变和RuvC结构域中的D10A突变使切割活性失活,但不能阻止DNA结合(Gasiunas等,2012,《美国科学院院报》(Proc.Natl.Acad.Sci.U.S.A.)111,E2579-2586)。因此,如果正确配置,这些变体可以修改用于序列特异性靶向基因组的区域而不切割。
如Tang等所述,Cpf1可衍生自例如氨基酸球菌属(Acidaminococcus sp.)BV3L6(AsCpf1),或衍生自Lachnospiracea bacterium ND2006(LbCpf1)(Tang等(2017),用于植物中的有效基因组编辑和转录阻遏的CRISPR/Cpf1系统(ACRISPR/Cpf1 system forefficient genome editing and transcriptional repression in plants),《自然植物》(Nature Plants),3:17018)。优选的dLbCpf1变体由SEQ ID NO:282-284和SEQ ID NO:288-290表示。
CRISPR/Cpf1系统可靶向富含AT的启动子区域,并且可用于多种作物植物。由于Cpf1的RNAse活性能够处理单个转录物的多个crRNA,因此基于Cpf1的转录调控系统比众所周知的基于Cas9的系统具有优势,可以轻松应用于多重基因调控。
在本发明的各方面的优选实施方案中,因此,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
基于Cpf1的转录调控系统具有高度特异性和灵活性,并可以通过使用靶向多个基因组区域的向导RNA阵列来同时激活/抑制多个基因。此外,基于Cpf1的系统无需引入目的基因的外源多聚核苷酸或多肽序列即可实现提高基因表达。因此有可能在无转基因的环境中瞬时诱导内源基因的基因表达。此外,基于Cpf1的系统提供了靶向富含AT的序列的手段,这是已知的对富含GC的区域表现出强烈偏好的基于Cas9的转录调控系统迄今所无法实现的。因此,该系统为植物细胞中目的内源性靶基因的转录激活和/或抑制提供了强大的工具。其使用方便,且适于同时靶向多个基因。重要的是,这是首次示出基于Cpf1的转录激活在植物细胞中起作用。尽管现有技术描述了拟南芥中基于Cpf1的基因抑制,但尚未在植物中显示出基于Cpf1的转录激活,这表明,由转录激活结构域替换转录抑制结构域并不简单,并且需要对正确的接头和激活结构域序列进行精心的配置和测试。
在根据本发明的各个方面的一个实施方案中,该识别结构域可包含CRISPR复合物的至少一个gRNA。在某些实施方案中,可以存在一个以上gRNA,例如,可以使用一系列gRNA。单个细胞或细胞系统中多个向导RNA的表达,例如两个、三个、四个、五个或更多个gRNA的表达,可实现内源性基因靶标的协同调控,从而实现在宽动态范围上内源基因表达的组合调控,因为如果根据本发明的STF可为STF提供额外的靶特异性并减少脱靶效应,则该至少一个gRNA作为识别部分,特别是在STF设计为靶向较大真核基因组中的基因时。每个gRNA均可靶向独立的调控/识别区域。
在根据本发明的各个方面的一个实施方案中,合成转录因子可配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
如本文所用的,“调控区域”是指至少一个识别结构域与基因组中目的形态发生基因处或附近的靶序列的结合位点。取决于本文进一步公开的至少一个激活结构域和至少一个识别结构域的性质,可存在两个离散调控区域,或可存在重叠调控区域,本发明的合成转录因子的不同结构域可以以模块化的方式进行组装。
在某些实施方案中,该至少一个识别结构域可靶向相对于目的基因的起始密码子的至少一个序列(识别位点),该序列可以是至少1000bp,相对于目的基因起始密码子的上游(-)或下游(+)-700bp至+700bp、-550bp至+500bp或-550bp至+425bp。在某些实施方案中,识别启动子附近的识别结构域可能是优选的,而这表示了本发明的特异性STF的优点,即,STF的靶向范围比常规或天然存在的TF进行了高度扩展。由于识别和/或激活结构域可以被专门设计和构建以特异性识别和靶向调控的热点。
在某些实施方案中,该至少一个识别位点可以是相对于目的基因的起始密码子-169bp至-4bp、-101bp至-48bp、-104至-42bp或-175至+450bp(上游(-)或下游(+)),以提供最佳的空间结合环境,从而实现最佳的调控(优选地是转录激活)活性。特别是对于根据本发明的基于CRISPR的合成转录因子,其与作为识别部分的向导RNA一起起作用,该结合位点也可位于目的基因的编码区域内(目的基因的起始密码子的下游)。
在本发明的合成转录因子的其他实施方案中,识别结构域可结合至目的基因的5'和/或3'非翻译区域(UTR)。在实施方案中,在采用不同的识别结构域的情况下,至少两个识别结构域可结合至目的形态发生基因的不同靶区域,包括5'和/或3'UTR,但是它们也可以在基因区域之外结合,但是仍然在最多1到1500bp的特定距离内。可以结合识别结构域的一个优选区域位于目的形态发生基因的起始密码子上游约-4bp至约-300bp,优选地约-40bp至约-170bp。值得注意的是,由于至少一种gRNA在所述STF中的附加功能,因此本文公开的某些STF,尤其是基于CRISPR的STF,具有更大的识别位点灵活性。
根据本文提出的各个方面和实施方案,因此,目的基因组中的识别结构域和相应地识别位点的长度可取决于STF和所应用的识别结构域的性质而变化。基于至少一个识别结构域的分子特征,这还将确定相应的至少一个识别位点的长度。例如,在单个锌指可以为约8bp至约20bp,其中三至六个锌指基序之间的阵列可能是优选的,在这种情况下,单个TALE识别位点可以为约11至约30bp,或更多。基于CRISPR的STF的gRNA的识别位点包含与目的基因组区域杂交的gRNA的靶向序列或“间隔子”序列,而gRNA包含其他结构域,包括与根据本发明的解除武装的CRISPR效应物相互作用的结构域。基于解除武装的CRISPR效应物的STF的识别位点将包含一个PAM基序,因为PAM序列对于任何CRISPR效应物的靶标结合都是必需的,确切的序列取决于CRISPR效应物(即,本文公开的解除武装的CRISPR效应物)的种类。
在本发明的各个方面的一个实施方案中,该合成转录因子可包含至少一个激活结构域,其中,该至少一个激活结构域可选自由酸性转录激活结构域所构成的组,优选地,其中,该至少一个激活结构域可来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。为了增强对至少一个目的形态发生基因的调控,可存在两个、三个、四个、五个或五个以上激活结构域。在本发明的优选实施方案中,该激活结构域是VPR(SEQ ID NO:276)。
VP16是最初在1型单纯疱疹病毒(HSV)中发现的转录因子,与病毒即早基因的激活有关(Flint和Shenk,1997;Wysocka和Herr,2003)。VP16野生型序列具有490个氨基酸,在其中心区域具有间接DNA结合所需的核心结构域,以及位于其最后81个氨基酸内的羧基末端TAD(Greaves和O'Hare,1989;Triezenberg等,1988)。VP16最初包含在HSV的病毒体(病毒颗粒)中,并在感染后释放到动物细胞中。VP16首先通过其核心结构域与宿主核蛋白HCF结合,然后与另一个宿主核蛋白Oct-1结合以形成三组分蛋白复合物。然后,该复合物在即早基因的启动子中与其靶DNA序列TAATGARAT(R为嘌呤)结合。这是通过Oct-1与靶DNA序列或重叠该序列的5'部分的共有八聚体基序之间的相互作用实现的。然后,HCF稳定VP16和Oct1之间的相互作用。一旦被募集为即早基因中,VP16通过TAD和其他转录因子之间的相互作用激活基因(Hirai等,《国际发育生物学杂志》(Int.J.Dev.Biol.),2010,54(11-12):1589-1596)。同时,原始的VP16结构域已被广泛用于使用人工或合成转录因子进行各种研究。通常,以单个形式或例如以三联(VP48)或作为VP16的10x串联拷贝(VP160)的形式包含VP16的最小激活结构域的核心结构域被用于这些目的。
水稻白叶枯病菌的TAL效应物基因的天然激活结构域是与TAL转录因子一起使用的最明显的激活结构域,并且也代表根据本发明的各个方面可单独或组合使用的一个激活结构域,但也已用于其他设置。它们属于酸性(转录)激活结构域家族。
SAM(协同激活介体)激活结构域通常由三个组分组成:通常与VP64融合体组合的溶核失活/灭活的CRISPR核酸酶、在四环和茎环处结合了两个MS2 RNA适体的向导RNA,以及MS2-P65-HSF1激活辅助蛋白(Konermann等,2015,“工程CRISPR-Cas9复合物进行的基因组规模转录激活(Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex)”,《自然》(Nature)517:583–588)。因此,向导RNA可包含两个拷贝的MS2噬菌体RNA发夹,该拷贝与RNA结合蛋白(RBP)MCP(MS2外壳蛋白)相互作用。
SAM系统采用多种转录激活子来产生协同效应,这使SAM系统成为单独使用或与用于根据本发明的合成转录因子的其他激活结构域结合使用的高通用性激活结构域。在优选的实施方案中,其中,该合成转录因子使用基于CRISPR的识别结构域,可以进一步工程化向导RNA,以优化激活和识别结构域之间的相互作用。
根据本发明单独或组合使用的另一个激活结构域是与串联连接的目的识别结构域融合的三方效应物VPR(VP64、p65和Rta)(Russa和Qi,《分子细胞生物学》(Mol.Cell.Biol.),2015年11月;35(22):3800–3809)。已显示使用VPR激活结构域会导致哺乳动物细胞中GFP表达的转录激活超过20倍(Liu等(2017),使用基于可调节CRISPR/Cpf1的转录因子进行细胞信号传导(Engineering cell signaling using tunable CRISPR/Cpf1based transcription factors),《自然-通信》(Nature Communications),8(1):2095)。
根据本发明单独或组合使用的又一个激活结构域是将例如VP64的多个拷贝募集到特定向导RNA(可选地与其它激活子一起)的“Scaffold”(Chavez等,《自然方法》(Nat.Methods),2016,13(7),563-567)。
根据本发明单独或组合使用的另一个激活结构域是包含重复肽阵列的“Suntag”,其可通过将转录激活结构域的多个拷贝募集到本发明的合成转录因子的核酸酶缺陷型识别结构域中而募集抗体融合蛋白的多个拷贝,从而产生强有效的合成转录因子(Tanenbaum等,《细胞》(Cell),2014,159(3):635-46)。
在另一个实施方案中,可以使用SAM激活结构域系统,特别是SAM修饰的向导RNA,与suntag激活结构域一起,将与例如VP64连接的具有所需特异性的单链可变片段(scFv)募集到识别结构域的一端,同时将p65-hsf1募集到基于CRISPR的合成转录因子的向导RNA。scFvs,本身不代表激活子,具有极高的特异性和靶标识别多功能性,可以进行工程改造,所以非常适于将目的激活子的多个拷贝募集到目的位置,即,根据本发明的各个方面和实施方案,scFv可与本文公开的激活结构域一起用作放大器。
根据本发明单独或组合使用的又一个激活结构域是p300或EP300或E1A(本文中可互换使用)或CBP(也称为CREB结合蛋白或CREBBP)。p300和CBP都与众多转录因子相互作用,并起着提高其靶基因表达的作用(Kasper等,2006,《分子细胞生物学》(Mol.Cell.Biol.),26(3),789-809)。P300和CBP具有相似的结构。两者都包含五个蛋白相互作用结构域:核受体相互作用结构域(RID)、KIX域结构域(CREB和MYB相互作用结构域)、半胱氨酸/组氨酸区域(TAZ1/CH1和TAZ2/CH3),以及干扰素反应结合结构域(IBiD)。p300的最后四个结构域KIX、TAZ1、TAZ2和IBiD分别与跨转录因子p53的两个反式激活结构域9aaTAD的序列紧密结合。此外,p300和CBP各自包含蛋白或组蛋白乙酰转移酶(PAT/HAT)结构域和结合乙酰化赖氨酸与功能未知的PHD指基序的溴结构域。保守的结构域通过长段的非结构化接头相连。P300和CBP可以通过三种方式提高基因表达:通过其固有的组蛋白乙酰转移酶(HAT)活性放松基因启动子上的染色质结构;通过将包括RNA聚合酶II的基础转录机制募集至启动子;以及/或通过充当接合体分子。
根据本发明的各个实施方案,可以分别优化本发明的合成转录因子的至少一个识别结构域和至少一个激活结构域,以实现完美的结合和调控活性。因此,特定数目的激活结构域可能适于适当定位在合成转录因子构建体中的给定识别结构域,以实现最佳的调控活性,优选地为转录激活。因此,根据本发明的各个方面的至少一个激活结构域可包括某些修饰以优化至少一个激活结构域以最优方式与至少一个识别结构域相互作用,使得两个结构域都可以到达要调控的目标靶位点。
在一个实施方案中,该至少一个激活结构域可以在本发明的合成转录因子内位于相对于该至少一个识别结构域的N-末端和/或C-末端。对于至少一个识别结构域和至少一个激活结构域之间的融合分子,该构型可能是最佳构型。根据各个实施方案,该至少一个识别结构域和该至少一个激活结构域可通过合适的接头序列分开,以达到最佳的灵活性并避免结构域实现其功能的空间障碍。
在一个实施方案中,该合成转录因子可包含至少一个其他元件,包括至少一个核定位信号(NLS)、细胞器定位信号(包括例如线粒体定位信号或叶绿体定位信号),以将STF靶向细胞或细胞系统的区室,STF可以在其中发挥其功能。此外,该合成转录因子可包含至少一个标签,例如以可视化该合成转录因子,从而跟踪转录因子的亚细胞定位,以及/或在合成转录因子内提供活性部分,例如scFv结合位点,以将其他分子连接至该合成转录因子、转位结构域(例如TALE分子中存在的转位结构域),以及本文还公开的和技术人员已知的。该至少一个其它结构域可以定位在相对于所该至少一个识别结构域的N-末端和/或C-末端,包括定位在该至少一个识别结构域和该至少一个激活结构域之间,例如,至少一个NLS可位于一个识别结构域和另一个识别结构域和/或激活结构域之间。如果提供为可转录/可翻译载体,则STF可包含至少一个启动子,用于在目的靶细胞或细胞系统内进行最佳转录。技术人员能够根据目的细胞系统定义具有诱导型或组成型表达的合适的启动子,优选强启动子。例如,BdUbi10是植物系统(例如玉米)中一个非常强的组成型启动子。例如,BdEF1是较弱的启动子。诱导型植物启动子是四环素、地塞米松和水杨酸诱导型启动子。根据本发明合适的其他启动子是CaMV(花椰菜花叶病毒)35S或双35S启动子。其他组成型真核启动子是CMV(巨细胞病毒)、EF1a、TEF1、SV40、PGK1(人或小鼠)、Ubc(泛素1)、人类β-肌动蛋白、GDS、GAL1或2(对于酵母系统)、CAG(包含CMV增强子、鸡β肌动蛋白启动子和兔β-珠蛋白剪接受体)、H1或U6。多种诱导型启动子是技术人员公知的。
因此,在根据本发明的STF中可以存在多种不同的架构。由于本申请的STF具有模块化特征,因此可以针对给定靶标设计几个具有不同结构域架构的STF,并且可以在体外以比较的方式对其进行评估以推断出提供最佳调控效果的架构。
在本发明的一个实施方案中,STF包含N-末端TAL识别结构域和C-末端VP64激活结构域,其中,STF还包括在N-末端识别结构域和C-末端激活结构域之间的SV40核定位信号(NLS)。
在本发明的另一个实施方案中,STF包含与其C-末端的SV40核定位信号(NLS)缔合的N-末端CRISPR/dCas9或CRISPR/dCpf1识别结构域以及C-末端VP64激活结构域,其中,该STF还包含位于该N-末端识别结构域和该C-末端激活结构域之间的两个SV40 NLS。
在本发明各个方面的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域(SEQ ID NO:276),优选地在该识别结构域和该激活结构域之间具有接头,优选为5xGS接头(SEQ ID NO:277)。在本发明各个方面的另一个优选实施方案中,STF的识别结构域包括解除武装的LbCpf1结构域(SEQ ID NO:282)、解除武装的LbCpf1_RR结构域(SEQID NO:283)和/或解除武装的LbCpf1_RVR结构域(SEQ ID NO:284)。为了提高转录调控(优选地为激活)的效率,优选靶向转录起始位点上游高达250bp区域的CRISPR/Cpf1系统的gRNA。在本发明的本文所述方面的一个实施方案中,优选的gRNA靶向转录起始位点上游1-250、1-200、1-150、1-100、1-50、50-250、100-250、150-250或200-250bp范围内或本文所公开范围之间的任何范围的区域。
在某些实施方案中,根据本发明的STF或编码其的序列可以作为多重系统提供,以靶向多个目的基因。例如,可以通过提供多重载体,或通过提供待在目的细胞或细胞系统在进行转化或转染的体外组装的多重STF,设计TALE和基于解除武装的CRISPR的STF,使其能够靶向2-7个或更多个目的基因基因座,或利用专门设计为调控一个目的基因的两个或更多个不同的STF实现对所述一个目的基因的靶向。
在一个实施方案中,本发明的合成转录因子或编码其的序列可包含共价或非共价连接至合成转录因子的至少一个氨基酸序列的至少一个非天然存在的核苷酸、氨基酸或合成序列,或其组合。该实施方案特别适合于将合成转录因子作为预组装复合物递送至目的细胞系统中的情况,特别是对于基于解除武装的CRISPR的合成转录因子而言,其中,该识别结构域还包含gRNA组分。由于核糖核酸相当不稳定,因此可以通过非天然存在的部分(例如,硫代磷酸酯骨架或任何其他稳定核苷酸)来稳定gRNA识别部分。此外,优选地在其中预组装蛋白复合物被递送到目的细胞或细胞系统中的实施方案中,合成转录因子可包含化学修饰以稳定、衍生化或功能化该复合物,并且/或者在旨在提供用于以靶向方式修饰细胞系统遗传物质的方法的实施方案中,向该复合物中添加至少一个DNA修复模板。
任何基于CRISPR的方法所面临的挑战是,必须将RNA部分(gRNA)和相应的CRISPR多肽以功能性(未降解)方式转运至包含基因组DNA(即,DNA靶序列)的细胞核或任何其他区室中。由于RNA不如多肽或双链DNA稳定且周转率更高,特别是因为它很容易被核酸酶降解,因此在一些实施方案中,CRISPR RNA序列和/或DNA修复模板核酸序列(在本发明的某些实施方案中如果存在的话)包含至少一个非天然存在的核苷酸。如果存在的话,根据本发明的优选的骨架修饰(提高CRISPR RNA的稳定性和/或提高DNA修复模板核酸序列的稳定性)选自由以下各项所构成的组:硫代磷酸酯修饰、甲基膦酸酯修饰、锁核酸修饰、O-(2-甲氧基乙基)修饰、二硫代磷酸酯修饰,以及肽核酸修饰。值得注意的是,所有所述骨架修饰仍然可以在两条核酸链之间形成互补碱基配对,但是对内源核酸酶的切割的抗性更强。根据与根据本发明的RNA/DNA核酸序列组合使用的解除武装的CRISPR效应物,可能有必要不修饰CRISPR核酸序列的那些核苷酸位置,所述核苷酸位置与CRISPR多肽的序列非依赖性相互作用有关。所述信息可来自可用于CRISPR核酸酶/CRISPR核酸序列复合物和解除武装的CRISPR效应物(例如,dCas9)的可以结构信息。
在本发明的某些实施方案中,设想至少一个CRISPR核酸序列(gRNA)和/或至少一个可选存在的DNA修复模板核酸序列可包含核苷酸和/或碱基修饰,优选地在所选择的并非所有核苷酸序列位置处。这些修饰选自由以下各项所构成的组:吖啶、胺、生物素、喀斯喀特蓝(cascade blue)、胆固醇、Cy3、Cy5、Cy5.5、Daboyl、地高辛(digoxigenin)、二硝基苯基、Edans、6-FAM、荧光素、3'-甘油基、HEX、IRD-700、IRD-800、JOE、磷酸补骨脂素(phosphatepsoralen)、若丹明(rhodamine)、ROX、硫醇(SH)、间隔子、TAMRA、TET、AMCA-S"、SE、
Figure BDA0002643914670000401
Marina
Figure BDA0002643914670000402
Pacific
Figure BDA0002643914670000403
Oregon
Figure BDA0002643914670000404
Rhodamine
Figure BDA0002643914670000405
Rhodamine
Figure BDA0002643914670000406
Rhodol
Figure BDA0002643914670000407
和Texas
Figure BDA0002643914670000408
优选地,所述添加被掺入到CRISPR核酸序列和/或DNA修复模板核酸序列的3'或5'端。这种修饰具有有利的效果,即,可以可视化CRISPR核酸序列和/或可选存在的DNA修复模板核酸序列在细胞中的细胞定位,以研究各序列的分布、浓度和/或可用性。此外,可以研究目的合成转录因子与结合行为的相互作用。研究此类相互作用或可视化如上所述的修饰或标记的核苷酸序列的方法对于相应领域的技术人员是可用的。
在一个实施方案中,至少一个CRISPR核酸序列的任何核苷酸或编码本发明的至少一个合成转录因子的序列的任何其他组分,可包含上述修饰之一作为标记或接头。因此,如本文所用的,“核苷酸”通常可以指碱基-糖-磷酸酯的组合。核苷酸可包含合成核苷酸。核苷酸可包含合成核苷酸类似物。核苷酸可以是核酸序列的单体单元(例如,脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可包括腺嘌呤核苷三磷酸(ATP)、尿苷三磷酸(UTP)、三磷酸胞嘧啶(CTP)、鸟苷三磷酸(GTP)和去氧核苷酸三磷酸(例如,dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物)。此类衍生物可包括例如但不限于,[αS]dATP、7-去氮-dGTP和7-去氮-dATP,以及在含有它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。本文所用的术语核苷酸可以指双脱氧核苷三磷酸(ddNTP)及其衍生物。双脱氧核苷三磷酸的说明性实例可包括但不限于,ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的,或通过众所周知的技术进行可检测标记的。标记也可以用量子点进行。可检测的标记可以包括,例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可包括但不限于,荧光素、5-羧基荧光素(FAM)、2'7'-5二甲氧基-4'5-二氯-6-羧基荧光素(JOE)、若丹明、6一羧基若丹明(R6G)、N,N,N',N'-四甲基-6-羧基若丹明(TAMRA)、6-羧基-X-若丹明(ROX)、4-(4'二甲基氨基苯基偶氮)苯甲酸(DABCYL)、喀斯喀特蓝(Cascade Blue)、俄勒冈绿(Oregon Green)、德克萨斯红(Texas Red)、花菁和5-(2'-氨乙基)氨基萘-l-磺酸(EDANS)。
标记或接头还可包含适于点击化学的部分,以使至少一个CRISPR向导的核酸序列或其一部分和/或DNA修复模板核酸序列和/或合成转录因子的至少一个识别结构域和/或合成转录因子的至少一个激活结构域彼此连接。
在包含适于根据本发明修饰任何核酸或氨基酸以在体外或体内构建分子复合物的点击化学领域的反应中,一个实例是炔烃与叠氮化物进行Huisgen1,3-偶极环加成反应,形成1,4-二取代-1,2,3-三氮唑。铜(I)催化的反应温和且非常有效,在许多情况下不需要保护基,也不需要纯化。叠氮化物和炔烃官能团通常对生物分子和水性环境呈惰性。三氮唑与自然界中普遍存在的酰胺部分相似,但与酰胺不同的是它不易裂解。另外,它们几乎不可能被氧化或还原。
如本领域技术人员所知的,适于体内反应的某些点击化学反应依赖于反应性基团,例如叠氮化物、末端炔烃或应变炔烃(例如,二苯并环辛基(DBCO)),这些反应性基团可以通过相应修饰的核苷酸(而不是其天然对应物)引入到任何形式的RNA或DNA中。标记可以通过酶或化学方法引入。随后可以通过Cu(I)催化的炔叠氮化物(CuAAC)或无Cu(I)的应变炔叠氮化物(SPAAC)单击化学反应来处理所得的CLICK官能化DNA,其中,优选将无铜反应用于细胞或生命系统中。根据本发明,这些反应可用于引入生物素基团用于随后的纯化任务(通过叠氮化物、生物素的炔烃或含DBCO的生物素化试剂),引入荧光基团用于随后的显微成像(通过荧光叠氮化物、荧光炔烃或含有DBCO的荧光染料),或与生物分子交联,例如本发明的至少一个合成转录因子的至少一个结构域或至少一个合成转录因子,以及可选地DNA修复模板(如果存在),以共价连接和/或提供功能化的生物分子。
在一个实施方案中,可以通过任何转化或转染方法将根据本发明的可选纯化的且在功能上缔合的5'或3'端点击化学标记的CRISPR核酸序列递送至稳定或瞬时表达相应的解除武装的CRISPR多肽的细胞或细胞系统中。因此,CRISPR核酸序列与CRISPR多肽相互作用并由此指导CRISPR多肽充当根据本发明的识别结构域。这使得激活结构域可以精确地调控至少一个目的形态发生基因的表达。
技术人员可以使用多种其他化学反应和相应的修饰,以共价方式彼此连接本发明的核酸,或与任何氨基酸识别和/或激活结构域连接。这些修饰包括各种交联剂,例如巯基修饰,如硫辛酸N-羟基琥珀酰亚胺(NHS)酯、与伯胺(-NH2)反应的化学基团。这些伯胺在生理pH下带正电;因此,它们主要发生在天然蛋白质三级结构的外表面,在这里它们很容易与引入水性介质的结合试剂接触。此外,在典型的生物或蛋白样品中可用的官能团中,伯胺尤其亲核;这使得它们易于靶向与几个反应性基团结合。有许多合成化学基团会与伯胺形成化学键。这些包括异硫氰酸酯、异氰酸酯、酰基叠氮化物、NHS酯、含磺酸根(-SO3)基团的磺基-NHS酯(例如,双(磺基琥珀酰亚胺基)硫酸盐(BS3))、磺酰氯、醛、乙二醛、环氧化物、环氧乙烷、碳酸酯、芳基卤化物、酰亚胺酯、碳二亚胺(例如,1-乙基-3-(3-二甲基氨基丙基)碳二亚胺(EDC)或二环己基碳二亚胺(DCC))、酸酐和氟苯基酯。
在某些实施方案中,可以对根据本发明各个方面的任何核酸序列进行密码子优化,以使该序列适应于在目的靶生物体或细胞中的最佳性能。例如,可以对序列进行密码子优化,以在目的植物属的目的植物细胞中实现高转录率,或者可以对序列进行密码子优化以用于哺乳动物(例如鼠或人)细胞中。
根据本发明的各个实施方案,该合成转录因子和/或该至少一个识别结构域可包含SEQ ID NO:1-94中任一个所示的序列,或包含与SEQ ID NO:1-94中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列,或者其中该合成转录因子和/或至少一个识别结构域结合SEQ ID NO:95-190中任一个所示的调控区域或与SEQ ID NO:95-190中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在本发明的各个方面的一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
优选地对WUS和/或BBM具有特异性的根据本发明的合成转录激活子可以容易地与基因编辑机器和/或T-DNA一起共递送,以改善植物细胞中的转化效率,并诱导转基因植物的再生。因此,本发明还涉及用于通过促进生长刺激基因(形态发生基因)(例如,BBM和WUS)的表达来诱导转化的植物细胞再生的方法。
根据本文公开的各个实施方案和方面,该细胞系统可选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中该至少一个真核细胞可以是至少一个植物细胞,并且/或者其中该至少一个真核生物体可以是植物或植物的一部分。
在本文公开的某些实施方案中,待进行调控、转化和/或转染的细胞系统可选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中该至少一个真核细胞可以是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在根据本文公开的各个实施方案和方面的某些实施方案中,该植物的至少一部分可选自由叶、茎、根、初生胚根(emerged radicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在细胞系统是或者源自植物细胞的实施方案中,该至少一个植物或植物的至少一部分可源自由以下各项所构成的组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Alliumcepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在本发明的另一方面,提供了一种用于提高细胞系统中的转化效率的方法,其中,该方法可包括以下步骤:(a)提供细胞系统;(b)在该细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;以及(c)在该细胞系统中引入至少一个目的核苷酸序列;(d)可选地:在获得该细胞系统的转化后代的条件下培养该细胞系统;其中该至少一个合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子配置为调控该细胞系统中的至少一个形态发生基因的表达,优选地为调控该细胞系统中的至少一个形态发生基因的转录;并且其中该至少一个合成转录因子或编码其的核苷酸序列的引入与至少一个目的核苷酸序列的引入平行进行或序贯进行。
因此,本发明公开了通过使用对可以重编程细胞并诱导多种植物物种细胞分裂的内源性形态发生基因具有特异性的合成转录因子来提高植物转化或转染以及/或植物再生效率的方法,从而提供可靠的细胞系统转化方法,包括那些公知难以通过当前可用的方法进行修饰和/或转化的细胞系统。特别地,包括极有价值的优良事件(即,很少发生的事件,并且如果有的话,源于非同寻常的事件以及令人惊讶的事件)的某些优良品系和所述优良品系的种质可能对体外培养和转化高度抵制。此类基因型通常在用于由通常合适的外植体(例如未成熟胚)引起这种反应的培养基上不产生适当的胚胎形成或器官发生培养反应。此外,当将外源性DNA或其他生物分子引入这些未成熟胚中时,在繁琐的选择轮次之后可能无法恢复成功的修饰事件,或者仅仅非常少的事件可以恢复,因此此类基因型的转化不切实际。
在一个实施方案中,该方法可包括,使(a)该至少一个合成转录因子或编码其的序列,或该至少一个合成转录因子的至少一个组分或编码其的序列;以及(b)该至少一个目的核苷酸序列,通过独立地选自生物方法和/或物理方法的方法引入该细胞系统中,该方法包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),电穿孔,细胞融合或其任何组合。
因此,“引入”或“引入”的过程可包括将生物分子引入或递送到目的细胞系统中的任何生物、化学和/或物理方法。值得注意的是,可以使用引入或递送技术的任何组合。此外,可以通过相同的技术同时或随后例如通过共轰击来引入待引入到目的细胞系统中的不同组分,或者可以通过不同的引入技术同时或随后将它们引入。
在本发明的上下文中首次证明,基于Cpf1的转录调控系统是用于植物中内源性靶基因的转录激活或抑制的强大工具,并且如上所述,与其他方法相比,它具有许多优点。因此,其可用于,通过使用对内源性形态发生基因具有特异性的合成转录因子提供转化细胞系统(包括已知难以进行修饰和/或难以通过当前可以的方法进行转化的那些细胞系统)的方法,提高植物转化或转染和/或植物再生的效率。
在本发明的用于提高细胞系统中转化效率的方法的优选实施方案中,该至少一个识别结构域是至少一个解除武装的非功能性CRISPR/核酸酶系统,或是至少一个解除武装的非功能性CRISPR/核酸酶系统的片段。
在本发明方法的另一个优选实施方案中,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中,该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在一个实施方案中,该至少一个合成转录因子的至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。优选地,该激活结构域是VPR结构域(SEQ ID NO:276)。
在另一个实施方案中,该至少一个合成转录因子的至少一个激活结构域相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在本发明方法的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域,可选地在该识别结构域和该激活结构域之间具有接头,优选地为5xGS接头。
根据本发明的各个方面和实施方案的转化效率提高可包括与对照植物或细胞系统相比较时的任何统计学上的显著增加。例如,转化效率的提高可包括与对照植物或对照植物部分或对照细胞系统相比较,增加约0.2%、0.5%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、120%、125%或更多。可替换地,转化效率的提高可包括,与对照植物或植物部分或细胞系统相比,该植物、植物部分或细胞系统中的转化效率增加约0.2倍、0.5倍、1倍、2倍、4倍、8倍、16倍或32倍或更多。
在一个实施方案中,本发明的方法可包括,提供至少一个目的核苷酸序列作为至少一个载体的一部分或作为至少一个线性分子。
在本文公开的方法的一个实施方案中,该至少一个目的核苷酸序列可以选自由转基因、修饰的内源基因、合成序列、内含子序列、编码序列或调控序列所构成的组。
在本文公开的方法的一个实施方案中,该至少一个目的核苷酸序列可以是转基因,其中,该转基因可包含编码目的生物体的基因组的基因或所述基因的至少一部分的核苷酸序列。
在一个实施方案中,根据本发明的调控序列可以是启动子序列,其中,该启动子的编辑或突变或调控包括用不同的启动子(也称为替换启动子)或启动子片段(也称为替换启动子片段)替换启动子或启动子片段,其中,启动子替换会造成以下任一项或以下任意组合的结果:启动子活性提高、启动子组织特异性提高、启动子活性降低,启动子组织特异性降低、新的启动子活性、诱导型启动子活性、基因表达窗口延长、改变同一细胞层或其他细胞层中基因表达的时间或发育进度(例如,延长花药绒毡层中基因表达的时间)、DNA结合元件突变,以及/或者DNA结合元件缺失或添加。待修饰的启动子(或启动子片段)可以是对于正在编辑的细胞是内源性的、人工的、预先存在的或转基因的启动子(或启动子片段)。替换启动子(或启动子片段)可以是对于正在编辑的细胞是内源性的、人工的、预先存在的或转基因的启动子(或启动子片段)。根据本公开的任何其它调控序列都可以按照针对上述启动子或启动子片段所详述的内容进行修饰。
特别是在待修饰的植物基因组的情况下,可能希望的是,由本发明的方法介导的修饰不会通过将外源性DNA以不精确的方式(例如必须要关注的环境、监管和政治问题)整合到亲本基因组中而产生遗传修饰的生物体。因此,根据本发明提供用于以瞬时的方式将目的遗传物质引入细胞系统的方法的实施方案特别适用于无需插入外源性DNA从而不需提供视为转基因生物体的细胞或生物体就可提供在预定位置进行修饰的细胞系统,因为执行本发明方法所必需的所有工具都可以以活性形式以瞬时的方式提供给细胞系统。
在本文所述的方法的一个实施方案中,转录激活以完全瞬时的方式与植物基因组的修饰结合,从而无需将外源性DNA插入植物基因组中,因而也不需提供被视为经基因修饰生物体的植物生物体,就可获得在预定遗传位置处包含修饰的植物生物体。因此,本文所述的方法提供了无需劳动密集型调控程序即可修饰植物基因组的方法。在本文所述方法的又一个实施方案中,STF和/或位点特异性核酸酶是无DNA的,例如蛋白或RNP,从而提供监管益处。在本文公开的各种方法的一个实施方案中,该方法可以以完全瞬时的方式执行。在其他实施方案中,可以通过稳定和瞬时方法的组合来执行该方法。在又一个实施方案中,该方法还可以通过将合适的递送工具稳定地引入到目的细胞或细胞系统中来执行。
在本发明各个方面的另一个实施方案中,待引入细胞系统的至少一个目的核苷酸序列可以是目的生物体的转基因,其中,该转基因或转基因的一部分可选自由以下各项所构成的组:编码对非生物胁迫的抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,所述除草剂抗性包括草甘膦抗性、草铵膦(glufosinate/phosphinotricin)抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性和麦草畏抗性或耐受性;编码对生物胁迫的抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳组成或营养含量。
在本发明各个方面的另一个实施方案中,该至少一个目的核苷酸序列可以是目的生物体的修饰的内源基因的至少一部分,其中该修饰的内源基因,与未经修饰的内源基因的核苷酸序列相比,可包含至少一个核苷酸的至少一个缺失、插入和/或取代。
在本发明各个方面的又一个实施方案中,该至少一个目的核苷酸序列可以是目的生物体的修饰的内源基因的至少一部分,其中该修饰的内源基因可包含编码该修饰的内源基因的结构域的至少一个核苷酸位置的截短、重复、取代和/或缺失中的至少一种。
在一个实施方案中,该至少一个目的核苷酸序列可以是调控序列的至少一部分,其中该调控序列可包括核心启动子序列、近端启动子序列、顺式调控序列、反式调控序列、基因座控制序列、绝缘子序列、沉默子序列、增强子序列、终止子序列或其任何组合中的至少一个。
本文下文公开的任何合成转录因子均可用于根据本发明的不同方法中,作为介体,以特异性调控目的形态发生基因的转录。这种调控(优选地为转录上调)使得可以实现更好的细胞系统(优选地为目的植物或植物部分)转化效率。
根据本文公开方法的各个实施方案,该待调控的优选形态发生基因可选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
优选地,该形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ IDNO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ IDNO:238-258中的任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在某些实施方案中,本发明方法中使用的合成转录因子可配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在某些实施方案中,本发明的方法中使用的合成转录因子和/或至少一个识别结构域可包含SEQ ID No:1-94中任一个所示的序列,或包含与SEQ ID No:1-94中任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列,或者其中该合成转录因子和/或至少一个识别结构域结合SEQID NO:95-190中任一个所示的调控区域或与SEQ ID NO:95-190中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在本发明方法的一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在本发明方法的某些实施方案中,该细胞系统可选自至少一个真核细胞或真核生物体,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在本发明方法的其它实施方案中,该植物的至少一部分选自由叶、茎、根、初生胚根(emerged radicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在本发明方法的其它实施方案中,该至少一个植物细胞、该至少一个植物或植物的至少一部分可源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeumbulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucusglochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在本发明的另一方面,独立地或与本文公开的其他方面和实施方案一起,提供了一种在预定位置修饰细胞系统的遗传物质的方法,其中该方法可以包括以下步骤:(a)提供细胞系统;(b)将至少一个合成转录因子或编码其的序列引入该细胞系统中,(c)进一步向该细胞系统引入:(i)至少一个位点特异性核酸酶或编码其的序列,其中,该位点特异性核酸酶在预定位置诱导双链断裂;(ii)可选的:至少一个目的核苷酸序列,优选地侧翼为与细胞系统遗传物质中预定位置相邻的一个或多个核苷酸序列互补的一个或多个同源序列;以及(e)可选地:确定修饰存在于细胞系统遗传物质中的预定位置;以及(f)获得在该细胞系统遗传物质的预定位置处进行修饰的细胞系统;其中该至少一个合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子配置为调控该细胞系统中的至少一个形态发生基因的表达,优选地为调控该细胞系统中的至少一个形态发生基因的转录;并且其中该至少一个合成转录因子或编码其的核苷酸序列的引入与至少一个位点特异性核酸酶或编码其的序列以及可选的至少一个目的核苷酸序列的引入平行,或序贯进行。
因此,该方面和相关实施方案协同地整合了细胞系统中至少一个目的形态发生基因的转录率的靶向调控与将某些效应物引入细胞的高度定点基因组编辑(GE)方法的优势。通过在包含至少一个根据本发明的合成转录因子的细胞系统内提供环境,可以在引入至少一个位点特异性核酸酶(SSN)(即,包含DNA双链或DNA单链切割能力的酶)或编码其的序列,以及可选地提供环境的其它工具(如修复模板(RTs))之前或同时,特异性调控细胞系统中至少一个形态发生基因的转录,其中该细胞系统具有高度的转化能力,并具有较高的再生能力。这些因子保证了目的细胞系统中此类编辑的遗传物质的成功编辑和再生,还使得可以有经修饰的细胞系统再生植物或植物材料,因为基于与至少一个合成转录因子或编码其的序列的共处理或预处理,该细胞系统在GE事件期间具有更大的耐受性和生存能力。
在一个实施方案中,该方法还包括以下步骤:在获得经修饰细胞系统的基因修饰后代的条件下培养该细胞系统。
本文在预定位置和一个或多个同源区域的上下文中使用的术语“相邻”或“相邻于”可包括上游和下游相邻区域,或两者。因此,相邻区域根据待被修饰的细胞系统的遗传物质来确定,所述物质包括预定位置。
在预定位置附近可能存在上游和/或下游相邻区域。对于诱导钝性双链断裂(DSB)的位点特异性核酸酶(SSN),“预定位置”代表DSB在目的细胞系统的遗传物质内被诱导的位点。对于在DSB诱导后留下突出端的SSN,预定位置是指一条链上5'端的切割与另一链上3'端的切割之间的区域。因此,对于粘性末端SSN,可以使用两条不同的DNA链作为参考来计算相邻区域。因此,术语“与预定位置相邻”可以表示待修饰的遗传物质中的上游和/或下游核苷酸位置,其中在诱导DSB或修饰之前,基于细胞系统的遗传物质来定义相邻区域。根据SSN诱导DSB的不同机制,“预定位置”意味着在目的遗传物质中进行修饰的位置可能因此暗示了对于钝DSB在同一链上的一个特定位置,或对于粘性切割DSB在不同链上的两个切割位点之间的区域,或对于用作SSN的切口酶在一条链中5′位置的切口与另一链上3′位置的切口之间。
如果存在,则上游相邻区域是指在启动双链断裂之前,例如在靶向基因组工程化期间,参照预定位置,定义目的位点特异性核酸酶切位点5′端的直接上游区域。相应地,下游相邻区域在启动双链断裂之前(例如,在靶向基因组工程化期间),参照预定位置定义目的SSN切割位点3′端的直接下游区域。5′端和3′端可以相同,这取决于目的位点特异性核酸酶。
在某些实施方案中,在远离要诱导的DSB的距离处设计至少一个同源区域也可能是有利的,即,不直接位于预定位置/DSB位置的两侧。在这种情况下,在预定的位置和同源序列(同源臂)之间的基因组序列将在发生同源重组后“缺失”,这对于某些策略可能是优选的,因为这使得可以在DSB附近有针对性地删除序列。因此,根据本发明,对于那些依赖于RT的实施方案,可以设想不同种类的RT配置和设计。RT可以用于引入位点特异性突变,或者RT可以用于目的核酸序列的位点特异性整合,或者RT可以用于辅助靶向的缺失。
引入的“同源序列”和相应的“相邻区域”各自可具有从约15bp至约15000bp的变化且不同的长度,即,上游同源区域与下游同源区域相比可以具有不同的长度。可能仅存在一个同源区域。同源区域的长度没有真正的上限,该长度由实际和技术问题决定。根据某些实施方案,依据RT的性质和待引入的靶向修饰,可以优选不对称同源区域,即,其中上游和下游侧翼区域具有可变长度的同源区域。在某些实施方案中,可以仅存在一个上游和下游侧翼区。
在根据本发明方法的一个实施方案中,该至少一种位点特异性核酸酶可包含锌指核酸酶、转录激活因子样核酸酶、CRISPR/Cas系统(包括CRISPR/Cas9系统、CRISPR/Cfp1系统、CRISPR/CasX系统、CRISPR/CasY系统)、工程化的归巢核酸内切酶和大范围核酸酶,和/或其任何组合,及其变体或催化活性片段。
一旦表达,则Cas9蛋白和gRNA通过gRNA“支架”结构域与Cas9表面暴露的带正电荷的凹槽之间的相互作用形成核糖核蛋白复合物。Cas9在gRNA结合后经历构象变化,其将分子从非活性的非DNA结合构象转变为活性的DNA结合构象。重要的是,gRNA的“间隔子(spacer)”序列仍可自由与靶DNA相互作用。Cas9-gRNA复合物将使与PAM结合任何基因组序列,但gRNA间隔子与靶DNA匹配的程度决定了Cas9是否会切割。一旦Cas9-gRNA复合物与推定DNA靶标结合,则在gRNA靶序列3'端的“种子”序列开始退火至靶DNA。如果种子和靶DNA序列匹配,则gRNA将继续沿3'至5'方向(相对于gRNA的极性)退火至靶DNA。
当正确设计gRNA时,CRISPR/Cas(例如,CRISPR/Cas9)以及同样的CRISPR/Cpf1或CRISPR/CasX或CRISPR/CasY和其它CRISPR系统都是高度特异性的,但特别地,特异性仍然是一个主要问题,特别是对于临床用途或基于该CRISPR技术的靶向植物GE而言。CRISPR系统的特异性在很大程度上取决于与基因组其余部分相比,gRNA靶向序列对基因组靶标的特异性。因此,当与使用至少一种CRISPR核酸酶作为位点特异性核酸酶结合并进一步与使用合适的CRISPR核酸结合时,根据本发明的方法可提供GE的显著更可预测的结果。尽管CRISPR复合物可以在特定位点介导细胞或细胞系统的基因组或遗传物质的高精度切割,但是本文提出的方法提供了保证可编程和可预测的修复机制的附加控制机制。
根据本发明的各个实施方案,关于共价和非共价缔合或附着的上述公开内容也适用于CRISPR核酸序列,其可以包含一个以上的部分,例如crRNA和tracrRNA部分,如上所述,它们可以彼此缔合。在一个实施方案中,可以将本发明的RT核酸序列置于目的CRISPR核酸序列内,以形成根据本发明的杂合核酸序列,该杂合体可以通过共价和非共价缔合形成。
在根据本发明各个方面的又一个实施方案中,预定位置处的至少一个目的核酸序列侧翼的一个或多个核酸序列与邻近预定位置(位于预定位置的上游和/或下游)的一个或多个核酸序列在各个邻近区域的全长上至少85%至100%互补。
值得注意的是,可以使用具有较低程度的同源性或互补性的至少一个侧翼区域,例如,与目的遗传物质中的至少一个相邻区域的同源性/互补性为至少70%、至少75%、至少80%、至少81%、至少82%、至少83%或至少84%。对于依赖于HDR模板的高精度GE(即,本文所公开的RT)而言,超过95%的同源性/互补性有利于实现高度特异性的修复事件。如Runnitz等,《分子生物学杂志》(Mol.Cell Biol.),1984,4(11),2253-2258,序列同源性非常低也可能足以获得同源重组。如技术人员所知,互补程度取决于待修饰的遗传物质、计划编辑的性质、基因组的复杂性和大小、潜在脱靶位点的数量、遗传背景,以及待修饰的细胞或细胞系统中的环境。
在一个实施方案中,该方法还包括在在获得该经修饰的细胞系统的遗传修饰后代的条件下培养该细胞系统的步骤。
在根据本发明的各个方面的又一个实施方案中,细胞系统的遗传物质可以选自由以下各项所构成的组:原生质体、转移于重组宿主细胞中的病毒基因组、真核细胞、组织或器官(优选植物细胞、植物组织或植物器官),以及真核生物体(优选植物生物体)。
在本发明方法的一个实施方案中,(i)至少一个合成转录因子或编码其的序列,或该至少一个合成转录因子的至少一个组分或编码其的序列;以及(ii)该至少一个位点特异性核酸酶或包含其的序列;以及可选地(iii)该至少一个目的核苷酸序列,可通过独立地选自生物方法和/或物理方法的方法引入该细胞系统中,该方法包括转染、转化,其中包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染)或其任何组合。
在本发明的用于在预定位置修饰细胞系统遗传物质的方法的实施方案中,该至少一个识别结构域可以是选自由以下各项多构成的组的分子,或分子的片段:至少一个TAL效应物、至少一个解除武装的CRISPR/nuclease系统、至少一个锌指结构域和至少一个解除武装的归巢核酸内切酶或其任意组合。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的一个实施方案中,该至少一个解除武装的CRISPR/核酸酶系统可选自CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCasX系统或CRISPR/dCasY系统,或其任何组合,其中该至少一个解除武装的CRISPR/核酸酶系统可包含至少一个向导RNA,优选是针对特异性的解除武装的CRISPR/核酸酶系统和形态发生系统内或附近的特异性靶位点优化的向导RNA,以增加本发明合成转录因子的识别和/或结合特性。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的优选实施方案中,该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
由于上述优点,特别优选的是,在本发明的在预定位置处修饰细胞系统的遗传物质的方法中,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的另一个实施方案中,该至少一个合成转录因子的至少一个激活结构域可选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在本发明的在预定位置修饰细胞系统的遗传物质的方法的优选实施方案中,该至少一个激活结构域是VPR(SEQ ID NO:276)。在本发明的另一个优选实施方案中,可以使用不同激活结构域的组合,例如,VP64-p65-Rita或本领域通常已知的激活结构域的任何组合。
用于本文所述的CRISPR/Cpf1系统的合适的接头包括柔性接头,例如,5GS或XTEN,而可体内裂解的接头不适合于本文描述的本发明的各个方面。
为了提高转录调控(优选地为激活)的效率,优选靶向转录起始位点上游高达250bp的区域的CRISPR/Cpf1系统的gRNA。在本文所述的本发明各方面的一个实施方案中,优选的gRNA靶向转录起始位点上游1-250、1-200、1-150、1-100、1-50、50-250、100-250、150-250或200-250bp,或本文公开范围之间的任何范围的区域。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的另一个实施方案中,该至少一个合成转录因子的至少一个激活结构域可相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在本发明的用于修饰细胞系统遗传物质的方法的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域,优选地在该识别结构域和该激活结构域之间存在接头,优选地为5xGS接头。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的再一个实施方案中,该至少一个形态发生基因可选自由BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。
在另一个实施方案中,提供了本发明的用于在预定位置修饰细胞系统的遗传物质的方法,其中该至少一个形态发生基因包含选自由以下各项所构成的组的核苷酸序列:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ IDNO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ IDNO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的另一个实施方案,该合成转录因子可配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
在本发明的用于在预定位置修饰细胞系统遗传物质的方法的一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ ID NO:1-94中任一个所示的序列,或包含与SEQ ID NO:1-94中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列,或者其中该合成转录因子和/或至少一个识别结构域结合SEQ ID NO:95-190中任一个所示的调控区域,或与SEQID NO:95-190中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的另一个实施方案中,该细胞系统可选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中该至少一个真核细胞可以是至少一个植物细胞,并且/或者其中该至少一个真核生物体可以是植物或植物的一部分。
在一个实施方案中,该植物的至少一部分选自由叶、茎、根、初生胚根(emergedradicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在另一个实施方案中,该至少一个植物细胞、该至少一个植物或植物的至少一部分源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setariaitalica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryzaaustraliensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、黑麦(Secalecereale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucuscarota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitisvinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morusnotabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassicanigra)、芝麻菜(Eruca vesicaria subsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Alliumfistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的又一个实施方案中,预定位置处的至少一个目的核苷酸序列侧翼的一个或多个核苷酸序列与邻近预定位置(位于预定位置的上游和/或下游)的一个或多个核苷酸序列在各个邻近区域的全长上至少85%至100%互补。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的一个实施方案中,该至少一个目的核苷酸序列可选自由以下各项所构成的组:转基因、修饰的内源基因、合成序列、内含子序列、编码序列或调控序列。如果该至少一个目的核苷酸序列是转基因,则该转基因可包含编码目的生物体的基因组的基因或所述基因的至少一部分的核苷酸序列。
在本发明的用于在预定位置修饰细胞系统遗传物质的方法的另一个实施方案中,该至少一个目的核苷酸序列可以是目的生物体的转基因,其中,该转基因或转基因的一部分可选自由以下各项所构成的组:编码对非生物胁迫的抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,所述除草剂抗性包括草甘膦抗性、草铵膦(glufosinate/phosphinotricin)抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性以及麦草畏抗性或耐受性;编码生物胁迫抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳组成或营养成份。
在本发明的用于在预定位置修饰细胞系统的遗传物质的方法的又一个实施方案中,其中该经修饰的内源基因,与未经修饰的内源基因的核苷酸序列相比,可包含至少一个核苷酸的至少一个缺失、插入和/或取代,并且/或者该至少一个目的核苷酸序列可以是目的生物体的经修饰的内源基因的至少一部分,其中该经修饰的内源基因可包含编码该经修饰的内源基因的结构域的至少一个核苷酸位置的截短、重复、取代和/或缺失中的至少一种。
在本发明的用于在预定位置修饰细胞系统遗传物质的方法的又一个实施方案中,该至少一个目的核苷酸序列可以是调控序列的至少一部分,其中该调控序列可包括核心启动子序列、近端启动子序列、顺式调控序列、反式调控序列、基因座控制序列、绝缘子序列、沉默子序列、增强子序列、终止子序列或其任何组合中的至少一个。
还提供了根据本文公开的各个方面的方法的实施方案,其中可以将至少一种位点特异性核酸酶或其催化活性片段作为编码位点特异性核酸酶及其催化活性片段的核酸序列引入细胞系统中,其中该核酸序列是至少一个载体的一部分,或者其中该至少一个位点特异性核酸酶或其催化活性片段作为至少一种氨基酸序列引入到细胞系统中。在一个实施方案中,可以将该至少一个位点特异性核酸酶作为可翻译RNA引入。在又一个实施方案中,可以将该至少一个位点特异性核酸酶与至少一个其他生物分子(例如gRNA)一起作为复合物的一部分引入,所述gRNA可选地与RT缔合,所述RT包含待引入细胞系统中的至少一个核酸序列或与待引入细胞系统中的至少一个核酸序列缔合。
在本发明的另一方面,提供了一种选择最佳合成转录因子(STF)以调控(优选地为激活)至少一个目的基因(优选地为形态发生基因)的表达的方法,其中,该方法包括(i)定义目的基因;(ii)定义并提供至少一个识别结构域,其中该识别结构域设计为识别目的基因处或附近的识别位点;(iii)定义并提供至少一个激活结构域;(iv)可选地:提供至少一个其他元件,该元件选自至少一个启动子、至少一个NLS、至少一个反式激活结构域和/或至少一个标签;(iv)提供靶向相同目的基因的至少两个STF;(v)测量每个测试的单个STF的调控比率;(vi)为给定的目的基因选择具有最佳调控比率的STF。此外,本文所述的方法还可用于选择至少两个用于进行调控的最佳STF以微调至少两个目的形态发生基因的转录并提高转化和再生。
根据本文提供的各个实施方案,并且由于STF的模块化本质,可以设计多个STF以调控给定的目的基因。由于复杂真核基因组中存在的空间问题和潜在的脱靶效应,因此提供具有不同数量的结构域和不同结构域构型的不同的STF可能是有利的,例如通过结构域改组或通过测试基于TALE和基于CRISPR的STF,最终为所选的靶基因选择最佳的STF。
在本发明的另一方面,提供了一种产生单倍或双单倍体生物体或细胞系统的方法,其中,该方法可包括以下步骤:(a)提供单倍体细胞系统;(b)在该单倍体细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;(c)在获得至少一个单倍体或双单倍体生物体的条件下培养该单倍体细胞系统;以及(d)可选地:选择步骤(c)中获得的至少一个单倍体或双单倍体生物体,其中该至少一种合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子配置为调控该单倍体细胞系统中的至少一个形态发生基因的表达,特别地为调控该单倍体细胞系统中的至少一个形态发生基因的转录。
由于单倍体在所有基因座都是纯合的,并且单倍体可以代表新品种(自花授粉作物)或亲本自交系,用于生产杂交品种(异花授粉作物),这使其成为植物育种计划中有吸引力的细胞类型。与野生型供体植株相比,单倍体通常较小,植株活力较低,由于减数分裂期间染色体不能配对而不育。因此,本文中提供的合成转录因子和方法可用于单倍体细胞、细胞系统和植物的发育中,因为将至少一个本发明的合成转录因子或编码本发明的合成转录因子的核苷酸序列引入到单倍体细胞系统中,可以显著提高单倍体细胞系统的生殖能力,从而发育成单倍体胚,进而可以用作单倍体和双单倍体植物的基础。
“双单倍体”细胞、细胞系统或生物体是通过在培养单倍体细胞或细胞系统的步骤中进行自发染色体倍增或通过在选择所获得的单倍体生物体后通过诱导染色体倍增而获得的。术语“双单倍体”和“加倍单倍体”在本文可互换使用。
在一个实施方案中,在产生单倍体或双单倍体生物体的方法中,步骤(a)的单倍体细胞系统是单倍体胚,或者其中步骤(c)中获得的至少一个单倍体或双单倍体生物体是通过从(b)的单倍体细胞系统产生至少一个单倍体胚的中间步骤获得的。
许多植物细胞都具有仅从单个细胞或组织就可再生完整生物体的能力。此过程通常称为全能性。各种各样的细胞都有可能发育成胚胎,包括单倍体配子体细胞,例如花粉和胚囊细胞(见Forster,B.P.等(2007),《植物科学发展趋势》(Trends Plant Sci.)12:368-375,以及Segui-Simarro,J.M.(2010),《植物学回顾》(Bot.Rev.76:377-404),以及源自植物所有三个组织层的体细胞(Gaj,M.D.(2004)Plant Growth Regul.43:27-47,或Rose,R.等(2010),《体细胞胚胎发生的发育生物学》:《植物发育生物学-生物技术观点》,Pua EC和Davey MR,Eds.(施普林格(Berlin Heidelberg:Springer)),第3-26页)。无融合生殖(无性种子发育的一种)在没有卵细胞受精的情况下也会发生胚胎发育。无融合生殖植物的全能性仅限于配子体和孢子体细胞,这些细胞通常有助于种子及其前体的发育,包括未受精卵细胞和周围的孢子体组织(参见Bicknell,R.A.和Koltunow,A.M.(2004)《植物细胞》(PlantCell)16:S228-S245)。
值得注意的是,植物细胞的全能性现象在组织培养(即,体外)达到其最高表达。因此,用于产生单倍体的相关步骤从体外不成熟细胞的培养开始,其必须在合适的条件下进行处理以诱导胚胎形成。这些步骤通常是耗时并且通常是相当低效率的,因为只有一小部分培养的单倍体细胞系统以期望的方式成熟到形态和细胞状态,任选地包括任何进一步的GE事件。在本文公开的合成转录因子和方法的辅助下,单倍体和/或双倍单倍体系统的产生可显著增强,因为该方法提供了具有更高再生能力的细胞系统,从而保证了更高频率的阳性事件。
在产生单倍体或双单倍体细胞系统或生物体的方法的一个实施方案中,该方法可包括诱导小孢子来源的胚胎形成的附加步骤。小孢子来源的胚胎形成是一个独特的过程,其中单倍体、未成熟花粉(小孢子)通过一种或多种胁迫处理而诱导以在培养物中形成胚胎。然后,这些小孢子来源的胚胎可以通过染色体加倍剂和/或通过自发加倍而发芽并转化为纯合的双倍单倍体植物。如上所述,双单倍体生产是植物育种和性状发现计划中的主要工具,因为它可以实现以单代形式生产纯合品系。这种快速的纯合性途径不仅大大缩短了繁殖期,而且还揭示了由隐性等位基因控制的性状。双倍单倍体作为F1杂种种子生产的亲本广泛用于作物改良中,以促进用于突变育种的回交转化,并产生永生种群进行分子作图研究。
本文在细胞系统的上下文中所使用的术语“未成熟的”旨在表示可从植物获得的任何未成熟的细胞或遗传物质。“未成熟”细胞或细胞系统可包括雄性或雌性未成熟细胞,或未成熟的营养细胞。未成熟的雌性或雄性细胞或细胞系统可选自未成熟的胚胎或未成熟愈伤组织、雄性配子体(例如,小孢子)或营养,花粉粒的生殖或精子细胞,或雌性配子体,包括大孢子及其衍生物,包括卵细胞、极核、中央细胞、助细胞、反足细胞(antipodal)。雌性配子体材料可包含在胚珠中,并且胚珠可以代表根据本发明的细胞系统。当使用小孢子作为本发明的单倍体细胞系统时,可以形成愈伤组织,然后该愈伤组织可以进行器官发生以形成胚胎。
用于使用化学方法获得单倍体和双单倍体细胞系统和生物体的方法是技术人员已知的(参见,例如,WO 2015/044199A1)。根据用于产生单倍体细胞系统的方法的某些实施方案,因此,该方法在将至少一个合成转录因子或编码本发明的合成转录因子的核苷酸序列引入该单倍体细胞系统中之前,可包括处理或培育单倍体细胞系统的额外步骤,其中,该处理或培养的额外步骤可包括向正在发育的细胞系统中添加组蛋白去乙酰化酶抑制剂或至少一种化学物质。组蛋白去乙酰化酶抑制剂(HDACi)优选地是能够与组蛋白去乙酰化酶相互作用并抑制其酶活性从而降低组蛋白去乙酰化酶从组蛋白中除去乙酰基的能力的化合物,并且可包括例如异羟肟酸(水杨异羟肟酸除外)、环状四肽、脂族酸、苯甲酰胺、多酚或亲电性酮、曲古抑菌素A(TSA)、丁酸、丁酸盐、丁酸钾、丁酸钠、丁酸铵、丁酸锂、丁酸苯酯、钠苯丁酸酯或正丁酸钠,其中在本说明书中使用的术语丁酸不包括异丁酸或α,β-二氯丁酸或辛二酰苯胺异羟肟酸,以上所有化合物均可商购获得。
在另一个实施方案中,可以将物理胁迫施加到单倍体细胞系统或生物体。例如,物理胁迫可以是温度、黑暗、光或电离辐射中的任何一种。该光可以是全光谱太阳光,或者是选自可见光谱、红外光谱或紫外光谱的一个或多个频率。可以使用一种或多种物理胁迫,或胁迫组合。胁迫可以是连续的或间断的(周期性的);随时间变化规律或随机变化。当胁迫随着时间而组合时,它们可能是同时的(连续的或部分重叠的)或分离的。
在另一个实施方案中,可以在本发明的方法中施加增加化学胁迫的附加步骤。因此,可以通过在体外培养期间,将花药或分离的配子体暴露于非生物胁迫或化学胁迫下,来另外诱导单倍体胚胎发育或小孢子胚胎形成、花粉胚胎形成或雄性生殖(Touraev,A.等(1997),《植物科学发展趋势》(Trends Plant Sci.)2:297-302)。
在另一个实施方案中,该产生单倍体细胞系统或生物体的方法可包括从单倍体细胞系统产生至少一个双单倍体细胞系统或生物体的附加步骤。
在又一个实施方案中,该产生单倍体或双单倍体细胞系统或生物体的方法可包括从至少一个单倍体细胞系统或生物体,或从至少一个双单倍体细胞系统或生物体产生幼苗的附加步骤。单倍体胚胎自发地或在用染色体加倍剂处理后转化为双单倍体植物的能力已被广泛利用,并且是技术人员公知的(Touraev,A.等(1997),《植物科学发展趋势》(TrendsPlant Sci.)2:297-302;Forster等(2007)同上)。在某些实施方案中,单倍体胚胎形成和染色体加倍基本可以同时发生。在其他实施方案中,在单倍体胚胎形成和染色体加倍之间可能存在时间延迟。时间延迟可能与单倍体胚、幼苗或小植株生长达到的发育阶段有关。如果单倍体幼苗、植物或小植株的生长不涉及自发的染色体加倍事件,则可以根据普通技术人员熟悉的程序使用化学染色体加倍剂。根据本发明的各个方面和实施方案合适的染色体加倍和染色体加倍剂在以下文献中进行了描述:Segui-Simarro J.M.和Nuez F.(2008)《细胞遗传与基因组研究》(Cytogenet.Genome Res.)120:358-369)。合适的染色体加倍剂包括,例如,秋水仙碱、抗微管剂或抗微管除草剂(如戊炔草胺)、一氧化二氮或任何有丝分裂抑制剂。在使用秋水仙碱的情况下,培养基中的浓度通常可以是0.01%-0.2%,或约0.05%或APM(5-225μM)。秋水仙碱的浓度范围可以为约400-600mg/L,或约500mg/L。在使用戊炔草胺的情况下,培养基浓度可以为约0.5-20μM。诸如DMSO、佐剂或表面活性剂的其他试剂可以与有丝分裂抑制剂一起使用,以提高加倍效率。合适的染色体加倍剂的通用名称或商品名称包括:秋水仙碱、乙酰三甲基秋水仙碱酸衍生物(acetyltrimethylcolchicinic acidderivative)、草长灭、氯苯胺灵、苯胺灵、戊炔草胺(pronamide/propyzamide tebutam)、二甲基敌草索(DCPA)、麦草畏(Dicamba/dianat/disugran)(BANVEL,CLARITY)、氟草胺(benfluralin/benefin,BALAN)、仲丁灵、chloralin、敌乐胺(dinitramine)、乙丁烯氟灵(ethalfluralin,Sonalan)、氟消草(fluchloralin)、异乐灵(isopropalin)、methalpropalin、磺乐灵(nitralin)、黄草消(oryzalin,SURFLAN)、二甲戊乐灵(pendimethalin,PROWL)、氨氟乐灵(prodiamine)、环丙氟灵(profluralin)、氟乐灵(trifluralin,TREFLAN、TRIFIC、TRILLIN)、AMP(甲基胺草磷,Amiprofos methyl);甲基胺草磷抑草磷(amiprophos-methyl Butamifos)、氟硫草定(Dithiopyr),以及噻唑烟酸(Thiazopyr)。施用所述试剂的结果是纯合双单倍体细胞或细胞系统生物体。
在上述方法的一个实施方案中,该至少一个合成转录因子或编码其的序列,或者该至少一个合成转录因子的至少一个组分或编码其的序列,通过独立地选自生物和/或物理方法的方法引入该单倍体细胞系统中,该方法包括转染、转化,其中包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染)或其任何组合。
在上述方法的另一个实施方案中,该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在上述方法的一个实施方案中,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在本发明各个方面的另一个优选实施方案中,STF的识别结构域包括解除武装的LbCpf1结构域(SEQ ID NO:282)、解除武装的LbCpf1_RR结构域(SEQ ID NO:283)和/或解除武装的LbCpf1_RVR结构域(SEQ ID NO:284)。为了提高转录调控(优选地为激活)的效率,优选靶向转录起始位点上游高达250bp的区域的CRISPR/Cpf1系统gRNA。在本文所述的本发明各方面的一个实施方案中,优选的gRNA靶向该转录起始位点上游1-250、1-200、1-150、1-100、1-50、50-250、100-250、150-250或200-250bp范围内,或本文所公开范围之间的任何范围的区域。
在一个优选实施方案中,提供单倍体或双单倍体细胞系统或生物体的方法可以利用如本文上文所述的至少一个包含至少一个识别结构域和至少一个激活结构域的合成转录因子,其中与本发明的合成转录因子相关的所述实施方案和方面可用于提供获得单倍体或双倍单倍体细胞系统或生物体的优化方法。
在提供单倍体或双单倍体细胞系统或生物体的方法的另一个实施方案中,该至少一个合成转录因子的至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在本发明的优选实施方案中,该至少一个激活结构域是VPR(SEQ ID NO:276)。在本发明的另一个优选实施方案中,可以使用不同激活结构域的组合,例如,VP64-p65-Rita或本领域通常已知的激活结构域的任何组合。
用于本文所述的CRISPR/Cpf1系统的合适的接头包括柔性接头,例如5GS或XTEN,而体内可裂解的接头不适合于本文所述的本发明的各个方面。
在提供单倍体或双单倍体细胞系统或生物体的方法的另一个实施方案中,该至少一个合成转录因子的至少一个激活结构域相对于该至少一个合成转录因子的至少一个识别结构域位于N-末端和/或C-末端。
在本发明的提供单倍体或双单倍体细胞系统或生物体的方法的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域,可选地在该识别结构域和该激活结构域之间具有接头,优选地为5xGS接头。
根据本文公开方法的待修饰的优选形态发生基因可选自由BBM、WUS、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4所构成的组。根据本文公开方法的待修饰的更优选形态发生基因可以是包含选自由以下各项所构成的组的核苷酸序列的基因:(i)SEQ ID NO:199-237中任一个所示的核苷酸序列,(ii)具有SEQ ID NO:199-237中任一个所示的核苷酸序列的编码序列的核苷酸序列,(iii)与(i)或(ii)的核苷酸序列互补的核苷酸序列,(iv)与(i)、(ii)或(iii)的核苷酸序列具有至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性(优选在全长上)的核苷酸序列,(v)在严格条件下与(iii)的核苷酸序列杂交的核苷酸序列,(vi)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的核苷酸序列,(vii)编码包含与SEQ ID NO:238-258中任一个所示的序列至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列的蛋白的核苷酸序列,或(viii)编码包含SEQ ID NO:238-258中任一个所示的氨基酸序列的蛋白的同源物、类似物或直系同源物的核苷酸序列。
在提供单倍体或双单倍体细胞系统或生物体的方法的一个实施方案中,该至少一个合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为转录。
在提供单倍体或双单倍体细胞系统或生物体的方法的另一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ ID No:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID No:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在一个实施方案中,该至少一个单倍体细胞系统可选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中该至少一个真核细胞可以是至少一个植物细胞,并且/或者其中,该至少一个真核生物体可以是植物或植物的一部分。
在另一个实施方案中,该植物的至少一部分可选自由叶、茎、根、初生胚根(emerged radicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在另一个实施方案中,该植物细胞、该至少一个植物或植物的一部分源自可选自由以下各项所构成的组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeumbulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucusglochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
一方面,本发明涉及一种细胞系统或其后代,其通过根据上述实施方案中任一项的用于提高细胞系统中转化效率的方法获得。
另一方面,本发明涉及一种细胞系统或其后代,其通过根据上述实施方案中任一项的在预定位置修饰细胞系统的遗传物质的方法获得。
在另一方面,本发明涉及一种单倍体或双单倍体生物体,其通过根据以上实施方案中任一项的生产单倍体或双单倍体生物体的方法获得。
在本发明的一个方面,可提供至少一个细胞系统、至少一个单倍体细胞系统和/或至少一个单倍体或双单倍体细胞系统或生物体,其可通过本文所公开的方法,利用特异性调控至少一个目的形态发生基因的转录的至少一个合成转录因子获得。这样获得的细胞系统然后可以用于本文中使用的其他基因组编辑方法,或用于从修饰的细胞系统再生植物。
在本发明的一个方面,根据本文公开的各种方法,提供了一种基于合成转录因子或编码该转录因子的序列的方法或用途。
一方面,本发明还提供了根据上述任何实施方案的合成转录因子或编码其的序列在根据上述任何实施方案的用于提高细胞系统中转化效率的方法中的用途。
另一方面,本发明还提供了根据上述任何实施方案的合成转录因子或编码其的序列在根据上述任何实施方案的在预定位置修饰细胞系统的遗传物质的方法中的应用。
另一方面,本发明还提供了根据上述任何实施方案的合成转录因子或编码其的序列在根据上述任何实施方案的产生单倍体或双单倍体生物体的方法中的用途。
通过使用本发明的合成转录因子,可以激活细胞系统中内源基因的表达。可以特异性地靶向多个内源基因,以瞬时的方式在无转基因的环境中增强表达。因此,本文所述的手段和方法具有广泛的潜在应用。
一方面,公开了一种合成转录因子或编码其的核苷酸序列,其包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子可配置为调控细胞系统中内源基因的表达。
在优选实施方案中,该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在另一个优选实施方案中,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在本发明各个方面的另一个优选实施方案中,STF的识别结构域包括解除武装的LbCpf1结构域(SEQ ID NO:282)、解除武装的LbCpf1_RR结构域(SEQ ID NO:283)和/或解除武装的LbCpf1_RVR结构域(SEQ ID NO:284)。为了提高转录调控(优选地为激活)的效率,优选靶向转录起始位点上游高达250bp的区域的CRISPR/Cpf1系统的gRNA。在本文所述的本发明各个方面的一个实施方案中,优选的gRNA靶向转录起始位点上游1-250、1-200、1-150、1-100、1-50、50-250、100-250、150-250或200-250bp范围内,或本文所公开范围之间的任何范围的区域。
在一个实施方案中,该至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在优选实施方案中,该至少一个激活结构域是VPR(SEQ ID NO:276)。在本发明的另一个优选实施方案中,可以使用不同激活结构域的组合,例如,VP64-p65-Rita或本领域通常已知的激活结构域的任何组合。
用于本文所述的CRISPR/Cpf1系统的合适的接头包括柔性接头,例如5GS或XTEN,而体内可裂解的接头不适合于本文描述的本发明的各个方面。在另一个实施方案中,该至少一个激活结构域相对于该至少一个识别结构域位于N-末端和/或C-末端。
在本发明的合成转录因子的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域,可选地在该识别结构域和该激活结构域之间具有接头,优选地为5xGS接头。
在另一个实施方案中,该内源基因选自由以下各项所构成的组:编码对非生物胁迫的抗性或耐受性的基因,该非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,该除草剂抗性包括草甘膦抗性、草铵膦/磷丝菌素抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性和麦草畏抗性或耐受性;编码对生物胁迫的抗性或耐受性的基因,该生物胁迫包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,该产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳成分或营养含量。具体的优选实例是ZmZEP1(SEQ ID NO:309)、ZmRCA-beta(SEQ ID NO:310)、BvEPSPS(SEQ ID NO:311)和BvFT2(SEQ ID NO:312)。
本发明的其它优选实施方案包括,增加Na+/H+反转运蛋白的表达以诱导番茄植物中的盐耐受性(Zhang HX和Blumwald E(2001),转基因耐盐番茄植物在叶子中积累盐而不在果实中积累盐(Transgenic salt-tolerant tomato plants accumulate salt infoliage but not in fruit),《自然生物技术》(Nature Biotechnpology)19,765-768);BvTST2.1过表达以提高直根中的蔗糖产量(Jung等(2015),鉴定甜菜直根中负责蔗糖积累的转运蛋白(Identification of the transporter responsible for sucroseaccumulation in sugar beet taproots),《自然植物》(Nature Plants)1,14001);Rubisco组装伴侣Rubisco组装因子1(RAF1)对Rubisco大小亚基的过表达对提高玉米产量的作用(overexpression of small and large subunits from Rubisco with theRubisco assembly chaperone RUBISCO ASSEMBLY FACTOR 1(RAF1)for improving cornproductivity)(Salesse-Smith CE等(2018),RAF1过量表达Rubisco亚基会增加玉米中Rubisco的含量(Overexpression of Rubisco subunits with RAF1increases Rubiscocontent in maize),《自然植物》(Nature Plants)2,802-810);过表达ZmArgos以增加抗旱性(Shi J等(2015),ARGOS基因的过度表达修饰植物对乙烯的敏感性,从而提高拟南芥和玉米的耐旱性(Overexpression of ARGOS genes modifies plant sensitivity toethylene,leading to improved drought tolerance in both Arabidopsis andmaize),《植物生理学》(Plant Physiology)169(1),266-282);以及激活HPPD基因表达以诱导除草剂抗性(Nakka S等(2017),苋菜(Amaranthus palmeri S.Wats)对羟基苯丙酮酸双酯酶(HPPD)抑制剂抗性的生理和分子生物学特性(Physiological and molecularcharacterization of hydroxyphenylpyruvate diogygenase(HPPD)-inhibitorresistance in Palmer Amaranth(Amaranthus palmeri S.Wats)),《植物科学前沿》(Frontiers in Plant Science)8,555)。
在一个实施方案中,该合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控内源基因的表达,优选地为调控内源基因的转录。
在另一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ IDNo:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在一个实施方案中,该细胞系统选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中该至少一个真核细胞是至少一个植物细胞,并且/或者其中该至少一个真核生物体是植物或植物的一部分。
在另一个实施方案中,该植物的至少一部分选自由叶、茎、根、初生胚根(emergedradicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在另一个实施方案中,该至少一个植物细胞、该至少一个植物或植物的至少一部分源自选自由以下各项所构成的组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在另一方面,提供了一种用于提高细胞系统中至少一个内源基因表达的方法,其中该方法包括以下步骤:
(a)提供细胞系统;
(b)在该细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;
其中该至少一个合成转录因子或编码其的核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中该合成转录因子配置为提高该细胞系统中的至少一个内源基因的表达,特别地为提高该细胞系统中的至少一个内源基因的转录。
在优选实施方案中,该至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
在另一个优选实施方案中,该至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中该至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
在本发明各个方面的另一个优选实施方案中,STF的识别结构域包括解除武装的LbCpf1结构域(SEQ ID NO:282)、解除武装的LbCpf1_RR结构域(SEQ ID NO:283)和/或解除武装的LbCpf1_RVR结构域(SEQ ID NO:284)。为了提高转录调控(优选地为激活)的效率,优选靶向转录起始位点上游高达250bp的区域的CRISPR/Cpf1系统的gRNA。在本文所述的本发明各个方面的一个实施方案中,优选的gRNA靶向转录起始位点上游1-250、1-200、1-150、1-100、1-50、50-250、100-250、150-250或200-250bp范围内,或本文所公开范围之间的任何范围内的区域。
在一个实施方案中,该至少一个激活结构域选自由酸性转录激活结构域所构成的组,优选地,其中该至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在优选实施方案中,该至少一个激活结构域是VPR(SEQ ID NO:276)。在优选实施方案中,该至少一个激活结构域是VPR(SEQ ID NO:276)。在本发明的另一个优选实施方案中,可以使用不同激活结构域的组合,例如,VP64-p65-Rita或本领域通常已知的激活结构域的任何组合。
用于本文所述的CRISPR/Cpf1系统的合适的接头包括柔性接头,例如5GS或XTEN,而体内可裂解的接头不适合于本文所述的本发明的各个方面。在另一个实施方案中,该至少一个激活结构域相对于该至少一个识别结构域位于N-末端和/或C-末端。
在本发明的用于提高细胞系统中至少一种内源基因表达的方法的优选实施方案中,STF的识别结构域是至少一个解除武装的CRISPR/Cpf1系统,或是至少一个解除武装的CRISPR/Cpf1系统的片段,并且该激活结构域是VPR结构域,可选地在该识别结构域和该激活结构域之间具有接头,优选地为5xGS接头。
在一个实施方案中,该内源基因选自由以下各项所构成的组:编码对非生物胁迫的抗性或耐受性的基因,该非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,所述除草剂抗性包括草甘膦抗性、草铵膦/磷丝菌素抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性和麦草畏抗性或耐受性;编码对生物胁迫的抗性或耐受性的基因,该生物胁迫包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳成分或营养含量。。
在一个实施方案中,该合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域来调控内源基因的表达,优选地为调控内源基因的转录。
在另一个实施方案中,该合成转录因子和/或该至少一个识别结构域包含SEQ IDNO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
在一个实施方案中,该细胞系统选自由至少一个真核细胞或真核生物体所构成的组,优选地,其中,该至少一个真核细胞是至少一个植物细胞,并且/或者其中,该至少一个真核生物体是植物或植物的一部分。
在一个实施方案中,该植物的至少一部分选自由叶、茎、根、初生胚根(emergedradicles)、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝所构成的组。
在另一个实施方案中,该至少一个植物细胞、该至少一个植物或植物的至少一部分源自选自由以下各项所构成的组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
由于本文公开的合成转录因子的模块特性,还可以提供至少一个合成转录因子,其包含至少一个本文所公开的识别结构域,并且还包含沉默结构域。因此,沉默结构域取代了激活结构域,以提供高度特异性的合成转录因子,用于在这种情况下降低目的基因的转录。
真核生物体的转录阻遏是通过“沉默子”实现的,沉默子有不同的类型,即“沉默子元件”和“负调控元件”(NRE)。沉默子元件是经典的,与位置无关的元件,可控制主动的阻遏机制,而NRE是与位置有关的元件,可引导被动的阻遏机制。另外,“阻遏物”是与沉默子直接相互作用的DNA结合转录因子。沉默子本身及其在给定启动子中的环境(而不是相互作用的阻遏物)通常决定了阻遏的机制。沉默子构成许多真核启动子的固有部分,因此对于真核生物体(包括动植物细胞)的基因调控极为重要。沉默子元件可位于相对于转录起始位点的5'或3'方向。
因此,本发明的合成转录因子或编码其的核苷酸序列还可包含至少一个识别结构域和至少一个沉默结构域,其中该合成转录因子配置为调控目的细胞或细胞系统(优选地为植物细胞)中形态发生基因的表达。
一方面,提供了一种用于产生转基因细胞系统或生物体的方法,其包括进行本文详述的任何方法,其中,该方法还包括再生包含至少一个目的核苷酸序列作为转基因的细胞系统或生物体。在本文中,“转基因”是指人工引入到细胞、细胞系统或生物体中的任何核酸序列。
根据某些实施方案,用于产生转基因细胞系统或生物体的方法可以优选地使用本文公开的合成转录因子来获得这种转化材料的更高转化频率和/或再生速率。
在另一方面,提供了一种用于产生遗传修饰的细胞系统或生物体的方法,其中,该方法可包括在上文详述的预定位置处执行修饰细胞系统遗传物质的方法,其中,该方法还包括以下步骤:使在细胞系统或生物体遗传物质中的预定位置包含修饰的细胞系统或生物体再生。同样,所述方法依赖于使用根据本发明各个方面和实施方案的合成转录因子。该方面可以有利地用于将至少一个构建体或遗传物质瞬时引入目的细胞或细胞系统中,以靶向的方式修饰目的基因(优选地为形态发生基因)的转录,从而增强有可能携带插入和/或缺失和/或编辑的靶向细胞或细胞系统的再生能力。反过来,这大大减少了要针对阳性遗传修饰或编辑进行筛选的细胞数量。
在根据本发明的各个方面的一个实施方案中,该至少一个目的核酸序列作为至少一个载体的一部分,或作为至少一种线性分子提供。在另一方面,该至少一个目的核酸序列可以复合物的形式提供,优选地为物理缔合至少一种核酸序列与另一种RT和/或与gRNA和/或与位点特异性核酸酶的复合物。该至少一个目的核酸序列还可包含允许所述目的序列(例如标签(包括荧光标签))的快速可追溯性(包括视觉可追溯性)的序列。该至少一个目的核酸序列可以是双链、单链或其混合物。此外,该至少一个目的核酸序列可包含DNA和RNA核苷酸的混合物,还包括合成的,即非天然存在的,核苷酸。
递送和分析方法:
可以使用将至少一个生物分子引入细胞或细胞系统的任何合适的递送方法,具体取决于目的细胞或细胞系统。因此,本文所用术语“引入”意指,将生物分子或遗传构建体(DNA、RNA、单链或双链蛋白(包括天然和/或合成组分)或其混合物)功能性转移到至少一个细胞或细胞系统中,这使得可以实现转录和/或翻译和/或催化活性,和或结合活性(包括将核酸分子与另一个核酸分子(包括DNA或RNA)结合、将蛋白与该至少一个细胞或细胞系统内的靶结构结合),和/或转录和/或翻译后引入酶的催化活性。在适当的情况下,遗传构建体的功能整合可能发生在至少一个细胞的某个细胞区室中,包括细胞核、胞质溶胶、线粒体、叶绿体、液泡、膜、细胞壁等。因此,“功能整合”一词意指,通过利用生物手段(包括农杆菌转化)或物理手段(包括粒子轰击)进行转化、转染或转导的方法以及后续步骤将目的分子复合物引入该至少一个细胞或细胞系统中,其中该分子复合物可在其引入的至少一个细胞或细胞系统上或内发挥效用,而不管该构建体或复合物是以稳定方式还是以瞬时方式引入。
因此,根据各个实施方案,可以以至少一种载体(例如质粒载体)的形式,作为至少一个线性分子或至少一个复合物提供根据本发明的至少一个STF。
取决于要待引入的遗传构建体或生物分子的性质,所述作用自然可以变化,并且单独或组合地包括由遗传构建体编码的DNA向核糖核酸的转录、RNA向氨基酸序列的翻译、细胞内RNA分子的活性,包括用于RNA干扰的向导RNA、crRNA、tracrRNA或miRNA或siRNA的活性和/或结合活性(包括核酸分子与另一种核酸分子(包括DNA或RNA)的结合,或蛋白质与至少一个细胞内靶结构的结合,或包括通过载体或遗传构建体递送序列的整合(无论是瞬时还是稳定的方式)。所述作用还可以包括在至少一个细胞中代表酶或其催化活性部分的氨基酸序列的催化活性。在根据本发明的分子复合物的功能整合后实现的所述效果可取决于调控序列或定位序列的存在,该调控序列或定位序列是由所属领域技术人员已知的目的遗传结构组成的。
根据本发明的方法的各种合适的瞬时和稳定的递送技术,用于将遗传物质、生物分子(包括任何种类的单链和双链DNA和/或RNA或氨基酸)、合成或化学物质引入真核细胞(优选植物细胞),或引入包含目的遗传物质的细胞系统中,是技术人员已知的,并且尤其包括选择直接递送技术,其范围从原生质体的聚乙二醇(PEG)处理(Potrykus,1985);电穿孔(D'Halluin等,1992)、显微注射(Neuhaus等,1987)、碳化硅纤维晶须技术(Kaeppler等,1992)、病毒载体介导的方法(Gelvin,《自然生物技术》(Nature Biotechnology)23,“病毒介导的植物转化得到促进”(Viral-mediated plant transformation gets a boost),684-685(2005))和粒子轰击(参见Sood等,2011,《植物生物学》(Biologia Plantarum),55,1-15)等方法。用PEI瞬时转染哺乳动物细胞的方法在Longo等,《酶学方法》(MethodsEnzymol.),2013,529:227-240中进行了公开。转化哺乳动物细胞的方案在《分子生物学方法》-核酸或蛋白质,ed.John M.Walker,Springer Protocols中进行了公开。
对于要修饰的植物细胞,尽管发展了基于农杆菌转化或病毒载体介导的植物转化等生物转化方法,基于粒子轰击或显微注射等的物理传递方法仍是将遗传物质引入目的植物细胞或组织的重要技术。Helenius等(“使用HeliosTM基因枪将基因递送到完整植物中(Gene delivery into intact plants using the HeliosTM Gene Gun)”,《植物分子生物学报道》,2000,18(3):287-288)公开了一种粒子轰击作为将材料引入植物细胞的物理方法。
当前,因此,存在多种植物转化方法,以遗传构建体的形式将遗传物质引入目标植物细胞或细胞系统中,包括植物生物技术领域技术人员已知的生物和物理手段,均可应用于根据本发明的生物分子或其复合物的各种引入技术。值得注意的是,所述用于转化和转染的递送方法可以应用于同时引入本发明的工具。常见的生物学手段是用农杆菌属物种转化,几十年来,它已用于多种不同的植物材料。病毒载体介导的植物转化代表了将遗传物质引入目的细胞的另一种策略。如本文所用的,术语“粒子轰击”,也称为“生物转染”或“生物轰击”或“微粒介导的基因转移”,是指用于将包含目的核酸或遗传构建体的包被微粒或纳米颗粒转移到靶细胞或细胞中的物理递送方法。物理引入方法适合于引入核酸(即RNA和/或DNA)以及蛋白质。同样,存在用于将目的核酸或氨基酸构建体特异性引入植物细胞的特异性转化或转染方法,包括电穿孔、显微注射、纳米颗粒和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以引入遗传构建体和/或核酸和/或蛋白质,尤其包括用磷酸钙转染,使用脂质体(例如阳离子脂质体)进行转染,或使用阳离子聚合物(包括DEAD-葡聚糖或聚乙烯亚胺)进行转染,或其组合。因此,所述递送方法和递送载体或产物固有地不同于用于其他真核细胞(包括动物和哺乳动物细胞)的递送工具,并且每种递送方法可能必须针对引入和/或修饰至少一个细胞系统、植物细胞、组织、器官或整个植物的遗传物质目的构建体进行专门的微调和优化;并/或可以以完全功能性和活性的方式引入到目标靶细胞的特定区室中。
单独或组合使用以上递送技术,可用于体内(植物体内)或体外方法。根据本发明的各个实施方案,不同的递送技术可以同时或相继地彼此组合使用,例如,使用用于至少合成转录因子或编码其的序列以及位点特异性核酸酶或编码其的mRNA或DNA以及可选的其他分子(例如gRNA)的化学转染,而这与使用基于农杆菌的技术瞬时提供(部分)失活相结合。
因此,本发明的合成转录因子可以与用于诱导靶向的基因组编辑的相关工具的转化和/或转染、和/或与诱导单倍体或双倍单倍体发育的其他化学物质一起、在之前或之后引入。
同样地,根据本发明的用于分析成功的转化或转染事件的方法是本领域技术人员已知的,并且包括但不限于,聚合酶链反应(PCR),尤其包括实时定量PCR、多重PCR、RT-PCR、巢式PCR、分析PCR等,显微镜(包括明视野和暗视野显微镜)、分散体染色、相衬、荧光、共焦、微分干涉衬度、解卷积、电子显微镜、UV显微镜、IR显微镜、扫描探针显微镜检查、植物或植物细胞代谢产物的分析,RNA分析、蛋白质组分析、用于确定功能整合的功能测定(例如标记基因或目的转基因,或敲除)、Southern-Blot分析、测序(包括下一代测序,包括深度测序或多重测序等)及其组合。
在根据本发明的上述方面的又一个实施方案中,目的构建体的引入是使用物理和/或生物学方法进行的,所述物理和/或生物学方法选自由以下各项所构成的组:适用于粒子轰击的装置,包括基因枪(包括手持式基因枪(例如
Figure BDA0002643914670000671
基因枪系统,BIO-RAD)或固定式基因枪;转化,包括使用农杆菌属物种,或使用病毒载体、显微注射、电穿孔、晶须技术(包括碳化硅晶须技术)进行的转化;以及转染;或其组合。
除非另有说明,否则所公开方法的实施采用分子生物学、生物化学、遗传学、计算化学、细胞培养、重组DNA和相关领域中的常规技术,如本领域技术人员所知的。这些技术在文献中已得到充分解释。参见,例如,Sambrook等,分子克隆:实验室手册(MOLECULARCLONING:A LABORATORY MANUAL),第二版,冷泉港实验室出版社(Cold Spring HarborLaboratory Press),1989;Ausubel等,《分子生物学最新方案》(CURRENT PROTOCOLS INMOLECULAR BIOLOGY),约翰·威利父子出版社(John Wiley&Sons),纽约,1987;定期更新;以及《酶学方法》系列(series METHODS IN ENZYMOLOGY),学术出版社(Academic Press),圣地亚哥。
参考以下非限制性实施例进一步描述本发明。
实施例
实施例1:用于瞬时表达玉米(Zm)的内源性形态发生基因的TAL转录因子
在一个实施例中,商业设计和构建的TAL转录因子用于暂时性地增强BBM和WUS的表达。TAL转录因子设计为与BBM的SEQ ID NO:95、109-147、270-272所示约24bp的调控区域和/或WUS的SEQ ID NO:96、148-190所示约18bp的调控区域结合(参见图3A和3B)。BBM的TAL转录因子识别结构域包含SEQ ID NO:13-51所示的序列,并且/或者WUS的TAL转录因子识别结构域包含SEQ ID NO:52-94所示的序列。
可以设计和克隆TAL效应物序列,可以以融合蛋白样方式将单纯疱疹病毒(VP16或四聚体VP64)的激活结构域添加到构建体中。
首先通过PEG介导的转化和定量逆转录酶PCR或分别针对ZmBBM和ZmWUS mRNA或蛋白质的蛋白质免疫印迹(western blot)在玉米原生质体中测试表达的瞬时诱导。为实现这一点,将20μg编码TALE转录因子的质粒DNA通过本领域公知的基于PEG的转化系统输送到约600000个原生质体中(参见图4)。一式三份进行实验,并重复四次(生物学重复)。转化后24小时,使用市售试剂盒提取RNA,并将其转化为cDNA。使用SYBR Green qRT-PCR方法确定内源性ZmWUS和ZmBBM的表达。结果清楚地表明,合成转录因子TALE1(SEQ ID NO:151)和TALE5(SEQ ID NO:271)能够诱导WUS(60倍诱导)和BBM(490倍诱导)的内源基因表达(参见图4A和4B)。
接下来,在可再生组织中测试由TALE转录因子诱导的瞬时ZmWUS表达的表型功能(参见图5)。因此,用荧光标记tdT、TALE1和PLT7通过基因枪法转化玉米A188愈伤组织的单细胞。在监测到tdTomato的红色荧光信号后,通过荧光显微镜确认细胞增殖的诱导(参见图5,白色圆圈和箭头)。结果清楚地表明,TALE转录因子能够通过WUS和/或BBM的瞬时表达诱导再生和胚胎形成。
此外,定量逆转录酶PCR或使用分别针对ZmBBM和ZmWUS mRNA或蛋白质的特异性抗体的蛋白质免疫印迹表明了表达与胚胎形成表型之间的联系。表达的瞬时行为可以通过逆转录酶PCR或分别针对ZmBBM和ZmWUS mRNA或蛋白的蛋白质免疫印迹随时间进行检测。
实施例2:非功能性CRISPR-核酸酶和激活结构域之间的融合蛋白,用于在玉米中瞬时表达内源性形态发生基因
与实施例1相似,设计用于瞬时递送的构建体,在这种情况下,表达dCas9(可用PAM变体)或dCpf1(可用PAM变体)作为具有激活结构域(例如,VP16或VP64)的融合蛋白。潜在的靶位点/调控区域包括:ZmBBM的SEQ ID No:97-99所示的Cas9靶序列;ZmBBM的SEQ ID No:100-102所示的Cpf1靶序列;ZmWUS2的SEQ ID NO:103-105所示的Cas9靶序列;ZmWUS2的SEQID No:106-108所示的Cpf1靶序列。
基于上述CRISPR/dCas9和CRISPR/dCpf1的调控区域,可以设计并商业上获得基于CRISPR的转录因子系统,其具有包含SEQ ID NO:1-12所示序列的识别结构域。
首先通过PEG介导的转化和定量逆转录酶PCR或分别针对ZmBBM和ZmWUS mRNA或蛋白质的蛋白质免疫印迹在玉米原生质体中测试表达的瞬时诱导。然后,通过颗粒递送或农杆菌介导的转化,在诸如愈伤组织或未成熟胚的可再生组织中测试了瞬时ZmBBM和ZmWUS表达的表型功能。技术人员可以成功地诱导胚胎形成。此外,定量逆转录酶PCR或分别针对ZmBBM和ZmWUS mRNA或蛋白质的蛋白质免疫印迹表明了表达与胚胎形成表型之间的联系。
表达的瞬时行为可以通过反转录酶PCR或分别针对ZmBBM和ZmWUS mRNA或蛋白质的蛋白质免疫印迹随时间进行检测。
实施例3:替换激活结构域以优化形态发生基因的表达
本实施例旨在以系统的方式测试不同的前述激活结构域的行为。这足以用来评估它们对ZmWUS和ZmBBM的表达水平的影响。如上所述,目的特异性靶基因的不同STF可包含不同的激活和识别结构域以及其他元件。因此,其非常适合为一个靶标和同一靶标设计不同的STF,从而最终定义用于调控目的基因的最佳STF。
水稻白叶枯病菌的TAL效应物基因的天然激活结构域是与TAL转录因子一起使用的最明显的激活结构域,并且还代表一个根据本发明的各个方面可单独或组合使用但也已经用于其它设定的激活结构域。它们属于酸性(转录)激活结构域家族。
先前已经在哺乳动物和昆虫细胞系统中测试了其他可用的激活结构域(Chavez、Alejandro等,“跨物种Cas9激活子的比较分析”(Comparative Analysis of Cas9Activators Across Multiple Species),《自然方法》(Nature methods)13.7(2016):563–567,PMC.Web.2017年9月22日),但对于用于调控目的形态发生基因转录的特定用途的植物系统中使用的合成转录因子的最佳激活结构域却知之甚少。
在此实施例中,实施例1和2中的VP16或VP64在由氨基酸链的N-末端或C-末端或两个末端的VPR、SAM、Scaffold、Suntag、P300、VP160,或这些因子中至少两个的组合或VP16和VP64替代。
通过定量逆转录酶PCR或针对激活的基因ZmBBM和ZmWUS的蛋白质免疫印迹评估与TAL或dCas9结合的激活结构域的功效,但最终通过愈伤组织或未成熟胚的表型反应进行评估。
实施例4:替换识别结构域以提高目标可变性和灵活性
在该实施例中,将实施例1、2和3的TAL、dCas9或dCpf1替换为序列特异性锌指结构域或归巢核酸内切酶。作为实施例3中鉴定的具有最佳激活结构域的融合蛋白,可以组合多种导致不同基因表达强度不同的转录激活子。例如,由于dCas9或dCpf1不能在sgRNA结合中提供足够的特异性,因此仅依靠dCas9系统可能不足以特异性靶向激活结构域(至少对于某些目的基因而言)。具体来说,dCas9和dCpf1系统在靶位点特异性方面受到限制,因为它们在靶基因的调控区域中需要特异性PAM基序,而在至少某些目的基因中可能并不存在该基序(Gao、L.等(2017),“具有改变的PAM特异性的工程化Cpf1变体(Engineered Cpf1variants with altered PAM specificities)”,《自然生物技术》(Nat Biotech);以及Kleinstiver、B.P.等(2015),“具有改变的PAM特异性的工程化CRISPR-Cas9核酸酶(Engineered CRISPR-Cas9 nucleases with altered PAM specificities)”,《自然》(Nature),523(7561):481-485)。相反,TAL转录因子通常需要初始T才能识别靶位点。因此,为了改善与难以与例如TAL STF连接的特异性目的靶基因的调控区域的结合,可以用基于dCpf1的系统替换TAL识别结构域,以便能够缩小到ATG的最佳距离,或者确定实现增强转录激活的更宽的靶向范围。此外,通过本文描述的实验获得的信息可用于设计和组合用于不同内源性调控区域的不同STF系统,以改善至少一种目的靶基因的转录激活。
改善靶位点特异性和转录激活的另一种选择是组合使用至少两个对相同目的靶基因的相同调控区域具有特异性的识别结构域(Bolukbasi、M.F.等(2015),“DNA结合结构域融合提高Cas9的靶向范围和精确度(DNA-binding-domain fusions enhance thetargeting range and precision of Cas9)”,《自然方法》(Nat Meth)12(12):1150-1156)。
与实施例3的激活子结合的其它识别结构域将通过定量逆转录酶PCR或针对激活的基因ZmBBM和ZmWUS的蛋白质免疫印迹再次进行评估。最终,其通过愈伤组织或未成熟胚中的表型反应来评估。
实施例5:除ZmBBM和ZmWUS外的形态发生和胚胎形成靶基因
已经描述了由胚胎形成的诱导导致的在愈伤组织或未成熟胚以及叶片或其它组织中瞬时过表达的多种基因。这些基因或其同源物可以单独或以组合的方式与实施例1至4中的转录激活子一起使用。该列表包括但不限于,WOX基因、其它WUS和BBM同源物、Lec1和Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT和IPT2、Knotted1和RKD4。优选地,设计为调控本文所公开的形态发生基因之一的合成转录因子包含至少两个激活结构域的融合,以提供最佳的识别特性,而单独使用一个激活结构域(例如,dCas9或dCpf1)则无法实现。此外,存在至少两个适当定位以避免空间位阻并实现高激活率的激活结构域。
实施例6:转录激活子在甜菜和小麦的形态发生和胚胎形成基因中的应用
实施例1至5中所述的方法可以转移至具有包含体外再生或组织培养步骤的转化方案的所有相关农作物。包括实施例1至5中所述的评估方案在内的所有操作和优化步骤以及靶基因及其同源物都可以转移至其他作物系统。必须知道形态发生和胚胎形成基因的基因组序列,以便可以设计和测试dCas9、dCpf1(两者均可用的PAM变体)、TAL效应物、锌指和归巢内切核酸酶的靶标。优选地,合成转录因子包含至少两个激活结构域的融合以提供最佳识别特性,而单独使用一个激活结构域(例如,dCas9或dCpf1)则无法实现。此外,存在至少两个适当定位以避免空间位阻并实现高激活率的激活结构域。
实施例7:定量分析增加的ZmBBM和ZmWUS转录
可以通过简单的PCR系统或定量逆转录酶PCR来测量BBM和WUS转录的诱导。后者的优点在于对转录的绝对定量具有更高的标准化程度。优选将简单的PCR系统用于针对野生型或转化事件之间的转录的相对比较。
使用简单PCR测定法测量BBM的转录激活。引物是SEQ ID NO:191所示的BBM-1和SEQ ID NO:192所示的BBM-2。Hot-Fire聚合酶用于34循环PCR中。
使用qRT-PCR(Taq-Man检测)测量WUS的转录激活。EF1基因用作参考。在40循环qPCR中,ZmEF1使用SEQ ID NO:193所示的引物ZmEF1xxxr01和SEQ ID NO:194所示的引物ZmEF1xxxf01进行扩增,并用SEQ ID NO:195所示的ZmEF1xxxMGB.1进行检测。ZmWUS使用SEQID NO:196所示的引物WUSxxxFw1和SEQ ID NO:197所示的引物WUSxxxRv1进行扩增,并用SEQ ID NO:198所示的WUSxxxMGB进行检测。
可以通过既定和先前公布的方法进行统计分析。
实施例8:玉米和甜菜愈伤组织和未成熟胚中合成转录因子的递送及形态发生提高的验证
实施例1至6中所述的合成转录因子可以以DNA、RNA或蛋白质的形式递送。已经描述了使用DNA转化玉米或甜菜愈伤组织和未成熟胚,并且这可以通过根癌农杆菌或粒子递送来完成。DNA的转化可以是瞬时的,这意味着表达盒未整合到基因组中,因此无法遗传或稳定,这意味着转化的目的是插入转基因盒。合成的或体外转录的RNA可以通过轰击来递送。通过根癌农杆菌的修饰菌株或颗粒递送已经完成了蛋白质递送。
可以在有标记基因或没有标记基因的情况下,引入瞬时或稳定转化的基因或基因片段或任何其它合成构建体(例如,包括合适的标签)。标记基因可助于选择或筛选转化细胞或组织。其范围可以从检测转化细胞的荧光标记(例如tdTomato)到有利于阳性选择的除草剂抗性基因。
有知识的技术人员可以通过眼睛或各种形式的显微镜检查(即,通过目视检查)来确定玉米或甜菜组织中形态发生提高的影响。通常,可以通过受影响的组织中细胞分裂的增加和胚胎形成的诱导来区分。胚胎形成可以使受影响的细胞被重新编程为胚胎早期发育阶段,即使它们之前是体细胞。
根据检测到的效果,可能有必要对转录强度和表达谱进行修改,以达到期望的效果。这种优化可能涉及鉴定最佳的转录激活子(实施例3)、靶位点(实施例1和2)、驱动表达的启动子、递送方法(实施例8和10)、递送时间(使用可诱导系统的可能性)和其它因素。
实施例9:将合成转录因子与基因编辑结合以提高具有编辑的再生植物的比率
可以将实施例1至8中所述的优化的转录激活子与基因编辑试剂或T-DNA载体共递送。典型的转化方法(例如,粒子轰击和农杆菌)可能对转化的或暴露的细胞不利。根据形态发生基因的瞬时激活的最新进展,可以共递送T-DNA盒和包含上述转录因子的质粒。这使得转化的或暴露的细胞具有优势而非劣势。
在该实施例中,可以和包含Cpf1基因和专门设计的crRNA(例如,为相关性状基因设计的)的表达盒一起通过粒子轰击来递送实施例1至8所示的质粒编码的瞬时转录激活子。该表达盒不包含供选择的抗性基因。从该愈伤组织再生的所有植物都在靶位点进行INDEL筛选。与未接受转录激活子的未选择组织相比,我们预期INDEL效率会大大降低。
将成功编辑的植物带入下一代并再次确认用Cpf1或其他定点核酸酶进行的修饰,我们预期与对照相比,编辑过的T1植物数量更高。
实施例10:基于蛋白质共递送合成转录激活子和定点核酸酶RNP,用于改善瞬时基因编辑
在该实施例中,将实施例9的组分作为纯化蛋白递送到诸如愈伤组织或未成熟胚的植物组织中。实施例1至8中所述的转录因子在原核或真核细胞系统中表达,并从中纯化。Cpf1同等地生产并与合成转录或体外转录的crRNA进行孵育以形成核糖核蛋白(RNP)。已经通过粒子轰击或融合至细胞穿透肽证明了蛋白质的递送。与实施例9相比,可以预期获得的编辑过的T1植物数量更少。但是,由于完全不存在可遗传物质,因此这种方法是极为需要的。
实施例11:将合成转录因子与碱基编辑结合以提高携带编辑的再生植物的速率
将实施例1至8中所述的优化的转录激活子与碱基编辑试剂一起共递送到轰击的DNA盒或携带其表达盒的一个或多个T-DNA载体上。典型的转化方法(例如,粒子轰击和农杆菌)可能对转化或暴露的细胞不利。根据形态发生基因的瞬时激活的最新进展,可以共递送T-DNA盒和包含上述转录因子的质粒。这使得转化或暴露的细胞具有优势而非劣势。
在该实施例中,可以和包含碱基编辑器基因和专门设计的向导RNA(例如,为相关性状基因设计的)的表达盒一起通过粒子轰击来递送实施例1至8所示的质粒编码的转录激活子,从而将碱基编辑器靶向适当的位点。该表达盒可包含或可不包含供选择的抗性基因。碱基编辑器基因可编码胞苷脱氨酶、腺嘌呤脱氨酶或另一种脱氨酶或其他适于进行碱基转化的催化活性。碱基编辑器还可基于适合于将碱基编辑功能递送至靶位点的任何CRISPR结构域。这可包括但不限于,Cas9、Cpf1、CasX、CasY或其他合适的结构域。从该愈伤组织再生的所有植物都在靶位点进行碱基取代筛选。与未接受转录激活子的细胞相比,我们预期该再生效率会更高。
实施例12:基于蛋白质共递送合成转录激活子和碱基编辑器RNP,用于改善瞬时基因编辑
在该实施例中,将实施例11的组分作为纯化蛋白和RNA递送到诸如愈伤组织或未成熟胚的植物组织中。实施例1至8中所述的转录因子在原核或真核细胞系统中表达并从中纯化。将碱基编辑器与合成转录或体外转录的crRNA进行同等的生产和孵育以形成核糖核蛋白(RNP)。通过粒子轰击或融合至细胞穿透肽已证明了蛋白质的递送。与实施例11相比,可以预期获得的编辑过的T1植物数量更少。但是,由于完全不存在可遗传物质,因此这种方法是极为需要的。
实施例13:基于Cpf1的转录激活子的生成
为了生成基于Cpf1的转录激活子,使用了LbCpf1表达质粒,包括识别原始TTTVPAM基序(pGEP362,SEQ ID NO:273)的野生型Lbcpf1以及两个分别识别TYCV和TATV PAM基序(pGEP487,SEQ ID NO:274;和pGEP488,SEQ ID NO:275)的LbCpf1变体(RR和RVR)。除了编码多聚核苷酸的LbCpfs之外,这些构建体还包含荧光标记mNeoGreen(参见图6A至图6C)。为了获得基于Cpf1的转录激活子,首先将VPR转录激活结构域(SEQ ID NO:276)融合到LbCpf1的C-末端。在哺乳动物细胞中显示,当用于激活GFP表达时,dAsCpf1-VP64融合仅导致最小激活,而使用VPR激活结构域导致20倍以上的转录激活(参见Liu等(2017),同上)。此外,dCAs9-VP64融合构建体在植物和动物细胞也只显示了对具有单个sgRNA(在一些情况下甚至具有多个sgRNA)的靶基因的弱激活。基于这些观察结果,使用了VPR激活结构域,VPR激活域经证实可在具有dCpf1-VPR融合系统的哺乳动物细胞中诱导强转录激活(Liu等人(2017),同上;以及Tak等(2017),同上)。
Tak等(2017)使用的VPR结构域的序列(SEQ ID NO:276)进行了调整,并且在LbCpf1和VPR结构域之间使用在基于Cas9的植物转录激活系统(Lowder等(2017),同上)中使用的5xGS接头(SEQ ID NO:277)。编码5xGS接头和VPR结构域的DNA序列已针对玉米进行了密码子优化(Genscript提供)。为促进克隆过程,在EcoRI和HindIII限制性位点之间的pUC57克隆载体中,通过侧翼为位于5’端的LbCpf1编码区域的3’端和位于3’端的Nos终止子的Genscript合成密码子优化的序列。所得的质粒命名为pKWS20,并示于(SEQ ID NO:278)。
接下来,pKWS20中带有VPR结构域的5xGS接头片段(随后是Nos终止子)通过EcoRI和HindIII双酶切反应释放,并用Gibson assembly方法克隆到MscI和XmaI双重消化的pGEP362(SEQ ID NO:273)、pGEP487(SEQ ID NO:274)或pGEP488(SEQ ID NO:275)的骨架(backbone)中,生成pGEP754(SEQ ID NO:279)、pGEP755(SEQ ID NO:280)和pGEP756(SEQID NO:281),携带与VPR激活结构域融合的野生型LbCpf1(SEQ ID NO:282)或LbCpf1的RR变体(LbCpf1(RR),SEQ ID NO:283)或LbCpf1的RVR变体(LbCpf1-RVR,SEQ ID NO:284)。将D832A突变进一步引入pGEP754、pGEP755和pGEP756中,以产生pGEP767(SEQ ID NO:285)、pGEP772(SEQ ID NO:286)and pGEP761(SEQ ID NO:287),其分别包含dLbCpf1-VPR(SEQ IDNO:288)或dLbCpf1(RR)-VPR(SEQ ID NO:289)或dLbCpf1(RVR)-VPR(SEQ ID NO:290)表达盒。质粒pGEP767、pGEP772和pGEP761(图6A、B、C)在以下转录激活实验中与不同的向导RNA表达质粒结合使用。
实施例14:靶向BBM和WUS的向导RNA设计
玉米Babyboom(BBM,SEQ ID NO:307)和Wuschel 2(WUS2,SEQ ID NO:308)基因是形态发生基因,据报道其通过异源过表达在许多之前不可转化的玉米自交系中实现高转化效率(Lowe,2016,同上)。为了测试内源性BBM和WUS2基因表达的激活是否具有相似的作用,设计了向导RNA,靶向BBM(SEQ ID NO:295-298)和WUS2(SEQ ID NO:291-294)启动子区域,以与LbCpf1-VPR融合蛋白结合使用。
据报道,通过在哺乳动物细胞中使用dCpf1-VPR融合系统,用转录起始位点上游~600bp和下游~400bp之间的靶标检测到转录激活(Tak等(2017),同上)。基于此,扫描ZmBBM和ZmWUS2的启动子区域中从转录起始位点上游~500bp到翻译起始位点的所有可能的PAM,并且利用不同的PAM,设计了跨越整个区域的总共的针对BBM的4个向导RNA(SEQ ID NO:295-298)和针对WUS2的4个向导RNA(SEQ ID NO:291-294)(图7和图10)。对于每个向导RNA序列,互补寡核苷酸集由IDT合成,然后退火并通过Golden Gate Assembly方法克隆到pGEP296(SEQ ID NO:299-306)中的LbCpf1 crRNA支架和丁型肝炎病毒(HDV)核酶之间(参见图8的代表性质粒图)。
实施例15:使用LbCpf1-VPR系统对ZmBBM和ZmWUS2的转录调控
首先通过PEG介导的转化,然后通过定量逆转录PCR,在玉米原生质体中测试内源基因表达的瞬时激活。为此,将15μg的编码LbCpf1-VPR融合蛋白的质粒DNA和8μg的表达向导RNA的质粒DNA通过本领域公知的基于PEG的转化系统共递送至约600000个玉米原生质体中。转化后24小时,使用市售试剂盒收集原生质体样品用于RNA提取和cDNA合成。然后使用SYBR Green qRT-PCR方法确定内源性ZmBBM和ZmWUS2的表达。如图9所示,所测试的靶向WUS2的启动子区域的向导RNAcrGEP186(SEQ ID NO:291)和crGEP201(SEQ ID NO:294)引起WUS2表达的显著激活(图9A)。类似地,发现靶向BBM启动子区域的向导RNA crGEP210(SEQID NO:297)和crGEP211(SEQ ID NO:298)会引起内源性BBM的强激活(图9B)。由于此实验仅进行了一次生物重复(三次技术重复),因此需要进一步确认,并且实验正在进行中。然而,本文首次提供的数据清楚地表明,可以使用基于Cpf1的转录激活系统来刺激植物基因激活。
序列表
<110> 科沃施种子欧洲股份两合公司
<120> 基于Cpf1的植物转录调控系统
<130> KWS0315PCT
<150> US62/609,508
<151> 2017-12-22
<150> US62/758,068
<151> 2018-11-09
<160> 318
<170> PatentIn version 3.5
<210> 1
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 1
caccgcucug aucacaagca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 2
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
cccauguguu guucuauccc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 3
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
acacaugggu cagugugaag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 4
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
gucuauggca agagaggcga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 5
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
uuuauaagga gggagugcau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 6
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
uagcaugcag agagcgagag guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 7
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
uaauuucuac uaaguguaga uaccgcucug aucacaagca aggca 45
<210> 8
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
uaauuucuac uaaguguaga uuggaaagcu auaccuccuu acccc 45
<210> 9
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
uaauuucuac uaaguguaga uugcccucuu cacacugacc caugu 45
<210> 10
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
uaauuucuac uaaguguaga ugcaagagag gcgaaggagg guucc 45
<210> 11
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
uaauuucuac uaaguguaga uuaaggaggg agugcauugg accua 45
<210> 12
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
uaauuucuac uaaguguaga ugcucucgcu cucugcaugc uagcu 45
<210> 13
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 13
His Asp His Asp Asn Gly Asn His His Asp His Asp His Asp Asn Gly
1 5 10 15
His Asp Asn Gly Asn Gly His Asp Asn Ile His Asp Asn Ile His Asp
20 25 30
Asn Gly Asn His
35
<210> 14
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 14
His Asp Asn Gly Asn Gly Asn Gly Asn Ile Asn Gly His Asp His Asp
1 5 10 15
Asn Gly Asn Gly Asn Ile Asn Ile Asn Ile Asn Gly Asn Ile Asn Ile
20 25 30
Asn His Asn Ile
35
<210> 15
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 15
Asn His His Asp His Asp His Asp Asn Gly His Asp Asn Gly Asn Gly
1 5 10 15
His Asp Asn Ile His Asp Asn Ile His Asp Asn Gly Asn His Asn Ile
20 25 30
His Asp His Asp
35
<210> 16
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 16
Asn Ile Asn Gly His Asp His Asp Asn Gly Asn Gly Asn Ile Asn Ile
1 5 10 15
Asn Ile Asn Gly Asn Ile Asn Ile Asn His Asn Ile Asn Ile Asn His
20 25 30
His Asp Asn Ile
35
<210> 17
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 17
His Asp His Asp Asn Gly Asn Gly Asn Ile Asn Ile Asn Ile Asn Gly
1 5 10 15
Asn Ile Asn Ile Asn His Asn Ile Asn Ile Asn His His Asp Asn Ile
20 25 30
Asn Gly Asn Ile
35
<210> 18
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 18
His Asp Asn Gly Asn Gly His Asp Asn Ile His Asp Asn Ile His Asp
1 5 10 15
Asn Gly Asn His Asn Ile His Asp His Asp His Asp Asn Ile Asn Gly
20 25 30
Asn His Asn Gly
35
<210> 19
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 19
Asn His Asn Gly Asn Gly His Asp Asn Gly Asn Ile Asn Gly His Asp
1 5 10 15
Asn Ile Asn Ile His Asp Asn His His Asp His Asp His Asp His Asp
20 25 30
Asn Gly His Asp
35
<210> 20
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 20
His Asp Asn Gly Asn Ile Asn Gly His Asp Asn Ile Asn Ile His Asp
1 5 10 15
Asn His His Asp His Asp His Asp His Asp Asn Gly His Asp His Asp
20 25 30
His Asp Asn Gly
35
<210> 21
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 21
Asn Ile Asn Gly His Asp Asn Ile Asn Ile His Asp Asn His His Asp
1 5 10 15
His Asp His Asp His Asp Asn Gly His Asp His Asp His Asp Asn Gly
20 25 30
Asn Gly Asn Ile
35
<210> 22
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 22
Asn His Asn Gly Asn Gly Asn His Asn Gly Asn Gly His Asp Asn Gly
1 5 10 15
Asn Ile Asn Gly His Asp His Asp His Asp Asn Gly Asn His Asn His
20 25 30
Asn Ile Asn Ile
35
<210> 23
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 23
Asn His Asn Gly Asn Gly His Asp Asn Gly Asn Ile Asn Gly His Asp
1 5 10 15
His Asp His Asp Asn Gly Asn His Asn His Asn Ile Asn Ile Asn Ile
20 25 30
Asn His His Asp
35
<210> 24
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 24
His Asp Asn Gly Asn Ile Asn Gly His Asp His Asp His Asp Asn Gly
1 5 10 15
Asn His Asn His Asn Ile Asn Ile Asn Ile Asn His His Asp Asn Gly
20 25 30
Asn Ile Asn Gly
35
<210> 25
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 25
Asn Ile Asn Gly His Asp His Asp His Asp Asn Gly Asn His Asn His
1 5 10 15
Asn Ile Asn Ile Asn Ile Asn His His Asp Asn Gly Asn Ile Asn Gly
20 25 30
Asn Ile His Asp
35
<210> 26
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 26
His Asp Asn Gly His Asp Asn Ile Asn His His Asp His Asp Asn Ile
1 5 10 15
Asn His Asn Gly Asn Gly His Asp Asn Gly Asn Gly Asn Ile Asn Ile
20 25 30
His Asp Asn Gly
35
<210> 27
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 27
Asn His Asn His Asn Ile Asn Ile Asn Ile Asn His His Asp Asn Gly
1 5 10 15
Asn Ile Asn Gly Asn Ile His Asp His Asp Asn Gly His Asp His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 28
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 28
Asn Ile Asn Gly Asn Ile His Asp His Asp Asn Gly His Asp His Asp
1 5 10 15
Asn Gly Asn Gly Asn Ile His Asp His Asp His Asp His Asp Asn Gly
20 25 30
Asn Ile Asn Gly
35
<210> 29
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 29
Asn Ile His Asp His Asp Asn Gly His Asp His Asp Asn Gly Asn Gly
1 5 10 15
Asn Ile His Asp His Asp His Asp His Asp Asn Gly Asn Ile Asn Gly
20 25 30
His Asp Asn Ile
35
<210> 30
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 30
His Asp His Asp Asn Gly Asn Gly Asn Ile His Asp His Asp His Asp
1 5 10 15
His Asp Asn Gly Asn Ile Asn Gly His Asp Asn Ile Asn His His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 31
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 31
His Asp Asn Gly His Asp Asn Gly Asn Gly Asn Ile Asn Gly Asn Ile
1 5 10 15
Asn Ile Asn Ile Asn Gly Asn Ile His Asp Asn Ile Asn His Asn Ile
20 25 30
His Asp His Asp
35
<210> 32
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 32
His Asp Asn Gly Asn Gly Asn Ile Asn Gly Asn Ile Asn Ile Asn Ile
1 5 10 15
Asn Gly Asn Ile His Asp Asn Ile Asn His Asn Ile His Asp His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 33
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 33
Asn Ile His Asp His Asp His Asp His Asp Asn Gly Asn Ile Asn Gly
1 5 10 15
His Asp Asn Ile Asn His His Asp Asn Gly Asn Gly His Asp Asn Gly
20 25 30
His Asp His Asp
35
<210> 34
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 34
Asn Ile Asn Gly Asn Ile Asn Ile Asn Ile Asn Gly Asn Ile His Asp
1 5 10 15
Asn Ile Asn His Asn Ile His Asp His Asp Asn Gly Asn Gly Asn His
20 25 30
Asn Gly Asn Ile
35
<210> 35
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 35
Asn Ile Asn Gly His Asp Asn Ile Asn His His Asp Asn Gly Asn Gly
1 5 10 15
His Asp Asn Gly His Asp His Asp Asn Gly His Asp Asn Ile His Asp
20 25 30
Asn Ile Asn Gly
35
<210> 36
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 36
Asn Ile His Asp Asn Ile Asn His Asn Ile His Asp His Asp Asn Gly
1 5 10 15
Asn Gly Asn His Asn Gly Asn Ile His Asp Asn Ile Asn Ile His Asp
20 25 30
Asn Ile His Asp
35
<210> 37
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 37
His Asp Asn Gly His Asp His Asp Asn Gly His Asp Asn Ile His Asp
1 5 10 15
Asn Ile Asn Gly His Asp Asn Gly His Asp His Asp Asn Gly His Asp
20 25 30
Asn Gly His Asp
35
<210> 38
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 38
His Asp His Asp Asn Gly His Asp Asn Ile His Asp Asn Ile Asn Gly
1 5 10 15
His Asp Asn Gly His Asp His Asp Asn Gly His Asp Asn Gly His Asp
20 25 30
Asn His Asn Gly
35
<210> 39
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 39
Asn His Asn Gly Asn Ile His Asp Asn Ile Asn Ile His Asp Asn Ile
1 5 10 15
His Asp Asn Gly Asn Gly Asn Gly His Asp Asn Ile His Asp His Asp
20 25 30
Asn Gly His Asp
35
<210> 40
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 40
Asn Ile His Asp Asn Ile Asn Ile His Asp Asn Ile His Asp Asn Gly
1 5 10 15
Asn Gly Asn Gly His Asp Asn Ile His Asp His Asp Asn Gly His Asp
20 25 30
His Asp Asn Gly
35
<210> 41
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 41
His Asp Asn Gly His Asp His Asp Asn Gly His Asp Asn Gly His Asp
1 5 10 15
Asn His Asn Gly His Asp Asn His His Asp His Asp Asn Ile His Asp
20 25 30
His Asp His Asp
35
<210> 42
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 42
His Asp His Asp Asn Gly His Asp Asn Gly His Asp Asn His Asn Gly
1 5 10 15
His Asp Asn His His Asp His Asp Asn Ile His Asp His Asp His Asp
20 25 30
Asn Ile Asn Gly
35
<210> 43
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 43
His Asp Asn Gly His Asp Asn His Asn Gly His Asp Asn His His Asp
1 5 10 15
His Asp Asn Ile His Asp His Asp His Asp Asn Ile Asn Gly Asn His
20 25 30
His Asp Asn Gly
35
<210> 44
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 44
His Asp Asn His Asn Gly His Asp Asn His His Asp His Asp Asn Ile
1 5 10 15
His Asp His Asp His Asp Asn Ile Asn Gly Asn His His Asp Asn Gly
20 25 30
Asn Ile Asn Gly
35
<210> 45
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 45
His Asp Asn His His Asp His Asp Asn Ile His Asp His Asp His Asp
1 5 10 15
Asn Ile Asn Gly Asn His His Asp Asn Gly Asn Ile Asn Gly His Asp
20 25 30
Asn Ile His Asp
35
<210> 46
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 46
His Asp His Asp His Asp Asn Gly Asn His Asn His Asn Ile Asn Ile
1 5 10 15
Asn Ile Asn His His Asp Asn Gly Asn Ile Asn Gly Asn Ile His Asp
20 25 30
His Asp Asn Gly
35
<210> 47
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 47
Asn His His Asp Asn Gly Asn Ile Asn Gly His Asp Asn Ile His Asp
1 5 10 15
His Asp Asn His His Asp Asn Gly His Asp Asn Gly Asn His Asn Ile
20 25 30
Asn Gly His Asp
35
<210> 48
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 48
Asn Ile Asn Gly His Asp Asn Ile His Asp His Asp Asn His His Asp
1 5 10 15
Asn Gly His Asp Asn Gly Asn His Asn Ile Asn Gly His Asp Asn Ile
20 25 30
His Asp Asn Ile
35
<210> 49
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 49
His Asp Asn Gly Asn His Asn Ile Asn Gly His Asp Asn Ile His Asp
1 5 10 15
Asn Ile Asn Ile Asn His His Asp Asn Ile Asn Ile Asn His Asn His
20 25 30
His Asp Asn Ile
35
<210> 50
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 50
His Asp Asn Gly Asn His Asn His His Asp His Asp His Asp His Asp
1 5 10 15
Asn Gly Asn Gly His Asp His Asp Asn Gly Asn His His Asp His Asp
20 25 30
His Asp Asn Gly
35
<210> 51
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 51
Asn His Asn His His Asp His Asp His Asp His Asp Asn Gly Asn Gly
1 5 10 15
His Asp His Asp Asn Gly Asn His His Asp His Asp His Asp Asn Gly
20 25 30
His Asp Asn Gly
35
<210> 52
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 52
His Asp Asn Gly Asn Gly His Asp Asn Gly His Asp His Asp His Asp
1 5 10 15
Asn His His Asp Asn Gly His Asp Asn Gly His Asp Asn His His Asp
20 25 30
Asn Gly His Asp
35
<210> 53
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 53
His Asp Asn Gly His Asp His Asp His Asp Asn His His Asp Asn Gly
1 5 10 15
His Asp Asn Gly His Asp Asn His His Asp Asn Gly His Asp Asn Gly
20 25 30
His Asp Asn Gly
35
<210> 54
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 54
Asn His His Asp Asn Ile Asn Gly Asn His His Asp Asn Gly Asn Ile
1 5 10 15
Asn His His Asp Asn Gly Asn Ile His Asp His Asp Asn Gly Asn Gly
20 25 30
His Asp Asn Gly
35
<210> 55
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 55
His Asp His Asp His Asp Asn His His Asp Asn Gly His Asp Asn Gly
1 5 10 15
His Asp Asn His His Asp Asn Gly His Asp Asn Gly His Asp Asn Gly
20 25 30
Asn His His Asp
35
<210> 56
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 56
His Asp Asn Gly His Asp Asn His His Asp Asn Gly His Asp Asn Gly
1 5 10 15
His Asp Asn Gly Asn His His Asp Asn Ile Asn Gly Asn His His Asp
20 25 30
Asn Gly Asn Ile
35
<210> 57
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 57
His Asp Asn His His Asp Asn Gly His Asp Asn Gly His Asp Asn Gly
1 5 10 15
Asn His His Asp Asn Ile Asn Gly Asn His His Asp Asn Gly Asn Ile
20 25 30
Asn His His Asp
35
<210> 58
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 58
His Asp Asn Gly His Asp Asn Gly Asn His His Asp Asn Ile Asn Gly
1 5 10 15
Asn His His Asp Asn Gly Asn Ile Asn His His Asp Asn Gly Asn Ile
20 25 30
His Asp His Asp
35
<210> 59
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 59
His Asp Asn Gly Asn His His Asp Asn Ile Asn Gly Asn His His Asp
1 5 10 15
Asn Gly Asn Ile Asn His His Asp Asn Gly Asn Ile His Asp His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 60
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 60
Asn Ile Asn Gly Asn His Asn Gly His Asp Asn Ile Asn Ile His Asp
1 5 10 15
Asn Gly Asn Gly His Asp Asn Ile His Asp Asn Gly Asn Gly Asn His
20 25 30
Asn Gly His Asp
35
<210> 61
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 61
Asn His Asn Gly His Asp Asn Ile Asn Ile His Asp Asn Gly Asn Gly
1 5 10 15
His Asp Asn Ile His Asp Asn Gly Asn Gly Asn His Asn Gly His Asp
20 25 30
Asn Gly His Asp
35
<210> 62
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 62
Asn His His Asp Asn Gly Asn Ile Asn His His Asp Asn Gly Asn Ile
1 5 10 15
His Asp His Asp Asn Gly Asn Gly His Asp Asn Gly Asn Ile Asn His
20 25 30
His Asp Asn Gly
35
<210> 63
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 63
Asn Ile Asn His His Asp Asn Gly Asn Ile His Asp His Asp Asn Gly
1 5 10 15
Asn Gly His Asp Asn Gly Asn Ile Asn His His Asp Asn Gly Asn Ile
20 25 30
Asn Gly His Asp
35
<210> 64
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 64
Asn Ile His Asp His Asp Asn Gly Asn Gly His Asp Asn Gly Asn Ile
1 5 10 15
Asn His His Asp Asn Gly Asn Ile Asn Gly His Asp Asn Gly Asn Ile
20 25 30
Asn His His Asp
35
<210> 65
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 65
Asn His Asn Gly His Asp Asn Gly His Asp Asn Gly His Asp Asn Gly
1 5 10 15
His Asp His Asp Asn Ile Asn Ile Asn Ile Asn Ile Asn His Asn Ile
20 25 30
Asn Gly Asn Ile
35
<210> 66
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 66
His Asp Asn Gly Asn Ile Asn His His Asp Asn Gly Asn Ile Asn Gly
1 5 10 15
His Asp Asn Gly Asn Ile Asn His His Asp His Asp Asn Gly His Asp
20 25 30
Asn Gly Asn Ile
35
<210> 67
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 67
His Asp Asn Gly His Asp Asn Gly His Asp Asn Gly His Asp His Asp
1 5 10 15
Asn Ile Asn Ile Asn Ile Asn Ile Asn His Asn Ile Asn Gly Asn Ile
20 25 30
Asn Gly His Asp
35
<210> 68
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 68
Asn Ile Asn His His Asp Asn Gly Asn Ile Asn Gly His Asp Asn Gly
1 5 10 15
Asn Ile Asn His His Asp His Asp Asn Gly His Asp Asn Gly Asn Ile
20 25 30
Asn His Asn His
35
<210> 69
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 69
His Asp Asn Gly His Asp Asn Gly His Asp His Asp Asn Ile Asn Ile
1 5 10 15
Asn Ile Asn Ile Asn His Asn Ile Asn Gly Asn Ile Asn Gly His Asp
20 25 30
Asn His Asn Gly
35
<210> 70
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 70
His Asp Asn Gly His Asp His Asp Asn Ile Asn Ile Asn Ile Asn Ile
1 5 10 15
Asn His Asn Ile Asn Gly Asn Ile Asn Gly His Asp Asn His Asn Gly
20 25 30
Asn Ile Asn Gly
35
<210> 71
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 71
Asn Ile Asn Gly His Asp Asn Gly Asn Ile Asn His His Asp His Asp
1 5 10 15
Asn Gly His Asp Asn Gly Asn Ile Asn His Asn His Asn Gly His Asp
20 25 30
His Asp Asn Ile
35
<210> 72
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 72
His Asp His Asp Asn Ile Asn Ile Asn Ile Asn Ile Asn His Asn Ile
1 5 10 15
Asn Gly Asn Ile Asn Gly His Asp Asn His Asn Gly Asn Ile Asn Gly
20 25 30
His Asp Asn Ile
35
<210> 73
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 73
His Asp Asn Gly Asn Ile Asn His His Asp His Asp Asn Gly His Asp
1 5 10 15
Asn Gly Asn Ile Asn His Asn His Asn Gly His Asp His Asp Asn Ile
20 25 30
Asn Ile Asn Gly
35
<210> 74
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 74
Asn Ile Asn His His Asp His Asp Asn Gly His Asp Asn Gly Asn Ile
1 5 10 15
Asn His Asn His Asn Gly His Asp His Asp Asn Ile Asn Ile Asn Gly
20 25 30
Asn His His Asp
35
<210> 75
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 75
His Asp Asn Gly Asn Ile Asn His Asn His Asn Gly His Asp His Asp
1 5 10 15
Asn Ile Asn Ile Asn Gly Asn His His Asp Asn Ile His Asp Asn Gly
20 25 30
His Asp His Asp
35
<210> 76
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 76
Asn Ile Asn Gly His Asp Asn His Asn Gly Asn Ile Asn Gly His Asp
1 5 10 15
Asn Ile His Asp His Asp His Asp Asn Ile Asn Gly Asn His Asn His
20 25 30
Asn His His Asp
35
<210> 77
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 77
Asn Ile Asn His Asn His Asn Gly His Asp His Asp Asn Ile Asn Ile
1 5 10 15
Asn Gly Asn His His Asp Asn Ile His Asp Asn Gly His Asp His Asp
20 25 30
His Asp Asn Gly
35
<210> 78
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 78
His Asp Asn His Asn Gly Asn Ile Asn Gly His Asp Asn Ile His Asp
1 5 10 15
His Asp His Asp Asn Ile Asn Gly Asn His Asn His Asn His His Asp
20 25 30
Asn Ile Asn Ile
35
<210> 79
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 79
His Asp His Asp Asn Ile Asn Ile Asn Gly Asn His His Asp Asn Ile
1 5 10 15
His Asp Asn Gly His Asp His Asp His Asp Asn Gly His Asp His Asp
20 25 30
Asn Gly Asn Gly
35
<210> 80
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 80
His Asp Asn Gly Asn Gly Asn His His Asp His Asp Asn Ile Asn Gly
1 5 10 15
Asn Ile Asn His Asn Ile His Asp His Asp Asn His Asn His Asn Ile
20 25 30
His Asp Asn Ile
35
<210> 81
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 81
Asn His His Asp Asn Ile His Asp Asn Gly His Asp His Asp His Asp
1 5 10 15
Asn Gly His Asp His Asp Asn Gly Asn Gly Asn Ile Asn Gly Asn Ile
20 25 30
Asn Ile Asn Ile
35
<210> 82
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 82
His Asp His Asp His Asp Asn Gly His Asp His Asp Asn Gly Asn Gly
1 5 10 15
Asn Ile Asn Gly Asn Ile Asn Ile Asn Ile His Asp Asn Ile Asn Ile
20 25 30
Asn His Asn His
35
<210> 83
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 83
His Asp His Asp Asn Gly Asn Gly Asn Ile Asn Gly Asn Ile Asn Ile
1 5 10 15
Asn Ile His Asp Asn Ile Asn Ile Asn His Asn His Asn Ile Asn Ile
20 25 30
His Asp His Asp
35
<210> 84
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 84
Asn His Asn His His Asp His Asp Asn Ile Asn Gly Asn His Asn Ile
1 5 10 15
His Asp His Asp His Asp His Asp His Asp His Asp Asn Gly His Asp
20 25 30
His Asp His Asp
35
<210> 85
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 85
Asn Ile Asn Gly Asn Ile Asn Ile Asn Ile His Asp Asn Ile Asn Ile
1 5 10 15
Asn His Asn His Asn Ile Asn Ile His Asp His Asp His Asp Asn Gly
20 25 30
His Asp His Asp
35
<210> 86
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 86
His Asp His Asp His Asp Asn Ile Asn His His Asp His Asp His Asp
1 5 10 15
His Asp Asn Ile Asn Ile His Asp His Asp Asn Gly Asn Ile Asn Gly
20 25 30
Asn Ile Asn Gly
35
<210> 87
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 87
His Asp His Asp Asn Gly Asn Gly His Asp Asn His His Asp His Asp
1 5 10 15
Asn Gly His Asp Asn Gly His Asp Asn Gly Asn Gly Asn His His Asp
20 25 30
His Asp Asn Ile
35
<210> 88
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 88
His Asp Asn His His Asp His Asp Asn Gly His Asp Asn Gly His Asp
1 5 10 15
Asn Gly Asn Gly Asn His His Asp His Asp Asn Ile Asn Gly Asn Ile
20 25 30
Asn His Asn Ile
35
<210> 89
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 89
His Asp Asn Gly His Asp Asn Gly Asn Gly Asn His His Asp His Asp
1 5 10 15
Asn Ile Asn Gly Asn Ile Asn His Asn Ile His Asp His Asp Asn His
20 25 30
Asn His Asn Ile
35
<210> 90
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 90
Asn Ile Asn Gly Asn Ile Asn Gly His Asp Asn Ile His Asp His Asp
1 5 10 15
Asn Gly Asn Ile Asn His His Asp Asn His His Asp Asn Ile Asn His
20 25 30
His Asp Asn Gly
35
<210> 91
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 91
Asn Ile Asn Gly His Asp Asn Ile His Asp His Asp Asn Gly Asn Ile
1 5 10 15
Asn His His Asp Asn His His Asp Asn Ile Asn His His Asp Asn Gly
20 25 30
Asn Ile His Asp
35
<210> 92
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 92
Asn Ile Asn His His Asp Asn His His Asp Asn Ile Asn His His Asp
1 5 10 15
Asn Gly Asn Ile His Asp Asn His His Asp Asn Gly His Asp Asn Gly
20 25 30
His Asp Asn Gly
35
<210> 93
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 93
Asn Ile His Asp Asn His His Asp Asn Gly His Asp Asn Gly His Asp
1 5 10 15
Asn Gly Asn Gly His Asp Asn Gly His Asp His Asp His Asp Asn His
20 25 30
His Asp Asn Gly
35
<210> 94
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 识别结构域
<400> 94
His Asp Asn Gly His Asp Asn Gly Asn Gly His Asp Asn Gly His Asp
1 5 10 15
His Asp His Asp Asn His His Asp Asn Gly His Asp Asn Gly His Asp
20 25 30
Asn His His Asp
35
<210> 95
<211> 303
<212> DNA
<213> Zea mays
<400> 95
cctctttatc cttaaataag aagcataaaa cgggatttct cagccagttc ttaacttctc 60
ttataaatac agaccttgta caacactttc acctcctctc aggtggccag gatatttttt 120
ctggcccctt cctgccctct tcacactgac ccatgtgttg ttctatccct ggaaagctat 180
acctccttac ccctatcagc ttctcctcac atctcctctc gtcgccaccc atgctatcac 240
cgctctgatc acaagcaagg caaaccctca ctgttctatc aacgcccctc ccttagctag 300
atg 303
<210> 96
<211> 303
<212> DNA
<213> Zea mays
<400> 96
gcaagagcca gcccccggcc gtatgtcaac ttcacttgtc tctctccaaa agatatcgta 60
tcacccatgg gcaatggcca tgacccccct cccagcccca acctatatca cctagcgcag 120
ctacgctctc ttctcccgct ctcgctctct gcatgctagc taccttctag ctatctagcc 180
tctaggtcca atgcactccc tccttataaa caaggaaccc tccttcgcct ctcttgccat 240
agaccggaca ccggagagct aggtcacagg agcgctcagg aaggccgctg agatagaggc 300
atg 303
<210> 97
<211> 23
<212> DNA
<213> Zea mays
<400> 97
caccgctctg atcacaagca agg 23
<210> 98
<211> 23
<212> DNA
<213> Zea mays
<400> 98
cccatgtgtt gttctatccc tgg 23
<210> 99
<211> 23
<212> DNA
<213> Zea mays
<400> 99
acacatgggt cagtgtgaag agg 23
<210> 100
<211> 27
<212> DNA
<213> Zea mays
<400> 100
atcaccgctc tgatcacaag caaggca 27
<210> 101
<211> 28
<212> DNA
<213> Zea mays
<400> 101
tccctggaaa gctatacctc cttacccc 28
<210> 102
<211> 28
<212> DNA
<213> Zea mays
<400> 102
ttcctgccct cttcacactg acccatgt 28
<210> 103
<211> 23
<212> DNA
<213> Zea mays
<400> 103
gtctatggca agagaggcga agg 23
<210> 104
<211> 23
<212> DNA
<213> Zea mays
<400> 104
tttataagga gggagtgcat tgg 23
<210> 105
<211> 23
<212> DNA
<213> Zea mays
<400> 105
tagcatgcag agagcgagag cgg 23
<210> 106
<211> 28
<212> DNA
<213> Zea mays
<400> 106
tatggcaaga gaggcgaagg agggttcc 28
<210> 107
<211> 28
<212> DNA
<213> Zea mays
<400> 107
tttataagga gggagtgcat tggaccta 28
<210> 108
<211> 28
<212> DNA
<213> Zea mays
<400> 108
tcccgctctc gctctctgca tgctagct 28
<210> 109
<211> 19
<212> DNA
<213> Zea mays
<400> 109
tcctgccctc ttcacactg 19
<210> 110
<211> 19
<212> DNA
<213> Zea mays
<400> 110
tctttatcct taaataaga 19
<210> 111
<211> 19
<212> DNA
<213> Zea mays
<400> 111
tgccctcttc acactgacc 19
<210> 112
<211> 19
<212> DNA
<213> Zea mays
<400> 112
tatccttaaa taagaagca 19
<210> 113
<211> 19
<212> DNA
<213> Zea mays
<400> 113
tccttaaata agaagcata 19
<210> 114
<211> 19
<212> DNA
<213> Zea mays
<400> 114
tcttcacact gacccatgt 19
<210> 115
<211> 19
<212> DNA
<213> Zea mays
<400> 115
tgttctatca acgcccctc 19
<210> 116
<211> 19
<212> DNA
<213> Zea mays
<400> 116
tctatcaacg cccctccct 19
<210> 117
<211> 19
<212> DNA
<213> Zea mays
<400> 117
tatcaacgcc cctccctta 19
<210> 118
<211> 19
<212> DNA
<213> Zea mays
<400> 118
tgttgttcta tccctggaa 19
<210> 119
<211> 19
<212> DNA
<213> Zea mays
<400> 119
tgttctatcc ctggaaagc 19
<210> 120
<211> 19
<212> PRT
<213> Zea mays
<400> 120
Thr Cys Thr Ala Thr Cys Cys Cys Thr Gly Gly Ala Ala Ala Gly Cys
1 5 10 15
Thr Ala Thr
<210> 121
<211> 19
<212> DNA
<213> Zea mays
<400> 121
tatccctgga aagctatac 19
<210> 122
<211> 19
<212> DNA
<213> Zea mays
<400> 122
tctcagccag ttcttaact 19
<210> 123
<211> 19
<212> DNA
<213> Zea mays
<400> 123
tggaaagcta tacctcctt 19
<210> 124
<211> 19
<212> DNA
<213> Zea mays
<400> 124
tatacctcct tacccctat 19
<210> 125
<211> 19
<212> PRT
<213> Zea mays
<400> 125
Thr Ala Cys Cys Thr Cys Cys Thr Thr Ala Cys Cys Cys Cys Thr Ala
1 5 10 15
Thr Cys Ala
<210> 126
<211> 19
<212> DNA
<213> Zea mays
<400> 126
tccttacccc tatcagctt 19
<210> 127
<211> 19
<212> DNA
<213> Zea mays
<400> 127
tctcttataa atacagacc 19
<210> 128
<211> 19
<212> DNA
<213> Zea mays
<400> 128
tcttataaat acagacctt 19
<210> 129
<211> 19
<212> DNA
<213> Zea mays
<400> 129
tacccctatc agcttctcc 19
<210> 130
<211> 19
<212> DNA
<213> Zea mays
<400> 130
tataaataca gaccttgta 19
<210> 131
<211> 19
<212> DNA
<213> Zea mays
<400> 131
tatcagcttc tcctcacat 19
<210> 132
<211> 19
<212> DNA
<213> Zea mays
<400> 132
tacagacctt gtacaacac 19
<210> 133
<211> 19
<212> DNA
<213> Zea mays
<400> 133
tctcctcaca tctcctctc 19
<210> 134
<211> 19
<212> DNA
<213> Zea mays
<400> 134
tcctcacatc tcctctcgt 19
<210> 135
<211> 19
<212> DNA
<213> Zea mays
<400> 135
tgtacaacac tttcacctc 19
<210> 136
<211> 19
<212> DNA
<213> Zea mays
<400> 136
tacaacactt tcacctcct 19
<210> 137
<211> 19
<212> DNA
<213> Zea mays
<400> 137
tctcctctcg tcgccaccc 19
<210> 138
<211> 19
<212> DNA
<213> Zea mays
<400> 138
tcctctcgtc gccacccat 19
<210> 139
<211> 19
<212> DNA
<213> Zea mays
<400> 139
tctcgtcgcc acccatgct 19
<210> 140
<211> 19
<212> DNA
<213> Zea mays
<400> 140
tcgtcgccac ccatgctat 19
<210> 141
<211> 19
<212> DNA
<213> Zea mays
<400> 141
tcgccaccca tgctatcac 19
<210> 142
<211> 19
<212> DNA
<213> Zea mays
<400> 142
tccctggaaa gctatacct 19
<210> 143
<211> 19
<212> DNA
<213> Zea mays
<400> 143
tgctatcacc gctctgatc 19
<210> 144
<211> 19
<212> DNA
<213> Zea mays
<400> 144
tatcaccgct ctgatcaca 19
<210> 145
<211> 19
<212> DNA
<213> Zea mays
<400> 145
tctgatcaca agcaaggca 19
<210> 146
<211> 19
<212> DNA
<213> Zea mays
<400> 146
tctggcccct tcctgccct 19
<210> 147
<211> 19
<212> DNA
<213> Zea mays
<400> 147
tggccccttc ctgccctct 19
<210> 148
<211> 19
<212> DNA
<213> Zea mays
<400> 148
tcttctcccg ctctcgctc 19
<210> 149
<211> 19
<212> DNA
<213> Zea mays
<400> 149
tctcccgctc tcgctctct 19
<210> 150
<211> 19
<212> DNA
<213> Zea mays
<400> 150
tgcatgctag ctaccttct 19
<210> 151
<211> 19
<212> DNA
<213> Zea mays
<400> 151
tcccgctctc gctctctgc 19
<210> 152
<211> 19
<212> DNA
<213> Zea mays
<400> 152
tctcgctctc tgcatgcta 19
<210> 153
<211> 19
<212> DNA
<213> Zea mays
<400> 153
tcgctctctg catgctagc 19
<210> 154
<211> 19
<212> DNA
<213> Zea mays
<400> 154
tctctgcatg ctagctacc 19
<210> 155
<211> 19
<212> DNA
<213> Zea mays
<400> 155
tctgcatgct agctacctt 19
<210> 156
<211> 19
<212> DNA
<213> Zea mays
<400> 156
tatgtcaact tcacttgtc 19
<210> 157
<211> 19
<212> DNA
<213> Zea mays
<400> 157
tgtcaacttc acttgtctc 19
<210> 158
<211> 19
<212> DNA
<213> Zea mays
<400> 158
tgctagctac cttctagct 19
<210> 159
<211> 19
<212> DNA
<213> Zea mays
<400> 159
tagctacctt ctagctatc 19
<210> 160
<211> 19
<212> DNA
<213> Zea mays
<400> 160
taccttctag ctatctagc 19
<210> 161
<211> 19
<212> DNA
<213> Zea mays
<400> 161
tgtctctctc caaaagata 19
<210> 162
<211> 19
<212> DNA
<213> Zea mays
<400> 162
tctagctatc tagcctcta 19
<210> 163
<211> 19
<212> DNA
<213> Zea mays
<400> 163
tctctctcca aaagatatc 19
<210> 164
<211> 19
<212> DNA
<213> Zea mays
<400> 164
tagctatcta gcctctagg 19
<210> 165
<211> 19
<212> DNA
<213> Zea mays
<400> 165
tctctccaaa agatatcgt 19
<210> 166
<211> 19
<212> DNA
<213> Zea mays
<400> 166
tctccaaaag atatcgtat 19
<210> 167
<211> 19
<212> DNA
<213> Zea mays
<400> 167
tatctagcct ctaggtcca 19
<210> 168
<211> 19
<212> DNA
<213> Zea mays
<400> 168
tccaaaagat atcgtatca 19
<210> 169
<211> 19
<212> DNA
<213> Zea mays
<400> 169
tctagcctct aggtccaat 19
<210> 170
<211> 19
<212> DNA
<213> Zea mays
<400> 170
tagcctctag gtccaatgc 19
<210> 171
<211> 19
<212> DNA
<213> Zea mays
<400> 171
tctaggtcca atgcactcc 19
<210> 172
<211> 19
<212> DNA
<213> Zea mays
<400> 172
tatcgtatca cccatgggc 19
<210> 173
<211> 19
<212> DNA
<213> Zea mays
<400> 173
taggtccaat gcactccct 19
<210> 174
<211> 19
<212> DNA
<213> Zea mays
<400> 174
tcgtatcacc catgggcaa 19
<210> 175
<211> 19
<212> DNA
<213> Zea mays
<400> 175
tccaatgcac tccctcctt 19
<210> 176
<211> 19
<212> DNA
<213> Zea mays
<400> 176
tcttgccata gaccggaca 19
<210> 177
<211> 19
<212> DNA
<213> Zea mays
<400> 177
tgcactccct ccttataaa 19
<210> 178
<211> 19
<212> DNA
<213> Zea mays
<400> 178
tccctcctta taaacaagg 19
<210> 179
<211> 19
<212> DNA
<213> Zea mays
<400> 179
tccttataaa caaggaacc 19
<210> 180
<211> 19
<212> DNA
<213> Zea mays
<400> 180
tggccatgac ccccctccc 19
<210> 181
<211> 19
<212> DNA
<213> Zea mays
<400> 181
tataaacaag gaaccctcc 19
<210> 182
<211> 19
<212> DNA
<213> Zea mays
<400> 182
tcccagcccc aacctatat 19
<210> 183
<211> 19
<212> DNA
<213> Zea mays
<400> 183
tccttcgcct ctcttgcca 19
<210> 184
<211> 19
<212> DNA
<213> Zea mays
<400> 184
tcgcctctct tgccataga 19
<210> 185
<211> 19
<212> DNA
<213> Zea mays
<400> 185
tctcttgcca tagaccgga 19
<210> 186
<211> 19
<212> DNA
<213> Zea mays
<400> 186
tatatcacct agcgcagct 19
<210> 187
<211> 19
<212> DNA
<213> Zea mays
<400> 187
tatcacctag cgcagctac 19
<210> 188
<211> 19
<212> DNA
<213> Zea mays
<400> 188
tagcgcagct acgctctct 19
<210> 189
<211> 19
<212> DNA
<213> Zea mays
<400> 189
tacgctctct tctcccgct 19
<210> 190
<211> 19
<212> DNA
<213> Zea mays
<400> 190
tgggcaatgg ccatgaccc 19
<210> 191
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 191
ggtacagctg gtgatggta 19
<210> 192
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 192
gactcttctt cctccctt 18
<210> 193
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 193
cgtctccccc ttcaggatgt 20
<210> 194
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 194
gtccaacagg gacagttcca a 21
<210> 195
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 195
accaccaatc ttg 13
<210> 196
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 196
caggatgctg aaggagctct acta 24
<210> 197
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 197
tggaaccagt agaagacgtt cttg 24
<210> 198
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 198
atccggtcgc ccagc 15
<210> 199
<211> 978
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WUS2 protein (wus2)
<400> 199
atggcggcca atgcgggcgg cggtggagcg ggaggaggca gcggcagcgg cagcgtggct 60
gcgccggcgg tgtgccgccc cagcggctcg cggtggacgc cgacgccgga gcagatcagg 120
atgctgaagg agctctacta cggctgcggc atccggtcgc ccagctcgga gcagatccag 180
cgcatcaccg ccatgctgcg gcagcacggc aagatcgagg gcaagaacgt cttctactgg 240
ttccagaacc acaaggcccg cgagcgccag aagcgccgcc tcaccagcct cgacgtcaac 300
gtgcccgccg ccggcgcggc cgacgccacc accagccaac tcggcgtcct ctcgctgtcg 360
tcgccgcctt caggcgcggc gcctccctcg cccaccctcg gcttctacgc cgccggcaat 420
ggcggcggat cggctgggct gctggacacg agttccgact ggggcagcag cggcgctgcc 480
atggccaccg agacatgctt cctgcaggac tacatgggcg tgacggacac gggcagctcg 540
tcgcagtggc catgcttctc gtcgtcggac acgataatgg cggcggcggc ggccgcggcg 600
cgggtggcga cgacgcgggc gcccgagaca ctccctctct tcccgacctg cggcgacgac 660
gacgacgacg acagccagcc cccgccgcgg ccgcggcacg cagtcccagt cccggcaggc 720
gagaccatcc gcggcggcgg cggcagcagc agcagctact tgccgttctg gggtgccggt 780
gccgcgtcca caactgccgg cgccacttct tccgttgcga tccagcagca acaccagctg 840
caggagcagt acagctttta cagcaacagc acccagctgg ccggcaccgg cagccaagac 900
gtatcggctt cagcggccgc cctggagctg agcctcagct catggtgctc cccttaccct 960
gctgcaggga gcatgtga 978
<210> 200
<211> 879
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Arabidopsis thaliana Homeodomain-like superfamily protein
(WUS)
<400> 200
atggagccgc cacagcatca gcatcatcat catcaagccg accaagaaag cggcaacaac 60
aacaacaaca agtccggctc tggtggttac acgtgtcgcc agaccagcac gaggtggaca 120
ccgacgacgg agcaaatcaa aatcctcaaa gaactttact acaacaatgc aatccggtca 180
ccaacagccg atcagatcca gaagatcact gcaaggctga gacagttcgg aaagattgag 240
ggcaagaacg tcttttactg gttccagaac cataaggctc gtgagcgtca gaagaagaga 300
ttcaacggaa caaacatgac cacaccatct tcatcaccca actcggttat gatggcggct 360
aacgatcatt atcatcctct acttcaccat catcacggtg ttcccatgca gagacctgct 420
aattccgtca acgttaaact taaccaagac catcatctct atcatcataa caagccatat 480
cccagcttca ataacgggaa tttaaatcat gcaagctcag gtactgaatg tggtgttgtt 540
aatgcttcta atggctacat gagtagccat gtctatggat ctatggaaca agactgttct 600
atgaattaca acaacgtagg tggaggatgg gcaaacatgg atcatcatta ctcatctgca 660
ccttacaact tcttcgatag agcaaagcct ctgtttggtc tagaaggtca tcaagaagaa 720
gaagaatgtg gtggcgatgc ttatctggaa catcgacgta cgcttcctct cttccctatg 780
cacggtgaag atcacatcaa cggtggtagt ggtgccatct ggaagtatgg ccaatcggaa 840
gttcgccctt gcgcttctct tgagctacgt ctgaactag 879
<210> 201
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Avalon WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 201
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtgcgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 202
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Cadenza WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 202
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtgcgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 203
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Badger WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 203
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtgcgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 204
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Charger WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 204
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtacgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 205
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Claire WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 205
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtacgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 206
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum cultivar Spark WUSCHEL-Like-B1
(WUSCHELL-B1) gene
<400> 206
atggcggcga cggcgactgc gacggcggcg gcgacgagcg tggtgacggg gacgacgcgg 60
tggtgcccga cgccggagca gctgatgatc ctggaggaga tgtaccgcgg cgggctgcgc 120
acccccaacg cgtcgcagat ccagcagatc acggcgcacc tggcccacta cggccgcatc 180
gagggcaaga acgtcttcta ctggttccag aaccacaagg cccgggaccg ccagaagctc 240
cgccgcaggc tctgcatgag ccaccacctc ctctcctgcg cccactacta cgccgccgcc 300
aacgccggcc agtaccacca ccagcagcag ctcctcggcg ccggcgcggt tccccctccg 360
ctgctgcagc accagcagca gcagcagtac tactccgcct cctgcgccgg cggcagctac 420
gaccagcacc tgctcccgac gaccgtccca gcttccgctt atgctgctgc tgctgctggg 480
tacgcctacc ccttcgccgc cgtgccggcg agccggtgcg ccgacccctc gccgcccaac 540
acgccgctgt ccttccatca ccagggtgga ggcgtagtag gatcgccgga gtactcactg 600
gggaggctgg gcaacttcgg cgtggtggac gacacgtgcc ggccgtcgcg gtacgagcag 660
cagccacagc agctggccgt ggcgacggaa gatcaggcgg cgccggtgac ggcgacgggg 720
ctgttctgcc ggccgctgaa gacgctggac ctcttccccg gcgcgatcaa ggaggagcag 780
cgcgatgtcg cctag 795
<210> 207
<211> 2130
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays AP2-like ethylene-responsive transcription
factor BBM2 (LOC103650883)
<400> 207
atggccactg tgaacaactg gctcgctttc tccctctccc cgcaggagct gccgccctcc 60
cagacgacgg actccacgct catctcggcc gccaccgccg accatgtctc cggcgatgtc 120
tgcttcaaca tcccccaaga ttggagcatg aggggatcag agctttcggc gctcgtcgcg 180
gagccgaagc tggaggactt cctcggcggc atctccttct ccgagcagca tcacaagtcc 240
aactgcaact tgatacccag cactagcagc acagtttgct acgcgagctc agctgctagc 300
accggctacc atcaccagct gtaccagccc accagctccg cgctccactt cgcggactcc 360
gtcatggtgg cctcctcggc cggtgtccac gacggcggtt ccatgctcag cgcggccgcc 420
gctaacggtg tcgctggcgc tgccagtgcc aacggcggcg gcatcgggct gtccatgatc 480
aagaactggc tgcggagcca accggcgccc atgcagccga gggcggcggc ggctgagggc 540
gcgcaggggc tctctttgtc catgaacatg gcggggacga cccaaggcgc tgctggcatg 600
ccacttctcg ctggagagcg cgcacgggcg cccgagagtg tatcgacgtc agcacagggt 660
ggtgccgtcg tcgtcacggc gccgaaggag gatagcggtg gcagcggtgt tgccggtgct 720
ctagtagccg tgagcacgga cacgggtggc agcggcggcg cgtcggctga caacacggca 780
aggaagacgg tggacacgtt cgggcagcgc acgtcgattt accgtggcgt gacaaggcat 840
agatggactg ggagatatga ggcacatctt tgggataaca gttgcagaag ggaaggacaa 900
actcgtaagg gtcgtcaagt ctatttaggt ggctatgata aagaggagaa agctgctagg 960
gcttatgatc ttgctgctct gaagtactgg ggtgccacaa caacaacaaa ttttccagtg 1020
agtaactacg aaaaggagct cgaggacatg aagcacatga caaggcagga gtttgtagcg 1080
tctctgagaa ggaagagcag tggtttctcc agaggtgcat ccatttacag gggagtgact 1140
aggcatcacc aacatggaag atggcaagca cggattggac gagttgcagg gaacaaggat 1200
ctttacttgg gcaccttcag cacccaggag gaggcagcgg aggcgtacga catcgcggcg 1260
atcaagttcc gcggcctcaa cgccgtcacc aacttcgaca tgagccgcta cgacgtgaag 1320
agcatcctgg acagcagcgc cctccccatc ggcagcgccg ccaagcgtct caaggaggcc 1380
gaggccgcag cgtccgcgca gcaccaccac gccggcgtgg tgagctacga cgtcggccgc 1440
atcgcctcgc agctcggcga cggcggagcc ctagcggcgg cgtacggcgc gcactaccac 1500
ggcgccgcct ggccgaccat cgcgttccag ccgggcgccg ccaccacagg cctgtaccac 1560
ccgtacgcgc agcagccaat gcgcggcggc gggtggtgca agcaggagca ggaccacgcg 1620
gtgatcgcgg ccgcgcacag cctgcaggac ctccaccact tgaacctggg cgcggccggc 1680
gcgcacgact ttttctcggc agggcagcag gccgccgccg cagctgcgat gcacggcctg 1740
gctagcatcg acagtgcgtc gctcgagcac agcaccggct ccaactccgt cgtctacaac 1800
ggcggggtcg gcgatagcaa cggcgccagc gccgttggca gcggcggtgg ctacatgatg 1860
ccgatgagcg ctgccggagc aaccactaca tcggcaatgg tgagccacga gcagatgcat 1920
gcacgggcct acgacgaagc caagcaggct gctcagatgg ggtacgagag ctacctggtg 1980
aacgcggaga acaatggtgg cggaaggatg tctgcatggg ggaccgtcgt ctctgcagcc 2040
gcggcggcag cagcaagcag caacgacaac attgccgccg acgtcggcca tggcggcgcg 2100
cagctcttca gtgtctggaa cgacacttaa 2130
<210> 208
<211> 1707
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Arabidopsis thaliana Integrase-type DNA-binding
superfamily protein (PLT2)
<400> 208
atgaattcta acaactggct cgcgttccct ctatcaccaa ctcactcttc tttgccgcct 60
cacattcact cttcacaaaa ttctcatttc aatctaggtt tggtcaacga caatatcgac 120
aacccttttc aaaaccaagg atggaatatg atcaatccac atggtggagg cggcgaaggt 180
ggagaggttc caaaagtggc tgatttctta ggagtgagca aatcggggga tcatcacacc 240
gatcacaacc tcgtacctta taacgacatt catcaaacca acgcctccga ctactacttt 300
caaaccaata gcttgttacc tacagtcgtc acttgtgcct ctaatgctcc taataattat 360
gagcttcaag agagtgcaca caatttgcaa tctctcactc tctctatggg aagtactgga 420
gctgccgctg cagaagtcgc cactgtgaaa gcctcgccgg ctgagactag tgccgataat 480
agtagcagca ctaccaacac aagtggagga gccatcgttg aggctacacc gagacggact 540
ttggaaactt ttggacaacg aacctctatc tatcgtggag ttacaagaca tagatggacc 600
ggtagatatg aagctcatct ttgggataat agctgtagaa gagaaggaca atcaaggaaa 660
ggaagacaag tctacttagg tgggtatgac aaagaagaga aagcagccag agcatatgat 720
ctagctgcac ttaaatattg gggtccctct actactacca actttccgat aactaactac 780
gagaaggaag tagaggagat gaaaaacatg acgagacaag agtttgtggc ttctataaga 840
aggaaaagta gcggattctc gcgtggtgca tccatgtatc gtggagtaac aaggcatcat 900
caacatggaa gatggcaagc aaggatcggc cgagttgctg gaaacaaaga tctctacttg 960
ggaacattca gcacggagga agaagcagca gaagcttatg acatagctgc gataaagttt 1020
cgaggtctaa acgcggttac aaactttgag ataaatcggt atgatgtgaa agccatcctg 1080
gagagcaaca cacttcctat aggaggtggt gcggctaaac ggctcaaaga agctcaagct 1140
ctagaatcat caagaaaacg agaggaaatg atagccctcg gatcaaattt ccatcaatat 1200
ggtgcagcga gcggctcgag ctctgttgct tccagctcta ggcttcagct tcaaccttac 1260
cctctaagca ttcaacaacc ttttgagcat cttcatcatc atcagccttt acttactcta 1320
cagaacaaca acgatatctc tcagtatcat gattccttta gttacattca gacgcagctt 1380
catcttcacc aacaacaaac caacaattac ttgcagtctt ctagtcacac ttcacagctc 1440
tacaatgctt atcttcagag taaccctggt ctgcttcatg gatttgtctc tgataataac 1500
aacacttcag ggtttcttgg aaacaatggg attggtattg ggtcaagctc taccgttgga 1560
tcatcggctg aggaagagtt tccagccgtg aaagtcgatt acgatatgcc tccttccggt 1620
ggagctacag ggtatggagg atggaatagt ggagagtctg ctcaaggatc gaatccagga 1680
ggtgttttca cgatgtggaa tgaataa 1707
<210> 209
<211> 1818
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Beta vulgaris subsp. vulgaris AP2-like
ethylene-responsive transcription factor PLT2 (LOC104889956)
<400> 209
atgggctcaa tgaattcaaa caattggttg tcttttcctc tttctcctac acatccttca 60
cttcaatcac atcttcaaac caatgattca caacctcatc aacaattctc cttgggtctt 120
gtatctgacc acattgacaa cccctttggt caagcgcaag aatggaactt gctcaatcca 180
caagggccaa atgaagtacc caaaatagca gatttcttag gagtagggaa ttcagaaact 240
catcattcac cagaccttac agcgttcagt gacatgagcc aaggtggtga atcagattat 300
cttttctccg gcaacggcgg cggcttaatg gcggtgcaaa acaccgtagc agcagctact 360
aatagtagcc aatatgatca ataccaagag aactctaata attgcttgca atctttgact 420
ctatcaatgg gaagtagtgg acaacagcct caacaacagc aacaaccacc ttcaagcact 480
aataattgtg agactagtgg tgacaataat agcaccgcta gtgtcgccgc ctctactgcc 540
gccactgtca ccaccgcgat tactcctgtg gttgaagcca cccctaggag aaccttggat 600
acttttggcc aaaggacttc tatttataga ggtgttacaa ggcataggtg gacaggaaga 660
tatgaagctc atctttggga taatagttgt agaagggaag gacagtcaag gaagggtcgt 720
caagtgtatc ttggagggta tgataaggaa gagaaggccg ctaggtctta tgatttagct 780
gcaatcaagt attggggaac ttcaactact acaaattttc caataagcaa ctatgagaaa 840
gaaatagaag acatgaaaca catgactaga caagaatttg tagcagctat tagaaggaag 900
agtagtggat tctctagagg tgcatcaatt tatcgtggtg taacaagaca ccatcaacat 960
gggagatggc aagcaagaat tggaagggtg gcaggaaaca aggatctcta cttaggaaca 1020
tttagcacag aggaagaggc tgcagaagct tatgatatcg cggctatcaa gtttagaggc 1080
cttaatgctg tgacaaattt tgacatgagc cggtatgatg ttaaagccat cctagagagc 1140
aacactcttc ccataggagg aggggcggcg aagcgcctta aggaagctca agctatagaa 1200
tcctctagga agagggaaga aatgcttgcc ctaagcaata gtagctaccc atatggagct 1260
agtagctcga gctcgactcg atatggagcc catcaacaag caacaactca tgcataccct 1320
ttgttaccat accaccatca agaccatcaa ccacaacctt tgctaaccct acaaaataac 1380
catggtcaag aaagcaatat ttccctatca cattactctc aagaggctca attccttcag 1440
ttgtaccaac aatcaagtta ctcaaaccct agtagcatgt acaacaatta cctccaaact 1500
aaccctagtt tgcttcatgg gttcatgaac atgggctcaa actcttgtgg tgttattgat 1560
actaacaata ctaatggaag ttcaagtggg agttatagtg gtggagggta ccttggtggt 1620
ggggctggga tcaatgccat gggtgccgcc tcgacaacga gcaatgcggt ggtttccggt 1680
gaaccggagc cacttgcatt ggtgaaggtg gactatgata tgccttctgc tggtggtggt 1740
ggaggaagtt atgaggggtg gtcaactgag acggttcaag gacctaataa tggggttttt 1800
acaatgtgga atgactaa 1818
<210> 210
<211> 2157
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Beta vulgaris subsp. vulgaris AP2-like
ethylene-responsive transcription factor BBM (LOC104890283)
<400> 210
atgggttcaa tgaattggtt aggtttctct ttatctcctc aagaacttcc ttcacaaact 60
cctgatcatg gtagtaatca agatcaccat catcatcact ttacaagcaa caacaatgga 120
gagtgtttcg atctcgggcc cggctcaacg cctcattctt ctctcaatca catcccttct 180
tcctttggaa tccttgaggc cttccataga tcaactaatg atcaatccca agattggaac 240
aatatgaagg gaaactcaga gcttagtatg ctaatgggaa accaagaagt tgaagaggag 300
ccaaaactag aaaactttct agggagtagt cactctttta gagagaatca tcatcaaaat 360
aatggagatc tctacatgtt taatactaca catgataaca acaataatag tactatgtca 420
aaccctaagg atattactag tcctgctagt aataataata ataataataa taacggactc 480
aatgtttcaa tgatcaagac atggttgaga tcaaaccacc ctcctcaatc aaatatagtg 540
gatggtggtg gtggcagtgg tggcggcggg gcgaatgcac aaacattatc cctttcaatg 600
ggaactggtg tgtcccaatc cgccttgccg ctactagcgg caggaggagg aggtggtggt 660
ggtggaggag agatagagag tagtttgtct gagaatagta gtagtaataa taaacaacaa 720
ttaagtgata caacggccgg gatatgtaat aacacagcta gtactattac tgctatcgtt 780
gatgttcaaa gtagtgcact agaaagcgtt cctaggaaat ctattgatac atttggacaa 840
cgtacatcca tttaccgtgg tgtaacaaga cataggtgga ctgggagata tgaagctcat 900
ctatgggata atagctgtag gagagaaggg cagactcgta agggcagaca agtttatttg 960
gggggttatg acaaagaaga aaaagcggct agagcttatg atttggctgc acttaaatat 1020
tggggtacca ctaccaccac caactttcct attactgatt atgaaaagga agttgaggat 1080
atgaagcata tgacacgcca agaatatgtg gcatctctac gaaggaaaag tagtggattt 1140
tctcgtggtg catcaattta tcgaggagta acaaggcatc atcagcatgg tcgttggcaa 1200
gcaaggatag gtagggttgc aggcaacaaa gacctctacc tgggaacttt cagtacacaa 1260
gaagaagcag cagaagcata tgatatagca gcaataaagt ttaggggatt aaatgcagta 1320
acaaactttg agataaacag gtatgatgtg aaagccatac ttgatagcac cacacttcct 1380
ataggaggag cagcaaagag gttaaaagat gtggaggatt taaccacaat tactccagat 1440
aaacagatta ttagggcaat tacttcgagt aatgataata atcatgaaaa ttctcagctt 1500
actaattttg gtaatgggac tcccaatttc cattcctggc ctggaatcgc attcccacaa 1560
gctcaaccac ttgcaatgca ttacccttat gcaacttctc aacaacaaca acaacaacaa 1620
caaaggtttt ggtgtaagca agaagttcaa gatactacta atgattacca agatcatctt 1680
aatcagcagc ttcaaatgaa taatgggaca cataatttct ttcagatgca taatttgatg 1740
gggttggaga attcttctac tagtttggag catagttctg ggtcgaattc cgtcgtttat 1800
gggaatggga atgggaatgg gaatggaaat gatcatggtg ttgggaatgg gtatggatta 1860
ccctttggga tgtcaacagt aattgctcat gatgggaatg ggaatggaag tgggaatggg 1920
aatgaacaaa gtgggtatga gaattattac tatctttcac accaaggaaa taataataat 1980
catggtaatg ctgctggtgt aagaggagct gttgggactt atgatcaagg gtcagcttgt 2040
aacaattggg tcccaacggc gattccgaca ctcgttccga ggccgaataa tatggcggct 2100
gttggtggtc atggtggagg aggaatccct actttcactg tgtggaatga cacctaa 2157
<210> 211
<211> 1884
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum WANT1-2 mRNA for AP2 transcription
factor
<400> 211
atgagagcga tggccagcgg cggcggcaac tggttaggct tctccctctc cccgcacatg 60
gccatggagg tgccctcctc ctctgaaccc gaccacgctc agcctgctag cgctagtgct 120
atgtctgctt ctcccaccaa cgccgcgacc tgcaacctcc tattctccca acccgcgcaa 180
atggccgctc cacctcctgg atactactac gtcggcggcg cctatgggga tggcaccagc 240
accgctggcg tctactactc ccaccacccc gtcatgccca tcacgtccga tggatctctg 300
tgcatcatgg aagggatgat gccgtcgtcc tcgccgaagc tcgaggactt cttgggtggc 360
ggcaatggca gcggacatga cgcggtcacc tactacagcc accagcagca ggaccaacaa 420
gaccaggagg caagcagaat ctaccagcac catcaacagc agcagcagca gctagcgccc 480
tacaacttcc agcacttgac ggaagcagag gcgatctacc aagaggccac ggcgccgatg 540
gacgaggcaa tggccgctgc caagaaccag ctggtgacga gctacggctc atgctacagc 600
aacgcgggga tgcagccgct gagcctgtcc atgagcccca ggtcccagtc cagcagctgc 660
gtcagcgcag ctcctcagca gcatcagatg gctgcggctg ctgctgctgc ctccttggct 720
gcttcccagg gaggcagtaa tggtggtggg gagcaggagc agtgcgtggg gaagaagagg 780
ggcactggga agggaggcca gaagcagccc gttcatcgca agtccatcga cacgtttggg 840
cagaggacct cccagtatag gggcgtcacc aggcacaggt ggactgggag atatgaagcc 900
cacctctggg acaacagctg caagaaggat gggcagacaa ggaaagggag gcaagtttat 960
ctaggtggtt atgacaatga agacaaggct gccagggctt atgatctggc tgctctgaaa 1020
tattgggggc cgtcgacgaa caccaatttc ccgctagaaa attatcgaga ggaggtcgag 1080
gagatgaaaa gcatgacaag gcaggaattc gttgcacact tgagaaggag aagcagcggg 1140
ttttctcgtg gtgcttcgat atatcgagga gtaacgaggc atcatcagca tggaagatgg 1200
caagctagga ttggcagggt tgctggcaac aaagacttgt atctcggcac tttcaccact 1260
caggaagaag cagccgaggc ctacgacgta gccgcgatca agttccgtgg cctgaacgcc 1320
gtgaccaact tcgacataac cagatacgac gtggacaaga tcatggagag cagctctctg 1380
ctgcccggtg acgaagcgcg caaggtcaag gcggtcgagg cagccaacca cgtgcctgcc 1440
atgcacaacg gcggcgggga gatcagccat gccgaagaag gaagctccgg cgtctggagg 1500
atggtactcc atggaacacc gcagcaagct gcacagtgca cccccgaggt ggcagacctt 1560
cagaagggct tcatgggcgg cggcgaccct cgctcgtccc tgcatggcat cgccgggttc 1620
gacgtcgagt cggcggcgca tgacatcgac gtctcaggca agatcaacta ctccaacccg 1680
tcctccctgg tgaccagcct cagcaactcg agagagggga gcccagagag gttcagcctg 1740
ccctcgctgt acgccaagca tcccaacgcc gtcagcgtcg ccagcatgag cccgtggatg 1800
gcgatgccag cgccggccgc cgcccacgtg ttaagggggc cgaattcctc catgcctgtg 1860
ttcgctgcct ggacggacgc atag 1884
<210> 212
<211> 1896
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum WANT1 mRNA for AP2 transcription factor
<400> 212
atgagagcga tggccagcgg cggcggcaac tggttaggtt tctccctctc cccgcacatg 60
gccatggagg tgccctcctc tgaacccgac cacgctcagg ctcaacctgc tagcgctagc 120
gctatgtccg cttctcccac aaacgccgcg acctgcaacc tcctattctc ccaacccgcg 180
caaatggccg ctccacctcc tggctactac tacgtcggcg gcgcctatgg ggatggcacc 240
agcaccgccg gcgtctacta ctcccaccac tccgtcatgc ccatcacgtc cgatggatcc 300
ctgtgcatca tggaagggat gatgccatcg tcctcgccga agctcgagga cttcttgggt 360
ggcggcaatg gaagtgggca cgacgcggtc acctactaca gccaccacca gcagcagcag 420
gaccaacagg accaggaggc aagcagaatc taccagcacc atcagcagca gctagcgccc 480
tacaacttcc agcacttgac ggaaacggag gcgatctacc aagagaccac ggcgccgatg 540
gatgaggcaa tggccgctgc caagaacctg ctcgtgacga gctatggctc atgctacagc 600
aacgcgggga tgcagccgct gagcctgtcc atgagcccca ggtcccagtc cagcagctgc 660
gtcaccgcag ctcctcagca gcatcagatg gctgcggctg ctgctgctgc tgctgcctct 720
atggctgctt cccagggagg cagtaatggt ggtggggagc agtgcgtggg gaagaagagg 780
ggcactggga agggaggcca gaagcagccc gttcaccgca agtccatcga cacgtttggg 840
cagaggacct cccagtatag gggcgtcacc aggcacaggt ggactgggag atatgaagcc 900
cacctgtggg acaacagttg caagaaggat gggcagacaa ggaaagggag gcaagtttat 960
ctaggtggtt atgataatga agacaaggct gccagggctt atgatctggc tgctctgaaa 1020
tactgggggc cgtcgacgaa caccaatttc ccgctagaaa attatcgaga ggaggtcgag 1080
gagatgaaaa gcatgacaag gcaggaattc gttgcacact tgagaaggag aagcagcggg 1140
ttttctcgtg gtgcttcgat atatcgagga gtaacgaggc atcatcagca tggaagatgg 1200
caagctagga ttggcagggt tgctggcaac aaagacttgt atctcggcac tttcaccact 1260
caagaagaag cagccgaggc ctatgacgta gccgcgatca agttccgtgg cctgaacgcc 1320
gtgaccaact tcgacataac cagatacgac gtggacaaga tcatggagag cagctctctg 1380
ctgcccgggg acgaagcgcg caaggtcagg ccgatcgagg cggccaacca cgtgccttcc 1440
atgcacaacg gcggcgggga gctcagccat gccgaagaag gaagctcagg cgtctggagg 1500
atggtgctcc atggaacacc gcagcaagct gcacagtgca cccccgaggt ggccgacctt 1560
cagaagggct tcatggacgg cgaccctcgc tcgtccctgc atggcaatgg cattgccggg 1620
ttcgacgtcg agtctgccgc gcatgacatc gacgtttcag gcaagattaa ctactccaac 1680
tcgtcttccc tggtgaccag cctcagcaac tcgagagagg ggagccccga gaggttcagc 1740
ctgccctcgc tgtacgccaa gcatcccaac gccgtcagcc tcgccaccat gagcccgtgg 1800
atggcgatgc cggcgccgac cgccacccac gcgttgaggg ggccgaattc ctccatccct 1860
cccatgcctg tgtttgctgc ctggacagac gcatag 1896
<210> 213
<211> 2382
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum clone: tplb0046e23, cultivar Chinese
Spring
<400> 213
gggttggccc ctccctctca ttccttttgc tcagctcacg ggtccctctc gcccgtcttc 60
ctcgtagttc acttctcttt taccaccact gcctccatct ccatgtcgtc gctcggacaa 120
gggtagtggt gccgcagtag cagtagagct cagctcagag tgaaagcgaa gcaagaagcg 180
ttttcgtctg tgtttgtttg ttgatgagag cgatggccag cggcggcaac tggttaggct 240
tctccctctc cccgcacatg gccatggagg tgccctcctc ctctgagccc gaccacgctc 300
agcctgctag cgctagcgct atgtccgctt ctcccaccaa cgccgccacc tgcaacctcc 360
tcttctcccc tccctcgcaa atggccgctc cacctcctgg ctactactac gtcggcgggg 420
cctacgggga tggcaccagc accgccggcg tttactactc ccaccacccc gtcatgccca 480
tcacgtccga tggatccctg tgcatcatgg aagggatgat gccgtcgtcc tcgccgaagc 540
tcgaggactt cttgggtggc ggcaatggca gtgcgcacga cgcggtcacc tactacagcc 600
accaccagca gcagcagcag gaccaacagg accaggaggt aagcagaatc taccagcacc 660
atcagcagca gctagcgccc tacaacttcc agcacttgac ggaggcagag gcgatctacc 720
aagaggccac ggcgccgacg gatgaggcaa tggccgctgc caagaacctg ctcgtgacga 780
gctatggctc atgctacagc aacgcgggga tgcagccgct gagcctgtcc atgagcccca 840
ggtcccagtc cagcagctgc gtcagcgcag ctcctcagca gcatcagatg gctgcggttg 900
ctgctgcggc tgctgcctct atggttgctt cccagggagg cagtaatggt ggtggggagc 960
agtgcgtggg gaagaagagg ggcactggga agggaggcca gaagcagccc gttcatcgca 1020
agtccatcga cacgtttggg cagaggacct cccagtatag gggcgtcacc aggcacaggt 1080
ggactgggag atatgaagcc cacctgtggg acaacagttg caagaaggat gggcagacaa 1140
ggaaagggag gcaagtttat ctaggtggtt atgacaatga agacaaggct gccagggctt 1200
atgatctggc tgctctgaaa tattgggggc catcgacgaa caccaatttc ccgctagaaa 1260
attatcgaga ggaggtcgag gagatgaaaa gcatgacaag acaggaattc gttgcacact 1320
tgagaaggag aagcagcggg ttttctcgtg gtgcttcgat atatcgagga gtaacgaggc 1380
atcatcagca tggaagatgg caagctagga ttggcagggt tgctggcaac aaagacttgt 1440
atctcggcac tttcaccact caggaagaag cagctgaggc ctacgacgta gcggcgatca 1500
agttccgtgg cctgaacgcc gtgaccaact tcgacataac cagatacgac gtggacaaga 1560
tcatggagag cagctctctg ctgcccgggg acgaagcgcg caaggtcagg ccgatcgagg 1620
cagccagcca cgtgtctccc atgcacaacg gcggcgggga gctcagccat gccgaagaag 1680
gaagctccgg cgtctggagg atggtgctcc atggaacacc gcagcaagct gcgccgtgca 1740
cccccgaggt ggccgacctt cagaagggct tcatggacgg cgaccctcgc tcgtccctgc 1800
atggcaatgg cattgccggg ttcgacgtgg agtctgcggc gcatgacatc gacgtctcag 1860
gcaagatcaa ctactccaac tcgtcttccc tggtgaccag cctcagcaac tcgagagagg 1920
ggagccccga gaggttcagc ctaccctcgc tgtacgccaa gcatcccaac gccgtcagcc 1980
tcgccagcat gagcccgtgg atggcgatgc cggcgccgac cgccgcccac acgttgaggg 2040
gaccgaattc ctccatccct tctatgcctg tgtttgctgc ctggacggac gcatagccgt 2100
gttgcagctg ctcaaatctt gctgtcactg gccatgttgt agtaaactgg agctggatta 2160
gtagcgtcgt tgctcatgtc gcttaagttt aatctgggaa ggctggttaa ttggttatca 2220
cgaaggcggt gtagtggtag tggtagtggt acgtaggaga agcatgcatt agtctctagc 2280
tcaccgaact tgtagcagta cgtagtgttc ttacttactt tcttttgagc ctataacaat 2340
gcatggaagg aggctgtccc aagaaaaaaa aaaaaaaaac ga 2382
<210> 214
<211> 2528
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum clone: WT012_J17, cultivar: Chinese
Spring
<400> 214
gacacacgcg cgcacagacc aaagtccccc ttcaaacccg ctgagcttgc aatggagagc 60
agcggcatca ttgcgacatg tgctccccaa tgattgatcc tctcattccc atctaagcta 120
gatcttcttg aatcttgaga ccaccacagc ctcatcccca gtcgtgctcg tgcgcccttg 180
ctcccatccg ctccgcccga tgaccaacgg cggccacagc atgagcggcg ccagcatcgc 240
gagcggtgct ggcggctggc tgggtttctc gctgtcgcct cacgtcgcca tggaggcggc 300
ggccggctcc ggcatcgtcg acgtggccgg ccaccaccac gcgcagcacg gcggggtcta 360
ctatcaccct gacgcggtcg cctcctcccc catgtccttc tacttcggtg ggagcgacaa 420
tgtcggcgcc gcgagcggcg ggtactactc cgggatctcc gcactgcctc tcaggtccga 480
cggctccctc tgcctcgccg acgcgctccg gaggagcgag cagaaacacc acggggcgga 540
ggtgtcggcg ccgccgaagc tcgaggactt cctgggcgcg agtcccgcca tggcgctgag 600
cctggacaac tcgggctact actacggcgg ccaaggccat ggccatggcg acgcaggagg 660
cggccagcac cagctgccgt acgccatgat gcctggctcc ggtggccacc acatgtacta 720
cgacgcccac gcggcgttgc tggacgagca ggctgcagcc acgtcggccg cgatggaagc 780
ggccggctgg atggcgcgtg ccggagacgt ctacgacgtg gacgccggca acggcgagga 840
cgccatcgtg gcgaccggcc acgacaaccc cggtgggtac gtacacccgc tgacgctgtc 900
catgagctcc gggtcccagt ccagctgcgt caccatgcag caggcggctg cacacgccca 960
cgcctacgtc ggtgccggcg gcgagtgcgt cggccaggcg accgcggcca gcaagaagcg 1020
cggcgcgggc gccgggcaga acaagcagcc ggtcgtgcac cgcaagtgca tcgacacctt 1080
cggccagcgc acgtccaagt accggggcgt caccaggcat aggtggacgg ggaggtatga 1140
ggcgcacctc tgggacaaca gctgccggaa ggaaggccag accaggaaag gccggcaagt 1200
ttatcttggt gggtatgaca tggaggagaa ggcggcgagg gcgtatgacc tcgcggcgct 1260
caagtactgg ggcgcgtcca cgcacatcaa cttcccggtg gaggactacc aggaggagct 1320
ggaggtgatg aagaacatga ccaggcagga gtatgtggct cacctcagaa ggaagagcag 1380
cgggttctcg cgcggcgcct cggtgtaccg gggagtcacc aggcaccacc agcaggggcg 1440
gtggcaggcg cgcatcggcc gcgtctccgg caacaaggac ctctacctcg gcacattcag 1500
cgcggaggcg gacgcggcgg aggcgtacga cgtggcggcg atcaagttcc gcggcctcaa 1560
cgcggtcacc aacttcgaca tcaaccgcta cgacgtggac aagatcatgg agagcagcac 1620
gctcctgccc ggcgaccagg tgcggcgcag gaaggacggc cccgacgaga gcgccgccgt 1680
ggtggcaagc gcggcggccg ccctcgtgca ggccggcagc gccgcggact actggaggca 1740
gcctgcggcg gtgaccacgg aagagcacag ccgccaccac ctggaccttc tgtcgagcga 1800
gtccttctcc ctgctgcgcg gcgtggtgtc cctggacggc gacgcggctg gtgctcaggg 1860
gcagggcaac cgcatgtcgg gcgcgtcgtc cctggccacg agcctgagca actcccggga 1920
gcagagcccg gaccagggag gcggcctggc catgctgttc gcccggcccg aggcgccgaa 1980
gctggcgagc tcgctgccca tgggcacctg ggtctcatcg ccggcgccgg ccaggcccgg 2040
tgtgtccgtg gcgcacatgc cagtgttcgc cgcgtgggcc gacgcctgac ttgctcgact 2100
acagcgtcgt ccttttggcc ctgcatccac gaggagatag caaggttgtt taactaggac 2160
tggttaccta gcattagtag ctgcgttagc aaggaactgt aaggtggttt tattagccat 2220
agctggtagc ttagcggcgc atgcatgcat ctgcctgggc tctcgtggtt ccttccccag 2280
ctgcgtctgg gacgaagggt ttttgtagta tcgagccatg gcacggcagc agcagcgtcg 2340
cctccggccc ggcggagagc cgccgccgct gatcggagct ggatgggtag ctgtagctcc 2400
tgtctctaga cctcctaact ttcatcaaac caaaatgttg gaccttcgtg ttcgtgtggc 2460
ctcgcggcgc gtctgaacat ctgatttttt tatttttttt gagggtaagc aaaaaaaaaa 2520
aaaaacga 2528
<210> 215
<211> 1803
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum PARG-2D
<400> 215
atgaccaaca acaacggcaa tggcaatggc ggcagcaacg cggcggcgag tggctggctg 60
ggcttctcgc tctcgccgca catggacgaa cacaaccacg tgcagcagca gcaacagcac 120
cagggcctat tctaccccag ctccgtcgcc gccgcctaca gcctcggcgg cgacgtcgcc 180
accgacgggt actattcgca gctagcctcc atgcctctca agtcagacgg ctccctctgc 240
atcatggaag ctctacgccg aaccgatcaa caagatcacc acggtccgaa gctggaggac 300
tttctgggcg cggggcaacc ggcgatggcg ctgagcctgg acaacacctc caacttctat 360
tactacggcg gcggtggcgg agccggtggg caacacggac agagccacgg cggcagcttc 420
ctgcagcaag catacgacgt gtacagcggg cccgcaacgg catcggtgct ggcggccaat 480
gaggacgccg cggcagccac ggccatggcg aactgggtgc aggtcgcgcg cggtgccacc 540
gcgtacgcca cagccgagaa cgtcttgtcc gcggcggcgg accggcagca gcatcttcac 600
caccaccctc tggcactctc catgagctcc gccgggtcgc tctccagctg cgttaccgcg 660
ggggccgagt acggcggcgt cggggcgacg gtggacggcg ggcgaaagcg cggcggcgcg 720
acggcggggc agaagcagcc ggtgcaccac cgcaagtcca tcgacacgtt cgggcagcgc 780
acgtcgcagt accgtggcgt caccaggcat aggtggacgg ggcggtatga ggcgcacctg 840
tgggacaaca gctgcaagaa ggaaggccag accaggaaag ggaggcaagt ttacctcgga 900
ggatatgaca tggaggagaa ggcggcgaga gcctacgacc aggcggcgct caagtactgg 960
ggcccttcca cccatatcaa cttcccgctc gaggactacc agcaggagct ggaggagatg 1020
aagaacatga cgaggcagga gtacgtggca caccttagaa ggaagagcag cggcttctcg 1080
cgtggcgcgt ccatgtaccg tggcgtgacc cggcaccacc agcacgggcg gtggcaggcg 1140
cgcatcggcc gcgtctccgg caacaaggac ctctacctcg gcactttcgg cacccaggag 1200
gaggccgcgg aggcgtacga catcgccgcc atcaagttcc ggggcctcaa cgccgtcacc 1260
aacttcgaca tcacccgcta cgacgtcgac aagatcatgg ccagcaacac gctcctcccg 1320
ggcgagcacg ccaggcgcaa caaggacgac aacgccgcgc ccctgcccct ccccgccccc 1380
gacgactgcg ccgcctctgc cctggtgccc gtgtccactc cggggacgga caccggcggc 1440
agcggccagc accgctacca cgacgtcatg tcctcgggcg aggccttctc ggcgctacac 1500
gacctggtca ccgtggacgg ccacaccgcg cagggcggga acggcgcgca cgtgcacatg 1560
tcgatgtcgg gcgcatcgtc gctggtgacg agcctgagca actcccgaga ggagagccca 1620
gaccggggcg gcgggctgtc catgctcttc gccaagccgc cgcagcagcc ggccacgaca 1680
acggcggcgt ccccgaagct gatgagcact ctgaagccgc tgggctcctg ggcgtcgtcg 1740
gcgaggccgg ccgccgtttc catcgctcac atgcccatgt tcgccgcgtg gagcgacgca 1800
tga 1803
<210> 216
<211> 1806
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Triticum aestivum PARG-2A
<400> 216
atgaccaaca acaacggcaa tgggaatggc ggcagcaacg cggcggcgag tggctggctg 60
ggcttctcgc tctcgccgca catggacgaa cacaaccacg tgcagcagca gcagcaacaa 120
caccagggcc tattctaccc cagctccgtc gccgccgcct acagcctcgg cagcgacgtc 180
gccaccggcg ggtactattc gcagctagcc tccatgcctc tcaagtcaga cggctccctc 240
tgcatcatgg aagctctacg ccgaaccgat caacaagatc accacggtcc gaagctggag 300
gactttctgg gcgcggggca accggcgatg gcgctgagcc tggacaacac ctccaacttc 360
tattactaca gcggcggtgg cggagcaggt gggcaacacg gacagagcca cggcggcggc 420
ttcctgcagc aagcatacga cgtgtacggc gggcccgcaa cggcatcggt gctggcggcc 480
gatgaggacg ccgcggcagc cacggccatg gcgaactggg tgcaggtcgc gcgcggtgcc 540
accgcgtacg ccacagccga gaacgtcttg tccgcggcgg cggaccggca gcagcatctt 600
caccaccacc ctctggcact ctccatgagc tccgccgggt cgctctccag ctgcgttacc 660
gcgggggccg agtacggcgg cgtcgtggcg acggtggacg gcgggcgaaa acgcggtggc 720
gcgacggcgg ggcagaagca gccggtgcac caccgcaagt ccatcgacac gttcgggcag 780
cgcacgtcgc agcaccgtgg cgtcaccagg cataggtgga cggggcggta tgaggcgcac 840
ctgtgggaca acagctgcaa gaaggaaggc cagaccagga aagggaggca agtttacctc 900
ggagggtatg acatggagga gaaggcggcg agagcctacg accaggcggc gctcaagtac 960
tgggggcctt ccacccatat caacttcccg ctcgaggact accagcagga gctggaggag 1020
atgaagaaca tgacgaggca ggagtacgtg gcacacctta gaaggaagag cagcggcttc 1080
tcgcgtggcg cgtccatgta ccgtggcgtg acccggcacc accagcacgg gcggtggcag 1140
gcgcgcatcg gccgcgtctc cggcaacaag gacctctatc tcggcacttt cggcacccag 1200
gaggaggccg cggaggcgta cgacatcgcc gccatcaagt tccggggact caacgccgtc 1260
accaacttcg acatcacccg ctacgacgtc gacaagatca tggccagcaa cacgctcctc 1320
ccgggcgagc tcgccaggcg caacaaggac gccaacgccg cgcccctgcc cctccccgcc 1380
cccgacgact gcgccgcctc tgccctggtg cccgtgtcta ctccggggac ggacaccggc 1440
ggcagcggcc agcaccgaaa ccaggacgtc atgtcctcgg gcgaggcctt ctcggcgctg 1500
cacgacctgg tcaccgtgga cggccacacc gcgcagggcg gcaacggcgc gcgcgtgcac 1560
atgtcgatgt cgggcgcatc gtcgctggtg acgagcctga gcaactcccg cgaggagagc 1620
ccagaccggg gcggtggcct gtctatgctc ttcgccaagc cgccgcagca gccggccacg 1680
acaacggcgg cgtccccgaa gctgatgagc actctggcgc cgctgggttc ctgggcgtcg 1740
tcggcgaggc cggccgccgt ttccatcgct cacatgccca tgttcgccgc gtggagcgac 1800
gcatga 1806
<210> 217
<211> 2040
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays BBM
<400> 217
atggcttcag cgaacaactg gctgggcttc tcgctctcgg gccaggataa cccgcagcct 60
aaccaggata gctcgcctgc cgccggtatc gacatctccg gcgccagcga cttctatggc 120
ctgcccacgc agcagggctc cgacgggcat ctcggcgtgc cgggcctgcg ggacgatcac 180
gcttcttatg gtatcatgga ggcctacaac agggttcctc aagaaaccca agattggaac 240
atgaggggct tggactacaa cggcggtggc tcggagctct cgatgcttgt ggggtccagc 300
ggcggcggcg ggggcaacgg caagagggcc gtggaagaca gcgagcccaa gctcgaagat 360
ttcctcggcg gcaactcgtt cgtctccgat caagatcagt ccggcggtta cctgttctct 420
ggagtcccga tagccagcag cgccaatagc aacagcggga gcaacaccat ggagctctcc 480
atgatcaaga cctggctacg gaacaaccag gtggcccagc cccagccgcc agctccacat 540
cagccgcagc ctgaggaaat gagcaccgac gccagcggca gcagctttgg atgctcggat 600
tcgatgggaa ggaacagcat ggtggcggct ggtgggagct cgcagagcct ggcgctctcg 660
atgagcacgg gctcgcacct gcccatggtt gtgcccagcg gcgccgccag cggagcggcc 720
tcggagagca catcgtcgga gaacaagcga gcgagcggtg ccatggattc gcccggcagc 780
gcggtagaag ccgtaccgag gaagtccatc gacacgttcg ggcaaaggac ctctatatat 840
cgaggtgtaa caaggcatag atggacaggg cggtatgagg ctcatctatg ggataatagt 900
tgtagaaggg aagggcagag tcgcaagggt aggcaagttt accttggtgg ctatgacaag 960
gaggacaagg cagcaagggc ttatgatttg gcagctctca agtattgggg cactacgaca 1020
acaacaaatt tccctataag caactacgaa aaggagctag aagaaatgaa acatatgact 1080
agacaggagt acattgcata cctaagaaga aatagcagtg gattttctcg tggggcgtca 1140
aagtatcgtg gagtaactag acatcatcag catgggagat ggcaagcaag gatagggaga 1200
gttgcaggaa acaaggatct ctacttgggc acattcagca ccgaggagga ggcggcggag 1260
gcctacgaca tcgccgcgat caagttccgc ggtctcaacg ccgtcaccaa cttcgacatg 1320
agccgctacg acgtgaagag catcctcgag agcagcacac tgcctgtcgg cggtgcggcc 1380
aggcgcctca aggacgccgt ggaccacgtg gaggccggcg ccaccatctg gcgcgccgac 1440
atggacggcg ccgtgatctc ccagctggcc gaagccggga tgggcggcta cgcctcgtac 1500
ggccaccacg gctggccgac catcgcgttc cagcagccgt cgccgctctc cgtccactac 1560
ccgtacggcc agccgtcccg cgggtggtgc aaacccgagc aggacgcggc cgccgccgcg 1620
gcgcacagcc tgcaggacct ccagcagctg cacctcggca gcgcggccca caacttcttc 1680
caggcgtcgt cgagctccac agtctacaac ggcggcgccg gcgccagtgg tgggtaccag 1740
ggcctcggtg gtggcagctc tttcctcatg ccgtcgagca ctgtcgtggc ggcggccgac 1800
caggggcaca gcagcacggc caaccagggg agcacgtgca gctacgggga cgaccaccag 1860
gaggggaagc tcatcggtta cgacgccgcc atggtggcga ccgcagctgg tggagacccg 1920
tacgctgcgg cgaggaacgg gtaccagttc tcgcagggct cgggatccac ggtgagcatc 1980
gcgagggcga acgggtacgc taacaactgg agctctcctt tcaacaacgg catggggtga 2040
<210> 218
<211> 963
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WUS1
<400> 218
atggcggcca acgtgggcgc gggcaggagt gctggcggcg gcggagccgg cactggcact 60
ggcactgctg ctggcagcgg cggcgtgtcg acggccgtgt gccgccctag cggctcgcgg 120
tggacgccga cgccggagca gatcaggatc ctcaaggagc tctactacgg ctgcggcatc 180
cggtcgccca actcggagca gatccagcgc atcaccgcca tgctgcggca gcacggcaag 240
atcgagggca agaacgtctt ctactggttc cagaaccaca aggcccgcga gcgccagaag 300
cgccgcctca ccaacctcga cgtcaacgtg cccgtcgccg ccgacgacag cgcccaccgc 360
cttggcgtcc tctcgttgtc gccttcttca ggttgttcag gcgcggcgcc tccgtcgccc 420
accctcggct tctacgccgg cggcaatggc tccgctgtga tgctggacac gagttccgat 480
tggggcagcg ctgctgccat ggccactgag gcatgcttca tgcaggacta catgggcgtg 540
atgggcggcg cgtcaccgtg ggcatgctcc tcctcgtcgt cggaggaccc gatggcggcg 600
ctggcgctgg cgccgaaggt gacccgggcg cccgagacgc tccctctctt cccgaccggc 660
ggcggcggag acgataggca gcccccgcgg ccgcggcagt ctgtcccagc aggcgaggcc 720
atccgcggcg gcagcagcag cagcagctac cttccgttct ggggtgccgc gcccacccca 780
actggcagtg ccacttccgt tgcgatccag cagcaacacc agctgatgca gatgcaagag 840
cagtacagct tttacagcaa cgcccagctg ctgcccggca ccggcagcca ggatgcagca 900
gcaacatccc tggagctgag cctcagctcc tggtgctccc cttaccctgc agggaccatg 960
tga 963
<210> 219
<211> 978
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WUS2
<400> 219
atggcggcca atgcgggcgg cggtggagcg ggaggaggca gcggcagcgg cagcgtggct 60
gcgccggcgg tgtgccgccc cagcggctcg cggtggacgc cgacgccgga gcagatcagg 120
atgctgaagg agctctacta cggctgcggc atccggtcgc ccagctcgga gcagatccag 180
cgcatcaccg ccatgctgcg gcagcacggc aagatcgagg gcaagaacgt cttctactgg 240
ttccagaacc acaaggcccg cgagcgccag aagcgccgcc tcaccagcct cgacgtcaac 300
gtgcccgccg ccggcgcggc cgacgccacc accagccaac tcggcgtcct ctcgctgtcg 360
tcgccgcctt caggcgcggc gcctccctcg cccaccctcg gcttctacgc cgccggcaat 420
ggcggcggat cggctgggct gctggacacg agttccgact ggggcagcag cggcgctgcc 480
atggccaccg agacatgctt cctgcaggac tacatgggcg tgacggacac gggcagctcg 540
tcgcagtggc catgcttctc gtcgtcggac acgataatgg cggcggcggc ggccgcggcg 600
cgggtggcga cgacgcgggc gcccgagaca ctccctctct tcccgacctg cggcgacgac 660
gacgacgacg acagccagcc cccgccgcgg ccgcggcacg cagtcccagt cccggcaggc 720
gagaccatcc gcggcggcgg cggcagcagc agcagctact tgccgttctg gggtgccggt 780
gccgcgtcca caactgccgg cgccacttct tccgttgcga tccagcagca acaccagctg 840
caggagcagt acagctttta cagcaacagc acccagctgg ccggcaccgg cagccaagac 900
gtatcggctt cagcggccgc cctggagctg agcctcagct catggtgctc cccttaccct 960
gctgcaggga gcatgtga 978
<210> 220
<211> 975
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WOX2
<400> 220
atggagacgc cacagcagca atccgccgcc gccgccgccg ccgccgccca cgggcaggac 60
gacggcgggt cgccgccgat gtcgccggcc tccgccgcgg cggcggcgct ggcgaacgcg 120
cggtggaacc cgaccaagga gcaggtggcc gtgctggagg ggctgtacga gcacggcctg 180
cgcaccccca gcgcggagca gatacagcag atcacgggca ggctgcggga gcacggcgcc 240
atcgagggca agaacgtctt ctactggttc cagaaccaca aggcccgcca gcgccagagg 300
cagaagcagg acagcttcgc ctacttcagc aggctcctcc gccggccccc gccgctgccc 360
gtgctctcca tgccccccgc gccaccgtac catcacgccc gcgtcccggc gccgcccgcg 420
ataccgatgc cgatggcgcc gccgccgccc gctgcatgca acgacaacgg cggcgcgcgt 480
gtgatctaca ggaacccatt ctacgtggct gcgccgcagg cgccccctgc aaatgccgcc 540
tactactacc cacagccaca gcagcagcag cagcagcagg tgacagtcat gtaccagtac 600
ccgagaatgg aggtagccgg ccaggacaag atgatgacca gggccgcggc gcaccagcag 660
cagcagcaca acggcgccgg gcaacaaccg ggacgcgccg gccaccccag ccgcgagacg 720
ctccagctgt tcccgctcca gcccaccttc gtgctgcggc acgacaaggg gcgcgccgcc 780
aacggcagta ataacgactc cctgacgtcg acgtcgacgg cgactgcgac agcgacagcg 840
acagcgacag cgtccgcttc catctccgag gactcggatg gcctggagag cggcagctcc 900
ggcaagggcg tcgaggaggc gcccgcgctg ccgttctatg acttcttcgg gctccagtcc 960
tccggaggcc gctga 975
<210> 221
<211> 666
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WOX5
<400> 221
atggaggcgc tgagcgggcg ggtaggcgtc aagtgcgggc ggtggaaccc tacggcggag 60
caggtgaagg tcctgacgga gctcttccgc gcggggctgc ggacgcccag cacggagcag 120
atccagcgca tctccaccca cctcagcgcc ttcggcaagg tggagagcaa gaacgtcttc 180
tactggttcc agaaccacaa ggcccgcgag cgccaccacc acaagaagcg acgccgcggc 240
gcgtcgtcgt cctcccccga cagcggcagc ggcaggggaa gcaacaacga ggaagacggc 300
cgtggtgccg cctcgcagtc gcacgacgcc gacgccgacg ccgacctcgt gctgcaaccg 360
ccagagagca agcgggaggc cagaagctat ggccaccatc accggctcgt gacatgctac 420
gtcagggacg tggtggagca gcaggaggcg tcgccgtcgt gggagcggcc gacgagggag 480
gtggagacgc tagagctctt ccccctcaag tcgtacggcg acctcgaggc ggcggagaag 540
gtccggtcgt acgtcagagg aagcggcgcc accagcgagc agtgcaggga gttgtccttc 600
ttcgacgtcg tctccgccgg ccgggatccg ccgctcgagc tcaggctctg cagcttcggt 660
ccctag 666
<210> 222
<211> 1521
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea Mays WOX8
<400> 222
atggcgtcct cgaacaggca ctggccgagc atgtacaggt ccagtctcgc ctgcaacttc 60
cagcagccgc agccgcagcc tgacatgaac aacggcggca agtcctcact catgtcctca 120
aggtgcgagg agaacggcgg aaggaacccg gagccgaggc cgcggtggaa cccgcggccg 180
gagcagatca ggatcctgga agggatcttc aactccggca tggtgaaccc gccgcgcgac 240
gagatccgcc gcatccgcct ccaactgcag gagtacgggc ccgtcggcga cgccaacgtc 300
ttctactggt tccagaaccg caagtcccgc accaagcaca agctgcgcgc cgcggggcag 360
ctgcagccgt cgggctcggg ccgctccgcc ctgcaggcgc gcgcgtgcgc cccggcgccc 420
gtgacgcctc ccaggaacct gcagctcgcg gccgctgctc ccgtggcgcc gcccacgtcc 480
tcgtcctcgt cgtcctccga ccggtcctcg gggtcatcat cgagcaagtc ggtgaccgtg 540
accccgacga ccgccgtcgc gcttgcttct cccgcaggcg ccgcgccggc tgctgtcttc 600
cgccagcagg gcgtgatgcc gacgacggcc atggacctgc ttacgccgct gccgtcgtcg 660
tcggccgctc tggccgcgcg ccagctctac tatcagtacc acagccagat catggcgcct 720
gccgcgccgc cgatgcccga tacggtgatc gcctctccgg agcagttcct tccgcagtgg 780
cagcagggcg gacagcagca ttattacctg ccggccaccg agctcggtgg cgtcctcgac 840
ggccactccc accacacaca cgagcccccg gcggccatac accggcccgt ctcgctctca 900
cccagcgtgc tctttggcct gtgcaacgaa gctctaaggc aagactactg cgccgacatc 960
agcgtcgtcc ccaccaaggg actcggccat ggccaccagt tctggaacag caccacctgc 1020
ggctctgata tgggcaatag caatagcaag atcgacgccg tgagcgccgt gatcagggac 1080
gacgagaagt ccaggctggg gttactccac tactacggct tggcgggcgc gacgacgacc 1140
gctgctgcgg ctgtcgctcc ggcccctctc gctgcagatg ccgccgccgg tacggccacg 1200
ctgcttccaa gctctgcggc gagcgaccag ttgcaagggc tgttggatgc tgctgggctg 1260
ctgatggggg agacgccgcc gacgccgacg gcgacggtgg tggccgtggc ccgggacgcc 1320
gtgacgtgcg cggccaccgc caccgcgcag ttcagcgtgc cggcgtcgat gcgcctggac 1380
gtgaggctgg cgttcggcga ggccgccctt ctggcgcgcc acaccggcga ggcggtcccc 1440
gtcgacgagt ccggcgtcac ggtggagccg ctccagcagg acactctcta ctacgtgctc 1500
atgcaggcga ctaataactg a 1521
<210> 223
<211> 822
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WOX10
<400> 223
atggagtggg tggacaggac caaggcctcc gccgccgccg ccgcagcggc ggcggacgag 60
agggctgggg gagcggaagg gctcgcggga tacgtcaagg tcatgaccga cgaacagatg 120
gaggtgctcc gcaagcagat ctccatctac gccaccatct gcgagcagct tgtcgagatg 180
caccgcgccc tcaccgagca ccaggacacc attgcaggaa ttaggtttag taatctgtac 240
tgtgatcctc aaattatccc tggaggccac aagatcacag caaggcaacg atggcaacca 300
acaccaatgc agctgcagat cttggagaac atctttgacc aaggcaatgg aacaccaagc 360
aagcagagga taaaggagat aacggcagag ctctcgcacc atggccaaat ctcggagaca 420
aatgtgtaca actggttcca gaacagacgg gcacggtcaa agcggaagca ggccgcttct 480
ttaccgaaca atgctgaatc tgaagctgag gtggacgagg agtctctcac cgataagaag 540
ccgaagtcag atcggtcgct ccaggacaac aaggctatgg gcgctcacaa cgctgacagg 600
atatctggga tgcatcactt ggacactgat catgaccaaa tcggtggcat gatgtatgga 660
tgcaatgaca acggcttgag atcgtctggc agttctggcc agatgtcctt ctacgggaac 720
atcatgccga atccaagaat cgatcatttc ccggggaagg tggagagctc ccggagcttc 780
tcccatctcc aacacgggga aggctttgac atgtttggat ga 822
<210> 224
<211> 849
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WOX13
<400> 224
atggactggg ggaacaggac caaggccgcc gccgccgctg cggcgccgga cgagagggcc 60
gggggagggg aagggctcgg aggatacgtc aaggtcatga ccgacgaaca gatggaggtg 120
ctccgcaagc agatctccat ctacgccacc atctgcgagc agcttgtcga gatgcatcgc 180
gtcctcaccg agcaccagga caccattgca ggattgaggt ttagcaatct gtactgtgac 240
cctctaatca tccccggcgg tcacaagatc acggcaaggc agcggtggca accaacaccg 300
atgcagctgc agatcctgga gagcatcttc gaccagggca acgggacacc gagcaagcag 360
aagataaagg agataacagc ggagctctcg cagcacggcc agatctcgga gacgaacgtg 420
tacaactggt tccagaacag gcgggcacgg tcgaagcgga agcaggccgc tgcttcctta 480
ccgaacaacg ccgaatccga agccgaggcg gacgaggagc ctctcgccga caagaagccg 540
aagtcagaca ggccgccgcc gccgccgccg ccgatccagg ataataccaa ggctacgggc 600
gctctcagcg ccgacagggt ctctggtggg acgcgtcact tggacacggg tcatgaccag 660
accagtggcg tgatgtatgg gtgcaacgac agtggcttgt tgagatcgtc cggcagttcg 720
ggccagatgt ccttgtacga gaacttcatg tcgaatccaa gaatcgatcg tttcccggcg 780
aaggtggaga gctcccggag cttcccccat ctccaacaac acggggaagg ctttggcatg 840
tttggatga 849
<210> 225
<211> 795
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays Lec1
<400> 225
atggactcca gcttcctccc tgccggcgcg gacaatggct cggcgggcgg cgccaacaat 60
ggcggcggcg ctgctcagca ggcgccgccg atccgcgagc aggaccggct gatgccgatc 120
gcgaacgtca tccgcatcat gcggcgcgtg ctgccggcgc acgccaagat ctcggacgac 180
gccaaggaga cgatccagga gtgcgtgtcg gagtacatca gcttcatcac gggggaggcc 240
aacgagcggt gccagcggga gcagcgcaag accatcaccg ccgaggacgt gctgtgggcc 300
atgagccgcc tcggcttcga cgactacgtc gagccgctca gcgtctacct ccaccgctac 360
cgcgagttcg agggcgaggc gcggggcgtc ggcctcgccc cggcccctcc gcgcggcgac 420
caccaccacc accaccactc cgtgccgcca tcgatgctca acaagtcccg cgggcccggc 480
tccggagccg tcatgctacc gcaccaccac caccacgaca tgcacgcctc catgtacggg 540
ggcgccgtgc ccccgccgcc gcaccacggc ttcctcatgc cacacccaca gggcggccac 600
tacctgcctt acccctacga gcccacgtcg tacggcggcg agcacgcctt ggccagcggg 660
tactatggag gggccgcgta cgcgccgggc aacaacggcg ggagcggcga tggcagcggc 720
gggagcgcgt cgcacgcacc gccgggcggc agcggcggcg gcttcgacca cccgcacacg 780
ttcgcgtaca agtag 795
<210> 226
<211> 1179
<212> DNA
<213> 人工序列
<220>
<223> cDNA od Zea mays Lec2
<400> 226
atgccagccc gcgcctccca cccggcgctt gccacctcgc gcgcgcgcgg ttggccgcgc 60
ctgcgcgccc tcggcatcgc ccccgacggg gggcgttggc gttgcctccc ccactttgca 120
cccatttcag agcccgcccg acacttgtca ccgcgcgccc ccgcctccgc gtctccgccc 180
gcccgccccc atccggctat aaaagcctcg ccctctccaa ccctagccgc cgctgccgct 240
gccgccgccg ccgctacctc ctcccttcct tccttctccg ctcgtcgtcg ttctaccggc 300
atggccggca ttaccaagcg ccgcacctcc ccggcctcca cctcctcttc gtccggcgac 360
gtcttgccgc agcgggtcac ccggaagcgt cggtccgccc gccgcgggcc ccggagcacc 420
gcccgtaggc cgtcggcgcc tccacctatg aatgaactgg acttgaatac agctgctctt 480
gatccggatc attatgctac aggattgaga gttcttcttc agaaggagct ccgaaatagc 540
gatgtaagcc agcttgggag aattgttctc ccaaagaagg aggcggagtc ttacctccct 600
attctgatgg caaaggatgg aaagagttta tgcatgcatg acttgctaaa ttcacaactg 660
tggaccttca agtatagata ttggttcaac aacaaaagca ggatgtatgt gcttgaaaat 720
accggagatt atgtaaaagc tcatgacctt cagcaaggag acttcatcgt gatctacaag 780
gacgacgaga acaaccgctt tgtcatagga gcaaagaagg caggagatga gcagaccgcc 840
actgtacctc aagtccatga acacatgcac atctctgccg cactgccagc tccacaagcg 900
ttccatgact atgcaggccc cgtcgcagca gaagctggta tgctcgcgat cgtgccacag 960
ggtgacgaga tattcgacgg catactgaac tccctgccgg agataccagt ggcgaacgtg 1020
aggtactccg acttcttcga cccgttcggt gactccatgg acatggcgaa tccgctgagc 1080
tcctccaata acccctcggt caacctggct acgcatttcc atgacgagag gatcgggagc 1140
tgctcgtttc cctacccaaa atccgggcct cagatgtga 1179
<210> 227
<211> 1026
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WIND1_1
<400> 227
atggccgcag ccatcgacat gtacaagtac tacaatacca gcgcacacca gatcccctcc 60
tcatccccct cggatcagga gctcgcgaaa gcactcgagc cttttataac gagtgcttcc 120
tcctcttcat cctcctcccc ctaccatggc tactcgtcct ctccatccat gtcccaagat 180
tcttacatgc ctacaccctc ttacaccagc tacgccacct cgcctcttcc cactcccgcc 240
gccgcctcct cctcgcagct tccgccgctc tactcgtcgc cttatgcggc gccgtgcatg 300
gccggccaga tgggcctgaa ccagctcggc ccggcccaga tccagcagat ccaggcccag 360
ttcatgttcc agcagcagca gcagcagcag aggggcctgc acgcggcgtt cctgggcccg 420
cgggcgcagc cgatgaagca gtcagggtcg ccgtcgccgc cgccgccgct ggcgccggcg 480
cagtcgaagc tgtaccgcgg cgtgcggcag cgccactggg gcaagtgggt ggcggagatc 540
cggctcccga agaaccgcac gcggctgtgg ctcggcacct tcgacaccgc ggaggacgcg 600
gcgctcgcct acgacaaggc ggccttccgc ctccgcggcg acacggcgcg cctcaacttc 660
ccggccctcc ggcgcggcgg cgcgcacctc gccggcccgc tgcacgcctc cgtggacgcc 720
aagctgaccg ccatctgcca gtccctgtcg gagtccaagt ccaagagcgg ctcgtccggc 780
gacgagtcgg ccgcgtcccc gccggactcc cccaagtgct cggcgtcgac gacggaggga 840
gagggggagg aggagtcggg ctccgccggc tcccctcctc ctcctcctcc tcccccgacg 900
ctggcgccgc ccgtgccgga gatggcgaag ctggacttca cggaggcgcc gtgggacgag 960
acggaggcct tccacctgcg caagtacccg tcctgggaga tcgactggga ttccatcctg 1020
tcatga 1026
<210> 228
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays WIND1_2
<400> 228
atggccgcag ccatagacat gtacaagtac tgcaatacca gcgcacacct tatcgcctcc 60
tcgtccccct cggatcagga gctcgcgaaa gcactcgagc cttttataac gagtgcttcc 120
tccccctacc atcgctactc gttggcccca gattcttaca tgcctacacc ctcctcctac 180
accacctcgc ctcttcccac ccccacctcc tcgcctttct cgcagcttcc gccactctac 240
tcgtcgcctt acgcggcttc gacggcgtcg ggcgtggctg ggccgatggg cctgaaccag 300
ctcggcccgg cccagatcca gcagatccag gcccagctca tgttccagca ccagcagcag 360
aggggcctgc acgcggcgtt cctgggcccg cgggcgcagc cgatgaagca gtccgggtcg 420
ccgccggcgc agtcgaagct gtaccgcggc gtgcgccagc gccactgggg caagtgggtg 480
gcggagatcc gcctccccaa gaaccgcacg cggctgtggc tcggcacctt cgacaccgcc 540
gagggcgcgg cgctggccta cgacgaggcg gccttccgcc tccgcggcga cacggcgcgc 600
ctcaacttcc cgtccctccg ccgcggcggc ggcgcgcgcc tcgccggccc gctccacgcc 660
tccgtggacg ccaagctcac cgccatctgc cagtccctgg cggggtccaa gaacagctcg 720
tccagcgacg agtcggccgc gtccctgccg gactccccca agtgctcagc gtcgacggag 780
ggggatgagg actcggcctc cgccggctcc cctccttccc cgacgcaggc gccgcccgtg 840
ccggagatgg cgaagctgga cttcaccgag gcgccgtggg acgaaacgga ggccttccac 900
ctgcgcaagt acccgtcctg ggagatcgac tgggattcca tcctctcatg a 951
<210> 229
<211> 702
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays ESR1_1
<400> 229
atggcgccga gaacgtcaga gaaaaccatg gcaccggcgg cggccgctgc cacggggctc 60
gcgctcagcg tcggcggcgg cggcggggcc ggcggcccgc actacagagg cgtgaggaag 120
cggccgtggg gccggtacgc ggcggagatc cgcgacccgg cgaagaagag ccgggtgtgg 180
ctcggcacct acgacacggc cgaggacgcc gcgcgggcct acgacgccgc cgcgcgcgag 240
taccgcggcg ccaaggccaa gaccaacttc ccttacccct cgtgcgtgcc cctctccgca 300
gccggttgcc ggagcagcaa cagcagcacc gtcgagtcct tcagcagcga cgcgcaggcg 360
cccatgcagg ccatgccgct cccgccgtcg ctcgagctgg acctgttcca ccgcgcggcg 420
gccgcggcca cgggcacggg cgctgccgcc gtacgcttcc ctttcggcag catccccgtt 480
acgcacccgt actacttctt cgggcaggcc gcagccgcag ccgcggaagc agggtgccgt 540
gtgctcaagc tggcgccggc ggtcaccgtg gcgcagagcg actccgactg ttcgtcggta 600
gtggatctgt cgccgtcgcc accggccgct gtgtcggcga ggaagcccgc cgcgttcgat 660
ctcgacctga actgctcacc gccgacggag gcggaagcct ag 702
<210> 230
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays ESR1_2
<400> 230
atggaggacg tggccaacgc acacatctac gcccacgccc accggagcaa gcgtccccag 60
tcggccgcga tcaaagacgg ggacggggac gtcgacctgt ccatgaaagg cgcgcggtac 120
cgcggcgtgc ggcgccggcc gtggggccgg ttcgcggcag agatccgcga ccccatgtcc 180
aaggagcggc ggtggctcgg caccttcgac accgccgagc aggccgcctg cgcctacgac 240
atcgcggcgc gcgccatgcg cggcaacaag gcgcgcacca acttcccggg ccacgccacg 300
gcgggctact ggccgtgggg cgcgccgcag ccggcggcgg tggcgcaccc gatcaaccct 360
ttcctcctgc acaacctcat catgagctcc tccaaccacg gctgccgcct gctcaaccac 420
gcaggccacg gacacgtcca ctccgcagcc cccagacctc cggcgccggc ggcggacgcc 480
acgtccacga ccatcgcagc gcccttccct gtcgccgcac accccgccgt agcgatggac 540
gaggacgtgg acgactggga cggcgtcctg cggagcgagc ccgcggacgc cgggctgctg 600
caggacgcgc tgcacgactt ctaccctttc acgcgtccgc gcgccggcgg gggcaggcgc 660
ggcctgtccg cggccggaac cgacgccagg gcggcagctg cgttggtggc gccggtaaag 720
ccggatgctt tcgtcgttcc cagccctttc gccggcgtcg agggggacgg tgaatacccg 780
atgatgccgc agggcctgct cgaggacgtg atccactccc cggcgttcgt ggaggttgtg 840
gccgcgccgc cgtccgtccc cacgcgccgc ggccgccggg gctga 885
<210> 231
<211> 2130
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays PLT3
<400> 231
atggccactg tgaacaactg gctcgctttc tccctctccc cgcaggagct gccgccctcc 60
cagacgacgg actccacgct catctcggcc gccaccgccg accatgtctc cggcgatgtc 120
tgcttcaaca tcccccaaga ttggagcatg aggggatcag agctttcggc gctcgtcgcg 180
gagccgaagc tggaggactt cctcggcggc atctccttct ccgagcagca tcacaagtcc 240
aactgcaact tgatacccag cactagcagc acagtttgct acgcgagctc agctgctagc 300
accggctacc atcaccagct gtaccagccc accagctccg cgctccactt cgcggactcc 360
gtcatggtgg cctcctcggc cggtgtccac gacggcggtt ccatgctcag cgcggccgcc 420
gctaacggtg tcgctggcgc tgccagtgcc aacggcggcg gcatcgggct gtccatgatc 480
aagaactggc tgcggagcca accggcgccc atgcagccga gggcggcggc ggctgagggc 540
gcgcaggggc tctctttgtc catgaacatg gcggggacga cccaaggcgc tgctggcatg 600
ccacttctcg ctggagagcg cgcacgggcg cccgagagtg tatcgacgtc agcacagggt 660
ggtgccgtcg tcgtcacggc gccgaaggag gatagcggtg gcagcggtgt tgccggtgct 720
ctagtagccg tgagcacgga cacgggtggc agcggcggcg cgtcggctga caacacggca 780
aggaagacgg tggacacgtt cgggcagcgc acgtcgattt accgtggcgt gacaaggcat 840
agatggactg ggagatatga ggcacatctt tgggataaca gttgcagaag ggaaggacaa 900
actcgtaagg gtcgtcaagt ctatttaggt ggctatgata aagaggagaa agctgctagg 960
gcttatgatc ttgctgctct gaagtactgg ggtgccacaa caacaacaaa ttttccagtg 1020
agtaactacg aaaaggagct cgaggacatg aagcacatga caaggcagga gtttgtagcg 1080
tctctgagaa ggaagagcag tggtttctcc agaggtgcat ccatttacag gggagtgact 1140
aggcatcacc aacatggaag atggcaagca cggattggac gagttgcagg gaacaaggat 1200
ctttacttgg gcaccttcag cacccaggag gaggcagcgg aggcgtacga catcgcggcg 1260
atcaagttcc gcggcctcaa cgccgtcacc aacttcgaca tgagccgcta cgacgtgaag 1320
agcatcctgg acagcagcgc cctccccatc ggcagcgccg ccaagcgtct caaggaggcc 1380
gaggccgcag cgtccgcgca gcaccaccac gccggcgtgg tgagctacga cgtcggccgc 1440
atcgcctcgc agctcggcga cggcggagcc ctagcggcgg cgtacggcgc gcactaccac 1500
ggcgccgcct ggccgaccat cgcgttccag ccgggcgccg ccaccacagg cctgtaccac 1560
ccgtacgcgc agcagccaat gcgcggcggc gggtggtgca agcaggagca ggaccacgcg 1620
gtgatcgcgg ccgcgcacag cctgcaggac ctccaccact tgaacctggg cgcggccggc 1680
gcgcacgact ttttctcggc agggcagcag gccgccgccg cagctgcgat gcacggcctg 1740
gctagcatcg acagtgcgtc gctcgagcac agcaccggct ccaactccgt cgtctacaac 1800
ggcggggtcg gcgatagcaa cggcgccagc gccgttggca gcggcggtgg ctacatgatg 1860
ccgatgagcg ctgccggagc aaccactaca tcggcaatgg tgagccacga gcagatgcat 1920
gcacgggcct acgacgaagc caagcaggct gctcagatgg ggtacgagag ctacctggtg 1980
aacgcggaga acaatggtgg cggaaggatg tctgcatggg ggaccgtcgt ctctgcagcc 2040
gcggcggcag cagcaagcag caacgacaac attgccgccg acgtcggcca tggcggcgcg 2100
cagctcttca gtgtctggaa cgacacttaa 2130
<210> 232
<211> 1479
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays PLT5
<400> 232
atggacacct cgcaccacta tcatccatgg ctcaacttct ccctcgccca ccactgtgac 60
ctcgaggagg aggagagggg cgcggccgcc gagctggccg cgatagccgg cgccgcgccg 120
ccgccgaagc tggaggactt cctcggcgga ggcgtcgcca ccggtggtcc ggaggcggtg 180
gcgcccgcgg agatgtacga ctcggacctc aagttcatag ccgccgccgg gttccttggc 240
ggctcggcgg cggcggcggc gacgtcgccg ctgtcctccc tcgaccaggc cggttccaag 300
ctggccttgc ctgcggcggc ggctgctccg gcgccggagc agaggaaggc cgtcgactcc 360
tttgggcagc gcacgtccat ctaccgcggc gtcacacggc accggtggac tggcaggtac 420
gaggcacatc tgtgggacaa cagctgccga cgcgaagggc agagccgcaa gggccgccaa 480
gtatatttgg gtggctatga taaggaggag aaggctgcca gggcgtatga tcttgcagct 540
ttgaagtact ggggttctag caccaccacc aactttccgg ttgctgagta tgagaaggag 600
gtcgaggaga tgaagaacat gacgcgacaa gagtttgttg cttcccttcg aaggaagagc 660
agtggattct ctcggggtgc ttccatctac cgaggtgtaa ccagacatca ccagcatgga 720
cggtggcagg cgaggatcgg aagggtggcc ggtaacaagg acctctacct tgggacgttc 780
agcaccgagg aggaagctgc agaggcctac gacatagcgg ccatcaagtt cagaggcctg 840
aacgccgtca caaacttcga gatcagccgg tacaacgtgg agaccataat gagcagcaac 900
cttccagtcg cgagcatgtc gtcgtcggcg gcggcggcgg cgggtggccg gagcagcaag 960
gcgctggagt cccctccgtc cggctcgctt gacggcggcg gcggcatgcc agtcgtcgaa 1020
gccagcacgg caccgccgct gttcattccg gtgaagtacg accagcagca gcaggagtac 1080
ctgtcgatgc tcgcgttgca gcagcaccac cagcagcaac aagcagggaa cctgttgcag 1140
gggccgctag tagggttcgg cggcctctac tcctccgggg tgaacctgga tttcgccaac 1200
tcccacggca cggcggctcc gtcgtcgatg gcccaccact gctacgccaa tggcaccgcc 1260
tccgcctcgc atgagcacca gcaccagatg cagcagggcg gcgagaacga gacgcagccg 1320
cagccgcagc agagctccag cagctgctcc tccctgccat tcgccacccc ggtcgctttc 1380
aatgggtcct atgaaagctc catcacggcg gcaggcccct ttggatactc ctacccaaat 1440
gtggcagcct ttcagacgcc gatctatgga atggaatga 1479
<210> 233
<211> 1467
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays PLT7
<400> 233
atggacatgg acatgagctc agcttatccc caccattggc tctccttctc cctctccaac 60
aactaccacc atggcctact cgaagccttc tctaactcct ccggtactcc tcttggagac 120
gagcagggcg cagtggagga gtccccgagg acggtggagg acttcctcgg cggcgtcggt 180
ggcgccggcg ccccgccgca gccggcggcg gctgcagatc aggatcacca gcttgtgtgc 240
ggcgagctgg gcagcatcac agccaggttc ttgcgccact acccggcggc gccagctggg 300
acgacggtgg agaaccccgg cgcggtgacc gtggcggcca tgtcgtcgac ggacgtggcc 360
ggggcggagt ccgaccaggc gaggcggccc gccgagacgt tcggccagcg cacatccatc 420
taccgtggcg tcaccaggca ccggtggacg gggagatatg aggcgcacct gtgggacaac 480
agctgccgcc gggagggcca aagccgcaaa ggacggcaag tctacctagg aggctatgac 540
aaggaggaga aggcggctag agcttacgac ctcgccgcgc tcaagtactg ggggcctaca 600
accacgacca acttcccggt gtccaactac gagaaggagc tggaggagat gaagtccatg 660
acgcggcagg agttcatcgc gtcgttgcgc aggaagagca gcggcttctc acgaggcgcc 720
tccatctaca gaggagtcac aaggcatcat cagcacggcc ggtggcaggc gaggatcggc 780
agggtggccg gaaacaagga cctgtacttg ggcactttca gtactcagga agaggcggcg 840
gaggcgtacg acatcgctgc gatcaagttc cgcgggctca acgccgtcac caactttgac 900
atgagccgct acgacgtgga gagcatcctc agcagcgacc tccccgtcgg gggcggagct 960
agcggtcgcg cccccgccaa gttcccgttg gactcgctgc agccggggag cgctgccgcc 1020
atgatgctcg ccggggctgc tgccgcttcg caggccacca tgccgccgtc cgagaaggac 1080
tactggtctc tgctcgccct gcactaccag cagcagcagg agcaggagcg gcagttcccg 1140
gcttctgctt acgaggctta cggctccggc ggcgtgaacg tggacttcac gatgggcacc 1200
agtagcggca acaacaacaa caacaccggc agcggcgtca tgtggggcgc caccactggt 1260
gcagtagtag tgggacagca agacagcagc ggcaagcagg gcaacggcta tgccagcaac 1320
attccttatg ctgctgctgc tatggtttct ggatctgctg gctacgaggg ctccaccggc 1380
gacaatggaa cctgggttac tacgactacc agcagcaaca ccggcacggc tccccactac 1440
tacaactatc tcttcgggat ggagtag 1467
<210> 234
<211> 1413
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays IPT
<400> 234
atggcccacc cctccgccgc cgccgccgcc gtatcctcca cggcgcccgc tgcaaaccct 60
agttctggcg cccgcgagga aggaggcgcc cgctctccgc cgtcgccgtc tccgtctcag 120
agggggcggg ccaaggtggt gatcgttatg ggcgccacgg gcgccggcaa gtcgcggctg 180
gccgtcgacc tcgcggccca cttcgccggc gtcgaagtgg tcagcgccga ctccatgcag 240
ctctaccgcg gcctcgacgt cctcaccaac aaggctcccc tccacgagca gaacggtgtt 300
cctcatcatc tacttagcgt gattgatccc tctgtcgagt tcacttgccg tgatttccgc 360
gaccgtgccg tgccgattat acaggaaata gtggaccgcg gtggcctccc tgtggttgtc 420
ggcggcacaa acttctacat ccaggctctc gttagcccat tcctcttgga tgatatggca 480
gaagaaatgc agggctgtac tctgagagat cacatagatg atggtcttac tgatgaagat 540
gaaggcaatg ggtttgaacg cttgaaggag atcgatcctg tggctgcgca gaggatccat 600
ccaaacgacc atagaaaaat caaacgctac ctcgagttgt atgcaaccac gggtgcccta 660
cccagcgatc tgttccaagg agaggccgct aagaaatggg gtcggcctag taactccaga 720
ctcgactgct gtttcctgtg ggtagatgct gatcttcaag tcctggacag ttatgtcaac 780
aaaagggtcg attgcatgat ggatggtggc ctgctggacg aagtatgcag catatatgat 840
gcggatgctg tctataccca ggggctgcgg caggctattg gggttcgtga gtttgacgag 900
tttttcagag catatttacc cagaaaagaa tctggtgagg gttcctgtgc aagcctgtta 960
ggtatgcatg acgatcagct taagagcttg ttggacgaag ctgtttccca gctgaaggca 1020
aacactcgta gactagttcg acgtcaaaga cggagattgc atcggctgag taaagatttt 1080
gggtggaact tgcatcgtgt tgacgcaacc gaagcattct tctgtgccac tgacgactca 1140
tggcaaaaga aagttgtcaa accatgtgtg gatgtcgtaa gaaggttttt gtcggacaat 1200
tccactgttt tgccaagcac aagcgcaagt gacccctctt caagagagct gtggacgcaa 1260
tatgtgtgcg aggcctgcgg caaccgggtg ctgcgaggtg cgcacgagtg ggagcagcac 1320
aggcaagggc gaggccaccg gaagcgagtg cagcgcctga agcagaagag cctgaggcca 1380
tggccatcgc tgctgcccca agaccgcagc tga 1413
<210> 235
<211> 1080
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays Knotted1
<400> 235
atggaggaga tcacccaaca ctttggagtt ggcgcaagca gccacggcca tggccacggc 60
cagcaccacc atcatcacca ccaccaccac ccgtgggcat cctccctcag cgccgtcgta 120
gcgccgctgc cgccgcaacc gccaagcgca ggcctgccgc tgaccctgaa cacggtggcg 180
gccactggga acagcggcgg tagcggcaac ccggtgctgc agcttgccaa cggtggcggc 240
ctcctcgacg catgcgtcaa ggcgaaggag ccctcgtcgt cgtctcccta cgcaggcgac 300
gtcgaggcca tcaaggccaa gatcatctcg cacccacact actactcgct cctcactgcc 360
tacctcgagt gcaacaaggt gggggcacca ccggaggtgt cggcgaggct gacggagata 420
gcgcaggagg tggaggcgcg gcagcgcacg gcgctcggcg gcctggccgc tgcgacggag 480
ccggagctgg accagttcat ggaggcgtac cacgagatgc tggtgaagtt cagggaggag 540
ctgacgaggc cgctgcagga ggcgatggag ttcatgcgaa gggtggagtc gcagctgaac 600
tcgctttcca tctccggaag gtcgctgcgc aacatccttt catctggctc ttctgaggag 660
gatcaagaag gtagcggagg agagaccgag ctccctgaag ttgatgcaca tggtgtggac 720
caagagctga agcaccatct cctgaagaaa tacagtggct atctaagctc gctcaagcaa 780
gaactgtcaa agaagaagaa gaaagggaag ctccccaagg aggctcgcca gcagctcctt 840
agctggtggg atcagcacta caaatggcct tacccctcag agactcagaa ggtggcactg 900
gctgagtcta ccgggcttga cctgaagcag atcaacaact ggttcatcaa ccagcggaag 960
cggcactgga agccatccga ggagatgcac cacctgatga tggacgggta ccacaccacc 1020
aatgccttct acatggacgg ccacttcatc aacgacggcg ggctgtaccg gctcggctag 1080
<210> 236
<211> 936
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays RKD4_1
<400> 236
atgacgggcc tcgacgaggc gctcatgctg ccgttcaccg acatcgatct tgaggccttc 60
gacaacgccg aagagcaaaa gcctcctgtc gaccaaatgg ttatgatgcc gccgacggtt 120
gaacaccccg ccgccgccgg gacgcgagcc ccaatcatca ttgatggtac ggcgaccgtt 180
ggccaaaatg taggtggtgg tgtcgtccac gctcatcaga aggcggccat gacgaccata 240
gaggactcca gctgcttccg acgaggagcc agctgtgtcg acgacgacat ggccgtcgtc 300
attcaccatg tcgagcgtcg tcgtcaagca ggctctaccg ccgtggcgct attgccgccg 360
ccgcagccgt cactgccgcg gccgcgtgca agggcgagcg gcggcgcggg cgagcggtca 420
gctccggcgg ccgccgggaa gacgaggatg gaccacatcg gcttcgacga gctgcgcaag 480
tacttctaca tgcccatcac cagggcggcc agggagatga acgtggggct caccgtgctc 540
aagaagcgct gccgcgagct cggcgtggcg cggtggcctc accggaagat gaagagcctc 600
aagtccctca tggccaacgt acaggaaatg gggaacggca tgtcgccggt ggctgtgcag 660
catgagcttg cggcgctgga gacgtactgc gcgctcatgg aggagaaccc atggatcgag 720
ctcacggacc ggacgaagag gctgcggcag gcctgcttca aggagagcta caagcggagg 780
aaggcggccg caggcaacgc tatcgagacg gatcacattg tctacagctt tggacagcat 840
cgtcgttaca agcagcagct gctgcctccg ccaactgcgg gtagtaccag tgctgacgac 900
cgccatggcc agagcagccg tttcttttgc tactga 936
<210> 237
<211> 1176
<212> DNA
<213> 人工序列
<220>
<223> cDNA of Zea mays RKD4_2
<400> 237
atggcgatgg tgccatgtgg cggtgacgac gcggaatggt gcaatatgat ggaggccatc 60
aaccacctga tgatgtcttc catgtcctcg ccgcacgtcg ccatgggcgc cagcagttgc 120
agggaagagg acgacgacag tttgtacttg cccatgtact actcatctgc gccaccgcca 180
gccgtcgtca gcgatcagta ctgccccgaa caactcccac cgctgcctgc tgccggtgca 240
atgacgggcc tcgacgaggc gctcatgctg ccgttcaccg acatcgatct tgaggccttc 300
gacaacgccg aagagcaaaa gcctcctgtc gaccaaatgg ttatgatgcc gccgacggtt 360
gaacaccccg ccgccgccgg gacgcgagcc ccaatcatca ttgatggtac ggcgaccgtt 420
ggccaaaatg taggtggtgg tgtcgtccac gctcatcaga aggcggccat gacgaccata 480
gaggactcca gctgcttccg acgaggagcc agctgtgtcg acgacgacat ggccgtcgtc 540
attcaccatg tcgagcgtcg tcgtcaagca ggctctaccg ccgtggcgct attgccgccg 600
ccgcagccgt cactgccgcg gccgcgtgca agggcgagcg gcggcgcggg cgagcggtca 660
gctccggcgg ccgccgggaa gacgaggatg gaccacatcg gcttcgacga gctgcgcaag 720
tacttctaca tgcccatcac cagggcggcc agggagatga acgtggggct caccgtgctc 780
aagaagcgct gccgcgagct cggcgtggcg cggtggcctc accggaagat gaagagcctc 840
aagtccctca tggccaacgt acaggaaatg gggaacggca tgtcgccggt ggctgtgcag 900
catgagcttg cggcgctgga gacgtactgc gcgctcatgg aggagaaccc atggatcgag 960
ctcacggacc ggacgaagag gctgcggcag gcctgcttca aggagagcta caagcggagg 1020
aaggcggccg caggcaacgc tatcgagacg gatcacattg tctacagctt tggacagcat 1080
cgtcgttaca agcagcagct gctgcctccg ccaactgcgg gtagtaccag tgctgacgac 1140
cgccatggcc agagcagccg tttcttttgc tactga 1176
<210> 238
<211> 679
<212> PRT
<213> Zea mays
<400> 238
Met Ala Ser Ala Asn Asn Trp Leu Gly Phe Ser Leu Ser Gly Gln Asp
1 5 10 15
Asn Pro Gln Pro Asn Gln Asp Ser Ser Pro Ala Ala Gly Ile Asp Ile
20 25 30
Ser Gly Ala Ser Asp Phe Tyr Gly Leu Pro Thr Gln Gln Gly Ser Asp
35 40 45
Gly His Leu Gly Val Pro Gly Leu Arg Asp Asp His Ala Ser Tyr Gly
50 55 60
Ile Met Glu Ala Tyr Asn Arg Val Pro Gln Glu Thr Gln Asp Trp Asn
65 70 75 80
Met Arg Gly Leu Asp Tyr Asn Gly Gly Gly Ser Glu Leu Ser Met Leu
85 90 95
Val Gly Ser Ser Gly Gly Gly Gly Gly Asn Gly Lys Arg Ala Val Glu
100 105 110
Asp Ser Glu Pro Lys Leu Glu Asp Phe Leu Gly Gly Asn Ser Phe Val
115 120 125
Ser Asp Gln Asp Gln Ser Gly Gly Tyr Leu Phe Ser Gly Val Pro Ile
130 135 140
Ala Ser Ser Ala Asn Ser Asn Ser Gly Ser Asn Thr Met Glu Leu Ser
145 150 155 160
Met Ile Lys Thr Trp Leu Arg Asn Asn Gln Val Ala Gln Pro Gln Pro
165 170 175
Pro Ala Pro His Gln Pro Gln Pro Glu Glu Met Ser Thr Asp Ala Ser
180 185 190
Gly Ser Ser Phe Gly Cys Ser Asp Ser Met Gly Arg Asn Ser Met Val
195 200 205
Ala Ala Gly Gly Ser Ser Gln Ser Leu Ala Leu Ser Met Ser Thr Gly
210 215 220
Ser His Leu Pro Met Val Val Pro Ser Gly Ala Ala Ser Gly Ala Ala
225 230 235 240
Ser Glu Ser Thr Ser Ser Glu Asn Lys Arg Ala Ser Gly Ala Met Asp
245 250 255
Ser Pro Gly Ser Ala Val Glu Ala Val Pro Arg Lys Ser Ile Asp Thr
260 265 270
Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp
275 280 285
Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu
290 295 300
Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys
305 310 315 320
Glu Asp Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp
325 330 335
Gly Thr Thr Thr Thr Thr Asn Phe Pro Ile Ser Asn Tyr Glu Lys Glu
340 345 350
Leu Glu Glu Met Lys His Met Thr Arg Gln Glu Tyr Ile Ala Tyr Leu
355 360 365
Arg Arg Asn Ser Ser Gly Phe Ser Arg Gly Ala Ser Lys Tyr Arg Gly
370 375 380
Val Thr Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile Gly Arg
385 390 395 400
Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr Glu Glu
405 410 415
Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu
420 425 430
Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Lys Ser Ile
435 440 445
Leu Glu Ser Ser Thr Leu Pro Val Gly Gly Ala Ala Arg Arg Leu Lys
450 455 460
Asp Ala Val Asp His Val Glu Ala Gly Ala Thr Ile Trp Arg Ala Asp
465 470 475 480
Met Asp Gly Ala Val Ile Ser Gln Leu Ala Glu Ala Gly Met Gly Gly
485 490 495
Tyr Ala Ser Tyr Gly His His Gly Trp Pro Thr Ile Ala Phe Gln Gln
500 505 510
Pro Ser Pro Leu Ser Val His Tyr Pro Tyr Gly Gln Pro Ser Arg Gly
515 520 525
Trp Cys Lys Pro Glu Gln Asp Ala Ala Ala Ala Ala Ala His Ser Leu
530 535 540
Gln Asp Leu Gln Gln Leu His Leu Gly Ser Ala Ala His Asn Phe Phe
545 550 555 560
Gln Ala Ser Ser Ser Ser Thr Val Tyr Asn Gly Gly Ala Gly Ala Ser
565 570 575
Gly Gly Tyr Gln Gly Leu Gly Gly Gly Ser Ser Phe Leu Met Pro Ser
580 585 590
Ser Thr Val Val Ala Ala Ala Asp Gln Gly His Ser Ser Thr Ala Asn
595 600 605
Gln Gly Ser Thr Cys Ser Tyr Gly Asp Asp His Gln Glu Gly Lys Leu
610 615 620
Ile Gly Tyr Asp Ala Ala Met Val Ala Thr Ala Ala Gly Gly Asp Pro
625 630 635 640
Tyr Ala Ala Ala Arg Asn Gly Tyr Gln Phe Ser Gln Gly Ser Gly Ser
645 650 655
Thr Val Ser Ile Ala Arg Ala Asn Gly Tyr Ala Asn Asn Trp Ser Ser
660 665 670
Pro Phe Asn Asn Gly Met Gly
675
<210> 239
<211> 320
<212> PRT
<213> Zea mays
<400> 239
Met Ala Ala Asn Val Gly Ala Gly Arg Ser Ala Gly Gly Gly Gly Ala
1 5 10 15
Gly Thr Gly Thr Gly Thr Ala Ala Gly Ser Gly Gly Val Ser Thr Ala
20 25 30
Val Cys Arg Pro Ser Gly Ser Arg Trp Thr Pro Thr Pro Glu Gln Ile
35 40 45
Arg Ile Leu Lys Glu Leu Tyr Tyr Gly Cys Gly Ile Arg Ser Pro Asn
50 55 60
Ser Glu Gln Ile Gln Arg Ile Thr Ala Met Leu Arg Gln His Gly Lys
65 70 75 80
Ile Glu Gly Lys Asn Val Phe Tyr Trp Phe Gln Asn His Lys Ala Arg
85 90 95
Glu Arg Gln Lys Arg Arg Leu Thr Asn Leu Asp Val Asn Val Pro Val
100 105 110
Ala Ala Asp Asp Ser Ala His Arg Leu Gly Val Leu Ser Leu Ser Pro
115 120 125
Ser Ser Gly Cys Ser Gly Ala Ala Pro Pro Ser Pro Thr Leu Gly Phe
130 135 140
Tyr Ala Gly Gly Asn Gly Ser Ala Val Met Leu Asp Thr Ser Ser Asp
145 150 155 160
Trp Gly Ser Ala Ala Ala Met Ala Thr Glu Ala Cys Phe Met Gln Asp
165 170 175
Tyr Met Gly Val Met Gly Gly Ala Ser Pro Trp Ala Cys Ser Ser Ser
180 185 190
Ser Ser Glu Asp Pro Met Ala Ala Leu Ala Leu Ala Pro Lys Val Thr
195 200 205
Arg Ala Pro Glu Thr Leu Pro Leu Phe Pro Thr Gly Gly Gly Gly Asp
210 215 220
Asp Arg Gln Pro Pro Arg Pro Arg Gln Ser Val Pro Ala Gly Glu Ala
225 230 235 240
Ile Arg Gly Gly Ser Ser Ser Ser Ser Tyr Leu Pro Phe Trp Gly Ala
245 250 255
Ala Pro Thr Pro Thr Gly Ser Ala Thr Ser Val Ala Ile Gln Gln Gln
260 265 270
His Gln Leu Met Gln Met Gln Glu Gln Tyr Ser Phe Tyr Ser Asn Ala
275 280 285
Gln Leu Leu Pro Gly Thr Gly Ser Gln Asp Ala Ala Ala Thr Ser Leu
290 295 300
Glu Leu Ser Leu Ser Ser Trp Cys Ser Pro Tyr Pro Ala Gly Thr Met
305 310 315 320
<210> 240
<211> 325
<212> PRT
<213> Zea mays
<400> 240
Met Ala Ala Asn Ala Gly Gly Gly Gly Ala Gly Gly Gly Ser Gly Ser
1 5 10 15
Gly Ser Val Ala Ala Pro Ala Val Cys Arg Pro Ser Gly Ser Arg Trp
20 25 30
Thr Pro Thr Pro Glu Gln Ile Arg Met Leu Lys Glu Leu Tyr Tyr Gly
35 40 45
Cys Gly Ile Arg Ser Pro Ser Ser Glu Gln Ile Gln Arg Ile Thr Ala
50 55 60
Met Leu Arg Gln His Gly Lys Ile Glu Gly Lys Asn Val Phe Tyr Trp
65 70 75 80
Phe Gln Asn His Lys Ala Arg Glu Arg Gln Lys Arg Arg Leu Thr Ser
85 90 95
Leu Asp Val Asn Val Pro Ala Ala Gly Ala Ala Asp Ala Thr Thr Ser
100 105 110
Gln Leu Gly Val Leu Ser Leu Ser Ser Pro Pro Ser Gly Ala Ala Pro
115 120 125
Pro Ser Pro Thr Leu Gly Phe Tyr Ala Ala Gly Asn Gly Gly Gly Ser
130 135 140
Ala Gly Leu Leu Asp Thr Ser Ser Asp Trp Gly Ser Ser Gly Ala Ala
145 150 155 160
Met Ala Thr Glu Thr Cys Phe Leu Gln Asp Tyr Met Gly Val Thr Asp
165 170 175
Thr Gly Ser Ser Ser Gln Trp Pro Cys Phe Ser Ser Ser Asp Thr Ile
180 185 190
Met Ala Ala Ala Ala Ala Ala Ala Arg Val Ala Thr Thr Arg Ala Pro
195 200 205
Glu Thr Leu Pro Leu Phe Pro Thr Cys Gly Asp Asp Asp Asp Asp Asp
210 215 220
Ser Gln Pro Pro Pro Arg Pro Arg His Ala Val Pro Val Pro Ala Gly
225 230 235 240
Glu Thr Ile Arg Gly Gly Gly Gly Ser Ser Ser Ser Tyr Leu Pro Phe
245 250 255
Trp Gly Ala Gly Ala Ala Ser Thr Thr Ala Gly Ala Thr Ser Ser Val
260 265 270
Ala Ile Gln Gln Gln His Gln Leu Gln Glu Gln Tyr Ser Phe Tyr Ser
275 280 285
Asn Ser Thr Gln Leu Ala Gly Thr Gly Ser Gln Asp Val Ser Ala Ser
290 295 300
Ala Ala Ala Leu Glu Leu Ser Leu Ser Ser Trp Cys Ser Pro Tyr Pro
305 310 315 320
Ala Ala Gly Ser Met
325
<210> 241
<211> 324
<212> PRT
<213> Zea mays
<400> 241
Met Glu Thr Pro Gln Gln Gln Ser Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10 15
His Gly Gln Asp Asp Gly Gly Ser Pro Pro Met Ser Pro Ala Ser Ala
20 25 30
Ala Ala Ala Ala Leu Ala Asn Ala Arg Trp Asn Pro Thr Lys Glu Gln
35 40 45
Val Ala Val Leu Glu Gly Leu Tyr Glu His Gly Leu Arg Thr Pro Ser
50 55 60
Ala Glu Gln Ile Gln Gln Ile Thr Gly Arg Leu Arg Glu His Gly Ala
65 70 75 80
Ile Glu Gly Lys Asn Val Phe Tyr Trp Phe Gln Asn His Lys Ala Arg
85 90 95
Gln Arg Gln Arg Gln Lys Gln Asp Ser Phe Ala Tyr Phe Ser Arg Leu
100 105 110
Leu Arg Arg Pro Pro Pro Leu Pro Val Leu Ser Met Pro Pro Ala Pro
115 120 125
Pro Tyr His His Ala Arg Val Pro Ala Pro Pro Ala Ile Pro Met Pro
130 135 140
Met Ala Pro Pro Pro Pro Ala Ala Cys Asn Asp Asn Gly Gly Ala Arg
145 150 155 160
Val Ile Tyr Arg Asn Pro Phe Tyr Val Ala Ala Pro Gln Ala Pro Pro
165 170 175
Ala Asn Ala Ala Tyr Tyr Tyr Pro Gln Pro Gln Gln Gln Gln Gln Gln
180 185 190
Gln Val Thr Val Met Tyr Gln Tyr Pro Arg Met Glu Val Ala Gly Gln
195 200 205
Asp Lys Met Met Thr Arg Ala Ala Ala His Gln Gln Gln Gln His Asn
210 215 220
Gly Ala Gly Gln Gln Pro Gly Arg Ala Gly His Pro Ser Arg Glu Thr
225 230 235 240
Leu Gln Leu Phe Pro Leu Gln Pro Thr Phe Val Leu Arg His Asp Lys
245 250 255
Gly Arg Ala Ala Asn Gly Ser Asn Asn Asp Ser Leu Thr Ser Thr Ser
260 265 270
Thr Ala Thr Ala Thr Ala Thr Ala Thr Ala Thr Ala Ser Ala Ser Ile
275 280 285
Ser Glu Asp Ser Asp Gly Leu Glu Ser Gly Ser Ser Gly Lys Gly Val
290 295 300
Glu Glu Ala Pro Ala Leu Pro Phe Tyr Asp Phe Phe Gly Leu Gln Ser
305 310 315 320
Ser Gly Gly Arg
<210> 242
<211> 221
<212> PRT
<213> Zea mays
<400> 242
Met Glu Ala Leu Ser Gly Arg Val Gly Val Lys Cys Gly Arg Trp Asn
1 5 10 15
Pro Thr Ala Glu Gln Val Lys Val Leu Thr Glu Leu Phe Arg Ala Gly
20 25 30
Leu Arg Thr Pro Ser Thr Glu Gln Ile Gln Arg Ile Ser Thr His Leu
35 40 45
Ser Ala Phe Gly Lys Val Glu Ser Lys Asn Val Phe Tyr Trp Phe Gln
50 55 60
Asn His Lys Ala Arg Glu Arg His His His Lys Lys Arg Arg Arg Gly
65 70 75 80
Ala Ser Ser Ser Ser Pro Asp Ser Gly Ser Gly Arg Gly Ser Asn Asn
85 90 95
Glu Glu Asp Gly Arg Gly Ala Ala Ser Gln Ser His Asp Ala Asp Ala
100 105 110
Asp Ala Asp Leu Val Leu Gln Pro Pro Glu Ser Lys Arg Glu Ala Arg
115 120 125
Ser Tyr Gly His His His Arg Leu Val Thr Cys Tyr Val Arg Asp Val
130 135 140
Val Glu Gln Gln Glu Ala Ser Pro Ser Trp Glu Arg Pro Thr Arg Glu
145 150 155 160
Val Glu Thr Leu Glu Leu Phe Pro Leu Lys Ser Tyr Gly Asp Leu Glu
165 170 175
Ala Ala Glu Lys Val Arg Ser Tyr Val Arg Gly Ser Gly Ala Thr Ser
180 185 190
Glu Gln Cys Arg Glu Leu Ser Phe Phe Asp Val Val Ser Ala Gly Arg
195 200 205
Asp Pro Pro Leu Glu Leu Arg Leu Cys Ser Phe Gly Pro
210 215 220
<210> 243
<211> 506
<212> PRT
<213> Zea mays
<400> 243
Met Ala Ser Ser Asn Arg His Trp Pro Ser Met Tyr Arg Ser Ser Leu
1 5 10 15
Ala Cys Asn Phe Gln Gln Pro Gln Pro Gln Pro Asp Met Asn Asn Gly
20 25 30
Gly Lys Ser Ser Leu Met Ser Ser Arg Cys Glu Glu Asn Gly Gly Arg
35 40 45
Asn Pro Glu Pro Arg Pro Arg Trp Asn Pro Arg Pro Glu Gln Ile Arg
50 55 60
Ile Leu Glu Gly Ile Phe Asn Ser Gly Met Val Asn Pro Pro Arg Asp
65 70 75 80
Glu Ile Arg Arg Ile Arg Leu Gln Leu Gln Glu Tyr Gly Pro Val Gly
85 90 95
Asp Ala Asn Val Phe Tyr Trp Phe Gln Asn Arg Lys Ser Arg Thr Lys
100 105 110
His Lys Leu Arg Ala Ala Gly Gln Leu Gln Pro Ser Gly Ser Gly Arg
115 120 125
Ser Ala Leu Gln Ala Arg Ala Cys Ala Pro Ala Pro Val Thr Pro Pro
130 135 140
Arg Asn Leu Gln Leu Ala Ala Ala Ala Pro Val Ala Pro Pro Thr Ser
145 150 155 160
Ser Ser Ser Ser Ser Ser Asp Arg Ser Ser Gly Ser Ser Ser Ser Lys
165 170 175
Ser Val Thr Val Thr Pro Thr Thr Ala Val Ala Leu Ala Ser Pro Ala
180 185 190
Gly Ala Ala Pro Ala Ala Val Phe Arg Gln Gln Gly Val Met Pro Thr
195 200 205
Thr Ala Met Asp Leu Leu Thr Pro Leu Pro Ser Ser Ser Ala Ala Leu
210 215 220
Ala Ala Arg Gln Leu Tyr Tyr Gln Tyr His Ser Gln Ile Met Ala Pro
225 230 235 240
Ala Ala Pro Pro Met Pro Asp Thr Val Ile Ala Ser Pro Glu Gln Phe
245 250 255
Leu Pro Gln Trp Gln Gln Gly Gly Gln Gln His Tyr Tyr Leu Pro Ala
260 265 270
Thr Glu Leu Gly Gly Val Leu Asp Gly His Ser His His Thr His Glu
275 280 285
Pro Pro Ala Ala Ile His Arg Pro Val Ser Leu Ser Pro Ser Val Leu
290 295 300
Phe Gly Leu Cys Asn Glu Ala Leu Arg Gln Asp Tyr Cys Ala Asp Ile
305 310 315 320
Ser Val Val Pro Thr Lys Gly Leu Gly His Gly His Gln Phe Trp Asn
325 330 335
Ser Thr Thr Cys Gly Ser Asp Met Gly Asn Ser Asn Ser Lys Ile Asp
340 345 350
Ala Val Ser Ala Val Ile Arg Asp Asp Glu Lys Ser Arg Leu Gly Leu
355 360 365
Leu His Tyr Tyr Gly Leu Ala Gly Ala Thr Thr Thr Ala Ala Ala Ala
370 375 380
Val Ala Pro Ala Pro Leu Ala Ala Asp Ala Ala Ala Gly Thr Ala Thr
385 390 395 400
Leu Leu Pro Ser Ser Ala Ala Ser Asp Gln Leu Gln Gly Leu Leu Asp
405 410 415
Ala Ala Gly Leu Leu Met Gly Glu Thr Pro Pro Thr Pro Thr Ala Thr
420 425 430
Val Val Ala Val Ala Arg Asp Ala Val Thr Cys Ala Ala Thr Ala Thr
435 440 445
Ala Gln Phe Ser Val Pro Ala Ser Met Arg Leu Asp Val Arg Leu Ala
450 455 460
Phe Gly Glu Ala Ala Leu Leu Ala Arg His Thr Gly Glu Ala Val Pro
465 470 475 480
Val Asp Glu Ser Gly Val Thr Val Glu Pro Leu Gln Gln Asp Thr Leu
485 490 495
Tyr Tyr Val Leu Met Gln Ala Thr Asn Asn
500 505
<210> 244
<211> 273
<212> PRT
<213> Zea mays
<400> 244
Met Glu Trp Val Asp Arg Thr Lys Ala Ser Ala Ala Ala Ala Ala Ala
1 5 10 15
Ala Ala Asp Glu Arg Ala Gly Gly Ala Glu Gly Leu Ala Gly Tyr Val
20 25 30
Lys Val Met Thr Asp Glu Gln Met Glu Val Leu Arg Lys Gln Ile Ser
35 40 45
Ile Tyr Ala Thr Ile Cys Glu Gln Leu Val Glu Met His Arg Ala Leu
50 55 60
Thr Glu His Gln Asp Thr Ile Ala Gly Ile Arg Phe Ser Asn Leu Tyr
65 70 75 80
Cys Asp Pro Gln Ile Ile Pro Gly Gly His Lys Ile Thr Ala Arg Gln
85 90 95
Arg Trp Gln Pro Thr Pro Met Gln Leu Gln Ile Leu Glu Asn Ile Phe
100 105 110
Asp Gln Gly Asn Gly Thr Pro Ser Lys Gln Arg Ile Lys Glu Ile Thr
115 120 125
Ala Glu Leu Ser His His Gly Gln Ile Ser Glu Thr Asn Val Tyr Asn
130 135 140
Trp Phe Gln Asn Arg Arg Ala Arg Ser Lys Arg Lys Gln Ala Ala Ser
145 150 155 160
Leu Pro Asn Asn Ala Glu Ser Glu Ala Glu Val Asp Glu Glu Ser Leu
165 170 175
Thr Asp Lys Lys Pro Lys Ser Asp Arg Ser Leu Gln Asp Asn Lys Ala
180 185 190
Met Gly Ala His Asn Ala Asp Arg Ile Ser Gly Met His His Leu Asp
195 200 205
Thr Asp His Asp Gln Ile Gly Gly Met Met Tyr Gly Cys Asn Asp Asn
210 215 220
Gly Leu Arg Ser Ser Gly Ser Ser Gly Gln Met Ser Phe Tyr Gly Asn
225 230 235 240
Ile Met Pro Asn Pro Arg Ile Asp His Phe Pro Gly Lys Val Glu Ser
245 250 255
Ser Arg Ser Phe Ser His Leu Gln His Gly Glu Gly Phe Asp Met Phe
260 265 270
Gly
<210> 245
<211> 282
<212> PRT
<213> Zea mays
<400> 245
Met Asp Trp Gly Asn Arg Thr Lys Ala Ala Ala Ala Ala Ala Ala Pro
1 5 10 15
Asp Glu Arg Ala Gly Gly Gly Glu Gly Leu Gly Gly Tyr Val Lys Val
20 25 30
Met Thr Asp Glu Gln Met Glu Val Leu Arg Lys Gln Ile Ser Ile Tyr
35 40 45
Ala Thr Ile Cys Glu Gln Leu Val Glu Met His Arg Val Leu Thr Glu
50 55 60
His Gln Asp Thr Ile Ala Gly Leu Arg Phe Ser Asn Leu Tyr Cys Asp
65 70 75 80
Pro Leu Ile Ile Pro Gly Gly His Lys Ile Thr Ala Arg Gln Arg Trp
85 90 95
Gln Pro Thr Pro Met Gln Leu Gln Ile Leu Glu Ser Ile Phe Asp Gln
100 105 110
Gly Asn Gly Thr Pro Ser Lys Gln Lys Ile Lys Glu Ile Thr Ala Glu
115 120 125
Leu Ser Gln His Gly Gln Ile Ser Glu Thr Asn Val Tyr Asn Trp Phe
130 135 140
Gln Asn Arg Arg Ala Arg Ser Lys Arg Lys Gln Ala Ala Ala Ser Leu
145 150 155 160
Pro Asn Asn Ala Glu Ser Glu Ala Glu Ala Asp Glu Glu Pro Leu Ala
165 170 175
Asp Lys Lys Pro Lys Ser Asp Arg Pro Pro Pro Pro Pro Pro Pro Ile
180 185 190
Gln Asp Asn Thr Lys Ala Thr Gly Ala Leu Ser Ala Asp Arg Val Ser
195 200 205
Gly Gly Thr Arg His Leu Asp Thr Gly His Asp Gln Thr Ser Gly Val
210 215 220
Met Tyr Gly Cys Asn Asp Ser Gly Leu Leu Arg Ser Ser Gly Ser Ser
225 230 235 240
Gly Gln Met Ser Leu Tyr Glu Asn Phe Met Ser Asn Pro Arg Ile Asp
245 250 255
Arg Phe Pro Ala Lys Val Glu Ser Ser Arg Ser Phe Pro His Leu Gln
260 265 270
Gln His Gly Glu Gly Phe Gly Met Phe Gly
275 280
<210> 246
<211> 264
<212> PRT
<213> Zea mays
<400> 246
Met Asp Ser Ser Phe Leu Pro Ala Gly Ala Asp Asn Gly Ser Ala Gly
1 5 10 15
Gly Ala Asn Asn Gly Gly Gly Ala Ala Gln Gln Ala Pro Pro Ile Arg
20 25 30
Glu Gln Asp Arg Leu Met Pro Ile Ala Asn Val Ile Arg Ile Met Arg
35 40 45
Arg Val Leu Pro Ala His Ala Lys Ile Ser Asp Asp Ala Lys Glu Thr
50 55 60
Ile Gln Glu Cys Val Ser Glu Tyr Ile Ser Phe Ile Thr Gly Glu Ala
65 70 75 80
Asn Glu Arg Cys Gln Arg Glu Gln Arg Lys Thr Ile Thr Ala Glu Asp
85 90 95
Val Leu Trp Ala Met Ser Arg Leu Gly Phe Asp Asp Tyr Val Glu Pro
100 105 110
Leu Ser Val Tyr Leu His Arg Tyr Arg Glu Phe Glu Gly Glu Ala Arg
115 120 125
Gly Val Gly Leu Ala Pro Ala Pro Pro Arg Gly Asp His His His His
130 135 140
His His Ser Val Pro Pro Ser Met Leu Asn Lys Ser Arg Gly Pro Gly
145 150 155 160
Ser Gly Ala Val Met Leu Pro His His His His His Asp Met His Ala
165 170 175
Ser Met Tyr Gly Gly Ala Val Pro Pro Pro Pro His His Gly Phe Leu
180 185 190
Met Pro His Pro Gln Gly Gly His Tyr Leu Pro Tyr Pro Tyr Glu Pro
195 200 205
Thr Ser Tyr Gly Gly Glu His Ala Leu Ala Ser Gly Tyr Tyr Gly Gly
210 215 220
Ala Ala Tyr Ala Pro Gly Asn Asn Gly Gly Ser Gly Asp Gly Ser Gly
225 230 235 240
Gly Ser Ala Ser His Ala Pro Pro Gly Gly Ser Gly Gly Gly Phe Asp
245 250 255
His Pro His Thr Phe Ala Tyr Lys
260
<210> 247
<211> 392
<212> PRT
<213> Zea mays
<400> 247
Met Pro Ala Arg Ala Ser His Pro Ala Leu Ala Thr Ser Arg Ala Arg
1 5 10 15
Gly Trp Pro Arg Leu Arg Ala Leu Gly Ile Ala Pro Asp Gly Gly Arg
20 25 30
Trp Arg Cys Leu Pro His Phe Ala Pro Ile Ser Glu Pro Ala Arg His
35 40 45
Leu Ser Pro Arg Ala Pro Ala Ser Ala Ser Pro Pro Ala Arg Pro His
50 55 60
Pro Ala Ile Lys Ala Ser Pro Ser Pro Thr Leu Ala Ala Ala Ala Ala
65 70 75 80
Ala Ala Ala Ala Ala Thr Ser Ser Leu Pro Ser Phe Ser Ala Arg Arg
85 90 95
Arg Ser Thr Gly Met Ala Gly Ile Thr Lys Arg Arg Thr Ser Pro Ala
100 105 110
Ser Thr Ser Ser Ser Ser Gly Asp Val Leu Pro Gln Arg Val Thr Arg
115 120 125
Lys Arg Arg Ser Ala Arg Arg Gly Pro Arg Ser Thr Ala Arg Arg Pro
130 135 140
Ser Ala Pro Pro Pro Met Asn Glu Leu Asp Leu Asn Thr Ala Ala Leu
145 150 155 160
Asp Pro Asp His Tyr Ala Thr Gly Leu Arg Val Leu Leu Gln Lys Glu
165 170 175
Leu Arg Asn Ser Asp Val Ser Gln Leu Gly Arg Ile Val Leu Pro Lys
180 185 190
Lys Glu Ala Glu Ser Tyr Leu Pro Ile Leu Met Ala Lys Asp Gly Lys
195 200 205
Ser Leu Cys Met His Asp Leu Leu Asn Ser Gln Leu Trp Thr Phe Lys
210 215 220
Tyr Arg Tyr Trp Phe Asn Asn Lys Ser Arg Met Tyr Val Leu Glu Asn
225 230 235 240
Thr Gly Asp Tyr Val Lys Ala His Asp Leu Gln Gln Gly Asp Phe Ile
245 250 255
Val Ile Tyr Lys Asp Asp Glu Asn Asn Arg Phe Val Ile Gly Ala Lys
260 265 270
Lys Ala Gly Asp Glu Gln Thr Ala Thr Val Pro Gln Val His Glu His
275 280 285
Met His Ile Ser Ala Ala Leu Pro Ala Pro Gln Ala Phe His Asp Tyr
290 295 300
Ala Gly Pro Val Ala Ala Glu Ala Gly Met Leu Ala Ile Val Pro Gln
305 310 315 320
Gly Asp Glu Ile Phe Asp Gly Ile Leu Asn Ser Leu Pro Glu Ile Pro
325 330 335
Val Ala Asn Val Arg Tyr Ser Asp Phe Phe Asp Pro Phe Gly Asp Ser
340 345 350
Met Asp Met Ala Asn Pro Leu Ser Ser Ser Asn Asn Pro Ser Val Asn
355 360 365
Leu Ala Thr His Phe His Asp Glu Arg Ile Gly Ser Cys Ser Phe Pro
370 375 380
Tyr Pro Lys Ser Gly Pro Gln Met
385 390
<210> 248
<211> 341
<212> PRT
<213> Zea mays
<400> 248
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Tyr Asn Thr Ser Ala His
1 5 10 15
Gln Ile Pro Ser Ser Ser Pro Ser Asp Gln Glu Leu Ala Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ser Ala Ser Ser Ser Ser Ser Ser Ser Pro Tyr
35 40 45
His Gly Tyr Ser Ser Ser Pro Ser Met Ser Gln Asp Ser Tyr Met Pro
50 55 60
Thr Pro Ser Tyr Thr Ser Tyr Ala Thr Ser Pro Leu Pro Thr Pro Ala
65 70 75 80
Ala Ala Ser Ser Ser Gln Leu Pro Pro Leu Tyr Ser Ser Pro Tyr Ala
85 90 95
Ala Pro Cys Met Ala Gly Gln Met Gly Leu Asn Gln Leu Gly Pro Ala
100 105 110
Gln Ile Gln Gln Ile Gln Ala Gln Phe Met Phe Gln Gln Gln Gln Gln
115 120 125
Gln Gln Arg Gly Leu His Ala Ala Phe Leu Gly Pro Arg Ala Gln Pro
130 135 140
Met Lys Gln Ser Gly Ser Pro Ser Pro Pro Pro Pro Leu Ala Pro Ala
145 150 155 160
Gln Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp
165 170 175
Val Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly
180 185 190
Thr Phe Asp Thr Ala Glu Asp Ala Ala Leu Ala Tyr Asp Lys Ala Ala
195 200 205
Phe Arg Leu Arg Gly Asp Thr Ala Arg Leu Asn Phe Pro Ala Leu Arg
210 215 220
Arg Gly Gly Ala His Leu Ala Gly Pro Leu His Ala Ser Val Asp Ala
225 230 235 240
Lys Leu Thr Ala Ile Cys Gln Ser Leu Ser Glu Ser Lys Ser Lys Ser
245 250 255
Gly Ser Ser Gly Asp Glu Ser Ala Ala Ser Pro Pro Asp Ser Pro Lys
260 265 270
Cys Ser Ala Ser Thr Thr Glu Gly Glu Gly Glu Glu Glu Ser Gly Ser
275 280 285
Ala Gly Ser Pro Pro Pro Pro Pro Pro Pro Pro Thr Leu Ala Pro Pro
290 295 300
Val Pro Glu Met Ala Lys Leu Asp Phe Thr Glu Ala Pro Trp Asp Glu
305 310 315 320
Thr Glu Ala Phe His Leu Arg Lys Tyr Pro Ser Trp Glu Ile Asp Trp
325 330 335
Asp Ser Ile Leu Ser
340
<210> 249
<211> 316
<212> PRT
<213> Zea mays
<400> 249
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Cys Asn Thr Ser Ala His
1 5 10 15
Leu Ile Ala Ser Ser Ser Pro Ser Asp Gln Glu Leu Ala Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ser Ala Ser Ser Pro Tyr His Arg Tyr Ser Leu
35 40 45
Ala Pro Asp Ser Tyr Met Pro Thr Pro Ser Ser Tyr Thr Thr Ser Pro
50 55 60
Leu Pro Thr Pro Thr Ser Ser Pro Phe Ser Gln Leu Pro Pro Leu Tyr
65 70 75 80
Ser Ser Pro Tyr Ala Ala Ser Thr Ala Ser Gly Val Ala Gly Pro Met
85 90 95
Gly Leu Asn Gln Leu Gly Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln
100 105 110
Leu Met Phe Gln His Gln Gln Gln Arg Gly Leu His Ala Ala Phe Leu
115 120 125
Gly Pro Arg Ala Gln Pro Met Lys Gln Ser Gly Ser Pro Pro Ala Gln
130 135 140
Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
145 150 155 160
Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr
165 170 175
Phe Asp Thr Ala Glu Gly Ala Ala Leu Ala Tyr Asp Glu Ala Ala Phe
180 185 190
Arg Leu Arg Gly Asp Thr Ala Arg Leu Asn Phe Pro Ser Leu Arg Arg
195 200 205
Gly Gly Gly Ala Arg Leu Ala Gly Pro Leu His Ala Ser Val Asp Ala
210 215 220
Lys Leu Thr Ala Ile Cys Gln Ser Leu Ala Gly Ser Lys Asn Ser Ser
225 230 235 240
Ser Ser Asp Glu Ser Ala Ala Ser Leu Pro Asp Ser Pro Lys Cys Ser
245 250 255
Ala Ser Thr Glu Gly Asp Glu Asp Ser Ala Ser Ala Gly Ser Pro Pro
260 265 270
Ser Pro Thr Gln Ala Pro Pro Val Pro Glu Met Ala Lys Leu Asp Phe
275 280 285
Thr Glu Ala Pro Trp Asp Glu Thr Glu Ala Phe His Leu Arg Lys Tyr
290 295 300
Pro Ser Trp Glu Ile Asp Trp Asp Ser Ile Leu Ser
305 310 315
<210> 250
<211> 233
<212> PRT
<213> Zea mays
<400> 250
Met Ala Pro Arg Thr Ser Glu Lys Thr Met Ala Pro Ala Ala Ala Ala
1 5 10 15
Ala Thr Gly Leu Ala Leu Ser Val Gly Gly Gly Gly Gly Ala Gly Gly
20 25 30
Pro His Tyr Arg Gly Val Arg Lys Arg Pro Trp Gly Arg Tyr Ala Ala
35 40 45
Glu Ile Arg Asp Pro Ala Lys Lys Ser Arg Val Trp Leu Gly Thr Tyr
50 55 60
Asp Thr Ala Glu Asp Ala Ala Arg Ala Tyr Asp Ala Ala Ala Arg Glu
65 70 75 80
Tyr Arg Gly Ala Lys Ala Lys Thr Asn Phe Pro Tyr Pro Ser Cys Val
85 90 95
Pro Leu Ser Ala Ala Gly Cys Arg Ser Ser Asn Ser Ser Thr Val Glu
100 105 110
Ser Phe Ser Ser Asp Ala Gln Ala Pro Met Gln Ala Met Pro Leu Pro
115 120 125
Pro Ser Leu Glu Leu Asp Leu Phe His Arg Ala Ala Ala Ala Ala Thr
130 135 140
Gly Thr Gly Ala Ala Ala Val Arg Phe Pro Phe Gly Ser Ile Pro Val
145 150 155 160
Thr His Pro Tyr Tyr Phe Phe Gly Gln Ala Ala Ala Ala Ala Ala Glu
165 170 175
Ala Gly Cys Arg Val Leu Lys Leu Ala Pro Ala Val Thr Val Ala Gln
180 185 190
Ser Asp Ser Asp Cys Ser Ser Val Val Asp Leu Ser Pro Ser Pro Pro
195 200 205
Ala Ala Val Ser Ala Arg Lys Pro Ala Ala Phe Asp Leu Asp Leu Asn
210 215 220
Cys Ser Pro Pro Thr Glu Ala Glu Ala
225 230
<210> 251
<211> 294
<212> PRT
<213> Zea mays
<400> 251
Met Glu Asp Val Ala Asn Ala His Ile Tyr Ala His Ala His Arg Ser
1 5 10 15
Lys Arg Pro Gln Ser Ala Ala Ile Lys Asp Gly Asp Gly Asp Val Asp
20 25 30
Leu Ser Met Lys Gly Ala Arg Tyr Arg Gly Val Arg Arg Arg Pro Trp
35 40 45
Gly Arg Phe Ala Ala Glu Ile Arg Asp Pro Met Ser Lys Glu Arg Arg
50 55 60
Trp Leu Gly Thr Phe Asp Thr Ala Glu Gln Ala Ala Cys Ala Tyr Asp
65 70 75 80
Ile Ala Ala Arg Ala Met Arg Gly Asn Lys Ala Arg Thr Asn Phe Pro
85 90 95
Gly His Ala Thr Ala Gly Tyr Trp Pro Trp Gly Ala Pro Gln Pro Ala
100 105 110
Ala Val Ala His Pro Ile Asn Pro Phe Leu Leu His Asn Leu Ile Met
115 120 125
Ser Ser Ser Asn His Gly Cys Arg Leu Leu Asn His Ala Gly His Gly
130 135 140
His Val His Ser Ala Ala Pro Arg Pro Pro Ala Pro Ala Ala Asp Ala
145 150 155 160
Thr Ser Thr Thr Ile Ala Ala Pro Phe Pro Val Ala Ala His Pro Ala
165 170 175
Val Ala Met Asp Glu Asp Val Asp Asp Trp Asp Gly Val Leu Arg Ser
180 185 190
Glu Pro Ala Asp Ala Gly Leu Leu Gln Asp Ala Leu His Asp Phe Tyr
195 200 205
Pro Phe Thr Arg Pro Arg Ala Gly Gly Gly Arg Arg Gly Leu Ser Ala
210 215 220
Ala Gly Thr Asp Ala Arg Ala Ala Ala Ala Leu Val Ala Pro Val Lys
225 230 235 240
Pro Asp Ala Phe Val Val Pro Ser Pro Phe Ala Gly Val Glu Gly Asp
245 250 255
Gly Glu Tyr Pro Met Met Pro Gln Gly Leu Leu Glu Asp Val Ile His
260 265 270
Ser Pro Ala Phe Val Glu Val Val Ala Ala Pro Pro Ser Val Pro Thr
275 280 285
Arg Arg Gly Arg Arg Gly
290
<210> 252
<211> 709
<212> PRT
<213> Zea mays
<400> 252
Met Ala Thr Val Asn Asn Trp Leu Ala Phe Ser Leu Ser Pro Gln Glu
1 5 10 15
Leu Pro Pro Ser Gln Thr Thr Asp Ser Thr Leu Ile Ser Ala Ala Thr
20 25 30
Ala Asp His Val Ser Gly Asp Val Cys Phe Asn Ile Pro Gln Asp Trp
35 40 45
Ser Met Arg Gly Ser Glu Leu Ser Ala Leu Val Ala Glu Pro Lys Leu
50 55 60
Glu Asp Phe Leu Gly Gly Ile Ser Phe Ser Glu Gln His His Lys Ser
65 70 75 80
Asn Cys Asn Leu Ile Pro Ser Thr Ser Ser Thr Val Cys Tyr Ala Ser
85 90 95
Ser Ala Ala Ser Thr Gly Tyr His His Gln Leu Tyr Gln Pro Thr Ser
100 105 110
Ser Ala Leu His Phe Ala Asp Ser Val Met Val Ala Ser Ser Ala Gly
115 120 125
Val His Asp Gly Gly Ser Met Leu Ser Ala Ala Ala Ala Asn Gly Val
130 135 140
Ala Gly Ala Ala Ser Ala Asn Gly Gly Gly Ile Gly Leu Ser Met Ile
145 150 155 160
Lys Asn Trp Leu Arg Ser Gln Pro Ala Pro Met Gln Pro Arg Ala Ala
165 170 175
Ala Ala Glu Gly Ala Gln Gly Leu Ser Leu Ser Met Asn Met Ala Gly
180 185 190
Thr Thr Gln Gly Ala Ala Gly Met Pro Leu Leu Ala Gly Glu Arg Ala
195 200 205
Arg Ala Pro Glu Ser Val Ser Thr Ser Ala Gln Gly Gly Ala Val Val
210 215 220
Val Thr Ala Pro Lys Glu Asp Ser Gly Gly Ser Gly Val Ala Gly Ala
225 230 235 240
Leu Val Ala Val Ser Thr Asp Thr Gly Gly Ser Gly Gly Ala Ser Ala
245 250 255
Asp Asn Thr Ala Arg Lys Thr Val Asp Thr Phe Gly Gln Arg Thr Ser
260 265 270
Ile Tyr Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala
275 280 285
His Leu Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Thr Arg Lys Gly
290 295 300
Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg
305 310 315 320
Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ala Thr Thr Thr Thr
325 330 335
Asn Phe Pro Val Ser Asn Tyr Glu Lys Glu Leu Glu Asp Met Lys His
340 345 350
Met Thr Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser Gly
355 360 365
Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His Gln
370 375 380
His Gly Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp
385 390 395 400
Leu Tyr Leu Gly Thr Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr
405 410 415
Asp Ile Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe
420 425 430
Asp Met Ser Arg Tyr Asp Val Lys Ser Ile Leu Asp Ser Ser Ala Leu
435 440 445
Pro Ile Gly Ser Ala Ala Lys Arg Leu Lys Glu Ala Glu Ala Ala Ala
450 455 460
Ser Ala Gln His His His Ala Gly Val Val Ser Tyr Asp Val Gly Arg
465 470 475 480
Ile Ala Ser Gln Leu Gly Asp Gly Gly Ala Leu Ala Ala Ala Tyr Gly
485 490 495
Ala His Tyr His Gly Ala Ala Trp Pro Thr Ile Ala Phe Gln Pro Gly
500 505 510
Ala Ala Thr Thr Gly Leu Tyr His Pro Tyr Ala Gln Gln Pro Met Arg
515 520 525
Gly Gly Gly Trp Cys Lys Gln Glu Gln Asp His Ala Val Ile Ala Ala
530 535 540
Ala His Ser Leu Gln Asp Leu His His Leu Asn Leu Gly Ala Ala Gly
545 550 555 560
Ala His Asp Phe Phe Ser Ala Gly Gln Gln Ala Ala Ala Ala Ala Ala
565 570 575
Met His Gly Leu Ala Ser Ile Asp Ser Ala Ser Leu Glu His Ser Thr
580 585 590
Gly Ser Asn Ser Val Val Tyr Asn Gly Gly Val Gly Asp Ser Asn Gly
595 600 605
Ala Ser Ala Val Gly Ser Gly Gly Gly Tyr Met Met Pro Met Ser Ala
610 615 620
Ala Gly Ala Thr Thr Thr Ser Ala Met Val Ser His Glu Gln Met His
625 630 635 640
Ala Arg Ala Tyr Asp Glu Ala Lys Gln Ala Ala Gln Met Gly Tyr Glu
645 650 655
Ser Tyr Leu Val Asn Ala Glu Asn Asn Gly Gly Gly Arg Met Ser Ala
660 665 670
Trp Gly Thr Val Val Ser Ala Ala Ala Ala Ala Ala Ala Ser Ser Asn
675 680 685
Asp Asn Ile Ala Ala Asp Val Gly His Gly Gly Ala Gln Leu Phe Ser
690 695 700
Val Trp Asn Asp Thr
705
<210> 253
<211> 492
<212> PRT
<213> Zea mays
<400> 253
Met Asp Thr Ser His His Tyr His Pro Trp Leu Asn Phe Ser Leu Ala
1 5 10 15
His His Cys Asp Leu Glu Glu Glu Glu Arg Gly Ala Ala Ala Glu Leu
20 25 30
Ala Ala Ile Ala Gly Ala Ala Pro Pro Pro Lys Leu Glu Asp Phe Leu
35 40 45
Gly Gly Gly Val Ala Thr Gly Gly Pro Glu Ala Val Ala Pro Ala Glu
50 55 60
Met Tyr Asp Ser Asp Leu Lys Phe Ile Ala Ala Ala Gly Phe Leu Gly
65 70 75 80
Gly Ser Ala Ala Ala Ala Ala Thr Ser Pro Leu Ser Ser Leu Asp Gln
85 90 95
Ala Gly Ser Lys Leu Ala Leu Pro Ala Ala Ala Ala Ala Pro Ala Pro
100 105 110
Glu Gln Arg Lys Ala Val Asp Ser Phe Gly Gln Arg Thr Ser Ile Tyr
115 120 125
Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu
130 135 140
Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln
145 150 155 160
Val Tyr Leu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr
165 170 175
Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ser Ser Thr Thr Thr Asn Phe
180 185 190
Pro Val Ala Glu Tyr Glu Lys Glu Val Glu Glu Met Lys Asn Met Thr
195 200 205
Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser
210 215 220
Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly
225 230 235 240
Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr
245 250 255
Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile
260 265 270
Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile
275 280 285
Ser Arg Tyr Asn Val Glu Thr Ile Met Ser Ser Asn Leu Pro Val Ala
290 295 300
Ser Met Ser Ser Ser Ala Ala Ala Ala Ala Gly Gly Arg Ser Ser Lys
305 310 315 320
Ala Leu Glu Ser Pro Pro Ser Gly Ser Leu Asp Gly Gly Gly Gly Met
325 330 335
Pro Val Val Glu Ala Ser Thr Ala Pro Pro Leu Phe Ile Pro Val Lys
340 345 350
Tyr Asp Gln Gln Gln Gln Glu Tyr Leu Ser Met Leu Ala Leu Gln Gln
355 360 365
His His Gln Gln Gln Gln Ala Gly Asn Leu Leu Gln Gly Pro Leu Val
370 375 380
Gly Phe Gly Gly Leu Tyr Ser Ser Gly Val Asn Leu Asp Phe Ala Asn
385 390 395 400
Ser His Gly Thr Ala Ala Pro Ser Ser Met Ala His His Cys Tyr Ala
405 410 415
Asn Gly Thr Ala Ser Ala Ser His Glu His Gln His Gln Met Gln Gln
420 425 430
Gly Gly Glu Asn Glu Thr Gln Pro Gln Pro Gln Gln Ser Ser Ser Ser
435 440 445
Cys Ser Ser Leu Pro Phe Ala Thr Pro Val Ala Phe Asn Gly Ser Tyr
450 455 460
Glu Ser Ser Ile Thr Ala Ala Gly Pro Phe Gly Tyr Ser Tyr Pro Asn
465 470 475 480
Val Ala Ala Phe Gln Thr Pro Ile Tyr Gly Met Glu
485 490
<210> 254
<211> 488
<212> PRT
<213> Zea mays
<400> 254
Met Asp Met Asp Met Ser Ser Ala Tyr Pro His His Trp Leu Ser Phe
1 5 10 15
Ser Leu Ser Asn Asn Tyr His His Gly Leu Leu Glu Ala Phe Ser Asn
20 25 30
Ser Ser Gly Thr Pro Leu Gly Asp Glu Gln Gly Ala Val Glu Glu Ser
35 40 45
Pro Arg Thr Val Glu Asp Phe Leu Gly Gly Val Gly Gly Ala Gly Ala
50 55 60
Pro Pro Gln Pro Ala Ala Ala Ala Asp Gln Asp His Gln Leu Val Cys
65 70 75 80
Gly Glu Leu Gly Ser Ile Thr Ala Arg Phe Leu Arg His Tyr Pro Ala
85 90 95
Ala Pro Ala Gly Thr Thr Val Glu Asn Pro Gly Ala Val Thr Val Ala
100 105 110
Ala Met Ser Ser Thr Asp Val Ala Gly Ala Glu Ser Asp Gln Ala Arg
115 120 125
Arg Pro Ala Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val
130 135 140
Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn
145 150 155 160
Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu
165 170 175
Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala
180 185 190
Ala Leu Lys Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Ser
195 200 205
Asn Tyr Glu Lys Glu Leu Glu Glu Met Lys Ser Met Thr Arg Gln Glu
210 215 220
Phe Ile Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala
225 230 235 240
Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln
245 250 255
Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr
260 265 270
Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile
275 280 285
Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr
290 295 300
Asp Val Glu Ser Ile Leu Ser Ser Asp Leu Pro Val Gly Gly Gly Ala
305 310 315 320
Ser Gly Arg Ala Pro Ala Lys Phe Pro Leu Asp Ser Leu Gln Pro Gly
325 330 335
Ser Ala Ala Ala Met Met Leu Ala Gly Ala Ala Ala Ala Ser Gln Ala
340 345 350
Thr Met Pro Pro Ser Glu Lys Asp Tyr Trp Ser Leu Leu Ala Leu His
355 360 365
Tyr Gln Gln Gln Gln Glu Gln Glu Arg Gln Phe Pro Ala Ser Ala Tyr
370 375 380
Glu Ala Tyr Gly Ser Gly Gly Val Asn Val Asp Phe Thr Met Gly Thr
385 390 395 400
Ser Ser Gly Asn Asn Asn Asn Asn Thr Gly Ser Gly Val Met Trp Gly
405 410 415
Ala Thr Thr Gly Ala Val Val Val Gly Gln Gln Asp Ser Ser Gly Lys
420 425 430
Gln Gly Asn Gly Tyr Ala Ser Asn Ile Pro Tyr Ala Ala Ala Ala Met
435 440 445
Val Ser Gly Ser Ala Gly Tyr Glu Gly Ser Thr Gly Asp Asn Gly Thr
450 455 460
Trp Val Thr Thr Thr Thr Ser Ser Asn Thr Gly Thr Ala Pro His Tyr
465 470 475 480
Tyr Asn Tyr Leu Phe Gly Met Glu
485
<210> 255
<211> 470
<212> PRT
<213> Zea mays
<400> 255
Met Ala His Pro Ser Ala Ala Ala Ala Ala Val Ser Ser Thr Ala Pro
1 5 10 15
Ala Ala Asn Pro Ser Ser Gly Ala Arg Glu Glu Gly Gly Ala Arg Ser
20 25 30
Pro Pro Ser Pro Ser Pro Ser Gln Arg Gly Arg Ala Lys Val Val Ile
35 40 45
Val Met Gly Ala Thr Gly Ala Gly Lys Ser Arg Leu Ala Val Asp Leu
50 55 60
Ala Ala His Phe Ala Gly Val Glu Val Val Ser Ala Asp Ser Met Gln
65 70 75 80
Leu Tyr Arg Gly Leu Asp Val Leu Thr Asn Lys Ala Pro Leu His Glu
85 90 95
Gln Asn Gly Val Pro His His Leu Leu Ser Val Ile Asp Pro Ser Val
100 105 110
Glu Phe Thr Cys Arg Asp Phe Arg Asp Arg Ala Val Pro Ile Ile Gln
115 120 125
Glu Ile Val Asp Arg Gly Gly Leu Pro Val Val Val Gly Gly Thr Asn
130 135 140
Phe Tyr Ile Gln Ala Leu Val Ser Pro Phe Leu Leu Asp Asp Met Ala
145 150 155 160
Glu Glu Met Gln Gly Cys Thr Leu Arg Asp His Ile Asp Asp Gly Leu
165 170 175
Thr Asp Glu Asp Glu Gly Asn Gly Phe Glu Arg Leu Lys Glu Ile Asp
180 185 190
Pro Val Ala Ala Gln Arg Ile His Pro Asn Asp His Arg Lys Ile Lys
195 200 205
Arg Tyr Leu Glu Leu Tyr Ala Thr Thr Gly Ala Leu Pro Ser Asp Leu
210 215 220
Phe Gln Gly Glu Ala Ala Lys Lys Trp Gly Arg Pro Ser Asn Ser Arg
225 230 235 240
Leu Asp Cys Cys Phe Leu Trp Val Asp Ala Asp Leu Gln Val Leu Asp
245 250 255
Ser Tyr Val Asn Lys Arg Val Asp Cys Met Met Asp Gly Gly Leu Leu
260 265 270
Asp Glu Val Cys Ser Ile Tyr Asp Ala Asp Ala Val Tyr Thr Gln Gly
275 280 285
Leu Arg Gln Ala Ile Gly Val Arg Glu Phe Asp Glu Phe Phe Arg Ala
290 295 300
Tyr Leu Pro Arg Lys Glu Ser Gly Glu Gly Ser Cys Ala Ser Leu Leu
305 310 315 320
Gly Met His Asp Asp Gln Leu Lys Ser Leu Leu Asp Glu Ala Val Ser
325 330 335
Gln Leu Lys Ala Asn Thr Arg Arg Leu Val Arg Arg Gln Arg Arg Arg
340 345 350
Leu His Arg Leu Ser Lys Asp Phe Gly Trp Asn Leu His Arg Val Asp
355 360 365
Ala Thr Glu Ala Phe Phe Cys Ala Thr Asp Asp Ser Trp Gln Lys Lys
370 375 380
Val Val Lys Pro Cys Val Asp Val Val Arg Arg Phe Leu Ser Asp Asn
385 390 395 400
Ser Thr Val Leu Pro Ser Thr Ser Ala Ser Asp Pro Ser Ser Arg Glu
405 410 415
Leu Trp Thr Gln Tyr Val Cys Glu Ala Cys Gly Asn Arg Val Leu Arg
420 425 430
Gly Ala His Glu Trp Glu Gln His Arg Gln Gly Arg Gly His Arg Lys
435 440 445
Arg Val Gln Arg Leu Lys Gln Lys Ser Leu Arg Pro Trp Pro Ser Leu
450 455 460
Leu Pro Gln Asp Arg Ser
465 470
<210> 256
<211> 359
<212> PRT
<213> Zea mays
<400> 256
Met Glu Glu Ile Thr Gln His Phe Gly Val Gly Ala Ser Ser His Gly
1 5 10 15
His Gly His Gly Gln His His His His His His His His His Pro Trp
20 25 30
Ala Ser Ser Leu Ser Ala Val Val Ala Pro Leu Pro Pro Gln Pro Pro
35 40 45
Ser Ala Gly Leu Pro Leu Thr Leu Asn Thr Val Ala Ala Thr Gly Asn
50 55 60
Ser Gly Gly Ser Gly Asn Pro Val Leu Gln Leu Ala Asn Gly Gly Gly
65 70 75 80
Leu Leu Asp Ala Cys Val Lys Ala Lys Glu Pro Ser Ser Ser Ser Pro
85 90 95
Tyr Ala Gly Asp Val Glu Ala Ile Lys Ala Lys Ile Ile Ser His Pro
100 105 110
His Tyr Tyr Ser Leu Leu Thr Ala Tyr Leu Glu Cys Asn Lys Val Gly
115 120 125
Ala Pro Pro Glu Val Ser Ala Arg Leu Thr Glu Ile Ala Gln Glu Val
130 135 140
Glu Ala Arg Gln Arg Thr Ala Leu Gly Gly Leu Ala Ala Ala Thr Glu
145 150 155 160
Pro Glu Leu Asp Gln Phe Met Glu Ala Tyr His Glu Met Leu Val Lys
165 170 175
Phe Arg Glu Glu Leu Thr Arg Pro Leu Gln Glu Ala Met Glu Phe Met
180 185 190
Arg Arg Val Glu Ser Gln Leu Asn Ser Leu Ser Ile Ser Gly Arg Ser
195 200 205
Leu Arg Asn Ile Leu Ser Ser Gly Ser Ser Glu Glu Asp Gln Glu Gly
210 215 220
Ser Gly Gly Glu Thr Glu Leu Pro Glu Val Asp Ala His Gly Val Asp
225 230 235 240
Gln Glu Leu Lys His His Leu Leu Lys Lys Tyr Ser Gly Tyr Leu Ser
245 250 255
Ser Leu Lys Gln Glu Leu Ser Lys Lys Lys Lys Lys Gly Lys Leu Pro
260 265 270
Lys Glu Ala Arg Gln Gln Leu Leu Ser Trp Trp Asp Gln His Tyr Lys
275 280 285
Trp Pro Tyr Pro Ser Glu Thr Gln Lys Val Ala Leu Ala Glu Ser Thr
290 295 300
Gly Leu Asp Leu Lys Gln Ile Asn Asn Trp Phe Ile Asn Gln Arg Lys
305 310 315 320
Arg His Trp Lys Pro Ser Glu Glu Met His His Leu Met Met Asp Gly
325 330 335
Tyr His Thr Thr Asn Ala Phe Tyr Met Asp Gly His Phe Ile Asn Asp
340 345 350
Gly Gly Leu Tyr Arg Leu Gly
355
<210> 257
<211> 311
<212> PRT
<213> Zea mays
<400> 257
Met Thr Gly Leu Asp Glu Ala Leu Met Leu Pro Phe Thr Asp Ile Asp
1 5 10 15
Leu Glu Ala Phe Asp Asn Ala Glu Glu Gln Lys Pro Pro Val Asp Gln
20 25 30
Met Val Met Met Pro Pro Thr Val Glu His Pro Ala Ala Ala Gly Thr
35 40 45
Arg Ala Pro Ile Ile Ile Asp Gly Thr Ala Thr Val Gly Gln Asn Val
50 55 60
Gly Gly Gly Val Val His Ala His Gln Lys Ala Ala Met Thr Thr Ile
65 70 75 80
Glu Asp Ser Ser Cys Phe Arg Arg Gly Ala Ser Cys Val Asp Asp Asp
85 90 95
Met Ala Val Val Ile His His Val Glu Arg Arg Arg Gln Ala Gly Ser
100 105 110
Thr Ala Val Ala Leu Leu Pro Pro Pro Gln Pro Ser Leu Pro Arg Pro
115 120 125
Arg Ala Arg Ala Ser Gly Gly Ala Gly Glu Arg Ser Ala Pro Ala Ala
130 135 140
Ala Gly Lys Thr Arg Met Asp His Ile Gly Phe Asp Glu Leu Arg Lys
145 150 155 160
Tyr Phe Tyr Met Pro Ile Thr Arg Ala Ala Arg Glu Met Asn Val Gly
165 170 175
Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp
180 185 190
Pro His Arg Lys Met Lys Ser Leu Lys Ser Leu Met Ala Asn Val Gln
195 200 205
Glu Met Gly Asn Gly Met Ser Pro Val Ala Val Gln His Glu Leu Ala
210 215 220
Ala Leu Glu Thr Tyr Cys Ala Leu Met Glu Glu Asn Pro Trp Ile Glu
225 230 235 240
Leu Thr Asp Arg Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Glu Ser
245 250 255
Tyr Lys Arg Arg Lys Ala Ala Ala Gly Asn Ala Ile Glu Thr Asp His
260 265 270
Ile Val Tyr Ser Phe Gly Gln His Arg Arg Tyr Lys Gln Gln Leu Leu
275 280 285
Pro Pro Pro Thr Ala Gly Ser Thr Ser Ala Asp Asp Arg His Gly Gln
290 295 300
Ser Ser Arg Phe Phe Cys Tyr
305 310
<210> 258
<211> 391
<212> PRT
<213> Zea mays
<400> 258
Met Ala Met Val Pro Cys Gly Gly Asp Asp Ala Glu Trp Cys Asn Met
1 5 10 15
Met Glu Ala Ile Asn His Leu Met Met Ser Ser Met Ser Ser Pro His
20 25 30
Val Ala Met Gly Ala Ser Ser Cys Arg Glu Glu Asp Asp Asp Ser Leu
35 40 45
Tyr Leu Pro Met Tyr Tyr Ser Ser Ala Pro Pro Pro Ala Val Val Ser
50 55 60
Asp Gln Tyr Cys Pro Glu Gln Leu Pro Pro Leu Pro Ala Ala Gly Ala
65 70 75 80
Met Thr Gly Leu Asp Glu Ala Leu Met Leu Pro Phe Thr Asp Ile Asp
85 90 95
Leu Glu Ala Phe Asp Asn Ala Glu Glu Gln Lys Pro Pro Val Asp Gln
100 105 110
Met Val Met Met Pro Pro Thr Val Glu His Pro Ala Ala Ala Gly Thr
115 120 125
Arg Ala Pro Ile Ile Ile Asp Gly Thr Ala Thr Val Gly Gln Asn Val
130 135 140
Gly Gly Gly Val Val His Ala His Gln Lys Ala Ala Met Thr Thr Ile
145 150 155 160
Glu Asp Ser Ser Cys Phe Arg Arg Gly Ala Ser Cys Val Asp Asp Asp
165 170 175
Met Ala Val Val Ile His His Val Glu Arg Arg Arg Gln Ala Gly Ser
180 185 190
Thr Ala Val Ala Leu Leu Pro Pro Pro Gln Pro Ser Leu Pro Arg Pro
195 200 205
Arg Ala Arg Ala Ser Gly Gly Ala Gly Glu Arg Ser Ala Pro Ala Ala
210 215 220
Ala Gly Lys Thr Arg Met Asp His Ile Gly Phe Asp Glu Leu Arg Lys
225 230 235 240
Tyr Phe Tyr Met Pro Ile Thr Arg Ala Ala Arg Glu Met Asn Val Gly
245 250 255
Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp
260 265 270
Pro His Arg Lys Met Lys Ser Leu Lys Ser Leu Met Ala Asn Val Gln
275 280 285
Glu Met Gly Asn Gly Met Ser Pro Val Ala Val Gln His Glu Leu Ala
290 295 300
Ala Leu Glu Thr Tyr Cys Ala Leu Met Glu Glu Asn Pro Trp Ile Glu
305 310 315 320
Leu Thr Asp Arg Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Glu Ser
325 330 335
Tyr Lys Arg Arg Lys Ala Ala Ala Gly Asn Ala Ile Glu Thr Asp His
340 345 350
Ile Val Tyr Ser Phe Gly Gln His Arg Arg Tyr Lys Gln Gln Leu Leu
355 360 365
Pro Pro Pro Thr Ala Gly Ser Thr Ser Ala Asp Asp Arg His Gly Gln
370 375 380
Ser Ser Arg Phe Phe Cys Tyr
385 390
<210> 259
<211> 33
<212> DNA
<213> herpes simplex
<400> 259
gacgctttgg acgacttcga cttggacatg ttg 33
<210> 260
<211> 183
<212> DNA
<213> herpes simplex
<400> 260
gaagcctctg gatctggcag agccgatgcc ctggatgatt ttgatctgga tatgctggga 60
agcgacgccc tggatgattt cgatctggat atgctgggat ctgacgccct ggatgatttc 120
gatctggata tgctgggatc tgacgccctg gatgatttcg atctggacat gctgatcaac 180
agc 183
<210> 261
<211> 1569
<212> DNA
<213> 人工序列
<220>
<223> tripartite effector VPR (VP64, p65, and Rta)
<400> 261
gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 60
cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 120
gcccttgatg atttcgacct ggacatgctg attaactcta gaagttccgg atctccgaaa 180
aagaaacgca aagttggtag ccagtacctg cccgacaccg acgaccggca ccggatcgag 240
gaaaagcgga agcggaccta cgagacattc aagagcatca tgaagaagtc ccccttcagc 300
ggccccaccg accctagacc tccacctaga agaatcgccg tgcccagcag atccagcgcc 360
agcgtgccaa aacctgcccc ccagccttac cccttcacca gcagcctgag caccatcaac 420
tacgacgagt tccctaccat ggtgttcccc agcggccaga tctctcaggc ctctgctctg 480
gctccagccc ctcctcaggt gctgcctcag gctcctgctc ctgcaccagc tccagccatg 540
gtgtctgcac tggctcaggc accagcaccc gtgcctgtgc tggctcctgg acctccacag 600
gctgtggctc caccagcccc taaacctaca caggccggcg agggcacact gtctgaagct 660
ctgctgcagc tgcagttcga cgacgaggat ctgggagccc tgctgggaaa cagcaccgat 720
cctgccgtgt tcaccgacct ggccagcgtg gacaacagcg agttccagca gctgctgaac 780
cagggcatcc ctgtggcccc tcacaccacc gagcccatgc tgatggaata ccccgaggcc 840
atcacccggc tcgtgacagg cgctcagagg cctcctgatc cagctcctgc ccctctggga 900
gcaccaggcc tgcctaatgg actgctgtct ggcgacgagg acttcagctc tatcgccgac 960
atggacttct ccgcactgct gggtagcgga tcgggatctc gggattccag ggaagggatg 1020
tttttgccga agcctgaggc cggctccgct attagtgacg tgtttgaggg ccgcgaggtg 1080
tgccagccaa aacgaatccg gccatttcat cctccaggaa gtccatgggc caaccgccca 1140
ctccccgcca gcctcgcacc aacaccaacc ggtccagtac atgagccagt cgggtcactg 1200
accccggcac cagtccctca gccactggat ccagcgcccg cagtgactcc cgaggccagt 1260
cacctgttgg aggatcccga tgaagagacg agccaggctg tcaaagccct tcgggagatg 1320
gccgatactg tgattcccca gaaggaagag gctgcaatct gtggccaaat ggacctttcc 1380
catccgcccc caaggggcca tctggatgag ctgacaacca cacttgagtc catgaccgag 1440
gatctgaacc tggactcacc cctgaccccg gaattgaacg agattctgga taccttcctg 1500
aacgacgagt gcctcttgca tgccatgcat atcagcacag gactgtccat cttcgacaca 1560
tctctgttt 1569
<210> 262
<211> 136
<212> DNA
<213> 人工序列
<220>
<223> SAM Part I (modification to the gRNA adding two ms2 hairpin
extensions)
<400> 262
gttttagagc taggccaaca tgaggatcac ccatgtctgc agggcctagc aagttaaaat 60
aaggctagtc cgttatcaac ttggccaaca tgaggatcac ccatgtctgc agggccaagt 120
ggcaccgagt cggtgc 136
<210> 263
<211> 399
<212> DNA
<213> 人工序列
<220>
<223> MCP domain
<400> 263
gcggccgctg actacaagga tgacgacgat aaatctagaa tggcttctaa ctttactcag 60
ttcgttctcg tcgacaatgg cggaactggc gacgtgactg tcgccccaag caacttcgct 120
aacgggatcg ctgaatggat cagctctaac tcgcgttcac aggcttacaa agtaacctgt 180
agcgttcgtc agagctctgc gcagaatcgc aaatacacca tcaaagtcga ggtgcctaaa 240
ggcgcctggc gttcgtactt aaatatggaa ctaaccattc caattttcgc cacgaattcc 300
gactgcgagc ttattgttaa ggcaatgcaa ggtctcctaa aagatggaaa cccgattccc 360
tcagcaatcg cagcaaactc cggcatctac gaggccagc 399
<210> 264
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> Scaffold Part I (modification to the gRNA)
<400> 264
gggagcacat gaggatcacc catgtgcgac tcccacagtc actggggagt cttccc 56
<210> 265
<211> 353
<212> DNA
<213> 人工序列
<220>
<223> MCP domain
<400> 265
agaatggctt ctaactttac tcagttcgtt ctcgtcgaca atggcggaac tggcgacgtg 60
actgtcgccc caagcaactt cgctaacggg atcgctgaat ggatcagctc taactcgcgt 120
tcacaggctt acaaagtaac ctgtagcgtt cgtcagagct ctgcgcagaa tcgcaaatac 180
accatcaaag tcgaggtgcc taaaggcgcc tggcgttcgt acttaaatat ggaactaacc 240
attccaattt tcgccacgaa ttccgactgc gagcttattg ttaaggcaat gcaaggtctc 300
ctaaaagatg gaaacccgat tccctcagca atcgcagcaa actccggcat cta 353
<210> 266
<211> 705
<212> DNA
<213> 人工序列
<220>
<223> Suntag Part I (10xGCN4_v4)
<400> 266
gaagaacttt tgagcaagaa ttatcatctt gagaacgaag tggctcgtct taagaaaggt 60
tctggcagtg gagaagaact gctttcaaag aattaccacc tggaaaatga ggtagctaga 120
ctgaaaaagg ggagcggaag tggggaggag ttgctgagca aaaattatca tttggagaac 180
gaagtagcac gactaaagaa agggtccgga tcgggtgagg agttactctc gaaaaattat 240
catctcgaaa acgaagtggc tcggctaaaa aagggcagtg gttctggaga agagctatta 300
tctaaaaact accacctcga aaatgaggtg gcacgcttaa aaaagggaag tggcagtggt 360
gaagagctac tatccaagaa ttatcatctt gagaacgagg tagcgcgttt gaagaagggt 420
tccggctcag gagaggaact gctctcgaag aactatcatc ttgaaaatga ggtcgctcga 480
ttaaaaaagg gatcgggcag tggtgaggaa ctactttcaa agaattacca cctcgaaaac 540
gaagtagctc gattaaagaa aggttcaggg tcgggtgaag aattactgag taaaaattat 600
catctggaaa atgaggtagc gagactaaaa aaggggagtg gttctggcga ggaattgcta 660
tcgaaaaatt atcatcttga gaacgaagtt gctaggctca aaaag 705
<210> 267
<211> 831
<212> DNA
<213> 人工序列
<220>
<223> Suntag Part II (ScFv_GCN4)
<400> 267
atgggccccg acatcgtgat gacccagagc cccagcagcc tgagcgccag cgtgggcgac 60
cgcgtgacca tcacctgccg cagcagcacc ggcgccgtga ccaccagcaa ctacgccagc 120
tgggtgcagg agaagcccgg caagctgttc aagggcctga tcggcggcac caacaaccgc 180
gcccccggcg tgcccagccg cttcagcggc agcctgatcg gcgacaaggc caccctgacc 240
atcagcagcc tgcagcccga ggacttcgcc acctacttct gcgccctgtg gtacagcaac 300
cactgggtgt tcggccaggg caccaaggtg gagctgaagc gcggcggcgg cggcagcggc 360
ggcggcggca gcggcggcgg cggcagcagc ggcggcggca gcgaggtgaa gctgctggag 420
agcggcggcg gcctggtgca gcccggcggc agcctgaagc tgagctgcgc cgtgagcggc 480
ttcagcctga ccgactacgg cgtgaactgg gtgcgccagg cccccggccg cggcctggag 540
tggatcggcg tgatctgggg cgacggcatc accgactaca acagcgccct gaaggaccgc 600
ttcatcatca gcaaggacaa cggcaagaac accgtgtacc tgcagatgag caaggtgcgc 660
agcgacgaca ccgccctgta ctactgcgtg accggcctgt tcgactactg gggccagggc 720
accctggtga ccgtgagcag ctacccatac gatgttccag attacgctgg tggaggcgga 780
ggttctgggg gaggaggtag tggcggtggt ggttcaggag gcggcggaag c 831
<210> 268
<211> 1851
<212> DNA
<213> 人工序列
<220>
<223> P300
<400> 268
attttcaaac cagaagaact acgacaggca ctgatgccaa ctttggaggc actttaccgt 60
caggatccag aatcccttcc ctttcgtcaa cctgtggacc ctcagctttt aggaatccct 120
gattactttg atattgtgaa gagccccatg gatctttcta ccattaagag gaagttagac 180
actggacagt atcaggagcc ctggcagtat gtcgatgata tttggcttat gttcaataat 240
gcctggttat ataaccggaa aacatcacgg gtatacaaat actgctccaa gctctctgag 300
gtctttgaac aagaaattga cccagtgatg caaagccttg gatactgttg tggcagaaag 360
ttggagttct ctccacagac actgtgttgc tacggcaaac agttgtgcac aatacctcgt 420
gatgccactt attacagtta ccagaacagg tatcatttct gtgagaagtg tttcaatgag 480
atccaagggg agagcgtttc tttgggggat gacccttccc agcctcaaac tacaataaat 540
aaagaacaat tttccaagag aaaaaatgac acactggatc ctgaactgtt tgttgaatgt 600
acagagtgcg gaagaaagat gcatcagatc tgtgtccttc accatgagat catctggcct 660
gctggattcg tctgtgatgg ctgtttaaag aaaagtgcac gaactaggaa agaaaataag 720
ttttctgcta aaaggttgcc atctaccaga cttggcacct ttctagagaa tcgtgtgaat 780
gactttctga ggcgacagaa tcaccctgag tcaggagagg tcactgttag agtagttcat 840
gcttctgaca aaaccgtgga agtaaaacca ggcatgaaag caaggtttgt ggacagtgga 900
gagatggcag aatcctttcc ataccgaacc aaagccctct ttgcctttga agaaattgat 960
ggtgttgacc tgtgcttctt tggcatgcat gttcaagagt atggctctga ctgccctcca 1020
cccaaccaga ggagagtata catatcttac ctcgatagtg ttcatttctt ccgtcctaaa 1080
tgcttgagga ctgcagtcta tcatgaaatc ctaattggat atttagaata tgtcaagaaa 1140
ttaggttaca caacagggca tatttgggca tgtccaccaa gtgagggaga tgattatatc 1200
ttccattgcc atcctcctga ccagaagata cccaagccca agcgactgca ggaatggtac 1260
aaaaaaatgc ttgacaaggc tgtatcagag cgtattgtcc atgactacaa ggatattttt 1320
aaacaagcta ctgaagatag attaacaagt gcaaaggaat tgccttattt cgagggtgat 1380
ttctggccca atgttctgga agaaagcatt aaggaactgg aacaggagga agaagagaga 1440
aaacgagagg aaaacaccag caatgaaagc acagatgtga ccaagggaga cagcaaaaat 1500
gctaaaaaga agaataataa gaaaaccagc aaaaataaga gcagcctgag taggggcaac 1560
aagaagaaac ccgggatgcc caatgtatct aacgacctct cacagaaact atatgccacc 1620
atggagaagc ataaagaggt cttctttgtg atccgcctca ttgctggccc tgctgccaac 1680
tccctgcctc ccattgttga tcctgatcct ctcatcccct gcgatctgat ggatggtcgg 1740
gatgcgtttc tcacgctggc aagggacaag cacctggagt tctcttcact ccgaagagcc 1800
cagtggtcca ccatgtgcat gctggtggag ctgcacacgc agagccagga c 1851
<210> 269
<211> 384
<212> DNA
<213> 人工序列
<220>
<223> VP160
<400> 269
gacgcgctgg acgatttcga tctcgacatg ctgggttctg atgccctcga tgactttgac 60
ctggatatgt tgggaagcga cgcattggat gactttgatc tggacatgct cggctccgat 120
gctctggacg atttcgatct cgatatgtta gggtcagacg cactggatga tttcgacctt 180
gatatgttgg gaagcgatgc ccttgatgat ttcgacctgg acatgctcgg cagcgacgcc 240
ctggacgatt tcgatctgga catgctgggg tccgatgcct tggatgattt tgacttggat 300
atgctgggga gtgatgccct ggacgacttt gacctggaca tgctgggctc cgatgcgctc 360
gatgacttcg atttggatat gttg 384
<210> 270
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> BBM target sequence
<400> 270
tggagtgtac cagttgtata aatat 25
<210> 271
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> BBM target sequence
<400> 271
tcctcgaatc attctaagaa gaaac 25
<210> 272
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> BBM target sequence
<400> 272
tggccgtgac aacgtatact attat 25
<210> 273
<211> 11414
<212> DNA
<213> 人工序列
<220>
<223> pGEP362 expression plasmid
<400> 273
agcatgaatg cctgggggag aagaactcga gagggaattg cagatcatga ggcagatggc 60
tatttttgtg tcacatatgc gcaaaaagag aggctatatt tgtgtcccta ggttcttcgt 120
tgtattgcag tttccatatc aatctgactt ggtcgcatga gaaattgatg gttaaataat 180
ttgaatctct catgtagtat caactattag atattatttt caccaaatat atttccatcg 240
gagaagaaga ggctacagag gaagcagaag agaggggtgg gagaattttt acacttttgt 300
acacccactt aaacagcaaa atccgtatga aaacaggccc accaaaacaa tgccacgata 360
acaatccgta gaaacaaaag cttcatttaa cagcggcgca acaaagcacg cttatccatg 420
gtagttgtag tccgtatgcg atccaaagat cacgattcac gcgtgacgga cggacgacgc 480
gtgccacacc acaactaacg gcatccatgg tagttgtagt ccgtatgcga tccaaagatc 540
acgattcacg cgtgacggac ggacgacgcg cgccacacca caactaacag cgtgagccag 600
cgtccaaact ccggatggca acggggacga aacccgtcgg gtagtcactg cccaaacccg 660
tccccgcaac cttcatccca aacccgtccc cgtttccggt cgcgggtttc agttttctac 720
cagacccgtc cccatcgggt ttttcatccc cgtcgggaaa tccgaacccg ccagcatttc 780
agcaccaagc caaagttgca gcagcaacat gaataaaaaa caacccgttt caacaccaag 840
ataaaacaaa acattataat ttagacaaca tttcacacgt ataacaataa catatagttc 900
tcacatataa caacaccatt tcacacataa aacaacacca tttgggataa aaatatgggc 960
tatatcaggc catttttatg ggccatattg agttttcgtg ggtttcacag gtaccggatt 1020
tgtagaatgc tgaaccgggt ttgaaccgta aaatccgcgg gtattgaatt tgacccaatc 1080
ccgtcgtccc ctggtggggt aaaaacacca tcttgagtcc aaacggccac caaccaaact 1140
ccgacggcaa caaacaaacg gcgttgcttt gctcctcggt atctccgtga ccgctcaatc 1200
tcccggctgt ttccccggaa ttgcgtggac tctctcatcc acacgcaaac cgcctctccc 1260
tcctctctcg tcctatccgc cccggtgccg tagcctcacg ggactcttct tcctcccttg 1320
ctataaaatc cccgccccct cccgtctcct ctccacacat ccaaactctc aatcgcaccg 1380
agaaaaatct cctagcgatc gaagcgaagc ctctcccgat cctctcaagg tacgcccgtt 1440
tcccgtcgat cctcctcctt ccgttcgtgt tctgtagccg atcgattcga ttcccttaca 1500
cccgttcgtg ttctctcgtg gatcgatcga ttgtttgttg ctagaaggaa ctcgtagatc 1560
tggcgtttat gaactgtgat tcgggttagt ccagatcgat tcaggtcggt cgtcgttgag 1620
cctctcggct atgtctggat tatcgtgtag atctgctggt tcagttgatt atgttcttct 1680
aggagtaatt tcgttgggtc agcgcgattt ctgcttaatc tatgctgctt attgcgcctg 1740
tacctatcta ctaagctatg tgcacctgta attttgctag attattcgtt catcctcgta 1800
gttggtttgt cacagtaatc cgtatgggtt ctgacgatgt tattgttggt catacctagg 1860
cttctccaga ttttattttg ttaaaattgg atagatctgc tactgatagt tgatgatgga 1920
atttggtgct gaatctatgc tatttattgc gcctatacct gatctatcgg gctatgtacg 1980
gctgtagttt actggattat tcgttcatcc tcggtagttg gttcatcgtt tgggttctga 2040
cgataatatt gttgattatg cgtaggcttc tgcagattgt tgttaaaatt ggatacatcg 2100
gttactgatg gttgatgata gatttgtgct gaacctatct gtttattgct cctatacctg 2160
atctataggg ctatgtatgc ctgtaattta ccagattatt cgttcatcct cgtagttggt 2220
tcatctctat aattcgtatg ggttcttatg atgttatcgt tgattatgcc tagtcttata 2280
cagattattg tgtcaagatt gaatatacct gctactgatc ggtgataatt tggttagtag 2340
tttgcaatct gctaggaaca cgttaccact gtaatctgta aacatggttt gccagagtag 2400
tttgttctac tactcttgat atggttgctg attttagtcg cctccttttg gatcatgtat 2460
tgatgtcctt gcagatttcc gtgtacttac cccggctttt gtgtacttcg tgttaacagg 2520
tcgggtaccg aagcaaacat ggcatctagc atggcaccaa agaaaaaaag gaaagtttcc 2580
aaacttgaaa aatttacaaa ctgctactcc ctttccaaga cgcttaggtt taaagcgatc 2640
cccgttggca agacccaaga gaatatcgat aacaaaagac ttctggtcga agatgaaaaa 2700
agggccgaag actacaaggg ggtcaagaag ttgctcgatc gctattatct ttcctttatc 2760
aacgatgtgc ttcattcaat caaactgaag aacttgaata actacattag ccttttcaga 2820
aagaaaacga ggactgaaaa ggagaacaag gaacttgaga atcttgaaat aaaccttcgc 2880
aaagaaattg caaaagcctt caaggggaac gaaggatata aatctctttt caaaaaagac 2940
attatagaaa caattttgcc tgagtttctt gacgacaagg atgaaattgc gctcgtcaat 3000
agctttaacg gatttacaac tgccttcaca gggttcttcg acaataggga gaatatgttt 3060
agcgaggagg caaaaagcac atccatcgca ttcagatgca tcaatgaaaa tcttacccgg 3120
tacatatcga atatggacat atttgaaaaa gtggatgcaa tattcgataa gcacgaagtc 3180
caggagataa aggaaaagat actgaatagc gactatgatg tcgaagattt tttcgaaggt 3240
gagttcttca actttgtcct gactcaagaa ggcattgatg tctataatgc aataattgga 3300
ggttttgtga ctgagtctgg cgagaagata aagggcttga acgagtatat caatctctac 3360
aaccagaaga ctaagcaaaa gttgcctaaa tttaaaccgc tttacaagca agttttgagc 3420
gaccgggaaa gcctttcctt ttacggtgaa ggatacacga gcgatgaaga agtcctcgaa 3480
gtcttccgca acacactcaa caagaactca gaaatctttt cctcaattaa aaaattggag 3540
aagcttttca agaacttcga tgaatactct tcggcgggga tttttgtgaa gaacggcccg 3600
gcaatttcca caatatctaa agacattttc ggagaatgga acgtgataag agacaagtgg 3660
aatgcggagt atgatgacat acacctgaag aagaaggcag ttgtgactga aaaatacgaa 3720
gatgacagga gaaaaagctt taaaaagatc gggtcctttt cactggaaca gctgcaggag 3780
tatgccgacg ccgatctttc ggttgtcgaa aagctcaaag aaataattat ccagaaggtc 3840
gatgaaatct acaaggtgta cggctcaagc gagaagctct ttgatgctga cttcgtgttg 3900
gagaagtctc ttaaaaaaaa cgacgcagtc gtcgcgataa tgaaagattt gctggattca 3960
gtgaaatcct tcgagaatta tatcaaagcc ttcttcggcg aggggaagga gacaaacagg 4020
gatgagtcct tctatggaga cttcgttctg gcttacgaca tccttcttaa ggtcgaccac 4080
atctatgacg caattcggaa ctatgtgacg cagaagccgt attcgaaaga taagttcaag 4140
ctctatttcc aaaaccctca atttatgggt gggtgggata aagacaaaga gaccgattac 4200
cgggcaacaa ttttgcggta cgggtctaaa tattacctcg ctataatgga taagaaatac 4260
gctaaatgtc tccagaaaat tgacaaagat gacgtcaacg gcaattatga aaaaatcaat 4320
tataaactcc ttcctggccc aaataaaatg ctcccgaagg tgtttttttc caaaaagtgg 4380
atggcctatt ataatccatc agaggatatt cagaaaatct ataaaaatgg gacctttaag 4440
aagggtgaca tgtttaacct gaacgattgc cacaagctta tagatttttt caaagactct 4500
attagccgct atcccaaatg gtctaatgct tatgatttca acttctctga aactgaaaag 4560
tacaaagata ttgcaggatt ctaccgcgaa gttgaagaac aaggttataa ggtttccttt 4620
gagtctgcgt ccaagaaaga ggtcgataag ttggtcgaag aagggaaatt gtatatgttt 4680
caaatttaca ataaagactt ttccgacaag tcccatggta cacctaatct gcataccatg 4740
tacttcaaac tgctgttcga tgagaataat cacggtcaga ttcgcctgag cggaggggcg 4800
gaactcttca tgaggagagc atcgttgaaa aaagaggagc tcgtcgtgca tccggctaac 4860
agccccattg ctaacaagaa tccggataat ccaaagaaga ctactaccct ctcctatgac 4920
gtctataagg ataagagatt ctctgaggac cagtacgagt tgcacatccc tattgcgata 4980
aataaatgcc ctaagaacat ctttaaaatc aatactgagg tcagagtcct gcttaagcac 5040
gacgacaacc cgtatgtgat cgggattgat aggggtgaaa ggaacttgct ttatattgtg 5100
gttgtcgatg gaaaaggtaa tatagtggaa caatactctc tgaatgaaat tatcaacaac 5160
ttcaatggca ttaggatcaa gaccgactat cattctctgt tggacaagaa agagaaagag 5220
cgcttcgagg cacggcaaaa ctggacgtct attgagaaca tcaaggagct taaggctggt 5280
tacatttctc aggttgtgca caaaatttgc gaactggtcg agaaatatga tgccgttatc 5340
gcacttgaag atctcaacag cggatttaag aattctcggg tgaaagtcga aaaacaggtg 5400
tatcaaaaat tcgaaaagat gctgatcgac aagctcaatt atatggttga taaaaagagc 5460
aacccatgcg ccacgggggg tgcgcttaag ggctatcaga ttacgaacaa atttgaatcc 5520
ttcaagtcaa tgtcgacgca aaatgggttt atattctata taccggcgtg gcttacatct 5580
aaaatagatc ctagcactgg gttcgtgaac ctgctgaaaa ccaagtacac ttcaatcgca 5640
gattctaaaa aatttataag cagcttcgac agaatcatgt atgtgcccga ggaagacctc 5700
ttcgagtttg cccttgatta caaaaatttc tcaagaacgg atgcagacta cataaagaag 5760
tggaagctgt actcttatgg gaaccggatt cggatattca gaaatccgaa aaaaaacaat 5820
gtctttgatt gggaggaagt ttgtcttacc tctgcttaca aagagctgtt caataaatat 5880
ggcattaatt accagcaagg tgatatccgg gcgctccttt gcgaacagtc tgacaaagct 5940
ttctattctt catttatggc gctcatgtca ttgatgctgc agatgaggaa tagcattacg 6000
gggaggactg atgttgactt tctgatctcg cccgtgaaaa attctgatgg aatcttctac 6060
gattccagga attatgaggc ccaggaaaat gctatccttc ccaagaacgc agacgcaaat 6120
ggcgcgtaca atatagctcg caaggttttg tgggctatag gccaattcaa gaaagccgaa 6180
gacgaaaagc tggacaaagt taagattgct atatctaaca aagagtggct tgagtatgcg 6240
caaacatctg ttaaacacaa acgccccgcg gctacaaaga aggctggcca ggcaaagaag 6300
aagaagtgag tcgaccgatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc 6360
tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat 6420
aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca 6480
attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc 6540
gcgcgcggtg tcatctatgt tactagatcg atcccgggat atcgcggccg cgtcgttcgg 6600
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 6660
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 6720
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 6780
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 6840
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 6900
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 6960
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 7020
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 7080
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 7140
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 7200
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 7260
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 7320
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 7380
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 7440
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 7500
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 7560
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 7620
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 7680
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 7740
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 7800
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 7860
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 7920
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 7980
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 8040
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 8100
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 8160
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 8220
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 8280
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 8340
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 8400
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 8460
cgcacatttc cccgaaaagt gccacctgac gcgccctgta gcggcacgtc taattcgggg 8520
gatctggatt ttagtactgg attttggttt taggaattag aaattttatt gatagaagta 8580
ttttacaaat acaaatacat actaagggtt tcttatatgc tcaacacatg agcgaaaccc 8640
tataggaacc ctaattccct tatctgggaa ctactcacac attattatgg agaaactcga 8700
gcttgtcgat cgacatgatc agggagccct agattatttg tatagttcat ccatgcccat 8760
tacgtcggta aatgccttct gccactcctt gaagttaagt tcggtcttgg aatgtttcaa 8820
ctcagtctta cggaacacgt acatgggttg gttcttaagg tagttagcgg ccattggttt 8880
agcgaatgtg taggtagtcc tggctgtaga gcgatatctc ttgccattgc ctgtggtgta 8940
agaccatttg aaggtactaa tgatggtctt gtcgttaggg taggttttct tggaccggca 9000
ccaatcagcg gcagttaagg agttggtcat gacaggtcca tcagcaggaa agcctgtccc 9060
cttcacttgg gcttctcctt tgatgtggct cccttcgtaa gtgtaacggt agttgacggt 9120
gagcgaagca ccgtcctcaa actgcattgt cctgtggact tggtatccgg agccatcaac 9180
catggctgct tggaatggac tcattccgtc agggtatgga aggtattgat ggaatccgta 9240
gccaatgtgt ggcaccagaa tccatggaga aaactgaaga tcacctttgg tgctcttgag 9300
gttcagctct tcgtatccgt cattagggtt cccagtgcct tgtccgacca tatcgaagtc 9360
aacgccgttg atggaaccga agatgtgaag ctcatgtgtg gctggaagcg aagccatgtt 9420
atcttcttct cctttactca cggaggacgc catggtggcg ggatcgcgcc ctatcgttcg 9480
taaatggtga aaattttcag aaaattgctt ttgctttaaa agaaatgatt taaattgctg 9540
caatagaagt agaatgcttg attgcttgag attcgtttgt tttgtatatg ttgtgttgag 9600
aggatcctct agagtcgacc tgcagaagta acaccaaaca acagggtgag catcgacaaa 9660
agaaacagta ccaagcaaat aaatagcgta tgaaggcagg gctaaaaaaa tccacatata 9720
gctgctgcat atgccatcat ccaagtatat caagatcaaa ataattataa aacatacttg 9780
tttattataa tagataggta ctcaaggtta gagcatatga atagatgctg catatgccat 9840
catgtatatg catcagtaaa acccacatca acatgtatac ctatcctaga tcgatatttc 9900
catccatctt aaactcgtaa ctatgaagat gtatgacaca cacatacagt tccaaaatta 9960
ataaatacac caggtagttt gaaacagtat tctactccga tctagaacga atgaacgacc 10020
gcccaaccac accacatcat cacaaccaag cgaacaaaag catctctgta tatgcatcag 10080
taaaacccgc atcaacatgt atacctatcc tagatcgata tttccatcca tcatcttcaa 10140
ttcgtaacta tgaatatgta tggcacacac atacagatcc aaaattaata aatccaccag 10200
gtagtttgaa acagaattct actccgatct agaacgaccg cccaaccaga ccacatcatc 10260
acaaccaaga caaaaaaaag catgaaaaga tgacccgaca aacaagtgca cggcatatat 10320
tgaaataaag gaaaagggca aaccaaaccc tatgcaacga aacaaaaaaa atcatgaaat 10380
cgatcccgtc tgcggaacgg ctagagccat cccaggattc cccaaagaga aacactggca 10440
agttagcaat cagaacgtgt ctgacgtaca ggtcgcatcc gtgtacgaac gctagcagca 10500
cggatctaac acaaacacgg atctaacaca aacatgaaca gaagtagaac taccgggccc 10560
taaccatgga ccggaacgcc gatctagaga aggtagagag ggggggggag gacgagcggc 10620
gtaccttgaa gcggaggtgc cgacgggtgg atttggggga gatccactag ttctagagcg 10680
gccgccaccg cggtggaatt ctcgaggtcc tctccaaatg aaatgaactt ccttatatag 10740
aggaagggtc ttgcgaagga tagtgggatt gtgcgtcatc ccttacgtca gtggagatat 10800
cacatcaatc cacttgcttt gaagacgtgg ttggaacgtc ttctttttcc acgatgctcc 10860
tcgtgggtgg gggtccatct ttgggaccac tgtcggcaga ggcatcttga acgatagcct 10920
ttcctttatc gcaatgatgg catttgtagg tgccaccttc cttttctact gtccttttga 10980
tcaagtgacc gatagctggg caatggaatc cgaggaggtt tcccgatatt accctttgtt 11040
gaaaagtctc aatagccctt tggtcttctg agactgtatc tttgatattc ttggagtaga 11100
cgagagtgtc gtgctccacc atgttatcac atcaattcac ttgctttgaa gacgtggttg 11160
gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg ggaccactgt 11220
cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat ttgtaggtgc 11280
caccttcctt ttctactgtc cttttgatca agtgacagat agctgggcaa tggaatccga 11340
ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg tcttctgaga 11400
cctgcaggca agca 11414
<210> 274
<211> 11414
<212> DNA
<213> 人工序列
<220>
<223> pGEP487 expression plasmid
<400> 274
aagcaagcat gaatgcctgg gggagaagaa ctcgagaggg aattgcagat catgaggcag 60
atggctattt ttgtgtcaca tatgcgcaaa aagagaggct atatttgtgt ccctaggttc 120
ttcgttgtat tgcagtttcc atatcaatct gacttggtcg catgagaaat tgatggttaa 180
ataatttgaa tctctcatgt agtatcaact attagatatt attttcacca aatatatttc 240
catcggagaa gaagaggcta cagaggaagc agaagagagg ggtgggagaa tttttacact 300
tttgtacacc cacttaaaca gcaaaatccg tatgaaaaca ggcccaccaa aacaatgcca 360
cgataacaat ccgtagaaac aaaagcttca tttaacagcg gcgcaacaaa gcacgcttat 420
ccatggtagt tgtagtccgt atgcgatcca aagatcacga ttcacgcgtg acggacggac 480
gacgcgtgcc acaccacaac taacggcatc catggtagtt gtagtccgta tgcgatccaa 540
agatcacgat tcacgcgtga cggacggacg acgcgcgcca caccacaact aacagcgtga 600
gccagcgtcc aaactccgga tggcaacggg gacgaaaccc gtcgggtagt cactgcccaa 660
acccgtcccc gcaaccttca tcccaaaccc gtccccgttt ccggtcgcgg gtttcagttt 720
tctaccagac ccgtccccat cgggtttttc atccccgtcg ggaaatccga acccgccagc 780
atttcagcac caagccaaag ttgcagcagc aacatgaata aaaaacaacc cgtttcaaca 840
ccaagataaa acaaaacatt ataatttaga caacatttca cacgtataac aataacatat 900
agttctcaca tataacaaca ccatttcaca cataaaacaa caccatttgg gataaaaata 960
tgggctatat caggccattt ttatgggcca tattgagttt tcgtgggttt cacaggtacc 1020
ggatttgtag aatgctgaac cgggtttgaa ccgtaaaatc cgcgggtatt gaatttgacc 1080
caatcccgtc gtcccctggt ggggtaaaaa caccatcttg agtccaaacg gccaccaacc 1140
aaactccgac ggcaacaaac aaacggcgtt gctttgctcc tcggtatctc cgtgaccgct 1200
caatctcccg gctgtttccc cggaattgcg tggactctct catccacacg caaaccgcct 1260
ctccctcctc tctcgtccta tccgccccgg tgccgtagcc tcacgggact cttcttcctc 1320
ccttgctata aaatccccgc cccctcccgt ctcctctcca cacatccaaa ctctcaatcg 1380
caccgagaaa aatctcctag cgatcgaagc gaagcctctc ccgatcctct caaggtacgc 1440
ccgtttcccg tcgatcctcc tccttccgtt cgtgttctgt agccgatcga ttcgattccc 1500
ttacacccgt tcgtgttctc tcgtggatcg atcgattgtt tgttgctaga aggaactcgt 1560
agatctggcg tttatgaact gtgattcggg ttagtccaga tcgattcagg tcggtcgtcg 1620
ttgagcctct cggctatgtc tggattatcg tgtagatctg ctggttcagt tgattatgtt 1680
cttctaggag taatttcgtt gggtcagcgc gatttctgct taatctatgc tgcttattgc 1740
gcctgtacct atctactaag ctatgtgcac ctgtaatttt gctagattat tcgttcatcc 1800
tcgtagttgg tttgtcacag taatccgtat gggttctgac gatgttattg ttggtcatac 1860
ctaggcttct ccagatttta ttttgttaaa attggataga tctgctactg atagttgatg 1920
atggaatttg gtgctgaatc tatgctattt attgcgccta tacctgatct atcgggctat 1980
gtacggctgt agtttactgg attattcgtt catcctcggt agttggttca tcgtttgggt 2040
tctgacgata atattgttga ttatgcgtag gcttctgcag attgttgtta aaattggata 2100
catcggttac tgatggttga tgatagattt gtgctgaacc tatctgttta ttgctcctat 2160
acctgatcta tagggctatg tatgcctgta atttaccaga ttattcgttc atcctcgtag 2220
ttggttcatc tctataattc gtatgggttc ttatgatgtt atcgttgatt atgcctagtc 2280
ttatacagat tattgtgtca agattgaata tacctgctac tgatcggtga taatttggtt 2340
agtagtttgc aatctgctag gaacacgtta ccactgtaat ctgtaaacat ggtttgccag 2400
agtagtttgt tctactactc ttgatatggt tgctgatttt agtcgcctcc ttttggatca 2460
tgtattgatg tccttgcaga tttccgtgta cttaccccgg cttttgtgta cttcgtgtta 2520
acaggtcggg taccgaagca aacatggcat ctagcatggc accaaagaaa aaaaggaaag 2580
tttccaaact tgaaaaattt acaaactgct actccctttc caagacgctt aggtttaaag 2640
cgatccccgt tggcaagacc caagagaata tcgataacaa aagacttctg gtcgaagatg 2700
aaaaaagggc cgaagactac aagggggtca agaagttgct cgatcgctat tatctttcct 2760
ttatcaacga tgtgcttcat tcaatcaaac tgaagaactt gaataactac attagccttt 2820
tcagaaagaa aacgaggact gaaaaggaga acaaggaact tgagaatctt gaaataaacc 2880
ttcgcaaaga aattgcaaaa gccttcaagg ggaacgaagg atataaatct cttttcaaaa 2940
aagacattat agaaacaatt ttgcctgagt ttcttgacga caaggatgaa attgcgctcg 3000
tcaatagctt taacggattt acaactgcct tcacagggtt cttcgacaat agggagaata 3060
tgtttagcga ggaggcaaaa agcacatcca tcgcattcag atgcatcaat gaaaatctta 3120
cccggtacat atcgaatatg gacatatttg aaaaagtgga tgcaatattc gataagcacg 3180
aagtccagga gataaaggaa aagatactga atagcgacta tgatgtcgaa gattttttcg 3240
aaggtgagtt cttcaacttt gtcctgactc aagaaggcat tgatgtctat aatgcaataa 3300
ttggaggttt tgtgactgag tctggcgaga agataaaggg cttgaacgag tatatcaatc 3360
tctacaacca gaagactaag caaaagttgc ctaaatttaa accgctttac aagcaagttt 3420
tgagcgaccg ggaaagcctt tccttttacg gtgaaggata cacgagcgat gaagaagtcc 3480
tcgaagtctt ccgcaacaca ctcaacaaga actcagaaat cttttcctca attaaaaaat 3540
tggagaagct tttcaagaac ttcgatgaat actcttcggc ggggattttt gtgaagaacg 3600
gcccggcaat ttccacaata tctaaagaca ttttcggaga atggaacgtg ataagagaca 3660
agtggaatgc ggagtatgat gacatacacc tgaagaagaa ggcagttgtg actgaaaaat 3720
acgaagatga caggagaaaa agctttaaaa agatcgggtc cttttcactg gaacagctgc 3780
aggagtatgc cgacgccgat ctttcggttg tcgaaaagct caaagaaata attatccaga 3840
aggtcgatga aatctacaag gtgtacggct caagcgagaa gctctttgat gctgacttcg 3900
tgttggagaa gtctcttaaa aaaaacgacg cagtcgtcgc gataatgaaa gatttgctgg 3960
attcagtgaa atccttcgag aattatatca aagccttctt cggcgagggg aaggagacaa 4020
acagggatga gtccttctat ggagacttcg ttctggctta cgacatcctt cttaaggtcg 4080
accacatcta tgacgcaatt cggaactatg tgacgcagaa gccgtattcg aaagataagt 4140
tcaagctcta tttccaaaac cctcaattta tgcgtgggtg ggataaagac aaagagaccg 4200
attaccgggc aacaattttg cggtacgggt ctaaatatta cctcgctata atggataaga 4260
aatacgctaa atgtctccag aaaattgaca aagatgacgt caacggcaat tatgaaaaaa 4320
tcaattataa actccttcct ggcccaaata aaatgctccc gagggtgttt ttttccaaaa 4380
agtggatggc ctattataat ccatcagagg atattcagaa aatctataaa aatgggacct 4440
ttaagaaggg tgacatgttt aacctgaacg attgccacaa gcttatagat tttttcaaag 4500
actctattag ccgctatccc aaatggtcta atgcttatga tttcaacttc tctgaaactg 4560
aaaagtacaa agatattgca ggattctacc gcgaagttga agaacaaggt tataaggttt 4620
cctttgagtc tgcgtccaag aaagaggtcg ataagttggt cgaagaaggg aaattgtata 4680
tgtttcaaat ttacaataaa gacttttccg acaagtccca tggtacacct aatctgcata 4740
ccatgtactt caaactgctg ttcgatgaga ataatcacgg tcagattcgc ctgagcggag 4800
gggcggaact cttcatgagg agagcatcgt tgaaaaaaga ggagctcgtc gtgcatccgg 4860
ctaacagccc cattgctaac aagaatccgg ataatccaaa gaagactact accctctcct 4920
atgacgtcta taaggataag agattctctg aggaccagta cgagttgcac atccctattg 4980
cgataaataa atgccctaag aacatcttta aaatcaatac tgaggtcaga gtcctgctta 5040
agcacgacga caacccgtat gtgatcggga ttgatagggg tgaaaggaac ttgctttata 5100
ttgtggttgt cgatggaaaa ggtaatatag tggaacaata ctctctgaat gaaattatca 5160
acaacttcaa tggcattagg atcaagaccg actatcattc tctgttggac aagaaagaga 5220
aagagcgctt cgaggcacgg caaaactgga cgtctattga gaacatcaag gagcttaagg 5280
ctggttacat ttctcaggtt gtgcacaaaa tttgcgaact ggtcgagaaa tatgatgccg 5340
ttatcgcact tgaagatctc aacagcggat ttaagaattc tcgggtgaaa gtcgaaaaac 5400
aggtgtatca aaaattcgaa aagatgctga tcgacaagct caattatatg gttgataaaa 5460
agagcaaccc atgcgccacg gggggtgcgc ttaagggcta tcagattacg aacaaatttg 5520
aatccttcaa gtcaatgtcg acgcaaaatg ggtttatatt ctatataccg gcgtggctta 5580
catctaaaat agatcctagc actgggttcg tgaacctgct gaaaaccaag tacacttcaa 5640
tcgcagattc taaaaaattt ataagcagct tcgacagaat catgtatgtg cccgaggaag 5700
acctcttcga gtttgccctt gattacaaaa atttctcaag aacggatgca gactacataa 5760
agaagtggaa gctgtactct tatgggaacc ggattcggat attcagaaat ccgaaaaaaa 5820
acaatgtctt tgattgggag gaagtttgtc ttacctctgc ttacaaagag ctgttcaata 5880
aatatggcat taattaccag caaggtgata tccgggcgct cctttgcgaa cagtctgaca 5940
aagctttcta ttcttcattt atggcgctca tgtcattgat gctgcagatg aggaatagca 6000
ttacggggag gactgatgtt gactttctga tctcgcccgt gaaaaattct gatggaatct 6060
tctacgattc caggaattat gaggcccagg aaaatgctat ccttcccaag aacgcagacg 6120
caaatggcgc gtacaatata gctcgcaagg ttttgtgggc tataggccaa ttcaagaaag 6180
ccgaagacga aaagctggac aaagttaaga ttgctatatc taacaaagag tggcttgagt 6240
atgcgcaaac atctgttaaa cacaaacgcc ccgcggctac aaagaaggct ggccaggcca 6300
agaagaagaa gtgagtcgac cgatcgttca aacatttggc aataaagttt cttaagattg 6360
aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta cgttaagcat 6420
gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat gattagagtc 6480
ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa 6540
ttatcgcgcg cggtgtcatc tatgttacta gatcgatccc gggatatcgc ggccgcgtcg 6600
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 6660
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 6720
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 6780
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 6840
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 6900
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 6960
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 7020
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 7080
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 7140
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 7200
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 7260
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 7320
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 7380
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 7440
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 7500
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 7560
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 7620
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 7680
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 7740
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 7800
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 7860
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 7920
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 7980
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 8040
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 8100
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 8160
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 8220
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 8280
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 8340
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 8400
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 8460
ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc acgtctaatt 8520
cgggggatct ggattttagt actggatttt ggttttagga attagaaatt ttattgatag 8580
aagtatttta caaatacaaa tacatactaa gggtttctta tatgctcaac acatgagcga 8640
aaccctatag gaaccctaat tcccttatct gggaactact cacacattat tatggagaaa 8700
ctcgagcttg tcgatcgaca tgatcaggga gctctagatt atttgtatag ttcatccatg 8760
cccattacgt cggtaaatgc cttctgccac tccttgaagt taagttcggt cttggaatgt 8820
ttcaactcag tcttacggaa cacgtacatg ggttggttct taaggtagtt agcggccatt 8880
ggtttagcga atgtgtaggt agtcctggct gtagagcgat atctcttgcc attgcctgtg 8940
gtgtaagacc atttgaaggt actaatgatg gtcttgtcgt tagggtaggt tttcttggac 9000
cggcaccaat cagcggcagt taaggagttg gtcatgacag gtccatcagc aggaaagcct 9060
gtccccttca cttgggcttc tcctttgatg tggctccctt cgtaagtgta acggtagttg 9120
acggtgagcg aagcaccgtc ctcaaactgc attgtcctgt ggacttggta tccggagcca 9180
tcaaccatgg ctgcttggaa tggactcatt ccgtcagggt atggaaggta ttgatggaat 9240
ccgtagccaa tgtgtggcac cagaatccat ggagaaaact gaagatcacc tttggtgctc 9300
ttgaggttca gctcttcgta tccgtcatta gggttcccag tgccttgtcc gaccatatcg 9360
aagtcaacgc cgttgatgga accgaagatg tgaagctcat gtgtggctgg aagcgaagcc 9420
atgttatctt cttctccttt actcacggag gacgccatgg tggcgggatc gcgccctatc 9480
gttcgtaaat ggtgaaaatt ttcagaaaat tgcttttgct ttaaaagaaa tgatttaaat 9540
tgctgcaata gaagtagaat gcttgattgc ttgagattcg tttgttttgt atatgttgtg 9600
ttgagaggat cctcaagctt cgacctgcag aagtaacacc aaacaacagg gtgagcatcg 9660
acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 9720
atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 9780
acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 9840
gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 9900
atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 9960
aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 10020
cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaagcatct ctgtatatgc 10080
atcagtaaaa cccgcatcaa catgtatacc tatcctagat cgatatttcc atccatcatc 10140
ttcaattcgt aactatgaat atgtatggca cacacataca gatccaaaat taataaatcc 10200
accaggtagt ttgaaacaga attctactcc gatctagaac gaccgcccaa ccagaccaca 10260
tcatcacaac caagacaaaa aaaagcatga aaagatgacc cgacaaacaa gtgcacggca 10320
tatattgaaa taaaggaaaa gggcaaacca aaccctatgc aacgaaacaa aaaaaatcat 10380
gaaatcgatc ccgtctgcgg aacggctaga gccatcccag gattccccaa agagaaacac 10440
tggcaagtta gcaatcagaa cgtgtctgac gtacaggtcg catccgtgta cgaacgctag 10500
cagcacggat ctaacacaaa cacggatcta acacaaacat gaacagaagt agaactaccg 10560
ggccctaacc atggaccgga acgccgatct agagaaggta gagagggggg gggaggacga 10620
gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatcc actagttcta 10680
gagcggccgc caccgcggtg gaattctcga ggtcctctcc aaatgaaatg aacttcctta 10740
tatagaggaa gggtcttgcg aaggatagtg ggattgtgcg tcatccctta cgtcagtgga 10800
gatatcacat caatccactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 10860
gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 10920
agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 10980
tttgatcaag tgaccgatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 11040
ttgttgaaaa gtctcaatag ccctttggtc ttctgagact gtatctttga tattcttgga 11100
gtagacgaga gtgtcgtgct ccaccatgtt atcacatcaa ttcacttgct ttgaagacgt 11160
ggttggaacg tcttcttttt ccacgatgct cctcgtgggt gggggtccat ctttgggacc 11220
actgtcggca gaggcatctt gaacgatagc ctttccttta tcgcaatgat ggcatttgta 11280
ggtgccacct tccttttcta ctgtcctttt gatcaagtga cagatagctg ggcaatggaa 11340
tccgaggagg tttcccgata ttaccctttg ttgaaaagtc tcaatagccc tttggtcttc 11400
tgagacctgc aggc 11414
<210> 275
<211> 11414
<212> DNA
<213> 人工序列
<220>
<223> pGEP488 expression plasmid
<400> 275
cgatctttcg gttgtcgaaa agctcaaaga aataattatc cagaaggtcg atgaaatcta 60
caaggtgtac ggctcaagcg agaagctctt tgatgctgac ttcgtgttgg agaagtctct 120
taaaaaaaac gacgcagtcg tcgcgataat gaaagatttg ctggattcag tgaaatcctt 180
cgagaattat atcaaagcct tcttcggcga ggggaaggag acaaacaggg atgagtcctt 240
ctatggagac ttcgttctgg cttacgacat ccttcttaag gtcgaccaca tctatgacgc 300
aattcggaac tatgtgacgc agaagccgta ttcgaaagat aagttcaagc tctatttcca 360
aaaccctcaa tttatgcgtg ggtgggataa agacgtagag accgatcgcc gggcaacaat 420
tttgcggtac gggtctaaat attacctcgc tataatggat aagaaatacg ctaaatgtct 480
ccagaaaatt gacaaagatg acgtcaacgg caattatgaa aaaatcaatt ataaactcct 540
tcctggccca aataaaatgc tcccgaaggt gtttttttcc aaaaagtgga tggcctatta 600
taatccatca gaggatattc agaaaatcta taaaaatggg acctttaaga agggtgacat 660
gtttaacctg aacgattgcc acaagcttat agattttttc aaagactcta ttagccgcta 720
tcccaaatgg tctaatgctt atgatttcaa cttctctgaa actgaaaagt acaaagatat 780
tgcaggattc taccgcgaag ttgaagaaca aggttataag gtttcctttg agtctgcgtc 840
caagaaagag gtcgataagt tggtcgaaga agggaaattg tatatgtttc aaatttacaa 900
taaagacttt tccgacaagt cccatggtac acctaatctg cataccatgt acttcaaact 960
gctgttcgat gagaataatc acggtcagat tcgcctgagc ggaggggcgg aactcttcat 1020
gaggagagca tcgttgaaaa aagaggagct cgtcgtgcat ccggctaaca gccccattgc 1080
taacaagaat ccggataatc caaagaagac tactaccctc tcctatgacg tctataagga 1140
taagagattc tctgaggacc agtacgagtt gcacatccct attgcgataa ataaatgccc 1200
taagaacatc tttaaaatca atactgaggt cagagtcctg cttaagcacg acgacaaccc 1260
gtatgtgatc gggattgata ggggtgaaag gaacttgctt tatattgtgg ttgtcgatgg 1320
aaaaggtaat atagtggaac aatactctct gaatgaaatt atcaacaact tcaatggcat 1380
taggatcaag accgactatc attctctgtt ggacaagaaa gagaaagagc gcttcgaggc 1440
acggcaaaac tggacgtcta ttgagaacat caaggagctt aaggctggtt acatttctca 1500
ggttgtgcac aaaatttgcg aactggtcga gaaatatgat gccgttatcg cacttgaaga 1560
tctcaacagc ggatttaaga attctcgggt gaaagtcgaa aaacaggtgt atcaaaaatt 1620
cgaaaagatg ctgatcgaca agctcaatta tatggttgat aaaaagagca acccatgcgc 1680
cacggggggt gcgcttaagg gctatcagat tacgaacaaa tttgaatcct tcaagtcaat 1740
gtcgacgcaa aatgggttta tattctatat accggcgtgg cttacatcta aaatagatcc 1800
tagcactggg ttcgtgaacc tgctgaaaac caagtacact tcaatcgcag attctaaaaa 1860
atttataagc agcttcgaca gaatcatgta tgtgcccgag gaagacctct tcgagtttgc 1920
ccttgattac aaaaatttct caagaacgga tgcagactac ataaagaagt ggaagctgta 1980
ctcttatggg aaccggattc ggatattcag aaatccgaaa aaaaacaatg tctttgattg 2040
ggaggaagtt tgtcttacct ctgcttacaa agagctgttc aataaatatg gcattaatta 2100
ccagcaaggt gatatccggg cgctcctttg cgaacagtct gacaaagctt tctattcttc 2160
atttatggcg ctcatgtcat tgatgctgca gatgaggaat agcattacgg ggaggactga 2220
tgttgacttt ctgatctcgc ccgtgaaaaa ttctgatgga atcttctacg attccaggaa 2280
ttatgaggcc caggaaaatg ctatccttcc caagaacgca gacgcaaatg gcgcgtacaa 2340
tatagctcgc aaggttttgt gggctatagg ccaattcaag aaagccgaag acgaaaagct 2400
ggacaaagtt aagattgcta tatctaacaa agagtggctt gagtatgcgc aaacatctgt 2460
taaacacaaa cgccccgcgg ctacaaagaa ggctggccag gcaaagaaga agaagtgagt 2520
cgaccgatcg ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc 2580
ttgcgatgat tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt 2640
aatgcatgac gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt 2700
aatacgcgat agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt 2760
catctatgtt actagatcga tcccgggata tcgcggccgc gtcgttcggc tgcggcgagc 2820
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 2880
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 2940
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 3000
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 3060
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 3120
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 3180
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 3240
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 3300
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 3360
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3420
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3480
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3540
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3600
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 3660
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 3720
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 3780
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 3840
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 3900
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 3960
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 4020
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 4080
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 4140
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 4200
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 4260
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 4320
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 4380
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 4440
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 4500
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 4560
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 4620
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 4680
ccgaaaagtg ccacctgacg cgccctgtag cggcacgtct aattcggggg atctggattt 4740
tagtactgga ttttggtttt aggaattaga aattttattg atagaagtat tttacaaata 4800
caaatacata ctaagggttt cttatatgct caacacatga gcgaaaccct ataggaaccc 4860
taattccctt atctgggaac tactcacaca ttattatgga gaaactcgag cttgtcgatc 4920
gacatgatca gggagctcta gattatttgt atagttcatc catgcccatt acgtcggtaa 4980
atgccttctg ccactccttg aagttaagtt cggtcttgga atgtttcaac tcagtcttac 5040
ggaacacgta catgggttgg ttcttaaggt agttagcggc cattggttta gcgaatgtgt 5100
aggtagtcct ggctgtagag cgatatctct tgccattgcc tgtggtgtaa gaccatttga 5160
aggtactaat gatggtcttg tcgttagggt aggttttctt ggaccggcac caatcagcgg 5220
cagttaagga gttggtcatg acaggtccat cagcaggaaa gcctgtcccc ttcacttggg 5280
cttctccttt gatgtggctc ccttcgtaag tgtaacggta gttgacggtg agcgaagcac 5340
cgtcctcaaa ctgcattgtc ctgtggactt ggtatccgga gccatcaacc atggctgctt 5400
ggaatggact cattccgtca gggtatggaa ggtattgatg gaatccgtag ccaatgtgtg 5460
gcaccagaat ccatggagaa aactgaagat cacctttggt gctcttgagg ttcagctctt 5520
cgtatccgtc attagggttc ccagtgcctt gtccgaccat atcgaagtca acgccgttga 5580
tggaaccgaa gatgtgaagc tcatgtgtgg ctggaagcga agccatgtta tcttcttctc 5640
ctttactcac ggaggacgcc atggtggcgg gatcgcgccc tatcgttcgt aaatggtgaa 5700
aattttcaga aaattgcttt tgctttaaaa gaaatgattt aaattgctgc aatagaagta 5760
gaatgcttga ttgcttgaga ttcgtttgtt ttgtatatgt tgtgttgaga ggatcctcaa 5820
gcttcgacct gcagaagtaa caccaaacaa cagggtgagc atcgacaaaa gaaacagtac 5880
caagcaaata aatagcgtat gaaggcaggg ctaaaaaaat ccacatatag ctgctgcata 5940
tgccatcatc caagtatatc aagatcaaaa taattataaa acatacttgt ttattataat 6000
agataggtac tcaaggttag agcatatgaa tagatgctgc atatgccatc atgtatatgc 6060
atcagtaaaa cccacatcaa catgtatacc tatcctagat cgatatttcc atccatctta 6120
aactcgtaac tatgaagatg tatgacacac acatacagtt ccaaaattaa taaatacacc 6180
aggtagtttg aaacagtatt ctactccgat ctagaacgaa tgaacgaccg cccaaccaca 6240
ccacatcatc acaaccaagc gaacaaaagc atctctgtat atgcatcagt aaaacccgca 6300
tcaacatgta tacctatcct agatcgatat ttccatccat catcttcaat tcgtaactat 6360
gaatatgtat ggcacacaca tacagatcca aaattaataa atccaccagg tagtttgaaa 6420
cagaattcta ctccgatcta gaacgaccgc ccaaccagac cacatcatca caaccaagac 6480
aaaaaaaagc atgaaaagat gacccgacaa acaagtgcac ggcatatatt gaaataaagg 6540
aaaagggcaa accaaaccct atgcaacgaa acaaaaaaaa tcatgaaatc gatcccgtct 6600
gcggaacggc tagagccatc ccaggattcc ccaaagagaa acactggcaa gttagcaatc 6660
agaacgtgtc tgacgtacag gtcgcatccg tgtacgaacg ctagcagcac ggatctaaca 6720
caaacacgga tctaacacaa acatgaacag aagtagaact accgggccct aaccatggac 6780
cggaacgccg atctagagaa ggtagagagg gggggggagg acgagcggcg taccttgaag 6840
cggaggtgcc gacgggtgga tttgggggag atccactagt tctagagcgg ccgccaccgc 6900
ggtggaattc tcgaggtcct ctccaaatga aatgaacttc cttatataga ggaagggtct 6960
tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcaatcc 7020
acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg 7080
ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg 7140
caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat caagtgaccg 7200
atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca 7260
atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg 7320
tgctccacca tgttatcaca tcaattcact tgctttgaag acgtggttgg aacgtcttct 7380
ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca 7440
tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt 7500
tctactgtcc ttttgatcaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 7560
gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac ttgcaggcaa 7620
gcaagcatga atgcctgggg gagaagaact cgagagggaa ttgcagatca tgaggcagat 7680
ggctattttt gtgtcacata tgcgcaaaaa gagaggctat atttgtgtcc ctaggttctt 7740
cgttgtattg cagtttccat atcaatctga cttggtcgca tgagaaattg atggttaaat 7800
aatttgaatc tctcatgtag tatcaactat tagatattat tttcaccaaa tatatttcca 7860
tcggagaaga agaggctaca gaggaagcag aagagagggg tgggagaatt tttacacttt 7920
tgtacaccca cttaaacagc aaaatccgta tgaaaacagg cccaccaaaa caatgccacg 7980
ataacaatcc gtagaaacaa aagcttcatt taacagcggc gcaacaaagc acgcttatcc 8040
atggtagttg tagtccgtat gcgatccaaa gatcacgatt cacgcgtgac ggacggacga 8100
cgcgtgccac accacaacta acggcatcca tggtagttgt agtccgtatg cgatccaaag 8160
atcacgattc acgcgtgacg gacggacgac gcgcgccaca ccacaactaa cagcgtgagc 8220
cagcgtccaa actccggatg gcaacgggga cgaaacccgt cgggtagtca ctgcccaaac 8280
ccgtccccgc aaccttcatc ccaaacccgt ccccgtttcc ggtcgcgggt ttcagttttc 8340
taccagaccc gtccccatcg ggtttttcat ccccgtcggg aaatccgaac ccgccagcat 8400
ttcagcacca agccaaagtt gcagcagcaa catgaataaa aaacaacccg tttcaacacc 8460
aagataaaac aaaacattat aatttagaca acatttcaca cgtataacaa taacatatag 8520
ttctcacata taacaacacc atttcacaca taaaacaaca ccatttggga taaaaatatg 8580
ggctatatca ggccattttt atgggccata ttgagttttc gtgggtttca caggtaccgg 8640
atttgtagaa tgctgaaccg ggtttgaacc gtaaaatccg cgggtattga atttgaccca 8700
atcccgtcgt cccctggtgg ggtaaaaaca ccatcttgag tccaaacggc caccaaccaa 8760
actccgacgg caacaaacaa acggcgttgc tttgctcctc ggtatctccg tgaccgctca 8820
atctcccggc tgtttccccg gaattgcgtg gactctctca tccacacgca aaccgcctct 8880
ccctcctctc tcgtcctatc cgccccggtg ccgtagcctc acgggactct tcttcctccc 8940
ttgctataaa atccccgccc cctcccgtct cctctccaca catccaaact ctcaatcgca 9000
ccgagaaaaa tctcctagcg atcgaagcga agcctctccc gatcctctca aggtacgccc 9060
gtttcccgtc gatcctcctc cttccgttcg tgttctgtag ccgatcgatt cgattccctt 9120
acacccgttc gtgttctctc gtggatcgat cgattgtttg ttgctagaag gaactcgtag 9180
atctggcgtt tatgaactgt gattcgggtt agtccagatc gattcaggtc ggtcgtcgtt 9240
gagcctctcg gctatgtctg gattatcgtg tagatctgct ggttcagttg attatgttct 9300
tctaggagta atttcgttgg gtcagcgcga tttctgctta atctatgctg cttattgcgc 9360
ctgtacctat ctactaagct atgtgcacct gtaattttgc tagattattc gttcatcctc 9420
gtagttggtt tgtcacagta atccgtatgg gttctgacga tgttattgtt ggtcatacct 9480
aggcttctcc agattttatt ttgttaaaat tggatagatc tgctactgat agttgatgat 9540
ggaatttggt gctgaatcta tgctatttat tgcgcctata cctgatctat cgggctatgt 9600
acggctgtag tttactggat tattcgttca tcctcggtag ttggttcatc gtttgggttc 9660
tgacgataat attgttgatt atgcgtaggc ttctgcagat tgttgttaaa attggataca 9720
tcggttactg atggttgatg atagatttgt gctgaaccta tctgtttatt gctcctatac 9780
ctgatctata gggctatgta tgcctgtaat ttaccagatt attcgttcat cctcgtagtt 9840
ggttcatctc tataattcgt atgggttctt atgatgttat cgttgattat gcctagtctt 9900
atacagatta ttgtgtcaag attgaatata cctgctactg atcggtgata atttggttag 9960
tagtttgcaa tctgctagga acacgttacc actgtaatct gtaaacatgg tttgccagag 10020
tagtttgttc tactactctt gatatggttg ctgattttag tcgcctcctt ttggatcatg 10080
tattgatgtc cttgcagatt tccgtgtact taccccggct tttgtgtact tcgtgttaac 10140
aggtcgggta ccgaagcaaa catggcatct agcatggcac caaagaaaaa aaggaaagtt 10200
tccaaacttg aaaaatttac aaactgctac tccctttcca agacgcttag gtttaaagcg 10260
atccccgttg gcaagaccca agagaatatc gataacaaaa gacttctggt cgaagatgaa 10320
aaaagggccg aagactacaa gggggtcaag aagttgctcg atcgctatta tctttccttt 10380
atcaacgatg tgcttcattc aatcaaactg aagaacttga ataactacat tagccttttc 10440
agaaagaaaa cgaggactga aaaggagaac aaggaacttg agaatcttga aataaacctt 10500
cgcaaagaaa ttgcaaaagc cttcaagggg aacgaaggat ataaatctct tttcaaaaaa 10560
gacattatag aaacaatttt gcctgagttt cttgacgaca aggatgaaat tgcgctcgtc 10620
aatagcttta acggatttac aactgccttc acagggttct tcgacaatag ggagaatatg 10680
tttagcgagg aggcaaaaag cacatccatc gcattcagat gcatcaatga aaatcttacc 10740
cggtacatat cgaatatgga catatttgaa aaagtggatg caatattcga taagcacgaa 10800
gtccaggaga taaaggaaaa gatactgaat agcgactatg atgtcgaaga ttttttcgaa 10860
ggtgagttct tcaactttgt cctgactcaa gaaggcattg atgtctataa tgcaataatt 10920
ggaggttttg tgactgagtc tggcgagaag ataaagggct tgaacgagta tatcaatctc 10980
tacaaccaga agactaagca aaagttgcct aaatttaaac cgctttacaa gcaagttttg 11040
agcgaccggg aaagcctttc cttttacggt gaaggataca cgagcgatga agaagtcctc 11100
gaagtcttcc gcaacacact caacaagaac tcagaaatct tttcctcaat taaaaaattg 11160
gagaagcttt tcaagaactt cgatgaatac tcttcggcgg ggatttttgt gaagaacggc 11220
ccggcaattt ccacaatatc taaagacatt ttcggagaat ggaacgtgat aagagacaag 11280
tggaatgcgg agtatgatga catacacctg aagaagaagg cagttgtgac tgaaaaatac 11340
gaagatgaca ggagaaaaag ctttaaaaag atcgggtcct tttcactgga acagctgcag 11400
gagtatgccg acgc 11414
<210> 276
<211> 1572
<212> DNA
<213> 人工序列
<220>
<223> VPR transcriptional activation domain
<400> 276
gacgccctgg acgacttcga cctcgacatg ctgggctccg acgccctcga tgatttcgac 60
ctcgatatgc tcggcagcga cgcgctcgat gacttcgacc tcgatatgct ggggagcgac 120
gccctcgacg attttgacct cgatatgctg atcaactccc gctccagcgg cagcccgaag 180
aagaagcgca aagtgggctc gcagtacctg cccgacaccg acgacaggca caggatcgag 240
gagaagcgca agaggacgta cgagaccttc aagtccatca tgaagaagtc cccgttcagc 300
ggcccaacgg acccccgccc gccgccgagg aggatcgccg tgccgtccag gtccagcgcg 360
tcggtcccca agccggcccc gcagccctac ccgttcacgt ccagcctcag caccatcaac 420
tacgacgagt tccccaccat ggtgttcccg tccggccaga tctcccaggc cagcgcgctg 480
gcccccgcgc ccccgcaggt gctgccccag gctccggccc ccgctccggc cccggccatg 540
gtctccgcgc tggcccaggc gcccgccccg gtgcccgtcc tcgcgccggg cccgccgcag 600
gcggtcgccc cgccagcgcc gaagcccacg caggccggcg agggcaccct cagcgaggcg 660
ctcctgcagc tgcagttcga cgacgaggac ctcggcgccc tcctgggcaa ctcgaccgac 720
cccgccgtgt tcaccgacct ggcctccgtc gacaacagcg agttccagca gctgctgaac 780
cagggcatcc cggtggcgcc gcacaccacg gagcccatgc tgatggagta cccggaggcg 840
atcacgcgcc tcgtcaccgg cgcccagagg cccccggacc ccgccccggc cccgctcggc 900
gccccaggcc tgccgaacgg cctcctgagc ggcgacgagg acttctccag catcgcggac 960
atggacttct ccgccctcct ggggtcgggc tcgggcagcc gcgacagcag ggagggcatg 1020
ttcctcccaa agcccgaggc cggctccgcc atctcggacg tgttcgaggg cagggaggtc 1080
tgccagccaa agcgcatcag gccgttccac ccgccgggct ccccgtgggc gaaccggccg 1140
ctccccgcca gcctggctcc aaccccgacc ggccccgtgc acgagccggt cggcagcctg 1200
acgcccgcgc cggtgcccca gccgctcgac cccgcgccgg ccgtcacccc cgaggcctcc 1260
cacctcctgg aggaccccga cgaggagacc tcgcaggccg tgaaggccct gagggagatg 1320
gccgacaccg tcatccccca gaaggaggag gcggccatct gcggccagat ggacctgtcg 1380
cacccgccgc cgcgcggcca cctcgacgag ctgaccacga ccctcgagtc catgaccgag 1440
gacctcaacc tggacagccc cctcacgccg gagctgaacg agatcctcga caccttcctg 1500
aacgacgagt gcctcctgca cgccatgcac atctccacgg gcctgagcat cttcgacacc 1560
agcctcttct ga 1572
<210> 277
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 5xGS linker sequence
<400> 277
ggctcggggt cggggtcggg ctcgggctcg 30
<210> 278
<211> 4570
<212> DNA
<213> 人工序列
<220>
<223> pKWS20 plasmid
<400> 278
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgcggctaca aagaaggctg 420
gccaggccaa gaagaagaag ggctcggggt cggggtcggg ctcgggctcg gacgccctgg 480
acgacttcga cctcgacatg ctgggctccg acgccctcga tgatttcgac ctcgatatgc 540
tcggcagcga cgcgctcgat gacttcgacc tcgatatgct ggggagcgac gccctcgacg 600
attttgacct cgatatgctg atcaactccc gctccagcgg cagcccgaag aagaagcgca 660
aagtgggctc gcagtacctg cccgacaccg acgacaggca caggatcgag gagaagcgca 720
agaggacgta cgagaccttc aagtccatca tgaagaagtc cccgttcagc ggcccaacgg 780
acccccgccc gccgccgagg aggatcgccg tgccgtccag gtccagcgcg tcggtcccca 840
agccggcccc gcagccctac ccgttcacgt ccagcctcag caccatcaac tacgacgagt 900
tccccaccat ggtgttcccg tccggccaga tctcccaggc cagcgcgctg gcccccgcgc 960
ccccgcaggt gctgccccag gctccggccc ccgctccggc cccggccatg gtctccgcgc 1020
tggcccaggc gcccgccccg gtgcccgtcc tcgcgccggg cccgccgcag gcggtcgccc 1080
cgccagcgcc gaagcccacg caggccggcg agggcaccct cagcgaggcg ctcctgcagc 1140
tgcagttcga cgacgaggac ctcggcgccc tcctgggcaa ctcgaccgac cccgccgtgt 1200
tcaccgacct ggcctccgtc gacaacagcg agttccagca gctgctgaac cagggcatcc 1260
cggtggcgcc gcacaccacg gagcccatgc tgatggagta cccggaggcg atcacgcgcc 1320
tcgtcaccgg cgcccagagg cccccggacc ccgccccggc cccgctcggc gccccaggcc 1380
tgccgaacgg cctcctgagc ggcgacgagg acttctccag catcgcggac atggacttct 1440
ccgccctcct ggggtcgggc tcgggcagcc gcgacagcag ggagggcatg ttcctcccaa 1500
agcccgaggc cggctccgcc atctcggacg tgttcgaggg cagggaggtc tgccagccaa 1560
agcgcatcag gccgttccac ccgccgggct ccccgtgggc gaaccggccg ctccccgcca 1620
gcctggctcc aaccccgacc ggccccgtgc acgagccggt cggcagcctg acgcccgcgc 1680
cggtgcccca gccgctcgac cccgcgccgg ccgtcacccc cgaggcctcc cacctcctgg 1740
aggaccccga cgaggagacc tcgcaggccg tgaaggccct gagggagatg gccgacaccg 1800
tcatccccca gaaggaggag gcggccatct gcggccagat ggacctgtcg cacccgccgc 1860
cgcgcggcca cctcgacgag ctgaccacga ccctcgagtc catgaccgag gacctcaacc 1920
tggacagccc cctcacgccg gagctgaacg agatcctcga caccttcctg aacgacgagt 1980
gcctcctgca cgccatgcac atctccacgg gcctgagcat cttcgacacc agcctcttct 2040
gagtcgaccg atcgttcaaa catttggcaa taaagtttct taagattgaa tcctgttgcc 2100
ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt aataattaac 2160
atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc gcaattatac 2220
atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt atcgcgcgcg 2280
gtgtcatcta tgttactaga tcgatcccgg gatatcgcgg ccgcgtcgtt aagcttggcg 2340
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 2400
atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 2460
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 2520
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 2580
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 2640
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 2700
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 2760
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 2820
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 2880
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 2940
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 3000
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 3060
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3120
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3180
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3240
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3300
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3360
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 3420
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 3480
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 3540
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 3600
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 3660
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 3720
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 3780
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 3840
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 3900
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 3960
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 4020
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 4080
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 4140
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 4200
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 4260
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 4320
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 4380
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 4440
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 4500
gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 4560
ccctttcgtc 4570
<210> 279
<211> 13012
<212> DNA
<213> 人工序列
<220>
<223> pGEP754 expression plasmid
<400> 279
agcatgaatg cctgggggag aagaactcga gagggaattg cagatcatga ggcagatggc 60
tatttttgtg tcacatatgc gcaaaaagag aggctatatt tgtgtcccta ggttcttcgt 120
tgtattgcag tttccatatc aatctgactt ggtcgcatga gaaattgatg gttaaataat 180
ttgaatctct catgtagtat caactattag atattatttt caccaaatat atttccatcg 240
gagaagaaga ggctacagag gaagcagaag agaggggtgg gagaattttt acacttttgt 300
acacccactt aaacagcaaa atccgtatga aaacaggccc accaaaacaa tgccacgata 360
acaatccgta gaaacaaaag cttcatttaa cagcggcgca acaaagcacg cttatccatg 420
gtagttgtag tccgtatgcg atccaaagat cacgattcac gcgtgacgga cggacgacgc 480
gtgccacacc acaactaacg gcatccatgg tagttgtagt ccgtatgcga tccaaagatc 540
acgattcacg cgtgacggac ggacgacgcg cgccacacca caactaacag cgtgagccag 600
cgtccaaact ccggatggca acggggacga aacccgtcgg gtagtcactg cccaaacccg 660
tccccgcaac cttcatccca aacccgtccc cgtttccggt cgcgggtttc agttttctac 720
cagacccgtc cccatcgggt ttttcatccc cgtcgggaaa tccgaacccg ccagcatttc 780
agcaccaagc caaagttgca gcagcaacat gaataaaaaa caacccgttt caacaccaag 840
ataaaacaaa acattataat ttagacaaca tttcacacgt ataacaataa catatagttc 900
tcacatataa caacaccatt tcacacataa aacaacacca tttgggataa aaatatgggc 960
tatatcaggc catttttatg ggccatattg agttttcgtg ggtttcacag gtaccggatt 1020
tgtagaatgc tgaaccgggt ttgaaccgta aaatccgcgg gtattgaatt tgacccaatc 1080
ccgtcgtccc ctggtggggt aaaaacacca tcttgagtcc aaacggccac caaccaaact 1140
ccgacggcaa caaacaaacg gcgttgcttt gctcctcggt atctccgtga ccgctcaatc 1200
tcccggctgt ttccccggaa ttgcgtggac tctctcatcc acacgcaaac cgcctctccc 1260
tcctctctcg tcctatccgc cccggtgccg tagcctcacg ggactcttct tcctcccttg 1320
ctataaaatc cccgccccct cccgtctcct ctccacacat ccaaactctc aatcgcaccg 1380
agaaaaatct cctagcgatc gaagcgaagc ctctcccgat cctctcaagg tacgcccgtt 1440
tcccgtcgat cctcctcctt ccgttcgtgt tctgtagccg atcgattcga ttcccttaca 1500
cccgttcgtg ttctctcgtg gatcgatcga ttgtttgttg ctagaaggaa ctcgtagatc 1560
tggcgtttat gaactgtgat tcgggttagt ccagatcgat tcaggtcggt cgtcgttgag 1620
cctctcggct atgtctggat tatcgtgtag atctgctggt tcagttgatt atgttcttct 1680
aggagtaatt tcgttgggtc agcgcgattt ctgcttaatc tatgctgctt attgcgcctg 1740
tacctatcta ctaagctatg tgcacctgta attttgctag attattcgtt catcctcgta 1800
gttggtttgt cacagtaatc cgtatgggtt ctgacgatgt tattgttggt catacctagg 1860
cttctccaga ttttattttg ttaaaattgg atagatctgc tactgatagt tgatgatgga 1920
atttggtgct gaatctatgc tatttattgc gcctatacct gatctatcgg gctatgtacg 1980
gctgtagttt actggattat tcgttcatcc tcggtagttg gttcatcgtt tgggttctga 2040
cgataatatt gttgattatg cgtaggcttc tgcagattgt tgttaaaatt ggatacatcg 2100
gttactgatg gttgatgata gatttgtgct gaacctatct gtttattgct cctatacctg 2160
atctataggg ctatgtatgc ctgtaattta ccagattatt cgttcatcct cgtagttggt 2220
tcatctctat aattcgtatg ggttcttatg atgttatcgt tgattatgcc tagtcttata 2280
cagattattg tgtcaagatt gaatatacct gctactgatc ggtgataatt tggttagtag 2340
tttgcaatct gctaggaaca cgttaccact gtaatctgta aacatggttt gccagagtag 2400
tttgttctac tactcttgat atggttgctg attttagtcg cctccttttg gatcatgtat 2460
tgatgtcctt gcagatttcc gtgtacttac cccggctttt gtgtacttcg tgttaacagg 2520
tcgggtaccg aagcaaacat ggcatctagc atggcaccaa agaaaaaaag gaaagtttcc 2580
aaacttgaaa aatttacaaa ctgctactcc ctttccaaga cgcttaggtt taaagcgatc 2640
cccgttggca agacccaaga gaatatcgat aacaaaagac ttctggtcga agatgaaaaa 2700
agggccgaag actacaaggg ggtcaagaag ttgctcgatc gctattatct ttcctttatc 2760
aacgatgtgc ttcattcaat caaactgaag aacttgaata actacattag ccttttcaga 2820
aagaaaacga ggactgaaaa ggagaacaag gaacttgaga atcttgaaat aaaccttcgc 2880
aaagaaattg caaaagcctt caaggggaac gaaggatata aatctctttt caaaaaagac 2940
attatagaaa caattttgcc tgagtttctt gacgacaagg atgaaattgc gctcgtcaat 3000
agctttaacg gatttacaac tgccttcaca gggttcttcg acaataggga gaatatgttt 3060
agcgaggagg caaaaagcac atccatcgca ttcagatgca tcaatgaaaa tcttacccgg 3120
tacatatcga atatggacat atttgaaaaa gtggatgcaa tattcgataa gcacgaagtc 3180
caggagataa aggaaaagat actgaatagc gactatgatg tcgaagattt tttcgaaggt 3240
gagttcttca actttgtcct gactcaagaa ggcattgatg tctataatgc aataattgga 3300
ggttttgtga ctgagtctgg cgagaagata aagggcttga acgagtatat caatctctac 3360
aaccagaaga ctaagcaaaa gttgcctaaa tttaaaccgc tttacaagca agttttgagc 3420
gaccgggaaa gcctttcctt ttacggtgaa ggatacacga gcgatgaaga agtcctcgaa 3480
gtcttccgca acacactcaa caagaactca gaaatctttt cctcaattaa aaaattggag 3540
aagcttttca agaacttcga tgaatactct tcggcgggga tttttgtgaa gaacggcccg 3600
gcaatttcca caatatctaa agacattttc ggagaatgga acgtgataag agacaagtgg 3660
aatgcggagt atgatgacat acacctgaag aagaaggcag ttgtgactga aaaatacgaa 3720
gatgacagga gaaaaagctt taaaaagatc gggtcctttt cactggaaca gctgcaggag 3780
tatgccgacg ccgatctttc ggttgtcgaa aagctcaaag aaataattat ccagaaggtc 3840
gatgaaatct acaaggtgta cggctcaagc gagaagctct ttgatgctga cttcgtgttg 3900
gagaagtctc ttaaaaaaaa cgacgcagtc gtcgcgataa tgaaagattt gctggattca 3960
gtgaaatcct tcgagaatta tatcaaagcc ttcttcggcg aggggaagga gacaaacagg 4020
gatgagtcct tctatggaga cttcgttctg gcttacgaca tccttcttaa ggtcgaccac 4080
atctatgacg caattcggaa ctatgtgacg cagaagccgt attcgaaaga taagttcaag 4140
ctctatttcc aaaaccctca atttatgggt gggtgggata aagacaaaga gaccgattac 4200
cgggcaacaa ttttgcggta cgggtctaaa tattacctcg ctataatgga taagaaatac 4260
gctaaatgtc tccagaaaat tgacaaagat gacgtcaacg gcaattatga aaaaatcaat 4320
tataaactcc ttcctggccc aaataaaatg ctcccgaagg tgtttttttc caaaaagtgg 4380
atggcctatt ataatccatc agaggatatt cagaaaatct ataaaaatgg gacctttaag 4440
aagggtgaca tgtttaacct gaacgattgc cacaagctta tagatttttt caaagactct 4500
attagccgct atcccaaatg gtctaatgct tatgatttca acttctctga aactgaaaag 4560
tacaaagata ttgcaggatt ctaccgcgaa gttgaagaac aaggttataa ggtttccttt 4620
gagtctgcgt ccaagaaaga ggtcgataag ttggtcgaag aagggaaatt gtatatgttt 4680
caaatttaca ataaagactt ttccgacaag tcccatggta cacctaatct gcataccatg 4740
tacttcaaac tgctgttcga tgagaataat cacggtcaga ttcgcctgag cggaggggcg 4800
gaactcttca tgaggagagc atcgttgaaa aaagaggagc tcgtcgtgca tccggctaac 4860
agccccattg ctaacaagaa tccggataat ccaaagaaga ctactaccct ctcctatgac 4920
gtctataagg ataagagatt ctctgaggac cagtacgagt tgcacatccc tattgcgata 4980
aataaatgcc ctaagaacat ctttaaaatc aatactgagg tcagagtcct gcttaagcac 5040
gacgacaacc cgtatgtgat cgggattgat aggggtgaaa ggaacttgct ttatattgtg 5100
gttgtcgatg gaaaaggtaa tatagtggaa caatactctc tgaatgaaat tatcaacaac 5160
ttcaatggca ttaggatcaa gaccgactat cattctctgt tggacaagaa agagaaagag 5220
cgcttcgagg cacggcaaaa ctggacgtct attgagaaca tcaaggagct taaggctggt 5280
tacatttctc aggttgtgca caaaatttgc gaactggtcg agaaatatga tgccgttatc 5340
gcacttgaag atctcaacag cggatttaag aattctcggg tgaaagtcga aaaacaggtg 5400
tatcaaaaat tcgaaaagat gctgatcgac aagctcaatt atatggttga taaaaagagc 5460
aacccatgcg ccacgggggg tgcgcttaag ggctatcaga ttacgaacaa atttgaatcc 5520
ttcaagtcaa tgtcgacgca aaatgggttt atattctata taccggcgtg gcttacatct 5580
aaaatagatc ctagcactgg gttcgtgaac ctgctgaaaa ccaagtacac ttcaatcgca 5640
gattctaaaa aatttataag cagcttcgac agaatcatgt atgtgcccga ggaagacctc 5700
ttcgagtttg cccttgatta caaaaatttc tcaagaacgg atgcagacta cataaagaag 5760
tggaagctgt actcttatgg gaaccggatt cggatattca gaaatccgaa aaaaaacaat 5820
gtctttgatt gggaggaagt ttgtcttacc tctgcttaca aagagctgtt caataaatat 5880
ggcattaatt accagcaagg tgatatccgg gcgctccttt gcgaacagtc tgacaaagct 5940
ttctattctt catttatggc gctcatgtca ttgatgctgc agatgaggaa tagcattacg 6000
gggaggactg atgttgactt tctgatctcg cccgtgaaaa attctgatgg aatcttctac 6060
gattccagga attatgaggc ccaggaaaat gctatccttc ccaagaacgc agacgcaaat 6120
ggcgcgtaca atatagctcg caaggttttg tgggctatag gccaattcaa gaaagccgaa 6180
gacgaaaagc tggacaaagt taagattgct atatctaaca aagagtggct tgagtatgcg 6240
caaacatctg ttaaacacaa acgccccgcg gctacaaaga aggctggcca ggccaagaag 6300
aagaagggct cggggtcggg gtcgggctcg ggctcggacg ccctggacga cttcgacctc 6360
gacatgctgg gctccgacgc cctcgatgat ttcgacctcg atatgctcgg cagcgacgcg 6420
ctcgatgact tcgacctcga tatgctgggg agcgacgccc tcgacgattt tgacctcgat 6480
atgctgatca actcccgctc cagcggcagc ccgaagaaga agcgcaaagt gggctcgcag 6540
tacctgcccg acaccgacga caggcacagg atcgaggaga agcgcaagag gacgtacgag 6600
accttcaagt ccatcatgaa gaagtccccg ttcagcggcc caacggaccc ccgcccgccg 6660
ccgaggagga tcgccgtgcc gtccaggtcc agcgcgtcgg tccccaagcc ggccccgcag 6720
ccctacccgt tcacgtccag cctcagcacc atcaactacg acgagttccc caccatggtg 6780
ttcccgtccg gccagatctc ccaggccagc gcgctggccc ccgcgccccc gcaggtgctg 6840
ccccaggctc cggcccccgc tccggccccg gccatggtct ccgcgctggc ccaggcgccc 6900
gccccggtgc ccgtcctcgc gccgggcccg ccgcaggcgg tcgccccgcc agcgccgaag 6960
cccacgcagg ccggcgaggg caccctcagc gaggcgctcc tgcagctgca gttcgacgac 7020
gaggacctcg gcgccctcct gggcaactcg accgaccccg ccgtgttcac cgacctggcc 7080
tccgtcgaca acagcgagtt ccagcagctg ctgaaccagg gcatcccggt ggcgccgcac 7140
accacggagc ccatgctgat ggagtacccg gaggcgatca cgcgcctcgt caccggcgcc 7200
cagaggcccc cggaccccgc cccggccccg ctcggcgccc caggcctgcc gaacggcctc 7260
ctgagcggcg acgaggactt ctccagcatc gcggacatgg acttctccgc cctcctgggg 7320
tcgggctcgg gcagccgcga cagcagggag ggcatgttcc tcccaaagcc cgaggccggc 7380
tccgccatct cggacgtgtt cgagggcagg gaggtctgcc agccaaagcg catcaggccg 7440
ttccacccgc cgggctcccc gtgggcgaac cggccgctcc ccgccagcct ggctccaacc 7500
ccgaccggcc ccgtgcacga gccggtcggc agcctgacgc ccgcgccggt gccccagccg 7560
ctcgaccccg cgccggccgt cacccccgag gcctcccacc tcctggagga ccccgacgag 7620
gagacctcgc aggccgtgaa ggccctgagg gagatggccg acaccgtcat cccccagaag 7680
gaggaggcgg ccatctgcgg ccagatggac ctgtcgcacc cgccgccgcg cggccacctc 7740
gacgagctga ccacgaccct cgagtccatg accgaggacc tcaacctgga cagccccctc 7800
acgccggagc tgaacgagat cctcgacacc ttcctgaacg acgagtgcct cctgcacgcc 7860
atgcacatct ccacgggcct gagcatcttc gacaccagcc tcttctgagt cgaccgatcg 7920
ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 7980
tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 8040
gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 8100
agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 8160
actagatcga tcccgggata tcgcggccgg tcgttcggct gcggcgagcg gtatcagctc 8220
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 8280
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 8340
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 8400
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 8460
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 8520
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 8580
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 8640
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 8700
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 8760
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 8820
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 8880
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 8940
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 9000
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 9060
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 9120
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 9180
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 9240
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 9300
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 9360
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 9420
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 9480
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 9540
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 9600
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 9660
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 9720
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 9780
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 9840
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 9900
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 9960
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 10020
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 10080
cacctgacgc gccctgtagc ggcacgtcta attcggggga tctggatttt agtactggat 10140
tttggtttta ggaattagaa attttattga tagaagtatt ttacaaatac aaatacatac 10200
taagggtttc ttatatgctc aacacatgag cgaaacccta taggaaccct aattccctta 10260
tctgggaact actcacacat tattatggag aaactcgagc ttgtcgatcg acatgatcag 10320
ggagccctag attatttgta tagttcatcc atgcccatta cgtcggtaaa tgccttctgc 10380
cactccttga agttaagttc ggtcttggaa tgtttcaact cagtcttacg gaacacgtac 10440
atgggttggt tcttaaggta gttagcggcc attggtttag cgaatgtgta ggtagtcctg 10500
gctgtagagc gatatctctt gccattgcct gtggtgtaag accatttgaa ggtactaatg 10560
atggtcttgt cgttagggta ggttttcttg gaccggcacc aatcagcggc agttaaggag 10620
ttggtcatga caggtccatc agcaggaaag cctgtcccct tcacttgggc ttctcctttg 10680
atgtggctcc cttcgtaagt gtaacggtag ttgacggtga gcgaagcacc gtcctcaaac 10740
tgcattgtcc tgtggacttg gtatccggag ccatcaacca tggctgcttg gaatggactc 10800
attccgtcag ggtatggaag gtattgatgg aatccgtagc caatgtgtgg caccagaatc 10860
catggagaaa actgaagatc acctttggtg ctcttgaggt tcagctcttc gtatccgtca 10920
ttagggttcc cagtgccttg tccgaccata tcgaagtcaa cgccgttgat ggaaccgaag 10980
atgtgaagct catgtgtggc tggaagcgaa gccatgttat cttcttctcc tttactcacg 11040
gaggacgcca tggtggcggg atcgcgccct atcgttcgta aatggtgaaa attttcagaa 11100
aattgctttt gctttaaaag aaatgattta aattgctgca atagaagtag aatgcttgat 11160
tgcttgagat tcgtttgttt tgtatatgtt gtgttgagag gatcctctag agtcgacctg 11220
cagaagtaac accaaacaac agggtgagca tcgacaaaag aaacagtacc aagcaaataa 11280
atagcgtatg aaggcagggc taaaaaaatc cacatatagc tgctgcatat gccatcatcc 11340
aagtatatca agatcaaaat aattataaaa catacttgtt tattataata gataggtact 11400
caaggttaga gcatatgaat agatgctgca tatgccatca tgtatatgca tcagtaaaac 11460
ccacatcaac atgtatacct atcctagatc gatatttcca tccatcttaa actcgtaact 11520
atgaagatgt atgacacaca catacagttc caaaattaat aaatacacca ggtagtttga 11580
aacagtattc tactccgatc tagaacgaat gaacgaccgc ccaaccacac cacatcatca 11640
caaccaagcg aacaaaagca tctctgtata tgcatcagta aaacccgcat caacatgtat 11700
acctatccta gatcgatatt tccatccatc atcttcaatt cgtaactatg aatatgtatg 11760
gcacacacat acagatccaa aattaataaa tccaccaggt agtttgaaac agaattctac 11820
tccgatctag aacgaccgcc caaccagacc acatcatcac aaccaagaca aaaaaaagca 11880
tgaaaagatg acccgacaaa caagtgcacg gcatatattg aaataaagga aaagggcaaa 11940
ccaaacccta tgcaacgaaa caaaaaaaat catgaaatcg atcccgtctg cggaacggct 12000
agagccatcc caggattccc caaagagaaa cactggcaag ttagcaatca gaacgtgtct 12060
gacgtacagg tcgcatccgt gtacgaacgc tagcagcacg gatctaacac aaacacggat 12120
ctaacacaaa catgaacaga agtagaacta ccgggcccta accatggacc ggaacgccga 12180
tctagagaag gtagagaggg ggggggagga cgagcggcgt accttgaagc ggaggtgccg 12240
acgggtggat ttgggggaga tccactagtt ctagagcggc cgccaccgcg gtggaattct 12300
cgaggtcctc tccaaatgaa atgaacttcc ttatatagag gaagggtctt gcgaaggata 12360
gtgggattgt gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga 12420
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt 12480
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca 12540
tttgtaggtg ccaccttcct tttctactgt ccttttgatc aagtgaccga tagctgggca 12600
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa tagccctttg 12660
gtcttctgag actgtatctt tgatattctt ggagtagacg agagtgtcgt gctccaccat 12720
gttatcacat caattcactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 12780
gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 12840
agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 12900
tttgatcaag tgacagatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 12960
ttgttgaaaa gtctcaatag ccctttggtc ttctgagact tgcaggcaag ca 13012
<210> 280
<211> 13013
<212> DNA
<213> 人工序列
<220>
<223> pGEP755 expression plasmid
<400> 280
cgatctttcg gttgtcgaaa agctcaaaga aataattatc cagaaggtcg atgaaatcta 60
caaggtgtac ggctcaagcg agaagctctt tgatgctgac ttcgtgttgg agaagtctct 120
taaaaaaaac gacgcagtcg tcgcgataat gaaagatttg ctggattcag tgaaatcctt 180
cgagaattat atcaaagcct tcttcggcga ggggaaggag acaaacaggg atgagtcctt 240
ctatggagac ttcgttctgg cttacgacat ccttcttaag gtcgaccaca tctatgacgc 300
aattcggaac tatgtgacgc agaagccgta ttcgaaagat aagttcaagc tctatttcca 360
aaaccctcaa tttatgcgtg ggtgggataa agacaaagag accgattacc gggcaacaat 420
tttgcggtac gggtctaaat attacctcgc tataatggat aagaaatacg ctaaatgtct 480
ccagaaaatt gacaaagatg acgtcaacgg caattatgaa aaaatcaatt ataaactcct 540
tcctggccca aataaaatgc tcccgagggt gtttttttcc aaaaagtgga tggcctatta 600
taatccatca gaggatattc agaaaatcta taaaaatggg acctttaaga agggtgacat 660
gtttaacctg aacgattgcc acaagcttat agattttttc aaagactcta ttagccgcta 720
tcccaaatgg tctaatgctt atgatttcaa cttctctgaa actgaaaagt acaaagatat 780
tgcaggattc taccgcgaag ttgaagaaca aggttataag gtttcctttg agtctgcgtc 840
caagaaagag gtcgataagt tggtcgaaga agggaaattg tatatgtttc aaatttacaa 900
taaagacttt tccgacaagt cccatggtac acctaatctg cataccatgt acttcaaact 960
gctgttcgat gagaataatc acggtcagat tcgcctgagc ggaggggcgg aactcttcat 1020
gaggagagca tcgttgaaaa aagaggagct cgtcgtgcat ccggctaaca gccccattgc 1080
taacaagaat ccggataatc caaagaagac tactaccctc tcctatgacg tctataagga 1140
taagagattc tctgaggacc agtacgagtt gcacatccct attgcgataa ataaatgccc 1200
taagaacatc tttaaaatca atactgaggt cagagtcctg cttaagcacg acgacaaccc 1260
gtatgtgatc gggattgata ggggtgaaag gaacttgctt tatattgtgg ttgtcgatgg 1320
aaaaggtaat atagtggaac aatactctct gaatgaaatt atcaacaact tcaatggcat 1380
taggatcaag accgactatc attctctgtt ggacaagaaa gagaaagagc gcttcgaggc 1440
acggcaaaac tggacgtcta ttgagaacat caaggagctt aaggctggtt acatttctca 1500
ggttgtgcac aaaatttgcg aactggtcga gaaatatgat gccgttatcg cacttgaaga 1560
tctcaacagc ggatttaaga attctcgggt gaaagtcgaa aaacaggtgt atcaaaaatt 1620
cgaaaagatg ctgatcgaca agctcaatta tatggttgat aaaaagagca acccatgcgc 1680
cacggggggt gcgcttaagg gctatcagat tacgaacaaa tttgaatcct tcaagtcaat 1740
gtcgacgcaa aatgggttta tattctatat accggcgtgg cttacatcta aaatagatcc 1800
tagcactggg ttcgtgaacc tgctgaaaac caagtacact tcaatcgcag attctaaaaa 1860
atttataagc agcttcgaca gaatcatgta tgtgcccgag gaagacctct tcgagtttgc 1920
ccttgattac aaaaatttct caagaacgga tgcagactac ataaagaagt ggaagctgta 1980
ctcttatggg aaccggattc ggatattcag aaatccgaaa aaaaacaatg tctttgattg 2040
ggaggaagtt tgtcttacct ctgcttacaa agagctgttc aataaatatg gcattaatta 2100
ccagcaaggt gatatccggg cgctcctttg cgaacagtct gacaaagctt tctattcttc 2160
atttatggcg ctcatgtcat tgatgctgca gatgaggaat agcattacgg ggaggactga 2220
tgttgacttt ctgatctcgc ccgtgaaaaa ttctgatgga atcttctacg attccaggaa 2280
ttatgaggcc caggaaaatg ctatccttcc caagaacgca gacgcaaatg gcgcgtacaa 2340
tatagctcgc aaggttttgt gggctatagg ccaattcaag aaagccgaag acgaaaagct 2400
ggacaaagtt aagattgcta tatctaacaa agagtggctt gagtatgcgc aaacatctgt 2460
taaacacaaa cgccccgcgg ctacaaagaa ggctggccag gccaagaaga agaagggctc 2520
ggggtcgggg tcgggctcgg gctcggacgc cctggacgac ttcgacctcg acatgctggg 2580
ctccgacgcc ctcgatgatt tcgacctcga tatgctcggc agcgacgcgc tcgatgactt 2640
cgacctcgat atgctgggga gcgacgccct cgacgatttt gacctcgata tgctgatcaa 2700
ctcccgctcc agcggcagcc cgaagaagaa gcgcaaagtg ggctcgcagt acctgcccga 2760
caccgacgac aggcacagga tcgaggagaa gcgcaagagg acgtacgaga ccttcaagtc 2820
catcatgaag aagtccccgt tcagcggccc aacggacccc cgcccgccgc cgaggaggat 2880
cgccgtgccg tccaggtcca gcgcgtcggt ccccaagccg gccccgcagc cctacccgtt 2940
cacgtccagc ctcagcacca tcaactacga cgagttcccc accatggtgt tcccgtccgg 3000
ccagatctcc caggccagcg cgctggcccc cgcgcccccg caggtgctgc cccaggctcc 3060
ggcccccgct ccggccccgg ccatggtctc cgcgctggcc caggcgcccg ccccggtgcc 3120
cgtcctcgcg ccgggcccgc cgcaggcggt cgccccgcca gcgccgaagc ccacgcaggc 3180
cggcgagggc accctcagcg aggcgctcct gcagctgcag ttcgacgacg aggacctcgg 3240
cgccctcctg ggcaactcga ccgaccccgc cgtgttcacc gacctggcct ccgtcgacaa 3300
cagcgagttc cagcagctgc tgaaccaggg catcccggtg gcgccgcaca ccacggagcc 3360
catgctgatg gagtacccgg aggcgatcac gcgcctcgtc accggcgccc agaggccccc 3420
ggaccccgcc ccggccccgc tcggcgcccc aggcctgccg aacggcctcc tgagcggcga 3480
cgaggacttc tccagcatcg cggacatgga cttctccgcc ctcctggggt cgggctcggg 3540
cagccgcgac agcagggagg gcatgttcct cccaaagccc gaggccggct ccgccatctc 3600
ggacgtgttc gagggcaggg aggtctgcca gccaaagcgc atcaggccgt tccacccgcc 3660
gggctccccg tgggcgaacc ggccgctccc cgccagcctg gctccaaccc cgaccggccc 3720
cgtgcacgag ccggtcggca gcctgacgcc cgcgccggtg ccccagccgc tcgaccccgc 3780
gccggccgtc acccccgagg cctcccacct cctggaggac cccgacgagg agacctcgca 3840
ggccgtgaag gccctgaggg agatggccga caccgtcatc ccccagaagg aggaggcggc 3900
catctgcggc cagatggacc tgtcgcaccc gccgccgcgc ggccacctcg acgagctgac 3960
cacgaccctc gagtccatga ccgaggacct caacctggac agccccctca cgccggagct 4020
gaacgagatc ctcgacacct tcctgaacga cgagtgcctc ctgcacgcca tgcacatctc 4080
cacgggcctg agcatcttcg acaccagcct cttctgagtc gaccgatcgt tcaaacattt 4140
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 4200
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 4260
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 4320
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgat 4380
cccgggatat cgcggccgcg tcgttaagct gcggcgagcg gtatcagctc actcaaaggc 4440
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4500
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4560
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4620
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4680
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4740
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4800
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4860
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4920
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4980
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 5040
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 5100
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 5160
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 5220
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 5280
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 5340
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 5400
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 5460
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 5520
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 5580
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 5640
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 5700
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 5760
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 5820
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5880
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5940
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 6000
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 6060
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 6120
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 6180
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 6240
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 6300
gccctgtagc ggcacgtcta attcggggga tctggatttt agtactggat tttggtttta 6360
ggaattagaa attttattga tagaagtatt ttacaaatac aaatacatac taagggtttc 6420
ttatatgctc aacacatgag cgaaacccta taggaaccct aattccctta tctgggaact 6480
actcacacat tattatggag aaactcgagc ttgtcgatcg acatgatcag ggagccctag 6540
attatttgta tagttcatcc atgcccatta cgtcggtaaa tgccttctgc cactccttga 6600
agttaagttc ggtcttggaa tgtttcaact cagtcttacg gaacacgtac atgggttggt 6660
tcttaaggta gttagcggcc attggtttag cgaatgtgta ggtagtcctg gctgtagagc 6720
gatatctctt gccattgcct gtggtgtaag accatttgaa ggtactaatg atggtcttgt 6780
cgttagggta ggttttcttg gaccggcacc aatcagcggc agttaaggag ttggtcatga 6840
caggtccatc agcaggaaag cctgtcccct tcacttgggc ttctcctttg atgtggctcc 6900
cttcgtaagt gtaacggtag ttgacggtga gcgaagcacc gtcctcaaac tgcattgtcc 6960
tgtggacttg gtatccggag ccatcaacca tggctgcttg gaatggactc attccgtcag 7020
ggtatggaag gtattgatgg aatccgtagc caatgtgtgg caccagaatc catggagaaa 7080
actgaagatc acctttggtg ctcttgaggt tcagctcttc gtatccgtca ttagggttcc 7140
cagtgccttg tccgaccata tcgaagtcaa cgccgttgat ggaaccgaag atgtgaagct 7200
catgtgtggc tggaagcgaa gccatgttat cttcttctcc tttactcacg gaggacgcca 7260
tggtggcggg atcgcgccct atcgttcgta aatggtgaaa attttcagaa aattgctttt 7320
gctttaaaag aaatgattta aattgctgca atagaagtag aatgcttgat tgcttgagat 7380
tcgtttgttt tgtatatgtt gtgttgagag gatcctcaag cttcgacctg cagaagtaac 7440
accaaacaac agggtgagca tcgacaaaag aaacagtacc aagcaaataa atagcgtatg 7500
aaggcagggc taaaaaaatc cacatatagc tgctgcatat gccatcatcc aagtatatca 7560
agatcaaaat aattataaaa catacttgtt tattataata gataggtact caaggttaga 7620
gcatatgaat agatgctgca tatgccatca tgtatatgca tcagtaaaac ccacatcaac 7680
atgtatacct atcctagatc gatatttcca tccatcttaa actcgtaact atgaagatgt 7740
atgacacaca catacagttc caaaattaat aaatacacca ggtagtttga aacagtattc 7800
tactccgatc tagaacgaat gaacgaccgc ccaaccacac cacatcatca caaccaagcg 7860
aacaaaagca tctctgtata tgcatcagta aaacccgcat caacatgtat acctatccta 7920
gatcgatatt tccatccatc atcttcaatt cgtaactatg aatatgtatg gcacacacat 7980
acagatccaa aattaataaa tccaccaggt agtttgaaac agaattctac tccgatctag 8040
aacgaccgcc caaccagacc acatcatcac aaccaagaca aaaaaaagca tgaaaagatg 8100
acccgacaaa caagtgcacg gcatatattg aaataaagga aaagggcaaa ccaaacccta 8160
tgcaacgaaa caaaaaaaat catgaaatcg atcccgtctg cggaacggct agagccatcc 8220
caggattccc caaagagaaa cactggcaag ttagcaatca gaacgtgtct gacgtacagg 8280
tcgcatccgt gtacgaacgc tagcagcacg gatctaacac aaacacggat ctaacacaaa 8340
catgaacaga agtagaacta ccgggcccta accatggacc ggaacgccga tctagagaag 8400
gtagagaggg ggggggagga cgagcggcgt accttgaagc ggaggtgccg acgggtggat 8460
ttgggggaga tccactagtt ctagagcggc cgccaccgcg gtggaattct cgaggtcctc 8520
tccaaatgaa atgaacttcc ttatatagag gaagggtctt gcgaaggata gtgggattgt 8580
gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga agacgtggtt 8640
ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt gggaccactg 8700
tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca tttgtaggtg 8760
ccaccttcct tttctactgt ccttttgatc aagtgaccga tagctgggca atggaatccg 8820
aggaggtttc ccgatattac cctttgttga aaagtctcaa tagccctttg gtcttctgag 8880
actgtatctt tgatattctt ggagtagacg agagtgtcgt gctccaccat gttatcacat 8940
caattcactt gctttgaaga cgtggttgga acgtcttctt tttccacgat gctcctcgtg 9000
ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat agcctttcct 9060
ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct tttgatcaag 9120
tgacagatag ctgggcaatg gaatccgagg aggtttcccg atattaccct ttgttgaaaa 9180
gtctcaatag ccctttggtc ttctgagact tgcaggcaag caagcatgaa tgcctggggg 9240
agaagaactc gagagggaat tgcagatcat gaggcagatg gctatttttg tgtcacatat 9300
gcgcaaaaag agaggctata tttgtgtccc taggttcttc gttgtattgc agtttccata 9360
tcaatctgac ttggtcgcat gagaaattga tggttaaata atttgaatct ctcatgtagt 9420
atcaactatt agatattatt ttcaccaaat atatttccat cggagaagaa gaggctacag 9480
aggaagcaga agagaggggt gggagaattt ttacactttt gtacacccac ttaaacagca 9540
aaatccgtat gaaaacaggc ccaccaaaac aatgccacga taacaatccg tagaaacaaa 9600
agcttcattt aacagcggcg caacaaagca cgcttatcca tggtagttgt agtccgtatg 9660
cgatccaaag atcacgattc acgcgtgacg gacggacgac gcgtgccaca ccacaactaa 9720
cggcatccat ggtagttgta gtccgtatgc gatccaaaga tcacgattca cgcgtgacgg 9780
acggacgacg cgcgccacac cacaactaac agcgtgagcc agcgtccaaa ctccggatgg 9840
caacggggac gaaacccgtc gggtagtcac tgcccaaacc cgtccccgca accttcatcc 9900
caaacccgtc cccgtttccg gtcgcgggtt tcagttttct accagacccg tccccatcgg 9960
gtttttcatc cccgtcggga aatccgaacc cgccagcatt tcagcaccaa gccaaagttg 10020
cagcagcaac atgaataaaa aacaacccgt ttcaacacca agataaaaca aaacattata 10080
atttagacaa catttcacac gtataacaat aacatatagt tctcacatat aacaacacca 10140
tttcacacat aaaacaacac catttgggat aaaaatatgg gctatatcag gccattttta 10200
tgggccatat tgagttttcg tgggtttcac aggtaccgga tttgtagaat gctgaaccgg 10260
gtttgaaccg taaaatccgc gggtattgaa tttgacccaa tcccgtcgtc ccctggtggg 10320
gtaaaaacac catcttgagt ccaaacggcc accaaccaaa ctccgacggc aacaaacaaa 10380
cggcgttgct ttgctcctcg gtatctccgt gaccgctcaa tctcccggct gtttccccgg 10440
aattgcgtgg actctctcat ccacacgcaa accgcctctc cctcctctct cgtcctatcc 10500
gccccggtgc cgtagcctca cgggactctt cttcctccct tgctataaaa tccccgcccc 10560
ctcccgtctc ctctccacac atccaaactc tcaatcgcac cgagaaaaat ctcctagcga 10620
tcgaagcgaa gcctctcccg atcctctcaa ggtacgcccg tttcccgtcg atcctcctcc 10680
ttccgttcgt gttctgtagc cgatcgattc gattccctta cacccgttcg tgttctctcg 10740
tggatcgatc gattgtttgt tgctagaagg aactcgtaga tctggcgttt atgaactgtg 10800
attcgggtta gtccagatcg attcaggtcg gtcgtcgttg agcctctcgg ctatgtctgg 10860
attatcgtgt agatctgctg gttcagttga ttatgttctt ctaggagtaa tttcgttggg 10920
tcagcgcgat ttctgcttaa tctatgctgc ttattgcgcc tgtacctatc tactaagcta 10980
tgtgcacctg taattttgct agattattcg ttcatcctcg tagttggttt gtcacagtaa 11040
tccgtatggg ttctgacgat gttattgttg gtcataccta ggcttctcca gattttattt 11100
tgttaaaatt ggatagatct gctactgata gttgatgatg gaatttggtg ctgaatctat 11160
gctatttatt gcgcctatac ctgatctatc gggctatgta cggctgtagt ttactggatt 11220
attcgttcat cctcggtagt tggttcatcg tttgggttct gacgataata ttgttgatta 11280
tgcgtaggct tctgcagatt gttgttaaaa ttggatacat cggttactga tggttgatga 11340
tagatttgtg ctgaacctat ctgtttattg ctcctatacc tgatctatag ggctatgtat 11400
gcctgtaatt taccagatta ttcgttcatc ctcgtagttg gttcatctct ataattcgta 11460
tgggttctta tgatgttatc gttgattatg cctagtctta tacagattat tgtgtcaaga 11520
ttgaatatac ctgctactga tcggtgataa tttggttagt agtttgcaat ctgctaggaa 11580
cacgttacca ctgtaatctg taaacatggt ttgccagagt agtttgttct actactcttg 11640
atatggttgc tgattttagt cgcctccttt tggatcatgt attgatgtcc ttgcagattt 11700
ccgtgtactt accccggctt ttgtgtactt cgtgttaaca ggtcgggtac cgaagcaaac 11760
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 11820
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 11880
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 11940
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 12000
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 12060
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 12120
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 12180
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 12240
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 12300
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 12360
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 12420
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 12480
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 12540
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 12600
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 12660
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 12720
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 12780
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 12840
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 12900
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 12960
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgc 13013
<210> 281
<211> 13012
<212> DNA
<213> 人工序列
<220>
<223> pGEP756 expression plasmid
<400> 281
cgatctttcg gttgtcgaaa agctcaaaga aataattatc cagaaggtcg atgaaatcta 60
caaggtgtac ggctcaagcg agaagctctt tgatgctgac ttcgtgttgg agaagtctct 120
taaaaaaaac gacgcagtcg tcgcgataat gaaagatttg ctggattcag tgaaatcctt 180
cgagaattat atcaaagcct tcttcggcga ggggaaggag acaaacaggg atgagtcctt 240
ctatggagac ttcgttctgg cttacgacat ccttcttaag gtcgaccaca tctatgacgc 300
aattcggaac tatgtgacgc agaagccgta ttcgaaagat aagttcaagc tctatttcca 360
aaaccctcaa tttatgcgtg ggtgggataa agacgtagag accgatcgcc gggcaacaat 420
tttgcggtac gggtctaaat attacctcgc tataatggat aagaaatacg ctaaatgtct 480
ccagaaaatt gacaaagatg acgtcaacgg caattatgaa aaaatcaatt ataaactcct 540
tcctggccca aataaaatgc tcccgaaggt gtttttttcc aaaaagtgga tggcctatta 600
taatccatca gaggatattc agaaaatcta taaaaatggg acctttaaga agggtgacat 660
gtttaacctg aacgattgcc acaagcttat agattttttc aaagactcta ttagccgcta 720
tcccaaatgg tctaatgctt atgatttcaa cttctctgaa actgaaaagt acaaagatat 780
tgcaggattc taccgcgaag ttgaagaaca aggttataag gtttcctttg agtctgcgtc 840
caagaaagag gtcgataagt tggtcgaaga agggaaattg tatatgtttc aaatttacaa 900
taaagacttt tccgacaagt cccatggtac acctaatctg cataccatgt acttcaaact 960
gctgttcgat gagaataatc acggtcagat tcgcctgagc ggaggggcgg aactcttcat 1020
gaggagagca tcgttgaaaa aagaggagct cgtcgtgcat ccggctaaca gccccattgc 1080
taacaagaat ccggataatc caaagaagac tactaccctc tcctatgacg tctataagga 1140
taagagattc tctgaggacc agtacgagtt gcacatccct attgcgataa ataaatgccc 1200
taagaacatc tttaaaatca atactgaggt cagagtcctg cttaagcacg acgacaaccc 1260
gtatgtgatc gggattgata ggggtgaaag gaacttgctt tatattgtgg ttgtcgatgg 1320
aaaaggtaat atagtggaac aatactctct gaatgaaatt atcaacaact tcaatggcat 1380
taggatcaag accgactatc attctctgtt ggacaagaaa gagaaagagc gcttcgaggc 1440
acggcaaaac tggacgtcta ttgagaacat caaggagctt aaggctggtt acatttctca 1500
ggttgtgcac aaaatttgcg aactggtcga gaaatatgat gccgttatcg cacttgaaga 1560
tctcaacagc ggatttaaga attctcgggt gaaagtcgaa aaacaggtgt atcaaaaatt 1620
cgaaaagatg ctgatcgaca agctcaatta tatggttgat aaaaagagca acccatgcgc 1680
cacggggggt gcgcttaagg gctatcagat tacgaacaaa tttgaatcct tcaagtcaat 1740
gtcgacgcaa aatgggttta tattctatat accggcgtgg cttacatcta aaatagatcc 1800
tagcactggg ttcgtgaacc tgctgaaaac caagtacact tcaatcgcag attctaaaaa 1860
atttataagc agcttcgaca gaatcatgta tgtgcccgag gaagacctct tcgagtttgc 1920
ccttgattac aaaaatttct caagaacgga tgcagactac ataaagaagt ggaagctgta 1980
ctcttatggg aaccggattc ggatattcag aaatccgaaa aaaaacaatg tctttgattg 2040
ggaggaagtt tgtcttacct ctgcttacaa agagctgttc aataaatatg gcattaatta 2100
ccagcaaggt gatatccggg cgctcctttg cgaacagtct gacaaagctt tctattcttc 2160
atttatggcg ctcatgtcat tgatgctgca gatgaggaat agcattacgg ggaggactga 2220
tgttgacttt ctgatctcgc ccgtgaaaaa ttctgatgga atcttctacg attccaggaa 2280
ttatgaggcc caggaaaatg ctatccttcc caagaacgca gacgcaaatg gcgcgtacaa 2340
tatagctcgc aaggttttgt gggctatagg ccaattcaag aaagccgaag acgaaaagct 2400
ggacaaagtt aagattgcta tatctaacaa agagtggctt gagtatgcgc aaacatctgt 2460
taaacacaaa cgccccgcgg ctacaaagaa ggctggccag gccaagaaga agaagggctc 2520
ggggtcgggg tcgggctcgg gctcggacgc cctggacgac ttcgacctcg acatgctggg 2580
ctccgacgcc ctcgatgatt tcgacctcga tatgctcggc agcgacgcgc tcgatgactt 2640
cgacctcgat atgctgggga gcgacgccct cgacgatttt gacctcgata tgctgatcaa 2700
ctcccgctcc agcggcagcc cgaagaagaa gcgcaaagtg ggctcgcagt acctgcccga 2760
caccgacgac aggcacagga tcgaggagaa gcgcaagagg acgtacgaga ccttcaagtc 2820
catcatgaag aagtccccgt tcagcggccc aacggacccc cgcccgccgc cgaggaggat 2880
cgccgtgccg tccaggtcca gcgcgtcggt ccccaagccg gccccgcagc cctacccgtt 2940
cacgtccagc ctcagcacca tcaactacga cgagttcccc accatggtgt tcccgtccgg 3000
ccagatctcc caggccagcg cgctggcccc cgcgcccccg caggtgctgc cccaggctcc 3060
ggcccccgct ccggccccgg ccatggtctc cgcgctggcc caggcgcccg ccccggtgcc 3120
cgtcctcgcg ccgggcccgc cgcaggcggt cgccccgcca gcgccgaagc ccacgcaggc 3180
cggcgagggc accctcagcg aggcgctcct gcagctgcag ttcgacgacg aggacctcgg 3240
cgccctcctg ggcaactcga ccgaccccgc cgtgttcacc gacctggcct ccgtcgacaa 3300
cagcgagttc cagcagctgc tgaaccaggg catcccggtg gcgccgcaca ccacggagcc 3360
catgctgatg gagtacccgg aggcgatcac gcgcctcgtc accggcgccc agaggccccc 3420
ggaccccgcc ccggccccgc tcggcgcccc aggcctgccg aacggcctcc tgagcggcga 3480
cgaggacttc tccagcatcg cggacatgga cttctccgcc ctcctggggt cgggctcggg 3540
cagccgcgac agcagggagg gcatgttcct cccaaagccc gaggccggct ccgccatctc 3600
ggacgtgttc gagggcaggg aggtctgcca gccaaagcgc atcaggccgt tccacccgcc 3660
gggctccccg tgggcgaacc ggccgctccc cgccagcctg gctccaaccc cgaccggccc 3720
cgtgcacgag ccggtcggca gcctgacgcc cgcgccggtg ccccagccgc tcgaccccgc 3780
gccggccgtc acccccgagg cctcccacct cctggaggac cccgacgagg agacctcgca 3840
ggccgtgaag gccctgaggg agatggccga caccgtcatc ccccagaagg aggaggcggc 3900
catctgcggc cagatggacc tgtcgcaccc gccgccgcgc ggccacctcg acgagctgac 3960
cacgaccctc gagtccatga ccgaggacct caacctggac agccccctca cgccggagct 4020
gaacgagatc ctcgacacct tcctgaacga cgagtgcctc ctgcacgcca tgcacatctc 4080
cacgggcctg agcatcttcg acaccagcct cttctgagtc gaccgatcgt tcaaacattt 4140
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 4200
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 4260
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 4320
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgat 4380
cccgggatat cgcggccggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4440
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4500
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4560
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4620
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4680
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4740
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4800
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4860
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4920
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4980
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5040
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5100
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5160
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5220
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5280
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5340
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5400
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5460
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5520
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5580
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5640
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5700
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5760
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5820
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5880
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5940
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 6000
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 6060
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 6120
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 6180
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 6240
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg 6300
ccctgtagcg gcacgtctaa ttcgggggat ctggatttta gtactggatt ttggttttag 6360
gaattagaaa ttttattgat agaagtattt tacaaataca aatacatact aagggtttct 6420
tatatgctca acacatgagc gaaaccctat aggaacccta attcccttat ctgggaacta 6480
ctcacacatt attatggaga aactcgagct tgtcgatcga catgatcagg gagccctaga 6540
ttatttgtat agttcatcca tgcccattac gtcggtaaat gccttctgcc actccttgaa 6600
gttaagttcg gtcttggaat gtttcaactc agtcttacgg aacacgtaca tgggttggtt 6660
cttaaggtag ttagcggcca ttggtttagc gaatgtgtag gtagtcctgg ctgtagagcg 6720
atatctcttg ccattgcctg tggtgtaaga ccatttgaag gtactaatga tggtcttgtc 6780
gttagggtag gttttcttgg accggcacca atcagcggca gttaaggagt tggtcatgac 6840
aggtccatca gcaggaaagc ctgtcccctt cacttgggct tctcctttga tgtggctccc 6900
ttcgtaagtg taacggtagt tgacggtgag cgaagcaccg tcctcaaact gcattgtcct 6960
gtggacttgg tatccggagc catcaaccat ggctgcttgg aatggactca ttccgtcagg 7020
gtatggaagg tattgatgga atccgtagcc aatgtgtggc accagaatcc atggagaaaa 7080
ctgaagatca cctttggtgc tcttgaggtt cagctcttcg tatccgtcat tagggttccc 7140
agtgccttgt ccgaccatat cgaagtcaac gccgttgatg gaaccgaaga tgtgaagctc 7200
atgtgtggct ggaagcgaag ccatgttatc ttcttctcct ttactcacgg aggacgccat 7260
ggtggcggga tcgcgcccta tcgttcgtaa atggtgaaaa ttttcagaaa attgcttttg 7320
ctttaaaaga aatgatttaa attgctgcaa tagaagtaga atgcttgatt gcttgagatt 7380
cgtttgtttt gtatatgttg tgttgagagg atcctcaagc ttcgacctgc agaagtaaca 7440
ccaaacaaca gggtgagcat cgacaaaaga aacagtacca agcaaataaa tagcgtatga 7500
aggcagggct aaaaaaatcc acatatagct gctgcatatg ccatcatcca agtatatcaa 7560
gatcaaaata attataaaac atacttgttt attataatag ataggtactc aaggttagag 7620
catatgaata gatgctgcat atgccatcat gtatatgcat cagtaaaacc cacatcaaca 7680
tgtataccta tcctagatcg atatttccat ccatcttaaa ctcgtaacta tgaagatgta 7740
tgacacacac atacagttcc aaaattaata aatacaccag gtagtttgaa acagtattct 7800
actccgatct agaacgaatg aacgaccgcc caaccacacc acatcatcac aaccaagcga 7860
acaaaagcat ctctgtatat gcatcagtaa aacccgcatc aacatgtata cctatcctag 7920
atcgatattt ccatccatca tcttcaattc gtaactatga atatgtatgg cacacacata 7980
cagatccaaa attaataaat ccaccaggta gtttgaaaca gaattctact ccgatctaga 8040
acgaccgccc aaccagacca catcatcaca accaagacaa aaaaaagcat gaaaagatga 8100
cccgacaaac aagtgcacgg catatattga aataaaggaa aagggcaaac caaaccctat 8160
gcaacgaaac aaaaaaaatc atgaaatcga tcccgtctgc ggaacggcta gagccatccc 8220
aggattcccc aaagagaaac actggcaagt tagcaatcag aacgtgtctg acgtacaggt 8280
cgcatccgtg tacgaacgct agcagcacgg atctaacaca aacacggatc taacacaaac 8340
atgaacagaa gtagaactac cgggccctaa ccatggaccg gaacgccgat ctagagaagg 8400
tagagagggg gggggaggac gagcggcgta ccttgaagcg gaggtgccga cgggtggatt 8460
tgggggagat ccactagttc tagagcggcc gccaccgcgg tggaattctc gaggtcctct 8520
ccaaatgaaa tgaacttcct tatatagagg aagggtcttg cgaaggatag tgggattgtg 8580
cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa gacgtggttg 8640
gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg ggaccactgt 8700
cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat ttgtaggtgc 8760
caccttcctt ttctactgtc cttttgatca agtgaccgat agctgggcaa tggaatccga 8820
ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg tcttctgaga 8880
ctgtatcttt gatattcttg gagtagacga gagtgtcgtg ctccaccatg ttatcacatc 8940
aattcacttg ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg 9000
gtgggggtcc atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt 9060
tatcgcaatg atggcatttg taggtgccac cttccttttc tactgtcctt ttgatcaagt 9120
gacagatagc tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag 9180
tctcaatagc cctttggtct tctgagactt gcaggcaagc aagcatgaat gcctggggga 9240
gaagaactcg agagggaatt gcagatcatg aggcagatgg ctatttttgt gtcacatatg 9300
cgcaaaaaga gaggctatat ttgtgtccct aggttcttcg ttgtattgca gtttccatat 9360
caatctgact tggtcgcatg agaaattgat ggttaaataa tttgaatctc tcatgtagta 9420
tcaactatta gatattattt tcaccaaata tatttccatc ggagaagaag aggctacaga 9480
ggaagcagaa gagaggggtg ggagaatttt tacacttttg tacacccact taaacagcaa 9540
aatccgtatg aaaacaggcc caccaaaaca atgccacgat aacaatccgt agaaacaaaa 9600
gcttcattta acagcggcgc aacaaagcac gcttatccat ggtagttgta gtccgtatgc 9660
gatccaaaga tcacgattca cgcgtgacgg acggacgacg cgtgccacac cacaactaac 9720
ggcatccatg gtagttgtag tccgtatgcg atccaaagat cacgattcac gcgtgacgga 9780
cggacgacgc gcgccacacc acaactaaca gcgtgagcca gcgtccaaac tccggatggc 9840
aacggggacg aaacccgtcg ggtagtcact gcccaaaccc gtccccgcaa ccttcatccc 9900
aaacccgtcc ccgtttccgg tcgcgggttt cagttttcta ccagacccgt ccccatcggg 9960
tttttcatcc ccgtcgggaa atccgaaccc gccagcattt cagcaccaag ccaaagttgc 10020
agcagcaaca tgaataaaaa acaacccgtt tcaacaccaa gataaaacaa aacattataa 10080
tttagacaac atttcacacg tataacaata acatatagtt ctcacatata acaacaccat 10140
ttcacacata aaacaacacc atttgggata aaaatatggg ctatatcagg ccatttttat 10200
gggccatatt gagttttcgt gggtttcaca ggtaccggat ttgtagaatg ctgaaccggg 10260
tttgaaccgt aaaatccgcg ggtattgaat ttgacccaat cccgtcgtcc cctggtgggg 10320
taaaaacacc atcttgagtc caaacggcca ccaaccaaac tccgacggca acaaacaaac 10380
ggcgttgctt tgctcctcgg tatctccgtg accgctcaat ctcccggctg tttccccgga 10440
attgcgtgga ctctctcatc cacacgcaaa ccgcctctcc ctcctctctc gtcctatccg 10500
ccccggtgcc gtagcctcac gggactcttc ttcctccctt gctataaaat ccccgccccc 10560
tcccgtctcc tctccacaca tccaaactct caatcgcacc gagaaaaatc tcctagcgat 10620
cgaagcgaag cctctcccga tcctctcaag gtacgcccgt ttcccgtcga tcctcctcct 10680
tccgttcgtg ttctgtagcc gatcgattcg attcccttac acccgttcgt gttctctcgt 10740
ggatcgatcg attgtttgtt gctagaagga actcgtagat ctggcgttta tgaactgtga 10800
ttcgggttag tccagatcga ttcaggtcgg tcgtcgttga gcctctcggc tatgtctgga 10860
ttatcgtgta gatctgctgg ttcagttgat tatgttcttc taggagtaat ttcgttgggt 10920
cagcgcgatt tctgcttaat ctatgctgct tattgcgcct gtacctatct actaagctat 10980
gtgcacctgt aattttgcta gattattcgt tcatcctcgt agttggtttg tcacagtaat 11040
ccgtatgggt tctgacgatg ttattgttgg tcatacctag gcttctccag attttatttt 11100
gttaaaattg gatagatctg ctactgatag ttgatgatgg aatttggtgc tgaatctatg 11160
ctatttattg cgcctatacc tgatctatcg ggctatgtac ggctgtagtt tactggatta 11220
ttcgttcatc ctcggtagtt ggttcatcgt ttgggttctg acgataatat tgttgattat 11280
gcgtaggctt ctgcagattg ttgttaaaat tggatacatc ggttactgat ggttgatgat 11340
agatttgtgc tgaacctatc tgtttattgc tcctatacct gatctatagg gctatgtatg 11400
cctgtaattt accagattat tcgttcatcc tcgtagttgg ttcatctcta taattcgtat 11460
gggttcttat gatgttatcg ttgattatgc ctagtcttat acagattatt gtgtcaagat 11520
tgaatatacc tgctactgat cggtgataat ttggttagta gtttgcaatc tgctaggaac 11580
acgttaccac tgtaatctgt aaacatggtt tgccagagta gtttgttcta ctactcttga 11640
tatggttgct gattttagtc gcctcctttt ggatcatgta ttgatgtcct tgcagatttc 11700
cgtgtactta ccccggcttt tgtgtacttc gtgttaacag gtcgggtacc gaagcaaaca 11760
tggcatctag catggcacca aagaaaaaaa ggaaagtttc caaacttgaa aaatttacaa 11820
actgctactc cctttccaag acgcttaggt ttaaagcgat ccccgttggc aagacccaag 11880
agaatatcga taacaaaaga cttctggtcg aagatgaaaa aagggccgaa gactacaagg 11940
gggtcaagaa gttgctcgat cgctattatc tttcctttat caacgatgtg cttcattcaa 12000
tcaaactgaa gaacttgaat aactacatta gccttttcag aaagaaaacg aggactgaaa 12060
aggagaacaa ggaacttgag aatcttgaaa taaaccttcg caaagaaatt gcaaaagcct 12120
tcaaggggaa cgaaggatat aaatctcttt tcaaaaaaga cattatagaa acaattttgc 12180
ctgagtttct tgacgacaag gatgaaattg cgctcgtcaa tagctttaac ggatttacaa 12240
ctgccttcac agggttcttc gacaataggg agaatatgtt tagcgaggag gcaaaaagca 12300
catccatcgc attcagatgc atcaatgaaa atcttacccg gtacatatcg aatatggaca 12360
tatttgaaaa agtggatgca atattcgata agcacgaagt ccaggagata aaggaaaaga 12420
tactgaatag cgactatgat gtcgaagatt ttttcgaagg tgagttcttc aactttgtcc 12480
tgactcaaga aggcattgat gtctataatg caataattgg aggttttgtg actgagtctg 12540
gcgagaagat aaagggcttg aacgagtata tcaatctcta caaccagaag actaagcaaa 12600
agttgcctaa atttaaaccg ctttacaagc aagttttgag cgaccgggaa agcctttcct 12660
tttacggtga aggatacacg agcgatgaag aagtcctcga agtcttccgc aacacactca 12720
acaagaactc agaaatcttt tcctcaatta aaaaattgga gaagcttttc aagaacttcg 12780
atgaatactc ttcggcgggg atttttgtga agaacggccc ggcaatttcc acaatatcta 12840
aagacatttt cggagaatgg aacgtgataa gagacaagtg gaatgcggag tatgatgaca 12900
tacacctgaa gaagaaggca gttgtgactg aaaaatacga agatgacagg agaaaaagct 12960
ttaaaaagat cgggtccttt tcactggaac agctgcagga gtatgccgac gc 13012
<210> 282
<211> 3768
<212> DNA
<213> Lachnospiracea bacterium
<400> 282
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgg gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaag 3768
<210> 283
<211> 3768
<212> DNA
<213> 人工序列
<220>
<223> LbCpf1_RR
<400> 283
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgc gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgag ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaag 3768
<210> 284
<211> 3768
<212> DNA
<213> 人工序列
<220>
<223> LbCpf1_RVR
<400> 284
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgc gtgggtggga taaagacgta gagaccgatc gccgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaag 3768
<210> 285
<211> 13012
<212> DNA
<213> 人工序列
<220>
<223> pGEP767 expression plasmid
<400> 285
agcatgaatg cctgggggag aagaactcga gagggaattg cagatcatga ggcagatggc 60
tatttttgtg tcacatatgc gcaaaaagag aggctatatt tgtgtcccta ggttcttcgt 120
tgtattgcag tttccatatc aatctgactt ggtcgcatga gaaattgatg gttaaataat 180
ttgaatctct catgtagtat caactattag atattatttt caccaaatat atttccatcg 240
gagaagaaga ggctacagag gaagcagaag agaggggtgg gagaattttt acacttttgt 300
acacccactt aaacagcaaa atccgtatga aaacaggccc accaaaacaa tgccacgata 360
acaatccgta gaaacaaaag cttcatttaa cagcggcgca acaaagcacg cttatccatg 420
gtagttgtag tccgtatgcg atccaaagat cacgattcac gcgtgacgga cggacgacgc 480
gtgccacacc acaactaacg gcatccatgg tagttgtagt ccgtatgcga tccaaagatc 540
acgattcacg cgtgacggac ggacgacgcg cgccacacca caactaacag cgtgagccag 600
cgtccaaact ccggatggca acggggacga aacccgtcgg gtagtcactg cccaaacccg 660
tccccgcaac cttcatccca aacccgtccc cgtttccggt cgcgggtttc agttttctac 720
cagacccgtc cccatcgggt ttttcatccc cgtcgggaaa tccgaacccg ccagcatttc 780
agcaccaagc caaagttgca gcagcaacat gaataaaaaa caacccgttt caacaccaag 840
ataaaacaaa acattataat ttagacaaca tttcacacgt ataacaataa catatagttc 900
tcacatataa caacaccatt tcacacataa aacaacacca tttgggataa aaatatgggc 960
tatatcaggc catttttatg ggccatattg agttttcgtg ggtttcacag gtaccggatt 1020
tgtagaatgc tgaaccgggt ttgaaccgta aaatccgcgg gtattgaatt tgacccaatc 1080
ccgtcgtccc ctggtggggt aaaaacacca tcttgagtcc aaacggccac caaccaaact 1140
ccgacggcaa caaacaaacg gcgttgcttt gctcctcggt atctccgtga ccgctcaatc 1200
tcccggctgt ttccccggaa ttgcgtggac tctctcatcc acacgcaaac cgcctctccc 1260
tcctctctcg tcctatccgc cccggtgccg tagcctcacg ggactcttct tcctcccttg 1320
ctataaaatc cccgccccct cccgtctcct ctccacacat ccaaactctc aatcgcaccg 1380
agaaaaatct cctagcgatc gaagcgaagc ctctcccgat cctctcaagg tacgcccgtt 1440
tcccgtcgat cctcctcctt ccgttcgtgt tctgtagccg atcgattcga ttcccttaca 1500
cccgttcgtg ttctctcgtg gatcgatcga ttgtttgttg ctagaaggaa ctcgtagatc 1560
tggcgtttat gaactgtgat tcgggttagt ccagatcgat tcaggtcggt cgtcgttgag 1620
cctctcggct atgtctggat tatcgtgtag atctgctggt tcagttgatt atgttcttct 1680
aggagtaatt tcgttgggtc agcgcgattt ctgcttaatc tatgctgctt attgcgcctg 1740
tacctatcta ctaagctatg tgcacctgta attttgctag attattcgtt catcctcgta 1800
gttggtttgt cacagtaatc cgtatgggtt ctgacgatgt tattgttggt catacctagg 1860
cttctccaga ttttattttg ttaaaattgg atagatctgc tactgatagt tgatgatgga 1920
atttggtgct gaatctatgc tatttattgc gcctatacct gatctatcgg gctatgtacg 1980
gctgtagttt actggattat tcgttcatcc tcggtagttg gttcatcgtt tgggttctga 2040
cgataatatt gttgattatg cgtaggcttc tgcagattgt tgttaaaatt ggatacatcg 2100
gttactgatg gttgatgata gatttgtgct gaacctatct gtttattgct cctatacctg 2160
atctataggg ctatgtatgc ctgtaattta ccagattatt cgttcatcct cgtagttggt 2220
tcatctctat aattcgtatg ggttcttatg atgttatcgt tgattatgcc tagtcttata 2280
cagattattg tgtcaagatt gaatatacct gctactgatc ggtgataatt tggttagtag 2340
tttgcaatct gctaggaaca cgttaccact gtaatctgta aacatggttt gccagagtag 2400
tttgttctac tactcttgat atggttgctg attttagtcg cctccttttg gatcatgtat 2460
tgatgtcctt gcagatttcc gtgtacttac cccggctttt gtgtacttcg tgttaacagg 2520
tcgggtaccg aagcaaacat ggcatctagc atggcaccaa agaaaaaaag gaaagtttcc 2580
aaacttgaaa aatttacaaa ctgctactcc ctttccaaga cgcttaggtt taaagcgatc 2640
cccgttggca agacccaaga gaatatcgat aacaaaagac ttctggtcga agatgaaaaa 2700
agggccgaag actacaaggg ggtcaagaag ttgctcgatc gctattatct ttcctttatc 2760
aacgatgtgc ttcattcaat caaactgaag aacttgaata actacattag ccttttcaga 2820
aagaaaacga ggactgaaaa ggagaacaag gaacttgaga atcttgaaat aaaccttcgc 2880
aaagaaattg caaaagcctt caaggggaac gaaggatata aatctctttt caaaaaagac 2940
attatagaaa caattttgcc tgagtttctt gacgacaagg atgaaattgc gctcgtcaat 3000
agctttaacg gatttacaac tgccttcaca gggttcttcg acaataggga gaatatgttt 3060
agcgaggagg caaaaagcac atccatcgca ttcagatgca tcaatgaaaa tcttacccgg 3120
tacatatcga atatggacat atttgaaaaa gtggatgcaa tattcgataa gcacgaagtc 3180
caggagataa aggaaaagat actgaatagc gactatgatg tcgaagattt tttcgaaggt 3240
gagttcttca actttgtcct gactcaagaa ggcattgatg tctataatgc aataattgga 3300
ggttttgtga ctgagtctgg cgagaagata aagggcttga acgagtatat caatctctac 3360
aaccagaaga ctaagcaaaa gttgcctaaa tttaaaccgc tttacaagca agttttgagc 3420
gaccgggaaa gcctttcctt ttacggtgaa ggatacacga gcgatgaaga agtcctcgaa 3480
gtcttccgca acacactcaa caagaactca gaaatctttt cctcaattaa aaaattggag 3540
aagcttttca agaacttcga tgaatactct tcggcgggga tttttgtgaa gaacggcccg 3600
gcaatttcca caatatctaa agacattttc ggagaatgga acgtgataag agacaagtgg 3660
aatgcggagt atgatgacat acacctgaag aagaaggcag ttgtgactga aaaatacgaa 3720
gatgacagga gaaaaagctt taaaaagatc gggtcctttt cactggaaca gctgcaggag 3780
tatgccgacg ccgatctttc ggttgtcgaa aagctcaaag aaataattat ccagaaggtc 3840
gatgaaatct acaaggtgta cggctcaagc gagaagctct ttgatgctga cttcgtgttg 3900
gagaagtctc ttaaaaaaaa cgacgcagtc gtcgcgataa tgaaagattt gctggattca 3960
gtgaaatcct tcgagaatta tatcaaagcc ttcttcggcg aggggaagga gacaaacagg 4020
gatgagtcct tctatggaga cttcgttctg gcttacgaca tccttcttaa ggtcgaccac 4080
atctatgacg caattcggaa ctatgtgacg cagaagccgt attcgaaaga taagttcaag 4140
ctctatttcc aaaaccctca atttatgggt gggtgggata aagacaaaga gaccgattac 4200
cgggcaacaa ttttgcggta cgggtctaaa tattacctcg ctataatgga taagaaatac 4260
gctaaatgtc tccagaaaat tgacaaagat gacgtcaacg gcaattatga aaaaatcaat 4320
tataaactcc ttcctggccc aaataaaatg ctcccgaagg tgtttttttc caaaaagtgg 4380
atggcctatt ataatccatc agaggatatt cagaaaatct ataaaaatgg gacctttaag 4440
aagggtgaca tgtttaacct gaacgattgc cacaagctta tagatttttt caaagactct 4500
attagccgct atcccaaatg gtctaatgct tatgatttca acttctctga aactgaaaag 4560
tacaaagata ttgcaggatt ctaccgcgaa gttgaagaac aaggttataa ggtttccttt 4620
gagtctgcgt ccaagaaaga ggtcgataag ttggtcgaag aagggaaatt gtatatgttt 4680
caaatttaca ataaagactt ttccgacaag tcccatggta cacctaatct gcataccatg 4740
tacttcaaac tgctgttcga tgagaataat cacggtcaga ttcgcctgag cggaggggcg 4800
gaactcttca tgaggagagc atcgttgaaa aaagaggagc tcgtcgtgca tccggctaac 4860
agccccattg ctaacaagaa tccggataat ccaaagaaga ctactaccct ctcctatgac 4920
gtctataagg ataagagatt ctctgaggac cagtacgagt tgcacatccc tattgcgata 4980
aataaatgcc ctaagaacat ctttaaaatc aatactgagg tcagagtcct gcttaagcac 5040
gacgacaacc cgtatgtgat cgggattgct aggggtgaaa ggaacttgct ttatattgtg 5100
gttgtcgatg gaaaaggtaa tatagtggaa caatactctc tgaatgaaat tatcaacaac 5160
ttcaatggca ttaggatcaa gaccgactat cattctctgt tggacaagaa agagaaagag 5220
cgcttcgagg cacggcaaaa ctggacgtct attgagaaca tcaaggagct taaggctggt 5280
tacatttctc aggttgtgca caaaatttgc gaactggtcg agaaatatga tgccgttatc 5340
gcacttgaag atctcaacag cggatttaag aattctcggg tgaaagtcga aaaacaggtg 5400
tatcaaaaat tcgaaaagat gctgatcgac aagctcaatt atatggttga taaaaagagc 5460
aacccatgcg ccacgggggg tgcgcttaag ggctatcaga ttacgaacaa atttgaatcc 5520
ttcaagtcaa tgtcgacgca aaatgggttt atattctata taccggcgtg gcttacatct 5580
aaaatagatc ctagcactgg gttcgtgaac ctgctgaaaa ccaagtacac ttcaatcgca 5640
gattctaaaa aatttataag cagcttcgac agaatcatgt atgtgcccga ggaagacctc 5700
ttcgagtttg cccttgatta caaaaatttc tcaagaacgg atgcagacta cataaagaag 5760
tggaagctgt actcttatgg gaaccggatt cggatattca gaaatccgaa aaaaaacaat 5820
gtctttgatt gggaggaagt ttgtcttacc tctgcttaca aagagctgtt caataaatat 5880
ggcattaatt accagcaagg tgatatccgg gcgctccttt gcgaacagtc tgacaaagct 5940
ttctattctt catttatggc gctcatgtca ttgatgctgc agatgaggaa tagcattacg 6000
gggaggactg atgttgactt tctgatctcg cccgtgaaaa attctgatgg aatcttctac 6060
gattccagga attatgaggc ccaggaaaat gctatccttc ccaagaacgc agacgcaaat 6120
ggcgcgtaca atatagctcg caaggttttg tgggctatag gccaattcaa gaaagccgaa 6180
gacgaaaagc tggacaaagt taagattgct atatctaaca aagagtggct tgagtatgcg 6240
caaacatctg ttaaacacaa acgccccgcg gctacaaaga aggctggcca ggccaagaag 6300
aagaagggct cggggtcggg gtcgggctcg ggctcggacg ccctggacga cttcgacctc 6360
gacatgctgg gctccgacgc cctcgatgat ttcgacctcg atatgctcgg cagcgacgcg 6420
ctcgatgact tcgacctcga tatgctgggg agcgacgccc tcgacgattt tgacctcgat 6480
atgctgatca actcccgctc cagcggcagc ccgaagaaga agcgcaaagt gggctcgcag 6540
tacctgcccg acaccgacga caggcacagg atcgaggaga agcgcaagag gacgtacgag 6600
accttcaagt ccatcatgaa gaagtccccg ttcagcggcc caacggaccc ccgcccgccg 6660
ccgaggagga tcgccgtgcc gtccaggtcc agcgcgtcgg tccccaagcc ggccccgcag 6720
ccctacccgt tcacgtccag cctcagcacc atcaactacg acgagttccc caccatggtg 6780
ttcccgtccg gccagatctc ccaggccagc gcgctggccc ccgcgccccc gcaggtgctg 6840
ccccaggctc cggcccccgc tccggccccg gccatggtct ccgcgctggc ccaggcgccc 6900
gccccggtgc ccgtcctcgc gccgggcccg ccgcaggcgg tcgccccgcc agcgccgaag 6960
cccacgcagg ccggcgaggg caccctcagc gaggcgctcc tgcagctgca gttcgacgac 7020
gaggacctcg gcgccctcct gggcaactcg accgaccccg ccgtgttcac cgacctggcc 7080
tccgtcgaca acagcgagtt ccagcagctg ctgaaccagg gcatcccggt ggcgccgcac 7140
accacggagc ccatgctgat ggagtacccg gaggcgatca cgcgcctcgt caccggcgcc 7200
cagaggcccc cggaccccgc cccggccccg ctcggcgccc caggcctgcc gaacggcctc 7260
ctgagcggcg acgaggactt ctccagcatc gcggacatgg acttctccgc cctcctgggg 7320
tcgggctcgg gcagccgcga cagcagggag ggcatgttcc tcccaaagcc cgaggccggc 7380
tccgccatct cggacgtgtt cgagggcagg gaggtctgcc agccaaagcg catcaggccg 7440
ttccacccgc cgggctcccc gtgggcgaac cggccgctcc ccgccagcct ggctccaacc 7500
ccgaccggcc ccgtgcacga gccggtcggc agcctgacgc ccgcgccggt gccccagccg 7560
ctcgaccccg cgccggccgt cacccccgag gcctcccacc tcctggagga ccccgacgag 7620
gagacctcgc aggccgtgaa ggccctgagg gagatggccg acaccgtcat cccccagaag 7680
gaggaggcgg ccatctgcgg ccagatggac ctgtcgcacc cgccgccgcg cggccacctc 7740
gacgagctga ccacgaccct cgagtccatg accgaggacc tcaacctgga cagccccctc 7800
acgccggagc tgaacgagat cctcgacacc ttcctgaacg acgagtgcct cctgcacgcc 7860
atgcacatct ccacgggcct gagcatcttc gacaccagcc tcttctgagt cgaccgatcg 7920
ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 7980
tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 8040
gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 8100
agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 8160
actagatcga tcccgggata tcgcggccgg tcgttcggct gcggcgagcg gtatcagctc 8220
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 8280
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 8340
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 8400
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 8460
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 8520
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 8580
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 8640
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 8700
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 8760
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 8820
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 8880
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 8940
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 9000
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 9060
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 9120
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 9180
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 9240
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 9300
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 9360
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 9420
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 9480
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 9540
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 9600
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 9660
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 9720
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 9780
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 9840
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 9900
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 9960
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 10020
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 10080
cacctgacgc gccctgtagc ggcacgtcta attcggggga tctggatttt agtactggat 10140
tttggtttta ggaattagaa attttattga tagaagtatt ttacaaatac aaatacatac 10200
taagggtttc ttatatgctc aacacatgag cgaaacccta taggaaccct aattccctta 10260
tctgggaact actcacacat tattatggag aaactcgagc ttgtcgatcg acatgatcag 10320
ggagccctag attatttgta tagttcatcc atgcccatta cgtcggtaaa tgccttctgc 10380
cactccttga agttaagttc ggtcttggaa tgtttcaact cagtcttacg gaacacgtac 10440
atgggttggt tcttaaggta gttagcggcc attggtttag cgaatgtgta ggtagtcctg 10500
gctgtagagc gatatctctt gccattgcct gtggtgtaag accatttgaa ggtactaatg 10560
atggtcttgt cgttagggta ggttttcttg gaccggcacc aatcagcggc agttaaggag 10620
ttggtcatga caggtccatc agcaggaaag cctgtcccct tcacttgggc ttctcctttg 10680
atgtggctcc cttcgtaagt gtaacggtag ttgacggtga gcgaagcacc gtcctcaaac 10740
tgcattgtcc tgtggacttg gtatccggag ccatcaacca tggctgcttg gaatggactc 10800
attccgtcag ggtatggaag gtattgatgg aatccgtagc caatgtgtgg caccagaatc 10860
catggagaaa actgaagatc acctttggtg ctcttgaggt tcagctcttc gtatccgtca 10920
ttagggttcc cagtgccttg tccgaccata tcgaagtcaa cgccgttgat ggaaccgaag 10980
atgtgaagct catgtgtggc tggaagcgaa gccatgttat cttcttctcc tttactcacg 11040
gaggacgcca tggtggcggg atcgcgccct atcgttcgta aatggtgaaa attttcagaa 11100
aattgctttt gctttaaaag aaatgattta aattgctgca atagaagtag aatgcttgat 11160
tgcttgagat tcgtttgttt tgtatatgtt gtgttgagag gatcctctag agtcgacctg 11220
cagaagtaac accaaacaac agggtgagca tcgacaaaag aaacagtacc aagcaaataa 11280
atagcgtatg aaggcagggc taaaaaaatc cacatatagc tgctgcatat gccatcatcc 11340
aagtatatca agatcaaaat aattataaaa catacttgtt tattataata gataggtact 11400
caaggttaga gcatatgaat agatgctgca tatgccatca tgtatatgca tcagtaaaac 11460
ccacatcaac atgtatacct atcctagatc gatatttcca tccatcttaa actcgtaact 11520
atgaagatgt atgacacaca catacagttc caaaattaat aaatacacca ggtagtttga 11580
aacagtattc tactccgatc tagaacgaat gaacgaccgc ccaaccacac cacatcatca 11640
caaccaagcg aacaaaagca tctctgtata tgcatcagta aaacccgcat caacatgtat 11700
acctatccta gatcgatatt tccatccatc atcttcaatt cgtaactatg aatatgtatg 11760
gcacacacat acagatccaa aattaataaa tccaccaggt agtttgaaac agaattctac 11820
tccgatctag aacgaccgcc caaccagacc acatcatcac aaccaagaca aaaaaaagca 11880
tgaaaagatg acccgacaaa caagtgcacg gcatatattg aaataaagga aaagggcaaa 11940
ccaaacccta tgcaacgaaa caaaaaaaat catgaaatcg atcccgtctg cggaacggct 12000
agagccatcc caggattccc caaagagaaa cactggcaag ttagcaatca gaacgtgtct 12060
gacgtacagg tcgcatccgt gtacgaacgc tagcagcacg gatctaacac aaacacggat 12120
ctaacacaaa catgaacaga agtagaacta ccgggcccta accatggacc ggaacgccga 12180
tctagagaag gtagagaggg ggggggagga cgagcggcgt accttgaagc ggaggtgccg 12240
acgggtggat ttgggggaga tccactagtt ctagagcggc cgccaccgcg gtggaattct 12300
cgaggtcctc tccaaatgaa atgaacttcc ttatatagag gaagggtctt gcgaaggata 12360
gtgggattgt gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga 12420
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt 12480
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca 12540
tttgtaggtg ccaccttcct tttctactgt ccttttgatc aagtgaccga tagctgggca 12600
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa tagccctttg 12660
gtcttctgag actgtatctt tgatattctt ggagtagacg agagtgtcgt gctccaccat 12720
gttatcacat caattcactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 12780
gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 12840
agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 12900
tttgatcaag tgacagatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 12960
ttgttgaaaa gtctcaatag ccctttggtc ttctgagact tgcaggcaag ca 13012
<210> 286
<211> 13013
<212> DNA
<213> 人工序列
<220>
<223> pGEP772 expression plasmid
<400> 286
cgatctttcg gttgtcgaaa agctcaaaga aataattatc cagaaggtcg atgaaatcta 60
caaggtgtac ggctcaagcg agaagctctt tgatgctgac ttcgtgttgg agaagtctct 120
taaaaaaaac gacgcagtcg tcgcgataat gaaagatttg ctggattcag tgaaatcctt 180
cgagaattat atcaaagcct tcttcggcga ggggaaggag acaaacaggg atgagtcctt 240
ctatggagac ttcgttctgg cttacgacat ccttcttaag gtcgaccaca tctatgacgc 300
aattcggaac tatgtgacgc agaagccgta ttcgaaagat aagttcaagc tctatttcca 360
aaaccctcaa tttatgcgtg ggtgggataa agacaaagag accgattacc gggcaacaat 420
tttgcggtac gggtctaaat attacctcgc tataatggat aagaaatacg ctaaatgtct 480
ccagaaaatt gacaaagatg acgtcaacgg caattatgaa aaaatcaatt ataaactcct 540
tcctggccca aataaaatgc tcccgagggt gtttttttcc aaaaagtgga tggcctatta 600
taatccatca gaggatattc agaaaatcta taaaaatggg acctttaaga agggtgacat 660
gtttaacctg aacgattgcc acaagcttat agattttttc aaagactcta ttagccgcta 720
tcccaaatgg tctaatgctt atgatttcaa cttctctgaa actgaaaagt acaaagatat 780
tgcaggattc taccgcgaag ttgaagaaca aggttataag gtttcctttg agtctgcgtc 840
caagaaagag gtcgataagt tggtcgaaga agggaaattg tatatgtttc aaatttacaa 900
taaagacttt tccgacaagt cccatggtac acctaatctg cataccatgt acttcaaact 960
gctgttcgat gagaataatc acggtcagat tcgcctgagc ggaggggcgg aactcttcat 1020
gaggagagca tcgttgaaaa aagaggagct cgtcgtgcat ccggctaaca gccccattgc 1080
taacaagaat ccggataatc caaagaagac tactaccctc tcctatgacg tctataagga 1140
taagagattc tctgaggacc agtacgagtt gcacatccct attgcgataa ataaatgccc 1200
taagaacatc tttaaaatca atactgaggt cagagtcctg cttaagcacg acgacaaccc 1260
gtatgtgatc gggattgcta ggggtgaaag gaacttgctt tatattgtgg ttgtcgatgg 1320
aaaaggtaat atagtggaac aatactctct gaatgaaatt atcaacaact tcaatggcat 1380
taggatcaag accgactatc attctctgtt ggacaagaaa gagaaagagc gcttcgaggc 1440
acggcaaaac tggacgtcta ttgagaacat caaggagctt aaggctggtt acatttctca 1500
ggttgtgcac aaaatttgcg aactggtcga gaaatatgat gccgttatcg cacttgaaga 1560
tctcaacagc ggatttaaga attctcgggt gaaagtcgaa aaacaggtgt atcaaaaatt 1620
cgaaaagatg ctgatcgaca agctcaatta tatggttgat aaaaagagca acccatgcgc 1680
cacggggggt gcgcttaagg gctatcagat tacgaacaaa tttgaatcct tcaagtcaat 1740
gtcgacgcaa aatgggttta tattctatat accggcgtgg cttacatcta aaatagatcc 1800
tagcactggg ttcgtgaacc tgctgaaaac caagtacact tcaatcgcag attctaaaaa 1860
atttataagc agcttcgaca gaatcatgta tgtgcccgag gaagacctct tcgagtttgc 1920
ccttgattac aaaaatttct caagaacgga tgcagactac ataaagaagt ggaagctgta 1980
ctcttatggg aaccggattc ggatattcag aaatccgaaa aaaaacaatg tctttgattg 2040
ggaggaagtt tgtcttacct ctgcttacaa agagctgttc aataaatatg gcattaatta 2100
ccagcaaggt gatatccggg cgctcctttg cgaacagtct gacaaagctt tctattcttc 2160
atttatggcg ctcatgtcat tgatgctgca gatgaggaat agcattacgg ggaggactga 2220
tgttgacttt ctgatctcgc ccgtgaaaaa ttctgatgga atcttctacg attccaggaa 2280
ttatgaggcc caggaaaatg ctatccttcc caagaacgca gacgcaaatg gcgcgtacaa 2340
tatagctcgc aaggttttgt gggctatagg ccaattcaag aaagccgaag acgaaaagct 2400
ggacaaagtt aagattgcta tatctaacaa agagtggctt gagtatgcgc aaacatctgt 2460
taaacacaaa cgccccgcgg ctacaaagaa ggctggccag gccaagaaga agaagggctc 2520
ggggtcgggg tcgggctcgg gctcggacgc cctggacgac ttcgacctcg acatgctggg 2580
ctccgacgcc ctcgatgatt tcgacctcga tatgctcggc agcgacgcgc tcgatgactt 2640
cgacctcgat atgctgggga gcgacgccct cgacgatttt gacctcgata tgctgatcaa 2700
ctcccgctcc agcggcagcc cgaagaagaa gcgcaaagtg ggctcgcagt acctgcccga 2760
caccgacgac aggcacagga tcgaggagaa gcgcaagagg acgtacgaga ccttcaagtc 2820
catcatgaag aagtccccgt tcagcggccc aacggacccc cgcccgccgc cgaggaggat 2880
cgccgtgccg tccaggtcca gcgcgtcggt ccccaagccg gccccgcagc cctacccgtt 2940
cacgtccagc ctcagcacca tcaactacga cgagttcccc accatggtgt tcccgtccgg 3000
ccagatctcc caggccagcg cgctggcccc cgcgcccccg caggtgctgc cccaggctcc 3060
ggcccccgct ccggccccgg ccatggtctc cgcgctggcc caggcgcccg ccccggtgcc 3120
cgtcctcgcg ccgggcccgc cgcaggcggt cgccccgcca gcgccgaagc ccacgcaggc 3180
cggcgagggc accctcagcg aggcgctcct gcagctgcag ttcgacgacg aggacctcgg 3240
cgccctcctg ggcaactcga ccgaccccgc cgtgttcacc gacctggcct ccgtcgacaa 3300
cagcgagttc cagcagctgc tgaaccaggg catcccggtg gcgccgcaca ccacggagcc 3360
catgctgatg gagtacccgg aggcgatcac gcgcctcgtc accggcgccc agaggccccc 3420
ggaccccgcc ccggccccgc tcggcgcccc aggcctgccg aacggcctcc tgagcggcga 3480
cgaggacttc tccagcatcg cggacatgga cttctccgcc ctcctggggt cgggctcggg 3540
cagccgcgac agcagggagg gcatgttcct cccaaagccc gaggccggct ccgccatctc 3600
ggacgtgttc gagggcaggg aggtctgcca gccaaagcgc atcaggccgt tccacccgcc 3660
gggctccccg tgggcgaacc ggccgctccc cgccagcctg gctccaaccc cgaccggccc 3720
cgtgcacgag ccggtcggca gcctgacgcc cgcgccggtg ccccagccgc tcgaccccgc 3780
gccggccgtc acccccgagg cctcccacct cctggaggac cccgacgagg agacctcgca 3840
ggccgtgaag gccctgaggg agatggccga caccgtcatc ccccagaagg aggaggcggc 3900
catctgcggc cagatggacc tgtcgcaccc gccgccgcgc ggccacctcg acgagctgac 3960
cacgaccctc gagtccatga ccgaggacct caacctggac agccccctca cgccggagct 4020
gaacgagatc ctcgacacct tcctgaacga cgagtgcctc ctgcacgcca tgcacatctc 4080
cacgggcctg agcatcttcg acaccagcct cttctgagtc gaccgatcgt tcaaacattt 4140
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 4200
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 4260
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 4320
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgat 4380
cccgggatat cgcggccgcg tcgttaagct gcggcgagcg gtatcagctc actcaaaggc 4440
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4500
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4560
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4620
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4680
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4740
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4800
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4860
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4920
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4980
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 5040
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 5100
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 5160
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 5220
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 5280
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 5340
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 5400
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 5460
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 5520
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 5580
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 5640
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 5700
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 5760
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 5820
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5880
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5940
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 6000
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 6060
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 6120
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 6180
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 6240
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 6300
gccctgtagc ggcacgtcta attcggggga tctggatttt agtactggat tttggtttta 6360
ggaattagaa attttattga tagaagtatt ttacaaatac aaatacatac taagggtttc 6420
ttatatgctc aacacatgag cgaaacccta taggaaccct aattccctta tctgggaact 6480
actcacacat tattatggag aaactcgagc ttgtcgatcg acatgatcag ggagccctag 6540
attatttgta tagttcatcc atgcccatta cgtcggtaaa tgccttctgc cactccttga 6600
agttaagttc ggtcttggaa tgtttcaact cagtcttacg gaacacgtac atgggttggt 6660
tcttaaggta gttagcggcc attggtttag cgaatgtgta ggtagtcctg gctgtagagc 6720
gatatctctt gccattgcct gtggtgtaag accatttgaa ggtactaatg atggtcttgt 6780
cgttagggta ggttttcttg gaccggcacc aatcagcggc agttaaggag ttggtcatga 6840
caggtccatc agcaggaaag cctgtcccct tcacttgggc ttctcctttg atgtggctcc 6900
cttcgtaagt gtaacggtag ttgacggtga gcgaagcacc gtcctcaaac tgcattgtcc 6960
tgtggacttg gtatccggag ccatcaacca tggctgcttg gaatggactc attccgtcag 7020
ggtatggaag gtattgatgg aatccgtagc caatgtgtgg caccagaatc catggagaaa 7080
actgaagatc acctttggtg ctcttgaggt tcagctcttc gtatccgtca ttagggttcc 7140
cagtgccttg tccgaccata tcgaagtcaa cgccgttgat ggaaccgaag atgtgaagct 7200
catgtgtggc tggaagcgaa gccatgttat cttcttctcc tttactcacg gaggacgcca 7260
tggtggcggg atcgcgccct atcgttcgta aatggtgaaa attttcagaa aattgctttt 7320
gctttaaaag aaatgattta aattgctgca atagaagtag aatgcttgat tgcttgagat 7380
tcgtttgttt tgtatatgtt gtgttgagag gatcctcaag cttcgacctg cagaagtaac 7440
accaaacaac agggtgagca tcgacaaaag aaacagtacc aagcaaataa atagcgtatg 7500
aaggcagggc taaaaaaatc cacatatagc tgctgcatat gccatcatcc aagtatatca 7560
agatcaaaat aattataaaa catacttgtt tattataata gataggtact caaggttaga 7620
gcatatgaat agatgctgca tatgccatca tgtatatgca tcagtaaaac ccacatcaac 7680
atgtatacct atcctagatc gatatttcca tccatcttaa actcgtaact atgaagatgt 7740
atgacacaca catacagttc caaaattaat aaatacacca ggtagtttga aacagtattc 7800
tactccgatc tagaacgaat gaacgaccgc ccaaccacac cacatcatca caaccaagcg 7860
aacaaaagca tctctgtata tgcatcagta aaacccgcat caacatgtat acctatccta 7920
gatcgatatt tccatccatc atcttcaatt cgtaactatg aatatgtatg gcacacacat 7980
acagatccaa aattaataaa tccaccaggt agtttgaaac agaattctac tccgatctag 8040
aacgaccgcc caaccagacc acatcatcac aaccaagaca aaaaaaagca tgaaaagatg 8100
acccgacaaa caagtgcacg gcatatattg aaataaagga aaagggcaaa ccaaacccta 8160
tgcaacgaaa caaaaaaaat catgaaatcg atcccgtctg cggaacggct agagccatcc 8220
caggattccc caaagagaaa cactggcaag ttagcaatca gaacgtgtct gacgtacagg 8280
tcgcatccgt gtacgaacgc tagcagcacg gatctaacac aaacacggat ctaacacaaa 8340
catgaacaga agtagaacta ccgggcccta accatggacc ggaacgccga tctagagaag 8400
gtagagaggg ggggggagga cgagcggcgt accttgaagc ggaggtgccg acgggtggat 8460
ttgggggaga tccactagtt ctagagcggc cgccaccgcg gtggaattct cgaggtcctc 8520
tccaaatgaa atgaacttcc ttatatagag gaagggtctt gcgaaggata gtgggattgt 8580
gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga agacgtggtt 8640
ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt gggaccactg 8700
tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca tttgtaggtg 8760
ccaccttcct tttctactgt ccttttgatc aagtgaccga tagctgggca atggaatccg 8820
aggaggtttc ccgatattac cctttgttga aaagtctcaa tagccctttg gtcttctgag 8880
actgtatctt tgatattctt ggagtagacg agagtgtcgt gctccaccat gttatcacat 8940
caattcactt gctttgaaga cgtggttgga acgtcttctt tttccacgat gctcctcgtg 9000
ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat agcctttcct 9060
ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct tttgatcaag 9120
tgacagatag ctgggcaatg gaatccgagg aggtttcccg atattaccct ttgttgaaaa 9180
gtctcaatag ccctttggtc ttctgagact tgcaggcaag caagcatgaa tgcctggggg 9240
agaagaactc gagagggaat tgcagatcat gaggcagatg gctatttttg tgtcacatat 9300
gcgcaaaaag agaggctata tttgtgtccc taggttcttc gttgtattgc agtttccata 9360
tcaatctgac ttggtcgcat gagaaattga tggttaaata atttgaatct ctcatgtagt 9420
atcaactatt agatattatt ttcaccaaat atatttccat cggagaagaa gaggctacag 9480
aggaagcaga agagaggggt gggagaattt ttacactttt gtacacccac ttaaacagca 9540
aaatccgtat gaaaacaggc ccaccaaaac aatgccacga taacaatccg tagaaacaaa 9600
agcttcattt aacagcggcg caacaaagca cgcttatcca tggtagttgt agtccgtatg 9660
cgatccaaag atcacgattc acgcgtgacg gacggacgac gcgtgccaca ccacaactaa 9720
cggcatccat ggtagttgta gtccgtatgc gatccaaaga tcacgattca cgcgtgacgg 9780
acggacgacg cgcgccacac cacaactaac agcgtgagcc agcgtccaaa ctccggatgg 9840
caacggggac gaaacccgtc gggtagtcac tgcccaaacc cgtccccgca accttcatcc 9900
caaacccgtc cccgtttccg gtcgcgggtt tcagttttct accagacccg tccccatcgg 9960
gtttttcatc cccgtcggga aatccgaacc cgccagcatt tcagcaccaa gccaaagttg 10020
cagcagcaac atgaataaaa aacaacccgt ttcaacacca agataaaaca aaacattata 10080
atttagacaa catttcacac gtataacaat aacatatagt tctcacatat aacaacacca 10140
tttcacacat aaaacaacac catttgggat aaaaatatgg gctatatcag gccattttta 10200
tgggccatat tgagttttcg tgggtttcac aggtaccgga tttgtagaat gctgaaccgg 10260
gtttgaaccg taaaatccgc gggtattgaa tttgacccaa tcccgtcgtc ccctggtggg 10320
gtaaaaacac catcttgagt ccaaacggcc accaaccaaa ctccgacggc aacaaacaaa 10380
cggcgttgct ttgctcctcg gtatctccgt gaccgctcaa tctcccggct gtttccccgg 10440
aattgcgtgg actctctcat ccacacgcaa accgcctctc cctcctctct cgtcctatcc 10500
gccccggtgc cgtagcctca cgggactctt cttcctccct tgctataaaa tccccgcccc 10560
ctcccgtctc ctctccacac atccaaactc tcaatcgcac cgagaaaaat ctcctagcga 10620
tcgaagcgaa gcctctcccg atcctctcaa ggtacgcccg tttcccgtcg atcctcctcc 10680
ttccgttcgt gttctgtagc cgatcgattc gattccctta cacccgttcg tgttctctcg 10740
tggatcgatc gattgtttgt tgctagaagg aactcgtaga tctggcgttt atgaactgtg 10800
attcgggtta gtccagatcg attcaggtcg gtcgtcgttg agcctctcgg ctatgtctgg 10860
attatcgtgt agatctgctg gttcagttga ttatgttctt ctaggagtaa tttcgttggg 10920
tcagcgcgat ttctgcttaa tctatgctgc ttattgcgcc tgtacctatc tactaagcta 10980
tgtgcacctg taattttgct agattattcg ttcatcctcg tagttggttt gtcacagtaa 11040
tccgtatggg ttctgacgat gttattgttg gtcataccta ggcttctcca gattttattt 11100
tgttaaaatt ggatagatct gctactgata gttgatgatg gaatttggtg ctgaatctat 11160
gctatttatt gcgcctatac ctgatctatc gggctatgta cggctgtagt ttactggatt 11220
attcgttcat cctcggtagt tggttcatcg tttgggttct gacgataata ttgttgatta 11280
tgcgtaggct tctgcagatt gttgttaaaa ttggatacat cggttactga tggttgatga 11340
tagatttgtg ctgaacctat ctgtttattg ctcctatacc tgatctatag ggctatgtat 11400
gcctgtaatt taccagatta ttcgttcatc ctcgtagttg gttcatctct ataattcgta 11460
tgggttctta tgatgttatc gttgattatg cctagtctta tacagattat tgtgtcaaga 11520
ttgaatatac ctgctactga tcggtgataa tttggttagt agtttgcaat ctgctaggaa 11580
cacgttacca ctgtaatctg taaacatggt ttgccagagt agtttgttct actactcttg 11640
atatggttgc tgattttagt cgcctccttt tggatcatgt attgatgtcc ttgcagattt 11700
ccgtgtactt accccggctt ttgtgtactt cgtgttaaca ggtcgggtac cgaagcaaac 11760
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 11820
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 11880
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 11940
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 12000
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 12060
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 12120
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 12180
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 12240
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 12300
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 12360
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 12420
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 12480
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 12540
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 12600
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 12660
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 12720
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 12780
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 12840
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 12900
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 12960
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgc 13013
<210> 287
<211> 13012
<212> DNA
<213> 人工序列
<220>
<223> pGEP761 expression plasmid
<400> 287
cgatctttcg gttgtcgaaa agctcaaaga aataattatc cagaaggtcg atgaaatcta 60
caaggtgtac ggctcaagcg agaagctctt tgatgctgac ttcgtgttgg agaagtctct 120
taaaaaaaac gacgcagtcg tcgcgataat gaaagatttg ctggattcag tgaaatcctt 180
cgagaattat atcaaagcct tcttcggcga ggggaaggag acaaacaggg atgagtcctt 240
ctatggagac ttcgttctgg cttacgacat ccttcttaag gtcgaccaca tctatgacgc 300
aattcggaac tatgtgacgc agaagccgta ttcgaaagat aagttcaagc tctatttcca 360
aaaccctcaa tttatgcgtg ggtgggataa agacgtagag accgatcgcc gggcaacaat 420
tttgcggtac gggtctaaat attacctcgc tataatggat aagaaatacg ctaaatgtct 480
ccagaaaatt gacaaagatg acgtcaacgg caattatgaa aaaatcaatt ataaactcct 540
tcctggccca aataaaatgc tcccgaaggt gtttttttcc aaaaagtgga tggcctatta 600
taatccatca gaggatattc agaaaatcta taaaaatggg acctttaaga agggtgacat 660
gtttaacctg aacgattgcc acaagcttat agattttttc aaagactcta ttagccgcta 720
tcccaaatgg tctaatgctt atgatttcaa cttctctgaa actgaaaagt acaaagatat 780
tgcaggattc taccgcgaag ttgaagaaca aggttataag gtttcctttg agtctgcgtc 840
caagaaagag gtcgataagt tggtcgaaga agggaaattg tatatgtttc aaatttacaa 900
taaagacttt tccgacaagt cccatggtac acctaatctg cataccatgt acttcaaact 960
gctgttcgat gagaataatc acggtcagat tcgcctgagc ggaggggcgg aactcttcat 1020
gaggagagca tcgttgaaaa aagaggagct cgtcgtgcat ccggctaaca gccccattgc 1080
taacaagaat ccggataatc caaagaagac tactaccctc tcctatgacg tctataagga 1140
taagagattc tctgaggacc agtacgagtt gcacatccct attgcgataa ataaatgccc 1200
taagaacatc tttaaaatca atactgaggt cagagtcctg cttaagcacg acgacaaccc 1260
gtatgtgatc gggattgcta ggggtgaaag gaacttgctt tatattgtgg ttgtcgatgg 1320
aaaaggtaat atagtggaac aatactctct gaatgaaatt atcaacaact tcaatggcat 1380
taggatcaag accgactatc attctctgtt ggacaagaaa gagaaagagc gcttcgaggc 1440
acggcaaaac tggacgtcta ttgagaacat caaggagctt aaggctggtt acatttctca 1500
ggttgtgcac aaaatttgcg aactggtcga gaaatatgat gccgttatcg cacttgaaga 1560
tctcaacagc ggatttaaga attctcgggt gaaagtcgaa aaacaggtgt atcaaaaatt 1620
cgaaaagatg ctgatcgaca agctcaatta tatggttgat aaaaagagca acccatgcgc 1680
cacggggggt gcgcttaagg gctatcagat tacgaacaaa tttgaatcct tcaagtcaat 1740
gtcgacgcaa aatgggttta tattctatat accggcgtgg cttacatcta aaatagatcc 1800
tagcactggg ttcgtgaacc tgctgaaaac caagtacact tcaatcgcag attctaaaaa 1860
atttataagc agcttcgaca gaatcatgta tgtgcccgag gaagacctct tcgagtttgc 1920
ccttgattac aaaaatttct caagaacgga tgcagactac ataaagaagt ggaagctgta 1980
ctcttatggg aaccggattc ggatattcag aaatccgaaa aaaaacaatg tctttgattg 2040
ggaggaagtt tgtcttacct ctgcttacaa agagctgttc aataaatatg gcattaatta 2100
ccagcaaggt gatatccggg cgctcctttg cgaacagtct gacaaagctt tctattcttc 2160
atttatggcg ctcatgtcat tgatgctgca gatgaggaat agcattacgg ggaggactga 2220
tgttgacttt ctgatctcgc ccgtgaaaaa ttctgatgga atcttctacg attccaggaa 2280
ttatgaggcc caggaaaatg ctatccttcc caagaacgca gacgcaaatg gcgcgtacaa 2340
tatagctcgc aaggttttgt gggctatagg ccaattcaag aaagccgaag acgaaaagct 2400
ggacaaagtt aagattgcta tatctaacaa agagtggctt gagtatgcgc aaacatctgt 2460
taaacacaaa cgccccgcgg ctacaaagaa ggctggccag gccaagaaga agaagggctc 2520
ggggtcgggg tcgggctcgg gctcggacgc cctggacgac ttcgacctcg acatgctggg 2580
ctccgacgcc ctcgatgatt tcgacctcga tatgctcggc agcgacgcgc tcgatgactt 2640
cgacctcgat atgctgggga gcgacgccct cgacgatttt gacctcgata tgctgatcaa 2700
ctcccgctcc agcggcagcc cgaagaagaa gcgcaaagtg ggctcgcagt acctgcccga 2760
caccgacgac aggcacagga tcgaggagaa gcgcaagagg acgtacgaga ccttcaagtc 2820
catcatgaag aagtccccgt tcagcggccc aacggacccc cgcccgccgc cgaggaggat 2880
cgccgtgccg tccaggtcca gcgcgtcggt ccccaagccg gccccgcagc cctacccgtt 2940
cacgtccagc ctcagcacca tcaactacga cgagttcccc accatggtgt tcccgtccgg 3000
ccagatctcc caggccagcg cgctggcccc cgcgcccccg caggtgctgc cccaggctcc 3060
ggcccccgct ccggccccgg ccatggtctc cgcgctggcc caggcgcccg ccccggtgcc 3120
cgtcctcgcg ccgggcccgc cgcaggcggt cgccccgcca gcgccgaagc ccacgcaggc 3180
cggcgagggc accctcagcg aggcgctcct gcagctgcag ttcgacgacg aggacctcgg 3240
cgccctcctg ggcaactcga ccgaccccgc cgtgttcacc gacctggcct ccgtcgacaa 3300
cagcgagttc cagcagctgc tgaaccaggg catcccggtg gcgccgcaca ccacggagcc 3360
catgctgatg gagtacccgg aggcgatcac gcgcctcgtc accggcgccc agaggccccc 3420
ggaccccgcc ccggccccgc tcggcgcccc aggcctgccg aacggcctcc tgagcggcga 3480
cgaggacttc tccagcatcg cggacatgga cttctccgcc ctcctggggt cgggctcggg 3540
cagccgcgac agcagggagg gcatgttcct cccaaagccc gaggccggct ccgccatctc 3600
ggacgtgttc gagggcaggg aggtctgcca gccaaagcgc atcaggccgt tccacccgcc 3660
gggctccccg tgggcgaacc ggccgctccc cgccagcctg gctccaaccc cgaccggccc 3720
cgtgcacgag ccggtcggca gcctgacgcc cgcgccggtg ccccagccgc tcgaccccgc 3780
gccggccgtc acccccgagg cctcccacct cctggaggac cccgacgagg agacctcgca 3840
ggccgtgaag gccctgaggg agatggccga caccgtcatc ccccagaagg aggaggcggc 3900
catctgcggc cagatggacc tgtcgcaccc gccgccgcgc ggccacctcg acgagctgac 3960
cacgaccctc gagtccatga ccgaggacct caacctggac agccccctca cgccggagct 4020
gaacgagatc ctcgacacct tcctgaacga cgagtgcctc ctgcacgcca tgcacatctc 4080
cacgggcctg agcatcttcg acaccagcct cttctgagtc gaccgatcgt tcaaacattt 4140
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 4200
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 4260
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 4320
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgat 4380
cccgggatat cgcggccggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 4440
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 4500
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 4560
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4620
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4680
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4740
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4800
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4860
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4920
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4980
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 5040
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 5100
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 5160
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 5220
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 5280
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 5340
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 5400
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 5460
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 5520
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5580
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5640
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5700
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5760
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5820
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5880
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5940
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 6000
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 6060
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 6120
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 6180
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 6240
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg 6300
ccctgtagcg gcacgtctaa ttcgggggat ctggatttta gtactggatt ttggttttag 6360
gaattagaaa ttttattgat agaagtattt tacaaataca aatacatact aagggtttct 6420
tatatgctca acacatgagc gaaaccctat aggaacccta attcccttat ctgggaacta 6480
ctcacacatt attatggaga aactcgagct tgtcgatcga catgatcagg gagccctaga 6540
ttatttgtat agttcatcca tgcccattac gtcggtaaat gccttctgcc actccttgaa 6600
gttaagttcg gtcttggaat gtttcaactc agtcttacgg aacacgtaca tgggttggtt 6660
cttaaggtag ttagcggcca ttggtttagc gaatgtgtag gtagtcctgg ctgtagagcg 6720
atatctcttg ccattgcctg tggtgtaaga ccatttgaag gtactaatga tggtcttgtc 6780
gttagggtag gttttcttgg accggcacca atcagcggca gttaaggagt tggtcatgac 6840
aggtccatca gcaggaaagc ctgtcccctt cacttgggct tctcctttga tgtggctccc 6900
ttcgtaagtg taacggtagt tgacggtgag cgaagcaccg tcctcaaact gcattgtcct 6960
gtggacttgg tatccggagc catcaaccat ggctgcttgg aatggactca ttccgtcagg 7020
gtatggaagg tattgatgga atccgtagcc aatgtgtggc accagaatcc atggagaaaa 7080
ctgaagatca cctttggtgc tcttgaggtt cagctcttcg tatccgtcat tagggttccc 7140
agtgccttgt ccgaccatat cgaagtcaac gccgttgatg gaaccgaaga tgtgaagctc 7200
atgtgtggct ggaagcgaag ccatgttatc ttcttctcct ttactcacgg aggacgccat 7260
ggtggcggga tcgcgcccta tcgttcgtaa atggtgaaaa ttttcagaaa attgcttttg 7320
ctttaaaaga aatgatttaa attgctgcaa tagaagtaga atgcttgatt gcttgagatt 7380
cgtttgtttt gtatatgttg tgttgagagg atcctcaagc ttcgacctgc agaagtaaca 7440
ccaaacaaca gggtgagcat cgacaaaaga aacagtacca agcaaataaa tagcgtatga 7500
aggcagggct aaaaaaatcc acatatagct gctgcatatg ccatcatcca agtatatcaa 7560
gatcaaaata attataaaac atacttgttt attataatag ataggtactc aaggttagag 7620
catatgaata gatgctgcat atgccatcat gtatatgcat cagtaaaacc cacatcaaca 7680
tgtataccta tcctagatcg atatttccat ccatcttaaa ctcgtaacta tgaagatgta 7740
tgacacacac atacagttcc aaaattaata aatacaccag gtagtttgaa acagtattct 7800
actccgatct agaacgaatg aacgaccgcc caaccacacc acatcatcac aaccaagcga 7860
acaaaagcat ctctgtatat gcatcagtaa aacccgcatc aacatgtata cctatcctag 7920
atcgatattt ccatccatca tcttcaattc gtaactatga atatgtatgg cacacacata 7980
cagatccaaa attaataaat ccaccaggta gtttgaaaca gaattctact ccgatctaga 8040
acgaccgccc aaccagacca catcatcaca accaagacaa aaaaaagcat gaaaagatga 8100
cccgacaaac aagtgcacgg catatattga aataaaggaa aagggcaaac caaaccctat 8160
gcaacgaaac aaaaaaaatc atgaaatcga tcccgtctgc ggaacggcta gagccatccc 8220
aggattcccc aaagagaaac actggcaagt tagcaatcag aacgtgtctg acgtacaggt 8280
cgcatccgtg tacgaacgct agcagcacgg atctaacaca aacacggatc taacacaaac 8340
atgaacagaa gtagaactac cgggccctaa ccatggaccg gaacgccgat ctagagaagg 8400
tagagagggg gggggaggac gagcggcgta ccttgaagcg gaggtgccga cgggtggatt 8460
tgggggagat ccactagttc tagagcggcc gccaccgcgg tggaattctc gaggtcctct 8520
ccaaatgaaa tgaacttcct tatatagagg aagggtcttg cgaaggatag tgggattgtg 8580
cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa gacgtggttg 8640
gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg ggaccactgt 8700
cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat ttgtaggtgc 8760
caccttcctt ttctactgtc cttttgatca agtgaccgat agctgggcaa tggaatccga 8820
ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg tcttctgaga 8880
ctgtatcttt gatattcttg gagtagacga gagtgtcgtg ctccaccatg ttatcacatc 8940
aattcacttg ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg 9000
gtgggggtcc atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt 9060
tatcgcaatg atggcatttg taggtgccac cttccttttc tactgtcctt ttgatcaagt 9120
gacagatagc tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag 9180
tctcaatagc cctttggtct tctgagactt gcaggcaagc aagcatgaat gcctggggga 9240
gaagaactcg agagggaatt gcagatcatg aggcagatgg ctatttttgt gtcacatatg 9300
cgcaaaaaga gaggctatat ttgtgtccct aggttcttcg ttgtattgca gtttccatat 9360
caatctgact tggtcgcatg agaaattgat ggttaaataa tttgaatctc tcatgtagta 9420
tcaactatta gatattattt tcaccaaata tatttccatc ggagaagaag aggctacaga 9480
ggaagcagaa gagaggggtg ggagaatttt tacacttttg tacacccact taaacagcaa 9540
aatccgtatg aaaacaggcc caccaaaaca atgccacgat aacaatccgt agaaacaaaa 9600
gcttcattta acagcggcgc aacaaagcac gcttatccat ggtagttgta gtccgtatgc 9660
gatccaaaga tcacgattca cgcgtgacgg acggacgacg cgtgccacac cacaactaac 9720
ggcatccatg gtagttgtag tccgtatgcg atccaaagat cacgattcac gcgtgacgga 9780
cggacgacgc gcgccacacc acaactaaca gcgtgagcca gcgtccaaac tccggatggc 9840
aacggggacg aaacccgtcg ggtagtcact gcccaaaccc gtccccgcaa ccttcatccc 9900
aaacccgtcc ccgtttccgg tcgcgggttt cagttttcta ccagacccgt ccccatcggg 9960
tttttcatcc ccgtcgggaa atccgaaccc gccagcattt cagcaccaag ccaaagttgc 10020
agcagcaaca tgaataaaaa acaacccgtt tcaacaccaa gataaaacaa aacattataa 10080
tttagacaac atttcacacg tataacaata acatatagtt ctcacatata acaacaccat 10140
ttcacacata aaacaacacc atttgggata aaaatatggg ctatatcagg ccatttttat 10200
gggccatatt gagttttcgt gggtttcaca ggtaccggat ttgtagaatg ctgaaccggg 10260
tttgaaccgt aaaatccgcg ggtattgaat ttgacccaat cccgtcgtcc cctggtgggg 10320
taaaaacacc atcttgagtc caaacggcca ccaaccaaac tccgacggca acaaacaaac 10380
ggcgttgctt tgctcctcgg tatctccgtg accgctcaat ctcccggctg tttccccgga 10440
attgcgtgga ctctctcatc cacacgcaaa ccgcctctcc ctcctctctc gtcctatccg 10500
ccccggtgcc gtagcctcac gggactcttc ttcctccctt gctataaaat ccccgccccc 10560
tcccgtctcc tctccacaca tccaaactct caatcgcacc gagaaaaatc tcctagcgat 10620
cgaagcgaag cctctcccga tcctctcaag gtacgcccgt ttcccgtcga tcctcctcct 10680
tccgttcgtg ttctgtagcc gatcgattcg attcccttac acccgttcgt gttctctcgt 10740
ggatcgatcg attgtttgtt gctagaagga actcgtagat ctggcgttta tgaactgtga 10800
ttcgggttag tccagatcga ttcaggtcgg tcgtcgttga gcctctcggc tatgtctgga 10860
ttatcgtgta gatctgctgg ttcagttgat tatgttcttc taggagtaat ttcgttgggt 10920
cagcgcgatt tctgcttaat ctatgctgct tattgcgcct gtacctatct actaagctat 10980
gtgcacctgt aattttgcta gattattcgt tcatcctcgt agttggtttg tcacagtaat 11040
ccgtatgggt tctgacgatg ttattgttgg tcatacctag gcttctccag attttatttt 11100
gttaaaattg gatagatctg ctactgatag ttgatgatgg aatttggtgc tgaatctatg 11160
ctatttattg cgcctatacc tgatctatcg ggctatgtac ggctgtagtt tactggatta 11220
ttcgttcatc ctcggtagtt ggttcatcgt ttgggttctg acgataatat tgttgattat 11280
gcgtaggctt ctgcagattg ttgttaaaat tggatacatc ggttactgat ggttgatgat 11340
agatttgtgc tgaacctatc tgtttattgc tcctatacct gatctatagg gctatgtatg 11400
cctgtaattt accagattat tcgttcatcc tcgtagttgg ttcatctcta taattcgtat 11460
gggttcttat gatgttatcg ttgattatgc ctagtcttat acagattatt gtgtcaagat 11520
tgaatatacc tgctactgat cggtgataat ttggttagta gtttgcaatc tgctaggaac 11580
acgttaccac tgtaatctgt aaacatggtt tgccagagta gtttgttcta ctactcttga 11640
tatggttgct gattttagtc gcctcctttt ggatcatgta ttgatgtcct tgcagatttc 11700
cgtgtactta ccccggcttt tgtgtacttc gtgttaacag gtcgggtacc gaagcaaaca 11760
tggcatctag catggcacca aagaaaaaaa ggaaagtttc caaacttgaa aaatttacaa 11820
actgctactc cctttccaag acgcttaggt ttaaagcgat ccccgttggc aagacccaag 11880
agaatatcga taacaaaaga cttctggtcg aagatgaaaa aagggccgaa gactacaagg 11940
gggtcaagaa gttgctcgat cgctattatc tttcctttat caacgatgtg cttcattcaa 12000
tcaaactgaa gaacttgaat aactacatta gccttttcag aaagaaaacg aggactgaaa 12060
aggagaacaa ggaacttgag aatcttgaaa taaaccttcg caaagaaatt gcaaaagcct 12120
tcaaggggaa cgaaggatat aaatctcttt tcaaaaaaga cattatagaa acaattttgc 12180
ctgagtttct tgacgacaag gatgaaattg cgctcgtcaa tagctttaac ggatttacaa 12240
ctgccttcac agggttcttc gacaataggg agaatatgtt tagcgaggag gcaaaaagca 12300
catccatcgc attcagatgc atcaatgaaa atcttacccg gtacatatcg aatatggaca 12360
tatttgaaaa agtggatgca atattcgata agcacgaagt ccaggagata aaggaaaaga 12420
tactgaatag cgactatgat gtcgaagatt ttttcgaagg tgagttcttc aactttgtcc 12480
tgactcaaga aggcattgat gtctataatg caataattgg aggttttgtg actgagtctg 12540
gcgagaagat aaagggcttg aacgagtata tcaatctcta caaccagaag actaagcaaa 12600
agttgcctaa atttaaaccg ctttacaagc aagttttgag cgaccgggaa agcctttcct 12660
tttacggtga aggatacacg agcgatgaag aagtcctcga agtcttccgc aacacactca 12720
acaagaactc agaaatcttt tcctcaatta aaaaattgga gaagcttttc aagaacttcg 12780
atgaatactc ttcggcgggg atttttgtga agaacggccc ggcaatttcc acaatatcta 12840
aagacatttt cggagaatgg aacgtgataa gagacaagtg gaatgcggag tatgatgaca 12900
tacacctgaa gaagaaggca gttgtgactg aaaaatacga agatgacagg agaaaaagct 12960
ttaaaaagat cgggtccttt tcactggaac agctgcagga gtatgccgac gc 13012
<210> 288
<211> 5370
<212> DNA
<213> 人工序列
<220>
<223> dLbCpf1-VPR
<400> 288
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgg gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaaggg ctcggggtcg 3780
gggtcgggct cgggctcgga cgccctggac gacttcgacc tcgacatgct gggctccgac 3840
gccctcgatg atttcgacct cgatatgctc ggcagcgacg cgctcgatga cttcgacctc 3900
gatatgctgg ggagcgacgc cctcgacgat tttgacctcg atatgctgat caactcccgc 3960
tccagcggca gcccgaagaa gaagcgcaaa gtgggctcgc agtacctgcc cgacaccgac 4020
gacaggcaca ggatcgagga gaagcgcaag aggacgtacg agaccttcaa gtccatcatg 4080
aagaagtccc cgttcagcgg cccaacggac ccccgcccgc cgccgaggag gatcgccgtg 4140
ccgtccaggt ccagcgcgtc ggtccccaag ccggccccgc agccctaccc gttcacgtcc 4200
agcctcagca ccatcaacta cgacgagttc cccaccatgg tgttcccgtc cggccagatc 4260
tcccaggcca gcgcgctggc ccccgcgccc ccgcaggtgc tgccccaggc tccggccccc 4320
gctccggccc cggccatggt ctccgcgctg gcccaggcgc ccgccccggt gcccgtcctc 4380
gcgccgggcc cgccgcaggc ggtcgccccg ccagcgccga agcccacgca ggccggcgag 4440
ggcaccctca gcgaggcgct cctgcagctg cagttcgacg acgaggacct cggcgccctc 4500
ctgggcaact cgaccgaccc cgccgtgttc accgacctgg cctccgtcga caacagcgag 4560
ttccagcagc tgctgaacca gggcatcccg gtggcgccgc acaccacgga gcccatgctg 4620
atggagtacc cggaggcgat cacgcgcctc gtcaccggcg cccagaggcc cccggacccc 4680
gccccggccc cgctcggcgc cccaggcctg ccgaacggcc tcctgagcgg cgacgaggac 4740
ttctccagca tcgcggacat ggacttctcc gccctcctgg ggtcgggctc gggcagccgc 4800
gacagcaggg agggcatgtt cctcccaaag cccgaggccg gctccgccat ctcggacgtg 4860
ttcgagggca gggaggtctg ccagccaaag cgcatcaggc cgttccaccc gccgggctcc 4920
ccgtgggcga accggccgct ccccgccagc ctggctccaa ccccgaccgg ccccgtgcac 4980
gagccggtcg gcagcctgac gcccgcgccg gtgccccagc cgctcgaccc cgcgccggcc 5040
gtcacccccg aggcctccca cctcctggag gaccccgacg aggagacctc gcaggccgtg 5100
aaggccctga gggagatggc cgacaccgtc atcccccaga aggaggaggc ggccatctgc 5160
ggccagatgg acctgtcgca cccgccgccg cgcggccacc tcgacgagct gaccacgacc 5220
ctcgagtcca tgaccgagga cctcaacctg gacagccccc tcacgccgga gctgaacgag 5280
atcctcgaca ccttcctgaa cgacgagtgc ctcctgcacg ccatgcacat ctccacgggc 5340
ctgagcatct tcgacaccag cctcttctga 5370
<210> 289
<211> 5370
<212> DNA
<213> 人工序列
<220>
<223> LbCpf1(RR)-VPR
<400> 289
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgc gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgag ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaaggg ctcggggtcg 3780
gggtcgggct cgggctcgga cgccctggac gacttcgacc tcgacatgct gggctccgac 3840
gccctcgatg atttcgacct cgatatgctc ggcagcgacg cgctcgatga cttcgacctc 3900
gatatgctgg ggagcgacgc cctcgacgat tttgacctcg atatgctgat caactcccgc 3960
tccagcggca gcccgaagaa gaagcgcaaa gtgggctcgc agtacctgcc cgacaccgac 4020
gacaggcaca ggatcgagga gaagcgcaag aggacgtacg agaccttcaa gtccatcatg 4080
aagaagtccc cgttcagcgg cccaacggac ccccgcccgc cgccgaggag gatcgccgtg 4140
ccgtccaggt ccagcgcgtc ggtccccaag ccggccccgc agccctaccc gttcacgtcc 4200
agcctcagca ccatcaacta cgacgagttc cccaccatgg tgttcccgtc cggccagatc 4260
tcccaggcca gcgcgctggc ccccgcgccc ccgcaggtgc tgccccaggc tccggccccc 4320
gctccggccc cggccatggt ctccgcgctg gcccaggcgc ccgccccggt gcccgtcctc 4380
gcgccgggcc cgccgcaggc ggtcgccccg ccagcgccga agcccacgca ggccggcgag 4440
ggcaccctca gcgaggcgct cctgcagctg cagttcgacg acgaggacct cggcgccctc 4500
ctgggcaact cgaccgaccc cgccgtgttc accgacctgg cctccgtcga caacagcgag 4560
ttccagcagc tgctgaacca gggcatcccg gtggcgccgc acaccacgga gcccatgctg 4620
atggagtacc cggaggcgat cacgcgcctc gtcaccggcg cccagaggcc cccggacccc 4680
gccccggccc cgctcggcgc cccaggcctg ccgaacggcc tcctgagcgg cgacgaggac 4740
ttctccagca tcgcggacat ggacttctcc gccctcctgg ggtcgggctc gggcagccgc 4800
gacagcaggg agggcatgtt cctcccaaag cccgaggccg gctccgccat ctcggacgtg 4860
ttcgagggca gggaggtctg ccagccaaag cgcatcaggc cgttccaccc gccgggctcc 4920
ccgtgggcga accggccgct ccccgccagc ctggctccaa ccccgaccgg ccccgtgcac 4980
gagccggtcg gcagcctgac gcccgcgccg gtgccccagc cgctcgaccc cgcgccggcc 5040
gtcacccccg aggcctccca cctcctggag gaccccgacg aggagacctc gcaggccgtg 5100
aaggccctga gggagatggc cgacaccgtc atcccccaga aggaggaggc ggccatctgc 5160
ggccagatgg acctgtcgca cccgccgccg cgcggccacc tcgacgagct gaccacgacc 5220
ctcgagtcca tgaccgagga cctcaacctg gacagccccc tcacgccgga gctgaacgag 5280
atcctcgaca ccttcctgaa cgacgagtgc ctcctgcacg ccatgcacat ctccacgggc 5340
ctgagcatct tcgacaccag cctcttctga 5370
<210> 290
<211> 5370
<212> DNA
<213> 人工序列
<220>
<223> dLbCpf1(RVR)-VPR
<400> 290
atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60
aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120
gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180
ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240
atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300
aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360
ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420
cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480
actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540
acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600
atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660
atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720
ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780
ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840
aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900
ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960
aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020
gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080
aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140
atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200
tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260
tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320
tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380
aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440
tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500
gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560
aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620
caatttatgc gtgggtggga taaagacgta gagaccgatc gccgggcaac aattttgcgg 1680
tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740
attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800
ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860
tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920
ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980
tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040
ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100
gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160
ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220
gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280
gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340
aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400
ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460
atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520
atcgggattg ctaggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580
aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640
aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700
aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760
cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820
agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880
atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940
ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000
caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060
gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120
agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180
tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240
gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300
gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360
ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420
gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480
tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540
gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600
cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660
gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720
aaacgccccg cggctacaaa gaaggctggc caggccaaga agaagaaggg ctcggggtcg 3780
gggtcgggct cgggctcgga cgccctggac gacttcgacc tcgacatgct gggctccgac 3840
gccctcgatg atttcgacct cgatatgctc ggcagcgacg cgctcgatga cttcgacctc 3900
gatatgctgg ggagcgacgc cctcgacgat tttgacctcg atatgctgat caactcccgc 3960
tccagcggca gcccgaagaa gaagcgcaaa gtgggctcgc agtacctgcc cgacaccgac 4020
gacaggcaca ggatcgagga gaagcgcaag aggacgtacg agaccttcaa gtccatcatg 4080
aagaagtccc cgttcagcgg cccaacggac ccccgcccgc cgccgaggag gatcgccgtg 4140
ccgtccaggt ccagcgcgtc ggtccccaag ccggccccgc agccctaccc gttcacgtcc 4200
agcctcagca ccatcaacta cgacgagttc cccaccatgg tgttcccgtc cggccagatc 4260
tcccaggcca gcgcgctggc ccccgcgccc ccgcaggtgc tgccccaggc tccggccccc 4320
gctccggccc cggccatggt ctccgcgctg gcccaggcgc ccgccccggt gcccgtcctc 4380
gcgccgggcc cgccgcaggc ggtcgccccg ccagcgccga agcccacgca ggccggcgag 4440
ggcaccctca gcgaggcgct cctgcagctg cagttcgacg acgaggacct cggcgccctc 4500
ctgggcaact cgaccgaccc cgccgtgttc accgacctgg cctccgtcga caacagcgag 4560
ttccagcagc tgctgaacca gggcatcccg gtggcgccgc acaccacgga gcccatgctg 4620
atggagtacc cggaggcgat cacgcgcctc gtcaccggcg cccagaggcc cccggacccc 4680
gccccggccc cgctcggcgc cccaggcctg ccgaacggcc tcctgagcgg cgacgaggac 4740
ttctccagca tcgcggacat ggacttctcc gccctcctgg ggtcgggctc gggcagccgc 4800
gacagcaggg agggcatgtt cctcccaaag cccgaggccg gctccgccat ctcggacgtg 4860
ttcgagggca gggaggtctg ccagccaaag cgcatcaggc cgttccaccc gccgggctcc 4920
ccgtgggcga accggccgct ccccgccagc ctggctccaa ccccgaccgg ccccgtgcac 4980
gagccggtcg gcagcctgac gcccgcgccg gtgccccagc cgctcgaccc cgcgccggcc 5040
gtcacccccg aggcctccca cctcctggag gaccccgacg aggagacctc gcaggccgtg 5100
aaggccctga gggagatggc cgacaccgtc atcccccaga aggaggaggc ggccatctgc 5160
ggccagatgg acctgtcgca cccgccgccg cgcggccacc tcgacgagct gaccacgacc 5220
ctcgagtcca tgaccgagga cctcaacctg gacagccccc tcacgccgga gctgaacgag 5280
atcctcgaca ccttcctgaa cgacgagtgc ctcctgcacg ccatgcacat ctccacgggc 5340
ctgagcatct tcgacaccag cctcttctga 5370
<210> 291
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP186 gRNA
<400> 291
gcaagagagg cgaaggaggg ttcc 24
<210> 292
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP187 gRNA
<400> 292
taaggaggga gtgcattgga ccta 24
<210> 293
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP188 gRNA
<400> 293
gctctcgctc tctgcatgct agct 24
<210> 294
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP201 gRNA
<400> 294
gtatcaccca tgggcaatgg ccat 24
<210> 295
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP208 gRNA
<400> 295
ctcacttcct cgaatcattc taag 24
<210> 296
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP209 gRNA
<400> 296
ctgaataccc caaaactctc tgct 24
<210> 297
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP210 gRNA
<400> 297
tgatagcgag atactctata ctta 24
<210> 298
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> crGEP211 gRNA
<400> 298
gtaagtatag agtatctcgc tatc 24
<210> 299
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP186 expression plasmid
<400> 299
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatgca agagaggcga aggagggttc 1620
cggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 300
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP187 expression plasmid
<400> 300
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagattaa ggagggagtg cattggacct 1620
aggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 301
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP188 expression plasmid
<400> 301
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatgct ctcgctctct gcatgctagc 1620
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 302
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP201 expression plasmid
<400> 302
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatgta tcacccatgg gcaatggcca 1620
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 303
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP208 expression plasmid
<400> 303
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatctc acttcctcga atcattctaa 1620
gggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 304
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP209 expression plasmid
<400> 304
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatctg aataccccaa aactctctgc 1620
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 305
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP210 expression plasmid
<400> 305
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagattga tagcgagata ctctatactt 1620
aggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 306
<211> 3841
<212> DNA
<213> 人工序列
<220>
<223> crGEP211 expression plasmid
<400> 306
ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60
taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120
tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180
aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240
atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300
gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360
tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420
catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480
tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540
accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600
agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660
tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720
tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780
ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260
ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320
atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380
aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440
tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500
ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560
aacgagtaag ctcgtctaat ttctactaag tgtagatgta agtatagagt atctcgctat 1620
cggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680
gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740
cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800
catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860
catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920
ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840
c 3841
<210> 307
<211> 2040
<212> DNA
<213> Zea mays
<400> 307
atggcttcag cgaacaactg gctgggcttc tcgctctcgg gccaggataa cccgcagcct 60
aaccaggata gctcgcctgc cgccggtatc gacatctccg gcgccagcga cttctatggc 120
ctgcccacgc agcagggctc cgacgggcat ctcggcgtgc cgggcctgcg ggacgatcac 180
gcttcttatg gtatcatgga ggcctacaac agggttcctc aagaaaccca agattggaac 240
atgaggggct tggactacaa cggcggtggc tcggagctct cgatgcttgt ggggtccagc 300
ggcggcggcg ggggcaacgg caagagggcc gtggaagaca gcgagcccaa gctcgaagat 360
ttcctcggcg gcaactcgtt cgtctccgat caagatcagt ccggcggtta cctgttctct 420
ggagtcccga tagccagcag cgccaatagc aacagcggga gcaacaccat ggagctctcc 480
atgatcaaga cctggctacg gaacaaccag gtggcccagc cccagccgcc agctccacat 540
cagccgcagc ctgaggaaat gagcaccgac gccagcggca gcagctttgg atgctcggat 600
tcgatgggaa ggaacagcat ggtggcggct ggtgggagct cgcagagcct ggcgctctcg 660
atgagcacgg gctcgcacct gcccatggtt gtgcccagcg gcgccgccag cggagcggcc 720
tcggagagca catcgtcgga gaacaagcga gcgagcggtg ccatggattc gcccggcagc 780
gcggtagaag ccgtaccgag gaagtccatc gacacgttcg ggcaaaggac ctctatatat 840
cgaggtgtaa caaggcatag atggacaggg cggtatgagg ctcatctatg ggataatagt 900
tgtagaaggg aagggcagag tcgcaagggt aggcaagttt accttggtgg ctatgacaag 960
gaggacaagg cagcaagggc ttatgatttg gcagctctca agtattgggg cactacgaca 1020
acaacaaatt tccctataag caactacgaa aaggagctag aagaaatgaa acatatgact 1080
agacaggagt acattgcata cctaagaaga aatagcagtg gattttctcg tggggcgtca 1140
aagtatcgtg gagtaactag acatcatcag catgggagat ggcaagcaag gatagggaga 1200
gttgcaggaa acaaggatct ctacttgggc acattcagca ccgaggagga ggcggcggag 1260
gcctacgaca tcgccgcgat caagttccgc ggtctcaacg ccgtcaccaa cttcgacatg 1320
agccgctacg acgtgaagag catcctcgag agcagcacac tgcctgtcgg cggtgcggcc 1380
aggcgcctca aggacgccgt ggaccacgtg gaggccggcg ccaccatctg gcgcgccgac 1440
atggacggcg ccgtgatctc ccagctggcc gaagccggga tgggcggcta cgcctcgtac 1500
ggccaccacg gctggccgac catcgcgttc cagcagccgt cgccgctctc cgtccactac 1560
ccgtacggcc agccgtcccg cgggtggtgc aaacccgagc aggacgcggc cgccgccgcg 1620
gcgcacagcc tgcaggacct ccagcagctg cacctcggca gcgcggccca caacttcttc 1680
caggcgtcgt cgagctccac agtctacaac ggcggcgccg gcgccagtgg tgggtaccag 1740
ggcctcggtg gtggcagctc tttcctcatg ccgtcgagca ctgtcgtggc ggcggccgac 1800
caggggcaca gcagcacggc caaccagggg agcacgtgca gctacgggga cgaccaccag 1860
gaggggaagc tcatcggtta cgacgccgcc atggtggcga ccgcagctgg tggagacccg 1920
tacgctgcgg cgaggaacgg gtaccagttc tcgcagggct cgggatccac ggtgagcatc 1980
gcgagggcga acgggtacgc taacaactgg agctctcctt tcaacaacgg catggggtga 2040
<210> 308
<211> 978
<212> DNA
<213> Zea mays
<400> 308
atggcggcca atgcgggcgg cggtggagcg ggaggaggca gcggcagcgg cagcgtggct 60
gcgccggcgg tgtgccgccc cagcggctcg cggtggacgc cgacgccgga gcagatcagg 120
atgctgaagg agctctacta cggctgcggc atccggtcgc ccagctcgga gcagatccag 180
cgcatcaccg ccatgctgcg gcagcacggc aagatcgagg gcaagaacgt cttctactgg 240
ttccagaacc acaaggcccg cgagcgccag aagcgccgcc tcaccagcct cgacgtcaac 300
gtgcccgccg ccggcgcggc cgacgccacc accagccaac tcggcgtcct ctcgctgtcg 360
tcgccgcctt caggcgcggc gcctccctcg cccaccctcg gcttctacgc cgccggcaat 420
ggcggcggat cggctgggct gctggacacg agttccgact ggggcagcag cggcgctgcc 480
atggccaccg agacatgctt cctgcaggac tacatgggcg tgacggacac gggcagctcg 540
tcgcagtggc catgcttctc gtcgtcggac acgataatgg cggcggcggc ggccgcggcg 600
cgggtggcga cgacgcgggc gcccgagaca ctccctctct tcccgacctg cggcgacgac 660
gacgacgacg acagccagcc cccgccgcgg ccgcggcacg cagtcccagt cccggcaggc 720
gagaccatcc gcggcggcgg cggcagcagc agcagctact tgccgttctg gggtgccggt 780
gccgcgtcca caactgccgg cgccacttct tccgttgcga tccagcagca acaccagctg 840
caggagcagt acagctttta cagcaacagc acccagctgg ccggcaccgg cagccaagac 900
gtatcggctt cagcggccgc cctggagctg agcctcagct catggtgctc cccttaccct 960
gctgcaggga gcatgtga 978
<210> 309
<211> 1754
<212> DNA
<213> Zea mays
<400> 309
atcggaccca aatcatagac acatgatgat ataataacag acaaccaaaa ttgagagtgg 60
caaaatagca aatttctgat agtcatgtga tagagaatag tagacaattt tgacataata 120
tatgtacact aattagtcaa caaaagcgat attgcggtta aaacagtgat tgccagtgtt 180
ttgacccgag tgtcctaacc aaccaataaa gtaaatttat gctatgtgtc ctcgtccaga 240
tggatgatgc aagaagacac aagatttatt ttggttcgga caatagaagg cctactttca 300
gcggaggggg atgggattta tattatcttg cacctaagtg cttgtagtag aaggtacaag 360
ttagtcgaga gagagagaga atcccaactc tctgcggatg attgaggcaa gtgtcaatat 420
cggccgcgga gggcaatagg tgaagtgtat tgtcctcctc ccttgcaagc cttggactcc 480
ttttatagcc ttaatgaggg aatcaaggag taataattag ttgaagactg attaagaaac 540
agtccatctg ttagtttttt tgtttaaata ggctaaagct aattttatct agttcttaat 600
tagctaataa ttattatttc gtaggatcca aaccattcct aagctatagt gctattatat 660
caagtgtaga tctatatgta ctcaaggtca tgatgtttgc aaaccaacaa tgaaatttat 720
cgcacacatt ggtcatggca gatcaacttt tttgccacaa aacaaacaag aatagtgcaa 780
acgaagttgc ataaaatgaa acaatatatt atgtgaatag ttgcatggtt tatcttgcta 840
gttccatttt aacacacaca catatcttgc tagttccatt ttaacttcta cttgcacaat 900
tccaaaagga acctaaattt catttaccga tgagtcacaa gaaacttaga tctaattaaa 960
tttaaagaaa aatagcaata tttatatttt taaatatatt tattataaaa atttatctca 1020
tattctagct aatgatattt attatgcatc ataactatta aatatatagc tatatatata 1080
tatatttcat aagtttcatg ttgtttaact taatagagat ttatattttt agggctagtt 1140
tggcaaacta tttttccaaa ggattttcat ttctataaag aaaattattt ttttaaaaaa 1200
aatagaaatc tcttgaaaga atagaattgt taaactactc ttagacaaat aaagagtatc 1260
cttggttcgt ggctaaccgt atcatatttt atctaagtta gttgttccaa ttaaagaact 1320
aattttatac acaaaagtta agtaaagtat agcaaattag tccgcgaacc aaatatgacc 1380
gaaatatcga ggagtgagga ggcttaaccc ttcccatgtg tgtatctact gttacaccgt 1440
gagctacaaa gttactggca caaacgtata gaggatggtg aggacatggg aagataaaat 1500
cctggtccag caagatccgt tcttccaaat gggatcaggt gattggctcc agttcctcct 1560
cccctcagca ccaccagtct cctccagtcc agctcccgtc ttctccgcct caagagtctc 1620
agaccaacgg caaagttcta gaagcacggt tgcacgggca gcacggcata acacctccct 1680
ccactgatcc agttccagtc gcccaacgcc ccaacgtctt ctcttgcaaa tcgcaagcaa 1740
acttcctgtt cacg 1754
<210> 310
<211> 658
<212> DNA
<213> Zea mays
<400> 310
gttggctact tgagttagat tttggttgtg tttcatcccc acgtacgtcc agcaaagaaa 60
aattgaagct agtgcatgca tggttcgtca tcaaatgcat ggccggccgg atacaaattt 120
gaactgtagc tatcgacgta cgcatgtatt aatttatatc agagaagaca aggaacacag 180
atacatacat gtcgaaacaa tcattttcta tggcacttga gctagctagc atacaatttt 240
gttttaaatg aaatgaaact gaagacgatc gatcgaattg aaggttgtgg ttcgtgagca 300
atgcaatgca gtttcacaga acgttgccaa tgcaacaagc caccaagaaa agagaagtct 360
actcgatctt gcaatgatta ggcttggatg atgcgtgggg ccacgtacgt atggacatcg 420
aagaacccca tcctcagcgt gtggcctgag ggtgatggca aagctgatcc acacattgcg 480
gccccctttc ccccctcaga gaccctgacc tcccgagcac agccagccac cgcgcaacgc 540
cggccaccac caccaccacc atacctgcta gcgctagctc tctttattta acgccgccgt 600
gtgcgtgcct cgacgacctc actactttga gctgcaaggt ccgaactaaa aagcaccg 658
<210> 311
<211> 1700
<212> DNA
<213> Beta vulgaris
<400> 311
tataagttca aacttcaata caggtatttt cgggatgtga ttaccttaca atttctcatt 60
ttcaaagaat tttacctgtg cagctatgtt ggataacctg tgcgagattc cgtttcagta 120
ggacactttt tttttttacc aataaaaaaa aacttataag ttcatgagct aatttttata 180
gatagtttaa agtaccgggt ggaggatgaa tagttgagtt ttttcttcaa aattagatac 240
ttcctccgtt ttttattaga tgttacactt ttcaaatcac ggactcctag gtaatttttg 300
gagaggagag agatagagag aatgaaaaac aaaagggtcc catgtgagta tgtgatagga 360
gagagataga gagaatttat tacccaaaat aaaagtgtaa catctaattc aaaacttcct 420
aaaatagaaa gtgtaacatc taaaaaaaac ggaggaagta tttgaatttg atatagatat 480
tgtgtctttg tgtgtgttga atttcaattc ccagttccct aaaaaaaatt tacaattgca 540
atttcgagat tatgatgtaa attaaatttg agagactaga aagtatttgg tcaacccaaa 600
aaaaaaatat caatacttat ataaatcaaa aacataatag agaatccaat tttactaaaa 660
atattagtaa ttttgattaa aataatctat taaaatgaac tctaaccttc acataatttc 720
cacatattat taatcaacaa aataagcatc acaaattatt agaataggcg atctaatttt 780
aacataaaat tagacgaatt caaattgaat ttttctaaca agctcattcc atttcacgca 840
acccaaaatt atcctagtca gtagtcatcc attcttttct cattccttta ttcttgatta 900
tcgaactaca acagataatt tcaaaaaaaa actaaattgg tagtcttaac tgattaaact 960
acttactaaa tggattaaag aatgtcatta ctgaatagat taaactgatt acgaaataga 1020
ttaacttggt ccctaaatag attaaattag ttactatatt aaaattaggc gatctcttac 1080
aaaaccaact gaataagcat agctctgtat attacctaga tttcaactaa atcaaaaccc 1140
cttacagttc aatctagagc tgatcatttt ggctcggccc gtcccatttt tgggccgggt 1200
tttagtcaga tttttttggc ccgcggtcgg gcccggcccg atttttttgg ctttgggcaa 1260
gccaaaaacg acttttcagt ttattttttg gcccgacccg tttttacccg caaaagcccg 1320
ctaatttagg tccgcacttt gggcacaaaa atttagcccg aacttaaacc tggcccgacc 1380
catgatcacc tctagtttaa tccaaactaa aaaactacac aagttagcca aaaattatgt 1440
ctactttgta caactttata aaatacacac agtagttgat atcttgatga ttaactcctt 1500
ttgaagtttg actacacacc aaccccaaac acacccactt tttcccccct cttgtcacca 1560
accccccctc ctctttagcc accaaagttt ggttggtgag tcctccataa ctgctaaatt 1620
ctctcttttt tctctctcct aaaaaactaa aacccaccaa aatttcagac atcaaaaaaa 1680
ttacaagtga aggaaacaat 1700
<210> 312
<211> 991
<212> DNA
<213> Beta vulgaris
<400> 312
aaagaaggaa aggaaggaat ttgaacatgt gacctatcgt tcacagcacc tcaatcttaa 60
tcactagacc aaaacatcct tggttcttgc gcaagaaggt tggctagaaa ttttttgtaa 120
aaacactagc cccgctcagt tcataatgag aatgtcgatg tcaccaaagg gatattaaat 180
gaatggaatt gggatatgga tggaatataa tgaaatagag ccactttgag gttccctatg 240
aaatgaggca tggaagggag ccactacgaa aaagttccgg gagttacgaa ggaagcttcg 300
agctcatatt ggtcatgaac ccgattactg agtctaataa gttcaattga aaagaaaaag 360
tcttatgttc taaaagaact tttcgtgcgg tttgcatgag ttcatagtcc atataatata 420
atgcaggaat gaagttctca gttgattctt ccacacccgt ccctcacccc ctaggcccca 480
ccttcacccc gccgaaaaaa ataaagaaaa tccaacgtta tttttcttag aaatgacagt 540
ttgatataga aaggaaaaat aataataaaa aaaaaaagtg ttggcgtttt cattttcaac 600
ctcagtatgt tggtttgccc caacaagttc tgaaccaatt ggcgatgtaa tcttataaga 660
agaatctaac gttggtccat tttgcttcta cagttttgaa agttaggtgg gccccattat 720
tatgttgatc ctagaataat taattttggt aggctgagaa gaggaaaaat aaagaacaat 780
gctaaaaaca agtgaaaaat atagttgcaa ctcatgatgc aacatgagat gcgatgaaat 840
atgatagtaa cttgagctca caactctgta tataagtgct catttggaca cttattttct 900
acaatttcct agtaactcag cttagcttca ttcccgactt ttttataaaa gtcaggacga 960
tcaatatcta tctatttatc tgtctgtctg t 991
<210> 313
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> Cys2His2 motif
<220>
<221> VARIANT
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> VARIANT
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<400> 313
Xaa Cys Xaa Cys Xaa His Xaa His
1 5
<210> 314
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> LAGLIDADG motif
<400> 314
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 315
<211> 360
<212> DNA
<213> Zea mays
<400> 315
cgaccggatg ccgcagccgt agtagagctc cttcagcatc ctgatctgct ccggcgtcgg 60
cgtccaccgc gagccgctgg ggcggcacac cgccggcgca gccacgctgc cgctgcctcc 120
tcccgctcca ccgccgcccg cattggccgc catgcctcta tctcagcggc cttcctgagc 180
gctcctgtga cctagctctc cggtgtccgg tctatggcaa gagaggcgaa ggagggttcc 240
ttgtttataa ggagggagtg cattggacct agaggctaga tagctagaag gtagctagca 300
tgcagagagc gagagcggga gaagagagcg tagctgcgct aggtgatata ggttggggct 360
<210> 316
<211> 900
<212> DNA
<213> Zea mays
<400> 316
taatcgttct tgacagcaac ctgccagtca aatggccgtg acaacgtata ctattatcga 60
gtaaaaggtc gccactttag tagtacatgt acatgcatgc gcagatacat catcaggtac 120
tcatatatgg gcacacatat agacatgttt tgaggaaaat gagacaaagt atagtggaga 180
cttccctaga aagcagaaga aaaagaagtg gtttatgttc cgttaaatca tactacaact 240
tttttttatt atactctcca ttttgtcatc attaggtact catatatggg cacacatata 300
gtactgccaa tttttcttgc taaaaaaagt tccactatat atatgtatgt atgcacaaat 360
aaactaattt tcttagaaaa gaaaaccggt gtaatacata ctaagggcta gtttgggaac 420
cctggtttcc taaggaattt tatttttcca aaaaaaatag tttatttttc cttcggaaat 480
taggaatctc ttataaaatt cgagttccca aactattcct aatatatata tcatactctc 540
catcagtcta tatatagatt acatatagta agtatagagt atctcgctat cacatagtgc 600
cactaatctt ctggagtgta ccagttgtat aaatatctat cagtatcagc actactgttt 660
gctgaatacc ccaaaactct ctgcttgact tctcttccct aacctttgca ctgtccaaaa 720
tggcttcctg atcccctcac ttcctcgaat cattctaaga agaaactcaa gccgctacca 780
ttaggggcag attaattgct gcactttcag ataatctacc atggccactg tgaacaactg 840
gctcgctttc tccctctccc cgcaggagct gccgccctcc cagacgacgg actccacgct 900
<210> 317
<211> 281
<212> DNA
<213> Zea mays
<400> 317
atatatagat tacatatagt aagtatagag tatctcgcta tcacatagtg ccactaatct 60
tctggagtgt accagttgta taaatatcta tcagtatcag cactactgtt tgctgaatac 120
cccaaaactc tctgcttgac ttctcttccc taacctttgc actgtccaaa atggcttcct 180
gatcccctca cttcctcgaa tcattctaag aagaaactca agccgctacc attaggggca 240
gattaattgc tgcactttca gataatctac catggccact g 281
<210> 318
<211> 372
<212> DNA
<213> Zea mays
<400> 318
gatctgctcc ggcgtcggcg tccaccgcga gccgctgggg cggcacaccg ccggcgcagc 60
cacgctgccg ctgcctcctc ccgctccacc gccgcccgca ttggccgcca tgcctctatc 120
tcagcggcct tcctgagcgc tcctgtgacc tagctctccg gtgtccggtc tatggcaaga 180
gaggcgaagg agggttcctt gtttataagg agggagtgca ttggacctag aggctagata 240
gcatgaaggt agctagcatg cagagagcga gagcgggaga agagagcgta gctgcgctag 300
gtgatatagg ttggggctgg gaggggggtc atggccattg cccatgggtg atacgatatc 360
ttttggagag ag 372

Claims (58)

1.一种合成转录因子或编码其的核苷酸序列,所述合成转录因子包含至少一个识别结构域和至少一个激活结构域,其中所述合成转录因子配置为调控细胞系统中形态发生基因的表达。
2.一种合成转录因子或编码其的核苷酸序列,所述合成转录因子包含至少一个识别结构域和至少一个激活结构域,其中所述合成转录因子配置为激活细胞系统中内源基因的表达。
3.根据权利要求1或2所述的合成转录因子,其中所述至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
4.根据权利要求3所述的合成转录因子,其中所述至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中所述至少一个解除武装的CRISPR/核酸酶系统包含至少一个向导RNA。
5.根据权利要求1或2所述的合成转录因子,其中所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自水稻白叶枯病菌(Xanthomonasoryzae)的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
6.根据权利要求1或2所述的合成转录因子,其中所述至少一个激活结构域相对于所述至少一个识别结构域位于N-末端和/或C-末端。
7.根据权利要求1所述的合成转录因子,其中所述形态发生基因选自BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4。
8.根据权利要求1所述的合成转录因子,其中所述合成转录因子配置为通过结合位于相对于起始密码子一定距离处的调控区域而调控所述形态发生基因的表达,优选地调控所述形态发生基因的转录。
9.根据权利要求2所述的合成转录因子,其中,所述内源基因选自:编码对非生物胁迫的抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,所述除草剂抗性包括草甘膦抗性、草铵膦/磷丝菌素抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性和麦草畏抗性或耐受性;编码对生物胁迫的抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳成分或营养含量。
10.根据权利要求1或2所述的合成转录因子,其中所述合成转录因子和/或所述至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
11.根据权利要求1或2所述的合成转录因子,其中所述细胞系统选自至少一个真核细胞或真核生物体,优选地,其中所述至少一个真核细胞是至少一个植物细胞,和/或其中所述至少一个真核生物体是植物或植物的一部分。
12.如权利要求11所述的合成转录因子,其中所述植物的至少一部分选自叶、茎、根、初生胚根、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝。
13.根据权利要求12所述的合成转录因子,其中所述至少一个植物细胞、所述至少一个植物或所述植物的至少一部分源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
14.一种用于提高细胞系统中转化效率的方法,其中所述方法包括以下步骤:
(a)提供细胞系统;
(b)在所述细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;以及
(c)在所述细胞系统中引入至少一个目的核苷酸序列;
(d)任选地,在获得所述细胞系统的转化的后代的条件下培养所述细胞系统;
其中所述至少一个合成转录因子或编码其的所述核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中所述合成转录因子配置为调控所述细胞系统中的至少一个形态发生基因的表达,优选地为调控所述细胞系统中的至少一个形态发生基因的转录;并且
其中所述至少一个合成转录因子或编码其的核苷酸序列的引入与所述至少一个目的核苷酸序列的引入平行进行或序贯进行。
15.根据权利要求14所述的方法,其中
(a)所述至少一个合成转录因子或编码其的所述序列,或者所述至少一个合成转录因子的至少一个组分或编码其的序列;以及
(b)所述至少一个目的核苷酸序列
通过独立地选自生物方法和/或物理方法的方法引入所述细胞系统中,所述方法包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染)或其任何组合。
16.一种用于提高细胞系统中至少一个内源基因的表达的方法,其中所述方法包括以下步骤:
(a)提供细胞系统;
(b)在所述细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;
其中所述至少一个合成转录因子或编码其的所述核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中所述合成转录因子配置为调控所述细胞系统中至少一个内源基因的表达,优选地为调控所述细胞系统中至少一个内源基因的转录。
17.根据权利要求16所述的方法,其中所述至少一个合成转录因子或编码其的所述序列,或者所述至少一个合成转录因子的至少一个组分或编码其的序列通过独立地选自生物和/或物理方法的方法引入所述细胞系统中,所述方法包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),或其任何组合。
18.根据权利要求14或16所述的方法,其中所述至少一个识别结构域是至少一个解除武装的非功能性CRISPR/核酸酶系统,或是至少一个解除武装的非功能性CRISPR/核酸酶系统的片段。
19.根据权利要求18所述的方法,其中所述至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中所述至少一个解除武装的CRISPR/核酸酶系统包括至少一个向导RNA。
20.根据权利要求14或16所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
21.根据权利要求14或16所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域相对于所述至少一个合成转录因子的所述至少一个识别结构域位于N-末端和/或C-末端。
22.根据权利要求14所述的方法,其中所述至少一个形态发生基因选自BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4。
23.根据权利要求14所述的方法,其中所述合成转录因子配置为通过结合位于相对于所述起始密码子一定距离处的调控区域来调控所述形态发生基因的表达,优选地为调控所述形态发生基因的转录。
24.根据权利要求16所述的方法,其中所述内源基因选自:编码对非生物胁迫的抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或渍水;编码除草剂抗性的基因,所述除草剂抗性包括草甘膦抗性、草铵膦/磷丝菌素抗性、潮霉素抗性、2,4-D抗性或耐受性、原卟啉原氧化酶(PPO)抑制剂抗性或耐受性、ALS抑制剂抗性或耐受性和麦草畏抗性或耐受性;编码对生物胁迫的抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码产量相关性状的基因,所述产量相关性状包括抗倒伏性、开花时间、抗落粒性、种子颜色、胚乳成分或营养含量。
25.根据权利要求14或16所述的方法,其中所述合成转录因子和/或所述至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQ ID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
26.根据权利要求14或16所述的方法,其中所述细胞系统选自至少一个真核细胞或真核生物体,优选地,其中所述至少一个真核细胞是至少一个植物细胞,和/或其中所述至少一个真核生物体是植物或植物的一部分。
27.根据权利要求26所述的方法,其中所述植物的至少一部分选自叶、茎、根、初生胚根、花、花部分、花瓣、果实、花粉、花粉管、花药花丝、胚珠、胚囊、卵细胞、子房、合子、胚、合子胚、体细胞胚、顶端分生组织、维管束、中柱鞘、种子、根和插枝。
28.根据权利要求27所述的方法,其中所述至少一个植物细胞、所述至少一个植物或所述植物的至少一部分源自选自以下的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、滨海大麦草(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、近缘种须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、硬毛南芥(Arabis hirsute)、甘蓝型油菜(Brassica napus)、甘蓝(Brassica oeleracia)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、甜橙(Citrus sinensis)、麻疯树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Toreniafournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
29.一种在预定位置修饰细胞系统的遗传物质的方法,其中所述方法包括以下步骤:
(a)提供细胞系统;
(b)将至少一个合成转录因子或编码其的序列引入所述细胞系统中,
(c)进一步向所述细胞系统中引入:
(i)至少一个位点特异性核酸酶或编码其的序列,其中所述位点特异性核酸酶在所述预定位置诱导双链断裂;
(ii)任选地:至少一个目的核苷酸序列,优选地侧翼为与所述细胞系统的遗传物质中所述预定位置相邻的一个或多个核苷酸序列互补的一个或多个同源序列;以及
(e)任选地:确定修饰存在于所述细胞系统的遗传物质中的所述预定位置;以及
(f)获得在所述细胞系统的遗传物质的所述预定位置处包含修饰的细胞系统;
其中所述至少一个合成转录因子或编码其的所述核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中所述至少一个合成转录因子配置为调控所述细胞系统中的至少一个形态发生基因的表达,优选地为调控所述细胞系统中的至少一个形态发生基因的转录;并且
其中所述至少一个合成转录因子或编码其的所述核苷酸序列的引入与所述至少一个位点特异性核酸酶或编码其的序列和所述任选的至少一个目的核苷酸序列的引入平行进行或序贯进行。
30.根据权利要求29所述的方法,其中所述方法还包括在获得所述修饰的细胞系统的遗传修饰后代的条件下培养所述细胞系统的步骤。
31.根据权利要求29所述的方法,其中,
(i)所述至少一个合成转录因子或编码其的所述序列,或者所述至少一个合成转录因子的至少一个组分或编码其的序列;以及
(ii)所述至少一个位点特异性核酸酶或包含其的序列;以及任选的
(iii)所述至少一个目的核苷酸序列
通过独立地选自生物方法和/或物理方法的方法引入所述细胞系统中,所述方法包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),或其任何组合。
32.根据权利要求29所述的方法,其中所述至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
33.根据权利要求32所述的方法,其中所述至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中所述至少一个解除武装的CRISPR/核酸酶系统包括至少一个向导RNA。
34.根据权利要求29所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
35.根据权利要求29所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域相对于所述至少一个合成转录因子的所述至少一个识别结构域位于N-末端和/或C-末端。
36.根据权利要求29所述的方法,其中所述至少一个形态发生基因选自BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4。
37.根据权利要求29所述的方法,其中所述合成转录因子配置为通过结合位于相对于所述起始密码子一定距离处的调控区域来调控形态发生基因的表达,优选地为调控形态发生基因的转录。
38.根据权利要求29所述的方法,其中所述合成转录因子和/或所述至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
39.根据权利要求29所述的方法,其中所述细胞系统选自至少一个真核细胞或真核生物体,优选地,其中所述至少一个真核细胞是至少一个植物细胞,和/或其中所述至少一个真核生物体是植物或植物的一部分。
40.根据权利要求29所述的方法,其中位于所述预定位置处的所述至少一个目的核苷酸序列侧翼的一个或多个核苷酸序列与邻近所述预定位置,位于所述预定位置的上游和/或下游的一个或多个核苷酸序列在各个邻近区域的全长上至少85%至100%互补。
41.一种产生单倍体或双单倍体生物体的方法,其中所述方法包括以下步骤:
(a)提供单倍体细胞系统;
(b)在所述单倍体细胞系统中引入至少一个合成转录因子或编码其的核苷酸序列;
(c)在获得至少一个单倍体或双单倍体生物体的条件下培养所述单倍体细胞系统;以及
(d)任选地:选择步骤(c)中获得的所述至少一个单倍体或双单倍体生物体,
其中所述至少一个合成转录因子或编码其的所述核苷酸序列包含至少一个识别结构域和至少一个激活结构域,其中所述至少一个合成转录因子配置为调控所述单倍体细胞系统中的至少一个形态发生基因的表达,优选地为调控所述单倍体细胞系统中的至少一个形态发生基因的转录。
42.根据权利要求41所述的方法,其中步骤(a)的所述单倍体细胞系统是单倍体胚,或者其中步骤(c)中定义的所述至少一个单倍体或双单倍体生物体通过由(b)的所述单倍体细胞系统生成至少一个单倍体胚的中间步骤获得。
43.根据权利要求41或42所述的方法,其中所述至少一个合成转录因子或编码其的序列,或者所述至少一个合成转录因子的至少一个组分或编码其的序列通过独立地选自生物方法和/或物理方法的方法引入所述单倍体细胞系统中,所述方法包括转染、转化,包括通过农杆菌属物种(优选地为根癌农杆菌)、病毒载体、生物弹轰击进行转化,使用化学试剂进行转染(包括聚乙二醇转染),或其任何组合。
44.根据权利要求41所述的方法,其中所述至少一个识别结构域是至少一个解除武装的CRISPR/核酸酶系统,或是至少一个解除武装的CRISPR/核酸酶系统的片段。
45.根据权利要求44所述的方法,其中所述至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCpf1系统,其中所述至少一个解除武装的CRISPR/核酸酶系统包括至少一个向导RNA。
46.根据权利要求41所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自水稻白叶枯病菌的无毒基因、单纯疱疹病毒的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。
47.根据权利要求41所述的方法,其中所述至少一个合成转录因子的所述至少一个激活结构域相对于所述至少一个合成转录因子的所述至少一个识别结构域位于N-末端和/或C-末端。
48.根据权利要求41所述的方法,其中所述至少一个形态发生基因选自BBM、WUS(包括WUS2)、WOX基因、WUS或BBM同源物、Lec1、Lec2、WIND1、ESR1、PLT3、PLT5、PLT7、IPT、IPT2、Knotted1和RKD4。
49.根据权利要求41所述的方法,其中所述合成转录因子配置为通过结合位于相对于所述起始密码子一定距离处的调控区域来调控所述形态发生基因的表达,优选地为调控所述形态发生基因的转录。
50.根据权利要求41所述的方法,其中所述合成转录因子和/或所述至少一个识别结构域包含SEQ ID NO:276、277、282、283、284、288、289、290中任一个所示的序列,或包含与SEQID NO:276、277、282、283、284、288、289、290中的任一个在全长上具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同性的序列。
51.根据权利要求41所述的方法,其中所述至少一个单倍体细胞系统选自至少一个真核细胞或真核生物所体,优选地,其中所述至少一个真核细胞是至少一个植物细胞,和/或其中所述至少一个真核生物体是植物或植物的一部分。
52.一种通过权利要求14或16所述的方法获得的细胞系统或其后代。
53.一种通过权利要求29所述的方法获得的细胞系统或其后代。
54.一种通过权利要求41所述的方法获得的单倍体或双单倍体生物体。
55.权利要求1所述的合成转录因子或编码其的序列在权利要求14所述的方法中的用途。
56.权利要求1所述的合成转录因子或编码其的序列在权利要求29所述的方法中的用途。
57.权利要求1所述的合成转录因子或编码其的序列在权利要求41所述的方法中的用途。
58.权利要求2所述的合成转录因子或编码其的序列在权利要求16所述的方法中的用途。
CN201880090026.6A 2017-12-22 2018-12-21 基于Cpf1的植物转录调控系统 Pending CN112204147A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762609508P 2017-12-22 2017-12-22
US62/609,508 2017-12-22
US201862758068P 2018-11-09 2018-11-09
US62/758,068 2018-11-09
PCT/EP2018/086725 WO2019122394A2 (en) 2017-12-22 2018-12-21 Cpf1 based transcription regulation systems in plants

Publications (1)

Publication Number Publication Date
CN112204147A true CN112204147A (zh) 2021-01-08

Family

ID=64959347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880090026.6A Pending CN112204147A (zh) 2017-12-22 2018-12-21 基于Cpf1的植物转录调控系统

Country Status (7)

Country Link
US (1) US20210071189A1 (zh)
EP (1) EP3728605A2 (zh)
CN (1) CN112204147A (zh)
AU (1) AU2018390965A1 (zh)
BR (1) BR112020012327A2 (zh)
CA (1) CA3086619A1 (zh)
WO (1) WO2019122394A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110982820A (zh) * 2020-01-03 2020-04-10 云南中烟工业有限责任公司 一种烟草单倍体的基因编辑方法
CN113150092A (zh) * 2021-02-18 2021-07-23 华中农业大学 与顶端发育和矮化相关的CsHD1蛋白、基因及其应用
CN114107374A (zh) * 2021-11-19 2022-03-01 广东省林业科学研究院 一种鸢尾科植物红葱vigs沉默体系的构建方法及其应用
CN114940998A (zh) * 2022-06-20 2022-08-26 四川农业大学 一种玉米转录因子ZmEREB92及应用
CN116574743A (zh) * 2023-06-02 2023-08-11 四川农业大学 ZmARGOS9基因在玉米抗旱与高产中的应用
WO2024036600A1 (zh) * 2022-08-19 2024-02-22 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11319547B1 (en) * 2019-04-12 2022-05-03 Inari Agriculture Technology, Inc. Plant transformation
CN111423500B (zh) * 2020-04-17 2022-05-17 中国农业科学院作物科学研究所 SiMYB56蛋白及其编码基因在调控植物耐干旱能力中的应用
EP4019638A1 (en) * 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
EP4019639A1 (en) * 2020-12-22 2022-06-29 KWS SAAT SE & Co. KGaA Promoting regeneration and transformation in beta vulgaris
CN115786390A (zh) * 2022-08-19 2023-03-14 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101842489A (zh) * 2007-10-29 2010-09-22 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于制备该植物的方法
WO2011082310A2 (en) * 2009-12-30 2011-07-07 Pioneer Hi-Bred International, Inc. Methods and compositions for targeted polynucleotide modification
CN102892888A (zh) * 2009-12-30 2013-01-23 先锋国际良种公司 在植物中导入并调节表达基因的方法和组合物
WO2017070598A1 (en) * 2015-10-23 2017-04-27 Caribou Biosciences, Inc. Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7256322B2 (en) 1999-10-01 2007-08-14 Pioneer Hi-Bred International, Inc. Wuschel (WUS) Gene Homologs
ATE420188T1 (de) 2004-02-02 2009-01-15 Pioneer Hi Bred Int Ap2-domäne-transkriptionsfaktor odp2 (ovule development protein 2) und verwendungsverfahren
WO2015043621A1 (en) 2013-09-24 2015-04-02 Stichting Dienst Landbouwkundig Onderzoek Haploid embryogenesis
EP3178935B1 (en) 2014-08-06 2022-12-21 Toolgen Incorporated Genome editing using campylobacter jejuni crispr/cas system-derived rgen
BR112018008705B1 (pt) 2015-10-30 2023-12-26 Pioneer Hi-Bred International, Inc Método para produzir uma planta transgênica
WO2018147343A1 (en) * 2017-02-07 2018-08-16 Edigene Corporation Method of treating diseases associated with elevated kras expression using crispr-gndm system
WO2018212361A1 (en) * 2017-05-17 2018-11-22 Edigene Corporation Method of treating diseases associated with myd88 pathways using crispr-gndm system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101842489A (zh) * 2007-10-29 2010-09-22 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于制备该植物的方法
WO2011082310A2 (en) * 2009-12-30 2011-07-07 Pioneer Hi-Bred International, Inc. Methods and compositions for targeted polynucleotide modification
CN102892888A (zh) * 2009-12-30 2013-01-23 先锋国际良种公司 在植物中导入并调节表达基因的方法和组合物
WO2017070598A1 (en) * 2015-10-23 2017-04-27 Caribou Biosciences, Inc. Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
ALTPETER ET AL.: "Advancing Crop Transformation in the Era of Genome Editing", 《PLANT CELL》 *
AMI M. KABADI ET AL.: "Engineering synthetic TALE and CRISPR/Cas9 transcription factors for regulating gene expression", 《METHODS》 *
JEFFREY C MILLER ET AL.: "A TALE nuclease architecture for efficient genome editing", 《NATURE BIOTECHNOLOGY》 *
LEVI ET AL.: "A CRISPR/Cas9 Toolbox for Multiplexed Plant Genome Editing and Transcriptional Regulation", 《PLANT PHYSIOLOGY》 *
LEVI ET AL.: "Robust Transcriptional Activation in plants using multiplexed CRISPR-Act2.0 and mTALE-Act Systems", 《MOLECULAR PLANT》 *
MIIN-FENG WU ET AL.: "Auxin-regulated chromatin switch directs acquisition of flower primordium founder fate", 《PLANT BIOLOGY》 *
RICHARD MOORE ET AL.: "Transcription Activator-like Effectors: A Toolkit for Synthetic Biology", 《ACS SYNTH. BIOL.》 *
TAK ET AL.: "Inducible and multiplex gene regulation using CRISPR-Cpf1-based transcription factors", 《NATURE METHODS》 *
WUSHENG LIU ET AL.: "Synthetic TAL effectors for targeted enhancement of transgene expression in plants", 《PLANT BIOTECHNOLOGY JOURNAL》 *
XU TANG ET AL.: "ACRISPR–Cpf1 system for efficient genome editing and transcriptional repression in plants", 《NATURE PLANTS》 *
YUE XU ET AL.: "Regulation of gene expression by manipulating transcriptional repressor activity using a novel CoSRI technology", 《PLANT BIOTECHNOLOGY JOURNAL》 *
ZHENXIANG LI ET AL.: "A potent Cas9-derived gene activator for plant and mammalian cells", 《NATURE PLANTS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110982820A (zh) * 2020-01-03 2020-04-10 云南中烟工业有限责任公司 一种烟草单倍体的基因编辑方法
CN113150092A (zh) * 2021-02-18 2021-07-23 华中农业大学 与顶端发育和矮化相关的CsHD1蛋白、基因及其应用
CN114107374A (zh) * 2021-11-19 2022-03-01 广东省林业科学研究院 一种鸢尾科植物红葱vigs沉默体系的构建方法及其应用
CN114107374B (zh) * 2021-11-19 2024-04-05 广东省林业科学研究院 一种鸢尾科植物红葱vigs沉默体系的构建方法及其应用
CN114940998A (zh) * 2022-06-20 2022-08-26 四川农业大学 一种玉米转录因子ZmEREB92及应用
WO2024036600A1 (zh) * 2022-08-19 2024-02-22 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用
CN116574743A (zh) * 2023-06-02 2023-08-11 四川农业大学 ZmARGOS9基因在玉米抗旱与高产中的应用
CN116574743B (zh) * 2023-06-02 2024-01-23 四川农业大学 ZmARGOS9基因在玉米抗旱与高产中的应用

Also Published As

Publication number Publication date
WO2019122394A3 (en) 2019-08-08
AU2018390965A1 (en) 2020-07-02
CA3086619A1 (en) 2019-06-27
US20210071189A1 (en) 2021-03-11
BR112020012327A2 (pt) 2020-11-24
EP3728605A2 (en) 2020-10-28
WO2019122394A2 (en) 2019-06-27

Similar Documents

Publication Publication Date Title
CN112204147A (zh) 基于Cpf1的植物转录调控系统
KR102628801B1 (ko) 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법
KR102274445B1 (ko) 게놈 삽입을 위한 방법
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR102381610B1 (ko) Rna-유도 엔도뉴클레아제를 사용한 통상적이지 않은 효모에서의 유전자 표적화
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
CN108026556A (zh) 在具有经改造的输入/输出的微生物宿主中人乳寡糖的产生
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
CN109563505A (zh) 用于真核细胞的组装系统
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
CN111836825A (zh) 优化的植物crispr/cpf1系统
KR20070085665A (ko) 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주
KR102652494B1 (ko) 전장 t-세포 수용체 오픈 리딩 프레임의 신속한 조립 및 다양화를 위한 2-성분 벡터 라이브러리 시스템
AU782960B2 (en) Conditional gene trapping construct for the disruption of genes
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR20210105382A (ko) 단백질을 코딩하는 rna
KR20230035689A (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
CN101918560B (zh) 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法
CN114126645A (zh) 冠状病毒刺突蛋白的修饰的s1亚基

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination