CN106947762A - 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子 - Google Patents

用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子 Download PDF

Info

Publication number
CN106947762A
CN106947762A CN201710157168.7A CN201710157168A CN106947762A CN 106947762 A CN106947762 A CN 106947762A CN 201710157168 A CN201710157168 A CN 201710157168A CN 106947762 A CN106947762 A CN 106947762A
Authority
CN
China
Prior art keywords
plant
nucleic acid
neena
seed
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710157168.7A
Other languages
English (en)
Other versions
CN106947762B (zh
Inventor
J·M·库恩
L·P·洛亚尔
M·西伯特
E·杜维尼哥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN106947762A publication Critical patent/CN106947762A/zh
Application granted granted Critical
Publication of CN106947762B publication Critical patent/CN106947762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/04Plant cells or tissues

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明属于植物分子生物学领域并且提供了用于产生高表达的种子特异的和/或种子优先的启动子的方法以及产生具有增强的核酸种子特异的和/或种子优先的表达的植物的方法,其中将增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或导入植物中。

Description

用于增强植物中种子特异的和/或种子优先的基因表达的调 节性核酸分子
本申请是中国专利申请201080038714.1的分案申请,原申请的申请日是2010年8月11日,发明名称是“用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子”。
发明描述
本发明属于植物分子生物学领域并且提供了用于产生高表达的种子特异的和/或种子优先的启动子和产生具有增强的核酸种子特异的和/或种子优先的表达的植物的方法,其中将增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或导入植物中。
转基因在植物中的表达强烈地受多种外部和内部因素影响,从而导致变动和不可预测水平的转基因表达。经常不得不产生大量的转化体并进行分析,以鉴定具有合乎需要的表达强度的株系。由于转化并筛选表达强度合乎需要的株系是昂贵和耗费人力的,故需要一个或多个转基因在植物中高表达。当不得不在转基因植物中协调表达几个基因以实现特定效应时,鉴于必须鉴定其中每个基因均强烈表达的植物,这个问题尤其严重。
例如,取决于构建体设计和各个转化事件中T-DNA插入基因座的位置效应,转基因的表达可以显著地变动。强启动子可以部分地克服这些难题。然而,显示强烈表达同时特异性合乎需要的合适启动子的可获得性经常是有限的。为了确保可获得具有合乎需要的表达特异性的充足启动子,额外启动子的鉴定和表征可能有助于弥合这种缺口。然而,具有相应特异性和强度的启动子的天然可获得性和费时的候选启动子表征阻碍了合适的新启动子的鉴定。
为了克服这些难题,已经显示多样的遗传元件和/或基序积极地影响基因表达。在它们当中,已经认可一些内含子作为具有改善基因表达的强大潜能的遗传元件。虽然机制大多未知,但是已经显示一些内含子积极地影响成熟mRNA的稳态量,这可能通过增强转录活性、改善mRNA成熟、增强胞核mRNA输出和/或改善翻译起始来影响(例如Huang和Gorman,1990;Le Hir等人,2003;Nott等人,2004)。由于显示仅所选的内含子增加表达,故剪接本身很可能解释不了观察到的效果。
将内含子与启动子功能性连接时观察到的基因表达增加称作内含子介导的基因表达增强(IME)并且已经在多种单子叶植物(例如Callis等人,1987;Vasil等人,1989;Bruce等人,1990;Lu等人,2008)和双子叶植物(例如Chung等人,2006;Kim等人,2006;Rose等人,2008)得到显示。在这个方面,显示内含子相对于翻译起始位点(ATG)的位置对于内含子介导的基因表达增强至关重要(Rose等人,2004)。
继一些内含子增强基因表达的潜能之后,显示少数内含子还在植物中于其原有核苷酸环境下影响组织特异性。发现报道基因表达依赖于含有多达2个内含子的基因组区域的存在(Sieburth等人,1997;Wang等人,2004)。也已经报道5’UTR内含子对启动子元件的恰当功能性是重要的,这可能归因于内含子中存在的组织特异性基因控制元件(Fu等人,1995a;Fu等人,1995b;Vitale等人,2003;Kim等人,2006)。然而,这些研究还显示内含子与异源启动子的组合可能对基因表达的强度和/或特异性产生强烈的不利影响(Vitale等人,2003;Kim等人,2006、WO2006/003186、WO2007/098042)。例如,花椰菜花叶病毒CaMV35S组成型强启动子因与芝麻SeFAD2 5’UTR内含子组合而不利地影响表达(Kim等人,2006)。与这些观察结果相反,一些文献显示通过IME增强核酸的表达而不影响相应启动子的组织特异性(Schünmann等人,2004)。本领域中尚未显示与异源启动子功能性连接时增强种子特异的和/或种子优先的表达的内含子或NEENA。
在本申请中,描述了与种子特异的和/或种子优先的启动子功能性连接时增强所述启动子的表达同时不影响其特异性的其他核酸分子。在本申请中将这些核酸分子描述为“增强核酸表达的核酸”(NEENA)。内含子具有从分别的前mRNA剪接下来的内在特征。与其相反,本申请中即将陈述的核酸不必要一定包含于mRNA中,或如果存在于mRNA中,没有必要一定从mRNA中剪接下来,以增强源自与NEENA功能性连接的启动子的表达。
发明详述
本发明的第一实施方案包括用于产生高表达种子特异的和/或种子优先的启动子的方法,所述高表达种子特异的和/或种子优先的启动子包含与启动子功能性连接的一个或多个增强核酸表达的核酸(NEENA)分子,所述方法包括
i)具有如SEQ ID NO:1至15的任一者中所定义序列的核酸分子,或
ii)具有下述序列的核酸分子,所述序列与如SEQ ID NO:1至15所定义的任一序列具有80%或更大的同一性,优选地,该同一性是85%或更大,更优选地,该同一性是90%或更大,甚至更优选地,该同一性是95%或更大、96%或更大、97%或更大、98%或更大或99%或更大,在最优选的实施方案中,该同一性相对于如SEQ ID NO:1至15所定义的任一序列是100%,或
iii)i)或ii)的核酸分子的100个或更多连续碱基、优选地150个或更多连续碱基、更优选地200个或更多连续碱基、或甚至更优选地250个或更多连续碱基的片段,所述片段具有如具备SEQ ID NO:1至15所定义的任一序列的相应核酸分子那样的增强表达活性,例如65%或更大、优选地70%或更大、更优选地75%或更大,甚至更优选地80%或更大、85%或更大或90%或更大,在一个最优选的实施方案中,95%或更大的增强表达活性,或
iv)作为前文在i)至iii)下提及的核酸分子中任一者的互补物或反向互补物的核酸分子,或
v)使用如表2中所示的SEQ ID NO:20至29、34至41、44至51和54至57描述的寡核苷酸引物,通过PCR可获得的核酸分子,或
vi)100个或更多核苷酸、150个或更多核苷酸、200个或更多核苷酸或250个或更多核苷酸的核酸分子,所述核酸分子在等同于在50℃于7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地65℃于2×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至15描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交。优选地,所述核酸分子在等同于在50℃于7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地65℃于1×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至15、优选地SEQ ID NO:1至15描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交;更优选地,所述核酸分子在等同于在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA杂交,以及在50℃或65℃、优选地65℃于0.1×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:1至15描述的增强转录的核苷酸序列或其互补物的至少50个、优选地至少100、更优选地至少150、甚至更优选地至少200、最优选地至少250个连续核苷酸的核酸分子杂交。
在一个实施方案中,一个或多个NEENA相对于与NEENA功能性连接的启动子是异源的。
如以上在v)下所述,使用如表2所示的由SEQ ID NO:20至29、34至41、44至51和54至57所定义的寡核苷酸,通过PCR可获得的核酸分子是例如使用如下文实施例1中所述的条件,从来自拟南芥属(Arabidopsis)植物如拟南芥(A.thaliana)的基因组DNA中可获得的。
技术人员知晓变动温度特征、循环数和/或缓冲液组成或浓度以获得相应的NEENA分子。表2中描述在用于获得相应NEENA分子的相应PCR反应中待使用的寡核苷酸的特定组合。
本领域技术人员知晓用于使单向启动子变成双向启动子的方法和使用启动子序列的互补物或反向互补物以产生与原始序列具有相同启动子特异性的启动子的方法。用于组成型及诱导型启动子的此类方法例如由Xie等人(2001)“Bidirectionalization ofpolar promoters in plants(植物中极性启动子的双向化)”nature biotechnology 19第677–679页描述。作者描述了添加最小启动子至任意给定启动子的5’引发端足以在两个方向获得启动子控制表达,同时具有相同的启动子特异性。因而,与如上文所述NEENA功能性连接的高表达启动子在互补或反向互补情况下是有功能的,并且因此所述NEENA在互补或反向互补情况下也是有功能的。
原则上,NEENA可以与任意的启动子如组织特异性、诱导型、发育特异性或组成型启动子功能性连接。相应的NEENA将导致在与一个或多个NEENA功能性连接的相应启动子控制下的异源核酸的增强的种子特异的和/或种子优先的表达。增强除种子特异的和/或种子优先的启动子之外的启动子例如组成型启动子或具有不同组织特异性的启动子的表达将给予这些启动子的特异性。核酸在相应启动子控制下的表达将在种子中显著增加,在所述种子中,在NEENA未与其启动子功能性连接的情况下,本来不可以检测到或仅微弱地检测到所述核酸的转录物。因此,组织特异性或发育特异性或任意其他启动子可以通过将一种或多种如上文所述的NEENA分子与所述启动子功能性连接而变成种子特异的和/或种子优先的启动子。因此,本发明的另一个实施方案是提供用于将植物中有功能的任意给定启动子的特异性通过相应启动子与NEENA分子连接而赋予种子特异的和/或种子优先的启动子的方法,其中所述NEENA分子包含如以上在i)至vi)下所述的序列。
优选地,一个或多个NEENA与任意的种子特异的和/或种子优先的启动子功能性连接并且将增强在所述启动子控制下的核酸分子的表达。待用于本发明任意方法中的种子特异的和/或种子优先的启动子可以源自植物例如单子叶或双子叶植物、源自细菌和/或病毒或可以是合成性启动子。待使用的种子特异的和/或种子优先的启动子例如是来自蚕豆(Vicia faba)的SBP-启动子、来自蚕豆的未知种子蛋白启动子(USP)、来自欧洲油菜(Brassica napus)的油菜籽蛋白启动子、来自亚麻(Linum usitatissmum)的conlinin启动子、来自编码过氧化物氧还蛋样过氧化物氧还蛋白样(peroxiredoxin-like)蛋白的拟南芥基因At5g01670的启动子、来自亚麻过氧化物氧还蛋白样蛋白的启动子、来自欧洲油菜的球蛋白样蛋白启动子、来自菜豆(Phaseolus vulgaris)的arcelin 5-1启动子、来自玉米(Zeamaize)的玉米醇溶蛋白启动子、来自玉米的球蛋白启动子、来自玉米的pKG86启动子,如下文实施例6中所述,等。
与NEENA功能性连接的本发明高表达的种子特异的和/或种子优先的启动子可以用于任意植物中,所述植物包括例如苔藓、蕨类、裸子植物或被子植物,例如单子叶或双子叶植物。在优选的实施方案中,与NEENA功能性连接的本发明所述启动子可以用于单子叶或双子叶植物中,优选地是作物植物如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉属植物、甘蔗、芒属植物等。在本发明的一个优选的实施方案中,与NEENA功能性连接的所述启动子可以用于单子叶作物植物如谷物、稻、小麦、高粱、大麦、芭蕉属植物、芒属植物或甘蔗中。在一个特别优选的实施方案中,与NEENA功能性连接的启动子可以用于双子叶作物植物如大豆、卡诺拉油菜、棉属植物或马铃薯中。
如本申请中所用的高表达的种子特异的和/或种子优先的启动子意指例如与NEENA功能性连接的启动子,所述NEENA引起该启动子在植物种子或其部分中增强的种子特异的和/或种子优先的表达,其中源自功能性连接于NEENA的相应启动子控制下的核酸分子的在种子中的RNA积累或RNA合成速率较高,优选地明显高于由缺少本发明NEENA的相同启动子在种子中引起的表达。优选地,与相同条件下培育的包含不与本发明NEENA功能性连接的相同种子特异的和/或种子优先的启动子的同龄对照植物相比,植物中相应核酸的RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更大、优选地200%或更大、更优选地5倍或更大、甚至更优选地10倍或更大、最优选地20倍或更大,例如50倍。
在本文中使用时,明显更高指技术人员知晓如何确定的统计显著性,例如通过对相应的数据集合应用统计检验如t-检验。
用于检测由启动子赋予的表达的方法是本领域已经的。例如,该启动子可以与标记基因如GUS、GFP或萤光素酶基因功能性连接,并且可以在植物或其部分中测定由相应标记基因编码的相应蛋白质的活性。作为代表性实例,下文详细描述用于检测萤光素酶的方法。其他方法例如是通过本领域已知的方法,例如RNA印迹分析法、qPCR、连缀(run-on)测定法或本领域所述的其他方法测量受该启动子控制的核酸分子的RNA稳态水平或合成速率。
技术人员知晓多种用于功能性连接两个或多个核酸分子的方法。此类方法可以包括限制性切割/连接法、不依赖连接酶的克隆法、重组工程法、重组或合成法。其他方法可以用来功能性连接两个或多个核酸分子。
本发明的又一个实施方案是用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的种子特异的和/或种子优先的表达,所述方法包括步骤:将包含如上文在i)至vi)下所定义核酸分子的一个或多个NEENA导入所述植物或其部分,和将所述一个或多个NEENA与启动子、优选地种子特异的和/或种子优先的启动子并且与处在所述启动子、优选地种子特异的和/或种子优先的启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。
NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。例如,本发明的NEENA在其天然环境中与其天然启动子功能性连接,而在本发明中,它与可以源自相同生物、不同生物或合成性启动子的另一个启动子连接。它也可以意指本发明的NEENA与其天然启动子连接,但是处于所述启动子控制下的核酸分子相对于包含其天然NEENA的启动子为异源。此外,应当理解,启动子和/或处在与本发明NEENA功能性连接的所述启动子控制下的核酸分子相对于所述NEENA为异源,原因是它们的序列已经受到例如突变如插入、缺失等操作,从而启动子和/或处在所述启动子控制下的核酸分子的天然序列被修饰并且因此已经变得相对于本发明的NEENA为异源。也可以理解,当NEENA与其天然启动子功能性连接,其中NEENA的位置相对于所述启动子改变,从而该启动子在这种操作后显示更高表达时,该NEENA相对于功能性连接至NEENA的核酸为异源。
如本文中所意指的显示增强的种子特异的和/或种子优先的核酸分子表达的植物意指与相同条件下培育的没有与相应核酸分子功能性连接的相应NEENA的对照植物相比,具有更高的、优选地统计显著更高的种子特异的和/或种子优先的核酸分子表达的植物。这种对照植物可以是野生型植物或是包含控制与本发明植物中相同的基因的相同启动子的转基因植物,其中所述启动子不与本发明的NEENA连接。
产生如本文中所用的植物包括用于稳定转化如借助农杆菌介导的转化、原生质体转化、粒子轰击等将重组DNA构建体导入植物或其部分中的方法和任选地随后再生出转基因植物。它还包括用于瞬时转化植物或其部分的方法,如病毒感染法或农杆菌浸润法。技术人员知晓用于稳定和/或瞬时转化植物或其部分的其他方法。方法如育种方法或原生质体融合法可以用于本发明植物的产生并且由本发明涵盖。
本发明的方法可以应用于任意植物,例如裸子植物或被子植物,优选地是被子植物,例如双子叶或单子叶植物,优选地是双子叶植物。优选的单子叶植物例如是谷物、小麦、稻、大麦、高粱、芭蕉属植物、甘蔗、芒属植物和短柄草属植物(Brachypodium),特别优选的单子叶植物是谷物、小麦和稻。优选的双子叶植物是例如大豆、油菜籽、卡诺拉油菜、亚麻、棉属植物、马铃薯、甜菜、万寿菊和拟南芥属植物(Arabidopsis),特别优选的双子叶植物是大豆、油菜籽、卡诺拉油菜和马铃薯。
在本发明的一个实施方案中,如上文定义的方法包括以下步骤:
a)将包含如上文的i)至vi)中所定义核酸分子的一个或多个NEENA导入植物或其部分,和
b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的优选地种子特异的和/或种子优先的表达的内源核酸功能性连接,和任选地
c)从所述转化的细胞再生出包含所述一个或多个表达构建体的植物或其部分。
可以将一个或多个NEENA分子借助粒子轰击法、原生质体电穿孔法、病毒感染法、农杆菌介导的转化法或本领域已知的任意其他方法导入植物或其部分。可以将NEENA分子导入整合例如至质粒或病毒DNA或病毒RNA中。NEENA分子也可以在导入植物或植物部分中之前包含于BAC、YAC或人工染色体上。也可以将NEENA分子作为包含NEENA序列的线性核酸分子导入,其中额外的序列可以紧邻该核酸分子上的NEENA序列存在。毗邻NEENA序列的这些序列可以长约20bp,例如20bp至数百碱基对,例如100bp或更多,并且可以促进整合至基因组中,例如通过同源重组。可以使用用于基因组整合的任何其他方法,无论它是定向整合法,如同源重组,或随机整合法,如非常规(illegitimate)重组。
可以与NEENA分子功能性连接的优选地种子特异的和/或种子优先的表达的内源核酸可以是任意核酸,优选地是任意的种子特异的和/或种子优先的表达的核酸分子。该核酸分子可以是编码蛋白质的核酸分子或非编码性分子如反义RNA、rRNA、tRNA、miRNA、ta-siRNA、siRNA、dsRNA、snRNA、snoRNA或本领域已知的任何其他非编码性RNA。
技术人员知晓用于鉴定种子特异的和/或种子优先的表达的核酸分子的方法,例如通过微阵列芯片杂交、qPCR、RNA印迹分析、下一代测序法等,其中本发明的方法可以优选地应用于所述核酸分子。
实施本发明方法的又一种方式可以是
a)提供包含一个或多个NEENA的表达构建体,所述NEENA包含如上文i)至vi)中所定义的启动子、优选地与如上文所定义的种子特异的和/或种子优先的启动子并且与相对于所述一个或多个NEENA为异源并处在所述启动子、优选地种子特异的和/或种子优先的启动子控制下的一种或多种核酸分子功能性连接的核酸分子,和
b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地
c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。
NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
表达构建体可以借助本领域已知的任何方法整合至相应植物的基因组中。使用如粒子轰击法或农杆菌介导的转化法的方法时,整合可以是随机的。在一个优选的实施方案中,整合借助定向整合,例如通过同源重组进行。后一种方法将允许包含与NEENA功能性连接的高表达启动子的表达构建体整合至有利的基因组区域中。有利的基因组区域例如是已知包含例如在种子中高度表达的基因的基因组区域,并且因而与显示无转录活性的基因组区域相比,可以增加源自所述表达构建体的表达。
在另一个优选的实施方案中,所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的启动子、优选地种子特异的和/或种子优先的启动子功能性连接。
如本文中所意指的靠近转录起始位点包含一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少、优选地2000bp或更少、更优选地1500bp或更少、甚至更优选地1000bp或更少并且最优选地500bp或更少的启动子、优选地种子特异的和/或种子优先的启动子功能性连接。应当理解,该NEENA可以距相应启动子的转录起始位点以相应距离在上游或下游整合。因而,一个或多个NEENA不必一定包含于处在与所述一个或多个NEENA功能性连接的优选地种子特异的和/或种子优先的启动子控制下的相应异源核酸的转录物中。优选地,一个或多个NEENA整合在相应启动子、优选地种子特异的和/或种子优先的启动子的转录起始位点的下游。转录起始位点下游的整合位点可以位于5’UTR、3’UTR、外显子或内含子中,或它可以替换内含子或部分或完全替换处于优选地种子特异的和/或种子优先的启动子控制下的异源核酸的5’UTR或3’UTR。优选地,一个或多个NEENA整合在5’UTR或内含子中,或所述NEENA替换内含子或部分或全部5’UTR,最优选地,它整合在相应异源核酸的5’UTR中。
本发明的又一个实施方案包括含有一个或多个NEENA的重组表达构建体,其中所述的NEENA包含上文i)至vi)中所定义的核酸分子。
重组表达构建体可以还包含与一个或多个NEENA功能性连接的一个或多个启动子,优选地种子特异的和/或种子优先的启动子和任选地一个或多个表达的核酸分子,所述核酸分子相对于所述一个或多个NEENA为异源。
NEENA可以相对于处在与NEENA功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。
该表达构建体可以包含与NEENA功能性连接的启动子、优选地种子特异的和/或种子优先的启动子和待表达核酸分子的1个或多个,例如2个或更多个,例如5个或更多个,如10个或更多个组合,所述的待表达核酸分子相对于相应的NEENA为异源。该表达构建体也可以包含其他启动子,所述的其他启动子不包含与相对于相应的启动子为同源或异源的待表达核酸分子功能性连接的NEENA。
包含如上文定义的一个或多个重组表达构建体的重组表达载体是本发明的另一个实施方案。可以在本发明中使用的多种表达载体是技术人员已知的。用于将包含这种表达构建体的此种载体导入植物基因组中的方法和用于从转化的细胞恢复转基因植物的方法也是本领域熟知的,其中所述的表达构建体包含例如与NEENA功能性连接的启动子和任选地其他元件如终止子。取决于用于转化植物或其部分的方法,完整载体可以整合至所述植物或其部分的基因组中,或者载体的某些组分可以整合至所述基因组中,例如T-DNA。
本发明中还包括转基因植物或其部分,其包含如上文i)至vi)中所定义的一种或多种异源NEENA。如果NEENA是合成的、源自另一种生物或源自相同生物,但是其天然基因组位置与对照植物例如野生型植物相比被改变,则将NEENA理解为相对于该植物是异源的。应当理解,改变的基因组位置意指,NEENA位于另一条染色体上或位于同一条染色体上,但是脱离例如在野生型植物中其天然基因组位置10kb或更远,例如10kb,优选地5kb或更远,例如5kb,更优选地1000bp或更远,例如1000bp,甚至更优选地500bp或更远,例如500bp,特别优选地100bp或更远,例如100bp,最优选地10bp或更远,例如10bp。
包含如上文定义的重组表达载体或如上文定义的重组表达构建体的转基因细胞或转基因植物或其部分是本发明的又一个实施方案。转基因细胞、转基因植物或其部分可以选自细菌、真菌、酵母或植物、昆虫细胞或哺乳动物细胞或植物。优选的转基因细胞是细菌、真菌、酵母、植物细胞。优选的细菌是肠杆菌属细菌如大肠杆菌(E.coli)和农杆菌属的细菌,例如根癌农杆菌(Agrobacterium tumefaciens)和发根农杆菌(Agrobacteriumrhizogenes)。优选的植物是单子叶或双子叶植物,例如单子叶或双子叶作物植物,如谷物、大豆、卡诺拉油菜、棉属植物、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉属植物、甘蔗、芒属植物等。优选的作物植物是谷物、稻、小麦、大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的双子叶作物植物是大豆、卡诺拉油菜、棉属植物或马铃薯。尤其优选的单子叶作物植物是谷物、小麦和稻。
源自如上文所定义的转基因细胞或植物或其部分中的转基因细胞培养物、转基因种子、部分或繁殖材料是本发明的其他实施方案,其中所述的转基因细胞或植物或其部分包含如上文在i)至vi)中定义的所述异源NEENA或如上文定义的所述重组表达构建体或所述重组载体。
如本文中所意指的转基因部分或繁殖材料包含含有相应NEENA、重组表达构建体或重组载体的全部组织和器官,例如叶、茎和果实以及用于植物繁殖和/或再生的材料如插条、接穗、压条、枝条或幼苗。
本发明的又一个实施方案是如上文在i)至vi)中定义的NEENA或如上文定义的重组构建体或重组载体用于增强植物或其部分中表达的用途。
因而,本申请即将提供种子特异的和/或种子优先的增强基因表达的核酸分子,其包含一个或多个启动子,优选地是与一个或多个NEENA功能性连接的种子特异的和/或种子优先的启动子。另外,提供了此类增强基因表达的核酸分子和包含此类增强基因表达的核酸分子的表达构建体、表达载体、转基因植物或其部分和转基因细胞的用途。
本发明中还包括源自如上文定义的转基因细胞或植物或其部分中的转基因细胞培养物、转基因种子、部分或繁殖材料用于生产食物、动物饲料、种子、药物或精细化学品的用途。
定义
缩写:NEENA–增强核酸表达的核酸,GFP–绿色荧光蛋白,GUS–β-葡糖苷酸酶,BAP–6-苄氨基嘌呤,2,4-D–2,4-二氯苯氧乙酸,MS–Murashige-Skoog培养基,NAA–1-萘乙酸,MES,2-(N-吗啉代)-乙磺酸,IAA:吲哚乙酸,Kan:硫酸卡那霉素,GA3–赤霉酸,TimentinTM:替卡西林二钠/克拉维酸钾,microl:微升。
应当理解,本发明不限于具体的方法或方案。还应当理解本文所用的术语目的仅在于描述具体实施方案,并且不意图限制本发明,本发明将仅受所附权利要求书限制。必须指出,如本文中和所附权利要求中所用,单数形式“一个”、“一种”和“该”包括复数指称,除非上下文另外明确地指明并非如此。因此,例如,对一种“载体”的提及是对一种或多种载体的提及并且包括本领域技术人员已知的其等同物等。术语“约”在本文中用来指大约、大致、左右和在……范围内。当术语“约”与一个数字范围联合使用时,它通过扩展界限值高于和低于所述数值而修饰该范围。通常而言,术语“约”在本文中用来通过20%、优选地10%之上或之下(更高或更低)变异而修饰高于和低于所述值的数值。如本文中所用,词汇“或”意指特定列出的任何一成员并且还包括该列出的成员的任意组合。在本说明书中及以下权利要求中使用时,词汇“包含”、“包含着”、“包括”、“包括着”和“包括了”意图指明一个或多个所述特征、整数、组分或步骤的存在,但是它们不排除一个或多个其他特征、整数、组分、步骤或其组的存在或添加。为清晰起见,将本说明书中使用的某些术语如下定义并使用。
反平行:“反平行”在本文中指经互补性碱基残基之间氢键配对的两个核苷酸序列,其中磷酸二酯键在一个核苷酸序列中以5’-3’方向分布并且在另一个核苷酸序列中以3’-5’方向分布。
反义:术语“反义”指相对于其转录或发挥作用的正常方向为反向并且从而表达下述RNA转录物的核苷酸序列,其中所述的RNA转录物与宿主细胞内部表达的靶基因mRNA分子互补(例如,它可以借助Watson-Crick碱基配对作用与靶基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(例如宿主细胞中存在的基因组DNA)互补。
编码区:如本文中所用,术语“编码区”在谈及结构基因使用时,指编码在作为mRNA分子翻译结果的新生多肽中存在的氨基酸的核苷酸序列。在真核生物中,编码区在5’侧以编码起始物甲硫氨酸的核苷酸三联体“ATG”为界并且在3’侧以特定终止密码子的3种三联体(即TAA、TAG、TGA)为界。除含有内含子之外,基因的基因组形式也可以包含位于RNA转录物中存在的序列的5’-及3’-端的序列。这些序列称作“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’-侧翼区可以含有控制或影响基因转录的调节序列如启动子和增强子。3’-侧翼区可以含有指导转录终止、转录后剪切和聚腺苷酸化的序列。
互补的:“互补的”或“互补性”指包含反平行核苷酸序列的两个核苷酸序列,其中一旦在反平行核苷酸序列中的互补性碱基残基之间形成氢键,则所述反平行核苷酸序列能够相互配对(通过碱基配对原则)。例如,序列5’-AGT-3’与序列5’-ACT-3’互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则未匹配的情况。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基按照碱基配对规则与另一个碱基匹配的情况。核酸分子链之间互补性的程度对核酸分子链之间杂交的效率和强度具有明显影响。如本文中所用的核酸序列“互补物”指这样的核苷酸序列,其核酸分子显示与该核酸序列的核酸分子的全部互补性。
双链RNA:“双链RNA分子”或“dsRNA”分子包含核苷酸序列的有义RNA片段和该核苷酸序列的反义RNA片段,二者均包含彼此互补的核苷酸序列,因而允许有义RNA片段和反义RNA片段配对并形成双链RNA分子。
内源的:“内源的”核苷酸序列指存在于未转化植物细胞的基因组中的核苷酸序列。
增强的表达:“增强”或“增加”核酸分子在植物细胞中的表达在本文中同等地使用,并且意指该核酸分子在应用本发明方法之后在植物、植物部分或植物细胞中的表达水平比其在应用该方法之前在植物、植物部分或植物细胞中的表达更高,或与缺少本发明重组核酸分子的参照植物相比更高。例如,参照植物包含仅缺少相应NEENA的相同构建体。如本文中所用的术语“增强”或“增加”是同义的,并且在本文中意指待表达的核酸分子的更高、优选地显著更高的表达。如本文中所用的,“增强”或“增加”某物质(如蛋白质、mRNA或RNA)的水平意指相对于基本上相同条件下培育的、缺少本发明重组核酸分子(例如缺少本发明的NEENA分子、重组构建体或重组载体)的基本上相同植物、植物部分或植物细胞,该水平增加。如本文中所用的,“增强”或“增加”某物质(例如由靶基因表达的前RNA、mRNA、rRNA、tRNA、snoRNA、snRNA和/或由其编码的蛋白质产物)的水平意指相对于缺少本发明重组核酸分子的细胞或生物,该水平增加50%或更多,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。可以通过技术人员熟悉的方法测定所述增强或增加。因而,可以例如通过蛋白质的免疫学检测法确定核酸或蛋白质量的增强或增加。另外,可以使用技术如蛋白质测定法、荧光法、RNA杂交法、核酸酶保护测定法、逆转录法(定量RT-PCR)、ELISA(酶联免疫吸附测定法)、蛋白质印迹法、放射免疫测定法(RIA)或其他免疫测定法和荧光激活的细胞分析(FACS)来测量植物或植物细胞中的特定蛋白质或RNA。取决于所诱导蛋白质产物的类型,也可以确定其活性或对生物或细胞表型的影响。用于确定蛋白质数量的方法是技术人员已知的。可以提到的实例是:微量Biuret法(Goa J(1953)Scand J Clin Lab Invest 5:218-222)、Folin-Ciocalteau法(Lowry OH等人(1951)J Biol Chem 193:265-275)或测量CBB G-250的吸光度(Bradford MM(1976)Analyt Biochem 72:248-254)。作为用于量化蛋白质的活性的一个实例,在下文实施例中描述萤光素酶活性检测法。
表达:“表达”指基因产物的生物合成,优选地指细胞中核苷酸序列例如内源基因或异源基因的转录和/或翻译。例如,在结构基因的情况下,表达涉及结构基因转录成mRNA并且任选地随后mRNA翻译成一种或多种多肽。在其他情况下,表达可以仅指携带RNA分子的DNA的转录。
表达构建体:如本文中所用的“表达构建体”意指能够指导特定核苷酸序列在适宜植物部分或植物细胞中表达的DNA序列,该DNA序列包含在导入此DNA序列的所述植物部分或植物细胞中有功能的启动子,所述启动子与任选地有效连接至终止信号的目的核苷酸序列有效连接。如果需要翻译,该DNA序列一般还包含为正确翻译所述核苷酸序列所需的序列。编码区可以编码目的蛋白,但也可以以有义或反义方向编码功能性目的RNA,例如RNAa、siRNA、snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码的调节性RNA。包含目的核苷酸序列的表达构建体可以是嵌合的,这意指该表达构建体的组件中一者或多者相对于该表达构建体的其他组件中一者或多者是异源的。该表达构建体也可以是一种这样的表达构建体,它天然地存在,但已经以用于异源表达的重组形式获得。然而,一般而言,该表达构建体相对于宿主是异源,即,该表达构建体的特定DNA序列不天然存在于宿主细胞中并且必须已经通过转化事件导入宿主细胞或该宿主细胞的祖先中。该表达构建体中的核苷酸序列的表达可以处于种子特异的和/或种子优先的启动子或处于仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子的控制下。在植物的情况下,该启动子也可以是针对特定组织或器官或发育阶段特异的。
外来:术语“外来”指任何核酸分子(例如,基因序列),所述核酸分子通过实验操作导入细胞的基因组中并且可以包括该细胞中存在的序列,只要导入的序列含有一些修饰(例如,点突变、存在可选择标记基因等)和因此相对于天然存在序列是不同的。
功能性连接:将术语“功能性连接”或“功能性连接的”理解为意指例如调节性元件(例如启动子)与待表达的核酸序列并且根据需要与其他调节性元件(例如,终止子或NEENA)以如此方式依次排列,从而每种调节性元件可以履行其目的功能以允许、修饰、促进或影响所述核酸序列的表达。作为同义词,可以使用“有效连接”或“有效连接的”。可以根据所述核酸序列相对于有义或反义RNA的排列,产生表达。为此目的,不是必需要求化学意义上的直接连接。遗传控制序列例如增强子序列也能够从远离的位置或甚至从其它DNA分子对靶序列产生其作用。优选的排列是这样的排列,其中待表达的核酸序列重组地位于充当启动子的序列之后,从而这两个序列相互共价地连接。该启动子序列与待重组表达的核酸序列之间的距离优选地小于200碱基对、特别优选地小于100碱基对、非常特别优选地小于50碱基对。在优选的实施方案中,待转录的核酸序列以如此方式位于启动子之后,其中转录起点与本发明嵌合RNA的合乎需要的开端相同。功能性连接和表达构建体可以借助如(例如,在Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy等人(1984)Experiments with Gene Fusions,Cold Spring Harbor Laboratory,ColdSpring Harbor(NY);Ausubel等人(1987)Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley Interscience;Gelvin等人(编著)(1990)PlantMolecular Biology Manual;Kluwer Academic Publisher,Dordrecht,The Netherlands)所述的惯用重组和克隆技术产生。然而,其他序列,例如充当带限制性酶特定切割位点的接头或充当信号肽的序列,也可以位于这两个序列之间。序列的插入也可以导致融合蛋白的表达。优选地,由调节性区域例如启动子和待表达核酸序列的连接组成的表达构建体可以以载体整合的形式存在并且被插入植物基因组,例如通过转化法。
基因:术语“基因”指与能够以某种方式调节基因产物(例如,多肽或功能性RNA)表达的适宜调节序列有效连接的区域。基因包括DNA中位于编码区(可读框,ORF)之前(上游)和之后(下游)的非翻译调节区(例如启动子、增强子、阻抑物等),以及在可用的情况下,在各个编码区(例如外显子)之间的间插序列(例如内含子)。如本文中所用的术语“结构基因”意图指转录成mRNA的DNA序列,其中所述的mRNA随后翻译成作为具体多肽的特征的氨基酸序列。
基因组和基因组DNA:术语“基因组”或“基因组DNA”指宿主生物的可遗传信息。所述基因组DNA包括胞核的DNA(也称作染色体DNA),还包括质体(例如,叶绿体)和其他细胞器(例如,线粒体)的DNA。优选地,术语“基因组”或基因组“DNA”指胞核的染色体DNA。
异源的:就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于,或受到操作以变得有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。包含核酸分子和与之连接的一个或多个调节性核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体,在所述构建体中,a)所述核酸分子或b)所述调节性核酸分子或c)二者(即(a)和(b))不位于其天然(原有)遗传环境中或已经因实验操作受到修饰,修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒位或插入。天然遗传环境指源生物中的天然染色体基因座或指存在于基因组文库中。在基因组文库的情况下,优选地保留,至少部分地保留该核酸分子的序列的天然遗传环境。该环境分布在该核酸序列的至少一侧并且具有至少50bp、优选地至少500bp、特别优选地至少1,000bp、非常特别优选地至少5,000bp序列长度。天然存在的表达构建体例如启动子与相应基因的天然存在组合-在通过非天然的合成性“人工”方法例如诱变法修饰时变成转基因表达构建体。已经描述了此类方法(US 5,565,350;WO00/15815)。例如,与启动子有效连接的编码蛋白质的核酸分子相对于该启动子视为异源,其中所述的启动子不是该核酸分子的天然启动子。优选地,异源DNA相对于导入该异源DNA的细胞不是内源的或不天然与该细胞相关,但是已经从另一种细胞获得或已经合成。异源DNA还包括含有一些修饰的内源DNA序列、不天然存在的多拷贝内源DNA序列或这样的DNA序列,该DNA序列不与同物理连接于所述DNA序列的另一个DNA序列天然接合。通常地但不是必需地,异源DNA编码在细胞中表达的RNA或蛋白质,而所述RNA或蛋白质正常情况下不被所述细胞产生。
高表达种子特异的和/或种子优先的启动子:如本文中所用的“高表达种子特异的和/或种子优先的启动子”意指在植物或其部分中引起种子特异的和/或种子优先的表达的启动子,其中衍生自处于相应启动子控制下的核酸分子中的RNA积累或合成速率或RNA稳定性比缺少本发明NEENA的启动子所引起的表达更高,优选地显著更高。优选地,相对于缺少本发明NEENA的种子特异的和/或种子优先的启动子,RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。
杂交:如本文中所用,术语“杂交”包括“核酸分子的链通过碱基配对作用与互补链结合的任意过程”。(J.Coombs(1994)Dictionary of Biotechnology,Stockton Press,NewYork)。杂交和杂交的强度(即,核酸分子之间结合的强度)受此类因素影响,如核酸分子之间的互补性程度、所涉及条件的严格性、所形成杂合体的Tm和核酸分子内部的G:C比。如本文中所用,术语“Tm”用来指“解链温度”。解链温度是双链核酸分子群体一半解离成单链的温度。用于计算核酸分子的Tm的等式是本领域熟知的。如标准参考文献所示,当核酸分子处于1M NaCl的水溶液中时,可以通过等式:Tm=81.5+0.41(%G+C)计算来进行Tm值的简单估计[见例如,Anderson和Young,Quantitative Filter Hybridization,in Nucleic AcidHybridization(1985)]。其他参考文献包括更复杂计算法,这些算法考虑了结构特征及序列特征以计算Tm。严格条件是本领域技术人员已知的并且可以在Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6中找到。
“同一性”:在比较两个或多个核酸或氨基酸分子使用时,“同一性”意指所述分子的序列共有某种程度的序列相似性,即所述序列是部分相同的。
为确定两个氨基酸序列或两个核酸分子的同一性(同源性在本文可互换地使用)百分数,将所述序列以一个序列在另一个序列下的方式书写以最佳比较(例如,可以将空位插入蛋白质的序列或核酸的序列,旨在与另一种蛋白质或另一种核酸产生最佳比对)。
随后在对应氨基酸位置或核苷酸位置处比较氨基酸残基或核酸分子。当一个序列中的位置由另一个序列中对应位置处的相同氨基酸残基或相同核酸分子占据时,则所述分子在这个位置处是同源的(即,如本上下文中所用的氨基酸或核酸“同源性”对应于氨基酸或核酸“同一性”。这两个序列之间的同源性百分数是所述序列共有的相同位置的数值的函数(即同源性百分数=相同位置的数值/位置总数×100)。术语“同源性”和“同一性”因而视为同义词。
为确定两个或多个氨基酸序列或两个或多个核苷酸序列的同一性百分数,已经开发了几个计算机软件程序。两个或更多序列的同一性可以用例如软件fasta计算,其中软件fasta已经以fasta 3版本使用(W.R.Pearson和D.J.Lipman,PNAS 85,2444(1988);W.R.Pearson,Methods in Enzymology 183,63(1990);W.R.Pearson和D.J.Lipman,PNAS85,2444(1988);W.R.Pearson,Enzymology 183,63(1990))。用于计算不同序列的同一性的另一种有用程序是标准blast程序,其中该程序包含于Biomax pedant软件(联邦德国慕尼黑Biomax)中。不幸地,该程序有时产生次优结果,因为blast不总是包含主题和查询对象的完整序列。然而,由于该程序非常高效,因而它可以用于庞大数目序列的比较。以下设置一般用于这样的序列比较:
-p程序名称[字符串];-d数据库[字符串];默认=nr;-i查询文件[File In];默认=stdin;-e期望值(E)[Real];默认=10.0;-m比对显示选项:0=配对;1=查询-比上区域(query-anchored),显示同一性;2=查询-比上区域,不显示同一性;3=查询-比上区域的屏文形式,显示同一性;4=查询-比上区域的屏文形式,不显示同一性;5=查询-比上区域,不显示同一性和突然结束;6=查询-比上区域的屏文形式,不显示同一性和突然结束;7=XML Blast输出;8=TAB格式输出;9带注释行的TAB格式输出[整数];默认=0;-o BLAST报告输出文件[File Out]任选;默认=stdout;-F过滤软件查询序列(DUST用blastn,SEG用其他方法)[字符串];默认=T;-G空位开口成本(零激发默认行为)[整数];默认=0;-E开口延伸成本(零激发默认行为)[整数];默认=0;-X X空位比对的下降值(比特)(零激发默认行为);blastn 30,megablast 20,tblastx 0,全部其他方法15[整数];默认=0;-I在定义行中显示GI'[T/F];默认=F;-q核苷酸错配罚分(仅blastn)[整数];默认=-3;-r核苷酸匹配回报(仅blastn)[整数];默认=1;-v显示对(V)的单-线描述的数据库序列数目[整数];默认=500;-b显示对(B)的比对的数据库序列数目[整数];默认=250;-f延伸命中的阈值,若为零,则默认;blastp 11,blastn 0,blastx 12,tblastn 13;tblastx 13,megablast 0[整数];默认=0;-g执行空位比对(对tblastx不可用)[T/F];默认=T;-Q查询使用的遗传密码[整数];默认=1;-D DB遗传密码子(仅用于tblast[nx])[整数];默认=1;-a使用的处理器数目[整数];默认=1;-O SeqAlign文件[File Out]任选;-J相信查询定义行[T/F];默认=F;-M矩阵[字符串];默认=BLOSUM62;-W字大小,如果为零,则默认(blastn 11,megablast28,全部其他方法3)[整数];默认=0;-z数据库的有效长度(对于真实大小,使用零)[Real];默认=0;-K来自保持区域的最佳命中数(默认关闭;若使用,则推荐值为100)[整数];默认=0;-P 0用于多重命中;1用于单一命中[整数];默认=0;-Y搜索空间的有效长度(对真实大小,使用零)[Real];默认=0;-S针对数据库搜索的查询链(对于blast[nx]和tblastx);3用于两者,1是顶端,2是底部[整数];默认=3;-T产生HTML输出结果[T/F];默认=F;-l限制数据库搜索至GI's列表[字符串]任选;-U使用FASTA序列的较低事件过滤作用[T/F]任选;默认=F;-y无空位延伸的X下降值(比特)(0.0激发默认行为);blastn 20,megablast 10,全部其他方法7[Real];默认=0.0;-Z最终空位比对的X下降值(比特)(0.0激发默认行为);blastn/megablast 50,tblastx 0,全部其他方法25[整数];默认=0;-RPSI-TBLASTN检查点文件[File In]任选;-n MegaBlast搜索[T/F];默认=F;-L查询序列上的位置[字符串]任选;-A多重命中窗口大小,如果为零,则默认(blastn/megablast 0,全部其他方法40[整数];默认=0;-w移码罚分(OOF算法用于blastx)[整数];默认=0;-t允许tblastn中用于联系HSP的最大内含子的长度(0取消连接联系)[整数];默认=0。
通过使用Needleman和Wunsch或者Smith和Waterman算法获得高质量的结果。因而,优选基于所述算法的程序。有利地,可以用程序PileUp(J.Mol.Evolution.,25,351(1987),Higgins等人,CABIOS 5,151(1989))或优选地用均基于Needleman和Wunsch算法(J.Mol.Biol.48;443(1970))的程序“Gap”与“Needle”和基于Smith和Waterman(Adv.Appl.Math.2;482(1981))算法的“BestFit”进行序列的比较。“Gap”和“BestFit”是GCG软件包[Genetics Computer Group,575Science Drive,Madison,Wisconsin,USA53711(1991);Altschul等人(Nucleic Acids Res.25,3389(1997)),“Needle”是欧洲分子生物学开放软件包(The European Molecular Biology Open Software Suite(EMBOSS))的部分(Trends in Genetics 16(6),276(2000))。因而,优选地,用程序“Gap”或“Needle”在所述序列的整个范围内进行确定序列同源性百分数的计算。为比较核酸序列,以下标准调整用于“Needle”:矩阵:EDNAFULL,空位罚分:10.0,延伸罚分:0.5。用于比较核酸序列的以下标准调整用于“Gap”:空位权重:50,长度权重:3,平均匹配:10.000,平均错配:0.000。
例如,将声称在核酸水平与序列SEQ ID NO:1具有80%同一性的序列理解为意指,通过上述程序“Needle”以设置的上述参数与序列SEQ ID NO:1所代表的序列比较时具有80%同一性的序列。优选地,在查询序列例如SEQ ID NO:1的完整长度上计算同源性。
内含子:指基因内部的DNA区段(间插序列),该DNA区段不编码该基因产生的蛋白质的部分,并且从该基因转录的mRNA中在该mRNA从细胞核输出之前剪切下来。内含子序列指内含子的核酸序列。因而,内含子是DNA序列的这些区域,它们随编码序列(外显子)一起转录但是在成熟mRNA形成期间被除去。内含子可以位于实际编码区内部或位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导序列中。初级转录物中的内含子被切下并且编码序列同时且精确地连接以形成成熟的mRNA。内含子和外显子的交界形成剪接位点。内含子的序列始于GU并止于AG。另外,在植物中,已经描述AU-AC内含子的两个实例:来自拟南芥(Arabidopsis thaliana)的RecA样蛋白基因第14内含子和G5基因第7内含子是AT-AC含子。含有内含子的前mRNA具有3种短序列,连同其他序列,这些短序列对于精确剪接内含子是必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接是除去初级mRNA转录物中存在的间插序列(内含子)并接合或连接外显子序列。这又称作顺式剪接作用,所述顺式剪接作用将相同RNA上的两个外显子接合,同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体的特定蛋白质组分(例如其剪接内含子末端处的共有序列)识别并结合的序列。功能性元件与剪接体的相互作用导致从不成熟mRNA除去内含子序列和外显子序列的再接合。内含子具有3种短序列,这些短序列对于精确剪接内含子是必需的,但是并非足够的。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序列是在植物中剪接过程和剪接位点选择方面重要的。分支点序列通常位于3’剪接位点上游10-60个核苷酸处。
同基因的:除可以因存在或不存在异源DNA序列而不同之外,在遗传上相同的生物(例如植物)。
分离的:如本文中所用的术语“分离”意指材料已经通过人工取出并且离开其原来的天然环境存在并且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化的形式存在或可以存在于非天然环境中如例如存在于转基因宿主细胞中。例如,活植物中存在的天然存在多核苷酸或多肽不是分离的,然而与该天然系统中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,和是分离的,因为这种载体或组合物不是其最初环境的一部分。优选地,术语“分离的”相对于核酸分子使用时,如在“分离的核酸序列”中,指被鉴定并且与该核酸序列天然来源中通常与其接合的至少一种杂质性核酸分子分开的核酸序列。分离的核酸分子是这样的核酸分子,其在与自然界中找到该核酸分子的形式或环境不同的形式或环境下存在。相反,未分离的核酸分子是以其在自然界中存在的状态所找到的核酸分子如DNA和RNA。例如,在宿主细胞染色体上相邻基因附近找到给定的DNA序列(例如,基因);作为与编码多种蛋白质的众多其他mRNA的混合物,在细胞中找到RNA序列,如编码特定蛋白质的特定mRNA序列。然而,包含例如SEQ ID NO:1的分离的核酸序列包括例如在细胞中通常含有SEQ ID NO:1的此类核酸序列,其中所述核酸序列位于不同于天然细胞的染色体或染色体外位置中,或侧翼分布有不同于自然界中存在的核酸序列。分离的核酸序列可以以单链或双链形式存在。当分离的核酸序列用来表达蛋白质时,该核酸序列将最少含有有义链或编码链的至少一部分(即,该核酸序列可以是单链的)。备选地,它可以含有有义链和反义链(即,该核酸序列可以是双链的)。
最小启动子:在缺少上游激活情况下无活性或启动子活性大大降低的启动子元件,尤其是TATA元件。在合适的转录因存在下,最小启动子发挥作用以引起转录。
NEENA:参见“增强核酸表达的核酸”。
非编码:术语“非编码”指核酸分子中不编码所表达蛋白质的部分或全部的序列。非编码序列包括但不限于内含子、增强子、启动子区、3’非翻译区和5’非翻译区。
增强核酸表达的核酸(NEENA):术语“增强核酸表达的核酸”指这样的序列和/或核酸分子,其是具有在与NEENA功能性连接的启动子的控制下增强核酸表达的内在特性的特定序列。不同于启动子序列,NEENA本身不能驱动表达。为了履行增强与NEENA功能性连接的核酸分子表达的职能,NEENA本身应当与启动子功能性连接。与本领域已知的增强子序列的区别在于,NEENA以顺式方式而不以反式方式起作用,并且必需靠近待表达核酸的转录起始位点存在。
核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在的或合成的或人工核酸或核苷酸。术语“核酸”和“核苷酸”包括处于单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另外说明,特定核酸序列也隐含地包括其保守方式修饰的变体(例如简并密码子置换)和互补序列,以及明确指出的序列。术语“核酸”在本文中与“基因”、“DNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换地使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸,所述修饰包括但不限于5-位置嘧啶修饰、8-位置嘌呤修饰、胞嘧啶环外环胺处的修饰、5-溴-尿嘧啶置换等;和2'-位置糖修饰,包括但不限于糖修饰的核糖核苷酸,其中2'-OH由选自H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN的基团替换。短发夹RNA(shRNA)也可以包含非天然元件如非天然碱基,例如,肌苷和黄嘌呤,非天然糖,例如,2'-甲氧基核糖,或非天然磷酸二酯键,例如甲基磷酸酯、硫代磷酸酯和肽。
核酸序列:短语“核酸序列”指从5’-端至3’-端读取的脱氧核糖核苷酸或核糖核苷酸的单链或双链聚合物。它包括染色体DNA、自我复制型质粒、DNA或RNA的感染性聚合物、和主要发挥结构性作用的DNA或RNA。“核酸序列”也指代表核苷酸的缩写、字母、字符或字的连续串。在一个实施方案中,核酸可以是“探针”,所述探针是相对短的核酸,通常长度小于100个核苷酸。经常地,核酸探针具有约50个核苷酸长度至约10个核苷酸长度。核酸的“靶区域”是核酸中被鉴定为有目标的部分。核酸的“编码区”是核酸的部分,其中置于适宜的调节性序列控制下时,所述部分以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。称该编码区编码这种多肽或蛋白质。
寡核苷酸:术语“寡核苷酸”指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的低聚物或聚合物,以及具有类似发挥作用的非天然存在部分的寡核苷酸。此类修饰或取代的寡核苷酸因合乎需要的特性,例如增强的细胞摄取、增强的核酸靶亲和力和在核酸酶存在下增加的稳定性而经常优选地胜过其天然形式。寡核苷酸优选地包括通过键(例如,磷酸二酯键)或取代键(substitute linkage)相互共价偶联的两个或多个核苷酸单体(nucleomonomer)。
突出端:“突出端”是双链寡核苷酸分子的5’-或3’-羟基端上相对短的单链核苷酸序列(也称作“延伸”、“伸出端”或“粘末端”)。
植物:通常理解为意指能够光合作用的任何真核单细胞或多细胞生物或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的,包括植物界(PlantKingdom)的全部属和物种的高等和低等植物。优选地一年生、多年生、单子叶和双子叶植物。该术语包括成熟植物、种子、幼苗和籽苗及其衍生部分、繁殖材料(如种子或微孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物(例如细胞培养物),和归并成产生功能单元或结构单元的任何其他类型的植物细胞。成熟植物指在除籽苗之外的任何目的发育阶段的植物。籽苗指在早期发育阶段的年幼不成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因植物的优选宿主生物。基因的表达在全部观赏植物、用材树或观赏树、花、切花、灌木或草坪草中是更进一步有利的。可以用举例方式、但非限制方式提到的植物是被子植物、苔藓植物例如獐耳细辛属(Hepaticae)(liverworts(獐耳细辛))和藓纲(Musci)(藓类植物);蕨类植物如蕨类、木贼类和石松类;裸子植物如松柏类植物、苏铁植物、银杏(ginkgo)和买麻藤科(Gnetaeae)植物;藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻类)和裸藻纲(Euglenophyceae)。优选地用于食物或饲料目的的植物,如豆科(Leguminosae)如豌豆、苜蓿和大豆;禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱、黑麦、黑小麦或燕麦;伞形科(Umbelliferae),具体地是胡萝卜属(Daucus)(非常特别地是物种胡萝卜(carota))和芹属(Apium)(非常特别地是物种旱芹(Graveolens dulce(celery)))及众多其它植物;茄科(Solanaceae),特别地是番茄属(Lycopersicon),非常特别地是物种番茄(tomato),和茄属(Solanum),非常特别地是物种马铃薯(tomato)和茄子(aubergine)和众多其它植物(如烟草(tobacco)),和辣椒属(Capsicum),非常特别地是物种辣椒(Capsicum annum(pepper))物种及众多其它植物;豆科(Leguminosae),特别地是大豆属(Glycine),非常特别地是物种大豆(soybean)、苜蓿、豌豆、紫花苜蓿、菜豆或花生及众多其它植物;和十字花科(Brassicacae),特别地是芸苔属(Brassica),非常特别地是物种欧洲油菜(oilseed rape)、芸苔(beet)、甘蓝(Brassicaoleracea cv Tastie(卷心菜))、花椰菜(Brassica oleracea cv Snowball Y(花椰菜))和花茎甘蓝(oleracea cv Emperor(broccoli));和拟南芥属,非常特别地是物种拟南芥及众多其它植物;菊科(Compositae),具体地是莴苣属(Lactuca),非常特别地是物种莴苣(lettuce)及众多其它植物;菊科(Asteraceae)如向日葵、万寿菊、莴苣或金盏花及众多其它植物;葫芦科(Cucurbitaceae)如甜瓜、西葫芦/南瓜或夏南瓜,和亚麻。更优选地是棉属植物、甘蔗、大麻、亚麻、辣椒和多种树、坚果和藤本(wine)物种。
多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在文中互换地使用,用来指连续氨基酸残基的聚合物或低聚物。
前蛋白:正常情况下靶向细胞器如叶绿体并且仍包含其转运肽的蛋白质。
初级转录物:如本文中所用的术语“初级转录物”指基因的不成熟RNA转录物。“初级转录物”例如仍包含内含子和/或仍不包含聚腺苷酸尾或帽结构和/或是缺少对其作为转录物正常发挥作用必需的其他修饰,例如修剪或编辑。
启动子:术语“启动子”或“启动子序列”是等同物并且如本文中所用的,指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。此类启动子可以例如在以下公共数据库中http://www.grassius.org/grasspromdb.html、http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom、http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi找到。其中所列的启动子可以用于本发明的方法并且在此引用而包括。启动子位于由该启动子控制转录成mRNA的目的核苷酸序列的5’(即,上游),靠近其转录起始位点,并且为RNA聚合酶和用于转录起始的其他转录因子的特异性结合提供位点。所述启动子包含靠近转录起始位点例如至少10kb,例如5kb或2kb。它也可以包含靠近转录起始位点至少1500bp,优选地至少1000bp,更优选地至少500bp,甚至更优选地至少400bp,至少300bp,至少200bp或至少100bp。在又一个优选的实施方案中,启动子包含靠近转录起始位点至少50bp,例如至少25bp。启动子不包含外显子和/或内含子区或5’非翻译区。启动子可以例如相对于相应植物为异源或同源。如果多核苷酸序列源自外来物种,或如果来自相同物种,但从其原有形式中被修饰,则它相对于某生物或第二多核苷酸序列为“异源”。例如,与异源编码序列有效连接的启动子指编码序列来自不同于衍生该启动子的物种中,或,如果来自相同物种,编码序列与该启动子不天然接合(例如基因修饰的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当出现表达的宿主细胞的基因或源自该宿主细胞的病原体(例如,植物或植物病原体如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。这种启动子可以源自植物,也可以源自植物病原体,或它可以是由人设计的合成性启动子。如果启动子是诱导型启动子,则转录的速率应答于诱导剂而增加。另外,启动子可以以组织特异性或组织优先的方式受到调节,从而它仅仅或优势地在特定组织类型如叶、根或分生组织中转录所接合的编码区方面有活性。用于启动子时,术语“组织特异性”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的组织(例如,花瓣)中选择性表达,同时相同目的核苷酸序列在不同类型组织(例如,根)中相对缺少的表达。可以例如通过这样的方式评价启动子的组织特异性:将报道基因与该启动子序列有效连接以产生报道构建体,将报道构建体导入植物的基因组,从而该报道构建体整合至所产生的转基因植物的每种组织中,并且检测报道基因在转基因植物的不同组织中的表达(例如,检测mRNA、蛋白质或由报道基因编码的蛋白质的活性)。相对于报道基因在其他组织中的表达水平,检测到该报道基因在一种或多种组织中的更大表达水平表明该启动子对其中检测到更大表达水平的组织是特异性的。用于启动子时,术语“细胞类型特异的”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的细胞中选择性表达,同时相同目的核苷酸序列在相同组织内部的不同类型细胞中相对缺少的表达。用于启动子时,术语“细胞类型特异的”还意指能够促进目的核苷酸序列在单一组织内部的某区域中选择表达的启动子。使用本领域熟知的方法,例如GUS活性染色法、GFP蛋白法或免疫组织化学染色法,可以评估启动子的细胞类型特异性。谈及启动子或源自启动子的表达时,术语“组成型”意指能够指导有效连接的核酸分子在刺激物(例如,热休克、化学品、光等)不存在下在大部分植物组织和细胞中贯穿植物或植物部分的基本上整个生活期限转录的启动子。一般而言,组成型启动子能够指导转基因在基本上任何细胞和任何组织中的表达。
启动子特异性:谈及启动子时,术语“特异性”意指由相应启动子引起的表达的样式。特异性描述了植物或其部分的组织和/或发育状态,在其中该启动子引起处于相应启动子控制下的核酸分子表达。启动子的特异性也可以包含环境条件,在所述环境条件下可以激活或下调该启动子,如由生物胁迫或环境胁迫如寒冷、干旱、受伤或感染诱导或阻遏。
纯化:如本文中所用,术语“纯化的”指从其天然环境取出、分离或分开的分子,即核酸序列或氨基酸序列。“基本上纯化的”分子至少60%没有、优选地至少75%没有和更优选地至少90%没有与它们天然结合在一起的其他组分。纯化的核酸序列可以是分离的核酸序列。
重组:就核酸分子而言,术语“重组”指通过重组DNA技术产生的核酸分子。重组核酸分子也可以包括本身不存在于自然界中但是被人修饰、改变、突变或操纵的分子。优选地,“重组核酸分子”是在序列方面与天然存在的核酸分子有至少一个核酸不同的非天然存在的核酸分子。“重组核酸分子”也可以包括“重组构建体”,其包含不天然地以这种顺序存在的一系列核酸分子,所述核酸分子优选地有效地连接。用于产生所述重组核酸分子的优选方法可以包括克隆技术、定向或非定向诱变法、合成或重组技术。
“种子特异的启动子”在本发明的上下文中意指在相应启动子控制下于种子中调节核酸分子转录的启动子,其中,在所述种子的任意组织或细胞中的转录贡献了多于90%、优选地多于95%,更优选地多于99%在整株植物中其任意发育阶段期间从所述核酸序列转录的RNA的全部量。据此理解术语“种子特异的表达”和“种子特异的NEENA”。因而“种子特异的NEENA”以这样的方式增强种子特异的或种子优先的启动子的转录,从而在种子中从功能性连接于相应NEENA的所述启动子的转录贡献了多于90%、优选地多于95%,更优选地多于99%在整株植物中其任意发育阶段期间从功能性连接于NEENA的相应启动子所转录的RNA的全部量。
“种子优先的启动子”在本发明的上下文中意指在种子中相应启动子控制下调节核酸分子转录的启动子,其中,在所述种子的任意组织或细胞中的转录贡献了多于50%、优选地多于70%,更优选地多于80%在整株植物中其任意发育阶段期间从所述核酸序列转录的RNA的全部量。据此理解术语“种子优先的表达”和“种子优先的NEENA”。因而“种子优先的NEENA”以这样的方式增强种子特异的或种子优先的启动子的转录,从而,在种子中从功能性连接于相应NEENA的所述启动子所获得的转录贡献了多于50%、优选地多于70%,更优选地多于80%在整株植物中其任意发育阶段期间从功能性连接于NEENA的相应启动子所转录的RNA的全部量。
有义:术语“有义”理解为意指核酸分子,其具有与靶序列互补或相同的序列,例如与蛋白质转录因子结合和参与给定基因表达的序列。根据一个优选的实施方案,该核酸分子包含目的基因和允许表达该目的基因的元件。
显著的增加或减少:大于测量技术中固有误差幅度的增加或减少,例如在酶活性或在基因表达方面,优选地是对照酶的活性或对照细胞中的表达增加或减少约2倍或更多,更优选地增加或减少约5倍或更多,并且最优选地增加或减少约10倍或更多。
小核酸分子:“小核酸分子”理解为由核酸或其衍生物如RNA或DNA组成的分子。它们可以是双链或单链的,并且其长度在约15和约30bp之间,例如在15和30bp之间,更优选地在约19和约26bp之间,例如在19和26bp之间,甚至更优选地在约20和约25bp之间,例如在20和25bp之间。In a especially preferred embodiment the oligonucleotides arebetween about 21and about 24bp,for example between 21and 24bp.在一个尤其优选的实施方案中,小核酸分子的长度是约21bp和约24bp,例如21bp和24bp。
基本上互补的:在最广意义上,本文中就核苷酸序列相对于参比或靶核苷酸序列而言使用时,术语“基本上互补的”意指这样的核苷酸序列,其具有在基本上互补的核苷酸序列和所述参比或靶核苷酸序列的完全互补序列之间至少60%,更希望地至少70%,更希望地至少80%或85%,优选地至少90%,更优选地至少93%,仍更优选地至少95%或96%,仍旧更优选地至少97%或98%,依旧更优选地至少99%或最优选地100%的同一性百分数(后者等同于本上下文中的术语“同一的”)。优选地,在至少19个核苷酸长度、优选地至少50个核苷酸长度、更优选地核酸序列的全部长度范围内针对所述参比核苷酸序列评估同一性(如果不是,则另外在下文说明)。使用威斯康辛大学GCG的默认GAP分析,GAP的SEQWEB应用,基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48:443-453;如上文定义)实施序列比较。与参比核苷酸序列“基本上互补的”核苷酸序列与该参比核苷酸序列在低严格性条件、优选地中等严格性条件、最优选地高严格性条件(如上文定义)下杂交。
转基因:如本文中所用的术语“转基因”指通过实验操作导入细胞的基因组中的任何核酸序列。转基因可以是“内源DNA序列”或“异源DNA序列”(即,“外来DNA”)。术语“内源DNA序列”指这样的核苷酸序列,其天然存在于导入该核苷酸序列的细胞中,只要它相对于天然存在序列不含有一些修饰(例如,点突变、存在可选择标记基因等)。
转基因的:当提及生物时,术语“转基因的”意指用重组DNA分子转化生物,优选地稳定转化生物,其中所述重组DNA分子优选地包含与目的DNA序列有效连接的合适启动子。
载体:如本文中所用,术语“载体”指能够运输已经与之连接的另一个核酸分子的核酸分子。一种类型的载体是基因组整合的载体,或“整合的载体”,所述载体可以整合至宿主细胞的染色体DNA中。另一个类型的载体是游离型载体,即,能够进行染色体外复制的核酸分子。本文中将能够指导与它们有效连接的基因表达的载体称作“表达载体”。在本说明书中,“质粒”和“载体”互换地使用,除非从上下文显而易见并非如此。设计旨在体外或体内产生如本文所述RNA的表达载体可以含有被任何RNA聚合酶识别的序列,所述的RNA聚合酶包括线粒体RNA聚合酶、RNA pol I、RNA pol II和RNA pol III。这些载体可以用来在根据本发明的细胞中转录想要的RNA分子。将植物转化载体理解为适用于植物转化过程中的载体。
野生型:就生物、多肽或核酸序列而言,术语“野生型”、“天然”或“天然来源”意指所述生物是天然存在的或是在至少一种天然存在生物中可获得的,其没有被改变、突变或由人类操作。
实施例
化学品和常用方法
除非另外说明,如(Sambrook等人,1989)所述为本发明的目的进行克隆过程,包括限制性消化、琼脂糖凝胶电泳、核酸的纯化、核酸的连接、细菌细胞的转化、选择和培养。使用Sanger技术(Sanger等人,1977),用激光荧光DNA测序仪(Applied Biosystems,FosterCity,CA,USA)进行重组DNA的序列分析。除非另外描述,从Sigma Aldrich(Sigma Aldrich,St.Louis,USA)、Promega(Madison,WI,USA)、Duchefa(Haarlem,The Netherlands)或Invitrogen(Carlsbad,CA,USA)获得化学品和试剂。限制性核酸内切酶来自New EnglandBiolabs(Ipswich,MA,USA)或Roche Diagnostics GmbH(Penzberg,Germany)。寡核苷酸由Eurofins MWG Operon(Ebersberg,Germany)合成。
实施例1:从具有种子特异的或种子优先的表达的基因鉴定增强核酸表达的核酸(NEENA)候选物
1.1从拟南芥(A.thaliana)基因鉴定NEENA分子
使用公开可获得的基因组DNA序列(例如http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html)和转录物表达数据(例如http:// www.weigelworld.org/resources/microarray/AtGenExpress/),选择源自具有种子特异的或种子优先的表达的拟南芥(Arabidopsis thaliana)转录物中的一组19个NEENA候选物用于详细分析。候选物命名如下:
表1:种子特异的NEENA候选物(NEENAss)。
1.2NEENA候选物的分离
使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。通过常规的聚合酶链反应(PCR)分离含有推定的NEENA分子的基因组DNA片段。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。该反应包含19组引物(表2)并且遵从由Phusion高保真DNA聚合酶(目录编号F-540L,New England Biolabs,Ipswich,MA,USA)概述的方案。使用分离的DNA作为利用以下引物的PCR扩增中的模板DNA:
表2:引物序列
PCR期间按以下组成实施扩增(50微升):
3.00微升拟南芥基因组DNA(50ng/微升)
10.00微升5x Phusion HF缓冲液
4.00微升dNTP(2.5mM)
2.50微升正向引物(10μM)
2.50微升反向引物(10μM)
0.50微升Phusion HF DNA聚合酶(2U/微升)
将递降方法用于以下参数的PCR:98.0℃30秒(1个循环),98.0℃30秒,56.0℃30秒和72.0℃60秒(4个循环),额外4个循环,每个循环的复性温度是:54.0℃,51.0℃和49.0℃,随后20个循环:98.0℃30秒,46.0℃30秒和72.0℃60秒(4个循环)及72.0℃5分钟。将扩增产物载于2%(w/v)琼脂糖凝胶上并且在80V分离。将PCR产物从该凝胶切下并且用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。用NcoI(10U/微升)和KpnI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物再次用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
1.3载体构建
使用Multisite Gateway系统(Invitrogen,Carlsbad,CA,USA),将启动子::NEENA::报道基因盒装配入用于植物转化的双元构建体。将拟南芥p-AtPXR(At1g48130,GenBank AC023673.3;WO2006089950;前缀p-指启动子)种子特异的启动子用于报道基因构建体中,并且将萤火虫萤光素酶(Promega,Madison,WI,USA)用作报道蛋白以定量地测定待分析的NEENA分子的表达增强作用。
根据制造商手册(Invitrogen,Carlsbad,CA,USA),在任一端处带有位点特异性重组位点的基因组DNA(见上文)上,用引物p-AtPXR-for和p-AtPXR-rev(表3),通过pDONR/A载体和p-AtPXR扩增产物之间的位点特异性重组(BP反应)克隆携带有p-AtPXR启动子的pENTR/A载体。对阳性pENTR/A克隆进行序列分析以确保p-AtPXR启动子的正确性。
表3:引物序列(p-AtPXR)
产生ENTR/B载体,其含有萤火虫萤光素酶编码序列(Promega,Madison,WI,USA),后接t-nos胭脂碱合酶转录终止子(Genbank V00087)。使用KpnI和NcoI限制酶,将NEENA候选物PCR片段(见上文)分别克隆在萤火虫萤光素酶编码序列的上游。表4中汇总所产生的pENTR/B载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
表4:带有和不带有NEENA候选物的全部pENTR/B载体
通过经KpnI和HindIII限制性位点导入一个多克隆位点(SEQ ID NO60)构建pENTR/C载体。通过进行位点特异性重组(LR反应),根据制造商(Invitrogen,Carlsbad,CA,USA)的Multisite Gateway手册,将产生的pENTR/A、pENTR/B和pENTR/C与pSUN目的载体(pSUN衍生物)组合。所述反应产生了具有p-AtPXR启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的1个双元载体和紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4、NO5、NO6、NO7、NO8、NO9、NO10、NO11、NO12、NO13、NO14、NO15、NO16、NO17、NO18和NO19的19个载体(表5),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO61)。除了SEQ ID NO2至NO19变化外,全部载体中的核苷酸序列是相同的(表5)。表5中汇总所产生的植物转化载体:
表5:用于拟南芥转化的植物表达载体
所产生的载体随后用来产生转基因拟南芥植物。
实施例2:筛选在转基因拟南芥植物中增强基因表达的NEENA分子
本实施例说明仅选择的NEENA候选分子能够增强基因表达。
将含有实施例1中描述的所选择NEENA候选分子的全部双元构建体以及缺少NEENA的对照构建体稳定地转化至拟南芥植物中。为了产生转基因拟南芥(A.thaliana)植物,根癌农杆菌(在C58C1pGV2260菌株)用上文所述的多种载体构建体转化。对于拟南芥转化,使用浸花法(Clough和Bent,1998,Plant Journal 16:735-743)。通过在卡那霉素上萌发和培育籽苗选择T1转基因植物。在12日后,采集转化体和野生型对照植物的子叶样品并分布于预载有50微升0.5x Murashige-Skoog培养基的96孔平板中并且进行萤光素酶报道基因测定法(根据Weigel和Glazebrook,2002,Arabidopsis,a laboratory manual,Cold SpringHarbor Laboratory Press,第7章,ISBN 0-87969-572-2的修订方案)。在MicroLumat PlusLB96V(Berthold Technologies,Bad Wildbad,Germany)中含有0.1mM D-萤光素(目录号:L-8220,BioSynth,Staad,Switzerland)和0.01%Tween20(Sigma Aldrich,St.Louis,USA)的溶液中测定子叶的发光,在添加D-萤光素后于60分钟处记录。将仪器读数对每种构建体平均化,并且基于这些平均表达值,计算倍数变化值以评估推定的NEENA的存在对缺少相应推定的NEENA的报道基因构建体的影响。与仅有种子特异的p-AtPXR启动子且缺少NEENA的报道基因构建体相比,19个含有NEENA候选物的受检构建体显示阴性作用以及阳性作用,范围从0.8倍至22.2倍萤光素酶活性诱导作用(图1)。总计,基于萤光素酶报道基因活性,与缺少NEENA仅有启动子的报道基因构建体相比(图1),包含SEQ ID NO1、NO2、NO3、NO4、NO5、NO6、NO7、NO8、NO9、NO10、NO11、NO12、NO13、NO14和NO15序列的15个推定的NEENA分子引起基因表达增加大于2.5倍,并且因而是有功能的NEENA分子。由于众多的受检NEENA候选分子对基因表达增强作用产生边际的或甚至负性影响,故并非全部推定的NEENA分子介导共同的刺激性作用,而是选择的NEENA序列传递显著的基因表达增强作用(SEQ ID NO.1至15)。
实施例3:在油籽油菜植物中测试用于种子特异的增强基因表达的NEENA分子
本实施例说明与缺少NEENA仅有启动子的方法相比,NEENA分子可以跨物种使用以增强组织特异性启动子的基因表达。
选择预筛选中介导最强基因表达增强作用的NEENA分子(参考实施例2,SEQ IDNO1、NO2、NO3、NO4、NO5、NO6和NO7)用于测定对转基因油籽油菜植物中基因表达水平的增强作用。
3.1构建用于欧洲油菜植物转化的载体
为了转化油籽油菜植物,将具有或没有基因表达控制分子(SEQ IDs NO1–NO7)的报道基因表达盒与pENTR/C载体内部携带用于检测转基因植物品系的选择标记基因的基因表达盒组合。如前文所述(见上文1.3),通过进行位点特异性重组(LR反应),根据制造商(Invitrogen,Carlsbad,CA,USA)的Multisite Gateway手册,将携带所述选择标记盒的pENTR/A、pENTR/B和pENTR/C与pSUN目的载体组合。所述反应产生了具有p-AtPXR启动子、萤火虫萤光素酶编码序列c-LUC、t-nos终止子和所述选择标记盒的1个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4、NO5、NO6和NO7的7个载体(表6),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO62)。除了SEQ ID NO2至NO7变化外,全部载体中的核苷酸序列是相同的(表6)。表6中汇总所产生的植物转化载体:
表6:用于欧洲油菜(B.napus)转化的植物表达载体
3.2转基因油菜籽植物的产生(根据Moloney等人,1992,Plant Cell Reports,8:238-242的修订方案)
在产生转基因油菜籽植物的准备工作中,将所述双元载体转化至根癌农杆菌C58C1:pGV2260(Deblaere等人,1985,Nucl.Acids.Res.13:4777-4788)中。将携带相应双元构建体的农杆菌的过夜培养物的1:50稀释物在Murashige-Skoog培养基(Murashige和Skoog,1962,Physiol.Plant 15,473)的补充有3%蔗糖的培养基(3MS培养基)中培育。为转化油菜籽植物,将无菌植物的叶柄或下胚轴与1:50农杆菌溶液孵育5–10分钟,随后在黑暗下25℃于补充有0.8%细菌培养用琼脂的3MS培养基上共孵育3日。在3日后,将外植体转移至含有500mg/l凯福隆(头孢噻肟-钠)、100nM咪唑烟(Imazetapyr)、20μM苄氨基嘌呤(BAP)和1.6g/l葡萄糖的MS-培养基中于16小时光照/8小时黑暗的光照方案下,该过程以每周期间重复。将正在生长的幼苗转移至含有2%蔗糖、250mg/l凯福隆和0.8%细菌培养用琼脂的MS-培养基。3周后,将生长激素2-吲哚丁酸添加至该培养基以促进根形成。根发育后,将幼苗转移至土壤,在生长室中培育2周并且在温室条件下培育直至成熟。
3.3植物分析
组织样品从产生的转基因植物中自不同发育阶段的叶、花和种子收集,贮藏在-80℃的冰箱中,进行萤光素酶报道基因测定(根据Ow等人,1986的修订方案)。在研磨后,将冷冻的组织样品重悬于800微升缓冲液I(0.1M磷酸盐缓冲液pH7.8,1mM DTT(Sigma Aldrich,St.Louis,MO,USA),0.05%Tween 20(Sigma Aldrich,St.Louis,MO,USA))中,随后以10000g离心10分钟。将75微升含水上清液转移至96孔平板。在添加25微升缓冲液II(80mM甘氨酰甘氨酸(Carl Roth,Karlsruhe,Germany),40mM MgSO4(Duchefa,Haarlem,TheNetherlands),60mM ATP(Sigma Aldrich,St.Louis,MO,USA),pH 7.8)和D-萤光素至终浓度0.5mM(目录编号:L-8220,BioSynth,Staad,Switzerland)后,在MicroLumat Plus LB96V(Berthold Technologies,Bad Wildbad,Germany)中记录发光,从而产生单位,是相对光照单位RLU/分钟(RLU/min)。
为了归一化样品之间的萤光素酶活性,与萤光素酶活性平行地测定上清水液中的蛋白质浓度(改编自Bradford,1976,Anal.Biochem.72,248)。将缓冲液I中的5微升细胞水质提取物与250微升Bradford试剂(Sigma Aldrich,St.Louis,MO,USA)混合,在室温孵育10分钟。在平板读数仪(Thermo Electron Corporation,Multiskan Ascent 354)中在595nm测定吸收。用事先产生的标准浓度曲线计算出样品中的总蛋白量。从RLU/min和mg蛋白质/ml样品的比率中产生的值对携带相同构建体的转基因植物平均化,并且计算倍数变化以评估NEENA分子存在对缺少NEENA的报道基因构建体的影响。
3.4NEENA序列在油籽油菜种子中介导强烈的基因表达增强作用
为评估所选择NEENA分子(SEQ ID NO1、NO2、NO3、NO4、NO5、NO6、NO7)在油籽油菜种子中增强基因表达的潜力,从携带仅有启动子的报道基因构建体或含有NEENA(SEQ IDNO1、NO2、NO3、NO4、NO5、NO6或NO7)的萤光素酶报道基因构建体的各转基因油籽油菜植物品系中收集发育阶段相同的种子。从每个转基因事件收集10粒种子,加工并如上文所述(实施例3.3)分析萤光素酶活性。
与仅有种子特异的p-AtPXR启动子缺少NEENA的报道基因构建体相比,7个受检NEENA分子均在卡诺拉油菜种子中介导基因表达的强烈增强作用,范围从54倍至380倍萤光素酶活性诱导作用(图2a)。在稍晚成熟阶段在油籽油菜种子中检测到可比较的表达增强作用(数据未显示)。
3.5NEENA分子以组织特异方式增强油籽油菜种子中的基因表达
为评估由NEENA分子(SEQ ID NO1、NO2、NO3、NO4、NO5、NO6或NO7)介导的组织特异性基因表达增强作用,在携带上述报道基因构建体的转基因油籽油菜植物的充分发育的叶和开放花朵中测定萤光素酶活性。从每株植物分别收集3份相同大小的叶样品以及一朵完整花,并且进行如上文所述的萤光素酶报道基因测定法(实施例3.3)。7种受检NEENA分子中有5种(Seq.ID NO1、NO2、NO3、NO4、NO5)在叶和花中显示与缺少NEEN的Ap-AtPXR启动子的构建体可比较的萤光素酶表达水平并且因而没有改变种子特异的p-AtPXR启动子的组织特异性(图2,b和c)。与包含缺少NEENA的构建体的植物相比,2种NEENA分子(SEQ ID NO6、NO7)在所分析的油籽油菜植物的叶和花中略微增强萤光素酶活性(图2,b和c)。因而,这些NEENA即SEQ ID NO 6和7是种子优先的NEENA,而其他NEENA SEQ ID NO 1至5是种子特异的NEENA。
实施例4:分析用于种子特异的增强种子特异的强启动子的NEENA。
本实施例说明,NEENA分子的表达增强能力可以与多种启动子分子组合地使用,以与单独的启动子相比,增强组织特异性表达水平。
4.1构建用于欧洲油菜植物转化的载体
对实施例3中所测试的组的所选择NEENA分子(SEQ IDs NO1、NO2、NO3、NO5和NO6)测试它们增强种子特异的强启动子p-LuPXR(WO2006089950,序列9)和p-VfUSP(X56240,Baeumlein等人,1991)的组织特异性基因表达的作用。用表7中概述的引物序列和作为DNA模板的载体LJB765(WO2009016202),如上文所述(参考实施例1.3和3.1)进行载体构建。对阳性pENTR/A克隆进行序列分析以确保p-LuPXR和p-VfUSP启动子的正确性。
表7:p-LuPXR和p-VfUSP的引物序列
如前文所述(见上文1.3),通过进行位点特异性重组(LR反应),根据制造商(Invitrogen,Carlsbad,CA,USA)的Multisite Gateway手册,将携带所述选择标记盒的pENTR/A、pENTR/B载体和pENTR/C载体与pSUN目的载体组合。所述反应产生了具有p-LuPXR启动子、萤火虫萤光素酶编码序列及t-nos终止子以及所述选择标记盒的1个双元载体,和紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1、NO2、NO3和NO6的4个载体(表8),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO67)。除了SEQ ID NO2、NO3和NO5变化外,全部载体中的核苷酸序列是相同的(表8)。类似地,p-VfUSP启动子用来产生仅有启动子的构建体LJK219以及含有SEQ IDs NO1,NO2,NO3和NO5的构建体LJK220、LJK221、LJK224和LJK225(表8)。表8中汇总所产生的植物转化载体:
表8:用于欧洲油菜(B.napus)转化的植物表达载体
4.2NEENA序列在油籽油菜种子中介导种子特异的强启动子的组织特异性基因表达增强作用
如上文所述(实施例3.2和3.3)实施转基因油菜籽植物的产生和植物分析。
为测试与种子特异的启动子组合的所选择NEENA分子(SEQ ID NO1、NO2、NO3、NO5和NO6)在油籽油菜种子中的作用,从携带仅有启动子的报道基因构建体(LJK212和LJK219)或含有NEENA(SEQ ID NO1、NO2、NO3、NO5和NO6)的萤光素酶报道基因构建体的各转基因油籽油菜植物品系中收集发育阶段相同的种子(表9)。从每个转基因事件中,收集10粒种子,加工并如上文所述(实施例3.3)分析萤光素酶活性。
与仅有种子特异的p-LuPXR和p-VfUSP启动子的缺少NEENA的报道基因构建体相比,全部受检的NEENA分子均在与p-LuPXR和p-VfUSP启动子组合的情况下介导中等成熟度的油籽油菜种子中强烈的基因表达增强作用(表9)。在稍晚成熟阶段在油籽油菜种子中检测到相似的表达增强作用。
表9:在稳定转化的油籽油菜植物的种子中的LUC表达。
*LUC表达作为萤火虫萤光素酶活性范围(-不表达至+++++非常高的表达)给出,与相应组织内部亚麻籽p-LuPXR启动子的表达相比的相对LUC表达。**与受亚麻籽过氧化物氧还蛋白启动子p-LuPXR控制的表达相比的相对萤光素酶表达
为评估由NEENA分子(SEQ ID NO1、NO2、NO3、NO5和NO6)介导的组织特异性基因表达增强作用,在携带上述报道基因构建体的转基因油籽油菜植物的已发育的叶中测定萤光素酶活性。从每株植物分别收集3份相同大小的叶样品,并且进行如上文所述的萤光素酶报道基因测定法(实施例3.2)。与p-LuPXR启动子和p-VfUSP启动子组合的受检NEENA分子(SEQID NO1、NO2、NO3、NO5、NO6)的组织特异性与上文所分析的那些与p-AtPXR启动子组合下的NEENA分子相似(实施例3.5)。与p-AtPXR启动子组合时(实施例3.5),NEENA分子(SEQ IDNO1、NO2、NO3和NO5)显示没有改变p-LuPXR或p-VfUSP启动子的组织特异性(表10)。类似于与p-AtPXR启动子组合下的活性(实施例3.5),NEENA(SEQ ID NO6)在种子中传递萤光素酶活性的增强作用,并且介导所分析油籽油菜植物的叶中的萤光素酶表达(表10)。
表10:在稳定转化的油籽油菜植物的叶中的LUC表达。
*LUC表达作为萤火虫萤光素酶活性范围(-不表达至+++++非常高的表达)给出,与相应组织内部亚麻籽p-LuPXR启动子的表达相比的相对LUC表达。**与受亚麻籽过氧化物氧还蛋白启动子p-LuPXR控制的表达相比的相对萤光素酶表达。
实施例5:在大豆植物中分析基因表达的组织特异性增强作用
本实施例说明与缺少NEENA仅有启动子的方法相比,要求保护的NEENA分子可以在广泛类型的植物物种中并且跨越不同植物科的物种界限使用以组织特异地增强基因表达。
选择预筛选中介导最强基因表达增强作用的NEENA序列分子(参考实施例2,SEQID NO1、NO2、NO4、NO5、NO6和NO7)用于测定对转基因大豆植物中基因表达水平的增强作用。将植物表达载体LJK148、LJK156、LJK157、LJK158、LJK159、LJK160和LJK161(参考实施例3.1)用于稳定的大豆转化。
5.1转基因大豆植物的产生(根据WO2005/121345;Olhoft等人,2007的修订方案)
大豆种子萌发、繁殖、发根农杆菌和腋生分生组织外植体制备和接种如先前所述进行(WO2005/121345;Olhoft等人,2007),除了使用的构建体LJK148、LJK156、LJK157、LJK158、LJK159、LJK160和LJK161(参考实施例3.1)各自含有受欧芹遍在蛋白启动子PcUbi4-2驱动的突变AHAS基因,所述的突变AHAS基因介导耐受用于选择的咪唑啉酮除草剂。
5.2NEENA序列在大豆植物中维持启动子组织特异性的情况下介导强烈的基因表达增强作用
从产生的转基因植物中自叶、花和种子收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
与仅有种子特异的p-AtPXR启动子缺少NEENA的报道基因构建体LJK148相比,基于萤光素酶活性,7个受检NEENA分子均在大豆种子中介导强烈的基因表达增强作用(图3a)。相反,不能在大豆叶和花中检测到由NEENA分子(SEQ ID NO1、NO2、NO4、NO5、NO6和NO7)介导的萤光素酶活性的显著改变(图3,b和c)。
实施例6:在单子叶植物中分析NEENA活性
本实施例描述在单子叶植物中对具有SEQ ID NO 1、2、3、4、5、6和7的NEENA序列的分析。
6.1载体构建
为在单子叶植物中分析具有SEQ ID NO 1、2、3、4、5、6和7的NEENA序列,将携带表达盒的基于pUC的表达载体与接续胭脂碱合酶(NOS)转录终止子的β-葡糖苷酸酶(GUS)基因的编码序列组合,其中所述的表达盒包含缺少NEENA的来自玉米(Z.mais)的种子特异的单子叶启动子p-KG86。使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。通过常规的聚合酶链反应(PCR)分离含有NEENA分子的基因组DNA片段。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。该反应包含7组引物(表11)并且使用以下引物,遵从由Phusion高保真DNA聚合酶(目录编号F-540L,NewEngland Biolabs,Ipswich,MA,USA)概述的方案:
表11:引物序列
PCR期间的扩增和扩增产物的纯化如上述那样(实施例1.2)实施。用AscI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
使用AscI限制性位点,将NEENA PCR片段(见上文)分别克隆在β-葡糖苷酸酶编码序列的上游。所述反应产生了具有p-KG86启动子、β-葡糖苷酸酶编码序列c-GUC和t-nos终止子的1个双元载体,以及紧邻β-葡糖苷酸酶编码序列上游携带SEQ ID NO1、NO2、NO3、NO4、NO5、NO6和NO7的7个载体(表12),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQID NO82)。除了SEQ ID NO2至NO7变化外,全部载体中的核苷酸序列是相同的(表12)。表12中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
表12:植物表达载体
使用所产生的载体在下文概述的实验中分析NEENA分子(实施例6.2)
6.2在单子叶植物组织中分析增强基因表达的NEENA分子
这些实验通过轰击单子叶植物组织或培养细胞(实施例6.2.1)或通过农杆菌介导的转化(实施例6.2.2)进行。用于这些实验的靶组织可以是植物组织(例如叶组织)、培养的植物细胞(例如墨西哥黑色甜玉米(Black Mexican Sweet Corn,BMS)或用于农杆菌方案的植物胚。
6.2.1使用微抛射体轰击的瞬时测定法
使用Qiagen质粒试剂盒(目录号12143)分离质粒构建体。根据Sanford等人,(1993)(Optimizing the biolistic process for different biological applications(为不同生物学应用优化生物射弹方法).Methods in Enzymology,217:483-509)描述的方案,将DNA沉淀在0.60μM金粒子(Bio-Rad目录编号165-2262),并且使用PDS-1000/He系统装置(Bio-Rad)加速到靶组织(例如2周龄玉米叶、BMS培养的细胞等)。全部DNA沉淀步骤和轰击步骤在无菌条件下在室温进行。悬浮培养的墨西哥黑色甜玉米(BMS)细胞在BMS细胞培养液体培养基[Murashige和Skoog(MS)盐(4.3g/L),3%(w/v)蔗糖,肌醇(100mg/L),3mg/L 2,4-二氯苯氧乙酸(2,4-D),酪蛋白水解物(1g/L),硫胺素(10mg/L)和L-脯氨酸(1.15g/L),pH5.8]中增殖。每周转移10mL稳定期细胞的培养物至40mL新鲜培养基并且在110转/分钟运转的回转摇床上的250mL烧瓶中于27℃培养。
将硅化Eppendorf管中的60mg金粒子重悬于100%乙醇中,随后离心30秒。将沉淀在100%乙醇中淋洗1次并且在无菌水中淋洗2次,每次洗涤后离心。沉淀最终重悬于1mL无菌50%甘油中。随后将金悬液分成50微升等份并且在4℃贮藏。添加以下试剂至一等份中:5微升的1微克/微升总DNA,50微升2.5M CaCl2,20微升0.1M亚精胺,游离碱。将DNA溶液涡旋混合1分钟并置于-80℃持续3分钟,随后离心10秒。除去上清液。通过轻击该管小心地使沉淀重悬于1mL 100%乙醇中,随后离心10秒。除去上清液,并且将沉淀小心地重悬于50微升100%乙醇中并置于-80℃直至使用(轰击前30分钟至4小时)。如果在溶液中可见到金聚集物,则将管在临用前才在水浴超声波仪中超声处理1秒。
为了轰击,将2周龄的玉米叶切成长度大约1cm的条并且近轴侧向上放置在渗透性诱导培养基M-N6-702[N6盐(3.96g/L),3%(w/v)蔗糖,1.5mg/L 2,4-二氯苯氧乙酸(2,4-D),酪蛋白水解物(100mg/L)和L-脯氨酸(2.9g/L),MS维生素母液(1mL/L),0.2M甘露醇,0.2M山梨醇,pH 5.8]上。将叶条孵育1-2小时。
在BMS培养的细胞的情况下,在Beckman/Coulter Avanti J25离心机中以1000g沉淀1周龄的悬浮细胞,并且弃去上清液。使用刮铲,将细胞置于一张作为1/16英寸厚层的圆形、无尘42号Whatman滤纸上。将承载植物材料的滤纸安置在27℃黑暗下的渗透性诱导培养基上持续1-2小时,随后轰击。就在轰击前,将滤纸从培养基取下并置于上一叠无菌滤纸上以允许愈伤组织表面部分地干燥。
对于叶材料,每个平板用6μL金-DNA溶液以1800psi射击2次,并且对于BMS培养的细胞,以1100psi射击2次。为保持植物材料的位置,将一张消毒的金属网铺在样品的顶部。轰击后,将承载样品的滤纸转移到缺少甘露醇和山梨醇的M-N6-702培养基上并且在瞬时测定法之前于27℃在黑暗下孵育2日。
使用例如Wang等人,1988(Transient expression of foreign genes in rice,wheat and soybean cells following particle bombardment(粒子轰击后外来基因在稻细胞、小麦细胞和大豆细胞中的瞬时表达).Plant Molecular Biology,11(4),433-439),Christou,1997(Rice transformation:bombardment(稻转化:轰击).Plant Mol Biol.35(1-2))中描述的技术,借助于微抛射体轰击其他单子叶植物实施瞬时转化。
使用本领域方法,通过GUS染色、发光/荧光定量、RT-PCR、蛋白丰度(由特异性抗体检测)或通过上述表达盒所产生的代谢产物,测定上述构建体(实施例6.1)中表达的基因的表达水平。GUS染色通过如下方式进行:将植物材料在GUS溶液[100mM NaHPO4,10mM EDTA,0.05%Triton×100,0.025%X-Gluc溶液(溶解于DMSO中的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸),10%甲醇,pH 7.0]中在37℃孵育16-24小时。将植物组织真空浸润2次持续15分钟以辅助均匀染色。萤光素酶活性的分析如上文所述(见实施例2和3.3)进行。
与仅有种子特异的p-ZmKG86启动子缺少NEENA的报道基因构建体相比,所述NEENA分子均在这些测定法中介导强烈的基因表达增强作用。
6.2.2单子叶作物植物的转化和再生
也可以为了转化作物植物的目的而实施使用标准转化和再生技术的农杆菌介导的植物转化法(Gelvin和Schilperoort,1995,Plant Molecular Biology Manual,第2版,Dordrecht:Kluwer Academic Publ.ISBN 0-7923-2731-4;Glick和Thompson(1993)Methods in Plant Molecular Biology and Biotechnology,Boca Raton:CRC Press,ISBN 0-8493-5164-2)。可以使用例如US 5,591,616中描述的技术实施玉米或其他单子叶植物的转化。使用粒子轰击、聚乙二醇介导的DNA摄取或借助碳酸硅纤维技术的植物转化法例如由Freeling和Walbot(1993)“The maize handbook(玉米手册)”ISBN 3-540-97826-7,Springer Verlag New York)描述。
使用本领域方法,通过GUS染色、发光或荧光定量、RT-PCR或蛋白丰度(由特异性抗体检测)测定所表达的基因的表达水平。GUS染色通过如下方式进行:将植物材料在GUS溶液[100mM NaHPO4,10mM EDTA,0.05%Triton×100,0.025%X-Gluc溶液(溶解于DMSO中的5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸),10%甲醇,pH 7.0]中在37℃孵育16-24小时。将植物组织真空浸润2次持续15分钟以辅助均匀染色。萤光素酶活性的分析如上文所述(实施例2和3.3)进行。
与仅有种子特异的p-ZmKG86启动子缺少NEENA的报道基因构建体相比,所述NEENA分子在植物中介导强烈和组织特异的基因表达增强作用。
实施例7:在单子叶植物中定量分析NEENA活性
本实施例描述在谷物植物中对具有SEQ ID NO 1和2的NEENA序列的分析。
7.1载体构建
为在单子叶植物中定量地分析具有SEQ ID NO 1和2的NEENA序列,将携带表达盒的基于pUC的表达载体与接续胭脂碱合酶(NOS)转录终止子的萤火虫萤光素酶(LUC)基因(Promega,Madison,WI,USA)的编码序列组合,其中所述的表达盒包含缺少NEENA的来自玉米(Z.mais)的种子特异的单子叶启动子p-KG86。使用Qiagen DNeasy Plant Mini试剂盒(Qiagen,Hilden,Germany)从拟南芥绿色组织提取基因组DNA。通过常规的聚合酶链反应(PCR)分离含有NEENA分子的基因组DNA片段。基于具有多种NEENA候选物的拟南芥基因组序列设计出引物。该反应包含2组引物(表11)并且使用以下引物,遵从由Phusion高保真DNA聚合酶(目录编号F-540L,New England Biolabs,Ipswich,MA,USA)概述的方案:
表11:引物序列
PCR期间的扩增和扩增产物的纯化如上述那样(实施例1.2)实施。用MluI(10U/微升)和AscI(10U/微升)限制性核酸内切酶进行DNA限制性消化后,消化的产物用Qiagen凝胶提取试剂盒(Qiagen,Hilden,Germany)纯化。
使用AscI限制性位点,将NEENA PCR片段(见上文)分别克隆在萤火虫萤光素酶编码序列的上游。所述反应产生了具有p-KG86启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的1个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1和NO2的2个载体(表12),对于所述载体,给出与SEQ ID NO1的组合作为示例(SEQ ID NO87)。除了SEQ ID NO2变化外,所述载体中的核苷酸序列是相同的(表12)。表12中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
表12:植物表达载体
使用所产生的载体在下文概述的实验中分析NEENA分子(实施例7.2)
7.2转基因玉米植物的产生
玉米萌发、繁殖、根癌农杆菌制备和接种如先前所述进行(WO2006136596,US20090249514),除了使用的构建体RTP5679、RTP5683和RTP5684(参考实施例7.1)各自含有受谷物遍在蛋白启动子p-Ubi驱动的突变AHAS基因,所述的突变AHAS基因介导耐受用于选择的咪唑啉酮除草剂。
7.3NEENA序列在谷物植物中介导强烈的和组织特异的基因表达增强作用
从产生的转基因植物中自叶和谷粒收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
与仅有种子特异的p-KG86启动子缺少NEENA的报道基因构建体相比,2个受检NEENA分子(SEQ ID NO1和NO2)在谷粒中介导强烈的基因表达增强作用(图4a)。相反,不能在玉米叶中检测到由NEENA分子(SEQ ID NO1和NO2)介导的萤光素酶活性的显著改变(图4b)。
实施例8:在稻植物中定量分析NEENA活性
本实施例描述在稻植物中对具有SEQ ID NO 1和2的NEENA序列的分析。
8.1载体构建
为在稻植物中定量地分析具有SEQ ID NO 1和2的NEENA序列,根据制造商(Invitrogen,Carlsbad,CA,USA)Gateway手册,使用位点特异性重组(LR反应),将pENTR/B载体LJK1、LJK19和LJK20(比较实施例1.3)与重组位点上游携带种子优先的稻PRO0090启动子的目的载体组合。所述反应产生了具有PRO0090启动子、萤火虫萤光素酶编码序列c-LUC和t-nos终止子的2个双元载体,以及紧邻萤火虫萤光素酶编码序列上游携带SEQ ID NO1和2的2个载体(表13)。除了SEQ ID NO2变化外,所述载体中的核苷酸序列是相同的(表13)。表13中汇总所产生的载体,其中启动子分子具有前缀p-,编码序列具有前缀c-,并且终止子分子具有前缀t-。
表13:植物表达载体
使用所产生的载体在下文概述的实验中分析NEENA分子(实施例8.2)
8.2转基因稻植物的产生
使用含有相应表达载体的农杆菌来转化稻(Oryza sativa)植物。将粳稻栽培品种日本晴(Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将生胚性盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。生胚性愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有相应表达载体的农杆菌菌株LBA4404用于共培育。将农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并且在液体共培育培养基中悬浮至密度(OD600)约1。随后将混悬液转移至培养皿内,并且将所述愈伤组织浸入该混悬液中15分钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并且在25℃于黑暗下孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗下在选择剂存在时培育4周。在此期间,迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养基并在光照下孵育后,生胚潜能释放并且幼苗在随后4至5周内发育。将幼苗从愈伤组织切下并且在含有植物生长素的培养基上孵育2至3周,其中从所述培养基转移幼苗至土壤。硬化的幼苗在温室中在高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在验证T-DNA插入物拷贝数的定量PCR分析后,仅保留显示所述选择剂抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
8.3NEENA序列在稻植物中介导强烈的和组织特异的基因表达增强作用
从产生的转基因植物中自叶和种子收集组织样品。组织样品如上文所述(参考实施例3.3)加工和分析。
与仅有种子特异的PRO0090启动子缺少NEENA的报道基因构建体相比,受检NEENA分子(SEQ ID NO 1和NO 2)在种子中介导强烈的基因表达增强作用(图5a)。相反,不能在稻叶中检测到由NEENA分子(SEQ ID NO1和NO2)介导的萤光素酶活性的显著改变(图5b)。
附图简述
图1:在缺少NEENA(LJK134)和含有NEENA的构建体(LJK71-LJK90)的稳定转化拟南芥植物的子叶中的萤光素酶报道基因表达分析,其中所述的构建体代表处于p-AtPXR启动子控制下的源自种子优先表达的基因的推定的NEENA分子。显示了相对于缺少NEENA的对照构建体(LJK134=1)的表达值。
图2:独立转基因油籽油菜植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因油籽油菜植物品系携带缺少NEENA(LJK148)或含有NEENA的报道基因构建体,所述的构建体代表在p-AtPXR启动子控制下种子优先表达的基因(LJK156–LJK162)中的NEENA分子。携带含NEENA的构建体的植物的表达值相对于缺少NEENA的对照构建体(LJK148)的植物显示(平均值,20个所分析的独立转基因植物的组织)。A)种子,B)叶组织,C)花。
图3:独立转基因大豆植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因大豆植物品系携带缺少NEENA(LJK148)或含有NEENA的报道基因构建体,所述的构建体代表在p-AtPXR启动子控制下种子优先表达的基因(LJK156–LJK161)中的NEENA分子。携带含NEENA的构建体的植物的表达值相对于缺少NEENA的对照构建体(LJK148)的植物显示(平均值,10个所分析的独立转基因植物的组织)。A)种子,B)叶组织,C)花。
图4:独立转基因玉米植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量(平均值,15个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因玉米植物品系携带缺少NEENA(RTP5679)或含有NEENA的报道基因构建体,所述的构建体代表在p-KG86启动子控制下种子优先表达的基因(RTP5683–RTP5684)中的NEENA分子。A)谷粒,B)叶组织。
图5:独立转基因稻植物品系的显示为相对光照单位(RLU)并且针对每份样品的蛋白质含量(平均值,15个所分析的独立转基因植物的组织)归一化后的萤光素酶报道基因活性的柱状图,其中所述的独立转基因稻植物品系携带缺少NEENA(CD30977)或含有NEENA的报道基因构建体,所述的构建体代表在稻PRO0090启动子控制下种子优先表达的基因(CD30971-CD30972)中的NEENA分子。A)种子,B)叶组织。
序列表
<110> 巴斯夫植物科学有限公司
<120> 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
<130> PF 62516
<160> 87
<170> PatentIn版本3.5
<210> 1
<211> 847
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 1
tggtgcttaa acactctggt gagttctagt acttctgcta tgatcgatct cattaccatt 60
tcttaaattt ctctccctaa atattccgag ttcttgattt ttgataactt caggttttct 120
ctttttgata aatctggtct ttccattttt ttttttttgt ggttaattta gtttcctatg 180
ttcttcgatt gtattatgca tgatctgtgt ttggattctg ttagattatg tattggtgaa 240
tatgtatgtg tttttgcatg tctggttttg gtcttaaaaa tgttcaaatc tgatgatttg 300
attgaagctt ttttagtgtt ggtttgattc ttctcaaaac tactgttaat ttactatcat 360
gttttccaac tttgattcat gatgacactt ttgttctgct ttgttataaa attttggttg 420
gtttgatttt gtaattatag tgtaattttg ttaggaatga acatgtttta atactctgtt 480
ttcgatttgt cacacattcg aattattaat cgataattta actgaaaatt catggttcta 540
gatcttgttg tcatcagatt atttgtttcg ataattcatc aaatatgtag tccttttgct 600
gatttgcgac tgtttcattt tttctcaaaa ttgttttttg ttaagtttat ctaacagtta 660
tcgttgtcaa aagtctcttt cattttgcaa aatcttcttt ttttttttgt ttgtaacttt 720
gttttttaag ctacacattt agtctgtaaa atagcatcga ggaacagttg tcttagtaga 780
cttgcatgtt cttgtaactt ctatttgttt cagtttgttg atgactgctt tgattttgta 840
ggtcaaa 847
<210> 2
<211> 455
<212> DNA
<213> 拟南芥
<400> 2
agttctttgc tttcgaagtt gccgcaacct aaacaggttt ttccttcttc tttcttctta 60
ttaactacga ccttgtcctt tgcctatgta aaattactag gttttcatca gttacactga 120
ttaagttcgt tatagtggaa gataaaatgc cctcaaagca ttttgcagga tatctttgat 180
ttttcaaaga tatggaactg tagagtttga tagtgttctt gaatgtggtt gcatgaagtt 240
tttttggtct gcatgttatt ttttcctcga aatatgtttt gagtccaaca agtgattcac 300
ttgggattca gaaagttgtt ttctcaatat gtaacagttt ttttctatgg agaaaaatca 360
tagggaccgt tggttttggc ttctttaatt ttgagctcag attaaaccca ttttacccgg 420
tgttcttggc agaattgaaa acagtacgta gtacc 455
<210> 3
<211> 758
<212> DNA
<213> 拟南芥
<400> 3
agggtttcgt ttttgtttca tcgataaact caaaggtgat gattttaggg tcttgtgagt 60
gtgctttttt gtttgattct actgtagggt ttatgttctt tagctcatag gttttgtgta 120
tttcttagaa atgtggcttc tttaatctct gggtttgtga ctttttgtgt ggtttctgtg 180
tttttcatat caaaaaccta ttttttccga gttttttttt acaaattctt actctcaagc 240
ttgaatactt cacatgcagt gttcttttgt agattttaga gttaatgtgt taaaaagttt 300
ggatttttct tgcttataga gcttcttcac tttgattttg tgggtttttt tgttttaaag 360
gtgagatttt tgatgaggtt tttgcttcaa agatgtcacc tttctgggtt tgtcttttga 420
ataaagctat gaactgtcac atggctgacg caattttgtt actatgtcat gaaagctgac 480
gtttttccgt gttatacatg tttgcttaca cttgcatgcg tcaaaaaaat tggggctttt 540
tagttttagt caaagatttt acttctcttt tgggatttat gaaggaaagt tgcaaacttt 600
ctcaaatttt accatttttg ctttgatgtt tgtttagatt gcgacagaac aaactcatat 660
atgttgaaat ttttgcttgg ttttgtatag gattgtgtct tttgcttata aatgttgaaa 720
tctgaacttt ttttttgttt ggtttctttg agcaggag 758
<210> 4
<211> 252
<212> DNA
<213> 拟南芥
<400> 4
actgtttaag cttcactgtc tctgaatcgg caaaggtaaa cgtatcaatt attctacaaa 60
cccttttatt tttcttttga attaccgtct tcattggtta tatgataact tgataagtaa 120
agcttcaata attgaatttg atctgtgttt ttttggcctt aatactaaat ccttacataa 180
gctttgttgc ttctcctctt gtgagttgag tgttaagttg taataatggt tcactttcag 240
ctttagaaga aa 252
<210> 5
<211> 377
<212> DNA
<213> 拟南芥
<400> 5
tttcacgatt tggaatttga ttcctgcgat cacaggtatg acaggttaga ttttgttttg 60
tatagttgta tacatacttc tttgtgatgt tttgtttact taatcgaatt tttggagtgt 120
tttaaggtct ctcgtttaga aatcgtggaa aatatcactg tgtgtgtgtt cttatgattc 180
acagtgttta tgggtttcat gttctttgtt ttatcattga atgggaagaa atttcgttgg 240
gatacaaatt tctcatgttc ttactgatcg ttattaggag tttggggaaa aaggaagagt 300
ttttttggtt ggttcgagtg attatgaggt tatttctgta tttgatttat gagttaatgg 360
tcgttttaat gttgtag 377
<210> 6
<211> 718
<212> DNA
<213> 拟南芥
<400> 6
gtccagaatt ttctccattg aagctggatt ctaaggtcag ttcttacttc tttatctcaa 60
tctgatgatt ccatatcgaa agtcttactt tttcacttca atttcaatct gatgattcta 120
agatctttga ttcgaggtcg atctctgata gttactacat gtttctgggt ttatttattt 180
ttaatccata tagtaattaa aaactcttat gaggtttaat tatggttact tgagaatttg 240
caatcgtcat ctttctttga ctcctatcca ttttttggtt tttcctttgt ttaatttctg 300
tttcataatt gtaattgtaa attaaccaaa acaaattgat cagaaacctt tttcctatgg 360
aatatttatc acacgcaagc ctgtgagttg tgactctgta atcacttcct tgttctggta 420
atttcagtgg ttaaggctct ccttttttct gatgttgtca gcaaaagtta gtttttcttc 480
ttctttaatg ggttaattac acctaaatct ctggttatta aacaatccag aaagaaaaaa 540
agtttattcc ttcctctatg tatatagttt cacatgcaag catcacttgt ttgttctgac 600
aaattgcaga gttttgagtt ctgttttttt ttttttctaa tgttttgtct ttaagaaagt 660
tctgtttttt tttctgcagg aaagttatca aaagttttga gagctttgga tagtgaag 718
<210> 7
<211> 495
<212> DNA
<213> 拟南芥
<400> 7
ctagcttaat ctcagattcg aatcgttcca tagtggtgag cttcgtgttc ttctttcgtc 60
tcttactcct gattctcgat tttagggttt tcagtaattg cgtcggcggc gaaagtcttt 120
atcgccgatc gatcttcctt atctagaaat tattgatcag aaactgttgg gttttgtttg 180
attcttgtca agttttgatt tttcatgcga aattgctcaa tcccaattca aagttacgat 240
ttttattgaa aaccctagat tggtttcttc aagtttgtca ctttgattca atctaatagc 300
ttagcttaat cgttaagtct cttttttggt tttaggtttc atttgcgatt taaaggttct 360
tgttttggta tttgttttgc tttggtcctt taagtttgag aggcttatgt agattataag 420
agagaagagt attgctttgc atgtttaaag gaagaacttt taactgaaca tttgtatgat 480
tggtatgtag atact 495
<210> 8
<211> 139
<212> DNA
<213> 拟南芥
<400> 8
atttccacac gctttctatc atttccaccc aaaaggtaac gcgcttttta tttcctttcc 60
tgcattcata aatttgtctc ctgcatgttg aaaaaaaaaa atttacatcg agattcgttt 120
ttatttttta gagagagat 139
<210> 9
<211> 889
<212> DNA
<213> 拟南芥
<400> 9
gtctactttc attacagtga ctctgcatgc ttcaggtctc gtctaattct tgaattctct 60
tcttttctgt tccgtaattt actttctagg gtctctagat ttgtgtctcc tctaacaaaa 120
gatcctatct ttcgacaaat ttaatttcat cattgacctt tgtcgattcc attctctctc 180
tatctctctg tttcttcgaa aacctagagg ttttgaattt aatgattcct ttttatgtca 240
ataaatttgc aatcaatggg agctttttaa aatcatcgtt atatctataa acaaaaaaac 300
agtaattact cttcttagat ctaaaacaat taataaatct ttcccttttt tctcatcata 360
attttttcgt atttaactct tgtaaaaatt tgcttagccg tttcgctttc tcaggcccca 420
ggtgattcgt gtcttctagg tcagcttgtg aaacctgaga gaagccatct tttgtttgcg 480
gttacaaact ttgccgcttc aatatttcat tgctgttttc tgggaaaacc tttttctagt 540
tttttcggct tattatgcct tttaactttt tgtgcattta acatttattg ttagtgcttt 600
gcttagtgta aagtagtagt tctctttgta atattaccat aaggttcaga agtaaatttt 660
tctaaaattg ttttcttgtg ggaaattcag actgatttca gcaacatgca tgggcttaaa 720
atcagcttct aagactgaga tttagtgacc agtgtggtgg tgtcttgttc tctgttcttg 780
ggagaacaca aaggcagtgt ggagtctggt gagttttctg attcttgaaa agatttataa 840
attttcttgc aaaattagtc tttatgttga attgtgttgc aggtaaaat 889
<210> 10
<211> 433
<212> DNA
<213> 拟南芥
<400> 10
gcacaatctt agcttacctt gaatcacaac ttcaggtata tgtaactgat tctaaattga 60
agattgtgtg caaatcttat atccattttt tattattaaa tttattgaaa aagctagcgg 120
tgtaaattaa tgtcacaaaa tcagtatatt gttagttttt gttttttttg aagttttatg 180
caaatcttca aaaagtatat tcagtgttgt aattgacaaa tagagactct agttcttttt 240
ttttttttct tttttttaac atctgactct tatagagact ctagttcatg tacacttttt 300
ttaatggaaa aacaaatttg aaactgaata tcttatttcc acgtagattg tatattagtt 360
taatttgatt gttatatttg taaatgtcta ctaaacagga attggatggt gaggaggcaa 420
ggcttgtgga tta 433
<210> 11
<211> 354
<212> DNA
<213> 拟南芥
<400> 11
atcttagggt ttcgcgagat ctcactctca ctggtatgtc tgtgtttctt cttccatttt 60
ctgtttctat tggaaacttc tctctccaat ttcgttttct tcacttcttt gatcctttag 120
ctttgacaaa accgtagtaa aggatcaaaa gttatcatct ttggtccatg ttgtgaatcg 180
tgctctgctt gggtcgtgac tcccaaatcc ggatttgaaa ccagcatatc tgagcttaat 240
tcgagcatgc atgcgcttct ttttttctga ttttttttag actttggttc taaatccctt 300
aactttggat taactgtcaa tctacaattt tatattaaca gagatagctt agca 354
<210> 12
<211> 143
<212> DNA
<213> 拟南芥
<400> 12
cagaagctca tttcttcgat acgatcaacc attaggtgat ttttttctct gatcttcgag 60
ttctgataat tgctcttttt tctctggctt tgttatcgat aatttctctg gattttcttt 120
ctggggtgaa tttttgcgca gag 143
<210> 13
<211> 182
<212> DNA
<213> 拟南芥
<400> 13
atttttgttg gtgaaaggta gaattcgtaa atttcttctg ctcactttat tgtttcgact 60
catacccgat aatctcttct atgtttggta gagatatctt ctcaaagtct tatctttcct 120
taccgtgttc tgtgtttttt gatgatttag gtgaagaaga agaagcagag acaaaaacga 180
tt 182
<210> 14
<211> 665
<212> DNA
<213> 拟南芥
<400> 14
ttaagctttt aagaatctct actcacattt tctctgtgag tgttctttta tacttctttg 60
ttatttccaa tttttctttc tttcctctaa aaattttagg aactattgaa tcatttaatt 120
tctgtttgtt gataaaattt cgatcaactg ttctcggctt accgatgcat tttttgtaaa 180
accgtctttt tttggtgaat aaaattttaa attcatacaa aaaaaaaaca tatttgatac 240
tattttagct ccattgtatc tgaatcttca tttgttaatt tttttgtttc ctctgttctc 300
acttgaattt tggaatattt tctctaggtt ttaccttata ttcttcactt taagaactat 360
atgaagattt gattggaagt aataatattc ggtgatagaa tctgagtttg tttgattctg 420
gtgtggggct tatatctaac ttttttcttt gtaccaatac attttcaatt ttacattttt 480
gattagctta aaatgtgaag gataccttgt aaataactat tacactattg cttgtcttag 540
tctaatagtc ttcactaata ttttgtgcag tagaagtaaa tattataaag agttgttgtt 600
tgattataga gagttgttgt ctattcttta acttgatgtg atgttgtttt tgatgacagg 660
taaaa 665
<210> 15
<211> 252
<212> DNA
<213> 拟南芥
<400> 15
tctgggaaat atcgattttg atctattaag agctggtgag agccaaagtt tcctttttgt 60
ttgtttgttt gtttgtttgt tgtttgtatt tttgtatctc tgtgatcgct tctacgtgtt 120
gggtcatgca gagaaactca ttttgttttg atttgcaatg tgtcaattcc actttgaaat 180
ataagattca tcgcctctct ctcctttgtt ttttttcttc ttctgcagct acgagctttg 240
ggatgtggtg ag 252
<210> 16
<211> 186
<212> DNA
<213> 拟南芥
<400> 16
tattcacaat ctcctgccac ctctcatttc tctagttgag ttgttatctg cgtttttaag 60
cactcgaata ctgcatgcaa attccctgat tgtttgttag taccttagag attctcgatt 120
ttttagttgt ttagattgaa ccaggattac taaattgtta ttgttttctg tgtaaaggct 180
acatat 186
<210> 17
<211> 345
<212> DNA
<213> 拟南芥
<400> 17
ctttgcagct tctgcagcac ctctccctac tccaggtact tatgtttttg ataattttat 60
tgatagactc tttacaatta tacttaagct tgttactttt tattgttacc aacaaaagct 120
aatgtatagt tcataactca caggtcctgc gtctttcggt ccgaccactt ctcctacaga 180
ttcgcaaact tctgatcctg aaggtactcg cgaacttttt actgcaactt ctagttctaa 240
ctccaaaaca ttttgttcag aatttgtttc taaaagattt tcgggtttgt tgacgtcaca 300
taactcgcag ggtctgcttc tttccgtccg cccacttctc cgaca 345
<210> 18
<211> 285
<212> DNA
<213> 拟南芥
<400> 18
aacaactatg gcctgagggt aacaagagta tcaggtatat gtgaaaactc tacttttgaa 60
gtttaccaaa aaaaatactc tacttttgga aagacattgc tcctaaaatc ttattagttg 120
tatataattt actaaaacac atagttcttg aattcttgtt aatgagcatg ttaccttgga 180
caagtgaccc tttttctaca ttttgttttt ctatcacacg tcatgcgttt tgattgtttc 240
cttacgagtt ttaattttat tttttggtta aaaacagtaa gataa 285
<210> 19
<211> 137
<212> DNA
<213> 拟南芥
<400> 19
tctaaaaata cagggcaccg aaccaaataa aggtgagaat gatgagaagc cgtttcttac 60
tcttcattgt tttcttctct ctatccctct tcatttcctc tctgatcgcc agtgatttag 120
gcttctgcaa cgaagag 137
<210> 20
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 20
aataatggta cctggtgctt aaacactctg gtgagt 36
<210> 21
<211> 38
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 21
aataatccat ggtttgacct acaaaatcaa agcagtca 38
<210> 22
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 22
ttttttggta ccagttcttt gctttcgaag ttgc 34
<210> 23
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 23
ttttttccat ggtactacgt actgttttca attct 35
<210> 24
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 24
aaaaaaggta ccatttccac acgctttcta tcatttc 37
<210> 25
<211> 42
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 25
aaaaaaccat ggttatctct ctctaaaaaa taaaaacgaa tc 42
<210> 26
<211> 33
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 26
aataaaggta ccgtccagaa ttttctccat tga 33
<210> 27
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 27
aataaaccat ggtcttcact atccaaagct ctca 34
<210> 28
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 28
ttttttggta ccgtctactt tcattacagt gactctg 37
<210> 29
<211> 39
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 29
ttttttccat ggttatattt tacctgcaac acaattcaa 39
<210> 30
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 30
ttttatggta cccactcgaa tactgcatgc aa 32
<210> 31
<211> 38
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 31
ttttatccat ggttatgtag cctttacaca gaaaacaa 38
<210> 32
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 32
tatataggta ccaacaacta tggcctgagg gt 32
<210> 33
<211> 44
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 33
tatataccat ggttatctta ctgtttttaa ccaaaaaata aaat 44
<210> 34
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 34
tttttaggta ccatcttagg gtttcgcgag atctca 36
<210> 35
<211> 42
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 35
ttttttccat ggtgctaagc tatctctgtt aatataaaat tg 42
<210> 36
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 36
ttttttggta ccatttttgt tggtgaaagg taga 34
<210> 37
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 37
tttttaccat ggttacgttt ttgtctctgc ttcttct 37
<210> 38
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 38
tatattggta cctctgggaa atatcgattt tgatct 36
<210> 39
<211> 33
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 39
tatataccat ggtctcacca catcccaaag ctc 33
<210> 40
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 40
ttttatggta ccgcacaatc ttagcttacc ttgaa 35
<210> 41
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 41
ttttatccat ggttatttaa tccacaagcc ttgcctc 37
<210> 42
<211> 29
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 42
tttttaccat ggtgtcggag aagtgggcg 29
<210> 43
<211> 27
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 43
tttttaccat ggagaagtgg gcggacg 27
<210> 44
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 44
ttttatggta cctagcttaa tctcagattc gaatcgt 37
<210> 45
<211> 40
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 45
ttttatccat ggtagtatct acataccaat catacaaatg 40
<210> 46
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 46
ttttttggta cctttcacga tttggaattt ga 32
<210> 47
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 47
ttttttccat ggtctacaac attaaaacga ccatta 36
<210> 48
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 48
tatataggta ccagggtttc gtttttgttt ca 32
<210> 49
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 49
tatataccat ggttatctcc tgctcaaaga aacca 35
<210> 50
<211> 33
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 50
tttataggta ccagaagctc atttcttcga tac 33
<210> 51
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 51
tttataccat ggtctctgcg caaaaattca cc 32
<210> 52
<211> 31
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 52
tatattggta cctctaaaaa tacagggcac c 31
<210> 53
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 53
tatattccat ggttactctt cgttgcagaa gccta 35
<210> 54
<211> 33
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 54
tatataggta ccactgttta agcttcactg tct 33
<210> 55
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 55
tatataccat ggtttcttct aaagctgaaa gt 32
<210> 56
<211> 39
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 56
tatataggta ccttaagctt ttaagaatct ctactcaca 39
<210> 57
<211> 41
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 57
atatatccat ggttaaattt tacctgtcat caaaaacaac a 41
<210> 58
<211> 49
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 58
ggggacaact ttgtatagaa aagttggcca catcatgttt agacttatc 49
<210> 59
<211> 50
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 59
ggggactgct tttttgtaca aacttgttta ccttttatat ttatatatag 50
<210> 60
<211> 73
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 60
ggtacccggg gatcctctag catatgctcg aggcggccgc agatatcaga tctggtcgac 60
ggcatgcaag ctt 73
<210> 61
<211> 12197
<212> DNA
<213> 人工的
<220>
<223> 载体序列
<400> 61
gacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc cgattattct 60
aataaacgct cttttctctt aggtttaccc gccaatatat cctgtcaaac actgatagtt 120
taaactgaag gcgggaaacg acaatcagat ctagtaggaa acagctatga ccatgattac 180
gccaagctat cgattacgcc aagctatcaa ctttgtatag aaaagttggc cacatcatgt 240
ttagacttat ctccataaag aaaaccactc atcaaagcta atacaaaagc tctagtgtga 300
cacttcaacg tcacttcatc aggatcagca ggtaaattcc gaaaattctc acgcagccac 360
gctaaggaca catgagaacc atgaagatcc ttgggacctg gcctatgacc aagcaaatcc 420
tcacataaat cagcccagtt gtattttgta ctaccagtta ctgcaggtcc atcgacacgt 480
agacccaaca aaatattcac atcttgtaaa gtcacagtga tctctccagc aggaagatga 540
aaagtatgcg tttcgggtct ccatctctcc accaaagctg ttatcagagc ataatcaagt 600
tgtataaagg caaccttgta aactccatat agaccaaact ctatcaactt ttgacacacg 660
agaggatcca gaggccaatc tcgcatcccc aataacttgt gccgacatgt cagttcacga 720
ggaggaacct gaatgtgaag tataacggta aaaaggaaat aattaaaaca acggaagcaa 780
aacaagaaac aagatgaaat gagaaactag taacacacct catcttccca tatagcagct 840
gatctatgct catgttgcca caccaatata gattgatcaa ctggaccagg atccaaatca 900
aagtttaata gactttgcac ctccatctat ataatatatc acaggacaat aaacacaatg 960
atcagtgatt atacaacatc aaagaaaact tgtaattctg ggaatataac tgagaaatga 1020
gaattaaaga ttcataattt gaacacaaga aatcctaaac tggtacgaaa gaaaaattgc 1080
tcaacaaaaa aatcaagcta attactcgta tacaaagaca cgaagaacta atacaagaaa 1140
caagaaacaa caaaccacaa agagattgaa ccaatccaaa ttcgacaaca taaaccaagt 1200
gtgtgggtga ttggaatcag aggacgtacc aaagaaaagc gtccgtgatc aacaaaaacc 1260
aaaaagagac gtttgaaata aaccagagga agacgaagaa taattaagca aagagaagcg 1320
ttaagcggga gcgagaaagg aaacgagaga aagagagagc ttccagatcc gacagaagtt 1380
ttcggcttct tctttttcgt ttaagaactt ctgatcctcc taggtctgtc cgaagaacta 1440
atctttttga ggtaacgacg ccgtttttct caaaacatgg gcccattaac catagtctcg 1500
gcccaaacga aacttaatac gacaatgttt gggtgtaaac gcaaagattt tgtcgattat 1560
cacaagtaaa aaaataaata caaacacttg agtctctcta gacatcgtgc atcgccttag 1620
ctttaagttt tttctcgaaa caaaagagtt attttatttg aactttgaag attatacgaa 1680
gacacgtggc gtgaacccaa ttcataacaa cgccacgcta tactcttttg catgcacctc 1740
aatttgaaca tcatcaagtc tctctctctt tttctgactt tgatccacga acctaaccag 1800
cttgcgatct ctatttaatc ggtcctcgac gcaacttcaa cttctactac atccattcac 1860
atcaaatcaa tacagaaagt tttttctata tataaatata aaaggtaaac aagtttgtac 1920
aaaaaagcag gctggtacct ggtgcttaaa cactctggtg agttctagta cttctgctat 1980
gatcgatctc attaccattt cttaaatttc tctccctaaa tattccgagt tcttgatttt 2040
tgataacttc aggttttctc tttttgataa atctggtctt tccatttttt tttttttgtg 2100
gttaatttag tttcctatgt tcttcgattg tattatgcat gatctgtgtt tggattctgt 2160
tagattatgt attggtgaat atgtatgtgt ttttgcatgt ctggttttgg tcttaaaaat 2220
gttcaaatct gatgatttga ttgaagcttt tttagtgttg gtttgattct tctcaaaact 2280
actgttaatt tactatcatg ttttccaact ttgattcatg atgacacttt tgttctgctt 2340
tgttataaaa ttttggttgg tttgattttg taattatagt gtaattttgt taggaatgaa 2400
catgttttaa tactctgttt tcgatttgtc acacattcga attattaatc gataatttaa 2460
ctgaaaattc atggttctag atcttgttgt catcagatta tttgtttcga taattcatca 2520
aatatgtagt ccttttgctg atttgcgact gtttcatttt ttctcaaaat tgttttttgt 2580
taagtttatc taacagttat cgttgtcaaa agtctctttc attttgcaaa atcttctttt 2640
tttttttgtt tgtaactttg ttttttaagc tacacattta gtctgtaaaa tagcatcgag 2700
gaacagttgt cttagtagac ttgcatgttc ttgtaacttc tatttgtttc agtttgttga 2760
tgactgcttt gattttgtag gtcaaaccat ggaagacgcc aaaaacataa agaaaggccc 2820
ggcgccattc tatccgctgg aagatggaac cgctggagag caactgcata aggctatgaa 2880
gagatacgcc ctggttcctg gaacaattgc ttttacagat gcacatatcg aggtggacat 2940
cacttacgct gagtacttcg aaatgtccgt tcggttggca gaagctatga aacgatatgg 3000
gctgaataca aatcacagaa tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc 3060
ggtgttgggc gcgttattta tcggagttgc agttgcgccc gcgaacgaca tttataatga 3120
acgtgaattg ctcaacagta tgggcatttc gcagcctacc gtggtgttcg tttccaaaaa 3180
ggggttgcaa aaaattttga acgtgcaaaa aaagctccca atcatccaaa aaattattat 3240
catggattct aaaacggatt accagggatt tcagtcgatg tacacgttcg tcacatctca 3300
tctacctccc ggttttaatg aatacgattt tgtgccagag tccttcgata gggacaagac 3360
aattgcactg atcatgaact cctctggatc tactggtctg cctaaaggtg tcgctctgcc 3420
tcatagaact gcctgcgtga gattctcgca tgccagagat cctatttttg gcaatcaaat 3480
cattccggat actgcgattt taagtgttgt tccattccat cacggttttg gaatgtttac 3540
tacactcgga tatttgatat gtggatttcg agtcgtctta atgtatagat ttgaagaaga 3600
gctgtttctg aggagccttc aggattacaa gattcaaagt gcgctgctgg tgccaaccct 3660
attctccttc ttcgccaaaa gcactctgat tgacaaatac gatttatcta atttacacga 3720
aattgcttct ggtggcgctc ccctctctaa ggaagtcggg gaagcggttg ccaagaggtt 3780
ccatctgcca ggtatcaggc aaggatatgg gctcactgag actacatcag ctattctgat 3840
tacacccgag ggggatgata aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc 3900
gaaggttgtg gatctggata ccgggaaaac gctgggcgtt aatcaaagag gcgaactgtg 3960
tgtgagaggt cctatgatta tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt 4020
gattgacaag gatggatggc tacattctgg agacatagct tactgggacg aagacgaaca 4080
cttcttcatc gttgaccgcc tgaagtctct gattaagtac aaaggctatc aggtggctcc 4140
cgctgaattg gaatccatct tgctccaaca ccccaacatc ttcgacgcag gtgtcgcagg 4200
tcttcccgac gatgacgccg gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa 4260
gacgatgacg gaaaaagaga tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa 4320
gttgcgcgga ggagttgtgt ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga 4380
cgcaagaaaa atcagagaga tcctcataaa ggccaagaag ggcggaaaga tcgccgtgta 4440
actcgagcat atgggctcga atttccccga tcgttcaaac atttggcaat aaagtttctt 4500
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 4560
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 4620
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 4680
ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggaattca agcttggcgt 4740
aatcatggac ccagctttct tgtacaaagt ggggtacccg gggatcctct agcatatgct 4800
cgaggcggcc gcagatatca gatctggtcg acggcatgca agcttggcgt aatcatggca 4860
actttattat acatagttga taattcactg gccggataat tcactggccg tcgttttaca 4920
acgactcagg atcctgtcaa acactgatag tttaaactga aggcgggaaa cgacaatctg 4980
atcatgagcg gagaattaag ggagtcacgt tatgaccccc gccgatgacg cgggacaagc 5040
cgttttacgt ttggaactga cagaaccgca acgttgaagg agccactcag ccgcgggttt 5100
ctggagttta atgagctaag cacatacgtc agaaaccatt attgcgcgtt caaaagtcgc 5160
ctaaggtcac tatcagctag caaatatttc ttgtcaaaaa tgctccactg acgttccata 5220
aattcccctc ggtatccaat tagagtctca tattcactct caatccaaat aatctgcacc 5280
ggatctggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 5340
tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 5400
gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 5460
ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 5520
gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 5580
ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 5640
atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 5700
caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 5760
caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 5820
aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 5880
aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 5940
gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 6000
gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 6060
gccttctatc gccttcttga cgagttcttc tgagcgggac ccaagctcta gatcttgctg 6120
cgttcggata ttttcgtgga gttcccgcca cagacccgga tgatccccga tcgttcaaac 6180
atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 6240
taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 6300
atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 6360
aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 6420
cgggcctcct gtcaagctct gcttggtaat aattgtcatt agattgtttt tatgcataga 6480
tgcactcgaa atcagccaat tttagacaag tatcaaacgg atgttaattc agtacattaa 6540
agacgtccgc aatgtgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat 6600
cctgccacca gccagccaac agctccccga ccggcagctc ggcacaaaat caccacgcgt 6660
taccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg ccgagttcga 6720
gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg cccgaggcgt 6780
gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc gcgagctgat 6840
cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc atcgctcgac 6900
cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca ggcggcgcgg 6960
tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg agaatgaacg 7020
ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt tttcattacc 7080
gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc cgcgcacgtc 7140
tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct ggcggcctgg 7200
ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg atgtgtattt 7260
gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt aaataaacaa 7320
atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc gggtcaggca 7380
agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc gatgttctgt 7440
tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg gaagatcaac 7500
cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag gccatcggcc 7560
ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct gtgtccgcga 7620
tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac atatgggcca 7680
ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga aggctacaag 7740
cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag gttgccgagg 7800
cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc gtgagctacc 7860
caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc gacgctgccc 7920
gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt aatgaggtaa 7980
agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg cacgcagcag 8040
caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg tcaactttca 8100
gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag gcaagaccat 8160
taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca aatgaataaa 8220
tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa caaccaggca 8280
ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc gtaagcggct 8340
gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa tcggcgtgag 8400
cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg ctgggtgatg acctggtgga 8460
gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc gaggcagaag cacgccccgg 8520
tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa tcccggcaac cgccggcagc 8580
cggtgcgccg tcgattagga agccgcccaa gggcgacgag caaccagatt ttttcgttcc 8640
gatgctctat gacgtgggca cccgcgatag tcgcagcatc atggacgtgg ccgttttccg 8700
tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc tacgagcttc cagacgggca 8760
cgtagaggtt tccgcagggc cggccggcat ggccagtgtg tgggattacg acctggtact 8820
gatggcggtt tcccatctaa ccgaatccat gaaccgatac cgggaaggga agggagacaa 8880
gcccggccgc gtgttccgtc cacacgttgc ggacgtactc aagttctgcc ggcgagccga 8940
tggcggaaag cagaaagacg acctggtaga aacctgcatt cggttaaaca ccacgcacgt 9000
tgccatgcag cgtacgaaga aggccaagaa cggccgcctg gtgacggtat ccgagggtga 9060
agccttgatt agccgctaca agatcgtaaa gagcgaaacc gggcggccgg agtacatcga 9120
gatcgagcta gctgattgga tgtaccgcga gatcacagaa ggcaagaacc cggacgtgct 9180
gacggttcac cccgattact ttttgatcga tcccggcatc ggccgttttc tctaccgcct 9240
ggcacgccgc gccgcaggca aggcagaagc cagatggttg ttcaagacga tctacgaacg 9300
cagtggcagc gccggagagt tcaagaagtt ctgtttcacc gtgcgcaagc tgatcgggtc 9360
aaatgacctg ccggagtacg atttgaagga ggaggcgggg caggctggcc cgatcctagt 9420
catgcgctac cgcaacctga tcgagggcga agcatccgcc ggttcctaat gtacggagca 9480
gatgctaggg caaattgccc tagcagggga aaaaggtcga aaaggtctct ttcctgtgga 9540
tagcacgtac attgggaacc caaagccgta cattgggaac cggaacccgt acattgggaa 9600
cccaaagccg tacattggga accggtcaca catgtaagtg actgatataa aagagaaaaa 9660
aggcgatttt tccgcctaaa actctttaaa acttattaaa actcttaaaa cccgcctggc 9720
ctgtgcataa ctgtctggcc agcgcacagc cgaagagctg caaaaagcgc ctacccttcg 9780
gtcgctgcgc tccctacgcc ccgccgcttc gcgtcggcct atcgcggccg ctggccgctc 9840
aaaaatggct ggcctacggc caggcaatct accagggcgc ggacaagccg cgccgtcgcc 9900
actcgaccgc cggcgcccac atcaaggcac cctgcctcgc gcgtttcggt gatgacggtg 9960
aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg 10020
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca 10080
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca 10140
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 10200
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 10260
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 10320
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 10380
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 10440
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 10500
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 10560
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 10620
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 10680
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 10740
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 10800
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 10860
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 10920
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 10980
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 11040
acgttaaggg attttggtca tgcatgatat atctcccaat ttgtgtaggg cttattatgc 11100
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 11160
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 11220
tctagctaga cattatttgc cgactacctt ggtgatctcg cctttcacgt agtggacaaa 11280
ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct tcttgtccaa gataagcctg 11340
tctagcttca agtatgacgg gctgatactg ggccggcagg cgctccattg cccagtcggc 11400
agcgacatcc ttcggcgcga ttttgccggt tactgcgctg taccaaatgc gggacaacgt 11460
aagcactaca tttcgctcat cgccagccca gtcgggcggc gagttccata gcgttaaggt 11520
ttcatttagc gcctcaaata gatcctgttc aggaaccgga tcaaagagtt cctccgccgc 11580
tggacctacc aaggcaacgc tatgttctct tgcttttgtc agcaagatag ccagatcaat 11640
gtcgatcgtg gctggctcga agatacctgc aagaatgtca ttgcgctgcc attctccaaa 11700
ttgcagttcg cgcttagctg gataacgcca cggaatgatg tcgtcgtgca caacaatggt 11760
gacttctaca gcgcggagaa tctcgctctc tccaggggaa gccgaagttt ccaaaaggtc 11820
gttgatcaaa gctcgccgcg ttgtttcatc aagccttacg gtcaccgtaa ccagcaaatc 11880
aatatcactg tgtggcttca ggccgccatc cactgcggag ccgtacaaat gtacggccag 11940
caacgtcggt tcgagatggc gctcgatgac gccaactacc tctgatagtt gagtcgatac 12000
ttcggcgatc accgcttccc ccatgatgtt taactttgtt ttagggcgac tgccctgctg 12060
cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg 12120
cttggatgcc cgaggcatag actgtacccc aaaaaaacag tcataacaag ccatgaaaac 12180
cgccactgcg ttccatg 12197
<210> 62
<211> 14901
<212> DNA
<213> 人工的
<220>
<223> 载体序列
<400> 62
gacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc cgattattct 60
aataaacgct cttttctctt aggtttaccc gccaatatat cctgtcaaac actgatagtt 120
taaactgaag gcgggaaacg acaatcagat ctagtaggaa acagctatga ccatgattac 180
gccaagctat cgattacgcc aagctatcaa ctttgtatag aaaagttggc cacatcatgt 240
ttagacttat ctccataaag aaaaccactc atcaaagcta atacaaaagc tctagtgtga 300
cacttcaacg tcacttcatc aggatcagca ggtaaattcc gaaaattctc acgcagccac 360
gctaaggaca catgagaacc atgaagatcc ttgggacctg gcctatgacc aagcaaatcc 420
tcacataaat cagcccagtt gtattttgta ctaccagtta ctgcaggtcc atcgacacgt 480
agacccaaca aaatattcac atcttgtaaa gtcacagtga tctctccagc aggaagatga 540
aaagtatgcg tttcgggtct ccatctctcc accaaagctg ttatcagagc ataatcaagt 600
tgtataaagg caaccttgta aactccatat agaccaaact ctatcaactt ttgacacacg 660
agaggatcca gaggccaatc tcgcatcccc aataacttgt gccgacatgt cagttcacga 720
ggaggaacct gaatgtgaag tataacggta aaaaggaaat aattaaaaca acggaagcaa 780
aacaagaaac aagatgaaat gagaaactag taacacacct catcttccca tatagcagct 840
gatctatgct catgttgcca caccaatata gattgatcaa ctggaccagg atccaaatca 900
aagtttaata gactttgcac ctccatctat ataatatatc acaggacaat aaacacaatg 960
atcagtgatt atacaacatc aaagaaaact tgtaattctg ggaatataac tgagaaatga 1020
gaattaaaga ttcataattt gaacacaaga aatcctaaac tggtacgaaa gaaaaattgc 1080
tcaacaaaaa aatcaagcta attactcgta tacaaagaca cgaagaacta atacaagaaa 1140
caagaaacaa caaaccacaa agagattgaa ccaatccaaa ttcgacaaca taaaccaagt 1200
gtgtgggtga ttggaatcag aggacgtacc aaagaaaagc gtccgtgatc aacaaaaacc 1260
aaaaagagac gtttgaaata aaccagagga agacgaagaa taattaagca aagagaagcg 1320
ttaagcggga gcgagaaagg aaacgagaga aagagagagc ttccagatcc gacagaagtt 1380
ttcggcttct tctttttcgt ttaagaactt ctgatcctcc taggtctgtc cgaagaacta 1440
atctttttga ggtaacgacg ccgtttttct caaaacatgg gcccattaac catagtctcg 1500
gcccaaacga aacttaatac gacaatgttt gggtgtaaac gcaaagattt tgtcgattat 1560
cacaagtaaa aaaataaata caaacacttg agtctctcta gacatcgtgc atcgccttag 1620
ctttaagttt tttctcgaaa caaaagagtt attttatttg aactttgaag attatacgaa 1680
gacacgtggc gtgaacccaa ttcataacaa cgccacgcta tactcttttg catgcacctc 1740
aatttgaaca tcatcaagtc tctctctctt tttctgactt tgatccacga acctaaccag 1800
cttgcgatct ctatttaatc ggtcctcgac gcaacttcaa cttctactac atccattcac 1860
atcaaatcaa tacagaaagt tttttctata tataaatata aaaggtaaac aagtttgtac 1920
aaaaaagcag gctggtacct ggtgcttaaa cactctggtg agttctagta cttctgctat 1980
gatcgatctc attaccattt cttaaatttc tctccctaaa tattccgagt tcttgatttt 2040
tgataacttc aggttttctc tttttgataa atctggtctt tccatttttt tttttttgtg 2100
gttaatttag tttcctatgt tcttcgattg tattatgcat gatctgtgtt tggattctgt 2160
tagattatgt attggtgaat atgtatgtgt ttttgcatgt ctggttttgg tcttaaaaat 2220
gttcaaatct gatgatttga ttgaagcttt tttagtgttg gtttgattct tctcaaaact 2280
actgttaatt tactatcatg ttttccaact ttgattcatg atgacacttt tgttctgctt 2340
tgttataaaa ttttggttgg tttgattttg taattatagt gtaattttgt taggaatgaa 2400
catgttttaa tactctgttt tcgatttgtc acacattcga attattaatc gataatttaa 2460
ctgaaaattc atggttctag atcttgttgt catcagatta tttgtttcga taattcatca 2520
aatatgtagt ccttttgctg atttgcgact gtttcatttt ttctcaaaat tgttttttgt 2580
taagtttatc taacagttat cgttgtcaaa agtctctttc attttgcaaa atcttctttt 2640
tttttttgtt tgtaactttg ttttttaagc tacacattta gtctgtaaaa tagcatcgag 2700
gaacagttgt cttagtagac ttgcatgttc ttgtaacttc tatttgtttc agtttgttga 2760
tgactgcttt gattttgtag gtcaaaccat ggaagacgcc aaaaacataa agaaaggccc 2820
ggcgccattc tatccgctgg aagatggaac cgctggagag caactgcata aggctatgaa 2880
gagatacgcc ctggttcctg gaacaattgc ttttacagat gcacatatcg aggtggacat 2940
cacttacgct gagtacttcg aaatgtccgt tcggttggca gaagctatga aacgatatgg 3000
gctgaataca aatcacagaa tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc 3060
ggtgttgggc gcgttattta tcggagttgc agttgcgccc gcgaacgaca tttataatga 3120
acgtgaattg ctcaacagta tgggcatttc gcagcctacc gtggtgttcg tttccaaaaa 3180
ggggttgcaa aaaattttga acgtgcaaaa aaagctccca atcatccaaa aaattattat 3240
catggattct aaaacggatt accagggatt tcagtcgatg tacacgttcg tcacatctca 3300
tctacctccc ggttttaatg aatacgattt tgtgccagag tccttcgata gggacaagac 3360
aattgcactg atcatgaact cctctggatc tactggtctg cctaaaggtg tcgctctgcc 3420
tcatagaact gcctgcgtga gattctcgca tgccagagat cctatttttg gcaatcaaat 3480
cattccggat actgcgattt taagtgttgt tccattccat cacggttttg gaatgtttac 3540
tacactcgga tatttgatat gtggatttcg agtcgtctta atgtatagat ttgaagaaga 3600
gctgtttctg aggagccttc aggattacaa gattcaaagt gcgctgctgg tgccaaccct 3660
attctccttc ttcgccaaaa gcactctgat tgacaaatac gatttatcta atttacacga 3720
aattgcttct ggtggcgctc ccctctctaa ggaagtcggg gaagcggttg ccaagaggtt 3780
ccatctgcca ggtatcaggc aaggatatgg gctcactgag actacatcag ctattctgat 3840
tacacccgag ggggatgata aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc 3900
gaaggttgtg gatctggata ccgggaaaac gctgggcgtt aatcaaagag gcgaactgtg 3960
tgtgagaggt cctatgatta tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt 4020
gattgacaag gatggatggc tacattctgg agacatagct tactgggacg aagacgaaca 4080
cttcttcatc gttgaccgcc tgaagtctct gattaagtac aaaggctatc aggtggctcc 4140
cgctgaattg gaatccatct tgctccaaca ccccaacatc ttcgacgcag gtgtcgcagg 4200
tcttcccgac gatgacgccg gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa 4260
gacgatgacg gaaaaagaga tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa 4320
gttgcgcgga ggagttgtgt ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga 4380
cgcaagaaaa atcagagaga tcctcataaa ggccaagaag ggcggaaaga tcgccgtgta 4440
actcgagcat atgggctcga atttccccga tcgttcaaac atttggcaat aaagtttctt 4500
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 4560
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 4620
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 4680
ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggaattca agcttggcgt 4740
aatcatggac ccagctttct tgtacaaagt ggggtaccaa ttcgaatcca aaaattacgg 4800
atatgaatat aggcatatcc gtatccgaat tatccgtttg acagctagca acgattgtac 4860
aattgcttct ttaaaaaagg aagaaagaaa gaaagaaaag aatcaacatc agcgttaaca 4920
aacggccccg ttacggccca aacggtcata tagagtaacg gcgttaagcg ttgaaagact 4980
cctatcgaaa tacgtaaccg caaacgtgtc atagtcagat cccctcttcc ttcaccgcct 5040
caaacacaaa aataatcttc tacagcctat atatacaacc cccccttcta tctctccttt 5100
ctcacaattc atcatctttc tttctctacc cccaatttta agaaatcctc tcttctcctc 5160
ttcattttca aggtaaatct ctctctctct ctctctctct gttattcctt gttttaatta 5220
ggtatgtatt attgctagtt tgttaatctg cttatcttat gtatgcctta tgtgaatatc 5280
tttatcttgt tcatctcatc cgtttagaag ctataaattt gttgatttga ctgtgtatct 5340
acacgtggtt atgtttatat ctaatcagat atgaatttct tcatattgtt gcgtttgtgt 5400
gtaccaatcc gaaatcgttg atttttttca tttaatcgtg tagctaattg tacgtataca 5460
tatggatcta cgtatcaatt gttcatctgt ttgtgtttgt atgtatacag atctgaaaac 5520
atcacttctc tcatctgatt gtgttgttac atacatagat atagatctgt tatatcattt 5580
tttttattaa ttgtgtatat atatatgtgc atagatctgg attacatgat tgtgattatt 5640
tacatgattt tgttatttac gtatgtatat atgtagatct ggactttttg gagttgttga 5700
cttgattgta tttgtgtgtg tatatgtgtg ttctgatctt gatatgttat gtatgtgcag 5760
ctgaaccatg gcggcggcaa caacaacaac aacaacatct tcttcgatct ccttctccac 5820
caaaccatct ccttcctcct ccaaatcacc attaccaatc tccagattct ccctcccatt 5880
ctccctaaac cccaacaaat catcctcctc ctcccgccgc cgcggtatca aatccagctc 5940
tccctcctcc atctccgccg tgctcaacac aaccaccaat gtcacaacca ctccctctcc 6000
aaccaaacct accaaacccg aaacattcat ctcccgattc gctccagatc aaccccgcaa 6060
aggcgctgat atcctcgtcg aagctttaga acgtcaaggc gtagaaaccg tattcgctta 6120
ccctggaggt acatcaatgg agattcacca agccttaacc cgctcttcct caatccgtaa 6180
cgtccttcct cgtcacgaac aaggaggtgt attcgcagca gaaggatacg ctcgatcctc 6240
aggtaaacca ggtatctgta tagccacttc aggtcccgga gctacaaatc tcgttagcgg 6300
attagccgat gcgttgttag atagtgttcc tcttgtagca atcacaggac aagtccctcg 6360
tcgtatgatt ggtacagatg cgtttcaaga gactccgatt gttgaggtaa cgcgttcgat 6420
tacgaagcat aactatcttg tgatggatgt tgaagatatc cctaggatta ttgaggaagc 6480
tttcttttta gctacttctg gtagacctgg acctgttttg gttgatgttc ctaaagatat 6540
tcaacaacag cttgcgattc ctaattggga acaggctatg agattacctg gttatatgtc 6600
taggatgcct aaacctccgg aagattctca tttggagcag attgttaggt tgatttctga 6660
gtctaagaag cctgtgttgt atgttggtgg tggttgtttg aattctagcg atgaattggg 6720
taggtttgtt gagcttacgg ggatccctgt tgcgagtacg ttgatggggc tgggatctta 6780
tccttgtgat gatgagttgt cgttacatat gcttggaatg catgggactg tgtatgcaaa 6840
ttacgctgtg gagcatagtg atttgttgtt ggcgtttggg gtaaggtttg atgatcgtgt 6900
cacgggtaag cttgaggctt ttgctagtag ggctaagatt gttcatattg atattgactc 6960
ggctgagatt gggaagaata agactcctca tgtgtctgtg tgtggtgatg ttaagctggc 7020
tttgcaaggg atgaataagg ttcttgagaa ccgagcggag gagcttaagc ttgattttgg 7080
agtttggagg aatgagttga acgtacagaa acagaagttt ccgttgagct ttaagacgtt 7140
tggggaagct attcctccac agtatgcgat taaggtcctt gatgagttga ctgatggaaa 7200
agccataata agtactggtg tcgggcaaca tcaaatgtgg gcggcgcagt tctacaatta 7260
caagaaacca aggcagtggc tatcatcagg aggccttgga gctatgggat ttggacttcc 7320
tgctgcgatt ggagcgtctg ttgctaaccc tgatgcgata gttgtggata ttgacggaga 7380
tggaagcttt ataatgaatg tgcaagagct agccactatt cgtgtagaga atcttccagt 7440
gaaggtactt ttattaaaca accagcatct tggcatggtt atgcaatggg aagatcggtt 7500
ctacaaagct aaccgagctc acacatttct cggggatccg gctcaggagg acgagatatt 7560
cccgaacatg ttgctgtttg cagcagcttg cgggattcca gcggcgaggg tgacaaagaa 7620
agcagatctc cgagaagcta ttcagacaat gctggataca ccaggacctt acctgttgga 7680
tgtgatttgt ccgcaccaag aacatgtgtt gccgatgatc ccgaatggtg gcactttcaa 7740
cgatgtcata acggaaggag atggccggat taaatactga gagatgaaac cggtgattat 7800
cagaaccttt tatggtcttt gtatgcatat ggtaaaaaaa cttagtttgc aatttcctgt 7860
ttgttttggt aatttgagtt tcttttagtt gttgatctgc ctgctttttg gtttacgtca 7920
gactactact gctgttgttg tttggtttcc tttctttcat tttataaata aataatccgg 7980
ttcggtttac tccttgtgac tggctcagtt tggttattgc gaaatgcgaa tggtaaattg 8040
agtaattgaa attcgttatt agggttctaa gctgttttaa cagtcactgg gttaatatct 8100
ctcgaatctt gcatggaaaa tgctcttacc attggttttt aattgaaatg tgctcatatg 8160
ggccgtggtt tccaaattaa ataaaactac gatgtcatcg agaagtaaaa tcaactgtgt 8220
ccacattatc agttttgtgt atacgatgaa atagggtaat tcaaaatcta gcttgatatg 8280
ccttttggtt cattttaacc ttctgtaaac attttttcag attttgaaca agtaaatcca 8340
aaaaaaaaaa aaaaaaatct caactcaaca ctaaattatt ttaatgtata aaagatgctt 8400
aaaacatttg gcttaaaaga aagaagctaa aaacatagag aactcttgta aattgaagta 8460
tgaaaatata ctgaattggg tattatatga atttttctga tttaggattc acatgatcca 8520
aaaaggaaat ccagaagcac taatcagaca ttggaagtag gaatatttca aaaagttttt 8580
tttttttaag taagtgacaa aagcttttaa aaaatagaaa agaaactagt attaaagttg 8640
taaatttaat aaacaaaaga aattttttat attttttcat ttctttttcc agcatgaggt 8700
tatgatggca ggatgtggat ttcatttttt tccttttgat agccttttaa ttgatctatt 8760
ataattgacg aaaaaatatt agttaattat agatatattt taggtagtat tagcaattta 8820
cacttccaaa agactatgta agttgtaaat atgatgcgtt gatctcttca tcattcaatg 8880
gttagtcaaa aaaataaaag cttaactagt aaactaaagt agtcaaaaat tgtactttag 8940
tttaaaatat tacatgaata atccaaaacg acatttatgt gaaacaaaaa caatatctag 9000
agtcgactta attaaactag tggcgcgcca attgactagt aggcctatcg attaattaag 9060
gccgcctcga gcatatgggc atgcaagctt ggcgtaatca tggcaacttt attatacata 9120
gttgataatt cactggccgg atctgcttgg taataattgt cattagattg tttttatgca 9180
tagatgcact cgaaatcagc caattttaga caagtatcaa acggatgtta attcagtaca 9240
ttaaagacgt ccgcaatgtg ttattaagtt gtctaagcgt caatttgttt acaccacaat 9300
atatcctgcc accagccagc caacagctcc ccgaccggca gctcggcaca aaatcaccac 9360
gcgttaccac cacgccggcc ggccgcatgg tgttgaccgt gttcgccggc attgccgagt 9420
tcgagcgttc cctaatcatc gaccgcaccc ggagcgggcg cgaggccgcc aaggcccgag 9480
gcgtgaagtt tggcccccgc cctaccctca ccccggcaca gatcgcgcac gcccgcgagc 9540
tgatcgacca ggaaggccgc accgtgaaag aggcggctgc actgcttggc gtgcatcgct 9600
cgaccctgta ccgcgcactt gagcgcagcg aggaagtgac gcccaccgag gccaggcggc 9660
gcggtgcctt ccgtgaggac gcattgaccg aggccgacgc cctggcggcc gccgagaatg 9720
aacgccaaga ggaacaagca tgaaaccgca ccaggacggc caggacgaac cgtttttcat 9780
taccgaagag atcgaggcgg agatgatcgc ggccgggtac gtgttcgagc cgcccgcgca 9840
cgtctcaacc gtgcggctgc atgaaatcct ggccggtttg tctgatgcca agctggcggc 9900
ctggccggcc agcttggccg ctgaagaaac cgagcgccgc cgtctaaaaa ggtgatgtgt 9960
atttgagtaa aacagcttgc gtcatgcggt cgctgcgtat atgatgcgat gagtaaataa 10020
acaaatacgc aaggggaacg catgaaggtt atcgctgtac ttaaccagaa aggcgggtca 10080
ggcaagacga ccatcgcaac ccatctagcc cgcgccctgc aactcgccgg ggccgatgtt 10140
ctgttagtcg attccgatcc ccagggcagt gcccgcgatt gggcggccgt gcgggaagat 10200
caaccgctaa ccgttgtcgg catcgaccgc ccgacgattg accgcgacgt gaaggccatc 10260
ggccggcgcg acttcgtagt gatcgacgga gcgccccagg cggcggactt ggctgtgtcc 10320
gcgatcaagg cagccgactt cgtgctgatt ccggtgcagc caagccctta cgacatatgg 10380
gccaccgccg acctggtgga gctggttaag cagcgcattg aggtcacgga tggaaggcta 10440
caagcggcct ttgtcgtgtc gcgggcgatc aaaggcacgc gcatcggcgg tgaggttgcc 10500
gaggcgctgg ccgggtacga gctgcccatt cttgagtccc gtatcacgca gcgcgtgagc 10560
tacccaggca ctgccgccgc cggcacaacc gttcttgaat cagaacccga gggcgacgct 10620
gcccgcgagg tccaggcgct ggccgctgaa attaaatcaa aactcatttg agttaatgag 10680
gtaaagagaa aatgagcaaa agcacaaaca cgctaagtgc cggccgtccg agcgcacgca 10740
gcagcaaggc tgcaacgttg gccagcctgg cagacacgcc agccatgaag cgggtcaact 10800
ttcagttgcc ggcggaggat cacaccaagc tgaagatgta cgcggtacgc caaggcaaga 10860
ccattaccga gctgctatct gaatacatcg cgcagctacc agagtaaatg agcaaatgaa 10920
taaatgagta gatgaatttt agcggctaaa ggaggcggca tggaaaatca agaacaacca 10980
ggcaccgacg ccgtggaatg ccccatgtgt ggaggaacgg gcggttggcc aggcgtaagc 11040
ggctgggttg tctgccggcc ctgcaatggc actggaaccc ccaagcccga ggaatcggcg 11100
tgagcggtcg caaaccatcc ggcccggtac aaatcggcgc ggcgctgggt gatgacctgg 11160
tggagaagtt gaaggccgcg caggccgccc agcggcaacg catcgaggca gaagcacgcc 11220
ccggtgaatc gtggcaagcg gccgctgatc gaatccgcaa agaatcccgg caaccgccgg 11280
cagccggtgc gccgtcgatt aggaagccgc ccaagggcga cgagcaacca gattttttcg 11340
ttccgatgct ctatgacgtg ggcacccgcg atagtcgcag catcatggac gtggccgttt 11400
tccgtctgtc gaagcgtgac cgacgagctg gcgaggtgat ccgctacgag cttccagacg 11460
ggcacgtaga ggtttccgca gggccggccg gcatggccag tgtgtgggat tacgacctgg 11520
tactgatggc ggtttcccat ctaaccgaat ccatgaaccg ataccgggaa gggaagggag 11580
acaagcccgg ccgcgtgttc cgtccacacg ttgcggacgt actcaagttc tgccggcgag 11640
ccgatggcgg aaagcagaaa gacgacctgg tagaaacctg cattcggtta aacaccacgc 11700
acgttgccat gcagcgtacg aagaaggcca agaacggccg cctggtgacg gtatccgagg 11760
gtgaagcctt gattagccgc tacaagatcg taaagagcga aaccgggcgg ccggagtaca 11820
tcgagatcga gctagctgat tggatgtacc gcgagatcac agaaggcaag aacccggacg 11880
tgctgacggt tcaccccgat tactttttga tcgatcccgg catcggccgt tttctctacc 11940
gcctggcacg ccgcgccgca ggcaaggcag aagccagatg gttgttcaag acgatctacg 12000
aacgcagtgg cagcgccgga gagttcaaga agttctgttt caccgtgcgc aagctgatcg 12060
ggtcaaatga cctgccggag tacgatttga aggaggaggc ggggcaggct ggcccgatcc 12120
tagtcatgcg ctaccgcaac ctgatcgagg gcgaagcatc cgccggttcc taatgtacgg 12180
agcagatgct agggcaaatt gccctagcag gggaaaaagg tcgaaaaggt ctctttcctg 12240
tggatagcac gtacattggg aacccaaagc cgtacattgg gaaccggaac ccgtacattg 12300
ggaacccaaa gccgtacatt gggaaccggt cacacatgta agtgactgat ataaaagaga 12360
aaaaaggcga tttttccgcc taaaactctt taaaacttat taaaactctt aaaacccgcc 12420
tggcctgtgc ataactgtct ggccagcgca cagccgaaga gctgcaaaaa gcgcctaccc 12480
ttcggtcgct gcgctcccta cgccccgccg cttcgcgtcg gcctatcgcg gccgctggcc 12540
gctcaaaaat ggctggccta cggccaggca atctaccagg gcgcggacaa gccgcgccgt 12600
cgccactcga ccgccggcgc ccacatcaag gcaccctgcc tcgcgcgttt cggtgatgac 12660
ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat 12720
gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggcgca 12780
gccatgaccc agtcacgtag cgatagcgga gtgtatactg gcttaactat gcggcatcag 12840
agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga tgcgtaagga 12900
gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 12960
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 13020
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 13080
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 13140
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 13200
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 13260
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 13320
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 13380
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 13440
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 13500
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 13560
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 13620
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 13680
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 13740
actcacgtta agggattttg gtcatgcatg atatatctcc caatttgtgt agggcttatt 13800
atgcacgctt aaaaataata aaagcagact tgacctgata gtttggctgt gagcaattat 13860
gtgcttagtg catctaacgc ttgagttaag ccgcgccgcg aagcggcgtc ggcttgaacg 13920
aatttctagc tagacattat ttgccgacta ccttggtgat ctcgcctttc acgtagtgga 13980
caaattcttc caactgatct gcgcgcgagg ccaagcgatc ttcttcttgt ccaagataag 14040
cctgtctagc ttcaagtatg acgggctgat actgggccgg caggcgctcc attgcccagt 14100
cggcagcgac atccttcggc gcgattttgc cggttactgc gctgtaccaa atgcgggaca 14160
acgtaagcac tacatttcgc tcatcgccag cccagtcggg cggcgagttc catagcgtta 14220
aggtttcatt tagcgcctca aatagatcct gttcaggaac cggatcaaag agttcctccg 14280
ccgctggacc taccaaggca acgctatgtt ctcttgcttt tgtcagcaag atagccagat 14340
caatgtcgat cgtggctggc tcgaagatac ctgcaagaat gtcattgcgc tgccattctc 14400
caaattgcag ttcgcgctta gctggataac gccacggaat gatgtcgtcg tgcacaacaa 14460
tggtgacttc tacagcgcgg agaatctcgc tctctccagg ggaagccgaa gtttccaaaa 14520
ggtcgttgat caaagctcgc cgcgttgttt catcaagcct tacggtcacc gtaaccagca 14580
aatcaatatc actgtgtggc ttcaggccgc catccactgc ggagccgtac aaatgtacgg 14640
ccagcaacgt cggttcgaga tggcgctcga tgacgccaac tacctctgat agttgagtcg 14700
atacttcggc gatcaccgct tcccccatga tgtttaactt tgttttaggg cgactgccct 14760
gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg taacgcgctt 14820
gctgcttgga tgcccgaggc atagactgta ccccaaaaaa acagtcataa caagccatga 14880
aaaccgccac tgcgttccat g 14901
<210> 63
<211> 51
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 63
ggggacaact ttgtatagaa aagttcacgg gcaggacata gggactacta c 51
<210> 64
<211> 51
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 64
ggggactgct tttttgtaca aacttggatt tatgataaaa atgtcggttt c 51
<210> 65
<211> 50
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 65
ggggacaact ttgtatagaa aagttctgca gcaaatttac acattgccac 50
<210> 66
<211> 50
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 66
ggggactgct tttttgtaca aacttgactg gctatgaaga aattataatc 50
<210> 67
<211> 15029
<212> DNA
<213> 人工的
<220>
<223> 载体序列
<400> 67
gacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc cgattattct 60
aataaacgct cttttctctt aggtttaccc gccaatatat cctgtcaaac actgatagtt 120
taaactgaag gcgggaaacg acaatcagat ctagtaggaa acagctatga ccatgattac 180
gccaagctat cgattacgcc aagctatcaa ctttgtatag aaaagttgcc atgattacgc 240
caagcttgca tgcccatatg ctcgaggcgg ccgcagatat cagatctggt cgaccacggg 300
caggacatag ggactactac aagcatagta tgcttcagac aaagagctag gaaagaactc 360
ttgatggagg ttaagagaaa aaagtgctag aggggcatag taatcaaact tgtcaaaacc 420
gtcatcatga tgagggatga cataatataa aaagttgact aaggtcttgg tagtactctt 480
tgattagtat tatatattgg tgagaacatg agtcaagagg agacaagaaa ccgaggaacc 540
atagtttagc aacaagatgg aagttgcaaa gttgagctag ccgctcgatt agttacatct 600
cctaagcagt actacaagga atggtctcta tactttcatg tttagcacat ggtagtgcgg 660
attgacaagt tagaaacagt gcttaggaga caaagagtca gtaaaggtat tgaaagagtg 720
aagttgatgc tcgacaggtc aggagaagtc cctccgccag atggtgacta ccaaggggtt 780
ggtatcagct gagacccaaa taagattctt cggttgaacc agtggttcga ccgagactct 840
tagggtggga tttcactgta agatttgtgc attttgttga atataaattg acaatttttt 900
ttatttaatt atagattatt tagaatgaat tacatattta gtttctaaca aggatagcaa 960
tggatgggta tgggtacagg ttaaacatat ctattaccca cccatctagt cgtcgggttt 1020
tacacgtacc cacccgttta cataaaccag accggaattt taaaccgtac ccgtccgtta 1080
gcgggtttca gatttacccg tttaatcggg taaaacctga ttactaaata tatatttttt 1140
atttgataaa caaaacaaaa atgttaatat tttcatattg gatgcaattt taagaaacac 1200
atattcataa atttccatat ttgtaggaaa ataaaaagaa aaatatattc aagaacacaa 1260
atttcaccga catgactttt attacagagt tggaattaga tctaacaatt gaaaaattaa 1320
aattaagata gaatatgttg aggaacatga catagtataa tgctgggtta cccgtcgggt 1380
aggtatcgag gcggatacta ctaaatccat cccactcgct atccgataat cactggtttc 1440
gggtataccc attcccgtca acaggccttt ttaaccggat aatttcaact tatagtgaat 1500
gaattttgaa taaatagtta gaataccaaa atcctggatt gcatttgcaa tcaaattttg 1560
tgaaccgtta aattttgcat gtacttggga tagatataat agaaccgaat tttcattagt 1620
ttaatttata acttactttg ttcaaagaaa aaaaatatct atccaattta cttataataa 1680
aaaataatct atccaagtta cttattataa tcaacttgta aaaaggtaag aatacaaatg 1740
tggtagcgta cgtgtgatta tatgtgacga aatgttatat ctaacaaaag tccaaattcc 1800
catggtaaaa aaaatcaaaa tgcatggcag gctgtttgta accttggaat aagatgttgg 1860
ccaattctgg agccgccacg tacgcaagac tcagggccac gttctcttca tgcaaggata 1920
gtagaacacc actccaccca cctcctatat tagacctttg cccaaccctc cccaactttc 1980
ccatcccatc cacaaagaaa ccgacatttt tatcataaat cactagtccc gggtacccaa 2040
gtttgtacaa aaaagcaggc tggtacctgg tgcttaaaca ctctggtgag ttctagtact 2100
tctgctatga tcgatctcat taccatttct taaatttctc tccctaaata ttccgagttc 2160
ttgatttttg ataacttcag gttttctctt tttgataaat ctggtctttc catttttttt 2220
tttttgtggt taatttagtt tcctatgttc ttcgattgta ttatgcatga tctgtgtttg 2280
gattctgtta gattatgtat tggtgaatat gtatgtgttt ttgcatgtct ggttttggtc 2340
ttaaaaatgt tcaaatctga tgatttgatt gaagcttttt tagtgttggt ttgattcttc 2400
tcaaaactac tgttaattta ctatcatgtt ttccaacttt gattcatgat gacacttttg 2460
ttctgctttg ttataaaatt ttggttggtt tgattttgta attatagtgt aattttgtta 2520
ggaatgaaca tgttttaata ctctgttttc gatttgtcac acattcgaat tattaatcga 2580
taatttaact gaaaattcat ggttctagat cttgttgtca tcagattatt tgtttcgata 2640
attcatcaaa tatgtagtcc ttttgctgat ttgcgactgt ttcatttttt ctcaaaattg 2700
ttttttgtta agtttatcta acagttatcg ttgtcaaaag tctctttcat tttgcaaaat 2760
cttctttttt tttttgtttg taactttgtt ttttaagcta cacatttagt ctgtaaaata 2820
gcatcgagga acagttgtct tagtagactt gcatgttctt gtaacttcta tttgtttcag 2880
tttgttgatg actgctttga ttttgtaggt caaaccatgg aagacgccaa aaacataaag 2940
aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca actgcataag 3000
gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc acatatcgag 3060
gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga agctatgaaa 3120
cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc tcttcaattc 3180
tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc gaacgacatt 3240
tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt ggtgttcgtt 3300
tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat catccaaaaa 3360
attattatca tggattctaa aacggattac cagggatttc agtcgatgta cacgttcgtc 3420
acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc cttcgatagg 3480
gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc taaaggtgtc 3540
gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccagagatcc tatttttggc 3600
aatcaaatca ttccggatac tgcgatttta agtgttgttc cattccatca cggttttgga 3660
atgtttacta cactcggata tttgatatgt ggatttcgag tcgtcttaat gtatagattt 3720
gaagaagagc tgtttctgag gagccttcag gattacaaga ttcaaagtgc gctgctggtg 3780
ccaaccctat tctccttctt cgccaaaagc actctgattg acaaatacga tttatctaat 3840
ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg aagtcgggga agcggttgcc 3900
aagaggttcc atctgccagg tatcaggcaa ggatatgggc tcactgagac tacatcagct 3960
attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt tgttccattt 4020
tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa tcaaagaggc 4080
gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc ggaagcgacc 4140
aacgccttga ttgacaagga tggatggcta cattctggag acatagctta ctgggacgaa 4200
gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa aggctatcag 4260
gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt cgacgcaggt 4320
gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt tgttttggag 4380
cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca agtaacaacc 4440
gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg tcttaccgga 4500
aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg cggaaagatc 4560
gccgtgtaac tcgagcatat gggctcgaat ttccccgatc gttcaaacat ttggcaataa 4620
agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 4680
aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 4740
tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 4800
gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatcg ggaattcaag 4860
cttggcgtaa tcatggaccc agctttcttg tacaaagtgg ggtaccaatt cgaatccaaa 4920
aattacggat atgaatatag gcatatccgt atccgaatta tccgtttgac agctagcaac 4980
gattgtacaa ttgcttcttt aaaaaaggaa gaaagaaaga aagaaaagaa tcaacatcag 5040
cgttaacaaa cggccccgtt acggcccaaa cggtcatata gagtaacggc gttaagcgtt 5100
gaaagactcc tatcgaaata cgtaaccgca aacgtgtcat agtcagatcc cctcttcctt 5160
caccgcctca aacacaaaaa taatcttcta cagcctatat atacaacccc cccttctatc 5220
tctcctttct cacaattcat catctttctt tctctacccc caattttaag aaatcctctc 5280
ttctcctctt cattttcaag gtaaatctct ctctctctct ctctctctgt tattccttgt 5340
tttaattagg tatgtattat tgctagtttg ttaatctgct tatcttatgt atgccttatg 5400
tgaatatctt tatcttgttc atctcatccg tttagaagct ataaatttgt tgatttgact 5460
gtgtatctac acgtggttat gtttatatct aatcagatat gaatttcttc atattgttgc 5520
gtttgtgtgt accaatccga aatcgttgat ttttttcatt taatcgtgta gctaattgta 5580
cgtatacata tggatctacg tatcaattgt tcatctgttt gtgtttgtat gtatacagat 5640
ctgaaaacat cacttctctc atctgattgt gttgttacat acatagatat agatctgtta 5700
tatcattttt tttattaatt gtgtatatat atatgtgcat agatctggat tacatgattg 5760
tgattattta catgattttg ttatttacgt atgtatatat gtagatctgg actttttgga 5820
gttgttgact tgattgtatt tgtgtgtgta tatgtgtgtt ctgatcttga tatgttatgt 5880
atgtgcagct gaaccatggc ggcggcaaca acaacaacaa caacatcttc ttcgatctcc 5940
ttctccacca aaccatctcc ttcctcctcc aaatcaccat taccaatctc cagattctcc 6000
ctcccattct ccctaaaccc caacaaatca tcctcctcct cccgccgccg cggtatcaaa 6060
tccagctctc cctcctccat ctccgccgtg ctcaacacaa ccaccaatgt cacaaccact 6120
ccctctccaa ccaaacctac caaacccgaa acattcatct cccgattcgc tccagatcaa 6180
ccccgcaaag gcgctgatat cctcgtcgaa gctttagaac gtcaaggcgt agaaaccgta 6240
ttcgcttacc ctggaggtac atcaatggag attcaccaag ccttaacccg ctcttcctca 6300
atccgtaacg tccttcctcg tcacgaacaa ggaggtgtat tcgcagcaga aggatacgct 6360
cgatcctcag gtaaaccagg tatctgtata gccacttcag gtcccggagc tacaaatctc 6420
gttagcggat tagccgatgc gttgttagat agtgttcctc ttgtagcaat cacaggacaa 6480
gtccctcgtc gtatgattgg tacagatgcg tttcaagaga ctccgattgt tgaggtaacg 6540
cgttcgatta cgaagcataa ctatcttgtg atggatgttg aagatatccc taggattatt 6600
gaggaagctt tctttttagc tacttctggt agacctggac ctgttttggt tgatgttcct 6660
aaagatattc aacaacagct tgcgattcct aattgggaac aggctatgag attacctggt 6720
tatatgtcta ggatgcctaa acctccggaa gattctcatt tggagcagat tgttaggttg 6780
atttctgagt ctaagaagcc tgtgttgtat gttggtggtg gttgtttgaa ttctagcgat 6840
gaattgggta ggtttgttga gcttacgggg atccctgttg cgagtacgtt gatggggctg 6900
ggatcttatc cttgtgatga tgagttgtcg ttacatatgc ttggaatgca tgggactgtg 6960
tatgcaaatt acgctgtgga gcatagtgat ttgttgttgg cgtttggggt aaggtttgat 7020
gatcgtgtca cgggtaagct tgaggctttt gctagtaggg ctaagattgt tcatattgat 7080
attgactcgg ctgagattgg gaagaataag actcctcatg tgtctgtgtg tggtgatgtt 7140
aagctggctt tgcaagggat gaataaggtt cttgagaacc gagcggagga gcttaagctt 7200
gattttggag tttggaggaa tgagttgaac gtacagaaac agaagtttcc gttgagcttt 7260
aagacgtttg gggaagctat tcctccacag tatgcgatta aggtccttga tgagttgact 7320
gatggaaaag ccataataag tactggtgtc gggcaacatc aaatgtgggc ggcgcagttc 7380
tacaattaca agaaaccaag gcagtggcta tcatcaggag gccttggagc tatgggattt 7440
ggacttcctg ctgcgattgg agcgtctgtt gctaaccctg atgcgatagt tgtggatatt 7500
gacggagatg gaagctttat aatgaatgtg caagagctag ccactattcg tgtagagaat 7560
cttccagtga aggtactttt attaaacaac cagcatcttg gcatggttat gcaatgggaa 7620
gatcggttct acaaagctaa ccgagctcac acatttctcg gggatccggc tcaggaggac 7680
gagatattcc cgaacatgtt gctgtttgca gcagcttgcg ggattccagc ggcgagggtg 7740
acaaagaaag cagatctccg agaagctatt cagacaatgc tggatacacc aggaccttac 7800
ctgttggatg tgatttgtcc gcaccaagaa catgtgttgc cgatgatccc gaatggtggc 7860
actttcaacg atgtcataac ggaaggagat ggccggatta aatactgaga gatgaaaccg 7920
gtgattatca gaacctttta tggtctttgt atgcatatgg taaaaaaact tagtttgcaa 7980
tttcctgttt gttttggtaa tttgagtttc ttttagttgt tgatctgcct gctttttggt 8040
ttacgtcaga ctactactgc tgttgttgtt tggtttcctt tctttcattt tataaataaa 8100
taatccggtt cggtttactc cttgtgactg gctcagtttg gttattgcga aatgcgaatg 8160
gtaaattgag taattgaaat tcgttattag ggttctaagc tgttttaaca gtcactgggt 8220
taatatctct cgaatcttgc atggaaaatg ctcttaccat tggtttttaa ttgaaatgtg 8280
ctcatatggg ccgtggtttc caaattaaat aaaactacga tgtcatcgag aagtaaaatc 8340
aactgtgtcc acattatcag ttttgtgtat acgatgaaat agggtaattc aaaatctagc 8400
ttgatatgcc ttttggttca ttttaacctt ctgtaaacat tttttcagat tttgaacaag 8460
taaatccaaa aaaaaaaaaa aaaaatctca actcaacact aaattatttt aatgtataaa 8520
agatgcttaa aacatttggc ttaaaagaaa gaagctaaaa acatagagaa ctcttgtaaa 8580
ttgaagtatg aaaatatact gaattgggta ttatatgaat ttttctgatt taggattcac 8640
atgatccaaa aaggaaatcc agaagcacta atcagacatt ggaagtagga atatttcaaa 8700
aagttttttt tttttaagta agtgacaaaa gcttttaaaa aatagaaaag aaactagtat 8760
taaagttgta aatttaataa acaaaagaaa ttttttatat tttttcattt ctttttccag 8820
catgaggtta tgatggcagg atgtggattt catttttttc cttttgatag ccttttaatt 8880
gatctattat aattgacgaa aaaatattag ttaattatag atatatttta ggtagtatta 8940
gcaatttaca cttccaaaag actatgtaag ttgtaaatat gatgcgttga tctcttcatc 9000
attcaatggt tagtcaaaaa aataaaagct taactagtaa actaaagtag tcaaaaattg 9060
tactttagtt taaaatatta catgaataat ccaaaacgac atttatgtga aacaaaaaca 9120
atatctagag tcgacttaat taaactagtg gcgcgccaat tgactagtag gcctatcgat 9180
taattaaggc cgcctcgagc atatgggcat gcaagcttgg cgtaatcatg gcaactttat 9240
tatacatagt tgataattca ctggccggat ctgcttggta ataattgtca ttagattgtt 9300
tttatgcata gatgcactcg aaatcagcca attttagaca agtatcaaac ggatgttaat 9360
tcagtacatt aaagacgtcc gcaatgtgtt attaagttgt ctaagcgtca atttgtttac 9420
accacaatat atcctgccac cagccagcca acagctcccc gaccggcagc tcggcacaaa 9480
atcaccacgc gttaccacca cgccggccgg ccgcatggtg ttgaccgtgt tcgccggcat 9540
tgccgagttc gagcgttccc taatcatcga ccgcacccgg agcgggcgcg aggccgccaa 9600
ggcccgaggc gtgaagtttg gcccccgccc taccctcacc ccggcacaga tcgcgcacgc 9660
ccgcgagctg atcgaccagg aaggccgcac cgtgaaagag gcggctgcac tgcttggcgt 9720
gcatcgctcg accctgtacc gcgcacttga gcgcagcgag gaagtgacgc ccaccgaggc 9780
caggcggcgc ggtgccttcc gtgaggacgc attgaccgag gccgacgccc tggcggccgc 9840
cgagaatgaa cgccaagagg aacaagcatg aaaccgcacc aggacggcca ggacgaaccg 9900
tttttcatta ccgaagagat cgaggcggag atgatcgcgg ccgggtacgt gttcgagccg 9960
cccgcgcacg tctcaaccgt gcggctgcat gaaatcctgg ccggtttgtc tgatgccaag 10020
ctggcggcct ggccggccag cttggccgct gaagaaaccg agcgccgccg tctaaaaagg 10080
tgatgtgtat ttgagtaaaa cagcttgcgt catgcggtcg ctgcgtatat gatgcgatga 10140
gtaaataaac aaatacgcaa ggggaacgca tgaaggttat cgctgtactt aaccagaaag 10200
gcgggtcagg caagacgacc atcgcaaccc atctagcccg cgccctgcaa ctcgccgggg 10260
ccgatgttct gttagtcgat tccgatcccc agggcagtgc ccgcgattgg gcggccgtgc 10320
gggaagatca accgctaacc gttgtcggca tcgaccgccc gacgattgac cgcgacgtga 10380
aggccatcgg ccggcgcgac ttcgtagtga tcgacggagc gccccaggcg gcggacttgg 10440
ctgtgtccgc gatcaaggca gccgacttcg tgctgattcc ggtgcagcca agcccttacg 10500
acatatgggc caccgccgac ctggtggagc tggttaagca gcgcattgag gtcacggatg 10560
gaaggctaca agcggccttt gtcgtgtcgc gggcgatcaa aggcacgcgc atcggcggtg 10620
aggttgccga ggcgctggcc gggtacgagc tgcccattct tgagtcccgt atcacgcagc 10680
gcgtgagcta cccaggcact gccgccgccg gcacaaccgt tcttgaatca gaacccgagg 10740
gcgacgctgc ccgcgaggtc caggcgctgg ccgctgaaat taaatcaaaa ctcatttgag 10800
ttaatgaggt aaagagaaaa tgagcaaaag cacaaacacg ctaagtgccg gccgtccgag 10860
cgcacgcagc agcaaggctg caacgttggc cagcctggca gacacgccag ccatgaagcg 10920
ggtcaacttt cagttgccgg cggaggatca caccaagctg aagatgtacg cggtacgcca 10980
aggcaagacc attaccgagc tgctatctga atacatcgcg cagctaccag agtaaatgag 11040
caaatgaata aatgagtaga tgaattttag cggctaaagg aggcggcatg gaaaatcaag 11100
aacaaccagg caccgacgcc gtggaatgcc ccatgtgtgg aggaacgggc ggttggccag 11160
gcgtaagcgg ctgggttgtc tgccggccct gcaatggcac tggaaccccc aagcccgagg 11220
aatcggcgtg agcggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga 11280
tgacctggtg gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga 11340
agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca 11400
accgccggca gccggtgcgc cgtcgattag gaagccgccc aagggcgacg agcaaccaga 11460
ttttttcgtt ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt 11520
ggccgttttc cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct 11580
tccagacggg cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta 11640
cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg 11700
gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg 11760
ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa 11820
caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt 11880
atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc 11940
ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa 12000
cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt 12060
tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac 12120
gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa 12180
gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg 12240
cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta 12300
atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct 12360
ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc 12420
gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat 12480
aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa 12540
aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc 12600
gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc 12660
cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc 12720
cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg 12780
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 12840
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 12900
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 12960
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 13020
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 13080
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 13140
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 13200
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 13260
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 13320
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 13380
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 13440
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 13500
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 13560
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 13620
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 13680
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 13740
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 13800
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 13860
gaacgaaaac tcacgttaag ggattttggt catgcatgat atatctccca atttgtgtag 13920
ggcttattat gcacgcttaa aaataataaa agcagacttg acctgatagt ttggctgtga 13980
gcaattatgt gcttagtgca tctaacgctt gagttaagcc gcgccgcgaa gcggcgtcgg 14040
cttgaacgaa tttctagcta gacattattt gccgactacc ttggtgatct cgcctttcac 14100
gtagtggaca aattcttcca actgatctgc gcgcgaggcc aagcgatctt cttcttgtcc 14160
aagataagcc tgtctagctt caagtatgac gggctgatac tgggccggca ggcgctccat 14220
tgcccagtcg gcagcgacat ccttcggcgc gattttgccg gttactgcgc tgtaccaaat 14280
gcgggacaac gtaagcacta catttcgctc atcgccagcc cagtcgggcg gcgagttcca 14340
tagcgttaag gtttcattta gcgcctcaaa tagatcctgt tcaggaaccg gatcaaagag 14400
ttcctccgcc gctggaccta ccaaggcaac gctatgttct cttgcttttg tcagcaagat 14460
agccagatca atgtcgatcg tggctggctc gaagatacct gcaagaatgt cattgcgctg 14520
ccattctcca aattgcagtt cgcgcttagc tggataacgc cacggaatga tgtcgtcgtg 14580
cacaacaatg gtgacttcta cagcgcggag aatctcgctc tctccagggg aagccgaagt 14640
ttccaaaagg tcgttgatca aagctcgccg cgttgtttca tcaagcctta cggtcaccgt 14700
aaccagcaaa tcaatatcac tgtgtggctt caggccgcca tccactgcgg agccgtacaa 14760
atgtacggcc agcaacgtcg gttcgagatg gcgctcgatg acgccaacta cctctgatag 14820
ttgagtcgat acttcggcga tcaccgcttc ccccatgatg tttaactttg ttttagggcg 14880
actgccctgc tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta 14940
acgcgcttgc tgcttggatg cccgaggcat agactgtacc ccaaaaaaac agtcataaca 15000
agccatgaaa accgccactg cgttccatg 15029
<210> 68
<211> 38
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 68
aataatggcg cgcctggtgc ttaaacactc tggtgagt 38
<210> 69
<211> 40
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 69
aataatggcg cgcctttgac ctacaaaatc aaagcagtca 40
<210> 70
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 70
ttttttggcg cgccagttct ttgctttcga agttgc 36
<210> 71
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 71
ttttttggcg cgcctactac gtactgtttt caattct 37
<210> 72
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 72
aataaaggcg cgccgtccag aattttctcc attga 35
<210> 73
<211> 36
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 73
aataaaggcg cgcctcttca ctatccaaag ctctca 36
<210> 74
<211> 39
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 74
ttttatggcg cgcctagctt aatctcagat tcgaatcgt 39
<210> 75
<211> 42
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 75
ttttatggcg cgcctagtat ctacatacca atcatacaaa tg 42
<210> 76
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 76
ttttttggcg cgcctttcac gatttggaat ttga 34
<210> 77
<211> 38
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 77
ttttttggcg cgcctctaca acattaaaac gaccatta 38
<210> 78
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 78
tatataggcg cgccagggtt tcgtttttgt ttca 34
<210> 79
<211> 37
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 79
tatataggcg cgccttatct cctgctcaaa gaaacca 37
<210> 80
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 80
tatataggcg cgccactgtt taagcttcac tgtct 35
<210> 81
<211> 34
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 81
tatataggcg cgcctttctt ctaaagctga aagt 34
<210> 82
<211> 14495
<212> DNA
<213> 人工的
<220>
<223> 载体序列
<400> 82
gtgattttgt gccgagctgc cggtcgggga gctgttggct ggctggtggc aggatatatt 60
gtggtgtaaa caaattgacg cttagacaac ttaataacac attgcggacg tctttaatgt 120
actgaattta gttactgatc actgattaag tactgatatc ggtaccaagc ttccgcggct 180
gcagtgcagc gtgacccggt cgtgcccctc tctagagata atgagcattg catgtctaag 240
ttataaaaaa ttaccacata ttttttttgt cacacttgtt tgaagtgcag tttatctatc 300
tttatacata tatttaaact ttactctacg aataatataa tctatagtac tacaataata 360
tcagtgtttt agagaatcat ataaatgaac agttagacat ggtctaaagg acaattgagt 420
attttgacaa caggactcta cagttttatc tttttagtgt gcatgtgttc tccttttttt 480
ttgcaaatag cttcacctat ataatacttc atccatttta ttagtacatc catttagggt 540
ttagggttaa tggtttttat agactaattt ttttagtaca tctattttat tctattttag 600
cctctaaatt aagaaaacta aaactctatt ttagtttttt tatttaatag tttagatata 660
aaatagaata aaataaagtg actaaaaatt aaacaaatac cctttaagaa attaaaaaaa 720
ctaaggaaac atttttcttg tttcgagtag ataatgccag cctgttaaac gccgtcgacg 780
agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt cgggccaagc gaagcagacg 840
gcacggcatc tctgtcgctg cctctggacc cctctcgaga gttccgctcc accgttggac 900
ttgctccgct gtcggcatcc agaaattgcg tggcggagcg gcagacgtga gccggcacgg 960
caggcggcct cctcctcctc tcacggcacc ggcagctacg ggggattcct ttcccaccgc 1020
tccttcgctt tcccttcctc gcccgccgta ataaatagac accccctcca caccctcttt 1080
ccccaacctc gtgttgttcg gagcgcacac acacacaacc agatctcccc caaatccacc 1140
cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc cctctctacc 1200
ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt ctgttcatgt 1260
ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca cggatgcgac 1320
ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg ggaatcctgg 1380
gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt ttcgttgcat 1440
agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc 1500
atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc 1560
tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt tggatctgta 1620
tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa atatcgatct 1680
aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat gctttttgtt 1740
cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta gatcggagta 1800
gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg tgtgtgtcat 1860
acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat aggtatacat 1920
gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct attcatatgc 1980
tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt atttcgatct 2040
tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta gccctgcctt 2100
catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct gttgtttggt 2160
gttacttctg cagcccgggg gatccactag ttctagaaac catggccacc gccgccgccg 2220
cgtctaccgc gctcactggc gccactaccg ctgcgcccaa ggcgaggcgc cgggcgcacc 2280
tcctggccac ccgccgcgcc ctcgccgcgc ccatcaggtg ctcagcggcg tcacccgcca 2340
tgccgatggc tcccccggcc accccgctcc ggccgtgggg ccccaccgat ccccgcaagg 2400
gcgccgacat cctcgtcgag tccctcgagc gctgcggcgt ccgcgacgtc ttcgcctacc 2460
ccggcggcac gtccatggag atccaccagg cactcacccg ctcccccgtc atcgccaacc 2520
acctcttccg ccacgagcaa ggggaggcct ttgcggcctc cggctacgcg cgctcctcgg 2580
gccgcgtcgg cgtctgcatc gccacctccg gccccggcgc caccaacctt gtctccgcgc 2640
tcgccgacgc gctgctcgat tccgtcccca tggtcgccat cacgggacag gtgccgcgac 2700
gcatgattgg caccgacgcc ttccaggaga cgcccatcgt cgaggtcacc cgctccatca 2760
ccaagcacaa ctacctggtc ctcgacgtcg acgacatccc ccgcgtcgtg caggaggctt 2820
tcttcctcgc ctcctctggt cgaccggggc cggtgcttgt cgacatcccc aaggacatcc 2880
agcagcagat ggcggtgcct gtctgggaca agcccatgag tctgcctggg tacattgcgc 2940
gccttcccaa gccccctgcg actgagttgc ttgagcaggt gctgcgtctt gttggtgaat 3000
cccggcgccc tgttctttat gttggcggtg gctgcgcagc atctggtgag gagttgcgac 3060
gctttgtgga gctgactgga atcccggtca caactactct tatgggcctc ggcaacttcc 3120
ccagcgacga cccactgtct ctgcgcatgc taggtatgca tggcacggtg tatgcaaatt 3180
atgcagtgga taaggccgat ctgttgcttg cacttggtgt gcggtttgat gatcgtgtga 3240
cagggaagat tgaggctttt gcaagcaggg ctaagattgt gcacgttgat attgatccgg 3300
ctgagattgg caagaacaag cagccacatg tgtccatctg tgcagatgtt aagcttgctt 3360
tgcagggcat gaatgctctt cttgaaggaa gcacatcaaa gaagagcttt gactttggct 3420
catggaacga tgagttggat cagcagaaga gggaattccc ccttgggtat aaaacatcta 3480
atgaggagat ccagccacaa tatgctattc aggttcttga tgagctgacg aaaggcgagg 3540
ccatcatcgg cacaggtgtt gggcagcacc agatgtgggc ggcacagtac tacacttaca 3600
agcggccaag gcagtggttg tcttcagctg gtcttggggc tatgggattt ggtttgccgg 3660
ctgctgctgg tgcttctgtg gccaacccag gtgttactgt tgttgacatc gatggagatg 3720
gtagctttct catgaacgtt caggagctag ctatgatccg aattgagaac ctcccggtga 3780
aggtctttgt gctaaacaac cagcacctgg ggatggtggt gcagtgggag gacaggttct 3840
ataaggccaa cagagcgcac acatacttgg gaaacccaga gaatgaaagt gagatatatc 3900
cagatttcgt gacgatcgcc aaagggttca acattccagc ggtccgtgtg acaaagaaga 3960
acgaagtccg cgcagcgata aagaagatgc tcgagactcc agggccgtac ctcttggata 4020
taatcgtccc acaccaggag catgtgttgc ctatgatccc taatggtggg gctttcaagg 4080
atatgatcct ggatggtgat ggcaggactg tgtactgatc taaaatccag caagcaactg 4140
atctaaaatc cagcaagcac cgcctccctg ctagtacaag ggtgatatgt ttttatctgt 4200
gtgatgttct cctgtattct atcttttttt gtaggccgtc agctatctgt tatggtaatc 4260
ctatgtagct tccgaccttg taattgtgta gtctgttgtt ttccttctgg catgtgtcat 4320
aagagatcat ttaagtgcct tttgctacat ataaataaga taataagcac tgctatgcag 4380
tggttctgaa ttggcttctg ttgccaaatt taagtgtcca actggtcctt gcttttgttt 4440
tcgctatttt tttccttttt tagttattat tatattggta atttcaactc aacatatgat 4500
gtatggaata atgctagggc tgcaatttca aactatttta caaaccagaa tggcattttc 4560
gtggtttgag gggagtgaaa aaaaatgagg catttgactg aattagttac ctgatccatt 4620
ttcgtggttt ggatcattgg aattaaattc cattctaata atagtaattt tggcatatat 4680
caattaagtt aattcggttt tatgcaaaat atatttgtat actattatta tcaagatgtc 4740
ggagatattt atatgctaca tttttactat acaggagtga gatgaagagt gtcatgtaag 4800
ttacacagta gaaacaaatt ctattaatgc ataaaatcat ttccatcatc caccctatga 4860
atttgagata gacctatatc taaactttga aaagtggttg aatatcaaat tccaaattaa 4920
ataagttatt ttattgagtg aattctaatt tctctaaaac gaagggatct aaacgccctc 4980
taaagctaat ttggaaactc aaactttctt agcattggag gggattgaga aaaaatatta 5040
attcattttc atctcaatca ttcaatctcc aaagagattt gagttcctta ttagtctgtt 5100
ccatgcatca aatcggctca atgtgtcatt atttgccatg acgattgacg agttgttctg 5160
gggcctagcg ctttccacgc cgatgtgctg gggcctggtc ctggagaaga cagcttgata 5220
tttaaagcta tcaattgttt caattgattc ccacttcatt tttctaaatg tagaaaacgg 5280
tgacgtataa gaaaaagaat gaattaggac ttttattccg tacactaatc tagagcggcc 5340
caagcttgta cactagtacg cgtcaattga tttaaattta attaatcccg tgtccgtcaa 5400
tgtgatacta ctagcatagt actagtacca tgcatacaca cagcaggtcg gccgcctgga 5460
tggatcgatg atgatactac atcatcctgt catccatcca ggcgatctag aaggggcgtg 5520
gctagctagc aaactgtgac cggtttttct acgccgataa taatactttg tcatggtaca 5580
gacgtacagt actggttata tatatctgta gatttcaact gaaaagctag gatagctaga 5640
ttaattcctg agaaacacag ataaaattcg agcttggcta tagatgacaa aacggaagac 5700
gcatgcattg gacgacgtat gcaatgcgag cgcgtctcgt gtcgtcccgt ccaagtctgg 5760
cgatctcacg ccacgtgctc aacagctcaa ggactgttcg tcaccagcgt taaattcatt 5820
gaagggatga cgcatttcgg catttgtcat tgcttgtagc tatatatata tatccaacag 5880
atttctctca agcttttgta tgcgtgaatg taaagtctag cttatacgac agcacgtgca 5940
gatatattaa cgtcattatt aggtggagag caagatgcat gatctggtag aaattgtcga 6000
aaacacaaga gagagtgaag tgcacacttc tggtatagga gtgtatacgc cgctggttgg 6060
tgggcaatgc gcgccgcaat attggccaat gaaacctagc aacgcccact cgccacgccc 6120
catgaatggc ccccgcacgg cagcgagcca gccagtgccc gcgcgcggcc cagccggagt 6180
cggcggaacg cgccacgggg gacgaggcgc ccgagggccg aggcagcgcg gcatggcaag 6240
caagccgaag cgggcaagcg acctgcatgc agcccctgcc cctcgccctc gtcagtcgtc 6300
ccagcctccc actggaatcc acccaacccg cccttcctct ccaaagcacg cgccccgcga 6360
ctcgcctccg cctacgtgtc ggcagcgtcc ccgccggtcg cccacgtacc ccgccccgtt 6420
ctcccacgtg cccctccctc tgcgcgcgtc cgattggctg acccgccctt cttaagccgc 6480
gccagcctcc tgtccgggcc ccaacgccgt gctccgtcgt cgtctccgcc cccagagtga 6540
tcgagcccac tgacctggcc cccgagcctc agctcgtgag tccggcgcgc ctggtgctta 6600
aacactctgg tgagttctag tacttctgct atgatcgatc tcattaccat ttcttaaatt 6660
tctctcccta aatattccga gttcttgatt tttgataact tcaggttttc tctttttgat 6720
aaatctggtc tttccatttt tttttttttg tggttaattt agtttcctat gttcttcgat 6780
tgtattatgc atgatctgtg tttggattct gttagattat gtattggtga atatgtatgt 6840
gtttttgcat gtctggtttt ggtcttaaaa atgttcaaat ctgatgattt gattgaagct 6900
tttttagtgt tggtttgatt cttctcaaaa ctactgttaa tttactatca tgttttccaa 6960
ctttgattca tgatgacact tttgttctgc tttgttataa aattttggtt ggtttgattt 7020
tgtaattata gtgtaatttt gttaggaatg aacatgtttt aatactctgt tttcgatttg 7080
tcacacattc gaattattaa tcgataattt aactgaaaat tcatggttct agatcttgtt 7140
gtcatcagat tatttgtttc gataattcat caaatatgta gtccttttgc tgatttgcga 7200
ctgtttcatt ttttctcaaa attgtttttt gttaagttta tctaacagtt atcgttgtca 7260
aaagtctctt tcattttgca aaatcttctt tttttttttg tttgtaactt tgttttttaa 7320
gctacacatt tagtctgtaa aatagcatcg aggaacagtt gtcttagtag acttgcatgt 7380
tcttgtaact tctatttgtt tcagtttgtt gatgactgct ttgattttgt aggtcaaagg 7440
cgcgccggat ccccgggtgg tcagtccctt atgttacgtc ctgtagaaac cccaacccgt 7500
gaaatcaaaa aactcgacgg cctgtgggca ttcagtctgg atcgcgaaaa ctgtggaatt 7560
gatcagcgtt ggtgggaaag cgcgttacaa gaaagccggg caattgctgt gccaggcagt 7620
tttaacgatc agttcgccga tgcagatatt cgtaattatg cgggcaacgt ctggtatcag 7680
cgcgaagtct ttataccgaa aggttgggca ggccagcgta tcgtgctgcg tttcgatgcg 7740
gtcactcatt acggcaaagt gtgggtcaat aatcaggaag tgatggagca tcagggcggc 7800
tatacgccat ttgaagccga tgtcacgccg tatgttattg ccgggaaaag tgtacgtaag 7860
tttctgcttc tacctttgat atatatataa taattatcat taattagtag taatataata 7920
tttcaaatat ttttttcaaa ataaaagaat gtagtatata gcaattgctt ttctgtagtt 7980
tataagtgtg tatattttaa tttataactt ttctaatata tgaccaaaat ttgttgatgt 8040
gcaggtatca ccgtttgtgt gaacaacgaa ctgaactggc agactatccc gccgggaatg 8100
gtgattaccg acgaaaacgg caagaaaaag cagtcttact tccatgattt ctttaactat 8160
gccggaatcc atcgcagcgt aatgctctac accacgccga acacctgggt ggacgatatc 8220
accgtggtga cgcatgtcgc gcaagactgt aaccacgcgt ctgttgactg gcaggtggtg 8280
gccaatggtg atgtcagcgt tgaactgcgt gatgcggatc aacaggtggt tgcaactgga 8340
caaggcacta gcgggacttt gcaagtggtg aatccgcacc tctggcaacc gggtgaaggt 8400
tatctctatg aactgtgcgt cacagccaaa agccagacag agtgtgatat ctacccgctt 8460
cgcgtcggca tccggtcagt ggcagtgaag ggcgaacagt tcctgattaa ccacaaaccg 8520
ttctacttta ctggctttgg tcgtcatgaa gatgcggact tgcgtggcaa aggattcgat 8580
aacgtgctga tggtgcacga ccacgcatta atggactgga ttggggccaa ctcctaccgt 8640
acctcgcatt acccttacgc tgaagagatg ctcgactggg cagatgaaca tggcatcgtg 8700
gtgattgatg aaactgctgc tgtcggcttt aacctctctt taggcattgg tttcgaagcg 8760
ggcaacaagc cgaaagaact gtacagcgaa gaggcagtca acggggaaac tcagcaagcg 8820
cacttacagg cgattaaaga gctgatagcg cgtgacaaaa accacccaag cgtggtgatg 8880
tggagtattg ccaacgaacc ggatacccgt ccgcaaggtg cacgggaata tttcgcgcca 8940
ctggcggaag caacgcgtaa actcgacccg acgcgtccga tcacctgcgt caatgtaatg 9000
ttctgcgacg ctcacaccga taccatcagc gatctctttg atgtgctgtg cctgaaccgt 9060
tattacggat ggtatgtcca aagcggcgat ttggaaacgg cagagaaggt actggaaaaa 9120
gaacttctgg cctggcagga gaaactgcat cagccgatta tcatcaccga atacggcgtg 9180
gatacgttag ccgggctgca ctcaatgtac accgacatgt ggagtgaaga gtatcagtgt 9240
gcatggctgg atatgtatca ccgcgtcttt gatcgcgtca gcgccgtcgt cggtgaacag 9300
gtatggaatt tcgccgattt tgcgacctcg caaggcatat tgcgcgttgg cggtaacaag 9360
aaagggatct tcactcgcga ccgcaaaccg aagtcggcgg cttttctgct gcaaaaacgc 9420
tggactggca tgaacttcgg tgaaaaaccg cagcagggag gcaaacaatg aatcaacaac 9480
tctcctggcg caccatcgtc ggctacagcc tcgggaattg ctaccgagct cctgcaggcc 9540
taggatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 9600
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 9660
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 9720
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 9780
tctatgttac tagatcggcc ggccgtttaa acttagttac taatcagtga tcagattgtc 9840
gtttcccgcc ttcactttaa actatcagtg tttgacagga tatattggcg ggtaaaccta 9900
agagaaaaga gcgtttatta gaataatcgg atatttaaaa gggcgtgaaa aggtttatcc 9960
gttcgtccat ttgtatgtca atattggggg ggggggaaag ccacgttgtg tctcaaaatc 10020
tctgatgtta cattgcacaa gataaaaata tatcatcatg aacaataaaa ctgtctgctt 10080
acataaacag taatacaagg ggtgttcgcc accatgagcc atatccagcg tgaaacctcg 10140
tgctcccgcc cgcgcctcaa ttccaatatg gatgccgacc tttatggcta caagtgggcg 10200
cgcgacaacg tcggccagtc gggcgcgacc atttatcggc tttatggcaa acccgatgcc 10260
ccggaactgt tcctgaagca cggcaaaggc agcgtcgcaa acgatgtcac cgatgagatg 10320
gtccgcctga actggcttac cgagttcatg ccgctgccga cgattaagca tttcatccgt 10380
accccggacg atgcctggct cttgaccacg gccattccgg gcaaaacggc ctttcaggtc 10440
cttgaagagt acccggactc cggtgagaat atcgtggacg ccctcgcggt cttcctccgc 10500
cgtttgcata gcatccccgt gtgcaactgc cccttcaact cggaccgggt tttccgcctg 10560
gcacaggccc agtcgcgcat gaataacggc ctcgttgacg cgagcgattt cgacgatgaa 10620
cggaatggct ggccggtgga acaggtttgg aaggaaatgc acaaactgct tccgttctcg 10680
ccggattcgg tggtcacgca tggtgatttt tccctggata atctgatctt tgacgagggc 10740
aagctgatcg gctgcatcga cgtgggtcgc gtcggtatcg ccgaccgcta tcaggacctg 10800
gcgatcttgt ggaattgcct cggcgagttc tcgccctcgc tccagaagcg cctgttccag 10860
aagtacggca tcgacaaccc ggatatgaac aagctccagt tccacctcat gctggacgaa 10920
tttttttgaa cagaattggt taattggttg taacactggc agagcattac gctgacttga 10980
cgggacggcg gctttgttga ataaatcgaa cttttgctga gttgaaggat cgatgagttg 11040
aaggaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 11100
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 11160
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 11220
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 11280
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 11340
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 11400
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 11460
gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 11520
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 11580
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 11640
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 11700
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 11760
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 11820
tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc 11880
ggtatttcac accgcatagg ccgcgatagg ccgacgcgaa gcggcggggc gtagggagcg 11940
cagcgaccga agggtaggcg ctttttgcag ctcttcggct gtgcgctggc cagacagtta 12000
tgcacaggcc aggcgggttt taagagtttt aataagtttt aaagagtttt aggcggaaaa 12060
atcgcctttt ttctctttta tatcagtcac ttacatgtgt gaccggttcc caatgtacgg 12120
ctttgggttc ccaatgtacg ggttccggtt cccaatgtac ggctttgggt tcccaatgta 12180
cgtgctatcc acaggaaaga gaccttttcg acctttttcc cctgctaggg caatttgccc 12240
tagcatctgc tccgtacatt aggaaccggc ggatgcttcg ccctcgatca ggttgcggta 12300
gcgcatgact aggatcgggc cagcctgccc cgcctcctcc ttcaaatcgt actccggcag 12360
gtcatttgac ccgatcagct tgcgcacggt gaaacagaac ttcttgaact ctccggcgct 12420
gccactgcgt tcgtagatcg tcttgaacaa ccatctggct tctgccttgc ctgcggcgcg 12480
gcgtgccagg cggtagagaa aacggccgat gccggggtcg atcaaaaagt aatcggggtg 12540
aaccgtcagc acgtccgggt tcttgccttc tgtgatctcg cggtacatcc aatcagcaag 12600
ctcgatctcg atgtactccg gccgcccggt ttcgctcttt acgatcttgt agcggctaat 12660
caaggcttca ccctcggata ccgtcaccag gcggccgttc ttggccttct tggtacgctg 12720
catggcaacg tgcgtggtgt ttaaccgaat gcaggtttct accaggtcgt ctttctgctt 12780
tccgccatcg gctcgccggc agaacttgag tacgtccgca acgtgtggac ggaacacgcg 12840
gccgggcttg tctcccttcc cttcccggta tcggttcatg gattcggtta gatgggaaac 12900
cgccatcagt accaggtcgt aatcccacac actggccatg ccggcggggc ctgcggaaac 12960
ctctacgtgc ccgtctggaa gctcgtagcg gatcacctcg ccagctcgtc ggtcacgctt 13020
cgacagacgg aaaacggcca cgtccatgat gctgcgacta tcgcgggtgc ccacgtcata 13080
gagcatcgga acgaaaaaat ctggttgctc gtcgcccttg ggcggcttcc taatcgacgg 13140
cgcaccggct gccggcggtt gccgggattc tttgcggatt cgatcagcgg ccccttgcca 13200
cgattcaccg gggcgtgctt ctgcctcgat gcgttgccgc tgggcggcct gcgcggcctt 13260
caacttctcc accaggtcat cacccagcgc cgcgccgatt tgtaccgggc cggatggttt 13320
gcgaccgctc acgccgattc ctcgggcttg ggggttccag tgccattgca gggccggcag 13380
acaacccagc cgcttacgcc tggccaaccg cccgttcctc cacacatggg gcattccacg 13440
gcgtcggtgc ctggttgttc ttgattttcc atgccgcctc ctttagccgc taaaattcat 13500
ctactcattt attcatttgc tcatttactc tggtagctgc gcgatgtatt cagatagcag 13560
ctcggtaatg gtcttgcctt ggcgtaccgc gtacatcttc agcttggtgt gatcctccgc 13620
cggcaactga aagttgaccc gcttcatggc tggcgtgtct gccaggctgg ccaacgttgc 13680
agccttgctg ctgcgtgcgc tcggacggcc ggcacttagc gtgtttgtgc ttttgctcat 13740
tttctcttta cctcattaac tcaaatgagt tttgatttaa tttcagcggc cagcgcctgg 13800
acctcgcggg cagcgtcgcc ctcgggttct gattcaagaa cggttgtgcc ggcggcggca 13860
gtgcctgggt agctcacgcg ctgcgtgata cgggactcaa gaatgggcag ctcgtacccg 13920
gccagcgcct cggcaacctc accgccgatg cgcgtgcctt tgatcgcccg cgacacgaca 13980
aaggccgctt gtagccttcc atccgtgacc tcaatgcgct gcttaaccag ctccaccagg 14040
tcggcggtgg cccaaatgtc gtaagggctt ggctgcaccg gaatcagcac gaagtcggct 14100
gccttgatcg cggacacagc caagtccgcc gcctggggcg ctccgtcgat cactacgaag 14160
tcgcgccggc cgatggcctt cacgtcgcgg tcaatcgtcg ggcggtcgat gccgacaacg 14220
gttagcggtt gatcttcccg cacggccgcc caatcgcggg cactgccctg gggatcggaa 14280
tcgactaaca gaacatcggc cccggcgagt tgcagggcgc gggctagatg ggttgcgatg 14340
gtcgtcttgc ctgacccgcc tttctggtta agtacagcga taaccttcat gcgttcccct 14400
tgcgtatttg tttatttact catcgcatca tatacgcagc gaccgcatga cgcaagctgt 14460
tttactcaaa tacacatcac ctttttagat gatca 14495
<210> 83
<211> 33
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 83
atatacgcgt ggtgcttaaa cactctggtg agt 33
<210> 84
<211> 38
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 84
atatggcgcg cctttgacct acaaaatcaa agcagtca 38
<210> 85
<211> 32
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 85
atatacgcgt agttctttgc tttcgaagtt gc 32
<210> 86
<211> 35
<212> DNA
<213> 人工的
<220>
<223> 合成的序列
<400> 86
atatggcgcg cctactacgt actgttttca attct 35
<210> 87
<211> 14065
<212> DNA
<213> 人工的
<220>
<223> 载体序列
<400> 87
gtgattttgt gccgagctgc cggtcgggga gctgttggct ggctggtggc aggatatatt 60
gtggtgtaaa caaattgacg cttagacaac ttaataacac attgcggacg tctttaatgt 120
actgaattta gttactgatc actgattaag tactgatatc ggtaccaagc ttccgcggct 180
gcagtgcagc gtgacccggt cgtgcccctc tctagagata atgagcattg catgtctaag 240
ttataaaaaa ttaccacata ttttttttgt cacacttgtt tgaagtgcag tttatctatc 300
tttatacata tatttaaact ttactctacg aataatataa tctatagtac tacaataata 360
tcagtgtttt agagaatcat ataaatgaac agttagacat ggtctaaagg acaattgagt 420
attttgacaa caggactcta cagttttatc tttttagtgt gcatgtgttc tccttttttt 480
ttgcaaatag cttcacctat ataatacttc atccatttta ttagtacatc catttagggt 540
ttagggttaa tggtttttat agactaattt ttttagtaca tctattttat tctattttag 600
cctctaaatt aagaaaacta aaactctatt ttagtttttt tatttaatag tttagatata 660
aaatagaata aaataaagtg actaaaaatt aaacaaatac cctttaagaa attaaaaaaa 720
ctaaggaaac atttttcttg tttcgagtag ataatgccag cctgttaaac gccgtcgacg 780
agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt cgggccaagc gaagcagacg 840
gcacggcatc tctgtcgctg cctctggacc cctctcgaga gttccgctcc accgttggac 900
ttgctccgct gtcggcatcc agaaattgcg tggcggagcg gcagacgtga gccggcacgg 960
caggcggcct cctcctcctc tcacggcacc ggcagctacg ggggattcct ttcccaccgc 1020
tccttcgctt tcccttcctc gcccgccgta ataaatagac accccctcca caccctcttt 1080
ccccaacctc gtgttgttcg gagcgcacac acacacaacc agatctcccc caaatccacc 1140
cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc cctctctacc 1200
ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt ctgttcatgt 1260
ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca cggatgcgac 1320
ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg ggaatcctgg 1380
gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt ttcgttgcat 1440
agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc 1500
atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc 1560
tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt tggatctgta 1620
tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa atatcgatct 1680
aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat gctttttgtt 1740
cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta gatcggagta 1800
gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg tgtgtgtcat 1860
acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat aggtatacat 1920
gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct attcatatgc 1980
tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt atttcgatct 2040
tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta gccctgcctt 2100
catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct gttgtttggt 2160
gttacttctg cagcccgggg gatccactag ttctagaaac catggccacc gccgccgccg 2220
cgtctaccgc gctcactggc gccactaccg ctgcgcccaa ggcgaggcgc cgggcgcacc 2280
tcctggccac ccgccgcgcc ctcgccgcgc ccatcaggtg ctcagcggcg tcacccgcca 2340
tgccgatggc tcccccggcc accccgctcc ggccgtgggg ccccaccgat ccccgcaagg 2400
gcgccgacat cctcgtcgag tccctcgagc gctgcggcgt ccgcgacgtc ttcgcctacc 2460
ccggcggcac gtccatggag atccaccagg cactcacccg ctcccccgtc atcgccaacc 2520
acctcttccg ccacgagcaa ggggaggcct ttgcggcctc cggctacgcg cgctcctcgg 2580
gccgcgtcgg cgtctgcatc gccacctccg gccccggcgc caccaacctt gtctccgcgc 2640
tcgccgacgc gctgctcgat tccgtcccca tggtcgccat cacgggacag gtgccgcgac 2700
gcatgattgg caccgacgcc ttccaggaga cgcccatcgt cgaggtcacc cgctccatca 2760
ccaagcacaa ctacctggtc ctcgacgtcg acgacatccc ccgcgtcgtg caggaggctt 2820
tcttcctcgc ctcctctggt cgaccggggc cggtgcttgt cgacatcccc aaggacatcc 2880
agcagcagat ggcggtgcct gtctgggaca agcccatgag tctgcctggg tacattgcgc 2940
gccttcccaa gccccctgcg actgagttgc ttgagcaggt gctgcgtctt gttggtgaat 3000
cccggcgccc tgttctttat gttggcggtg gctgcgcagc atctggtgag gagttgcgac 3060
gctttgtgga gctgactgga atcccggtca caactactct tatgggcctc ggcaacttcc 3120
ccagcgacga cccactgtct ctgcgcatgc taggtatgca tggcacggtg tatgcaaatt 3180
atgcagtgga taaggccgat ctgttgcttg cacttggtgt gcggtttgat gatcgtgtga 3240
cagggaagat tgaggctttt gcaagcaggg ctaagattgt gcacgttgat attgatccgg 3300
ctgagattgg caagaacaag cagccacatg tgtccatctg tgcagatgtt aagcttgctt 3360
tgcagggcat gaatgctctt cttgaaggaa gcacatcaaa gaagagcttt gactttggct 3420
catggaacga tgagttggat cagcagaaga gggaattccc ccttgggtat aaaacatcta 3480
atgaggagat ccagccacaa tatgctattc aggttcttga tgagctgacg aaaggcgagg 3540
ccatcatcgg cacaggtgtt gggcagcacc agatgtgggc ggcacagtac tacacttaca 3600
agcggccaag gcagtggttg tcttcagctg gtcttggggc tatgggattt ggtttgccgg 3660
ctgctgctgg tgcttctgtg gccaacccag gtgttactgt tgttgacatc gatggagatg 3720
gtagctttct catgaacgtt caggagctag ctatgatccg aattgagaac ctcccggtga 3780
aggtctttgt gctaaacaac cagcacctgg ggatggtggt gcagtgggag gacaggttct 3840
ataaggccaa cagagcgcac acatacttgg gaaacccaga gaatgaaagt gagatatatc 3900
cagatttcgt gacgatcgcc aaagggttca acattccagc ggtccgtgtg acaaagaaga 3960
acgaagtccg cgcagcgata aagaagatgc tcgagactcc agggccgtac ctcttggata 4020
taatcgtccc acaccaggag catgtgttgc ctatgatccc taatggtggg gctttcaagg 4080
atatgatcct ggatggtgat ggcaggactg tgtactgatc taaaatccag caagcaactg 4140
atctaaaatc cagcaagcac cgcctccctg ctagtacaag ggtgatatgt ttttatctgt 4200
gtgatgttct cctgtattct atcttttttt gtaggccgtc agctatctgt tatggtaatc 4260
ctatgtagct tccgaccttg taattgtgta gtctgttgtt ttccttctgg catgtgtcat 4320
aagagatcat ttaagtgcct tttgctacat ataaataaga taataagcac tgctatgcag 4380
tggttctgaa ttggcttctg ttgccaaatt taagtgtcca actggtcctt gcttttgttt 4440
tcgctatttt tttccttttt tagttattat tatattggta atttcaactc aacatatgat 4500
gtatggaata atgctagggc tgcaatttca aactatttta caaaccagaa tggcattttc 4560
gtggtttgag gggagtgaaa aaaaatgagg catttgactg aattagttac ctgatccatt 4620
ttcgtggttt ggatcattgg aattaaattc cattctaata atagtaattt tggcatatat 4680
caattaagtt aattcggttt tatgcaaaat atatttgtat actattatta tcaagatgtc 4740
ggagatattt atatgctaca tttttactat acaggagtga gatgaagagt gtcatgtaag 4800
ttacacagta gaaacaaatt ctattaatgc ataaaatcat ttccatcatc caccctatga 4860
atttgagata gacctatatc taaactttga aaagtggttg aatatcaaat tccaaattaa 4920
ataagttatt ttattgagtg aattctaatt tctctaaaac gaagggatct aaacgccctc 4980
taaagctaat ttggaaactc aaactttctt agcattggag gggattgaga aaaaatatta 5040
attcattttc atctcaatca ttcaatctcc aaagagattt gagttcctta ttagtctgtt 5100
ccatgcatca aatcggctca atgtgtcatt atttgccatg acgattgacg agttgttctg 5160
gggcctagcg ctttccacgc cgatgtgctg gggcctggtc ctggagaaga cagcttgata 5220
tttaaagcta tcaattgttt caattgattc ccacttcatt tttctaaatg tagaaaacgg 5280
tgacgtataa gaaaaagaat gaattaggac ttttattccg tacactaatc tagagcggcc 5340
caagcttgta cactagtacg cgtcaattga tttaaattta attaatcccg tgtccgtcaa 5400
tgtgatacta ctagcatagt actagtacca tgcatacaca cagcaggtcg gccgcctgga 5460
tggatcgatg atgatactac atcatcctgt catccatcca ggcgatctag aaggggcgtg 5520
gctagctagc aaactgtgac cggtttttct acgccgataa taatactttg tcatggtaca 5580
gacgtacagt actggttata tatatctgta gatttcaact gaaaagctag gatagctaga 5640
ttaattcctg agaaacacag ataaaattcg agcttggcta tagatgacaa aacggaagac 5700
gcatgcattg gacgacgtat gcaatgcgag cgcgtctcgt gtcgtcccgt ccaagtctgg 5760
cgatctcacg ccacgtgctc aacagctcaa ggactgttcg tcaccagcgt taaattcatt 5820
gaagggatga cgcatttcgg catttgtcat tgcttgtagc tatatatata tatccaacag 5880
atttctctca agcttttgta tgcgtgaatg taaagtctag cttatacgac agcacgtgca 5940
gatatattaa cgtcattatt aggtggagag caagatgcat gatctggtag aaattgtcga 6000
aaacacaaga gagagtgaag tgcacacttc tggtatagga gtgtatacgc cgctggttgg 6060
tgggcaatgc gcgccgcaat attggccaat gaaacctagc aacgcccact cgccacgccc 6120
catgaatggc ccccgcacgg cagcgagcca gccagtgccc gcgcgcggcc cagccggagt 6180
cggcggaacg cgccacgggg gacgaggcgc ccgagggccg aggcagcgcg gcatggcaag 6240
caagccgaag cgggcaagcg acctgcatgc agcccctgcc cctcgccctc gtcagtcgtc 6300
ccagcctccc actggaatcc acccaacccg cccttcctct ccaaagcacg cgccccgcga 6360
ctcgcctccg cctacgtgtc ggcagcgtcc ccgccggtcg cccacgtacc ccgccccgtt 6420
ctcccacgtg cccctccctc tgcgcgcgtc cgattggctg acccgccctt cttaagccgc 6480
gccagcctcc tgtccgggcc ccaacgccgt gctccgtcgt cgtctccgcc cccagagtga 6540
tcgagcccac tgacctggcc cccgagcctc agctcgtgag tccggcgcgt ggtgcttaaa 6600
cactctggtg agttctagta cttctgctat gatcgatctc attaccattt cttaaatttc 6660
tctccctaaa tattccgagt tcttgatttt tgataacttc aggttttctc tttttgataa 6720
atctggtctt tccatttttt tttttttgtg gttaatttag tttcctatgt tcttcgattg 6780
tattatgcat gatctgtgtt tggattctgt tagattatgt attggtgaat atgtatgtgt 6840
ttttgcatgt ctggttttgg tcttaaaaat gttcaaatct gatgatttga ttgaagcttt 6900
tttagtgttg gtttgattct tctcaaaact actgttaatt tactatcatg ttttccaact 6960
ttgattcatg atgacacttt tgttctgctt tgttataaaa ttttggttgg tttgattttg 7020
taattatagt gtaattttgt taggaatgaa catgttttaa tactctgttt tcgatttgtc 7080
acacattcga attattaatc gataatttaa ctgaaaattc atggttctag atcttgttgt 7140
catcagatta tttgtttcga taattcatca aatatgtagt ccttttgctg atttgcgact 7200
gtttcatttt ttctcaaaat tgttttttgt taagtttatc taacagttat cgttgtcaaa 7260
agtctctttc attttgcaaa atcttctttt tttttttgtt tgtaactttg ttttttaagc 7320
tacacattta gtctgtaaaa tagcatcgag gaacagttgt cttagtagac ttgcatgttc 7380
ttgtaacttc tatttgtttc agtttgttga tgactgcttt gattttgtag gtcaaaggcg 7440
cgccaccatg gaagacgcca aaaacataaa gaaaggcccg gcgccattct atccgctgga 7500
agatggaacc gctggagagc aactgcataa ggctatgaag agatacgccc tggttcctgg 7560
aacaattgct tttacagatg cacatatcga ggtggacatc acttacgctg agtacttcga 7620
aatgtccgtt cggttggcag aagctatgaa acgatatggg ctgaatacaa atcacagaat 7680
cgtcgtatgc agtgaaaact ctcttcaatt ctttatgccg gtgttgggcg cgttatttat 7740
cggagttgca gttgcgcccg cgaacgacat ttataatgaa cgtgaattgc tcaacagtat 7800
gggcatttcg cagcctaccg tggtgttcgt ttccaaaaag gggttgcaaa aaattttgaa 7860
cgtgcaaaaa aagctcccaa tcatccaaaa aattattatc atggattcta aaacggatta 7920
ccagggattt cagtcgatgt acacgttcgt cacatctcat ctacctcccg gttttaatga 7980
atacgatttt gtgccagagt ccttcgatag ggacaagaca attgcactga tcatgaactc 8040
ctctggatct actggtctgc ctaaaggtgt cgctctgcct catagaactg cctgcgtgag 8100
attctcgcat gccagagatc ctatttttgg caatcaaatc attccggata ctgcgatttt 8160
aagtgttgtt ccattccatc acggttttgg aatgtttact acactcggat atttgatatg 8220
tggatttcga gtcgtcttaa tgtatagatt tgaagaagag ctgtttctga ggagccttca 8280
ggattacaag attcaaagtg cgctgctggt gccaacccta ttctccttct tcgccaaaag 8340
cactctgatt gacaaatacg atttatctaa tttacacgaa attgcttctg gtggcgctcc 8400
cctctctaag gaagtcgggg aagcggttgc caagaggttc catctgccag gtatcaggca 8460
aggatatggg ctcactgaga ctacatcagc tattctgatt acacccgagg gggatgataa 8520
accgggcgcg gtcggtaaag ttgttccatt ttttgaagcg aaggttgtgg atctggatac 8580
cgggaaaacg ctgggcgtta atcaaagagg cgaactgtgt gtgagaggtc ctatgattat 8640
gtccggttat gtaaacaatc cggaagcgac caacgccttg attgacaagg atggatggct 8700
acattctgga gacatagctt actgggacga agacgaacac ttcttcatcg ttgaccgcct 8760
gaagtctctg attaagtaca aaggctatca ggtggctccc gctgaattgg aatccatctt 8820
gctccaacac cccaacatct tcgacgcagg tgtcgcaggt cttcccgacg atgacgccgg 8880
tgaacttccc gccgccgttg ttgttttgga gcacggaaag acgatgacgg aaaaagagat 8940
cgtggattac gtcgccagtc aagtaacaac cgcgaaaaag ttgcgcggag gagttgtgtt 9000
tgtggacgaa gtaccgaaag gtcttaccgg aaaactcgac gcaagaaaaa tcagagagat 9060
cctcataaag gccaagaagg gcggaaagat cgccgtgtaa cctgcaggcc taggatcgtt 9120
caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 9180
tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 9240
tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 9300
aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 9360
tagatcggcc ggccgtttaa acttagttac taatcagtga tcagattgtc gtttcccgcc 9420
ttcactttaa actatcagtg tttgacagga tatattggcg ggtaaaccta agagaaaaga 9480
gcgtttatta gaataatcgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat 9540
ttgtatgtca atattggggg ggggggaaag ccacgttgtg tctcaaaatc tctgatgtta 9600
cattgcacaa gataaaaata tatcatcatg aacaataaaa ctgtctgctt acataaacag 9660
taatacaagg ggtgttcgcc accatgagcc atatccagcg tgaaacctcg tgctcccgcc 9720
cgcgcctcaa ttccaatatg gatgccgacc tttatggcta caagtgggcg cgcgacaacg 9780
tcggccagtc gggcgcgacc atttatcggc tttatggcaa acccgatgcc ccggaactgt 9840
tcctgaagca cggcaaaggc agcgtcgcaa acgatgtcac cgatgagatg gtccgcctga 9900
actggcttac cgagttcatg ccgctgccga cgattaagca tttcatccgt accccggacg 9960
atgcctggct cttgaccacg gccattccgg gcaaaacggc ctttcaggtc cttgaagagt 10020
acccggactc cggtgagaat atcgtggacg ccctcgcggt cttcctccgc cgtttgcata 10080
gcatccccgt gtgcaactgc cccttcaact cggaccgggt tttccgcctg gcacaggccc 10140
agtcgcgcat gaataacggc ctcgttgacg cgagcgattt cgacgatgaa cggaatggct 10200
ggccggtgga acaggtttgg aaggaaatgc acaaactgct tccgttctcg ccggattcgg 10260
tggtcacgca tggtgatttt tccctggata atctgatctt tgacgagggc aagctgatcg 10320
gctgcatcga cgtgggtcgc gtcggtatcg ccgaccgcta tcaggacctg gcgatcttgt 10380
ggaattgcct cggcgagttc tcgccctcgc tccagaagcg cctgttccag aagtacggca 10440
tcgacaaccc ggatatgaac aagctccagt tccacctcat gctggacgaa tttttttgaa 10500
cagaattggt taattggttg taacactggc agagcattac gctgacttga cgggacggcg 10560
gctttgttga ataaatcgaa cttttgctga gttgaaggat cgatgagttg aaggaccccg 10620
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 10680
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 10740
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 10800
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 10860
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 10920
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 10980
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 11040
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 11100
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 11160
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 11220
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 11280
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 11340
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 11400
aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 11460
accgcatagg ccgcgatagg ccgacgcgaa gcggcggggc gtagggagcg cagcgaccga 11520
agggtaggcg ctttttgcag ctcttcggct gtgcgctggc cagacagtta tgcacaggcc 11580
aggcgggttt taagagtttt aataagtttt aaagagtttt aggcggaaaa atcgcctttt 11640
ttctctttta tatcagtcac ttacatgtgt gaccggttcc caatgtacgg ctttgggttc 11700
ccaatgtacg ggttccggtt cccaatgtac ggctttgggt tcccaatgta cgtgctatcc 11760
acaggaaaga gaccttttcg acctttttcc cctgctaggg caatttgccc tagcatctgc 11820
tccgtacatt aggaaccggc ggatgcttcg ccctcgatca ggttgcggta gcgcatgact 11880
aggatcgggc cagcctgccc cgcctcctcc ttcaaatcgt actccggcag gtcatttgac 11940
ccgatcagct tgcgcacggt gaaacagaac ttcttgaact ctccggcgct gccactgcgt 12000
tcgtagatcg tcttgaacaa ccatctggct tctgccttgc ctgcggcgcg gcgtgccagg 12060
cggtagagaa aacggccgat gccggggtcg atcaaaaagt aatcggggtg aaccgtcagc 12120
acgtccgggt tcttgccttc tgtgatctcg cggtacatcc aatcagcaag ctcgatctcg 12180
atgtactccg gccgcccggt ttcgctcttt acgatcttgt agcggctaat caaggcttca 12240
ccctcggata ccgtcaccag gcggccgttc ttggccttct tggtacgctg catggcaacg 12300
tgcgtggtgt ttaaccgaat gcaggtttct accaggtcgt ctttctgctt tccgccatcg 12360
gctcgccggc agaacttgag tacgtccgca acgtgtggac ggaacacgcg gccgggcttg 12420
tctcccttcc cttcccggta tcggttcatg gattcggtta gatgggaaac cgccatcagt 12480
accaggtcgt aatcccacac actggccatg ccggcggggc ctgcggaaac ctctacgtgc 12540
ccgtctggaa gctcgtagcg gatcacctcg ccagctcgtc ggtcacgctt cgacagacgg 12600
aaaacggcca cgtccatgat gctgcgacta tcgcgggtgc ccacgtcata gagcatcgga 12660
acgaaaaaat ctggttgctc gtcgcccttg ggcggcttcc taatcgacgg cgcaccggct 12720
gccggcggtt gccgggattc tttgcggatt cgatcagcgg ccccttgcca cgattcaccg 12780
gggcgtgctt ctgcctcgat gcgttgccgc tgggcggcct gcgcggcctt caacttctcc 12840
accaggtcat cacccagcgc cgcgccgatt tgtaccgggc cggatggttt gcgaccgctc 12900
acgccgattc ctcgggcttg ggggttccag tgccattgca gggccggcag acaacccagc 12960
cgcttacgcc tggccaaccg cccgttcctc cacacatggg gcattccacg gcgtcggtgc 13020
ctggttgttc ttgattttcc atgccgcctc ctttagccgc taaaattcat ctactcattt 13080
attcatttgc tcatttactc tggtagctgc gcgatgtatt cagatagcag ctcggtaatg 13140
gtcttgcctt ggcgtaccgc gtacatcttc agcttggtgt gatcctccgc cggcaactga 13200
aagttgaccc gcttcatggc tggcgtgtct gccaggctgg ccaacgttgc agccttgctg 13260
ctgcgtgcgc tcggacggcc ggcacttagc gtgtttgtgc ttttgctcat tttctcttta 13320
cctcattaac tcaaatgagt tttgatttaa tttcagcggc cagcgcctgg acctcgcggg 13380
cagcgtcgcc ctcgggttct gattcaagaa cggttgtgcc ggcggcggca gtgcctgggt 13440
agctcacgcg ctgcgtgata cgggactcaa gaatgggcag ctcgtacccg gccagcgcct 13500
cggcaacctc accgccgatg cgcgtgcctt tgatcgcccg cgacacgaca aaggccgctt 13560
gtagccttcc atccgtgacc tcaatgcgct gcttaaccag ctccaccagg tcggcggtgg 13620
cccaaatgtc gtaagggctt ggctgcaccg gaatcagcac gaagtcggct gccttgatcg 13680
cggacacagc caagtccgcc gcctggggcg ctccgtcgat cactacgaag tcgcgccggc 13740
cgatggcctt cacgtcgcgg tcaatcgtcg ggcggtcgat gccgacaacg gttagcggtt 13800
gatcttcccg cacggccgcc caatcgcggg cactgccctg gggatcggaa tcgactaaca 13860
gaacatcggc cccggcgagt tgcagggcgc gggctagatg ggttgcgatg gtcgtcttgc 13920
ctgacccgcc tttctggtta agtacagcga taaccttcat gcgttcccct tgcgtatttg 13980
tttatttact catcgcatca tatacgcagc gaccgcatga cgcaagctgt tttactcaaa 14040
tacacatcac ctttttagat gatca 14065

Claims (22)

1.用于产生高表达种子特异的和/或种子优先的植物启动子的方法,包括将一个或多个增强核酸表达的核酸(NEENA)分子与启动子功能性连接,其中所述增强核酸表达的核酸(NEENA)分子相对于所述启动子是异源的,其包含
i)具有如SEQ ID NO:2至15中所定义序列的核酸分子,或
ii)具有与SEQ ID NO:2至15具备至少80%同一性的序列的核酸分子,或
iii)i)或ii)的核酸分子的至少100个连续碱基的片段,所述片段具有如具有SEQ IDNO:2至15的序列的相应核酸分子那样的增强表达活性,或
iv)作为前述在i)或ii)下提及的任一核酸分子的互补物或反向互补物的核酸分子,或
v)使用表2中所示的SEQ ID NO:22至29、34至41、44至51和54至57描述的寡核苷酸引物,通过PCR可获得的核酸分子,或
vi)核酸分子,其在等同于50℃于7%十二烷基硫酸钠(SDS)、0.5MNaPO4、1mM EDTA杂交,以及50℃于2×SSC、0.1%SDS中洗涤的条件下与包含由SEQ ID NO:2至15或其互补物描述的增强转录的核苷酸序列的至少50个连续核苷酸的核酸分子杂交。
2.用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强的种子特异的和/或种子优先的表达,所述方法包括步骤
a)将包含权利要求1的i)至vi)中所定义核酸分子的一个或多个NEENA导入所述植物或其部分;
b)将所述一个或多个NEENA与种子特异的和/或种子优先的启动子以及与处在所述种子特异的和/或种子优先的启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。
3.根据权利要求1和2所述的方法,包括步骤
a)将包含权利要求1的i)至vi)中所定义核酸分子的一个或多个NEENA导入植物或其部分,和
b)将所述一个或多个NEENA整合至所述植物或其部分的基因组中,从而所述一个或多个NEENA与相对所述一个或多个NEENA为异源的种子特异的和/或种子优先的表达的内源核酸功能性连接,和任选地
c)从所述转化的细胞再生出包含所述一个或多个NEENA的植物或其部分。
4.根据权利要求1至3所述的方法,包括步骤
a)提供包含一个或多个NEENA的表达构建体,所述NEENA包含权利要求1的i)至vi)中所定义的、与种子特异的和/或种子优先的启动子以及与相对于所述一个或多个NEENA为异源并处在所述种子特异的和/或种子优先的启动子控制下的一种或多种核酸分子功能性连接的核酸分子,和
b)将包含所述一个或多个NEENA的所述表达构建体整合至所述植物或其部分的基因组中,和任选地
c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。
5.根据权利要求1至4所述的方法,其中所述植物是单子叶或双子叶植物。
6.根据权利要求5所述的植物,其中所述植物是双子叶植物。
7.根据权利要求5所述的植物,其中所述植物是单子叶植物。
8.根据权利要求1至7所述的方法,其中所述一个或多个NEENA与靠近所述异源核酸分子的转录起始位点的种子特异的和/或种子优先的启动子功能性连接。
9.根据权利要求8所述的方法,其中所述一个或多个NEENA与距离所述异源核酸分子的转录起始位点2500bp或更少、优选地2000bp或更少、更优选地1500bp或更少、甚至更优选地1000bp或更少并且最优选地500bp或更少的种子特异的和/或种子优先的启动子功能性连接。
10.根据权利要求1至9所述的方法,其中所述一个或多个NEENA与核酸分子的翻译起始位点上游的种子特异的和/或种子优先的启动子功能性连接,所述核酸分子的表达处在所述种子特异的和/或种子优先的启动子的控制下。
11.根据权利要求1至9所述的方法,其中所述一个或多个NEENA与核酸分子的5’UTR内部的种子特异的和/或种子优先的启动子功能性连接,所述核酸分子的表达处在所述种子特异的和/或种子优先的启动子的控制下。
12.重组表达构建体,其包含权利要求1的i)至vi)中所定义核酸分子的一个或多个NEENA。
13.根据权利要求12所述的包含一个或多个NEENA的重组表达构建体,其包含权利要求1的i)至vi)中所定义的核酸分子,所述核酸分子与一个或多个种子特异的和/或种子优先的启动子以及与相对于所述一个或多个NEENA为异源的一种或多种表达的核酸分子功能性连接。
14.重组表达载体,其包含根据权利要求12或13所述的一个或多个重组表达构建体。
15.转基因植物或其部分,其包含权利要求1的i)至vi)中所定义的一种或多种异源NEENA。
16.转基因细胞或转基因植物或其部分,其包含权利要求14中所述的重组表达载体或根据权利要求12或13所述的重组表达构建体。
17.根据权利要求16所述的转基因细胞、转基因植物或其部分,其选自或衍生自细菌、真菌、酵母或植物。
18.根据权利要求17所述的转基因植物或其部分,其中所述植物或其部分是双子叶植物。
19.根据权利要求17所述的转基因植物或其部分,其中所述植物或其部分是单子叶植物。
20.衍生自根据权利要求15至19所述的转基因细胞或植物或其部分的转基因细胞培养物、转基因种子、部分或繁殖材料,其包含权利要求1的i)至vi)中所定义的所述异源NEENA、权利要求12或13的重组表达构建体或权利要求14的重组载体。
21.权利要求1的i)至vi)中所定义的NEENA或权利要求12至14中任一项所定义的重组构建体或重组载体的用途,用于增强在植物或其部分中的表达。
22.权利要求20中所述的衍生自转基因细胞或植物的转基因细胞培养物、转基因种子、转基因植物、部分或繁殖材料的用途,用于食物、动物饲料、种子、药物或精细化学品的生产。
CN201710157168.7A 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子 Active CN106947762B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US23823309P 2009-08-31 2009-08-31
EP09169017.2 2009-08-31
US61/238233 2009-08-31
EP09169017 2009-08-31
CN201080038714.1A CN102575259B (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201080038714.1A Division CN102575259B (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子

Publications (2)

Publication Number Publication Date
CN106947762A true CN106947762A (zh) 2017-07-14
CN106947762B CN106947762B (zh) 2020-06-23

Family

ID=42752300

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201080038714.1A Active CN102575259B (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN202010460012.8A Pending CN111560375A (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN201710157168.7A Active CN106947762B (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201080038714.1A Active CN102575259B (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
CN202010460012.8A Pending CN111560375A (zh) 2009-08-31 2010-08-11 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子

Country Status (17)

Country Link
US (5) US9150871B2 (zh)
EP (5) EP3156490B1 (zh)
JP (1) JP5794987B2 (zh)
KR (1) KR20120046788A (zh)
CN (3) CN102575259B (zh)
AR (5) AR078009A1 (zh)
AU (5) AU2010288760B2 (zh)
BR (4) BR122021003073B1 (zh)
CA (3) CA3167819A1 (zh)
CL (1) CL2012000553A1 (zh)
DE (1) DE112010003493T5 (zh)
IL (1) IL218095A0 (zh)
MX (1) MX2012002069A (zh)
RU (2) RU2559534C2 (zh)
SG (1) SG178388A1 (zh)
WO (1) WO2011023539A1 (zh)
ZA (1) ZA201202245B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113825838A (zh) * 2019-05-10 2021-12-21 巴斯夫欧洲公司 增强植物中基因表达的调节性核酸分子

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2421976B1 (en) 2009-04-22 2015-09-16 BASF Plant Science Company GmbH Whole seed specific promoter
CN102597245A (zh) 2009-08-31 2012-07-18 巴斯夫植物科学有限公司 用于在植物中增强种子特异性基因表达而促进增强的多不饱和脂肪酸合成的调节性核酸分子
CA3175433C (en) 2009-08-31 2024-05-28 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for enhancing constitutive gene expression in plants
CN102575259B (zh) 2009-08-31 2017-04-12 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
MX2013010197A (es) 2011-03-18 2013-09-26 Basf Plant Science Co Gmbh Promotores para regular la expresion en plantas.
WO2013038294A1 (en) * 2011-09-15 2013-03-21 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for reliable gene expression in plants
EP2677035A1 (en) 2012-06-22 2013-12-25 BASF Plant Science Company GmbH Plants having enhanced yield-related traits and a method for making the same
EP2816115A1 (en) 2013-06-17 2014-12-24 BASF Plant Science Company GmbH Plants having one or more enhanced yield-related traits and a method for making the same
US10731169B2 (en) 2013-07-05 2020-08-04 Basf Plant Science Company Gmbh Gene expression or activity enhancing elements
EP2896698A1 (en) 2014-01-17 2015-07-22 BASF Plant Science Company GmbH Plants having one or more enhanced yield-related traits and a method for making the same
BR112022004545A2 (pt) * 2019-09-12 2022-05-31 Basf Se Métodos para aumentar a expressão derivada de um promotor vegetal e produzir uma planta, construção de expressão recombinante, vetor de expressão, célula ou planta transgênica, cultura de células transgênicas e usos
WO2021069387A1 (en) * 2019-10-07 2021-04-15 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants
WO2024083579A1 (en) * 2022-10-20 2024-04-25 Basf Se Regulatory nucleic acid molecules for enhancing gene expression in plants

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031646A (zh) * 2004-07-30 2007-09-05 巴斯夫农业化学产品公司 抗除草剂的向日葵植物、编码抗除草剂的乙酰羟酸合酶大亚基蛋白的多核苷酸和使用方法
CN101137752A (zh) * 2005-03-08 2008-03-05 巴斯福植物科学有限公司 增强表达的内含子序列

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993020216A1 (en) * 1991-02-22 1993-10-14 University Technologies International, Inc. Oil-body protein cis-elements as regulatory signals
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
AU691550B2 (en) 1993-12-09 1998-05-21 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US5750866A (en) * 1994-09-08 1998-05-12 American Cyanamid Company AHAS promoter useful for expression of introduced genes in plants
WO1999067389A2 (en) 1995-05-15 1999-12-29 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Agriculture And Agri-Food Canada Cryptic regulatory elements obtained from plants
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US20110014706A2 (en) * 1998-12-14 2011-01-20 Monsanto Technology Llc Arabidopsis thaliana Genome Sequence and Uses Thereof
BR0009119A (pt) 1999-03-18 2001-12-26 Univ Chicago Composições e métodos de cromossoma de planta
US8877916B2 (en) * 2000-04-26 2014-11-04 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
EP2221381A3 (en) 2000-06-23 2010-10-27 Syngenta Participations AG Promoters for regulation of plant expression
WO2002016655A2 (en) * 2000-08-24 2002-02-28 The Scripps Research Institute Stress-regulated genes of plants, transgenic plants containing same, and methods of use
AU2002319285A1 (en) 2001-07-13 2003-03-03 Sungene Gmbh And Co. Kgaa Expression cassettes for transgenically expressing selection markers
US8022272B2 (en) 2001-07-13 2011-09-20 Sungene Gmbh & Co. Kgaa Expression cassettes for transgenic expression of nucleic acids
ATE393830T1 (de) 2001-07-13 2008-05-15 Sungene Gmbh & Co Kgaa Expressionskassetten zur transgenen expression von nukleinsäuren
DE10224889A1 (de) 2002-06-04 2003-12-18 Metanomics Gmbh & Co Kgaa Verfahren zur stabilen Expression von Nukleinsäuren in transgenen Pflanzen
US7803983B2 (en) * 2004-06-30 2010-09-28 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant growth rate and biomass in plants
US7402667B2 (en) 2003-10-14 2008-07-22 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US20100170002A1 (en) * 2006-03-24 2010-07-01 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US20070006335A1 (en) 2004-02-13 2007-01-04 Zhihong Cook Promoter, promoter control elements, and combinations, and uses thereof
AU2005252338B2 (en) 2004-06-07 2008-12-18 Basf Plant Science Gmbh Improved transformation of soybean
EP1614754A1 (en) 2004-07-06 2006-01-11 Biogemma Method for enhancing gene expression in plants
EP1794305A2 (en) 2004-09-23 2007-06-13 BASF Plant Science GmbH Recombination cassettes and methods for sequence excision in plants
EP2166098B1 (en) 2004-10-05 2013-11-06 SunGene GmbH Constitutive expression cassettes for regulation of plant expression
WO2006076099A2 (en) 2004-12-08 2006-07-20 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant size and biomass in plants
WO2006091676A2 (en) 2005-02-22 2006-08-31 Ceres Inc. Modulating plant alkaloids
WO2006089950A2 (en) 2005-02-26 2006-08-31 Basf Plant Science Gmbh Expression cassettes for seed-preferential expression in plants
EP1896594B1 (en) 2005-06-23 2011-01-12 BASF Plant Science GmbH Improved methods for the production of stably transformed, fertile zea mays plants
EP1931789B1 (en) 2005-09-20 2016-05-04 BASF Plant Science GmbH Methods for controlling gene expression using ta-siran
EP2843053A1 (en) 2006-02-17 2015-03-04 Monsanto Technology LLC Chimeric regulatory sequences comprising introns for plant gene expression
JP2009529863A (ja) 2006-03-17 2009-08-27 ビーエーエスエフ プラント サイエンス ゲーエムベーハー ダイズに対するd−アミノ酸選択
DE102006034313A1 (de) 2006-07-21 2008-01-24 Basf Plant Science Gmbh Verfahren zur Herstellung von Arachidonsäure und/oder Eicosapentaensäure
WO2008064128A2 (en) 2006-11-22 2008-05-29 Ceres, Inc. Broadly expressing regulatory regions
WO2008104559A1 (de) * 2007-02-27 2008-09-04 Norddeutsche Pflanzenzucht Verfahren zur herstellung von mehrfach ungesättigten fettsäuren in transgenen organismen
ATE528412T1 (de) 2007-07-31 2011-10-15 Basf Plant Science Gmbh Desaturasen und verfahren zur herstellung mehrfach ungesättigter fettsäuren in transgenen organismen
BRPI0816880A2 (pt) 2007-09-21 2015-09-08 Basf Plant Science Gmbh métodos para produzir uma planta com rendimento aumentado em comparação com uma planta do tipo selvagem correspondente, para produzir uma planta transgênica com rendimento aumentado em comparação com uma planta do tipo selvagem não transformada correspondente, para produzir uma composição agrícola, para identificar uma planta com um rendimento aumentado, e para aumentar o rendimento de uma população de plantas, molécula de ácido nucleico isolada, construção de ácido nucléico, vetor, processos para produzir um polipeptídeo, e para identificar um composto, polipeptídeo, anticorpo, núcleo de célula de planta, célula de planta, tecido de planta, material de propagação, pólen, progênie, material colhido ou planta, semente, parte de planta, planta transgênica, planta transgênica, núcleo de célula de planta transgênica, célula de planta transgênica, planta que compreende um ou mais de tais núcleos de célula de planta transgênica ou células de planta, progênie, semente ou pólen derivado de ou produzido por uma planta transgênica, composição, e, uso dos ácidos nucleicos.
ES2556358T3 (es) 2009-03-23 2016-01-15 Satyatek Sa Sistema y procedimiento para la lectura de una o varias etiquetas RFID en un estuche metálico con un protocolo anticolisión
CN102597245A (zh) 2009-08-31 2012-07-18 巴斯夫植物科学有限公司 用于在植物中增强种子特异性基因表达而促进增强的多不饱和脂肪酸合成的调节性核酸分子
CA3175433C (en) 2009-08-31 2024-05-28 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for enhancing constitutive gene expression in plants
CN102575259B (zh) 2009-08-31 2017-04-12 巴斯夫植物科学有限公司 用于增强植物中种子特异的和/或种子优先的基因表达的调节性核酸分子
WO2013038294A1 (en) * 2011-09-15 2013-03-21 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for reliable gene expression in plants

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101031646A (zh) * 2004-07-30 2007-09-05 巴斯夫农业化学产品公司 抗除草剂的向日葵植物、编码抗除草剂的乙酰羟酸合酶大亚基蛋白的多核苷酸和使用方法
CN101137752A (zh) * 2005-03-08 2008-03-05 巴斯福植物科学有限公司 增强表达的内含子序列

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VYSOTSKAIA,V.S. 等: "GenBank 登录号:AC00723.2", 《NCBI》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113825838A (zh) * 2019-05-10 2021-12-21 巴斯夫欧洲公司 增强植物中基因表达的调节性核酸分子

Also Published As

Publication number Publication date
AU2016256725B2 (en) 2018-02-15
ZA201202245B (en) 2013-06-26
BR122021003079B1 (pt) 2022-05-10
US10041081B2 (en) 2018-08-07
CA3048833A1 (en) 2011-03-03
AU2010288760B2 (en) 2016-01-21
US10041082B2 (en) 2018-08-07
JP5794987B2 (ja) 2015-10-14
CN102575259B (zh) 2017-04-12
AU2016256724B2 (en) 2018-02-15
CA2771253A1 (en) 2011-03-03
RU2012112346A (ru) 2013-10-10
EP3156492A1 (en) 2017-04-19
DE112010003493T5 (de) 2012-06-21
RU2559534C2 (ru) 2015-08-10
CN106947762B (zh) 2020-06-23
KR20120046788A (ko) 2012-05-10
US9970019B2 (en) 2018-05-15
US10041083B2 (en) 2018-08-07
AU2016201517B2 (en) 2017-05-25
MX2012002069A (es) 2012-03-29
AR115681A2 (es) 2021-02-17
BR122021003073B1 (pt) 2022-05-10
EP2473608A1 (en) 2012-07-11
RU2692924C2 (ru) 2019-06-28
US20150361440A1 (en) 2015-12-17
JP2013502908A (ja) 2013-01-31
US20170044562A1 (en) 2017-02-16
CN111560375A (zh) 2020-08-21
RU2015125627A (ru) 2015-12-10
CA3167819A1 (en) 2011-03-03
BR122021003076B1 (pt) 2022-05-10
CN102575259A (zh) 2012-07-11
US9150871B2 (en) 2015-10-06
US20170044563A1 (en) 2017-02-16
RU2015125627A3 (zh) 2018-12-13
BR122021003080B1 (pt) 2022-05-10
EP3153584A3 (en) 2017-07-12
CA3048833C (en) 2022-10-18
EP3156492B1 (en) 2019-11-20
IL218095A0 (en) 2012-04-30
EP3153584B1 (en) 2019-10-09
EP3156490A3 (en) 2017-07-05
AU2016256726B2 (en) 2018-02-15
AR078009A1 (es) 2011-10-05
EP3156491B1 (en) 2019-10-09
AU2016256725A1 (en) 2016-11-24
SG178388A1 (en) 2012-03-29
US20120159670A1 (en) 2012-06-21
AR115680A2 (es) 2021-02-17
CL2012000553A1 (es) 2012-10-12
EP3156490B1 (en) 2019-10-09
AR115679A2 (es) 2021-02-17
EP3156491A1 (en) 2017-04-19
AU2016256726A1 (en) 2016-11-24
EP3153584A2 (en) 2017-04-12
EP2473608B1 (en) 2017-07-05
WO2011023539A1 (en) 2011-03-03
US20170044561A1 (en) 2017-02-16
AU2010288760A1 (en) 2012-04-12
EP3156490A2 (en) 2017-04-19
EP3153584A9 (en) 2017-05-17
AR115682A2 (es) 2021-02-17
CA2771253C (en) 2019-09-10
AU2016201517A1 (en) 2016-03-24
AU2016256724A1 (en) 2016-11-24

Similar Documents

Publication Publication Date Title
AU2016256726B2 (en) Regulatory nucleic acid molecules for enhancing seed-specific and/or seed-preferential gene expression in plants
CA2486392C (en) Method for the stable expression of nucleic acids in transgenic plants, controlled by a parsley-ubiquitin promoter
CN105132425B (zh) 用于增强植物中组成型基因表达的调节性核酸分子
JP2659459B2 (ja) 生物学的に安全な植物形質転換システム
KR20200128129A (ko) 식물 형질전환을 위한 방법
US6096950A (en) Cotton fiber-specific promoters
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
CN101001951B (zh) 分离转录终止序列的方法
CN101410521A (zh) 植物木质素含量的调控
CN107849581A (zh) 用于植物中的特异性核酸编辑的方法和构建体
CN103649314A (zh) 用于增强植物中组成型基因表达的调节性核酸分子
CN113966169A (zh) 表达动物乳蛋白的植物
US11542530B2 (en) Method for increasing efficiency of homologous recombination-based gene editing in plant
CN107567499A (zh) 大豆u6核小rna基因启动子及其在植物小rna基因的组成型表达中的用途
JPH05199877A (ja) バレイショおよびイネの誘導型植物防御遺伝子の制御領域、その用途およびアッセイ法
KR102676633B1 (ko) 식물 조절 요소 및 이의 용도
CN112088215A (zh) Crispr瞬时表达构建体(ctec)
CN113403209A (zh) 天冬氨酸蛋白酶基因在改良球孢白僵菌品种中的应用
CN103732747A (zh) 鉴定和分离导致转录增强的终止子序列的方法
US20200283786A1 (en) Lodging resistance in plants
US7288409B1 (en) Method of introducing a plurality of genes into plants
KR20210084557A (ko) 오크로박트럼-매개 유전자 편집을 위한 조성물 및 방법
CN114245823A (zh) 非生物胁迫耐性植物和方法
KR101773365B1 (ko) 콩 모자이크 바이러스를 이용한 두 종의 외래 유전자 동시발현용 유전자 전달 벡터
CN114480375A (zh) 事件ctc79005-2,抗虫甘蔗植株,生产和检测抗虫甘蔗植株的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant