CN115135142A - 控制籽粒大小和粒重的方法 - Google Patents

控制籽粒大小和粒重的方法 Download PDF

Info

Publication number
CN115135142A
CN115135142A CN202180011352.5A CN202180011352A CN115135142A CN 115135142 A CN115135142 A CN 115135142A CN 202180011352 A CN202180011352 A CN 202180011352A CN 115135142 A CN115135142 A CN 115135142A
Authority
CN
China
Prior art keywords
oml4
ser
leu
gly
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180011352.5A
Other languages
English (en)
Inventor
李云海
吕佳
段朋根
刘亚培
张丽敏
张保兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Genetics and Developmental Biology of CAS
Original Assignee
Institute of Genetics and Developmental Biology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Genetics and Developmental Biology of CAS filed Critical Institute of Genetics and Developmental Biology of CAS
Publication of CN115135142A publication Critical patent/CN115135142A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/12Processes for modifying agronomic input traits, e.g. crop yield
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4636Oryza sp. [rice]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/11001Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physiology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Fertilizers (AREA)
  • Peptides Or Proteins (AREA)
  • Adjustment And Processing Of Grains (AREA)
  • Medicines Containing Plant Substances (AREA)

Abstract

本发明涉及增加植物的籽粒大小和/或粒重的方法,以及具有增加的籽粒大小和/或粒重的植物。

Description

控制籽粒大小和粒重的方法
技术领域
本发明涉及增加植物的籽粒大小和/或粒重的方法,以及通过降低OML4的表达和/或活性而具有增加的籽粒大小和/或粒重的植物。可选地,本发明涉及通过增加OML4的表达和/或活性来增加粒数的方法。
背景技术
世界人口继续快速增长,并且这种增长已导致对主要作物(例如水稻、小麦和玉米)的需求不断增长。粮食产量由分蘖数、粒数和粒重决定。由于籽粒大小是粒重的关键组成部分,因此调节籽粒大小是增加粮食产量的关键策略。谷物生长受小穗壳的限制,其影响水稻的最终籽粒大小。反过来,小穗壳的生长由细胞增殖和细胞扩增过程决定。已经在水稻中描述了几种通过影响小穗壳中细胞增殖来调节籽粒大小的基因,例如GW2、GW5/GSE5、GW8/OsSPL16、GS3、GS9、OsMKKK10-OsMKK4-OsMPK6和MKP1。此外,已经在水稻中报道了几种通过影响小穗壳中细胞扩增来控制籽粒大小的基因,例如GS2/OsGRF4、OsGSK5、GLW7(SPL13)、GL7、PGL1/2和APG。然而,这些因素之间的遗传和分子关系仍在很大程度上未知。因此,需要增加主要作物的籽粒大小和/或粒重。还需要增加主要作物的粒数。本发明解决了这种需要。
发明内容
我们已经确定了功能缺失和获得对籽粒大小产生相反影响的基因。在此我们报道了由LARGE1基因编码的Mei2样(Mei2-Like)蛋白4(OML4)被糖原合酶激酶2(GSK2)磷酸化,并且负控制水稻的籽粒大小和粒重。OML4的功能缺失导致大而重的谷粒,而OML4的过表达导致小而轻的谷粒。OML4通过限制小穗壳中的细胞扩增来调节籽粒大小。OML4在发育中的花序(例如水稻穗)和谷粒中表达,并且表达(由GFP-OML4融合蛋白表示)位于细胞核中。生化分析表明GSK2与OML4发生物理相互作用并使其磷酸化,因此可能影响OML4的稳定性。基因分析支持GSK2和OML4至少部分地在控制水稻的籽粒大小的共同途径中起作用。因此,我们的研究结果揭示了控制作物籽粒大小和粒重的重要基因和分子机制。
在本发明的第一方面,提供了一种增加籽粒大小和/或粒重的方法,该方法包括降低或消除Mei2样蛋白4(OML4)的表达和/或活性。
优选地,该方法包括将至少一个突变引入至少一个编码OML4的核酸序列和/或将至少一个突变引入OML4的启动子。
在还一个实施方案中,该方法进一步包括另外降低或消除SHAGGY样激酶(GSK2)的表达和/或活性。优选地,该方法包括将至少一个突变引入至少一个编码GSK2的核酸序列和/或将至少一个突变引入GSK2的启动子。
在一个实施方案中,突变是功能缺失或部分功能缺失突变。优选地,使用靶向基因组修饰,优选ZFN、TALEN或CRISPR/Cas9或诱变,优选TILLING或T-DNA插入来引入突变。可选地,该方法包括使用RNA干扰来降低或消除OML4核酸序列或GSK2核酸序列的表达。
在本发明的另一方面,提供了一种基因修饰的植物、植物细胞或其部分,其特征在于OML4的表达降低或消除。优选地,植物包含在至少一个编码OML4基因的核酸序列中的至少一个突变,和/或进入OML4的启动子的至少一个突变。最优选地,植物部分是种子或谷粒(这些术语可以互换使用)。还提供了从种子获得或可获得的子代植物,以及从所述子代植物获得的种子。
在另一个实施方案中,植物进一步包含在至少一个编码GSK2的核酸序列中的至少一个突变和/或GSK2的启动子中的至少一个突变。
优选地,突变是功能缺失或部分功能缺失突变。
在可选的实施方案中,植物包含降低或消除OML4表达的RNA干扰构建体。
在本发明的另一方面,提供了产生具有增加的籽粒大小和/或粒重的植物的方法,该方法包括将至少一个突变引入至少一个编码OML4多肽的核酸序列和/或将至少一个突变引入OML4的启动子。在一个实施方案中,该方法进一步包括将至少一个突变引入至少一种编码GSK2多肽的核酸序列和/或将至少一个突变引入GSK2的启动子。优选地,该突变是功能缺失或部分功能缺失突变。
根据本发明的任一方面,在一个实施方案中,OML4核酸序列编码包含SEQ ID NO:1或其功能变体或同源物的多肽,并且优选地,编码OML4的核酸序列包含如SEQ ID NO:2中定义的核酸序列。在另一个实施方案中,OML4的启动子包含如SEQ ID NO:3或其功能变体或同源物中定义的序列。
在还一个实施方案中,GSK2核酸序列编码如SEQ ID NO:4或其功能变体或同源物中定义的多肽,并且优选地,GSK2核酸序列包含如SEQ ID NO:5或其功能变体或同源物中定义的核酸序列。在另一个实施方案中,GSK2启动子包含如SEQ ID NO:6或其功能变体或同源物中定义的核酸序列。
在任何上述方法的一个实施方案中,使用靶向基因组修饰,优选ZFN、TALEN或CRISP/Cas9,或者使用诱变引入突变,优选TILLING或T-DNA插入来引入突变。
根据本发明的任一方面,在一个实施方案中,植物是农作物。优选地,植物选自水稻、小麦、玉米、大豆和芸苔属植物。
附图说明
在以下非限制性附图中进一步描述本发明:
图1显示了LARGE1影响籽粒大小和植株形态。(A,B)ZHJ和large1-1籽粒。(C,D)ZHJ和large1-1植株。(E)ZHJ(左)和large1-1(右)穗。(F,G)ZHJ和large1-1的粒长和粒宽。(H)ZHJ和large1-1的千粒重。(I)ZHJ和large1-1的株高。(J)ZHJ和large1-1的穗长。(K)ZHJ和large1-1穗的一次枝梗数。(L)ZHJ和large1-1穗的二次枝梗数。F-H中的值以平均值+SD(n≥50)的形式示出。I-L中的值以平均值+SD(n=20)的形式示出。星号表示ZHJ与large1-1之间的显著性差异。通过Student t检验,与野生型(ZHJ)相比,**P<0.01。条形线:A和B中为2mm;C-E中为10cm。
图2显示了由于小穗壳中的细胞扩增增加,large1形成大籽粒。(A,B)ZHJ(A)和large1-1(B)外稃的外表面的SEM分析。(C,D)ZHJ(C)和large1-1(D)外稃的内表面的SEM分析。(E,F)ZHJ和large1-1外稃的外表皮细胞的平均长度(E)和宽度(F)。(G)ZHJ和large1-1外稃纵向外表皮细胞数。(H)ZHJ和large1-1外稃横向外表皮细胞数。(I,J)ZHJ和large1-1外稃纵向内表皮细胞的平均长度(I)和宽度(J)。E-J中的值以平均值+SD(n≥50)的形式示出。通过Student t检验,与野生型相比,**P<0.01。条形线:A-D中为50μm。
图3显示了LARGE1编码mei2样蛋白OML4。(A)LARGE1/OML4基因结构。编码序列用黑框表示,并且内含子用黑线表示。ATG和TGA分别代表起始密码子和终止密码子。(B)OML4和突变蛋白由large1编码。OML4蛋白包含三个RNA识别基序(RRM)结构域。该突变导致OML4中的提前终止密码子,从而产生截短的蛋白。(C)根据large1-1突变开发dCAPS1标志物。PCR产物用限制性内切酶Hph I消化。(D,E)ZHJ、large1-1、gLARGE1;large1-1#1和gLARGE1;large1-1#2的成熟稻谷(D)和糙米(E)籽粒。(F,G)ZHJ、large1-1、gLARGE1;large1-1#1和gLARGE1;large1-1#2的粒长(F)和粒宽(G)。星号表示ZHJ与large1-1之间的显著性差异。通过Student t检验,与野生型相比,**P<0.01。(H)ZHJ中1cm(YP1)至15cm(YP15)幼穗中相对OML4基因表达水平。值以平均值±SD示出。使用三个生物学重复(n=3)。(I)通过proOML4::GUS转基因表达监测OML4表达活性。不同发育阶段的穗中GUS活性的组织化学分析。(J,K)ZHJ、large1-1、gLARGE1-GFP;large1-1#1的成熟稻谷(J)和糙米(K)籽粒。(L-O)gLARGE1-GFP;large1-1#1根细胞中OML4-GFP的亚细胞定位。显示了GFP-OML4的GFP荧光(L)、DAPI染色(M)、DIC(N)和合并(O)图像。条形线:D、E、J和K中为2mm;I中为1cm;L-O中为10μm。
图4显示了OML4过表达导致较小籽粒。(A,B)ZHJ和proActin:OML4籽粒。(C,D)ZHJ和proActin:OML4转基因株系的粒长和粒宽。(E)ZHJ和proActin:OML4转基因株系的千粒重。(F)ZHJ和proActin:OML4转基因株系中OML4的表达水平。使用三个生物学重复(n=3)。ACTIN1用于归一化表达。(G)ZHJ和proActin:OML4植株。(H)ZHJ和proActin:OML4转基因株系的株高。(I)ZHJ和proActin:OML4穗。(J)ZHJ和proActin:OML4转基因株系的穗长。(K,L)ZHJ和proActin:OML4转基因株系穗的一次和二次枝梗数。(M)ZHJ和proActin:OML4转基因株系的每穗总粒数。(N,O)ZHJ(N)和proActin:OML4#1(O)外稃外表面的SEM分析。(P,Q)ZHJ和proActin:OML4#1外稃纵向外表皮细胞的平均长度和宽度。(R,S)ZHJ和proActin:OML4#1外稃纵向和横向外表皮细胞数。C-E和P-S中的值以平均值±SD(n≥50)的形式示出。值F以平均值±SD的形式示出。值H和J-M以平均值±SD(n=20)的形式示出。星号表示ZHJ与proActin:OML4转基因株系之间的显著性差异。通过Student t检验,与野生型相比,*P<0.05;**P<0.01。条形线:A和B中为2mm;G和I中为10cm;N和O中为50μm。
图5显示了在体外和体内OML4与GSK2物理相互作用。(A)OML4与酵母细胞中的GSK2相互作用。在SD/-Trp-Leu或SD/-Trp-Leu-His-Ade培养基上培养酵母细胞。(B)OML4与本氏烟草(N.benthamiana)中的GSK2缔合。OML4-nLUC和GSK2-cLUC在本氏烟草叶中共表达。浸润后48小时观察到荧光素酶活性。发光强度的范围通过伪彩色条缩放。(C)双分子荧光互补(BiFC)测定显示OML4与本氏烟草中的GSK2相互作用。OML4-cYFP与GSK2-nYFP在本氏烟草的叶子中共表达。(D)在体外OML4结合GSK2。GSK2-GST与OML4-MBP孵育,并用OML4-MBP进行拉下(pull down),并用抗GST抗体通过免疫印迹检测。IB:免疫印迹。(E)Co-IP测定中OML4和GSK2之间的相互作用。抗MYC珠用于免疫沉淀GSK2-GFP蛋白。用抗MYC抗体或抗GFP抗体探测凝胶印迹。条形线:C中为50μm。
图6显示了OML4的磷酸化需要GSK2。(A)在体外GSK2磷酸化OML4。磷酸化的OML4-FLAG、nOML4-FLAG(OML4的N-末端)和cOML4-FLAG(OML4的C-末端)通过phos-tag SDS-PAGE分离。磷酸化蛋白用红色垂直线标记。(B)体外磷酸化反应后通过LC-MS/MS检测OML4的磷酸化位点。OML4包含1001个残基。LC-MS/MS检测到的磷酸化残基以红色显示。下划线所示的两个重要残基被置换为磷光猝灭的(phosphor-dead)残基。(C)S(105)和S(607)部分影响OML4的磷酸化。通过phos-tag SDS-PAGE分离磷酸化的nOML4-FLAG、nOML4(S105A)-FLAG、cOML4-FLAG和cOML4(S607A)-FLAG。磷酸化蛋白用红色垂直线标记。(D)S(105)和S(607)部分影响OML4的磷酸化。通过phos-tag SDS-PAGE分离磷酸化的OML4-MBP、OML4S105A、S607A-MBP和GSK2-GST。磷酸化蛋白用红色垂直线标记。(E)GSK2影响OML4的丰度。GSK2-GFP和OML4-MYC在烟叶中共表达,并通过western印迹检测蛋白水平。将该结果重复三次。(F)S(105)和S(607)部分影响OML4的丰度。GSK2-GFP和OML4-MYC或OML4S105A、S607A-MYC在烟叶中共表达,并通过western印迹检测蛋白水平。将该结果重复三次。
图7显示了GSK2与OML4在基因上起作用以调节种子大小。(A,B)ZHJ和GSK2-RNAi籽粒。(C)ZHJ和GSK2-RNAi转基因株系中GSK2的表达水平。使用三个生物学重复(n=3)。ACTIN1用于归一化表达。(D,E)ZHJ和GSK2-RNAi转基因株系的粒长(D)和粒宽(E)。(F)ZHJ和GSK2-RNAi转基因株系的千粒重。(G,H)ZHJ(G)和GSK2-RNAi#1(H)外稃外表面的SEM分析。(I,J)ZHJ和GSK2-RNAi#1外稃纵向外表皮细胞的平均长度和宽度。(K)ZHJ、large1-1、GSK2-RNAi#1和large1-1;GSK2-RNAi#1的籽粒。(L)ZHJ、large1-1、GSK2-RNAi#1和large1-1;GSK2-RNAi#1的粒长。D-F、I-J和L中的值以平均值+SD(n≥50)的形式示出。通过Student t检验,与野生型相比,*P<0.05;**P<0.01。条形线:A、B和K中为2mm;G和H中为50μm。
图8显示了ZHJ和large1-1穗中指定基因的表达水平。ACTIN1用于归一化表达。值是相对于设置为1的ZHJ值的平均值+SD。使用三个生物学重复(n=3)。通过Student t检验,与野生型相比,*P<0.05;**P<0.01。
图9显示了OML4的CDS和蛋白序列。(A)OML4的全长cDNA序列。OML4基因中large1-1的缺失序列以红色显示。(B)OML4的氨基酸序列。(C)large1-1的氨基酸序列。
图10显示了gLARGE1;large1-1的株高、穗大小和每穗粒数。(A)ZHJ、large1-1、gLARGE1;large1-1#1和gLARGE1;large1-1#2的植株。(B)ZHJ(左)、large1-1(中)和gLARGE1;large1-1#1(右)穗的表型。(C)ZHJ、large1-1和gLARGE1;large1-1#1的株高。(D)ZHJ、large1-1和gLARGE1;large1-1#1的穗长度。(E)ZHJ、large1-1和gLARGE1;large1-1#1穗的一次枝梗数。(F)ZHJ、large1-1和gLARGE1;large1-1#1的千粒重。C-E中的值以平均值+SD(n=20)的形式示出。值F以平均值+SD(n=100)的形式示出。星号表示ZHJ与large1-1或ZHJ与gLARGE1;large1-1#1之间的显著性差异。通过Student t检验,与野生型相比,**P<0.01。条形线:A和B中为10cm。
图11显示了OML4的结构特征和系统发育树。(A)水稻中MEI2-LIKE蛋白的氨基酸序列比对。标记了三个保守的RNA识别基序(RRM)。(B)水稻和拟南芥(Arabidopsis)中MEI2-LIKE蛋白的系统发育树。OML1、OML2、OML3、OML4和OML5来自亚洲栽培稻(O.sativa),TE1和LOC103653544(MEI2-LIKE蛋白1)来自玉米(Z.mays),AML1、AML2、AML3、AML4和AML5来自拟南芥。使用具有100个自举重复的邻接法,使用MEGA7进行多序列比对和系统发育树的构建。
图12显示了large1-1突变的鉴定。CHR,染色体;POS,染色体中的位置。全基因组测序揭示了LOC_Os02g31290基因中的一个缺失,其具有SNP/INDEL-index=1。
具体实施方式
现在将进一步描述本发明。在以下段落中,更详细地定义了本发明的不同方面。如此定义的每个方面可以与任何其他方面或多个方面组合,除非明确指示相反情况。特别地,被指示为优选或有利的任何特征可以与被指示为优选或有利的任何其他一个或多个特征组合。
除非另有说明,否则本发明的实践将采用在本领域的技术范围内的植物学、微生物学、组织培养、分子生物学、化学、生物化学和重组DNA技术、生物信息学的常规技术。这些技术在文献中有充分的解释。
如本文所用,词语“核酸”、“核酸序列”、“核苷酸”、“核酸分子”或“多核苷酸”旨在包括DNA分子(例如,cDNA或基因组DNA),RNA分子(例如mRNA)、天然存在的、突变的、合成的DNA或RNA分子,以及使用核苷酸类似物产生的DNA或RNA的类似物。它可以是单链或双链。此类核酸或多核苷酸包括但不限于结构基因的编码序列、反义序列和不编码mRNA或蛋白产物的非编码调控序列。这些术语还涵盖基因。术语“基因”或“基因序列”被广泛用于指代与生物学功能相关的DNA核酸。因此,基因可以包括如基因组序列中的内含子和外显子,或可以仅包括如cDNA中的编码序列,和/或可以包括与调控序列组合的cDNA。
术语“多肽”和“蛋白质”在本文中可互换使用,并且是指任何长度的聚合形式的氨基酸,通过肽键连接在一起。
本发明的方面涉及重组DNA技术并且排除仅基于通过传统育种方法产生植株的实施方案。
增加籽粒大小和/或粒重的方法
在本发明的第一方面,提供了一种增加植物的籽粒大小和/或粒重的方法,其中该方法包括降低或消除Mei2样蛋白4(OML4)的表达和/或活性。
在一个实施方案中,籽粒大小和/或粒重的“增加”可以包括与野生型或对照植株的籽粒大小和/或粒重相比增加至少5%、10%、15%、20%、25%、30%、35%、40%、45%或50%。在一个实施方案中,与野生型或对照植株的籽粒大小和/或粒重相比,该增加可以为5%至30%,甚至更优选为10%至25%。在一个实施方案中,籽粒大小可以包括粒长和/或粒宽中的一种。在还一个实施方案中,粒重可以包括千粒重。可以使用本领域中的标准技术测量上述任何一种。
在本发明的还一方面,提供了增加产量的方法,该方法包括降低或消除OML4基因的表达或活性。术语“产量”通常意指具有经济价值的可测量的产品,通常与特定作物、地区和时间段有关。个体植株部分基于其数量、大小和/或重量直接影响产量。实际产量是作物和年份每平方米的产量,其通过将总产量(包括收获和评估产量)除以种植平方米确定。
在一个实例中,与对照或野生型植株相比,产量增加至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%75%、80%、85%、90%或95%。在优选的实施方案中,与对照或野生型植物相比,产量增加至少10%,甚至更优选10%至60%。
在本发明的还一方面,该方法还包括降低或消除SHAGGY样激酶(GSK2)的表达或活性。
在一个实施方案中,该方法包括将至少一个突变引入OML4。在还一个实施方案中,该方法包括将至少一个突变引入OML4并且将至少一个突变引入GSK2。
“至少一个突变”是指当OML4或GSK2基因作为多于一个拷贝或同源物(具有相同或轻微不同的序列)存在时,在至少一个基因中存在至少一个突变。优选地,OML4和/或GSK2中所有基因均发生突变。
术语“降低”意指当与野生型或对照植株中的水平相比时,OML4或GSK2表达和/或活性水平降低至多10%、20%、30%、40%、50%、60%、70%、80%或90%。术语“消除”表达意指未检测到OML4或GSK2多肽的表达或未产生功能性OML4或GSK2多肽。用于确定OML4或GSK2多肽表达和/或活性水平的方法是技术人员熟知的。这些降低可以通过本领域技术人员已知的任何标准技术来测量。例如,至少OML4或GSK2表达的表达和/或含量水平的降低可以是蛋白和/或核酸水平的量度并且可以通过技术人员已知的任何技术来测量,例如但不是仅限于,任何形式的凝胶电泳或色谱(例如HPLC)。
在一个实施方案中,该方法包括将至少一个突变引入编码OML4的优选内源基因和/或OML4启动子中。在另一个实施方案中,该方法包括将进一步的突变引入编码GSK2的优选内源基因和/或GSK2启动子中。优选地,所述突变位于OML4或GSK2基因的编码区。在还一个实施方案中,可以将至少一个突变或结构改变引入OML4或GSK2启动子,使得OML4或GSK2基因不表达(即,表达被消除)或表达被降低,如本文所定义。在可选的实施方案中,可以将至少一个突变引入OML4或GSK2基因,使得改变的基因不表达全长(即表达截短的)OML4或GSK2蛋白或不表达全功能OML4或GSK2蛋白。以此方式,OML4或GSK2多肽的活性可被视为如本文所述被降低或消除。在任何情况下,突变均可以导致OML4或GSK2表达而在体内没有、显著降低的或改变的生物活性。可选地,OML4或GSK2可以根本不表达。
在一个实施方案中,OML4基因的序列包含如SEQ ID NO:2(基因组)或其功能变体或同源物中定义的核酸序列或由其组成,并且编码如SEQ ID NO:1或其功能变体或同源物中定义的多肽。
“OML4启动子”意指在OML4 ORF(开放阅读框)的ATG密码子上游延伸至少2000-2500bp,优选2049bp的区域。在一个实施方案中,OML4启动子的序列包含如SEQ ID NO:3或其功能变体或同源物中定义的核酸序列或由其组成。类似地,“GSK2启动子”意指在GSK2ORF(开放阅读框)的ATG密码子上游延伸至少200-300bp,优选247bp的区域。在一个实施方案中,GSK2启动子的序列包含如SEQ ID NO:6或其功能变体或同源物中定义的核酸序列或由其组成。
在上述实施方案中,“内源”核酸可以指植物基因组中的天然或自然序列。在一个实施方案中,OML4基因的内源序列包含SEQ ID NO:2并且编码如SEQ ID NO:1中定义的氨基酸序列或其同源物。本发明的范围还包括上述鉴定的序列的功能变体(如本文所定义)和同源物。OML4同源物的实例显示在SEQ ID NO:7-9、13-15、19-21和25-27中。因此,在一个实施方案中,同源物编码选自SEQ ID NO:7、13、19或25的多肽,或同源物包含选自SEQ ID NO:8、14、20、26的核酸序列或由其组成。在还一个实施方案中,GSK2基因的内源序列包含SEQ IDNO:5并且编码如SEQ ID NO:4中定义的氨基酸序列或其同源物。本发明的范围还包括上述鉴定的序列的功能变体(如本文所定义)和同源物。GSK2同源物的实例显示在SEQ ID NO:10-12、16-18、22-24和28-30中。因此,在一个实施方案中,同源物编码选自SEQ ID NO:10、16、22或28的多肽,或同源物包含选自SEQ ID NO:11、17、23或29的核酸序列或由其组成。
如本文所用,关于本文提及的任何SEQ ID的术语“核酸序列的功能变体”是指保留完整非变体序列的生物学功能的变体基因序列或基因序列的一部分。功能变体还包括目的基因的变体,其具有不影响功能的序列改变,例如在非保守残基中。还涵盖基本上相同的变体,即与本文所示的野生型序列相比,仅具有一些序列变化,例如在非保守残基中,并且具有生物活性。导致在给定位点产生不影响编码多肽的功能特性的不同氨基酸的核酸序列改变是本领域熟知的。例如,氨基酸丙氨酸(疏水性氨基酸)的密码子可以被编码另一个疏水性较低的残基(例如甘氨酸)或疏水性较高的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子置换。类似地,还可以预期导致一个带负电荷的残基置换另一个(例如天冬氨酸置换谷氨酸)或一个带正电荷的残基置换另一个(例如赖氨酸置换精氨酸)的变化产生功能等同的产物。还将预期导致多肽分子的N-末端和C-末端部分改变的核苷酸变化不改变多肽的活性。提出的每一种修饰均在本领域的常规技术范围内,如编码产物的生物活性保留的测定。
在一个实施方案中,功能变体与非变体核酸或氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%总体序列同一性。
如本文所用,术语同源物还指OML4或GSK2启动子或来自其他植物物种的OML4或GSK2基因直向同源物。以递增的优先顺序,同源物可以与SEQ ID NO:1或4中任一项所示的氨基酸或与SEQ ID NO:2或5中所示的核酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%总体序列同一性。如上定义的OML4同源物的功能变体也在本发明的范围内。
“OML4”或“LARGE1”基因(这些术语在本文中可互换使用)编码Mei-2类蛋白OML4。这种蛋白的特征在于具有三个RNA识别基序或RRM。
在一个实施例中,RRM的序列选自:
SRTLFVRNINSNVEDSELKLLFEHFGDIRALYTACKHRGFVMISYYDIRSALNAKMELQNKALRRRKLDIHYSIPKD:SEQ ID NO:37
QGTIVLFNVDLSLTNDDLHKIFGDYGEIKEIRDTPQKGHHKIIEFYDVRAAEAALRALNRNDIAGKKIKLE:SEQ ID NO:38;和
LMIKNIPNKYTSKMLLAAIDENHKGTYDFIYLPIDFKNKCNVGYAFINM TNPQHIIPFYQTFNGKKWEKFNSEKVASLAYARIQGK:SEQ ID NO:39
因此,在一个实施方案中,OML4核酸(编码)序列编码包含至少一个RRM基序,优选所有三个如上定义的基序或其变体的OML4蛋白,其中变体与如本文定义的SEQ ID No 37至39中的至少一个具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%总体序列同一性。
“GSK2”基因(SHAGGY样激酶)编码丝氨酸/苏氨酸激酶,其是BIN2的直向同源物,并参与BR信号传导。
如果两个序列中的核苷酸或氨基酸残基的序列分别在如下所述的最大对应比对时是相同的,则称两个核酸序列或多肽是“相同的”。在两个或更多个核酸或多肽序列的背景下,术语“相同”或百分比“同一性”是指在比较窗口上进行比较和对齐以获得最大对应性时,相同的两个或更多个序列或子序列或具有特定百分比的相同的氨基酸残基或核苷酸,如使用以下序列比较算法之一或通过手动比对和目视检查进行测量的。当序列同一性百分比用于蛋白质或肽时,应认识到不相同的残基位置通常因保守氨基酸置换而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其他氨基酸残基置换,因此不改变分子的功能性质。在序列在保守置换方面不同的情况下,可以向上调整百分比序列同一性以校正置换的保守性质。用于进行这种调整的方法是本领域技术人员来熟知的。对于序列比较,通常一个序列充当参考序列,测试序列与之进行比较。当使用序列比较算法时,将测试和参考序列输入计算机,如有需要,指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,也可以指定可选参数。然后序列比较算法基于程序参数计算测试序列相对于参考序列的百分比序列同一性。适用于确定百分比序列同一性和序列相似性的算法的非限制性实例是BLAST和BLAST 2.0算法。
合适的同源物可以通过序列比较和保守结构域的鉴定来鉴定。本领域中存在可用于鉴定此类序列的预测因子。可以如本文所述鉴定同源物的功能,并且技术人员将因此能够确认该功能,例如当在植物中过表达时。
因此,本发明和本文所述的核苷酸序列也可用于从其他生物体,特别是其他植物(例如农作物)中分离相应的序列。以这种方式,例如PCR、杂交等方法可以用于基于它们与本文描述的序列的序列同源性来鉴定这些序列。在鉴定和分离同源物时,还可以考虑序列的拓扑结构和特征结构域结构。可以基于它们与整个序列或其片段的序列同一性来分离序列。在杂交技术中,已知核苷酸序列的全部或部分用作探针,该探针选择性地与来自所选植物的克隆基因组DNA片段或cDNA片段(即基因组或cDNA文库)群中存在的其他相应核苷酸序列杂交。杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用可检测的基团或任何其他可检测的标志物进行标记。制备用于杂交的探针和用于构建cDNA和基因组文库的方法通常是本领域已知的并且公开于Sambrook等人,(1989)MolecularCloning:A Library Manual(第二版,Cold Spring Harbor Laboratory Press,普莱恩维尤,纽约)。
此类序列的杂交可以在严格条件下进行。“严格条件”或“严格杂交条件”是探针将以比与其他序列更高的可检测程度与其靶序列杂交(例如,至少超过背景2倍)的预期条件。严格条件具有序列依赖性并且在不同情况下将不同。通过控制杂交和/或洗涤条件的严格性,可以鉴定与探针100%互补的靶序列(同源探测)。可选地,可以调整严格条件以使得序列中的一些错配,从而检测到较低程度的相似性(异源探测)。通常,探针的长度小于约1000个核苷酸,优选地小于500个核苷酸。通常,严格条件将是以下条件:在pH 7.0至8.3下,盐浓度小于约1.5M Na离子,通常约0.01至1.0M Na离子浓度(或其他盐),并且对于短探针(例如,10至50个核苷酸),温度为至少约30℃,对于长探针(例如,大于50个核苷酸),温度为至少约60℃。杂交持续时间通常少于约24小时,通常约4至12小时。添加去稳定剂(例如甲酰胺)也可以实现严格条件。
在还一个实施方案中,本文使用的变体可以包含编码如本文定义的OML4或GSK2多肽的核酸序列,其能够在如本文定义的严格条件下分别与SEQ ID NO:2或5中定义的核酸序列杂交。
在一个实施方案中,提供了一种增加植物的籽粒大小和/或粒重的方法,如本文所述,该方法包括降低或消除编码OML4多肽的至少一种核酸的表达,如本文所述,其中该方法包括将至少一个突变引入至少OML4基因和/或启动子,其中该OML4基因包含以下或由以下组成
a.编码如SEQ ID NO:1中的一项定义的多肽的核酸序列;或
b.如SEQ ID NO:2中的一项定义的核酸序列;或
c.与(a)或(b)具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%总体序列同一性的核酸序列;或
d.编码如本文定义的OML4多肽的核酸序列,其能够在如本文定义的严格条件下与(a)至(c)中任一项的核酸序列杂交。
并且其中OML4启动子包含以下或由以下组成
e.如SEQ ID NO:3中定义的核酸序列;
f.与(e)具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%总体序列同一性的核酸序列;或
g.能够在如本文定义的严格条件下与(e)至(f)中任一项的核酸序列杂交的核酸序列。
在优选的实施方案中,引入内源OML4基因或启动子或GSK2基因或其启动子以沉默、降低或抑制OML4或GSK2基因或蛋白的生物学活性和/或表达水平的突变可以选自以下突变类型
1.“错义突变”,其是导致一个氨基酸被另一个氨基酸置换的核酸序列的变化;
2.“无义突变”或“终止密码子突变”,其是导致引入提前终止密码子并因此终止翻译(导致截短的蛋白)的核酸序列的变化;植物基因含有翻译终止密码子“TGA”(RNA中为UGA)、“TAA”(RNA中为UAA)和“TAG”(RNA中为UAG);因此,导致这些密码子中的一个在正在被翻译的成熟mRNA中(在阅读框中)的任何核苷酸置换、插入、缺失均将终止翻译。
3.一个或更多个氨基酸的“插入突变”,由于在核酸的编码序列中已添加一个或更多个密码子;
4.一个或更多个氨基酸的“缺失突变”,由于在核酸的编码序列中已缺失一个或更多个密码子;
5.“移码突变”,导致核酸序列在突变下游的不同框架中翻译。移码突变可能有多种原因,例如一个或更多个核苷酸的插入、缺失或重复。
6.“剪接位点”突变,其是导致在剪接位点插入、缺失或置换核苷酸的突变。
如本文所用,“缺失”可以是指至少一个核苷酸的缺失。在一个实施方案中,所述缺失可以在1个至20个碱基对之间。在优选的实施方案中,至少一个突变是至少一个核苷酸的缺失。
通常,技术人员将理解如上定义并且导致与野生型OML4或GSK 2启动子或OML4或GSK2核酸或蛋白序列相比插入、缺失或置换至少一种核酸或氨基酸的至少一个突变可以分别影响OML4蛋白或GSK2蛋白的生物活性。
在一个实施方案中,突变是功能缺失突变,例如提前终止密码子,或预测对蛋白结构很重要的高度保守区域中的氨基酸变化。
在一个实施方案中,可以将突变引入OML4基因的如本文定义的至少一种RRM中。在可选的或还一实施方案中,突变可以是OML4中磷酸化位点的置换或缺失。在一个实施方案中,突变可以在SEQ ID NO:1的位置S105、S146和/或S607或同源序列中的同源位置。优选地,突变阻止OML4在这些位点中的一个或更多个处的磷酸化。如实例中所述,在这些位点中的一个或更多个处阻止OML4的磷酸化(通过GSK2)降低OML4的蛋白水平。
在另一个实施方案中,突变被引入OML4或GSK2启动子并且至少是至少一个核酸的缺失和/或插入。还包括其他主要变化,例如移除启动子功能区的缺失,因为这些将降低OML4和GSK2的表达。
在一个实施方案中,可以将至少一个突变引入OML4启动子并且将至少一个突变引入OML4基因。在还一实施方案中,还可以将至少一个突变引入GSK2基因并且将至少一个突变引入GSK2启动子。
在一个实施方案中,使用诱变或靶向基因组编辑引入突变。即,在一个实施方案中,本发明涉及方法和通过上述基因工程化方法产生的植物,并且不涵盖天然存在的品种。
靶向基因组修饰或靶向基因组编辑是基因组工程化技术,其使用靶向DNA双链断裂(DSB)通过同源重组(HR)介导的重组事件来刺激基因组编辑。为了通过引入位点特异性DNA DSB实现有效的基因组编辑,可以使用四大类可定制的DNA结合蛋白:源自微生物可移动遗传元件的大范围核酸酶、基于真核转录因子的ZF核酸酶、来自黄单胞菌属(Xanthomonas)细菌的转录激活因子样效应子(TALE)以及来自II型细菌适应性免疫系统CRISPR(成簇的规则间隔的短回文重复序列)的RNA引导的DNA核酸内切酶Cas9。大范围核酸酶、ZF和TALE蛋白均通过蛋白质-DNA相互作用识别特定DNA序列。尽管大范围核酸酶整合核酸酶和DNA结合结构域,但ZF和TALE蛋白由分别靶向3个或1个DNA核苷酸(nt)的单独模块组成。ZF和TALE可以以期望的组合组装并附接至FokI的核酸酶结构域,以将溶核活性导向特定的基因组位点。
在优选的实施方案中,可以根据本发明的各方面使用的基因组编辑方法是CRISPR。该技术在基因组编辑中的使用在本领域中已充分描述,例如在US 8,697,359和本文引用的参考文献中。简言之,CRISPR是一种微生物核酸酶系统,参与防御入侵的噬菌体和质粒。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸切割(sgRNA)特异性的非编码RNA元件的组合。已在广泛的细菌宿主中鉴定出三种类型(I-III)的CRISPR系统。每个CRISPR基因座的一个关键特征是存在一系列重复序列(同向重复),它们被短片段的非重复序列(间隔子)隔开。非编码CRISPR阵列在同向重复序列中被转录和切割成含有单个间隔子的短crRNA,其引导Cas核酸酶至靶位点(原间隔子)。II型CRISPR是最充分表征的系统之一并且以四个连续步骤进行靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA、前体crRNA阵列和tracrRNA。其次,tracrRNA与前体crRNA的重复区域杂交,并介导前体crRNA加工成含有单个间隔子的成熟crRNA。第三,成熟crRNA:tracrRNA复合物通过crRNA上的间隔子和与原间隔子相邻基序(PAM)相邻的靶DNA上的原间隔子之间的Watson-Crick碱基配对将Cas9引导至靶DNA,这是对靶标识别的另外要求。最后,Cas9介导靶DNA的切割以在原间隔子内产生双链断裂。
与传统的基因靶向和其他可编程核酸内切酶相比,CRISPR-Cas9系统的一个主要优势在于易于复用,其中多个基因可以同时突变,仅需使用多个sgRNA,它们各自靶向不同基因。此外,如果在基因组区域的侧翼使用两个sgRNA,则可以缺失或倒置中间部分(Wiles等人,2015)。
因此,Cas9是II型CRISPR-Cas系统的标志性蛋白,并且是大型单体DNA核酸酶,通过两种非编码RNA:CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)的复合物引导至与PAM(原间隔子相邻基序)序列基序相邻的DNA靶序列。Cas9蛋白含有与RuvC和HNH核酸酶同源的两个核酸酶结构域。HNH核酸酶结构域切割互补DNA链,而RuvC样结构域切割非互补链,因此,在靶DNA中引入平口切割。Cas9与sgRNA一起的异源表达可以将位点特异性双链断裂(DSB)引入来自各种生物体的活细胞的基因组DNA中。对于真核生物体中的应用,已使用最初来自酿脓链球菌(Streptococcus pyogenes)细菌的Cas9的密码子优化形式。可选地,可以将另一种Cas蛋白Cpf1用作核酸内切酶。Cpf1在几个方面与Cas9不同:Cpf1需要富含T的PAM序列(TTTV)用于靶标识别,Cpf1不需要tracrRNA(即仅需要crRNA),并且Cpf1切割位点位于原间隔子中PAM序列的远端和下游(Li等人,2017)。此外,在鉴定PAM基序后,Cpf1引入粘性末端样DNA双链断裂,带有突出端的几个核苷酸。因此,CRISPR/CPf1系统由Cpf1酶和crRNA组成。在还一个可选实施方案中,核酸酶可以是MAD7。
单向导RNA(sgRNA)是CRISPR/Cas(Cpf或MAD7)系统的第二组成部分,其与Cas9/Cpf1/MAD7核酸酶形成复合物。sgRNA是通过crRNA与tracrRNA融合构建的合成RNA嵌合体。位于其5'端的sgRNA向导序列赋予DNA靶标特异性。因此,通过修饰向导序列,可以构建具有不同靶标特异性的sgRNA。向导序列的规范长度为20bp。
可以如本领域所述构建用于本发明的方法的Cas9(或Cpf1/MAD7)表达质粒。Cas9或Cpf1或MAD7和一个或更多个sgRNA分子可以作为单独的或作为单个构建体递送。当使用单独的构建体来递送CRISPR酶(即Cas9或Cpf1或MAD7)和sgRNA分子时,用于驱动CRISPR酶/sgRNA分子表达的启动子可以相同或不同。在一个实施方案中,RNA聚合酶(Pol)II依赖性启动子或CaMV35S启动子可用于驱动CRISPR酶的表达。在另一个实施方案中,Pol III依赖性启动子,例如U6或U3,可用于驱动sgRNA的表达。
因此,使用本领域已知的技术,可以设计sgRNA分子(例如https:// chopchop.cbu.uib.no/),可以找到靶位点并设计靶向如本文所述的OML4或GSK2基因或启动子序列的sgRNA分子。在一个实施方案中,sgRNA分子靶向选自SEQ ID NO:33(OML4靶序列)或SEQ ID NO:34(GSK2靶序列)的序列或其变体,如本文所定义。在还一实施方案中,sgRNA分子包含选自SEQ ID NO:35(OML4靶序列)或SEQ ID NO:36(GSK2靶序列)的原间隔子或其变体,如本文所定义。
在一个实施方案中,该方法使用下文详细定义的sgRNA构建体将靶向突变引入OML4基因和/或启动子,并且在还一实施方案中,将突变另外引入GSK2基因和/或启动子。
因此,本发明的方面涉及靶向诱变方法,特别是基因组编辑,并且在优选的实施方案中排除仅基于通过传统育种方法产生植株的实施方案。
可以使用技术人员已知的任何合适的方法将基因组编辑构建体引入植物细胞中(术语“引入”可以与“转化”互换使用,如下所述)。在可选的实施方案中,本文所述的任何核酸构建体可以首先被转录以形成预组装的Cas9(或其他CRISP核酸酶)-sgRNA核糖核蛋白,然后使用任何上述方法(例如脂转染、电穿孔、生物射弹轰击或显微注射)递送至至少一个植物细胞。
使用上述CRISPR构建体的具体方案将是技术人员熟知的。作为一个实例,在Ma和Liu(“CRISPR/Cas-based multiplex genome editing in monocot and dicot plants”)中描述了合适的方案,其通过引用并入本文。
本发明还扩展至通过本文所述的任何方法获得或可获得的植物。
可选地,可以使用更常规的诱变方法将至少一个突变引入OML4基因或OML4启动子序列,或引入GSK2基因或GSK2启动子序列。这些方法包括物理诱变和化学诱变。技术人员将知晓可以使用其他方法来产生此类突变体,并且用于诱变和多核苷酸改变的方法是本领域熟知的。参见,例如,Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等人(1987)Methods in Enzymol.154:367-382;美国专利号4,873,192;Walker和Gaastra,编辑(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York)及其中引用的参考文献。
在一个实施方案中,使用插入诱变,例如使用T-DNA诱变(其将来自根癌农杆菌(Agrobacterium tumefaciens)T-质粒的T-DNA片段插入DNA,导致基因功能缺失或基因功能突变获得)、位点定向核酸酶(site-directed nuclease)(SDN)或转座子作为诱变剂。插入诱变是破坏基因功能的可选方法并且基于将外源DNA插入目的基因(参见Krysan等人,The Plant Cell,第11卷,2283–2290,1999年12月)。因此,在一个实施方案中,T-DNA用作插入诱变剂以破坏OML4或GSK2基因或OML4或GSK2启动子表达。T-DNA不仅破坏其所插入的基因的表达,而且还充当随后鉴定突变的标志物。由于插入元件的序列是已知的,因此可以使用各种克隆或基于PCR的策略恢复发生插入的基因。插入一段长度为5至25kb的T-DNA通常破坏基因功能。如果产生足够多的T-DNA转化系群,则有相当好的机会找到在任何目的基因中携带T-DNA插入物的转基因植物。用T-DNA转化孢子是通过农杆菌介导的方法实现的,该方法涉及将植物细胞和组织暴露于农杆菌细胞的悬浮液。
该方法的详细信息是技术人员熟知的。简言之,农杆菌对植物的转化导致被称为T-DNA的序列整合到核基因组中,该序列由细菌质粒携带。使用T-DNA转化导致稳定的单次插入。对所得转化系的进一步突变分析易于进行并且每个单独的插入系可以通过直接测序和分析插入侧翼的DNA来快速表征。将突变体中的基因表达与野生型植物中OML4或GSK2核酸序列的表达进行比较,并进行表型分析。
在另一个实施方案中,诱变是物理诱变,例如应用紫外线辐射、X射线、γ射线、快中子或热中子或质子。然后可以筛选靶向群体以鉴定OML4或GSK2功能缺失突变体。
在本发明的各方面的另一个实施方案中,该方法包括用诱变剂诱变植物群。诱变剂可以是快中子辐照或化学诱变剂,例如选自以下非限制性列表:甲磺酸乙酯(EMS)、甲磺酸甲酯(MMS)、N-乙基-N-亚硝基脲(ENU)、三乙基三聚氰胺(1'EM)、N-甲基-N-亚硝基脲(MNU)、丙卡巴肼、苯丁酸氮芥、环磷酰胺、硫酸二乙酯、丙烯酰胺单体、美法仑、氮芥、长春新碱、二甲基亚硝胺、N-甲基-N'-硝基-亚硝基胍(MNNG)、亚硝基胍、2-氨基嘌呤、7,12二甲基苯并(a)蒽(DMBA)、环氧乙烷、六甲基磷酰胺、白消安(bisulfan)、二环氧烷烃(二环氧辛烷(DEO)、二环氧丁烷(BEB)等)、2-甲氧基-6-氯-9[3-(乙基-2-氯乙基)氨基丙基氨基]吖啶二盐酸盐(ICR-170)或甲醛。再次,然后可以筛选靶向群体以鉴定OML4或GSK2基因或启动子突变体。
在另一个实施方案中,用于构建和分析突变的方法是靶向基因组中诱导的局部损伤(TILLING),综述于Henikoff等人,2004。在这种方法中,种子用化学诱变剂(例如EMS)进行诱变。产生的M1植株是自授粉的,并且M2代个体用于制备DNA样品以进行突变筛选。将DNA样品合并且排列在微量滴定板上,并进行基因特异性PCR。可以使用鉴定野生型和突变基因之间的异源双链体的任何方法来筛选PCR扩增产物的靶基因突变。例如,但不限于,变性高压液相色谱(dHPLC)、恒变性毛细管电泳(CDCE)、温度梯度毛细管电泳(TGCE),或通过使用化学切割的片段化。优选地,PCR扩增产物与优先切割野生型和突变型序列之间的异源双链中的错配的核酸内切酶一起孵育。使用自动测序凝胶装置对切割产物进行电泳,并借助标准的商业图像处理程序分析凝胶图像。任何对OML4或GSK2核酸序列特异的引物均可用于扩增合并的DNA样品中的OML4或GSK2核酸序列。优选地,引物被设计成扩增最有可能出现有用突变的OML4或GSK2基因区域,特别是在高度保守和/或赋予活性的基因区域中,如在别处所解释。为了便于在凝胶上检测PCR产物,可以使用任何常规标记方法标记PCR引物。在另一个实施方案中,用于产生和分析突变的方法是EcoTILLING。EcoTILLING是类似于TILLING的分子技术,不同之处在于它的目标是揭示既定种群的自然变异,而不是诱导突变。在Comai等人2004中描述了EcoTILLING方法的第一个出版物。
因此,快速高通量筛选程序实现分析扩增产物以鉴定与相应的未诱变野生型植物相比赋予OML4或GSK2基因表达降低或失活的突变。一旦在目的基因中鉴定出突变,携带该突变的M2植物的种子长成成年M3植株,并筛选与靶基因相关的表型特征。因此可以鉴定与对照相比具有增加的粒重和/或籽粒大小的功能缺失和降低的突变体。
通过这种方法获得或可获得的在内源OML4基因或启动子基因座中携带部分或完全功能缺失突变的植物也在本发明的范围内
在可选的实施方案中,OML4或GSK2基因的表达可以在转录或翻译水平上降低。例如,本文定义的OML4或GSK2核酸的表达可以使用本领域技术人员已知的许多基因沉默方法来降低或沉默,例如,但不限于使用针对OML4或GSK2的小干扰核酸(siNA)。
“基因沉默”是通常用于指通过由RNA分子介导的序列特异性相互作用抑制基因的表达的术语。降低的程度可以完全消除编码基因产物的产生,但更常见的是,表达的消除是部分的,保留了某种程度的表达。因此,该术语不应被视为要求表达完全“沉默”。
在一个实施方案中,siNA可以包括能够介导RNA干扰的短干扰RNA(siRNA)、双链RNA(dsRNA)、微小RNA(miRNA)、antagomir和短发夹RNA(shRNA)。
表达和/或活性的抑制可以通过使用技术人员熟知的技术确定OML4或GSK2转录物的存在和/或量来测量(如Northern印迹、RT-PCR等)。
转基因可用于抑制内源植物基因。这最初是在矮牵牛中的查尔酮合酶转基因引起内源查尔酮合酶基因的抑制并以易于观察到的色素沉着变化指示时发现的。随后描述了有多少(如若并非全部)植物基因可以被转基因“沉默”。基因沉默需要转基因与变得沉默的基因之间具有序列相似性。该序列同源性可能涉及沉默靶基因的启动子区或编码区。当涉及编码区时,能够引起基因沉默的转基因可以已经使用启动子构建,该启动子将转录编码序列RNA的有义或反义方向。基因沉默的各种实例很可能涉及尚未很好理解的不同机制。在不同实例中,可能存在转录或转录后基因沉默,并且两者均可以根据本发明的方法使用。
在文献中被广泛地描述了基因沉默的机制及其在基因工程中的应用,这种机制在20世纪90年代初在植物中首次发现,然后在秀丽隐杆线虫(Caenorhabditis elegans)中显示。
RNA干扰(RNAi)是可以根据本发明的方法使用的另一种转录后基因沉默现象。这是由双链RNA诱导的,其中与dsRNA同源的mRNA被特异性降解。它是指由短干扰RNA(siRNA)介导的序列特异性转录后基因沉默的过程。当酶DICER遇到dsRNA并将其切成称为小干扰RNA(siRNA)的片段时,RNAi的过程开始。该酶属于RNase III核酸酶家族。蛋白复合物聚集这些RNA残留物,并使用它们的代码作为向导,以搜索和破坏细胞中具有匹配序列的任何RNA,例如靶mRNA。
人工和/或天然微小RNA(miRNA)可用于敲除基因表达和/或mRNA翻译。微小RNA(miRNA)miRNA通常是单链小RNA,长度通常为19-24个核苷酸。大多数植物miRNA与其靶序列具有完美或接近完美的互补性。然而,有至多五个不匹配的天然靶标。它们是由Dicer家族的双链特异性RNase从具有特征折回结构的较长非编码RNA加工获得。加工后,它们通过与其主要组分Argonaute蛋白结合而被整合到RNA诱导的沉默复合物(RISC)中。miRNA作为RISC的特异性组分,因为它们与细胞质中的靶核酸(主要是mRNA)进行碱基配对。随后的调控事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的影响通常反映在靶基因mRNA水平降低上。人工微小RNA(amiRNA)技术已应用于拟南芥和其他植物中,以有效地沉默目的靶基因。amiRNA的设计原则已被推广并集成到基于Web的工具(http://wmd.weigelworld.org)中。
因此,根据本发明的各方面,植物可以被转化以引入已经设计用于靶向OML4或GSK2核酸序列的表达并选择性降低或抑制基因表达或其转录本的稳定性的RNAi、shRNA、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、amiRNA或共抑制分子。优选地,根据本发明的各方面使用的RNAi、snRNA、dsRNA、shRNA siRNA、miRNA、amiRNA、ta-siRNA或共抑制分子包含至少17nt、优选22至26nt的片段,并且可以在SEQ ID NO:2、5、8、11、14、17、20、23、26和29中任一个所示的信息的基础上进行设计。用于设计有效siRNA的指南是本领域技术人员已知的。简言之,选择靶基因序列的短片段(例如,长度为19-40个核苷酸)作为本发明的siRNA的靶序列。靶基因序列的短片段是靶基因mRNA的片段。在优选的实施方案中,选择来自靶基因mRNA的序列片段作为候选siRNA分子的标准包括1)距天然mRNA分子的5'或3'端至少50-100个核苷酸的来自靶基因mRNA的序列,2)G/C含量为30%至70%,最优选为约50%的来自靶基因mRNA的序列,3)不含有重复序列(例如,AAA、CCC、GGG、TTT、AAAA、CCCC、GGGG、TTTT)的来自靶基因mRNA的序列,4)在mRNA中可接近的来自靶基因mRNA的序列,5)对靶基因是唯一的来自靶基因mRNA的序列,6)避开起始密码子75个碱基内的区域。来自靶基因mRNA的序列片段可以满足一种或更多种上述标准。将所选基因作为核苷酸序列引入预测程序,该预测程序考虑上述所有变量以设计最佳寡核苷酸。该程序扫描任何mRNA核苷酸序列以寻找易被siRNA靶向的区域。该分析的输出是可能的siRNA寡核苷酸的评分。最高评分用于设计通常通过化学合成制备的双链RNA寡核苷酸。除了与mRNA靶区域互补的siRNA外,简并siRNA序列还可用于靶向同源区域。根据本发明的siRNA可以通过本领域已知的任何方法合成。优选地使用适当保护的核糖核苷亚磷酰胺和常规的DNA/RNA合成仪化学合成RNA。此外,siRNA可以获自商业RNA寡核苷酸合成供应商。
使用常规方法(例如载体和农杆菌介导的转化)将沉默RNA分子引入植物。生成稳定转化的植物并分析与野生型对照植物相比OML4或GSK2基因的表达。
OML4或GSK2核酸序列的沉默还可以使用病毒诱导的基因沉默来实现。
因此,在本发明的一个实施方案中,植物表达核酸构建体,该构建体包含靶向如本文所述的OML4核酸序列并降低内源OML4核酸序列表达的RNAi、shRNA、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、amiRNA或共抑制分子。例如,当与对照植物相比,RNAi、snRNA、dsRNA、siRNA、shRNA miRNA、ta-siRNA、amiRNA或共抑制分子选择性地降低或抑制基因的表达时,该基因被靶向。可选地,当在严格条件下RNAi、shRNA、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、amiRNA或共抑制分子与基因转录物杂交时,该RNAi、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、amiRNA或共抑制分子靶向OML4或GSK2核酸序列。
基因沉默的还一种方法是靶向与OML4或GSK2的基因调控区(例如,启动子和/或增强子)互补的核酸序列,以形成阻止基因在靶细胞中转录的三螺旋结构。其他方法,例如使用针对内源多肽的抗体来抑制其在植物中的功能,或干扰涉及多肽的信号传导通路,将是本领域技术人员熟知的。特别地,可以设想人造分子可用于抑制靶多肽的生物学功能,或用于干扰涉及靶多肽的信号传导通路。
在另一方面,本发明涉及通过本文所述的方法可获得或获得的沉默构建体以及包含这种构建体的植物细胞。在一个实例中,沉默GSK2的RNAi构建体包含SEQ ID NO:31或其功能变体中定义的序列或由其组成。
在另一方面,本发明扩展至通过本文所述的方法获得或可获得的植物。
增加粒数的方法
在本发明的另一方面,提供了一种增加植物的粒数的方法。如图4(m)所示,过表达OML4导致粒数显著增加。因此,在本发明的还一方面,提供了一种增加植物的粒数的方法,该方法包括增加OML4的表达和/或活性。优选地,所述增加相对于野生型或对照植物。
在一个实施方案中,粒数的“增加”可以包括与野生型或对照植物的粒数相比增加至少5%、10%、15%、20%、25%、30%、35%、40%、45%或50%。在一个实施方案中,粒数的增加可以是每穗粒数的增加。可以使用本领域中的标准技术测量上述任何一种。
在本发明的还一方面,该方法还包括增加SHAGGY样激酶(GSK2)的表达或活性。
在一个实施方案中,该方法可以包括在植物或植物细胞中引入和表达核酸构建体,该核酸构建体包含编码如SEQ ID NO:1中定义的OML4多肽或其同源物或功能变体的核酸序列,如本文所定义。优选地,核酸序列可操作地连接至调控序列,优选启动子。在另一个实施方案中,核酸构建体可以包含编码如上定义的OML4多肽的第一核酸序列和编码如SEQID NO:4中定义的GSK2多肽的第二核酸序列或其同源物或功能变体。优选地,第一和第二核酸序列可操作地连接至调控序列,优选启动子。第一和第二核酸序列可以可操作地连接至相同或不同的调控序列。
在可选的实施方案中,该方法可以包括引入和表达包含编码如上定义的OML4多肽的核酸序列的第一核酸构建体和包含编码如上定义的GSK2多肽的核酸序列的第二核酸构建体。再次,核酸序列优选地可操作地连接至调控序列。可以在第一核酸构建体之前、之后或同时在植物中引入和表达第二核酸构建体。
本文描述了用于将如上所述的核酸构建体引入植物或植物细胞的方法(也称为“转化”(这些术语可以互换使用))。在一个实施方案中,子代植物用本文所述的核酸构建体稳定转化,并且包含在植物细胞中可遗传维持的一种或更多种外源多肽。该方法还可以包括从选定的子代植物收集种子的另外步骤。
该方法可以进一步包括从植物细胞再生转基因植物的步骤,其中转基因植物在其基因组中包含选自SEQ ID NO:2的核酸序列和选自SEQ ID NO:5的核酸序列或同源物或其功能变体,以及获得源自转基因植物的子代,其中子代表现出粒数的增加。
在还一个实施方案中,该方法可以包括将突变引入植物基因组,其中所述突变是插入编码OML4多肽或其同源物或变体的核酸的至少一个或更多个另外的拷贝,使得所述序列可操作地连接至调控序列,并且其中使用靶向基因组编辑引入所述突变。优选地,与对照或野生型植物相比,所述突变导致OML4核酸的表达增加。在另外的实施方案中,该方法可以进一步包括将一个或更多个进一步的突变引入植物基因组,其中一个或更多个另外的突变是插入编码GSK2多肽或其同源物或功能变体的核酸的至少一个或更多个另外的拷贝,使得所述序列可操作地连接至调控序列。再次,优选地,使用靶向基因组编辑引入突变。优选地,与对照或野生型植物相比,突变还导致GSK2多肽的表达增加。水稻OML4和GSK2的基因组和氨基酸序列及其同源物定义如下。
在一个实施方案中,使用本文所述的CRISPR引入突变。
本发明还扩展至通过本文所述的任何方法获得或可获得的植物。
基因改变或修饰的植物和产生此类植物的方法
在本发明的另一方面,提供了一种基因改变的植物、其部分或植物细胞,其特征在于该植物不表达OML4,具有降低的OML4表达水平,不表达功能性OML4蛋白或表达功能和/或活性降低的OML4蛋白。例如,植物是功能降低(敲低)或缺失(敲除)的突变体,其中与野生型对照植物相比,OML4核酸序列的功能降低或缺失。为此,将突变引入OML4基因序列或相应的启动子序列,从而破坏基因的转录。因此,优选地,所述植物在OML4的启动子和/或基因中包含至少一个突变。在一个实施方案中,该植物可以在OML4的启动子和基因中均包含突变。
在还一个实施方案中,基因改变的植物、其部分或植物细胞的进一步特征在于植物不表达GSK2,具有降低的GSK2表达水平,不表达功能性GSK2蛋白或表达功能和/或活性降低的GSK2蛋白。
在本发明的还一方面,提供了一种植物、其部分或植物细胞,其特征在于与野生型或对照植物相比,粒重和/或籽粒大小增加,其中优选地,植物在OML4基因和/或其启动子中包含至少一个突变。
可以通过任何上述方法将突变,优选缺失、插入或置换引入OML4基因和/或启动子序列来产生植物。优选地,将所述突变引入至少一个植物细胞和从该至少一个突变植物细胞再生的植物。
可选地,植物或植物细胞可以包含核酸构建体,该核酸构建体表达靶向如本文所述的OML4或GSK2基因的RNAi分子。在一个实施方案中,所述构建体被稳定地掺入植物基因组中。这些技术还包括使用靶向目的基因并使得在特定位点整合转基因的载体进行基因靶向。靶向构建体经工程化以与靶基因重组,这是通过将来自基因本身的序列整合到构建体中来完成的。然后在基因内该序列的区域发生重组,导致插入外源序列以破坏基因。如果其序列被打断,改变的基因将被翻译成无功能蛋白,如果它被翻译的话。
在本发明的另一方面,提供了一种用于产生如本文所述的基因改变的植物的方法。在一个实施方案中,该方法包括使用本文所述的任何诱变技术将至少一个突变引入优选至少一个植物细胞的OML4基因和/或OML4启动子。在还一个实施方案中,该方法包括进一步将至少一个突变引入GSK2基因和/或GSK2启动子中。优选地,所述方法进一步包括从突变的植物细胞再生植物。
该方法可以进一步包括选择一种或更多种突变植物,优选用于进一步繁殖。优选地,所述选择的植物在靶基因和/或启动子序列中包含至少一个突变。优选地,所述植物或所述植物的所述种子的特征在于OML4表达水平的消除或降低和/或OML4多肽活性水平降低。OML4的表达和/或活性水平可以通过技术人员已知的任何标准技术来测量。降低如本文所述。
选择的植物可以通过多种方式繁殖,例如通过克隆繁殖或经典育种技术。例如,第一代(或T1)转化植物可以是自交并选择纯合的第二代(或T2)转化体,然后T2植物可以通过经典育种技术进一步繁殖。产生的转化生物体可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如,所有转化为含有表达盒的细胞);转化和未转化组织的移植物(例如,在植物中,将转化的砧木嫁接到未转化的接穗上)。
在本发明的还一方面,提供了通过上述方法获得或可获得的植物。
在本发明的另一方面,提供了一种基因改变的植物、其部分或植物细胞,其特征在于与对照或野生型植物中的表达水平相比OML4的表达增加。优选地,植物表达对该植物是外源的或内源的多核苷酸。即,通过有性杂交以外的任何方式引入植物中的多核苷酸。在该方法的一个实施方案中,外源核酸在转基因植物中表达,其是包含如上所述的核酸构建体的核酸构建体。可选地,植物在其基因组中携带突变,其中突变是插入编码如本文定义的OML4多肽或其同源物或变体的核酸序列的至少一个或更多个另外的拷贝,使得所述序列可操作地连接至调控序列。植物还可以在植物基因组中包含第二突变,其中该突变是插入编码如本文定义的GSK2多肽或其同源物或变体的核酸序列的至少一个或更多个另外的拷贝,使得所述序列可操作地连接至调控序列。优选地,使用靶向基因组编辑引入突变。
为了本发明的目的,“基因改变的植物”或“突变植物”是与天然存在的野生型(WT)植物相比已经基因改变的植物。在一个实施方案中,突变植物是与天然存在的野生型(WT)植物相比已使用诱变方法(例如本文所述的任何诱变方法)改变的植物。在一个实施方案中,诱变方法是靶向基因组修饰或基因组编辑。在一个实施方案中,与野生型序列相比,已使用诱变方法改变植物基因组。此类植物具有如本文所述的改变的表型,例如增加的疾病抗性。因此,在一个实例中,增加的粒重和/或籽粒大小是由改变的植物基因组的存在赋予的,例如,突变的内源OML4基因或OML4启动子序列。在一个实施方案中,使用靶向基因组修饰特异性靶向内源启动子或基因序列,并且突变基因或启动子序列的存在不是由植物中表达的转基因的存在赋予的。换言之,基因改变的植物可以被描述为无转基因。
根据本发明各方面(包括本文所述的转基因植物、方法和用途)的植物可以是单子叶植物或双子叶植物。优选地,植物是农作物。农作物是指以商业规模种植以供人或动物消费或使用的任何植物。
优选地,农作物选自水稻、小麦、玉米、大豆和芸苔属植物,例如甘蓝型油菜(B.napus)。更优选地,农作物是水稻,甚至更优选地是粳稻(japonica)或籼稻(indica)品种。
如本文所用,术语“植物”涵盖整株植物的子代和植物部分,包括种子、果实、芽、茎、叶、根(包括块茎)、花、组织和器官,其中前述的每一种包括本文所述的突变中的至少一种或如本文所述的sgRNA或RNAi构建体。术语“植物”还涵盖植物细胞、悬浮培养物、愈伤组织、胚胎、分生组织区、配子体、孢子体、花粉和小孢子,其中前述的每一种均包含本文所述的突变或如本文所述的核酸构建体、sgRNA或RNAi构建体中的至少一种。因此,在一个实施方案中,植物部分是籽粒或种子。
本发明还扩展至如本文所述的本发明植物的可收获部分,但不限于种子、叶、果实、花、茎、根、根茎、块茎和鳞茎。本发明的方面还扩展至源自,优选地直接源自此类植物的可收获部分的产品,例如干颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。可源自本发明的植物的可收获部分的另一种产品是生物柴油。本发明还涉及包含本发明的植物或其部分的食品和食品补充剂。在一个实施方案中,食品可以是动物饲料。在本发明的另一方面,提供了源自如本文所述的植物或其部分的产品。
在最优选的实施方案中,植物部分或可收获的产品是种子或籽粒。因此,在本发明的还一方面,提供了由本文所述的基因改变的植物产生的种子。
在可选的实施方案中,植物部分是花粉、本文所述的基因改变的植物的繁殖体或子代。因此,在本发明的还一方面,提供了如本文所述的基因改变的植物的花粉、繁殖体或子代。
如本文所用,根据本发明的所有方面的对照植物是尚未根据本发明的方法进行修饰的植物。因此,在一个实施方案中,对照植物不具有降低的OML4核酸表达和/或降低的OML4多肽活性。在可选的实施方案中,如上所述,植物经基因修饰。在一个实施方案中,对照植物是野生型植物。对照植物通常是相同的植物物种,优选地具有与修饰的植物相同的遗传背景。
与本文所述的靶向基因组修饰方法一起使用的基因组编辑构建体
“crRNA”或CRISPR RNA是指含有原间隔子元件和与tracrRNA互补的另外的核苷酸的RNA序列。
“tracrRNA”(反式激活RNA)意指与crRN杂交并结合CRISPR酶的RNA序列,例如Cas9,从而激活核酸酶复合物以在至少一个OML4或GSK2核酸或启动子序列的基因组序列内的特定位点引入双链断裂。
“原间隔子元件”意指与基因组DNA靶序列互补的crRNA(或sgRNA)部分,长度通常为约20个核苷酸。这也可以称为间隔子或靶向序列。
“sgRNA”(单向导RNA)意指在单个RNA分子中tracrRNA和crRNA的组合,优选地还包括接头环(其将tracrRNA和crRNA连接成单个分子)。“sgRNA”还可以称为“gRNA”,并且在本文中,这些术语是可互换使用的。sgRNA或gRNA为Cas核酸酶提供靶向特异性和支架/结合能力两者。gRNA可以指包含crRNA分子和tracrRNA分子的双重RNA分子。
“TAL效应子”(转录激活因子样(TAL)效应子)或TALE意指可以结合基因组DNA靶序列(例如OML4基因内的序列或启动子序列)并且可以与核酸内切酶(例如FokI)的切割结构域融合以构建TAL效应核酸酶,或与TALENS或大范围核酸酶的切割结构域融合以构建megaTAL的蛋白序列。TALE蛋白由负责DNA结合的中心结构域、核定位信号和激活靶基因转录的结构域组成。DNA结合结构域由单体组成,并且每个单体可以结合靶核苷酸序列中的一个核苷酸。单体是33-35个氨基酸的串联重复,其中位于位置12和13的两个氨基酸是高度可变的(重复可变二残基,RVD)。负责识别单个特定核苷酸的是RVD。HD靶向胞嘧啶;NI靶向腺嘌呤,NG靶向胸腺嘧啶,以及NN靶向鸟嘌呤(尽管NN也可以以较低的特异性结合腺嘌呤)。
在本发明的另一方面,提供了一种核酸构建体,其中该核酸构建体编码至少一个DNA结合结构域,其中DNA结合结构域可以结合OML4基因中的序列,其中所述序列包含SEQID NO:33或其变体或由其组成。在可选的实施方案中,DNA结合结构域可以与GSK2基因中的序列结合,其中所述序列包含SEQ ID NO:34或其变体或由其组成。在一个实施方案中,所述构建体还包含编码SSN(例如FokI或Cas蛋白)的核酸。
在一个实施方案中,核酸构建体编码至少一种原间隔子元件,其中原间隔子元件的序列选自SEQ ID NO:35(以靶向OML4)或SEQ ID NO:36(以靶向GSK2)或其变体。
在还一个实施方案中,核酸构建体包含crRNA编码序列。如上所定义,crRNA序列可以包含如上定义的原间隔子元件和优选地与tracrRNA互补的另外的核苷酸。另外的核苷酸的适当序列是本领域技术人员已知的,因为这些由Cas蛋白的选择定义。
在另一个实施方案中,核酸构建体还包含tracrRNA序列。再次,适当的tracrRNA序列是技术人员已知的,因为该序列由Cas蛋白的选择来定义。
在还一个实施方案中,核酸构建体包含至少一个编码sgRNA(或gRNA)的核酸序列。再次,如已经讨论的,sgRNA通常包含crRNA序列、tracrRNA序列并且优选地包含用于接头环的序列。
在还一个实施方案中,核酸构建体还可以包含编码核糖核酸内切酶切割位点的至少一个核酸序列。优选地,核糖核酸内切酶是Csy4(也称为Cas6f)。在核酸构建体包含多个sgRNA核酸序列的情况下,构建体可以包含相同数量的核糖核酸内切酶切割位点。在另一个实施方案中,切割位点是sgRNA核酸序列的5'。因此,每个sgRNA核酸序列的侧翼是核糖核酸内切酶切割位点。
术语“变体”是指核苷酸序列,其中核苷酸与上述序列中的一个基本上相同。变体可以通过一个或更多个核苷酸的修饰(例如插入、置换或缺失)来实现。在优选的实施方案中,变体与上述序列中任一项具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%同一性。在一个实施方案中,序列同一性为至少90%。在另一个实施方案中,序列同一性为100%。序列同一性可以通过本领域中任何一种已知的序列比对程序来确定。
本发明还涉及一种核酸构建体,该核酸构建体包含与合适的植物启动子可操作地连接的核酸序列。合适的植物启动子可以是组成型启动子或强启动子,或者可以是组织特异性启动子。在一个实施方案中,合适的植物启动子选自但不限于U3和U6。
本发明的核酸构建体还可以进一步包含编码CRISPR酶的核酸序列。“CRISPR酶”意指可以与CRISPR系统相关的RNA向导的DNA核酸内切酶。具体地,这种酶与tracrRNA序列结合。在一个实施方案中,CRISPR酶是Cas蛋白(“CRISPR相关蛋白),优选Cas 9或Cpf1,更优选Cas9。在具体的实施方案中,Cas9是密码子优化的Cas9(特定于所讨论的植物)。在一个实施方案中,Cas9具有SEQ ID NO:32中描述的序列或其功能变体或同源物。在另一个实施方案中,CRISPR酶是来自2类候选x蛋白家族的蛋白质,例如C2c1、C2C2和/或C2c3。在一个实施方案中,Cas蛋白来自酿脓链球菌(Streptococcus pyogenes)。在可选的实施方案中,Cas蛋白可以来自金黄色葡萄球菌(Staphylococcus aureus)、脑膜炎奈瑟菌(Neisseriameningitides)、嗜热链球菌(Streptococcus thermophiles)或齿垢密螺旋体(Treponemadenticola)中的任何一种。可选地,CRISPR酶是MAD7。
如本文所用,关于Cas9的术语“功能变体”是指保留完整非变体序列的生物学功能的变体Cas9基因序列或该基因序列的一部分,例如,充当DNA核酸内切酶,或识别或/和结合DNA。功能变体还包括目的基因的变体,其具有不影响功能的序列改变,例如非保守残基。还涵盖与本文所示的野生型序列相比基本上相同的变体,即仅具有一些序列变化,例如在非保守残基中,并且具有生物活性。在一个实施方案中,SEQ ID NO:32的功能变体与由SEQ IDNO:32所示的核酸具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%总体序列同一性。在还个一实施方案中,Cas9蛋白已经修饰以提高活性。
合适的同源物或直向同源物可以通过序列比较和保守结构域的鉴定来鉴定。同源物或直向同源物的功能可以如本文所述进行鉴定,因此技术人员将能够确认在植物中表达时的功能。
在本发明的可选方面,核酸构建体包含编码TAL效应子的至少一个核酸序列,其中所述效应子靶向OML4序列(例如SEQ ID NO:33)或GSK2序列(例如SEQ ID NO:34)。在给定靶序列的情况下,用于设计TAL效应子的方法将是技术人员熟知的。合适方法的实例在Sanjana等人和Cermak T等人中给出,两者均通过引用并入本文。优选地,所述核酸构建体包含编码TAL效应子的两个核酸序列,以产生TALEN对。在还一个实施方案中,核酸构建体还包含序列特异性核酸酶(SSN)。优选地,这种SSN是核酸内切酶,例如FokI。在还一个实施方案中,TALEN通过金门(Golden Gate)克隆方法在单个质粒或核酸构建体中组装。
在本发明的另一方面,提供了sgRNA分子,其中sgRNA分子包含crRNA序列和tracrRNA序列,并且其中crRNA序列可以结合至少一个序列,例如SEQ ID NO:33(对于OML4)或SEQ ID NO:34(对于GSK2)或其变体。
“变体”如本文所定义。在一个实施方案中,sgRNA分子可以包含至少一种化学修饰,例如,增强其对靶序列或crRNA序列对tracrRNA序列的稳定性和/或结合亲和力。这种修饰将是技术人员熟知的,并且包括例如但不限于在Rahdar等人,2015中描述的修饰,其通过引用并入本文。在该实例中,crRNA可以包含硫代磷酸酯骨架修饰,例如2'-氟(2'-F)、2'-O-甲基(2'-O-Me)和S-约束乙基(cET)取代。
在本发明的另一方面,提供了一种分离的核酸序列,该分离的核酸序列编码原间隔子元件(如SEQ ID NO:35或36中任一项所定义)。
在本发明的另一方面,提供了一种植物或其部分或至少一种分离的植物细胞,该植物细胞用至少一种如本文所述的核酸构建体转染。Cas9和sgRNA可以组合或在单独的表达载体(或核酸构建体,这些术语可互换使用)中。换言之,在一个实施方案中,分离的植物细胞用包含sgRNA和Cas9两者的单一核酸构建体转染,如上详述。在可选的实施方案中,用两种核酸构建体转染分离的植物细胞,第一核酸构建体包含至少一种如上定义的sgRNA,并且第二种核酸构建体包含Cas9或其功能变体或同源物。第二核酸构建体可以在第一核酸构建体下方、之后或同时转染。包含cas蛋白的单独的第二构建体的优点是编码至少一种sgRNA的核酸构建体可以与任何类型的cas蛋白配对,如本文所述,因此不限于单一cas功能(如cas和sgRNA均在相同的核酸构建体上编码时的情况)。
在一个实施方案中,在用包含至少一种sgRNA核酸的核酸构建体进行第二次转染之前,包含cas蛋白的核酸构建体首先被转染并稳定地整合到基因组中。在可选的实施方案中,用编码cas蛋白的mRNA转染植物或其部分或至少一个分离的植物细胞,并用至少一种如本文定义的核酸构建体共转染。
可以如本领域所述构建用于本发明的Cas9表达载体。在一个实例中,表达载体包含如本文定义的核酸序列或其功能变体或同源物,其中所述核酸序列可操作地连接至合适的启动子。合适的启动子的实例包括但不限于Cas9、35S和Actin。
在本发明的可选方面,提供了一种分离的植物细胞,其用至少一种如本文所述的sgRNA分子转染。
在本发明的还一方面,提供了一种基因修饰或编辑的植物,其包含本文所述的转染细胞。在一个实施方案中,可以以稳定的形式整合一个或更多个核酸构建体。在可选的实施方案中,核酸构建体或多个构建体未整合(即瞬时表达)。因此,在优选的实施方案中,基因修饰的植物不含任何sgRNA和/或Cas蛋白核酸。换言之,该植物无转基因。
本申请通篇提及的术语“引入”、“转染”或“转化”涵盖将外源多核苷酸转移到宿主细胞中,与用于转移的方法无关。能够进行后续克隆繁殖的植物组织,无论是通过器官发生还是胚胎发生,均可以用本发明的遗传构建体转化,并从中再生整株植物。选择的特定组织将根据可用于且最适合被转化的特定物种的克隆繁殖系统而有所不同。示例性组织靶标包括叶盘、花粉、胚胎、子叶、下胚轴、大配子体、愈伤组织、现有的分生组织(例如,顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如,子叶分生组织和下胚轴分生组织)。然后可以将所得的转化植物细胞以本领域技术人员已知的方式用于再生转化植物。将外源基因转移到植物基因组中的过程称为转化。植物的转化现在是许多物种的常规技术。本领域技术人员已知的几种转化方法中的任一种可用于将本文所述的任何核酸构建体或目的sgRNA分子引入合适的祖先细胞。描述的从植物组织或植物细胞转化和再生植物的方法可用于瞬时或稳定转化。
转化方法包括使用脂质体、电穿孔、增加游离DNA摄取的化学物质、将DNA直接注射至植物中(显微注射)、如实例中所述的基因枪(或生物射弹粒子递送系统(生物射弹)(bioloistics))、脂质转染、使用病毒或花粉的转化和显微投影(microprojection)。方法可以选自用于原生质体的钙/聚乙二醇方法、超声介导的基因转染、光学或激光转染、使用碳化硅纤维的转染、原生质体的电穿孔、显微注射至植物材料中、DNA或RNA包被的粒子轰击、用(非整合性)病毒感染等。转基因植物还可以通过根癌农杆菌(Agrobacteriumtumefaciens)介导的转化产生,包括但不限于使用如Clough和Bent(1998)中描述的并通过引用并入本文的花浸/农杆菌真空渗透方法。
因此,在一个实施方案中,可以使用任何上述方法将本文所述的至少一种核酸构建体或sgRNA分子引入至少一种植物细胞。在可选的实施方案中,可以首先转录本文所述的任何核酸构建体以形成预组装的Cas9-sgRNA核糖核蛋白,然后使用任何上述方法(例如脂转染、电穿孔或显微注射)递送至至少一个植物细胞。
任选地,为了选择转化植物,转化中获得的植物材料是,通常,经受选择性条件,使得可以将转化的植物与未转化的植物区分。例如,可以种植以上述方式获得的种子,并在初始生长期后,通过喷雾进行合适的选择。另一种可能性是使种子生长,如果合适,在灭菌后,在琼脂板上使用合适的选择剂,使得仅转化的种子才能长成植物。如实例中所述,合适的标志物可以是bar-草丁膦或PPT。可选地,筛选转化植物是否存在选择标志物,例如但不限于,GFP,GUS(β-葡萄糖醛酸酶)。本领域技术人员将容易知道其他实例。可选地,不进行选择,并且种植和生长以上述方式获得的种子,并使用本领域的标准技术在适当的时间测量OML4表达或蛋白水平。这种避免引入转基因的可选方案更适合产生无转基因的植物。
在DNA转移和再生之后,还可以评价推定转化的植物,例如,使用PCR来检测目的基因、拷贝数和/或基因组组织的存在。可选地或另外地,可以使用Southern、Northern和/或Western分析监测新引入的DNA的整合和表达水平,这些技术均是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,例如通过克隆繁殖或经典育种技术。例如,第一代(或T1)转化植物可以是自交的并选择纯合的第二代(或T2)转化体,然后T2植物可以通过经典育种技术进一步繁殖。
在本发明的还一个相关方面,还提供了一种获得如本文所述的基因修饰的植物的方法,该方法包括
a.选择植物的一部分;
b.使用上述转染或转化技术,用至少一种如本文所述的核酸构建体或至少一种如本文所述的sgRNA分子转染(a)段中的植物的一部分的至少一个细胞;
c.再生至少一个源自转染细胞或多个细胞的植物;
d.选择根据(c)段获得的一个或多个种植物,其显示出OML4沉默或表达降低。
在还一个实施方案中,该方法还包括针对OML4基因或启动子序列中的SSN(优选CRISPR)诱导的突变筛选基因修饰的植物的步骤。在一个实施方案中,该方法包括从转化植物获得DNA样品并进行DNA扩增以检测至少一个OML4基因或启动子序列中的突变。
在还一个实施方案中,该方法包括产生稳定的T2植物,优选地对于突变是纯合的(即至少一个OML4基因或启动子序列中的突变)。
在至少一个OML4基因和/或启动子序列中具有突变的植物还可以与在至少一个OML4基因和/或启动子序列中也含有至少一个突变的另一种植物杂交以获得在OML4基因中具有另外突变的植物。这些组合对于技术人员而言将是显而易见的。因此,该方法可用于产生在所有或增加数量的同源物上具有突变的T2植物,当与如上所述转化的单个T1植物中的同源突变数相比时。
通过上述方法获得或可获得的植物也在本发明的范围内。
本发明的基因改变的植物还可以通过杂交转移本发明的任何序列而获得,例如,使用本文所述的基因改变的植物的花粉为野生型或对照植物授粉,或用在OML4基因或启动子序列中的至少一种中不包含突变的其他花粉给本文所述植物的雌蕊群授粉。获得本发明的植物的方法不仅限于本段中描述的那些方法;例如,如上所述,可以从小麦穗中进行生殖细胞的遗传转化,但无需随后再生植物。
尽管前述公开内容提供了涵盖在本发明范围内的主题的一般描述,包括制备和使用本发明的方法及其最佳模式,提供以下实例以进一步使本领域技术人员能够实践本发明并提供其完整的书面描述。然而,本领域技术人员将理解这些实例的细节不应被理解为对本发明的限制,其范围应由本公开内容所附的权利要求及其等同物来理解。鉴于本公开内容,本发明的各种其他方面和实施方案对于本领域技术人员将是显而易见的。在本文中使用的“和/或”将被视为两个特定特征或组成部分中的每一个(有或没有另一个)的具体公开。例如,“A和/或B”将被视为(i)A、(ii)B和(iii)A和B中的每一个的具体公开,正如每一个在本文中单独列出一样。除非上下文另有说明,否则上述特征的描述和定义不限于本发明的任何特定方面或实施方案,并且同样适用于所描述的所有方面和实施方案。
上述申请,以及其中或在其审查过程中援引的所有文件和序列登录号(“申请引用的文件”)以及在申请援引的文件中援引或引用的所有文件,以及本文援引或引用的所有文件(“本文援引的文件”),以及在本文援引的文件中援引或引用的所有文件,连同任何生产商的说明、描述、产品规范和用于本文提到的任何产品或通过引用并入本文的任何文件中的任何产品的产品表,在此通过引用并入本文,并且可以在本发明的实践中使用。更具体地,所有引用的文件均通过引用并入,其程度与每个单独的文件被具体和单独地指出通过引用并入的程度相同。
现在在以下非限制性实施例中描述本发明。
实施例
large1形成大且重的籽粒
我们已经在水稻中鉴定出许多籽粒大小的突变体。large1-1突变体是从经γ射线处理的粳稻品种Zhonghuajing(ZHJ)的M2种群中分离得到的。large1-1突变体显示出大籽粒和高植株(图1A-1E)。相比于ZHJ籽粒的粒长,large1-1籽粒的粒长增加了16.24%(图1F)。类似地,相比于ZHJ籽粒的粒宽,large1-1籽粒的粒宽增加了11.54%(图1G)。large1-1籽粒也显著重于ZHJ籽粒(图1H)。与ZHJ籽粒的粒重相比,large1-1籽粒的粒重增加了23.11%。这些结果表明LARGE1负调控水稻的籽粒大小和粒重。
成熟的large1-1植株显著高于ZHJ植株(图1I)。与野生型穗相比,large1-1穗长且松散(图1J),表明LARGE1也对穗长度产生负影响。由于穗的结构和形状由穗枝梗决定,我们研究了ZHJ和large1-1穗枝梗。large1-1穗的一次枝梗多于ZHJ(图1K),并且large1-1的二次枝梗少于ZHJ(图1L)。
LARGE1调控小穗壳中的细胞扩增
籽粒生长受小穗壳的限制,并且小穗壳的生长由细胞增殖和细胞扩增过程决定。为了揭示LARGE1在籽粒生长中的细胞基础,我们研究了ZHJ和large1-1小穗壳中的细胞。如图2所示,large1-1外稃的外表皮细胞比ZHJ外稃的细胞更长更宽,而large1-1外稃中的细胞数在纵向和横向上与野生型外稃相似(图2A、2B、2E-2H)。类似地,large1-1的内表皮细胞的平均长度和宽度比ZHJ的更长和更宽(图2C、2D、2I、2J)。这些结果表明,large1-1的长且宽籽粒表型是由小穗壳中长且宽的细胞造成的。因此,LARGE1通过限制小穗壳中的细胞扩增来调控籽粒大小。
几种基因被报道通过影响小穗壳中的细胞扩增来调控籽粒大小,我们研究了它们在野生型和large1-1穗中的表达水平(图8)。SPL13/GWL7是一种转录因子,通过增加细胞扩增对籽粒长度产生积极影响(Si等人,2016)。观察到large1-1穗中SPL13的表达水平较高。GL7/GW7/SLG7促进小穗壳细胞伸长,产生长籽粒(Wang等人,2015;Wang等人,2015;Zhou等人,2015),尽管GL7/GW7/SLG7也被提出通过影响细胞增殖来增加粒长(Wang等人,2015)。与ZHJ中GL7的表达相比,large1-1中GL7的表达明显增加(图8)。假定的丝氨酸羧肽酶GS5和转录因子GS2通过增加细胞扩增和细胞增殖两者来影响籽粒生长(Li等人,2011;Duan等人,2015;Hu等人,2015)。large1-1中GS5和GS2的表达水平显著高于ZHJ中的表达水平(图8)。bHLH转录因子PGL1通过增加细胞扩增来控制粒长(Heang和Sassa 2012a,b)。APG是另一种bHLH转录因子,通过限制小穗壳中的细胞扩增来调控粒长(Heang和Sassa 2012a,b)。large1-1中APG和PGL1的表达水平分别低于和高于ZHJ中的表达水平(图8)。这些数据表明LARGE1影响调控细胞扩增的几个籽粒大小基因的表达。
LARGE1编码Mei-2类蛋白OML4
MutMap方法用于鉴定large1-1突变。我们将ZHJ与large1-1杂交并产生F2种群。在F2种群中,子代分离显示单个隐性突变决定large1-1的大粒表型。合并来自具有大粒表型的F2植株的基因组DNA,并应用于全基因组重测序。还对野生型ZHJ进行测序作为对照。如前所述进行SNP分析(Fang等人,2016;Huang等人,2017)。我们在ZHJ和具有large1-1表型的合并的F2植株之间检测到3913个SNP和1280个INDEL。在全基因组中计算合并的F2植株中的SNP/INDEL比。其中,编码区中仅有一个INDEL具有SNP/INDEL比=1。该INDEL在基因(LOC_Os02g31290)中的large1-1中包含4-bp缺失(图3A;图9;表13),这导致提前终止密码子(图3B)。我们通过开发dCAPS1标志物进一步证实了LOC_Os02g31290中的这种缺失(图3C)。这些结果表明LOC_Os02g31290是LARGE1的候选基因。
进行基因互补试验以确认LOC_Os02g31290中的缺失是否是large1-1表型的原因。LOC_Os02g31290(gLARGE1)的基因组片段被转化至large1-1突变体中,并产生11个转基因系。gLARGE1构建体互补large1-1突变体的大粒表型(图3D和3E)。gLARGE1;large1-1转基因植株的粒长和粒宽与ZHJ相似(图3F和3G)。基因组互补植株的株高和形态也恢复到野生型(图10)。因此,互补试验支持LARGE1基因为LOC_Os02g31290。
LARGE1/LOC_Os02g31290编码具有三个RNA识别基序(RRM)的Mei-2类蛋白OML4(图3B和图11)。在作物中发现了OML4的同源物(图11),但到目前为止,OML4及其同源物在控制籽粒大小方面的作用完全未知。large1-1中的突变导致提前终止密码子。large1-1(OML4large1-1)编码的蛋白质缺乏RRM基序(图3B),这表明large1-1是功能缺失等位基因。
OML4的表达和亚细胞定位
我们使用定量RT-PCR分析研究了OML4在发育穗中的表达。检测到OML4基因表达,并且在穗发育过程中也是可变的(图3H)。我们进一步生成了OML4启动子:GUS转基因植物(proOML4:GUS)并检查了OML4在发育中的穗中的表达模式。在穗发育过程中,在长度为约1cm的穗中检测到GUS活性。在长度为约5cm的穗中观察到最强GUS活性。然后在穗发育过程中GUS活性逐渐降低(图3I)。类似地,定量RT-PCR分析表明OML4在长度为约5cm的穗中的表达相对较高(图3H)。
为了研究OML4在水稻中的亚细胞定位,我们生成了gLARGE1-GFP转基因植物。如图3J和3K所示,gLARGE1-GFP构建体挽救large1-1突变体的表型(图3J和3K),表明LARGE1-GFP融合蛋白具有功能。gLARGE1-GFP;large1-1根中的GFP信号主要在细胞核中检测到(图3L-3O)。因此,该发现表明OML4定位于水稻的细胞核中
由于小穗壳中的细胞短,OML4过表达导致短粒
为了进一步揭示OML4在籽粒生长中的功能,我们构建了proActin:OML4构建体,将其转化为ZHJ并产生14个转基因株系。与ZHJ相比,proActin:OML4转基因植株产生短粒(图4A-4C),而proActin:OML4籽粒的宽度与ZHJ的相似(图4D)。籽粒也显著轻于ZHJ(图4E)。proActin:OML4转基因株系的粒长与OML4的表达水平相关(图4F)。这些数据表明,OML4具有限制水稻籽粒生长的功能。
成熟的proActin:OML4转基因植物比ZHJ短(图4G和4H)。proActin:OML4穗的平均长度与ZHJ穗相比显著缩短(图4I和4J)。proActin:OML4穗的一次枝梗与ZHJ的相当,而proActin:OML4穗的二次枝梗与ZHJ相比明显增加(图4K和4L),导致每穗粒数增加(图4M)。
由于proActin:OML4转基因株系产生短粒,我们检测了OML4的过表达是否可减少小穗壳中的细胞长度。我们检查了野生型和proActin:OML4小穗壳中外表皮细胞的大小(图4N和4O)。proActin:OML4小穗壳的外表皮细胞比ZHJ小穗壳短(图4P和4Q)。相反,proActin:OML4小穗壳中纵向和横向的表皮细胞数量与ZHJ小穗壳相似(图4R和4S)。这些结果进一步揭示OML4通过限制小穗壳中的细胞扩增来影响籽粒生长。X
OML4与GSK2相互作用
为了进一步了解OML4在籽粒生长控制中的分子作用,我们通过酵母双杂交(Y2H)测定鉴定其相互作用的配偶体。OML4全长蛋白用作诱饵。在几种相互作用的蛋白中,在该筛选中发现对应于GSK2的六个不同克隆。由于已报道GSK2限制水稻的籽粒生长,这表明GSK2是候选的OML4相互作用配偶体。我们进一步证实了酵母细胞中OML4与全长GSK2的相互作用(图5A)。
接下来,我们使用萤火虫荧光素酶(LUC)互补成像测定验证OML4和GSK2在植物细胞中的相互作用(图5B)。OML4-nLUC和GSK2-cLUC在本氏烟草叶中被转化和共表达。当我们共表达OML4-nLUC和GSK2-cLUC时检测到LUC活性,而在OML4-nLUC/cLUC和nLUC/GSK2-cLUC的两种组合中均未观察到信号。然后我们进行双分子荧光互补(BiFC)测定以检测在植物细胞中OML4与GSK2之间的相互作用(图5C)。OML4与黄色荧光蛋白(OML4-cYFP)的C-末端融合,并且GSK2与黄色荧光蛋白(GSK2-nYFP)的N-末端融合。共聚焦激光扫描显微镜观察表明,当我们在本氏烟草叶中共表达OML4-cYFP和GSK2-nYFP时,在细胞核中观察到强YFP荧光。这些结果表明在植物细胞中OML4与GSK2缔合。
为了研究OML4是否可以直接与GSK2相互作用,我们进行体外拉下(pull-down)测定(图5D)。我们在大肠杆菌细胞中表达麦芽糖结合蛋白(MBP)融合的OML4(OML4-MBP)和GST标签融合的GSK2(GSK2-GST)蛋白。如图5D所示,OML4-MBP与GSK2-GST物理相互作用,但在体外不与阴性对照(GST)相互作用。免疫共沉淀(Co-IP)分析用于检查本氏烟草中GSK2和OML4的缔合。我们在本氏烟草叶中共表达GSK2-GFP和OML4-MYC(图5E)。分离总蛋白并与MYC珠孵育以免疫沉淀OML4-MYC。抗MYC抗体和抗GFP抗体分别用于检测免疫沉淀蛋白。在免疫沉淀的OML4-MYC复合物中检测到GSK2-GFP蛋白(图5E),表明GSK2在体内与OML4缔合。这些结果揭示OML4可以在体外和体内直接与GSK2相互作用。
GSK2磷酸化OML4并调节其蛋白水平
由于GSK2具有激酶活性并与OML4相互作用,我们检查GSK2是否可以磷酸化OML4。为了检测这一点,我们进行体外激酶测定。GST融合的GSK2(GSK2-GST)蛋白分别与OML4-Flag孵育、OML4融合Flag(nOML4-Flag)的N-末端区域和OML4融合Flag(cOML4-Flag)的C-末端区域在体外激酶测定缓冲液中孵育。在存在GSK2-GST的情况下检测到磷酸化的OML4-Flag、nOML4-Flag和cOML4-Flag,而在不存在GSK2-GST的情况下,未发现磷酸化的OML4-Flag、nOML4-Flag和cOML4-Flag(图6A)。这些结果表明GSK2可以在体外磷酸化OML4。
为了进一步验证GSK2可以磷酸化OML4,我们研究了OML4的磷酸化位点。为了鉴定OML4中的磷酸化位点,将重组OML4与重组GSK2在体外激酶测定缓冲液中孵育,通过SDS-PAGE电泳分离,然后针对磷酸肽进行LC-MS/MS分析。我们鉴定了OML4的18种磷酸肽,它们对应于14个磷酸位点(图6B)。在OML4的14个磷酸化位点中,我们观察到S105、S146和S607分别是不同植物物种中最接近的同源物中Ser/Thr、Ser和Ser,表明这三个氨基酸可能是保守的磷酸化位点。然后我们将两个氨基酸突变成磷光猝灭的丙氨酸(OML4S105A,S607A),并通过GSK2检测它们的磷酸化水平。上述两个Ser残基向Ala的突变降低了OML4的磷酸化水平,尽管OML4S105A,S607A仍被GSK2磷酸化(图6C和6D),表明S105和S607部分促成了GSK2的磷酸化。该结果进一步支持GSK2可以在体外磷酸化OML4。
考虑到在体外GSK2可以与OML4相互作用并使其磷酸化,我们想知道OML4的蛋白水平是否受GSK2的影响。如图6E所示,我们发现当GSK2-GFP在本氏烟草叶中共表达时,OML4-MYC的水平增加。考虑到在体外OML4S105A,S607A的磷酸化水平低于OML4,我们想知道S105和S607的突变是否影响OML4的蛋白水平。如图6F所示,当我们用OML4-MYC或OML4S105A,S607A-MYC在本氏烟草叶中瞬时过表达GSK2-GFP时,OML4S105A,S607A的水平明显低于OML4。这些结果表明GSK2可能通过影响其磷酸化来影响OML4的水平。
GSK2与OML4在基因上共同作用以调控籽粒大小
虽然GSK2已被描述为影响籽粒大小,但GSK2在籽粒大小控制中的功能尚未详细表征。为了仔细研究GSK2在籽粒大小控制中的作用,我们使用RNA干扰(RNAi)方法(GSK2-RNAi)下调GSK2的表达,如前所述(Tong等人,2012)。GSK2-RNAi株系显示出比ZHJ更长且稍宽的籽粒(图7A-7E),表明GSK2主要调控水稻的粒长。与ZHJ相比,GSK2-RNAi转基因株系的粒重也显著增加(图7F)。然后我们观察了ZHJ和GSK2-RNAi小穗壳中的表皮细胞。GSK2-RNAi小穗壳比ZHJ小穗壳含有更长且稍宽的表皮细胞(图7G-7J)。这些结果表明,GSK2通过限制小穗壳中的细胞伸长来控制籽粒生长。
GSK2-RNAi产生长粒,如同在large1-1突变体中所观察到的,并且GSK2和OML4限制了小穗壳中的细胞伸长(图2和图7)。此外,在体外GSK2可以磷酸化OML4。因此,我们推测GSK2和OML4可能在调控水稻粒长的共同途径中发挥作用。为了检测这一点,我们将large1-1与GSK2-RNAi杂交并分离large1-1;GSK2-RNAi植株(图7K)。如图7L所示,与ZHJ相比,large1-1籽粒的长度增加了16.24%,而与GSK2-RNAi相比,large1-1;GSK2-RNAi籽粒的长度增加了7.90%。结果表明,GSK2至少部分地在与OML4的共同遗传途径中起作用以控制粒长。
此外,我们还使用本文所述的CRISPR构建体将至少一个突变引入GSK2。在这些CRISPR系中,与ZHJ(7.20±0.17)相比,gsk2-cri(7.99±0.30)的粒长增加。
讨论
籽粒大小和粒重是籽粒产量的关键决定因素,但水稻中籽粒大小控制的遗传和分子机制仍有限。在这项研究中,我们鉴定OML4作为一种新型籽粒大小和粒重的调节子。GSK2与OML4相互作用并使其磷酸化。GSK2和OML4至少部分地在控制水稻粒长的共同途径中发挥作用。这些发现揭示了GSK2-OML4调控模块在籽粒大小控制中的重要遗传和分子机制。
与野生型相比,large1-1突变体产生长、宽且重的籽粒。相反,LARGE1的过表达导致短且轻的籽粒。因此,LARGE1是籽粒大小和粒重的负调节子。细胞分析支持LARGE1通过限制细胞扩增来控制籽粒大小。与此一致,几个基因(例如SPL13、GS2、GS5和GL7)的表达(Li等人,2011;Che等人,2015;Duan等人,2015;Hu等人,2015;Zhou等人,2015;Si等人,2016),通过调控细胞扩增来控制籽粒大小,在large1-1中发生改变(图8)。
LARGE1编码水稻中的Mei2样蛋白(OML4)。植物中有许多Mei2样蛋白,它们具有保守的RRM,但似乎在植物发育中发挥不同的作用(Jeffares等人,2004)。拟南芥-Mei2样(AML)基因含有五成员基因家族,它们在减数分裂和营养生长中发挥作用(Kaur等人,2006)。在玉米中,编码Mei2样蛋白的TERMINAL EAR 1(TE1)在调控叶萌芽中发挥作用(Veit等人,1998)。在水稻中,PLASTOCHRON2(PLA2)/LEAFY HEAD2(LHD2)编码Mei2样蛋白(OML1)(Kawakatsu等人,2006)。pla2突变体在生殖阶段表现出叶片早熟、质体缩短和异位芽形成(Kawakatsu等人,2006)。然而,在植物中尚未报道Mei2样蛋白在种子/籽粒大小控制中的功能。在本研究中,我们鉴定OML4作为水稻粒大小的负调节子。
我们进一步鉴定了与OML4相互作用的蛋白。有意思的是,其中之一是GSK2,拟南芥BIN2(BRASSINOSTEROID INSENSITIVE2)激酶的同源物,已报道其影响水稻的籽粒大小和多种生长过程(Tong等人,2012)。先前的研究表明,GSK2与几种籽粒大小调节子相互作用。然而,尚未详细表征GSK2对小穗壳中细胞增殖和/或细胞扩增的影响。在这项研究中,我们发现由于小穗壳中的大细胞,GSK2的下调形成大粒(图7D和7I)。这些结果表明GSK2限制细胞扩增而不限制小穗壳中的细胞增殖。与此一致,已提出GSK2通过与主要促进小穗壳中细胞扩增的GS2相互作用来调控籽粒大小(Che等人,2015)。已报道GSK5是GSK2的同源物,通过限制小穗壳中的细胞扩增来控制籽粒大小(Hu等人,2018)。考虑到GSK2是一种功能性蛋白激酶,我们推测GSK2可以磷酸化OML4。与这个想法一致,我们发现GSK2可以与OML4相互作用并使其磷酸化。我们进一步观察到GSK2影响OML4的水平(图6E)。GSK2可能使OML4磷酸化并阻止OML4降解。支持这一点,我们观察到S105和S607中的突变部分影响OML4的丰度(图6F)。此外,我们的基因分析表明,GSK2和OML4至少部分地在控制水稻粒长的共同途径中发挥作用。因此,我们的研究结果揭示了水稻中涉及GSK2-OML4调控模块的重要遗传和分子机制,表明该模块是改善作物籽粒大小的有前景的靶标。
材料和方法
植物材料和生长条件
用γ射线照射野生型Zhonghuajing(ZHJ)的籽粒,从M2种群中分离出large1-1突变体。根据先前报道(Huang等人,2017),水稻植株在田间种植。水稻植株分别于2016年12月至2017年4月、2017年12月至2018年4月在陵水和于2017年7月至2017年11月、2018年7月至2018年11月在浙江省农业科学院(杭州)种植。
表型评价和细胞分析
灌浆完成后拍摄水田生长的ZHJ和large1-1植株。MICROTEK Scan Marker i560(MICROTEK,上海,中国)用于扫描成熟种子。我们使用WSEEN水稻测试系统(WSeen,浙江,中国)测量粒长和粒宽。我们还测量了千粒重,重复三次(Huang等人,2017)。
我们使用扫描电子显微镜(SEM)来观察细胞大小和细胞数。如前所述进行SEM观察(Duan等人,2015)。探索Image J软件来测量细胞的长度和宽度。
RNA提取和实时RT-PCR分析
使用RNA Pre Pure Plant Kit(Tiangen,北京)提取籽苗或幼穗的总RNA。根据先前的研究(Duan等人,2015)合成cDNA。使用SYBR Green Mix Kit(Bio-Rad,Hercules,CA)在ABI7500实时PCR系统上进行实时RT-PCR。水稻Actin1基因用作内部对照。
LARGE1基因的鉴定
我们将large1-1与野生型ZHJ杂交以产生F2种群。我们使用F2种群克隆LARGE1基因。使用NextSeq 500(Illumine,美国)对野生型ZHJ的全基因组和50个具有突变表型的个体植株的混合池进行重新测序。MutMap用于分离LARGE1基因,如前所述(Abe等人,2012),并如前所述分析SNP/INDEL比(Fang等人,2016)。
构建体和植物转化
OML4的基因组序列含有2049-bp 5'侧翼区、整个基因区和1259-bp 3'侧翼区,其使用引物gOML4-99-F和gOML4-99-R进行扩增。我们使用GBclonart Seamless Cloe Kit将OML4基因组序列与pMDC99载体融合,并生成gOML4重组构建体。后一系列重组载体使用相同的试剂盒和相似的方法构建。我们在本研究中使用的相关载体是pIPKB003(含有ACTIN启动子并与OML4基因的CDS融合)、pMDC107(构建gOML4-GFP质粒)和pMDC164(构建proOML4:GUS载体)。将质粒gOML4、proACTIN:OML4、gOML4-GFP和proOML4:GUS分别引入农杆菌菌株GV3101。根据先前的报道(Hiei等人,1994),将gOML4和gOML4-GFP转移至large1-1中,并且将其他质粒转移至野生型中。
OML4的GUS染色和亚细胞定位
如前所述(Fang等人,2016)对不同发育阶段的穗进行GUS染色。使用Zeiss LSM710共聚焦显微镜观察gOML4-GFP转基因籽苗的GFP荧光。4',6-二脒基-2-苯基吲哚(DAPI)(1μg/mL)用于细胞核染色。
酵母双杂交测定
使用基因特异性引物扩增GSK2和OML4的cDNA序列(表S4),并将产物分别融合至线性化的pGADT7和pGBKT7载体中。根据生产商的说明(Clontech,USA)进行酵母双杂交分析。
BiFC测定
OML4和GSK2的全长cDNA片段被重组到pGBW414-cYFP和pGBW414-nYFP载体中。通过乙酰丁香酮(AS)将构建体转化到本氏烟草叶肉细胞中用于瞬时表达。使用Zeiss LSM 710共聚焦显微镜进行共聚焦成像分析。
拉下(Pull down)测定
将重组蛋白(OML4-MBP和MBP)和捕获蛋白(GSK2-GST和GST)在TGH缓冲液(50mMHEPES、PH 7.5、10%甘油、150mM NaCl、Triton X-100、1.5mM MgCl2、1mM EGTA和蛋白酶抑制剂混合物片)中在4℃下与每管20μl MBP-珠孵育0.5小时。以500rpm离心2分钟并弃去上清液以终止反应。用冰冷的TGH缓冲液洗涤珠5次,然后加入50μl SDS-上样缓冲液。将样品在98℃下变性5min,最后进行SDS-PAGE分析。我们分别使用抗MBP(Beyotime)和抗GST(Beyotime)来检测输入和拉下样品。
磷酸化分析
使用表S4中的特异性引物(OML4-FLAG-F/R、nOML4-FLAG-F/R和cOML4-FLAG-F/R)扩增OML4、nOML4和cOML4的编码序列。将产物克隆至载体pETnT以构建OML4-FLAG、nOML4-FLAG和cOML4-FLAG质粒。使用引物GSK2-GST-F/R扩增GSK2编码序列并亚克隆至载体pGEX4T-1以构建GSK2-GST质粒。
所有这些质粒均被转化至大肠杆菌(宿主菌株BL21)中。OML4-FLAG、nOML4-FLAG、cOML4-FLAG和GSK2-GST蛋白的诱导、分离和纯化如前所述(Xia等人,2013)。将10μL的GSK2-GST分别与5μL的OML4-FLAG、nOML4-FLAG和cOML4-FLAG在20μL反应缓冲液(25mM Tris-HCl,PH 7.5,10mM MgCl2,1mM DTT,50mM ATP)中孵育2小时。通过phos-tag SDS-PAGE分析磷酸化产物。使用抗GST抗体和抗FLAG抗体以及抗GST抗体来检测磷酸化产物和输入。
序列表
水稻
SEQ ID NO:1:OML4氨基酸序列
Figure BDA0003767722330000481
(RRM结构域以下划线显示)
SEQ ID NO:2:OML4核酸序列(基因组)
Figure BDA0003767722330000482
Figure BDA0003767722330000491
Figure BDA0003767722330000501
SEQ ID NO:3OML4启动子序列
Figure BDA0003767722330000502
Figure BDA0003767722330000511
SEQ ID NO:4:GSK2氨基酸序列
Figure BDA0003767722330000512
SEQ ID NO:5:GSK2核酸序列
Figure BDA0003767722330000513
Figure BDA0003767722330000521
SEQ ID NO:6GSK2启动子序列
Figure BDA0003767722330000522
Figure BDA0003767722330000531
小麦
SEQ ID NO:7:OML4氨基酸序列
Figure BDA0003767722330000532
SEQ ID NO:8:OML4核酸序列
Figure BDA0003767722330000533
Figure BDA0003767722330000541
Figure BDA0003767722330000551
SEQ ID NO:9:OML4启动子序列
Figure BDA0003767722330000552
Figure BDA0003767722330000561
SEQ ID NO:10:GSK2氨基酸序列
Figure BDA0003767722330000562
SEQ ID NO:11:GSK2核酸序列
Figure BDA0003767722330000563
Figure BDA0003767722330000571
Figure BDA0003767722330000581
SEQ ID NO:12:GSK2启动子序列
Figure BDA0003767722330000582
大豆
SEQ ID NO:13:OML4氨基酸序列
Figure BDA0003767722330000583
Figure BDA0003767722330000591
SEQ ID NO:14:OML4核酸序列
Figure BDA0003767722330000592
Figure BDA0003767722330000601
Figure BDA0003767722330000611
SEQ ID NO:15:OML4启动子序列
Figure BDA0003767722330000612
Figure BDA0003767722330000621
SEQ ID NO:16:GSK2氨基酸序列
Figure BDA0003767722330000622
SEQ ID NO:17:GSK2核酸序列
Figure BDA0003767722330000623
Figure BDA0003767722330000631
Figure BDA0003767722330000641
SEQ ID NO:18:GSK2启动子序列
Figure BDA0003767722330000642
玉米
SEQ ID NO:19:OML4氨基酸序列
Figure BDA0003767722330000643
Figure BDA0003767722330000651
SEQ ID NO:20:OML4核酸序列
Figure BDA0003767722330000652
Figure BDA0003767722330000661
Figure BDA0003767722330000671
Figure BDA0003767722330000681
Figure BDA0003767722330000691
Figure BDA0003767722330000701
SEQ ID NO:21:OML4启动子序列
Figure BDA0003767722330000702
Figure BDA0003767722330000711
SEQ ID NO:22:GSK2氨基酸序列
Figure BDA0003767722330000712
SEQ ID NO:23:GSK2核酸序列
Figure BDA0003767722330000713
Figure BDA0003767722330000721
Figure BDA0003767722330000731
SEQ ID NO:24:GSK2启动子序列
Figure BDA0003767722330000732
Figure BDA0003767722330000741
甘蓝型油菜
SEQ ID NO:25:OML4氨基酸序列
Figure BDA0003767722330000742
SEQ ID NO:26:OML4核酸序列
Figure BDA0003767722330000743
Figure BDA0003767722330000751
Figure BDA0003767722330000761
SEQ ID NO:27:OML4启动子序列
Figure BDA0003767722330000762
SEQ ID NO:28:GSK2氨基酸序列
Figure BDA0003767722330000763
SEQ ID NO:29:GSK2核酸序列
Figure BDA0003767722330000771
Figure BDA0003767722330000781
SEQ ID NO:30:GSK2启动子序列
Figure BDA0003767722330000782
Figure BDA0003767722330000791
SEQ ID NO:31:GSK2 RNAi序列
Figure BDA0003767722330000792
SEQ ID NO:32CAS9核酸序列
Figure BDA0003767722330000793
Figure BDA0003767722330000801
SEQ ID NO:33针对OML4的CRISPR靶序列
Figure BDA0003767722330000802
SEQ ID NO:34针对GSK2的CRISPR靶序列
Figure BDA0003767722330000803
SEQ ID NO:35:针对OML4的CRISPR原间隔子
Figure BDA0003767722330000804
SEQ ID NO:36:针对GSK2的CRISPR原间隔子
Figure BDA0003767722330000805
序列表
<110> 中国科学院遗传与发育生物学研究所
<120> 控制籽粒大小和粒重的方法
<130> PC931261WOA
<150> PCT/CN2020/074530
<151> 2020-02-07
<160> 40
<170> BiSSAP 1.3.6
<210> 1
<211> 1001
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> OML4氨基酸序列(水稻)
<400> 1
Met Pro Ser Gln Val Met Asp Gln Arg His His Met Ser Gln Tyr Ser
1 5 10 15
His Pro Thr Leu Ala Ala Ser Ser Phe Ser Glu Glu Leu Arg Leu Pro
20 25 30
Thr Glu Arg Gln Val Gly Phe Trp Lys Gln Glu Ser Leu Pro His His
35 40 45
Met Gly Ser Lys Ser Val Ala Ser Ser Pro Ile Glu Lys Pro Gln Pro
50 55 60
Ile Gly Thr Arg Met Ala Gly Arg Leu Glu Leu Leu Gln Pro Tyr Lys
65 70 75 80
Leu Arg Asp Gln Gly Ala Ala Phe Ser Leu Glu His Lys Leu Phe Gly
85 90 95
Gln Glu Arg His Ala Asn Leu Pro Pro Ser Pro Trp Arg Pro Asp Gln
100 105 110
Glu Thr Gly Arg Gln Thr Asp Ser Ser Leu Lys Ser Ala Ala Leu Phe
115 120 125
Ser Asp Gly Arg Ile Asn Pro Asn Gly Ala Tyr Asn Glu Asn Gly Leu
130 135 140
Phe Ser Ser Ser Val Ser Asp Ile Phe Asp Lys Lys Leu Arg Leu Thr
145 150 155 160
Ser Lys Asn Gly Leu Val Gly Gln Ser Ile Glu Lys Val Asp Leu Asn
165 170 175
His Val Asp Asp Glu Pro Phe Glu Leu Thr Glu Glu Ile Glu Ala Gln
180 185 190
Ile Ile Gly Asn Leu Leu Pro Asp Asp Asp Asp Leu Leu Ser Gly Val
195 200 205
Val Asp Glu Val Gly Tyr Pro Thr Asn Ala Asn Asn Arg Asp Asp Ala
210 215 220
Asp Asp Asp Ile Phe Tyr Thr Gly Gly Gly Met Glu Leu Glu Thr Asp
225 230 235 240
Glu Asn Lys Lys Leu Gln Glu Phe Asn Gly Ser Ala Asn Asp Gly Ile
245 250 255
Gly Leu Leu Asn Gly Val Leu Asn Gly Glu His Leu Tyr Arg Glu Gln
260 265 270
Pro Ser Arg Thr Leu Phe Val Arg Asn Ile Asn Ser Asn Val Glu Asp
275 280 285
Ser Glu Leu Lys Leu Leu Phe Glu His Phe Gly Asp Ile Arg Ala Leu
290 295 300
Tyr Thr Ala Cys Lys His Arg Gly Phe Val Met Ile Ser Tyr Tyr Asp
305 310 315 320
Ile Arg Ser Ala Leu Asn Ala Lys Met Glu Leu Gln Asn Lys Ala Leu
325 330 335
Arg Arg Arg Lys Leu Asp Ile His Tyr Ser Ile Pro Lys Asp Asn Pro
340 345 350
Ser Glu Lys Asp Ile Asn Gln Gly Thr Ile Val Leu Phe Asn Val Asp
355 360 365
Leu Ser Leu Thr Asn Asp Asp Leu His Lys Ile Phe Gly Asp Tyr Gly
370 375 380
Glu Ile Lys Glu Ile Arg Asp Thr Pro Gln Lys Gly His His Lys Ile
385 390 395 400
Ile Glu Phe Tyr Asp Val Arg Ala Ala Glu Ala Ala Leu Arg Ala Leu
405 410 415
Asn Arg Asn Asp Ile Ala Gly Lys Lys Ile Lys Leu Glu Thr Ser Arg
420 425 430
Leu Gly Ala Ala Arg Arg Leu Ser Gln His Met Ser Ser Glu Leu Cys
435 440 445
Gln Glu Glu Phe Gly Val Cys Lys Leu Gly Ser Pro Ser Thr Ser Ser
450 455 460
Pro Pro Ile Ala Ser Phe Gly Ser Thr Asn Leu Ala Thr Ile Thr Ser
465 470 475 480
Thr Gly His Glu Asn Gly Ser Ile Gln Gly Met His Ser Gly Leu Gln
485 490 495
Thr Ser Ile Ser Gln Phe Arg Glu Thr Ser Phe Pro Gly Leu Ser Ser
500 505 510
Thr Ile Pro Gln Ser Leu Ser Thr Pro Ile Gly Ile Ser Ser Gly Ala
515 520 525
Thr His Ser Asn Gln Ala Ala Leu Gly Glu Ile Ser Gln Ser Leu Gly
530 535 540
Arg Met Asn Gly His Met Asn Tyr Ser Phe Gln Gly Met Ser Ala Leu
545 550 555 560
His Pro His Ser Leu Pro Glu Val His Asn Gly Val Asn Asn Gly Val
565 570 575
Pro Tyr Asn Leu Asn Ser Met Ala Gln Val Val Asn Gly Thr Asn Ser
580 585 590
Arg Thr Ala Glu Ala Val Asp Asn Arg His Leu His Lys Val Gly Ser
595 600 605
Gly Asn Leu Asn Gly His Ser Phe Asp Arg Ala Glu Gly Ala Leu Gly
610 615 620
Phe Ser Arg Ser Gly Ser Ser Ser Val Arg Gly His Gln Leu Met Trp
625 630 635 640
Asn Asn Ser Ser Asn Phe His His His Pro Asn Ser Pro Val Leu Trp
645 650 655
Pro Ser Pro Gly Ser Phe Val Asn Asn Val Pro Ser Arg Ser Pro Ala
660 665 670
Gln Met His Gly Val Pro Arg Ala Pro Ser Ser His Met Ile Asp Asn
675 680 685
Val Leu Pro Met His His Leu His Val Gly Ser Ala Pro Ala Ile Asn
690 695 700
Pro Ser Leu Trp Asp Arg Arg His Gly Tyr Ala Gly Glu Leu Thr Glu
705 710 715 720
Ala Pro Asn Phe His Pro Gly Ser Val Gly Ser Met Gly Phe Pro Gly
725 730 735
Ser Pro Gln Leu His Ser Met Glu Leu Asn Asn Ile Tyr Pro Gln Thr
740 745 750
Gly Gly Asn Cys Met Asp Pro Thr Val Ser Pro Ala Gln Ile Gly Gly
755 760 765
Pro Ser Pro Gln Gln Arg Gly Ser Met Phe His Gly Arg Asn Pro Met
770 775 780
Val Pro Leu Pro Ser Phe Asp Ser Pro Gly Glu Arg Met Arg Ser Arg
785 790 795 800
Arg Asn Asp Ser Asn Gly Asn Gln Ser Asp Asn Lys Lys Gln Tyr Glu
805 810 815
Leu Asp Val Asp Arg Ile Val Arg Gly Asp Asp Ser Arg Thr Thr Leu
820 825 830
Met Ile Lys Asn Ile Pro Asn Lys Tyr Thr Ser Lys Met Leu Leu Ala
835 840 845
Ala Ile Asp Glu Asn His Lys Gly Thr Tyr Asp Phe Ile Tyr Leu Pro
850 855 860
Ile Asp Phe Lys Asn Lys Cys Asn Val Gly Tyr Ala Phe Ile Asn Met
865 870 875 880
Thr Asn Pro Gln His Ile Ile Pro Phe Tyr Gln Thr Phe Asn Gly Lys
885 890 895
Lys Trp Glu Lys Phe Asn Ser Glu Lys Val Ala Ser Leu Ala Tyr Ala
900 905 910
Arg Ile Gln Gly Lys Ser Ala Leu Ile Ala His Phe Gln Asn Ser Ser
915 920 925
Leu Met Asn Glu Asp Lys Arg Cys Arg Pro Ile Leu Phe His Ser Asp
930 935 940
Gly Pro Asn Ala Gly Asp Gln Glu Pro Phe Pro Met Gly Thr Asn Ile
945 950 955 960
Arg Ala Arg Ser Gly Arg Ser Arg Ala Ser Ser Gly Glu Glu Ser His
965 970 975
Gln Asp Ile Ser Ile Thr Ser Val Asn Cys Asp Thr Ser Thr Asn Gly
980 985 990
Val Asp Thr Thr Gly Pro Ala Lys Asp
995 1000
<210> 2
<211> 7759
<212> DNA
<213> 水稻(Oryza sativa)
<220>
<223> OML4核酸序列(基因组)(水稻)
<400> 2
atgccatctc aggtcatgga tcagaggcat cacatgtccc agtacagcca ccccaccttg 60
gctgcatcct ccttctcgga ggagcttcgt ctccccacag aggtactcca taattgcgat 120
aattttggtc caaatcttcc ttctggaagt cttttctatg tgatggctaa tggtgatctg 180
tctggaaatt ttatttgttt agcctttcct ggtgacctgg ttatgattca tatctacaaa 240
tctttaccaa ttattctcac catgtttata tattcattat gatgaatatc tataatttgt 300
actaattttt ctctcaccat gttcatctct tcttctatct ttgcagaggc aagttggatt 360
ttggaagcag gagtcattac ctcatcacat gggttagtgc tgagtttgat ttaacttata 420
ctgggttttg ttctacattt gtctattagt atgccttgcg gttgcagctt taaattttca 480
cgctgttggg ggcatgtact tagtcgtttc tttatgcatg gatagcaaaa ctttggggac 540
atctattggc tcttttttct gcatgaatta caaaccatct ataggagggc tttctttgaa 600
aggtttacct ggccttgaca gccatctagc ctgcctaaat tgagttaaca ctaggtgctg 660
gccttgccac ctgattagtg ccttggtgaa cattggtttt aagtattttc ccctctattt 720
atgttagatt aatttgcaat aaataaataa ataaataaat aaacatgcat gttcttctta 780
tatatgcaat tggttgttgt gttttttctt gttatggtta ctttctttgt tctattgtac 840
tactctttga gtctttgata atgtgatggt tcataaatat gtgggtttcc catgatattt 900
tctcataact aggtgggttt ccaatattga caggaagcaa gtctgttgca tcttcaccaa 960
ttgaaaaacc tcaacctatt gggacaagga tggctggtcg actagaactt ctacaaccat 1020
ataaactaag agaccaggga gctgcattta gccttgagca caagctattc ggtcaagaga 1080
ggcatgctaa cttgccacca tctccttgga gacctgatca agaaactggc cgccaaactg 1140
attcatcttt gaagtcggca gctttatttt ctgatgggag gattaatccg aatggtgcct 1200
ataacgagaa tgggcttttc tcaagctctg tatcagatat ttttgacaag aaatgtgagt 1260
ggtttttctt tatcatttgc atttgcttca tcaaaatgct tgattctatg aaacacagac 1320
tcgagaaatt tccattccat tgatagtaaa tgtgctgaaa tataccatca catgacatat 1380
gtattggcaa ctacaacgct tccttacgat cttacattct atacttaatg cttctcatga 1440
atgaatagaa atgtacaaaa gtaaaacaaa aaatacaact gaaatgaaag ggtagtaaaa 1500
tgaaatgact ttcattccct tccccttttt ccataagaat cttgcctcct ttatctcctg 1560
tttctttcta gtggctaaaa gaatcaatcc actttagttt ggtatcgtag tccgtctgtt 1620
attcttgtac attcttttgc caaaaaaaag tctgcactct ggttcaacct ttattctatt 1680
gtaatatgtt atctccaatt tccaatcatt gaccactgtc tgattttatt tgtaacctgt 1740
gcagtgagat taacatccaa gaatggtctt gtcggtcagt caattgaaaa ggttgaccta 1800
aaccatgttg atgatgagcc ctttgagttg accgaggaaa ttgaggccca aataattgga 1860
aatcttcttc ctgatgatga tgacctgtta tcaggtgttg ttgatgaagt tgggtatcca 1920
accaacgcta acaaccggga tgatgctgat gatgatatat tctacactgg aggcgggatg 1980
gaactcgaaa ctgatgaaaa taaaaaactg caagaattta atggcagtgc taatgatgga 2040
attggtttgt taaatggtgt gttgaatggt gaacatctat accgggaaca gccttcgaga 2100
actctttttg ttcgaaacat taatagtaat gttgaggact ctgaattgaa gctcctattt 2160
gaggttagtt acttatttct tcttctttga atcactcttc tgttacaaca gatttgacat 2220
ctgagaagcc atctgttctt ctatgcagca tttcggagat atccgtgccc tttatactgc 2280
ctgtaaacat cgtggttttg tgatgatatc ttactatgat ataaggtcag cgctgaatgc 2340
caagatggag cttcaaaaca aggcactgag gcgtaggaaa cttgacatac attattccat 2400
tccgaaggta accatcaaat catcaattgc cacttaactg aaaatgctta tctgcatttt 2460
ctgttgcctg ttcttgtgct tagaatgtta ttattctaga tattcactaa aattgagcac 2520
atttgctttt ctttccccac aggacaatcc ttcggagaaa gatattaacc agggaactat 2580
tgtacttttt aacgttgacc tatctttaac aaatgatgat ctacataaga tctttggtga 2640
ctatggtgaa ataaaggagg tacgatattt catttgctga ctactattat agctagaaag 2700
tatgactcac tagttctatt tgcagattcg tgacactcca cagaagggtc atcacaaaat 2760
aatagaattt tatgatgtca gagcagctga agctgcactt cgtgcattaa acaggaatga 2820
tattgcaggc aagaaaatca aattggagac cagccgtctg ggtgctgcta ggcggtaagt 2880
catttgggtc ttgtcaacag tgataatact ctgtttgctg ttttcttttt agttcttact 2940
actactttct tcatcacttt tataacatac atattcacca ttttaacatt tttgacatac 3000
tagctgaatg cccatacatt gcaatgggaa ttaattatta gagaaccaca ctgcacactc 3060
taaagcctca aaaattaata taaaactatc ctcaatgtaa atcttagggt catatttttt 3120
gtcgtcattt tcacctccaa tttgttttcc ctgttagacg gcttgaggtt aggaaaggga 3180
caaaagtcca cctacctcac tgtttggggg actcacatag cagtggtggt gggtggtggg 3240
tggtggcagt ggtagagtat agagtatata ttttgaatgc atagtgtatc ttcttttatg 3300
tttgagtttc ttatccacat aatgttcatg ctgagctgtg caggaatagt ttagttgaat 3360
gcagcatatt gaataaacga aaaaaatgtc aaacatgttg gtagaatggc atttctctga 3420
gtattttaat tgtagctatt gctttgactg atttcaatgc tctctatcac agcttgtcgc 3480
agcatatgtc ttcagaattg tgtcaggaag agtttggtgt atgcaaactg gggagtccaa 3540
gcacaagtag ccctccaatt gcttcgtttg gtatgctgtt ttcctttttc atctcaatgt 3600
atgttttgct gataggtgca ttttctgaca cggatggtta tattgcaagg ttctactaat 3660
ttggcaacaa taacttcaac tggtcatgaa aatggaagta tccagggtat gcattctgga 3720
cttcagacat caataagcca gttcagagaa acatcttttc caggcctatc ttctaccata 3780
ccacaaagtt tgtccactcc aattggaatt tcatccggtg caactcatag taaccaggct 3840
gcccttggtg agatcagcca atctctaggt cggatgaatg ggcatatgaa ctatagtttt 3900
cagggcatga gtgctcttca tcctcattct ctgcctgaag tccacaatgg agtgaacaat 3960
ggtgtccctt acaacttaaa cagcatggca caagttgtca atggaaccaa ctcgaggaca 4020
gctgaagctg tggacaacag acatctccat aaagtgggtt ccggcaacct caatggacat 4080
tcatttgatc gtgcggaagg aggtaatttg tatatcctaa tctcctttgt ttgaaaaatc 4140
tgttatgtta agaggaactg aactatccta ggatatgttg gttccatcat gggtcatgcc 4200
atgattttgg tgggatgaat tcctcgtttt ctataattac atgcttttgt gggatgaggt 4260
ggtgatcgac caaacacatt tcgtttctca aaccaatgaa agttgtgtaa tgtttggatg 4320
aaagaaatta catctggatc aatctacaag ccttatatgt tatctaatca ttccttgaat 4380
gtgtattttt tttttcactt gcagctcttg gattttcaag aagtggaagt tcttctgtcc 4440
gtggtcacca gttaatgtgg aataattcaa gtaacttcca tcatcaccca aattctcctg 4500
ttctatggcc aagccctgga tcatttgtaa acaatgttcc atctcgctcc cctgcacaaa 4560
tgcatggagt tccaagagca ccatcgtcgc acatgattga caatgtgctt cccatgcacc 4620
atctccatgt aggatcggca ccagcgatca acccatcact ttgggatagg cggcatggct 4680
atgcagggga attgacagaa gcaccaaatt tccatcctgg tagtgtggga agcatgggat 4740
ttcctggtag tcctcagctt cactcgatgg agcttaataa catataccct caaactggag 4800
ggaattgcat ggacccaact gtgtctcctg cacagattgg tggtccatct cctcagcaga 4860
gaggttcgat gttccatgga aggaatccta tggttcccct tccatccttt gattcacctg 4920
gtgaacggat gaggagccga agaaatgatt caaatggtaa tcagtctgat aataaaaagc 4980
aatatgagct tgatgttgac cgcattgttc gtggtgatga ctcccggact acgctgatga 5040
taaagaatat cccaaacaag tatgtgtaac aactgttaat ttaggttcat ttttttttct 5100
tgcctttgcc ttcttttctg tcattttcat gtatttctaa ttgacttggg attccaggta 5160
cacctcaaag atgcttctag ctgctattga tgaaaatcat aaagggactt atgattttat 5220
ttacctacca attgacttca aggtgatcta gatttattta gtatgcaact aatacatcat 5280
atttgttcag atagtcttgc ctaatcgaat tactgaatgg gatgtgtcct acttttcaga 5340
acaagtgcaa tgtaggctat gctttcatca atatgaccaa tcctcagcat atcattccat 5400
tttatcaggt gagagatact atctataggg cctgcccagc tgagctggct gcaactgcat 5460
cacagccagc tgctgcccga agcagcaatg ccagtggctt gctcctgcag ccagctcagc 5520
caagagaaac cattatcaag tgctagtcgc atgaaggcaa tagcttacgt tctgcatgcg 5580
gcttgtcaac tttggacatt gtacattatc caatttgaaa taaatcaata ttgtgccctc 5640
atcccttttt tgcagacgtt caatggcaag aagtgggaaa agtttaacag tgagaaagtg 5700
gcatcacttg cttatgctag aatccaaggg aaatcagctc ttattgctca cttccagaac 5760
tccagtttga tgaatgagga caagcgctgc cgccccatac tattccattc ggatggtcct 5820
aatgcaggag atcaggtatg atctttctct ctctctctct ctctctctct ctctctctct 5880
ctcgttgata aatggagtta aagcagcaga tgacacttgg acacagtttg ctgttttatg 5940
gcaagttctt ttttgttagc aggccttttc tgctgtattt gaatgtattt tatcacaaat 6000
agacctatat tttgtggttg tttctgttct gcagttccaa atttcatgcc acattgtggg 6060
ttccttctca ctctcttttt tcttttgcat gccatgtcat ggtctctttc ctatatatta 6120
cagttgcaag caccattcct tctcatttct ttgggaacta gaagataata gtatctgtta 6180
cttattattc tctcctaatg gcactgagtt tgctccataa tcactagtca ttcttgtttg 6240
gtctttcaga accttttatg ttagctctga aaggtttatt gttccatgca gattgctatt 6300
cctttaacta tatgattaac accttttgtc cttttgttgt ccattaggaa ccattcccta 6360
tgggtacaaa catccgagcc aggtcaggga gatcgcgagc ttcctctggc gaagaaagcc 6420
accaggacat ctcaatcacc tcggttaatt gtgacacttc taccaatgga gttgatacta 6480
cagggcctgc caaggactga gtaacacaac tgctctggat cactaacccc caaatcccaa 6540
atcataactt ttgcgacgcg gtttccattt cccagttttc cgcccttttt cccccaactt 6600
tggttttttt ggtatgaccc ccaatctgta tttattaact tccatgaatg cgggttaccg 6660
aagacttggc tagattgctg caacattttg tccctgatgg aaacatggat agagagacag 6720
agagggtgct tccagtttcc cctgaaccta ccattatcat attaacctga aggccgagaa 6780
aggtgaaagg cgcagcgaga gcttccagat tttggtcact ttttaagaat gtattaaccc 6840
catgttgtat agcagtttcc agtaactgtg ctgaggggag agagagaaag agaggagagc 6900
aaggagacaa tttacatgag tttttagtgg tggtgtggag aggaagtctt tccctgcatt 6960
ttcttttgga accttttctg gcgtcttcat ctatgttcca ttttgagttg aggtctcctc 7020
ttttaagttg tgtgcagagg agttccgatt ttgtcttcag ggaactttga ccgtatctat 7080
cgaccttcat atgtaaatca acatctctat atagtttgtg tgccctctgt tgtatgcctg 7140
cggccccttg caccaaacga attgtctctc taactcgtga gattgctgtc ctcgtttggt 7200
cgtattacat ctgaatctaa gcatttgatg ttacgcaaat acatgccaat ggctgcattg 7260
cgacatgtag cagacggcca atgttcaaac aaaaatctta acttatgaag tatactagta 7320
cctccatcct aaaatataac aatttgggac tgatgtgtat atcctagtcc aatgaatctg 7380
gcccttgtct aaattcattg gactggatat gtctcatcca ctttcaaata gctatatttt 7440
gggacgacac tttcaaataa ctatattttg gaacggaggg agtaaataat tataaatact 7500
agtactatca atttggcaca tggtgtcaag tccacttggt gcatggtcat ctaggcttcc 7560
ctttggtgcc tctcttaaga accttctaag cgtttaacac aaattaaaat cgaagtaaga 7620
atctgacacg aattgaattc gaaatttgct ctcacaatga gacaaaaaca aaagaatttg 7680
gcgaatacag cagtaacgcc gtggacgaag acaataataa tagtctcgga ctcgggagtt 7740
gttcagtcag tgtccgtca 7759
<210> 3
<211> 2049
<212> DNA
<213> 水稻(Oryza sativa)
<220>
<223> OML4启动子序列(水稻)
<400> 3
cttactgtca gatggactac tttgagaaaa aaagggggca aaataactat atcaataaat 60
taacctctgt caaaacaggc aacaattaaa attaagagca gcttagacca ttctttctaa 120
ttttctagtt ataagatgca cattctactt cagttttcgt tagcgcgttt ttcaaactgc 180
taaacgatat gttccgtgcg aaaactttct atataagtag cttaaagata tcaaataaat 240
ccattattca attttgtaat aatcaaaaac tcaattaatc atacgctaat gactttatat 300
tcccttactc aatcttcatc tatcttaaat tgggccatgt ctcttttttt aattaagatg 360
cagattttac ttcggttttc attagcacga tttttaaatc gctaaatggt gtgtttcata 420
cggaggatct acttttgaaa atttttaatg atttaaactc aattatttat atattaatag 480
ctctctcatt ctgcgtgccc ttacttaatc ctcatcctca ttacttacaa acactgcata 540
acggagtaat agtattatta ttaatgttat gttaatcctg atcctaatcc ctaatccaaa 600
gagaaccatc taaatacccg gcgcaagcaa ccccctctgc tctgtcgtaa ccaaaaattt 660
ccctctcccc tgcgaactcc caccacccaa atttaactcc cccaacctcc cgcccgtcgc 720
gccagctgac ccgtcactga cagggtgggc cccacgcccc ggcgcggtgg gtcccacgcg 780
tcagcgaccg tgggtagggt gggcgcgggt gcgccccccc cccacccggt cccgtgctcc 840
gcggtggcgg tcaccgggtg cggggggtgg gccgcgtata taggcgggcc gccgcgccgc 900
gcgctgctgg ctaggtgtag gagcttcagc tttggcccac atcgcccccc tctcgccctc 960
ttccttcgct ttcgtctcac cgcccccacc gcctcgcctg ggggagggga ggggagggga 1020
gcccttcgcc ggagcggcca ggttccggcg agcatctaga ggaggaggag ggggagggcg 1080
gggaatgggg agcggcggcc ggaagagggg gcacgtcgtc gctgctgctg ctgctgttgt 1140
tgttgcgtcc ctctagggtt aggtaggggc gttgctggag tagctttctc ccacccccaa 1200
ttttttttgt tcgttctctt tcgctctcga ggtctctctc tctctctctc tctccccacc 1260
tccgccccgc cgcgtcgggg ggttggtcct ccttgccggc ggcgttcgtc gtcgtcgtcg 1320
tcgcattgag gggggagagg tgatccggcc gtagtccatt ccagctcggg gaaggggggg 1380
ggcatggggg cagctggtcc gcgtggtggt gccgccgctc tcgaattcgt gcggggattt 1440
tggttttgaa gagggaggtg acccgcacgc gccgatctgg tgaggccttg ctcgttttgt 1500
gctgtttttt gtgcctagct ttggtcggag gtgtttgaat tgttggggaa ttttgagctt 1560
ttgctgtgat ctgagcttca aatttcggtg ggggttaact tggcctgggc acctcggaat 1620
ttctgtttaa tttttggtgg ggtttctttg atcacaagat acttgcttgc ttggagcttt 1680
gggagcccga ggcgcattaa attccacatc ttctgcgctg ttttatcggg aaattaaaca 1740
tttcgtgctc aagtctgtgg gggggttttt ccctcggatt tgtcaaatct ggcggctctt 1800
gttcgaaaat tttcatcttg ggagcttacg aacgcaaaat tcttcacatt tcttttgctt 1860
cctggcttgg aagctgtgga atccaaattt ttatgtgctg aattgacatg gttagccatg 1920
ttttttttcc acagaaccac atgattttag caaaatttcg ccatttctac tttgatccgg 1980
tggaatctag ttgccagatg tgtcgactgg taccttgtct aactagctcc atggctatgc 2040
gcttgcagg 2049
<210> 4
<211> 402
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> GSK2氨基酸序列(水稻)
<400> 4
Met Asp Gln Pro Ala Pro Ala Pro Glu Pro Met Leu Leu Asp Ala Gln
1 5 10 15
Pro Pro Ala Ala Val Ala Cys Asp Lys Lys Gln Gln Glu Gly Glu Ala
20 25 30
Pro Tyr Ala Glu Gly Asn Asp Ala Val Thr Gly His Ile Ile Ser Thr
35 40 45
Thr Ile Gly Gly Lys Asn Gly Glu Pro Lys Arg Thr Ile Ser Tyr Met
50 55 60
Ala Glu Arg Val Val Gly Thr Gly Ser Phe Gly Ile Val Phe Gln Ala
65 70 75 80
Lys Cys Leu Glu Thr Gly Glu Thr Val Ala Ile Lys Lys Val Leu Gln
85 90 95
Asp Arg Arg Tyr Lys Asn Arg Glu Leu Gln Leu Met Arg Ala Met Asp
100 105 110
His Pro Asn Val Ile Ser Leu Lys His Cys Phe Phe Ser Thr Thr Ser
115 120 125
Arg Asp Glu Leu Phe Leu Asn Leu Val Met Glu Tyr Val Pro Glu Thr
130 135 140
Leu Tyr Arg Val Leu Lys His Tyr Ser Asn Ala Asn His Arg Met Pro
145 150 155 160
Leu Ile Tyr Val Lys Leu Tyr Met Tyr Gln Leu Phe Arg Gly Leu Ala
165 170 175
Tyr Ile His Thr Val Pro Gly Val Cys His Arg Asp Val Lys Pro Gln
180 185 190
Asn Val Leu Val Asp Pro Leu Thr His Gln Val Lys Leu Cys Asp Phe
195 200 205
Gly Ser Ala Lys Thr Leu Val Pro Gly Glu Pro Asn Ile Ser Tyr Ile
210 215 220
Cys Ser Arg Tyr Tyr Arg Ala Pro Glu Leu Ile Phe Gly Ala Thr Glu
225 230 235 240
Tyr Thr Thr Ser Ile Asp Ile Trp Ser Ala Gly Cys Val Leu Ala Glu
245 250 255
Leu Leu Leu Gly Gln Pro Leu Phe Pro Gly Glu Ser Ala Val Asp Gln
260 265 270
Leu Val Glu Ile Ile Lys Val Leu Gly Thr Pro Thr Arg Glu Glu Ile
275 280 285
Arg Cys Met Asn Pro Asn Tyr Thr Glu Phe Arg Phe Pro Gln Ile Lys
290 295 300
Ala His Pro Trp His Lys Val Phe His Lys Arg Met Pro Pro Glu Ala
305 310 315 320
Ile Asp Leu Ala Ser Arg Leu Leu Gln Tyr Ser Pro Ser Leu Arg Cys
325 330 335
Thr Ala Leu Asp Ala Cys Ala His Pro Phe Phe Asp Glu Leu Arg Glu
340 345 350
Pro Asn Ala Arg Leu Pro Asn Gly Arg Pro Phe Pro Pro Leu Phe Asn
355 360 365
Phe Lys His Glu Leu Ala Asn Ser Ser Gln Glu Leu Ile Ser Arg Leu
370 375 380
Ile Pro Glu His Val Arg Arg Gln Ala Thr His Asn Phe Phe Asn Thr
385 390 395 400
Gly Ser
<210> 5
<211> 4624
<212> DNA
<213> 水稻(Oryza sativa)
<220>
<223> GSK2核酸序列(水稻)
<400> 5
atggaccagc cggcgccggc gccggagccg atgctgctcg acgcgcagcc gcccgccgcc 60
gtcgcctgcg acaaggtatg tgactaaccg gatcttggcg tgctgatccg tggttttgcg 120
gttctttgct gtgtgctgat ttagtgtgct gttcttggtg gagcagaagc agcaggaggg 180
ggaggcgccg tacgcggagg ggaatgacgc ggtgaccggg cacatcatct ccaccaccat 240
cgggggcaag aacggcgagc ccaagagggt gagacacgag ccttcccccc cccccctttg 300
ttgttttggt cttggttcca tttcttgagt tgcagtgaaa tgctgccggt tcttggttta 360
ggaaggtgtt cttgtgtgtt ctgcagctag tttcttagct ccgtgtagtg atttttggtg 420
atgggaaagc cattggctct aagagaggca tgtggattag tggtcagatt ttgcaaaaga 480
agtaaactgt tggtagatat cagccaattt atttagtgtt agttgttcat gttcttgtat 540
tactgcaaga tctgttgtaa ataactaaat atggcttgtt tggtgctcat ttttggtggt 600
ttgtagggga aaaagttggg tgtgttggat tacattgttg tgaacactag tgctcataat 660
taaattttgg tcttaagatg gtaattttgt acttgatttt cagacaatta gctacatggc 720
ggagcgcgtt gtgggcactg gttctttcgg tatcgtcttt caggtgattc atctttcaga 780
aagttgttat ttgtttcttt cttttcgtgc tgtcgacttg ttggtctgat gtttagcttg 840
ctggtttcat gtgtaggcta aatgcttgga gacaggagag actgttgcca ttaagaaggt 900
attgcaggac cgacggtaca agaaccgtga gcttcagctt atgcgcgcca tggaccaccc 960
caatgtcatc tccctgaagc attgcttctt ctcaaccaca agtagggatg agctgttcct 1020
caatcttgtc atggaatatg ttccagaaac actctaccgt gtgcttaagc actacagcaa 1080
tgccaaccac cggatgccac ttatctacgt caagctttac atgtatcagg tgtgtggatt 1140
gctaatcaat cataaatttt gaaatgcctg ccttcctgtg tgtctcttct aagtctattc 1200
tacattggct gcagttattt agggggcttg cgtacattca tactgttcca ggggtctgtc 1260
atagggatgt gaagccacaa aatgttttgg taggtattca tgatcagatt attattttgc 1320
tatgcgatgg cctttgatta ttggctctga actcctttct tgcaatacag gtggatcctc 1380
taactcatca agtcaagctc tgtgactttg ggagcgcaaa aacactggta ttggcctttt 1440
ccaccctaaa gttttgtaat acgcacacat tactttagac tttctttttt ttaattggac 1500
tttagacgat tcttgctgta gactagtcag ttttgaatct taccatttgt taagttggag 1560
ctagccctgt gttactgaat cgttcaaaga actcttatat acttggtgaa tcttacccct 1620
ttttttcttc ctttttatta tgcttgatgg aagtttcatg gaaattcctt agttttacac 1680
ctttttccac cttattccag atgtttgcta caattgtact tttgataatt ttgatcttac 1740
tgtcctaata tccattaatt tactattcca tcaggtccca ggtgaaccca atatatcata 1800
tatatgctca cgctactacc gagcaccgga gctcatattt ggtgcaactg aatatactac 1860
atcaatagat atatggtcag ctgggtgtgt tcttgcagag ctactccttg gtcaggttgg 1920
tttctttttt ctatggttga cagatctgca aacttttggt ttagttattt aagcatgatg 1980
tcatcactgt tgctgtgatt ttgattatct tgtatttgtt tttgctagcc attgtttcca 2040
ggggagagtg cagtcgatca gcttgtagag ataattaagg tactgcaaga catgccatgc 2100
agttctaatt ttgctcctac tattgagtat gggcatcttc tctaaccttg tatgatattc 2160
ttgcaggttc ttggtacacc aacccgtgag gaaatacgtt gcatgaaccc gaactataca 2220
gagtttaggt ttccacagat aaaagctcac ccttggcaca aggtaagcat acaatcttat 2280
ccatgttgag tcatatatca cgtcatcttt tatagtttcc tggacaacta tgaaaatgta 2340
gctgggctca tttccaataa tagattctgg acaccagata gctttacaat gcaatgtata 2400
aataaggagg tgcatacagg tactgatttt tctaacttct gcgtaggttt tccacaagag 2460
gatgcctcct gaagcaatag acctcgcttc acgccttctt caatattcac cgagtctccg 2520
ctgcactgct gtgagtatat tcttgctgca attttaagta gcagaacagt agaaaagtga 2580
tttttcacta ctgctcacag caggggtact gtaaaacgcc ccttttctta ttgctgttat 2640
gcaagtttgc ctactgtagc tggtcatatg agctgttact tttcaccctt taagagttgc 2700
acaaatttga gcgtaaccaa ggaattttct taatcacttt gccctccaag tgctctttga 2760
tttgtgcaac tcctgaaatg gggtggagtg gagaaacact ccttgtttct ttctcttttt 2820
tcttttttcc taaagtagat tgaagaatgc tagtcttcac taactttggt tttagtgggg 2880
catggccatt atggttatga tctttagtgg tccattacca aatcaatgtt ggggtggatg 2940
aatgatagtt gtctcatgtt tagtcgttat tcagtgtaat tgcaatagcc agatgacaac 3000
ttaatattga ttttttttcc gatgtgctta ttcatttgaa tatctttatg cagcttgatg 3060
catgtgcaca tcctttcttt gatgagctgc gagagccgaa tgcacgcttg ccaaacggac 3120
gtccatttcc accactattc aacttcaaac acgaagtaag tgaatcagat gaaacataat 3180
ctgctacaca acttcagatc ttggtatcca tgagaaaatg tgtactctcc ttggtgctca 3240
ttggtgctgc cttttggtct ctacagctag caaattcttc tcaagagctc atcagcaggc 3300
tcataccaga acatgttcga cggcaagcta cccacaactt cttcaatact gggagctaaa 3360
aatgctaaat gcacaccacc agaccttttg ttggatcgtt ttcgcggaac cggtgaagtt 3420
cacatgaagg ctgagtcaga tgattcttcg aatccccgca aaacaagaag aatagaaaat 3480
atgattcctc agatgatgat atgcaaatgc ttcgttggaa gttcaattca atcatcgaag 3540
aagaacaaca ttgtaaatcg agaagttttt gcatcgcgag tttggtagtg aaaccgggat 3600
cagctggtat gacggaggaa accgaaatgt ttagatccat gactgagttt tctttcattt 3660
tttttgccca attgtaacag aagaatatag ttccctaatg taggcgtagt tgtaacctgt 3720
aaactgccac tgttttgttc acattccatg atgtaaatgc caccatgcct ctgatgaata 3780
actctccttg taaccttgtt ccttccatcc ttgactgttt accttaaagc cgtggacagt 3840
gtacactgta catgtaccgt gctacacgga aggacatatt tgaatttttt ttctctctct 3900
cgaaagacta catcaagcat tgctggattt ttttttaaaa aaatggcaca actttcgatg 3960
gtcaaccata agcaattagt gtcgttttaa aaccccttac tcccatatgc acaatactta 4020
tctttcattt ttctagattg tttagcataa aataagattt aaaaagaaag aaaactatat 4080
tgctatttaa ttgttgggtg tagaatggga aaacttttta aatgaaagat gattatttct 4140
taatgtaaca agtagtactg tagtgtggat tgaattgggg caaactttaa actctaaaac 4200
gagaactatt tttgaataga gcgagcattt aaaagatgaa ttacatacca cctatagaga 4260
tgaaaaaaaa ggcatgggac agttagggct tgggccccat agcttgttag gtttgtaaga 4320
ttaaaattta gagtaaattt cacaaaacta cacatactat gaccaaacta tcacaaaact 4380
atatatttaa ctcgatgtat cataaaacta cacatttaag atgaaatgtt acaaaactac 4440
atgtttagtt actacattat tacagaacta taggtttaga accaatttag ttacaaaaca 4500
ataatgttta ttgctctagc ataataatgg tgctagggat ttaaactcta aattgtgata 4560
acttcaatat taaatatgca gttttgtgat acttaacttt aaatctatag ttttatgata 4620
caac 4624
<210> 6
<211> 2247
<212> DNA
<213> 水稻(Oryza sativa)
<220>
<223> GSK2启动子序列(水稻)
<400> 6
ccgtactgat ttcggcagca tcaaggacta gaggaggagg aggagcaata aacaagtgcc 60
gccatgtcgc ttgcccggct ttcaggggcg cttttggaat tctcgtttga ccgcctacaa 120
acccacagcc tgtccctgca accaatttgg ccctgcgcca cgccaccccc aaagctatta 180
gtactaacca caccccctct ctctctctct acacttagca gtagtactaa gaccctcttt 240
tataaaattt ttaagtcact atcacattcg ttagcagtag tactaagacc ctctttgtaa 300
aacttttaag tccctatcac atcgaatgtt tggacactaa ttataaatat taaacgtaga 360
ctattaataa aacccatcca taatcttaga ctaattcgcg agacgaatct attgagccta 420
attaagtcat gattagccta tgtgatgata cagtaaacat tctctaatta tggattaatt 480
agacttaaaa aatttgtctc gcaaattagc tttcatttat ataattagtt ttgtaaatag 540
tctatattta atactctaaa ttagtgttta aaacagagac taaagttaag tccatgatcc 600
aaacaccacc taacatggac aattaggctg tactacaacc ttttgccaag ctacgtgtac 660
aggtaaatcg cacacatgtt gtcatctttg gaggctgaaa catggggaaa tatcatgtga 720
aaaccgttaa ataagtgaaa actcatgaaa attatattta aaagttctct aaatttatat 780
aaaaattaat agagataaat atagacatga aatacattta catcaaatct caagtcgaaa 840
ctcaactttt atttgagaga atataaaaga caaattttag gtgaatagtg ttctattatt 900
tttcatccga aatttggcat ttttgttact cccaaataaa gttgagttta acttgatatt 960
tggtgaatat atttcatgcc tacacttctc tccagtaatt tttcatgaat ttattaaact 1020
tttagttccg attttcacgt gttttcactt atttgatggt ttccatcgga tatgtccctg 1080
aaatatggta ttgaagtaca acatagttca tacttgggtc gtgtttgaag tcatgtaagg 1140
gcgttataag ctcataggtt ttgcttacat acaattggtg ggataaaaag gcaccggtaa 1200
tttcttcaag attgataaaa taaatgtcta gcgctataag gccatggcac acatcaaatg 1260
ttgtttagaa caggttattt ctagctccat aaattgttgg atttgaattt gtgattacat 1320
tgataataat tgattgaatc agtttgttct tattttagag aaaataaaaa aaataaacca 1380
ctataattta acttacaaac tccaaaacta gtctggatct gtaatttagg ttgtgctaaa 1440
caaggcctaa agaaaagaag taatgtttgg agaacatgtt tttaaatcaa tatggaccat 1500
cttctaaaat gggcacactg tgcaaccgaa atggttatta gcaacttaat atccaatcct 1560
taaaaaaact acattgaaaa tatcctaaat cccaaaatta aattttaaaa tctaattttg 1620
gtagcgattg attatttgta ggggcaaatg atgaggccct aaatcaacca tgtttagcta 1680
cttcctcgct ttctttaagt atgtttcata cgctacaaac tgatattttt tgcaaatact 1740
ttttattaaa aaaattattt taagtctgca aaagctaatg tttaattagt cctacactaa 1800
taatcctcct tgtttggctt gccgctgata agcttagtca aaaccctgat ccgaactgca 1860
cgtaagaacg gtcaagaaac catttcggtt acatcacaca acacagcctc atctctcatg 1920
ctgtcatgct tgtggtgcac ctagcaattc ctccctcccc atctgtcttc ctcctctaat 1980
ctaatccacc tccccactaa tccaccagct gtgtacactg cagcagcagc agcagctaac 2040
cactctcact aaaaactata gcagctgcag taacagcagc agcatcaccc accttcttct 2100
tggtcaaagc catccatccc accactcacc catccctccc agtataagcc aaaccaatcc 2160
atagaggagg aagaggagga ccaggtggtg gcacacctaa gctttgtgca gtgccattca 2220
cgcacctgca gcttccagct ttgccac 2247
<210> 7
<211> 925
<212> PRT
<213> 小麦(Triticum aestivum)
<220>
<223> OML4氨基酸序列(小麦)
<400> 7
Met Glu Pro Tyr Lys Leu Met Asp Gln Lys Thr Pro Phe Gly Glu Arg
1 5 10 15
Lys Leu Leu Gly His Gln Arg His Val Asn Leu Pro Pro Thr Pro Trp
20 25 30
Arg Ala Asp Gln Asp Pro Leu Gln Gln His Asp Ser Phe Ser Lys Pro
35 40 45
Leu Ala Leu Phe Pro Asn Ala Arg Lys Gly His Leu Asn Met Thr Gln
50 55 60
Tyr Glu Asn Gly Leu Phe Ser Ser Ser Leu Pro Asp Ile Phe Asp Asn
65 70 75 80
Lys Leu Arg Leu Thr Pro Lys Asn Gly Leu Val Gly Gln Pro Ala Glu
85 90 95
Lys Glu Val Asn His Ala Asp Asp Glu Pro Phe Glu Leu Thr Gln Glu
100 105 110
Ile Glu Ala Gln Val Ile Gly Asn Leu Leu Pro Asp Asp Asp Asp Leu
115 120 125
Leu Ser Gly Val Leu Tyr Asn Val Gly His Pro Ala Arg Ala Asn Asn
130 135 140
Met Asp Asp Ile Asp Asp Asp Ile Phe Ser Thr Gly Gly Gly Met Glu
145 150 155 160
Leu Glu Ala Asp Glu Asn Asn Lys Leu Leu Lys Leu Asn Gly Gly Ala
165 170 175
Asn Thr Gly Gln Thr Gly Phe Asn Gly Leu Leu Tyr Gly Glu Asn Pro
180 185 190
Ser Arg Thr Leu Ser Ile Arg Asn Ile Asn Thr Asn Val Glu Asp Thr
195 200 205
Glu Leu Lys Leu Leu Phe Glu Gln Tyr Gly Asp Ile Arg Thr Leu Tyr
210 215 220
Thr Ala Tyr Lys His His Gly Leu Val Met Ile Ser Tyr Tyr Asp Ile
225 230 235 240
Arg Ser Ala Glu Arg Ala Met Lys Ala Leu Gln Ser Lys Pro Phe Arg
245 250 255
Gln Trp Lys Leu Glu Ile His Tyr Ser Ile Pro Lys Glu Asn Pro Leu
260 265 270
Glu Asn Asp Asn Asn Gln Gly Thr Leu Ala Val Ile Asn Leu Asp Gln
275 280 285
Ser Val Thr Asn Asp Asp Leu Arg His Ile Phe Gly Gly Tyr Gly Glu
290 295 300
Ile Lys Ala Ile His Gly Thr Ser Gln Asn Gly His His Lys Tyr Val
305 310 315 320
Asp Phe Phe Asp Thr Arg Ala Ala Glu Ala Ala Leu Tyr Ala Leu Asn
325 330 335
Met Arg Asp Ile Ala Gly Lys Lys Ile Arg Leu Glu Arg Cys Cys Ala
340 345 350
Gly Asp Gly Lys Arg Leu Thr Thr Leu His Arg Pro Pro Glu Leu Glu
355 360 365
Gln Glu Glu Tyr Gly Ala Cys Lys Leu Gly Asn Ala Asn Ser Leu Pro
370 375 380
Ser Thr Tyr Tyr Gly Ser Val Asn Met Ala Ser Met Thr Ser Ala Gly
385 390 395 400
Pro Glu His Gly Ile Ser Arg Val Leu Arg Pro Arg Val Gln Pro Pro
405 410 415
Ile His Gln Phe Arg Glu Gly Ala Phe Leu Asp Val Pro Ser Ser Thr
420 425 430
Met Gln Ser Ile Ser Ser Pro Val Arg Ile Ala Thr Ala Val Thr His
435 440 445
Asn Asn Arg Ser Thr Val Gly Glu Asn Gly His Ser Leu Gly Lys Met
450 455 460
Gly Gly Gln Ile Asn Gly His Leu Asn Tyr Gly Phe His Gly Val Gly
465 470 475 480
Ala Phe Asn Pro His Ser Leu Pro Asp Phe Arg Asn Gly Gln Ser Asn
485 490 495
Gly Ile Ser Cys Asn Leu Gly Thr Ile Ser Pro Ile Gly Val Lys Ser
500 505 510
Asn Ser Arg Thr Ala Glu Gly Met Glu Ser Arg His Leu Tyr Lys Val
515 520 525
Gly Ser Ala Asn Leu Gly Gly His Ser Ser Gly His Thr Glu Ala Pro
530 535 540
Gly Phe Ser Arg Thr Gly Ser Cys Pro Leu His Gly His Gln Val Ala
545 550 555 560
Trp Asn Asn Ser Asn Asn Ser His His His Thr Ser Ser Pro Met Leu
565 570 575
Trp Pro Asn Ser Gly Ser Phe Ile Asn Asn Ile Pro Ser Arg Pro Pro
580 585 590
Thr Gln Ala His Gly Ile Ser Arg Thr Ser Arg Met Leu Glu Asn Val
595 600 605
Leu Pro Val Asn His His Val Gly Ser Ala Pro Ala Val Asn Pro Ser
610 615 620
Ile Leu Asp Arg Arg Thr Gly Tyr Ala Gly Glu Leu Met Glu Ala Pro
625 630 635 640
Ser Phe His Pro Gly Ser Ala Gly Ser Met Gly Phe Ser Gly Ser Pro
645 650 655
His Leu His Gln Leu Glu Leu Thr Ser Met Phe Pro Gln Ser Gly Gly
660 665 670
Asn Gln Ala Met Ser Pro Ala His Ile Gly Ala Arg Ser Pro Gln Gln
675 680 685
Arg Gly His Met Phe His Gly Arg Gly His Ile Gly Pro Pro Pro Ser
690 695 700
Ser Phe Asp Ser Pro Gly Glu Arg Ala Arg Ser Arg Arg Asn Glu Ser
705 710 715 720
Cys Ala Asn Gln Ser Asp Asn Lys Arg Gln Tyr Glu Leu Asp Ile Glu
725 730 735
Arg Ile Val Cys Gly Glu Asp Ser Arg Thr Thr Leu Met Ile Lys Asn
740 745 750
Ile Pro Asn Lys Tyr Thr Ser Lys Met Leu Leu Thr Ala Ile Asp Glu
755 760 765
Asn His Lys Gly Thr Tyr Asp Phe Ile Tyr Leu Pro Ile Asp Phe Phe
770 775 780
Gln Asn Lys Cys Asn Val Gly Tyr Ala Phe Ile Asn Met Ile Ser Pro
785 790 795 800
Glu His Ile Val Pro Phe Tyr Lys Ile Phe His Gly Lys Arg Trp Glu
805 810 815
Lys Phe Asn Ser Glu Lys Val Ala Ser Leu Ala Tyr Ala Arg Ile Gln
820 825 830
Gly Lys Ser Ser Leu Ile Ala His Phe Gln Asn Ser Ser Leu Met Asn
835 840 845
Glu Asp Lys Arg Cys Arg Pro Ile Leu Phe His Ser Asp Gly Pro Asn
850 855 860
Ala Gly Asp Gln Glu Pro Phe Pro Met Gly Thr His Val Arg Ser Arg
865 870 875 880
Pro Gly Arg Ser Arg Val Leu Ser Cys Glu Glu Ser His Arg Asp Thr
885 890 895
Leu Ser Ser Ser Ala Asn Asn Trp Thr Pro Ser Asn Gly Gly Gly His
900 905 910
Ala Ser Gly Tyr Ser Lys Glu Ala Asp Pro Thr Thr Ala
915 920 925
<210> 8
<211> 6947
<212> DNA
<213> 小麦(Triticum aestivum)
<220>
<223> OML4核酸序列(小麦)
<400> 8
atggacccat acaagttgat ggaccagaaa actccctttg gtgagcacaa gttgttgggc 60
catcaaaggc atgttaacct gccgccaacc ccctggaggg ctgatcaaga tcctctacaa 120
caacatgatt cgttttcgaa gccgttggct ttatttccta atgctagaaa aggacattta 180
aatatgaccc aatatgagaa tggacttttc tcaagctccc ttccagacat ttttgacaac 240
aaatgtaagc ccttgatcct tgtctcttgc agtttttatt tcatttattg tagcacttca 300
taacactgaa ctatgaactg cgtccatccg atatggtact cctcccttca gttcatataa 360
ataatactcc ctccgtccca aaatgtaaga cgctttttga cactatacta atgttaaaaa 420
gcgtcttata ttatgggacg gagggagtag tatgcagata acggaaaggg taaacaaaag 480
aagataagga aaatattttt atttgcttat taataaaaag cttgtttgct tttattgact 540
gtttcacttc agtgaaatct gagcttttct tgctacatcc aagtgagaaa cgagacaaac 600
tggcctgagc ttttcatgct acatccaatt gagaaatgag agtctgtcct gtgcttttca 660
tgctaagtcc aagtgagaaa agagacaatc tgcagtaata ttagtgctta atactaaacc 720
acttttaatt tgctgatgtg cagtgagact aacacctaag aatggccttg ttggccagcc 780
agctgaaaag gaactcaacc atgcagatga cgagcctttt gaattaactc aggaaattga 840
ggcacaagta attggcaatc tcctccctga tgatgacgac ttattgtcag gtgttcttta 900
taatgtgggt caccctgccc gtgctaataa catggatgac attgatgacg atatattctc 960
tactggaggt ggaatggaat tggaagctga tgaaaataac aaattgctaa aacttaatgg 1020
aggtgccaac accggtcaga ctgggttcaa cggcctactg tatggcgaaa acccctcgag 1080
aaccctttcc attagaaaca ttaataccaa tgttgaggat actgaattga aactcctatt 1140
tgaggtaagt tccatcttcc agcttgactt tctcccaact ctgaaggcaa tatatttcac 1200
ctgatagcat ttattttctt tgtagcaata tggagacatc cgaacacttt acactgccta 1260
caaacatcat ggtttagtga tgatatctta ctatgatata agatcggcag aacgtgccat 1320
gaaagcgctt caaagcaagc cattcaggca gtggaaactt gagatacatt actccatccc 1380
aacggtattt ccttgatata atgccattct gacttgatat gatgtggtgc tttgacatta 1440
cttaatgtga tattactacg atgtttgctt gccattattt gttgcattgg tacttaattg 1500
gcactggaaa tgtatttata cttgcaagaa tgttcacatt ctaatgctga ctttgttcca 1560
ataggagaac cctttggaga atgacaataa ccagggcaca cttgcagtga ttaacctaga 1620
ccagtctgta actaatgatg atcttcgtca tatatttggt ggctatggtg aaatcaaggc 1680
ggtatggcct gcgcactaac caactcttat gtcagctagt acactacaga tactaacttc 1740
cttgtttatc agattcacgg gacatcacaa aatggccatc acaaatacgt tgagtttttt 1800
gataccagag cagcagaagc tgcactttat gctttgaaca tgagagatat tgcaggaaag 1860
aaaatcagat tagagcgctg ctgcctgggc gacggtaaac ggtattactg tgaccataat 1920
tttgcgcatc tgtccatttt tagtgcttct agtgccttcg cttttcgaag agtcttatta 1980
cacaccttgt gtcggctacc cttcatgaag ttcttttttc tccaacacgc tttagaatgc 2040
tgttattttt tattagagga aggtactgaa atggcacaag gtatgaccaa tggaagccaa 2100
aaatgaacag aaaaactaaa aaaccagcaa acaaaaaacc aaaaaggcta agaagactaa 2160
caaaatctaa ccaaaactag cataatgacc tatatatact ataccaatta ggaagcaaga 2220
gacctgaagc cccagtaagc agcagaatat ggcggtccag tcggtagcag caaccttcgc 2280
agatcaactt tgtataaagt tatctgggta tctgcgaatt gaggaaatat ataattcaac 2340
ggtgtttatg gtcttgcata tactgtgaag ttggtaaaca tatcgtcaat ggacatatac 2400
agtatacacg gggctgatgc aattcctgtc tcttcaataa aatatgtttt agttattaaa 2460
cacgcaaact tgtgattgac gtttaatatg attttttaga gtcgtcattt gcacttgaat 2520
tcaaagttgg ttgtatactt gtatatttct tgttttaggg aagtgtgctt tggagtttgg 2580
aggaaattgg taggtgtaaa aaaatctttt catatgatgt gcaggaagat gtgttttaga 2640
acttgatgca gaacgtcccc cctatggatt attatgcttg tctaaacttt atttttggag 2700
gaagaaacaa gagcatctga ctttccttat gcctattctt acaactgtat tagtaatgct 2760
agtttttgca caacagtttg acgcggcaca ggcctcctga gttggagcac gaagagtatg 2820
gtgcatgcaa gctaggaaat gcaaacagtc tgccgtcaac ttactacggt atgcagtttg 2880
atttcaaatc acgagacatg tttctgctgc taatcgcatt tactaaccta tgtatggcat 2940
aatacaaggt tctgtcaaca tggcttccat gacttccgct ggtcctgaac atgggatctc 3000
tcgggttctg cgtcccagag ttcagccacc aatacaccaa ttcagggagg gagctttcct 3060
ggatgttccc tcaaatacta tgcaaagtat atcctctcct gttagaattg caactgcagt 3120
aacgcataac aaccggtcga ctgtcggtga gaatggtcat tcacttggaa agatgggtgg 3180
acagattaat ggacacttga attatggatt tcatggggtt ggagctttca atccacattc 3240
ccttcctgac tttcgcaacg gccaaagtaa tggtatttct tgcaacttag gcacaatatc 3300
acccattgga gttaagagca actctagaac tgctgaagga atggagagca gacatcttta 3360
caaagttggt tctgctaacc ttggtggtca ttcttctggt cataccgaag gtactaattt 3420
gggtgcctta tttactgatg tagccatatg tttatggaga cgcactgttt ccattaggtt 3480
catttgccat ctctttccct tccagtcatt ttcttgaaaa tgtcaatttt gaaagaacat 3540
atgctttgat atcaataata cagaagcttt tatagcttaa tggtaattgg tgtagcctaa 3600
attatactat ttttgaggtt gcaactattc tgtttagaca atgcaattag gcttacatgg 3660
gcatgccttg tgttcttgta gcacccgggt tttcaagaac tggaagctgc ccccttcatg 3720
gccaccaagt agcgtggaat aattcaaata actcccatca ccatacctcc tctcccatgc 3780
tatggacgaa ctcaggatca tttatcaata atataccatc tcgacctccc atgcaagcgc 3840
atggaatttc aagaacatct cgcatgcttg aaaatgtcct tccagtgaat catcatgttg 3900
gatctgcacc agctgtcaat ccatcaattt tggataggag aactggttat gtaggggagc 3960
tgatggaagc gccaagtttc caccctggga gtgctggaag catgggtttc tctggtagtc 4020
cgcatctgca tcagttggag ctcactagca tgtttcctca gagtggaggg aaccaagcca 4080
tgtcccctgc acacattggt gctcgatctc ctcagcagag ggggcatatg tttaatggaa 4140
ggggtcatat aggtccccct ccatcttcat ttgattcacc aggtgaacgt gcaaggagcc 4200
gaagaaacga gtcatgtgct aatcaatcgg ataataaaag gcagtatgag ctagacattg 4260
agcgtatagt ctgcggcgag gattcccgga ctactttaat gataaagaac atcccaaaca 4320
agtatacatc tgggactttc tgattttgtt ctagtttatg tgcaagtgtc actctatttg 4380
aagtcacgcc atgttttgat gtttctattg ccttaatggt atttcaggta cacctctaag 4440
atgcttttga ccgctattga tgaaaatcac aagggaactt atgattttat ctatcttcca 4500
attgacttta aggtgaatgg agcttttgta aacagctgtt gcatgtttat ccttggttcg 4560
acattacttg catacaacga actaatggtg ctcatgtgca ttttcagaat aaatgcaacg 4620
tgggctacgc attcatcaat atgataagtc ctgaacatat tgttccattc tataaggtga 4680
gagtgagatg ttacaagtta tgaaatggcg gcagtgtatt agataaagct tcatgttgac 4740
atttttatat gatttttcac cctctgcttt ccgtcgtcat ttctttttcc ataactacct 4800
gtattacact atcatgctac aattgcatgg attttggata tcgcatgtca ggtagtcagt 4860
agtaccttta ccatttctgg tttcacgctc taagcatttt ttacctaatg ccagtcgata 4920
aatgaacaac atacatgcct gtctctttca gatatttcat gggaaaaggt gggagaaatt 4980
caatagcgag aaggtagcat cacttgcata tgctagaatc caaggaaaat catctctaat 5040
tgcgcacttc caaaattcaa gtttgatgaa tgaggataaa cgctgccgcc ctatactttt 5100
tcactcagat ggtccaaatg caggggatca agtatgttct ctgattgtcc atatcctttg 5160
ctgtattact gtttcgatag ggcacctgac ttggtgccac taactagatg acctgtatat 5220
cttattgtgt gcccatccaa tacatgatcg gtgaagtcca cacacatacc taattttata 5280
tcattatatt tttattatct tgcatctgaa attaagcagt agaccttaca cagtttagta 5340
tgtttttttc ttatgctacg tcagaacttt tcctgagtat ttctttcctt tagaattgta 5400
ttgacgcgga aagaaatact gaggaaaaat tcttactccc tccgttccaa attactcgtc 5460
gtggttttag ttcaagagta ctaattaaaa tcctacaaat catggaatat gatcctcaat 5520
ttattctaaa tcctttgaaa caaggaggtc cttgaggatt caagcatagg ctcatcgttc 5580
ttgtttccta gtgttgctat gttcttttta atgatacata tagctgtata ggctcatcat 5640
tttcttcaca tatggtggtg tttgatgcgc aattgggata cattgtgggt tagggagcgg 5700
aaaataaaac catcttgtta acattaggca gggctatgag tttggagtag agaatatagt 5760
gcatacatga caagattgcc cctcgataat ggctttactt aattttgtgt gtatatattt 5820
tttgtatttt taacattatt actcaacctg tctacaaaaa accatcgttc tgattggact 5880
tcaaactgtg gtatatgaaa ctacatatcc catgccaaac accccaatag attgaactcc 5940
tcccacccac tatttccatt cttacctccc atgatgagtc tgaactgacc atgtttttgt 6000
tgtaaacttt tctcaggaac cttttccaat gggaacacac gtccgttcta ggcctgggcg 6060
atccagggtt ttgagctgcg aagaaagtca ccgggacact ctgtcatctt ctgccaacaa 6120
ttggactcct tccaacgggg gcggccacgc ttcaggctac tcaaaggagg ctgacccaac 6180
cacagcttga aagctgaagc actaaccaca acatcaacat ccaacctttt gacatttgca 6240
atcccagttt tcacattacc atcctttccc acctcttttt gcttgtggta ttttcggagt 6300
ctgtagctat ttagtacttt ctatgtcgtg ggctaccaga ggcttcctag aggctgcaaa 6360
ttttgtcgct gagtagaagc aagggaacgg acggagggtg ctcccagttt ctcctgagcc 6420
tatatgcgtg tattaactga aggccgtgga aggcaaaact cgtggggagc tctctgagat 6480
tttggactgt aaggtgtaac ccagcgttgt acagggtttc ctagtaagaa tgcatgacgg 6540
ggacagccga cactgtattg gtgctgttgt atgaaaggca ggctgtgcca tgcagcgtct 6600
tttgaaactg ttttgatgtt aactactccc tccgtccgcg aataagtgta catctagctt 6660
ttattctaac tcaaagtttt gaaactttga ccaactttat aggtaaaagt agcatcattt 6720
atggcactaa attagtatca ctagattcgt tctgaagtgt atttttataa tataccaatt 6780
tgatgtcata taatcctact actctttttt aacaagttgg tcaaaattat aaaactttga 6840
cttaggaaaa acggtagaag tacacttatt cgaggacgga gggagtagga aacatgcccg 6900
tgtgttgcaa cgggagaaat aaaatccttg acataatgat aattgtt 6947
<210> 9
<211> 3140
<212> DNA
<213> 小麦(Triticum aestivum)
<220>
<223> OML4启动子序列(小麦)
<400> 9
gaggagggga caacaagaat gccagatgag aaggggatga tgcacatgcc ggcaacatgt 60
gatatgtaca tgtcttggtt agagactttt gtttatgcaa cctattaaaa actatgtgca 120
tgtttgcttg atgtgttaaa catttaaatt tgaagaaatc aaaatgtttg aatgaaaaag 180
aatatggaga ccgagatatg tcgactctga gtctgccgtc gcctgtctag atttcaaatg 240
aaaaacgtca catatacatt ctgacaagca caaatgcagc gacattactc ttagaacgca 300
gaaaagttgc tatgagtaca aacatgccaa cctaacagga agtgctgtcg agaacgagcc 360
cttgccttga tggttggcct tggcggtggc caactagccc acctgggttt gatccctagg 420
attaacgcga gtgtttcacc tggcgcaaaa gaacccataa cctagggttc ttttgccagt 480
tttaaagtat ctcacatgtc tatggagatt cacggagtcg aatgatgcga tttaggtgtc 540
tgtcacgaaa ttgttttggt gtgaatcaaa tgatttgccc atattagatg caaagaagaa 600
tcattttaat tattttccct atatctgtta tctttaatgt attgaaaatg taaataggaa 660
caacgtaatt ttcaaggcaa tcaataacaa tcaatgttgc atttttaggc ttgtttgaaa 720
atgcatatag ctagtagtag tatattttgt ttgaaaacgt gatttcaaat atactcctca 780
ctaaactgaa ttttcccagt gtttttggaa gcagagttct tccaacacgg aaggtggtac 840
cagtataaac gtgccaacct aacagcaaga gccgtcgaaa tcctcggtgg ttcggcggca 900
gcaactccag cggtccagtc ccgatcgacc cccacacaac tcgtactggt gagcgttatc 960
ctgtcccaca ccagacaatc ggagaacgtg acctccgcgt cacctcaccg cgccaacccc 1020
cacccctccg cgaaataatt ccgtccccgt ccaaacgccg cttcccaccc gggccgacgc 1080
gcagccacgc gggtcccgac gtctgacacc ggccccagct cactgacacg tggggcccct 1140
gacccgggta catgtgccgt tcggcacgaa cggaatggcg gaggagctat acggtgccgc 1200
ggtggggtgc gccgcgggtg agcctaccgc ggtggggacc acaccgggcg cggtatataa 1260
aggccccgca ccttctgcat cgcgtttcca cttagtccaa taaataatat agtaatacag 1320
catttcgccg ctcttttaat tagatttttt tggccttcgt ctccgcttcg tctcgtctcg 1380
tctcaccacc gccagtccac caccagctcg ccggaattcc ctcgccggag acgcgctgcg 1440
gaggcatacc taggaggagg agcgaagaat ggggaggagt ggaggggtgc ccgctgccgc 1500
gctcgctcgc tagggttagg tgcgcgcgtg cgtgaggatg gagctcgctc tctgagctcg 1560
cctcgacccc ccgctgaggg cattagctgt gccgtcgctg cgcgctgggt gatctgccct 1620
cctgtgagct ccgggggagc cgttttggct tgcgccatgg agccgtctct tccgggcgcg 1680
gccacgggtt gcgtgttgcg gtaagctcct ggccgcgaca agctgaaggg gatctcgact 1740
gccgatctgg tgagcctaca aattcttccg tttctaacaa tttttttgcg ggttttcatg 1800
caaattcggg gtgcgtttgt gcagaaaaat ggtgtttgaa ttcctggagg tatttgtttg 1860
ggggtaattt tgtgcgtatt tttctcgctt tgtgtgatct gtgctcgggt tcgggggata 1920
ctttgatgcg gttgggcagt attttggtct cttctgcctt tttattttga tcacaagttt 1980
cttgtgctct ttcgagctcg tcgaggacga ggagcattaa atttcccgtc gtcttttgcg 2040
ctgttttatg gctaattagt ttgggagcac agagttctgc acggaatttt gcataacctt 2100
ttttaatcgt tcaattcgag ttgttccggt cctaaatttt gcagaatttc tccagtgttc 2160
cgtagccggt ctcgtgagtt cgattttggg ttcacggtcg atcaaatcta ggcctcggga 2220
ctgcattttc tcgcgtttat tatttgatga tctgcttcag tcgagctacc tgaggtgttg 2280
aaacttggta tctgtctatc tttcaaggtg ctagcaggat gccagctaga atcatggagc 2340
agaggcacca catgccccca ttccacctcc ccgtggagtc cgaatcgtct tctcccatgt 2400
ggtaagccaa ctgcaatagc cattattgcc cgatatcctt aaatgatgtc taatgatgga 2460
ctgcattctt tcttacttta gggtaggggg tactaattgg ttcagttttg gggtgacttg 2520
gtcagtatca ttaacaacta gacctaggtt aattccttca tcattatcga attctttttg 2580
tagaggcctg ttggacactt caggcaggaa tgttttcctg agcatgttag tgactacctg 2640
aacattcgtg taatttgtag gtgcttatta gtttattctt cgggtagttt ctctcggact 2700
aaataaaatg tgacctagca gaacactgtt acagtttacg gatatgtggg ggcatccgag 2760
gttccacata tgggacaatt gatcgagcaa gattggagga tgtgtatcgt tgtttccagg 2820
tagcttaagg tagctgtctt gctatatatg ggtgaagcag ctgatttgga aggcacatgg 2880
tctcacaggg gtgattgggt atcgattatt gacagatgcg catggatgtt gcctacaatg 2940
attcttccat taaataattc tgatgttgct tcatcacttc tctttgcgct cagtgtttgt 3000
gttcgttttt atggctgatt tatttcttgt tttgaaaaac agaaaaaaga ttcattgatt 3060
tcgggaagta ggtctgctgc atcttctcca gtcgaaaagc caaagcctat tggccaaagg 3120
ttgtgcatca attaggactt 3140
<210> 10
<211> 402
<212> PRT
<213> 小麦(Triticum aestivum)
<220>
<223> GSK2氨基酸序列(小麦)
<400> 10
Met Glu His Pro Ala Pro Ala Pro Glu Pro Met Leu Leu Asp Glu Gln
1 5 10 15
Pro Pro Thr Ala Val Ala Cys Glu Lys Lys Gln Gln Asp Gly Glu Ala
20 25 30
Pro Tyr Ala Glu Gly Asn Asp Ala Met Thr Gly His Ile Ile Ser Thr
35 40 45
Thr Ile Gly Gly Lys Asn Gly Glu Pro Lys Gln Thr Ile Ser Tyr Met
50 55 60
Ala Glu Arg Val Val Gly Thr Gly Ser Phe Gly Ile Val Phe Gln Ala
65 70 75 80
Lys Cys Leu Glu Thr Gly Glu Thr Val Ala Ile Lys Lys Val Leu Gln
85 90 95
Asp Arg Arg Tyr Lys Asn Arg Glu Leu Gln Leu Met Arg Ser Met Ile
100 105 110
His Ser Asn Val Val Ser Leu Lys His Cys Phe Phe Ser Thr Thr Ser
115 120 125
Arg Asp Glu Leu Phe Leu Asn Leu Val Met Glu Tyr Val Pro Glu Thr
130 135 140
Leu Tyr Arg Val Leu Lys His Tyr Ser Asn Ala Lys Gln Gly Met Pro
145 150 155 160
Leu Ile Tyr Val Lys Leu Tyr Thr Tyr Gln Leu Phe Arg Gly Leu Ala
165 170 175
Tyr Ile His Thr Val Pro Gly Val Cys His Arg Asp Val Lys Pro Gln
180 185 190
Asn Val Leu Val Asp Pro Leu Thr His Gln Val Lys Ile Cys Asp Phe
195 200 205
Gly Ser Ala Lys Val Leu Val Ala Gly Glu Pro Asn Ile Ser Tyr Ile
210 215 220
Cys Ser Arg Tyr Tyr Arg Ala Pro Glu Leu Ile Phe Gly Ala Thr Glu
225 230 235 240
Tyr Thr Thr Ser Ile Asp Ile Trp Ser Ala Gly Cys Val Leu Ala Glu
245 250 255
Leu Leu Leu Gly Gln Pro Leu Phe Pro Gly Glu Ser Ala Val Asp Gln
260 265 270
Leu Val Glu Ile Ile Lys Val Leu Gly Thr Pro Thr Arg Glu Glu Ile
275 280 285
Arg Cys Met Asn Pro Asn Tyr Thr Glu Phe Arg Phe Pro Gln Ile Lys
290 295 300
Ala His Pro Trp His Lys Val Phe His Lys Lys Met Pro Pro Glu Ala
305 310 315 320
Ile Asp Leu Ala Ser Arg Leu Leu Gln Tyr Ser Pro Ser Leu Arg Cys
325 330 335
Thr Ala Leu Asp Ala Cys Ala His Pro Phe Phe Asp Glu Leu Trp Glu
340 345 350
Pro Asn Ala Arg Leu Pro Asn Gly Arg Pro Phe Pro Pro Leu Phe Asn
355 360 365
Phe Lys His Glu Leu Ala Asn Ala Ser Gln Asp Leu Ile Asn Arg Leu
370 375 380
Val Pro Glu His Val Arg Arg Gln Ala Gly Leu Ala Phe Val His Ala
385 390 395 400
Gly Ser
<210> 11
<211> 4729
<212> DNA
<213> 小麦(Triticum aestivum)
<220>
<223> GSK2核酸序列(小麦)
<400> 11
atggagcatc cggcgccggc gccggagccg atgctgctcg acgagcagcc ccccaccgca 60
gtcgcctgcg agaaggtaac cggatctgtg ctgggatggt gttggccgtg tgtttcttgg 120
cgtggtgttc cgttgagctg atgtttagcg tgttgttttc gttgggcgct cttgttgagc 180
agaagcagca ggatggcgag gcgccgtatg cggaggggaa cgacgccatg accggtcaca 240
tcatctccac caccatcggc ggcaagaacg gcgagcccaa gcaggtgagc tcagcgtctc 300
ttatgtttcg cttgtgtctc ttggcctgag tttgcacggc cagttcttgc cttggtgaga 360
tgtgtctgct ctcctgcagc tattctcttt agctatgaca actcattgaa atatagctgt 420
gtggattctt ggttagattt ttcttcgttt accaaatacg aaaaaaatgt ttcaaagcgg 480
ctgaatttat caattatcaa ggacgatgta gcttgtcagc ctatttttgt agtgctcatt 540
tgtttgatcc tcatgtaact atggtttgct caagagatct gttccaaata tgcctgtgtg 600
gtgttccata ctgtgggttt tcgggacaaa tttggacggc ttcagttaga ttttggccaa 660
cactagtgct caaatctgtt actatgagca acagctgata cctctttggc gcccagttgg 720
taatgtcctg ctttgttttt cagacgatta gctacatggc ggagcgcgtt gtgggcactg 780
gttcgtttgg catcgtcttt caggtgattg ctctagccat tgtttgtttc cttgtttgtg 840
ttgttgacta ccagcctgat gtttagggaa atgttgcatg tgtaggctaa atgcctggag 900
accggggaga cagtggccat taagaaggta ctgcaggacc gacggtacaa gaatcgtgag 960
ctgcagctta tgcgttcgat gatccattcc aatgttgtct ccctcaagca ctgcttcttc 1020
tcaaccacaa gtagagatga gctgtttctg aaccttgtca tggagtatgt cccggagaca 1080
ctctaccgcg tgcttaagca ctacagtaat gccaaacagg ggatgccact tatctacgtc 1140
aagctttaca cctatcaggt ttgtgaattt ccagtgaata aatgtgaaat gtgtgtctgt 1200
cattgtgcaa ctattctaag tcaattttac atttgtggca gctattcagg gggctggcgt 1260
acattcatac tgttccagga gtctgtcaca gggatgtgaa gccacaaaat gttttggtat 1320
gtatcagagg ccggggtctt cccctttctg aaaaaaatgt atcagtgaac actgaacaga 1380
tttgctcagt tttcatgtat ggcttttctt gcttgatttt gaacttgcct ccacttgcta 1440
tattatacag gttgatcctt taacacatca agttaagatc tgcgactttg gaagcgcgaa 1500
agttctggta tgttggctct ttccccaaga gtttagtgat acgtacacac tgcttcaatc 1560
catttgtcct gtcgtgtagg ctactcattc tattcagtat tgaaccagaa tcggcatcat 1620
ggtctgtgct attttgattt agtcttactg ttttaggctt atagctggcc aggtgttaag 1680
attaaaatta agtcactttt atatacctta cagtttgact tcttcagata tttttggttt 1740
ataaactatt atctctgtat tccgcttatt ccttcctaga ttgctgaatt cttgctttag 1800
ccgaatgcaa agtttctgat cttcacttca tttatttaca ttggatgtcc gacactgaat 1860
ttaaactttt gttcctttac tacaatatca acctgcatag tactttgatg ttacttacct 1920
gctaatccga tatcgttttt cttgtcctgt tctatcaggt ggcgggtgag cccaatatat 1980
catacatatg ctcacgctac taccgtgctc cggagcttat atttggtgcg actgaatata 2040
caacatcgat agatatatgg tcagctggtt gtgttcttgc agaactgctc cttggtcagg 2100
ttagttcctt cgtttcgttc acatatattg caatctccta ggttccaact aagatgtcaa 2160
tactgtagtt tctgatcttt catttgtttt tgctagccat tatttccagg cgagagtgca 2220
gtcgatcaac ttgtagagat aatcaaggtc tgcaaacatt ccatatatct ttctttcgct 2280
tatactatta gatgttgttg acctttgtga tgttcttgta ggttcttgga acgccaactc 2340
gggaggaaat acgttgtatg aacccgaatt atacggagtt taggtttcca cagataaaag 2400
ctcatccttg gcacaaggta ggcttgcaat ctcattctaa tgtccaatca tatatcacat 2460
ttgctgttat taatatatgt ggctcactgt tattaatata ggtcagccgt atataagatc 2520
tgctgtaata tacttaacca tgtaatgtga tgcctacgtg tactgattgc actttgctgt 2580
gaccaggttt tccacaagaa aatgcctcct gaagccatag atcttgcttc acgtcttctt 2640
caatattcac caagcctccg ttgcactgct gtaagttttt tcttttcacg ttgcttgctc 2700
ttccaggtgt ttgttgcggc aagtaggaga ggaacagatg aatgtaaatg taaatatgaa 2760
tggtctttta gagacaatca gatatatagt tgtccttatt gattgttggt aacttattta 2820
tgtatatgtg tgtagtgtac gtttgtcaaa ctagattgat cagtactagt cttctttttt 2880
ttcttttcga aaagggggga ctccccggcc tctgcatcag agcgatgcat acggccacaa 2940
ttataaataa ataaagtagt tcaacaaggt cttgcaatct gctgcaaaaa agtaggctgg 3000
ctcacaaaga gctagaaaaa caaaaaaggc ccaaaagcca caaccggctg gcataagata 3060
gatagatagg taaactaatc gcctatccta ttactagtct tctatgagca tcataatcat 3120
agttatgagg accgctaatc cagtaccata gatcgatgct tggcagatga cgagttgata 3180
tttagtcgtc ttgtaacatg ttttgctata gcgtgatggc tatattcacg catttgaata 3240
tccgcatgca gcttgacgca tgtgcgcatc ctttctttga tgagctatgg gagcctaacg 3300
cgcgcctgcc aaatggacgc ccgttcccac ctctgttcaa cttcaagcat gaagtaagtg 3360
catcagagaa aaactaggct gctcatttgc aatttgacaa aaatgtatgc aacctgttcg 3420
tgctgttgtg cttatgggat ctgctttttt ttttttctgc agctggccaa tgcttcacaa 3480
gacctcatca acaggcttgt gcctgaacat gttcgccgac aagctggtct tgctttcgtg 3540
catgcgggga gctaaatatg cgcaccggtg ccctcaacct tgcaccttat tgttttgcca 3600
tgggcagaag ggtggtggtt taagatggag gcaggtcaga tgatccctgg agcgatatat 3660
gccagattcc atcatcagga gtaccggtag agcaccgagg aataacaact gtctagatca 3720
tctgccaggg aaggagactt gccagggaaa cagcatagcc ttacgccgtg gacccgagtt 3780
ttctttcagt ttttgcccta ttgtaagagt tattaatagc ttcttaatgt actgtagctc 3840
gtaagttgtc aactattttg ttctccattc actgacgtat tgttgcagta aacttcgctg 3900
ttcaataagt tgtgtcatgg cagagcttgc acgcccactg cctgtcatgt agtcaagctg 3960
tctattttct gttgggtagt tgcgacccgt cgtgagatgg catggctgaa ctggaattag 4020
ggttcgtggg atcgagaatt ggggaagcta taggtttagt atggccaaag gctcacaata 4080
taatccaatg ctgattccag aaaaacgggg gaggcttaaa ttgccccgct agcaacaggt 4140
agaaaggaaa caactcggca agtgaactga tacaataata ctccccttgt cttaaaataa 4200
ctgtctcaat tttgtaccaa ctttaatata aagttatact acggttaaga catctatttt 4260
ggaatggcac gagtagtaaa taatggttga atagatggag tcccacgagc cgtccgatcc 4320
tgtgacagac ggcgagtccc acgagccgtc cgatcctgtg acgagcttca atcttgagcg 4380
tccactaact gaatcttgat gaggagttat ataaagcagt ttcggcctga caatacctcc 4440
ccgtgaaaga cgaacttgtc ctcaaatagt tgatgggcga tcgaaccagc ctcctattgt 4500
ttgcttgaac aaggccggga aggtggtctt gatgaaatca gtgtcttccc aggatgcatc 4560
atgatgcgga gcatcttaca gtcattccca tggacctatc ttcgtctctc gagacaccac 4620
gtggaccgat gacacgagct cgtgcaaggg ctaccacgaa cgaggttaac tctctctttg 4680
ttgaactctc ctttgaccca cttgagacat ggctactacc tcaaatgga 4729
<210> 12
<211> 2178
<212> DNA
<213> 小麦(Triticum aestivum)
<220>
<223> GSK2启动子序列(小麦)
<400> 12
acgttccaaa aggataattc ataacctagc aattttagat atctatgaac ttcagtatgt 60
gccatcacgg tctcaacagg atatggtact ctgttttgat tttttatcaa aacctaatta 120
tcaatttata tatgtgcgta caatctttaa ccattatagc tgacgatctt taacgtgttt 180
catcatctgt aggctgtgca atgtgagata atcatgtatg gtgttaccga atgggctgga 240
aagtttctaa attatgagct ctgcatgatt aagtggcgcc gggacctgta cttcatttaa 300
tgcagagcaa gaaaggaaca tcaaagaagc tgttaaaatg gatgggagaa tttgctaaaa 360
catgtttacc tattttttta aagattaagt gtattctaga aagaaaataa ttgtatgttt 420
catggagtaa caaatcagga actgtgcagg tatgtgttca tcttgatggg agtttgtccg 480
agatgctggg cgaggggatt gtttccgcac tgcatgtatc caagtgttta gggatgcctt 540
ttgcgaacaa atttagtttt tttttgagcg aggaaattga tacttttttt gtgaatgtat 600
tcgagtgggt gaaatactcc ccatttgtct cgagaggtcc aggtgtggaa gcttagcact 660
gggtttgtca ttattgaggc aagaatagtt tgaatatgca cactttcatt atgtacttgc 720
agtgcgtaat gcatcatgtg tagaaaaaga tagttatatt tgtatagagt aaattacaat 780
gtttgaggta tttgaataaa aaatactttg ttgtttcatg acatgcaaca atgcgatctt 840
ttgtgctcgt tattataagt ttgagtaaat ttgtattagt taatataatg tacgatgact 900
gccacgtttg actaatttta tattaattta gacgtgcaaa catttactag tactcaatat 960
ggaacacaga aaccgactat caaagcattg ctgatccgat cccgcatact atatataggt 1020
cattaactga catataaaaa tgtttggata attttacttc tacaaatata ctcacaaaaa 1080
ctgagtacat ttttagcact ggctaaaagg gttattattc gaacgaaaac acataattgt 1140
tgcgtaaaag atgttgtatt ttcagtacca aatttacgat ttgatccaaa aataaggagg 1200
cattaaaatg atgcggatct ttgggtctcg ggtgccaatg cacttgaatt tgatcttttt 1260
aaaagtattg cgaaattagt caaaaatttc agaaacttct tgcaaacaag aatgatacgg 1320
tgttataccc gtgtgacaag tttcacgaat gaatgagttt tatggtattt taggttaaac 1380
aaaacaaaat cgacactata taaacatatt cacacctttt gtttatgtca aggagtccac 1440
ggaagtcact tcttcgctaa actttttata caagtataac actacaagat tctcgtctcc 1500
gaaaattttc aggaattttt gactcttttt gttatttata aattattatt tttcaaacag 1560
gttgcaatgg gacccaagat tcattaggta tttccgggca ttaaaatgac atagtatata 1620
gcactaataa ggttctccta tatgacatga atgcgccatc aatttctccc acgaataccc 1680
tagtatattt gtacagcaat tagtgtacaa ttttcacaaa tttctctgac gaataccctc 1740
gtatattatc agttcatttt ccggcagaaa ttgaaaatat gccgtaaata tattttagcg 1800
gcattgttat ccttttgacc aaaaaatgaa tcccattact cggcaataaa tgcggcagac 1860
tatataaaac ccaacctgat gcccggggta ctcccagcaa tttgactccc gaggctcgtc 1920
tagtctaatc cacctcccca ctaatccacc agctgtttac acagggtcag ctaaccgctc 1980
tctctataga tcaacgtcac tccccatctt gttcgtcttg gtcaccccca cccccacttt 2040
cccttcactg gtcaaaggca ccaccaccca catcacagta caagccaagc caagccaagc 2100
caagccagag aagaggacca ggcgtaggtg gatgcaagtg tgagcccacc gtgtccgccc 2160
cattcacacc ctagccac 2178
<210> 13
<211> 971
<212> PRT
<213> 大豆(Glycine max)
<220>
<223> OML4氨基酸序列(大豆)
<400> 13
Met Pro Ser Glu Ile Met Glu Lys Arg Gly Val Ser Ala Ser Ser Arg
1 5 10 15
Phe Leu Asp Asp Ile Ser Tyr Val Ser Glu Lys Asn Thr Gly Leu Arg
20 25 30
Lys Pro Lys Phe Ile His Asp His Phe Leu Gln Gly Lys Ser Glu Met
35 40 45
Ala Ala Ser Pro Gly Ile Ile Phe Asn Thr Ser Ser Pro His Glu Thr
50 55 60
Asn Ala Lys Thr Gly Leu Leu Met Ser Gln Thr Thr Leu Ser Arg Glu
65 70 75 80
Ile Thr Glu Asp Leu His Phe Gly Arg Glu Ala Gly Asn Ile Glu Met
85 90 95
Leu Lys Asp Ser Thr Thr Glu Ser Leu Asn Tyr His Lys Arg Ser Trp
100 105 110
Ser Asn Val His Arg Gln Pro Ala Ser Ser Ser Tyr Gly Leu Val Gly
115 120 125
Ser Lys Ile Val Thr Asn Ala Ala Ser Arg Glu Ser Ser Leu Phe Ser
130 135 140
Ser Ser Leu Ser Asp Met Phe Ser Gln Lys Leu Arg Leu Leu Gly Asn
145 150 155 160
Gly Val Leu Ser Gly Gln Pro Ile Thr Val Gly Ser Leu Pro Glu Glu
165 170 175
Glu Pro Tyr Lys Ser Leu Glu Glu Ile Glu Ala Glu Thr Ile Gly Asn
180 185 190
Leu Leu Pro Asp Glu Asp Asp Leu Phe Ser Gly Val Asn Asp Glu Leu
195 200 205
Gly Cys Ser Thr Arg Thr Arg Met Asn Asp Asp Phe Glu Asp Phe Asp
210 215 220
Leu Phe Ser Ser Ser Gly Gly Met Glu Leu Glu Gly Asp Glu His Leu
225 230 235 240
Ile Ser Gly Lys Arg Thr Ser Cys Gly Asp Glu Asp Pro Asp Tyr Phe
245 250 255
Gly Val Ser Lys Gly Lys Ile Pro Phe Gly Glu Gln Ser Ser Arg Thr
260 265 270
Leu Phe Val Arg Asn Ile Asn Ser Asn Val Glu Asp Ser Glu Leu Lys
275 280 285
Ala Leu Phe Glu Gln Tyr Gly Asp Ile Arg Thr Ile Tyr Thr Ala Cys
290 295 300
Lys His Arg Gly Phe Val Met Ile Ser Tyr Tyr Asp Ile Arg Ala Ala
305 310 315 320
Gln Asn Ala Met Lys Ala Leu Gln Asn Arg Ser Leu Arg Ser Arg Lys
325 330 335
Leu Asp Ile His Tyr Ser Ile Pro Lys Gly Asn Ser Pro Glu Lys Asp
340 345 350
Ile Gly His Gly Thr Leu Met Ile Ser Asn Leu Asp Ser Ser Val Leu
355 360 365
Asp Asp Glu Leu Lys Gln Ile Phe Gly Phe Tyr Gly Glu Ile Arg Glu
370 375 380
Ile Tyr Glu Tyr Pro Gln Leu Asn His Val Lys Phe Ile Glu Phe Tyr
385 390 395 400
Asp Val Arg Ala Ala Glu Ala Ser Leu Arg Ala Leu Asn Gly Ile Cys
405 410 415
Phe Ala Gly Lys His Ile Lys Leu Glu Pro Gly Leu Pro Lys Ile Ala
420 425 430
Thr Cys Met Met His Gln Ser His Lys Gly Lys Asp Glu Pro Asp Val
435 440 445
Gly His Ser Leu Ser Asp Asn Ile Ser Leu Arg His Lys Ala Gly Val
450 455 460
Ser Ser Gly Phe Ile Ala Ser Gly Ser Ser Leu Glu Asn Gly Tyr Asn
465 470 475 480
Gln Gly Phe His Ser Ala Thr Gln Leu Pro Ala Phe Ile Asp Asn Ser
485 490 495
Pro Phe His Val Asn Ser Ser Ile His Lys Ile Thr Arg Gly Ala Ser
500 505 510
Ala Gly Lys Val Ser Gly Val Phe Glu Ala Ser Asn Ala Phe Asp Ala
515 520 525
Met Lys Phe Ala Ser Ile Ser Arg Phe His Pro His Ser Leu Pro Glu
530 535 540
Tyr Arg Glu Ser Leu Ala Thr Gly Ser Pro Tyr Asn Phe Ser Ser Thr
545 550 555 560
Ile Asn Thr Ala Ser Asn Ile Gly Thr Gly Ser Thr Glu Ser Ser Glu
565 570 575
Ser Arg His Ile Gln Gly Met Ser Ser Thr Gly Asn Leu Ala Glu Phe
580 585 590
Asn Ala Gly Gly Asn Gly Asn His Pro His His Gly Leu Tyr His Met
595 600 605
Trp Asn Gly Ser Asn Leu His Gln Gln Pro Ser Ser Asn Ala Met Leu
610 615 620
Trp Gln Lys Thr Pro Ser Phe Val Asn Gly Ala Cys Ser Pro Gly Leu
625 630 635 640
Pro Gln Ile Pro Ser Phe Pro Arg Thr Pro Pro His Val Leu Arg Ala
645 650 655
Ser His Ile Asp His Gln Val Gly Ser Ala Pro Val Val Thr Ala Ser
660 665 670
Pro Trp Asp Arg Gln His Ser Phe Leu Gly Glu Ser Pro Asp Ala Ser
675 680 685
Gly Phe Arg Leu Gly Ser Val Gly Ser Pro Gly Phe Asn Gly Ser Trp
690 695 700
Gln Leu His Pro Pro Ala Ser His Asn Met Phe Pro His Val Gly Gly
705 710 715 720
Asn Gly Thr Glu Leu Thr Ser Asn Ala Gly Gln Gly Ser Pro Lys Gln
725 730 735
Leu Ser His Val Phe Pro Gly Lys Leu Pro Met Thr Leu Val Ser Lys
740 745 750
Phe Asp Thr Thr Asn Glu Arg Met Arg Asn Leu Tyr Ser Arg Arg Ser
755 760 765
Glu Pro Asn Thr Asn Asn Asn Ala Asp Lys Lys Gln Tyr Glu Leu Asp
770 775 780
Leu Gly Arg Ile Leu Arg Gly Asp Asp Asn Arg Thr Thr Leu Met Ile
785 790 795 800
Lys Asn Ile Pro Asn Lys Tyr Thr Ser Lys Met Leu Leu Val Ala Ile
805 810 815
Asp Glu Gln Cys Arg Gly Thr Tyr Asp Phe Leu Tyr Leu Pro Ile Asp
820 825 830
Phe Lys Asn Lys Cys Asn Val Gly Tyr Ala Phe Ile Asn Met Ile Asp
835 840 845
Pro Gly Gln Ile Ile Pro Phe His Lys Ala Phe His Gly Lys Lys Trp
850 855 860
Glu Lys Phe Asn Ser Glu Lys Val Ala Val Leu Ala Tyr Ala Arg Ile
865 870 875 880
Gln Gly Lys Ser Ala Leu Ile Ala His Phe Gln Asn Ser Ser Leu Met
885 890 895
Asn Glu Asp Lys Arg Cys Arg Pro Ile Leu Phe His Thr Asp Gly Pro
900 905 910
Asn Ala Gly Asp Pro Glu Pro Phe Pro Leu Gly Asn Asn Ile Arg Val
915 920 925
Arg Pro Gly Lys Ile Arg Ile Asn Gly Asn Glu Glu Asn Arg Ser Gln
930 935 940
Gly Asn Pro Ser Ser Leu Ala Ser Gly Glu Glu Ser Gly Asn Ala Ile
945 950 955 960
Glu Ser Thr Ser Ser Ser Ser Lys Asn Ser Asp
965 970
<210> 14
<211> 8150
<212> DNA
<213> 大豆(Glycine max)
<220>
<223> OML4核酸序列(大豆)
<400> 14
atgccttctg aaataatgga gaagaggggt gtttctgcct catctcgctt tttggatgac 60
atttcctatg tttctgaggt aattattaat gtaactgtct aagaatggtt tgttctaatt 120
tataatgtga ccctcaacaa gctaattgtt attctaactg tcttataatg ttttttttta 180
taatgattat cagttccaag aacattttac agcctaagac ttcggttttc tttgtcattt 240
tgttaatcaa tttgacctgt atgcatggcc tcaatgctat tgccttttcg acaattggtt 300
ttctaaacat gcgttaaact tttatgggca gaagaataca ggattacgga agccaaaatt 360
tattcatgac cattttctac aaggtgagtt caatcaacta attattattt gttcaaaatg 420
gtttgtatat cttgtgctga tttacctgtg tatcaattgc atccttaatg ccccaaatag 480
attcactaac agatagttaa gattcagacc ttttgagtga actgtttaca ctccagttta 540
gaaattggct agtagctatc attgagtttg aacgtgtgaa ctttttgaag aatctttcca 600
tatatgtttc tgtatacctt atttttgtat atttcaaagc aatatttctc tcaatttttg 660
tttcaatttt ttatcaatgt tttgtttgct tttagaatta atgattgtca atgttgctaa 720
ctagtatcct tcatacgagt aattatctta aattctaaaa ctggtatatt tatttcactt 780
tatggtgatt ggtgataata cttgttgatt tgtctttttt agcccataca cttctcactt 840
tatgctgaaa tcaatatgta atttttattt tgcttctgga ataatgaata tcactaatca 900
acgttgcaaa ttgacatcat ctaaaattaa tgtatttttc tgtttgtggt gacaatgtaa 960
ttgctgcaaa cctatataaa ttgctgataa aaaaaaaaaa acctatataa attaatgttt 1020
tatagtgaat gtataaattc aataccttgt tctcacaaca ttttgattgt ggtatagctg 1080
ggataattaa tgatgatttc atgaatttag atgctgtgct ctgctggact gaagcttatt 1140
tatgattttg gtataaatat tattaagaat ttgcttttat tttaattgtg ctaattttga 1200
atgtagtaat aatgtaatat ctgcatgtat ccatatttat gtttgtttac ctatgttcca 1260
ttaataagca gttcatctgc tgaacatgta actaatttct ggataaagta atttctatat 1320
tcaaattttc agggaagagt gaaatggctg catcacctgg catcattttt aatacttcgt 1380
caccccatga aaccaatgca aaaacaggct tgttaatgtc tcaaactact ctatctcgtg 1440
aaattacaga agacctacat tttggcagag aagcaggcaa tatagagatg ctgaaggatt 1500
ctaccacaga atcattgaat tatcacaaga gatcatggtc taatgtgcat cggcagccag 1560
catctagctc atatggttta gttgggagca agattgtcac caatgctgcc tcacgggaaa 1620
gcagtctatt ttcaagctca ttgtctgaca tgtttagcca aaagtgtaag aatttgtttc 1680
atggatgtta atatagttgc atgcatgtgt tatgggtatt gtagcataat caaattctgg 1740
ttgcttttac acttcgtaat attttagata tgagtttctg ttgcattcat ttgcttgtgt 1800
atttgtcatt agcaatttag catagaagaa tatatgcttg ctatcttttg taatgtagaa 1860
ggacaatacc ctcaccaaac ccaccaccaa aaatataaaa ctaagtaaag ttatctattt 1920
gttttaggtt ttgtgattat actttagttc tgctcatgtg tcactgtgtg tatatatgta 1980
tatcttaatg cagtgaggtt attggggaat ggagtgctgt ctggtcaacc cattactgtt 2040
ggttcccttc ctgaggaaga accatataaa tctctcgaag aaattgaggc tgaaactatt 2100
ggaaatctcc ttcctgatga agatgacctg ttttctggag tcaatgatga gttaggatgc 2160
agtactcgca ctagaatgaa tgatgatttt gaagattttg acttgttcag cagcagtgga 2220
ggcatggaat tggaaggaga tgaacatcta atttctggaa aaagaaccag ttgcggggat 2280
gaagatcctg attactttgg agtttctaaa ggaaaaattc cttttggtga acaatcttct 2340
agaacacttt ttgttagaaa catcaatagc aatgtagaag attctgagct aaaggctctc 2400
tttgaggtga acctttattc ttttattctg gcggatgcta tcttagaatt ttcatgaaac 2460
atttcatacc actaataatg gcatgtaaat ggactatttt gtttgttcca gcaatatgga 2520
gatatccgaa ccatatatac tgcctgcaag catcgtggat ttgttatgat ttcttattat 2580
gatataaggg cagcacaaaa tgcaatgaaa gcacttcaaa ataggtcatt gagatctagg 2640
aaacttgata tacattattc aattccaaag gtatcattat taataacttc tcatgcatgc 2700
ataattcctt tttccttgtc attttgataa agttgttatt tttattcttc atcatatcat 2760
ttattattac cgccatatgt tttgcttgtt caattgcttg catgcctgtt tttatggttt 2820
gcttatagat atatcttgat ttgatgacat gtcagggcaa ttctccagag aaggatattg 2880
gccatggtac actgatgata tccaatcttg attcatctgt tttggatgat gaactaaaac 2940
agatttttgg gttttatgga gaaattagag aagtaagtcg ttcttgttgg ttttcatcca 3000
tttttggtgt ttgtgtttta aaatgataca agcattctta aatattgtct ctgtaattgc 3060
agatctatga atatccacaa ttgaatcatg tcaaatttat tgaattttat gatgtccggg 3120
ctgcagaagc ttctcttcgt gcattaaacg ggatctgctt tgctgggaag cacattaagc 3180
ttgagcctgg tcttcccaag attgcaacat ggttgctgtt accgcttctt ttttattttc 3240
aatttatttt tttctctttt tatatcaact ttttcaactg ttttctactt ttttaaatgt 3300
gcgaatctta aaacattgtt ttgtaaatga agtcttttat tttggatctt catatttatg 3360
ctcaccacct ttaatagtat cctcactttg tagagtttga tagagtgtaa agttgttatc 3420
aaccaccttg atggaaaaat tacatcttga caattatgca aaccttgctt ttgtagtatg 3480
atgcatcagt cacacaaagg aaaagatgaa cctgatgttg gtcatagtct gagtgacaac 3540
atatccttaa gacataaagg tataattttt gtctgctttc acttgtcttt tttccctcat 3600
aaagctaaaa tgttcttggt ctcactagac ataacttaca gcaggagtgt catctggatt 3660
tattgcatct ggtagcagct tggaaaatgg atataatcag ggatttcatt ctgcgacaca 3720
gctacctgct tttattgata actcaccgtt tcatgtgaat tctagcattc acaagatcac 3780
aagaggggca tctgcgggaa aagtatctgg tgtttttgag gccagtaatg cttttgatgc 3840
tatgaaattt gcatccattt cgaggttcca tcctcattct ttacctgaat atcgtgaaag 3900
tttagctact ggcagtcctt acaacttttc aagtaccatt aacacggctt ccaatattgg 3960
aactggatcg acggaatcat ctgaaagcag gcacattcag ggaatgagtt caactgggaa 4020
cctagctgag tttaatgcag gaggtaagtt taatgtgcta agaaagcctc atgtatatgc 4080
ttcctttatt tgcagcagtt ttgaaatgtt tccttgtcta tagaaaattc tgataaggaa 4140
tcaatttgtt gcaaaggttg aacttattgt tcactttaaa tggcatccta ggagtttgaa 4200
accttataat gaagagcttg attgttaatt ttaatgatga tgccagccta gggttttcaa 4260
tattttcatt cttctaataa cacccaaaaa taataattgt tgtttaagag ccagactatt 4320
gatctatatg aatctagact tgcctgtccg agtatatgag atttaagcat tccaaattgt 4380
aaattggtcg aggtcatttt tcctacaagc ttgtaagtgg tagaaggtgc tgggaaattt 4440
taggctgaag cgatatctaa tatggattta atagttctat atttgaatgc tggtatgtaa 4500
cctttttgtt tgattttgga ccttcaggaa acggaaacca cccccatcat ggactttatc 4560
atatgtggaa tgggtccaac ttgcatcagc aaccttcttc aaatgccatg ctttggcaaa 4620
aaacaccatc ctttgttaat ggtgcatgtt ctccaggtct tccacagata cccagctttc 4680
ctagaacacc acctcatgtt cttagagcat cacatataga ccaccaagtg ggatcagcac 4740
cagttgttac agcctcaccc tgggatagac aacattcttt cttgggagag tcacctgatg 4800
cttctggttt tagattgggt tctgttggaa gtccaggctt taatggtagc tggcagttgc 4860
atcctcctgc ttctcacaat atgtttcctc atgttggtgg gaatggtaca gaattgacgt 4920
caaatgctgg gcagggctct cctaagcagt tgtcacatgt tttccctggg aaacttccca 4980
tgactttggt ttctaaattt gatactacca atgaacgaat gagaaacctc tattctcgta 5040
gaagtgaacc aaacactaac aacaatgctg ataaaaaaca atatgaactt gacctaggcc 5100
gcattttacg tggggatgac aaccggacaa cactcatgat aaaaaatatt cccaataagt 5160
atgccaatta tctccatatc ttttttgtgc atttttgctg cttatgctgt tatcttctca 5220
tccttacttc accaaagaat gtgattatta gttaaataag caattgctta tttggcttgt 5280
ccgcttttca tgttggtgca ttaaccatac aagtgccctc tctcttttgc ttgcttacat 5340
gcctaaatag catatacttt ttacataaca gattttacaa aatttgaata acaattttta 5400
aaaacaagca aattcttttg cactggtctt tcagtttgtc tctttcattt atatttgttt 5460
aaatattttt ggcaggtata cttcaaagat gcttcttgtt gccatagatg agcaatgtcg 5520
aggaacttat gattttctgt atttgccaat tgatttcaag gcaagtattt atttggactt 5580
gctagttgat tgattcttta cttaaatgaa gtaatcataa atatgtttct aagtcaattc 5640
tacaaatggt tgcagaacaa atgtaatgtt ggctatgcat tcatcaatat gatcgatcct 5700
ggacaaatta ttccattcca caaggttatt tggaaaccct tatgtaatac taatttgata 5760
taattatctg tgatttgaat tctgagttca tctgattctt tttgtttcta agagttgata 5820
tatctaatag ataaggaata ttgtacaggc ttttcatggg aaaaaatggg agaagttcaa 5880
cagtgaaaag gtagcagtac tcgcctatgc ccgaattcaa ggaaaatctg ctcttattgc 5940
tcatttccag aattcaagcc tgatgaatga agataaacgg tgccgtccta ttctcttcca 6000
tacagatggc ccaaatgctg gtgatccggt aaatcagctt gttctttagt tgtaactatt 6060
ttccttttgc taactacaat gtattatgga actactatat cagcttgttc ttcagttgta 6120
attgttttcc ttttgctaac tacattacta caatgtatta tggaactact ataggaccag 6180
actactaata ttcctctcac tgatatttta ttccgtagat ctggttttac tgatgataca 6240
ttaatgtttt gggctgatgc aagtaaagtg ggagctaatt ataggctttc tcacttcaaa 6300
acttttttgc ctgatgtcta atattaacat ccattgggtg tggcaagaaa gagtttcttg 6360
aaggaatatt tccccgatga ttatttgact tacacataac aactaaagca ttatgtttct 6420
gacttgagtt ggttttaatg gctacaaaat gcaatctatt agtgtgattt taactgtttc 6480
tagcattata tgcatttaac aaactgggct ttccattaaa agaatatata ttggcttgca 6540
acctaattgt actattggta cctggttctt ccactgatat tatataccga gacaaaatta 6600
acctaatctg tctctgcagg agcctttccc cttgggtaac aatattagag tgaggcctgg 6660
aaaaattcgc attaatggta atgaggagaa tcgcagccaa gggaatcctt catctttggc 6720
aagtggagaa gagtccggga atgcaataga atctacatcg agctcttcaa aaaattctga 6780
ctgatttagc atcatgatct aacagttcaa tgttgcatgt gatatcaact ccaagactgt 6840
atatttacat tatctttttg ttcgatcgag caagaggagt tggagctggt aggaaagggg 6900
gctcaaaatt ttttcctata gaggagcctt gcaagagttt ttggaagttg aggtacataa 6960
cccgaatgaa gtcactgatt ctattgtttt ccgttatttt cctaaaattt tgcatggagt 7020
actgctacca tcctacaact ttagagaatg gcctaactga agcttaaaat tttggctagc 7080
tgtgaatgga caatgtgaca ctttgcagtt tccttgtgat aatgtgcatc attgtgggtt 7140
tcaagggttc tttgctgatt ttgttttcat ggtcatcttt gttgttcata tgtaattttg 7200
ttcccttata ttcccgggca ttggtatcct tatgggtttt gttgtctata taatggattt 7260
ttgaggaaaa acatttaaat gaaacatttt cttcggtggt ggtagtattc agatatttct 7320
gcttcgcttg ttatttctgt attcttttat cagtgcttat acacctgtta tgcatgtcag 7380
ggttctagtc attgattaga aaaatgctta attcagcctt agttacatgc cactagcaaa 7440
tgctgtttga taataaaggt tcctgagtca tgactatatt ctttgacaga gaaaaaaatt 7500
gagtatatat agcaattggt tagatagatt tctctataaa catttaaaag aaaacaagaa 7560
ggtaaaaata ttcagtttct taataaacta aattcagttt atccatttaa cttttggaga 7620
agttaaatga aaagagtttc tataaaagtt aagtgcatat gcagtaagtt tgattactat 7680
gaagttatat atattttctt tgaagtttga tgatcataaa gttttatttt atatatgtat 7740
gtatatttca aatgactgtt tagacgaaga aaactaatgg tacaaatttt ctgttcacaa 7800
tcacatacgt tggcatttat ttgtacgcaa gtgactggtg agctttatgg catgactagc 7860
agtggtacat ttgctgcaac cagacctgat gaaatgagat ttgttttctg tccatagata 7920
tctggctttt cttatcatga tagtgactca tcattttccg aagtttcaag tctcaacatg 7980
tatttttttt tcattttaat tttttgacca taaagtgaaa tctgttgaaa aagtagtgca 8040
atggtatcta caattccaat atatgtgtct gcgcagtgcg cacaaacttt acaaaactaa 8100
ccagtgagac atgattttgc acttttgcct tttggtttca agagtcaaga 8150
<210> 15
<211> 3577
<212> DNA
<213> 大豆(Glycine max)
<220>
<223> OML4启动子序列(大豆)
<400> 15
caccaaacca taaaacatat gaatgtgtgc aattaaatta tttcattggt tagtagatat 60
gcaaaagaaa aacagttcca ttgtgaaaaa aacagtttca tcatttgaat ataacaaatt 120
tgatatatat atatatatat atatatatat atatatatat atatataatg attggaatat 180
atttaaaaat agagtaaata ctttcttatt gttcacaaaa cattatctta gaagaaagca 240
tttatggaaa ttttttttag agaaaatatt gaaagtagcc attaatcaat agaattgtat 300
aaaattttcc taaatgaaat tttacaagaa tatagaaacc caacttccca tcttaagctc 360
aatacacatg cctgcatcca atataaagag gggtttcaac ttgttgtttt tcactgtaaa 420
aaaaaaagtt ttaagcatat tattattata atccacacta ctccctgcac ctatttatta 480
tcattttttt aagataagat tgtaattaat aaatttgtta aatagaattt aatgaattaa 540
aagttagtaa ttaattatca tttttcttcg agataagaat gtaattaata aatttgttaa 600
atataattta atgaattaaa attcaaggta ttaataaatt acaattttaa aaataattaa 660
aattttcact taaatagtaa tttcattacc aaatatttta aggacaccaa taaagtaaat 720
gtatctagta attacttaaa aataaatatt tgtttaattt ttaatgatgt tatttttact 780
aaattcctaa tatggtaaaa aaaattcact taatattttt ctatttgttc atggactaat 840
agtttttctt atgtacattg gtagtaatga ggatcgaaac catccatcta ctataaaacc 900
cttgctatca gatgacccta gtgaattaga ctaataattt aagccatctt tagtagtaaa 960
ttaaattaaa ttaacttatt atatacatgc ttatatgctg aaaacaataa taaatcacat 1020
gtgagtaaat acatgaacaa tttattttaa agacaaattt tttttctttt gaatacgggt 1080
acgttatgag aatccattta aaacatttat ataaccatta ttttgtcgca tgcatatacc 1140
attatgtatc ctgggatttt atgatgcaca ataactataa ctacaaaatt aaataactat 1200
ggaattttaa aaattaaata acaaatgttt ttcagttata ccttaaaatg ctaaatgtgt 1260
atttaaaact aggaaaataa aatagcaagt acttagatta attagtgtgg gttatttcaa 1320
tttatccatt aatcttgaat taaaatctaa aagtatataa ttgtattaaa tatttttatt 1380
caagcaagtg catctcttgc atgtgttttt tgaaatcaat atattttcat tgtcggaaac 1440
taaaaacttt gaaactaaaa agacaacttt gacaccgact ctcaaagctt aaagattatc 1500
aaagtgattt tacctcttta aacaaaatat ttttcataca aataacacat ttggaaaacc 1560
aaaaaattaa aaagtataat aaaatcacca gtaattcaca ataaaacata gatatgtgta 1620
tagatgaatt attacattaa gctggtattc aagcaacact aaaaaaaaaa agaaacagat 1680
tcatgttgga taaaatcaaa aaacaaaacg aaacggtttc attatttgaa tgtaacaaac 1740
ctgacacctg atattataat aataacaaca cattaaatta tatttttaaa atacaaatat 1800
tatttttttg tgaatatatt aaatttattt gaaaccatta tcttagagga aacatttatg 1860
gaaaagagtt ttaaaaaaaa tactgaaaaa gtaactgtaa taaaagtatc cattagtgaa 1920
taaatttgca taaaaaattc ccaaacagaa ttttacaaga atttagaaag ccccactttc 1980
caagtttcca tgttaagaac acacagactt gcatccaata aagagagaag cttatcttgt 2040
tattttccac tgtaaaaaaa aaaaaaaaac aagtttagtt tgaagctgct tattattaaa 2100
acacactatt tctgcgccta tttattctcc ctcctcattt ctagttttca ttttttaatt 2160
attattattt ttattttttt tgtttttgtt ttcaaagcca actaacaccc ttttcctttc 2220
actttctctg tcagaagact aaaaaaacac ctctgttgtt gccttgtccg tttattttct 2280
ctccaaacca gagagcgacc gccggcgagt ctcacctcgc cggaaattcg ctcttcctcg 2340
ccggaacctc catttttccc tttcctattg cgcttgcttt ttcttcccac cggctccttc 2400
aagaggagcc gtttccgtgc aatagttttg ttgcttcttt ttttttttcg ttttctgagc 2460
gcctgagatt gcaatgcaga gggaaggagg ttcctgtcgc ggcaagaagc gtgggatctc 2520
tcgtttctga aattcctatg atgtggagcg tttgagagat tcgttttttt cttcttcttt 2580
tttttgtctc tttctctttg ttctcgagtt tctggatgag gagcgcgctg aattttgtgg 2640
aggagaagtt tttgtgctag cgagggcgtg ttgaaattca gaaggtgtga atttgttttg 2700
ttagcttgag aaaaaaaaag tgctaattat ggtttgtgtt tatgtgtgtt tctttttgct 2760
tttttttttt ttctggttaa atggtttttt ctctttagtg gaagtggttt ttatgagttt 2820
atggagagat gagaatctct ttggtgttca tgtttttgat ctgctggtgt tttcagatta 2880
tggcctctct gaaattttgt tcttttgttt ttattttttc tctggatctg ttagtgtttg 2940
aggctttccc tgtgaaattc cctctccata tgtgtaattt tgtgatagaa ccaaggtgta 3000
gtgatataaa tttaagttaa atgcttgttt tttttttttt ttttggtttg ggaaaaaaag 3060
ggagagttgt ggttacagtt gaatgggatt ttatttttgt tttgttttaa tttccatgga 3120
tagtttttgt ttttaatttt ttaagttttt tgttaagcaa atggcctaat aaccgcatta 3180
ggttgttagt aggtaagcat cgagcttctt tcttctccta atacatcctt ccttctggta 3240
atgtatagtt gaagatgcaa ctatttgtgg ctttgttttc cactgctctt tttaaaattt 3300
gcaattgaat atttgaagtg ctttggtagg gttttcatta gtccattttt ttgtcacttt 3360
tttttgtggt ggtgatgtta gtaaagttcc aattgttatg atagatgata tttttctggg 3420
tctgaatttt tctttctgcc tgtagcagtt atgtatgata tgaaatgcga tgttcattgt 3480
tatcagtcct ttcctatgac aagggaatga ccttgaattt ctcgcagatg tcgcacatag 3540
agcttgacga aaactaacaa ggaaggaggt tttcagg 3577
<210> 16
<211> 420
<212> PRT
<213> 大豆(Glycine max)
<220>
<223> GSK2氨基酸序列(大豆)
<400> 16
Met Ala Ser Leu Pro Leu Gly His His His His His His Lys Pro Ala
1 5 10 15
Ala Ala Ala Ile His Pro Ser Gln Pro Pro Gln Ser Gln Pro Gln Pro
20 25 30
Glu Val Pro Arg Arg Ser Ser Asp Met Glu Thr Asp Lys Asp Met Ser
35 40 45
Ala Thr Val Ile Glu Gly Asn Asp Ala Val Thr Gly His Ile Ile Ser
50 55 60
Thr Thr Ile Gly Gly Lys Asn Gly Glu Pro Lys Glu Thr Ile Ser Tyr
65 70 75 80
Met Ala Glu Arg Val Val Gly Thr Gly Ser Phe Gly Val Val Phe Gln
85 90 95
Ala Lys Cys Leu Glu Thr Gly Glu Ala Val Ala Ile Lys Lys Val Leu
100 105 110
Gln Asp Arg Arg Tyr Lys Asn Arg Glu Leu Gln Leu Met Arg Leu Met
115 120 125
Asp His Pro Asn Val Ile Ser Leu Lys His Cys Phe Phe Ser Thr Thr
130 135 140
Ser Arg Asp Glu Leu Phe Leu Asn Leu Val Met Glu Tyr Val Pro Glu
145 150 155 160
Ser Met Tyr Arg Val Ile Lys His Tyr Thr Thr Met Asn Gln Arg Met
165 170 175
Pro Leu Ile Tyr Val Lys Leu Tyr Thr Tyr Gln Ile Phe Arg Gly Leu
180 185 190
Ala Tyr Ile His Thr Ala Leu Gly Val Cys His Arg Asp Val Lys Pro
195 200 205
Gln Asn Leu Leu Val His Pro Leu Thr His Gln Val Lys Leu Cys Asp
210 215 220
Phe Gly Ser Ala Lys Val Leu Val Lys Gly Glu Ser Asn Ile Ser Tyr
225 230 235 240
Ile Cys Ser Arg Tyr Tyr Arg Ala Pro Glu Leu Ile Phe Gly Ala Thr
245 250 255
Glu Tyr Thr Ala Ser Ile Asp Ile Trp Ser Ala Gly Cys Val Leu Ala
260 265 270
Glu Leu Leu Leu Gly Gln Pro Leu Phe Pro Gly Glu Asn Gln Val Asp
275 280 285
Gln Leu Val Glu Ile Ile Lys Val Leu Gly Thr Pro Thr Arg Glu Glu
290 295 300
Ile Arg Cys Met Asn Pro Asn Tyr Thr Glu Phe Arg Phe Pro Gln Ile
305 310 315 320
Lys Ala His Pro Trp His Lys Val Phe His Lys Arg Met Pro Pro Glu
325 330 335
Ala Ile Asp Leu Ala Ser Arg Leu Leu Gln Tyr Ser Pro Ser Leu Arg
340 345 350
Cys Thr Ala Leu Glu Ala Cys Ala His Pro Phe Phe Asp Glu Leu Arg
355 360 365
Glu Pro Asn Ala Arg Leu Pro Asn Gly Arg Pro Leu Pro Pro Leu Phe
370 375 380
Asn Phe Lys Gln Glu Leu Ala Gly Ala Ser Pro Glu Leu Ile Asn Arg
385 390 395 400
Leu Ile Pro Glu His Ile Arg Arg Gln Met Gly Leu Ser Phe Pro His
405 410 415
Ser Ala Gly Thr
420
<210> 17
<211> 5793
<212> DNA
<213> 大豆(Glycine max)
<220>
<223> GSK2核酸序列(大豆)
<400> 17
atggcctcct tgcccttggg gcaccaccac caccaccaca aaccggcggc ggcggctata 60
catccgtcgc aaccgccgca gtctcagccg caacccgaag ttcctcgccg gagctccgat 120
atggagacag ataaggtact tccgctcatt gtactcttca cgaaccctcg gagtggtttc 180
cgactttccg gagctccgat ctccgtcgat tcgcctcgaa gctccggcgt cgccggagtt 240
tcgaccgatc taccggtttt ccgtgctcgc cagagatttt ctccggcgac gccgctgatc 300
ggaatggtta ttgttttctt cgagagcgat gttgattctc gttgacgaac tccaaaaata 360
gaaaagaaaa ttaggtttta cttttttgga gtgtgttttg gttgatgctt ttttggtagg 420
gatcttaaca ctgaagaaaa aattagaatt ttctgtttta ggtgtcggag aaaaggaaag 480
gaatcaatgt gaaaatgtgg aatcctgtgc tttgattttt tgtttccttt aattcaagga 540
gagagattct gattaggtgt acttagctga cctgagttaa cattcttatt tcacattcta 600
acatttttat gtttctttca cttatctcta atctactgtt aattttcttt agctatgtta 660
attctgtgct attatatggt ctattatggg ggtatagttt ttgtttacat tttttggggt 720
ttgtgtgtgt gatttccttt acttcccttg tggtggattg ttgttcaaaa ggtcaaacgg 780
ttataatttg ctttgcttca gggaattagt gtccttagat tctctctgta ttgtgtctta 840
agttatagcg ttgaagtttt tctttatgct ttcttgtgag ctgcggttac ctgatttaac 900
tttagtttat gtgtgtgctc tttgagctct ttacactttg cctttcttca acttcacatt 960
ctgaactttg tctgatttct tctggtaacc ctctggttca tatgtttcat tgccatgcaa 1020
ttttcttctc ataacacttg tttcaaccag taaactgtca tgagataccc cctttcctta 1080
tatttgcatc ttctcaaatt aacttcactg tctatatgca tgtttgttgc catgtctggc 1140
acggcatgcg tttgatagtt gataggcaca tgttgttgcc atattttgtg gacgttgcta 1200
aacaaaatta ttgatgacaa tatctgtaaa gctaaattta aatatgattg atattgtatc 1260
aataaaaatc tgacattcaa gtactgtatt aggagatttg ctttactgca ttaaatatct 1320
aattcttgtt ataagttgca ggatatgtca gctactgtca ttgaggggaa tgatgctgtc 1380
actggccaca taatctccac cacaattgga ggcaaaaatg gggaacctaa agaggtgaga 1440
atgtgttcta actcccaacc cctttcctcc tgaacttaca atttttatta aaaaattcat 1500
ttcataccct cataaatata tgttattgta tatactgatt attgttttga taatggttca 1560
cttccttatg gggatagagt ggaagtagag ttagtggttg gggaatctaa attaataaat 1620
tgcctattat attcaaggcc ttccaaagat ataatactgg ttgtcaatca gagtttggct 1680
tatttcccca gtgcttacct catctgataa tttttattcg ccaacaatat attagctctt 1740
acaagatgta taattttgaa gaatttaatt atgatggttc aataaattta tgcttaaaat 1800
tggtgatatt tatctgagtt tccttatgtg ggcttggttg aaggggtggg aaagggattt 1860
caatgtccct tttctccagt ggtcctcagc aatgtcctta gcttttattt aatgcttctt 1920
ggaagggcag ggtttgtggt ttgttcttga gatgtttgtt atgtttttac agaagtatta 1980
tattctatgt atcttttagt actactggta cttttcatgc attaatatat attatctttg 2040
gagtccaaaa aaaaataaaa tttattcttc gtaaataact tatttgttat gattacttcc 2100
atgataccac ctgcagacca tcagttacat ggcagaacgt gttgttggca ctggatcatt 2160
tggagttgtt tttcaggtat ggatgaacaa tcacctagat gacaaatatt cctattaagc 2220
tttctctgct gtcacatatc tcattgtttt ccacccctgg atggcattcc tcttttacct 2280
aaaatatagg caaagtgctt ggagactgga gaagcagtgg ctattaaaaa ggtcttgcaa 2340
gacaggcggt acaaaaatcg tgaattgcag ttaatgcgct taatggatca ccctaatgta 2400
atttccctga agcactgttt cttctccaca acaagcagag atgaactttt tctaaacttg 2460
gtaatggaat atgttcccga atcaatgtac cgagttataa agcactacac tactatgaac 2520
cagagaatgc ctctcatcta tgtgaaactg tatacatatc aagtatgaac ttttctattc 2580
tgtttggaat ttagctcatg tgttgtttta taacattgta acaatcgagt ttggatatga 2640
tgtttagatc tttaggggat tagcatatat ccataccgca ctgggagttt gccataggga 2700
tgtgaagcct caaaatcttt tggtatgctt tctttcaatg cttttcctct atgagttgta 2760
ttcatttatt ctaaatctta accttttgca tatatgacta caggttcatc ctcttactca 2820
ccaagttaag ctatgtgatt ttgggagtgc caaagttctg gtatgttggt ctgcattgtt 2880
cttgtacaca tcattgcttc atgtacatat gccaccatga taatggagga ctactaaaat 2940
caaattcttc ctaccggaca tagctatgct aaaacttgta taagatcttt ccataaatgc 3000
aatattgatt taacctgttt atgtgatgat ttgttattag taaatagcaa ttgaagtgaa 3060
aatgatgcca agaatcttga ctctgaccca ttttttccta ttatatgaaa aataaataga 3120
agaaaagtta tcgattggca tcatgtggat tttttattca attatcaatt tcatgaagct 3180
tctcatgttc accacttggt aggatatagt tatgatatta tttttccaca aaaaatttat 3240
atcaggtcaa gggtgaatca aacatttcat acatatgttc acgttactat cgggctccag 3300
aactaatatt tggtgcaaca gaatacacag cttctattga tatctggtca gctggttgtg 3360
ttcttgctga acttcttcta ggacaggtta taaatttctg gaaatctatg cattaatgtt 3420
gttgatactt aagatttttt tgctttcttt ctgggatatg ttatattgac ttcacgtagt 3480
ttctaatgtt tgtatagcca ttatttcctg gagaaaacca agtggaccaa cttgtggaaa 3540
ttatcaaggt gatgtccctt ctatatgagt gtctccatgg attgcagaat atatctgcag 3600
agataattat ttagatgtct tcttgtaggt tcttggtact ccaacacgcg aggaaatccg 3660
ttgtatgaac ccaaattata cagagtttag attccctcag attaaagctc atccttggca 3720
caaggtaatg acatttctca tccatcctcc ttttgatatt catcacttgc cattggactt 3780
taaaatgggg attaaaaaga tgaaaaaata gttgtcaaaa tcaaattcaa tagcatgcgt 3840
tacaagttac aactaggttt ttgaggttgc tttccatatt ctttgttttg taattgatga 3900
gcatgatagc attgattgat gtaacctact acctcactaa taggataaag cattggctag 3960
tgaattatgc atttattttg gtgctctatg tttcaggttt tccacaagcg aatgcctcct 4020
gaagcaattg accttgcatc aaggcttctc caatattcac ctagtctccg ctgcactgcg 4080
gtgagtagga tgaactatga tacctccctt cacttttccc ctttaaataa aaggaaaaca 4140
tacacaggaa aaagtttgct tattttaacc ttcttgctgt gatattatat ctatattcct 4200
tatggcatgt tttttaattt agttaactca attggcttaa ttttcactgg tggcttttat 4260
tatttcagct ggaagcatgt gcacatcctt tctttgatga gcttcgcgaa ccaaatgccc 4320
ggctacctaa tggccgtcca ctgcccccac ttttcaactt caaacaggag gtatatatct 4380
tagtcgtatt ttttttatta aatgtgacgt gtcaaggctg ttgctttgtc cactgttcat 4440
tatgtatatc tgtatgacta cttactttac catctgttct gcatgatcca aaccaaacac 4500
aagggaatcc aattaacaat ttctcttata tcaaaattgt gaacagtatt taacaccaga 4560
atattatctt aatcattctg caatgaaaac ttaactacag ttagctggag catcacctga 4620
actgatcaat aggctcatcc cagagcatat taggcggcag atgggtctca gcttcccgca 4680
ttctgccggt acatagatgt aaagggataa tgaaacgatg agtcaaccta catagtgatc 4740
gatgtgaatc aacagaaggg ctgtttgagg cctatgtata actgggagtc ccaacataat 4800
atgcagtttt tcctccccct tgtgaagatg tatacatgtg ttggttgctc ggtaaagctt 4860
gaaagttggt gattctgtgt agtatttcat tcaagttaaa gcatacttat ccctgcatct 4920
gtatattgtt ttggtcagat ttcagaaagc taggagtata aaatgatagc aatcatgtct 4980
tcataggtag aggggcccag ctgaattgag gggcccctat agtagtttgg ctttgctttt 5040
tatgagatta aattcagcat gtcgtttata ttatgtttat aacaatctct tgattcaaaa 5100
caagaaattt tctcgttgtt taatactcta gtaaccccgt tccttctacc caagaagatt 5160
ttgtttgtca tatgtggaca agaagaaagg attcaatcaa aaagttgatt acggaagaaa 5220
aaaatatgaa ttctttatgt tgatgacaag ggtgtgtgca cttagggtga cttgttaaca 5280
acatacgttg agatgagggt taatatactt cgttgctata tattcaatta tatttcattt 5340
ctatttgtgt tgaagtctaa gtcagaattt gaagtcacat atggttagga cttgggagca 5400
aaatatataa gtgaaaaaga atcacaaacc taacgcttta agatcatcca ctatgcatat 5460
tgaattgttt agaagctttt tcggtggtcc tacacttcac ctcagattta aaagtttttt 5520
tttcctccga tgataacatt aaatgaattg tttaaatgaa cttaaaagat gttttttttt 5580
tttataaaaa aatttggtta agcagcaatt cttaaatgct atgttatccg ctctaatggt 5640
aaattctgtt aaacaatgtt gtttctgaac gtataatata atgtaatcaa cgaaataaaa 5700
ttactatcaa tcaaagatac tagggtatta acataattat gagttgattt agtttgaatt 5760
tagaaaaaaa actgattaaa ctggtttgat ttg 5793
<210> 18
<211> 2233
<212> DNA
<213> 大豆(Glycine max)
<220>
<223> GSK2启动子序列(大豆)
<400> 18
gaaattattt taagtaagat atctatttat aaattaggtc caaattcaca ttttttaaac 60
attataaata gaattatcta cctgaacata aagtgttaaa caatttagaa tgtctaattt 120
taaatttgaa aagtaaaaaa gaaaatttac tcagagtttc acttatcaca aaattgatag 180
taaaaaatta gtttcagtgt ataattttta cattactgaa gaaaaaaatt tgtgacttta 240
agagctcatt atacacattt aatatgtttt ggattctagc tagtctgatt taatataatt 300
taaatataaa atatttcata attgtttgtt atgcatgttt tgaacaccac tccttccata 360
agggggagtt tacactgttc aattactttt acatgatcac gtcaaggtca agattatgat 420
tcttaatcgc atccatagct agcaagaagc aaaagcagtt accagaggtt tctggaattc 480
ccagcttctc tctctctctc tctctctctc tatatatata tatatatata tatgattgcc 540
aaatgttaca ttttggggct tatgtgaagt gataataaat tcaattgaac gtcccttctc 600
ttcctttagg atatttcttt ttctataaca taaaggatag tttagaatac aatatataac 660
tacctgtttt aggttttaac tattgaatcg ggtaaaaact gaaaacaact aatgctgaaa 720
aataaaataa aatctaaaat tggaaaattg gccaggttaa aaataaaaga ggttaatttc 780
taatctataa atttaatgta tgtttagatt gcagttggaa gagtttaaaa tattttgtct 840
caaagtagta gttttttttt cttcattatt tcgtacatta aaatttttaa aatttattct 900
caacctttat tcaaatatag tcttataatt agtactaatt aaatagtagt gtcaaaaatc 960
ctacactcaa atatattcca attaaatttt aaaaaatatt atttttcatg aagttacgga 1020
gtgctgtgca ctaatgagat gaaaccgagc aaattattag aatatactac atagttacaa 1080
ttataataaa tgaaaattaa aatatttttt acattatttg gatatgcata tagaaattat 1140
atacttatat atatatatat atatatatat atatatatat atatatatat atatatatat 1200
atatcagtaa tataatttat taaacccaat ggaaagtact tatgagaagg agctgtaatt 1260
ttttatttta ttttcaaagt atttcccaat aaataaatat ctaagtaaaa gattaattaa 1320
ttgaaaaaaa tagtatgcat gagttttatt agtgaatatt ttaaaaattt tggttaaaaa 1380
gtacttagta tattgttatg aaatatttta tttttcaact aattaaaata tttaatataa 1440
ctgtataata tacatataat cttatgatca cttgttaaaa agactcattc aattttaaat 1500
agatcaaact gtacatttga tttaatgttc attcttattt tatttcttaa gttgacaatt 1560
cataacaaag tcataaatgc atatatgtag gacagcgttt tcattttgaa tgaatcaatt 1620
ttctttaaga tgtgtttatt ttaattacat ttctttcttt cttttgtaag aggttttcaa 1680
agatgttcat actatattaa ctgcgtgaac catgcatcgg atgtttcgtg ttcacaatga 1740
tttttaatga atatttaatt aataaataaa gaaaatatca aaatgtcttt taacgtcatc 1800
aaacgttaaa tatatatata tatatatata tatatatata tttatcataa aaaatcaaaa 1860
tatttattaa gaagattaaa tataaaaatg taaatttatc atcaatttgg acttgagtta 1920
tgaagcacta cctttcgttt taaattctct agataaactg ttttacaaaa tattgcatgc 1980
aagtacgtaa cattatacga acatcgaatt tgcttcggtt ctcctgcccc ttacggcacc 2040
agatcactgc tccctttcat cacgaccctg attcgcgcgt gctctcaatc tccctaaact 2100
cgcgtgaact cactctttct ctcttcttga acaaaaacag ggcaagagag agagaagaaa 2160
aacgaagaaa ggtaatagag agagaaaggg aagaggagag agaaacgaag aagaagagtg 2220
tttctcacat cac 2233
<210> 19
<211> 996
<212> PRT
<213> 玉米(Zea mays)
<220>
<223> OML4氨基酸序列(玉米)
<400> 19
Met Pro Phe Gln Val Met Asp Pro Arg His His Leu Ser Gln Phe Thr
1 5 10 15
Asn Thr Thr Val Ala Ala Ser Ser Phe Ser Glu Glu Gln Leu Arg Leu
20 25 30
Pro Thr Glu Arg Leu Val Gly Phe Trp Lys Gln Glu Ser Leu His His
35 40 45
Ile Gly Ser Lys Ser Val Ala Ser Ser Pro Ile Glu Lys Pro Gln Pro
50 55 60
Ile Gly Thr Lys Thr Met Gly Arg Val Asp Pro Gln Pro Tyr Lys Pro
65 70 75 80
Arg Gly Gln Lys Ser Ala Phe Ser Leu Glu His Lys Thr Phe Gly Gln
85 90 95
Glu Arg His Val Asn Met Pro Pro Ser Leu Trp Arg Ala Asp Gln Asp
100 105 110
Pro Tyr Val Gln Ser Asp Ser Ser Leu Phe Pro Asp Gly Arg Ser Thr
115 120 125
Asn Pro Tyr Glu Ala Tyr Asn Glu Asn Gly Leu Phe Ser Ser Ser Leu
130 135 140
Ser Glu Ile Phe Asp Arg Lys Leu Gly Leu Arg Ser Asn Asp Val Leu
145 150 155 160
Leu His Gln Pro Leu Glu Lys Val Glu Pro Thr His Val Asp Asp Glu
165 170 175
Pro Phe Glu Leu Thr Glu Glu Ile Glu Ala Gln Ile Ile Gly Asn Ile
180 185 190
Leu Pro Asp Asp Asp Asp Leu Leu Ser Gly Val Asp Val Gly Tyr Thr
195 200 205
Ala His Ala Ser Asn Gly Asp Asp Val Asp Asp Asp Ile Phe Tyr Thr
210 215 220
Gly Gly Gly Met Glu Leu Glu Thr Val Glu Asn Lys Lys Ser Thr Glu
225 230 235 240
Pro Asn Ser Gly Ala Asn Asp Gly Leu Gly Ser Leu Asn Gly Thr Met
245 250 255
Asn Gly Gln His Pro Tyr Gly Glu His Pro Ser Arg Thr Leu Phe Val
260 265 270
Gln Asn Ile Asn Ser Asn Val Glu Asp Ser Glu Leu Lys Val Leu Phe
275 280 285
Glu His Tyr Gly Glu Ile Ser Asn Leu Tyr Thr Ala Cys Lys His Arg
290 295 300
Gly Phe Val Met Ile Ser Tyr Tyr Asp Ile Arg Ser Ser Trp Asn Ala
305 310 315 320
Met Arg Ala Leu Gln Asn Lys Pro Leu Arg His Arg Lys Leu Asp Ile
325 330 335
His Tyr Ser Ile Pro Lys Asp Asn Pro Ser Gly Lys Asp Ile Asn Gln
340 345 350
Gly Met Leu Val Val Phe Asn Val Asp Pro Ser Val Thr Asn Asn Asp
355 360 365
Ile His Lys Ile Phe Ser Asp Tyr Gly Glu Ile Lys Glu Ile Arg Asp
370 375 380
Ala Pro Gln Lys Gly His His Lys Val Ile Glu Phe Tyr Asp Val Arg
385 390 395 400
Ala Ala Glu Gly Ala Val Arg Ala Leu Asn Arg Ser Asp Leu Ala Gly
405 410 415
Lys Lys Ile Asn Leu Gly Thr Val Gly Leu Ser Gly Val Arg Arg Leu
420 425 430
Thr Gln His Met Ser Lys Glu Ser Gly Gln Glu Glu Phe Gly Val Cys
435 440 445
Lys Leu Gly Ser Leu Ser Thr Asn Ser Pro Pro Leu Pro Ser Leu Gly
450 455 460
Ser Ser Tyr Met Val Ala Met Thr Ser Ser Gly Arg Glu Asn Gly Ser
465 470 475 480
Ile His Gly Leu His Ser Gly Leu Leu Thr Ser Met Ser Pro Phe Arg
485 490 495
Glu Ala Ser Phe Pro Gly Leu Ser Ser Thr Ile Pro Gln Ser Leu Ser
500 505 510
Ser Pro Ile Gly Ile Ala Ser Ala Thr Thr His Ser Asn Gln Ala Pro
515 520 525
Leu Gly Glu Leu Ser His Ser Leu Ser Arg Met Asn Gly His Met Asn
530 535 540
Tyr Gly Phe Gln Gly Leu Gly Ala Leu His Pro His Ser Leu Pro Glu
545 550 555 560
Val His Asp Gly Ala Asn Asn Gly Thr Pro Tyr Asn Leu Asn Thr Met
565 570 575
Val Pro Ile Gly Val Asn Ser Asn Ser Arg Thr Ala Glu Ala Val Asp
580 585 590
Cys Arg His Leu His Lys Val Gly Ser Ser Asn Leu Asn Gly His Ser
595 600 605
Phe Asp Arg Val Gly Glu Gly Ala Met Gly Phe Ser Arg Ser Gly Ser
610 615 620
Gly Pro Val His Gly His Gln Leu Met Trp Asn Asn Ser Asn Asn Leu
625 630 635 640
Gln Arg His Pro Asn Ser Pro Val Leu Trp Gln Asn Pro Gly Ser Phe
645 650 655
Val Asn Asn Val Pro Ser Arg Ser Pro Ala Gln Met His Gly Val Pro
660 665 670
Arg Ala Pro Ser His Met Ile Glu Asn Val Leu Pro Met His His His
675 680 685
His Val Gly Ser Ala Pro Ala Ile Asn Pro Ser Leu Trp Asp Arg Arg
690 695 700
His Gly Tyr Ala Gly Glu Leu Thr Glu Ala Ser Ser Phe His Leu Gly
705 710 715 720
Ser Val Gly Ser Leu Gly Phe Pro Gly Ser Pro Gln Leu His Gly Leu
725 730 735
Glu Leu Asn Asn Ile Phe Ser His Thr Gly Gly Asn Arg Met Asp Pro
740 745 750
Thr Val Ser Ser Ala Gln Ile Ser Ala Pro Ser Pro Gln Gln Arg Gly
755 760 765
Pro Met Phe His Gly Arg Asn Pro Met Val Pro Leu Pro Ser Phe Asp
770 775 780
Ser Pro Gly Glu Arg Ile Arg Ser Met Arg Asn Asp Ser Gly Ala Asn
785 790 795 800
Gln Ser Asp Asn Lys Arg Gln Tyr Glu Leu Asp Val Asp Arg Ile Met
805 810 815
Arg Gly Val Asp Ser Arg Thr Thr Leu Met Ile Lys Asn Ile Pro Asn
820 825 830
Lys Tyr Thr Ser Lys Met Leu Leu Ala Ala Ile Asp Glu Ser His Lys
835 840 845
Gly Thr Tyr Asp Phe Ile Tyr Leu Pro Ile Asp Phe Lys Asn Lys Cys
850 855 860
Asn Val Gly Tyr Ala Phe Ile Asn Met Thr Asn Ala Gln His Ile Ile
865 870 875 880
Pro Phe Tyr Gln Thr Phe Asn Gly Lys Lys Trp Glu Lys Phe Asn Ser
885 890 895
Glu Lys Val Ala Ser Leu Ala Tyr Ala Arg Ile Gln Gly Lys Thr Ala
900 905 910
Leu Ile Ala His Phe Gln Asn Ser Ser Leu Met Asn Glu Asp Lys Arg
915 920 925
Cys Arg Pro Ile Leu Phe His Ser Asp Gly Pro Asn Ala Gly Asp Gln
930 935 940
Glu Pro Phe Pro Met Gly Thr Asn Ile Arg Ala Arg Ser Gly Arg Ser
945 950 955 960
Arg Thr Ser Ser Gly Glu Glu Asn His His Asp Ile Gln Thr Val Leu
965 970 975
Thr Asn Gly Asp Thr Ser Ser Asn Gly Ala Asp Thr Ser Gly Pro Thr
980 985 990
Lys Asp Thr Glu
995
<210> 20
<211> 19111
<212> DNA
<213> 玉米(Zea mays)
<220>
<223> OML4核酸序列(玉米)
<400> 20
atgccatttc aagtcatgga tccgaggcac cacctctccc agttcaccaa tacaaccgta 60
gctgcgtcct ccttctctga ggagcagctt cgccttccca cagaggtaat aatctgcagt 120
tgcagaattg ttgccctatt tattgttttc tgtttttgtt agtttatgat aaggctagtg 180
gtgtctttat tgttttagtt catgtttgat acctaccatg ttgtcactcg attttctgga 240
tatctatgac atgcactaat ttttttaatc tatctttgca gaggctggtg ggtttttgga 300
agcaggagtc gttgcatcac attggtgagt acttaatttg attcaatacc ccttagcttt 360
ttgctcattt ccatgcaaag aatgctcttt ggctgcaaaa atccacatgt tattgcgggg 420
aaattttgtg catttaataa cattttatgc gtgactaagg gctagtttga atccactaga 480
gctaataatt agttgtctaa aaaattgcta gtagaattag ctagctaaca aataactagc 540
taactattag ctaatttact aaaaatagct aatagttcaa ctattagcta tattgtttgg 600
atgtctatag agctaatttt agcagctaac tattatctct agtgcattca aacagggcct 660
aaataacata aataatttgt ttgcttgtga tgaatatgat tttagctttt taccctaact 720
ttatcaggaa tagaaggctt tgtttttgtt gttgtcgtgt tggacatgtt ttattgcact 780
tttcatttgt tgtttatgta tttatagtct caagccattg ttttgtgttc accttgggtt 840
gcaatggatt tatgacatat ttgatgtcca ggttatcctt tgatatgcaa ttggttgcgc 900
tagtttctac cttattattc ctttttactt atttggcact cctgtcgtac tctctctttg 960
ttctcacaat ggttcatgca ttttgttgtt cattatcaag atgtcttctc aaaggcaagc 1020
tgtttctatt gttgtcaggg agcaagtcag ttgcatcttc tccaattgaa aagccccaac 1080
ccattggtac aaaaacaatg ggtcgggtag atccacaacc atacaagccg agaggccaga 1140
agtctgcatt tagccttgaa cacaaaactt ttggtcaaga gaggcatgtt aacatgccac 1200
catctctgtg gagagctgat caagaccctt atgttcaatc tgattcatct ttatttcccg 1260
atggaaggag tactaatcca tatgaggcct acaacgagaa tgggcttttc tcaagctccc 1320
tgtcagaaat ttttgacaga aaatgtgaga cagcttactc tggcactttc atcaacttca 1380
ttagagcgat tgattatact gcagtgagcc tgcaccatga gaaccattct cttcatctta 1440
gaaaatgcat tgaactgtat cacacattcc atagtatgta ttgtgtatgt gtgtgccttg 1500
aaatcaacag aaaggaataa aaagtacaat aaaggatatt agtgagtatg aatgggaaga 1560
aaaaataaaa aaaatactta acatattttt ttagcatttt tgcatcttat tttcgaagga 1620
accttacctg ctttattttt ctttggccca agaatccttt cacttaagtt tggtatcgtt 1680
atccttttat tttcagtaac actttgtgca agatttgggc agtcagacac tccgattaaa 1740
tcattgctat tgtagtaagc aatacataat tcatatttat tgctttctaa caaattatat 1800
gcttcaatgt gtagtgggac tgagatcaaa tgatgtgctt ctacatcaac cacttgaaaa 1860
ggttgaacca actcatgtag atgatgagcc ctttgagtta acagaggaaa tcgaggctca 1920
aataatagga aacatacttc ctgatgatga tgatctacta tcaggtgttg atgttgggta 1980
cacagcccat gctagcaatg gtgatgatgt tgatgatgat atattttaca ctggaggtgg 2040
gatggaactg gagaccgttg aaaataaaaa aagtacagaa cctaacagtg gagctaatga 2100
tggtcttggg tcgctaaatg gcacaatgaa tggtcaacat ccatatgggg aacacccttc 2160
aagaactctt ttcgtccaga acattaatag caatgttgag gattctgaat taaaggtcct 2220
atttgaggta tgttcctttt ttctgttttc tgcttaaacc tatcgttcct gtacagaaca 2280
tttgtttctg aaaatcattt actctttacc cacagcatta tggagaaatc agcaaccttt 2340
acactgcctg caaacatcgc ggttttgtaa tgatatctta ctatgacata aggtcatcat 2400
ggaatgccat gagggcactt caaaacaagc cactaagaca tagaaaactt gacatacatt 2460
actccattcc gaaggtattc acgagtctta ctggcttgat gtgtagacat attttgccca 2520
aggatgccag tatgtagcta gtttactgtt atcagttttg tagttcttgt gctaattttc 2580
accttttttc ccttaggata atccttcggg gaaggatatt aaccagggga tgcttgttgt 2640
atttaatgtt gacccgtctg taacaaacaa tgatatccat aagatattta gtgactatgg 2700
tgaaataaaa gaggtatgct atgctcttac attaactacc tactacatta taactagaac 2760
tataatgtct taaattaatt gcagattcgt gatgcaccgc aaaagggcca tcacaaagtt 2820
atagaatttt acgatgtcag agcagctgaa ggtgcagttc gtgctttaaa caggagtgat 2880
cttgctggca agaaaataaa tttggggact gttggtctga gtggtgttag acggtatgcc 2940
tttgaaatgt tatcctgctg ttcattcaca tatttcagta acaatactta ttacttttgg 3000
acagtccata tttaactgtt gatcatttga tcgtgattct tgcttaggca tctttggtat 3060
atagtaccat cacttattct atatgacggt acctgtcgat agaatgcaca ttagttgatc 3120
tggattttta ttttcttttc tcaagtggaa aatctcttcc tggagctgta aacattgcac 3180
tgtttttatt ttgtcatgca tagatagttg atctttgttt ctttatttct atgtatgggc 3240
tctgatgtcc tacacaaaac agatttttgt ttgttctttc atattgtagt cttattctat 3300
gtattgcatt taggtgtatg gatatatact tagtatgtta gttatctaag tcatccagaa 3360
aaaagagcaa ttattatgtg acaacattct aattttgatt ttaccgtgca aacttttgaa 3420
aacattggtt ttaatcactg ctctaacatt gattttaatg ttgttttata acagattaac 3480
acagcacatg tccaaagagt cggggcaaga agaatttggt gtatgcaaac tgggcagtct 3540
aagcacaaat agccctccat tgccttcatt gggtatgctg ttggtttttt tcatctttaa 3600
tgtatgtcat gtctatagct acatttcctg acatggagga taattcttca aggttcatct 3660
tatatggtag ccatgacatc ttctggccgt gaaaatggga gtattcatgg tttgcattct 3720
ggactgctca catcaatgag cccgttcaga gaggcttctt ttccgggcct atcatctacc 3780
ataccacaga gcctgtcctc tcccattgga attgcatctg ctacaactca tagtaatcag 3840
gctccccttg gtgagctcag ccactcactt agtcggatga atgggcatat gaattatggt 3900
tttcaaggct tgggtgctct tcatccccat tctcttcctg aagttcacga tggagcaaat 3960
aatggcaccc cgtacaatct aaacaccatg gtaccaattg gtgtgaatag caactcaaga 4020
acagccgaag cagttgactg cagacatctt cataaagtgg gttctagcaa cctcaatgga 4080
cattcatttg atcgtgtcgg tgaaggaggt aagtttgtaa atttggacat tctaatctcc 4140
atttttatgt ttgaacccat tgtcatttct attccttaaa catgtgtttt gtaataaagc 4200
tgttaggttt atcaggattg tgaaaactga actgtgaaaa tttgatcaat taatgtatgt 4260
tatttaactg ttccgttcat gattgcatct gtaacaaatt ttgcagctat gggattttca 4320
agaagtggaa gtggtcctgt ccatggtcac cagctaatgt ggaataattc aaataactta 4380
caacgtcatc ccaattcccc tgtgctgtgg caaaatccag gatcatttgt aaataatgta 4440
ccgtctcgct ccccagcaca aatgcatgga gttccaagag caccatcaca catgattgag 4500
aatgtccttc caatgcatca tcatcatgtg ggctctgcgc cagcaatcaa tccatcactt 4560
tgggacaggc ggcatggcta tgcaggggaa ttgacagaag catcaagttt tcatcttggc 4620
agtgttggga gcttgggatt tcctggtagc cctcagcttc atggcctgga gctaaataac 4680
atattttctc acactggtgg gaatcgcatg gatccaaccg tgtcttcggc tcagatcagc 4740
gcaccatctc ctcaacagag aggtcctatg ttccatggaa ggaatcctat ggttcccctt 4800
ccatcatttg attcacctgg tgagcggata agaagcatga gaaatgactc aggtgctaac 4860
cagtctgata ataaacggca gtacgagctt gatgttgacc gcataatgcg aggggtagac 4920
tcacgaacta cactgatgat aaagaatatc ccaaataagt atgttttgag atcaccaaat 4980
tttatgctac atttatgttc tgtctcaata tattcttttg ttctggttgg ttctttcggg 5040
tttcaggtat acctccaaga tgctcttggc tgctattgat gaaagtcata agggcactta 5100
tgactttatt tacttgccaa ttgattttaa ggtagtttga aactttgaat ttaactcata 5160
agcgaccggg gccttgtatt agttgagact acttttgtgt tcatgttact aaatgagatc 5220
aatctccttt tcagaataaa tgtaatgttg gctatgcttt catcaacatg accaatgctc 5280
agcatatcat tccattttat caggtcagaa aattattcca attgacgaag tgctactgca 5340
ttgatgtaaa gttgtaaact agcctttggt caacttatat gccttgccaa atttgtactt 5400
tgataaaata tccggcttga acatcgacgt gctatcctga gccattttgt catctttttc 5460
agacttttaa tggtaaaaag tgggagaagt ttaacagtga gaaggtggca tcacttgctt 5520
atgctagaat ccaagggaaa acagctctga ttgctcattt ccagaactct agtttgatga 5580
atgaggacaa acgttgccgc cccatactct tccactcaga tggtcctaat gcaggagatc 5640
aggtatgctt atttcttttt tattttgtcg ttggtacttt ccctgctatc ttgttctcca 5700
gttacattat gtttcgctgc agtgcactgt gacgagtctt ctatataatc catatacctt 5760
gaatccttga tggggctgat ggcagataaa aacataggtt ttgtgaaaat aaaatggggg 5820
gaggtaaatg tccacctgcc atttttgctg cattaactgc cctgtgacaa gacttctcta 5880
taccatcgta caaaggccct gtttgaatgc actaaagcta atagttagtt ggctaaaaag 5940
tttagagaat tggctagcta acaaatagtt ggctaactat tagctgattt gctagaagta 6000
gctaatagtt gaattattag ccagactgtt tggatgtctg cagctaattt tagcagctaa 6060
ctattaactc tagtggattc aaacagggcc aaagtcatca atatatacct tgaatccttg 6120
atgggctgat ggcagctaaa aacataggtt ttgtgtggcg aatccttcta aattatatgg 6180
cccacatgca cttgtcttta tcccaaagac ctcagacgac tatgcatatg taccagataa 6240
cttaaaagaa tttgtcccag tatctcgaag gacctcggga aatccacttt acaaccaaga 6300
tcgcaagatt aagtacacac aaatcacata ccgaagtttt gtagcggaat tcatattaca 6360
ataagtttac aaattacaat atcgaaaagg gcgtacccaa tgctgtaggc ttcccgcact 6420
gtgcggggtc tgggggaggg tatctttaag cgccaagcct tacccgcata atatgtagag 6480
gctggggctc gaaccaggga ccttccggtt acagacggta ggctctaccg ctgcactagg 6540
cctgcccttc acaaattaca atatcgaaat gagtacaaat ttgatatgaa agtaatacaa 6600
ctttgaatga catgaattac aattttaagt tcaaaataca ttgctatctt aaatgacaaa 6660
actcaggtgg aagtacagaa aatatactta tataagaaga ccgagtccac cgacacttag 6720
cttctatcta caacagaaca agaacatcac tcgcaacatg gtgggataaa accctgagta 6780
cacaagtact ccacaaggct tacccgacta aagaaaatga ctccaagggc atgcaagaat 6840
tggggattca aggtgaggtt atagcaagaa taaaaaactc ctttgcataa aagcttacta 6900
gaagtggatc cttaagccat atttgaattt atcaacttag ctctctccta aatctagatt 6960
agcctaatct agatcaaaca cttgccaaac cattgtcttc attttaccag atctcatttc 7020
tcttcttaac tacgatgcac ttaacccttg catatgtcaa cccaatcttc gagtggtcca 7080
agaccaaaac gggtttgggc cacctgatag cacagtactc caccctccaa cccatgctag 7140
ttgggcacac actactctcc ttaatcgact cggacggaaa cactgcaccg agacgaaaac 7200
actgcacaaa tctcattttt ctccttaatc gactcagatg gaaacactgc accgagactc 7260
ctttctcgat gcaagttacc cacccggtct catattaatt cacctttttc acatttcttt 7320
aacatatctc aatattcagc ggaattggaa acattttctg aaaaccccta attggaaaca 7380
ttacactcta tttggtgcat gcaaggagaa aaatcttgtt tccccatcta ctcgactggg 7440
acaaataatc atgcgtcacc ttgtttccag ccatataaag aaacgtgcat gctctggtag 7500
gaaaatggag aagggcacat gcttctacag taggatagta gtagtacgcc ttatttttta 7560
gacaaaatct aaaactttat acgccttgtt ttttaggatg gacgaagtat ataagtatat 7620
atgtccagaa acatatggat gactaaatgg acgaccagct cgactagggt cgattagtcg 7680
acctagtcga cgactaatca caactaacaa ggttttaaag tcgtttgact aatcgcgatt 7740
agtcggcctt attgctggag taagcacgat taggggcttc gactcgacta gggcgactag 7800
gaagcgatta gtcatcctag tcactgacta atcgtgatta gtcgcccgat taggggttat 7860
gtccgactag ctagtcctgt tttgggccag taattcgtcc tttgttctat gggccggcag 7920
gcggcccacc atctctgcag aaagtagaaa acttgtgttg ccctacctgt accgcagtag 7980
cagcacagta gccgtcgtcc cttctctagc gcgcagttgc gcaccctctg cagcccttct 8040
tcagcgtgcg gctgcgtcct ctctgctccg gctgcgatcc ctctgctcct gccagcgcgt 8100
ggttgttgca gaggcctctg ttaagccgat gccctctagt atggcgcacg cctctgctcc 8160
aggactccac cgaagtccac cctccagcgc aagagcgtcc tccactgatc cactctgact 8220
cctccatcat acttcttcag agtgaattag tttagagttt gttctgaact tcagaaatca 8280
gaaatcagaa attcagactt cagacttcgg agtccagaga acatcagagt tcagacttct 8340
gagttcacag ttcaggcttt cagagtctgt tgttttgcta tagctataat atattgttgt 8400
cctgctacag ctctagtgta ctgctatatt gcagtactgc tacagctata tatattgata 8460
tatatattta tacatatagt cctgttatag gtggacgact ataggacgac taggagtcta 8520
ctagactcga ctaatcgagc aaatcgatga ctaatcgtga ttagtcgcct tatcggtgct 8580
caggcgacta gaatcgacta gccgacttta aaaccttgat gactaatcga ctggtcggta 8640
gctatacgac taggttcgat tagacgactt gaaaatagtt atctcgagca gactccctat 8700
cccacttcac tccctatttc aaactacact atgcaaacaa tataatctat agtgcaaaac 8760
agtactttgc acgctcgttt acatggtatg ctggagatga ccttagtgct tgttagacga 8820
tattcacttg gcgattatct cccaacctag cacttgatct gtccatccat cttcaggttg 8880
gtctgccgtc atcgtcttgt ggttggcttt gatccacgtt ctttactccg cgtaatcaac 8940
taacgtacct gaatgagatg cacgatgcat atgtatgagc ataaaatgaa ccaatgctac 9000
agtgaagaaa atcaaacact taatggcaag gcattgccac aatcctacgc aagtactaga 9060
tacatattgt cactaacctt gattaggcga gataataacc ccctcgggta ctgtagcata 9120
tatatgtagg cagacaagaa tatatgggct ttatgggcct taacaccccc tatcgaactc 9180
aaggcggaag tggaggattt gaagcattga gtttgattag atgaaactga tgttgtgccc 9240
tagtttgtgc ttttgtgaag aaatctgcaa gctataattc tcagggcaca tattgaagat 9300
caatggtctt ctgatgacaa tgagatctag tgaacgatac atcaacacca atgtgttttg 9360
tgagttcacg cttcactgga tcatgacaaa tttgtatagt tccaatgttg tcacagtgaa 9420
gaggcgtagg cgagtcacaa gaaacgccta gatcagccaa gagccaacga atccagataa 9480
tcttagcagt agtagtagcc agggctcgaa gttctgcttc agtactagat ctagatacaa 9540
cagcttgctt cttggatttc caagcaacag gggatgatcc aagaagaata cagtaaccag 9600
tgatggagcg acgatctgta ggatcactgg cccaggtagc atcagagtaa gcacgaagct 9660
gaagtgggga atttgagtca taaaataaac attgtgtttt tgtccctcgt aaatatctaa 9720
gcacacgaag taagtgccca taatgaactg atgtaggagc agatacaaac tcataatcat 9780
agacggtttg acgctgttca ccatagcagc catcacttta ccatcattaa gctgccatgt 9840
tttgatatca gcagcattgc gacgatcatc cgcaagaacg ggtgccgcat cagtcaaatg 9900
aaagagtaat ccatgtcccc tgagtgcagt ctcaacacag aaagcccact ccggataatt 9960
tcggccatca agagtgatat tgaccacaat agcatttgtc gccatattga attcaatgaa 10020
aatcagggag aacaggagac ctgaaaccaa acaaaccaga ggacgagttg acggaggtcc 10080
tgggcgcgga aaccgagttg gacagtctgc tcgcaatggc agccaccggc gcagaaacag 10140
ggacgacgca gatggcgacg aggcagggcg cagcagacgg cagcgcagat ccggatccgc 10200
agactgtttg cggcgtgatt atcggatcga tggcagttgc acaaatcttc tctgcagcga 10260
ctgtttgcgg cgtgcagcag gcggacggcg acagggcgca gtaggcggac gacggcagcc 10320
gagcgcagca ggcaggtgca gacggcggac gacggcggcc gggaagccca gatccgcccg 10380
cggggatgga agaaaccgcg gccgggcgca gcaggcaggt gcggacggcg gcgaccgggt 10440
agcccagatc cgcccgcggc agaggcgggg aggggaaaag ccgcggcggc cggatctgcc 10500
tcgaggacgg ccgcggatct ggacgggatc cgcgacgacg gacgggcggt ggccggatct 10560
gcgcgacggc ggacgggatc cacgatggcg gccgcggatc tggacgaggg cggcgcagat 10620
gagcccgcaa cgacggaatc cgcgacggcg gacgggcggc ggccggatct gcgcgaccgc 10680
ggacgggatc cgcgatggcg gccgcggatg tggacggggg cgacacagat gagcctgcag 10740
ccgcgacggc gggtgggagg aaggtggaga gagggtcgca acggcggccg ggaggagacg 10800
atggtggcta aaaaaatcta agaaacccta atcgtgacct gctctgttaa taggtcacta 10860
accttgatta ggcgagataa taaccccttc gggtactgta gcatatatat aggcgacaag 10920
aatatatggg ctttatgggc cttaacacat ataactcact aaacacaaca atcacgttct 10980
tccagtttaa ccagatctaa ctcaaacatc aagaaataat aaactatgtg taagtcctat 11040
atcttcttta ggtagtgccc aacatcagaa gactagcaaa acctagactc atcattctta 11100
gacacctaaa ttcagaatga gaatagaagc aatctaacta gcactctaaa ccaccttttg 11160
gtgaaagagt aattgtggga atgacttgat tctattccac gacaatgtgt gcgtatacat 11220
aggagaggcc ggggttgctc acaaggcaac cgcacaggcg tacaagccaa tcaagggcag 11280
cctacaatca agggctgact accataatta ggctttctat aattacaata gtctaacatt 11340
tgggactaac tcgcatagca caacatctaa ataaaacatc acactattag atctagcagg 11400
cagaacatca ttaaagatca cagtctttca caaaaccaca acttaaaacc aaaagaccta 11460
aaacactaat gtgcaatgcc cactatgcag tattaagatt tcaactaaag cagacctagc 11520
gatgttattt gcttcgagat acttggagaa gcaatcaaca tccatctatg acatttaacc 11580
ggtcactaag gccctgtttg gacagctcca gctccagaaa attcggtaga gttggtggag 11640
caggtcatta ggtgctccat aaaatcgtgg agttggagct gtaagccttc agaagacatt 11700
ttgtctttga taagtcatgc ccccgcagtc taatcgggag catcgctaac ggtcaggctg 11760
gaccgaaact cctggaacaa cgaggtgggt ggtcccttgg tgaagacatc tgcgtactga 11820
gatgtcgtag gaacatgaag aacccgagcg tgtccgaggg cgaccttctc tcggacaaag 11880
tggagatcga tctcaacatg cttcgtccgt tgatgctgca ctggattgct ggagagatat 11940
acaacactga cgttgtcaca atagactagg gtggcacggc gaggcgggtg ccgaagctca 12000
atgagtaact aacgtaacca agtagcttca gcaacgccat ttgccacaac acggtattcg 12060
gcctcggcac tggaccggga aaccgtgtgc tggcgcttgg aggaccacga cactaggttg 12120
tctccaagga acactgcgta gccagaggtc gaccggcgag tgtcgggaca tccagcccag 12180
tcggcatctg tgtagacaac gagcttcgta ggggaagatc ggcgcatagt cagtccaaga 12240
gatatagtgc cttgcaggta gcgcaagatg cgcttgagag ccgcgaggtg gggctctcgt 12300
ggatcatgca tatagaggca aatctgctga acaacgaagg caatgtccgg acgggtgaaa 12360
gtcaaatact gtagagcacc tgccaggctg cggtactgag tagcgtcatc aacgggaggt 12420
ccatctgcag ataatttgga gtggagatca acaggtgtgc tacacggctt gcacacgctc 12480
atcccgacgc gctccaaaat atcctgagtg tactgtcgtt gagagagaaa cagaccattg 12540
gcagaacgtg tcacagaaat gcccaaaaaa tggtgaagct gacccatgtc cgtcatagca 12600
aactcacgct ggagagcccc aatcacatac tgaagaaact ttgcagagga ggcagtgaga 12660
acaatatcat caacatacag cagcaaatag gcagtgtctg gcccttggtg atagatgaac 12720
agtgaactat ctgacttggt ttcaataaat ccaagggaaa aaagatggga tgcgaacctg 12780
tgatgccaag cacgaggagc ctgcttcaag ccatataggg atttgttgag ccgacagaca 12840
agatccggat gagaggaatc cacaaaacca gagggttgta cgcagtacac tgtctcggtg 12900
agggtgccat gtaagaatgc attcttcaca tctagctgat ggatggacca gttctgagag 12960
agagccaacg agagaacaac tcgaactgtt gcaggcttga caaccggact gaaagtctca 13020
tcataatcca caccggggcg ctgggtaaac ccacggagga cccaacgagc cttgtagtga 13080
tcaagagacc catctgcgag cagtttgtgt cgaaaaatcc acttgccagt taccacattg 13140
actccaggag gccgtgctac taaactccag gtgtcattgg cgagtagagc atcatactca 13200
gcttgcatag cggagcgcca attggggtct gacaatgcat cacgaacgga gcgaggcagt 13260
ggcgacatag acacaacgtg gaggttgagg cgatccacgg gctgtgccat gccggttttg 13320
ccgcgagtgt gcatgggatg cgcattggcg ataggggtga tggagaccgg acgagtgtct 13380
gccgtgcgac cggtggccgc ggtgctgctg gcaacggcct gtgcaggatg cacaggggca 13440
gcatcacccg tcgatgcggt cggcgaggcg gcgggggcac tgctggcagc agcctgtgca 13500
gggtgcacag gggcagcagc gccggtcgac gtggcggagg gactgggcgt ccccaatcca 13560
gtgggaggag acgtgggtgc ctctacacgc ccatgggcga cgtgaggtgt acctgcatgc 13620
acaagtcttg ctccaggaat aggagcggtt agatcatgtt catcaagaag aaaatccaag 13680
gcggaggatg ccatgggagt ggtagacatg gctgcgaaag ggaagaagga ctcgtcaaaa 13740
acgacatgtc tagaaataag aatgcggttc gactcaagct ggagacacca atagcctttg 13800
tgttccgagg aatagccgag aaaaacgcat aaggaggagc ggggggcaag tttgtgaggt 13860
gctgtggagg acatgttagg ataacaggca ctcccaaaaa ctttaagatg atcataggag 13920
ggttgggagg aaaagagggc actatatggt gtggagaaag caagggtttt agtggggagc 13980
cgattcacaa gatatgtcgc agtgtgaagg gcttcaaccc aataagccgg aggtatactg 14040
gcctgaaaca aaagagaacg cagaatgtca tttatggtgc gaagagaacg ttctgctttc 14100
ccattttgct gagaagttta ggggcacgac atgcgtaaga caatgccgtg ggagagaaaa 14160
aatgtgcggg cctgggaatt atcaaattca cggccattgt cgcactggat gctcttgatg 14220
acggtgccga attgggtgcg aatataggtg aaaaagttgg caagggcgga aaaagtctcg 14280
gactttagac ggagtggaaa cgtccaaatg tagtgggagc agtcatcaag aattaccaga 14340
taatatttat agcccgacac actaacaatt ggggaggtcc ataaatcaca gtgtattaag 14400
tcaaaattgt gagaagctcg agagctagat gaactgaatg gcaaacgaac atgacgacca 14460
agttgacacg catgacagat gtggttgaca tcatctttat tacaggaaat aacactggag 14520
gtaataagtt tggacaaagc ttgatgccca agatgaccga gacgacgatg ccacagggag 14580
gtgggtgcag cgaggaatgc aggggtgctg gtggagggtg catagaacgg gtagaggtca 14640
ccggagctat tgcacctggc gatcacgttc ctggtttgca aatccttcac agaaaggcca 14700
aagggatcaa actcaatgga gcaattattg tcggtggtaa aacgacggat agaaattaga 14760
ttcttaataa tgttaggaga cacgaggaca ttattgagaa ctaaattgtg atgcgggaaa 14820
gaaaaaatat gtgatccagt ggctgtgaca ggaagcaaga caccatttcc cacaatgata 14880
gatggagtga atgaagtggg caaggaaatg gtggaaagtt taccagcgtc cgaggtcatg 14940
tgcgatcctg caccggagtc ggcgtaccac tctgaagtag cgttcggcgg gttgagggtc 15000
atggtgttga aagagtgcaa gggcgtcctg atgccatgct cctccgtgag tggggttcca 15060
gggcgccgct tggtacgccg gtgcgggcgc ctggaaacca ggggctccag ttcccccgta 15120
gtgcataccg tacggagggg atggagcgcc gtagaaactg ccataggcgt tgtattgtgg 15180
tactgcgttg aatgctggcg gcggtggtgg gcgcccggac tgatcgtatg gccacaaccg 15240
tacagtgcca acccaaggat gcgcgaagga cggatgcatg ccggggggca cctccctgtc 15300
tggcaccagg aggcgttggt tggccctggt gatggccgtt gcgtccaccg cggccgcgac 15360
gacggccgtt acgttggccg tttggcaccg aggggcatgc tggaggatgt gcccctggac 15420
gtggaggtgc tggagccccg ggagccgcag ctcgcagcgt tgcagcgacg agggcggatg 15480
gcggggacgg aggtcgtgcg tcgatttcca gctcctccaa cagcaggtgc gctcgtgcct 15540
ctgcgaacgt ggggaacggc ctgtgcatct tgaggatgga caccatctgg cggaacttac 15600
cgccgaggcc gcgaaggagc gtgagcacca tctgccgatc gtcgatggga tcgccgaact 15660
cggcaaggga agccgccatc gattcgagct ggcggcagta gtcggtgatt ctcagggact 15720
cttggcggaa gttgcggaat tttgtttcga gcagaagcgc ccgagactcc ctctggccga 15780
ggaactcgtc ctcgaggtag caccacgccc cgcgagcggg gccctgtcgc atcatcagag 15840
attgctgcag gtcaccggag acggtgctgt agatccatgt caggacgcag caattggctt 15900
gaacccatgc cgggcgcgac gggaacgctt catcttcaag gacgtgacga gtcagggcat 15960
atttgccaag gacagtgagg aacatgccac gccacttggt gtaggtattt gtcgcctgat 16020
cgagaaggac agggatgagc gccttcacgt tgacgacggc agtggcctgc gcccagaggg 16080
cctcatgggc atgctcatac gcgtccagag cggcagcacg gaggcggcct tcctcggcgc 16140
ggcgggcgtc tttggcacgg tgtgcagcag cctcagccgt agggcgctgg tcctcggcgg 16200
cagcgtcgtg gtcgtccgcc atcgggaggg agacgcgacg gctgggcagc cgagctggag 16260
ccgctgcaga ctggacggga gggaggcgcg acggggatta gcgtggtctg gaggctcgac 16320
cgcgcccgac cagagggaac gaccacgcga tctggacggg aatcagccga gggagacgcg 16380
acggggatcc gccgatctgg tgccgcgtcg gatcagcgag cgtggcgggc gagcggatca 16440
gcggccgcgc tcgcggtctg gagctgcgac cgcgcgacga ggcgggtgag cggatcagcg 16500
gccgcacccg gcagcaacaa cgacggggcg ggtgatcgaa cggacggcgc aggcgatggg 16560
atcagcgacg ctccaggcga cgaggtctgc aggggcggcg atcggatcgg cgacggcgcg 16620
gtcttgggtt gcggaagtgt ggtggatcgg aaccttgata ccatgaaaga gtaattgtgg 16680
gaatgacttg attctattcc acggcaatgt gtgcgtatac ataggagagg ccggggttgc 16740
tcacaaggca accgcacagg cgtacaagcc aatcaagggc agcctacaat caagggctga 16800
ctaccataat taggctttct ataattacaa tagtctaaca tttgggacta actcgcatcg 16860
cacaacatct aaataaaaca tcacactatt agatctagca ggcagaacat caccaaagat 16920
cacagtcttt cacaaaacca caacttaaaa ccaaaagacc taaaacacta atgtgcaatg 16980
cccactatgc agtattaaga tttcaactga agcagaccta gcgatgttat ttgcttcgag 17040
atacttggag aagcaatcaa catccatcta tgacatttaa ccggtcacta aggccctgtt 17100
tggacagctc cagctccaga aaattcggta gagttggtgg agcaggtcat taggtgctcc 17160
ataaaatcgt ggagttggag ctgtaagcct tcagaagaca ttttgtcttt gataagtcat 17220
tttgattatt atttaggtta aaaatatttt ttaaaactat ttaaattaat attataaact 17280
atagctccgc gctggagctg gaatttagag tcatcccaaa caccaactaa atatagagta 17340
taatgaccac tagagcaagg catcgacttt atcaaataaa taaaatcgac acaaacaaca 17400
ctgagaacat gttggctagc cgattgaaat actaaaccta tctttcacgt catcaattga 17460
caatacattg catacttgtc taccaaaaca ctcttctagg agatggtatc attctcactg 17520
tttccagagc aagtttggta catagtttgc aaatcgcacc atacttaaat ggtcccagtg 17580
tctgcttaac aatttcagaa cttgctgtat ttttgtgttt gcagttcttc taagcacatg 17640
gttgtaattt tgacattttg ttgtgatctt tctcaggaac ctttccctat gggtacaaac 17700
atccgagcca ggtctgggag atcccggact tcctctggtg aagaaaatca ccatgatatc 17760
cagacagtct tgaccaacgg tgacacttct tccaatggag ctgacacttc aggtcccacc 17820
aaggacactg agtagctgaa ctgcagcttg ctgcgttgct gaccacaaag gcccaaacta 17880
taactttttg caaacccatt ttcagttctt tccccccttt cccattttgg ttctgttttg 17940
taaagtctcc cgatctgtat ttattgactt ccacgatgcg ggtcaccgaa gacttaggtt 18000
gctgcaaaat tttgtccctg acgggaagct atatgcaaga gggtggtact ggctatgtgc 18060
ttgttaacct gaaggccgag aaaggtgaaa agcgcaggga gagcctccag attttggtcg 18120
ctgtaagaat taaccccatg ttgtacagca ggtcccagta acttgtagtg atgggagagt 18180
ggagtcattt tcatcagttt ttagtggtgg ttgtgtggag aggaagagtc ttgcctgcgt 18240
tttcttttgg aaccttctct tgtgccttta cattttttta gtcgagggtt cctcttaaat 18300
tgtgtgcaga gggggctcaa ttttgttaac cggaacaagg cgcatgtgcg tcttggatca 18360
accccggtct tgtcttcagg cactgttacc ttatttatca aacatatgta cacctccatc 18420
tatatatagt atgagttttg atgcctatct attttgtggc tgtcgtctca caaggttatt 18480
tatctatata tagtgtgagt aattcttgtt caaatccttt ctccttacta taaatatttg 18540
tcacaatacg cgatcgctcc caataactgc tataaatatt tgtctccgcc gtggcctcca 18600
tccctaaacg gagcacagag ccagccccac tccctttctc cttactccga caggagatgc 18660
ggatgccgcc gagggccgtt ccacatggcc cctaaaaaca gtggggtcct aagctgctgg 18720
acactagcat tttccctata gtttatctgc tttatagttt atctacttta gacacaaata 18780
cgcaaagagc atcgcactgt catcctgtct tatttagatt gttatcctaa tatctcaatt 18840
gcttatcaaa cattatttac tatacccacg atggttatat tggttgagag actttttaaa 18900
attgaaatta ttggggaact atttaaggcc tgcaatgatt gaaggaagat taaatagttt 18960
ggcaattcta tgcatggaga aaaagttgga tgctattgat ctcaatggta taatctttga 19020
ctttgtatca caatgttaga agacattttt agcgtgatat gaatgagacg tgcgacagcg 19080
cagccacaca atagcacaca cttttatacg g 19111
<210> 21
<211> 2944
<212> DNA
<213> 玉米(Zea mays)
<220>
<223> OML4启动子序列(玉米)
<400> 21
catacttgtt ggcaagagcg ccaatcacgg tgcctcaaaa caggttattg acaacgtcga 60
acattctctc ctcttcagga gtgaactgtt cgggtttccc ctgtgcggcg tgataacagt 120
tcattgcagc caaccacaat atcatcttac tacgtcatct tttgtaaaat gtcctatcaa 180
aaggttcact tggttttaaa gtagcaacaa aaccactaac agaaaaatgc ctaatatcag 240
gtttttggat tgttagagaa atatgcattt tcagttttaa tttaatccag aaaatcacag 300
tgatgtatgt gatgacatgt atgtgcatat gtgtatcact actcacataa gttgtaaaca 360
acagtaaatt atacacaaat actaagaaca gagtgtaccc tgtggaggga ccgatgttgc 420
aaggcatcag tggctctatt cacacgagac atctcatgtg tatgttcgat gtagtcatac 480
gcagtcgatg tagacagatg tacgtagtgc agtccctcga acgacgccgg cgacgaggaa 540
cttgatcagc gttgattcag cggacgaagc gagcagtcgt gagtacgctc cccaaaaacc 600
taatcgtccg cacacctgtg caagtaacag acagcgattt cggaggcctg ctctcccaaa 660
ctctctgtgc tcgcagaagg tgggacgaga atggctgtgt gcaacgcgtc tgagactcta 720
cgtgcgtact gtgaatagaa gcagcctcca ctcctccata taagtacacg cgcagaggga 780
ggtgaacaga cagtaacagt caccatcaga gctaccgtta tagacagcca gaaattgata 840
ccattagtga cgtccgttac tagccgacaa ccattacagc ccgtccgtta tagccataac 900
acaggaaaca accagtaaca gacgataata atggactgtc attactctag gcaaaatatg 960
caacccttag gacggaatat tcggatcaaa gtccgatcca ccacggcccc gccggcggcg 1020
gcgcgcgcgc atgatagtcc ttcatcattt tctcagcttt atcaatagat gcaccaatga 1080
tacttctatt taagttgatt gaattgtcac ttgaacttcc ggtatggtac taaagtacta 1140
gtacactgta gcattaaaat gagcctttaa cattaactat tattgaatat taatttgtgc 1200
cagacccaca ttaattcaac agtcgttgca actagccatt tttggatcca aaaaatttaa 1260
aaaaattgca aaaaccacaa atttcacccc aatctcttta gaaataccct acgcggatgg 1320
agctcgttac acaaaccatt ccattatgtt gtgcgatttc tgagcgttca aataaacgtg 1380
cgtgaattac ttaattctga aataaaaaag ctatagaggc tgtagtctgc tacaatctat 1440
gtactagagc attagagatg aagtgaagtc gagagctgat atgatatgga cgagaggagg 1500
atgctgcact agaacgaggc taatccaagc agtgagtgag aggagaacaa tctggcgcaa 1560
gcaagcaagc agcaaggctt gccgcccgtc ctaaccaact cagcccaaag ccgtcgcctc 1620
ccccaactcc caccacccaa atttgaaccc accgcacacc aatgcaccgc tctcttccgt 1680
cgatcccact gcagtactgg tcccacccct gtatcaagtc actgacaaga cagcccgcct 1740
agagtgggcc acatctcgtc agtttcaggt ggtatgaaca agccccagga cagccgcgcg 1800
cgccgcggtc ccgtgctccg cggtggcagt caccgggcgt aaccgcaggg tacggtataa 1860
agggcgtgcc gcccgtctct tgccgcccgc atttgggtag gtagttgctg ttcccctgcg 1920
aggcccgcgt ctccccttcg tctcaacacc caccgcctcc tcgccggagc cagtaagctt 1980
ccggcgaaga aatccggcgg gcacatcaca agggggccga gcagggggac ctaggcgagc 2040
gccggaatgg gggccagcgc ccgggggctc gccgtcgtcg tggctctagg gttagatagg 2100
tgtccgtagc ttttttcttc gctcgccctc ccccacgcgg ccagggtgtg cagccccggc 2160
gtcgcattgg gtcccgggac gaccgtaagg ccgcgtgatc cacccgtgct cgagctcgga 2220
cagggtcccg gttgcgtggc atgggggcat ctcttccgcc tgctcccgct gcctgcgagt 2280
ttggcaccgt ttttgagctc tgaagaggag gaggtggtgg cagcaggcac cgatctggtg 2340
agcccccact cgctttccgt tctctacatg gatggtttct gtttgggatg tttcaatttt 2400
gggaaatttt gaaagctctc gtataagtcg ttttgtttcg tgggtgtcct tgcttgctgt 2460
atgtaacctg agcttgaatt cggggtctga caattatttt gggttgtgtt ctgccgggaa 2520
ttcctcgttt tattttgatg gtttctttga tcactaggga cttgctggtt tggagctcgt 2580
agagcccgag gcgcattaaa ttttacatct tctgtgctgt cgtattgggg gaaattaaac 2640
atttctctca aatttgtggg attcgcactc tggtttgtca aacctactgg ttctgattca 2700
gaagtattga ctttggaagc tcacacgagc taaaatccgc ctttttctct gctgccctgt 2760
ggctcggttg tcatggattg acagatttct gcccgtaaaa ttgctcctat tcgtcatgtt 2820
aacccctcga cacttcatct tttccgcaag ttttattaat tttgcgttga tcctgggcaa 2880
ttgagatacg gtgctgttgt ctaggtttgt gcctaacacg ttatatggtc tggacgcctg 2940
cagg 2944
<210> 22
<211> 406
<212> PRT
<213> 玉米(Zea mays)
<220>
<223> GSK2氨基酸序列(玉米)
<400> 22
Met Glu Ala Pro Pro Val Pro Glu Leu Met Asp Leu Asp Ala Pro Pro
1 5 10 15
Pro Ala Ala Ala Asp Ala Ala Ala Ala Ala Pro Val Pro Pro Ala Val
20 25 30
Ser Asp Lys Lys Lys Glu Gly Glu Gly Gly Asp Thr Val Thr Gly His
35 40 45
Ile Ile Ser Thr Thr Ile Gly Gly Lys Asn Gly Glu Pro Lys Arg Thr
50 55 60
Ile Ser Tyr Met Ala Glu Arg Val Val Gly Thr Gly Ser Phe Gly Ile
65 70 75 80
Val Phe Gln Ala Lys Cys Leu Glu Thr Gly Glu Thr Phe Ala Ile Lys
85 90 95
Lys Val Leu Gln Asp Arg Arg Tyr Lys Asn Arg Glu Leu Gln Leu Met
100 105 110
Arg Ala Met Glu His Pro Asn Val Ile Cys Leu Lys His Cys Phe Phe
115 120 125
Ser Thr Thr Ser Arg Asp Glu Leu Phe Leu Asn Leu Val Met Glu Phe
130 135 140
Val Pro Glu Thr Leu Tyr Arg Val Leu Lys His Tyr Ser Asn Ala Asn
145 150 155 160
Gln Arg Met Pro Leu Ile Tyr Val Lys Leu Tyr Met Tyr Gln Leu Phe
165 170 175
Arg Gly Leu Ala Tyr Ile His Asn Val Pro Gly Val Cys His Arg Asp
180 185 190
Val Lys Pro Gln Asn Val Leu Val Asp Pro Leu Thr His Gln Val Lys
195 200 205
Leu Cys Asp Phe Gly Ser Ala Lys Val Leu Ile Pro Gly Glu Pro Asn
210 215 220
Ile Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala Pro Glu Leu Ile Phe
225 230 235 240
Gly Ala Thr Glu Tyr Thr Thr Ser Ile Asp Ile Trp Ser Ala Gly Cys
245 250 255
Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Leu Phe Pro Gly Glu Ser
260 265 270
Ala Val Asp Gln Leu Val Glu Ile Ile Lys Val Leu Gly Thr Pro Thr
275 280 285
Arg Glu Glu Ile Arg Cys Met Asn Pro Asn Tyr Thr Glu Phe Arg Phe
290 295 300
Pro Gln Ile Lys Ala His Pro Trp His Lys Ile Phe His Lys Arg Met
305 310 315 320
Pro Pro Glu Ala Ile Asp Leu Ala Ser Arg Leu Leu Gln Tyr Ser Pro
325 330 335
Ser Leu Arg Cys Ser Ala Leu Asp Ala Cys Ala His Pro Phe Phe Asp
340 345 350
Glu Leu Arg Ala Pro Asn Ala Arg Leu Pro Asn Gly Arg Pro Phe Pro
355 360 365
Pro Leu Phe Asn Phe Lys His Glu Leu Ala Asn Ala Ser Pro Asp Leu
370 375 380
Ile Asn Arg Leu Val Pro Glu Gln Ile Arg Arg Gln Asn Gly Val Asn
385 390 395 400
Phe Gly His Thr Gly Ser
405
<210> 23
<211> 5830
<212> DNA
<213> 玉米(Zea mays)
<220>
<223> GSK2核酸序列(玉米)
<400> 23
atggaggcgc cgccggtacc ggagctcatg gatctggacg cgccccctcc cgccgcagcc 60
gacgccgcag ccgcggcgcc ggttcccccc gccgtcagcg acaaggtgag cgagtgcccc 120
agatccggag ctgggctcgg atctgcggcc gtggtcgcgg ctgggcgcct cccgatctgc 180
tgcctccgcg agcgacgttg ctaatggtgg tggcctgtct attttttcct ctctcacttt 240
ccgtttgtgt tgcagaagaa ggaaggggaa gggggagaca ctgttacggg tcacatcatc 300
tccaccacca tcggtgggaa gaacggcgag ccgaagcggg taaagctacg cttctctcgc 360
tgtctgtttg tctatctgtc gtgccgatgt gcgcgtgaat gctgctgcgg ttagtgcggc 420
tgaagtgccc ccgcttgttt cgtagcggcc ttgcggtcgg aatccgtttt gatctgacgg 480
tttgcgcatg gggtcgtgtt ctgcgcctct tgtttagcgg ctacacagct acagctagca 540
tgctggtgaa atttggtggg tttgttctgg ttttgttgat gtattatgct ctccccgcta 600
ctctgggcct ctggggattc tggctgggtt gcgcttcctt ggcttagtgt ttgcagctga 660
attatgtgtc tgaccgcttc atttcgtgct tcgttacttg gttttttaag gctaacatgc 720
atttaggaag cacggtctac cattcttgtg attagttctg ccgtgtgcag aacagaaatg 780
gtctaactgt tagtttaggt ccaggtatga gtgaggattc gaattccttc ctgctcagtt 840
gctctgacgc ctgcctagtt tgttaccctc ttcgtgtcct cagttgctca tttgttcttc 900
ttctggcctt aattgcagac catcagttac atggcagaac gtgtcgtggg tacgggctca 960
tttgggatcg tcttccaggt atggtgcttg gtcatgggag ctcttctttg tacgtgccta 1020
acatttgttg atgtaacatg cactgaatta actttgacat gtaggctaag tgtttggaga 1080
ctggagagac cttcgccatt aagaaggtgc tgcaggatcg gcgttacaag aaccgggagc 1140
tgcaacttat gcgtgccatg gagcacccca acgtcatctg cctgaagcac tgcttcttct 1200
caacaacgag cagggacgag ttgtttctaa accttgtcat ggaatttgtc cccgagaccc 1260
tgtaccgtgt cctgaagcac tacagcaacg cgaaccagag gatgcctctt atctacgtca 1320
agctctacat gtatcaggtt tgtgaaccag catcttaact tatatgaagc tgctaatgtg 1380
tgctttcatt gttttgctaa ctgtctcttt ttttgtaatg ttcgcagctt ttcagaggcc 1440
tagcctatat tcataatgta ccaggagtct gccataggga tgtaaagcca caaaacgttt 1500
tggtacgtgt catgtggaca aggtttcgtt ctttctttga tttggtaact agttctgagt 1560
tggtctgatc cttctttgat atacaggttg atcctctcac ccaccaggtc aagctctgtg 1620
actttggtag cgcaaaagtc ctggtatgtt gtttttcttt ccttgaggat ttgtagtcac 1680
atccagttgt tgtatgcttt ctcttttgaa atattcttat caaaggcttg tttttctttc 1740
cttgaggata tgtagtcaca tccagttgtt gtatgctttc ttttttgaaa tattcttatc 1800
aaaggctatc catactattg gcatggcatt agtggtttgt gtcactatgt aaaatgtatc 1860
atcagtatgc tgctattgcc tgttatgatt aattgtgatt gtagttggtt ggtcctatgg 1920
aacaaaacac atcttgaagg tagcttaagt atagatgcaa ggctcgtgga tatatttctc 1980
agtgaactat tgatacaaaa actgtcctgt tacatagttt tggtctagat atcttgcaga 2040
tcaatgttgg ctacatttta gtcaagctta tcaaatttgt cttcatcatg tgcagttata 2100
tttatcctat ttgagctatg acttattcaa ttgtttctgg ggctgtcttt gtatgtaata 2160
gcattgattc ttttgcttct atccgaagtt ccaatcttgg aattgactgt aattcatgtg 2220
ttataacaat tagattcttt acttgtatgc tgtatttttt tatccacata ctaatcagtt 2280
ccatatgttg ttttgtcaga ttcctggtga accgaacata tcttacatat gctctcgtta 2340
ttatcgtgct ccagagctca tatttggagc gacggagtat acaacttcaa tagacatatg 2400
gtcagctggc tgtgttctag ctgagttgct tcttggtcag gttggttgca ttcatataat 2460
gattaaccta atatttttgt acctcgattt gaccaaatca tgtatggtgt gattctaacc 2520
tcttggggtc ttggatctta tgtatcagcc actgtttccg ggagagagtg ctgttgatca 2580
gttggtagag attatcaagg tactgcaaaa tgttccaaag tagacattct attcttctac 2640
cggggtgttt cttatggtta tgtgatgtgc ctgtaggttc ttggtactcc aacccgtgag 2700
gagatacgat gcatgaatcc caactatact gagttcaggt ttcctcagat aaaggctcat 2760
ccgtggcaca aggtattctt atgttaaaat catgtttctg tccacatcta tgattccatt 2820
tcaccagcag ctactgtagt tatatacttg tagcccacgg tccaaaatgt tattgaaggg 2880
cgcttaaaga aattgtttgc agatcttagc gaaaatttga gctcagaatg catcagttac 2940
tgactgattg ttccactttc cgttttatcc tccagatttt ccacaagaga atgcctccgg 3000
aagccattga ccttgcttcc cgtctccttc agtattcgcc aagtcttcgc tgctctgctg 3060
tgagtatttt tttttacttt gtttatttag attagagtca gctttgatgc ttatagtttg 3120
aggggaatag acaatggaac gcgacagact aaggtctttg aggtctttgt gttgcatatg 3180
gtctatttta cttggctttg gttattcgaa agcttccact gttgtcaatt atccgtagtc 3240
ctgtagacca tgaccaatta aaagtggcta aaatccatgt ggaattatgt cctctcaaac 3300
catagcgtat ggtcctgcat gtatatggta attatgctgc ccagtggtcc agaaggctag 3360
tagaaccatc agttttgatg gatgttagct gatgaagagt gggtgcaact ttatagtcac 3420
atgtgcttgt taagtgtact agctagtggc ccacctaaaa agagcagtcc tagttctcac 3480
atgctgtagg gtggcacaca ccataatctt taatgcatca gtttgttggt tagaaatgtt 3540
ctaatgtgct tcatgtattc tatttctatt cagcttgatg catgcgctca tcccttcttt 3600
gatgagctcc gggcgccgaa tgcacgtcta ccaaacggcc gtccattccc tccgctcttt 3660
aacttcaaac atgaggtaag caaactaaac acagtgcaaa gttcgtttag ccagacgctt 3720
cagttcggtc attaaagacc tgaaaggatc cagtttgcac ttgctctact gttttgctca 3780
tcagttaccc cccccccttt ttttttgcta tgcagctagc aaatgcctcc ccggacctca 3840
tcaacaggct tgtaccggag cagattagac ggcagaacgg tgtcaacttt gggcataccg 3900
ggagctagga gggcaggcgg ctgccatggt caagtttttg gtcttggtac cccatgtgca 3960
gggccgattg caggtgacgg tgatattgct gcaccatctg gagaggaggg gctcagcagt 4020
acctgagaga gctgaaacta tgtaaattat ctgaccgcga aggagtacgg ccagtgttaa 4080
gccagtaaac tggcgcatgt tggtccagag tagttaagaa tgtagcaggt ggagactggt 4140
aaatgcctag ggtcgttttt agttgttgtt actagtattt tgtaatgtaa tgttcgtcgg 4200
tacttcccag cagtagtgta gctgctcatg ttttgttcgc ccgtcatgat gtaaatgatc 4260
atcacccaac tggaacccct gttatctcgt tacatgctta ggcctctgat cgttccgtag 4320
ttgctgtgat agagctctga caagtctgag caggaaagtg ggtaggaatt gcttctggtg 4380
aaatctggac aagttttgtc gaatacagat gcatctgctg attgatcgtc tggttgcaag 4440
tagtctgcac attcccaagg ccacagatca ttactttcag attgttgata acgaccaaat 4500
ggcaagtaac agaaacgacc gaaattcgca agcaggcaat tacagacgcg gccgcgccag 4560
cacatcgccg ccgtagtcct tgaccttgct ccacaaaacc ggccatgcgt ccttcctgat 4620
ggcggctagg ttctctccat cccagtctct ggctgcgagc tcctcagcca tggcgaccgc 4680
cgcggccacg acgtcctcca cgccgccgtc cacggccgca tccacgatgc ctcggcgcgc 4740
ggcctgcgcg gccgtcatct tctccccctt catcaccagg tccctcctag cggccgcgtc 4800
ggggaccttc tgccgaacca gctcgccgac aaaatcgacg atcttgatcc cggcgtcgac 4860
ctcgctcatg tagaggaacc cgcgggaggc gcgcatggcg acggcgtcgt gcgccagcgc 4920
gagcgcgcag ccggcgcccg cggcgtggcc cgtgacggcc gcgaccgttg gcacggggag 4980
cgcgagcagg tcggcgacga ggccgcggaa cgcggcgcgc atctcggaga ggcggtgccc 5040
cggcgccggg gccggccccg cgcgcgccca cgcgaggtcg tagccgttgc tgaagaactt 5100
gccctcgccg gccaggacga gcgcaccggg ggaggcgcgg cgggcggctg cgaccgcgga 5160
gcggagggcg gagagcaggg ccgggctgag gcggtgctcc tccgcgccgg tgagggtgat 5220
gacgtgcacc cgcccgcgct tctccacggc gcacaggctt tcctccatcg ttggagtgga 5280
tttggggctc ctcactgcta tgccactgat agtatgttta ctttttcccc tcttgcatct 5340
gggaaggtcc aaaatgtccc tggtccagct ctagtacaga agtgttcaac taaacctttt 5400
ctgttctggc gtcaacacca aggccctaga gcacaaacca aatttaggag tgaaactaaa 5460
ttatatcagg aacataataa ttggaggtga atttaattgt atagactacc ttattcaaat 5520
tatgagccta ttttaattgg atgtgacttc aacattatta gatatgtgaa agacaagaac 5580
actatgaatg gtgttcataa acacaaaacc atctcaattc tttgattcac aattttatga 5640
actttgagag ttggtaatgt gtggtgggct ttttcacttg gtcaaacaat caagagttcc 5700
ccattttggg aaaaacttga tcgaattctt gtctcaaaag gtgagaagtc attttttcca 5760
caagctatgg ataaatgaat ccctagagag atttatgaac acaatcccct gcttctttca 5820
actggaaact 5830
<210> 24
<211> 2711
<212> DNA
<213> 玉米(Zea mays)
<220>
<223> GSK2启动子序列(玉米)
<400> 24
aagtgaagga tatcttcttt gcgaatggga tattccgagt taacaatgga caggacacaa 60
ggttttggga ggacaaatgg ctgggggatt tctcgctcca gcatagattc ccgagcctat 120
ataacctagt gcagcggaag aatgctactg tggccaatgt gctagggtct gtacctctca 180
atgtatccta caagagaggc ttacatggtg ctaatttgga gagatggcat accttagtca 240
gcctagtagt ggatacgacg ttgaaccagg caagagatag ttttcgttgg agccttcatc 300
aaaacgggtt gttctccact cagtctatgt atgcggcatt gattgggaac ggacaagtac 360
ggcaggatgg cctcatctgg aaactaaaac tccccttaaa gatcaagatc ttcttctggt 420
tcttaagaca aggggtaacc ttaactaaag ataaccttgc caagagaaat tggtcaggat 480
caaaaaaatg tgttttctgt ccacaagatg aaaccattca acatcttttc ctccagtgtc 540
attatgcgag atttctatgg cgtacggtat attttacatt tggcattaga gaaccaacta 600
gtatagaaga tatgtgttct tcttggcttc aggggtttca ccctaatgtt aaagctaaga 660
tatatgtgag cgctatagct atttgttggg cgttgtggct aagtagaaac gatgtggttt 720
ttaataaatc tcctacccaa acttatttac aggtactctt ccgaggaact tactggtgtc 780
gtttctaggg atgcttcaaa ggcataaaga ggacactaga agcatgaggg aggcctgcag 840
acttttggag acatcgatga tgcaagtctt ctcgacgtat ggttggacct tcagtaatag 900
attaactatg tgatgtttgt ctattctccc aactgcgttt gggttttgtg gccaaatgtg 960
gcgttgtttc ggtactttat gttgtggtgt gtggacggcc gtcatcagct gatgtaggtc 1020
gggatttggt ttttttttcc cgttatctaa aaaatatatg tggctagatt tatcatcatc 1080
caggtaaata tagacataaa aattaagatc tcaaatgaat aatatcttcg accggatgga 1140
gtatgacata attttacatc acgatttcta aacaattgct aagttctttc cgctcattcg 1200
gtctattgta catatgtatc aacatcttat actcatccgt ctcaaattaa gattcgtttt 1260
acttaattaa tgggttcata caacacttga tttatatgtt atgtatgtgt ctaggttcat 1320
cttcatttat ttgaatattg atataaaaat caagagttaa aacaactatt attttgggac 1380
gcggtgagta ttttttctcc atttcctcgc acctagggat ttcacgcgat ggatacacat 1440
tctatgtaaa aaaagattgg gcgttaacag tcagtcatta aaaatattct ttttctaaaa 1500
aattaaaaaa agaggatctc cattggaaat atgttttttc gaaactactg gagatgctct 1560
aggtattgtg aacagttttt ttctcattaa aaagatgctg caaaatccgt tgatgctcct 1620
agatcactcg acaactacag ttaccatcgt tcatgccttc ggttttagca acaaaaaaca 1680
gtgcaatcct aaacaaaagc atctattaat cacaattggt tgctgccatt ggtactgcac 1740
tcagcaactc tgttagcaaa ggtaatgcac tcttgtagtc tttgaccgga tcttttggct 1800
agggaaaact aaggatgcgt ttggttacgg gacaggcagg atagagatgt ccccaggcgt 1860
actctctcgt cactctaatt tcgaggggca actagagaca acattggaat aatcctgtct 1920
caacccctga ttctgaacta aacaacctta tttaaggtac gtcctatctc atcccgttct 1980
gtcattataa ccaaacgcac cctaaaaaaa tgttcatgaa ggagagaatt aaaaggttcc 2040
agttttcagt atgctagttt agcaacgagt gtattgcaat taattatcac tattgttcgg 2100
accctccatt ttggtagtac aggtaaatcc ctactaagca agaataatat gtttttttat 2160
gctacacata ggtagcgttt gagtagactt gtattttaaa taaaatgcta ctgctgataa 2220
gactataacg gtacgggaaa aagaagacaa tttagagctt gccaaatttc tttagcagcc 2280
aattaattcc taccacggtc ctgtcctcag aatttttttt agtaacaaat cagtgcacta 2340
ctgattccta aaccaggctg aaaccggaaa cggctcgctg cgctgccgct gcgtcactgt 2400
cgctggcaaa gaaaacaact cccggccagg ggtccgagca ggagcagcag tatattttcc 2460
cgccgctaat aaaaacagtc agcggcacac ttcgccaagc gaggcaggca gcggctgtcc 2520
cgagctgtcg aaagcgaggc gcggcggcag tcctcgcagc agggccgacc ggtcaaaagc 2580
actgctgctc cacaccaccc ccaccatccc tttccccaac ccccgaagcc gagccagcga 2640
accaccccgc ccgcagccgc aagcaagcag ccaagcagtg tgaactgacc gtccgttccg 2700
tccagcccac c 2711
<210> 25
<211> 917
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> OML4氨基酸序列(甘蓝型油菜)
<400> 25
Met Met Pro Ser Asp Ile Met Glu Gln Arg Gly Val Ser Thr Pro Ser
1 5 10 15
His Phe Arg Glu Asp Thr Arg Ile Ser Ser Glu Arg Gln Phe Gly Phe
20 25 30
Leu Lys Thr Asp Leu Ile Pro Glu Asn Gln Gly Gly Arg Asp Arg Phe
35 40 45
Ser Asn Leu Pro Lys Ser Ser Trp Thr Pro Glu Ser His Gln Leu Lys
50 55 60
Pro Gln Ser Ser Leu Ser Gly Val His Pro Ser Val Ser Pro Asn Ala
65 70 75 80
Arg Asn Thr Thr Asn Gly Ser Gln Trp Glu Ser Ser Leu Phe Ser Ser
85 90 95
Ser Leu Ser Asp Thr Phe Ser Arg Lys Leu Arg Leu Gln Arg Ser Asp
100 105 110
Met Leu Ser Pro Met Ser Ala Asn Thr Val Val Thr His Arg Glu Glu
115 120 125
Glu Pro Ser Glu Ser Leu Glu Glu Ile Glu Ala Gln Thr Ile Gly Asn
130 135 140
Leu Leu Pro Asp Glu Asp Asp Leu Phe Ala Glu Val Met Gly Asp Val
145 150 155 160
Gly Arg Lys Ser Arg Ala Gly Gly Asp Asp Leu Asp Asp Phe Asp Leu
165 170 175
Phe Ser Ser Val Gly Gly Met Glu Leu Asp Gly Asp Val Phe Pro Pro
180 185 190
Met Gly Pro Arg Asn Gly Glu Arg Gly Arg Asn Asn Ser Val Gly Glu
195 200 205
His His Arg Ala Glu Ile Pro Ser Arg Thr Ile Leu Ala Gly Asn Ile
210 215 220
Ser Ser Asn Val Glu Asp Tyr Glu Leu Lys Val Leu Phe Glu Gln Phe
225 230 235 240
Gly Asp Ile Gln Ala Leu His Thr Ala Cys Lys Asn Arg Gly Phe Ile
245 250 255
Met Val Ser Tyr Tyr Asp Ile Arg Ala Ala Gln Asn Ala Ala Arg Ala
260 265 270
Leu His Asn Lys Leu Leu Arg Gly Thr Lys Leu Asp Ile Arg Tyr Ser
275 280 285
Ile Pro Lys Glu Ile Pro Ser Gly Lys Asp Ala Ser Lys Gly Ala Leu
290 295 300
Leu Ile Thr Asn Ile Asp Ser Ser Ile Ser Asn Glu Glu Leu Asn Arg
305 310 315 320
Met Val Lys Ser Tyr Gly Glu Ile Lys Glu Ile Arg Arg Thr Met His
325 330 335
Asp Asn Pro Gln Ile Tyr Ile Glu Phe Phe Asp Ile Arg Ala Ser Glu
340 345 350
Ala Ala Leu Gly Gly Leu Asn Gly Leu Glu Val Ala Gly Lys Gln Leu
355 360 365
Lys Leu Ala Leu Thr Tyr Pro Glu Ser Gln Arg Tyr Met Ser Gln Phe
370 375 380
Val Ala His Asp Ala Glu Gly Phe Leu Pro Lys Met Pro Phe Thr Asn
385 390 395 400
Thr Ser Ser Gly His Met Gly Arg His Phe Pro Gly Ile Ile Pro Ser
405 410 415
Thr Ser Ile Asp Gly Gly Pro Met Gly Ile Ser His Ser Ser Val Gly
420 425 430
Ser Pro Val Asn Ser Phe Ile Glu Arg His Arg Ser Leu Ser Ile Pro
435 440 445
Ile Gly Phe Pro Pro Leu Ala Asn Val Ile Ser Ala Ser Lys Pro Gly
450 455 460
Ile Gln Glu His Val His Pro Phe Asp Asn Ser Asn Met Gly Ile Gln
465 470 475 480
Ser Met Pro Asn Leu His Pro His Ser Phe Ser Glu Tyr Leu Asp Asn
485 490 495
Phe Thr Asn Gly Ser Pro Tyr Lys Ser Ser Thr Ala Phe Ser Glu Val
500 505 510
Val Ser Asp Gly Ser Lys Ala Asn Asp Ala Phe Met Leu His Asn Val
515 520 525
Arg Gly Val Asp Gly Phe Asn Gly Gly Gly Ile Gly Ser Pro Met Asn
530 535 540
Gln Asn Ser Arg Arg Pro Asn Leu Asn Leu Trp Ser Asn Ser Asn Thr
545 550 555 560
Gln Gln Gln Asn Pro Ser Gly Gly Met Met Trp Pro Ser Ser Pro Ser
565 570 575
His Leu Asn Ser Ile Thr Ser Gln Arg Pro Pro Val Thr Val Phe Ser
580 585 590
Arg Ala Pro Pro Val Met Val Asn Met Ala Ser Ser Pro Val His His
595 600 605
His Ile Gly Ser Ala Pro Val Leu Asn Ser Pro Phe Trp Asp Arg Arg
610 615 620
Gln Ala Tyr Val Ala Glu Ser Leu Glu Ser Pro Gly Phe His Ile Gly
625 630 635 640
Ser His Gly Ser Met Gly Phe Pro Gly Ser Ser Pro Ser His Pro Met
645 650 655
Glu Ile Gly Ser His Lys Ser Phe Ser His Val Ala Gly Asn Arg Met
660 665 670
Asp Ile Asn Ser Gln Asn Ala Val Leu Arg Ser Pro Gln Gln Leu Ser
675 680 685
His Leu Phe Pro Gly Arg Asn Pro Met Val Ser Met Pro Gly Ser Phe
690 695 700
Asp Ser Pro Asn Glu Arg Tyr Arg Asn Leu Ser His Arg Arg Ser Glu
705 710 715 720
Ser Ser Ser Ser His Ala Asp Lys Lys Leu Phe Glu Leu Asp Val Asp
725 730 735
Arg Ile Leu Arg Gly Asp Asp Val Arg Thr Thr Leu Met Leu Lys Asn
740 745 750
Ile Pro Asn Lys Tyr Thr Ser Lys Met Leu Leu Ser Ala Ile Asp Glu
755 760 765
His Cys Lys Gly Thr Tyr Asp Phe Leu Tyr Leu Pro Ile Asp Phe Lys
770 775 780
Asn Lys Cys Asn Val Gly Tyr Ala Phe Ile Asn Leu Ile Glu Pro Glu
785 790 795 800
Lys Ile Val Pro Phe Tyr Lys Ala Phe Asn Gly Lys Lys Trp Glu Lys
805 810 815
Phe Asn Ser Glu Lys Val Ala Thr Leu Thr Tyr Ala Arg Ile Gln Gly
820 825 830
Lys Val Ala Leu Ile Ala His Phe Gln Asn Ser Ser Leu Met Asn Glu
835 840 845
Asp Lys Arg Cys Arg Pro Ile Leu Phe His Thr Asp Gly Pro Asn Ala
850 855 860
Gly Asp Gln Glu Pro Phe Pro Met Gly Thr Asn Ile Arg Ser Arg Pro
865 870 875 880
Gly Lys Pro Arg Ser Ser Ser Ile Asp Asn His Asn Gly Phe Ser Ile
885 890 895
Ala Ser Val Ser Glu Asn Arg Glu Glu Pro Pro Asn Gly Thr Asp Pro
900 905 910
Phe Leu Lys Glu Asn
915
<210> 26
<211> 5843
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> OML4核酸序列(甘蓝型油菜)
<400> 26
atgatgccgt ctgatataat ggaacagaga ggtgtatcaa caccttccca ctttcgtgaa 60
gatactcgta ttagttcaga ggtaactttt tcttttactg tgtagcacca tctttgtcac 120
attatctgcc actattttct atgatgttta aaactgtttt ctttttgttt ctcaagtata 180
cttgttcttt tgtctggcag aggcaatttg ggtttctgaa aacagacctg attcctgaaa 240
accaaggtgg tcgtgataga ttttcaaatc tgccaaagag ttcctggaca cctgaaagtc 300
accagctgaa gccacaatct agcttgtctg gggtgcaccc ctctgttagc cctaacgcaa 360
gaaacaccac aaatggtagc cagtgggaaa gtagtttatt ttccagctca ctgtctgata 420
catttagtag aaaacgtaag cttctggttc acttttatga attgttactt attatgttga 480
ttttgtttta tcctctacgg taaagaaacg ccgtttgtta atctagtaca tcatagacga 540
tcgtgaaagt ttgtttcttt ctcctttaac ttactgtact ttaactactt gactgcgtct 600
ccaaattctt ggtttttgca gtacggttac agagaagtga tatgctatct cctatgtctg 660
cgaacacagt tgttacccac cgtgaggaag aaccctctga atctttagaa gaaattgagg 720
cgcaaactat tggaaatctt ctgccagatg aagatgacct ctttgcagaa gtgatgggtg 780
acgttgggcg taaatctcgt gccggtggag atgatctaga tgattttgac cttttcagca 840
gtgttggtgg catggagcta gatggagatg tttttcctcc tatgggcccc agaaacggag 900
agagaggccg caataattct gttggcgaac atcatcgagc ggaaattcca tccagaacaa 960
ttttggccgg aaatatcagt agcaatgtcg aagactatga gctgaaggtc ctttttgagg 1020
taccttattc cagcagcgtt tccccccaca gatttgttta tataatctgg aattgattac 1080
ttcgtactga gaatactttt acttgttcag caatttggag acatccaggc tcttcataca 1140
gcttgcaaga atcgtggttt tatcatggta tcctactatg atataagggc tgctcaaaat 1200
gcggcgagag cactccacaa taagctgtta agaggaacga aacttgatat tcgttattct 1260
atccctaagg tatgattcct tgtttttatg aaatatattg tctttgctct gtggacagta 1320
tttgtgactt atgttgattt gtatctatct tacaattttc ttggctccag gaaattcctt 1380
caggaaaaga cgccagtaaa ggagccctgt tgattactaa tattgattcg tctatttcaa 1440
atgaagaact caatcgaatg gtcaaatcgt atggagaaat caaagaggtt gatatattga 1500
gatgctccgt ttagttactt ttctgaggta gattctaatg atgtttctgt ggtttgcaga 1560
ttcgtagaac catgcacgat aacccacaga tatacataga attctttgac atccgagcgt 1620
cagaggctgc tcttggtggc ctgaatggac tcgaggttgc tgggaagcag cttaaacttg 1680
cgttaaccta tccagagagt caaaggtggg tgactggttg tttttttttt ctccctggtt 1740
tatattcctt tgtgggctgt gaatgaatac aaaatcctaa atcaaaatga tttgaacatg 1800
tgctttgctg ttaagtattt acgaggatgc cagttgtgtt gatgtatggg gttcacccat 1860
tcttttttct ttatttcagg tacatgtcac agtttgttgc acatgatgct gaagggtttc 1920
tacctaaaat gccttttact aatacatcat ctgggcacat gggtatgctt ttgcattcag 1980
catttgtaat tctttttttt attgaatgat ttgtcatctt gatactcaaa ccactgccgt 2040
taaatatctc tgtgtcaggg agacatttcc caggaataat tccttcaacc tccattgatg 2100
gtggacctat ggggattagt catagttctg ttggatcgcc tgtgaactcc ttcattgaac 2160
gtcataggag tctcagcatt cctattggat ttccaccttt ggcaaacgtc atctcagcca 2220
gcaagcccgg aattcaggag catgtccacc cttttgacaa ttcaaatatg gggatccaaa 2280
gcatgccaaa ccttcatcct cattcttttt cagagtacct cgacaacttt acaaatggta 2340
gtccatataa gtcctcgaca gcattttctg aagtcgtcag tgatggctcg aaagcaaatg 2400
atgcctttat gttacataat gttcgtggag tggatggctt taacggaggg ggtaagctct 2460
ttatctctaa attgctactg ttttgataaa tttgtcgaag aataatgatg atatgtagtt 2520
gacaattgtg agtttaagaa gaatgtctgc cgtagcacac tgttaggatg gtccttacaa 2580
ttttagtgga atctgaaatg tgctacagcg atgaaaattc taggtactgt ttctgtagac 2640
aacttttttt aaaagcattc ttggtgtaaa acttgtcatc ctgggaaaat attattagta 2700
ttatgttctt aattgcagtc atatagacag ataactgtgc tgggtttgaa attgaatttg 2760
aaagtggctg aaacattcgt tgtgtatgtc aacagaattg cacaattact gagtgctagt 2820
atttcttcta ctgtcataca taatattgtt tttttctttc tcacttttag ttgttgtggt 2880
cttttgactg taggcatagg gtctcccatg aaccaaaact cccgccgccc taaccttaat 2940
ttatggagca attctaacac tcagcaacaa aatccttcag gtggcatgat gtggcctagc 3000
tcgccgtctc acctcaacgg caaacgtcat ctcagccagc aagcccggaa ttcaggagca 3060
tgtccaccct tttgacaatt caaatatggg gatccaaagc atgccaaacc ttcatcctca 3120
ttctttttca gagtacctcg acaactttac aaatggtagt ccatataagt cctcgacagc 3180
attttctgaa gtcgttagtg atggctcgaa agcaaatgat gcctttatgt tacataatgt 3240
tcgtggagtg gatggcttta acggaggggg taagctcttt atctctaaat tgctactgtt 3300
ttgataaatt tgtcgaagaa taatgatgat atgtagttga caattgtgag tttaagaaga 3360
atgtctgccg tagcacacta ttaggatggt ccttacaatt ttagtggaat ctgaaatgtg 3420
ctacagcgat gaaaattcta ggtactgttt ctgtagacaa ctttttttaa aagcattctt 3480
ggtgtaaaac ttgtcatcct gggaaaatat tattagtatt atgttcttaa ttgcagtcat 3540
atagacagat aactgtgctg ggtttgaaat tgaatttgaa agtggctgaa acattcgttg 3600
tgtatgtcaa cagaattgca caattactga gtgctagtat ttcttctact gtcatacata 3660
atattgtttt tttctttctc acttttagtt gttgtggtct tttgactgta ggcatagggt 3720
ctcccatgaa ccaaaactcc cgccgcccta accttaattt atggagcaat tctaacactc 3780
agcaacaaaa tccttcaggt ggcatgatgt ggcctagctc gccgtctcac ctcaacagca 3840
ttactagtca gcgcccacct gttactgtat tctctagagc acctcctgtt atggtgaata 3900
tggcatcttc ccctgtgcac caccacattg gatctgcgcc cgtattaaac tcgcctttct 3960
gggatagaag acaagcctat gttgctgaat ctctagaatc gcctggcttc cacataggtt 4020
ctcatggtag catggggttt cctggctctt caccctcaca tccaatggaa attggttctc 4080
acaagtcctt ttcccatgtt gctgggaatc gcatggatat aaattcccaa aatgctgtac 4140
tgcgatctcc ccaacagttg tctcatctct tccccgggag gaacccaatg gtttcaatgc 4200
cgggttcgtt tgactcgcct aatgaacgat acaggaatct ctcacaccgt agaagcgagt 4260
ctagctctag tcatgctgac aagaaactgt ttgagcttga tgttgaccgt atattacgtg 4320
gggatgatgt caggacaaca ctgatgctta aaaacattcc taataagtaa gtggattcag 4380
tgtctttcct ttattccttg ttatatatct tttgttagct tcgtaggttg tttgatgttt 4440
tccttttcaa ttctgaactc tataaaatgc tgctatggtt taggtatact tctaagatgc 4500
ttctctccgc cattgacgag cattgtaaag gaacgtatga tttcctttat ttgccaattg 4560
atttcaaggc aagcaggcgt ccgtcctacc tttttatata atagtcttat gtagaaaatg 4620
ggcttttggt atttgcaata tcagtatttt tttgctaacc taattttacc ttctcgtttc 4680
agaacaaatg caatgtggga tacgctttca tcaaccttat tgaacctgaa aagattgtac 4740
cattttataa ggtacagcca gccttttctg ttgctgcttt ttatatattt tttggctttt 4800
tctcttgaag agcattggtt aaaagtttaa aaaaaacttg caggctttta atggaaaaaa 4860
gtgggaaaag tttaacagcg agaaggtggc aactcttaca tatgctcgaa ttcaaggaaa 4920
agtagcactt attgcccatt tccagaactc aagcttaatg aacgaagaca aacgttgccg 4980
gcctattctt ttccacaccg atggtccaaa tgctggtgat caggtgaatg ttactaacac 5040
atcagataac atcatcttgt tagggttctc atttcgtagt agttgctcaa tttcgctctc 5100
cctttggttg cacatattga aatgggttct tagtgagatc tcataagttc aaagatgtgg 5160
tgatgctcag ttactcaata agagattgat ttgtttcata tttgtcacct ttgttgttat 5220
tatttgcagg aaccatttcc aatgggaacc aacatacgat caagaccagg aaagccacga 5280
agcagtagca ttgataacca caacggcttt agcatcgctt ccgtttcaga aaacagagaa 5340
gaacctccta atggaaccga tcctttcttg aaggagaact aaccaatgag caaaaaaacc 5400
aagcagaggt aaaagaaagt taaggaaaaa tgaagagcta aagatataac acaagtttta 5460
tattattata atcatatcat cagcacaccc tagagttctg taaatcgggg gtgttaaatt 5520
taccctgaca aaactgtttt tgcggtgaag atatattttt ggagagatca ttaaactttg 5580
ttgacctcaa accttcacag gttgcttcac cagttttgtt gtattatcaa atatcccctg 5640
agaaatatct tcgagagttt ctctttactt tttgtttttt tttttgtctt gtttggggtt 5700
attcaagtat ttttgtcttc ttgctatcga tgtagtatgt aacaagcctt ggatttacat 5760
tcaacgtctt tgctggctat ttgtggccat ttcatgttgt aacttttttg gagattttaa 5820
tgaatgcttc ctttttggat aaa 5843
<210> 27
<211> 2619
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> OML4启动子序列(甘蓝型油菜)
<400> 27
agtaattaat attcttttcg ttccacaaat ataatttttt tagtattttc acacatatta 60
agaaaacacg ctaaactacc ataataaatg tattgtttta tgtaattttc aattttcaat 120
aacttttaac caatagtaat tcaataaagt caattaattt ctttgaaatt tacaaatttt 180
tcatagaaaa cacaaaaata catatttgtg aaacaaactt tttcaaaaaa gtctatcttg 240
atgaaacgga tggagtatta tgtataatat ttttattata tattttattg ctaaataaaa 300
attttatgac ttttgtttac tttttcacca ataaaagact ataatgcaaa atgtaaaata 360
tttaaagttt aatttgaagt tgttatttcg gaaataatca ccttcgaagt ttaaatttgt 420
aatattgcaa actttatttg gagatgtttt cacggtcgac ttgctacatg actctttttt 480
ttttgtagca tgctacatga ccctctattc ttttttttcc cctatttatt gttactttac 540
aattgaaata ataaggcaaa atacaatagt ggatgacttt tttccccata ccaccttttt 600
cggttttctc tatttggttg ttcgaacctg cacatgctca tttgatagcg tggaaggatt 660
ggccatcaaa caaataaaaa ttcacaatca aggatattta ttatcagttt ttgttgttgt 720
gcacttcatt gtaaaataaa aaaaatccaa acacggatga taacaaccgt ggatcacgag 780
taaactaatt cactcagtca taaaaagaaa gagatatagt gagcaaaaaa tcattttaag 840
atagtattga tccaaccaac caaacattat cttcaaaaat tacaatgttt ttacgacagt 900
tgataaaaaa aaagcttatt tagtaaacat aaaaactatg gagtagtttt ttttgtaaac 960
acaaactata gtttcagact ttgttttgta ttctttcaac aaagagtgta actataaaaa 1020
cattcttatc aacttttcgc tcaagttgtt acagaaaaaa acttaatcaa gaattaaaat 1080
gacacttata aaattatcaa tataataaaa ttattaattt atagaggtta tatcaattaa 1140
aaactaacaa cttttattcg tgttttcatt catatataat agtaaagtgt aatttcctaa 1200
cttcatttga acatattcta ataaatagtt tgtagattaa aaacaaatca cactttgaaa 1260
agaaaaaaaa atcaaatagt ccacatgttc aataaatagg ctgctccttg gttacaaaac 1320
cgcgctcatc gactgctcgc tgccgtcgag actctcgtgt gagaccgtaa tttttgtcag 1380
ttttagttat aatctacggt ccagatttaa tatcgtacga aaccactaga tccacgatac 1440
atccaacaca gaagagtgct ctcctctcct caactctatt ttgttttttt cctctcattc 1500
tttttttagt cgaaactcta aaccaactaa ccgaaaaaaa caaaaaactc tttctctcct 1560
ctccatttct ctctctagga gagacaaccg gaatcgcacg tcgacgggaa gagtatcgcc 1620
ggaactatta taattaccgc cggtcgcata gattattcgt tggaaacaac gcgtcgtgag 1680
aggagaggaa attcgaaaaa aagaagaaaa aaattagaaa caccgattca cttttttttt 1740
gggggttatt ttaattgatt tgtgtgaatt aaatattctg cgatggatgt gattggatag 1800
aaggaaacaa aaaggaaagg aggaagataa aagagaaggc gaattattct gctcctctct 1860
ctctctctct ctctttcttc tctgtcgaac atcgctgttg ctgctgtgtg ttttcttcgt 1920
gcatcctttt atttttcaag gtaatgaatt tcacgagatc cattcttcac aagtttcttt 1980
ctttttttaa atttaattta atttagtgga aaaaatgttt gggaggaagc gtaattgtgt 2040
ttgtttgtaa attaggtaag ctctttgtat ttgttttttt atttgctggt gagtaattta 2100
ggtttatttt cttaaattaa gttaaactgg gtgcccaagt ttgtgaatta ggtaggagtt 2160
ggttccctgt ttgcatataa tgagctgaac aaggatcatg aattaggcga aattgtagtc 2220
tcttatggct ttttgaaata cctaatcttt gtcttccagg tgtttctact ccgctttaaa 2280
ggagagaggt ttaagatgat ttttttcgta ttgaacttct tcttagagta cgtaaagttg 2340
ctgactttgt ttggatttag ggtttgattt tgcttagttc taattgaatt cttgtgttgt 2400
ttttttttgt gtcctttgag ttattttgct taatcttttt tgtctggcaa gatccttctt 2460
tgcaatgaat agtggatttt gtttcttttg gagacttact ggctttgaat ctaaaactgg 2520
ttgttcatct ttcaggggaa gtgatatggt ccgttgaaaa agactaaaaa gctacaaaag 2580
agattttgtt ttattattcc aaattttgct gtcatctgc 2619
<210> 28
<211> 410
<212> PRT
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> GSK2氨基酸序列(甘蓝型油菜)
<400> 28
Met Thr Ser Leu Ser Leu Gly Pro Gln Pro Pro Ala Thr Ala Gln Pro
1 5 10 15
Pro Gln Leu Arg Asp Gly Asp Ala Ser Arg Arg Arg Ser Asp Met Asp
20 25 30
Thr Asp Lys Asp Met Ser Ala Ala Val Ile Glu Gly Asn Asp Ala Val
35 40 45
Thr Gly His Ile Ile Ser Thr Thr Ile Gly Gly Lys Asn Gly Glu Pro
50 55 60
Lys Gln Thr Ile Ser Tyr Met Ala Glu Arg Val Val Gly Gln Gly Ser
65 70 75 80
Phe Gly Ile Val Phe Gln Ala Lys Cys Leu Glu Thr Gly Glu Ser Val
85 90 95
Ala Ile Lys Lys Val Leu Gln Asp Arg Arg Tyr Lys Asn Arg Glu Leu
100 105 110
Gln Leu Met Arg Leu Met Asp His Pro Asn Val Val Ser Leu Lys His
115 120 125
Cys Phe Phe Ser Thr Thr Ser Arg Asp Glu Leu Phe Leu Asn Leu Val
130 135 140
Met Glu Tyr Val Pro Glu Thr Leu Tyr Arg Val Leu Lys His Tyr Thr
145 150 155 160
Asn Ser Ser Gln Arg Met Pro Ile Phe Tyr Val Lys Leu Tyr Thr Tyr
165 170 175
Gln Ile Phe Arg Gly Leu Ala Tyr Ile His Thr Val Pro Gly Val Cys
180 185 190
His Arg Asp Val Lys Pro Gln Asn Leu Leu Val Asp Pro Leu Thr His
195 200 205
Gln Cys Lys Leu Cys Asp Phe Gly Ser Ala Lys Val Leu Val Lys Gly
210 215 220
Glu Ala Asn Ile Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala Pro Glu
225 230 235 240
Leu Ile Phe Gly Ala Thr Glu Tyr Thr Ser Ser Ile Asp Ile Trp Ser
245 250 255
Ala Gly Cys Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Leu Phe Pro
260 265 270
Gly Glu Asn Ser Val Asp Gln Leu Val Glu Ile Ile Lys Val Leu Gly
275 280 285
Thr Pro Thr Arg Glu Glu Ile Arg Cys Met Asn Pro Asn Tyr Thr Asp
290 295 300
Phe Arg Phe Pro Gln Ile Lys Ala His Pro Trp His Lys Val Phe His
305 310 315 320
Lys Arg Met Pro Pro Glu Ala Ile Asp Leu Ala Ser Arg Leu Leu Gln
325 330 335
Tyr Ser Pro Ser Leu Arg Tyr Thr Ala Leu Glu Ala Cys Ala His Pro
340 345 350
Phe Phe Asn Glu Leu Arg Glu Pro Asn Ala Arg Leu Pro Asn Gly Arg
355 360 365
Pro Leu Pro Ala Leu Phe Asn Phe Lys Gln Glu Leu Ala Gly Ala Ser
370 375 380
Pro Glu Leu Ile Asn Arg Leu Ile Pro Glu His Ile Arg Arg Gln Met
385 390 395 400
Ser Gly Gly Phe Pro Ser Gln Pro Gly His
405 410
<210> 29
<211> 4412
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> GSK2核酸序列(甘蓝型油菜)
<400> 29
atgacatcac tatcattggg ccctcagcct ccggctactg ctcagccgcc gcagcttcgc 60
gacggagatg cttccaggcg tcgttccgat atggatacag acaaggttgc tctctccctc 120
tctctctctc tctctctctc tactttaacg tttggtgaac aaattgcatt tcgattgcgt 180
ttggtggcta ttgtagatct cggctagatc tagcttcgat ttcacttttt ttttgcggtt 240
tctcagcgaa tcgatctgtg ttttctcttg ctatcgtcgt agttcgtagt tcgtagtagc 300
tagctagtct tactattcag ctgaatgttt caaccaatca tattgaagat cttgagctat 360
gttttgatta ctagtattag ggtgaagaac attggttctc tctgggtttg aaattcgatt 420
tcacagacga tgtagatctt aattactaga ttgtttaact aatcacacac ttgttccatg 480
actgtaagtg atttgatgta ttggatttac atttgtttgt tatctacgtg attggactct 540
gagctaggcc ttgactgttc ttggatttga agatttcata tgtttaaaga atggttttgt 600
ctattgattg tttcgtaatc tcatgtttgt tgttttcagg agaagagcac tatttttttt 660
tttaatcagt tttctttgtt ctttcttgac gagaatagtt tgatgatatg ttgaggtttg 720
gttgcaggat atgtctgctg ctgtgataga gggaaacgat gctgttacag gccacatcat 780
ttctactaca attggaggca aaaacggtga acctaaacag gtttgagttc ctttctttgt 840
ttgaaatctt caaatgtcat aattagtaac attgttaatg attacattta atcatatgtt 900
cacttgcttt tccacttaca gcttaaaaca ataactaaac agagactctt tgtggttcat 960
ttattacaac tttaagtagg ctactcactt atgttttact ctttctgttt ttttgcagac 1020
catcagttac atggccgaac gggttgttgg acaaggatca ttcggaatcg tgttccaggt 1080
acctttgtgc ttctcaatca ctgttaccct ttgtaggcgg tagctttctt ctttcctttc 1140
tgatcgaagt atgaacttac cattgtaggc caagtgcttg gaaactggag aatcagtcgc 1200
cattaagaag gttttgcaag accggcgcta caagaatcgt gagctgcagt tgatgcgact 1260
aatggaccac ccaaatgtgg tttccttgaa gcattgtttc ttctctacaa cgagtagaga 1320
tgagctcttc ctcaatctcg ttatggagta tgtacccgag actttgtacc gggttttgaa 1380
gcactatact aattcaagcc agagaatgcc tattttctat gtcaaactct acacatacca 1440
agtatgcatt gttattatgt gtttcccttt caggcagtat ctctctttgt tgattctaaa 1500
acgggtaaga atactttttt tctgcagatc ttcagaggct tggcttatat ccatactgtt 1560
cctggtgtct gtcacagaga tgtgaaacca caaaatcttt tggtacgttg attctatttt 1620
gggtttgtct ttgataatct tgatagattg ttaactaatt ctcttgtacg ttctgcaggt 1680
tgatcctctc actcatcagt gtaagctgtg tgattttgga agtgcaaaag tattggtaag 1740
gagctttacc tttaatatcc tgctttgctt atttcaactg tgtatgtgtt ctgtctcatg 1800
aaatctttgc gacacatgat tattcggatt aggtgaaagg tgaagcaaac atatcataca 1860
tttgctctcg gtattaccga gctccagagc tcatctttgg ggccacagag tatacatcct 1920
ccatagacat atggtctgct ggttgtgttt tggcagagct ccttcttggc caggttagtg 1980
taaactattt tatctgttta actctagaat gttccgctat catttttgat atttataatt 2040
ttttatctgt cagccgttgt tcccgggaga aaattctgtg gaccagctgg tagagatcat 2100
caaggtgaag tttcattttg atcatatgtt atcttgctgt cgtattctgt tttgtatata 2160
aaattcatat aatcttatag atttgtaatg atatatgtgc tgcgtttgtt taggttcttg 2220
gtactccaac tcgagaagaa atccgatgca tgaatccaaa ctacacagac ttcagattcc 2280
ctcaaatcaa agctcacccg tggcataagg tatttatatg catgtccgat catacagtgg 2340
ctaaatagtt gaatcgcttc tcattatatt cgtataaatg aaaaactaaa caaattcaca 2400
tacttctctc tgaccttcag gttttccata agaggatgcc tccagaagcc attgacctcg 2460
catctcggct tcttcaatac tcaccgagcc tgcgttacac tgcggtcagt atctctaaac 2520
caccaagtac tcttaattgt taagagtgtt ctctctggat tcattggacc tgcactgcac 2580
tgtccaatgt tgctgatgtt ttcttttaac tgacattttt ttgttgtttc tgtgtaaaag 2640
cttgaagcat gtgcacatcc atttttcaat gaactccgtg agccgaatgc tcgtcttcct 2700
aacggccgac ctctaccagc cttgttcaac ttcaaacaag aggtacgtca atcacagcaa 2760
aaaaaaaaaa agtaatatag ctccaaacca ttactagaat gttcagtttt aaacagttgc 2820
ctaatctgta atctctctct ctattcgaat gttcataaca gttagctggg gcttcaccag 2880
agctgataaa caggctcata ccggagcaca taaggcgaca gatgagtgga ggcttcccat 2940
cacagcctgg tcattagaaa aggaatatgg aaactgggat gcttttgcgg agcaaatgcc 3000
ttatggaaaa gaggagagaa gatctctgat ttttcagagg gtttaactaa aatatcagct 3060
tatgagtaga gagatgattg gccaattaag ctttttgaga aatcaggagg tggtgatgat 3120
tgtgtctaat atacaattct ctcttttctc tttttatgtt ataattcgct tttgacttgt 3180
agagatacct tttctcgttg tattatttgt atatgttttt gtccgtaaga cagcaaaccg 3240
cgatgatgga agaatggaat gaatgaatga tgtctaaaac ttaagcctaa taacaaggtc 3300
ggagctcata catatatata aagttagaat gtgagagctc catgttaaaa taaccttaac 3360
attggcacgt gaatacaatt gcatgattga atttctggta cgtcgagagg aagtaagttt 3420
atagaaagtt gtttgtgaac aaacaaatgg agaaacattt gttttgttgc aaagaaacgt 3480
atggttccat aatgtagaag aggcatttga atgtgagctt taaaaccttt catgaaagaa 3540
aaggaaagtt atgggtcact aaccggaaaa tatatcattt gaaatgtgta taaaacttaa 3600
tgggctgaaa actgtagata aggaattccg gattctggga accctattaa ctgagccaca 3660
agcaaagata cgaggaccaa accctaaatc ttctctcttt ttttccccct cattcaggtg 3720
tttttcatta gtcacattcg ttctttatac ttttattatc tttgattgtt aatagattgt 3780
ctgaaaacgc atgtccactt gtttctgttt tatttgtttt tttcttttgc tgcaggcttt 3840
ggaagtccac actaaggtga aacaactctc cctaatctat acgcctttca cctctttccc 3900
cgcctttgat cctttgagag tttttttttc tttttttttt ttgaaaattc aaattttatt 3960
caacctgaga atcgggaaat catattcggt tacaaatccg ctttgaacaa aagttccaaa 4020
atcaaactat tactatcttt gcccactcac taaacctgac acattctgct agcctgtttt 4080
tcgaaattct tcagaatcgg ttgccgttct aaacttttga cgaaacccag aggactcctt 4140
gttgctgcag atgccgggac ttcctatgtc gtctccggag tagctagttc ccgatgaact 4200
ccacaaaact cataaccgtc aatgtctatg aagcgcttga cggttcaata ggggatggtt 4260
tcaggtactt acgattagag gctttgcaac caccaccaaa accgggcttg tacacaaacg 4320
ccacacagcg ctcgaaaccg aatcccaaac cgggcaagcg cccgctactg ccgccactaa 4380
accaaccttc aagaaagcgg gccgattttg ct 4412
<210> 30
<211> 2777
<212> DNA
<213> 甘蓝型油菜(Brassica napus)
<220>
<223> GSK2启动子序列(甘蓝型油菜)
<400> 30
atgcgttcta agtatcaaga tcctattact actactacta caccttgtaa tgagaatcat 60
aaggtgaaga taaatggatc ttctactcca gaagggaaag agagactaga gaacttgagc 120
tcagcttcac gcactaaaac cagcaaaaac tttggtgagc tcttggctag tgatgacaat 180
acatgggaac cttattctga ggctcctgtt gctgagaaaa ctctgtatgt agacactgtg 240
cattcagtac acaagaaggt acaagaagag tctttattaa aagattaccc ttcactagaa 300
gttgttcctg ttaaagaaga tgttcagaac ttgattggag ccagtgaaga agctatctca 360
ggtctaaaag ttgaagaatg tgctgatcaa gctatttctg aagtagtaga gattacaaag 420
gattttgaat gttcaaggct tcatcatcat cacattgttg caccaccatc attgccaaaa 480
gctccttcag attcttggtt aaagcgtacg ttgccaacaa tcccatcaaa gaacaactca 540
ttcacatggt tgcagtctct tggcattgat gataataata atcaaatcac caagagtatt 600
caagaaaatc tcaagtggga aactatggtc aaaacctcca atacacaaca agggtttgtg 660
tgcatctcca aggtaagcta atgtgtattt ttcaaagtca atggttggcc aaatgttttt 720
gttttttttt ttgtttttga caagttgatt agcttacttt gttgaccatt atttttgtct 780
ttcaggacac actcaaccct ataccagagg catagcaata ccaaattaca agtaaatttc 840
aacaataaaa aaaggatgag ccaataaagt tttgtttttg ttcatcttcc aaattttctc 900
ctctttaatt atatgtaaat ctgaaataaa aggttcctaa aaagagaaaa gctatggaga 960
tgaaataaaa ggtctcaaat attgtctgtc acttgtgggg tttggggggg ggtcttattg 1020
aagtgatgta cagctcatgt taacagagat tttgttgcaa taatactcca taattccatg 1080
tgacattgtt tcttttgacc ttctttatat attctctgct agtaatagac tttttgtttt 1140
gttcttttgt aattatgttt ctgtaatgta gagcactaaa gagacctgaa aactgcagaa 1200
ctcaattgaa tgcattggct aaatggttat gagaggaatt attgaaacaa tttatggtgt 1260
gagaagttca aatattattc tctttatagt gtcatggata gatcagatat agttcaggag 1320
aaagtaaaga aagaaaaaaa aactttataa aggtatcttc attagttaag atatacatga 1380
aagaaactgc tgctttagga gatgttttgt tgatcttcat gattcttcta tctttatcac 1440
ttgtatgatt gtatccatgg cggtttttgc ttgcttcaaa aacaagaaag agaagaatgg 1500
ttcctgtagc tgtggcagtt gttggtggct gcggttgtgg tggtggaggc tgcgtttagt 1560
attacacaaa tgagatatat cttggtcctt ggcgagtttc ctggtaatga ttttggttta 1620
gagcatcttt atccgggtat accaaagggt ttcttagcct gtgggtcccg tgtaggaccc 1680
atttttttta agaaatcggt tacaaaaact actaaatagt agtcggttat taagggtttc 1740
ttacactgtt cgcggacccc gctaacacgt gacggctaac gattggttca tttttttttt 1800
ttaaattcga aaaagtaaaa aaaataaaat aaaaaaaatt aggaaactct atttggagtt 1860
tcagggataa tgatgctatt aggtcttcac cgattgtgac tgatttactt aagcagccat 1920
tctatatata gtttacatta cgtacatata gaacaaaaat atatacataa aatatcagat 1980
aaattcagaa tcaaatatat atgcgatatg tttttgtaaa ttatttgttc aaattttcaa 2040
gtctacaaat aatgagtcac aaaacaaaat ataccaagaa atggattgcg atcgtccatg 2100
tgatacatcc agggccctct aagactttta aacgtatctc gtattgaacc aaatgttaaa 2160
accccgttga aaaggtagcc atcttgctcg tataaacgaa aattttcata gatggtaggg 2220
ggtgattggt tgaactgtag caagtgactt taactttaat ttttatctac agttttaaaa 2280
accatcaatc gtgctttata ttagttttta aagctaccac caaaaaataa aaagtacagc 2340
caaaaaaaca aaaaaaaaaa taactgtaaa aaatttaatt tctaaagctc catttttttg 2400
gatgtaggaa attttaaagc tctgttcacg cgtgggccat ccttttcaaa catactatac 2460
tagttgttat ttgttaccca aaatgtaaat acatgctatg tccttactag gcagtatata 2520
gaaattagtt tgttttaatg aatctggaac aatactaact tcaataatta attgcaaggt 2580
tatccaccct tgactgatga ggaggttagt cgcgttctca ttggtgcgtt actcttacgc 2640
gctctatcga cgcgtggacg atatccgaag ctcttttaat aatacaaaga gagagagaga 2700
gagaagggaa agatagtctt tactcttcag tggtgggtag agagcgaaag ttagagaaag 2760
agagagaaga atagcac 2777
<210> 31
<211> 410
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> GSK2 RNAi序列
<400> 31
tcccaggtga acccaatata tcatatatat gctcacgcta ctaccgagca ccggagctca 60
tatttggtgc aactgaatat actacatcaa tagatatatg gtcagctggg tgtgttcttg 120
cagagctact ccttggtcag ccattgtttc caggggagag tgcagtcgat cagcttgtag 180
agataattaa ggttcttggt acaccaaccc gtgaggaaat acgttgcatg aacccgaact 240
atacagagtt taggtttcca cagataaaag ctcacccttg gcacaaggtt ttccacaaga 300
ggatgcctcc tgaagcaata gacctcgctt cacgccttct tcaatattca ccgagtctcc 360
gctgcactgc tcttgatgca tgtgcacatc ctttctttga tgagctgcga 410
<210> 32
<211> 4206
<212> DNA
<213> 细菌 <原核生物>
<220>
<223> CAS9核酸序列
<400> 32
atggctccta agaagaagcg gaaggttggt attcacgggg tgcctgcggc tatggataag 60
aagtacagca ttggtctgga catcgggacg aattccgttg gctgggccgt gatcaccgat 120
gagtacaagg tcccttccaa gaagtttaag gttctgggga acaccgatcg gcacagcatc 180
aagaagaatc tcattggagc cctcctgttc gactcaggcg agaccgccga agcaacaagg 240
ctcaagagaa ccgcaaggag acggtataca agaaggaaga ataggatctg ctacctgcag 300
gagattttca gcaacgaaat ggcgaaggtg gacgattcgt tctttcatag attggaagaa 360
agtttcctcg tcgaggaaga taagaagcac gagaggcatc ctatctttgg caacattgtc 420
gacgaggttg cctatcacga aaagtacccc acaatctatc atctgcggaa gaagcttgtg 480
gactcgactg ataaggcgga ccttagattg atctacctcg ctctggcaca catgattaag 540
ttcaggggcc attttctgat cgagggggat cttaacccgg acaatagcga tgtggacaag 600
ttgttcatcc agctcgtcca aacctacaat cagctctttg aggaaaaccc aattaatgct 660
tcaggcgtcg acgccaaggc gatcctgtct gcacgccttt caaagtctcg ccggcttgag 720
aacttgatcg ctcaactccc gggcgaaaag aagaacggct tgttcgggaa tctcattgca 780
ctttcgttgg ggctcacacc aaacttcaag agtaattttg atctcgctga ggacgcaaag 840
ctgcagcttt ccaaggacac ttatgacgat gacctggata accttttggc ccaaatcggc 900
gatcagtacg cggacttgtt cctcgccgcg aagaatttgt cggacgcgat cctcctgagt 960
gatattctcc gcgtgaacac cgagattaca aaggccccgc tctcggcgag tatgatcaag 1020
cgctatgacg agcaccatca ggatctgacc cttttgaagg ctttggtccg gcagcaactc 1080
ccagagaagt acaaggaaat cttctttgat caatccaaga acggctacgc tggttatatt 1140
gacggcgggg catcgcagga ggaattctac aagtttatca agccaattct ggagaagatg 1200
gatggcacag aggaactcct ggtgaagctc aatagggagg accttttgcg gaagcaaaga 1260
actttcgata acggcagcat ccctcaccag attcatctcg gggagctgca cgccatcctg 1320
agaaggcagg aagacttcta cccctttctt aaggataacc gggagaagat cgaaaagatt 1380
ctgacgttca gaattccgta ctatgtcgga ccactcgccc ggggtaattc cagatttgcg 1440
tggatgacca gaaagagcga ggaaaccatc acaccttgga acttcgagga agtggtcgat 1500
aagggcgctt ccgcacagag cttcattgag cgcatgacaa attttgacaa gaacctgcct 1560
aatgagaagg tccttcccaa gcattccctc ctgtacgagt atttcactgt ttataacgaa 1620
ctcacgaagg tgaagtatgt gaccgaggga atgcgcaagc ccgccttcct gagcggcgag 1680
caaaagaagg cgatcgtgga ccttttgttt aagaccaatc ggaaggtcac agttaagcag 1740
ctcaaggagg actacttcaa gaagattgaa tgcttcgatt ccgttgagat cagcggcgtg 1800
gaagacaggt ttaacgcctc actggggact taccacgatc tcctgaagat cattaaggat 1860
aaggacttct tggacaacga ggaaaatgag gatatcctcg aagacattgt cctgactctt 1920
acgttgtttg aggataggga aatgatcgag gaacgcttga agacgtatgc ccatctcttc 1980
gatgacaagg ttatgaagca gctcaagaga agaagataca ccggatgggg aaggctgtcc 2040
cgcaagctta tcaatggcat tagagacaag caatcaggga agacaatcct tgactttttg 2100
aagtctgatg gcttcgcgaa caggaatttt atgcagctga ttcacgatga ctcacttact 2160
ttcaaggagg atatccagaa ggctcaagtg tcgggacaag gtgacagtct gcacgagcat 2220
atcgccaacc ttgcgggatc tcctgcaatc aagaagggta ttctgcagac agtcaaggtt 2280
gtggatgagc ttgtgaaggt catgggacgg cataagcccg agaacatcgt tattgagatg 2340
gccagagaaa atcagaccac acaaaagggt cagaagaact cgagggagcg catgaagcgc 2400
atcgaggaag gcattaagga gctggggagt cagatcctta aggagcaccc ggtggaaaac 2460
acgcagttgc aaaatgagaa gctctatctg tactatctgc aaaatggcag ggatatgtat 2520
gtggaccagg agttggatat taaccgcctc tcggattacg acgtcgatca tatcgttcct 2580
cagtccttcc ttaaggatga cagcattgac aataaggttc tcaccaggtc cgacaagaac 2640
cgcgggaagt ccgataatgt gcccagcgag gaagtcgtta agaagatgaa gaactactgg 2700
aggcaacttt tgaatgccaa gttgatcaca cagaggaagt ttgataacct cactaaggcc 2760
gagcgcggag gtctcagcga actggacaag gcgggcttca ttaagcggca actggttgag 2820
actagacaga tcacgaagca cgtggcgcag attctcgatt cacgcatgaa cacgaagtac 2880
gatgagaatg acaagctgat ccgggaagtg aaggtcatca ccttgaagtc aaagctcgtt 2940
tctgacttca ggaaggattt ccaattttat aaggtgcgcg agatcaacaa ttatcaccat 3000
gctcatgacg catacctcaa cgctgtggtc ggaacagcat tgattaagaa gtacccgaag 3060
ctcgagtccg aattcgtgta cggtgactat aaggtttacg atgtgcgcaa gatgatcgcc 3120
aagtcagagc aggaaattgg caaggccact gcgaagtatt tcttttactc taacattatg 3180
aatttcttta agactgagat cacgctggct aatggcgaaa tccggaagag accacttatt 3240
gagaccaacg gcgagacagg ggaaatcgtg tgggacaagg ggagggattt cgccacagtc 3300
cgcaaggttc tctctatgcc tcaagtgaat attgtcaaga agactgaagt ccagacgggc 3360
gggttctcaa aggaatctat tctgcccaag cggaactcgg ataagcttat cgccagaaag 3420
aaggactggg atccgaagaa gtatggaggt ttcgactcac caacggtggc ttactctgtc 3480
ctggttgtgg caaaggtgga gaagggaaag tcaaagaagc tcaagtctgt caaggagctc 3540
ctgggtatca ccattatgga gaggtccagc ttcgaaaaga atccgatcga ttttctcgag 3600
gcgaagggat ataaggaagt gaagaaggac ctgatcatta agcttccaaa gtacagtctt 3660
ttcgagttgg aaaacggcag gaagcgcatg ttggcttccg caggagagct ccagaagggt 3720
aacgagcttg ctttgccgtc caagtatgtg aacttcctct atctggcatc ccactacgag 3780
aagctcaagg gcagcccaga ggataacgaa cagaagcaac tgtttgtgga gcaacacaag 3840
cattatcttg acgagatcat tgaacagatt tcggagttca gtaagcgcgt catcctcgcc 3900
gacgcgaatt tggataaggt tctctcagcc tacaacaagc accgggacaa gcctatcaga 3960
gagcaggcgg aaaatatcat tcatctcttc accctgacaa accttggggc tcccgctgca 4020
ttcaagtatt ttgacactac gattgatcgg aagagataca cttctacgaa ggaggtgctg 4080
gatgcaaccc ttatccacca atcgattact ggcctctacg agacgcggat cgacttgagt 4140
cagctcggtg gcgataagag acccgcagca accaagaagg cagggcaagc aaagaagaag 4200
aagtga 4206
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对OML4的CRISPR靶序列
<400> 33
gtgggttccg gcaacctcaa tgg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对GSK2的CRISPR靶序列
<400> 34
aggggaatga cgcggtgacc ggg 23
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对OML4的CRISPR前间隔序列
<400> 35
gtgggttccg gcaacctcaa 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 针对GSK2的CRISPR原间隔子
<400> 36
aggggaatga cgcggtgacc 20
<210> 37
<211> 77
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> OML4 RNA识别基序1
<400> 37
Ser Arg Thr Leu Phe Val Arg Asn Ile Asn Ser Asn Val Glu Asp Ser
1 5 10 15
Glu Leu Lys Leu Leu Phe Glu His Phe Gly Asp Ile Arg Ala Leu Tyr
20 25 30
Thr Ala Cys Lys His Arg Gly Phe Val Met Ile Ser Tyr Tyr Asp Ile
35 40 45
Arg Ser Ala Leu Asn Ala Lys Met Glu Leu Gln Asn Lys Ala Leu Arg
50 55 60
Arg Arg Lys Leu Asp Ile His Tyr Ser Ile Pro Lys Asp
65 70 75
<210> 38
<211> 71
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> OML4 RNA识别基序2
<400> 38
Gln Gly Thr Ile Val Leu Phe Asn Val Asp Leu Ser Leu Thr Asn Asp
1 5 10 15
Asp Leu His Lys Ile Phe Gly Asp Tyr Gly Glu Ile Lys Glu Ile Arg
20 25 30
Asp Thr Pro Gln Lys Gly His His Lys Ile Ile Glu Phe Tyr Asp Val
35 40 45
Arg Ala Ala Glu Ala Ala Leu Arg Ala Leu Asn Arg Asn Asp Ile Ala
50 55 60
Gly Lys Lys Ile Lys Leu Glu
65 70
<210> 39
<211> 86
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> OML4 RNA识别基序3
<400> 39
Leu Met Ile Lys Asn Ile Pro Asn Lys Tyr Thr Ser Lys Met Leu Leu
1 5 10 15
Ala Ala Ile Asp Glu Asn His Lys Gly Thr Tyr Asp Phe Ile Tyr Leu
20 25 30
Pro Ile Asp Phe Lys Asn Lys Cys Asn Val Gly Tyr Ala Phe Ile Asn
35 40 45
Met Thr Asn Pro Gln His Ile Ile Pro Phe Tyr Gln Thr Phe Asn Gly
50 55 60
Lys Lys Trp Glu Lys Phe Asn Ser Glu Lys Val Ala Ser Leu Ala Tyr
65 70 75 80
Ala Arg Ile Gln Gly Lys
85
<210> 40
<211> 71
<212> PRT
<213> 水稻(Oryza sativa)
<220>
<223> large1-1氨基酸序列
<400> 40
Met Pro Ser Gln Val Met Asp Gln Arg His His Met Ser Gln Tyr Ser
1 5 10 15
His Pro Thr Leu Ala Ala Ser Ser Phe Ser Glu Glu Leu Arg Leu Pro
20 25 30
Thr Glu Arg Gln Val Gly Phe Trp Lys Gln Glu Ser Leu Pro His His
35 40 45
Met Gly Ser Lys Ser Val Ala Ser Ser Pro Ile Glu Lys Pro Gln Pro
50 55 60
Ile Gly Thr Arg Met Ala Asp
65 70

Claims (20)

1.一种增加植物的籽粒大小和/或粒重的方法,所述方法包括降低或消除Mei2样蛋白4(OML4)的表达和/或活性。
2.如权利要求1所述的方法,其中所述方法包括将至少一个突变引入至少一个编码OML4的核酸序列,其中优选地OML4核酸序列编码包含SEQ ID NO:1或其功能变体或同源物的多肽,和/或将至少一个突变引入OML4的启动子,其中所述OML4的启动子任选地包含如SEQ ID NO:3或其功能变体或同源物中定义的序列。
3.一种产生具有增加的籽粒大小和/或粒重的植物的方法,所述方法包括
将至少一个突变引入至少一个编码OML4多肽的核酸序列,其中OML4核酸序列优选地编码包含SEQ ID NO:1或其功能变体或同源物的多肽,和/或
将至少一个突变引入OML4的启动子,其中所述OML4的启动子任选地包含如SEQ ID NO:3或其功能变体或同源物中定义的序列。
4.如前述权利要求中任一项所述的方法,其中所述方法进一步包括降低或消除SHAGGY样激酶(GSK2)的表达和/或活性。
5.如权利要求4所述的方法,其中所述方法包括
将至少一个突变引入至少一个编码GSK2的核酸序列,其中所述编码GSK2的核酸序列优选地编码包含SEQ ID NO:4或其功能变体或同源物的多肽,和/或将至少一个突变引入GSK2的启动子,其中所述GSK2的启动子任选地包含如SEQ ID NO:6或其功能变体或同源物中定义的核酸序列。
6.如权利要求2至5中任一项所述的方法,其中所述突变是功能缺失或部分功能缺失突变。
7.如权利要求2至6中任一项所述的方法,其中使用靶向基因组修饰,优选ZFN、TALEN或CRISPR/Cas9或诱变,优选TILLING或T-DNA插入来引入所述突变。
8.如权利要求1或3所述的方法,其中所述方法包括使用RNA干扰来降低或消除OML4核酸序列或GSK2核酸序列的表达。
9.如前述权利要求中任一项所述的方法,其中所述植物是农作物,任选地选自水稻、小麦、玉米、大豆和芸苔属植物。
10.一种基因修饰的植物、植物细胞或其部分,其特征在于OML4的表达和/或活性降低或消除。
11.如权利要求10所述的基因修饰的植物,其中所述植物包含
在至少一个编码OML4基因的核酸序列中的至少一个突变,其中OML4核酸优选地编码如SEQ ID NO:1或其功能变体或同源物中定义的多肽,和/或OML4的启动子中的至少一个突变,其中所述OML4的启动子任选地包含如SEQ ID NO:3或其功能变体或同源物中定义的核酸序列。
12.如权利要求10或权利要求11所述的基因修饰的植物,其中所述植物进一步包含
在至少一个编码GSK2的核酸序列中的至少一个突变,其中GSK2核酸优选地编码如SEQID NO:4或其功能变体或同源物中定义的多肽,和/或GSK2的启动子中的至少一个突变,其中所述GSK2的启动子优选地包含如SEQ ID NO:6或其功能变体或同源物中定义的核酸序列。
13.如权利要求11或权利要求12所述的基因修饰的植物,其中所述突变是功能缺失或部分功能缺失突变。
14.如权利要求11至13中任一项所述的基因修饰的植物,其中使用靶向基因组修饰,优选ZFN、TALEN或CRISP/Cas9来引入所述突变,或其中使用诱变,优选TILLING或T-DNA插入来引入所述突变。
15.如权利要求14所述的基因修饰的植物,其中所述植物包含降低或消除OML4的表达的RNA干扰构建体。
16.如权利要求10至14中任一项所述的基因修饰的植物,其中所述植物是农作物,任选地选自水稻、小麦、玉米、大豆和芸苔属植物。
17.一种核酸构建体,其中所述构建体包含编码至少一种单向导RNA(sgRNA)的核酸序列,其中所述sgRNA序列包含选自SEQ ID NO:35和36或其变体的序列。
18.一种增加植物的粒数的方法,所述方法包括增加Mei2样蛋白4(OML4)的表达和/或活性。
19.如权利要求18所述的方法,其中所述方法包括在植物中引入和表达核酸构建体,其中所述构建体包含编码如SEQ ID NO:1或其功能变体或同源物中定义的OML4多肽的核酸序列。
20.一种基因修饰的植物、植物细胞或其部分,其特征在于OML4的表达和/或活性增加,其中所述植物优选为农作物。
CN202180011352.5A 2020-02-07 2021-02-08 控制籽粒大小和粒重的方法 Pending CN115135142A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2020/074530 2020-02-07
CN2020074530 2020-02-07
PCT/EP2021/052951 WO2021156505A1 (en) 2020-02-07 2021-02-08 Methods of controlling grain size and weight

Publications (1)

Publication Number Publication Date
CN115135142A true CN115135142A (zh) 2022-09-30

Family

ID=74595262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180011352.5A Pending CN115135142A (zh) 2020-02-07 2021-02-08 控制籽粒大小和粒重的方法

Country Status (6)

Country Link
US (1) US20230081195A1 (zh)
EP (1) EP4099818A1 (zh)
CN (1) CN115135142A (zh)
AU (1) AU2021216126A1 (zh)
CA (1) CA3167040A1 (zh)
WO (1) WO2021156505A1 (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016974A1 (en) * 1999-09-30 2007-01-18 Byrum Joseph R Nucleic acid molecules and other molecules associated with plants
WO2010086221A1 (en) * 2009-01-28 2010-08-05 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
CN103667314A (zh) * 2013-12-09 2014-03-26 中国科学院遗传与发育生物学研究所 来源于水稻的蛋白质OsMKK4及其相关生物材料在调控植物种子大小中的应用
CN110004163A (zh) * 2019-02-01 2019-07-12 中国农业科学院作物科学研究所 多基因编辑提高水稻抗旱性的方法
CN110484555A (zh) * 2018-05-10 2019-11-22 中国农业科学院作物科学研究所 具有多籽粒簇生性状的转基因水稻的构建方法
CN110526993A (zh) * 2019-03-06 2019-12-03 山东舜丰生物科技有限公司 一种用于基因编辑的核酸构建物
CN110603264A (zh) * 2017-03-24 2019-12-20 中国科学院遗传与发育生物学研究所 用于增加籽粒产量的方法
US20200008387A1 (en) * 2018-07-09 2020-01-09 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for improving plant variety

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016974A1 (en) * 1999-09-30 2007-01-18 Byrum Joseph R Nucleic acid molecules and other molecules associated with plants
WO2010086221A1 (en) * 2009-01-28 2010-08-05 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
CN103667314A (zh) * 2013-12-09 2014-03-26 中国科学院遗传与发育生物学研究所 来源于水稻的蛋白质OsMKK4及其相关生物材料在调控植物种子大小中的应用
CN110603264A (zh) * 2017-03-24 2019-12-20 中国科学院遗传与发育生物学研究所 用于增加籽粒产量的方法
CN110484555A (zh) * 2018-05-10 2019-11-22 中国农业科学院作物科学研究所 具有多籽粒簇生性状的转基因水稻的构建方法
US20200008387A1 (en) * 2018-07-09 2020-01-09 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for improving plant variety
CN110004163A (zh) * 2019-02-01 2019-07-12 中国农业科学院作物科学研究所 多基因编辑提高水稻抗旱性的方法
CN110526993A (zh) * 2019-03-06 2019-12-03 山东舜丰生物科技有限公司 一种用于基因编辑的核酸构建物

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
DANIEL C.JEFFARES等: "A description of the Mei2-like protein family;structure, phylogenetic distribution and biological context", 《DEVLOPMENT GENES AND EVOLUTION》, vol. 214, pages 149 - 158 *
JAGREET KAUR等: "The Arabidopsis-mei2-Like Genes Play a Role in Meiosis and Vegetative Growth in Arabidopsis", 《THE PLANT CELL》, vol. 18, no. 3, pages 545 - 559, XP055195387, DOI: 10.1105/tpc.105.039156 *
JIA LYU等: "Control of Grain Size and Weight by the GSK2-LARGE1/OML4 Pathway in Rice", 《THE PLANT CELL》, vol. 32, no. 6, pages 1905 - 1918 *
NA LI等: "Control of grain size in rice", 《PLANT REPRODUCTION》, vol. 31, pages 237 - 251 *
TIAN ZHANG: "When Less Is More: GSK2-OML4 Module Negatively Regulates Grain Size in Rice", 《THE PLANT CELL》, vol. 32, no. 6, pages 1781, XP055800736, DOI: 10.1105/tpc.20.00219 *
关亚丽等: "《植物基因克隆的方法与应用实践》", 30 June 2009, 中国科学技术出版社, pages: 1 - 2 *
李春俭: "《高级植物营养学》", vol. 2, 31 January 2015, 中国农业大学出版社, pages: 311 *

Also Published As

Publication number Publication date
EP4099818A1 (en) 2022-12-14
AU2021216126A1 (en) 2022-07-07
CA3167040A1 (en) 2021-08-12
WO2021156505A1 (en) 2021-08-12
US20230081195A1 (en) 2023-03-16

Similar Documents

Publication Publication Date Title
KR102607893B1 (ko) 지베렐린 대사의 조작을 통해 저신장 식물의 수확량을 증가시키기 위한 방법 및 조성물
AU2020223685B2 (en) Plant regulatory elements and uses thereof
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
AU2019276382B2 (en) Use of Yr4DS gene of Aegilops tauschii in stripe rust resistance breeding of Triticeae plants
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN115175556B (zh) 与大豆中锈病抗性相关联的新颖的遗传基因座
US20030093837A1 (en) Polynucleotides for seed trait alteration
CN101370938B (zh) 赋予植物调节的植物生长速率和生物量的核苷酸序列及相应多肽
CN107223155A (zh) 单倍体诱导系
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR20170116034A (ko) 성 결정 유전자들 및 육종에 이들의 이용
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101605902A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN111542610A (zh) 精确基因组编辑的新策略
CA2492136A1 (en) Nuclear fertility restorer genes and methods of use in plants
CN106471008B (zh) 棕榈Mantle表型检测
CN111295447A (zh) 玉米优良事件mzir098
US20020173017A1 (en) Wooden leg gene, promoter and uses thereof
CN101595222A (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN111100868B (zh) 美洲黑杨的促雌基因ferr和抑雌基因ferr-r及其应用
CN115867565A (zh) 用于改善对大豆锈病的抗性的方法
CN115135142A (zh) 控制籽粒大小和粒重的方法
RU2788379C2 (ru) Способы и композиции для увеличения урожайности низкорослых растений путем манипуляции метаболизма гиббереллина
RU2775653C2 (ru) Композиции и способы для изменения цветения и архитектуры растений для улучшения потенциальной урожайности
RU2820183C2 (ru) Устойчивость к растрескиванию стручков у растений рода brassica

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination