CN111825751B - 一个陆地棉芽黄基因vsp的克隆及其功能 - Google Patents

一个陆地棉芽黄基因vsp的克隆及其功能 Download PDF

Info

Publication number
CN111825751B
CN111825751B CN201910237791.2A CN201910237791A CN111825751B CN 111825751 B CN111825751 B CN 111825751B CN 201910237791 A CN201910237791 A CN 201910237791A CN 111825751 B CN111825751 B CN 111825751B
Authority
CN
China
Prior art keywords
cotton
sequence
leu
gly
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910237791.2A
Other languages
English (en)
Other versions
CN111825751A (zh
Inventor
喻树迅
毛光志
王寒涛
魏恒玲
张蒙
马强
胡伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Cotton Research of Chinese Academy of Agricultural Sciences filed Critical Institute of Cotton Research of Chinese Academy of Agricultural Sciences
Priority to CN201910237791.2A priority Critical patent/CN111825751B/zh
Publication of CN111825751A publication Critical patent/CN111825751A/zh
Application granted granted Critical
Publication of CN111825751B publication Critical patent/CN111825751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/825Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving pigment biosynthesis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明公开了一个陆地棉芽黄基因vsp的克隆及其功能。本发明公开的陆地棉芽黄基因vsp编码序列4的蛋白质,其CDS序列为序列表中序列5,基因组DNA序列为序列表中序列6;该基因在野生型棉花中编码序列1的蛋白质,其CDS序列为序列表中序列2,基因组DNA序列为序列表中序列3。实验证明,本发明的陆地棉芽黄基因vsp可以调控植物苗期叶片的叶绿素含量,进而影响叶片的颜色,可作为标记性状用于杂种优势育种,也可用于研究植物光合作用,对植物育种和光合作用的研究具有重要的理论和应用价值。

Description

一个陆地棉芽黄基因vsp的克隆及其功能
技术领域
本发明涉及生物技术领域中,一个陆地棉芽黄基因vsp的克隆及其功能。
背景技术
棉花(Gossypium spp.)不仅提供世界上最多的用于纺织的天然纤维,还拥有丰富的油脂和蛋白(Sunilkumar et al 2006)。高产是充分利用其经济价值的前提。虽然改进栽培技术在一定程度上提高了棉花产量,但棉花产量的提高最终还须依赖品种改良。在棉花育种上,已发现棉花杂交种在产量、抗逆、纤维品质和光合作用等方面都具有杂种优势。棉花科研人员也越来越重视对杂种优势的研究,如对杂交种的产量、纤维品质、光合作用、种间杂交种和种内杂交种的产量和产量构成等方面的杂种优势的研究。在杂种优势的利用上,自2000年以来,用三系配套技术陆续选育出了一系列适合黄河流域、新疆和长江流域的杂交棉品种,并在生产上推广利用,部分杂交棉品种在产量和纤维品质等方面均超过对照品种。
在杂交种生产的过程中,受温度或光照影响,不育系自交结实,结果造成生产的杂交种不纯。另外,棉花是常异花授粉植物,由于昆虫的活动,亲本自交系和F1代种子很容易被花粉污染而造成生物学混杂。因此,合适的保持棉花杂交种纯度的方法就显得非常重要。分子标记虽然能快速鉴定种子的纯度,但对于移除种子中混杂的非典型的个体却并没有帮助。利用隐性叶色突变作为标记性状可在苗期清除三系中混杂的种子,也可剔除杂交种中混杂的自交种子。此外,叶色突变经常会导致叶绿体发育和叶绿素(chlorophyll,Chl)生物合成异常,进而影响光合作用,叶色突变体也是研究光合作用的理想工具。棉花芽黄突变体幼叶黄化,随着叶片的发育,叶色逐渐转绿,芽黄突变可作为标记性状用于杂种优势育种,也可用于研究棉花光合作用。因此,解析棉花芽黄突变的遗传基础对棉花育种和光合作用的研究具有重要的理论和应用价值。
发明内容
本发明提供了一个可以调控植物叶绿素含量及植物叶片颜色的编码基因。
本发明提供的蛋白质,来源于棉花,其名称为GhPUR4或△GhPUR4,所述GhPUR4为如下A1)、A2)或A3):
A1)氨基酸序列是序列1的蛋白质;
A2)将序列表中序列1所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质;
所述△GhPUR4为如下E1)、E2)或E4):
E1)氨基酸序列是序列4的蛋白质;
E2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。
为了使A1)或E2)中的蛋白质便于纯化,可在由序列表中序列1或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表1所示的标签。
表1标签的序列
Figure BDA0002008731990000011
Figure BDA0002008731990000021
上述A2)中的蛋白质,为与序列1所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。上述E2)中的蛋白质,为与序列4所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)或E2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述A2)中的蛋白质的编码基因可通过将序列2所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连上上表1所示的标签的编码序列得到。上述E2)中的蛋白质的编码基因可通过将序列5所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连上上表1所示的标签的编码序列得到。其中,序列2所示的DNA分子编码序列1所示的蛋白质。序列5所示的DNA分子编码序列4所示的蛋白质。
本发明还提供了与所述GhPUR4或所述△GhPUR4相关的生物材料,所述生物材料为下述B1)至B9)中的任一种:
B1)编码所述GhPUR4或所述△GhPUR4的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)含有B1)所述核酸分子的转基因植物细胞系、或含有B2)所述表达盒的转基因植物细胞系;
B6)含有B1)所述核酸分子的转基因植物组织、或含有B2)所述表达盒的转基因植物组织;
B7)含有B1)所述核酸分子的转基因植物器官、或含有B2)所述表达盒的转基因植物器官;
B8)降低GhPUR4表达量的核酸分子;
B9)含有B8)所述核酸分子的表达盒、重组载体、重组微生物、转基因植物细胞系、转基因植物组织或转基因植物器官。
上述生物材料中,B1)所述编码所述GhPUR4的所述核酸分子可为如下b11)或b12)或b13)或b14)或b15):
b11)编码序列是序列表中序列2的cDNA分子或DNA分子;
b12)序列表中序列2的cDNA分子或DNA分子;
b13)序列表中序列3的DNA分子;
b14)与b11)或b12)或b13)限定的核苷酸序列具有75%或75%以上同一性,且编码GhPUR4的cDNA分子或DNA分子;
b15)在严格条件下与b11)或b12)或b13或b14)限定的核苷酸序列杂交,且编码GhPUR4的cDNA分子或DNA分子;
B1)所述编码所述△GhPUR4的核酸分子可为如下f11)或f12)或f13)或f14)或f15):
f11)编码序列是序列表中序列5的cDNA分子或DNA分子;
f12)序列表中序列5的cDNA分子或DNA分子;
f13)序列表中序列6的DNA分子;
f14)与f11)或f12)或f13)限定的核苷酸序列具有75%或75%以上同一性,且编码所述△GhPUR4的cDNA分子或DNA分子;
f15)在严格条件下与f11)或f12)或f13或f14)限定的核苷酸序列杂交,且编码所述△GhPUR4的cDNA分子或DNA分子;
B8)所述核酸分子可为c1)或c2)或c3):
c1)序列表中序列2的第1028-1519位的DNA分子;
c2)与c1)限定的核苷酸序列具有75%或75%以上同一性,且具有相同功能的DNA分子;
c3)在严格条件下与c1)或c2)限定的核苷酸序列杂交,且具有相同功能的DNA分子。
其中,所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码GhPUR4或△GhPUR4蛋白质的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的GhPUR4或△GhPUR4蛋白质的核苷酸序列75%或者更高同一性的核苷酸,只要编码GhPUR4或△GhPUR4蛋白质且具有GhPUR4或△GhPUR4蛋白质功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列1或序列4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
上述应用中,B2)所述的含有编码GhPUR4蛋白质的核酸分子的表达盒(GhPUR4基因表达盒),是指能够在宿主细胞中表达GhPUR4蛋白质的DNA,该DNA不但可包括启动GhPUR4基因转录的启动子,还可包括终止GhPUR4基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用于本发明的启动子包括但不限于:组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。启动子的例子包括但不限于:花椰菜花叶病毒的组成型启动子35S:来自西红柿的创伤诱导型启动子,亮氨酸氨基肽酶("LAP",Chao等人(1999)PlantPhysiol120:979-992);来自烟草的化学诱导型启动子,发病机理相关1(PR1)(由水杨酸和BTH(苯并噻二唑-7-硫代羟酸S-甲酯)诱导);西红柿蛋白酶抑制剂II启动子(PIN2)或LAP启动子(均可用茉莉酮酸甲酯诱导);热休克启动子(美国专利5,187,267);四环素诱导型启动子(美国专利5,057,422);种子特异性启动子,如谷子种子特异性启动子pF128(CN101063139B(中国专利200710099169.7)),种子贮存蛋白质特异的启动子(例如,菜豆球蛋白、napin,oleosin和大豆beta conglycin的启动子(Beachy等人(1985)EMBO J.4:3047-3053))。它们可单独使用或与其它的植物启动子结合使用。此处引用的所有参考文献均全文引用。合适的转录终止子包括但不限于:农杆菌胭脂碱合成酶终止子(NOS终止子)、花椰菜花叶病毒CaMV 35S终止子、tml终止子、豌豆rbcS E9终止子和胭脂氨酸和章鱼氨酸合酶终止子(参见,例如:Odell等人(I985)Nature 313:810;Rosenberg等人(1987)Gene,56:125;Guerineau等人(1991)Mol.Gen.Genet,262:141;Proudfoot(1991)Cell,64:671;Sanfacon等人Genes Dev.,5:141;Mogen等人(1990)Plant Cell,2:1261;Munroe等人(1990)Gene,91:151;Ballad等人(1989)Nucleic Acids Res.17:7891;Joshi等人(1987)Nucleic AcidRes.,15:9627)。
可用现有的表达载体构建含有所述GhPUR4基因表达盒的重组载体。所述植物表达载体包括双元农杆菌载体和可用于植物微弹轰击的载体等。
所述载体可为质粒、黏粒、噬菌体或病毒载体。所述载体具体可为pTRV2。
B9)所述重组载体可为pTRV2:GhPUR4,pTRV2:GhPUR4为将pTRV2的BamHI和EcoRI识别序列间的DNA片段替换为序列表中序列2的第1028-1519位所示的DNA分子得到的重组载体。
所述微生物可为酵母、细菌、藻或真菌。其中,细菌可为农杆菌,如农杆菌GV3101。
所述转基因植物细胞系、转基因植物组织和转基因植物器官均不包括繁殖材料。
本发明还提供了GhPUR4或△GhPUR4或所述生物材料的下述任一应用:
X1)在调控植物颜色中的应用;
X2)在制备调控植物颜色产品中的应用;
X3)在植物育种中的应用。
本发明还提供了调控植物颜色的产品,所述产品含有GhPUR4或△GhPUR4或所述生物材料。
上文中,所述植物可为Y1)或Y2)或Y3)或Y4):
Y1)双子叶植物或单子叶植物;Y2)锦葵科植物;Y3)棉属植物;Y4)陆地棉。
上文中,所述植物颜色可为幼嫩叶片的颜色。
进一步,所述幼嫩叶片可为所述植物苗期的幼嫩叶片。
所述幼嫩叶片进一步可为种子萌发后第0-15天(如0-4天)的幼嫩叶片。
本发明还提供了下述任一方法:
Z1)培育芽黄植物的方法,包括:降低受体植物中GhPUR4的含量,或降低受体植物中GhPUR4的活性,得到芽黄目的植物;
Z2)降低植物叶绿素含量的方法,包括:降低受体植物中GhPUR4的含量,或降低受体植物中GhPUR4的活性,得到叶绿素含量降低的目的植物,实现叶绿素含量的降低;
Z3)培育叶绿素含量降低植物的方法,包括:降低受体植物中GhPUR4的含量,或降低受体植物中GhPUR4的活性,得到叶绿素含量降低的目的植物;
Z4)培育黄化植物的方法,包括:降低受体植物中GhPUR4的含量,或降低受体植物中GhPUR4的活性,得到叶绿素含量降低的目的植物,所述目的植物即为黄化植物。
所述受体植物含有GhPUR4的编码基因。
所述芽黄目的植物与所述受体植物相比,其幼嫩叶片出现黄化显现,且随着的植物的生长,叶片颜色恢复正常(即绿色)。所述幼嫩叶片可为所述受体植物苗期的幼嫩叶片。所述幼嫩叶片进一步可为种子萌发后第0-15天(如0-4天)的幼嫩叶片。
上述方法中,所述降低受体植物中GhPUR4的含量可通过向所述受体植物中导入序列表中序列2的第1028-1519位所示的DNA分子降低所述蛋白质编码基因的表达实现。
上述方法中,所述降低受体植物中GhPUR4的含量具体可利用病毒诱导的基因沉默(VIGS)系统完成。具体的,可利用烟草脆裂病毒(tobacco rattle virus,TRV)诱导的基因沉默(VIGS)系统完成。
所述降低受体植物中GhPUR4的含量具体可通过向所述受体植物中导入所述pTRV2:GhPUR4和pTRV1实现。
上述方法中,所述降低受体植物中GhPUR4的含量可通过将GhPUR4的编码基因突变为△GhPUR4的编码基因实现。
上述方法中,所述植物可为Y1)或Y2)或Y3)或Y4):
Y1)双子叶植物或单子叶植物;Y2)锦葵科植物;Y3)棉属植物;Y4)陆地棉。
上述方法中,所述植物颜色可为幼嫩叶片的颜色。
进一步,所述幼嫩叶片可为所述植物苗期的幼嫩叶片。
所述幼嫩叶片进一步可为种子萌发后第0-15天(如0-4天)的幼嫩叶片。棉花从出苗到现蕾的一段时间为棉花苗期。
实验证明,本发明的GhPUR4、△GhPUR4及其编码基因可以调控植物苗期叶片的叶绿素含量,进而影响叶片的颜色:降低该GhPUR4编码基因的表达可以降低叶片中叶绿素的含量进而导致叶片变黄出现芽黄性状,而随着植物的生长,叶绿素含量与叶片颜色均恢复正常;将GhPUR4编码基因突变为△GhPUR4编码基因导致植物出现芽黄性状,并且在植物中△GhPUR4编码基因为隐性基因,其控制的叶色变化为隐性性状,可以用于在苗期清除育种三系中混杂的种子,也可剔除杂交种中混杂的自交种子。表明,本发明中的△GhPUR4及其编码基因控制的芽黄突变可作为标记性状用于杂种优势育种,也可用于研究植物光合作用,对植物育种和光合作用的研究具有重要的理论和应用价值。
附图说明
图1为CCRI58和vsp突变体真叶表型及相对叶绿素含量检测结果。a为CCRI58和vsp的真叶表型;b为CCRI58和vsp突变体真叶的相对叶绿素含量。
图2为用Bin标记构建的遗传图谱。
图3为vsp基因和连锁标记的遗传图。
图4为vsp基因的定位与候选基因的序列分析。a)vsp基因的初定位。染色体下方的数字表示遗传标记和vsp基因之间重组的芽黄单株的个数。b)用F2群体IV的484个隐性单株把vsp基因定位在D0436-3-7-47和D04_1596标记之间,区间长度约为353.7kb。每一标记下方的数字表示遗传标记和基因之间重组的隐性单株的个数。c)353.7kb的区间内共预测到15个基因。Gh_D04G1108(GhPUR4)基因(第6个),编码磷酸核糖甲酰甘氨脒(FGAM)合酶。d)GhPUR4基因第2个外显子上的201bp(960Deletion1160)的DNA片段的缺失。蓝色框表示GhPUR4基因的5′和3′非编码区。e)琼脂糖凝胶电泳。f)GhPUR4和△GhPUR4的部分序列比对结果。GhPUR4蛋白以CCRI58的GhPUR4基因为模板,△GhPUR4蛋白以vsp突变体中的GhPUR4(vsp)基因为模板。
图5为GhPUR4基因沉默后可导致棉花芽黄表型。a为GhPUR4基因沉默后GhPUR4基因相对表达量检测结果,b为相对叶绿素含量检测结果,c为各棉花的表型。CCRI24为未进行处理的棉花,pTRV2:00为空载体对照棉花,pTRV2:GhPUR4为GhPUR4基因沉默棉花,pTRV2:GhPDS为白化对照。“**”表示P<0.01。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
下述实施例中的中棉所58(CCRI58)及CCRI58的突变体(vsp突变体)均记载在文献(Meizhen Song,Zhaoguang Yang,Shuli Fan,Haiyong Zhu,Chaoyou Pang,MingshuangTian,Shuxun Yu(2012)Cytological and genetic analysis of a virescent mutant inupland cotton(Gossypium hirsutum L.).Euphytica 187:235-245)中,公众可从申请人处获得该生物材料,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的陆地棉(Gossypium hirsutum L.)遗传标准系TM-1(GuangzhiMao,Qiang Ma,Hengling Wei,Junji Su,Hantao Wang,Qifeng Ma,Shuli Fan,MeizhenSong,Xianlong Zhang,Shuxun Yu(2018)Fine mapping and candidate gene analysisof the virescent gene v1in Upland cotton(Gossypium hirsutum).Mol GenetGenomics 293:249-264)公众可从申请人处获得该生物材料,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的海岛棉(Gossypium barbadense L.)7124(Hai7124,海7124)(郝俊杰,马奇祥,刘焕民,贾新合,董中东,刘书梅,崔小伟,张志新(2010),嫁接棉花对棉花黄萎病抗性、产量和纤维品质的影响.中国农业科学43(19):3974-3980)公众可从申请人处获得该生物材料,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的pTRV1(pYL192)载体和pTRV2(pYL156)载体均记载在文献(Gao X,Jr BR,Shan L,He P(2011)Agrobacterium-Mediated Virus-Induced Gene SilencingAssay In Cotton.J Vis Exp 54:e2938,DOI:10.3791/2938)中,公众可从申请人处获得,这些生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
实施例1、棉花芽黄性状受一对隐性核基因控制
本实施例发现vsp突变体芽黄性状受一对隐性核基因控制,并对该基因进行了定位。步骤如下:
一、表型观察与相对叶绿素含量检测
田间种植TM-1、海7124、CCRI58和CCRI58的突变体(vsp突变体),自第1片真叶开始,对真叶颜色进行观察,连续观察3-5片真叶。在0d(将真叶即将展平的当天记为第0天,即0d)时vsp突变体和CCRI58真叶颜色差别不明显,然后,vsp突变体真叶逐渐黄化;至2d和3d时,vsp突变体真叶黄化,CCRI58真叶绿色;此后vsp突变体真叶逐渐转绿,7d以后,vsp突变体和CCRI58真叶颜色差异不明显(图1中a)。
用SPAD-502Plus[Konica Minolta(China)Investment Ltd]仪器检测各植株真叶的相对叶绿素含量。3次生物学重复。每重复取3株生长一致的幼苗的真叶进行检测,结果取3次检测数值的平均值。在0d、2d和4d时,vsp突变体的真叶相对叶绿素含量均显著低于CCRI58,此后逐渐升高,至6d时,vsp突变体和CCRI58的相对叶绿素含量无显著差异(图1中b)。
将vsp突变体的上述表型记为芽黄性状。TM-1和海7124的表型与CCRI58相同。
二、群体构建及遗传分析
将陆地棉遗传标准系TM-1与vsp突变体杂交,得到杂交一代,记为F1(TM-1×vsp),F1(TM-1×vsp)的叶色表型均与TM-1相同,均为绿色单株(即无芽黄性状的单株),说明vsp突变体芽黄性状是完全隐性性状;F1(TM-1×vsp)自交得到具有950个绿色单株和320个芽黄单株(即与vsp突变体叶色表型相同的单株)的F2代,记为F2代群体I。利用Excel软件对F2代群体I的表型数据进行卡平方分析,发现F2群体I中绿色植株和芽黄植株的比例符合3:1,χ2值(χ2value)为0.02,χ2分位数(χ2 0.05,1)为3.84。
从F2群体I中随机抽取75个绿色单株和25个芽黄单株构成F2群体III,各植株进行自交,25个芽黄单株的自交后代全部表现芽黄性状,绿色植株中49株自交后代出现绿叶表型和芽黄表型的分离,绿色植株中26个绿色单株自交后代没有出现叶色表型的分离,符合1:2:1的比例(χ2=0.06<χ2 0.05,2=5.99)。
这些结果表明:vsp突变体芽黄性状受一对隐性核基因控制,将该基因记为vsp基因,芽黄性状是由核基因控制的完全隐性性状。
三、基因定位
将海岛棉7124(Hai7124)与vsp突变体杂交,得到杂交一代,记为F1(vsp×Hai7124);F1(vsp×Hai7124)自交得到具有2126个绿色单株和484个芽黄单株的F2群体II。
利用用GBS测序构建的包含4472个bin标记的遗传图谱将vsp基因定位在D04染色体上,位于Bin3262至Bin3268标记之间,物理距离为38.32Mb。利用重测序技术开发分子标记,将vsp基因限定在23.11Mb的区间内。利用F2群体II中的484个芽黄单株将vsp基因定位在为353.7kb的候选区间内。Sanger测序分析候选区间内的基因变异,发现在CCRI58中Gh_D04G1108基因全长4468bp,含2个长分别为42bp和4197bp的外显子和1个长229bp的内含子,将该基因命名为GhPUR4基因,GhPUR4基因的基因组序列为序列表中序列3,其CDS序列为序列表中序列2,编码序列表中序列1所示的GhPUR4蛋白质。在vsp突变体中,GhPUR4基因的第2个外显子中有201bp DNA片段(即缺失序列3的第960-1160位)的缺失,进而导致其编码的△GhPUR4蛋白质缺失序列表中序列1的第244-300位,CDS序列缺失序列2的第731-931位,vsp突变体中的GhPUR4基因被记为vsp基因,vsp基因的基因组序列为序列表中序列6,其CDS序列为序列表中序列5,编码序列表中序列4所示的△GhPUR4蛋白质。具体定位方法如下:
一)实验方法
数据库:本研究使用了陆地棉基因组数据库(Zhang et al 2015)。陆地棉基因组数据库从http://mascotton.njau.edu.cn/Data/Genome_sequence.htm下载。部分SSR引物序列从COTTONGEN数据库(https://www.cottongen.org/)下载。
1.高密度SNP标记遗传图谱构建
1.1GBS文库构建及测序
提取TM-1、vsp芽黄突变体及F2群体III中100个个体的基因组DNA。用1%的琼脂糖凝胶检测DNA的完整性,用
Figure BDA0002008731990000081
分光光度计(IMPLEN,CA,USA)检测基因组DNA的纯度,用
Figure BDA0002008731990000082
DNA Assay Kit in
Figure BDA0002008731990000083
2.0Flurometer(Life Technologies,CA,USA)检测DNA浓度。
以陆地棉基因组为参考基因组进行电子酶切评估后,选择MseI+NlaIII+EcoRI组合对DNA样品进行酶切,加上带有barcode的接头后,对每个样品进行扩增,然后对样品进行混合,进行GBS文库构建。检测合格的DNA文库,利用Illumina HiSeqTM 2500测序平台(Illumina,San Diego,CA,USA)进行双末端(Paired-End)150测序。
1.2SNP标记开发
对测序获得的原始数据进行质量控制、比对分析和SNP检测,具体方法见文献(Libei Li,Shuqi Zhao,Junji Su,Shuli Fan,Chaoyou Pang,Hengling Wei,HantaoWang,Lijiao Gu,Chi Zhang,Guoyuan Liu,Dingwei Yu,Qibao Liu,Xianlong Zhang,Shuxun Yu(2017)High-density genetic linkage map construction by F2populationsand QTL analysis of early-maturity traits in upland cotton(Gossypium hirsutumL.).PLOS ONE https://doi.org/10.1371/journal.pone.0182918)。根据SNP检测结果对亲本间SNP标记进行开发。统计TM-1和vsp之间“aaxbb”类型的标记数量。完成亲本间SNP标记开发后,按照碱基支持数不小于2且不大于1000,提取100个子代间的多态性位点。
1.3遗传图谱构建
对标记对应染色体划分连锁群。用Joinmap 4.0和perl SVG模块绘制连锁图。
2.PCR扩增和基因分型
PCR扩增程序、SSR标记和SNP标记基因分型方法见文献(Guangzhi Mao,Qiang Ma,Hengling Wei,Junji Su,Hantao Wang,Qifeng Ma,Shuli Fan,Meizhen Song,XianlongZhang,Shuxun Yu(2018)Fine mapping and candidate gene analysis of thevirescent gene v1 in Upland cotton(Gossypium hirsutum).Mol Genet Genom 293:249-264)。
3.基因定位
3.1表型和基因型数据记录
在F2群体中,表现型为绿叶,记为G,表现型为黄叶,记为V。利用Excel软件对表型数据进行卡平方分析,验证F2群体的叶色性状分离比是否符合3:1。
共显性分子标记分析过程中,F2群体中如果某个单株的带型与TM-1一致,记为A;如果某个单株的带型与vsp突变体一致,记为B;杂合带型记为H。显性分子标记分析过程中,F2群体中如果某个单株的带型与TM-1一致,记为D;如果某个单株的带型与vsp突变体一致,记为B。
3.2遗传连锁图谱的构建和定位
利用构建的SNP遗传图谱和F2群体III个体的表型数据对vsp基因进行初定位。基于重测序开发的分子标记,利用F2群体Ⅲ对vsp基因进行进一步定位。采用LOD值≥5,最大遗传距离为35cM的标准决定标记和标记及标记和vsp基因之间的连锁关系。F2群体II的芽黄单株被用于精细定位,重组的芽黄单株被用于确定vsp基因和标记之间的物理距离。
4.候选基因筛选和序列分析
根据定位区间内的基因代码,从陆地棉CDS数据库(Zhang et al 2015)中调取基因的序列,利用NCBI数据库(http://www.ncbi.nlm.nih.gov/),进行BLAST和Blast2GO(Conesa et al 2005)分析,对候选区间内的基因的预测进行确认。为鉴定候选基因,用克隆引物(表2)和Tks GflexTM DNA聚合酶(R060A),以vsp突变体和CCRI58的基因组DNA为模板克隆候选区间内的基因。为进一步确认候选基因,用克隆引物(表2)和Tks GflexTM DNA聚合酶(R060A),以vsp突变体和CCRI58的cDNA为模板,克隆候选基因的CDS序列。克隆过程中,HiPure Gel Pure DNA Mini Kit(Magen)对PCR产物进行纯化,纯化后的PCR产物连接到CEEntry vector(Vazyme Biotech Co.,Ltd)上,重组载体转化大肠杆菌后进行测序。
序列分析方法见文献(Guangzhi Mao,Qiang Ma,Hengling Wei,Junji Su,HantaoWang,Qifeng Ma,Shuli Fan,Meizhen Song,Xianlong Zhang,Shuxun Yu(2018)Finemapping and candidate gene analysis of the virescent gene v1 in Upland cotton(Gossypium hirsutum).Mol Genet Genom 293:249-264)。
二)结果分析
1.高密度SNP遗传图谱构建
基于TM-1和vsp之间SNP检测结果,共筛选出84663个多态性位点。类型为“aa×bb”型的标记可用于遗传图谱构建,该标记类型为29796个。提取100个子代在上述29796个亲本多态性标记位点的基因型,共获得7321个候选标记。用Joinmap 4.0对每个连锁群的标记进行排序(ML Kosambi作图)、计算标记间的遗传距离,去掉严重不能连锁的标记,最终获得含6471个SNP标记或4472个bin标记的连锁遗传图(图2)。遗传图谱含26个连锁群,总长5384.33cM,平均每个连锁群的图距长约为207.1cM,4472个Bin标记间的平均遗传距离约为1.2cM,2496个Bin标记分布在At亚基因组,1976个标记分布在Dt亚基因组。连锁群上gap的统计分析表明:总的gap数为4446个,小于5cM的gap数占总gap数的比例为93.91%,10cM至20cM和大于20cM的gap数较少,分别约占1.6%和0.34%,5cM至10cM的gap约占总gap的比例为2.86%。
2利用SNP遗传图谱对vsp基因进行定位
利用构建的高密度的SNP标记连锁遗传图,用Joinmap4.0软件,按LOD值≥5,对vsp基因进行初定位,vsp基因被定位在D04染色体上,位于Bin3262至Bin3268之间,物理距离为38.32Mb(图3)。
3.亲本重测序开发分子标记对vsp基因进行定位
在Bin3262至Bin3268之间没有可以利用的的分子标记,为进一步缩小vsp基因所在的区间,对TM-1和vsp进行重测序开发分子标记。按照SNP的reads支持数不低于4,SNP的质量值(MQ)不低于20,对TM-1和vsp之间的多态性分子标记进行了开发。SNP结果检测表明,在物理位置为10Mb至30Mb区间内,共有17个“aa×bb”类型的SNP标记,根据SNP标记的位置,在基因组里调取SNP位点上下游各300bp的DNA序列,用Oligo7.0设计17对引物,经ePCR分析得到6对特异性的引物,合成后用SSCP分析TM-1和vsp之间多态性的、能够分型的标记4个,分别为zsmarker94、zsmarker96、zsmarker98和zsmarker104。10Mb至30Mb的区间内,共有48个“aa×bb”和“lm×ll”类型的InDel标记,挑选在TM-1和vsp之间差异4bp以上的InDel标记19个,调取上下游各300bp的DNA序列用Oligo7.0设计引物,经ePCR分析后得到序列特异性引物,经PAGE分析后得到1对多态性的和vsp基因连锁的标记mkZSID187。利用上述开发的5个标记和F2群体Ⅲ,vsp基因被定位在mkZSID187和Bin3268标记之间(图3;表2),物理距离为23.11Mb。20Mb至30Mb的区间内共有66个“lm×ll”类型的标记,调取标记位点上下游各300bp的DNA序列,设计引物后,经ePCR分析15对特异引物序列,合成引物后经SSCP分析,没能筛到TM-1和vsp之间的多态性引物。
4.用海陆F2群体定位vsp基因
基于TM-1和vsp之间的多态性标记分析表明,mkZSID187和Bin3268之间没有可以利用的分子标记,不能对vsp基因进行精细定位。因此,本研究以海7124和vsp为亲本构建了F2群体II,由于偏分离的原因,在2610株的F2群体II中共有484株芽黄单株,这些芽黄单株被用于vsp芽黄基因的精细定位,在精细定位过程中发生交换的芽黄单株被用于界定标记和vsp基因的位置关系。基于F2群体III的定位结果显示,vsp基因更靠近mkZSID187(图4),用BatchPrimer3v1.0(You et al 2008)在靠近mkZSID187标记的区域在线设计了212对引物,合成后经PAGE分析筛选到海7124和vsp之间的多态性引物20对。根据Wang等(2015)报道的SSR标记,在mkZSID187和Bin3268标记之间筛选到序列特异性SSR引物219对,合成后经PAGE分析,筛选到海7124和vsp之间的多态性引物28对;利用F2群体IV中的90个芽黄单株和22个多态性的、和vsp基因连锁的SSR标记(表2),将vsp基因定位在D04_1471标记(物理位置约34.5Mb)和D04_1671标记(物理位置约38.7Mb)之间,物理距离约为4.1Mb(图4中a)。
在已筛选到的多态性标记中,在D04_1471和D04_1671之间还有6个SSR标记,利用这6个标记和来自F2群体IV的25个芽黄交换单株,将vsp基因定位在D04_1571(物理位置约为36.3Mb)和D04_1596(物理位置约为36.8Mb)标记之间(图4中b),物理距离约为502.9Kb。为进一步缩小vsp基因所在的区间,在陆地棉基因组里挑取36.3Mb至36.7Mb范围内DNA序列,用BatchPrimer3v1.0(You et al 2008)在线设计15对序列特异的SSR引物,经PAGE分析筛选到7个多态性标记(D0436-3-7-1、D0436-3-7-16、D0436-3-7-22、D0436-3-7-33、D0436-3-7-47、D0436-3-7-74和D0436-3-7-93)(表2),利用5个交换单株进行连锁分析,vsp芽黄基因被界定在D0436-3-7-47和D04_1596之间(图4中b),物理距离约为353.7Kb,区间内包含15个基因(图4中c)。
5.候选基因筛选
为了筛选候选基因,基于陆地棉参考基因组信息,设计和合成了15对特异引物,从CCRI58和vsp基因组DNA中扩增了15个基因的全长DNA序列,PCR产物连接CE Entry Vector(C114-02)(Vazyme Biotech Co.,Ltd)并测序。用DNAMAN软件对各基因全长序列的比对分析表明:Gh_D04G1103、Gh_D04G1104、Gh_D04G1105、Gh_D04G1106、Gh_D04G1107、Gh_D04G1109、Gh_D04G1110、Gh_D04G1111、Gh_D04G1112、Gh_D04G1113、Gh_D04G1114、Gh_D04G1115、Gh_D04G1116和Gh_D04G1117的基因全长序列在CCRI58和vsp之间没有序列上的差异;与CCRI58的Gh_D04G1108基因的全长序列比较,vsp的Gh_D04G1108基因出现了201bp的序列缺失(图4中d)。根据Gh_D04G1108和其同源基因的SNP,设计特异引物(表2)进行基因分型,结果表明201bp DNA片段的缺失真实存在(图4中e)。基因注释表明,Gh_D04G1108(GhPUR4)与嘌呤的生物合成途径有关。在拟南芥上,PUR4基因编码磷酸核糖甲酰甘氨脒(FGAM)合酶,是嘌呤从头生物合成途径中的第4个酶,亚细胞定位显示该基因编码的产物位于拟南芥叶绿体和线粒体上(Berthoméet al 2008)。Gh_D04G1108(GhPUR4)基因被筛选为候选基因进行进一步分析。
表2、vsp基因精细定位和候选基因克隆研究中使用的引物
Figure BDA0002008731990000101
Figure BDA0002008731990000111
Figure BDA0002008731990000121
Figure BDA0002008731990000131
实施例2、降低GhPUR4基因的表达可以使棉花出现芽黄性状
利用病毒诱导的基因沉默(VIGS)系统降低棉花中GhPUR4基因的表达,所用VIGS载体为烟草脆裂病毒(tobacco rattle virus,TRV)的pTRV1(pYL192)载体和pTRV2(pYL156)载体,步骤如下:
1、重组载体的构建
利用TRV1108-2引物以CCRI58的cDNA为模板进行PCR扩增,得到PCR产物;将该PCR产物利用BamHI和EcoRI进行酶切,将酶切后的大片段与将出发载体pTRV2经BamHI和EcoRI酶切得到的载体骨架相连,得到重组载体,将序列正确的重组载体命名为pTRV2:GhPUR4。其中,TRV1108-2引物由名称分别为TRV1108-2F和TRV1108-2R的两个单链DNA组成,序列如下:
TRV1108-2F:5′-TTCTGTGAGTAAGGTTACCGAATTCTATTAGGGATACACATGCCACT-3′;
TRV1108-2R:5′-GACGCGTGAGCTCGGTACCGGATCCAGTTTTTGTGCCATTTCAGCAT-3′。
pTRV2:GhPUR4为将出发载体pTRV2的BamHI和EcoRI识别序列间的DNA片段替换为序列表中序列2的第1028-1519位所示的DNA分子得到的重组载体。
2、转基因棉花的构建
利用农杆菌介导的植物转化方法,将pTRV2:GhPUR4导入农杆菌GV3101中转化受体棉花,得到转基因棉花。所用受体棉花为子叶完全展平、第1片真叶没有出现或刚露芯的时的陆地棉中棉所24(CCRI24)。具体转化方法如下:
将pTRV2:GhPUR4和pTRV1分别接种于含有浓度分别为50μg/L的利福平、卡那霉素和庆大霉素的LB液体培养基中进行培养至OD600在1.5-2.0之间,收集菌液,离心,收集菌体沉淀;向菌体沉淀中加入转化介质至OD600为1.5,分别得到pTRV2:GhPUR4转化液和pTRV1转化液,按照体积比为1:1混合两种转化液,得到混合转化液。转化介质的配制方法见表3,用水补至100mL。
表3、转化介质的成分及配制方法
Figure BDA0002008731990000141
用针头划伤受体棉花子叶背面,用无针注射器将上文所得混合转化液注入,注射30株受体棉花,将注射当天记为处理0天。
将注射后的棉株黑暗过夜培养,之后置于25℃棉花培养室培养,即得到GhPUR4基因沉默棉花,光周期为16h(光照)/8h(无光照),光照强度为11000lx。
按照上述方法,将pTRV2:GhPUR4替换为出发载体pTRV2导入农杆菌后转化受体棉花,得到空载对照棉花。
以沉默陆地棉八氢番茄红素脱氢酶基因(GhPDS)作为VIGS系统作用效果的参考,沉默该基因可导致植株的白化表型,按照上述方法,将pTRV2:GhPUR4替换为可以沉默GhPDS基因的重组载体pTRV2:GhPDS(Ge XY,Wu J,Zhang CJ,Wang QH,Hou YX,Yang ZR,Yang ZE,Xu ZZ,Wang Y,Lu LL,Zhang XY,Hua JP,Li FG(2016)Prediction of VIGS effciency bythe Sfold program and its reliability analysis in Gossypiumhirsutum.Sci.Bull.61(7):543–551)转化受体棉花,得到白化对照。结果发现,白化对照棉花在上述处理后出现白化表型,表明上述方法可成功沉默目的基因。
3、转基因棉花的鉴定
待测棉花为CCRI24、空载对照棉花和GhPUR4基因沉默棉花。
在GhPUR4基因沉默棉花真叶出现芽黄表型后(在处理17天后),取待测棉花的、自顶部开始的倒数第3叶提取RNA,通过荧光定量PCR分析GhPUR4基因在待测棉花中的相对表达量。3次生物学重复,每重复2株。所用引物为1108-1F(5′-CCCCAGATTTGAAGCAAGGAG-3′)和1108-1R(5′-ATCAGACCATCTCCAAGAACG-3′),内参基因为ACTIN(GenBank ID AY305733)基因,内参基因的引物序列为:5′-ATCCTCCGTCTTGACCTTG3-′,5′-TGTCCGTCAGGCAACTCAT-3′。
结果显示,与CCRI24和空载对照棉花相比,GhPUR4基因沉默棉花的叶片中GhPUR4基因的表达量极显著降低,表明CCRI24叶片中的GhPUR4基因被有效的沉默(图5中a)。
4、表型分析
在GhPUR4基因沉默棉花真叶出现芽黄表型后(在处理17天后),用SPAD-502PlusMeter[Konica Minolta(China)Investment Ltd]检测受体棉花、空载对照棉花以及GhPUR4基因沉默棉花从顶端开始的倒数第3片真叶的相对叶绿素含量。3次生物学重复,每重复2株,在每株的叶片不同部分测定5次,取5次数值的平均值。结果见表4。
表4、相对叶绿素含量检测结果
Figure BDA0002008731990000142
Figure BDA0002008731990000151
在处理17天后,GhPUR4基因沉默棉花显示了较低的叶绿素含量以及芽黄表型,显著低于空载对照棉花;受体棉花、空载对照棉花均未出现芽黄表型,且二者的叶绿素含量无显著差异,图5中b与c。这些结果表明:GhPUR4基因沉默可以导致棉花的叶绿素含量降低,叶绿素含量的降低进而造成了CCRI24幼嫩叶片出现芽黄表型。
<110> 中国农业科学院棉花研究所
<120> 一个陆地棉芽黄基因vsp的克隆及其功能
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 1412
<212> PRT
<213> 棉花(Gossypium hirsutum L.)
<400> 1
Met Ala Gly Leu Arg Glu Leu Thr Ala Ala Glu Phe Leu Gln Gly Thr
1 5 10 15
Thr Arg Gln Thr Leu Phe Leu Gln Arg Asn Ser Ser Ile Lys Ser Ser
20 25 30
Asn Leu Leu Trp Gly Lys Leu Cys Asn Pro Ser Arg Met Gly Tyr Leu
35 40 45
Ser Asn Thr Lys Gly Ala Ser Leu Arg Cys Ser Ser Arg Ser Lys Pro
50 55 60
Lys Ala Met Ala Ser Gly Asn Val Pro Thr Ser Leu Val Asp Glu Gln
65 70 75 80
Pro Gly Leu Ile Glu Lys Pro Ala Gln Glu Val Val His Phe Tyr Arg
85 90 95
Ile Pro Leu Ile Gln Glu Gly Ala Asn Asp Glu Leu Leu Lys Ser Val
100 105 110
Gln Thr Lys Val Ser Asn His Ile Val Gly Leu Lys Thr Glu Gln Cys
115 120 125
Phe Asn Ile Gly Leu Ala Ser Lys Ile Ser Ser Glu Lys Phe Ser Thr
130 135 140
Leu Lys Trp Ile Leu Gly Glu Thr Tyr Glu Pro Glu Asn Leu Ala Thr
145 150 155 160
Glu Ser Phe Leu Val Lys Lys Arg Gln Glu Gly Leu Asn Thr Val Ile
165 170 175
Val Glu Val Gly Pro Arg Leu Ser Phe Thr Thr Ala Trp Ser Ser Asn
180 185 190
Ala Val Ser Ile Cys Gln Ser Cys Gly Leu Thr Glu Val Thr Arg Met
195 200 205
Glu Arg Ser Arg Arg Tyr Leu Leu Tyr Ser Lys Glu Ala Leu Gln Glu
210 215 220
Asn Gln Ile Asn Glu Phe Ala Ala Met Val His Asp Arg Met Thr Glu
225 230 235 240
Cys Val Tyr Thr Gln Arg Leu Thr Ser Phe Glu Thr Ser Val Ala Pro
245 250 255
Glu Glu Val Arg Phe Val Pro Val Ile Glu Arg Gly Arg Lys Ala Leu
260 265 270
Glu Glu Ile Asn Gln Glu Met Gly Leu Ala Phe Asp Glu Gln Asp Leu
275 280 285
Gln Tyr Tyr Thr Arg Leu Phe Val Glu Asp Ile Lys Arg Asn Pro Thr
290 295 300
Asn Val Glu Leu Phe Asp Ile Ala Gln Ser Asn Ser Glu His Ser Arg
305 310 315 320
His Trp Phe Phe Thr Gly Lys Ile Val Ile Asp Gly Gln Pro Met Asp
325 330 335
Arg Thr Leu Met Gln Ile Val Lys Ser Thr Leu Lys Ala Asn Pro Asn
340 345 350
Asn Ser Val Ile Gly Phe Lys Asp Asn Ser Ser Ala Ile Lys Gly Phe
355 360 365
Leu Ala Tyr Arg Leu Arg Pro Val Lys Pro Gly Thr Ala Cys Leu Leu
370 375 380
Asn Glu Thr Ser Arg Glu Ile Asp Val Leu Phe Thr Ala Glu Thr His
385 390 395 400
Asn Phe Pro Cys Ala Val Ala Pro Tyr Pro Gly Ala Glu Thr Gly Ala
405 410 415
Gly Gly Arg Ile Arg Asp Thr His Ala Thr Gly Arg Gly Ser Phe Val
420 425 430
Val Ala Ser Thr Ala Gly Tyr Thr Thr Gly Asn Leu Asn Ile Glu Gly
435 440 445
Ser Tyr Ala Pro Trp Glu Asp Ser Ser Phe Thr Tyr Pro Ser Asn Leu
450 455 460
Ala Ser Pro Leu Glu Ile Leu Ile Glu Ala Ser Asn Gly Ala Ser Asp
465 470 475 480
Tyr Gly Asn Lys Phe Gly Glu Pro Leu Ile Gln Gly Phe Thr Arg Thr
485 490 495
Phe Gly Thr Arg Leu Pro Ser Gly Glu Arg Arg Glu Trp Leu Lys Pro
500 505 510
Ile Met Phe Ser Gly Gly Ile Gly Gln Ile Asp His Thr His Ile Ser
515 520 525
Lys Gly Asp Pro Glu Ile Gly Met Leu Val Val Lys Ile Gly Gly Pro
530 535 540
Ala Tyr Arg Ile Gly Met Gly Gly Gly Ala Ala Ser Ser Met Val Ser
545 550 555 560
Gly Gln Asn Asp Ala Glu Leu Asp Phe Asn Ala Val Gln Arg Gly Asp
565 570 575
Ala Glu Met Ala Gln Lys Leu Tyr Arg Val Val Arg Ala Cys Ile Glu
580 585 590
Met Gly Glu Asp Asn Pro Ile Ile Ser Ile His Asp Gln Gly Ala Gly
595 600 605
Gly Asn Cys Asn Val Val Lys Glu Ile Ile Tyr Pro Lys Gly Ala Glu
610 615 620
Ile Asp Ile Arg Ala Ile Val Val Gly Asp His Thr Met Ser Val Leu
625 630 635 640
Glu Ile Trp Gly Ala Glu Tyr Gln Glu Gln Asp Ala Ile Leu Val Lys
645 650 655
Pro Glu Ser Arg Lys Leu Leu Glu Ser Ile Cys Ala Arg Glu Arg Leu
660 665 670
Ser Met Ala Val Ile Gly Thr Ile Asn Gly Glu Gly Arg Val Val Leu
675 680 685
Val Asp Ser Val Ala Ile Glu Lys Ser Arg Ala Ser Gly Leu Pro Pro
690 695 700
Pro Pro Pro Ala Val Asp Leu Glu Leu Glu Lys Val Leu Gly Asp Met
705 710 715 720
Pro Gln Lys Ser Phe Glu Phe Lys Arg Val Ser Tyr Ala Arg Glu Pro
725 730 735
Leu Asp Val Ala Pro Ala Ile Thr Val Met Asp Ser Leu Lys Arg Val
740 745 750
Leu Arg Leu Pro Ser Val Cys Ser Lys Arg Phe Leu Thr Thr Lys Val
755 760 765
Asp Arg Cys Val Thr Gly Leu Val Ala Gln Gln Gln Thr Val Gly Pro
770 775 780
Leu Gln Leu Pro Leu Ala Asp Val Ala Val Ile Ala Gln Ser Tyr Val
785 790 795 800
Asp Leu Thr Gly Gly Ala Cys Ala Ile Gly Glu Gln Pro Ile Lys Gly
805 810 815
Leu Leu Asp Pro Lys Ala Met Ala Arg Leu Ala Val Gly Glu Ala Leu
820 825 830
Thr Asn Leu Val Trp Ala Lys Val Thr Ser Leu Ser Asp Val Lys Ala
835 840 845
Ser Gly Asn Trp Met Tyr Ala Ala Lys Leu Glu Gly Glu Gly Ala Ala
850 855 860
Met Tyr Asp Ala Ala Ile Ala Leu Ser Glu Ala Met Ile Glu Leu Gly
865 870 875 880
Ile Ala Ile Asp Gly Gly Lys Asp Ser Leu Ser Met Ala Ala His Ala
885 890 895
Gly Gly Glu Val Val Lys Ala Pro Gly Asn Leu Val Ile Ser Ala Tyr
900 905 910
Val Thr Cys Pro Asp Ile Thr Lys Thr Val Thr Pro Asp Leu Lys Gln
915 920 925
Gly Asp Asp Gly Ile Leu Leu His Ile Asp Leu Ala Lys Gly Lys Arg
930 935 940
Arg Leu Gly Gly Ser Ala Leu Ala Gln Val Phe Asp Gln Ile Gly Asn
945 950 955 960
Asp Cys Pro Asp Ile Asp Asp Val Ser Tyr Leu Lys Arg Val Phe Glu
965 970 975
Gly Val Gln Asp Val Leu Gly Asp Gly Leu Ile Ser Ala Gly His Asp
980 985 990
Ile Ser Asp Gly Gly Leu Leu Val Cys Ala Leu Glu Met Ala Phe Ala
995 1000 1005
Gly Asn Cys Gly Ile Ala Leu Asp Leu Ala Ser Leu Gly Asn Ser
1010 1015 1020
Val Phe Gln Ser Leu Phe Ala Glu Glu Leu Gly Leu Ile Leu Glu
1025 1030 1035
Val Ser Arg Asn Asn Leu Asp Ser Val Met Glu Lys Leu Ser Ser
1040 1045 1050
Val Asp Val Ser Ala Glu Ile Ile Gly Arg Val Thr Thr Ser Pro
1055 1060 1065
Val Ile Glu Leu Lys Val Asp Gly Ile Thr His Leu Asn Glu Lys
1070 1075 1080
Thr Ser Leu Leu Arg Asp Met Trp Glu Asp Thr Ser Phe Gln Leu
1085 1090 1095
Glu Lys Leu Gln Arg Leu Ala Ser Cys Val Glu Leu Glu Lys Glu
1100 1105 1110
Gly Leu Lys Phe Arg His Glu Pro Ser Trp Pro Leu Ser Phe Thr
1115 1120 1125
Pro Ser Val Thr Asp Glu Lys Phe Leu Thr Thr Thr Leu Lys Pro
1130 1135 1140
Lys Ile Ala Ile Ile Arg Glu Glu Gly Ser Asn Gly Asp Arg Glu
1145 1150 1155
Met Ser Ala Ala Phe Tyr Ala Ala Gly Phe Glu Pro Trp Asp Val
1160 1165 1170
Ala Met Ser Asp Leu Leu Asn Gly Val Ile Ser Leu Asn Glu Phe
1175 1180 1185
Arg Gly Ile Ala Phe Val Gly Gly Phe Ser Tyr Ala Asp Val Leu
1190 1195 1200
Asp Ser Ser Lys Gly Trp Ala Ala Ser Ile Arg Phe Asn Gln Pro
1205 1210 1215
Leu Leu Asn Gln Phe Gln Glu Phe Tyr Lys Arg Pro Asp Thr Phe
1220 1225 1230
Ser Leu Gly Val Cys Asn Gly Cys Gln Leu Met Ala Leu Leu Gly
1235 1240 1245
Trp Val Pro Gly Pro Gln Val Gly Gly Val Phe Gly Ala Gly Gly
1250 1255 1260
Asp Pro Ser Gln Pro Arg Phe Val His Asn Glu Ser Gly Arg Phe
1265 1270 1275
Glu Cys Arg Phe Thr Ser Val Thr Ile Lys Asp Ser Pro Ala Met
1280 1285 1290
Met Phe Lys Gly Met Glu Gly Ser Thr Leu Gly Val Trp Ala Ala
1295 1300 1305
His Gly Glu Gly Arg Ala Tyr Phe Pro Asp Asp Gly Val Leu Asp
1310 1315 1320
Arg Val Leu His Ser Asp Leu Ala Pro Leu Arg Tyr Cys Asp Asp
1325 1330 1335
Asp Gly Asn Pro Thr Glu Ala Tyr Pro Phe Asn Leu Asn Gly Ser
1340 1345 1350
Pro Leu Gly Val Ala Ala Ile Cys Ser Pro Asp Gly Arg His Leu
1355 1360 1365
Ala Met Met Pro His Pro Glu Arg Cys Phe Leu Met Trp Gln Phe
1370 1375 1380
Pro Trp Tyr Pro Met Asp Trp Asn Val Asp Lys Lys Gly Pro Ser
1385 1390 1395
Pro Trp Leu Arg Met Phe Gln Asn Ala Arg Glu Trp Cys Ser
1400 1405 1410
<210> 2
<211> 4239
<212> DNA
<213> 棉花(Gossypium hirsutum L.)
<400> 2
atggctgggt taagagagct aactgcggca gagttcctgc aaggtacaac aaggcaaact 60
ctgtttttgc agagaaattc ttcgattaag tcaagtaatc tattatgggg caagctatgt 120
aatccaagcc ggatgggata cctgtctaat acgaaaggtg cttctttgag gtgctcttct 180
cggtcaaagc ctaaagcaat ggcttctgga aatgtcccta ctagtttggt tgatgagcaa 240
cctggattga ttgaaaagcc tgctcaagag gtcgtccatt tctaccgtat ccctttgata 300
caagaaggtg caaacgacga gcttctcaaa tcggttcaaa ccaaagtttc taatcacatt 360
gtcgggttga aaaccgagca gtgttttaat ataggccttg catcaaaaat ttcatctgag 420
aagttctcaa cgcttaaatg gattcttggg gaaacatacg agcctgaaaa tttggcaact 480
gagagttttc ttgtgaagaa gaggcaagaa gggttgaata cagtgatagt tgaagttggg 540
ccaaggttgt cttttacaac agcatggtcc tcgaatgctg tttcaatttg tcaatcatgt 600
ggcttgactg aggtgactcg aatggagagg tccagaagat acttgttgta tagtaaggaa 660
gcattgcagg aaaatcaaat taatgagttt gctgcgatgg ttcatgatcg gatgacggag 720
tgtgtttata cgcagaggct cacttcattt gaaactagtg tggctccgga ggaggttcgt 780
tttgtgcctg tcattgagag gggaaggaaa gcgttggagg aaataaatca ggaaatgggt 840
ttagcatttg atgaacaaga cttgcagtac tataccaggc tgtttgtgga ggacataaag 900
cggaatccga cgaatgtaga gttattcgat atcgcccaat ctaacagtga gcatagcagg 960
cattggtttt tcacagggaa gattgttatt gatggacagc ccatggatag gaccctcatg 1020
caaattgtca agagcacttt gaaagcaaat ccaaataatt ctgtcattgg ttttaaggat 1080
aattcgagtg caataaaggg gtttcttgca taccgattac gaccagttaa gcctggaact 1140
gcctgcctac taaatgaaac atctcgtgaa attgatgtct tgtttacagc tgaaacacat 1200
aacttcccat gtgcagtggc accctaccca ggtgcagaga caggtgcagg tggccgtatt 1260
agggatacac atgccactgg aagaggatca tttgttgttg catccacagc tggttacaca 1320
actgggaatc ttaatataga gggatcatat gccccatggg aagactcatc tttcacttat 1380
ccatcaaatt tggcttctcc tttggaaatt ctcattgagg ctagcaatgg tgcatctgac 1440
tatggcaaca aatttggtga gccattaatc cagggtttta ctagaacatt tggaacgaga 1500
ctccctagtg gtgaacgtcg tgaatggctg aagcctatca tgtttagtgg aggcattgga 1560
cagattgatc acactcatat atcgaaaggg gacccagaaa ttggaatgtt agttgtaaag 1620
attggtggcc ctgcatatcg gattggaatg ggcggtggag ctgcgtctag tatggttagt 1680
ggccagaatg atgcagaact tgattttaat gctgtacagc gtggagatgc tgaaatggca 1740
caaaaactgt accgtgtagt tcgtgcctgc attgagatgg gggaggataa cccgattatt 1800
agcattcatg atcagggagc tggtgggaat tgcaatgttg tcaaggaaat catataccca 1860
aagggtgctg agattgatat tagggccatt gttgttggag atcacactat gtctgttttg 1920
gagatatggg gtgcagagta tcaagaacaa gatgcaattt tggtaaaacc tgaaagccgc 1980
aagctgttgg aatcaatatg tgcaagggaa agactttcga tggctgttat tgggactatt 2040
aatggtgagg gacgtgttgt tctagttgat agcgtagcta ttgaaaaaag ccgtgcaagt 2100
ggactccctc cccctcctcc agctgttgat cttgagcttg agaaagtgct aggtgacatg 2160
cctcaaaaat cctttgaatt caagcgagtg tcttatgcac gagaaccgct tgatgttgct 2220
cctgcaatca cagtcatgga ctcattgaag agagtattaa gacttccatc tgtatgttcc 2280
aaacggtttt tgacaacaaa agttgataga tgtgtaacag gtcttgtagc acagcagcaa 2340
acggttggtc ccttgcagtt acctctagct gatgttgcag tcattgctca aagttatgtt 2400
gacttaactg ggggtgcctg tgccattgga gagcaaccta tcaaggggct gcttgatcca 2460
aaagcaatgg ctagactggc tgttggagaa gctctcacaa atcttgtttg ggcaaaggtt 2520
acttctttgt ctgatgtcaa agcaagcgga aattggatgt atgctgccaa gcttgagggt 2580
gaaggagcag ccatgtatga tgctgctatt gctctttcag aagcaatgat tgaactcggt 2640
atcgctattg atggtgggaa ggacagtctg tcaatggctg cccatgcagg tggggaggtt 2700
gttaaggctc ctggaaatct tgtaattagt gcctatgtca cttgtcctga cataacaaaa 2760
acggtaaccc cagatttgaa gcaaggagat gatggtattt tgcttcatat tgatttggca 2820
aagggaaagc ggcgtctggg tggatccgct ttggctcagg tttttgatca gattgggaat 2880
gactgccctg atattgatga tgtttcttac cttaagagag tttttgaggg ggtgcaggac 2940
gttcttggag atggtctgat ctctgcaggt catgatatca gtgatggtgg attactagtt 3000
tgcgcgttgg agatggcatt tgctggaaat tgtggcattg cattggactt ggcttctcta 3060
ggaaatagtg ttttccaatc actttttgct gaagagcttg gtctcattct tgaggtaagc 3120
aggaataact tggatagtgt gatggagaag cttagcagtg tggatgtttc tgctgagata 3180
ataggacgag taaccacctc acctgtgata gagctcaagg ttgatggaat tactcattta 3240
aatgagaaaa cttctctgct gagagatatg tgggaggata caagtttcca gctcgaaaag 3300
ttgcagagat tagcttcttg tgtggaactg gagaaagaag gtttgaagtt tcggcatgag 3360
ccttcttggc ccttgtcttt cactccttca gttacagatg agaaattttt gactacaact 3420
ttaaaaccga aaatagccat cattcgtgag gaagggagca atggagacag agaaatgtca 3480
gcagcatttt atgctgctgg ttttgagcct tgggatgttg caatgtcaga ccttcttaac 3540
ggagttattt ctttgaatga attccgtgga attgcatttg ttggaggttt tagttatgcc 3600
gatgtgcttg attcttcaaa aggttgggct gcgtccatac gcttcaatca gcctcttctc 3660
aatcagtttc aggaatttta caagcgccct gatactttca gtcttggcgt ttgcaatgga 3720
tgtcagttaa tggctctgtt agggtgggtc ccagggcccc aagtgggggg tgtttttggt 3780
gctggtgggg acccatcaca gcccaggttt gttcacaatg agtctggccg atttgaatgc 3840
cggttcacaa gtgtgactat aaaggactct cccgccatga tgtttaaagg aatggaaggc 3900
agtacattag gtgtatgggc tgcccatggt gagggaagag catattttcc tgatgatggt 3960
gttctggatc gtgtattaca ttcagatttg gctccattaa gatattgcga tgatgatggg 4020
aacccaacag aggcataccc cttcaacttg aatggttctc ctttaggagt ggctgcaatt 4080
tgttctcctg atggtcgaca tcttgccatg atgcctcatc cagagcggtg tttcctgatg 4140
tggcagttcc cttggtatcc aatggactgg aatgtggaca agaaaggccc tagtccatgg 4200
ttaagaatgt ttcaaaatgc cagagagtgg tgctcatga 4239
<210> 3
<211> 4468
<212> DNA
<213> 棉花(Gossypium hirsutum L.)
<400> 3
atggctgggt taagagagct aactgcggca gagttcctgc aagtaagttt tcctttatgt 60
tctacactct gtttggtctc cgagaaagtg tgttaaagca attttccacg tacgggtttt 120
ccttgtttta gctaagaaat aggactgttg ttttcctttg atttttctta ttaaactaat 180
aaaaactgca ttgagatctt cttcttcata caaactgatt caggttctta actttcttct 240
tcgttttttg gtgcactttg ccttatttca gggtacaaca aggcaaactc tgtttttgca 300
gagaaattct tcgattaagt caagtaatct attatggggc aagctatgta atccaagccg 360
gatgggatac ctgtctaata cgaaaggtgc ttctttgagg tgctcttctc ggtcaaagcc 420
taaagcaatg gcttctggaa atgtccctac tagtttggtt gatgagcaac ctggattgat 480
tgaaaagcct gctcaagagg tcgtccattt ctaccgtatc cctttgatac aagaaggtgc 540
aaacgacgag cttctcaaat cggttcaaac caaagtttct aatcacattg tcgggttgaa 600
aaccgagcag tgttttaata taggccttgc atcaaaaatt tcatctgaga agttctcaac 660
gcttaaatgg attcttgggg aaacatacga gcctgaaaat ttggcaactg agagttttct 720
tgtgaagaag aggcaagaag ggttgaatac agtgatagtt gaagttgggc caaggttgtc 780
ttttacaaca gcatggtcct cgaatgctgt ttcaatttgt caatcatgtg gcttgactga 840
ggtgactcga atggagaggt ccagaagata cttgttgtat agtaaggaag cattgcagga 900
aaatcaaatt aatgagtttg ctgcgatggt tcatgatcgg atgacggagt gtgtttatac 960
gcagaggctc acttcatttg aaactagtgt ggctccggag gaggttcgtt ttgtgcctgt 1020
cattgagagg ggaaggaaag cgttggagga aataaatcag gaaatgggtt tagcatttga 1080
tgaacaagac ttgcagtact ataccaggct gtttgtggag gacataaagc ggaatccgac 1140
gaatgtagag ttattcgata tcgcccaatc taacagtgag catagcaggc attggttttt 1200
cacagggaag attgttattg atggacagcc catggatagg accctcatgc aaattgtcaa 1260
gagcactttg aaagcaaatc caaataattc tgtcattggt tttaaggata attcgagtgc 1320
aataaagggg tttcttgcat accgattacg accagttaag cctggaactg cctgcctact 1380
aaatgaaaca tctcgtgaaa ttgatgtctt gtttacagct gaaacacata acttcccatg 1440
tgcagtggca ccctacccag gtgcagagac aggtgcaggt ggccgtatta gggatacaca 1500
tgccactgga agaggatcat ttgttgttgc atccacagct ggttacacaa ctgggaatct 1560
taatatagag ggatcatatg ccccatggga agactcatct ttcacttatc catcaaattt 1620
ggcttctcct ttggaaattc tcattgaggc tagcaatggt gcatctgact atggcaacaa 1680
atttggtgag ccattaatcc agggttttac tagaacattt ggaacgagac tccctagtgg 1740
tgaacgtcgt gaatggctga agcctatcat gtttagtgga ggcattggac agattgatca 1800
cactcatata tcgaaagggg acccagaaat tggaatgtta gttgtaaaga ttggtggccc 1860
tgcatatcgg attggaatgg gcggtggagc tgcgtctagt atggttagtg gccagaatga 1920
tgcagaactt gattttaatg ctgtacagcg tggagatgct gaaatggcac aaaaactgta 1980
ccgtgtagtt cgtgcctgca ttgagatggg ggaggataac ccgattatta gcattcatga 2040
tcagggagct ggtgggaatt gcaatgttgt caaggaaatc atatacccaa agggtgctga 2100
gattgatatt agggccattg ttgttggaga tcacactatg tctgttttgg agatatgggg 2160
tgcagagtat caagaacaag atgcaatttt ggtaaaacct gaaagccgca agctgttgga 2220
atcaatatgt gcaagggaaa gactttcgat ggctgttatt gggactatta atggtgaggg 2280
acgtgttgtt ctagttgata gcgtagctat tgaaaaaagc cgtgcaagtg gactccctcc 2340
ccctcctcca gctgttgatc ttgagcttga gaaagtgcta ggtgacatgc ctcaaaaatc 2400
ctttgaattc aagcgagtgt cttatgcacg agaaccgctt gatgttgctc ctgcaatcac 2460
agtcatggac tcattgaaga gagtattaag acttccatct gtatgttcca aacggttttt 2520
gacaacaaaa gttgatagat gtgtaacagg tcttgtagca cagcagcaaa cggttggtcc 2580
cttgcagtta cctctagctg atgttgcagt cattgctcaa agttatgttg acttaactgg 2640
gggtgcctgt gccattggag agcaacctat caaggggctg cttgatccaa aagcaatggc 2700
tagactggct gttggagaag ctctcacaaa tcttgtttgg gcaaaggtta cttctttgtc 2760
tgatgtcaaa gcaagcggaa attggatgta tgctgccaag cttgagggtg aaggagcagc 2820
catgtatgat gctgctattg ctctttcaga agcaatgatt gaactcggta tcgctattga 2880
tggtgggaag gacagtctgt caatggctgc ccatgcaggt ggggaggttg ttaaggctcc 2940
tggaaatctt gtaattagtg cctatgtcac ttgtcctgac ataacaaaaa cggtaacccc 3000
agatttgaag caaggagatg atggtatttt gcttcatatt gatttggcaa agggaaagcg 3060
gcgtctgggt ggatccgctt tggctcaggt ttttgatcag attgggaatg actgccctga 3120
tattgatgat gtttcttacc ttaagagagt ttttgagggg gtgcaggacg ttcttggaga 3180
tggtctgatc tctgcaggtc atgatatcag tgatggtgga ttactagttt gcgcgttgga 3240
gatggcattt gctggaaatt gtggcattgc attggacttg gcttctctag gaaatagtgt 3300
tttccaatca ctttttgctg aagagcttgg tctcattctt gaggtaagca ggaataactt 3360
ggatagtgtg atggagaagc ttagcagtgt ggatgtttct gctgagataa taggacgagt 3420
aaccacctca cctgtgatag agctcaaggt tgatggaatt actcatttaa atgagaaaac 3480
ttctctgctg agagatatgt gggaggatac aagtttccag ctcgaaaagt tgcagagatt 3540
agcttcttgt gtggaactgg agaaagaagg tttgaagttt cggcatgagc cttcttggcc 3600
cttgtctttc actccttcag ttacagatga gaaatttttg actacaactt taaaaccgaa 3660
aatagccatc attcgtgagg aagggagcaa tggagacaga gaaatgtcag cagcatttta 3720
tgctgctggt tttgagcctt gggatgttgc aatgtcagac cttcttaacg gagttatttc 3780
tttgaatgaa ttccgtggaa ttgcatttgt tggaggtttt agttatgccg atgtgcttga 3840
ttcttcaaaa ggttgggctg cgtccatacg cttcaatcag cctcttctca atcagtttca 3900
ggaattttac aagcgccctg atactttcag tcttggcgtt tgcaatggat gtcagttaat 3960
ggctctgtta gggtgggtcc cagggcccca agtggggggt gtttttggtg ctggtgggga 4020
cccatcacag cccaggtttg ttcacaatga gtctggccga tttgaatgcc ggttcacaag 4080
tgtgactata aaggactctc ccgccatgat gtttaaagga atggaaggca gtacattagg 4140
tgtatgggct gcccatggtg agggaagagc atattttcct gatgatggtg ttctggatcg 4200
tgtattacat tcagatttgg ctccattaag atattgcgat gatgatggga acccaacaga 4260
ggcatacccc ttcaacttga atggttctcc tttaggagtg gctgcaattt gttctcctga 4320
tggtcgacat cttgccatga tgcctcatcc agagcggtgt ttcctgatgt ggcagttccc 4380
ttggtatcca atggactgga atgtggacaa gaaaggccct agtccatggt taagaatgtt 4440
tcaaaatgcc agagagtggt gctcatga 4468
<210> 4
<211> 1345
<212> PRT
<213> 棉花(Gossypium hirsutum L.)
<400> 4
Met Ala Gly Leu Arg Glu Leu Thr Ala Ala Glu Phe Leu Gln Gly Thr
1 5 10 15
Thr Arg Gln Thr Leu Phe Leu Gln Arg Asn Ser Ser Ile Lys Ser Ser
20 25 30
Asn Leu Leu Trp Gly Lys Leu Cys Asn Pro Ser Arg Met Gly Tyr Leu
35 40 45
Ser Asn Thr Lys Gly Ala Ser Leu Arg Cys Ser Ser Arg Ser Lys Pro
50 55 60
Lys Ala Met Ala Ser Gly Asn Val Pro Thr Ser Leu Val Asp Glu Gln
65 70 75 80
Pro Gly Leu Ile Glu Lys Pro Ala Gln Glu Val Val His Phe Tyr Arg
85 90 95
Ile Pro Leu Ile Gln Glu Gly Ala Asn Asp Glu Leu Leu Lys Ser Val
100 105 110
Gln Thr Lys Val Ser Asn His Ile Val Gly Leu Lys Thr Glu Gln Cys
115 120 125
Phe Asn Ile Gly Leu Ala Ser Lys Ile Ser Ser Glu Lys Phe Ser Thr
130 135 140
Leu Lys Trp Ile Leu Gly Glu Thr Tyr Glu Pro Glu Asn Leu Ala Thr
145 150 155 160
Glu Ser Phe Leu Val Lys Lys Arg Gln Glu Gly Leu Asn Thr Val Ile
165 170 175
Val Glu Val Gly Pro Arg Leu Ser Phe Thr Thr Ala Trp Ser Ser Asn
180 185 190
Ala Val Ser Ile Cys Gln Ser Cys Gly Leu Thr Glu Val Thr Arg Met
195 200 205
Glu Arg Ser Arg Arg Tyr Leu Leu Tyr Ser Lys Glu Ala Leu Gln Glu
210 215 220
Asn Gln Ile Asn Glu Phe Ala Ala Met Val His Asp Arg Met Thr Glu
225 230 235 240
Cys Val Tyr Ile Ala Gln Ser Asn Ser Glu His Ser Arg His Trp Phe
245 250 255
Phe Thr Gly Lys Ile Val Ile Asp Gly Gln Pro Met Asp Arg Thr Leu
260 265 270
Met Gln Ile Val Lys Ser Thr Leu Lys Ala Asn Pro Asn Asn Ser Val
275 280 285
Ile Gly Phe Lys Asp Asn Ser Ser Ala Ile Lys Gly Phe Leu Ala Tyr
290 295 300
Arg Leu Arg Pro Val Lys Pro Gly Thr Ala Cys Leu Leu Asn Glu Thr
305 310 315 320
Ser Arg Glu Ile Asp Val Leu Phe Thr Ala Glu Thr His Asn Phe Pro
325 330 335
Cys Ala Val Ala Pro Tyr Pro Gly Ala Glu Thr Gly Ala Gly Gly Arg
340 345 350
Ile Arg Asp Thr His Ala Thr Gly Arg Gly Ser Phe Val Val Ala Ser
355 360 365
Thr Ala Gly Tyr Thr Thr Gly Asn Leu Asn Ile Glu Gly Ser Tyr Ala
370 375 380
Pro Trp Glu Asp Ser Ser Phe Thr Tyr Pro Ser Asn Leu Ala Ser Pro
385 390 395 400
Leu Glu Ile Leu Ile Glu Ala Ser Asn Gly Ala Ser Asp Tyr Gly Asn
405 410 415
Lys Phe Gly Glu Pro Leu Ile Gln Gly Phe Thr Arg Thr Phe Gly Thr
420 425 430
Arg Leu Pro Ser Gly Glu Arg Arg Glu Trp Leu Lys Pro Ile Met Phe
435 440 445
Ser Gly Gly Ile Gly Gln Ile Asp His Thr His Ile Ser Lys Gly Asp
450 455 460
Pro Glu Ile Gly Met Leu Val Val Lys Ile Gly Gly Pro Ala Tyr Arg
465 470 475 480
Ile Gly Met Gly Gly Gly Ala Ala Ser Ser Met Val Ser Gly Gln Asn
485 490 495
Asp Ala Glu Leu Asp Phe Asn Ala Val Gln Arg Gly Asp Ala Glu Met
500 505 510
Ala Gln Lys Leu Tyr Arg Val Val Arg Ala Cys Ile Glu Met Gly Glu
515 520 525
Asp Asn Pro Ile Ile Ser Ile His Asp Gln Gly Ala Gly Gly Asn Cys
530 535 540
Asn Val Val Lys Glu Ile Ile Tyr Pro Lys Gly Ala Glu Ile Asp Ile
545 550 555 560
Arg Ala Ile Val Val Gly Asp His Thr Met Ser Val Leu Glu Ile Trp
565 570 575
Gly Ala Glu Tyr Gln Glu Gln Asp Ala Ile Leu Val Lys Pro Glu Ser
580 585 590
Arg Lys Leu Leu Glu Ser Ile Cys Ala Arg Glu Arg Leu Ser Met Ala
595 600 605
Val Ile Gly Thr Ile Asn Gly Glu Gly Arg Val Val Leu Val Asp Ser
610 615 620
Val Ala Ile Glu Lys Ser Arg Ala Ser Gly Leu Pro Pro Pro Pro Pro
625 630 635 640
Ala Val Asp Leu Glu Leu Glu Lys Val Leu Gly Asp Met Pro Gln Lys
645 650 655
Ser Phe Glu Phe Lys Arg Val Ser Tyr Ala Arg Glu Pro Leu Asp Val
660 665 670
Ala Pro Ala Ile Thr Val Met Asp Ser Leu Lys Arg Val Leu Arg Leu
675 680 685
Pro Ser Val Cys Ser Lys Arg Phe Leu Thr Thr Lys Val Asp Arg Cys
690 695 700
Val Thr Gly Leu Val Ala Gln Gln Gln Thr Val Gly Pro Leu Gln Leu
705 710 715 720
Pro Leu Ala Asp Val Ala Val Ile Ala Gln Ser Tyr Val Asp Leu Thr
725 730 735
Gly Gly Ala Cys Ala Ile Gly Glu Gln Pro Ile Lys Gly Leu Leu Asp
740 745 750
Pro Lys Ala Met Ala Arg Leu Ala Val Gly Glu Ala Leu Thr Asn Leu
755 760 765
Val Trp Ala Lys Val Thr Ser Leu Ser Asp Val Lys Ala Ser Gly Asn
770 775 780
Trp Met Tyr Ala Ala Lys Leu Glu Gly Glu Gly Ala Ala Met Tyr Asp
785 790 795 800
Ala Ala Ile Ala Leu Ser Glu Ala Met Ile Glu Leu Gly Ile Ala Ile
805 810 815
Asp Gly Gly Lys Asp Ser Leu Ser Met Ala Ala His Ala Gly Gly Glu
820 825 830
Val Val Lys Ala Pro Gly Asn Leu Val Ile Ser Ala Tyr Val Thr Cys
835 840 845
Pro Asp Ile Thr Lys Thr Val Thr Pro Asp Leu Lys Gln Gly Asp Asp
850 855 860
Gly Ile Leu Leu His Ile Asp Leu Ala Lys Gly Lys Arg Arg Leu Gly
865 870 875 880
Gly Ser Ala Leu Ala Gln Val Phe Asp Gln Ile Gly Asn Asp Cys Pro
885 890 895
Asp Ile Asp Asp Val Ser Tyr Leu Lys Arg Val Phe Glu Gly Val Gln
900 905 910
Asp Val Leu Gly Asp Gly Leu Ile Ser Ala Gly His Asp Ile Ser Asp
915 920 925
Gly Gly Leu Leu Val Cys Ala Leu Glu Met Ala Phe Ala Gly Asn Cys
930 935 940
Gly Ile Ala Leu Asp Leu Ala Ser Leu Gly Asn Ser Val Phe Gln Ser
945 950 955 960
Leu Phe Ala Glu Glu Leu Gly Leu Ile Leu Glu Val Ser Arg Asn Asn
965 970 975
Leu Asp Ser Val Met Glu Lys Leu Ser Ser Val Asp Val Ser Ala Glu
980 985 990
Ile Ile Gly Arg Val Thr Thr Ser Pro Val Ile Glu Leu Lys Val Asp
995 1000 1005
Gly Ile Thr His Leu Asn Glu Lys Thr Ser Leu Leu Arg Asp Met
1010 1015 1020
Trp Glu Asp Thr Ser Phe Gln Leu Glu Lys Leu Gln Arg Leu Ala
1025 1030 1035
Ser Cys Val Glu Leu Glu Lys Glu Gly Leu Lys Phe Arg His Glu
1040 1045 1050
Pro Ser Trp Pro Leu Ser Phe Thr Pro Ser Val Thr Asp Glu Lys
1055 1060 1065
Phe Leu Thr Thr Thr Leu Lys Pro Lys Ile Ala Ile Ile Arg Glu
1070 1075 1080
Glu Gly Ser Asn Gly Asp Arg Glu Met Ser Ala Ala Phe Tyr Ala
1085 1090 1095
Ala Gly Phe Glu Pro Trp Asp Val Ala Met Ser Asp Leu Leu Asn
1100 1105 1110
Gly Val Ile Ser Leu Asn Glu Phe Arg Gly Ile Ala Phe Val Gly
1115 1120 1125
Gly Phe Ser Tyr Ala Asp Val Leu Asp Ser Ser Lys Gly Trp Ala
1130 1135 1140
Ala Ser Ile Arg Phe Asn Gln Pro Leu Leu Asn Gln Phe Gln Glu
1145 1150 1155
Phe Tyr Lys Arg Pro Asp Thr Phe Ser Leu Gly Val Cys Asn Gly
1160 1165 1170
Cys Gln Leu Met Ala Leu Leu Gly Trp Val Pro Gly Pro Gln Val
1175 1180 1185
Gly Gly Val Phe Gly Ala Gly Gly Asp Pro Ser Gln Pro Arg Phe
1190 1195 1200
Val His Asn Glu Ser Gly Arg Phe Glu Cys Arg Phe Thr Ser Val
1205 1210 1215
Thr Ile Lys Asp Ser Pro Ala Met Met Phe Lys Gly Met Glu Gly
1220 1225 1230
Ser Thr Leu Gly Val Trp Ala Ala His Gly Glu Gly Arg Ala Tyr
1235 1240 1245
Phe Pro Asp Asp Gly Val Leu Asp Arg Val Leu His Ser Asp Leu
1250 1255 1260
Ala Pro Leu Arg Tyr Cys Asp Asp Asp Gly Asn Pro Thr Glu Ala
1265 1270 1275
Tyr Pro Phe Asn Leu Asn Gly Ser Pro Leu Gly Val Ala Ala Ile
1280 1285 1290
Cys Ser Pro Asp Gly Arg His Leu Ala Met Met Pro His Pro Glu
1295 1300 1305
Arg Cys Phe Leu Met Trp Gln Phe Pro Trp Tyr Pro Met Asp Trp
1310 1315 1320
Asn Val Asp Lys Lys Gly Pro Ser Pro Trp Leu Arg Met Phe Gln
1325 1330 1335
Asn Ala Arg Glu Trp Cys Ser
1340 1345
<210> 5
<211> 4038
<212> DNA
<213> 棉花(Gossypium hirsutum L.)
<400> 5
atggctgggt taagagagct aactgcggca gagttcctgc aaggtacaac aaggcaaact 60
ctgtttttgc agagaaattc ttcgattaag tcaagtaatc tattatgggg caagctatgt 120
aatccaagcc ggatgggata cctgtctaat acgaaaggtg cttctttgag gtgctcttct 180
cggtcaaagc ctaaagcaat ggcttctgga aatgtcccta ctagtttggt tgatgagcaa 240
cctggattga ttgaaaagcc tgctcaagag gtcgtccatt tctaccgtat ccctttgata 300
caagaaggtg caaacgacga gcttctcaaa tcggttcaaa ccaaagtttc taatcacatt 360
gtcgggttga aaaccgagca gtgttttaat ataggccttg catcaaaaat ttcatctgag 420
aagttctcaa cgcttaaatg gattcttggg gaaacatacg agcctgaaaa tttggcaact 480
gagagttttc ttgtgaagaa gaggcaagaa gggttgaata cagtgatagt tgaagttggg 540
ccaaggttgt cttttacaac agcatggtcc tcgaatgctg tttcaatttg tcaatcatgt 600
ggcttgactg aggtgactcg aatggagagg tccagaagat acttgttgta tagtaaggaa 660
gcattgcagg aaaatcaaat taatgagttt gctgcgatgg ttcatgatcg gatgacggag 720
tgtgtttata tcgcccaatc taacagtgag catagcaggc attggttttt cacagggaag 780
attgttattg atggacagcc catggatagg accctcatgc aaattgtcaa gagcactttg 840
aaagcaaatc caaataattc tgtcattggt tttaaggata attcgagtgc aataaagggg 900
tttcttgcat accgattacg accagttaag cctggaactg cctgcctact aaatgaaaca 960
tctcgtgaaa ttgatgtctt gtttacagct gaaacacata acttcccatg tgcagtggca 1020
ccctacccag gtgcagagac aggtgcaggt ggccgtatta gggatacaca tgccactgga 1080
agaggatcat ttgttgttgc atccacagct ggttacacaa ctgggaatct taatatagag 1140
ggatcatatg ccccatggga agactcatct ttcacttatc catcaaattt ggcttctcct 1200
ttggaaattc tcattgaggc tagcaatggt gcatctgact atggcaacaa atttggtgag 1260
ccattaatcc agggttttac tagaacattt ggaacgagac tccctagtgg tgaacgtcgt 1320
gaatggctga agcctatcat gtttagtgga ggcattggac agattgatca cactcatata 1380
tcgaaagggg acccagaaat tggaatgtta gttgtaaaga ttggtggccc tgcatatcgg 1440
attggaatgg gcggtggagc tgcgtctagt atggttagtg gccagaatga tgcagaactt 1500
gattttaatg ctgtacagcg tggagatgct gaaatggcac aaaaactgta ccgtgtagtt 1560
cgtgcctgca ttgagatggg ggaggataac ccgattatta gcattcatga tcagggagct 1620
ggtgggaatt gcaatgttgt caaggaaatc atatacccaa agggtgctga gattgatatt 1680
agggccattg ttgttggaga tcacactatg tctgttttgg agatatgggg tgcagagtat 1740
caagaacaag atgcaatttt ggtaaaacct gaaagccgca agctgttgga atcaatatgt 1800
gcaagggaaa gactttcgat ggctgttatt gggactatta atggtgaggg acgtgttgtt 1860
ctagttgata gcgtagctat tgaaaaaagc cgtgcaagtg gactccctcc ccctcctcca 1920
gctgttgatc ttgagcttga gaaagtgcta ggtgacatgc ctcaaaaatc ctttgaattc 1980
aagcgagtgt cttatgcacg agaaccgctt gatgttgctc ctgcaatcac agtcatggac 2040
tcattgaaga gagtattaag acttccatct gtatgttcca aacggttttt gacaacaaaa 2100
gttgatagat gtgtaacagg tcttgtagca cagcagcaaa cggttggtcc cttgcagtta 2160
cctctagctg atgttgcagt cattgctcaa agttatgttg acttaactgg gggtgcctgt 2220
gccattggag agcaacctat caaggggctg cttgatccaa aagcaatggc tagactggct 2280
gttggagaag ctctcacaaa tcttgtttgg gcaaaggtta cttctttgtc tgatgtcaaa 2340
gcaagcggaa attggatgta tgctgccaag cttgagggtg aaggagcagc catgtatgat 2400
gctgctattg ctctttcaga agcaatgatt gaactcggta tcgctattga tggtgggaag 2460
gacagtctgt caatggctgc ccatgcaggt ggggaggttg ttaaggctcc tggaaatctt 2520
gtaattagtg cctatgtcac ttgtcctgac ataacaaaaa cggtaacccc agatttgaag 2580
caaggagatg atggtatttt gcttcatatt gatttggcaa agggaaagcg gcgtctgggt 2640
ggatccgctt tggctcaggt ttttgatcag attgggaatg actgccctga tattgatgat 2700
gtttcttacc ttaagagagt ttttgagggg gtgcaggacg ttcttggaga tggtctgatc 2760
tctgcaggtc atgatatcag tgatggtgga ttactagttt gcgcgttgga gatggcattt 2820
gctggaaatt gtggcattgc attggacttg gcttctctag gaaatagtgt tttccaatca 2880
ctttttgctg aagagcttgg tctcattctt gaggtaagca ggaataactt ggatagtgtg 2940
atggagaagc ttagcagtgt ggatgtttct gctgagataa taggacgagt aaccacctca 3000
cctgtgatag agctcaaggt tgatggaatt actcatttaa atgagaaaac ttctctgctg 3060
agagatatgt gggaggatac aagtttccag ctcgaaaagt tgcagagatt agcttcttgt 3120
gtggaactgg agaaagaagg tttgaagttt cggcatgagc cttcttggcc cttgtctttc 3180
actccttcag ttacagatga gaaatttttg actacaactt taaaaccgaa aatagccatc 3240
attcgtgagg aagggagcaa tggagacaga gaaatgtcag cagcatttta tgctgctggt 3300
tttgagcctt gggatgttgc aatgtcagac cttcttaacg gagttatttc tttgaatgaa 3360
ttccgtggaa ttgcatttgt tggaggtttt agttatgccg atgtgcttga ttcttcaaaa 3420
ggttgggctg cgtccatacg cttcaatcag cctcttctca atcagtttca ggaattttac 3480
aagcgccctg atactttcag tcttggcgtt tgcaatggat gtcagttaat ggctctgtta 3540
gggtgggtcc cagggcccca agtggggggt gtttttggtg ctggtgggga cccatcacag 3600
cccaggtttg ttcacaatga gtctggccga tttgaatgcc ggttcacaag tgtgactata 3660
aaggactctc ccgccatgat gtttaaagga atggaaggca gtacattagg tgtatgggct 3720
gcccatggtg agggaagagc atattttcct gatgatggtg ttctggatcg tgtattacat 3780
tcagatttgg ctccattaag atattgcgat gatgatggga acccaacaga ggcatacccc 3840
ttcaacttga atggttctcc tttaggagtg gctgcaattt gttctcctga tggtcgacat 3900
cttgccatga tgcctcatcc agagcggtgt ttcctgatgt ggcagttccc ttggtatcca 3960
atggactgga atgtggacaa gaaaggccct agtccatggt taagaatgtt tcaaaatgcc 4020
agagagtggt gctcatga 4038
<210> 6
<211> 4267
<212> DNA
<213> 棉花(Gossypium hirsutum L.)
<400> 6
atggctgggt taagagagct aactgcggca gagttcctgc aagtaagttt tcctttatgt 60
tctacactct gtttggtctc cgagaaagtg tgttaaagca attttccacg tacgggtttt 120
ccttgtttta gctaagaaat aggactgttg ttttcctttg atttttctta ttaaactaat 180
aaaaactgca ttgagatctt cttcttcata caaactgatt caggttctta actttcttct 240
tcgttttttg gtgcactttg ccttatttca gggtacaaca aggcaaactc tgtttttgca 300
gagaaattct tcgattaagt caagtaatct attatggggc aagctatgta atccaagccg 360
gatgggatac ctgtctaata cgaaaggtgc ttctttgagg tgctcttctc ggtcaaagcc 420
taaagcaatg gcttctggaa atgtccctac tagtttggtt gatgagcaac ctggattgat 480
tgaaaagcct gctcaagagg tcgtccattt ctaccgtatc cctttgatac aagaaggtgc 540
aaacgacgag cttctcaaat cggttcaaac caaagtttct aatcacattg tcgggttgaa 600
aaccgagcag tgttttaata taggccttgc atcaaaaatt tcatctgaga agttctcaac 660
gcttaaatgg attcttgggg aaacatacga gcctgaaaat ttggcaactg agagttttct 720
tgtgaagaag aggcaagaag ggttgaatac agtgatagtt gaagttgggc caaggttgtc 780
ttttacaaca gcatggtcct cgaatgctgt ttcaatttgt caatcatgtg gcttgactga 840
ggtgactcga atggagaggt ccagaagata cttgttgtat agtaaggaag cattgcagga 900
aaatcaaatt aatgagtttg ctgcgatggt tcatgatcgg atgacggagt gtgtttatat 960
cgcccaatct aacagtgagc atagcaggca ttggtttttc acagggaaga ttgttattga 1020
tggacagccc atggatagga ccctcatgca aattgtcaag agcactttga aagcaaatcc 1080
aaataattct gtcattggtt ttaaggataa ttcgagtgca ataaaggggt ttcttgcata 1140
ccgattacga ccagttaagc ctggaactgc ctgcctacta aatgaaacat ctcgtgaaat 1200
tgatgtcttg tttacagctg aaacacataa cttcccatgt gcagtggcac cctacccagg 1260
tgcagagaca ggtgcaggtg gccgtattag ggatacacat gccactggaa gaggatcatt 1320
tgttgttgca tccacagctg gttacacaac tgggaatctt aatatagagg gatcatatgc 1380
cccatgggaa gactcatctt tcacttatcc atcaaatttg gcttctcctt tggaaattct 1440
cattgaggct agcaatggtg catctgacta tggcaacaaa tttggtgagc cattaatcca 1500
gggttttact agaacatttg gaacgagact ccctagtggt gaacgtcgtg aatggctgaa 1560
gcctatcatg tttagtggag gcattggaca gattgatcac actcatatat cgaaagggga 1620
cccagaaatt ggaatgttag ttgtaaagat tggtggccct gcatatcgga ttggaatggg 1680
cggtggagct gcgtctagta tggttagtgg ccagaatgat gcagaacttg attttaatgc 1740
tgtacagcgt ggagatgctg aaatggcaca aaaactgtac cgtgtagttc gtgcctgcat 1800
tgagatgggg gaggataacc cgattattag cattcatgat cagggagctg gtgggaattg 1860
caatgttgtc aaggaaatca tatacccaaa gggtgctgag attgatatta gggccattgt 1920
tgttggagat cacactatgt ctgttttgga gatatggggt gcagagtatc aagaacaaga 1980
tgcaattttg gtaaaacctg aaagccgcaa gctgttggaa tcaatatgtg caagggaaag 2040
actttcgatg gctgttattg ggactattaa tggtgaggga cgtgttgttc tagttgatag 2100
cgtagctatt gaaaaaagcc gtgcaagtgg actccctccc cctcctccag ctgttgatct 2160
tgagcttgag aaagtgctag gtgacatgcc tcaaaaatcc tttgaattca agcgagtgtc 2220
ttatgcacga gaaccgcttg atgttgctcc tgcaatcaca gtcatggact cattgaagag 2280
agtattaaga cttccatctg tatgttccaa acggtttttg acaacaaaag ttgatagatg 2340
tgtaacaggt cttgtagcac agcagcaaac ggttggtccc ttgcagttac ctctagctga 2400
tgttgcagtc attgctcaaa gttatgttga cttaactggg ggtgcctgtg ccattggaga 2460
gcaacctatc aaggggctgc ttgatccaaa agcaatggct agactggctg ttggagaagc 2520
tctcacaaat cttgtttggg caaaggttac ttctttgtct gatgtcaaag caagcggaaa 2580
ttggatgtat gctgccaagc ttgagggtga aggagcagcc atgtatgatg ctgctattgc 2640
tctttcagaa gcaatgattg aactcggtat cgctattgat ggtgggaagg acagtctgtc 2700
aatggctgcc catgcaggtg gggaggttgt taaggctcct ggaaatcttg taattagtgc 2760
ctatgtcact tgtcctgaca taacaaaaac ggtaacccca gatttgaagc aaggagatga 2820
tggtattttg cttcatattg atttggcaaa gggaaagcgg cgtctgggtg gatccgcttt 2880
ggctcaggtt tttgatcaga ttgggaatga ctgccctgat attgatgatg tttcttacct 2940
taagagagtt tttgaggggg tgcaggacgt tcttggagat ggtctgatct ctgcaggtca 3000
tgatatcagt gatggtggat tactagtttg cgcgttggag atggcatttg ctggaaattg 3060
tggcattgca ttggacttgg cttctctagg aaatagtgtt ttccaatcac tttttgctga 3120
agagcttggt ctcattcttg aggtaagcag gaataacttg gatagtgtga tggagaagct 3180
tagcagtgtg gatgtttctg ctgagataat aggacgagta accacctcac ctgtgataga 3240
gctcaaggtt gatggaatta ctcatttaaa tgagaaaact tctctgctga gagatatgtg 3300
ggaggataca agtttccagc tcgaaaagtt gcagagatta gcttcttgtg tggaactgga 3360
gaaagaaggt ttgaagtttc ggcatgagcc ttcttggccc ttgtctttca ctccttcagt 3420
tacagatgag aaatttttga ctacaacttt aaaaccgaaa atagccatca ttcgtgagga 3480
agggagcaat ggagacagag aaatgtcagc agcattttat gctgctggtt ttgagccttg 3540
ggatgttgca atgtcagacc ttcttaacgg agttatttct ttgaatgaat tccgtggaat 3600
tgcatttgtt ggaggtttta gttatgccga tgtgcttgat tcttcaaaag gttgggctgc 3660
gtccatacgc ttcaatcagc ctcttctcaa tcagtttcag gaattttaca agcgccctga 3720
tactttcagt cttggcgttt gcaatggatg tcagttaatg gctctgttag ggtgggtccc 3780
agggccccaa gtggggggtg tttttggtgc tggtggggac ccatcacagc ccaggtttgt 3840
tcacaatgag tctggccgat ttgaatgccg gttcacaagt gtgactataa aggactctcc 3900
cgccatgatg tttaaaggaa tggaaggcag tacattaggt gtatgggctg cccatggtga 3960
gggaagagca tattttcctg atgatggtgt tctggatcgt gtattacatt cagatttggc 4020
tccattaaga tattgcgatg atgatgggaa cccaacagag gcatacccct tcaacttgaa 4080
tggttctcct ttaggagtgg ctgcaatttg ttctcctgat ggtcgacatc ttgccatgat 4140
gcctcatcca gagcggtgtt tcctgatgtg gcagttccct tggtatccaa tggactggaa 4200
tgtggacaag aaaggcccta gtccatggtt aagaatgttt caaaatgcca gagagtggtg 4260
ctcatga 4267

Claims (7)

1.蛋白质,其名称为GhPUR4或△GhPUR4,所述GhPUR4为如下A1)或A2):
A1)氨基酸序列是序列1的蛋白质;
A2)在A1)的N端或/和C端连接标签得到的融合蛋白质;
所述△GhPUR4为如下E1)或E2):
E1)氨基酸序列是序列4的蛋白质;
E2)在E1)的N端或/和C端连接标签得到的融合蛋白质。
2.与权利要求1所述蛋白质相关的生物材料,为下述B1)至B5)中的任一种:
B1)编码权利要求1中所述GhPUR4或所述△GhPUR4的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)降低权利要求1所述GhPUR4表达量的核酸分子。
3.根据权利要求2所述的生物材料,其特征在于:B1)所述编码权利要求1中所述GhPUR4的核酸分子为如下b11)或b12)或b13):
b11)编码序列是序列表中序列2的DNA分子;
b12)序列表中序列2的DNA分子;
b13)序列表中序列3的DNA分子;
B1)所述编码权利要求1中所述△GhPUR4的核酸分子为如下f11)或f12)或f13):
f11)编码序列是序列表中序列5的DNA分子;
f12)序列表中序列5的DNA分子;
f13)序列表中序列6的DNA分子;
B5)所述核酸分子为序列表中序列2的第1028-1519位的DNA分子。
4.权利要求1所述蛋白质或权利要求2或3所述生物材料的下述任一应用:
X1)在调控棉花颜色中的应用;
X2)在制备调控棉花颜色产品中的应用;
X3)在棉花育种中的应用;
所述棉花颜色为棉花幼苗6d以内的幼嫩叶片的颜色。
5.调控棉花颜色的产品,含有权利要求1所述蛋白质或权利要求2或3所述生物材料;
所述棉花颜色为棉花幼苗6d以内的幼嫩叶片的颜色。
6.下述任一方法:
Z1)培育芽黄棉花的方法,包括:降低受体棉花中权利要求1所述蛋白质GhPUR4的含量,得到芽黄目的棉花;所述棉花为棉花幼苗6d以内棉花;
Z2)降低棉花叶绿素含量的方法,包括:降低受体棉花中权利要求1所述蛋白质GhPUR4的含量,得到叶绿素含量降低的目的棉花,实现叶绿素含量的降低;所述棉花为棉花幼苗6d以内棉花;
Z3)培育叶绿素含量降低棉花的方法,包括:降低受体棉花中权利要求1所述蛋白质GhPUR4的含量,得到叶绿素含量降低的目的棉花;所述棉花为棉花幼苗6d以内棉花;
Z4)培育黄化棉花的方法,包括:降低受体棉花中权利要求1所述蛋白质GhPUR4的含量,得到叶绿素含量降低的目的棉花,所述目的棉花即为黄化棉花;所述棉花为棉花幼苗6d以内棉花。
7.根据权利要求6所述的方法,其特征在于:所述降低受体棉花中权利要求1所述蛋白质GhPUR4的含量通过向所述受体棉花中导入序列表中序列2的第1028-1519位所示的DNA分子降低所述蛋白质编码基因的表达实现;
或,所述降低受体棉花中权利要求1所述蛋白质GhPUR4的含量利用病毒诱导的基因沉默(VIGS)系统完成;
或,所述降低受体棉花中权利要求1所述蛋白质GhPUR4的含量利用烟草脆裂病毒诱导的基因沉默系统完成。
CN201910237791.2A 2019-03-27 2019-03-27 一个陆地棉芽黄基因vsp的克隆及其功能 Active CN111825751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910237791.2A CN111825751B (zh) 2019-03-27 2019-03-27 一个陆地棉芽黄基因vsp的克隆及其功能

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910237791.2A CN111825751B (zh) 2019-03-27 2019-03-27 一个陆地棉芽黄基因vsp的克隆及其功能

Publications (2)

Publication Number Publication Date
CN111825751A CN111825751A (zh) 2020-10-27
CN111825751B true CN111825751B (zh) 2022-02-11

Family

ID=72914168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910237791.2A Active CN111825751B (zh) 2019-03-27 2019-03-27 一个陆地棉芽黄基因vsp的克隆及其功能

Country Status (1)

Country Link
CN (1) CN111825751B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1528912A (zh) * 2003-10-21 2004-09-15 南京农业大学 棉花高强纤维基因主效基因位点及其分子标记
CN108018373B (zh) * 2014-09-26 2021-06-15 中国农业科学院棉花研究所 一种来自海岛棉海1与黄萎病抗性有关的qtl/主效基因的分子标记
CN106399575A (zh) * 2016-12-12 2017-02-15 西南大学 与陆地棉叶绿素质量分数基因连锁的分子标记

Also Published As

Publication number Publication date
CN111825751A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
US9663794B2 (en) Heat-resistance rice gene OsZFP, screening marker and separation method thereof
CN112375130B (zh) 玉米穗长基因和分子标记及其应用
CN108291234A (zh) 倍数孢子体形成基因
CN109112146B (zh) 控制甘蓝型油菜角果长和粒重性状的基因qSLWA9的克隆与育种应用
CN111172173B (zh) 降低玉米株高或延迟开花的方法
CN110862993B (zh) 控制玉米株高和穗位高基因zkm89及其应用
CN111235180A (zh) 缩短玉米花期的方法
US20100319083A1 (en) Method of producing plants having enhanced transpiration efficiency and plants produced therefrom
US20070186302A1 (en) Genes that confer regeneration ability to plants, and uses thereof
CN105713079B (zh) 蛋白质及其相关生物材料在提高植物产量中的应用
CN109797158B (zh) 基因OsNTL3在改良水稻高温抗性方面的应用及获得的水稻高温抗性基因
CN108484741B (zh) 一种控制作物籽粒粒重的蛋白及其应用
CN111825751B (zh) 一个陆地棉芽黄基因vsp的克隆及其功能
CN113234733B (zh) 一个水稻叶绿体发育的相关基因及分子标记和应用
CN114395580A (zh) 用于控制玉米株高的基因
CN108440658B (zh) 水稻叶绿体核糖体蛋白编码基因OsWGL2及其用途
US7626078B2 (en) Polycomb genes from maize—Mez1 and Mez2
CN102558321B (zh) 植物耐低磷胁迫相关的蛋白AtLPT4及其编码基因与应用
CN101492499B (zh) 一种水稻根毛控制基因OsRHL1及其应用
CN114516908B (zh) 水稻粒形调控蛋白hos59及其编码基因和应用
CN112899292B (zh) 陆地棉株高调控基因GhGA20ox6及其用途
CN112724215B (zh) 改变玉米开花期的基因及方法
CN112646013B (zh) 玉米开花期基因及其应用
US20230365985A1 (en) PROTEINS AND BIOLOGICAL MATERIALS RELATED TO RICE (Oryza sativa L.) YIELD, AND USE THEREOF IN RICE YIELD INCREASE
WO2005003349A1 (ja) イネのトランスポゾン遺伝子

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant