CN110511945A - 一种水稻育性调控基因及其突变体与应用 - Google Patents

一种水稻育性调控基因及其突变体与应用 Download PDF

Info

Publication number
CN110511945A
CN110511945A CN201811004799.6A CN201811004799A CN110511945A CN 110511945 A CN110511945 A CN 110511945A CN 201811004799 A CN201811004799 A CN 201811004799A CN 110511945 A CN110511945 A CN 110511945A
Authority
CN
China
Prior art keywords
leu
ser
seq
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811004799.6A
Other languages
English (en)
Other versions
CN110511945B (zh
Inventor
黄培劲
龙湍
唐杰
刘昊
李佳林
李新鹏
安保光
曾翔
吴永忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Bolian Rice Gene Science & Technology Co Ltd
Original Assignee
Hainan Bolian Rice Gene Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Bolian Rice Gene Science & Technology Co Ltd filed Critical Hainan Bolian Rice Gene Science & Technology Co Ltd
Priority to CN201811004799.6A priority Critical patent/CN110511945B/zh
Priority to PCT/CN2018/119270 priority patent/WO2020042412A1/zh
Publication of CN110511945A publication Critical patent/CN110511945A/zh
Application granted granted Critical
Publication of CN110511945B publication Critical patent/CN110511945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/02Flowers
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Physiology (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供一种水稻育性调控基因及其突变体与应用。本发明提供了具有调控水稻雄性生殖细胞发育和花粉育性功能的水稻基因GMS1,其CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。本发明提供了GMS1基因的辐射诱变突变体和CRISPR敲除突变体,并提供了所述突变体的分子标记鉴定方法。本发明提供的水稻基因GMS1可用于水稻杂交种的不育化制种和生产,具有巨大的应用价值和经济价值。

Description

一种水稻育性调控基因及其突变体与应用
技术领域
本发明属于生物技术领域,具体地涉及一个植物育性调控基因GMS1、GMS1编码蛋白、GMS1的辐射诱变和基因敲除突变体,以及GMS1基因、蛋白和突变体在杂交育种中的应用。
背景技术
水稻是世界上最重要的粮食作物之一。随着人口的增长和生活品质的提升,据预计到2050年水稻的年产量要提高1-2倍才能满足人类发展的需求。杂交水稻是父母本杂交后获得的子一代,其产量往往比常规稻亲本提高15%以上,抗性和适应性也远胜于亲本。因此,应用和推广杂交水稻是提高水稻产量的一个重要途径。
雄性不育系是杂交水稻育制种技术的关键节点。雄性不育系是指雄配子发育异常而丧失生育能力,雌配子发育正常的植物株系。它只能作为母本接受父本的花粉,自交不能结实。目前杂交水稻生产上应用的雄性不育系有核质互作型和光温敏型两种。核质互作型雄性不育系的不育基因在细胞质中,细胞核中没有育性恢复基因。当细胞核中有育性恢复基因的恢复系与其配组杂交时可以生产可育的子一代杂交种,当细胞核中没有育性恢复基因而细胞质中也没有不育基因的保持系与其杂交时可以繁殖不育系种子。由于需要不育系、保持系和恢复系三系配套,这种杂交水稻育制种技术常被称为“三系法”。一些控制核质互作型不育及相应育性恢复的基因已经被克隆(Chen and Liu,2014,Male sterility andfertility restoration in crops,Annu Rev Plant Biol,65:579-606)。核质互作型不育系是杂交水稻育制种中第一种大规模应用的不育系,为杂交水稻产业的建立和发展奠定了材料基础。然而由于核质互作型不育系的组配受到恢复系基因型的限制,导致只有约5%的种质资源能被利用。而细胞质的不育基因有导致米质差、特定病虫害流行的潜在风险。
光温敏型雄性不育系是一种育性受光温环境调控的不育系。在一定的光温条件下这种不育系保持不育,可用于组配杂交。当条件改变时不育系恢复育性,可用于不育系繁殖。由于光温敏雄性不育系实现了不育系和保持系的合二为一,只需要父本与其配组生产子一代杂交种,因此相应的育制种技术常被称为“两系法”。调控光温敏雄性不育的基因在细胞核中,目前已经克隆的基因包括PMS3、TMS5、CSA和TMS10(Chen and Liu,2014,Malesterility and fertility restoration in crops,Annu Rev Plant Biol,65:579-606;Zhou H,et al,2014,RNase ZS1processes UbL40mRNAs and controls thermosensitivegenic male sterility in rice,Nature Communications,5:4884-4892)。与核质互作型不育系相比,光温敏型不育系繁殖程序简单,配组因恢复基因广泛存在而更自由。光温敏不育系的大规模应用极大地巩固和推动了杂交水稻产业发展。然而,由于该型不育系的育性受光温环境影响,也导致制种风险高,制种地域受到限制。
为了克服目前杂交水稻育制种技术中存在的关键性缺陷,创造和利用新类型的不育系将是重要的突破口。本发明提供了一种作物育性基因及基于该基因突变所产生的隐性核不育类型的雄性不育系。该不育系育性稳定,只受核编码的单基因调控,不受光温环境的影响。该不育系的育性恢复基因广泛存在于水稻种质资源中,也可以通过转野生型基因恢复育性。该基因和该基因突变产生的不育系为研发水稻新型杂交育制种技术提供了元件,为解决现有技术存在的问题奠定了基础。
发明内容
本发明提供一种育性相关基因及其核苷酸和蛋白序列,还包括通过操作该基因在调控植株雄性生育力中的应用。非限制性地举例而言,下文描述的任何方法都可与本发明所提供的相应核苷酸序列一起使用,例如,将所述育性基因的突变体序列引入植株以导致植株雄性不育、使植株内源序列突变、向植株中引入该序列的反义序列、使用发卡形式、或将其与其它核苷酸序列连接起来调控植株的表型,或者是本领域技术人员己知的可用于影响植株的雄性生育力的多种方法中的任一方法。
本发明第一个方面是提供一个花粉发育调控基因GMS1。GMS1位于水稻第2号染色体上,其在粳稻中的基因组核苷酸序列如SEQ ID NO:1所示,CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。在籼稻中其基因组核苷酸序列如SEQ ID NO:4所示,其CDS和氨基酸序与粳稻相同。在拟南芥(Arabidopsis thaliana)中该育性基因的基因组核苷酸序列如SEQ ID NO:26所示,CDS序列如SEQ ID NO:27所示,氨基酸序列如SEQ ID NO:28所示;在小米(Setaria italica)中该育性基因的基因组核苷酸序列如SEQ ID NO:29所示,CDS序列如SEQ ID NO:30所示,氨基酸序列如SEQ ID NO:31所示;高粱(Sorghum bicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:32所示,CDS序列如SEQ ID NO:33所示,氨基酸序列如SEQ ID NO:34所示;玉米(Zeamays)中该育性基因的基因组核苷酸序列如SEQID NO:35所示,CDS序列如SEQ ID NO:36所示,氨基酸序列如SEQ ID NO:37所示;二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ ID NO:38所示,CDS序列如SEQ ID NO:39所示,氨基酸序列如SEQ ID NO:40所示:大麦(Hordeum vulgare)中该育性基因的基因组核苷酸序列如SEQ ID NO:41所示,CDS序列如SEQ ID NO:42所示,氨基酸序列如SEQ ID NO:43所示;短药野生稻(Oryza brachyantha)中该育性基因的基因组核苷酸序列如SEQ ID NO:44所示,CDS序列如SEQ ID NO:45所示,氨基酸序列如SEQ ID NO:46所示;非洲栽培稻(Oryza glaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:47所示,CDS序列如SEQ ID NO:48所示,氨基酸序列如SEQ ID NO:49所示。
上述所述育性基因,可从各种植物中分离获得。本领域技术人员应该知晓,本发明所述的育性恢复基因包括与GMS1基因高度同源,并且具有同样的育性调控功能的高度同源的功能等价序列。所述高度同源的功能等价序列包括在严谨条件下能够与本发明所公开的GMS1基因的核苷酸序列杂交的DNA序列。本发明中所使用的“严谨条件”是公知的,包括诸如在含400mM NaCl、40mM PIPES(pH6.4)和l mM EDTA的杂交液中于60℃杂交12-16小时,然后在65℃下用含0.1%SDS、和0.1×SSC的洗涤液洗涤15-60分钟。
功能等价序列还包括与本发明所公开的GMS1基因所示的序列有至少85%、90%、95%、96%、97%、98%、或99%序列相似性,且具有育性调控功能的DNA序列,可以从任何植物中分离获得。其中,序列相似性的百分比可以通过公知的生物信息学算法来获得,包括Myers和Miller算法(Bioinformatics,4(1):1117,1988)、Needleman-Wunsch全局比对法(JMol Biol,48(3):443-453,1970)、Smith-Waterman局部比对法(J Mol Biol,147:195-197,1981)、Pearson和Lipman相似性搜索法(PNAS,85(8):2444-2448,1988)、Karlin和Altschul的算法(Altschul等,J Mol Biol,215(3):403-410,1990;PNAS,90:5873-5877,1993)。这对于本领域技术人员来说是熟悉的。
基于本发明的上述发现,本发明一种具有调控植物雄性育性功能的DNA片段,其序列为以下任一:
1)具有SEQ ID NO:1或2所示的核苷酸序列;
2)具有SEQ ID NO:4或2所示的核苷酸序列;
3)具有SEQ ID NO:26或27所示的核苷酸序列;
4)具有SEQ ID NO:29或30所示的核苷酸序列;
5)具有SEQ ID NO:32或33所示的核苷酸序列;
6)具有SEQ ID NO:35或36所示的核苷酸序列;
7)具有SEQ ID NO:38或39所示的核苷酸序列;
8)具有SEQ ID NO:41或42所示的核苷酸序列;
9)具有SEQ ID NO:44或45所示的核苷酸序列;
10)具有SEQ ID NO:47或48所示的核苷酸序列;
11)在严格条件下能够与(1)-(10)之任一序列的DNA杂交的DNA片段;或
12)与(1)-(11)之任一所述序列互补的DNA片段;或
13)在(1)-(11)之任一所述序列的基础之上,经过一至数个碱基替换和/或一至数个碱基的插入和/或缺失以及大片段的核苷酸序列插入/缺失/易位/倒位所形成能够影响植物花粉生育能力的DNA片段;或
14)与(1)-(11)之任一所述序列的DNA片段具有85%以上的同一性且编码水稻雄性育性相关蛋白的DNA片段。
上述DNA片段为GMS1基因或其特异性片段。
本发明提供了所述DNA片段编码的蛋白,为如下1)或2)所述的蛋白:
1)SEQ ID NO:3、28、31、34、37、40、43、46或49所示的氨基酸序列组成的蛋白;
2)将SEQ ID NO:3、28、31、34、37、40、43、46或49经过一个或若干个氨基酸残基的取代和/或缺失和/或添加且具有调控植物雄性育性活性的蛋白。
本发明提供一种生物材料,含有上述的DNA序列,所述生物材料为表达盒,表达载体、工程菌、转基因植物或转基因细胞系。
本发明所述的DNA片段可以从任何植物中分离获得,包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。
本发明的第二方面是提供了通过影响GMS1的核苷酸序列或者通过调控GMS1基因的转录表达从而影响植株育性的方法。所述影响植株育性是指通过调控GMS1基因的表达,从而使所述植株的育性发生改变,如导致植株雄性不育。具体地,取决于实际应用需求,可以通过多种方法来影响GMS1基因在植物体内的表达,从而达到调控植株雄性育性的效果。更具体地,调控GMS1基因的表达可以使用许多本领域普通技术人员可获得的工具进行,例如,通过理化诱变、插入突变、基因打靶敲除、反义基因的转入、共抑制或发夹结构的引入等,都可以用于破坏GMS1基因的正常表达,从而获得雄性不育的植株。另一方面,本发明还包括通过将野生型GMS1的核苷酸序列引入植株来恢复GMS1表达被破坏的植株的雄性生育力。
本发明的第三方面提供了一种DNA分子,其含有所述DNA片段,并在所述DNA片段中插入、和/或缺失、和/或取代若干个核苷酸从而导致水稻雄性育性发生改变。
进而本发明提供一种GMS1基因的不育突变体序列及其雄性不育突变体材料。所述雄性不育突变体材料是由核苷酸序列的突变所造成,含有该突变后核苷酸序列的植株表现为雄性不育,所述核苷酸序列如SEQ ID NO:1、2、4、26、27、29、30、32、33、35、36、38、39、41、42、44、45、47或48任一所示,所述的突变为点突变、DNA缺失、插入或取代突变、反义基因的转入、共抑制或发夹结构的引入或通过基因沉默手段产生的突变。
具体地,所述雄性不育突变体材料是通过突变水稻内源的GMS1基因,或突变与其高度同源的基因的核苷酸序列,使该植物体丧失雄性育性的过程。所述“突变”包括但不限于以下方法,如用物理或化学的方法导致的基因突变,所述突变可以是点突变,也可以是DNA缺失或插入突变。突变还可以是通过RNAi、CRSPR-Cas9、人工核酸酶、定点突变等基因沉默手段产生。
在本发明的一个优选的实施方案中,所述的突变体材料为采用CRISPR-Gas9方法,以序列CTTCGTGATCGGCGACTCCA(靶位点1)和/或序列GAGAGAATGCCAGCTGCCG(靶位点2)为靶位点,使靶位点或靶位点及相邻核苷酸序列突变后得到的植物。
所述植物包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。
在本发明的优选实施例中,所述的突变体材料为水稻突变体材料,在水稻基因组所述靶位点1和靶位点2或靶位点及相邻区域内具有以下1)和/或2)中的1种或多种突变,如2种、3种、4种突变:
1)在靶位点1或靶位点1及相邻序列内发生了CGGCGACTCCA、CTCCACGGCG、TCGGCGACTCCA、TCGGCGACTCCA、CCACGGCG、ATCGGCGAC、C、CGGCGGCGGCGGCGGCCCCGCGCCGCACGCCGCTCGTCCCGGCGCTCTTCGTGATCGGCGACT、CTCTTCGTGATCGGCGACTCCA或TCCACGGCGGAC序列缺失突变,或T碱基插入突变;
2)在靶位点2或靶位点2及相邻序列内发生了AGCTGC、G、GCTG、TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGCATAGTTG或TG序列缺失突变,或A、CT、GT或GC碱基插入突变,或从TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGC到GTTTGT或从CAGCTG到ATAGTTAAAAAATT序列替换突变。
进一步,本发明提供了一种适用于CRISPR/Cas9系统对植物GMS1基因进行定向敲除的靶位点,其为CTTCGTGATCGGCGACTCCA(靶位点1)和/或GAGAGAATGCCAGCTGCCG(靶位点2)。
本发明还提供了一种特异性靶向上述靶位点1或靶位点2的sgRNA。
含有上述sgRNA的DNA序列的CRISPR/Cas9打靶载体属于本发明的保护范围。
更具体地,本发明提供了一种水稻雄性不育突变体,其含有突变后的雄性不育基因,所述突变后的雄性不育基因的基因组核苷酸序列如SEQ ID NO:5所示,CDS序列如SEQID NO:6所示,氨基酸序列如SEQ ID NO:7所示。对野生型和突变体序列进行比对发现,在LOC_Os02g18870基因的基因组序列编码区第3外显子的第3600位碱基处的TTGT被替换为A,导致LOC_Os02g18870基因编码蛋白中第230位和第231位的亮氨酸和缬氨酸突变为一个组氨酸,进而导致蛋白丧失功能。本领域技术人员应该知晓,可以将所述核苷酸序列SEQ IDNO:5通过杂交、回交或转基因的方法导入受体植物中,从而获得新的雄性不育突变体材料。
本发明提供了GMS1基因或其编码蛋白或含有其的生物材料或其突变体材料在调控植物雄性育性活性中的应用。所述生物材料为含有GMS1基因的表达盒、表达载体、工程菌、转基因植物或转基因细胞系。
其中所述GMS1基因用于恢复作物植株雄性不育,以便导入外源基因以获得优质的转基因作物。
提供上述GMS1基因用于转基因改良作物的用途。
所述改良包括产量提高、品质提高、抗病虫害、抗逆、抗倒伏等生长性状的改良。
在另一具体实施方案中,所述作物是自花授粉或异花授粉作物。
在一个更加具体的实施方案中,所述作物包括但不限于玉米、小麦、高梁、水稻。
本发明还提供了所述的GMS1基因或其编码蛋白或含有其的生物材料或DNA分子或上述任一种突变体材料在转育带有纯合GMS1突变基因的隐性核不育系中的应用。
本发明还提供了一种在其它植物中获取GMS1基因的直系同源基因的方法,以及利用该方法获得高粱、小米、短柄草、水稻同源GMS1的氨基酸序列。
本发明提供了一种在其它植物中获取GMS1基因的直系同源基因的方法包括:
1)使用前述GMS1基因的DNA片段在核苷酸数据库中进行blastx搜索;
2)所有Identities大于或等于35%、Positives大于或等于50%即为与所述DNA片段直系同源的基因片段。
本发明提供了一种与GMS1基因紧密连锁的分子标记,通过核苷酸序列如SEQ IDNO:8-9所述的引物扩增得到。
本发明提供了一种用于检测GMS1基因突变体材料的分子标记,通过核苷酸序列如SEQ ID NO:10-11所述的引物扩增得到。
选用SEQ ID NO:10-11所示引物扩增待测水稻基因组DNA时,若只能扩增出108bp一条带,则待测水稻为GMS1基因突变体。
含有核苷酸序列如SEQ ID NO:8-9或SEQ ID NO:10-11所述的引物的检测试剂或试剂盒属于本发明的保护范围。
进一步本发明提供了上述两种分子标记或上述检测试剂或试剂盒在检测水稻GMS1基因突变体中的应用。
本发明提供了上述两种分子标记或上述检测试剂或试剂盒在筛选或培育雄性不育水稻突变体中的应用。
与现有技术相比,本发明具有如下的有益效果:本发明提供的水稻花粉发育调控基因GMS1直接参与花粉发育调控,该基因被敲除或表达受到抑制后,花粉完全不育。gms1不育突变体与现有三系和两系不育系相比不育性状稳定,不受环境条件影响。通过植物生物技术途径,本发明在农作物的杂种优势利用和不育化杂交种制种生产中都将发挥重要作用。
附图说明
图1灌浆期野生型(左)和gms1突变体(右)的植株形态。
图2野生型(左)和gms1突变体(右)的小穗形态。
图3野生型(左)和gms1突变体(右)穗开花的形态。
图4解剖后野生型(左)和gms1突变体(右)的小花形态。
图5野生型(左)和gms1突变体(右)的花药形态。
图6野生型(左)和gms1突变体(右)花粉碘染。
图7利用Indel3标记鉴定定位群体中不育单株的基因型。上带大小124bp,下带大小120bp。泳道1-4的DNA模板分别为gms1突变体,明恢63,定位群体中的不育单株2.5和2.6。
图8A为GMS1基因图位克隆图,图8B为gms1突变体的突变位点示意图。
图9GMS1基因在9311(9311-870),明恢63(MH63-870),日本晴(Nip-870)和gms1突变体(gms1-870)材料中的核苷酸序列差异。有差异的地方用黑色背景突出。每行最后一个核苷酸在整个基因序列中的位置标示在行末。
图10GMS1编码蛋白在9311(9311-870)和gms1突变体(gms1-870)中的氨基酸序列差异。有差异的地方用黑色背景突出。每行最后一个氨基酸残基在整个蛋白序列中的位置标示在行末。
图11GMS1杂合株后代基因型鉴定。上带大小111bp,下带大小108bp。箭头所指为不育株DNA。
图12GMS1在水稻不同组织中的表达量。S1-S8分别代表水稻一到八期幼穗。
图13pC9M-GMS1载体示意图。T1代表靶位点1,T2代表靶位点2。
图14转基因植株L138-1-1在靶位点1处的测序峰图。箭头指向缺失位点。
图15转基因植株L138-3-1在靶位点2处的测序峰图。箭头指向缺失位点。
图16GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的小穗形态。
图17GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的花药形态。
图18GMS1野生型(左)、敲除植株L138-1-1(中)和L138-3-1(右)的花粉碘染。
图19pBLU5-870-CDS载体示意图。
图20GMS1在超表达植株中的表达量。
图21pC2300-870-genome载体示意图。
图22gms1突变植株(左)和互补植株(右)的植株形态。
图23水稻GMS1基因编码蛋白与其他物种基因组中的同源蛋白的序列比对图。包括拟南芥(Arabidopsis thaliana)蛋白AT4G10950.1、小米(Setaria italica)蛋白Si019557m、高粱(Sorghum bicolor)蛋白Sb04g011320.1、玉米(Zea mays)蛋白GRMZM2G166330_P01、二穗短柄草(Brachypodium distachyon)蛋白BRADI3G01797.1、大麦(Hordeum vulgare)蛋白MLOC_10139.2、短药野生稻(Oryza brachyantha)蛋白OB02G21480.1、非洲栽培稻(Oryza glaberrima)蛋白ORGLA02G0115000.1。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明的应用范围。下述实施例中的所有技术和科学术语,如无特殊说明,均为本发明所属领域普通技术人员通常所理解的相同含义。除非有相反指明,本发明所使用或提及的技术均为本领域普通技术人员公认的标准技术。所述试验材料,如无特别注明,均为本发明领域通用的试验材料。下述实施例中所用的试验试剂,如无特殊说明,均为自常规生化试剂商店购买得到的。
本发明所述的雄性不育,特指由植物细胞核基因发生功能变化导致植物雄性生殖器官发育出现异常(无法产生正常雄蕊、花药或者正常的雄性配子体)并出现育性的丧失,即通常所说的雄性核不育(Genic male sterility)而非细胞质核不育(Cytoplasmic malesterility)。雄性生殖器官育性的异常和恢复均由细胞核内的基因加以控制。
因此,本发明也包括利用序列表所述序列调控植株的雄配子生育能力,即利用本发明提供的基因序列在基因组、和/或转录组、和/或蛋白质组水平影响其它植物中相同或同源基因的功能从而达到控制雄性生殖器官育性的目的。例如,下述方法但不限于下述方法:通过天然序列的变异导致基因表达抑制或蛋白质功能的丧失、通过向植物中转入所述基因的反义序列或引入发卡结构、或将所述基因与其它序列(DNA或RNA)相结合产生新的具有功能活性的DNA或RNA链,来影响或改变植物基因的功能。或其它本领域技术人员己知的可用于影响植物雄花育性的技术方法中的任何一种技术方法。
本发明包括水稻GMS1基因,其显性等位基因对植物雄花育性具有关键作用,功能缺失性的隐性等位基因会导致雄性不育。该基因位于水稻2号染色体,其基因具体位置如图8A、图8B所示。
该基因序列及其同源序列可从各种植物中获得,包括但不限于卷柏(Selaginellamoellendorffii)、毛果杨(populus trichocarpa)、芜菁(Brassica rapa)、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、大豆(Glycine max)、茄属马铃薯(Solanum tuberosum)、葡萄(Vitis vinifera)、小果野芭蕉(Musa acuminata)、小米(Setaria italica)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)、短药野生稻(Oryzabrachyantha)、非洲栽培稻(Oryza glaberrima)、籼稻(Oryza sativa Indica Group)、粳稻(Oryza sativa Japonica Group)、小立碗藓(Physcomitrella patens)等。获得方法包括但不限于:通过水稻GMS1基因序列利用blastx、blastn或通过氨基酸序列利用blastp从其它植物的基因组序列数据库、和/或cDNA序列数据库、和/或蛋白质序列数据库中调取;以水稻GMS1基因的DNA或cDNA或RNA序列为参考序列设计引物,从其它植物的基因组DNA或cDNA或RNA中利用PCR的方法直接获得:以水稻GMS1的基因序列设计探针,利用核酸杂交的方法从基因组文库中分离含有同源基因序列的DNA或cDNA或RNA片段。
GMS1基因同源序列指在与SEQ ID NO:3的氨基酸序列进行blastx比较分析后,Identities大于或等于35%、Positives大于或等于50%的植物基因的DNA序列。进行blastx时,所有参数均遵照http://blast.ncbi.nlm.nih.gov/所示的默认设置进行。
下文通过说明和阐述提供了更为详细的描述,但这并非意欲对本发明的范围加以限制。
实施例1水稻雄性不育突变体gms1的筛选
2013年6月用钴60辐射93-11种子10公斤得到M0代。辐射后的种子种植于海南省临高县试验田,成熟后分单株收种,共获得M1代材料约6500份。2014年春,选种子量较多的3617个M1代材料种植成株系,每个株系种50个单株。分别在分蘖期、孕穗期、抽穗期、开花期、灌浆期筛选株型、穗型、育性、产量等各种类型突变体,并收种保存。其中一个突变体表现为雄性不育,被命名为gms1。
实施例2水稻雄性不育突变体gms1的表型分析
与野生型相比,gms1突变体植株(图1)和小穗(图2)形态正常,花期稍迟。内、外稃大小、小花开张尺寸、开张时间与野生型没有明显差异(图3)。体式显微镜下观察突变体小花形态,发现子房,花柱,柱头均比野生型略大(图4),但花药比野生型瘦小,颜色较浅(图5)。用碘-碘化钾溶液(0.6%KI,0.3%I2,w/w)溶液对花粉进行染色,如图6所示野生型花粉粒大而圆并且被染成蓝黑色,而突变体花粉粒皱缩并且不能被染色。同一家系野生型植株套袋自交后正常结实,而3013突变体不结实。而以水稻品种93-11为父本给3013突变体授粉则可以结实。这表明该突变体为雄性不育突变体。
实施例3水稻雄性不育突变体gms1的遗传分析
在M4代种植gms1的分离群体436株,其中330株育性正常,106株不育,可育与不育株分离比符合3:1(χ2=0.08,P<0.05)。用gms1与明恢63杂交,F1代植株全部可育。在F3代种植gms1的分离群体7832株,其中5834株育性正常,1998株不育,可育与不育株分离比符合3:1(χ2=1.06,P<0.05)。上述结果表明gms1的不育性状是由隐性单基因控制。
实施例4水稻雄性不育基因GMS1的克隆
使用图位克隆的方法对GMS1基因进行定位。以明恢63为父本与gms1突变体杂交构建了一个包含350棵植株的F2群体。利用该群体将GMS1定位于2号染色体SSR标记RM13004和RM13018之间,与SSR标记RM13011共分离。GMS1基因与上述三个标记之间的交换单株分别为1个,0个,1个。利用连锁标记挑选F2群体中的gms1杂合单株发展了一个F3群体,包含7832个单株。在F3群体中RM13004、RM13011、RM13018与GMS1基因之间的交换单株分别为9个,3个,13个。在RM13004和RM13018之间通过分析和比较93-11和日本晴基因组的序列,开发并实验证实了一个新的插入缺失标记Indel3。检测Indel3的引物为Indel3-F:GGGAAGAAACAGAGGTGCC(SEQ ID NO:8)和Indel3-R:GCTTGGAGGTATTTGGGACA(SEQ ID NO:9)。利用Indel3-F和Indel3-R可以在gms1突变体和明恢63基因组DNA中分别扩增出1条120bp(序列如SEQ ID NO:62)和1条124bp(序列如SEQ ID NO:63)条带(图7)。实验结果显示定位群体中所有不育单株都只扩增出了一条120bp的条带(图7),表明Indel3与gms1不育表型紧密连锁(图8A)。以Indel3上下游20kb为候选区段,发现在该区段内共有6个注释基因,其中LOC_Os02g18870预测编码一个GDSL类脂肪酶/酰基水解酶,推测是GMS1基因。在日本晴中,LOC_Os02g18870基因组核苷酸序列长5604bp(记为Nip-870,序列如SEQ ID NO:1),CDS核苷酸序列长1200bp(序列如SEQ ID NO:2),包含5个外显子和4个内含子(图8B),编码一个包含399个氨基酸残基的蛋白(序列如SEQ ID NO:3)。
根据Nip-870序列设计引物对LOC_Os02g18870基因在93-11、明恢63和gms1突变体中的等位基因进行扩增和测序,引物序列如表1所示。所有PCR扩增均使用KOD FX DNAPolymerase(TOYOBO CO.,LTD.Life Science Department,Osaka,Japan),并按照产品说明的反应体系和条件,在Thermo scientific Arktik thermal cycler上进行PCR扩增。PCR产物送往南京金斯瑞生物科技有限公司进行测序。测序结果用DNAman 6.0进行拼接。93-11、明恢63和gms1突变体中的LOC_Os02g18870基因分别记为9311-870(序列如SEQ ID NO:4),MH63-870,gms1-870(序列如SEQ ID NO:5)。
表1用于扩增LOC_Os02g18870的引物对序列
引物对名称 正向引物 反向引物
LOC_Os02g18870_1 TGCGAGGTCGGCTGCTA AGATCAGATGCCCCAAATTCATA
LOC_Os02g18870_2 CATGGCTGTGGCCCCTTTGCTC GTTTCTTTCCTATGCCTTTTCC
LOC_Os02g18870_3 GAGGGAAAAGGCATAGGAAA AGGTATGCAAATCAACAAGC
LOC_Os02g18870_4 ATACTATGGCTTTTGGGATGA AATAGTGGATGAAGTCGTTGC
LOC_Os02g18870_5 GGCAGCAACAACTGACCTTTTC ACAAGAAAGCAACATCTCAAGTCA
LOC_Os02g18870_6 AATCTTTGGCAGAGCATG GGAGTTTAAGGGTTGGTTC
对9311-870、gms1-870、MH63-870和Nip-870进行多序列比对,结果如图9所示。9311-870和gms1-870只在第3个外显子的第3600位碱基处存在一个TTGT到A的替换(图8和图9)。氨基酸序列分析显示,该突变将导致LOC_Os02g18870基因编码蛋白中第230位和第231位的亮氨酸和缬氨酸突变为一个组氨酸(图10)。MH63-870和Nip-870与gms1-870也在第3600个碱基处存在上述相同差异(图9)。这表明第3600位碱基处TTGT到A的突变是造成gms1突变体雄性不育的原因。此外9311-870和MH63-870的序列完全一致,而与Nip-870相比,在第308位缺失一个C,在第3303位有一个T变C的SNP(图9)。两处核苷酸差异分别落在第1和第2内含子中,并不影响编码区。这表明LOC_Os02g18870基因在水稻中高度保守,其核苷酸序列即使在籼、粳亚种间也只在非编码区存在两个碱基的差异,而蛋白质序列则没有差异。在93-11中LOC_Os02g18870的CDS核苷酸序列如SEQ ID NO:2所示,编码蛋白序列如SEQ IDNO:3。在gms1突变体中LOC_Os02g18870的CDS核苷酸序列和氨基酸序列分别如SEQ ID NO:6和SEQ ID NO:7所示。
基于LOC_Os02g18870基因突变位点的测序结果,在突变位点两侧设计特异引物3013_F:GCAACGACTTCATCCACT(SEQ ID NO:10)和3013_R:CCTTGATTTCCTGCCTCA(SEQ ID NO:11)。当3013_F和3013_R配对扩增野生型LOC_Os02g18870基因时将产生111bp条带,扩增突变型LOC_Os02g18870基因时将产生108bp条带。使用3013_F和3013_R引物对对38株gms1的M5分离群体进行基因型检测。如图11所示,野生型要么扩增出111bp和108bp两条带,要么扩增出111bp一条带,而不育突变体均只能扩增出108bp一条带。这说明突变基因型与不育表型共分离,LOC_Os02g18870就是GMS1基因。
实施例5GMS1基因的表达分析
取93-11各时期组织提取总RNA,反转录成cDNA。根据GMS1的基因组和编码区核苷酸序列设计跨内含子的引物3013_RTF:AATTCATCCGCCAGCACC(SEQ ID NO:12)和3013_RTR:GCCCACAGCAGGCATCAG(SEQ ID NO:13),同时以水稻Actin基因作为内参对照设计引物Actin-RTF:GATGCTTATGTCGGTGAT(SEQ ID NO:14)和Actin-RTR:ATGCTCTTCTGGTGCTAC(SEQID NO:15)。采取实时定量PCR方法进行表达量分析。如图12所示,GMS1基因在水稻的根、茎、叶、种子、外稃、內稃中均有表达但表达量较低。在一期到三期幼穗中,GMS1的表达量快速升高,然后逐渐降低,直到八期幼穗。其中七期幼穗中GMS1表达量略有升高。此外,在八期穗的花药中,GMS1的表达明显升高。
实施例6GMS1基因敲除株系的获得及表型分析
利用CRISPR/Cas9系统对GMS1基因进行定向敲除。为了提高敲除效率,选择两个靶位点同时进行敲除。靶位点1位于第一外显子的正链上,序列为CTTCGTGATCGGCGACTCCA(SEQID NO:1序列的第168位至第187位),靶位点2位于第二外显子的负链上,序列为GAGAGAATGCCAGCTGCCG(SEQ ID NO:1序列的第1629位至第1647位)。根据Ma等(Ma X,etal.A Robust CRISPR/Cas9System for Convenient,High-Efficiency Multiplex GenomeEditing in Monocot and Dicot Plants.Mol Plant,2015,8:1274-84)的方法将靶位点1和靶位点2连入载体pC9M中,获得载体pC9M-GMS1(图13)。有pC9M-GMS1的大肠杆菌被命名为E.coli-pC9M-GMS1。将pC9M-GMS1通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC9M-GMS1。
利用重组农杆菌Ab-pC9M-GMS1侵染粳稻中花11愈伤组织,经潮霉素抗性筛选、分化、生根获得再生转基因株系33株。提取上述植株叶片的总DNA,利用引物SP1:CCCGACATAGATGCAATAACTTC(SEQ ID NO:16)和SP2:GCGCGGTGTCATCTATGTTACT(SEQ ID NO:17)做阳性检测,共鉴定出转基因阳性植株30株。随机选取17株阳性株,用靶位点1两侧的引物靶1-F:TTCGCCCTGCTCTTCCCG(SEQ ID NO:18)和靶1-R:AGATCAGATGCCCCAAATTCATA(SEQID NO:19)以及靶位点2两侧的引物靶2-F:TGGAGCCTCTTGGTTAGAGTC(SEQ ID NO:20)和靶2-R:CCTCCTTCTGATTCGTCCT(SEQ ID NO:21)。扩增基因组DNA,扩增产物测序后与基因组进行比对。结果显示17株阳性株的基因组DNA至少在靶位点1和靶位点2中的一处两条等位染色体均发生了突变(表2)。例如植株L138-1-1在靶位点1处发生了CGGCGACTCCA序列的纯合缺失突变(图14)。植株L138-3-1在靶位点2处发生了G缺失的纯合突变(图15)。发生在靶位点1或靶位点1及相邻序列内的突变还包括CTCCACGGCG、TCGGCGACTCCA、TCGGCGACTCCA、CCACGGCG、ATCGGCGAC、C、CGGCGGCGGCGGCGGCCCCGCGCCGCACGCCGCTCGTCCCGGCGCTCTTCGTGATCGGCGACT、CTCTTCGTGATCGGCGACTCCA或TCCACGGCGGAC等序列缺失突变,或T等碱基插入突变(表2)。发生在靶位点2或靶位点2及相邻序列内的突变还包括AGCTGC、G、GCTG、TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGCATAGTTG或TG等序列缺失突变,或A、CT、GT或GC等碱基插入突变,或从TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGC到GTTTGT或从CAGCTG到ATAGTTAAAAAATT等序列替换突变。
开花后对上述17株阳性株进行表型分析。与野生型ZH11相比,GMS1敲除植株L138-1-1和L138-3-1在株叶和小穗形态上并无明显差别(图16)。但GMS1敲除植株的花药明显更加瘦小(图17)。花粉碘染结果表明,野生型ZH11的花粉大而圆,可以被染色,而GMS1敲除植株的花粉小而皱缩,不能被染色(表2和图18)。GMS1敲除植株的表型与gms1突变体的表型一致。
实施例7GMS1基因超表达株系的获得及表型分析
以9311的RNA反转录产物为模板,用引物3013OXS:tttggtaccATGGCGCTCCCCTTCCTC(SEQ ID NO:22)和3013OXAS:tttggatccCTACTTGAGTTTTACCATCTGCTGCA(SEQ ID NO:23)扩增获得带有GMS1完整编码核苷酸序列(SEQ ID NO:2)的DNA片段。将该片段用Kpn I和BamHI双酶切后连入pBLU5获得质粒pBLU5-870-CDS(图19)。有pBLU5-870-CDS的大肠杆菌被命名为E.coli-pBLU5-870-CDS。将pBLU5-870-CDS通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pBLU5-870-CDS。
利用重组农杆菌Ab-pBLU5-870-CDS侵染粳稻中花11愈伤组织,经潮霉素抗性筛选、分化、生根获得转基因阳性植株42株。使用实时定量PCR方法,利用实施例5中的引物3013_RTF:AATTCATCCGCCAGCACC(SEQ ID NO:12)和3013_RTR:GCCCACAGCAGGCATCAG(SEQ IDNO:13),Actin-RTF:GATGCTTATGTCGGTGAT(SEQ ID NO:14)和Actin-RTF:ATGCTCTTCTGGTGCTAC(SEQ ID NO:15)对转基因阳性植株中GMS1的表达量进行分析。如图20所示,和转基因阴性单株L136-3-1相比,超表达植株中GMS1的表达量普遍上升了3倍以上,但超表达植株并未出现与表达量共分离的明显表型,说明GMS1基因超表达对水稻表型并没有显著影响。
实施例8gms1突变体转基因互补株系的获得及表型分析
以9311的基因组DNA为模板,用引物870F:GGGGTACCGAGCATAAGGCAAACTGGCG(SEQID NO:24)和870R:CGGGATCCATGGCCAAACCATGGGAAGA(SEQ ID NO:25)扩增获得带有GMS1起始密码子ATG上游1373bp和终止密码子TAG下游795bp的基因全长片段。将该片段用Kpn I和BamH I双酶切后连入pC2300获得质粒pC2300-870-genome(图21)。有pC2300-870-genome的大肠杆菌被命名为E.coli-pC2300-870-genome。将pC2300-870-genome通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC2300-870-genome。利用重组农杆菌Ab-pC2300-870-genome侵染gms1突变体愈伤组织,经抗性筛选、分化、生根共获得转基因阳性植株25株,均使gms1突变体的育性恢复正常(图22)。这进一步证明GMS1基因调控花粉发育,该基因突变会导致花粉败育。
实施例9GMS1基因编码蛋白与植物基因组中预测同源蛋白的序列比对
利用blastx工具在NCBI的Genbank数据库中对水稻GMS1基因编码蛋白的氨基酸序列进行同源性搜索,得到了拟南芥(Arabidopsis thaliana)、小米(Setaria italica)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)、短药野生稻(Oryza brachyantha)、非洲栽培稻(Oryza glaberrima)基因组中预测的同源蛋白,将这些蛋白序列进行比对分析,结果显示来自不同植物的同源蛋白都具有非常相似的保守序列,彼此之间同源性很高(图23),表明该蛋白在植物花的雄性器官发育过程中生物学功能保守,起着非常重要的作用。
在拟南芥(Arabidopsis thaliana)中该育性基因的基因组核苷酸序列如SEQ IDNO:26所示,CDS序列如SEQ ID NO:27所示,氨基酸序列如SEQ ID NO:28所示;在小米(Setaria italica)中该育性基因的基因组核苷酸序列如SEQ ID NO:29所示,CDS序列如SEQ ID NO:30所示,氨基酸序列如SEQ ID NO:31所示;高粱(Sorghum bicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:32所示,CDS序列如SEQ ID NO:33所示,氨基酸序列如SEQ ID NO:34所示;玉米(Zeamays)中该育性基因的基因组核苷酸序列如SEQ ID NO:35所示,CDS序列如SEQ ID NO:36所示,氨基酸序列如SEQ ID NO:37所示;二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ ID NO:38所示,CDS序列如SEQ ID NO:39所示,氨基酸序列如SEQ ID NO:40所示:大麦(Hordeumvulgare)中该育性基因的基因组核苷酸序列如SEQ ID NO:41所示,CDS序列如SEQ ID NO:42所示,氨基酸序列如SEQ ID NO:43所示;短药野生稻(Oryzabrachyantha)中该育性基因的基因组核苷酸序列如SEQ ID NO:44所示,CDS序列如SEQ ID NO:45所示,氨基酸序列如SEQ ID NO:46所示;非洲栽培稻(Oryzaglaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:47所示,CDS序列如SEQ ID NO:48所示,氨基酸序列如SEQ ID NO:49所示。
实施例10转育带有GMS1基因的隐性核不育系
用gms1突变体与育性正常的受体,如H28B,进行杂交、回交和自交,并在此过程中用分子标记进行gms1基因和遗传背景选择,最终获得H28B背景下带有纯合GMS1突变基因的隐性核不育系。具体实施步骤如下:
1、以受体亲本,如H28B,为父本与gms1杂交获得F1
2、以F1为母本与受体亲本,如H28B,回交获得BC1F1
3、种植BC1F1,使用引物3013_F:GCAACGACTTCATCCACT(SEQ ID NO:10)和3013_R:CCTTGATTTCCTGCCTCA(SEQ ID NO:11)检测gms1基因型。选择gms1杂合基因型,即同时能扩增出111bp和108bp条带的植株。
4、使用一组基因型(例如100个,或200个等)在gms1突变体和轮回亲本基因组之间存在多态性,且分布均匀的分子标记(可以是但不限于SSR、SNP、INDEL、EST、RFLP、AFLP、RAPD、SCAR等类型标记),对步骤3中选出的单株进行遗传背景鉴定,选取与轮回亲本基因型相似度高(如大于88%相似度,或2%中选率等)的植株。
5、用步骤4中选出的植株与受体亲本,如H28B,回交获得BC2F1
6、种植BC2F1,重复步骤3和步骤4,选出gms1基因型杂合,遗传背景回复率高(如大于98%,或2%中选率等)的植株,收自交种BC2F2
7、种植BC2F2,重复步骤3和步骤4,选出gms1基因型杂合,遗传背景纯合率最高的植株,收自交种BC2F3。BC2F3后代中分离的gms1杂合株即gms1隐性核不育系,BC2F3用于保存gms1隐性核不育系种质资源。
序列表
<110> 海南波莲水稻基因科技有限公司
<120> 一种水稻育性调控基因及其突变体与应用
<130> KHP181114253.6
<160> 63
<170> SIPOSequenceListing 1.0
<210> 1
<211> 5604
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60
ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120
gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180
gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240
gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300
atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360
tggccccttt gctctctcgt gaatcctccc cccccccgct tcaaaggttg caggtggttc 420
tggaatcgtc gatccgatgc tgctttgcct ctcgtacgcc tatggatgca gcatgttgtg 480
ggtttagtgt aatctgggtt ttgggtttct ggtatacgaa ggttttgctt agttgttggt 540
tcctatgaat ttggggcatc tgatctcata catcgggggt atgtggattt ttgcccaaca 600
attgctgaag ctgaagagta atcagttcat agcactctcc tacacagctg accacctgga 660
tctcacatac atagactcct gcggcttcct ctccttgatc tcacatagca atgttgtggg 720
tttagtgtaa tctgggtatt tgggtttctc gcatgcgagg ggcttgctca gttgttggtt 780
cgtctgtggg tttctgccga acaattgctg aagctgaaga gtaaccagtt ttgcagcaca 840
accaccacag tctgggcatc atttgatcct gctgttctta gcactcctgc agagctgacc 900
acctggatct cacgtatcta tatagaatcc tgcggcttcc tctccaaatc agtatccagt 960
atccaccacc gttatcagcc gttgaggcaa tgcattggca gaatgccaga acattaagaa 1020
gtgccatcat aatgtacacc attagtccat gcatccagaa aacattgcca gaatcctgca 1080
atgtatccat ttgatagtcc tgagtcccga ccagttgtct acatgctcca gtctctttgc 1140
caccacacac tgttaaatct ctcttgtcca atgtccacca cattctggac agtttcaagg 1200
tcctcacagg aagcacagct gcacaacctt tgttaatgtt gctttaagaa agtcatatct 1260
actcattagt ttctttggga gagtaaggag ggaaaaggca taggaaagaa acatttaact 1320
agggctactg gctcactatg tgaaagatgt ttcccttcaa tttcatttag ctggtgttct 1380
ttatctcttt tgcccgtctc tgtcagtact tatgtttttc atgaatcaat agtatcttgt 1440
tctttcttct gtttttaaat tattttttcc gtgatttctt aatcttagac ttttttgtgc 1500
atttgcagca gagaagctgg ggcttccttt tgtgcctcca taccttgaac agaacatgcg 1560
catgggtgtc ggcagtgtcg acctcagcaa cattgatggg atgatacaag gtgtcaacta 1620
tgcatccgcg gcagctggca ttctctccag cagtggttct gagctggttt gtcctcctaa 1680
cttcccaaca actctatttc acgcttataa tctagcagga atgtctttgt gagacccttc 1740
tctagaggac gaatcagaag gagggtgttt caacaacaga ctagaagcaa tgactcttct 1800
catagtgtct acatcctctc tagttaggaa gaatacttgc tcaaccattt gaactaatgc 1860
tgaaagattc tcctgttcgg ctgctccctt ccttccatgt gttccaacta gtgtggatta 1920
tcagggcatc aaattccctt cttagttcct aggaattcat gacttatata tgcttcctac 1980
cagatgtgag attgtctaca cgagacgatt gatatgctgg tgctgatggg gggtttattt 2040
atgctgctgg ccttgtccaa gtttgcttgt gaagctacag tgctataagt tgtatggttg 2100
ttttattttc ctgcacgcat aaagcaaaag gagatatatg tagccatcta ctcaaagcta 2160
atttatcata atttttttat tgtctgaaac taaaaaactg catttgttct atactatggc 2220
ttttgggatg atcaaggagt tagtaagaat cactgatccg gcaccaatgt gatgaaattg 2280
atgtatatca tcctgaacat tccattttca tatcaatctt tattcctgct tatgttgttg 2340
aatctccaat ctttgtgccc aaaacaacaa aaacttgtgg agctgcaaat gctaattttg 2400
tcatttcaat aaaacatcat ggtggtgtct aaagaggaga aatgtttacg tatgaacatt 2460
gctgcaaagt tttcctttat gtggctatat gttttaactt tctataaagg attggagcct 2520
cttggttaga gtcaagcttg ttgatttgca taccttttca ttattcttaa atgtacttga 2580
aactaaatcg acatgatcat taactatata acaccagtct aaagaacacc aatctaaaga 2640
acacacttaa tgcttctcta tgaaggtttc tcttttggta tgtaatactt gctcatcgga 2700
tgtatccttt tttgttacta ttttgtctcg tgaactatac atttgaagat tattttgtgg 2760
tggtattctt tactactgcg gcattccagc agctgtaaaa gtatgtgcaa ttatactgtt 2820
aaaaaatctc caacattggc agtcccctag cttggaatct gtcgatattt tctgtgttta 2880
tgttatgatt tcttgcaaac atattttaga ttcttaaatt ttaatggcgt ggttgttcta 2940
gcttaaatat gtttagaaca agggatgtga cacctttact ttgtgcagaa taaaccttca 3000
tgctgatctc ttgtgtatca agccttcagg ctaggggtgt aagtggctaa cccgcgaaac 3060
ccacttatag gctaaaataa gccgcgaacc cgtttatttt gacctataag tgggttcgcg 3120
gctgacccac ttacagccct acttcaggca catgaggatc aatcatttca tagtgtgact 3180
atttgtagtt atctgtatgg ccgtaaataa tggcctctat attgttctgt attggagtat 3240
ctctctacta tttttttctc tgaagaagag cattctttta cctatttttg gttttcataa 3300
tttaatgtga tgcataattt gattctgttc ttttttagat aaaggaggct aatttgattc 3360
tgttcttgca attgtggatg cactgcaggg aatgcatgtg tcgctgagcc agcaggtgca 3420
gcaggttgag gacacatatg agcagctctc tctggctctc ggggaggcag caacaactga 3480
ccttttcaga aagtccgtgt tctttttctc aatcgggagc aacgacttca tccactatta 3540
cctgcgcaat gtgtctggcg tccagatgcg ttacctccca tgggagttca accagcttct 3600
tgtcaatgca atgaggcagg aaatcaaggt gtggttattg ttctccagtt tattctctct 3660
gtgcaacatt tcttgcctcc ttatgattcc agttttagtt ttttgatcag tgtgttgcat 3720
attgcccaaa ggctgtagta tcgtgcttag cagtggccaa tgttgtgagt atgaatttga 3780
tccgtaattt acggcccgta aatattctgt gcttgaaagg tatctgctct cagttccacc 3840
acccagatgt gaatagttct ttgtactcct ggttaggaat atgtttgaga aaaggaggag 3900
tgtggacctc tggggactgc agatacatga attatggaaa actagctatg aacattaatt 3960
tttatgtttc aagggctaga aaattttcaa atgtttatag agaaacctga tatagtacac 4020
tttttctgta ggttaaagtt ttcaaatggt ggatgagttt aaaaccgtgt acagttttgg 4080
actgaagctt ctttgagtta ctgaaatcct caggctgtac agtttttctg tagttatgaa 4140
ttaggttaaa aggataggag ggtatttcat ctgtacattt gtaatatggg aaagttaact 4200
gataaataca tggaattgat taactcaatg gatatttata tcgttggctg ttagcagttc 4260
tgtggtgtta tgtactttac attctccgtc taccgtacct tagtttcaga tttgaggtag 4320
tacgttgcaa cgttgctcaa caaggacata cttgtttttt atatgttcat tttgaattct 4380
taacattttg atcagataag gcggccccaa atctgatagg gactgatgta aagtcgatac 4440
tgaatattgt cttggactga atactgtgtt tgagtccctt agttcttggt ctgcgcatac 4500
ttccagagtg gattgtactt tgtactgcct cccatttgga agtgcaagct aaatgcgtgt 4560
tacttttgct caacttgtag gacaccatgc acactaccaa tatgcccatg atcttaccat 4620
gatacaaaca taattctcac atcatgcata aatgcataat gcacaatttg attttctccc 4680
taatttatcc cctttccttt tttgaacgga taattttaat ttgcaaaaga attggtaaaa 4740
atggccccaa atttctattc agtaaatctt tggcagagca tgcgatgcac attgattgag 4800
gctgcatgcg ccatgagttt atttgtactg tccaacattt gagagcagaa atttctgtta 4860
ccattgtact catccaagtt gacttgagat gttgctttct tgtttcttaa ccttagtaaa 4920
tcagttacaa tgatgcattt ttttattatt tagccatatg cagttcttgt cagattagat 4980
tattaagcta tttatatcta tatataagag ttctgtactt cctgcagaat ttgtacaata 5040
tcaatgttcg gaaggtcgtc atgatgggcc tccctcctgt tggctgcgca cctcactttc 5100
tctgggagta cggcagtcaa gacggggaat gcatcgacta catcaataac gtcgtgattc 5160
agttcaacta tgccctgaga tacatgtcta gtgaattcat ccgccagcac ccaggctcta 5220
tgatcagtta ctgtgatact tttgaggggt ctgtggacat actgaagaat cgtgaccgct 5280
acggtgagca gatgtatcat tgttactact gtcagattgc ctttctgtcc ttagggaaga 5340
actcacatta cgatggaatc acattgtgca ggttttctga ccaccactga tgcctgctgt 5400
gggctgggga agtatggggg cctgttcatg tgtgttcttc cacagatggc gtgcagcgac 5460
gcgtcgagcc atgtctggtg ggacgagttc caccccacgg atgctgtgaa ccgaatcctg 5520
gctgataatg tgtggtctgg tgagcatacc aagatgtgct atcctgtgga tttgcagcag 5580
atggtaaaac tcaagtagaa ctga 5604
<210> 2
<211> 1200
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60
ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120
gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180
gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240
gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300
atccccgtcg actacatcgc agagaagctg gggcttcctt ttgtgcctcc ataccttgaa 360
cagaacatgc gcatgggtgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 420
ggtgtcaact atgcatccgc ggcagctggc attctctcca gcagtggttc tgagctggga 480
atgcatgtgt cgctgagcca gcaggtgcag caggttgagg acacatatga gcagctctct 540
ctggctctcg gggaggcagc aacaactgac cttttcagaa agtccgtgtt ctttttctca 600
atcgggagca acgacttcat ccactattac ctgcgcaatg tgtctggcgt ccagatgcgt 660
tacctcccat gggagttcaa ccagcttctt gtcaatgcaa tgaggcagga aatcaagaat 720
ttgtacaata tcaatgttcg gaaggtcgtc atgatgggcc tccctcctgt tggctgcgca 780
cctcactttc tctgggagta cggcagtcaa gacggggaat gcatcgacta catcaataac 840
gtcgtgattc agttcaacta tgccctgaga tacatgtcta gtgaattcat ccgccagcac 900
ccaggctcta tgatcagtta ctgtgatact tttgaggggt ctgtggacat actgaagaat 960
cgtgaccgct acggttttct gaccaccact gatgcctgct gtgggctggg gaagtatggg 1020
ggcctgttca tgtgtgttct tccacagatg gcgtgcagcg acgcgtcgag ccatgtctgg 1080
tgggacgagt tccaccccac ggatgctgtg aaccgaatcc tggctgataa tgtgtggtct 1140
ggtgagcata ccaagatgtg ctatcctgtg gatttgcagc agatggtaaa actcaagtag 1200
<210> 3
<211> 399
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Ala Leu Pro Phe Leu Leu Leu Leu Ala Phe Ala Leu Leu Phe Pro
1 5 10 15
Leu Ser Ala Pro Pro Arg Cys Cys Ser Ala Ala Pro Ala Ser Ser Pro
20 25 30
Pro Pro Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Ala Pro Arg
35 40 45
Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala
50 55 60
Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg
65 70 75 80
Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe
85 90 95
Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu
100 105 110
Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly
115 120 125
Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr
130 135 140
Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly
145 150 155 160
Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr
165 170 175
Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe
180 185 190
Arg Lys Ser Val Phe Phe Phe Ser Ile Gly Ser Asn Asp Phe Ile His
195 200 205
Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp
210 215 220
Glu Phe Asn Gln Leu Leu Val Asn Ala Met Arg Gln Glu Ile Lys Asn
225 230 235 240
Leu Tyr Asn Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro
245 250 255
Val Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly
260 265 270
Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala
275 280 285
Leu Arg Tyr Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met
290 295 300
Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn
305 310 315 320
Arg Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu
325 330 335
Gly Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys
340 345 350
Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp
355 360 365
Ala Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr
370 375 380
Lys Met Cys Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys
385 390 395
<210> 4
<211> 5603
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60
ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120
gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180
gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240
gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300
atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360
tggccccttt gctctctcgt gaatcctccc ccccccgctt caaaggttgc aggtggttct 420
ggaatcgtcg atccgatgct gctttgcctc tcgtacgcct atggatgcag catgttgtgg 480
gtttagtgta atctgggttt tgggtttctg gtatacgaag gttttgctta gttgttggtt 540
cctatgaatt tggggcatct gatctcatac atcgggggta tgtggatttt tgcccaacaa 600
ttgctgaagc tgaagagtaa tcagttcata gcactctcct acacagctga ccacctggat 660
ctcacataca tagactcctg cggcttcctc tccttgatct cacatagcaa tgttgtgggt 720
ttagtgtaat ctgggtattt gggtttctcg catgcgaggg gcttgctcag ttgttggttc 780
gtctgtgggt ttctgccgaa caattgctga agctgaagag taaccagttt tgcagcacaa 840
ccaccacagt ctgggcatca tttgatcctg ctgttcttag cactcctgca gagctgacca 900
cctggatctc acgtatctat atagaatcct gcggcttcct ctccaaatca gtatccagta 960
tccaccaccg ttatcagccg ttgaggcaat gcattggcag aatgccagaa cattaagaag 1020
tgccatcata atgtacacca ttagtccatg catccagaaa acattgccag aatcctgcaa 1080
tgtatccatt tgatagtcct gagtcccgac cagttgtcta catgctccag tctctttgcc 1140
accacacact gttaaatctc tcttgtccaa tgtccaccac attctggaca gtttcaaggt 1200
cctcacagga agcacagctg cacaaccttt gttaatgttg ctttaagaaa gtcatatcta 1260
ctcattagtt tctttgggag agtaaggagg gaaaaggcat aggaaagaaa catttaacta 1320
gggctactgg ctcactatgt gaaagatgtt tcccttcaat ttcatttagc tggtgttctt 1380
tatctctttt gcccgtctct gtcagtactt atgtttttca tgaatcaata gtatcttgtt 1440
ctttcttctg tttttaaatt attttttccg tgatttctta atcttagact tttttgtgca 1500
tttgcagcag agaagctggg gcttcctttt gtgcctccat accttgaaca gaacatgcgc 1560
atgggtgtcg gcagtgtcga cctcagcaac attgatggga tgatacaagg tgtcaactat 1620
gcatccgcgg cagctggcat tctctccagc agtggttctg agctggtttg tcctcctaac 1680
ttcccaacaa ctctatttca cgcttataat ctagcaggaa tgtctttgtg agacccttct 1740
ctagaggacg aatcagaagg agggtgtttc aacaacagac tagaagcaat gactcttctc 1800
atagtgtcta catcctctct agttaggaag aatacttgct caaccatttg aactaatgct 1860
gaaagattct cctgttcggc tgctcccttc cttccatgtg ttccaactag tgtggattat 1920
cagggcatca aattcccttc ttagttccta ggaattcatg acttatatat gcttcctacc 1980
agatgtgaga ttgtctacac gagacgattg atatgctggt gctgatgggg ggtttattta 2040
tgctgctggc cttgtccaag tttgcttgtg aagctacagt gctataagtt gtatggttgt 2100
tttattttcc tgcacgcata aagcaaaagg agatatatgt agccatctac tcaaagctaa 2160
tttatcataa tttttttatt gtctgaaact aaaaaactgc atttgttcta tactatggct 2220
tttgggatga tcaaggagtt agtaagaatc actgatccgg caccaatgtg atgaaattga 2280
tgtatatcat cctgaacatt ccattttcat atcaatcttt attcctgctt atgttgttga 2340
atctccaatc tttgtgccca aaacaacaaa aacttgtgga gctgcaaatg ctaattttgt 2400
catttcaata aaacatcatg gtggtgtcta aagaggagaa atgtttacgt atgaacattg 2460
ctgcaaagtt ttcctttatg tggctatatg ttttaacttt ctataaagga ttggagcctc 2520
ttggttagag tcaagcttgt tgatttgcat accttttcat tattcttaaa tgtacttgaa 2580
actaaatcga catgatcatt aactatataa caccagtcta aagaacacca atctaaagaa 2640
cacacttaat gcttctctat gaaggtttct cttttggtat gtaatacttg ctcatcggat 2700
gtatcctttt ttgttactat tttgtctcgt gaactataca tttgaagatt attttgtggt 2760
ggtattcttt actactgcgg cattccagca gctgtaaaag tatgtgcaat tatactgtta 2820
aaaaatctcc aacattggca gtcccctagc ttggaatctg tcgatatttt ctgtgtttat 2880
gttatgattt cttgcaaaca tattttagat tcttaaattt taatggcgtg gttgttctag 2940
cttaaatatg tttagaacaa gggatgtgac acctttactt tgtgcagaat aaaccttcat 3000
gctgatctct tgtgtatcaa gccttcaggc taggggtgta agtggctaac ccgcgaaacc 3060
cacttatagg ctaaaataag ccgcgaaccc gtttattttg acctataagt gggttcgcgg 3120
ctgacccact tacagcccta cttcaggcac atgaggatca atcatttcat agtgtgacta 3180
tttgtagtta tctgtatggc cgtaaataat ggcctctata ttgttctgta ttggagtatc 3240
tctctactat ttttttctct gaagaagagc attcttttac ctatttttgg ttttcataat 3300
tcaatgtgat gcataatttg attctgttct tttttagata aaggaggcta atttgattct 3360
gttcttgcaa ttgtggatgc actgcaggga atgcatgtgt cgctgagcca gcaggtgcag 3420
caggttgagg acacatatga gcagctctct ctggctctcg gggaggcagc aacaactgac 3480
cttttcagaa agtccgtgtt ctttttctca atcgggagca acgacttcat ccactattac 3540
ctgcgcaatg tgtctggcgt ccagatgcgt tacctcccat gggagttcaa ccagcttctt 3600
gtcaatgcaa tgaggcagga aatcaaggtg tggttattgt tctccagttt attctctctg 3660
tgcaacattt cttgcctcct tatgattcca gttttagttt tttgatcagt gtgttgcata 3720
ttgcccaaag gctgtagtat cgtgcttagc agtggccaat gttgtgagta tgaatttgat 3780
ccgtaattta cggcccgtaa atattctgtg cttgaaaggt atctgctctc agttccacca 3840
cccagatgtg aatagttctt tgtactcctg gttaggaata tgtttgagaa aaggaggagt 3900
gtggacctct ggggactgca gatacatgaa ttatggaaaa ctagctatga acattaattt 3960
ttatgtttca agggctagaa aattttcaaa tgtttataga gaaacctgat atagtacact 4020
ttttctgtag gttaaagttt tcaaatggtg gatgagttta aaaccgtgta cagttttgga 4080
ctgaagcttc tttgagttac tgaaatcctc aggctgtaca gtttttctgt agttatgaat 4140
taggttaaaa ggataggagg gtatttcatc tgtacatttg taatatggga aagttaactg 4200
ataaatacat ggaattgatt aactcaatgg atatttatat cgttggctgt tagcagttct 4260
gtggtgttat gtactttaca ttctccgtct accgtacctt agtttcagat ttgaggtagt 4320
acgttgcaac gttgctcaac aaggacatac ttgtttttta tatgttcatt ttgaattctt 4380
aacattttga tcagataagg cggccccaaa tctgataggg actgatgtaa agtcgatact 4440
gaatattgtc ttggactgaa tactgtgttt gagtccctta gttcttggtc tgcgcatact 4500
tccagagtgg attgtacttt gtactgcctc ccatttggaa gtgcaagcta aatgcgtgtt 4560
acttttgctc aacttgtagg acaccatgca cactaccaat atgcccatga tcttaccatg 4620
atacaaacat aattctcaca tcatgcataa atgcataatg cacaatttga ttttctccct 4680
aatttatccc ctttcctttt ttgaacggat aattttaatt tgcaaaagaa ttggtaaaaa 4740
tggccccaaa tttctattca gtaaatcttt ggcagagcat gcgatgcaca ttgattgagg 4800
ctgcatgcgc catgagttta tttgtactgt ccaacatttg agagcagaaa tttctgttac 4860
cattgtactc atccaagttg acttgagatg ttgctttctt gtttcttaac cttagtaaat 4920
cagttacaat gatgcatttt tttattattt agccatatgc agttcttgtc agattagatt 4980
attaagctat ttatatctat atataagagt tctgtacttc ctgcagaatt tgtacaatat 5040
caatgttcgg aaggtcgtca tgatgggcct ccctcctgtt ggctgcgcac ctcactttct 5100
ctgggagtac ggcagtcaag acggggaatg catcgactac atcaataacg tcgtgattca 5160
gttcaactat gccctgagat acatgtctag tgaattcatc cgccagcacc caggctctat 5220
gatcagttac tgtgatactt ttgaggggtc tgtggacata ctgaagaatc gtgaccgcta 5280
cggtgagcag atgtatcatt gttactactg tcagattgcc tttctgtcct tagggaagaa 5340
ctcacattac gatggaatca cattgtgcag gttttctgac caccactgat gcctgctgtg 5400
ggctggggaa gtatgggggc ctgttcatgt gtgttcttcc acagatggcg tgcagcgacg 5460
cgtcgagcca tgtctggtgg gacgagttcc accccacgga tgctgtgaac cgaatcctgg 5520
ctgataatgt gtggtctggt gagcatacca agatgtgcta tcctgtggat ttgcagcaga 5580
tggtaaaact caagtagaac tga 5603
<210> 5
<211> 5600
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60
ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120
gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180
gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240
gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300
atccccgtcg actacatcgg tacgcgcccc ccaccttctc gatcggcggc gccatggctg 360
tggccccttt gctctctcgt gaatcctccc ccccccgctt caaaggttgc aggtggttct 420
ggaatcgtcg atccgatgct gctttgcctc tcgtacgcct atggatgcag catgttgtgg 480
gtttagtgta atctgggttt tgggtttctg gtatacgaag gttttgctta gttgttggtt 540
cctatgaatt tggggcatct gatctcatac atcgggggta tgtggatttt tgcccaacaa 600
ttgctgaagc tgaagagtaa tcagttcata gcactctcct acacagctga ccacctggat 660
ctcacataca tagactcctg cggcttcctc tccttgatct cacatagcaa tgttgtgggt 720
ttagtgtaat ctgggtattt gggtttctcg catgcgaggg gcttgctcag ttgttggttc 780
gtctgtgggt ttctgccgaa caattgctga agctgaagag taaccagttt tgcagcacaa 840
ccaccacagt ctgggcatca tttgatcctg ctgttcttag cactcctgca gagctgacca 900
cctggatctc acgtatctat atagaatcct gcggcttcct ctccaaatca gtatccagta 960
tccaccaccg ttatcagccg ttgaggcaat gcattggcag aatgccagaa cattaagaag 1020
tgccatcata atgtacacca ttagtccatg catccagaaa acattgccag aatcctgcaa 1080
tgtatccatt tgatagtcct gagtcccgac cagttgtcta catgctccag tctctttgcc 1140
accacacact gttaaatctc tcttgtccaa tgtccaccac attctggaca gtttcaaggt 1200
cctcacagga agcacagctg cacaaccttt gttaatgttg ctttaagaaa gtcatatcta 1260
ctcattagtt tctttgggag agtaaggagg gaaaaggcat aggaaagaaa catttaacta 1320
gggctactgg ctcactatgt gaaagatgtt tcccttcaat ttcatttagc tggtgttctt 1380
tatctctttt gcccgtctct gtcagtactt atgtttttca tgaatcaata gtatcttgtt 1440
ctttcttctg tttttaaatt attttttccg tgatttctta atcttagact tttttgtgca 1500
tttgcagcag agaagctggg gcttcctttt gtgcctccat accttgaaca gaacatgcgc 1560
atgggtgtcg gcagtgtcga cctcagcaac attgatggga tgatacaagg tgtcaactat 1620
gcatccgcgg cagctggcat tctctccagc agtggttctg agctggtttg tcctcctaac 1680
ttcccaacaa ctctatttca cgcttataat ctagcaggaa tgtctttgtg agacccttct 1740
ctagaggacg aatcagaagg agggtgtttc aacaacagac tagaagcaat gactcttctc 1800
atagtgtcta catcctctct agttaggaag aatacttgct caaccatttg aactaatgct 1860
gaaagattct cctgttcggc tgctcccttc cttccatgtg ttccaactag tgtggattat 1920
cagggcatca aattcccttc ttagttccta ggaattcatg acttatatat gcttcctacc 1980
agatgtgaga ttgtctacac gagacgattg atatgctggt gctgatgggg ggtttattta 2040
tgctgctggc cttgtccaag tttgcttgtg aagctacagt gctataagtt gtatggttgt 2100
tttattttcc tgcacgcata aagcaaaagg agatatatgt agccatctac tcaaagctaa 2160
tttatcataa tttttttatt gtctgaaact aaaaaactgc atttgttcta tactatggct 2220
tttgggatga tcaaggagtt agtaagaatc actgatccgg caccaatgtg atgaaattga 2280
tgtatatcat cctgaacatt ccattttcat atcaatcttt attcctgctt atgttgttga 2340
atctccaatc tttgtgccca aaacaacaaa aacttgtgga gctgcaaatg ctaattttgt 2400
catttcaata aaacatcatg gtggtgtcta aagaggagaa atgtttacgt atgaacattg 2460
ctgcaaagtt ttcctttatg tggctatatg ttttaacttt ctataaagga ttggagcctc 2520
ttggttagag tcaagcttgt tgatttgcat accttttcat tattcttaaa tgtacttgaa 2580
actaaatcga catgatcatt aactatataa caccagtcta aagaacacca atctaaagaa 2640
cacacttaat gcttctctat gaaggtttct cttttggtat gtaatacttg ctcatcggat 2700
gtatcctttt ttgttactat tttgtctcgt gaactataca tttgaagatt attttgtggt 2760
ggtattcttt actactgcgg cattccagca gctgtaaaag tatgtgcaat tatactgtta 2820
aaaaatctcc aacattggca gtcccctagc ttggaatctg tcgatatttt ctgtgtttat 2880
gttatgattt cttgcaaaca tattttagat tcttaaattt taatggcgtg gttgttctag 2940
cttaaatatg tttagaacaa gggatgtgac acctttactt tgtgcagaat aaaccttcat 3000
gctgatctct tgtgtatcaa gccttcaggc taggggtgta agtggctaac ccgcgaaacc 3060
cacttatagg ctaaaataag ccgcgaaccc gtttattttg acctataagt gggttcgcgg 3120
ctgacccact tacagcccta cttcaggcac atgaggatca atcatttcat agtgtgacta 3180
tttgtagtta tctgtatggc cgtaaataat ggcctctata ttgttctgta ttggagtatc 3240
tctctactat ttttttctct gaagaagagc attcttttac ctatttttgg ttttcataat 3300
tcaatgtgat gcataatttg attctgttct tttttagata aaggaggcta atttgattct 3360
gttcttgcaa ttgtggatgc actgcaggga atgcatgtgt cgctgagcca gcaggtgcag 3420
caggttgagg acacatatga gcagctctct ctggctctcg gggaggcagc aacaactgac 3480
cttttcagaa agtccgtgtt ctttttctca atcgggagca acgacttcat ccactattac 3540
ctgcgcaatg tgtctggcgt ccagatgcgt tacctcccat gggagttcaa ccagcttcac 3600
aatgcaatga ggcaggaaat caaggtgtgg ttattgttct ccagtttatt ctctctgtgc 3660
aacatttctt gcctccttat gattccagtt ttagtttttt gatcagtgtg ttgcatattg 3720
cccaaaggct gtagtatcgt gcttagcagt ggccaatgtt gtgagtatga atttgatccg 3780
taatttacgg cccgtaaata ttctgtgctt gaaaggtatc tgctctcagt tccaccaccc 3840
agatgtgaat agttctttgt actcctggtt aggaatatgt ttgagaaaag gaggagtgtg 3900
gacctctggg gactgcagat acatgaatta tggaaaacta gctatgaaca ttaattttta 3960
tgtttcaagg gctagaaaat tttcaaatgt ttatagagaa acctgatata gtacactttt 4020
tctgtaggtt aaagttttca aatggtggat gagtttaaaa ccgtgtacag ttttggactg 4080
aagcttcttt gagttactga aatcctcagg ctgtacagtt tttctgtagt tatgaattag 4140
gttaaaagga taggagggta tttcatctgt acatttgtaa tatgggaaag ttaactgata 4200
aatacatgga attgattaac tcaatggata tttatatcgt tggctgttag cagttctgtg 4260
gtgttatgta ctttacattc tccgtctacc gtaccttagt ttcagatttg aggtagtacg 4320
ttgcaacgtt gctcaacaag gacatacttg ttttttatat gttcattttg aattcttaac 4380
attttgatca gataaggcgg ccccaaatct gatagggact gatgtaaagt cgatactgaa 4440
tattgtcttg gactgaatac tgtgtttgag tcccttagtt cttggtctgc gcatacttcc 4500
agagtggatt gtactttgta ctgcctccca tttggaagtg caagctaaat gcgtgttact 4560
tttgctcaac ttgtaggaca ccatgcacac taccaatatg cccatgatct taccatgata 4620
caaacataat tctcacatca tgcataaatg cataatgcac aatttgattt tctccctaat 4680
ttatcccctt tccttttttg aacggataat tttaatttgc aaaagaattg gtaaaaatgg 4740
ccccaaattt ctattcagta aatctttggc agagcatgcg atgcacattg attgaggctg 4800
catgcgccat gagtttattt gtactgtcca acatttgaga gcagaaattt ctgttaccat 4860
tgtactcatc caagttgact tgagatgttg ctttcttgtt tcttaacctt agtaaatcag 4920
ttacaatgat gcattttttt attatttagc catatgcagt tcttgtcaga ttagattatt 4980
aagctattta tatctatata taagagttct gtacttcctg cagaatttgt acaatatcaa 5040
tgttcggaag gtcgtcatga tgggcctccc tcctgttggc tgcgcacctc actttctctg 5100
ggagtacggc agtcaagacg gggaatgcat cgactacatc aataacgtcg tgattcagtt 5160
caactatgcc ctgagataca tgtctagtga attcatccgc cagcacccag gctctatgat 5220
cagttactgt gatacttttg aggggtctgt ggacatactg aagaatcgtg accgctacgg 5280
tgagcagatg tatcattgtt actactgtca gattgccttt ctgtccttag ggaagaactc 5340
acattacgat ggaatcacat tgtgcaggtt ttctgaccac cactgatgcc tgctgtgggc 5400
tggggaagta tgggggcctg ttcatgtgtg ttcttccaca gatggcgtgc agcgacgcgt 5460
cgagccatgt ctggtgggac gagttccacc ccacggatgc tgtgaaccga atcctggctg 5520
ataatgtgtg gtctggtgag cataccaaga tgtgctatcc tgtggatttg cagcagatgg 5580
taaaactcaa gtagaactga 5600
<210> 6
<211> 1197
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
atggcgctcc ccttcctcct cctcctcgcc ttcgccctgc tcttcccgct ctccgctccc 60
ccgcgctgct gctccgcggc ccccgcctcc tcgccgcccc cgtccccgcc cccttcccct 120
gcggcggcgg cggcggcccc gcgccgcacg ccgctcgtcc cggcgctctt cgtgatcggc 180
gactccacgg cggacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc 240
gagccgtacg gccgcgactt cgacacccgc cgccccacgg ggcgcttctc caacggccgc 300
atccccgtcg actacatcgc agagaagctg gggcttcctt ttgtgcctcc ataccttgaa 360
cagaacatgc gcatgggtgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 420
ggtgtcaact atgcatccgc ggcagctggc attctctcca gcagtggttc tgagctggga 480
atgcatgtgt cgctgagcca gcaggtgcag caggttgagg acacatatga gcagctctct 540
ctggctctcg gggaggcagc aacaactgac cttttcagaa agtccgtgtt ctttttctca 600
atcgggagca acgacttcat ccactattac ctgcgcaatg tgtctggcgt ccagatgcgt 660
tacctcccat gggagttcaa ccagcttcac aatgcaatga ggcaggaaat caagaatttg 720
tacaatatca atgttcggaa ggtcgtcatg atgggcctcc ctcctgttgg ctgcgcacct 780
cactttctct gggagtacgg cagtcaagac ggggaatgca tcgactacat caataacgtc 840
gtgattcagt tcaactatgc cctgagatac atgtctagtg aattcatccg ccagcaccca 900
ggctctatga tcagttactg tgatactttt gaggggtctg tggacatact gaagaatcgt 960
gaccgctacg gttttctgac caccactgat gcctgctgtg ggctggggaa gtatgggggc 1020
ctgttcatgt gtgttcttcc acagatggcg tgcagcgacg cgtcgagcca tgtctggtgg 1080
gacgagttcc accccacgga tgctgtgaac cgaatcctgg ctgataatgt gtggtctggt 1140
gagcatacca agatgtgcta tcctgtggat ttgcagcaga tggtaaaact caagtag 1197
<210> 7
<211> 398
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Ala Leu Pro Phe Leu Leu Leu Leu Ala Phe Ala Leu Leu Phe Pro
1 5 10 15
Leu Ser Ala Pro Pro Arg Cys Cys Ser Ala Ala Pro Ala Ser Ser Pro
20 25 30
Pro Pro Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Ala Pro Arg
35 40 45
Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala
50 55 60
Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg
65 70 75 80
Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe
85 90 95
Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu
100 105 110
Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly
115 120 125
Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr
130 135 140
Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly
145 150 155 160
Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr
165 170 175
Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe
180 185 190
Arg Lys Ser Val Phe Phe Phe Ser Ile Gly Ser Asn Asp Phe Ile His
195 200 205
Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp
210 215 220
Glu Phe Asn Gln Leu His Asn Ala Met Arg Gln Glu Ile Lys Asn Leu
225 230 235 240
Tyr Asn Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro Val
245 250 255
Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly Glu
260 265 270
Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala Leu
275 280 285
Arg Tyr Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met Ile
290 295 300
Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn Arg
305 310 315 320
Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly
325 330 335
Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys Ser
340 345 350
Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp Ala
355 360 365
Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr Lys
370 375 380
Met Cys Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys
385 390 395
<210> 8
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggaagaaac agaggtgcc 19
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gcttggaggt atttgggaca 20
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gcaacgactt catccact 18
<210> 11
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ccttgatttc ctgcctca 18
<210> 12
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aattcatccg ccagcacc 18
<210> 13
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gcccacagca ggcatcag 18
<210> 14
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gatgcttatg tcggtgat 18
<210> 15
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
atgctcttct ggtgctac 18
<210> 16
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
cccgacatag atgcaataac ttc 23
<210> 17
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gcgcggtgtc atctatgtta ct 22
<210> 18
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ttcgccctgc tcttcccg 18
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
agatcagatg ccccaaattc ata 23
<210> 20
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tggagcctct tggttagagt c 21
<210> 21
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cctccttctg attcgtcct 19
<210> 22
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tttggtacca tggcgctccc cttcctc 27
<210> 23
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tttggatccc tacttgagtt ttaccatctg ctgca 35
<210> 24
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ggggtaccga gcataaggca aactggcg 28
<210> 25
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cgggatccat ggccaaacca tgggaaga 28
<210> 26
<211> 2127
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
atgtcgatca agcttctcgt tcttgttttc tctcttctga taatcttcac gagacccaaa 60
ttgatcgccg atcatcactt aactacaaga atctcgccga tttatccttc gatttctacg 120
tttcagcctt cgattccgcc gtttttacct ccatcgccgt cgcgcagagc acaatctccg 180
acggtgaagc cgtctttgcc atttgtaccg gcgttgttcg ttttcggaga ttcctcagtc 240
gatagcggaa ccaataactt tcttggaacc ttagcgagag cagatcggct tccctacggt 300
cgcgatttcg atacgcatca accaacggga aggttttgca atggaagaat cccagttgat 360
tatctaggtt acaattcttc cccagtttct ggatattgat tatagtccca gttgattctt 420
agaagtgtaa gcgaaaatgt tgacttcttg tgttcgattc tttatacaat tgagaggaac 480
aaattcattg aggaaatgtt gaatcattcg ttttttgttg tccattgaaa atcttgtgaa 540
cagctgatcg tttaggctta ccattcgttc ctagctatct tggacaaact gggactgttg 600
aagacatgtt tcaaggagta aactatgcat cagctggtgc tggaatcatc ttatcaagtg 660
gatctgaatt ggtaatactc agtttttcag agtcttttga gttcattttc tgtataccat 720
ctttcagctt tttcaatcct gtgggggaat ttttgttgtt gcagggccag cgggtttcat 780
ttgcgatgca agttgagcag tttgttgata cgtttcagca gatgatactg agtattgggg 840
agaaagcttc ggaacgttta gtgtcaaact cggttttcta catatcgatt ggagtgaatg 900
attacataca tttctacatc agaaacatct ccaatgtgca gaatctctat actccatgga 960
attttaatca gttcttggct tctaatatga gacaggagct caaggttaga cctctaatca 1020
atctttatac gttttctctt ggtaaagagt ttatagggga cagacaagta tgattctgag 1080
ttagtatagt tagtataagt gagacatctt gattagtaca caaaacgttg cctttatgaa 1140
gatcaaatca caaccctttt ttctgttttg gatctctggt ttgtatagtt gtagagagca 1200
taaagctcat taagctgcat attgatagcc taaacatgat tgagttatag tagttgcctc 1260
ttcatttagc tgcatattga tggcctaata agagaagtat tatgtttgtt tcacagacct 1320
tgtacaatgt caaggtgagg aggatggtgg tgatgggact gccacctatt ggctgtgcac 1380
catactacat gtggaaatac agaagccaga acggagaatg tgcagaagaa gtgaacagca 1440
tgatcatgga atccaacttt gtcatgagat acactgtaga taaactcaac cgtgagcttc 1500
caggggcatc cattatctac tgtgacgtgt tccaaagcgc tatggacatt ctcaggaacc 1560
accaacacta cggtaagcac cacttctatg tcaattctca attcacaaaa agactgtgac 1620
tggtaacaag taacaacata gcattataat cccatagcag tatcttggaa ctcaaacata 1680
gtcttctgag agtgatatat agagttttct gatcatcttc aagtgtgaaa gtaacttgtc 1740
aagagtcttg ttgaatctta gttgtgtgtg tattgtggtg tggacaggtt ttaatgagac 1800
gacagatgcg tgttgtgggc tagggaggta caaaggatgg cttccatgca tctcgccgga 1860
gatggcttgc tctgacgcct ccggtcacct ctggtgggac cagtttcatc ctacagacgc 1920
cgttaacgcc attctagccg acaatgtatg gaatggtcgc cacgtggaca tgtgttaccc 1980
tactaaccta gaaactatgc ttcattctta aatcagctga gaggataaaa atgtacataa 2040
aaaacatagt aaattgtaaa tgaactttgc aattttgatg tttggtccat ggtacataaa 2100
ggaaaactat aggtctttta tgctaaa 2127
<210> 27
<211> 1203
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
atgtcgatca agcttctcgt tcttgttttc tctcttctga taatcttcac gagacccaaa 60
ttgatcgccg atcatcactt aactacaaga atctcgccga tttatccttc gatttctacg 120
tttcagcctt cgattccgcc gtttttacct ccatcgccgt cgcgcagagc acaatctccg 180
acggtgaagc cgtctttgcc atttgtaccg gcgttgttcg ttttcggaga ttcctcagtc 240
gatagcggaa ccaataactt tcttggaacc ttagcgagag cagatcggct tccctacggt 300
cgcgatttcg atacgcatca accaacggga aggttttgca atggaagaat cccagttgat 360
tatctaggct taccattcgt tcctagctat cttggacaaa ctgggactgt tgaagacatg 420
tttcaaggag taaactatgc atcagctggt gctggaatca tcttatcaag tggatctgaa 480
ttgggccagc gggtttcatt tgcgatgcaa gttgagcagt ttgttgatac gtttcagcag 540
atgatactga gtattgggga gaaagcttcg gaacgtttag tgtcaaactc ggttttctac 600
atatcgattg gagtgaatga ttacatacat ttctacatca gaaacatctc caatgtgcag 660
aatctctata ctccatggaa ttttaatcag ttcttggctt ctaatatgag acaggagctc 720
aagaccttgt acaatgtcaa ggtgaggagg atggtggtga tgggactgcc acctattggc 780
tgtgcaccat actacatgtg gaaatacaga agccagaacg gagaatgtgc agaagaagtg 840
aacagcatga tcatggaatc caactttgtc atgagataca ctgtagataa actcaaccgt 900
gagcttccag gggcatccat tatctactgt gacgtgttcc aaagcgctat ggacattctc 960
aggaaccacc aacactacgg ttttaatgag acgacagatg cgtgttgtgg gctagggagg 1020
tacaaaggat ggcttccatg catctcgccg gagatggctt gctctgacgc ctccggtcac 1080
ctctggtggg accagtttca tcctacagac gccgttaacg ccattctagc cgacaatgta 1140
tggaatggtc gccacgtgga catgtgttac cctactaacc tagaaactat gcttcattct 1200
taa 1203
<210> 28
<211> 400
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 28
Met Ser Ile Lys Leu Leu Val Leu Val Phe Ser Leu Leu Ile Ile Phe
1 5 10 15
Thr Arg Pro Lys Leu Ile Ala Asp His His Leu Thr Thr Arg Ile Ser
20 25 30
Pro Ile Tyr Pro Ser Ile Ser Thr Phe Gln Pro Ser Ile Pro Pro Phe
35 40 45
Leu Pro Pro Ser Pro Ser Arg Arg Ala Gln Ser Pro Thr Val Lys Pro
50 55 60
Ser Leu Pro Phe Val Pro Ala Leu Phe Val Phe Gly Asp Ser Ser Val
65 70 75 80
Asp Ser Gly Thr Asn Asn Phe Leu Gly Thr Leu Ala Arg Ala Asp Arg
85 90 95
Leu Pro Tyr Gly Arg Asp Phe Asp Thr His Gln Pro Thr Gly Arg Phe
100 105 110
Cys Asn Gly Arg Ile Pro Val Asp Tyr Leu Gly Leu Pro Phe Val Pro
115 120 125
Ser Tyr Leu Gly Gln Thr Gly Thr Val Glu Asp Met Phe Gln Gly Val
130 135 140
Asn Tyr Ala Ser Ala Gly Ala Gly Ile Ile Leu Ser Ser Gly Ser Glu
145 150 155 160
Leu Gly Gln Arg Val Ser Phe Ala Met Gln Val Glu Gln Phe Val Asp
165 170 175
Thr Phe Gln Gln Met Ile Leu Ser Ile Gly Glu Lys Ala Ser Glu Arg
180 185 190
Leu Val Ser Asn Ser Val Phe Tyr Ile Ser Ile Gly Val Asn Asp Tyr
195 200 205
Ile His Phe Tyr Ile Arg Asn Ile Ser Asn Val Gln Asn Leu Tyr Thr
210 215 220
Pro Trp Asn Phe Asn Gln Phe Leu Ala Ser Asn Met Arg Gln Glu Leu
225 230 235 240
Lys Thr Leu Tyr Asn Val Lys Val Arg Arg Met Val Val Met Gly Leu
245 250 255
Pro Pro Ile Gly Cys Ala Pro Tyr Tyr Met Trp Lys Tyr Arg Ser Gln
260 265 270
Asn Gly Glu Cys Ala Glu Glu Val Asn Ser Met Ile Met Glu Ser Asn
275 280 285
Phe Val Met Arg Tyr Thr Val Asp Lys Leu Asn Arg Glu Leu Pro Gly
290 295 300
Ala Ser Ile Ile Tyr Cys Asp Val Phe Gln Ser Ala Met Asp Ile Leu
305 310 315 320
Arg Asn His Gln His Tyr Gly Phe Asn Glu Thr Thr Asp Ala Cys Cys
325 330 335
Gly Leu Gly Arg Tyr Lys Gly Trp Leu Pro Cys Ile Ser Pro Glu Met
340 345 350
Ala Cys Ser Asp Ala Ser Gly His Leu Trp Trp Asp Gln Phe His Pro
355 360 365
Thr Asp Ala Val Asn Ala Ile Leu Ala Asp Asn Val Trp Asn Gly Arg
370 375 380
His Val Asp Met Cys Tyr Pro Thr Asn Leu Glu Thr Met Leu His Ser
385 390 395 400
<210> 29
<211> 2629
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
atggcggcgc cccttctcgc cctcctgctc ctgttcctct ccggtccccg ccgctgctcc 60
gccgccgcgg cctcgccgcc cccaccgtcc ccgcccccgc ggcccgcgcc cctggtcccg 120
gcgctcttcg tcatcggcga ttccacggcc gacgtcggca ccaacaacta cctcggcacg 180
ctcgcccgcg ccgaccgcga gccctacggc cgggacttcg acacgcaccg ccccacgggg 240
cgcttctcca acggccgcat ccccgtcgac tacctcggta atattaaggg catgctccgc 300
ggcctccttt tgtagttcag cgacactgat gcgatgatcc aaggccgtgg tatatatgtt 360
aatgtgcagc ggagcggctg ggccttccct tcgtgcctcc ctaccttgaa cagaacatgc 420
gcacgggcgc cgccggtgcc ggcctcggca agattgatgg gatgatccaa ggcgtcaact 480
acgcgtccgc ggcagccggc atcatctcca gtagtggctc tgagctggta tatatatgtg 540
tcctccaatc ccatcacccc tacaaacctg atgctgagct taatctggca ggcagcattg 600
ccatgatttt gttgacaaat ctgttcgggt gcagaccact gaatactgtt gttgcttcgt 660
gatttgttca cttcactcat gtggtcctta attgaatgag cgatgttgat tgtaatcttt 720
gttgtgctgc agggaatgca tgtgtcgctg acccagcagg tgcaacaggt cgaggacacg 780
tacgagcagc tgtcgctggc tcttggggag gccgcggcag ccaacctgtt caagaggtcg 840
gtgttctttg tgtccatcgg gagcaacgat ttcatccact actacctgcg caatgtgtcg 900
ggtgtccaga tgcgttacct cccttgggaa ttcaacaagc tccttgtcag tacaatgaga 960
caggaaatta aggtgctctc cttgttttcc ggttagttct tttttagggt attttccggt 1020
tagtttattc agtgcagcat tacttgcctt gtttagagtg tgctaggctg atagagcttt 1080
ttacttggtg gtgctattct atttatagtg agggatcttg atgcttgaat tgttttcact 1140
tgcaattggc ataaatggtc ccatgcgtca aggagctgtg cctacaatca ccttttatct 1200
gttgcagttc tgaagtttaa actctgaacc catgaaaggg attaaattca gttgattgaa 1260
ataattattc tgagtttact agggactaac caactataat tgatattgat tatgtcttgg 1320
actgaaggta tgtttgattc gttgatatgc tggcactata tttctgaagt gatttgtaat 1380
ttgtactgcc ctccatatct tgagccaaag ttaactccat tgcacttcag tcttgactgc 1440
tggatccgct tccatattta tccttctgta ttcatatgac ctgactacga tacatcatga 1500
ttctttgtgc ccaatttatc ccatcgatga gtactaagga gaacatacga tgcttgttga 1560
ttgaagatgc gcatgccttg aagttgtatt gtctggcacc caagagttga aacacatact 1620
gtttataatg atacacccaa gattgtttat tttctcttaa tgtttataaa accttcagta 1680
ttaactggaa ttctgttttt ttgttttttt tcatctgtga atcttgttgt ataatgggag 1740
ttgtattgta tattatctac tgctctcttc tgacagtgaa gttttatgca gaatttgtac 1800
aacatcaatg ttcgcaaggt catactgatg ggcctacctc ctgttggatg cgcacctcat 1860
ttcctcgagg agtatggcag tcaaaatggg gaatgcatcg attatatcaa caatgtcgtg 1920
attgagttca actatgccct gaggcacatg tccaatgagt tcatcagcca gcacccagat 1980
tctatgatca gctattgcga tacttttgag gggtccgtgg acatactaaa caaccgtgag 2040
cgttatggtc agcacatgaa tcattagcaa gtttggatta cttgctgtcc ttagggaagc 2100
actcacagtt gactgagata ctgtgcaggt tttgtgacca ccactgatgc ttgctgcggg 2160
ctgggcaagt atggaggctt gatcatgtgc gttcttccac aaatggcgtg cagcgacgcg 2220
tcaagccatg tctggtggga tgaattccac ccaacagatg ctgtcaacca catcctggca 2280
gataatgttt ggtccagtca gcacaccaag atgtgctatc ctttggactt gcaacagatg 2340
gtaaaactga agctatagaa ccaatctgaa gttacttgcc tcacatacgt ttcaaagaaa 2400
tgtatagttg tgaatctgaa agagttgtca tgccaaaatg ttcatggttg tggattgcaa 2460
agatctatga agatagactt gtcaaattta gagctcaggt tacatcaaag tagatgttgc 2520
tgtttttttc tttcatatgt agaggatcta tatggtcaaa ctgacagact ctgttacggt 2580
actcttacga ggtaagatat gatcaaatga gtcaatggtt attcgggag 2629
<210> 30
<211> 1161
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
atggcggcgc cccttctcgc cctcctgctc ctgttcctct ccggtccccg ccgctgctcc 60
gccgccgcgg cctcgccgcc cccaccgtcc ccgcccccgc ggcccgcgcc cctggtcccg 120
gcgctcttcg tcatcggcga ttccacggcc gacgtcggca ccaacaacta cctcggcacg 180
ctcgcccgcg ccgaccgcga gccctacggc cgggacttcg acacgcaccg ccccacgggg 240
cgcttctcca acggccgcat ccccgtcgac tacctcgcgg agcggctggg ccttcccttc 300
gtgcctccct accttgaaca gaacatgcgc acgggcgccg ccggtgccgg cctcggcaag 360
attgatggga tgatccaagg cgtcaactac gcgtccgcgg cagccggcat catctccagt 420
agtggctctg agctgggaat gcatgtgtcg ctgacccagc aggtgcaaca ggtcgaggac 480
acgtacgagc agctgtcgct ggctcttggg gaggccgcgg cagccaacct gttcaagagg 540
tcggtgttct ttgtgtccat cgggagcaac gatttcatcc actactacct gcgcaatgtg 600
tcgggtgtcc agatgcgtta cctcccttgg gaattcaaca agctccttgt cagtacaatg 660
agacaggaaa ttaagaattt gtacaacatc aatgttcgca aggtcatact gatgggccta 720
cctcctgttg gatgcgcacc tcatttcctc gaggagtatg gcagtcaaaa tggggaatgc 780
atcgattata tcaacaatgt cgtgattgag ttcaactatg ccctgaggca catgtccaat 840
gagttcatca gccagcaccc agattctatg atcagctatt gcgatacttt tgaggggtcc 900
gtggacatac taaacaaccg tgagcgttat ggttttgtga ccaccactga tgcttgctgc 960
gggctgggca agtatggagg cttgatcatg tgcgttcttc cacaaatggc gtgcagcgac 1020
gcgtcaagcc atgtctggtg ggatgaattc cacccaacag atgctgtcaa ccacatcctg 1080
gcagataatg tttggtccag tcagcacacc aagatgtgct atcctttgga cttgcaacag 1140
atggtaaaac tgaagctata g 1161
<210> 31
<211> 386
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 31
Met Ala Ala Pro Leu Leu Ala Leu Leu Leu Leu Phe Leu Ser Gly Pro
1 5 10 15
Arg Arg Cys Ser Ala Ala Ala Ala Ser Pro Pro Pro Pro Ser Pro Pro
20 25 30
Pro Arg Pro Ala Pro Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser
35 40 45
Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala
50 55 60
Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr His Arg Pro Thr Gly
65 70 75 80
Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr Leu Ala Glu Arg Leu
85 90 95
Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg Thr Gly
100 105 110
Ala Ala Gly Ala Gly Leu Gly Lys Ile Asp Gly Met Ile Gln Gly Val
115 120 125
Asn Tyr Ala Ser Ala Ala Ala Gly Ile Ile Ser Ser Ser Gly Ser Glu
130 135 140
Leu Gly Met His Val Ser Leu Thr Gln Gln Val Gln Gln Val Glu Asp
145 150 155 160
Thr Tyr Glu Gln Leu Ser Leu Ala Leu Gly Glu Ala Ala Ala Ala Asn
165 170 175
Leu Phe Lys Arg Ser Val Phe Phe Val Ser Ile Gly Ser Asn Asp Phe
180 185 190
Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu
195 200 205
Pro Trp Glu Phe Asn Lys Leu Leu Val Ser Thr Met Arg Gln Glu Ile
210 215 220
Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val Ile Leu Met Gly Leu
225 230 235 240
Pro Pro Val Gly Cys Ala Pro His Phe Leu Glu Glu Tyr Gly Ser Gln
245 250 255
Asn Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Glu Phe Asn
260 265 270
Tyr Ala Leu Arg His Met Ser Asn Glu Phe Ile Ser Gln His Pro Asp
275 280 285
Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu
290 295 300
Asn Asn Arg Glu Arg Tyr Gly Phe Val Thr Thr Thr Asp Ala Cys Cys
305 310 315 320
Gly Leu Gly Lys Tyr Gly Gly Leu Ile Met Cys Val Leu Pro Gln Met
325 330 335
Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe His Pro
340 345 350
Thr Asp Ala Val Asn His Ile Leu Ala Asp Asn Val Trp Ser Ser Gln
355 360 365
His Thr Lys Met Cys Tyr Pro Leu Asp Leu Gln Gln Met Val Lys Leu
370 375 380
Lys Leu
385
<210> 32
<211> 10875
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tccgggccgg caagccaagc ggcccagagc acgccaccac taagccgagc gcgccaactc 60
accgccgcca ccgagcgcgc gcgcccgcag gaaatggcgg tggcgccctt gctcaccctc 120
ttactcctgc tgttcctctc cggttccggt ccccgccgat gctccgccgc cgccacagcg 180
aactcgacgt cctcaccttc tccgcccccg cggccggcgc cgctagtccc ggcgctcttc 240
gtaatcggcg actccacggc cgacgtaggc accaacaact acctgggcac gctcgcccgc 300
gccgaccgcg agccctacgg ccgggacttc gacacgcacc gccccacggg gcgcttctcc 360
aacggccgca tccccgtcga ctacatcggt aataattaag gccgggctct gcggcctcct 420
ctccatcctt tggttcagct agcgagcagc gacattctat tgatggtctt tgtgcagcgg 480
agcggctggg cctccccttc gtgcctccat accttgaaca gaacatgcgc acgggcgccg 540
ccgatgttgg cctcacaagc attgatggga tgatacaagg cgtcaactac gcgtccgcgg 600
ctgccggcat catctccagc agtggctctg agcttgtaca tatatatcct cccatgaatc 660
ccattgatcc tacaaaacct gatgctaaac ttagctcggc agaatggtca taatttagtt 720
gaaaaaaaaa ttaatttagt cattctggtt gtaatcttgg ttgtgctgta gggaatgcat 780
gtatccctga cccaacaggt gcagcaggtc gaggacacat atgagcagct atcactggct 840
cttggggagg ccgcggtggc caacctgttc aggaggtccg tgttctttgt gtccatcggg 900
agcaatgact tcatccacta ctacctgcgc aatgtgtctg gtgtccagat gcgatacctc 960
ccttgggagt tcaaccagct ccttgtcagt acaatgagac aggaaatcaa ggtgcgcttc 1020
ttcttctcca gttaggtcat tcagtgcagc attggttgtc acatttcttt acttttggag 1080
tgtatggtat atatgcttgc taggctggta gctatgttct tgtgcaaatc agtgagttaa 1140
ttggtgctta attagccgtt gttagcctta gtcatgtgag catcagttgt atacttgtat 1200
agttcaacgt tgtgctgcta ttctatttat agtttggtac tttggttctt tcacgaaata 1260
ttgacagatt ttttgttatg ttcgggaaga catacaagcg ccgggatcgt ggctgaccgg 1320
ggttggcatg tgtgtgcgcg gtcaccacga cagggtgtcc atgtcgttta cgacaagtgg 1380
atagttacgg atatttatca gatttggtta gttatatttg ttaggaagat ctagtttatt 1440
agcaagtcat cgttatgtag tcatgtaagg actataagag tccccatcgg ttaatgagaa 1500
gggtttagcc caggattgag atttatatct ccctaagggc gcctgacagt gccttcctgt 1560
tcgttgccct actgccgctc gtgatcgacc ttcgatcacg acgccaactc gctgcaaggt 1620
tcctcgcgct cacgctccaa tctcttcgcc ctactttcta cgctccaaag cccgacatcc 1680
taccaacttg gtatcagaga cgatggctac gtccggggat gcttccgcac cggttcctcc 1740
gacaacggtc gccccgacga cgggagtgcc tatgaggggc gttccgacgg tcggcgttac 1800
ggccgccgcc actctgcccc tcgccacaac ggcgcctcgt tgtcaccacc accagctatc 1860
tcgtccgtcg ccgaggccct taatgccttg acgtcggcca tcaccagcat gtagctgcaa 1920
atgacggcag tgaaccatca cctggcgaac caggccgctc gtctctctcg gcgattgaca 1980
gacaacacgc cttcacgcag ttcgggttgc ccagattcgg cggggtccca gccctgccca 2040
cttcctcgac gcccgtgatc tccgtggtct cggcggcctc ggactctgcc tcatccatgc 2100
cgcggtcttc gcaccgctca ccgcgaccga accacaaggg gcggcgccgc gtccgcatcc 2160
gccacctgga ggcgtcccga tcaatcagat cgttttcccc ccttgccgtt gccgcagcct 2220
gtgtttccct cggtgggtct tccatacttc accacgccga cgtctcacct gtcgacgcgg 2280
ccaccggcgg ttccttcgtc gcaaagcccg acggggtggc ggtcccaagg taccacaagc 2340
tcacgttcgc tacgtacgac gacacctgcg atcccctcgg ttggctcaac aagtgtgagt 2400
aattcttccg cagccaaaac acgcgcgagg cggacaagac ctggctcgcg tcataccacc 2460
tccaggacgt cgcgctccag tggtacatgg tattggaggc ggacatgggc tgaccggtgt 2520
ggcctgactt ccgccacatg tgtcagcaac gctttggtcc agcgcttagc acgaactacc 2580
tcgccaatct ggcgcggctc ccgttcggcg gttcggtcaa caaatatatg gcagcgtccc 2640
aacgcgcgcc gctcacgtcg gcgacctctc caccctacag aaggtccgct tgttcatggg 2700
tgggggctgc cggaatacat tcgagtcgac atcgaactca tggatcctca agacctgcag 2760
caggccatgc gtttggcgcg ggcttatgag cgccgcaatg ctgcccatgc cccggcttcg 2820
acgggacagc ggccggcgcg gcgtccccct ggcactcaag caaccttgcc agcaccgaca 2880
ggctccacaa ccacatcatc tacacctaca cggctcttca agcagctgac cccggaggag 2940
atggccgatc gatgcaagat gggtctttgc tataattgcg atgagccata cgtgcgcggt 3000
cataagtgtg catgccagtt tttcttggag gcaaccgact atgttgttga agaatcgaaa 3060
gatgacactg agcctgttga tgcctctttt gatccagaga agcccatgat ctccctggcc 3120
gcaatcacgg gcatccgagt ggagaagacg atgcagcttc ctgtccagat tgggatgcac 3180
aagttcactg ccctcctcga ttcaggcagc acgcacaact tcattgacgt caacgcagcg 3240
cgtcgcgcag ggctacaggt ggacgattgc ccaggcacgc acgtcgttgt ggccaacggt 3300
gaccatgtcg cctgccgtgg cctcaaccgt gctatccccc tccagattgg tgacaccagc 3360
tttgcggtgg actgcttcgc cataccgctg ccccactacg acatggtcct gaggatctcg 3420
tggctacgga ccctgggtcc catcttttgg gatttcaacg gccttcacat ggcattcgtc 3480
cttcgtggtc gccgtatgct gtggacgggc gtcggctcgc ccaacgcgca atgtgccgaa 3540
cccctgctcg aaagcgccat ctacaccgac aagggcgctg agccggccct cctcgagtga 3600
ttgctggacc tgttcacgga catcttcgcc gagccaacgg ggcttccgcc cgaacgcctg 3660
ggtgatcacc gcatccacct gaagccgggc acggagccgg tcgccgtgcg cccctccgct 3720
acccacatct ccaaaaagac gagttggagt gctagtgcga cgctatgctc caacagggcg 3780
tcatccggga gagcacgtcc cccttttcgg cgccggtctt gctggtccgc aagcaggatg 3840
caacgtggcg cttttgcgtc gattacaggg cgctcgacgc ggtgactgtg aaggacaagt 3900
tcctgatccc tgtcgtcgaa gagctgctca gcgagctcca tggcgccaac tttttcacca 3960
agctggatcc tcgttcgggc tatcattagg ttcgcgtcca cgcagcggat gttgaaaaga 4020
cagcgttccg gacgcaccac gaccacttcg aattcttggt cattcctttc ggcctgttga 4080
aagccctagt ttggttttgg ataattgatg aaaccctagt actaacctct ataataagtg 4140
tgtgtagact taatgaggtt ggtacatgcc aagtgatgga gcaagtgatg atcatggtga 4200
tgatggtgat gaccacaaga tgatcaagtg ctcaacttgg aaaagaagaa agagaaaaac 4260
aaaactctat ggagatcaag gcgaaggtat tgcttagggt tttggttttg gtgatcaaga 4320
caccatagag ggtgtgatca catttaggat agatagccgt actataaaga ggggaattct 4380
ttggctaagc ggttatcaag tgtcactagg tgtcattgtt catgggcatg catttagaac 4440
ctagtaagct aacttaactc cttcgaagaa aatgtttgtg aaaatgctaa cacacgtgca 4500
catgttggtt cacactttgt ggtgttggca cactttgaga aggaggtgga gtttgaaagg 4560
tagagagagg atgggttcct ctctccctcc cgccgagctt gcgaggcggg attcggcgct 4620
tttcgagaaa atgaagtgca tattttctat tgcgccggtg ggaaaattgg tgaagtcgcg 4680
ggagtgtttc tcgctgagaa aacactcacc ggacgctggc tcagaggcac cggacgctgt 4740
gtctgagcgt ccggtgtgca ggctgcctgg ctcagctagg gttaggcacc ggacgcaagc 4800
tggagcgtcc ggtggtctga gtccggtgtt cgcgtgtttt gcaaccctct ctgggtgtga 4860
gtccggtgag caccggacgc tcagggtgcg tccggtggct tgcgtccggt gaccctgcga 4920
gtttgcggag ctctctgcgc atgagtccgg tgtgcaccgg acgcgtccgg tgccaacctg 4980
ctcagcgtcc ggtgctctgc aggttaccgt tggactctga cacgcggctg acgttggagc 5040
accggacgtt ggtgttgagc gtccggtgcc cctttaagag cgtccggtga ccccgtattt 5100
cgcccagtga aagagccaac ggctctattt gtttgagggg ctataaatac gtgtttggcc 5160
ggcttggggc tcactctctt ggcattctaa catacttgac atacttgtga gcctaagcaa 5220
acacctccca ctcatctcct tcatagatta tacatctttg tgagattggg agtgattcta 5280
agtgcatttg cttgagtgat tgcatctagt ggcacttggg gatcgttcta gctgcagttt 5340
tcttgttact cttggtggtt gccgccacct agacggcttg gagcagcaga ggagctttgg 5400
cacgagttgg tgattgttcg tggccatctc cggtgattgt gagaggtttg tgcctacctc 5460
ggcggagtgc caaaggtaac attagtggat tgctcgtgtc attgagctac ctcacttgtg 5520
ggtaggttct tgtggtgtcc tagtgaggac gaggttcgtg ctacacctct tagccaccga 5580
accatcaagt gttggtcgac acaacgggga cgcagcgtgc cggcaagcac gtgaacctcg 5640
ggagaaaaat cggtgtctca attgtgtttg attggcattc tcccggtgct tgattgttga 5700
tatattggtg attggttcat cccctacacg gcggtataaa tatcttttcc tctcctatta 5760
cttaccacaa agtagtgtaa ctagttttag ttgctagttt tgacttgtgt agttaagctc 5820
actagtgtaa cttgtagaag acctagagct tgtgtgtata gtgatcatag caactagaat 5880
tattggatag gtggtttgca aacacccctt ttagagctag agcaaaaagc tacactttgt 5940
tatttactaa cctcttgctc tagtgagttt gtagattttt taaataggct attcaccctc 6000
cctctagcca tattaggacc tttcacctgt ccaacgcgcc ctcgacgttc caagcactca 6060
tgaacatcgt cctcaagccg ttcctgcgcc gctgtgtctt ggtgttcttt gatgacatcc 6120
tggtctacag acgtggaccg agcacctcca gcaacttcgg gtcgtcttcg acgtcctccc 6180
gtgagcaccg cttgcacctc aagcgttcta agtgctcctt cgccaccact tcggtccact 6240
acttgggcca cgtcatctcc aaggagggtg tggacatgga tgccaccaac gtagccgctg 6300
tgcagacgtg gccgcagccg cgttcggcgc gtggcctccg cggtttcctc ggcctatcgg 6360
gttactatcg ccgctttatc aaggacaatg gtagaatcgc ggcgccctta acccagctcc 6420
tgcgcaagga gtttcattgg tctgaggagg cgggcatggc attctcggcg ctcaaggagg 6480
ccctatgtgc ccccccgtac tccagctgcc tgtatggtac gattgcggcg cccttaaccc 6540
agctcctgca caaggagggg tttcgttggt ctgaggaggc aggcatggca ttctcggcgc 6600
tcaaggaggc cctctgtgcc ccctggtact ccagctgcct gacttcgcag cgacgttctt 6660
catggactgc gacgcgtcag gcttcagctt cggcgtagtg cttcatcagg atgggcggcc 6720
tattgcattc ttcagccacc ccttcgcagc acggcatctc aagacggcgg cctacgagca 6780
cgagattatt gggctcgttc aagcagtccg ccattggcga ccatatcttt gggggcgcgc 6840
cttcgtcgta cagaccgacc actacgccct caagtttatg cttgatcagc ggctgtcgac 6900
gattccgcag cgtcactggg tgagcaagtt atttggttat gatttcagcg ttgaatatcg 6960
tccaggcaaa gggaacgtgg tggccgatgc tttgtcacgc tgggatggcg acgtacctct 7020
cctggcggac gttctggagg ccggcgcctt cctcatggca ctgtctaccc tggcgttcca 7080
actctacgac gacatccacc acgagctgga cgccgacggc gggctgcgcc agcaccgcga 7140
cgccgcagca gccggtgagc tcgatccggc ctttaccgtt cgtgatggcc tcgtgctgta 7200
tgaggggcgt gtctacatcc ctgctgcgtc cgcccgtctc aacgacgtgc tccaactggc 7260
gcacatgggc gggcacgaag ggatccagcg caccctgcag cgcctcccgc agcgcttcta 7320
cgtcgagcat gaccgccgca tcgttggcga cttcgtccgt tcgtccccga cgtgccagcg 7380
gaataaaatg gagacgctgc acccgacagg tcttctccaa cctctgccgg tcccctcccg 7440
tgtttcggct gacatctcca tcaacttcgt cgaagctttg cccaaggtgc atggcaaaag 7500
tgtgctgctc acggtggtgg acagattctc gaagtatgcc cacttcattg cattgggcca 7560
tccctacacg gcgtcttcgg tggcacgagc attcttccac gagatcgttc gtcttcatgg 7620
gtttcctgag tccatcgtga gtgaccgtga cccggtgttc actggtcatg tgtggcgtga 7680
cctgttccgc catgccggtg tcaagcttcg catgagcact gcttttcatt cgcaaacgga 7740
ccgtcaatcg aaggtggtca acaagattat caccatgtat ctcatatgtc ttacagggga 7800
tcgtcctcgt gactggctag attggttggc atgggcggag ttctgctaca acacggcgta 7860
ccacactgct ctgcaggcca cgccgttcta ggtggtctat gggcgcgctc ctccggccct 7920
gttgccgtac acgccggggg aggcacacac agaggcggtc gacaccctgc tcaccaacag 7980
ggatgagttg ttggcggagg tgcgtgctcg gcttctccaa gcacaggaat atgcgcgacg 8040
cttctaagac gccaagcatc gtgcactgga gttcgccatt ggggactggg tcttgcttcg 8100
catgttgcat cgacacacgc aggctcttgt tcccggcggg cgtggcaagc tagggcccaa 8160
atatgcaggt ccttttcagg tactcgagcg cgtgggtgaa gttgcctacc atatgcgtct 8220
tccggatggg gctcggattc acgacgtctt tcatgtgggt gtgttgaagc ttttccgggg 8280
tcctcctccc ccgggtgaac tggtgctacc tcctcttcgt catgggtggc cactacagca 8340
gcctgatagg gtgctgcgct cagagcttcg tcgtggagtt tggcatgtcc tggtggcttg 8400
gtctggcatg ccgacgtccg aagctacctg ggaaccagtg ccggcattcc gcgctgccta 8460
tccttcgttc cagctcgagg acgagctgtt tccttaggga gggagagatg ggttggcatg 8520
tgtgtgcacg gtcaccaaga cagggtgtcc atgtcgttta cgacaagtgg acagttaggg 8580
atatttgtca gatttggtta gttatatttg ttaggaagat ctagtttatt agcaagtcat 8640
cgttatggag tcatgtaagg actataagag tccctattgg ttaatgagaa gggtttagcc 8700
catgattgag atttatatct ccctaagggc gcctggcagt gccttcctgt tcgttgccct 8760
gctgccgctc gtgattgacc ttcgatcacg gcgccaactc gccgcaaggt tcctcgcgct 8820
cacgctccaa tctctccgcc ctactttcta cgctccaaag cccgacgttc taccattttt 8880
tatgcctgaa ctattttcct gcgagtggca taaatgattt gggctgaggc tacaatcccc 8940
ctttgtctgt tgctgttcag tgttctgaat tttaatctct gaactcagga gtgaacatat 9000
ttgtctatgt gggaactgta taacatttgc aatttcgaaa gctaactgat ctgaacacat 9060
gaaagggaag taacctaatg gatattcaga taaccttatt atttatggaa gttctgggat 9120
gtaagacctt ttcaattttc cttagatgga tatatcgctg gctgtgagtt tccaatgtgg 9180
gatgctgctc aagaaagaat gcgttggttt tctatatata tgttcatctt tagttctttg 9240
aaaattgaac agctactgca atctaaattt caaaattgat gtcagttgca gcattttgat 9300
gaaatactaa gtttagctaa tcgaaataca actatcctgc gtgtaccaag aactcaagga 9360
aggcaaggac taattgacta taattgatat ttaattattt cttcgagtga atttatattt 9420
gattcaaata tatgctcact tacatatttc tgaagtgaat ttgtcatggc ccaggatcaa 9480
ctgggcccat ttaattccaa agttctgttc acaggtaccg tagcacactg ctgtgcacgt 9540
ctctgccgag tccaaaataa tgcacaagga ccaagagtct agttagttag gaagtctatt 9600
cattcaattt tcccactccc atgctaaatg gcgactagca tcggtggctc actcgtcatc 9660
agagtgccat accatccctg ctctgatacg ttgccctcca tattttgagc caaagttaat 9720
tgtattgtac ttctatgata caacatgatt ctaagttcat attcatatat tacattgatt 9780
cttaaggcct aatttgtcac atcgatggtt gtattattct ctgacaccca agggttgagt 9840
ttatataaat aataaggggc ggaaagttgt tagtttttta atgtttatga gaccttcatt 9900
attaattaga attctgtact ttttctcctt ttcatatatt cattattgtc caattttctg 9960
tggaccttgt tatataatca agttgcatat cccccactct ctcttctgat agtgatggtt 10020
ttatacagaa tttgtacgac atcaatgttc gcaaagtcat actgatgggc ctacctcctg 10080
ttggttgtgc acctcatttc ctcgaggagt atggcagtca aactggggaa tgcatcgatt 10140
atatcaacaa tgtcgtgatc gagttcaact atgccctgag acacatgtct agcgagttca 10200
tcagccagca tccagattcc atgatcagtt attgcgacac tttcgagggg tctgtggaca 10260
tactaaacaa tcgtgagcat tatggtgagc aaagtaatcg ttggtaagtt tggattactt 10320
gctggccttg gggaagcact tacatctcat tgagatatga cattgtgcag gttttgtcac 10380
caccactgac gcttgctgtg ggctgggcaa gtatggaggc ttgatcatgt gcgttcttcc 10440
acagatggcg tgcagtgatg catcaagcca tgtctggtgg gatgaattcc acccaacaga 10500
ggctgtcaac cgcatcctgg cagataatgt gtggtccagt cagcacacca agatgtgcta 10560
tcctttggac ctgcaacaga tggtaaaact gaagctgtag aaccaatctc gaatgacttg 10620
tttaacatgc gtttcaaaga acttaagagg tgacaagcct aattgaaatg tttagaattg 10680
tgaattacaa aatatttata aggatagact tgtcagtttt agatagctca gggtacatga 10740
aaagcaagag gttgttcctt ggtatgtaga tgcaatgtag gggatctatt tggcgaaact 10800
ggaacacata ctatcaagca tatgtgctaa tgactgatga ataatttagg cgacagaaag 10860
ttatttgaga ttgta 10875
<210> 33
<211> 1179
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
atggcggtgg cgcccttgct caccctctta ctcctgctgt tcctctccgg ttccggtccc 60
cgccgatgct ccgccgccgc cacagcgaac tcgacgtcct caccttctcc gcccccgcgg 120
ccggcgccgc tagtcccggc gctcttcgta atcggcgact ccacggccga cgtaggcacc 180
aacaactacc tgggcacgct cgcccgcgcc gaccgcgagc cctacggccg ggacttcgac 240
acgcaccgcc ccacggggcg cttctccaac ggccgcatcc ccgtcgacta catcgcggag 300
cggctgggcc tccccttcgt gcctccatac cttgaacaga acatgcgcac gggcgccgcc 360
gatgttggcc tcacaagcat tgatgggatg atacaaggcg tcaactacgc gtccgcggct 420
gccggcatca tctccagcag tggctctgag cttggaatgc atgtatccct gacccaacag 480
gtgcagcagg tcgaggacac atatgagcag ctatcactgg ctcttgggga ggccgcggtg 540
gccaacctgt tcaggaggtc cgtgttcttt gtgtccatcg ggagcaatga cttcatccac 600
tactacctgc gcaatgtgtc tggtgtccag atgcgatacc tcccttggga gttcaaccag 660
ctccttgtca gtacaatgag acaggaaatc aagaatttgt acgacatcaa tgttcgcaaa 720
gtcatactga tgggcctacc tcctgttggt tgtgcacctc atttcctcga ggagtatggc 780
agtcaaactg gggaatgcat cgattatatc aacaatgtcg tgatcgagtt caactatgcc 840
ctgagacaca tgtctagcga gttcatcagc cagcatccag attccatgat cagttattgc 900
gacactttcg aggggtctgt ggacatacta aacaatcgtg agcattatgg ttttgtcacc 960
accactgacg cttgctgtgg gctgggcaag tatggaggct tgatcatgtg cgttcttcca 1020
cagatggcgt gcagtgatgc atcaagccat gtctggtggg atgaattcca cccaacagag 1080
gctgtcaacc gcatcctggc agataatgtg tggtccagtc agcacaccaa gatgtgctat 1140
cctttggacc tgcaacagat ggtaaaactg aagctgtag 1179
<210> 34
<211> 392
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 34
Met Ala Val Ala Pro Leu Leu Thr Leu Leu Leu Leu Leu Phe Leu Ser
1 5 10 15
Gly Ser Gly Pro Arg Arg Cys Ser Ala Ala Ala Thr Ala Asn Ser Thr
20 25 30
Ser Ser Pro Ser Pro Pro Pro Arg Pro Ala Pro Leu Val Pro Ala Leu
35 40 45
Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu
50 55 60
Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp
65 70 75 80
Thr His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp
85 90 95
Tyr Ile Ala Glu Arg Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu
100 105 110
Gln Asn Met Arg Thr Gly Ala Ala Asp Val Gly Leu Thr Ser Ile Asp
115 120 125
Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Ile
130 135 140
Ser Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln Gln
145 150 155 160
Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ser Leu Ala Leu Gly
165 170 175
Glu Ala Ala Val Ala Asn Leu Phe Arg Arg Ser Val Phe Phe Val Ser
180 185 190
Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly
195 200 205
Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Ser
210 215 220
Thr Met Arg Gln Glu Ile Lys Asn Leu Tyr Asp Ile Asn Val Arg Lys
225 230 235 240
Val Ile Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu
245 250 255
Glu Glu Tyr Gly Ser Gln Thr Gly Glu Cys Ile Asp Tyr Ile Asn Asn
260 265 270
Val Val Ile Glu Phe Asn Tyr Ala Leu Arg His Met Ser Ser Glu Phe
275 280 285
Ile Ser Gln His Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu
290 295 300
Gly Ser Val Asp Ile Leu Asn Asn Arg Glu His Tyr Gly Phe Val Thr
305 310 315 320
Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Ile Met
325 330 335
Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp
340 345 350
Trp Asp Glu Phe His Pro Thr Glu Ala Val Asn Arg Ile Leu Ala Asp
355 360 365
Asn Val Trp Ser Ser Gln His Thr Lys Met Cys Tyr Pro Leu Asp Leu
370 375 380
Gln Gln Met Val Lys Leu Lys Leu
385 390
<210> 35
<211> 2883
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gagcacactg cacaccacta cgcactaccc gagcgcgcca actcaccacc accaccaagc 60
gcgcgcgctg gaaatggcgg tggcgccctt gtttgccctc ctagtcctgt tcctctccgg 120
tccccgccga tgcgccgccg ccgccgccgc cgccgccgcc gcggcctcgc cgtcctcacc 180
ttccccgtcc ccgcgacccg caccgctggt cccggcgctt ttcgtaatcg gcgactcaac 240
ggccgacgta ggcaccaaca actatctggg cacgctcgcc cgcgccgacc gcgagcccta 300
tggccgggac ttcgacacgc accaccccac ggggcgcttc tccaacggcc gcatccccgt 360
cgactacatc ggtaataagg gcaggctctg cggcctcctc tcgttgtttg gttcagccac 420
acttattgga aagatcgatt tgtgcagctg agcgactggg cctccccttc gtgcctccct 480
accttgaaca gagcatgcgc acgggcgccg gcggcgttgg cctcacaaac attgatggga 540
tgatacaagg cgtcaactac gcgtcggcgg cagccggcat catctccagc agtggctctg 600
agcttgtata tactccctct gctccgaacg gtcatcccaa atttctagag agttaaagca 660
tcttgagttt gagcaaaatt atataataaa caaataacat ttataacatg aaatgaatat 720
cattagattt ttcatcaatt atatttttat agtatgtcta tttaatggca gaaatctttg 780
taattttttc ataattttgg tcaaacactt tgatttttcc aaagaagttg ggacgactta 840
taattcgaaa cggagggcct acatctatac ttcatatatc atcccacgaa tcccattacc 900
ccaaatctgg tgctaacctt agctggccag catcgtcata atttggttta caaaaaaaat 960
gttcttactt tatgatcagt tcagtcagtt ttgtggttct taaattaatc gagtgattct 1020
agctgtaatc ttggttgtgc tgtagggaat gcatgtatcg ctgacccagc aggtgcagca 1080
ggtcgaggac acatatgagc agctatcact ggctcttggg gaggcggcag cgggcaacct 1140
attcaggagg tccgtgttct ttgtgtccat cgggagcaat gacttcatcc actactacct 1200
tcgcaatgtg tctggtgtcc agatgcggta cctcccttgg gagttcaacc agctccttgt 1260
aagcacaatg agacaagaaa tcaaggtgtg cttcttgttc tctagttagg tcattcagtg 1320
cagcattaga gtatctactt gctaggctgt tagttatgtt cttgtccaaa tcagtgagtt 1380
ggtgacatca tgcttaatta accattgcta gccttgtgag cctgtgagca tcagttgtga 1440
tacttgtgtg gttcaacttc gtggtgctac tctatttaag gtttagttct ttgatgaaat 1500
agttagggat ttctatgcct gaaatattgc tattctattt atagttttgt tctttgatga 1560
aatagttagg ggttttctat gcccgaacta tttttacttg caattggcat aaatgatccc 1620
gtgctttaag ctacaacctc attttgtttg ttgctgttca gcgttctaaa ttttaaactc 1680
tgaactaagg attgaacata tttgtctatg cgagaactgt ataacatttg caatttcgaa 1740
agctatctga tctgaaaaaa cgaaagggct agattcagat aaccttagtt atggcaattc 1800
tggctctggg atgtaagacc ttacaaattt ccttagttag atatatctga acaaatgaaa 1860
ttgtatgttt ttctttatgt ttgtaagacc ttcagtatta actggaatgc tgtatttttg 1920
cttcttttca tatattcgtc attgtcaaat taactgtgga ccttgatata taatcaagat 1980
ctatatcctc tgctgtctct tctgatactg atagttttct acagaatttg tatgacatca 2040
acgttcgcaa ggtcatactg atgggcctac ctcctgttgg ttgtgcacct catttcctcg 2100
aggagtatgg cagtcaaact ggggaatgca tcgattatat caacaatgta gtgatcgagt 2160
tcaactatgc cctgagacac atgtctaggg agttcatcag ccagcatcca gattccatga 2220
tcagttattg cgacactttc gaggggtctg tggacatact aaacaatcgt gagcattatg 2280
gtgagcaaac taatcattgg taaggttgga atacttgccg tccttagggg aagcacttac 2340
atctcattgg gatacgacgt tgtgcaggtt ttgtcaccac aactgatgct tgctgtgggc 2400
tgggcaagta tggaggcctg atcatgtgcg ttcttccaca aatggcgtgc agcgatgcat 2460
caagccatgt ctggtgggat gaattccacc caacagatgc tgtcaaccgc atcctggcag 2520
ataatgtgtg gtccagtcag cataccaaga tgtgctatcc tttggacctg cagcagatgg 2580
taaaactgaa gctgtagaaa ccagtctgga ctgacttgtt taacacgcgt ttcaaagaac 2640
ctacaagagg tgacaagccg aatggaaatg tatagatctg tgaattacaa atacttataa 2700
ggataggctt gtcagtttta gatatctcag gttacatgaa aagcatgatg ttgttccttg 2760
gtatgtagat gcaatgtagg ggatatatat ggtcaaactg gaacacatgc tgtcaggttt 2820
atataggtgc taatgagtga tgaataatct cggtgacaga aagctcattt gagattgtac 2880
ctg 2883
<210> 36
<211> 1182
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
atggcggtgg cgcccttgtt tgccctccta gtcctgttcc tctccggtcc ccgccgatgc 60
gccgccgccg ccgccgccgc cgccgccgcg gcctcgccgt cctcaccttc cccgtccccg 120
cgacccgcac cgctggtccc ggcgcttttc gtaatcggcg actcaacggc cgacgtaggc 180
accaacaact atctgggcac gctcgcccgc gccgaccgcg agccctatgg ccgggacttc 240
gacacgcacc accccacggg gcgcttctcc aacggccgca tccccgtcga ctacatcgct 300
gagcgactgg gcctcccctt cgtgcctccc taccttgaac agagcatgcg cacgggcgcc 360
ggcggcgttg gcctcacaaa cattgatggg atgatacaag gcgtcaacta cgcgtcggcg 420
gcagccggca tcatctccag cagtggctct gagcttggaa tgcatgtatc gctgacccag 480
caggtgcagc aggtcgagga cacatatgag cagctatcac tggctcttgg ggaggcggca 540
gcgggcaacc tattcaggag gtccgtgttc tttgtgtcca tcgggagcaa tgacttcatc 600
cactactacc ttcgcaatgt gtctggtgtc cagatgcggt acctcccttg ggagttcaac 660
cagctccttg taagcacaat gagacaagaa atcaagaatt tgtatgacat caacgttcgc 720
aaggtcatac tgatgggcct acctcctgtt ggttgtgcac ctcatttcct cgaggagtat 780
ggcagtcaaa ctggggaatg catcgattat atcaacaatg tagtgatcga gttcaactat 840
gccctgagac acatgtctag ggagttcatc agccagcatc cagattccat gatcagttat 900
tgcgacactt tcgaggggtc tgtggacata ctaaacaatc gtgagcatta tggttttgtc 960
accacaactg atgcttgctg tgggctgggc aagtatggag gcctgatcat gtgcgttctt 1020
ccacaaatgg cgtgcagcga tgcatcaagc catgtctggt gggatgaatt ccacccaaca 1080
gatgctgtca accgcatcct ggcagataat gtgtggtcca gtcagcatac caagatgtgc 1140
tatcctttgg acctgcagca gatggtaaaa ctgaagctgt ag 1182
<210> 37
<211> 393
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 37
Met Ala Val Ala Pro Leu Phe Ala Leu Leu Val Leu Phe Leu Ser Gly
1 5 10 15
Pro Arg Arg Cys Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser
20 25 30
Pro Ser Ser Pro Ser Pro Ser Pro Arg Pro Ala Pro Leu Val Pro Ala
35 40 45
Leu Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr
50 55 60
Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe
65 70 75 80
Asp Thr His His Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val
85 90 95
Asp Tyr Ile Ala Glu Arg Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu
100 105 110
Glu Gln Ser Met Arg Thr Gly Ala Gly Gly Val Gly Leu Thr Asn Ile
115 120 125
Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile
130 135 140
Ile Ser Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln
145 150 155 160
Gln Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ser Leu Ala Leu
165 170 175
Gly Glu Ala Ala Ala Gly Asn Leu Phe Arg Arg Ser Val Phe Phe Val
180 185 190
Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser
195 200 205
Gly Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val
210 215 220
Ser Thr Met Arg Gln Glu Ile Lys Asn Leu Tyr Asp Ile Asn Val Arg
225 230 235 240
Lys Val Ile Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe
245 250 255
Leu Glu Glu Tyr Gly Ser Gln Thr Gly Glu Cys Ile Asp Tyr Ile Asn
260 265 270
Asn Val Val Ile Glu Phe Asn Tyr Ala Leu Arg His Met Ser Arg Glu
275 280 285
Phe Ile Ser Gln His Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe
290 295 300
Glu Gly Ser Val Asp Ile Leu Asn Asn Arg Glu His Tyr Gly Phe Val
305 310 315 320
Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Ile
325 330 335
Met Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val
340 345 350
Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala
355 360 365
Asp Asn Val Trp Ser Ser Gln His Thr Lys Met Cys Tyr Pro Leu Asp
370 375 380
Leu Gln Gln Met Val Lys Leu Lys Leu
385 390
<210> 38
<211> 4019
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
atgacgatgt catatgtgtg caacaccgac ggcaactttc tttgtgcaat gtgtggagtg 60
aatgtggata gtcaggtcag ccagtgttgt cctcggtgcg gtcatattcc atgatggcgc 120
taaggacatt tattaatgtt tttgttcggt tttctacttt tctgcaaatt aactagacaa 180
ctattttcta catgattaat ggattgactc aaggattccg gttggaaaaa aaggaataat 240
gttgatctga attcttgaag attgagtacc acttacgaat agaatggagg gccaaatttt 300
atgggcccct gtacatcccc gtacaggcct ggactatatc ttggtttgtt ttgggttgta 360
ggtagaattc agtgttgggt tgggttgggt tgccaaattt cttcaaacaa ttgtcaggcc 420
ttttaaccca ccaaaccggc ctgcttcagg ctagcgactt gattgggctc gagtctgaca 480
gagcccatcg tcgacttgca ttgcatacgc ccgcgatcca tctcctccac cttttccacc 540
ccaactcccc aaggacgcgc gaacttgcac cgccttcgcc ggaaatggcg actctcctcg 600
ctctcctcat gtgcctcctc ctcttctccg ctctcccttg ctgcgccgcc gccgcgtcgc 660
cttcccggtc ctccgcccca tcggcggccc ctaccccgct cgtcccggcg ctcttcgtgg 720
tcggcgactc cacggccgac gtcggcacca acaactacct cggcacgctc gcccgcgccg 780
atcgtgagcc ctacggacgc gatttcgaca cccaccgccc caccggacgc ttctccaacg 840
gccgcatccc cgtcgactac ctcggtacgg tgctcgcgtc gcgcttcctt ttggtttcgc 900
cccccttttc tcgattgcta accccttttt ctgtactaca gcggagaagc tggggcttcc 960
cttcgtgcct ccgtaccttg agcagagcat gcgcacgggc gtaagcagtg ttggcctcgg 1020
caatattgat ggaatgatcc aaggcgtcaa ctatgcgtcc gcggcaggcg gcattctctc 1080
cagcagtggc tctgatctgg tctgtcctcc cacttctcct aataacacca tatcgatttt 1140
atgacgcctt ggtgtggccg agagcctgag atatctgttt gggtggagga atcgagtttc 1200
aatttttggt ttgttcacat cagtattgat gctaaccagg tggtgctcgt gcgattttgg 1260
ttgcgcttgt aggggatgca tgtgtcgctg acccagcaaa tgcagcaggt tgaggacaca 1320
tatgagcagc tggcactggc tcttggggag gcagcgacaa ctgacctgtt caagaggtcg 1380
gtgttctttg tgtcgatcgg gagcaacgac ttcatccact actacctgcg caatgtgtcc 1440
ggcgtccaga tgcattacct cccatgggag ttcaatcagc tccttgttaa tgaaatgagg 1500
caggcaatca aggtgcgcat cttgttcctc agtttattac tcccatggga gtactgtatt 1560
atgtgcagca ttgctcatct ctgtgttgtt tcttagtgtg tgtattatct cttatggctg 1620
taacatttca attttacttt gctggattta tctcttatgg ctgtaacatt tcaattttac 1680
tttgctggat tagtgacctc tgtagctagg attaggaatt gtgcttcgga gaaaatgtac 1740
ctctttatgt ggagagacta gcaatttgtt atctctggaa attaactaat gaacactagg 1800
aagtaattaa ctgaatgaat attgttgtgt ccttgcttgg ttgcagttct gaaatgttgg 1860
ttccttcacg gcttcacctt cgatatacat atcattcatt cttagtgtca aattttgggg 1920
tgtttctcaa gaagttaata ttggttgaac acatattcat cttaaatgat cttagttgca 1980
ccatttttat caaatgaaat aacaatgatt ggatctatta tcaggagtct acaatgagat 2040
atactgatgt ttacttgtta cttagttgta tcttgtgtaa acgttaccat ggatggctga 2100
agcgtgtaat catttcagtc tgcatcttct tcttgcccag tttattcttc gtaggattgc 2160
ccacctcctt tctggtatca ctgtcctctg tatcgttcct aaaggcagtg gcattggggt 2220
ttgacaatct atagtcagga ttctctgtaa aattcagaaa atatactctc ttatctgcac 2280
agagattaga aaagtagaaa tttgctatca ttggccggct ttcatttcag gaatattagt 2340
tcctttacct taagatttac atataattgg ttcttagtgt caactgtggg gtgtttctca 2400
agaaggtaat attgattttc tagatattca tcttaatttc taggacagtt gcataggtac 2460
cacaaatgca aaatattcca gatggatgct agttgcagca ttttgataat tttttttaaa 2520
atgactaggt atattatccc gactctgcaa ggaggtatag tggtgtttat ttgttacgta 2580
gtcagtattt agcagtgtct tcaactgact gatgtttttg agtaagctgc actaatttta 2640
taagcgattt atgctgcctt gtttattgag agtgcaagct aagtttctgg caaaaaaaaa 2700
gagagtgcaa gctaagtctg tggtacttat atcaactggt ggaccatctt gcacatttgg 2760
ctcaatgtgc tcatgacttg actttgatac agcatatgct tctcagtcca ggcgtcatgt 2820
atgatgtatc atttgatttt ctatgcccaa tttatctcca ttagctaatc ttaagcagaa 2880
tattcaaggc acggtaattg aagatgcaca ttccagtagt ttgttgtact gtccaactgt 2940
tgattattga atattcttgt gtttcattcc acaatctcat gaatatgctc atgcagattg 3000
aatggattgc ttcagtttgt ttgttcttta caattcttca gaaaattaat tgcatttttt 3060
agaacgaatt taattgcaag ttggcatttt tttcttcata tttcgcaact ttcggtgacc 3120
gaactagttg tgtgtatcct gctcccttct gacatgataa tttatgcaga atctgtacaa 3180
catcaacgtc agaaaggttg tattgatggg ccttcctcct gttggctgtg cacctcactt 3240
cctttcggac tatggcagcc aaaatgggga atgcatcgac tacatcaaca atgttgtgat 3300
tgagttcaac tatgggctgc gatacatgtc cagcgagttc atccgccagt acccagattc 3360
tatgatcagt tactgtgata ctttcgaggg gtcagtggac atactagaga accgtgaccg 3420
ctatggtgag caaatgcatc ataagtacta catttggttt gcctgctatc cttagtaaaa 3480
gccttacatt ttgatggaat tgcaatgcac aggctttgtg accatcactg atgcttgctg 3540
tgggctaggg aagtatggcg gcgtattcat atgtgttctt ccacagatgg cgtgcagcga 3600
cgcatcaagc catgtctggt gggacgagtt ccacccaaca gatgctgtga atcggatcct 3660
ggcagaaaat gtctggtcgg gtgagcacac caagatgtgc tatccagtcg acttgcagga 3720
gatggtgaaa ctgaagcagt agaaaccaac ctgaaatctc catctcagtt gcttgctcaa 3780
cttctttgtt ttcagtttta cgaagaactt ttggggtcgg catagaaaat gtacatatcg 3840
agaatcacgg agttctgtaa tcagatttgg atagctctgg ttaaatgcaa gtatgtttgc 3900
ctgtaagtga actgtaaagg atctgtattg ccaaactgcc acatattgcc tgtcaagtga 3960
gactgaatga gtgatgagcc tgtttggtga caaaaagaaa cgccgagctg ttgacctgc 4019
<210> 39
<211> 1374
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
atgacgatgt catatgtgtg caacaccgac ggcaactttc tttgtgcaat gtgtggagtg 60
aatgtggata gtcaggctag cgacttgatt gggctcgagt ctgacagagc ccatcgtcga 120
cttgcattgc atacgcccgc gatccatctc ctccaccttt tccaccccaa ctccccaagg 180
acgcgcgaac ttgcaccgcc ttcgccggaa atggcgactc tcctcgctct cctcatgtgc 240
ctcctcctct tctccgctct cccttgctgc gccgccgccg cgtcgccttc ccggtcctcc 300
gccccatcgg cggcccctac cccgctcgtc ccggcgctct tcgtggtcgg cgactccacg 360
gccgacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgatcg tgagccctac 420
ggacgcgatt tcgacaccca ccgccccacc ggacgcttct ccaacggccg catccccgtc 480
gactacctcg cggagaagct ggggcttccc ttcgtgcctc cgtaccttga gcagagcatg 540
cgcacgggcg taagcagtgt tggcctcggc aatattgatg gaatgatcca aggcgtcaac 600
tatgcgtccg cggcaggcgg cattctctcc agcagtggct ctgatctggg gatgcatgtg 660
tcgctgaccc agcaaatgca gcaggttgag gacacatatg agcagctggc actggctctt 720
ggggaggcag cgacaactga cctgttcaag aggtcggtgt tctttgtgtc gatcgggagc 780
aacgacttca tccactacta cctgcgcaat gtgtccggcg tccagatgca ttacctccca 840
tgggagttca atcagctcct tgttaatgaa atgaggcagg caatcaagaa tctgtacaac 900
atcaacgtca gaaaggttgt attgatgggc cttcctcctg ttggctgtgc acctcacttc 960
ctttcggact atggcagcca aaatggggaa tgcatcgact acatcaacaa tgttgtgatt 1020
gagttcaact atgggctgcg atacatgtcc agcgagttca tccgccagta cccagattct 1080
atgatcagtt actgtgatac tttcgagggg tcagtggaca tactagagaa ccgtgaccgc 1140
tatggctttg tgaccatcac tgatgcttgc tgtgggctag ggaagtatgg cggcgtattc 1200
atatgtgttc ttccacagat ggcgtgcagc gacgcatcaa gccatgtctg gtgggacgag 1260
ttccacccaa cagatgctgt gaatcggatc ctggcagaaa atgtctggtc gggtgagcac 1320
accaagatgt gctatccagt cgacttgcag gagatggtga aactgaagca gtag 1374
<210> 40
<211> 457
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 40
Met Thr Met Ser Tyr Val Cys Asn Thr Asp Gly Asn Phe Leu Cys Ala
1 5 10 15
Met Cys Gly Val Asn Val Asp Ser Gln Ala Ser Asp Leu Ile Gly Leu
20 25 30
Glu Ser Asp Arg Ala His Arg Arg Leu Ala Leu His Thr Pro Ala Ile
35 40 45
His Leu Leu His Leu Phe His Pro Asn Ser Pro Arg Thr Arg Glu Leu
50 55 60
Ala Pro Pro Ser Pro Glu Met Ala Thr Leu Leu Ala Leu Leu Met Cys
65 70 75 80
Leu Leu Leu Phe Ser Ala Leu Pro Cys Cys Ala Ala Ala Ala Ser Pro
85 90 95
Ser Arg Ser Ser Ala Pro Ser Ala Ala Pro Thr Pro Leu Val Pro Ala
100 105 110
Leu Phe Val Val Gly Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr
115 120 125
Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe
130 135 140
Asp Thr His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val
145 150 155 160
Asp Tyr Leu Ala Glu Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu
165 170 175
Glu Gln Ser Met Arg Thr Gly Val Ser Ser Val Gly Leu Gly Asn Ile
180 185 190
Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Gly Gly Ile
195 200 205
Leu Ser Ser Ser Gly Ser Asp Leu Gly Met His Val Ser Leu Thr Gln
210 215 220
Gln Met Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu
225 230 235 240
Gly Glu Ala Ala Thr Thr Asp Leu Phe Lys Arg Ser Val Phe Phe Val
245 250 255
Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser
260 265 270
Gly Val Gln Met His Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val
275 280 285
Asn Glu Met Arg Gln Ala Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg
290 295 300
Lys Val Val Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe
305 310 315 320
Leu Ser Asp Tyr Gly Ser Gln Asn Gly Glu Cys Ile Asp Tyr Ile Asn
325 330 335
Asn Val Val Ile Glu Phe Asn Tyr Gly Leu Arg Tyr Met Ser Ser Glu
340 345 350
Phe Ile Arg Gln Tyr Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe
355 360 365
Glu Gly Ser Val Asp Ile Leu Glu Asn Arg Asp Arg Tyr Gly Phe Val
370 375 380
Thr Ile Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Val Phe
385 390 395 400
Ile Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val
405 410 415
Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala
420 425 430
Glu Asn Val Trp Ser Gly Glu His Thr Lys Met Cys Tyr Pro Val Asp
435 440 445
Leu Gln Glu Met Val Lys Leu Lys Gln
450 455
<210> 41
<211> 3584
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
cttccataaa ccagaccggt cttctccccc acctttccca acccagagcg cgcgaactcg 60
ccaccgcctc gccggaaatg gcgccttccc tcgctcacct cgtgtgcctc ctcctcctcc 120
tccttctcct cctctccgct ctacccctct ccgcagccgc ctcgaccccc cggtccgcgc 180
cgccgtcggc gccccccacc ccgctcgtcc ccgcgctctt cgtcatcggc gactccacgt 240
ccgacgtcgg caccaacaac tacctcggca cgctcgcccg cgccgaccgc gagccctacg 300
gccgggactt cgacacccac cgccccaccg gacgcttctc caacggccgc atccccgtcg 360
actacctcgg tgcgttgccc gcgacctcgg tgtctcctcg cttctctcgg tttctccatg 420
gatcattggt gcggtgctgg tttctcgatt ttgcgcgtcc ttgcttccag atgcggatcg 480
tttcggttta ttaggcctcc atggttcatc gtgactactg atgattgttt cttctgcttg 540
attgttccgt gtaatcttct gtcgctgctg tggtctgaat ccgcaggagt atggcagccc 600
catgtgatat tcctagtttc ccttctcttg atttctgacc ccttttgttg ctgtaccaca 660
gcggagaagc tggggcttcc cttcgtgcct ccgtacctcg agcagagcat gcgcatgggc 720
gtcggcagcg ttggcctcat caacatcggc ggaatgatcc aaggagtcaa ctacgcttcc 780
gcggcagccg gcattctctc cagcagtggc tctgagctgg tccgttctcc caccgctccc 840
gataactgcg tcaatcttat aacgtcttgg tgctgtcgag agatctgttt ggggatgatt 900
ctgctgtcaa tctgtggttt cttcacacca aatttgatgc taatcggttg gggtttttgc 960
gattttggtc gcgcttgcag gggatgcacg tgtcgctgac ccagcaggtg cagcaggttg 1020
aggacacata tgagcagttg gcgctggctc ttggggaggc agctacagtc gacttgttca 1080
agaggtcggt attctttgtg tcgatcggga gcaacgactt catccactac tacctgcgca 1140
atgtgtcagg cgtgcagatg cattacctcc catgggagtt caatcagctc cttgttaatg 1200
cagtgaggca ggaaatcaag gtgtgcttct tgctcctcag tttgttatgt gtaccattgc 1260
tcgcctcctt tttcattatc agtgtgttgt gcattgtttt acttgtggag atgcaccaca 1320
cgtagtcagg gatctctgta actacgaatt tcgttttgga cataacgtag tttcttgtgt 1380
ggatacacta gaaaaccatt atctgggaaa ttaacacatg aaagtgattt aaatgaatga 1440
ggtttccttg ttggtttgca gttctagaac attaacggct tcacctatgg tttgcagttc 1500
acagatggaa taatcccatt gttcttactg tcgaatttgg ggttatttct ttcaatattg 1560
cacaggtatt gcgattgcaa aatgtttcag actgatgtta gatgcggcat tttgataaaa 1620
tatgaaataa aaatggttgg attgatgatc ccgattctac aatgaggtgt aatggtgttt 1680
ggttgctatg taagggtatg tttggatggt agccaaaact tatctccaat ttttttgcat 1740
gccaatagcc aacattggcc aactctagtt cattttcctt tccaacattg gccaactcat 1800
ggaccagcac aactttgacc aaaattttgg cctaactttt tggtaaggca aacatgggct 1860
caaacaaaac tgacattata ctgtcttaaa actttttttc tctcaaacgc acacttaaat 1920
gtgtgttgtt gtatattaga agaaagcgtc atgatgatgc aaagcaaagc aaatacaacc 1980
ctgaaaagca gaagtcctaa actattgaaa acgaagcaat acaaaaggca gcccaactga 2040
aaaactgaaa ctgcacaagg tgctactcat gctacccgag ctacaccaca gcatactatc 2100
ttaaaatgtg atatattctg aaatgctcag gctgcacttt tttttgtgct accatctgtt 2160
ttgggttcaa gttaagtctg ttgtactttc agagttcatg gatggaaccc tcgttctagg 2220
atgcagtgtt ttatctgtgg aacttgatgt attttcactg gtctgtaatt tctggagctc 2280
atgcttgatc gtcgtgtttg atctgcctgc gtgctgttgg ttcctggtag ttgctttacc 2340
tgtatgcttg taggtttagc ttcctgtttt gtgtctttaa tgtttctcat actctgtaga 2400
actatgccgg tttctttaat ggaaatcgat gaggaggctc gttgcttaaa aactaaaaaa 2460
aaaaacagtc tgttgtactt tcagctataa ctgtataaca ccttgcacat ttatctcgct 2520
gcattgaact gttcatgatc tgaccatggt acaagtgtgc ttctcagttc atgtgtcatg 2580
gatcatttga ttctctatgc ctaatttatc tctgttacct aatcttgagc agaacatgtg 2640
atgcatggtg attgaagatg catataccag tagtttgttg tatgtagaaa ttttctttgt 2700
gtttattcca taatctcatt tatatgctga tgcaaattgt aatggattgc ttcggtttct 2760
ttattcttcg cagtaccgta gcaaattaat tgccattttg catccattac tgtttagttc 2820
tatacatgtg gttcttgtca gattactcca cttttgatgt ctaaactagt tctggactca 2880
tgtgtctcct actaccttct gacaatgatg atttatgcag aatctgtaca atatcaacgt 2940
ccgaaaggtc gtgctgatgg gccttcctcc tgttggctgt gcccctcact tcctctcaga 3000
ctacggcagc caaaatgggg aatgcatcga ctacatcaac aacgtcgtga tcgagttcaa 3060
ctatgggctg agatacatgt ccagcgagtt catccgccag tacccagact cgatgatcag 3120
ctactgtgat acatttgagg ggtcagtgga catactagag aaccgtgacc gctatggtga 3180
gtaaatgcat cattagtatt gcatttaaat tgcgtgccgg ttcgcaactg taacatttgt 3240
agtacattta aatggagtgc taagtcttct catttttggt ggacttgcaa ctgcaggctt 3300
tctgaccacc actgatgctt gctgtgggct tggcaagtat ggcgggctat tcatctgtgt 3360
tcttccacag atggcgtgca gcgacgcgtc aagccatgtg tggtgggatg aattccaccc 3420
gaccgatgct gtgaaccgga tcctggcaga aaacgtgtgg tctggtgagc acaccaggat 3480
gtgctatcca gtgaacttgc aggagatggt gaagctgaag cagtagaacc aacctggatc 3540
gtcattgcag ttacttgctc aacttctgtg ttttcatttt cgac 3584
<210> 42
<211> 1176
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
atggcgcctt ccctcgctca cctcgtgtgc ctcctcctcc tcctccttct cctcctctcc 60
gctctacccc tctccgcagc cgcctcgacc ccccggtccg cgccgccgtc ggcgcccccc 120
accccgctcg tccccgcgct cttcgtcatc ggcgactcca cgtccgacgt cggcaccaac 180
aactacctcg gcacgctcgc ccgcgccgac cgcgagccct acggccggga cttcgacacc 240
caccgcccca ccggacgctt ctccaacggc cgcatccccg tcgactacct cgcggagaag 300
ctggggcttc ccttcgtgcc tccgtacctc gagcagagca tgcgcatggg cgtcggcagc 360
gttggcctca tcaacatcgg cggaatgatc caaggagtca actacgcttc cgcggcagcc 420
ggcattctct ccagcagtgg ctctgagctg gggatgcacg tgtcgctgac ccagcaggtg 480
cagcaggttg aggacacata tgagcagttg gcgctggctc ttggggaggc agctacagtc 540
gacttgttca agaggtcggt attctttgtg tcgatcggga gcaacgactt catccactac 600
tacctgcgca atgtgtcagg cgtgcagatg cattacctcc catgggagtt caatcagctc 660
cttgttaatg cagtgaggca ggaaatcaag aatctgtaca atatcaacgt ccgaaaggtc 720
gtgctgatgg gccttcctcc tgttggctgt gcccctcact tcctctcaga ctacggcagc 780
caaaatgggg aatgcatcga ctacatcaac aacgtcgtga tcgagttcaa ctatgggctg 840
agatacatgt ccagcgagtt catccgccag tacccagact cgatgatcag ctactgtgat 900
acatttgagg ggtcagtgga catactagag aaccgtgacc gctatggctt tctgaccacc 960
actgatgctt gctgtgggct tggcaagtat ggcgggctat tcatctgtgt tcttccacag 1020
atggcgtgca gcgacgcgtc aagccatgtg tggtgggatg aattccaccc gaccgatgct 1080
gtgaaccgga tcctggcaga aaacgtgtgg tctggtgagc acaccaggat gtgctatcca 1140
gtgaacttgc aggagatggt gaagctgaag cagtag 1176
<210> 43
<211> 391
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 43
Met Ala Pro Ser Leu Ala His Leu Val Cys Leu Leu Leu Leu Leu Leu
1 5 10 15
Leu Leu Leu Ser Ala Leu Pro Leu Ser Ala Ala Ala Ser Thr Pro Arg
20 25 30
Ser Ala Pro Pro Ser Ala Pro Pro Thr Pro Leu Val Pro Ala Leu Phe
35 40 45
Val Ile Gly Asp Ser Thr Ser Asp Val Gly Thr Asn Asn Tyr Leu Gly
50 55 60
Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr
65 70 75 80
His Arg Pro Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr
85 90 95
Leu Ala Glu Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln
100 105 110
Ser Met Arg Met Gly Val Gly Ser Val Gly Leu Ile Asn Ile Gly Gly
115 120 125
Met Ile Gln Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Leu Ser
130 135 140
Ser Ser Gly Ser Glu Leu Gly Met His Val Ser Leu Thr Gln Gln Val
145 150 155 160
Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu Gly Glu
165 170 175
Ala Ala Thr Val Asp Leu Phe Lys Arg Ser Val Phe Phe Val Ser Ile
180 185 190
Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Val
195 200 205
Gln Met His Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Asn Ala
210 215 220
Val Arg Gln Glu Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val
225 230 235 240
Val Leu Met Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu Ser
245 250 255
Asp Tyr Gly Ser Gln Asn Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val
260 265 270
Val Ile Glu Phe Asn Tyr Gly Leu Arg Tyr Met Ser Ser Glu Phe Ile
275 280 285
Arg Gln Tyr Pro Asp Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly
290 295 300
Ser Val Asp Ile Leu Glu Asn Arg Asp Arg Tyr Gly Phe Leu Thr Thr
305 310 315 320
Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Phe Ile Cys
325 330 335
Val Leu Pro Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp
340 345 350
Asp Glu Phe His Pro Thr Asp Ala Val Asn Arg Ile Leu Ala Glu Asn
355 360 365
Val Trp Ser Gly Glu His Thr Arg Met Cys Tyr Pro Val Asn Leu Gln
370 375 380
Glu Met Val Lys Leu Lys Gln
385 390
<210> 44
<211> 5417
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atggcgcccc gctcgccgct cctcctgccc ctcctcctcg ccctcgagct tctcgtcctc 60
ccgctcccca ctccccccca ctgctgctcc gcggcccccc acgtctcgcc gtcaccgtcg 120
ccggaggcgg aggcggtaac ggcaacggca gccacgcgca cgccgctcgt cccggcgctc 180
ttcgtgatcg gggactccac ggccgacgtc ggcaccaaca actacctcgg cacgctcgcc 240
cgcgccgacc gcgagccgta cggccgcgac ttcgacaccc gccgccccac ggggcgtttc 300
tccaacggcc gcatccccgt cgactacatc ggtatgtgcg cgtccccgcc cccgcccctg 360
cccccgctcg ctcgctctcg tgagtcctcc ccgcttccag tgtcgcagat agtactccaa 420
atcgccgctc cgatgctttg cctcttgtac ggctcccatg gatgcagcag ccgtgcagca 480
tttggtgggt ttagtgtgtt gcgtaatttg ggtttctcgc atgcgagggt tttggattca 540
gttgttggtt cctacatctg atctcgtgca ttcgggtatg tgagtttttg ctgaacaatt 600
gctgaatctg aagagtaatc agttctaata gtacactcct acagactagt acaacaagca 660
tccttgtttt caacttgcca aactagagcg tcgcccccac tagaaaaatg caatactata 720
agcgaaatga tctccacaag ctccccatcc caaagctcag tagtaggcta gtagctccac 780
gttccctaaa ctgagtagaa agattaggat ctctctctat gtttagttat tgtttcgttt 840
gagccaattg acaactttcc aatgggagtt tgttatgccc ttaatttatc atgttacaat 900
cagtgggtca tttgagaatt tagtactttt cagaacctac ttctgaaact tgaagaataa 960
aatacatatt aaacatgaat aattgctaaa caggtttcta tccaaactag gattaccagc 1020
ctactatgcg aaagaggttt cccttcaacc tgcaatccaa ttcgtttcta tgtcagtact 1080
tatttttttc ctggttcaat aatatcttat taattgtgca gtttacaact tgcttttttc 1140
ttcttcttga tttcttaatc ttagtccatt ttgttgcatc tgcagcagag aagctggggc 1200
tcccttttgt gcctccatac cttgaacaga acatgcgcat gggcgtcggc agtgttgacc 1260
tcagcaacat tgatgggatg atacaaggtg tcaactatgc atctgccgca gctggaattc 1320
tctcaagcag tggctctgag ctggttcgcc ctcctaactt cccaataact ctatttcacg 1380
cttataatct agcaggaatg tctctgtgaa acctttctct agaggagaaa tcaggaggag 1440
ggtgtttcga caacagacta gaatgaacaa ccctcctctt agtgtcaaca tcctttctaa 1500
ttgggaataa tacttgatca accatgtgaa ctaatgctca atgcttctcc tccttggctg 1560
tttcctttcc ttccatgcat tccaactagt gtagattatt aacgcattcc tagggctatc 1620
tgttaccaat aagacgtgag attgcccacc ggagagtggg tgatgatggg ctggtgctaa 1680
tggacagttt ctccatgctg cttcccttgt ccaagtttcc ttgccaagct acagcgaaat 1740
ataagttgtt tgattgtttt attttcctgc acacaaggta aaaagagaga tatgtggtca 1800
tccacacaaa gctaattcat cagaaatatt gtgttgtgtc agaaactaag caaagtagaa 1860
aactgcttta gttccctacc atgggctttt ggacgatcag ggaatatgca aggataaact 1920
gagttgcact gatatggtga ctttgatgta tatcaccctg aacattccat ttcaatacca 1980
atctttgaat cttattcctg ttcatgttga atctctgatc tttctgtcca aagcatcaaa 2040
aactcatggg gctgcaaagt gttttgccat tgcaatgaaa tatcttggtg gtgtctaaat 2100
agaatagagg cttacatatg aacattgttg aaaatttttc ctttattggt tatgtgtttt 2160
aactttatac aaaggattgg gacctcttgg ttagatccaa gcttgtgcac ttcccacttg 2220
atttgttgta cctcctgtat ttagtagctg aatcaatttt accattaagc aataaaaatc 2280
aatctagaaa acatactttt tgctgctcta tgaagcgatt ttcttgtggt attaacttcc 2340
actcatctga tgtatcctca tttgccactg ttttgtttca tcaagacatc aactatgtct 2400
atatgtttga aggttgtttt ctggtggtat tttataccac tgcaattttt ttcttcagct 2460
gcaaaattct gtgaagctct acagttcaat aacctcaaac attggcagac ccctattctt 2520
ggaatgtgtc aatatgtttc tgtctttttt gttatgattt aatgcaacca tattgcatat 2580
tcttaaattt taatggtgtg gttgctctag ctttcatgtg cttagaatca gggaactctc 2640
acatctttac tttgtgcaga ataaaccttc atgctggtct cttgtgtatc agcctgtagg 2700
cacatgagga tcatttcata gtgtctattt acaattaccc atatggttgt aattcttata 2760
ggagtgtcct tatacctttt ctttactctg cagaaaaact ccatattacc tacttttggt 2820
tttgataact caacgtgatg cctaatttga ttctgttctt gcaattgtgg ttacactgca 2880
gggaatgcat gtttcactga gccagcaggt gcagcaggtt gaggacacat atgagcagct 2940
ggctctggct ctcggggagg aagcaacaac tgatctattc agaaagtctg tgttcttttt 3000
gtcaatcggg agcaacgact ttatccacta ctacctgcgc aatgtgtctg gcatccagat 3060
acgttacctc ccatgggagt tcaaccagct ccttgtcaat gcaatgaggc aggaaatcaa 3120
ggtgtggttc ttgttctcca gtttgttctc tctgtccaac atttctcgcc tctatacaac 3180
actccagttc cagtcttctg atcagtgttt tgcatcgctt aaaggctgta gcatcctgct 3240
tacagtggct aatgatgtga gtgcaatttt agttttgata gtaacttagt ggcatactag 3300
catcacacta cttctggaca ggaatctttc tgccaagtct attttatctg tatttgatca 3360
gtaaatgctc tctgctttag ggtatctgct ccaagttcta gaattaccta ataattggtg 3420
caattcctca ctctaaacac aaatgtgtat aattctttgt agttataaat gtgattgaga 3480
aaaccaggaa tgtgactcca gacatataac ataatgtgaa aatctagcta aggaacatag 3540
gaatgtgaaa atctaatata tattctagaa aaaaaatcaa atgtttatgg agaaatttga 3600
gtatagtgag gaacgttgga tgatagctga atgtgtgtgg aatcttggaa tgaagtttct 3660
ttgagttact gaaatgtgcg agctgaggta agtaggctaa aaaaggacag gtggctattt 3720
cgtctggagg ttgtagacat atataatatg ggaaagttaa ctgataaata catagaagtg 3780
attaacctaa tggatattcg tatcattggt ctgctagcat ttctgggata ttaaataatt 3840
tacactctgt gtaaccttag accctttcag atttgaggta tgttgccatg ttgctctcaa 3900
aatttaactt cctttttata tgttgcaatt ttgatcagat aagacgtaaa gttgatattg 3960
aatattgcct tggattgaat actgtgtcta agttacttaa tttcttggtc ttcaaataca 4020
tgatacatct agaaatactg ccttacattt ttaagtgcaa gctaaatgca tgttgccggg 4080
gcaaccaaag atcagcgccc tgatttcatt aagattagga taaacaagta tagctaaatg 4140
catgttactt tgagctcaac ttgtaggaca ccatgcacat tatcactgta caaacttaat 4200
tctcatgtct ggattatgta taatttggtt tcttcctaat ttatctccat tcttcttttg 4260
atgagataat ttagataatt ttcatttgca aatgaattgg taaacgatcc caagttgcta 4320
ttcagcaaat ctttggcaga acatatgatg catgttgatc gaggctgcat gcaccatgag 4380
ttttatttgt attgtctaac atttgggaac attttcgtta tactcatcca acaatctcat 4440
ttataaactt atcgaagttg gattgatgtg ctttcttgtt gcttaaagtt agtaaattaa 4500
ccacaattat gcattttttt tgctatttag ccatatgcat tttttgtcag attactagat 4560
tattaagctt ttcatatcta taagagctgt gtacttaatg cagaatttgt acaatatcaa 4620
tgtgcggaag gtcgtcatga tgggcctccc tcctgttggc tgtgcacctc actttctctg 4680
ggagtacggc agtcaagatg gggaatgcat cgattatatc aacaatgttg tgattcagtt 4740
caactatgcc ctgagataca tgtctagtga gttcactcgc cagcacccag gctctatgat 4800
cagttattgt gatacttttg aggggtctgt ggacatacta aacaatcgtg accgctacgg 4860
tgagcaaata tatcattgac tactttcaga ctgccttccg tccataggga agtactcaca 4920
ttacgatgca attacaactt gcaggtttcc tgaccaccac tgatgcttgc tgtgggctgg 4980
gaaagtatgg aggcctattc atgtgtgtgc ttccacagat ggcgtgcagt gacgcgtcga 5040
gccatgtctg gtgggacgaa ttccacccca cagattctgt gaaccgaata ctggcagata 5100
atgtgtggtc tggtgagcat acccagatgt gctatcctat ggatttgcag gagatggtaa 5160
aactgaagta gacccaacct gaatctccat tgtagctagt tgcacagctt tcatatactt 5220
tgacaaagaa cctatacggc ggcacacaga aatgtatatc ttgagaacta caaatatttg 5280
tacatatagg tttgtgccaa aaaaaaaaaa agaacggtct tatcatgttt gttcatatat 5340
ttgcactgta aaggatctgt atggccaaac tggaacaggc gcttggtagg taaacgtaaa 5400
gcattgttca gttctca 5417
<210> 45
<211> 1212
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
atggcgcccc gctcgccgct cctcctgccc ctcctcctcg ccctcgagct tctcgtcctc 60
ccgctcccca ctccccccca ctgctgctcc gcggcccccc acgtctcgcc gtcaccgtcg 120
ccggaggcgg aggcggtaac ggcaacggca gccacgcgca cgccgctcgt cccggcgctc 180
ttcgtgatcg gggactccac ggccgacgtc ggcaccaaca actacctcgg cacgctcgcc 240
cgcgccgacc gcgagccgta cggccgcgac ttcgacaccc gccgccccac ggggcgtttc 300
tccaacggcc gcatccccgt cgactacatc gcagagaagc tggggctccc ttttgtgcct 360
ccataccttg aacagaacat gcgcatgggc gtcggcagtg ttgacctcag caacattgat 420
gggatgatac aaggtgtcaa ctatgcatct gccgcagctg gaattctctc aagcagtggc 480
tctgagctgg gaatgcatgt ttcactgagc cagcaggtgc agcaggttga ggacacatat 540
gagcagctgg ctctggctct cggggaggaa gcaacaactg atctattcag aaagtctgtg 600
ttctttttgt caatcgggag caacgacttt atccactact acctgcgcaa tgtgtctggc 660
atccagatac gttacctccc atgggagttc aaccagctcc ttgtcaatgc aatgaggcag 720
gaaatcaaga atttgtacaa tatcaatgtg cggaaggtcg tcatgatggg cctccctcct 780
gttggctgtg cacctcactt tctctgggag tacggcagtc aagatgggga atgcatcgat 840
tatatcaaca atgttgtgat tcagttcaac tatgccctga gatacatgtc tagtgagttc 900
actcgccagc acccaggctc tatgatcagt tattgtgata cttttgaggg gtctgtggac 960
atactaaaca atcgtgaccg ctacggtttc ctgaccacca ctgatgcttg ctgtgggctg 1020
ggaaagtatg gaggcctatt catgtgtgtg cttccacaga tggcgtgcag tgacgcgtcg 1080
agccatgtct ggtgggacga attccacccc acagattctg tgaaccgaat actggcagat 1140
aatgtgtggt ctggtgagca tacccagatg tgctatccta tggatttgca ggagatggta 1200
aaactgaagt ag 1212
<210> 46
<211> 403
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 46
Met Ala Pro Arg Ser Pro Leu Leu Leu Pro Leu Leu Leu Ala Leu Glu
1 5 10 15
Leu Leu Val Leu Pro Leu Pro Thr Pro Pro His Cys Cys Ser Ala Ala
20 25 30
Pro His Val Ser Pro Ser Pro Ser Pro Glu Ala Glu Ala Val Thr Ala
35 40 45
Thr Ala Ala Thr Arg Thr Pro Leu Val Pro Ala Leu Phe Val Ile Gly
50 55 60
Asp Ser Thr Ala Asp Val Gly Thr Asn Asn Tyr Leu Gly Thr Leu Ala
65 70 75 80
Arg Ala Asp Arg Glu Pro Tyr Gly Arg Asp Phe Asp Thr Arg Arg Pro
85 90 95
Thr Gly Arg Phe Ser Asn Gly Arg Ile Pro Val Asp Tyr Ile Ala Glu
100 105 110
Lys Leu Gly Leu Pro Phe Val Pro Pro Tyr Leu Glu Gln Asn Met Arg
115 120 125
Met Gly Val Gly Ser Val Asp Leu Ser Asn Ile Asp Gly Met Ile Gln
130 135 140
Gly Val Asn Tyr Ala Ser Ala Ala Ala Gly Ile Leu Ser Ser Ser Gly
145 150 155 160
Ser Glu Leu Gly Met His Val Ser Leu Ser Gln Gln Val Gln Gln Val
165 170 175
Glu Asp Thr Tyr Glu Gln Leu Ala Leu Ala Leu Gly Glu Glu Ala Thr
180 185 190
Thr Asp Leu Phe Arg Lys Ser Val Phe Phe Leu Ser Ile Gly Ser Asn
195 200 205
Asp Phe Ile His Tyr Tyr Leu Arg Asn Val Ser Gly Ile Gln Ile Arg
210 215 220
Tyr Leu Pro Trp Glu Phe Asn Gln Leu Leu Val Asn Ala Met Arg Gln
225 230 235 240
Glu Ile Lys Asn Leu Tyr Asn Ile Asn Val Arg Lys Val Val Met Met
245 250 255
Gly Leu Pro Pro Val Gly Cys Ala Pro His Phe Leu Trp Glu Tyr Gly
260 265 270
Ser Gln Asp Gly Glu Cys Ile Asp Tyr Ile Asn Asn Val Val Ile Gln
275 280 285
Phe Asn Tyr Ala Leu Arg Tyr Met Ser Ser Glu Phe Thr Arg Gln His
290 295 300
Pro Gly Ser Met Ile Ser Tyr Cys Asp Thr Phe Glu Gly Ser Val Asp
305 310 315 320
Ile Leu Asn Asn Arg Asp Arg Tyr Gly Phe Leu Thr Thr Thr Asp Ala
325 330 335
Cys Cys Gly Leu Gly Lys Tyr Gly Gly Leu Phe Met Cys Val Leu Pro
340 345 350
Gln Met Ala Cys Ser Asp Ala Ser Ser His Val Trp Trp Asp Glu Phe
355 360 365
His Pro Thr Asp Ser Val Asn Arg Ile Leu Ala Asp Asn Val Trp Ser
370 375 380
Gly Glu His Thr Gln Met Cys Tyr Pro Met Asp Leu Gln Glu Met Val
385 390 395 400
Lys Leu Lys
<210> 47
<211> 6731
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
atggcgctcc ccttcctcct cgccttcgcc ctgctcttcc agctctccgc tcccccgcgc 60
ttctgctccg cggcccccgc ctcctcgccg cccccgtccc cgcccccttc ccctgcggcg 120
gcggcggccc cgcgccgcac gccgctcgtc ccggcgctct tcgtgatcgg cgactccacg 180
gcggacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgaccg cgagccgtac 240
ggccgcgact tcgacacccg ccgccccacg gggcgcttct ccaacggccg catccccgtc 300
gactacatcg gtacgcgccc cccaccttct cgatcggcgg cgccatggct gtggcccctt 360
tgctctctcg tgaatcctcc cccgcttcca ggattgcagg tggttctgga atcgtcgatc 420
cgatgctgct ttgcctcttg cacggctatg gatgcagctt gttgtgggtt tagtgtaatc 480
tgggtttggg ttttctggta tacgagggtt ttgctcagtt gttggttcct acatttggat 540
gaatttgggg gcatatgatc tcatgcattg ggagtatgtg gatttttgcc caacaattgc 600
tgaagctgaa gagtaatcag ttctgcaaca caatcaccac agccggatgt tcatagcgct 660
ctcctacaca gctgaccacc tggatctcac atacatagac tcctgcggct tcctctcctt 720
gatctcacat agcatgttgt gggtttagtg taatctgggt atttgggtca tgagagggtt 780
ttcgtctgtg ggtttctgcc gaacaattgc tgaagctgaa gagtaacctg ttttgcagca 840
caactaccac agtctgggac accatttgag cccggctgtt tgtaacactc ctacagagct 900
gaccatctgg atctcacgta tctatataga atcctgcggc ttcctctcca aatcagtatc 960
cagtatccag tatccaccgc cgttatcagc ggttgaggca atgcattggc agagggccag 1020
aacatgaaga agtgccatca taatgtacac cattagtcca tgcatccaga aaacattacc 1080
agaatcctac aatgtatcca tttgatagtc ctgagtcctg accagttgtc tacatgcccc 1140
agtctctttg tcaccacaca ccgttaaatc tctcttgtcc aatgtccacc acattctgga 1200
caatttcaag gtcctcacag gaagcacagc tgcacaacct ttgttaatgt tgctttaaga 1260
aagtcatatc tactaattgg tttatttggg agagtaagga gggaaaaagc ataggaaaga 1320
agcatttaac tagggctact ggctcactat gtgaaagatg tttcccttca atttcattta 1380
gctggtgttc tcgatctctc ttgcccgtct ctgtcagtac ttacgttttt cacgactcaa 1440
tagtatcttg ttctttatac tgtttttaaa ttattttttc ggcgatttct taatcttaga 1500
cttttttgtg catttgcagc agagaagctg gggctccctt ttgtgcctcc ataccttgaa 1560
cagaacatgc gcatgggcgt cggcagtgtc gacctcagca acattgatgg gatgatacaa 1620
ggtgtcaact atgcatccgc ggcagccggc attctctcca gcagtggttc tgagctggtt 1680
tgtcctccta acttcccaac aactctattc acgcttataa tctagcagga atatctttgt 1740
gagacccctc tctagaggac gaatcagaag gagggtgttt caacaacagg ctagaagcaa 1800
tgactcttct catagtgtct acatcctctc tagttaggaa gaatactttc tcaaccattt 1860
gaactatgct caaagattct cctgttcggc tgctcccttc cttccatgtg ttccaaccag 1920
tgtggattat caggtcatca aattcccttc ttagttccta ggagttcatg acttatatct 1980
gcttcctacc agatgtgaga ttgtctacac gagacgattg ataggttaca caagacgatt 2040
gataggctgg tgctaatggg cagtttattc atgctgctgg ccttgtccaa gtttgcttgt 2100
gaagctacag tgctataagt tgtttggttg ttttattttc ctgcacacat aaagcaaaaa 2160
gagatatatg tagccatcta cacaaagcta atttatcata atttttttat tgtgtctgaa 2220
attaaaatag aaaccgcatt tattctctac tatggccttt gggatgatca aggagttagt 2280
aaggatcact gaactgcatc aatgtggtgg aattgatgta tatcatcctt gacattccat 2340
tttcgtatca ctctttattc ctgctatgtt gttgaatctc caatctttgt gcccaaaaca 2400
acaaaaactc gtggagcttc aaattctaat tttgtcattt caataaaaca tcgtggtggt 2460
gtctaaagag gagaaatgtt tacgtatgaa cattgctgca aagctttcct ttatgtggct 2520
atatgtttta actttctata aaggattgga gcctcttggt tagattcaag cttgtgaatt 2580
tctcatttga tttgttgtac ctcctggcaa ttgttggcat attatttatt gcataccttt 2640
tcattattct taaatgtatt tgaaactaaa tcaacatgat catcaagcaa acaacaccaa 2700
tccaaagaac acacttaatg cttctctatg aaggtttctc ttttggtatg taaatacttg 2760
ctcatctgat gtatcctttt ttgttactgt tttgtctcat caactataca tttgaagatt 2820
attttgtggt ggtattcttt actactgcga cattctagca gctgtaaaag tatgtttata 2880
ctgttaaaaa atctccaaaa ttggcagtcc cctagcttgg aatctgtcga tattttctgt 2940
gtttatgtta tgatttcctg caaacatatt ttagattctt aaattttaat ggtgtggttg 3000
ttctagctta aatatgttta gaataaggga tctaacacct ttactttgag cagaataaac 3060
cttcatgctg atctcttgtg tatcaagcct tcaggcacat gaggatcatt tcatagtgtg 3120
actatttgta gttatctgta tggccgtaac taacggcctc tatattgttc tgtataggag 3180
tgtgtctcta ctattttttt ctctgaagaa gagcattctt ttacctattt ttggttttca 3240
taattcaatg tgatgcataa tttgattctg ttctttttta gataaaggaa gctaatttga 3300
ttctgttctt gcaattgtgg ttgcactgca gggaatgcat gtgtcgctga gccagcaggt 3360
gcagcaggtt gaggacacat atgagcagct ctctctggct ctcggggagg cagcaacaac 3420
tgaccttttc agaaagtccg tgttcttttt gtcaatcggg agcaacgact tcatccacta 3480
ttacctgcgc aatgtgtctg gcgtccagat gcgttacctc ccatgggagt tcaaccagct 3540
tcttgtcaat gcaatgaggc aggaaatcaa ggtgtggtta ttgttctcca gtttagtctc 3600
tctgtgcaat atttcttgcc tccttatgat attccagttt tagttttttg atcaatgtgt 3660
tgcatattgc ccaaaggctg tagtatcgtg cttagcagtg gccaatgatg tgagtacaat 3720
tgtagttttg atggtgactt ggtggcatac tggcgtgaca ctatttttgg tcaggaatct 3780
ttctgcgctg actacttatt acctgaattt ggtcagtaaa tattctgtgc ttcataggta 3840
tctgctccca gttccaccac ccagatgtga atagttcttt gtagttagga atatgtttga 3900
gaaaaggagg attgtggact ccagatacat gaattatgaa aagctagcta tgaacattaa 3960
ttcctatgtt tcaagtgtta gaaaattttt aaatgtttat aaagaaacct gatatagtac 4020
actttttctg taggttaaaa ttttcaaatg gtggatgata gtttaaaact gtgtacagtc 4080
ttggactgaa gcttctttga gttactgaaa tgctcaggct gtacagtttt tctgtagtta 4140
tgaattaggt taaaaggata ggagggtaat tcatctgtac atatgtaata tgggaaagtt 4200
aactggtaag tagatggaag tgattaactc gatggatatt tatatcgttg gctgttagca 4260
gttctgtggt gttgtgtact ttacattctc cgtgtaccgt accttagttt cagatttgag 4320
gtagtaagtt gcaacgttac tctataagga catacttgtt ttgtatatgt tcattttgaa 4380
ctcttaacat tttgatcaga caagaagttc agataataaa ttaatcaatt accccaaaaa 4440
atctgctacg ggactgatgt aaagttgata ctgaatattg tcttggactg aatactgtgt 4500
ttgagttagt tcttggtctg cacatacttc cagagtggtt tgtattttgt acgggtactg 4560
ctagtgggcg ggtgatcgct tccccctcct cctagcgatc accagtccct cccccttata 4620
cactcttctt ctcccccttc ctcctcccct tcttctcttc ctactacagt acaccataaa 4680
atttaaaaaa ataaaaaaac aaagttggaa aaaattatgg atagaaatac tatatataaa 4740
aaatttgaat ttaaattcaa atttgaaacg gggctgtnnn nnnnnnnnnn nnnnnnnnnn 4800
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4860
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4920
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5040
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5100
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5160
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 5220
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ttcaaattca aatttgaatc 5280
ggatataatt caaattcaaa tttgaatcgg gtatataaac ttttgacttg taaactttgg 5340
gtctataaac tttaggtgta taaactttag atgtatagaa atactatata taaaaaatat 5400
ttgaattcaa attcaaattt gaatcggata tataaacttt tgatttataa actttgagtc 5460
tctaaacttt agatgtgtaa acttgaggtg tacaaacttt atgtccataa atttactaaa 5520
aagggaaaat aatgtagtgc caaaaaagga aaccacgtag aggagaggga gggggggggg 5580
gatcgatcac ccgttagcca tctcgacttt gtactgcctt ccatttggaa gtgcaagcta 5640
aatgcatgtt acttttgctc aaaacttgta ggacaccatg cacattccca atatgcccat 5700
gatcttacca tgatacaaaa cataattctc acttcatgca taaatgcata atgtacaatt 5760
tgattttctt cctaatttat ctcctttcat cttttgaaca gataatttta attcgcaaaa 5820
gaattggtaa aaatggcccc aaatttctat tcagtaaatc tttggcagaa catgtgatga 5880
tgtaatgcac attgattgag gctgcatgcg ccatgagttt atttgtactg agtactgaca 5940
aacatttgag agcggaaatt tctgttagca ttgtactcat ccaacaatac catgtataca 6000
cttatccaag ttgacttgag atgttgcttt cttgtttttt aaccttagta aaaatcagtt 6060
acaatgatgc attttttttt atttagccat atgcagttct tgtcagatta gattattaag 6120
ctctttatat ctatatataa gagttctgta cttcctgcag aatttgtaca atatcaatgt 6180
tcggaaggtc gtcatgatgg gcctccctcc tgttggctgc gcacctcact ttctctggga 6240
gtacggcagt caagatgggg aatgcatcga ctacatcaat aacgtcgtga ttcagttcaa 6300
ctatgccctg agatacatgt ctagtgaatt catccgccag cacccaggct ctatgatcag 6360
ttactgtgat acttttgagg ggtctgtgga catactgaag aatcgtgacc actacggtga 6420
gcagatgcat cattgttact actgtcagat tgcctttctg tccttaggga agaactcaca 6480
ttacgatgga atcacattgt gcaggttttc tgaccaccac tgatgcctgc tgtgggctgg 6540
ggaagtatgg aggcctgttc atgtgtgttc ttccacagat ggcgtgcagt gacgcgtcga 6600
gccatgtctg gtgggacgag ttccacccca cggatgctgt gaaccgaatc ctggctgata 6660
atgtgtggtc tggtgagcat accaagatgt gctatcctgt ggatttgcag cagatggtaa 6720
aactcaagta g 6731
<210> 48
<211> 1191
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
atggcgctcc ccttcctcct cgccttcgcc ctgctcttcc agctctccgc tcccccgcgc 60
ttctgctccg cggcccccgc ctcctcgccg cccccgtccc cgcccccttc ccctgcggcg 120
gcggcggccc cgcgccgcac gccgctcgtc ccggcgctct tcgtgatcgg cgactccacg 180
gcggacgtcg gcaccaacaa ctacctcggc acgctcgccc gcgccgaccg cgagccgtac 240
ggccgcgact tcgacacccg ccgccccacg gggcgcttct ccaacggccg catccccgtc 300
gactacatcg cagagaagct ggggctccct tttgtgcctc cataccttga acagaacatg 360
cgcatgggcg tcggcagtgt cgacctcagc aacattgatg ggatgataca aggtgtcaac 420
tatgcatccg cggcagccgg cattctctcc agcagtggtt ctgagctggg aatgcatgtg 480
tcgctgagcc agcaggtgca gcaggttgag gacacatatg agcagctctc tctggctctc 540
ggggaggcag caacaactga ccttttcaga aagtccgtgt tctttttgtc aatcgggagc 600
aacgacttca tccactatta cctgcgcaat gtgtctggcg tccagatgcg ttacctccca 660
tgggagttca accagcttct tgtcaatgca atgaggcagg aaatcaagaa tttgtacaat 720
atcaatgttc ggaaggtcgt catgatgggc ctccctcctg ttggctgcgc acctcacttt 780
ctctgggagt acggcagtca agatggggaa tgcatcgact acatcaataa cgtcgtgatt 840
cagttcaact atgccctgag atacatgtct agtgaattca tccgccagca cccaggctct 900
atgatcagtt actgtgatac ttttgagggg tctgtggaca tactgaagaa tcgtgaccac 960
tacggttttc tgaccaccac tgatgcctgc tgtgggctgg ggaagtatgg aggcctgttc 1020
atgtgtgttc ttccacagat ggcgtgcagt gacgcgtcga gccatgtctg gtgggacgag 1080
ttccacccca cggatgctgt gaaccgaatc ctggctgata atgtgtggtc tggtgagcat 1140
accaagatgt gctatcctgt ggatttgcag cagatggtaa aactcaagta g 1191
<210> 49
<211> 396
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 49
Met Ala Leu Pro Phe Leu Leu Ala Phe Ala Leu Leu Phe Gln Leu Ser
1 5 10 15
Ala Pro Pro Arg Phe Cys Ser Ala Ala Pro Ala Ser Ser Pro Pro Pro
20 25 30
Ser Pro Pro Pro Ser Pro Ala Ala Ala Ala Ala Pro Arg Arg Thr Pro
35 40 45
Leu Val Pro Ala Leu Phe Val Ile Gly Asp Ser Thr Ala Asp Val Gly
50 55 60
Thr Asn Asn Tyr Leu Gly Thr Leu Ala Arg Ala Asp Arg Glu Pro Tyr
65 70 75 80
Gly Arg Asp Phe Asp Thr Arg Arg Pro Thr Gly Arg Phe Ser Asn Gly
85 90 95
Arg Ile Pro Val Asp Tyr Ile Ala Glu Lys Leu Gly Leu Pro Phe Val
100 105 110
Pro Pro Tyr Leu Glu Gln Asn Met Arg Met Gly Val Gly Ser Val Asp
115 120 125
Leu Ser Asn Ile Asp Gly Met Ile Gln Gly Val Asn Tyr Ala Ser Ala
130 135 140
Ala Ala Gly Ile Leu Ser Ser Ser Gly Ser Glu Leu Gly Met His Val
145 150 155 160
Ser Leu Ser Gln Gln Val Gln Gln Val Glu Asp Thr Tyr Glu Gln Leu
165 170 175
Ser Leu Ala Leu Gly Glu Ala Ala Thr Thr Asp Leu Phe Arg Lys Ser
180 185 190
Val Phe Phe Leu Ser Ile Gly Ser Asn Asp Phe Ile His Tyr Tyr Leu
195 200 205
Arg Asn Val Ser Gly Val Gln Met Arg Tyr Leu Pro Trp Glu Phe Asn
210 215 220
Gln Leu Leu Val Asn Ala Met Arg Gln Glu Ile Lys Asn Leu Tyr Asn
225 230 235 240
Ile Asn Val Arg Lys Val Val Met Met Gly Leu Pro Pro Val Gly Cys
245 250 255
Ala Pro His Phe Leu Trp Glu Tyr Gly Ser Gln Asp Gly Glu Cys Ile
260 265 270
Asp Tyr Ile Asn Asn Val Val Ile Gln Phe Asn Tyr Ala Leu Arg Tyr
275 280 285
Met Ser Ser Glu Phe Ile Arg Gln His Pro Gly Ser Met Ile Ser Tyr
290 295 300
Cys Asp Thr Phe Glu Gly Ser Val Asp Ile Leu Lys Asn Arg Asp His
305 310 315 320
Tyr Gly Phe Leu Thr Thr Thr Asp Ala Cys Cys Gly Leu Gly Lys Tyr
325 330 335
Gly Gly Leu Phe Met Cys Val Leu Pro Gln Met Ala Cys Ser Asp Ala
340 345 350
Ser Ser His Val Trp Trp Asp Glu Phe His Pro Thr Asp Ala Val Asn
355 360 365
Arg Ile Leu Ala Asp Asn Val Trp Ser Gly Glu His Thr Lys Met Cys
370 375 380
Tyr Pro Val Asp Leu Gln Gln Met Val Lys Leu Lys
385 390 395
<210> 50
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tgcgaggtcg gctgcta 17
<210> 51
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
agatcagatg ccccaaattc ata 23
<210> 52
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
catggctgtg gcccctttgc tc 22
<210> 53
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gtttctttcc tatgcctttt cc 22
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gagggaaaag gcataggaaa 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aggtatgcaa atcaacaagc 20
<210> 56
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
atactatggc ttttgggatg a 21
<210> 57
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aatagtggat gaagtcgttg c 21
<210> 58
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ggcagcaaca actgaccttt tc 22
<210> 59
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
acaagaaagc aacatctcaa gtca 24
<210> 60
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
aatctttggc agagcatg 18
<210> 61
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
ggagtttaag ggttggttc 19
<210> 62
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gggaagaaac agaggtgcct ttgaacttct ggacatcaag aagaagaagt tgatgagcaa 60
aatagagggg gggggggggg gggagtgtgt gtagctagtg tgtcccaaat acctccaagc 120
<210> 63
<211> 124
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
gggaagaaac agaggtgcct ttgaacttct ggacatcaag aagaagaagt tgatgagcaa 60
aatagagggg gggggggggg gggggggagt gtgtgtagct agtgtgtccc aaatacctcc 120
aagc 124

Claims (22)

1.一种DNA片段,具有调控植物雄性育性的功能,其特征在于,所述DNA片段的序列为以下任一:
1)具有SEQ ID NO:1或2所示的核苷酸序列;
2)具有SEQ ID NO:4或2所示的核苷酸序列;
3)具有SEQ ID NO:26或27所示的核苷酸序列;
4)具有SEQ ID NO:29或30所示的核苷酸序列;
5)具有SEQ ID NO:32或33所示的核苷酸序列;
6)具有SEQ ID NO:35或36所示的核苷酸序列;
7)具有SEQ ID NO:38或39所示的核苷酸序列;
8)具有SEQ ID NO:41或42所示的核苷酸序列;
9)具有SEQ ID NO:44或45所示的核苷酸序列;
10)具有SEQ ID NO:47或48所示的核苷酸序列;
11)在严格条件下能够与(1)-(10)之任一序列的DNA杂交的DNA片段;或
12)与(1)-(11)之任一所述序列互补的DNA片段;或
13)在(1)-(11)之任一所述序列的基础之上,经过一至数个碱基替换和/或一至数个碱基的插入和/或缺失以及大片段的核苷酸序列插入/缺失/易位/倒位所形成能够影响植物花粉生育能力的DNA片段;或
14)与(1)-(11)之任一所述序列的DNA片段具有85%以上的同一性且编码水稻雄性育性相关蛋白的DNA片段。
2.权利要求1所述DNA片段编码的蛋白,其特征在于,为如下1)或2)所述的蛋白:
1)SEQ ID NO:3、28、31、34、37、40、43、46或49所示的氨基酸序列组成的蛋白;
2)将SEQ ID NO:3、28、31、34、37、40、43、46或49经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有调控植物雄性育性活性的蛋白。
3.一种生物材料,其特征在于,该生物材料含有权利要求1所述的DNA序列,所述生物材料为表达盒,表达载体、工程菌、转基因植物或转基因细胞系。
4.一种突变体材料,所述突变材料是由核苷酸序列的突变所造成,含有该突变后核苷酸序列的植株表现为雄性不育,其特征在于,所述核苷酸序列如SEQ ID NO:1、2、4、26、27、29、30、32、33、35、36、38、39、41、42、44、45、47或48任一所示,所述的突变为点突变、DNA缺失、插入或取代突变、反义基因的转入、共抑制或发夹结构的引入或通过基因沉默手段产生的突变。
5.如权利要求4所述的突变体材料,其特征在于,所述的突变体材料为采用CRISPR-Gas9方法,以靶位点1的序列CTTCGTGATCGGCGACTCCA和/或靶位点2的序列GAGAGAATGCCAGCTGCCG为靶位点,造成靶位点或靶位点及相邻核苷酸序列突变后得到的植物。
6.如权利要求5所述的突变体材料,所述的突变体材料为水稻突变体材料,其特征在于,在如权利要求5所述的靶位点1和靶位点2或靶位点及相邻区域内具有以下1)和/或2)中的1种或多种突变:
1)在靶位点1或靶位点1及相邻序列内发生了CGGCGACTCCA、CTCCACGGCG、TCGGCGACTCCA、TCGGCGACTCCA、CCACGGCG、ATCGGCGAC、C、CGGCGGCGGCGGCGGCCCCGCGCCGCACGCCGCTCGTCCCGGCGCTCTTCGTGATCGGCGACT、CTCTTCGTGATCGGCGACTCCA或TCCACGGCGGAC序列缺失突变,或T碱基插入突变;
2)在靶位点2或靶位点2及相邻序列内发生了AGCTGC、G、GCTG、TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGCATAGTTG或TG序列缺失突变,或A、CT、GT或GC碱基插入突变,或从TTGGGAAGTTAGGAGGACAAACCAGCTCAGAACCACTGCTGGAGAGAATGCCAGCTGCCGCGGATGC到GTTTGT或从CAGCTG到ATAGTTAAAAAATT序列替换突变。
7.如权利要求4所述的突变体材料,其特征在于,其为水稻突变体材料gms1,其基因组序列在LOC_Os02g18870基因的基因组序列编码区第3外显子的第3600位碱基处的TTGT被替换为A,导致LOC_Os02g18870基因编码蛋白中第230位和第231位的亮氨酸和缬氨酸突变为一个组氨酸。
8.如权利要求7所述的突变体材料,其特征在于,其含有权利要求1所述DNA片段突变后的DNA片段,该突变后的DNA片段为水稻雄性不育基因,所述突变后的水稻雄性不育基因的基因组核苷酸序列如SEQ ID NO:5所示,CDS序列如SEQ ID NO:6所示,氨基酸序列如SEQ IDNO:7所示。
9.一种适用于CRISPR/Cas9系统对植物GMS1基因进行定向敲除的靶位点,其为CTTCGTGATCGGCGACTCCA和/或GAGAGAATGCCAGCTGCCG。
10.特异性靶向权利要求9所述靶位点的sgRNA。
11.含有权利要求10所述sgRNA的DNA序列的CRISPR/Cas9打靶载体。
12.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在调控植物雄性育性性状中的应用。
13.如权利要求12所述的应用,其中所述DNA片段用于诱导作物植株雄性不育,以便导入外源基因以获得优质的转基因作物。
14.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在作物种质资源改良中的应用,所述改良包括研发新杂交育制种技术,提高作物产量、提高作物品质、抗病虫害、抗逆、抗倒伏的改良。
15.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在转育带有纯合GMS1突变基因的隐性核不育系中的应用。
16.一种获取权利要求1所述DNA片段在植物中的直系同源基因片段的方法,包括:
1)使用权利要求1所述DNA片段在核苷酸数据库中进行blastx搜索;
2)所有Identities大于或等于35%、Positives大于或等于50%即为与权利要求1所述DNA片段直系同源的基因片段。
17.一种与权利要求1所述DNA片段紧密连锁的分子标记,其特征在于,通过核苷酸序列如SEQ ID NO:8-9所述的引物扩增得到。
18.一种用于检测权利要求7所述突变体材料的分子标记,其特征在于,通过核苷酸序列如SEQ ID NO:10-11所述的引物扩增得到。
19.含有核苷酸序列如SEQ ID NO:8-9或SEQ ID NO:10-11所述的引物的检测试剂或试剂盒。
20.权利要求17或18所述的分子标记或权利要求19所述的检测试剂或试剂盒在检测水稻GMS1基因突变体中的应用。
21.如权利要求20所述的应用,其特征在于,当选用SEQ ID NO:10-11所示引物扩增待测水稻基因组DNA时,若只能扩增出108bp一条带,则待测水稻为GMS1基因突变体。
22.权利要求17或18所述的分子标记或权利要求19所述的检测试剂在筛选或培育雄性不育水稻突变体中的应用。
CN201811004799.6A 2018-08-30 2018-08-30 一种水稻育性调控基因及其突变体与应用 Active CN110511945B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811004799.6A CN110511945B (zh) 2018-08-30 2018-08-30 一种水稻育性调控基因及其突变体与应用
PCT/CN2018/119270 WO2020042412A1 (zh) 2018-08-30 2018-12-05 一种水稻育性调控基因及其突变体与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811004799.6A CN110511945B (zh) 2018-08-30 2018-08-30 一种水稻育性调控基因及其突变体与应用

Publications (2)

Publication Number Publication Date
CN110511945A true CN110511945A (zh) 2019-11-29
CN110511945B CN110511945B (zh) 2021-07-27

Family

ID=68621953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811004799.6A Active CN110511945B (zh) 2018-08-30 2018-08-30 一种水稻育性调控基因及其突变体与应用

Country Status (2)

Country Link
CN (1) CN110511945B (zh)
WO (1) WO2020042412A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110800606A (zh) * 2019-12-10 2020-02-18 安徽省农业科学院水稻研究所 一种水稻可繁殖杂合雄性不育系分子选育方法及其应用
CN111690047A (zh) * 2020-07-13 2020-09-22 中国科学院遗传与发育生物学研究所 一个玉米细胞核雄性育性基因ipe2的克隆与应用
CN113046359A (zh) * 2019-12-28 2021-06-29 湖南杂交水稻研究中心 调控水稻雌性发育的突变型基因及其编码的蛋白、应用以及引物
CN113754746A (zh) * 2020-06-02 2021-12-07 海南波莲水稻基因科技有限公司 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法
CN113754747A (zh) * 2020-06-02 2021-12-07 海南波莲水稻基因科技有限公司 一种水稻雄性育性调控基因突变体及其分子标记和应用
WO2021244007A1 (zh) * 2020-06-02 2021-12-09 海南波莲水稻基因科技有限公司 水稻雄性育性调控基因、水稻雄性育性调控基因突变体、其应用以及调控水稻育性的方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11177389B2 (en) 2019-07-30 2021-11-16 Micron Technology, Inc. Integrated transistors having gate material passing through a pillar of semiconductor material, and methods of forming integrated transistors
CN112195269B (zh) * 2020-11-06 2024-05-03 海南波莲水稻基因科技有限公司 与水稻核雄性不育表型相关的分子标记和应用
CN116286871B (zh) * 2023-04-04 2023-12-05 安徽省农业科学院水稻研究所 一种水稻显性雄性不育基因sdgms及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102634522A (zh) * 2012-03-07 2012-08-15 四川农业大学 控制水稻育性的基因及其编码蛋白和应用
CN106834316A (zh) * 2017-03-31 2017-06-13 西南大学 水稻花粉萌发孔发育及花粉育性基因OsAOM、突变基因及其重组表达载体和应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105695501B (zh) * 2014-11-28 2020-06-19 上海师范大学 创制光温敏不育系的方法及其在植物育种中的应用
CN106834294B (zh) * 2017-03-31 2020-04-28 西南大学 水稻花药及种子高效启动子POsAOM及其重组表达载体和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102634522A (zh) * 2012-03-07 2012-08-15 四川农业大学 控制水稻育性的基因及其编码蛋白和应用
CN106834316A (zh) * 2017-03-31 2017-06-13 西南大学 水稻花粉萌发孔发育及花粉育性基因OsAOM、突变基因及其重组表达载体和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SASAKI,T.等: "Genbank:AP004212.3", 《GENBANK》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110800606A (zh) * 2019-12-10 2020-02-18 安徽省农业科学院水稻研究所 一种水稻可繁殖杂合雄性不育系分子选育方法及其应用
CN113046359A (zh) * 2019-12-28 2021-06-29 湖南杂交水稻研究中心 调控水稻雌性发育的突变型基因及其编码的蛋白、应用以及引物
CN113046359B (zh) * 2019-12-28 2022-09-09 湖南杂交水稻研究中心 调控水稻雌性发育的突变型基因及其编码的蛋白、应用以及引物
CN113754746A (zh) * 2020-06-02 2021-12-07 海南波莲水稻基因科技有限公司 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法
CN113754747A (zh) * 2020-06-02 2021-12-07 海南波莲水稻基因科技有限公司 一种水稻雄性育性调控基因突变体及其分子标记和应用
WO2021244007A1 (zh) * 2020-06-02 2021-12-09 海南波莲水稻基因科技有限公司 水稻雄性育性调控基因、水稻雄性育性调控基因突变体、其应用以及调控水稻育性的方法
CN113754747B (zh) * 2020-06-02 2024-02-23 海南波莲水稻基因科技有限公司 一种水稻雄性育性调控基因突变体及其分子标记和应用
CN113754746B (zh) * 2020-06-02 2024-02-23 海南波莲水稻基因科技有限公司 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法
CN111690047A (zh) * 2020-07-13 2020-09-22 中国科学院遗传与发育生物学研究所 一个玉米细胞核雄性育性基因ipe2的克隆与应用

Also Published As

Publication number Publication date
CN110511945B (zh) 2021-07-27
WO2020042412A1 (zh) 2020-03-05

Similar Documents

Publication Publication Date Title
CN110511945B (zh) 一种水稻育性调控基因及其突变体与应用
KR102180294B1 (ko) 탐지용 대두 유전자변형 이벤트 mon87751 및 이의 이용 방법
JP6393478B2 (ja) トランスジェニック事象mon87712に対応するダイズ植物および種子、ならびにそれを検出するための方法
CA2812576C (en) Maize cytoplasmic male sterility (cms) c-type restorer rf4 gene, molecular markers and their use
CN105602952B (zh) 一种育性基因及其应用
CN101253268A (zh) 提高植物育种的方法和组合物
CN113121664A (zh) 鉴定、选择和产生疾病抗性作物的方法
CN115175556B (zh) 与大豆中锈病抗性相关联的新颖的遗传基因座
CN108291234A (zh) 倍数孢子体形成基因
CN112375130B (zh) 玉米穗长基因和分子标记及其应用
US11578339B2 (en) Transgenic corn event MON95275 and methods for detection and uses thereof
CN102131925A (zh) 高粱基因(ma5/ma6)的发现和利用
CN109897858A (zh) 一种利用育性基因s44获得水稻雄性不育系的方法
JP2011120597A (ja) ゲノムdna断片の選抜方法
CA3129544C (en) Methods of determining sensitivity to photoperiod in cannabis
CN108441571A (zh) 玉米分子标记在鉴定和调控玉米粗缩病抗性性状中的应用
CN102925478B (zh) 一种水稻雄性育性可控系的构建方法及育种方法
US10087461B2 (en) Glycine max resistance gene(s) and use thereof to engineer plants with broad-spectrum resistance to fungal pathogens and pests
CN110004155A (zh) 控制植物趋避性抗蚜性状的抗病基因、蛋白质及其应用
CN115216554A (zh) 植物病原体效应子和疾病抗性基因鉴定、组合物和使用方法
CN113754746B (zh) 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法
CN114854712B (zh) 玉米ZmWAK02基因在提高玉米灰斑病抗性中的应用
CN113754747B (zh) 一种水稻雄性育性调控基因突变体及其分子标记和应用
RU2763468C2 (ru) СВЯЗАННЫЙ С ФЕРТИЛЬНОСТЬЮ ГЕН ТаМS7 ПШЕНИЦЫ И СПОСОБ ЕГО ПРИМЕНЕНИЯ
KR20230010678A (ko) 표적화된 돌연변이유발에 의해 돌연변이체 식물을 수득하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant