CN114540366A - 一种水稻育性调控基因gms3及其突变体与应用 - Google Patents

一种水稻育性调控基因gms3及其突变体与应用 Download PDF

Info

Publication number
CN114540366A
CN114540366A CN202110989206.1A CN202110989206A CN114540366A CN 114540366 A CN114540366 A CN 114540366A CN 202110989206 A CN202110989206 A CN 202110989206A CN 114540366 A CN114540366 A CN 114540366A
Authority
CN
China
Prior art keywords
ala
seq
pro
gene
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110989206.1A
Other languages
English (en)
Other versions
CN114540366B (zh
Inventor
李京琳
龙湍
唐杰
吴春瑜
李新鹏
安保光
曾翔
吴永忠
黄培劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Bolian Rice Gene Technology Co ltd
Original Assignee
Hainan Bolian Rice Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Bolian Rice Gene Technology Co ltd filed Critical Hainan Bolian Rice Gene Technology Co ltd
Publication of CN114540366A publication Critical patent/CN114540366A/zh
Application granted granted Critical
Publication of CN114540366B publication Critical patent/CN114540366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/8289Male sterility

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明提供一种水稻育性调控基因GMS3及其突变体与应用。本发明提供了具有调控水稻雄性生殖细胞发育和花粉育性功能的水稻基因GMS3,其CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。本发明提供了GMS3基因的辐射诱变突变体和CRISPR敲除突变体,并提供了所述突变体的分子标记鉴定方法。本发明提供的水稻基因GMS3可用于水稻杂交种的不育化制种和生产,具有巨大的应用价值和经济价值。

Description

一种水稻育性调控基因GMS3及其突变体与应用
技术领域
本发明属于生物技术领域,具体地涉及一个植物育性调控基因GMS3、GMS3编码蛋白、GMS3的辐射诱变和基因敲除突变体,以及GMS3基因、蛋白和突变体在杂交育种中的应用。
背景技术
杂交水稻是父母本杂交后获得的子一代,其产量往往比常规稻亲本提高15%以上,抗性和适应性也远胜于亲本。因此,应用和推广杂交水稻是提高水稻产量的一个重要途径。
雄性不育系是杂交水稻育制种技术的关键节点。雄性不育系是指雄配子发育异常而丧失生育能力,雌配子发育正常的植物株系。它只能作为母本接受父本的花粉,自交不能结实。目前杂交水稻生产上应用的雄性不育系有核质互作型和光温敏型两种。核质互作型雄性不育系的不育基因在细胞质中,细胞核中没有育性恢复基因。当细胞核中有育性恢复基因的恢复系与其配组杂交时可以生产可育的子一代杂交种,当细胞核中没有育性恢复基因而细胞质中也没有不育基因的保持系与其杂交时可以繁殖不育系种子。由于需要不育系、保持系和恢复系三系配套,这种杂交水稻育制种技术常被称为“三系法”。一些控制核质互作型不育及相应育性恢复的基因已经被克隆(Chen and Liu,2014,Male sterility andfertility restoration in crops,Annu Rev Plant Biol,65:579-606)。核质互作型不育系是杂交水稻育制种中第一种大规模应用的不育系,为杂交水稻产业的建立和发展奠定了材料基础。然而由于核质互作型不育系的组配受到恢复系基因型的限制,导致只有约5%的种质资源能被利用。而细胞质的不育基因有导致米质差、特定病虫害流行的潜在风险。
光温敏型雄性不育系是一种育性受光温环境调控的不育系。在一定的光温条件下这种不育系保持不育,可用于组配杂交。当条件改变时不育系恢复育性,可用于不育系繁殖。由于光温敏雄性不育系实现了不育系和保持系的合二为一,只需要父本与其配组生产子一代杂交种,因此相应的育制种技术常被称为“两系法”。调控光温敏雄性不育的基因在细胞核中,目前已经克隆的基因包括PMS3、TMS5、CSA和TMS10(Chen and Liu,2014,Malesterility and fertility restoration in crops,Annu Rev Plant Biol,65:579-606;Zhou H,et al,2014,RNase ZS1 processes UbL40 mRNAs and controlsthermosensitive genic male sterility in rice,Nature Communications,5:4884-4892)。与核质互作型不育系相比,光温敏型不育系繁殖程序简单,配组因恢复基因广泛存在而更自由。光温敏不育系的大规模应用极大地巩固和推动了杂交水稻产业发展。然而,由于该型不育系的育性受光温环境影响,也导致制种风险高,制种地域受到限制。
为了克服目前杂交水稻育制种技术中存在的关键性缺陷,创造和利用新类型的不育系将是重要的突破口。本发明提供了一种作物育性基因及基于该基因突变所产生的隐性核不育类型的雄性不育系。该不育系育性稳定,只受核编码的单基因调控,不受光温环境的影响。该不育系的育性恢复基因广泛存在于水稻种质资源中,也可以通过转野生型基因恢复育性。该基因和该基因突变产生的不育系为研发水稻新型杂交育制种技术提供了元件,为解决现有技术存在的问题奠定了基础。
发明内容
本发明提供一种育性相关基因及其核苷酸和蛋白序列,还包括通过操作该基因在调控植株雄性生育力中的应用。下文描述的任何方法都可与本发明所提供的相应核苷酸序列一起使用,例如,将所述育性基因的突变体序列引入植株以导致植株雄性不育、使植株内源序列突变、向植株中引入该序列的反义序列、使用发卡形式、或将其与其它核苷酸序列连接起来调控植株的表型,或者是本领域技术人员己知的可用于影响植株的雄性生育力的多种方法中的任一方法。
本发明第一个方面是提供一个花粉发育调控基因GMS3。GMS3位于水稻第3号染色体上,其在粳稻中的基因组核苷酸序列如SEQ ID NO:1所示,CDS序列如SEQ ID NO:2所示,氨基酸序列如SEQ ID NO:3所示。在籼稻中其基因组核苷酸序列如SEQ ID NO:4所示,其CDS和氨基酸序与粳稻相同。在山羊草(Aegilops tauschii)中该育性基因的基因组核苷酸序列如SEQ ID NO:22所示,CDS序列如SEQ ID NO:23所示,氨基酸序列如SEQ ID NO:24所示;在二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ IDNO:25所示,CDS序列如SEQ ID NO:26所示,氨基酸序列如SEQ ID NO:27所示;高粱(Sorghumbicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:28所示,CDS序列如SEQ ID NO:29所示,氨基酸序列如SEQ ID NO:30所示;玉米(Zeamays)中该育性基因的基因组核苷酸序列如SEQ ID NO:31所示,CDS序列如SEQ ID NO:32所示,氨基酸序列如SEQ ID NO:33所示;小米(Setaria italica)中该育性基因的基因组核苷酸序列如SEQ ID NO:34所示,CDS序列如SEQ ID NO:35所示,氨基酸序列如SEQ ID NO:36所示:图小麦(Triticum aestivum)中该育性基因的基因组核苷酸序列如SEQ ID NO:37所示,CDS序列如SEQ ID NO:38所示,氨基酸序列如SEQ ID NO:39所示;短药野生稻(Oryza brachyantha)中该育性基因的基因组核苷酸序列如SEQ ID NO:40所示,CDS序列如SEQ ID NO:41所示,氨基酸序列如SEQ ID NO:42所示;非洲栽培稻(Oryza glaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:43所示,CDS序列如SEQ ID NO:44所示,氨基酸序列如SEQ ID NO:45所示。
上述所述育性基因,可从各种植物中分离获得。本领域技术人员应该知晓,本发明所述的育性恢复基因包括与GMS3基因高度同源,并且具有同样的育性调控功能的高度同源的功能等价序列。所述高度同源的功能等价序列包括在严谨条件下能够与本发明所公开的GMS3基因的核苷酸序列杂交的DNA序列。本发明中所使用的“严谨条件”是公知的,包括诸如在含400mM NaCl、40mM PIPES(pH6.4)和l mM EDTA的杂交液中于60℃杂交12-16小时,然后在65℃下用含0.1%SDS、和0.1×SSC的洗涤液洗涤15-60分钟。
功能等价序列还包括与本发明所公开的GMS3基因所示的序列有至少85%、90%、95%、96%、97%、98%、或99%序列相似性,且具有育性调控功能的DNA序列,可以从任何植物中分离获得。其中,序列相似性的百分比可以通过公知的生物信息学算法来获得,包括Myers和Miller算法(Bioinformatics,4(1):1117,1988)、Needleman-Wunsch全局比对法(JMol Biol,48(3):443-453,1970)、Smith-Waterman局部比对法(J Mol Biol,147:195-197,1981)、Pearson和Lipman相似性搜索法(PNAS,85(8):2444-2448,1988)、Karlin和Altschul的算法(Altschul等,J Mol Biol,215(3):403-410,1990;PNAS,90:5873-5877,1993)。这对于本领域技术人员来说是熟悉的。
基于本发明的上述发现,本发明一种具有调控植物雄性育性功能的DNA片段,其序列为以下任一:
1)具有SEQ ID NO:1或2所示的核苷酸序列;
2)具有SEQ ID NO:4或2所示的核苷酸序列;
3)具有SEQ ID NO:22或23所示的核苷酸序列;
4)具有SEQ ID NO:25或26所示的核苷酸序列;
5)具有SEQ ID NO:28或29所示的核苷酸序列;
6)具有SEQ ID NO:31或32所示的核苷酸序列;
7)具有SEQ ID NO:34或35所示的核苷酸序列;
8)具有SEQ ID NO:37或38所示的核苷酸序列;
9)具有SEQ ID NO:40或41所示的核苷酸序列;
10)具有SEQ ID NO:43或44所示的核苷酸序列;
11)在严格条件下能够与(1)-(10)之任一序列的DNA杂交的DNA片段;或
12)与(1)-(11)之任一所述序列互补的DNA片段;或
13)在(1)-(11)之任一所述序列的基础之上,经过一至数个碱基替换和/或一至数个碱基的插入和/或缺失以及大片段的核苷酸序列插入/缺失/易位/倒位所形成能够影响植物花粉生育能力的DNA片段;或
14)与(1)-(11)之任一所述序列的DNA片段具有85%、90%、92%、95%、96%、97%、98%、99%以上的同一性且编码水稻雄性育性相关蛋白的DNA片段。
上述DNA片段为GMS3基因或其特异性片段。
本发明提供了所述DNA片段编码的蛋白,为如下1)或2)所述的蛋白:
1)SEQ ID NO:3、24、27、30、33、36、39、42或45所示的氨基酸序列组成的蛋白;
2)将SEQ ID NO:3、24、27、30、33、36、39、42或45经过一个或若干个氨基酸残基的取代和/或缺失和/或添加且具有调控植物雄性育性活性的蛋白。
本发明提供一种生物材料,含有上述的DNA序列,所述生物材料为表达盒,表达载体、工程菌、转基因植物或转基因细胞系。所述转基因细胞系为不能繁殖为植物的细胞系。
本发明所述的DNA片段可以从任何植物中分离获得,包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。
本发明的第二方面是提供了通过影响GMS3的核苷酸序列或者通过调控GMS3基因的转录表达从而影响植株育性的方法。所述影响植株育性是指通过调控GMS3基因的表达,从而使所述植株的育性发生改变,如导致植株雄性不育。具体地,取决于实际应用需求,可以通过多种方法来影响GMS3基因在植物体内的表达,从而达到调控植株雄性育性的效果。更具体地,调控GMS3基因的表达可以使用许多本领域普通技术人员可获得的工具进行,例如,通过理化诱变、插入突变、基因打靶敲除、反义基因的转入、共抑制或发夹结构的引入等,都可以用于破坏GMS3基因的正常表达,从而获得雄性不育的植株。另一方面,本发明还包括通过将野生型GMS3的核苷酸序列引入植株来恢复GMS3表达被破坏的植株的雄性生育力。
本发明的第三方面提供了一种DNA分子,其含有所述DNA片段,并在所述DNA片段中插入、和/或缺失、和/或取代若干个核苷酸从而导致水稻雄性育性发生改变。
进而本发明提供一种GMS3基因的不育突变体序列及其雄性不育突变体材料。所述雄性不育突变体材料是由核苷酸序列的突变所造成,含有该突变后核苷酸序列的植株表现为雄性不育,所述核苷酸序列如SEQ ID NO:1、2、4、22、23、25、26、28、29、31、32、34、35、37、38、40、41、43或44任一所示,所述的突变为点突变、DNA缺失、插入或取代突变、反义基因的转入、共抑制或发夹结构的引入或通过基因沉默手段产生的突变。
具体地,所述雄性不育突变体材料是通过突变水稻内源的GMS3基因,或突变与其高度同源的基因的核苷酸序列,使该植物体丧失雄性育性的过程。所述“突变”包括但不限于以下方法,如用物理或化学的方法导致的基因突变,所述突变可以是点突变,也可以是DNA缺失或插入突变。突变还可以是通过RNAi、CRSPR-Cas9、人工核酸酶、定点突变等基因沉默手段产生。
在本发明的一个优选的实施方案中,所述的突变体材料为采用CRISPR-Cas9方法,以序列GCCTCCTCGCCTTCGCCGC(靶位点1)和/或序列CGCTGTACGCCGCCTGCGG(靶位点2)为靶位点,使靶位点或靶位点及相邻核苷酸序列突变后得到的植物。
所述植物包括但不限于芸苔属、玉米、小麦、高梁、短药野生稻、非洲栽培稻、短柄草属、两节荠属、白芥、草麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、茵宿、燕麦、油菜籽、大麦、燕麦、黑麦(Rye)、小米、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(Spelt)、双粒小麦、亚麻、格兰马草(Gramma grass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘廉、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石角斗、剑兰、菊花、百合科、棉花、校、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,包括玉米、小米、拟南芥、二穗短柄草、大豆、红花、芥菜、小麦、大麦、黑麦、短药野生稻、非洲栽培稻、棉花和高粱。
在本发明的优选实施例中,所述的突变体材料为水稻突变体材料,在水稻基因组所述靶位点1和靶位点2或靶位点及相邻区域内具有以下1)和/或2)中的1种或多种突变,如2种、3种、4种突变:
1)在靶位点1或靶位点1及相邻序列内发生了G碱基缺失突变,或G、T碱基插入突变,或从TCGCCTTCGCCGCCG到ACGGC或从G到C序列替换突变;
2)在靶位点2或靶位点2及相邻序列内发生了G、T或A碱基插入突变,或从GA到G或从GCCGCCTGCGGAGGCCTCCGCCCTGGAGG到CTT序列替换突变。
进一步,本发明提供了一种适用于CRISPR/Cas9系统对植物GMS3基因进行定向敲除的靶位点,其为GCCTCCTCGCCTTCGCCGC(靶位点1)和/或序列CGCTGTACGCCGCCTGCGG(靶位点2)。
本发明还提供了一种特异性靶向上述靶位点1或靶位点2的sgRNA。
含有上述sgRNA的DNA序列的CRISPR/Cas9打靶载体属于本发明的保护范围。
更具体地,本发明提供了一种水稻雄性不育突变体,其在3号染色体上含有一个3867745个碱基序列的倒位片段。该倒位造成两端的核苷酸序列发生重组,其中一端的重组位于BGIOSGA010102基因内部,所述的两端重组位点的侧翼核苷酸序列如SEQ ID NO:5和SEQ ID NO:6所示。重组后的水稻雄性不育基因的基因组核苷酸序列如SEQ ID NO:64所示,CDS序列如SEQ ID NO:65所示,氨基酸序列如SEQ ID NO:66所示。对野生型和突变体序列进行比对发现,在第3号染色体的第26091933位碱基到第29959677位碱基的序列发生倒位,造成位于第29958173位碱基到第29960719位碱基的BGIOSGA010102基因发生撕裂并重组,使BGIOSGA010102基因的转录框改变。本领域技术人员应该知晓,可以将所述倒位片段通过杂交或回交的方法导入受体植物中,从而获得新的雄性不育突变体材料。
本发明提供了GMS3基因或其编码蛋白或含有其的生物材料或其突变体材料在调控植物雄性育性活性中的应用。所述生物材料为含有GMS3基因的表达盒、表达载体、工程菌、转基因植物或转基因细胞系,所述转基因细胞系不能繁殖为植物品种。
其中所述GMS3基因用于恢复作物植株雄性不育,以便导入外源基因以获得优质的转基因作物。
提供上述GMS3基因用于转基因改良作物的用途。
所述改良包括产量提高、品质提高、抗病虫害、抗逆、抗倒伏等生长性状的改良。
在另一具体实施方案中,所述作物是自花授粉或异花授粉作物。
在一个更加具体的实施方案中,所述作物包括但不限于玉米、小麦、高梁、小米、水稻。
本发明还提供了所述的GMS3基因或其编码蛋白或含有其的生物材料或DNA分子或上述任一种突变体材料在转育带有纯合GMS3突变基因的隐性核不育系中的应用。
本发明还提供了一种在其它植物中获取GMS3基因的直系同源基因的方法,以及利用该方法获得高粱、小米、短柄草、水稻同源GMS3的氨基酸序列。
本发明提供了一种在其它植物中获取GMS3基因的直系同源基因的方法包括:
1)使用前述GMS3基因的DNA片段在核苷酸数据库中进行blastx搜索;
2)所有Identities大于或等于35%、Positives大于或等于50%即为与所述DNA片段直系同源的基因片段。
本发明提供了一种用于检测GMS3基因突变体材料的分子标记,通过核苷酸序列如SEQ ID NO:7-9所述的引物扩增得到。
用SEQ ID NO:7-9所示引物扩增待测水稻基因组DNA时,若只能扩增出167bp一条带,则待测水稻为GMS3基因突变体。
含有核苷酸序列如SEQ ID NO:7-9所述的引物的检测试剂或试剂盒属于本发明的保护范围。
进一步本发明提供了上述分子标记或上述检测试剂或试剂盒在检测水稻GMS3基因突变体中的应用。
本发明提供了上述分子标记或上述检测试剂或试剂盒在筛选或培育雄性不育水稻突变体中的应用。
与现有技术相比,本发明具有如下有益效果:本发明提供的基因GMS3直接参与花粉发育调控,该基因被敲除或表达受到抑制后,花粉完全不育。gms3不育突变体与现有三系和两系不育系相比不育性状稳定,不受环境条件影响。通过植物生物技术途径,本发明在农作物的杂种优势利用和不育化杂交种制种生产中都将发挥重要作用。
附图说明
图1灌浆期野生型(左)和gms3突变体(右)的植株形态。
图2野生型(左)和gms3突变体(右)的去掉外颖小穗形态。
图3野生型(左)和gms3突变体(右)的花药形态。
图4 gms3突变体花粉碘染。
图5野生型花粉碘染。
图6为GMS3基因图位克隆图。
图7染色体倒位引起GMS3基因撕裂重组示意图。
图8 GMS3基因核苷酸序列在9311(9311-01)、ZH11(ZH11-02)、日本晴(RBQ-03)间的序列差异。有差异的地方用黑色背景突出。每行最后一个碱基在整个序列中的位置标示在行末。
图9 GMS3杂合株后代基因型鉴定。上带大小253bp,下带大小167bp。
图10 GMS3在水稻不同组织中的表达量。
图11 pC9M-GMS3载体示意图。T1代表靶位点1,T2代表靶位点2。
图12转基因植株PC9M-1199-1在靶位点1处的测序峰图。箭头指向碱基替换位点。
图13转基因植株PC9M-1199-2在靶位点2处的测序峰图。箭头指向碱基插入位点。
图14 GMS3野生型(左)、敲除植株PC9M-1199-1(右)的植株形态。
图15 GMS3野生型(左)、敲除植株PC9M-1199-1(右)的小穗形态。
图16 GMS3野生型(左)、敲除植株PC9M-1199-1(右)的去掉外颖的小穗形态。
图17 GMS3野生型(左)、敲除植株PC9M-1199-1(右)的花粉碘染图。
图18 pC1300-1199-P2k-CDS-T500载体示意图。
图19 gms3突变植株(左)和互补植株(右)的植株形态。
图20水稻GMS3基因编码蛋白与其他物种基因组中的同源蛋白的序列比对图。山羊草(Aegilops tauschii)蛋白、二穗短柄草(Brachypodium distachyon)蛋白、高粱(Sorghum bicolor)蛋白、玉米(Zea mays)蛋白、小米(Setaria italica)蛋白、短药野生稻(Oryza brachyantha)蛋白、非洲栽培稻(Oryza glaberrima)蛋白。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明的应用范围。下述实施例中的所有技术和科学术语,如无特殊说明,均为本发明所属领域普通技术人员通常所理解的相同含义。除非有相反指明,本发明所使用或提及的技术均为本领域普通技术人员公认的标准技术。所述试验材料,如无特别注明,均为本发明领域通用的试验材料。下述实施例中所用的试验试剂,如无特殊说明,均为自常规生化试剂商店购买得到的。
本发明所述的雄性不育,特指由植物细胞核基因发生功能变化导致植物雄性生殖器官发育出现异常(无法产生正常雄蕊、花药或者正常的雄性配子体)并出现育性的丧失,即通常所说的雄性核不育(Genic male sterility)而非细胞质核不育(Cytoplasmic malesterility)。雄性生殖器官育性的异常和恢复均由细胞核内的基因加以控制。
因此,本发明也包括利用序列表所述序列调控植株的雄配子生育能力,即利用本发明提供的基因序列在基因组、和/或转录组、和/或蛋白质组水平影响其它植物中相同或同源基因的功能从而达到控制雄性生殖器官育性的目的。例如,下述方法但不限于下述方法:通过天然序列的变异导致基因表达抑制或蛋白质功能的丧失、通过向植物中转入所述基因的反义序列或引入发卡结构、或将所述基因与其它序列(DNA或RNA)相结合产生新的具有功能活性的DNA或RNA链,来影响或改变植物基因的功能。或其它本领域技术人员己知的可用于影响植物雄花育性的技术方法中的任何一种技术方法。
本发明包括水稻GMS3基因,其显性等位基因对植物雄花育性具有关键作用,功能缺失性的隐性等位基因会导致雄性不育。该基因位于水稻3号染色体,其基因具体位置如图6、图7所示。
该基因序列及其同源序列可从各种植物中获得,包括但不限于山羊草(Aegilopstauschii)、卷柏(Selaginella moellendorffii)、毛果杨(populus trichocarpa)、芜菁(Brassica rapa)、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、大豆(Glycine max)、茄属马铃薯(Solanum tuberosum)、葡萄(Vitis vinifera)、图小麦(Triticum aestivum)、小果野芭蕉(Musa acuminata)、小米(Setaria italica)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium distachyon)、大麦(Hordeum vulgare)、短药野生稻(Oryza brachyantha)、非洲栽培稻(Oryza glaberrima)、籼稻(Oryza sativa Indica Group)、粳稻(Oryza sativa Japonica Group)、小立碗藓(Physcomitrella patens)等。获得方法包括但不限于:通过水稻GMS3基因序列利用blastx、blastn或通过氨基酸序列利用blastp从其它植物的基因组序列数据库、和/或cDNA序列数据库、和/或蛋白质序列数据库中调取;以水稻GMS3基因的DNA或cDNA或RNA序列为参考序列设计引物,从其它植物的基因组DNA或cDNA或RNA中利用PCR的方法直接获得:以水稻GMS3的基因序列设计探针,利用核酸杂交的方法从基因组文库中分离含有同源基因序列的DNA或cDNA或RNA片段。
GMS3基因同源序列指在与SEQ ID NO:3的氨基酸序列进行blastx比较分析后,Identities大于或等于35%、Positives大于或等于50%的植物基因的DNA序列。进行blastx时,所有参数均遵照http://blast.ncbi.nlm.nih.gov/所示的默认设置进行。
下文通过说明和阐述提供了更为详细的描述,但这并非意欲对本发明的范围加以限制。
实施例1水稻雄性不育突变体gms3的筛选
将10千克籼稻93-11干种子送至湖南省农业科学院用钴60进行辐射,辐射总剂量为250伦琴(Gy),得到M0代并种植于临高新盈基地,成熟后分单株收种,共获得M1代材料约6000份。将种子数超过100粒的M1代材料种植成株系,共计3500份,每个株系种50个单株。分别在分蘖期、孕穗期、抽穗期、开花期、灌浆期筛选株型、穗型、育性、产量等各种类型突变体,并收种保存。其中一个突变体1199表现为雄性不育,被命名为gms3。
实施例2水稻雄性不育突变体gms3的表型分析
与野生型相比,gms3突变体植株(图1)和小穗(图2)形态正常,花期稍迟。体式显微镜下观察突变体小花形态,发现gms3的花药比野生型瘦小,颜色较浅(图3)。用碘-碘化钾溶液(0.6%KI,0.3%I2,w/w)溶液对花粉进行染色,突变体花粉粒小、少、不规则并且不能被染色(图4),而野生型花粉粒大而圆并且被染成蓝黑色(图5)。同一家系野生型植株套袋自交后正常结实,而gms3突变体不结实。而以水稻品种93-11为父本给gms3突变体授粉则可以结实。这表明该突变体为雄性不育突变体。
实施例3水稻雄性不育突变体gms3的遗传分析
在M4代种植gms3的分离群体1321株,其中996株育性正常,325株不育,可育与不育株分离比符合3:1(χ2=0.08,P<0.05)。用gms3与明恢63杂交,F1代植株全部可育。在F3代种植gms3的分离群体861株,其中631株育性正常,230株不育,可育与不育株分离比符合3:1(χ2=1.06,P<0.05)。上述结果表明gms3的不育性状是由隐性单基因控制。
实施例4水稻雄性不育基因GMS3的克隆
使用图位克隆的方法对GMS3基因进行定位。以ZH11为父本与gms3突变体杂交构建了一个包含623个单株的BC2F2群体。利用该群体将GMS3定位于3号染色体的两个In/Del标记3.1830和3.2725之间,且与3.2513标记共分离。GMS3基因与上述三个标记之间的交换单株分别为17个,0个,25个(图6)。利用共分离标记挑选BC2F2群体中的GMS3杂合单株,发展了另一个包含1321个单株的BC2F3群体。使用位于3.1830与3.2725标记间的6个InDel标记3.2245、3.235、3.240、3.245、3.250、3.255检测BC2F3群体,分别检测到2个,0个,0个,0个,0个,0个交换单株。分析和比较93-11和日本晴基因组在3.2245与3.235之间和3.255与3.2725之间的序列,分别开发新的InDel标记3.2239、3.2245、3.2249及3.2611、3.2615、3.2624、3.2631。用这些标记检测BC2F3群体,分别检测到3个,0个,0个;及0个,1个,6个,19个交换单株(图6)。综上,推测突变体在3.2245到3.2615标记间存在染色体倒置。随后利用染色体步移方法,在3.2611与3.2615间设计均分布的引物组合,分别扩增93-11和gms3突变体,结果显示引物组合F1510/R1810无法在gms3突变体中扩增出PCR产物,而在野生型93-11中能扩增出一段300bp的核苷酸序列,表明倒置位点极有可能在此区间内。参考93-11基因组的列,在F1510上游设计一组热不对称PCR引物,分离gms3突变体在F1510处的侧翼DNA序列。
用于扩增F1处的侧翼序列引物对序列见下表1:
表1用于扩增F1处的侧翼序列引物对序列
引物对名称 引物序列
1199sp1_F GGTCGATTTTGATTCCTTTCTCTGGATGT
1199sp2_F ACGATGGACTCCAGTCT AGCTGATCTTGTGGTTATTGCTCGAAG
1199sp3_F CCAGCAACGTATAGATCTATAGTGGTGT
1199AC1_R ACGATGGACTCCAGAG
1199LAD1_R ACGATGGACTCCAGAGCGGCCGCVNNNGGAA
1199LAD2_R ACGATGGACTCCAGAGCGGCCGCVVNVNNNCCAA
PCR反应体系为:1μL 10×反应缓冲液,0.25μL dNTP,0.25μL正向引物和0.25μL反向引物,0.5U Taq酶,1μL 10ng/μL模板DNA,加超纯水将总体积补至10μL。PCR反应分三步进行:第一步使用引物对1199sp1_F和1199AC1_R,模板DNA为gms3基因组DNA,反应程序为:93℃预热2min,95℃变性1min,然后执行以下循环:94℃变性30s,60℃复性1min,72℃延伸3min,10个循环;接着94℃变性30s,20℃复性2min,72℃延伸3min,再执行以下循环:94℃变性20s,58℃复性1min,72℃延伸3min,25个循环;循环结束后72℃补充延伸5min,结束反应。第二步使用引物对1199sp2_F和1199AD1_R,模板DNA为反应1产物40倍稀释液,反应程序为:执行以下循环94℃变性20s,65℃复性1min,72℃延伸3min,1个循环,然后再执行以下循环:94℃变性20s,68℃复性1min,72℃延伸3min,94℃变性20s,68℃复性1min,72℃延伸3min,94℃变性20s,50℃复性1min,72℃延伸3min,13个循环;循环结束后72℃补充延伸5min,结束反应。第三步使用引物对1199sp3_F和1199AD2_R,模板DNA为反应1产物10倍稀释液,反应程序为:94℃变性20s,68℃复性1min,72℃延伸3min,94℃变性20s,68℃复性1min,72℃延伸3min,94℃变性20s,50℃复性1min,72℃延伸3min,6-7个循环;循环结束后72℃补充延伸5min,结束反应。配置1.5%琼脂糖凝胶,在5V/cm电场下电泳30min;采用市面DNA凝胶回收试剂盒回收反应2和反应3的PCR产物。
将回收所得的反应2和反应3的PCR产物DNA采用ABI3730测序仪进行测序,测序引物分别使用正向引物与反向引物。使用常见DNA序列分析软件DNAman6.0对双向测序结果进行拼接;拼接后的序列在NCBI中应用blastN比对水稻基因组序列,gms3突变体在第3号染色体第26091933位碱基到第29959677位碱基的序列发生倒位,造成位于第29958173位碱基到第29960719位碱基的BGIOSGA010102基因发生撕裂并重组,导致BGIOSGA010102基因的转录框改变(图7)。该倒置点两边的侧翼核苷酸序列如SEQ ID NO.5和SEQ ID NO.6所示。
参考水稻基因组版本ASM465v1序列设计引物对LOC_Os03g46110基因在93-11、ZH11、RBQ中的等位基因进行扩增和测序,引物序列如表2所示。所有PCR扩增均使用KOD FXDNA Polymerase(TOYOBO CO.,LTD.Life Science Department,Osaka,Japan),并按照产品说明的反应体系和条件,在Thermo scientific Arktik thermal cycler上进行PCR扩增。PCR产物送往南京金斯瑞生物科技有限公司进行测序。测序结果用DNAman 6.0进行拼接。93-11、ZH11、RBQ中的LOC_Os03g46110基因分别记为9311-01(序列如SEQ ID NO:4),ZH11-02,RBQ-03(序列如SEQ ID NO:1)。
表2用于扩增LOC_Os03g46110的引物对序列
引物对名称 正向引物 反向引物
LOC_Os03g46110_1 TGCGAGGTCGGCTGCTA AGATCAGATGCCCCAAATTCATA
LOC_Os03g46110_2 CATGGCTGTGGCCCCTTTGCTC GTTTCTTTCCTATGCCTTTTCC
LOC_Os03g46110_3 GAGGGAAAAGGCATAGGAAA AGGTATGCAAATCAACAAGC
LOC_Os03g46110_4 ATACTATGGCTTTTGGGATGA AATAGTGGATGAAGTCGTTGC
LOC_Os03g46110_5 GGCAGCAACAACTGACCTTTTC ACAAGAAAGCAACATCTCAAGTCA
LOC_Os03g46110_6 AATCTTTGGCAGAGCATG GGAGTTTAAGGGTTGGTTC
对9311-01、ZH11-02和RBQ-03进行多序列比对,结果如图8所示。9311-01与ZH11-02和RBQ-03除在第1个内含子上存在一段位于第397位碱基处的(CT)19缺失和位于第820位碱基的G-A的替换外,编码区序列完全一致。这表明LOC_Os03g46110基因在水稻中高度保守,其核苷酸序列即使在籼、粳亚种间也只在非编码区存在两处碱基的差异,而蛋白质序列则没有差异。在93-11中LOC_Os03g46110的CDS核苷酸序列如SEQ ID NO:2所示,编码蛋白序列如SEQ ID NO:3。
基于gms3突变位点的测序结果,设计3条基因特异引物:正向引物1199_F1,其核苷酸序列如SEQ ID NO.7所示;反向引物1199_R1,其核苷酸序列如SEQ IDNO.8和1199_R2,其核苷酸序列如SEQ ID NO.9所示。其中1199_R1位于倒置片段上。当用1199_F1、1199_R1和1199_R2组合扩增野生型基因组时产生253bp条带,扩增突变型基因组时产生167bp条带。使用1199_F1、1199_R1和1199_R2组合对24株GMS3的M3分离群体进行基因型检测。如图11所示,野生型要么扩增出167bp和253bp两条带,要么扩增出253bp一条带,而不育突变体均只能扩增出167bp一条带(图9)。这说明突变基因型与不育表型共分离,LOC_Os03g46110就是GMS3基因。
实施例5 GMS3基因的表达分析
取93-11各时期组织提取总RNA,反转录成cDNA。根据GMS3的基因组和编码区核苷酸序列设计跨内含子的引物1199_RTF:GTTGCCATCACCCTCATC(SEQ ID NO:10)和1199_RTR:AAAATACTGCGAACGAAT(SEQ ID NO:11),同时以水稻GADPH基因作为内参对照设计引物GADPH-ACF1:GAATGGCTTTCCGTGTT(SEQ ID NO:12)和GAPDH-ACR1:CAAGGTCCTCCTCAACG(SEQID NO:13)。采取实时定量PCR方法进行表达量分析。如图10所示,GMS3基因在水稻的根、茎、叶和种子中几乎不表达,而在花器官中高表达。在一期到八期幼穗中,GMS3的表达量逐渐升高,然后在九期幼穗中直线下降。
实施例6GMS3基因敲除株系的获得及表型分析
利用CRISPR/Cas9系统对GMS3基因进行定向敲除。为了提高敲除效率,选择两个靶位点同时进行敲除。靶位点1位于第一外显子的正链上,序列为GCCTCCTCGCCTTCGCCGC(SEQID NO:1序列的第132位至第150位),靶位点2位于第二外显子的负链上,序列为CGCTGTACGCCGCCTGCGG(SEQ ID NO:1序列的第399位至第417位)。根据Ma等(Ma X,et al.ARobust CRISPR/Cas9 System for Convenient,High-Efficiency Multiplex GenomeEditing in Monocot and Dicot Plants.Mol Plant,2015,8:1274-84)的方法将靶位点1和靶位点2连入载体pC9M中,获得载体pC9M-GMS3(图11)。有pC9M-GMS3的大肠杆菌被命名为E.coli-pC9M-GMS3。将pC9M-GMS3通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC9M-GMS3。
利用重组农杆菌Ab-pC9M-GMS3侵染粳稻中花11愈伤组织,经潮霉素抗性筛选、分化、生根获得再生转基因株系40株。提取上述植株叶片的总DNA,利用引物SP1:CTTAGCCAGACGAGCGGGTTC(SEQ ID NO:14)和SP2:GCTTCTGCGGGCGATTTGT(SEQ ID NO:15)做阳性检测,共鉴定出转基因阳性植株31株。随机选取7株阳性株,用靶位点1两侧的引物靶1-F:CCCTAGAGTAGGAAGCG(SEQ ID NO:16)和靶1-R:CAGAAGAGCGAGACCTG(SEQ ID NO:17)以及靶位点2两侧的引物靶2-F:CCACCCAGGTCTCGCTCT(SEQ ID NO:18)和靶2-R:CGCACGTAAACACTGAACCAC(SEQ ID NO:19)。扩增基因组DNA,扩增产物测序后与基因组进行比对。结果显示7株阳性株的基因组DNA至少在靶位点1和靶位点2中的一处两条等位染色体均发生了突变(表3)。例如植株PC9M-1199-7在靶位点1处发生了TCGCCTTCGCCGCCG到ACGGC的序列替换(图12)。植株PC9M-1199-1在靶位点2处发生了G碱基插入的纯合突变(图13)。发生在靶位点1或靶位点1及相邻序列内的突变还包括G碱基缺失突变,或G、T碱基插入突变,或从TCGCCTTCGCCGCCG到ACGGC或从G到C序列替换突变(表3)。发生在靶位点2或靶位点2及相邻序列内的突变还包括G、T或A碱基插入突变,或从GA到G或从GCCGCCTGCGGAGGCCTCCGCCCTGGAGG到CTT序列替换突变。
开花后对上述8株阳性株进行表型分析。与野生型ZH11相比,GMS3敲除植株PC9M-1199-1在株叶(图14)和小穗形态(图15)上并无明显差别。但GMS3敲除植株的花药明显更加瘦小(图16)。花粉碘染结果表明,野生型ZH11的花粉大而圆,可以被染色,而GMS3敲除植株的花粉小而皱缩,不能被染色(表3和图17)。GMS3敲除植株的表型与gms3突变体的表型一致。
表3利用CRISPR/Cas9系统对GMS3进行基因敲除后靶位点序列分析
Figure BDA0003231864930000121
实施例7gms3突变体转基因互补株系的获得及表型分析
以9311的基因组DNA为模板,用引物3900HB-F:CgcgtttcgaaatttTCCAGGAATTCCGTT(SEQ ID NO:20)和3900HB-R:GtcgcgatcgcatgcTGCAGAGTTCACCCAGAATT(SEQ ID NO:21)扩增获得带有GMS3起始密码子ATG上游2000bp和终止密码子TAG下游500bp的基因全长片段。将该片连入pC1300获得质粒pC1300-1199-P2k-CDS-T500(图18)。有pC1300-1199-P2k-CDS-T500的大肠杆菌被命名为E.coli-pC2300-870-genome。将pC1300-1199-P2k-CDS-T500通过电击转人农杆菌菌株EH105中,得到的菌株命名为Ab-pC1300-1199-P2k-CDS-T500。利用重组农杆菌Ab-pC1300-1199-P2k-CDS-T500侵染gms3突变体愈伤组织,经抗性筛选、分化、生根共获得转基因阳性植株25株,均使gms3突变体的育性恢复正常(图19)。这进一步证明GMS3基因调控花粉发育,该基因突变会导致花粉败育。
实施例8GMS3基因编码蛋白与植物基因组中预测同源蛋白的序列比对
利用blastx工具在NCBI的Genbank数据库中对水稻GMS3基因编码蛋白的氨基酸序列进行同源性搜索,得到了山羊草(Aegilops tauschii)、二穗短柄草(Brachypodiumdistachyon)、高粱(Sorghum bicolor)、玉米(Zea mays)、小米(Setaria italica)、短药野生稻(Oryza brachyantha)、非洲栽培稻(Oryza glaberrima)基因组中预测的同源蛋白,将这些蛋白序列进行比对分析,结果显示来自不同植物的同源蛋白都具有非常相似的保守序列,彼此之间同源性很高(图20),表明该蛋白在植物花的雄性器官发育过程中生物学功能保守,起着非常重要的作用。
在山羊草(Aegilops tauschii)中该育性基因的基因组核苷酸序列如SEQ ID NO:22所示,CDS序列如SEQ ID NO:23所示,氨基酸序列如SEQ ID NO:24所示;在二穗短柄草(Brachypodium distachyon)中该育性基因的基因组核苷酸序列如SEQ ID NO:25所示,CDS序列如SEQ ID NO:26所示,氨基酸序列如SEQ ID NO:27所示;高粱(Sorghum bicolor)中该育性基因的基因组核苷酸序列如SEQ ID NO:28所示,CDS序列如SEQ ID NO:29所示,氨基酸序列如SEQ ID NO:30所示;玉米(Zea mays)中该育性基因的基因组核苷酸序列如SEQ IDNO:31所示,CDS序列如SEQ ID NO:32所示,氨基酸序列如SEQ ID NO:33所示;小米(Setariaitalica)中该育性基因的基因组核苷酸序列如SEQ ID NO:34所示,CDS序列如SEQ ID NO:35所示,氨基酸序列如SEQ ID NO:36所示:图小麦(Triticum aestivum)中该育性基因的基因组核苷酸序列如SEQ ID NO:37所示,CDS序列如SEQ ID NO:38所示,氨基酸序列如SEQ IDNO:39所示;短药野生稻(Oryza brachyantha)中该育性基因的基因组核苷酸序列如SEQ IDNO:40所示,CDS序列如SEQ ID NO:41所示,氨基酸序列如SEQ ID NO:42所示;非洲栽培稻(Oryza glaberrima)中该育性基因的基因组核苷酸序列如SEQ ID NO:43所示,CDS序列如SEQ ID NO:44所示,氨基酸序列如SEQ ID NO:45所示。
实施例9转育带有GMS3基因的隐性核不育系
用gms3突变体与育性正常的受体,如H28B,进行杂交、回交和自交,并在此过程中用分子标记进行GMS3基因和遗传背景选择,最终获得H28B背景下带有纯合GMS3突变基因的隐性核不育系。具体实施步骤如下:
1、以受体亲本,如H28B,为父本与gms3杂交获得F1
2、以F1为母本与受体亲本,如H28B,回交获得BC1F1
3、种植BC1F1,使用引物1199_F1:AGATCTATAGTGGTGTTGTGCTT(SEQ ID NO:7)、1199_R1:GCCAGTTCAACACCAAATCCG(SEQ ID NO:8)和1199_R2:GGTAGTCGCCGTACACCAT(SEQ ID NO:11)检测GMS3基因型。选择GMS3杂合基因型,即同时能扩增出167bp和253bp条带的植株。
4、使用一组基因型(例如100个,或200个等)在GMS3突变体和轮回亲本基因组之间存在多态性,且分布均匀的分子标记(可以是但不限于SSR、SNP、INDEL、EST、RFLP、AFLP、RAPD、SCAR等类型标记),对步骤3中选出的单株进行遗传背景鉴定,选取与轮回亲本基因型相似度高(如大于88%相似度,或2%中选率等)的植株。
5、用步骤4中选出的植株与受体亲本,如H28B,回交获得BC2F1
6、种植BC2F1,重复步骤3和步骤4,选出GMS3基因型杂合,遗传背景回复率高(如大于98%,或2%中选率等)的植株,收自交种BC2F2
7、种植BC2F2,重复步骤3和步骤4,选出GMS3基因型杂合,遗传背景纯合率最高的植株,收自交种BC2F3。BC2F3后代中分离的GMS3杂合株即GMS3隐性核不育系,BC2F3用于保存GMS3隐性核不育系种质资源。
序列表
<110> 海南波莲水稻基因科技有限公司
<120> 一种水稻育性调控基因GMS3及其突变体与应用
<130> KHP201117463.5
<160> 66
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2982
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtcttcccct tctctagagc cttcctctca cagagcacac acaaaaccct agagtaggaa 60
gcgagcgaga gagagagaga gagagagaga gaccacaccc atggagcgct cccacctcgc 120
cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg gccgcagcgg cggccaccgc 180
cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc gagccctcca tcctcgccac 240
ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg cagtgctgcg agccggtggt 300
ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc cgcgtcgccg ccgagccgca 360
gctcatcatc tccggcctca acgccaccca cctcctcacg ctgtacgccg cctgcggagg 420
cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa ggtacgtaca tgcataacct 480
cctcctcctc ctcctcctct ctctctctct ctctctctct ctctctctct ctctctctct 540
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 600
ctctctcggt tggggttgct gccttgcgtt tttggttggt ttttcgtggg ttgggcgaga 660
tccttcgagt tgcttgtgtt ttgtggtatg ctaggcttcg aacgagttgc cggcgttgct 720
gtgtcgacca actctcgtat gcttatcttt cagcacatga gttttggcct cgtttttact 780
cggttgttgt atgctacttc tgagatttga gttcatccac tgctaaactg acatcataga 840
tgaagaatag cagcggcgtt tggtcgattt tgattccttt ctctggatgt tcgagctgat 900
cttgtggtta ttgctcgaag cctcgaaacg cttgcgcaca tgcaagatcc agcaacgtat 960
agatctatag tggtgttgtg cttttattcg gatttgtggt tcagtgttta cgtgcgaagt 1020
cacgcgttcg atgtttccgc ttgagctcca tatctatagc acaaatcaat catgtgcgtt 1080
gcgcgagttc aagctcgaga gaaaagaaaa gcatcaaggc cacggggggt ttttgggcca 1140
ggtcgtgatt ctcccttgaa ctccgaatat accgagttta ttatcttttg agcggatttg 1200
gtgttgaact ggcaggactc aaaacccacc cgtgggacga tcgttttctt ttcctttcgc 1260
tttgtgttct ctgtctcctt tccgtgaaat ctctgcgttt cccttctggt gcttgttata 1320
gatgattctg gatcgagccg tgtatgctcg tgcagtggta cgacttggcg atgaacgtgc 1380
ttgcggagct agtcgcagtt catctttctt ttttttttcc ctcgtttctt ttctcggcgt 1440
ttcattctct acacctcttc tactcgccat gcatgttcat ctctctccgt gttggtcctc 1500
atttggagcc gattcgaacc gggcagcaca gtgctttttt tctgtttcgt tttggaggtt 1560
tccactttcg tgaaaaggaa agggtcaaat cgaatcgccc cctgaaccat cctttgcaga 1620
gcttttttgg acgtttccgc ctttcgtcag agaccatctg cactgcgcgt ttctccccaa 1680
ctcgatcgat tttgcagctt ttaatcactt tttagaaaaa gtttttaatc actcgtcatc 1740
gatgtgatct cttgctctaa ttgcatcttc tccgtaggat tagcacttcc atgcttcttg 1800
ttttgtctgt tcaattagcc aagaaacgag tcagtatacc ttcaagatgc atgcagattt 1860
aaaatcggca ctgctcttta tcttgttctt gtttttgcaa gttttggttg gttcaaaact 1920
tatctcttct gcagcattgc ctgctgtgta cagaaagttg gcaggggcat cgtgcagctt 1980
ttttgcctgc tgtgtgtaac gttttctttc cgtacgttgc gttccgtttc acgtcgctta 2040
cctctgtttc ttggggcgca agttatggca gtacagccgt tgtttccacg ttggaaggac 2100
ggttttgccc cttcgcttcc agaagcttcc agagattttt cgagtttttc taatgtgttt 2160
gttattgctg taactcgttc taacgtgcag gtcccgcccc accggcctcc atcgtcactg 2220
ccccgccgcc cccggttgct tttcgccgca agccgccggc acgtaaggct gattgattcc 2280
ccttcatcca ctgattgtta atgcgcgtgt aatctttgtg attactaact tgctgctgga 2340
tgctttgcag gcgaggcacc tcccccaccg ccggcggccg agaagctctc cccgccgcct 2400
cagcagcacg acgactccga ccacaacaag cgcgtcggcc cactcccgag aggctctcct 2460
cccccgtatg cccagtccgt cccggtcggc cccgccgccg ctcccccgcc accacgctcc 2520
ggcgcctcct cgtcgctcca ggcgcccctc gccgccacca ccaccatcgt tgccatcacc 2580
ctcatcgccg ccgcccagta ctgaggacac gccgccgccg gcgcccgctc cccagagcca 2640
tgattcgttc gcagtatttt tcatcctgtt cttttgcttc tctctctggc tacccatgta 2700
tatgagtttg gaagacgatg atttgatcta gtagcgcgtt accaagtttg cctagattcg 2760
agtagtagct gtggtactat gctgatgtct ctttgatcgc gtcgtctcta gagcgtccgc 2820
cgtttttgat cgatcactag catggccgat gtgagtccag catgaaaagt ggtcgaggag 2880
aacattgttg ctaagttttt tttttgcttt ctatctccag tagctgaaca agtatgtcaa 2940
ctgaatgctg caatgaagtg aatggatgca gtcttaaatt ta 2982
<210> 2
<211> 687
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtcccgccc caccggcctc catcgtcact gccccgccgc ccccggttgc ttttcgccgc 420
aagccgccgg cacgcgaggc acctccccca ccgccggcgg ccgagaagct ctccccgccg 480
cctcagcagc acgacgactc cgaccacaac aagcgcgtcg gcccactccc gagaggctct 540
cctcccccgt atgcccagtc cgtcccggtc ggccccgccg ccgctccccc gccaccacgc 600
tccggcgcct cctcgtcgct ccaggcgccc ctcgccgcca ccaccaccat cgttgccatc 660
accctcatcg ccgccgccca gtactga 687
<210> 3
<211> 228
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Glu Arg Ser His Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala
1 5 10 15
Ala Gly Val Pro Ala Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln
20 25 30
Ala Ala Thr Ala Glu Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln
35 40 45
Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu
50 55 60
Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys
65 70 75 80
Arg Val Ala Ala Glu Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr
85 90 95
His Leu Leu Thr Leu Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly
100 105 110
Ala Arg Leu Ala Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ser Ile
115 120 125
Val Thr Ala Pro Pro Pro Pro Val Ala Phe Arg Arg Lys Pro Pro Ala
130 135 140
Arg Glu Ala Pro Pro Pro Pro Pro Ala Ala Glu Lys Leu Ser Pro Pro
145 150 155 160
Pro Gln Gln His Asp Asp Ser Asp His Asn Lys Arg Val Gly Pro Leu
165 170 175
Pro Arg Gly Ser Pro Pro Pro Tyr Ala Gln Ser Val Pro Val Gly Pro
180 185 190
Ala Ala Ala Pro Pro Pro Pro Arg Ser Gly Ala Ser Ser Ser Leu Gln
195 200 205
Ala Pro Leu Ala Ala Thr Thr Thr Ile Val Ala Ile Thr Leu Ile Ala
210 215 220
Ala Ala Gln Tyr
225
<210> 4
<211> 2466
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtacgtaca tgcataacct cctcctcctc ctcctcctct ctctctctct ctctctctct 420
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctcg gttggggttg 480
ctgccttgcg tttttggttg gtttttcgtg ggttgggcga gatccttcga gttgcttgtg 540
ttttgtggta tgctaggctt cgaacgagtt gccggcgttg ctgtgtcgac caactctcgt 600
atgcttatct ttcagcacat gagttttggc ctcgttttta ctcggttgtt gtatgctact 660
tctgagattt gagttcatcc actgctaaac tgacatcata gatgaagaat agcagcggcg 720
tttggtcgat tttgattcct ttctctggat gttcgagctg atcttgtggt tattgctcga 780
aacctcgaaa cgcttgcgca catgcaagat ccagcaacgt atagatctat agtggtgttg 840
tgcttttatt cggatttgtg gttcagtgtt tacgtgcgaa gtcacgcgtt cgatgtttcc 900
gcttgagctc catatctata gcacaaatca atcatgtgcg ttgcgcgagt tcaagctcga 960
gagaaaagaa aagcatcaag gccacggggg gtttttgggc caggtcgtga ttctcccttg 1020
aactccgaat ataccgagtt tattatcttt tgagcggatt tggtgttgaa ctggcaggac 1080
tcaaaaccca cccgtgggac gatcgttttc ttttcctttc gctttgtgtt ctctgtctcc 1140
tttccgtgaa atctctgcgt ttcccttctg gtgcttgtta tagatgattc tggatcgagc 1200
cgtgtatgct cgtgcagtgg tacgacttgg cgatgaacgt gcttgcggag ctagtcgcag 1260
ttcatctttc tttttttttt ccctcgtttc ttttctcggc gtttcattct ctacacctct 1320
tctactcgcc atgcatgttc atctctctcc gtgttggtcc tcatttggag ccgattcgaa 1380
ccgggcagca cagtgctttt tttctgtttc gttttggagg tttccacttt cgtgaaaagg 1440
aaagggtcaa atcgaatcgc cccctgaacc atcctttgca gagctttttt ggacgtttcc 1500
gcctttcgtc agagaccatc tgcactgcgc gtttctcccc aactcgatcg attttgcagc 1560
ttttaatcac tttttagaaa aagtttttaa tcactcgtca tcgatgtgat ctcttgctct 1620
aattgcatct tctccgtagg attagcactt ccatgcttct tgttttgtct gttcaattag 1680
ccaagaaacg agtcagtata ccttcaagat gcatgcagat ttaaaatcgg cactgctctt 1740
tatcttgttc ttgtttttgc aagttttggt tggttcaaaa cttatctctt ctgcagcatt 1800
gcctgctgtg tacagaaagt tggcaggggc atcgtgcagc ttttttgcct gctgtgtgta 1860
acgttttctt tccgtacgtt gcgttccgtt tcacgtcgct tacctctgtt tcttggggcg 1920
caagttatgg cagtacagcc gttgtttcca cgttggaagg acggttttgc cccttcgctt 1980
ccagaagctt ccagagattt ttcgagtttt tctaatgtgt ttgttattgc tgtaactcgt 2040
tctaacgtgc aggtcccgcc ccaccggcct ccatcgtcac tgccccgccg cccccggttg 2100
cttttcgccg caagccgccg gcacgtaagg ctgattgatt ccccttcatc cactgattgt 2160
taatgcgcgt gtaatctttg tgattactaa cttgctgctg gatgctttgc aggcgaggca 2220
cctcccccac cgccggcggc cgagaagctc tccccgccgc ctcagcagca cgacgactcc 2280
gaccacaaca agcgcgtcgg cccactcccg agaggctctc ctcccccgta tgcccagtcc 2340
gtcccggtcg gccccgccgc cgctcccccg ccaccacgct ccggcgcctc ctcgtcgctc 2400
caggcgcccc tcgccgccac caccaccatc gttgccatca ccctcatcgc cgccgcccag 2460
tactga 2466
<210> 5
<211> 4002
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
cgcgtagagg gcgacgagac gaactcattg atgctcaccc caacacgaga cgatgcacga 60
cggcggccgg cgacgaagaa gaagacggcg gcggctcggg tcgacggcga cggcggcact 120
ccggtgatca acggcgcaaa cggaggggcg gccgagcttc tcctcgctcc cgtgcacctc 180
acggtggtgg cggcgaccga cggcgacggc ggaggcggcg gcgcgacacg gccggagatc 240
gccggcgacg gctagcggct agggcaacgg cgcgacggcg ctacaagcga cgagagggct 300
cgagacttgg ggcaaacgaa agaggagatc aaagggaagc tatatatggg ctcaaatcga 360
agagatcgag ccgtaaacgg aaggaattag atcgggaaga acacggactc ggttttggag 420
agataaaaca aaacgaactc gattcgaatc caaatcgcaa cgaattcctt tgtttcttga 480
ggggaaagaa agaggagatt gagaggaata aaatccctca atcaatcgga gaagaccgag 540
tcggatttgg ccgaatttga gaggagaaag ggcgctaggg tttcggctcg gcggcggcgg 600
ccggctggag gaggaagacg gccctgacat gtgggcccca catgtcagcg gctgggagag 660
aggagcggcg cggcgcggcg tcggcttggg ccggcgtggg ccgagcgcgg ggaaaagaag 720
agaaagagag agaagttggg ccgaaaacgg cccaacggcc taggagaaga tttaaaaact 780
ttttcaatta aaataattcg tgaaatgatg tttcatttat taaaaatact tcccttgctc 840
aaataattcc cagaaaaaat ctagaaaata gaggaacaag caaagtattt aataaaattt 900
tatctaactc acttttatgt tgagatttag caaaataaaa gaaagatctt ctcttttaaa 960
cttttaaaat catttctatt aattcctttt aaacaacaat ttataattta aggattttta 1020
aacaagacaa ctcttaacaa ttataattag atcattatat gattatgtta atatttaaat 1080
aattgctgaa cttctctttg tatgattaaa attaacaatt gagctctgaa aaatccgaga 1140
aaattccaga gagtataatt aatcatggaa aatttaataa aaattaaatc catccatgct 1200
taatatttag aaaattttat ttcccacatt taacttcact tgtaaattaa agaacattta 1260
atataaattc tgataataat ttattaaata atttataaat cctgaaacga aaatcagggt 1320
gtgacagtcg caatgggagt gggacgaacc tgcgaggggg tcggttaaat gaccacctgg 1380
gaggggaaat caggtttccc cgggatggtt ccgtctcccc catcttgcgg agccgtttct 1440
tcttgcgttc cccctcgggc tgcgatgtcg gtgcggcccc ctccgggcgc cgactgctgg 1500
cacgcaccgc cccgccccct cggggaggag atgggggagg tgttcctccc agcttcctct 1560
tcccctgggc gtcggcaggg cggctgctcc ccgagccccc gacgcggggc ccagaagcac 1620
gaccccctcc tggggtagat tgttcccccc ggcggctctc gcccgcgccg tcgtggccct 1680
taggagtttc ctcctctgag gccccgaccc ccgtcataat ggtcagaatg gaggcgcggt 1740
cgggatcgct acagaggggg aggattcctt gaggaatgcg agacgcctcc acggagctga 1800
gattcagcac cctttggacc acgatcttga agtcctcggg agcccaatcc catctgactc 1860
cctggtgggt ccgcatgtag tcttcggacc cggtgtactc ccaggcgccc cgggcgcgcc 1920
gctggagcgg cgcaatccgg cgacggaggt agtcgccgta caccatggcc cctgtgagcc 1980
cctgggatcg taggcctgcc agaaaagaaa agcatcaagg ccacgggggg tttttgggcc 2040
aggtcgtgat tctcccttga actccgaata taccgagttt attatctttt gagcggattt 2100
ggtgttgaac tggcaggact caaaacccac ccgtgggacg atcgttttct tttcctttcg 2160
ctttgtgttc tctgtctcct ttccgtgaaa tctctgcgtt tcccttctgg tgcttgttat 2220
agatgattct ggatcgagcc gtgtatgctc gtgcagtggt acgacttggc gatgaacgtg 2280
cttgcggagc tagtcgcagt tcatctttct tttttttttc cctcgtttct tttctcggcg 2340
tttcattctc tacacctctt ctactcgcca tgcatgttca tctctctccg tgttggtcct 2400
catttggagc cgattcgaac cgggcagcac agtgcttttt ttctgtttcg ttttggaggt 2460
ttccactttc gtgaaaagga aagggtcaaa tcgaatcgcc ccctgaacca tcctttgcag 2520
agcttttttg gacgtttccg cctttcgtca gagaccatct gcactgcgcg tttctcccca 2580
actcgatcga ttttgcagct tttaatcact ttttagaaaa agtttttaat cactcgtcat 2640
cgatgtgatc tcttgctcta attgcatctt ctccgtagga ttagcacttc catgcttctt 2700
gttttgtctg ttcaattagc caagaaacga gtcagtatac cttcaagatg catgcagatt 2760
taaaatcggc actgctcttt atcttgttct tgtttttgca agttttggtt ggttcaaaac 2820
ttatctcttc tgcagcattg cctgctgtgt acagaaagtt ggcaggggca tcgtgcagct 2880
tttttgcctg ctgtgtgtaa cgttttcttt ccgtacgttg cgttccgttt cacgtcgctt 2940
acctctgttt cttggggcgc aagttatggc agtacagccg ttgtttccac gttggaagga 3000
cggttttgcc ccttcgcttc cagaagcttc cagagatttt tcgagttttt ctaatgtgtt 3060
tgttattgct gtaactcgtt ctaacgtgca ggtcccgccc caccggcctc catcgtcact 3120
gccccgccgc ccccggttgc ttttcgccgc aagccgccgg cacgtaaggc tgattgattc 3180
cccttcatcc actgattgtt aatgcgcgtg taatctttgt gattactaac ttgctgctgg 3240
atgctttgca ggcgaggcac ctcccccacc gccggcggcc gagaagctct ccccgccgcc 3300
tcagcagcac gacgactccg accacaacaa gcgcgtcggc ccactcccga gaggctctcc 3360
tcccccgtat gcccagtccg tcccggtcgg ccccgccgcc gctcccccgc caccacgctc 3420
cggcgcctcc tcgtcgctcc aggcgcccct cgccgccacc accaccatcg ttgccatcac 3480
cctcatcgcc gccgcccagt actgaggaca cgccgccgcc ggcgcccgct ccccagagcc 3540
atgattcgtt cgcagtattt ttcatcctgt tcttttgctt ctctctctgg ctacccatgt 3600
atatgagttt ggaagacgat gatttgatct agtagcgcgt taccaagttt gcctagattc 3660
gagtagtagc tgtggtacta tgctgatgtc tctttgatcg cgtcgtctct agagcgtccg 3720
ccgtttttga tcgatcacta gcatggccga tgtgagtcca gcatgaaaag tggtcgagga 3780
gaacattgtt gctaagtttt ttttttgctt tctatctcca gtagctgaac aagtatgtca 3840
actgaatgct gcaatgaagt gaatggatgc agtcttaaat ttagcctttc tgttgccaac 3900
ttcttcctct gttctgtacg gttcagatgc tgcttgttct gtttatgcga tggtgttgca 3960
ttgttgtgat gtgtgaagtg cgcccaattc tgggtgaact ct 4002
<210> 6
<211> 4298
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggattattac tcatcttgag agtccaaact agtataaacc cttgttcctt gtcttttaga 60
ctactcatct tgagagtcca aactcgtata aacccttgtt ccttgtcttt tagatgcagt 120
cttgtgtata ccttggttcc aaagatactc atactctaca aataacgtag gcaggtatcg 180
cctgttgaca atggcgctct aggtaggggg cttggtgcta tataagataa cacaaaaatt 240
atcagaggta ttttttatac ctccattttt ttcagcaaat aatcgcccta gtcctcccgt 300
gaacagtgca ctggttggga taacaagaag ttagaaattg ggcatatata tagaagggta 360
agacacctct aatggatagg gtggacaatc catcaaagat gactattttg gcacctctga 420
ggccgtgaca agttgcctat cttcgcaccc ttcacaagtg actccctact tgtgatgggt 480
cgtgagatgt gagccggtga tctttctcag atgtaaattt cggcctctca caagtgactc 540
cttatctgtg ataggtcttg ccctcacagc ctcatctgta acggcctcta attcaatccg 600
ttacagatta aatcattcat gacaagacac tttgacccat cataggtggg ttgttaatgt 660
tgaaccgagg tagcgtggtg gtggcttctt tgattgttga gcgggttgtg ttcttcatca 720
cttggtagga agtaggaacc caagaaggtt agaagcccac aactattata tcgtcggcct 780
cattggtaaa tgggctagaa gcctagaggc aatctgattc aatagtgtcg gaaatttgtg 840
gatgggccag agacgttgcg tcgtcttcga ctcttcgagt gcctggccta cggatctgca 900
cgaatcttag agcaagtaga aaatcgcata tcgtcgtgta gagcgcagca caaattcgag 960
ttgcttttcc ctttttcgca gccaaatctt acctgctcac gtgccgtgct gcccggtgtg 1020
cagagcccac gcgccacggc gccagtgtac tacaccgaat cggcaccatc catcgccaca 1080
gctggccggt cccccctaag acggacgctc cggatcaatc cacgttggca tggcttcccc 1140
gcatcgcctt ctccgcgccc ccgcctatat aatggcgctc tcgcttctct tccccatttc 1200
gtcttcccct tctctagagc cttcctctca cagagcacac acaaaaccct agagtaggaa 1260
gcgagcgaga gagagagaga gagagagaga gaccacaccc atggagcgct cccacctcgc 1320
cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg gccgcagcgg cggccaccgc 1380
cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc gagccctcca tcctcgccac 1440
ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg cagtgctgcg agccggtggt 1500
ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc cgcgtcgccg ccgagccgca 1560
gctcatcatc tccggcctca acgccaccca cctcctcacg ctgtacgccg cctgcggagg 1620
cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa ggtacgtaca tgcataacct 1680
cctcctcctc ctcctcctct ctctctctct ctctctctct ctctctctct ctctctctct 1740
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 1800
ctctctcggt tggggttgct gccttgcgtt tttggttggt ttttcgtggg ttgggcgaga 1860
tccttcgagt tgcttgtgtt ttgtggtatg ctaggcttcg aacgagttgc cggcgttgct 1920
gtgtcgacca actctcgtat gcttatcttt cagcacatga gttttggcct cgtttttact 1980
cggttgttgt atgctacttc tgagatttga gttcatccac tgctaaactg acatcataga 2040
tgaagaatag cagcggcgtt tggtcgattt tgattccttt ctctggatgt tcgagctgat 2100
cttgtggtta ttgctcgaag cctcgaaacg cttgcgcaca tgcaagatcc agcaacgtat 2160
agatctatag tggtgttgtg cttttattcg gatttgtggt tcagtgttta cgtgcgaagt 2220
cacgcgttcg atgtttccgc ttgagctcca tatctatagc acaaatcaat catgtgcgtt 2280
gcgcgagttc aagctcgagg cggtcgagga cggcgtcata gtcctccccc agatctaccg 2340
gcgcccgcca gctggagacc tgcgccgggg gctggcttgg aagtcggagg cgcgcttcgt 2400
tggcgagggg ggtgtagaac cagtcacttt tccagtcgtc ccatttctta cggagggcgc 2460
aggggatgta gcggttcaac accggccccc gcggctggaa atagcagcca ccaaccaccg 2520
acggcagcga caccgactgc acggtgaaga accaccggaa cagccgaaga gatgggcgca 2580
ccccgatgaa catctcgcac agatgcgtga agatggccaa tgtcatcacc gcgttggggg 2640
tgaggtgcgc catctggaga tcgtagaact ccagaacgtc cataaagaaa gaagaaaatg 2700
gcggaaccag ccctgccatt gcgaagggga gaaagaagac ggaccgcccc gggtagtctg 2760
gtgccgggcg tccctcgcct agcatcacta tctcccggcc ggtggcagat tccggcatga 2820
agcggcgcgg cagcccggca tgcctctcgc tcacaatgcg ggaaggcggt agtacgctac 2880
cgtcgagcag agcggagccc cgtgccatgg cgccggagga agagatgatt gagagcgagc 2940
gcgtgtggcg aaggtaaggc gcagcagaga aaaagttagg gctcaagcag cgaaggcaag 3000
gggaataatg gcgaaaggaa gtgtcacgac cggaaatcac ccaacaggcg ttcctgacgt 3060
gcgtgtatta ttccttgtcc caggaggcaa ggtacaccaa aagttgatac aatacagagt 3120
ttaacaagcg gaagcgtata taaaattatt acatgggcaa caaaggccca gcacacacaa 3180
agacaacgaa aaacagcgga agactagggc gacgaccaca ggcgcttgac ggcaggcacg 3240
agctagacac caaagccttc atcttccagg aactcctcat ctgggcttgg gaaaaattga 3300
gcaagactga gtacaaccac cgtactcaac aagacacacc cacagatgca gaataaatgc 3360
aagggagtac aagggaatta taacataaag ggttagggtt gcagtaaaca gcatttaaag 3420
tcatttagtt gctcaaagct attttgcaaa cgcgatcctg gatctataca aagttattaa 3480
tcaaggccgt gaacccacac gaacctgcct taacccaagg cctaagatga ttcagaccga 3540
actggcaacc cgaccctggg tcccagctcg tcccaagcca acccaggcca accattccac 3600
attttagttg ttaagcaagt tttaagaatt gaaacactaa cttgggtaca ttgctcggct 3660
tgcccataac cgaggacgcg gctattcgaa tagattatac tctgatcaga ggtgtacatc 3720
tttacccaca agacacatct ttctcacgtg caaccacgtg ccacatacca ccacagtata 3780
caggcgaaag acgtgacata gtttccaacc catcctagcc atagacaaga gtaccgaccc 3840
aatcccgcct acggccggaa cccccgggac aggcagacgg aactgagccc ctcgcagcag 3900
ggcaccaacc ctgtgctttt tgacatctcg actaccgggc cgcagctcgt gtagccttca 3960
tttgccctgg agaatgtcca tcgacccccg acttcatcca tctccaatcc gtgtactttt 4020
gtttaagact agactgagcc acaaactaag ccttacccat tagacatgtg gaagtacggt 4080
aatgctttgc aacagaggcc cgaagaccgg tccttaaacg gccgaggtgc taccatcaaa 4140
accatgcacc ccgagcccag cctaaaacca ttttggggac ttttgaatag agggagcggt 4200
gtgaagccaa ttccacaatt aaccaataat tccagagtgt ccaggtgata tgaataattc 4260
ccaagtctaa agttgtaaaa ccacctaagg ttacctaa 4298
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agatctatag tggtgttgtg ctt 23
<210> 8
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gccagttcaa caccaaatcc g 21
<210> 9
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggtagtcgcc gtacaccat 19
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gttgccatca ccctcatc 18
<210> 11
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aaaatactgc gaacgaat 18
<210> 12
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gaatggcttt ccgtgtt 17
<210> 13
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
caaggtcctc ctcaacg 17
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cttagccaga cgagcgggtt c 21
<210> 15
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gcttctgcgg gcgatttgt 19
<210> 16
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ccctagagta ggaagcg 17
<210> 17
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cagaagagcg agacctg 17
<210> 18
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ccacccaggt ctcgctct 18
<210> 19
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cgcacgtaaa cactgaacca c 21
<210> 20
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cgcgtttcga aattttccag gaattccgtt 30
<210> 21
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtcgcgatcg catgctgcag agttcaccca gaatt 35
<210> 22
<211> 2271
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
cgcatcacca ccaccactcc accaaaccct agcgaccgag cgagagaggg agagaccgcc 60
ccgccgatgg agagatcccg cggcctgctg ctggtggcgg gcctgctggc ggcgctgctg 120
ccggcggcgg cggccgcgtt cgggcagcag ccgggggcgc cgtgcgagcc cacgctgctg 180
gcgacgcagg tggcgctctt ctgcgcgccc gacatgccca cggcccagtg ctgcgagccc 240
gtcgtcgccg ccgtcgacct cggcggcggg gtgccctgcc tctgccgcgt cgccgcggag 300
ccgcagctcg tcatggcggg cctcaacgcc acccatctcc tcacgctcta cggctcctgc 360
ggcggcctcc gtcctggcgg cgcccacctc gccgccgcct gcgaaggtac gtcgcgcacg 420
ttcaccgcct ccctccctcc ctcgctctct ctctctctct ctctacgtgc cgattctctg 480
tgttcgcttc cctgcttacc tagcacgtag ttttccatgg cttctcgact cgctggtcct 540
ccgatttggg tcggttaatt tcctcgctgt actaccggat ctgtcggcac ggcgcgcggc 600
gtcgggttct cgccgtctcc cgtggcgagc gacctgcgca gcgcgcgcgc ggcctagcta 660
gcttcatacc gctgtacctt cagatacacg gagcgattta gggtctactc tgagtatttc 720
gtcatcgtag gatgcatgtg gcagtcgcga ttgtttcatc gattttagat ctgtgcttgt 780
tcccgcgagt taagatggat ctagcgccgt acgcagacgc agatggtctt gctgtctctg 840
ttgctcgagt tatcttatct actgtcgttc gagtatattt gcctgcttcc ttttgatctg 900
tgtttatcgt gcagtagcag tagccatgtc cacgccttct tgtttcgagg cgatcatcgt 960
cgagatagcg ctttgtttca aaccgcaacg cagcctttgc tttctgcggt atcttctgcc 1020
ttgtttttgt tctgtgcagt acgtcttgct tggtcaaaag taaaaactct tgctgttcga 1080
tcgaccgagg cctgatgcag agcaagagct ggccgtgctt ttcgctctgc agtgcatcgc 1140
ctctgcctct ttggccaaac atttccatgt tgatcctctg gtgtggtact acttttttgc 1200
atgcggtttg cgtagccttc ctctttcgtg aaaaaaggtc gggtcgccta ttggcagagc 1260
agcagcagca gcaacagata gctggctgtc tcgcagcttt gacagaaccg gtctgtggcc 1320
atctgtcgcc gcctgccacc gtttccctga tgtttgtttc tctcgtctca tctcgcctgc 1380
cactgtttct tttcttgttg cgcacgtcgt cacctcctcc tacttttttt tccagttttg 1440
tttacttttg agatacggac gaacggctgg taattactaa ctttggttgc tgttgttact 1500
gtggattttg gacgcaggac ccgctccccc ggccgccatc gtcagcagcc ccccgccccc 1560
gccaccaccg tccgccgcac ctcgccgcaa gcagccagcg cgtacgaacc tctccctccc 1620
tctctctcgc ctgcatctcg ctctgtatta gctgattgtg tttacttact gacgtgtgct 1680
ttggctttgg atctgtttcg cagacgacgc accgccgccg ccgccgccgt ctagcgagaa 1740
gccgtcgtcc ccgccgccgt cccaggagca cgacggcgcc gccccccgcg ccaaggccgc 1800
gcccgcccag gcgaccacct ccccgctcgc gcccgctgcc gccatcgccc cgccgcccca 1860
ggcgccacac tccgcggcgc ccacggcgtc gtccaaggcg gccttcttct tcgtcgccac 1920
ggccatgctc ggcctctaca tcatcctctg agtggccgac cccgcaagac catggtccgt 1980
ccagttgcag tagagtagag tgctcgtcgt cttgttccgt ttcatgcttg tcgccgttcg 2040
aggttcgtct ctgcatgcag tccgatcgaa gaagacggtg gattttgagt agtagctgtc 2100
gttggcagga gtatggagtt catgtgtcct cggtcgccta gttttggtct caagtagtgt 2160
ctgtctgtcc gccgtgtttg cgtggtcgcg gagaagtaca attgggtgtt tgcgattcct 2220
ctggttagat gaaccactgc tatgtgatcg atcgatatga tctgaatgga a 2271
<210> 23
<211> 672
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atggagagat cccgcggcct gctgctggtg gcgggcctgc tggcggcgct gctgccggcg 60
gcggcggccg cgttcgggca gcagccgggg gcgccgtgcg agcccacgct gctggcgacg 120
caggtggcgc tcttctgcgc gcccgacatg cccacggccc agtgctgcga gcccgtcgtc 180
gccgccgtcg acctcggcgg cggggtgccc tgcctctgcc gcgtcgccgc ggagccgcag 240
ctcgtcatgg cgggcctcaa cgccacccat ctcctcacgc tctacggctc ctgcggcggc 300
ctccgtcctg gcggcgccca cctcgccgcc gcctgcgaag gacccgctcc cccggccgcc 360
atcgtcagca gccccccgcc cccgccacca ccgtccgccg cacctcgccg caagcagcca 420
gcgcacgacg caccgccgcc gccgccgccg tctagcgaga agccgtcgtc cccgccgccg 480
tcccaggagc acgacggcgc cgccccccgc gccaaggccg cgcccgccca ggcgaccacc 540
tccccgctcg cgcccgctgc cgccatcgcc ccgccgcccc aggcgccaca ctccgcggcg 600
cccacggcgt cgtccaaggc ggccttcttc ttcgtcgcca cggccatgct cggcctctac 660
atcatcctct ga 672
<210> 24
<211> 223
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 24
Met Glu Arg Ser Arg Gly Leu Leu Leu Val Ala Gly Leu Leu Ala Ala
1 5 10 15
Leu Leu Pro Ala Ala Ala Ala Ala Phe Gly Gln Gln Pro Gly Ala Pro
20 25 30
Cys Glu Pro Thr Leu Leu Ala Thr Gln Val Ala Leu Phe Cys Ala Pro
35 40 45
Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala Ala Val Asp
50 55 60
Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala Glu Pro Gln
65 70 75 80
Leu Val Met Ala Gly Leu Asn Ala Thr His Leu Leu Thr Leu Tyr Gly
85 90 95
Ser Cys Gly Gly Leu Arg Pro Gly Gly Ala His Leu Ala Ala Ala Cys
100 105 110
Glu Gly Pro Ala Pro Pro Ala Ala Ile Val Ser Ser Pro Pro Pro Pro
115 120 125
Pro Pro Pro Ser Ala Ala Pro Arg Arg Lys Gln Pro Ala His Asp Ala
130 135 140
Pro Pro Pro Pro Pro Pro Ser Ser Glu Lys Pro Ser Ser Pro Pro Pro
145 150 155 160
Ser Gln Glu His Asp Gly Ala Ala Pro Arg Ala Lys Ala Ala Pro Ala
165 170 175
Gln Ala Thr Thr Ser Pro Leu Ala Pro Ala Ala Ala Ile Ala Pro Pro
180 185 190
Pro Gln Ala Pro His Ser Ala Ala Pro Thr Ala Ser Ser Lys Ala Ala
195 200 205
Phe Phe Phe Val Ala Thr Ala Met Leu Gly Leu Tyr Ile Ile Leu
210 215 220
<210> 25
<211> 2560
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tggactcaca ccaactcgcc tagccctagc ggtaggaagc gaaagcgaga gatcccaccc 60
atggagagat cccaccacct cctcctcgtg ctcggcctcc tcgccgcgct gctcccggcg 120
gccgcggcta ccttcgggac gacgcagccg gagcctgggg ccccatgcga gcccaccctc 180
ctcgccaccc aggtctcgct cttctgcgcg ccggacatgc cgaccgcgca gtgctgcgag 240
cctgtggtgg cctccgtcga cctcgggggt ggcgtcccct gcctctgccg tgtcgccgcc 300
gagccgcagc tcgtcatggc cggcctcaac gccacccacc tcctcacgct ctacacctcc 360
tgcggtggac tccgccccgg aggcgcccac ctcgccgccg cctgtgaagg tacgcgacgc 420
ctgcgtctct ctctctctct gcgtctctct ctgcgtctct cccatgacga gcaactcgcg 480
atacgcctta ctgccttatt ttttttgaag atatgtgtct gcttggtcca ctgtatttgg 540
gttcttcttt cgagaagttc atccgtaggc atctataatc cgacgagttc ggatgagatc 600
aaacagtgac acgcgcgaca ccaacgtttt caacgatctc ttgctgtttg gtttgatatt 660
tcctgcttcc catgatctat tttcaacctt ttttgtatgg ctttcgctcc aatctcgtgc 720
agaaccatat ttcatcttgg gtttatgctg ttctgtaaga tctagcgcca tgcagaggtc 780
atttctgctg ttccagaccc cctacgtgac atttgctgtt tttcctcttt gttgccatgg 840
ccacgggttg gtttttacga aagatacttt gatatgtcaa gatctgcgag cactttgaaa 900
ccccaacgca ttttctatgt gttttgtgct gtttgatcga ccgattgatc gaggccgtgc 960
tagtactttg acacccgaaa gcatctctcc tttctgcagt atcttttctg ttcttgtcgt 1020
ctcttgggct tgtgcagttt accatggtga agagcgcttc atacacgatc tgccgcgagg 1080
ccagagcaaa agcttcccgt gctttttctt gcacagtgca tctccttctt ttttgccttt 1140
ttcgtttgga cgtttctgct tcgtctcccc atgtttctgt tgtactgtcg cgcaccatgc 1200
atgttgattt tctgatacga agctagtact gctctgcagt ttttgtgtag ccttcctctt 1260
tcgtgataaa gaacgtggtc aaactgctct ctgactctgt tcgtctaaat ctttttctcg 1320
caggaaaatt ttcgttgcag atctccttta ccctcgtcct ccgcatctgt ttgctttacc 1380
tgctgtagtt gcgttcttcg tttgaatcaa attcttgttt ccttctttta tcccatcgct 1440
cgtttagtta ccttttcttt ttattgaact ttagttcatt ggtgtagtag gcagtagtat 1500
gctttgcgtt gtttgcggag tagcaattga attgctctcc ggtctctgca gagcggcccg 1560
ctgaacagat agctggctgc agcagcttta ccagaatcgg tcggttacga acttacgatt 1620
atacccttcg tcttgctttc atttactggt agcctgctag tcttttcttg ttgcgcacgt 1680
aatcgtaccc agtactgtac gcttagataa aatagacggg tctggcctta aattatttcg 1740
ttgcgttttc gaattttgaa ttccggaagt taactttatt ttgtgctctg tttggacgca 1800
tgtgcaggtc cagctcctcc cgccgccgtc gtcagtgccc ctcccccctc cgccgcacct 1860
cgccgcaagc agccagcacg tacgaacaac cttttacact tcgcttgatc taattgctgc 1920
tgctatactc tcttactcga ttctaaatct atgttttgct cattattaat atgttgatct 1980
gactcgtgtg gcacgcgcgc gtgctttgat ttcgcagacg aggcacctcc gcctccgccg 2040
tcgactgaga agccgtcccc gccgcctcag caggacaacg tcaccgccca cggcaaggca 2100
atccccaccc atgcggccac atccccgctc gcgccggctg cttccatgat ccacatgtcc 2160
ccaccgcccg catgcaatcc atgctccggc tccgccgctt cctcagccga ggggcccctc 2220
ctcatcgccg cgctcctcct cgtcatcacc gccatcatcg tcggcaccct cgacgataag 2280
tgatccagga gccgtccgcc ccctccgact caccaacgtc cgactatgat ccagttgcag 2340
tagtggtctt gttctgtttc atgtttctcg ccatttggtt ccgagatttc tatatcgtgc 2400
ctagtcgtag ctgtagcagt cagtatgttc atgtgtccac aagatgtggt cgagtataac 2460
attgggtttc atgattcctc tagcagatga aacactatgt gatgtgatct gaatggatgc 2520
agttttgcta ccttttctgc tgctatgata tgcttatcca 2560
<210> 26
<211> 687
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
atggagagat cccaccacct cctcctcgtg ctcggcctcc tcgccgcgct gctcccggcg 60
gccgcggcta ccttcgggac gacgcagccg gagcctgggg ccccatgcga gcccaccctc 120
ctcgccaccc aggtctcgct cttctgcgcg ccggacatgc cgaccgcgca gtgctgcgag 180
cctgtggtgg cctccgtcga cctcgggggt ggcgtcccct gcctctgccg tgtcgccgcc 240
gagccgcagc tcgtcatggc cggcctcaac gccacccacc tcctcacgct ctacacctcc 300
tgcggtggac tccgccccgg aggcgcccac ctcgccgccg cctgtgaagg tccagctcct 360
cccgccgccg tcgtcagtgc ccctcccccc tccgccgcac ctcgccgcaa gcagccagca 420
cacgaggcac ctccgcctcc gccgtcgact gagaagccgt ccccgccgcc tcagcaggac 480
aacgtcaccg cccacggcaa ggcaatcccc acccatgcgg ccacatcccc gctcgcgccg 540
gctgcttcca tgatccacat gtccccaccg cccgcatgca atccatgctc cggctccgcc 600
gcttcctcag ccgaggggcc cctcctcatc gccgcgctcc tcctcgtcat caccgccatc 660
atcgtcggca ccctcgacga taagtga 687
<210> 27
<211> 228
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 27
Met Glu Arg Ser His His Leu Leu Leu Val Leu Gly Leu Leu Ala Ala
1 5 10 15
Leu Leu Pro Ala Ala Ala Ala Thr Phe Gly Thr Thr Gln Pro Glu Pro
20 25 30
Gly Ala Pro Cys Glu Pro Thr Leu Leu Ala Thr Gln Val Ser Leu Phe
35 40 45
Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu Pro Val Val Ala
50 55 60
Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala
65 70 75 80
Glu Pro Gln Leu Val Met Ala Gly Leu Asn Ala Thr His Leu Leu Thr
85 90 95
Leu Tyr Thr Ser Cys Gly Gly Leu Arg Pro Gly Gly Ala His Leu Ala
100 105 110
Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ala Val Val Ser Ala Pro
115 120 125
Pro Pro Ser Ala Ala Pro Arg Arg Lys Gln Pro Ala His Glu Ala Pro
130 135 140
Pro Pro Pro Pro Ser Thr Glu Lys Pro Ser Pro Pro Pro Gln Gln Asp
145 150 155 160
Asn Val Thr Ala His Gly Lys Ala Ile Pro Thr His Ala Ala Thr Ser
165 170 175
Pro Leu Ala Pro Ala Ala Ser Met Ile His Met Ser Pro Pro Pro Ala
180 185 190
Cys Asn Pro Cys Ser Gly Ser Ala Ala Ser Ser Ala Glu Gly Pro Leu
195 200 205
Leu Ile Ala Ala Leu Leu Leu Val Ile Thr Ala Ile Ile Val Gly Thr
210 215 220
Leu Asp Asp Lys
225
<210> 28
<211> 2313
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
aggctaccag ccttctccat ccagagcctt gctccccaca ccacaccgag agccctcctc 60
cgccttgaaa accctagcga gcgagcgagc cagcgagagg tctcaccccc accaccccaa 120
cccatggagc gccgcctcca ccacctcgcg ctgctgctcg gcctcctcgc ctgggcggcg 180
gcggccgcca ccacgggagc cgaggcgcag ccggcggtgt gcgacccctc catcatcgcc 240
acccagatcg cgctcttctg catgccggac atgcccacgg cgccctgctg cgagcccatc 300
atcgcctccg tcgacctcgg cggcggcatc ccctgcctct gccgcgtcgc cgcccaaccg 360
cagctcgtcc tcgcccgcct caacgccacc cacctcctcg cgctctacgc ctcctgcgga 420
ggacagcaca ccgggggcgc ccacctcgcc gccgcctgcc aaggtacatc acgcgttcgc 480
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct ctctctctct 540
cgtgcgagtg tgagtgtgta tgtttggctg tgtgcgtgag gtgagggtgt gtgtttgctc 600
ggatccagtg gtggtttggc gagatcctag tgtactgtct gtgcttgccg atttggttct 660
tgactcttga gccttttgcg tgcgtttatg atggtatata tatttcggtg cgagttctcg 720
ccttccactg tggcgacgaa ccgtacgtac tgatcaagtt tgttcgaact taattttgct 780
tcatgtcgtc gtctctttcg agtcgcaaga ccgctactac tagtgggcat attttgggtg 840
agattacccg ttgctccgta cgcgcgcggc tcctggtctt tgtagacctt ttctctttgg 900
tttggatttc gttcgttttg ttctggattt cgaaaaaaag tttgttcgtc ttggttcccc 960
actctgggct taattttccc catggatcac ctgatgtttt gacccgtttc tgatgttttt 1020
tttttgctaa aaagtatttg tgcttatcaa gcaggtctgc gtttcttttt cgcctcttcc 1080
tttttgcgtt cttgtctgct tgttcctgtt gcgtgaaaag tttcctggcc tgaattttga 1140
acagagagag agcaactgcc ctctgggctt ctggcttttg cagcagcagg ccagctgcac 1200
aacctgcagc agcgctgcag cctttcagga tttcggcaaa gaccatccca ttcttttgcc 1260
cgtttgtttt cttggcccgc acgaaatagc gccacgtcgc atgcttttct acccgaaaga 1320
cgatactgcc cttgcactaa ttatctttcc gttgttttcc ttttgtggac gtgaaattat 1380
tgcatctctg gactaacgcc gttaaactct cgtgctgttt gcctgcaggt ccgtcacctc 1440
ccgccgccac cattcccgtg atcgccccgc cgccgcccgc cgcgccccgc cacaagcagc 1500
caacacgtac gaacccgctg tcacctcctc gatctgctct gtgctatttc tgctttaact 1560
tttcgcgtgt tctctgtttg atccgtgcgg gacgggacgg tgtcttatgt ttctgttgcg 1620
atgatgtttc gcaggcgagg cccctccccc gccgctgcgg ggcgagaagc cgtccccgtc 1680
gccccagcag cagcctggcg ccgccgccgc ccacggcaag gccatccccg ccagcccggc 1740
cgcctccttc tcccagctgg cgccggccgc cgcgcccacg acgcccacgc caccgcactc 1800
cggctccgac cccatcgtcg cctccgccgc gctcctcgtc ttcttcatcg ccgtcctcat 1860
catcctcgac tgagcccacg gtgccgcccc ggccggccgc caaccatccg ccggtgcctg 1920
gcttgagccc gtagcagcag cagaagtcgt agtgcaactc tcgttttcac gatttccctg 1980
tagtagtgtc atcatcagta gtagtagtag tgccacttgc attggtcgtc gtagttctgt 2040
tgcgtcttag tagtagcatc atcggcagta cttgatcggt ggatttggaa ggaggaggac 2100
gtgatggttg gtctagcagt agcccccgta tggtcatact ttcgttacta tggtggtttc 2160
ggatgaatat aatggtgatg gaattaatct tggatagttc gatctggaac ttaatttctg 2220
cttgctctca tgataaatgc agatggtaat ggaatgtgaa cttagataaa tgtggcttgt 2280
tattttgatc ttattgtttc tgatcaattt ctg 2313
<210> 29
<211> 657
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
atggagcgcc gcctccacca cctcgcgctg ctgctcggcc tcctcgcctg ggcggcggcg 60
gccgccacca cgggagccga ggcgcagccg gcggtgtgcg acccctccat catcgccacc 120
cagatcgcgc tcttctgcat gccggacatg cccacggcgc cctgctgcga gcccatcatc 180
gcctccgtcg acctcggcgg cggcatcccc tgcctctgcc gcgtcgccgc ccaaccgcag 240
ctcgtcctcg cccgcctcaa cgccacccac ctcctcgcgc tctacgcctc ctgcggagga 300
cagcacaccg ggggcgccca cctcgccgcc gcctgccaag gtccgtcacc tcccgccgcc 360
accattcccg tgatcgcccc gccgccgccc gccgcgcccc gccacaagca gccaacacgc 420
gaggcccctc ccccgccgct gcggggcgag aagccgtccc cgtcgcccca gcagcagcct 480
ggcgccgccg ccgcccacgg caaggccatc cccgccagcc cggccgcctc cttctcccag 540
ctggcgccgg ccgccgcgcc cacgacgccc acgccaccgc actccggctc cgaccccatc 600
gtcgcctccg ccgcgctcct cgtcttcttc atcgccgtcc tcatcatcct cgactga 657
<210> 30
<211> 218
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 30
Met Glu Arg Arg Leu His His Leu Ala Leu Leu Leu Gly Leu Leu Ala
1 5 10 15
Trp Ala Ala Ala Ala Ala Thr Thr Gly Ala Glu Ala Gln Pro Ala Val
20 25 30
Cys Asp Pro Ser Ile Ile Ala Thr Gln Ile Ala Leu Phe Cys Met Pro
35 40 45
Asp Met Pro Thr Ala Pro Cys Cys Glu Pro Ile Ile Ala Ser Val Asp
50 55 60
Leu Gly Gly Gly Ile Pro Cys Leu Cys Arg Val Ala Ala Gln Pro Gln
65 70 75 80
Leu Val Leu Ala Arg Leu Asn Ala Thr His Leu Leu Ala Leu Tyr Ala
85 90 95
Ser Cys Gly Gly Gln His Thr Gly Gly Ala His Leu Ala Ala Ala Cys
100 105 110
Gln Gly Pro Ser Pro Pro Ala Ala Thr Ile Pro Val Ile Ala Pro Pro
115 120 125
Pro Pro Ala Ala Pro Arg His Lys Gln Pro Thr Arg Glu Ala Pro Pro
130 135 140
Pro Pro Leu Arg Gly Glu Lys Pro Ser Pro Ser Pro Gln Gln Gln Pro
145 150 155 160
Gly Ala Ala Ala Ala His Gly Lys Ala Ile Pro Ala Ser Pro Ala Ala
165 170 175
Ser Phe Ser Gln Leu Ala Pro Ala Ala Ala Pro Thr Thr Pro Thr Pro
180 185 190
Pro His Ser Gly Ser Asp Pro Ile Val Ala Ser Ala Ala Leu Leu Val
195 200 205
Phe Phe Ile Ala Val Leu Ile Ile Leu Asp
210 215
<210> 31
<211> 2226
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
attcccttct ccatccacaa ctgtcctcca cacacaccca cacacgccac actgaggagc 60
cctgagccct ccgcccttaa accctagcga gcgagccagc gagaggtctc atccccacca 120
acaccaccca tggagctccg cctctaccac ctcgcgctgc tgctcggcct cgtcgcctgg 180
gcggcggctg ctgccacggg agccgaggcg cagccggtgt gcgacccctc catcatcgcc 240
acccagatcg cgctcttctg catgccggac atgcccacgg cgccctgctg cgagccgatc 300
atcgcctccg tcgacctcgg cggcggcgtc ccctgcctct gccgcgtcgc cgcccaaccg 360
cagctcgtcc tcgcccgcct caacgccacc cacctcctcg cgctctacgc ttcctgcgga 420
ggacaacaca ccgtgggcgc tcacctcgct gccgcctgcc aaggtacatc acggtcgcac 480
tctctctctc tctctctctc tctctgtgcg tgcgtgacct gtgcgcgtga gtgcggtgtg 540
tgcgcgaggg tgtgtgttcg ctcggatcga gtggtggtct gccgtgatcc tagtgtactg 600
ttctactgtg tcttcggatt tggtttttga gcttttggcg tgcgtttttg tgtcatggta 660
tttcgttgcg agttcccgtc ttccgctgtg gcgacgaacc cgtaccgtac gtcttgataa 720
agtttgttcg atttttcttc gcaagagcgc tactactggg tgggcatatt tggggcgaga 780
tcaccagtgg ctccatagtc catacgcgcg cgactcgtgt tttttagcct attctatttg 840
gcctgaattt tgaaaaagtt tgttcgttta attggttgcc ttctctgggc ttgttttgcc 900
ccattgatca cgtgacccgt ttctgatgtt tttgcttact gaaatataca tttgctttag 960
tattaagcga cgcacggacg ctgcgtttct ttttcactta ttcctttttg cgtcattgtc 1020
tgcttgttct ttgttgctcg aaagtttgct ggcctgaatt ctgaacatag agagtaactg 1080
ccctctgggc tctggcctct gcaggagcag gctgcaagcc ggttgcagaa cctgcagcag 1140
cgctgcagcc tttcaggatg ccggcaaaga ccagccccgt ttctcttgcc cgtttgtttt 1200
cttggcccgc acgaaatggc gccgcgtcgc atgcttttct acgcgagaga cgatactgcc 1260
cttgcactaa ttatcactct tgttgtttta tttttgaacg tgaaattatt gcatgtctgg 1320
gcggactata acgctgttaa aaacttaaaa tcacgtgcta ttgcctgcag gtccgtcacc 1380
tcccgccacc gttcctgtta tcgccccgcc gccgcccgcc gcgccccgcc tcaagcagcc 1440
aacacgtacg aagccgctgt cacctagtct gctctgtgct atttccgctt taacttttcg 1500
cgcgctctgt ttgattgatg cgagaattgg actaatccgt gctgtgcata attttctgtt 1560
gcgatgtttg gcaggcgagg cccctccccc tccgccacaa agcgagaagc cgtccccgtc 1620
gccccagcag cagcctggcg tcgccgccgc ccacggcaag gccatcccca ccagttcggc 1680
cgccaacttc tccacgctgg cgccggccgc cgcgcccacg actcccacgc caccacactc 1740
tggctccgac aacgggtgcg tcgtcgtctc ctccacgatt gtcatcttcg tcatcgccgt 1800
tatcaccatc ctcgaatgag cctcacggcg ccggcccggc cggccgccaa ccatcgccgg 1860
tgcctggata gagcccgtag cagcagcaga agtcgtagtg caactcgttt tcaagatccc 1920
cctttggcag tagtagtagt atcatcacca gtggtagcta gtgccactag gtcatcgtag 1980
ttctgttgca tctcagtata gtaacgtgat ggctggtctg gcgttttttc tgcttggtgt 2040
cgacccatag atcgatcact tgcctggacg aagtgagtcg atctaataag agaatggact 2100
gtggccgagg ggaacactgc tttttttggt tggttaatct tgtctccgta gttgaactat 2160
ggtttcggaa ttcggatgga tggtgatgga ataaatcttg gatggttcga tctggacctt 2220
attttt 2226
<210> 32
<211> 654
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
atggagctcc gcctctacca cctcgcgctg ctgctcggcc tcgtcgcctg ggcggcggct 60
gctgccacgg gagccgaggc gcagccggtg tgcgacccct ccatcatcgc cacccagatc 120
gcgctcttct gcatgccgga catgcccacg gcgccctgct gcgagccgat catcgcctcc 180
gtcgacctcg gcggcggcgt cccctgcctc tgccgcgtcg ccgcccaacc gcagctcgtc 240
ctcgcccgcc tcaacgccac ccacctcctc gcgctctacg cttcctgcgg aggacaacac 300
accgtgggcg ctcacctcgc tgccgcctgc caaggtccgt cacctcccgc caccgttcct 360
gttatcgccc cgccgccgcc cgccgcgccc cgcctcaagc agccaacacg cgaggcccct 420
ccccctccgc cacaaagcga gaagccgtcc ccgtcgcccc agcagcagcc tggcgtcgcc 480
gccgcccacg gcaaggccat ccccaccagt tcggccgcca acttctccac gctggcgccg 540
gccgccgcgc ccacgactcc cacgccacca cactctggct ccgacaacgg gtgcgtcgtc 600
gtctcctcca cgattgtcat cttcgtcatc gccgttatca ccatcctcga atga 654
<210> 33
<211> 217
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 33
Met Glu Leu Arg Leu Tyr His Leu Ala Leu Leu Leu Gly Leu Val Ala
1 5 10 15
Trp Ala Ala Ala Ala Ala Thr Gly Ala Glu Ala Gln Pro Val Cys Asp
20 25 30
Pro Ser Ile Ile Ala Thr Gln Ile Ala Leu Phe Cys Met Pro Asp Met
35 40 45
Pro Thr Ala Pro Cys Cys Glu Pro Ile Ile Ala Ser Val Asp Leu Gly
50 55 60
Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala Gln Pro Gln Leu Val
65 70 75 80
Leu Ala Arg Leu Asn Ala Thr His Leu Leu Ala Leu Tyr Ala Ser Cys
85 90 95
Gly Gly Gln His Thr Val Gly Ala His Leu Ala Ala Ala Cys Gln Gly
100 105 110
Pro Ser Pro Pro Ala Thr Val Pro Val Ile Ala Pro Pro Pro Pro Ala
115 120 125
Ala Pro Arg Leu Lys Gln Pro Thr Arg Glu Ala Pro Pro Pro Pro Pro
130 135 140
Gln Ser Glu Lys Pro Ser Pro Ser Pro Gln Gln Gln Pro Gly Val Ala
145 150 155 160
Ala Ala His Gly Lys Ala Ile Pro Thr Ser Ser Ala Ala Asn Phe Ser
165 170 175
Thr Leu Ala Pro Ala Ala Ala Pro Thr Thr Pro Thr Pro Pro His Ser
180 185 190
Gly Ser Asp Asn Gly Cys Val Val Val Ser Ser Thr Ile Val Ile Phe
195 200 205
Val Ile Ala Val Ile Thr Ile Leu Glu
210 215
<210> 34
<211> 2412
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ccttcatccc aacagagcgc cgagccctcc gccctcaaac cctagcaagc gagagatccc 60
acccaccatc catggagcgc cccctccgcc acctcgcgct gctgctcggc ctcctcgcct 120
gggcggcggc ggccgccacc ggggccgcgg cgcagcctgc gtgcgagccc tccaacctcg 180
ccacgcagat cacgctcttc tgcatgcccg acatgcccac ggcgccctgc tgcgagccgg 240
tcgtcgcctc cgtagacctc ggcggcggcg tcccctgcct ctgccgcgtc gccgcccagc 300
cgcagctcgt cctcgcccgc ctcaacgcct cccacctcct cgcgctctac accgcctgcg 360
ggggactgcg caccgggggc gcccacctcg ccgccgcctg ccaaggtacg tgacaccagc 420
gcccgcgcct ctcctctctc tagatctgcg tctgtgccgt ggccgtgcgc gagatgggtg 480
tgctaggtgc gagatgtgtg tgttctgcag ctttctggtt tggctcttga gcgagctgtt 540
cgtggttgcg ctcttgggta acggtgtttt gttgcgagtt cccgtcttcc tctgtggcga 600
cgaacccgta cgtcttgttc cagtacgttc gaacattttt ttttgcttcg ttttcttctc 660
tcctccgtat tttggctatg gttctcgcgt cacatgaatg ctactagttg ggcacatttc 720
gggatagatt tacccgtacg tcctgttctg gtttgttcga acacttttcc ttcgttttct 780
tttctcttcc gaattttggt tgtgttttcg ggacacgcga gcgctactac tagttgggca 840
aatttggggt cagatgtacc cgtggctccg tacgcgcgca cgtctcctga tttatttgtg 900
cgtttccttt tctcaagcga tttctctgtg ccttttcgtt ttggtttgga agcaaattct 960
ctgggtttca aggcgttggt tccgatctct gggcttttag ccatgcatct cctgatgatt 1020
tgacccgttt cagtggagtg gaatctgttc aactgcccaa gcgaggtcga aaggctgggt 1080
ttctttgccc aagcgaggtc gaaaggctgg gtttcttttt gctttttcac cgcttccttt 1140
ttttgttttt gtctccttgt ttccgttgcg tcgaaaggct tgctgcgttc cagccttctg 1200
aacagagaga gcaaccgccc tctgatcctc tgcagcggac agctgcacag cctgcacagc 1260
agcgctgcag cctttcaggc aagaccaagc ccgttcggca ccgtttctct ctcccgcttg 1320
gtttcttggc cctcacgaaa tggcgcctcg gcgcatgctt tttctgccca aaagacgata 1380
ctacccctgc aataaatatc ttctgttatt tttgccgttt taatctgtga attattacaa 1440
gcctggacta acggcgttaa cctctcgtgt ttcgtgcctg caggtccgtc accccctgcc 1500
accgtccccg tcatcgcccc gccgccgccc gccgcccctc gccacaggct gccagcacgt 1560
acgaacccgc ccgcacccgc tctgctcctg ctactttccg ctttaacttt tcgcgtgctc 1620
tgtttgatcg atgcgagagt tgaactaatg catgtgctgg tttctgtttc tcttgtgctg 1680
ttgcgcaggc ggcgaggccc ctccccctcc ggcgacgagc gagaagccgt ccccaccacc 1740
ccagcagcag cctggcgccg ccgccgccca cggcaaggcc atccccgcca gcccggccgc 1800
ctcctcgccg ctggcgccgg cagccgcgcc cacgacgccc acgccgccaa cctccggctc 1860
cgacggcagg tgcagctgca ccccggtcat cctcttcctc ctcaccgcca tcatcgtcct 1920
ctactgatga gcccgcggcg ccgccccggc cggccgccaa ccatcgccgg tgcctgactt 1980
gagctcgtag cggcagcagc agtagtacta ttatccttct cggtttggct ccagcagtag 2040
tatagcagta tcatcatcag cagtagtagt agtccactca tcgtagttct gttgttgcat 2100
cctatcttag tagtatcatt cgtacttgat cggtggaatc gcctgaaggg cgggtgatgg 2160
ttggtctagc agtagtagtt gtacccgtat gatgatacct gcagtatgtt cgttcgtctt 2220
cctcctcggt cgccttgttt ctactgggcg ttcaccgtgt gtcttggatc gatcacttgc 2280
ctgggtgaag tgactcgaac aagcgaatca aatgtggccg aggaggagaa cactgcgttt 2340
ttttggttaa tcttgtctct acagttgaac tatatatgct ttatgctttt ggtctgatga 2400
ttagtgatga aa 2412
<210> 35
<211> 648
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
atggagcgcc ccctccgcca cctcgcgctg ctgctcggcc tcctcgcctg ggcggcggcg 60
gccgccaccg gggccgcggc gcagcctgcg tgcgagccct ccaacctcgc cacgcagatc 120
acgctcttct gcatgcccga catgcccacg gcgccctgct gcgagccggt cgtcgcctcc 180
gtagacctcg gcggcggcgt cccctgcctc tgccgcgtcg ccgcccagcc gcagctcgtc 240
ctcgcccgcc tcaacgcctc ccacctcctc gcgctctaca ccgcctgcgg gggactgcgc 300
accgggggcg cccacctcgc cgccgcctgc caaggtccgt caccccctgc caccgtcccc 360
gtcatcgccc cgccgccgcc cgccgcccct cgccacaggc tgccagcacg cggcgaggcc 420
cctccccctc cggcgacgag cgagaagccg tccccaccac cccagcagca gcctggcgcc 480
gccgccgccc acggcaaggc catccccgcc agcccggccg cctcctcgcc gctggcgccg 540
gcagccgcgc ccacgacgcc cacgccgcca acctccggct ccgacggcag gtgcagctgc 600
accccggtca tcctcttcct cctcaccgcc atcatcgtcc tctactga 648
<210> 36
<211> 215
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 36
Met Glu Arg Pro Leu Arg His Leu Ala Leu Leu Leu Gly Leu Leu Ala
1 5 10 15
Trp Ala Ala Ala Ala Ala Thr Gly Ala Ala Ala Gln Pro Ala Cys Glu
20 25 30
Pro Ser Asn Leu Ala Thr Gln Ile Thr Leu Phe Cys Met Pro Asp Met
35 40 45
Pro Thr Ala Pro Cys Cys Glu Pro Val Val Ala Ser Val Asp Leu Gly
50 55 60
Gly Gly Val Pro Cys Leu Cys Arg Val Ala Ala Gln Pro Gln Leu Val
65 70 75 80
Leu Ala Arg Leu Asn Ala Ser His Leu Leu Ala Leu Tyr Thr Ala Cys
85 90 95
Gly Gly Leu Arg Thr Gly Gly Ala His Leu Ala Ala Ala Cys Gln Gly
100 105 110
Pro Ser Pro Pro Ala Thr Val Pro Val Ile Ala Pro Pro Pro Pro Ala
115 120 125
Ala Pro Arg His Arg Leu Pro Ala Arg Gly Glu Ala Pro Pro Pro Pro
130 135 140
Ala Thr Ser Glu Lys Pro Ser Pro Pro Pro Gln Gln Gln Pro Gly Ala
145 150 155 160
Ala Ala Ala His Gly Lys Ala Ile Pro Ala Ser Pro Ala Ala Ser Ser
165 170 175
Pro Leu Ala Pro Ala Ala Ala Pro Thr Thr Pro Thr Pro Pro Thr Ser
180 185 190
Gly Ser Asp Gly Arg Cys Ser Cys Thr Pro Val Ile Leu Phe Leu Leu
195 200 205
Thr Ala Ile Ile Val Leu Tyr
210 215
<210> 37
<211> 2122
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
atggctctcc tcctcgccac cgcccttgcg cccctcgccg tagacgctcc ccgcgccccc 60
tccgcagtag gagctccgct ctccgggacc gccgtcgcct ccccaccccc gccgctccct 120
gccgctgcag cgtgggggct cgcgctcgag cccagctgcc cggcatcgtt cgtcgcagcg 180
catgtgcttc tctcctgcga tcccttgctt ccgacggcag gctgctgcaa cgcactgctg 240
ggatccgtcc cgcgggacga cgcgctgccc tgcctgtgcg cggcggcgca cgaccccgac 300
ctccagcgcg caggctacat ggagggggac tgctgcagct gtacggcgac tgcggcggcc 360
agctcccgcg gccgacgacc tgcacgccct ctgtgagtcc catcccgcgg ccgacgacct 420
gttcgaatgg tcgaattcag tcaggcgtgc agattattaa ttcaccgagg gtcgcgtgtt 480
tgattgtaat tgatggttct tcaattggcc accgttctgt accgatgcat attgttagtt 540
cctcgatgag ccccgcgtgt ttgatcgtaa ttgatgcttg tgtagttgtg ttgttcatct 600
gaagcacatt tcacagtagt ttctgaatgc ccagacgtac tctgctaatt tattggtata 660
ttgcagcaaa ggctgtttcg gtagatagat tccgacgacg ggggttgaat taatgcctct 720
gttctggcca cacgcccgtt tgcaattgcg atgccacaca tcccatccaa acaggagcgc 780
aaggatggga tgtcatgcct gtcccttgtt tgtgatgtgc atgcagattt ctgaatttgc 840
aatagtgcac aagttctgct tccaggatac acttgtaaca acattagtac aaccacatta 900
tcgtagatgg ctaattgaga tgttgtttat ctttcaaaat gatgtttgca ggccaggaag 960
cacacattac ccagaccacc atcccccaag ctggctccgc atctcatcga cgcatccaga 1020
aagaagttgc tggtactttg ttcaacgcac tgcctttatt gcgatttgat ttcagagttt 1080
cacatgaacg aaaaaacgtt acttaccata tgaaatatta ggatcctgtg atgcgagcaa 1140
gctcgcgtgg gatgtcgctg taaactgtgt caattctttg gacggtgagg aagtcaaggt 1200
gacgccgtcg tgctgtactc cattcctagc cgctgcagag agccgcaggt gcttctgcag 1260
cttcctgcag gaacttaagg tcgaactttc cccgatctcg aggaaggacg cacacctcct 1320
tcacaggagg tgtggaggac tccaccctct gcccaggtgc ttctcacata gagacggtat 1380
gtaagcatca aactccttta tttgcagctc tgctcgcact gtcttcaact taggttccca 1440
gcagccttga attcagaata taaccatgtg atacactgtt gaattcagaa cccgaggggt 1500
aggatgatgg agcctttgtg ctgccctttg ctgctggttc ccccccgcct ccagcgccat 1560
tgtccccttc gccgcctgct cctgctctga agaatgagct gccggcgtat gtgcagatcg 1620
tttggtcggt tctgcggtgg gttctgtctc atggcccact tgaggctgtt gttttcgtgt 1680
cttccgcggc ggtggctgat gctctcgtgt gggtccggaa gcgccgcaaa gacagtaatg 1740
acacttctgc aatagttgtt tatgatgtac aatttatgtt gtttatgatg ctaacgacct 1800
taactttcca gggcgtgctc ggcggcgcgc agcgggcacc gtcggggaca aggtagctga 1860
cctcggcttg caagccgcag agataggatt ggaggccgta gccaagaagc tggagcagaa 1920
ggagcaggac agcagcagta gtccacctca gtcagctgga acaagaagcc gtgggacgtc 1980
catggactca tcgccgtcct cggaggagga tcacaaggag gagctgcagg aggaggagga 2040
gaagacctcc aaaccacagg cgtgccgcca tatccatcat cgccgtcgcc gccgaagctc 2100
cgctcgatct cgagctctct ga 2122
<210> 38
<211> 987
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
atggctctcc tcctcgccac cgcccttgcg cccctcgccg tagacgctcc ccgcgccccc 60
tccgcagtag gagctccgct ctccgggacc gccgtcgcct ccccaccccc gccgctccct 120
gccgctgcag cgtgggggct cgcgctcgag cccagctgcc cggcatcgtt cgtcgcagcg 180
catgtgcttc tctcctgcga tcccttgctt ccgacggcag gctgctgcaa cgcactgctg 240
ggatccgtcc cgcgggacga cgcgctgccc tgcctgtgcg cggcggcgca cgaccccgac 300
ctccagcgcg caggctacat ggagggggac tgctgcagct gccaggaagc acacattacc 360
cagaccacca tcccccaagc tggctccgca tctcatcgac gcatccagaa agaagttgct 420
ggatcctgtg atgcgagcaa gctcgcgtgg gatgtcgctg taaactgtgt caattctttg 480
gacggtgagg aagtcaaggt gacgccgtcg tgctgtactc cattcctagc cgctgcagag 540
agccgcaggt gcttctgcag cttcctgcag gaacttaagg tcgaactttc cccgatctcg 600
aggaaggacg cacacctcct tcacaggagg tgtggaggac tccaccctct gcccaggtgc 660
ttctcacata gagacgggcg tgctcggcgg cgcgcagcgg gcaccgtcgg ggacaaggta 720
gctgacctcg gcttgcaagc cgcagagata ggattggagg ccgtagccaa gaagctggag 780
cagaaggagc aggacagcag cagtagtcca cctcagtcag ctggaacaag aagccgtggg 840
acgtccatgg actcatcgcc gtcctcggag gaggatcaca aggaggagct gcaggaggag 900
gaggagaaga cctccaaacc acaggcgtgc cgccatatcc atcatcgccg tcgccgccga 960
agctccgctc gatctcgagc tctctga 987
<210> 39
<211> 328
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 39
Met Ala Leu Leu Leu Ala Thr Ala Leu Ala Pro Leu Ala Val Asp Ala
1 5 10 15
Pro Arg Ala Pro Ser Ala Val Gly Ala Pro Leu Ser Gly Thr Ala Val
20 25 30
Ala Ser Pro Pro Pro Pro Leu Pro Ala Ala Ala Ala Trp Gly Leu Ala
35 40 45
Leu Glu Pro Ser Cys Pro Ala Ser Phe Val Ala Ala His Val Leu Leu
50 55 60
Ser Cys Asp Pro Leu Leu Pro Thr Ala Gly Cys Cys Asn Ala Leu Leu
65 70 75 80
Gly Ser Val Pro Arg Asp Asp Ala Leu Pro Cys Leu Cys Ala Ala Ala
85 90 95
His Asp Pro Asp Leu Gln Arg Ala Gly Tyr Met Glu Gly Asp Cys Cys
100 105 110
Ser Cys Gln Glu Ala His Ile Thr Gln Thr Thr Ile Pro Gln Ala Gly
115 120 125
Ser Ala Ser His Arg Arg Ile Gln Lys Glu Val Ala Gly Ser Cys Asp
130 135 140
Ala Ser Lys Leu Ala Trp Asp Val Ala Val Asn Cys Val Asn Ser Leu
145 150 155 160
Asp Gly Glu Glu Val Lys Val Thr Pro Ser Cys Cys Thr Pro Phe Leu
165 170 175
Ala Ala Ala Glu Ser Arg Arg Cys Phe Cys Ser Phe Leu Gln Glu Leu
180 185 190
Lys Val Glu Leu Ser Pro Ile Ser Arg Lys Asp Ala His Leu Leu His
195 200 205
Arg Arg Cys Gly Gly Leu His Pro Leu Pro Arg Cys Phe Ser His Arg
210 215 220
Asp Gly Arg Ala Arg Arg Arg Ala Ala Gly Thr Val Gly Asp Lys Val
225 230 235 240
Ala Asp Leu Gly Leu Gln Ala Ala Glu Ile Gly Leu Glu Ala Val Ala
245 250 255
Lys Lys Leu Glu Gln Lys Glu Gln Asp Ser Ser Ser Ser Pro Pro Gln
260 265 270
Ser Ala Gly Thr Arg Ser Arg Gly Thr Ser Met Asp Ser Ser Pro Ser
275 280 285
Ser Glu Glu Asp His Lys Glu Glu Leu Gln Glu Glu Glu Glu Lys Thr
290 295 300
Ser Lys Pro Gln Ala Cys Arg His Ile His His Arg Arg Arg Arg Arg
305 310 315 320
Ser Ser Ala Arg Ser Arg Ala Leu
325
<210> 40
<211> 2415
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggtgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtacgtaca tgcataacct cctccacctc ctcctcctct ctctctctct ctctctctcg 420
gttggggttg ctgccttgcg tttttggttg gtttttcctg ggttgggcga gatccttcga 480
gttgcttgtg ttttgtggta tgctaagctt cgaacgagtt gccggcgttg ctgtgtcgac 540
caactctcgt atgcttatct ttcagcacat gagttttggc ctcgttttta ctcggttgtt 600
gtatgctact tctgagattt gagttcatcc actgctaaac tgacatcata gatgaagaat 660
agcagcggcg tttggtcgat tttgattcct ttctctggat gttcgagctg atcttgtggt 720
tattgctcga agcctcgaaa cgcttgcgca catgcaagat ccagcagcgt atagatctat 780
agtggtgttg tgcttttatt cggatttgtg gttcagtgtt tacgtgcgaa gtcacgcgtt 840
cgatgtttcc gcttgagctc catatctata gcacaaatca atcatgtgcg ttgcgcgagt 900
tcaagctcga gagaaaagaa aagcatcaag gccacggggg gtttttgggc caggtcgtga 960
ttctcccttg aattccgaat ataccgagtt tattatcttt tgagcggatt tggtgttgaa 1020
ctggcaggac tcaaaaccca cccgtgggac gatcgttttc ttttcctttc gctttgtgtt 1080
ctctgtctcc tttccgtgaa atctctgcgt ttcccttctg gtgcttgtta tagatgattc 1140
tggatcgagc cgtgtatgct cgtgcagtgg tacgacttgg cgatgaacgt gcttgcggag 1200
ctagtcgcag ttcatctttc tttttttttt ccctcgtttc ttttctcggc gtttcattct 1260
ctacacctct tctactcgcc atgcatgttc atctctctcc gtgttggtcc tcatttggag 1320
ccgattcgaa ccgagcagca cagtgctttt tttctgtttc gttttggagg tttccacttt 1380
cgtgaaaagg aaagggtcaa atcgaatcgc cccctgaacc atcctttgca gagctttttt 1440
ggacgtttcc gcctttcgtc agagaacatc tgcactgcgc gtttctcccc aactcgatcg 1500
attttgcagc ttttaatcac tttttagaaa aagtttttaa tcactcgtca tcgatgtgat 1560
ctcttgctct aattgcatct tctccgtggg attagcactt ccatgcttct tgttttgtct 1620
gttcaattag ccaagaaacg agtcagtata ccttcaagat gcatgcagat ttaaaatcgg 1680
cactgctctt tatcttgttc ttgtttttgc aagttttggt tggttcaaaa cttatctctt 1740
ctgcagcatt gcctgctgtg tacagaaagt tggcaggggc atcgtgcagc ttttttgcct 1800
gctgtgtgta acgttttctt tccgtacgtt gcgttccgtt tcacgtcgct tacctctgtt 1860
tcttggggcg caagttatgg cagtacagcc gttgtttcca cgttggaagg acggttttgc 1920
ccttcgcttc cagaagcttc tagagatttt tcgagttttt ctaatgtgtt tgttattgct 1980
gtaactcgtt ctaacgtgca ggtcccgccc caccggcctc catcgtcact gccccgccgc 2040
ccccggttgc ttttcgccgc aagccgccgg cacgtaaggc tgattgattc cccttcatcc 2100
actgattgtt aatgcgcgtg taatctttgt gattactaac ttgctgctgg atgctttgca 2160
ggcgaggcac ctcccccacc gccggcggcc gagaagctct ccccgccgcc tcagcagcac 2220
gacgactccg accacaacaa gcgcgtcggc ccactcccga gaggctctcc tcccccgtat 2280
gcccagtccg tcccggtcgg ccccgccgcc gctcccccgc caccacgctc cggcgcctcc 2340
tcgtcgctcc aggcgcccct cgccgccacc accaccatcg ttgccatcac cctcatcgcc 2400
gccgcccagt actga 2415
<210> 41
<211> 687
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggtgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtcccgccc caccggcctc catcgtcact gccccgccgc ccccggttgc ttttcgccgc 420
aagccgccgg cacgcgaggc acctccccca ccgccggcgg ccgagaagct ctccccgccg 480
cctcagcagc acgacgactc cgaccacaac aagcgcgtcg gcccactccc gagaggctct 540
cctcccccgt atgcccagtc cgtcccggtc ggccccgccg ccgctccccc gccaccacgc 600
tccggcgcct cctcgtcgct ccaggcgccc ctcgccgcca ccaccaccat cgttgccatc 660
accctcatcg ccgccgccca gtactga 687
<210> 42
<211> 228
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 42
Met Glu Arg Ser His Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala
1 5 10 15
Ala Gly Val Pro Ala Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln
20 25 30
Val Ala Thr Ala Glu Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln
35 40 45
Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu
50 55 60
Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys
65 70 75 80
Arg Val Ala Ala Glu Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr
85 90 95
His Leu Leu Thr Leu Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly
100 105 110
Ala Arg Leu Ala Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ser Ile
115 120 125
Val Thr Ala Pro Pro Pro Pro Val Ala Phe Arg Arg Lys Pro Pro Ala
130 135 140
Arg Glu Ala Pro Pro Pro Pro Pro Ala Ala Glu Lys Leu Ser Pro Pro
145 150 155 160
Pro Gln Gln His Asp Asp Ser Asp His Asn Lys Arg Val Gly Pro Leu
165 170 175
Pro Arg Gly Ser Pro Pro Pro Tyr Ala Gln Ser Val Pro Val Gly Pro
180 185 190
Ala Ala Ala Pro Pro Pro Pro Arg Ser Gly Ala Ser Ser Ser Leu Gln
195 200 205
Ala Pro Leu Ala Ala Thr Thr Thr Ile Val Ala Ile Thr Leu Ile Ala
210 215 220
Ala Ala Gln Tyr
225
<210> 43
<211> 2412
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggtgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtacgtaca tgcataacct cctccacctc ctcctcctct ctctctctct ctctctcggt 420
tggggttgct gccttgcgtt tttggttggt ttttcctggg ttgggcgaga tccttcgagt 480
tgcttgtgtt ttgtggtatg ctaagcttcg aacgagttgc cggcgttgct gtgtcgacca 540
actctcgtat gcttatcttt cagcacatga gttttggcct cgtttttact cggttgttgt 600
atgctacttc tgagatttga gttcatccac tgctaaactg acatcataga tgaagaatag 660
cagcggcgtt tggtcgattt tgattccttt ctctggatgt tcgagctgat cttgtggtta 720
ttgctcgaag cctcgaaacg cttgcgcaca tgcaagatcc agcagcgtat agatctatag 780
tggtgttgtg cttttattcg gatttgtggt tcagtgttta cgtgcgaagt cacgcgttcg 840
atgtttccgc ttgagctcca tatctatagc acaaatcaat catgtgcgtt gcgcgagttc 900
aagctcgaga gaaaagaaaa gcatcaaggc cacggggggt ttttgggcca ggtcgtgatt 960
ctcccttgaa ttccgaatat accgagttta ttatcttttg agcggatttg gtgttgaact 1020
ggcaggactc aaaacccacc cgtgggacga tcgttttctt ttcctttcgc tttgtgttct 1080
ctgtctcctt tccgtgaaat ctctgcgttt cccttctggt gcttgttata gatgattctg 1140
gatcgagccg tgtatgctcg tgcagtggta cgacttggcg atgaacgtgc ttgcggagct 1200
agtcgcagtt catctttctt tttttttccc tcgtttcttt tctcggcgtt tcattctcta 1260
cacctcttct actcgccatg catgttcatc tctctccgtg ttggtcctca tttggagccg 1320
attcgaaccg agcagcacag tgcttttttt ctgtttcgtt ttggaggttt ccactttcgt 1380
gaaaaggaaa gggtcaaatc gaatcgcccc ctgaaccatc ctttgcagag cttttttgga 1440
cgtttccgcc tttcgtcaga gaacatctgc actgcgcgtt tctccccaac tcgatcgatt 1500
ttgcagcttt taatcacttt ttagaaaaag tttttaatca ctcgtcatcg atgtgatctc 1560
ttgctctaat tgcatcttct ccgtgggatt agcacttcca tgcttcttgt tttgtctgtt 1620
caattagcca agaaacgagt cagtatacct tcaagatgca tgcagattta aaatcggcac 1680
tgctctttat cttgttcttg tttttgcaag ttttggttgg ttcaaaactt atctcttctg 1740
cagcattgcc tgctgtgtac agaaagttgg caggggcatc gtgcagcttt tttgcctgct 1800
gtgtgtaacg ttttctttcc gtacgttgcg ttccgtttca cgtcgcttac ctctgtttct 1860
tggggcgcaa gttatggcag tacagccgtt gtttccacgt tggaaggacg gttttgccct 1920
tcgcttccag aagcttctag agatttttcg agtttttcta atgtgtttgt tattgctgta 1980
actcgttcta acgtgcaggt cccgccccac cggcctccat cgtcactgcc ccgccgcccc 2040
cggttgcttt tcgccgcaag ccgccggcac gtaaggctga ttgattcccc ttcatccact 2100
gattgttaat gcgcgtgtaa tctttgtgat tactaacttg ctgctggatg ctttgcaggc 2160
gaggcacctc ccccaccgcc ggcggccgag aagctctccc cgccgcctca gcagcacgac 2220
gactccgacc acaacaagcg cgtcggccca ctcccgagag gctctcctcc cccgtatgcc 2280
cagtccgtcc cggtcggccc cgccgccgct cccccgccac cacgctccgg cgcctcctcg 2340
tcgctccagg cgcccctcgc cgccaccacc accatcgttg ccatcaccct catcgccgcc 2400
gcccagtact ga 2412
<210> 44
<211> 687
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggtgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtcccgccc caccggcctc catcgtcact gccccgccgc ccccggttgc ttttcgccgc 420
aagccgccgg cacgcgaggc acctccccca ccgccggcgg ccgagaagct ctccccgccg 480
cctcagcagc acgacgactc cgaccacaac aagcgcgtcg gcccactccc gagaggctct 540
cctcccccgt atgcccagtc cgtcccggtc ggccccgccg ccgctccccc gccaccacgc 600
tccggcgcct cctcgtcgct ccaggcgccc ctcgccgcca ccaccaccat cgttgccatc 660
accctcatcg ccgccgccca gtactga 687
<210> 45
<211> 228
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 45
Met Glu Arg Ser His Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala
1 5 10 15
Ala Gly Val Pro Ala Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln
20 25 30
Val Ala Thr Ala Glu Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln
35 40 45
Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu
50 55 60
Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys
65 70 75 80
Arg Val Ala Ala Glu Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr
85 90 95
His Leu Leu Thr Leu Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly
100 105 110
Ala Arg Leu Ala Ala Ala Cys Glu Gly Pro Ala Pro Pro Ala Ser Ile
115 120 125
Val Thr Ala Pro Pro Pro Pro Val Ala Phe Arg Arg Lys Pro Pro Ala
130 135 140
Arg Glu Ala Pro Pro Pro Pro Pro Ala Ala Glu Lys Leu Ser Pro Pro
145 150 155 160
Pro Gln Gln His Asp Asp Ser Asp His Asn Lys Arg Val Gly Pro Leu
165 170 175
Pro Arg Gly Ser Pro Pro Pro Tyr Ala Gln Ser Val Pro Val Gly Pro
180 185 190
Ala Ala Ala Pro Pro Pro Pro Arg Ser Gly Ala Ser Ser Ser Leu Gln
195 200 205
Ala Pro Leu Ala Ala Thr Thr Thr Ile Val Ala Ile Thr Leu Ile Ala
210 215 220
Ala Ala Gln Tyr
225
<210> 46
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ggtcgatttt gattcctttc tctggatgt 29
<210> 47
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
acgatggact ccagtctagc tgatcttgtg gttattgctc gaag 44
<210> 48
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ccagcaacgt atagatctat agtggtgt 28
<210> 49
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
acgatggact ccagag 16
<210> 50
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
acgatggact ccagagcggc cgcvnnngga a 31
<210> 51
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
acgatggact ccagagcggc cgcvvnvnnn ccaa 34
<210> 52
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tgcgaggtcg gctgcta 17
<210> 53
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
agatcagatg ccccaaattc ata 23
<210> 54
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
catggctgtg gcccctttgc tc 22
<210> 55
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gtttctttcc tatgcctttt cc 22
<210> 56
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gagggaaaag gcataggaaa 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aggtatgcaa atcaacaagc 20
<210> 58
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
atactatggc ttttgggatg a 21
<210> 59
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
aatagtggat gaagtcgttg c 21
<210> 60
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
ggcagcaaca actgaccttt tc 22
<210> 61
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
acaagaaagc aacatctcaa gtca 24
<210> 62
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
aatctttggc agagcatg 18
<210> 63
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ggagtttaag ggttggttc 19
<210> 64
<211> 772
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gtcttcccct tctctagagc cttcctctca cagagcacac acaaaaccct agagtaggaa 60
gcgagcgaga gagagagaga gagagagaga gaccacaccc atggagcgct cccacctcgc 120
cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg gccgcagcgg cggccaccgc 180
cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc gagccctcca tcctcgccac 240
ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg cagtgctgcg agccggtggt 300
ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc cgcgtcgccg ccgagccgca 360
gctcatcatc tccggcctca acgccaccca cctcctcacg ctgtacgccg cctgcggagg 420
cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa ggtacgtaca tgcataacct 480
cctcctcctc ctcctcctct ctctctctct ctctctctct ctctctctct ctctctctct 540
ctctctctct ctctctctct ctctctctcg gttggggttg ctgccttgcg tttttggttg 600
gtttttcgtg ggttgggcga gatccttcga gttgcttgtg ttttgtggta tgctaggctt 660
cgaacgagtt gccggcgttg ctgtgtcgac caactctcgt atgcttatct ttcagcacat 720
gagttttggc ctcgttttta ctcggttgtt gtatgctact tctgagattt ga 772
<210> 65
<211> 672
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
atggagcgct cccacctcgc cgtcctgctc ggcctcctcg ccttcgccgc cggggtcccg 60
gccgcagcgg cggccaccgc cgtggaggga gcgcaggcgg ccacggcgga ggcgtcgtgc 120
gagccctcca tcctcgccac ccaggtctcg ctcttctgcg cgcccgacat gcccaccgcg 180
cagtgctgcg agccggtggt ggcctccgtc gacctcggcg gcggcgtacc ctgcctctgc 240
cgcgtcgccg ccgagccgca gctcatcatc tccggcctca acgccaccca cctcctcacg 300
ctgtacgccg cctgcggagg cctccgccct ggaggcgctc gcctcgccgc cgcctgtgaa 360
ggtacgtaca tgcataacct cctcctcctc ctcctcctct ctctctctct ctctctctct 420
ctctctctct ctctctctct ctctctctct ctctctctct ctctctctcg gttggggttg 480
ctgccttgcg tttttggttg gtttttcgtg ggttgggcga gatccttcga gttgcttgtg 540
ttttgtggta tgctaggctt cgaacgagtt gccggcgttg ctgtgtcgac caactctcgt 600
atgcttatct ttcagcacat gagttttggc ctcgttttta ctcggttgtt gtatgctact 660
tctgagattt ga 672
<210> 66
<211> 223
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 66
Met Glu Arg Ser His Leu Ala Val Leu Leu Gly Leu Leu Ala Phe Ala
1 5 10 15
Ala Gly Val Pro Ala Ala Ala Ala Ala Thr Ala Val Glu Gly Ala Gln
20 25 30
Ala Ala Thr Ala Glu Ala Ser Cys Glu Pro Ser Ile Leu Ala Thr Gln
35 40 45
Val Ser Leu Phe Cys Ala Pro Asp Met Pro Thr Ala Gln Cys Cys Glu
50 55 60
Pro Val Val Ala Ser Val Asp Leu Gly Gly Gly Val Pro Cys Leu Cys
65 70 75 80
Arg Val Ala Ala Glu Pro Gln Leu Ile Ile Ser Gly Leu Asn Ala Thr
85 90 95
His Leu Leu Thr Leu Tyr Ala Ala Cys Gly Gly Leu Arg Pro Gly Gly
100 105 110
Ala Arg Leu Ala Ala Ala Cys Glu Gly Thr Tyr Met His Asn Leu Leu
115 120 125
Leu Leu Leu Leu Leu Ser Leu Ser Leu Ser Leu Ser Leu Ser Leu Ser
130 135 140
Leu Ser Leu Ser Leu Ser Leu Ser Leu Ser Leu Ser Arg Leu Gly Leu
145 150 155 160
Leu Pro Cys Val Phe Gly Trp Phe Phe Val Gly Trp Ala Arg Ser Phe
165 170 175
Glu Leu Leu Val Phe Cys Gly Met Leu Gly Phe Glu Arg Val Ala Gly
180 185 190
Val Ala Val Ser Thr Asn Ser Arg Met Leu Ile Phe Gln His Met Ser
195 200 205
Phe Gly Leu Val Phe Thr Arg Leu Leu Tyr Ala Thr Ser Glu Ile
210 215 220

Claims (21)

1.一种DNA片段,具有调控植物雄性育性的功能,其特征在于,所述DNA片段的序列为以下任一:
1)具有SEQ ID NO:1或2所示的核苷酸序列;
2)具有SEQ ID NO:4或2所示的核苷酸序列;
3)具有SEQ ID NO:22或23所示的核苷酸序列;
4)具有SEQ ID NO:25或26所示的核苷酸序列;
5)具有SEQ ID NO:28或29所示的核苷酸序列;
6)具有SEQ ID NO:31或32所示的核苷酸序列;
7)具有SEQ ID NO:34或35所示的核苷酸序列;
8)具有SEQ ID NO:37或38所示的核苷酸序列;
9)具有SEQ ID NO:40或41所示的核苷酸序列;
10)具有SEQ ID NO:43或44所示的核苷酸序列;
11)在严格条件下能够与(1)-(10)之任一序列的DNA杂交的DNA片段;或
12)与(1)-(11)之任一所述序列互补的DNA片段;或
13)在(1)-(11)之任一所述序列的基础之上,经过一至数个碱基替换和/或一至数个碱基的插入和/或缺失以及大片段的核苷酸序列插入/缺失/易位/倒位所形成能够影响植物花粉生育能力的DNA片段;或
14)与(1)-(11)之任一所述序列的DNA片段具有85%、90%、92%、95%、96%、97%、98%、99%以上的同一性且编码水稻雄性育性相关蛋白的DNA片段。
2.权利要求1所述DNA片段编码的蛋白,其特征在于,为如下1)或2)所述的蛋白:
1)SEQ ID NO:3、24、27、30、33、36、39、42或45所示的氨基酸序列组成的蛋白;
2)将SEQ ID NO:3、24、27、30、33、36、39、42或45经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有调控植物雄性育性活性的蛋白。
3.一种生物材料,其特征在于,该生物材料含有权利要求1所述的DNA序列,所述生物材料为表达盒,表达载体、工程菌、或转基因细胞系,所述转基因细胞系不能繁殖为植物。
4.一种突变体材料,所述突变材料是由核苷酸序列的突变所造成,含有该突变后核苷酸序列的植株表现为雄性不育,其特征在于,所述核苷酸序列如SEQ ID NO:1、2、4、22、23、25、26、28、29、31、32、34、35、37、38、40、41、43或44任一所示,所述的突变为点突变、DNA缺失、插入或取代突变、反义基因的转入、共抑制或发夹结构的引入或通过基因沉默手段产生的突变。
5.如权利要求4所述的突变体材料,其特征在于,所述的突变体材料为采用CRISPR-Cas9方法,根据所述核苷酸序列如SEQ ID NO:1、2、4、22、23、25、26、28、29、31、32、34、35、37、38、40、41、43或44的CDS序列选择靶标序列;靶标序列的反向互补链具有5’-(N)X-NGG-3’结构,所述N表示A,T,C和G中的任意一个,所述X为19或20;所述靶标序列包括靶位点1:GCCTCCTCGCCTTCGCCGC和/或靶位点2:CGCTGTACGCCGCCTGCGG,造成靶位点或靶位点及相邻核苷酸序列突变后得到的植物。
6.如权利要求5所述的突变体材料,所述的突变体材料为水稻突变体材料,其特征在于,在所述的靶位点1和靶位点2或靶位点及相邻区域内具有以下1)和/或2)中的1种或多种突变:
1)在靶位点1或靶位点1及相邻序列内发生了G碱基缺失突变,或G、T碱基插入突变,或从TCGCCTTCGCCGCCG到ACGGC或从G到C序列替换突变;
2)在靶位点2或靶位点2及相邻序列内发生了G、T或A碱基插入突变,或从GA到G或从GCCGCCTGCGGAGGCCTCCGCCCTGGAGG到CTT序列替换突变。
7.如权利要求4所述的突变体材料,其特征在于,其为水稻突变体材料gms3,其在水稻基因组版本ASM465v1第3染色体上的第26091933位碱基到第29959677位碱基的序列发生倒位,造成位于第29958173位碱基到第29960719位碱基的BGIOSGA010102基因发生撕裂,导致BGIOSGA010102基因的转录框改变。
8.如权利要求7所述的突变体材料,其特征在于,其含有一个3867745个碱基序列的倒位片段,该倒位造成两端的核苷酸序列发生重组,其中一端的重组位于权利要求1所述DNA片段内部,该处重组片段为水稻雄性不育基因,所述重组后的水稻雄性不育基因的基因组核苷酸序列如SEQ ID NO:64所示,CDS序列如SEQ ID NO:65所示,氨基酸序列如SEQ ID NO:66所示;所述的两端重组位点的侧翼核苷酸序列如SEQ ID NO:5和SEQ ID NO:6所示。
9.一种适用于CRISPR/Cas9系统对植物GMS3基因进行定向敲除的靶位点,其为靶位点1:GCCTCCTCGCCTTCGCCGC和/或靶位点2:CGCTGTACGCCGCCTGCGG。
10.特异性靶向权利要求9所述靶位点的sgRNA。
11.含有权利要求10所述sgRNA的DNA序列的CRISPR/Cas9打靶载体。
12.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在调控植物雄性育性性状中的应用。
13.如权利要求12所述的应用,其中所述DNA片段用于诱导作物植株雄性不育,以便导入外源基因以获得优质的转基因作物。
14.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在作物种质资源改良中的应用,所述改良包括研发新杂交育制种技术,提高作物产量、提高作物品质、抗病虫害、抗逆、抗倒伏的改良。
15.权利要求1所述的DNA片段或其编码蛋白或含有其的生物材料或DNA分子或权利要求4-8任一所述的突变体材料在转育带有纯合gms3突变基因的隐性核不育系中的应用。
16.一种获取权利要求1所述DNA片段在植物中的直系同源基因片段的方法,包括:
1)使用权利要求1所述DNA片段在核苷酸数据库中进行blastx搜索;
2)所有Identities大于或等于35%、Positives大于或等于50%即为与权利要求1所述DNA片段直系同源的基因片段。
17.一种用于检测权利要求7所述突变体材料的分子标记,其特征在于,通过核苷酸序列如SEQ ID NO:7-9所述的引物扩增得到。
18.含有核苷酸序列如SEQ ID NO:7-9所述的引物的检测试剂或试剂盒。
19.权利要求17所述的分子标记或权利要求18所述的检测试剂或试剂盒在检测水稻GMS3基因突变体中的应用。
20.如权利要求19所述的应用,其特征在于,当选用SEQ ID NO:7-9所示引物扩增待测水稻基因组DNA时,若只能扩增出167bp一条带,则待测水稻为GMS3基因突变体。
21.权利要求17所述的分子标记或权利要求18所述的检测试剂在筛选或培育雄性不育水稻突变体中的应用。
CN202110989206.1A 2020-11-24 2021-08-26 一种水稻育性调控基因gms3及其突变体与应用 Active CN114540366B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011334475 2020-11-24
CN2020113344756 2020-11-24

Publications (2)

Publication Number Publication Date
CN114540366A true CN114540366A (zh) 2022-05-27
CN114540366B CN114540366B (zh) 2024-02-13

Family

ID=81668717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110989206.1A Active CN114540366B (zh) 2020-11-24 2021-08-26 一种水稻育性调控基因gms3及其突变体与应用

Country Status (1)

Country Link
CN (1) CN114540366B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107072165A (zh) * 2014-09-26 2017-08-18 先锋国际良种公司 小麦Ms1多核苷酸、多肽以及使用方法
CN107267527A (zh) * 2016-07-25 2017-10-20 未名兴旺系统作物设计前沿实验室(北京)有限公司 雄性育性的保持方法及其应用
CN108243963A (zh) * 2017-12-18 2018-07-06 海南波莲水稻基因科技有限公司 一种水稻ptc1基因缺失突变体及其分子鉴定方法和应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107072165A (zh) * 2014-09-26 2017-08-18 先锋国际良种公司 小麦Ms1多核苷酸、多肽以及使用方法
CN107267527A (zh) * 2016-07-25 2017-10-20 未名兴旺系统作物设计前沿实验室(北京)有限公司 雄性育性的保持方法及其应用
CN108243963A (zh) * 2017-12-18 2018-07-06 海南波莲水稻基因科技有限公司 一种水稻ptc1基因缺失突变体及其分子鉴定方法和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIANGYUAN WAN等: "Molecular Cloning of Genic Male-Sterility Genes and Their Applications for Plant Heterosis via Biotechnology-based Male-sterility Systems", 《 NEW INTERDISCIPLINARY SCIENCE》 *

Also Published As

Publication number Publication date
CN114540366B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN107267527B (zh) 雄性育性的保持方法及其应用
CN106998665B (zh) 单倍体植物的产生
CN107630031B (zh) 一种调控植物育性的方法和体系
CN110511945B (zh) 一种水稻育性调控基因及其突变体与应用
CN111153974A (zh) 玉米抗病基因和分子标记及其应用
CN109705202B (zh) 一种培育抗灰斑病植物的方法
KR20080075908A (ko) 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법
CN113874388A (zh) 孤雌生殖基因
JP2019103526A (ja) 植物における自家不和合性の操作
WO2018098420A1 (en) Induction of haploid plants using baby boom1 gene
KR20230088741A (ko) 단위생식 유전자의 변형된 프로모터
CN108441499A (zh) 雄性育性相关基因ht2925及其应用
CN105579583B (zh) 雌性不育系的繁殖及杂交制种技术
CN101525630A (zh) 油菜隐性核不育恢复基因BnCYP704B1及应用
CN108660139B (zh) 植物育性调控基因np2及其编码蛋白和应用
CN114072512A (zh) 不育基因及其相关构建体和应用
CN114540366B (zh) 一种水稻育性调控基因gms3及其突变体与应用
CN112251523B (zh) 水稻芽鞘紫线基因OsMYB76的应用及实现方法
CN109912706B (zh) 一种水稻弱势早衰相关基因、蛋白质、分子标记及应用
CN113151295A (zh) 水稻温敏雄性不育基因OsFMS1及其应用
CN113754746A (zh) 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法
CN107058351B (zh) 一种水稻核酸酶基因OsGEN-L的突变基因及其应用
CN110846325B (zh) 一种水稻多花基因mof1及其编码的蛋白质的应用
CN114854712B (zh) 玉米ZmWAK02基因在提高玉米灰斑病抗性中的应用
CN114644692B (zh) 一种定点突变创制旱敏感玉米种质的方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant