CN114656546B - 孤雌生殖单倍体诱导基因及其应用 - Google Patents

孤雌生殖单倍体诱导基因及其应用 Download PDF

Info

Publication number
CN114656546B
CN114656546B CN202111462060.1A CN202111462060A CN114656546B CN 114656546 B CN114656546 B CN 114656546B CN 202111462060 A CN202111462060 A CN 202111462060A CN 114656546 B CN114656546 B CN 114656546B
Authority
CN
China
Prior art keywords
val
leu
gly
phe
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111462060.1A
Other languages
English (en)
Other versions
CN114656546A (zh
Inventor
陈绍江
钟裕
刘晨旭
王雨文
王冬
祁晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN202311219047.2A priority Critical patent/CN117069813A/zh
Priority to CN202311215614.7A priority patent/CN117285610A/zh
Priority to CN202311219347.0A priority patent/CN117069814B/zh
Publication of CN114656546A publication Critical patent/CN114656546A/zh
Application granted granted Critical
Publication of CN114656546B publication Critical patent/CN114656546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • A01H1/045Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/08Fruits
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/60Malvaceae, e.g. cotton or hibiscus
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/82Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Physiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一种孤雌生殖单倍体诱导基因及其应用。本发明在克隆孤雌生殖单倍体关键诱导基因DMP的基础上,通过遗传互补的方式验证了不同双子叶作物中DMP同源基因的单倍体诱导功能的保守性。进一步的,本发明利用基因编辑技术编辑重要的双子叶作物油菜、烟草、棉花和大豆中的DMP同源基因,获得了孤雌生殖单倍体诱导系。本发明所建立的双子叶作物单倍体诱导方法为作物育种共性核心技术的创新及应用展现了广阔前景。

Description

孤雌生殖单倍体诱导基因及其应用
技术领域
本发明涉及以基因组编辑技术为主的农业生物技术领域和作物遗传育种领域,具体涉及一种植物母本单倍体诱导系的制备方法及其应用,特别涉及一种利用基因编辑技术得到的孤雌生殖单倍体诱导基因DMP突变体作为植物单倍体诱导系在诱导植物产生母本单倍体中的应用。
背景技术
大田作物生产是维持人类生存的重要物质基础,在植物学上可以分为单子叶作物和双子叶作物两大类,单子叶作物主要包括水稻、小麦和玉米等,双子叶主要包括大豆、油菜、棉花及番茄、黄瓜等作物。无论是对于单子叶作物还是双子叶作物,纯系创制均是其育种过程的关键环节。单倍体育种技术可加速纯系选育进程,且与基因编辑技术结合可实现对自交系的快速定向改良,能够极大地提高育种效率,是作物育种中的共性关键技术。目前,单倍体育种技术已在玉米育种中得到了大规模应用,且控制玉米单倍体诱导的关键基因已被克隆,这为以杂交诱导为基础的单倍体育种技术体系在其他作物中的构建提供了可鉴路径。目前,磷脂酶基因ZmPLA1已在水稻、小麦上成功获得了单倍体。但该基因仅在单子叶作物中具有较高保守性,由此在双子叶作物上的应用存在一定限制。
目前,在双子叶作物上单倍体的产生主要依靠的还是花药离体培养,效率低下且对材料的基因型依赖性较高,很难实现规模化的应用。虽然将遗传修饰的着丝粒特异组蛋白CENH3导入拟南芥cenh3突变体中可诱导单倍体的产生,但该方式在诱导过程中产生大量的整倍体,这在一定程度上限制了该方法在育种中的应用。
发明内容
本发明首先提供了B1)或B2)或B3)或B4)所示的蛋白质的新用途;
B1)氨基酸序列是序列2或序列4或序列6或序列8或序列10或序列12或序列14或序列16或序列18或序列20或序列22或序列24或序列26或序列28或序列30或序列32或序列34或序列36或序列38或序列40或序列42或序列44或序列46或序列48或序列50或序列52或序列54或序列56或序列58或序列60或序列62或序列64或序列66或序列68或序列70所示的蛋白质;
B2)在序列2或序列4或序列6或序列8或序列10或序列12或序列14或序列16或序列18或序列20或序列22或序列24或序列26或序列28或序列30或序列32或序列34或序列36或序列38或序列40或序列42或序列44或序列46或序列48或序列50或序列52或序列54或序列56或序列58或序列60或序列62或序列64或序列66或序列68或序列70所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
B3)将序列2或序列4或序列6或序列8或序列10或序列12或序列14或序列16或序列18或序列20或序列22或序列24或序列26或序列28或序列30或序列32或序列34或序列36或序列38或序列40或序列42或序列44或序列46或序列48或序列50或序列52或序列54或序列56或序列58或序列60或序列62或序列64或序列66或序列68或序列70所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
B4)与序列2或序列4或序列6或序列8或序列10或序列12或序列14或序列16或序列18或序列20或序列22或序列24或序列26或序列28或序列30或序列32或序列34或序列36或序列38或序列40或序列42或序列44或序列46或序列48或序列50或序列52或序列54或序列56或序列58或序列60或序列62或序列64或序列66或序列68或序列70所示的氨基酸序列具有75%或75%以上同源性且具有相同功能的蛋白质。
本发明提供了B1)或B2)或B3)或B4)所示的蛋白质在调控植物单倍体诱导能力或果实数目中的应用。
所述调控植物单倍体诱导能力体现为:当植物中的上述蛋白质活性被抑制时,所述植物变成植物单倍体诱导系,当植物中的上述蛋白质被表达或活性提高时,所述植物单倍体诱导能力降低或缺失。所述蛋白质活性被抑制为不表达该蛋白质或该蛋白质没有活性。所述植物单倍体诱导能力降低或缺失具体体现为所述植物果实(如角果)数目增加。
所述调控植物果实数目体现为:当植物中的上述蛋白质活性被抑制时,所述植物果实(如角果)数目减少,当植物中的上述蛋白质被表达或活性提高时,所述植物果实(如角果)数目增加。所述蛋白质活性被抑制为不表达该蛋白质或该蛋白质没有活性。
上述B2)中,所述标签是指利用DNA体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述蛋白标签可为Flag标签、His标签、MBP标签、HA标签、myc标签、GST标签和/或SUMO标签等。
上述B3)中,所述一个或几个氨基酸残基的取代和/或缺失和/或添加为不超过10个氨基酸残基的取代和/或缺失和/或添加。
上述B4)中,所述75%或75%以上同源性,可为80%以上或85%以上或90%以上或91%以上或92%以上或93%以上或94%以上或95%以上或96%以上或97%以上或98%以上或99%以上的同源性。
本发明又提供了与上述蛋白质相关的生物材料的新用途;
所述生物材料为下述A1)至A12)中的任一种:
A1)编码上述蛋白质的核酸分子;
A2)含有A1)所述核酸分子的表达盒;
A3)含有A1)所述核酸分子的重组载体;
A4)含有A2)所述表达盒的重组载体;
A5)含有A1)所述核酸分子的重组微生物;
A6)含有A2)所述表达盒的重组微生物;
A7)含有A3)所述重组载体的重组微生物;
A8)含有A4)所述重组载体的重组微生物;
A9)含有A1)所述核酸分子的转基因植物细胞系;
A10)含有A2)所述表达盒的转基因植物细胞系;
A11)含有A3)所述重组载体的转基因植物细胞系;
A12)含有A4)所述重组载体的转基因植物细胞系。
本发明提供了与上述蛋白质相关的生物材料在调控植物单倍体诱导能力或果实数目中的应用。
上述A1)中,所述核酸分子为如下C1)或C2)或C3)或C4)所示的基因:
C1)序列1或序列3或序列5或序列7或序列9或序列11或序列13或序列15或序列17或序列19或序列21或序列23或序列25或序列27或序列29或序列31或序列33或序列35或序列37或序列39或序列41或序列43或序列45或序列47或序列49或序列51或序列53或序列55或序列57或序列59或序列61或序列63或序列65或序列67第33-767位或序列69第32-434位所示的cDNA分子或基因组DNA分子;
C2)与C1)限定的核苷酸序列具有70%或70%以上同一性的cDNA分子或基因组DNA分子;
C3)来源于双子叶植物且与C1)限定的核苷酸序列具有70%或70%以上同一性的cDNA分子或基因组DNA分子;
C4)在严格条件下与C1)或C2)或C3)限定的核苷酸序列杂交的cDNA分子或基因组DNA分子。
上述基因具有如下功能:当植物中的上述基因被抑制或敲除时,所述植物变成植物单倍体诱导系;当植物中的上述基因被表达时,所述植物的单倍体诱导能力下降,果实数目增加。所述抑制为完全抑制。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2或序列4或序列6或序列8或序列10或序列12或序列14或序列16或序列18或序列20或序列22或序列24或序列26或序列28或序列30或序列32或序列34或序列36或序列38或序列40或序列42或序列44或序列46或序列48或序列50或序列52或序列54或序列56或序列58或序列60或序列62或序列64或序列66或序列68或序列70所示的氨基酸序列组成的蛋白质的核苷酸序列具有75%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
本发明还提供了m1或m2所示的物质的新用途:
m1、抑制植物中上述蛋白质活性的物质;
m2、抑制植物中编码上述蛋白质的基因表达的物质或敲除植物中编码上述蛋白质的基因的物质。
本发明提供了m1或m2所示的物质在培育植物单倍体诱导系或培育植物单倍体或提高植物单倍体诱导能力中的应用。
上述应用中,所述抑制植物中上述蛋白质活性的物质可为任何能够使植物中上述蛋白质活性缺失的物质,如抑制上述蛋白质合成或促进上述蛋白质降解或抑制上述蛋白质功能的蛋白质、多肽或小分子化合物(如蛋白活性抑制剂);
所述抑制植物中编码上述蛋白质的基因表达的物质可为任何能够使植物中编码上述蛋白质的基因无法表达的物质,如沉默植物中编码上述蛋白质的基因的物质(如miRNA、siRNA、dsRNA、shRNA等);
所述敲除意味着携带敲除物质的宿主细胞不产生该基因的功能性蛋白质产物,敲除物质可以是以任何方式实现宿主细胞不产生该基因的功能性蛋白质产物的物质,具体方式如去除全部或部分编码基因序列、引入移码突变使得不产生功能性蛋白质、去除或改变调节组分(例如启动子编辑)使得编码基因序列不被转录、通过与mRNA的结合阻止翻译等。通常,敲除在基因组DNA水平上进行,使得细胞的后代也永久地携带敲除。进一步的,所述敲除植物中编码上述蛋白质的基因的物质可为任何能够使植物中编码上述蛋白质的基因发生突变(所述突变形式可为缺失突变和/或插入突变和/或碱基替换)从而失去活性的物质,如锌指蛋白ZFN基因编辑系统或TALENs基因编辑系统或CRISPR/Cas9基因编辑系统等。更进一步的,所述敲除植物中编码上述蛋白质的基因的物质为CRISPR/Cas9基因编辑系统。
本发明还提供了一种植物单倍体诱导系的制备方法。
本发明提供的植物单倍体诱导系的制备方法为如下D1)或D2):
D1)抑制受体植物中上述蛋白质的活性,得到植物单倍体诱导系;
D2)抑制受体植物中编码上述蛋白质的基因的表达或敲除受体植物中编码上述蛋白质的基因,得到植物单倍体诱导系。
本发明还提供了一种植物单倍体诱导系的制备方法。
本发明提供的植物单倍体诱导系的制备方法包括将按照上述植物单倍体诱导系制备方法制备得到的植物单倍体诱导系进行自交的步骤。
本发明还提供了一种提高植物单倍体诱导能力的方法。
本发明提供的提高植物单倍体诱导能力的方法包括如下步骤:抑制受体植物中上述蛋白质的活性,或抑制受体植物中编码上述蛋白质的基因的表达,或敲除受体植物中编码上述蛋白质的基因,得到植物单倍体诱导系;所述植物单倍体诱导系的单倍体诱导能力高于所述受体植物。
上述植物单倍体诱导系的制备方法中,所述自交的次数至少为一次,具体可为一次。
上述植物单倍体诱导系的制备方法还包括筛选纯合突变体的步骤。所述纯合突变体为编码上述蛋白质的基因的两条同源染色体发生了相同突变的植物个体。
进一步的,当所述受体植物为油菜时,所述基因为BnDMP1A基因和/或BnDMP2A基因和/或BnDMP1C基因和/或BnDMP2C基因;所述方法为抑制油菜中BnDMP1A基因和/或BnDMP2A基因和/或BnDMP1C基因和/或BnDMP2C基因的表达或敲除油菜中BnDMP1A基因和/或BnDMP2A基因和/或BnDMP1C基因和/或BnDMP2C基因,得到转基因油菜,即为油菜单倍体诱导系;
当所述受体植物为烟草时,所述基因为NtDMP1基因和/或NtDMP2基因和/或NtDMP3基因;所述方法为抑制烟草中NtDMP1基因和/或NtDMP2基因和/或NtDMP3基因的表达或敲除烟草中NtDMP1基因和/或NtDMP2基因和/或NtDMP3基因,得到转基因烟草,即为烟草单倍体诱导系;
当所述受体植物为棉花时,所述基因为GhDMP1基因和/或GhDMP2基因;所述方法为抑制棉花中GhDMP1基因和/或GhDMP2基因的表达或敲除棉花中GhDMP1基因和/或GhDMP2基因,得到转基因棉花,即为棉花单倍体诱导系。
当所述受体植物为大豆时,所述基因为GmDMP1基因和/或GmDMP2基因;所述方法为抑制大豆中GmDMP1基因和/或GmDMP2基因的表达或敲除大豆中GmDMP1基因和/或GmDMP2基因,得到转基因大豆,即为大豆单倍体诱导系。
更进一步的,所述敲除受体植物中编码上述蛋白质的基因的方式均为CRISPR/Cas9。
所述敲除受体植物中编码上述蛋白质的基因的方法包括如下步骤:将含有靶序列的CRISPR/Cas9载体导入受体植物中,得到转基因植物。所述靶序列靶向受体植物中的靶基因。
所述编码上述蛋白质的基因为序列1或序列3或序列5或序列7或序列9或序列11或序列13或序列15或序列17或序列19或序列21或序列23或序列25或序列27或序列29或序列31或序列33或序列35或序列37或序列39或序列41或序列43或序列45或序列47或序列49或序列51或序列53或序列55或序列57或序列59或序列61或序列63或序列65或序列67第33-767位或序列69第32-434位所示的DNA分子。
在本发明的一个具体实施例中,当所述受体植物为油菜时,所述CRISPR/Cas9的靶序列为序列67第26-45位、序列63第4-23位、序列67第56-75位和序列63第159-178位。所述含有靶序列的CRISPR/Cas9载体具体为将序列71所示的DNA分子插入pDIRECT-22C载体后得到的载体。所述植物单倍体诱导系具体可为BnDMP基因突变纯合型株系bndmp-1或BnDMP基因突变纯合型株系bndmp-2。所述BnDMP基因突变纯合型株系bndmp-1与野生型油菜Westar的基因组DNA的差异仅在于在编码BnDMP1A的基因的两条同源染色体上均发生了碱基G的插入,该碱基G插入位置位于序列63第162-163位之间,且在编码BnDMP2A的基因的两条同源染色体上均发生了碱基G和碱基A的插入,该插入碱基G位于序列67第42-43位之间,该插入碱基A位于序列67第72-73位之间,且在编码BnDMP2C的基因的两条同源染色体上均发生了碱基A的插入,该插入碱基A位于序列69第42-43位之间和序列69第72-73位之间。所述BnDMP基因突变纯合型株系bndmp-2与野生型油菜Westar的基因组DNA的差异仅在于在编码BnDMP1A的基因的两条同源染色体上均发生了碱基G的插入,该碱基G插入位置位于序列63第162-163位之间,且在编码BnDMP2A的基因的两条同源染色体上均发生了碱基替换和碱基T的插入,该碱基替换为将序列67第43-53位所示的DNA分子替换为如下序列:TATAACA,该碱基T插入位置位于序列67第72-73位之间,且在编码BnDMP2C的基因的两条同源染色体上均发生了碱基A的插入,该插入碱基A位于序列69第42-43位之间和序列69第72-73位之间。
在本发明的另一个具体实施例中,当所述受体植物为烟草时,所述CRISPR/Cas9的靶序列为序列59第111-130位、序列59第278-297位、序列57第88-107位和序列57第383-402位。所述含有靶序列的CRISPR/Cas9载体具体为将序列72所示的DNA分子插入pDIRECT-22C载体后得到的载体。所述植物单倍体诱导系具体可为NtDMP基因突变纯合型株系ntdmp-1或NtDMP基因突变纯合型株系ntdmp-2。所述NtDMP基因突变纯合型株系ntdmp-1与野生型烟草K326的基因组DNA的差异仅在于在编码NtDMP1的基因的两条同源染色体上均发生了碱基G缺失和片段缺失,该缺失碱基G位于序列57第91位,该缺失片段位于序列57第115-399位,且在编码NtDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列59第116-281位,且在编码NtDMP3的基因的两条同源染色体上均发生了碱基G缺失和片段缺失,该缺失碱基G位于序列61第91位,该缺失片段位于序列61第115-399位。所述NtDMP基因突变纯合型株系ntdmp-2与野生型烟草K326的基因组DNA的差异仅在于在编码NtDMP1的基因的两条同源染色体上均发生了碱基G缺失和碱基A缺失,该缺失碱基G位于序列57第91位,该缺失碱基A位于序列57第114位,且在编码NtDMP2的基因的两条同源染色体上均发生了碱基替换,该碱基替换为将序列59第111-280位所示的DNA分子替换为碱基T,且在编码NtDMP3的基因的两条同源染色体上均发生了碱基A插入,该插入碱基A位于序列61第400-401位之间。
在本发明的再一个具体实施例中,当所述受体植物为棉花时,所述CRISPR/Cas9的靶序列为序列53、55的第42-61位、序列53、55的第79-98位、序列53、55的第316-335位和序列53第326-345位。所述含有靶序列的CRISPR/Cas9载体具体为将序列73所示的DNA分子插入pDIRECT-22C载体后得到的载体。所述植物单倍体诱导系具体可为GhDMP基因突变纯合型株系ghdmp-1或GhDMP基因突变纯合型株系ghdmp-2。所述GhDMP基因突变纯合型株系ghdmp-1与野生型华棉1号的基因组DNA的差异仅在于在编码GhDMP1的基因的两条同源染色体上均发生了碱基C缺失,该缺失碱基C位于序列53第342位,且在编码GhDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列55第54-58位。所述GhDMP基因突变纯合型株系ghdmp-2与野生型华棉1号的基因组DNA的差异仅在于在编码GhDMP1的基因的两条同源染色体上均发生了碱基替换和片段缺失,该碱基替换为将序列53第345位碱基T替换成碱基A,该缺失片段位于序列53第358-359位,且在编码GhDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列55第59-83位。
在本发明的最后一个具体实施例中,当所述受体植物为大豆时,所述CRISPR/Cas9的靶序列为序列43第96-115位、序列43第112-131位(序列45第112-131位)、序列45第168-187位、序列43第350-369位(序列45第350-369位)。所述含有靶序列的CRISPR/Cas9载体的核苷酸序列具体如序列表中序列74所示。所述植物单倍体诱导系具体可为GmDMP基因突变纯合型株系gmdmp-1或GmDMP基因突变纯合型株系gmdmp-2。所述GmDMP基因突变纯合型株系gmdmp-1与野生型大豆威廉姆斯82的基因组DNA的差异仅在于在编码GmDMP1的基因的两条同源染色体上均发生了226bp片段缺失和2个碱基缺失,缺失片段和缺失碱基分别位于序列43第85-310位和第367-368位,且在编码GmDMP2的基因的两条同源染色体上均发生了192bp片段缺失,该缺失片段位于序列45第175-366位。所述GmDMP基因突变纯合型株系gmdmp-2与野生型威廉姆斯82的基因组DNA的差异仅在于在编码GmDMP1的基因的两条同源染色体上均发生了267bp片段缺失,该缺失片段位于序列43第101-367位,且在编码GmDMP2的基因的两条同源染色体上均发生了195bp片段缺失,该缺失片段位于序列45第171-365位。
本发明还提供了一种植物单倍体的制备方法。
本发明提供的植物单倍体的制备方法包括如下步骤:将按照上述植物单倍体诱导系的制备方法制备的植物单倍体诱导系或其后代进行自交或者作为父本与其他植物材料进行杂交,得到自交后代或杂交后代,即为所述植物单倍体。
进一步的,上述植物单倍体的制备方法还包括如下步骤:将所述自交后代或所述杂交后代单株进行荧光标记鉴定和/或单倍体性状鉴定和/或叶片倍性鉴定和/或分子标记鉴定,选取至少一种方法鉴定为单倍体的后代单株为植物单倍体。
更进一步的,所述荧光标记鉴定方法可按照如下方法进行:将携带荧光蛋白表达元件的上述植物单倍体诱导系作为父本与母本杂交,得到杂交子代,通过检测杂交子代种子是否具有荧光信号判断待测种子为单倍体还是四倍体(二倍体):若待测种子无荧光或弱荧光,则该种子为或候选为单倍体;若待测种子表现出强荧光,则该种子为或候选为四倍体(二倍体)。进一步的,通过荧光灯检测待测种子是否具有荧光。更进一步的,所述父本携带有由启动子AtOLEO1驱动的TagRFP荧光蛋白表达元件,可以根据杂交后代种子是否具有红色荧光判断其为单倍体还是四倍体(二倍体)。
所述单倍体性状鉴定方法可按照如下方法进行:若待测植株具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,则该植株为或候选为单倍体;若待测植株具有植株高大,叶片宽大,披散,育性正常等特征,则该植株为或候选为四倍体(二倍体)。
所述叶片倍性鉴定方法可按照如下方法进行:提取待测植株幼嫩叶片的细胞核,以四倍体(二倍体)植物叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体(二倍体)细胞核信号,并将四倍体(二倍体)细胞核信号峰位设为100(由于四倍体(二倍体)细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则该植株为或候选为单倍体;若待测植株的信号峰出现在100附近,其与四倍体(二倍体)细胞核信号强度富集位置相同,则该植株为或候选为四倍体(二倍体)。
所述分子标记鉴定可按照如下方法进行:采用父本(母本单倍体诱导系)和母本间多态性引物进行PCR扩增,根据PCR扩增产物判断待测植株为单倍体还是四倍体(二倍体):若待测植株的扩增产物仅具有母本的带型,不存在父本的带型,则该植株为或候选为单倍体;若待测植株的扩增产物具有父本和母本的杂合带型,则该植株为或候选为四倍体(二倍体)。
上述任一所述应用或方法,所述植物为双子叶植物;进一步的,所述双子叶植物可为胡萝卜、向日葵、番木瓜、甜菜、甜瓜、苜蓿、核桃、芝麻、橡胶树、木薯、荷花、甜樱桃、月季、马铃薯、葡萄、大豆、番茄、黄瓜、辣椒、棉花、烟草或油菜;更进一步的,所述油菜具体可为野生型油菜Westar或hau-A;所述烟草具体可为野生型烟草K326;所述棉花具体可为野生型棉花华棉1号;所述大豆具体可为野生型威廉姆斯82。
本发明最后提供了一种单倍体诱导能力降低或果实数目提高的转基因植物的制备方法。
本发明提供的单倍体诱导能力降低或果实数目提高的转基因植物的制备方法包括如下步骤:提高植物单倍体诱导系中上述蛋白质的表达量和/或活性,得到转基因植物;所述转基因植物的单倍体诱导能力低于所述植物单倍体诱导系,所述转基因植物的果实数目高于所述植物单倍体诱导系。
进一步的,所述提高植物单倍体诱导系中上述蛋白质的表达量和/或活性的方法为在植物单倍体诱导系中过表达上述蛋白质。
所述过表达的方法为将编码上述蛋白质的基因导入植物单倍体诱导系中。
更进一步的,所述编码上述蛋白质的基因为序列1或序列3或序列5或序列7或序列9或序列11或序列13或序列15或序列17或序列19或序列21或序列23或序列25或序列27或序列29或序列31或序列33或序列35或序列37或序列39或序列41或序列43或序列45或序列47或序列49或序列51或序列53或序列55或序列57或序列59或序列61或序列63或序列65或序列67第33-767位或序列69第32-434位所示的DNA分子。
所述植物单倍体诱导系为敲除基因AtDMP8(AtDMP8基因序列如序列表中序列75第95-826位所示)和AtDMP9(AtDMP9基因序列如序列表中序列76第141-875位所示)的拟南芥突变体,如拟南芥DMP基因突变体dmp8dmp9(T2-19-1),与野生型拟南芥Col-0的基因组DNA相比,拟南芥DMP基因突变体dmp8dmp9(T2-19-1)的差异仅在于在编码AtDMP8蛋白的基因的两条同源染色体上均发生了片段缺失,该缺失的片段位于序列75第115-511位,且在编码AtDMP9蛋白的基因的两条同源染色体上均发生了片段缺失,该缺失的片段位于序列76第161-564位。
本发明在克隆孤雌生殖单倍体关键诱导基因DMP的基础上,通过遗传互补的方式验证了不同双子叶作物中DMP同源基因的单倍体诱导功能的保守性,具体方法如下:通过基因合成或者是PCR扩增的方式克隆不同双子叶作物中DMP同源基因,构建拟南芥中AtDMP9基因的启动子分别驱动这些双子叶作物中DMP同源基因的表达载体,并将所构建的表达载体转化至拟南芥dmp8dmp9突变体中,通过观察携带表达载体与不携带表达载体的植株角果结实数目,证明这些双子叶作物中DMP同源基因均与孤雌生殖单倍体诱导相关,说明不同双子叶作物中DMP同源基因的单倍体诱导功能具有较高的保守性。进一步的,本发明利用基因编辑技术编辑重要的双子叶作物(油菜、烟草、棉花和大豆)中的DMP同源基因,获得了孤雌生殖单倍体诱导系,再次证明双子叶作物中DMP基因均具有调控植物单倍体诱导能力的功能。本发明所建立的双子叶作物单倍体诱导方法为作物育种共性核心技术的创新及应用展现了广阔前景。
附图说明
图1为不同作物DMP基因互补载体构建过程示意图。
图2为油菜单倍体和四倍体对比图。图a为油菜单倍体苗期,图b为流式测试结果,图c为单倍体成熟期。图a-c中,左为单倍体,右为四倍体。
图3为烟草单倍体和四倍体对比图。图a为烟草单倍体苗期,图b为流式测试结果,图c为烟草单倍体旺长期。图a-c中,左为单倍体,右为四倍体。
图4为大豆突变体种子和果荚对比图。图a左边为大豆正常发育种子,右边为突变体的败育种子。图b为大豆单倍体和二倍体果荚对比图,左为单倍体,右为二倍体。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
下述实施例中的载体pICH41295、pICH41308、pICH41276、pICH47742、pL1-F1-FastR、pICH41744和pICSL4723均记载于文献“Engler C,Youles M,Gruetzner R,EhnertT,Werner S,Jones J D G,Patron N J,Marillonnet S.A Golden Gate Modular CloningToolbox for Plants[J].ACS Synthetic Biology,2014,3(11):839-843.”中,公众可从申请人处获得,该试验材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的载体pDIRECT-22C记载于文献“Cermak,T.and S.J.Curtin,etal.(2017)."A multi-purpose toolkit to enable advanced genome engineering inplants."The Plant Cell:tpc.00922.2016.”中,公众可从申请人处获得,该试验材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的拟南芥DMP基因突变体dmp8dmp9(T2-19-1)和Col-0均记载于文献“Zhong Y,Chen B,Li M,Wang D,Jiao Y,Qi X,Wang M,Liu Z,Chen C,Wang Y,Chen M,LiJ,Xiao Z,Cheng D,Liu W,Boutilier K,Liu C,Chen S.A DMP-triggered in vivomaternal haploid induction system in the dicotyledonous Arabidopsis[J].NaturePlants,2020,6(5):466-472.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型油菜Westar记载于文献“Silva N F,Stone S L,ChristieL N,et al.Expression of the S receptor kinase in self-compatible Brassicanapus cv.Westar leads to the allele-specific rejection of self-incompatibleBrassica napus pollen[J].Molecular genetics and genomics:MGG,2001,265(3):552-559.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型油菜hau-A记载于文献“陈凤仪.甘蓝型油菜hau CMS蛋白质组学研究[D].华中农业大学,2017.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型烟草K326记载于文献“kováM,Vosátka M,Rossi L,et al.Effects of arbuscular mycorrhizal inoculation on cadmium accumulationby different tobacco(Nicotiana tabacum L.)types[J].Applied soil ecology,2007,35(3):502-510.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型棉花华棉1号记载于文献“Wang,P.and J.Zhang,et al.(2018)."High efficient multisites genome editing in allotetraploid cotton(Gossypium hirsutum)using CRISPR/Cas9 system."Plant Biotechnology Journal 16(1):137-150.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型大豆威廉姆斯82记载于文献“林志豪.大豆根部特异表达的磷转运子基因GmPT4的功能分析[D].华南农业大学,2016.”中,公众可从申请人处获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
本发明涉及的基因和蛋白及其序列如表1所示。表1中的DNA序列除序列67和序列69外均为对应基因的CDS序列,编码对应的蛋白序列。序列67第33-767位为序列68所示蛋白的CDS序列,序列69第32-434位为序列70所示蛋白的CDS序列。
表1、本发明涉及的基因序列和蛋白序列
实施例1、不同双子叶作物中DMP同源基因的单倍体诱导功能的保守性验证
一、DMP同源基因氨基酸序列的获取
利用NCBI网站的blastp工具(https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&BLAST_SPEC=&LINK_LOC=blasttab)对DMP蛋白的氨基酸序列进行比对,选择默认参数,最大比对数量设置为250,从中下载非冗余且相似度大于50%的氨基酸序列。从这些序列中,选择22个具有代表性物种的DMP基因序列进行合成或者PCR扩增的方式进行克隆。其中,胡萝卜、向日葵、番木瓜、甜菜、甜瓜、苜蓿、核桃、芝麻、橡胶树、木薯、荷花、甜樱桃、月季、马铃薯和葡萄中的DMP同源基因的序列交由金斯瑞生物科技股份有限公司进行合成。大豆、番茄、黄瓜、辣椒、棉花、烟草和油菜中的DMP同源基因序列则以PCR扩增的方式进行克隆。
大豆GmDMP1和GmDMP2基因高度同源,所用的扩增引物相同,设计扩增引物进行PCR扩增并克隆至载体,然后挑取单克隆测序后分别与GmDMP1和GmDMP2基因序列进行比对,从而获得GmDMP1和GmDMP2基因序列。GmDMP1和GmDMP2基因扩增引物如下:
GmDMP1/2-CDS1F1:tttgaagacaaaatgGATCTAAACGAACAACAAATCGG;
GmDMP1/2-CDS1R1:tttgaagacaaCGAGGCCCCTCGGGGTGACG;
GmDMP1/2-CDS1F2-Annealing:CTCGCCGTGTTCAAGCCCGCCGTGGCCGTCCCGGAGGACGA;
GmDMP1/2-CDS1R2-Annealing:CCTGTCGTCCTCCGGGACGGCCACGGCGGGCTTGAACACGG;
GmDMP1/2-CDS1F3:tttgaagacaaCAGGTTTAAGGTCGGGTTCAC;
GmDMP1/2-CDS1R3:tttgaagacaaAAGCCTAGGCAGACATGCAACCAA。
番茄SlDMP基因扩增引物的序列如下:
SlDMP-CDS1F1:tttgaagacaaaatgGAGCAAACTAGTGAAGGA;
SlDMP-CDS1R1:tttgaagacaaACCTTTCATCTTTTGGCACATC;
SlDMP-CDS1F2:tttgaagacaaAGGTACATTGTGGGAGTGACA;
SlDMP-CDS1R2:tttgaagacaaAAGCCTAAGCAGACATACATCCAAC。
黄瓜CsDMP基因扩增引物的序列如下:
CsDMP-CDS1F1:tttgaagacaaaatgGACGAACACACAGTAACC;
CsDMP-CDS1R1:tttgaagacaaCACCGACGGCAGAAGCATTTC;
CsDMP-CDS1F2:tttgaagacaaGGTGTCCGGGAAGGGGGAGTG;
CsDMP-CDS1R2:tttgaagacaaAAGCTCAATTAGCCATACAACCAATACCAT。
辣椒CaDMP基因扩增引物的序列如下:
CaDMP-CDS1F1:tttgaagacaaaatgGAGCAAAGTAGTGAGGGA;
CaDMP-CDS1R1:tttgaagacaaGATGAAGAATTATCGACGCGCTTTG;
CaDMP-CDS1F2:tttgaagacaaCATCTTCAATGTACCCTACTAGTTTAC;
CaDMP-CDS1R2:tttgaagacaaACCTTTCATCTTTTGGGATTTCG;
CaDMP-CDS1F3:tttgaagacaaAGGTACATTGTGGGATTGACAGA;
CaDMP-CDS1R3:tttgaagacaaAAGCTTAAGCAGACATACATCCAACACC。
棉花GhDMP1和GhDMP2基因高度同源,所用的扩增引物相同,设计扩增引物进行PCR扩增并克隆至载体,然后挑取单克隆测序后分别与GhDMP1和GhDMP2基因序列进行比对,从而获得GhDMP1和GhDMP2基因序列。GhDMP1和GhDMP2基因扩增引物如下:
GhDMP1/2-CDS1F:tttgaagacaaaatgGAGCAAACCCACCATGG;
GhDMP1/2-CDS1R:tttgaagacaaAAGCTCAAGCAGCCATGCAACC。
烟草NtDMP1、NtDMP2和NtDMP3基因高度同源,所用的扩增引物相同,设计扩增引物进行PCR扩增并克隆至载体,挑取单克隆测序后分别与NtDMP1、NtDMP2和NtDMP3基因序列进行比对,从而获得NtDMP1、NtDMP2和NtDMP3基因序列。NtDMP1、NtDMP2和NtDMP3基因扩增引物如下:
NtDMP-CDS1F1:tttgaagacaaaatgGAGCAAAGTACTGAGGGAATTG;
NtDMP1-CDS1R1:tttgaagacaaACCTCTTATCTTTTGGCACATCCA;
NtDMP2/3-CDS1R1:tttgaagacaaACCTCTCATCTTTTGGCACATCCA;
NtDMP-CDS1F2:tttgaagacaaAGGTACGTCGTGGGATTTAC;
NtDMP-CDS1R2:tttgaagacaaAAGCTTAAGCAGACATACATCCAATACCAT。
油菜BnDMP1A、BnDMP1C、BnDMP2A和BnDMP2C基因高度同源,所用的扩增引物相同,设计扩增引物进行PCR扩增并克隆至载体,挑取单克隆测序后分别与BnDMP1A、BnDMP1C、BnDMP2A和BnDMP2C基因序列进行比对,从而获得BnDMP1A、BnDMP1C、BnDMP2A和BnDMP2C基因序列。BnDMP1A、BnDMP1C、BnDMP2A和BnDMP2C基因扩增引物如下:
BnDMP1A/1C-CDS1F:tttgaagacaaaatgGAGAAAACAGAGGAAAGT;
BnDMP1A/1C-CDS1R:tttgaagacaaAAGCTCAAGCAGACATGCATCCAAC;
BnDMP2A/C-CDS1F:tttgaagacaaaatgGAGAAAACAGAGGAAAGC;
BnDMP2A/C-CDS1R:tttgaagacaaAAGCTCAAGCGGACATGCATCCAAC;
BnDMP2C-CDS1R1:tttgaagacaaCTCTCTTCCTCCTCCTGCGGCG;
BnDMP2C-CDS1F2:tttgaagacaaAGAGATTCCGGTAAGTGATGATA。
二、DMP同源基因互补载体构建及转化
1、将以上获得的不同作物中DMP同源基因的片段通过golden gate方法分别克隆至level0载体pICH41308中,得到携带不同DMP基因序列的载体pL0-DMP-CDS1(图1b)。
2、以拟南芥Col-0的基因组DNA为模板,利用引物对DMP9-proF/R对AtDMP9基因的启动子序列进行扩增,并克隆至level 0载体pICH41295中,获得载体pL0-AtDMP9-pro(图1a);
拟南芥AtDMP9基因启动子扩增引物的序列如下:
DMP9-proF:tttgaagacaaGGAGccttccaagactcgga;
DMP9-proR:tttgaagacaaCATTTTTCGTGTGTTTCTCTCTGTTTTT。
3、以携带AtuNos终止子序列的载体质粒为模板,利用引物对TerAtuNosF/R对AtuNos终止子序列进行扩增,并克隆至level 0载体pICH41276中,得到载体pL0-terAtuNos(图1c);
AtuNos终止子扩增引物的序列如下:
TerAtuNosF:tttgaagacaagcttgtcaagcagatcgttca;
TerAtuNosR:tttgaagacaaAGCGTCGATCTAGTAACATAG。
4、通过酶切连接的方式,分别将不同作物DMP同源基因的载体pL0-DMP-CDS1中的BsaI酶切位点间的片段(DMP基因CDS序列)、与载体pL0-AtDMP9-pro中的BsaI酶切位点间的片段(AtDMP9基因基因的启动子)、载体pL0-terAtuNos中的BsaI酶切位点间的片段(AtuNos终止子序列)连接至level 1载体pICH47742中,获得不同作物DMP同源基因的Level 1载体pL1-F2-pDMP9::DMP-TerAtuNos(图1d)。
5、通过酶切连接的方式,分别将不同作物DMP同源基因的Level 1载体pL1-F2-pDMP9::DMP-TerAtuNos中的BbsI酶切位点间的片段(AtDMP9基因基因的启动子+DMP基因CDS序列+AtuNos终止子序列)、载体pL1-F1-FastR中的BbsI酶切位点间的片段(FastR片段)和载体pICH41744的BbsI酶切位点间的片段(L2E片段)连接至level 2载体pICSL4723中,获得最终的互补载体pL2-FastR+pDMP9::DMP(图1e)。
6、分别将不同作物的DMP同源基因互补载体转化至农杆菌GV3101中,然后利用蘸花法转化至拟南芥DMP基因突变体dmp8dmp9(T2-19-1)中,再通过RFP荧光对转化种子进行筛选,最终获得阳性转基因种子。
7、将阳性转基因种子种植并自交,选择自交后代中携带荧光与不携带荧光种子比例约为3:1的植株用于下一步的分析。
三、携带DMP同源基因互补载体的转基因植株的结实数分析
由于拟南芥单倍体诱导基因DMP突变体dmp8dmp9(T2-19-1)的自交和杂交角果结实数均比野生型拟南芥Col-0低。如果其它作物中DMP同源基因具有相同的单倍体诱导功能,则理论上携带DMP同源基因互补载体的转基因植株的角果结实数会高于突变体dmp8dmp9(T2-19-1)。因此,为了验证其它作物中DMP同源基因的功能,分别对突变体dmp8dmp9和携带不同作物DMP同源基因互补载体的转基因植株自交角果结实数进行统计和分析,具体操作步骤如下:
1、将需要观察的角果固定于粘有双面胶带的载玻片上;
2、在体式镜下,使用1mL注射器的尖端轻轻将角果两侧划开,再用尖镊子将角果的果皮撕掉;
3、对角果中正常种子的数目进行统计,计算角果平均结实数。
结果显示:与突变体dmp8dmp9相比,携带不同作物DMP同源基因互补载体的转基因植株自交角果的结实数均显著升高(表2)。这些结果表明,外源的DMP同源基因可以互补突变体dmp8dmp9的表型,说明这些作物中的DMP同源基因均具备调控植物单倍体诱导能力的功能。
表2、突变体dmp8dmp9和携带DMP同源基因的转基因植株的自交角果结实数目统计表
/>
注:a表示结实数与dmp8dmp9相比有显著差异;每种基因型材料取3个以上独立的转基因植株。
实施例2、BnDMP基因敲除的油菜突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除BnDMP基因
利用CRISPR/Cas9系统敲除油菜中的BnDMP基因(BnDMP表示BnDMP1A、BnDMP2A、BnDMP1C和BnDMP2C四个基因),获得BnDMP基因敲除的突变体。由于油菜Westar中只存在BnDMP1A、BnDMP2A和BnDMP2C三个DMP的同源基因。因此,只对这三个基因进行敲除,具体步骤如下:
1、sgRNA序列的选择
分别在BnDMP1A、BnDMP2A和BnDMP2C基因上设计靶位点序列,长度为20bp。
靶位点1位于序列67第26-45位,序列69第26-45位,靶位点1序列为CACGAAAATGGAGAAAACAG。
靶位点2位于序列63第4-23位,靶位点2序列为GAGAAAACAGAGGAAAGTGT。
靶位点3位于序列67第56-75位,序列69第56-75位,靶位点3序列为TGGGATCAGAGTTTACACGA。
靶位点4位于序列63第159-178位,靶位点4序列为GAACTCCTTGAGCGACCATG。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体为将序列71所示的DNA分子插入pDIRECT-22C载体后得到的载体。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化至农杆菌感受态细胞GV3101(农杆菌GV3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌GV3101/CRISPR/Cas9。
再将重组菌GV3101/CRISPR/Cas9采用农杆菌侵染方法转化至野生型油菜Westar(重组农杆菌进行28℃扩繁,扩繁后的菌液用于侵染油菜Westar)中,经过卡那抗性筛选后获得T0代转基因油菜植株。
4、BnDMP基因发生突变的转基因植株鉴定
采集步骤3获得的T0代转基因油菜植株叶片,并提取基因组DNA作为模板,采用如下引物进行PCR扩增,得到不同株系的PCR扩增产物。
BnDMP1A基因突变序列检测引物的序列如下:
BnDMP1AF1:CTTCTTGATTCCAGAGATCAC;
BnDMP1AR1:GAAGAAGAAGCAGGAGGTTG。
BnDMP2A基因突变序列检测引物的序列如下:
BnDMP2AF1:CCACCACTGGTTAAGCGATACT;
BnDMP2AR1:CATGCGACGTTTTCGACCTC。
BnDMP2C基因突变序列检测引物的序列如下:
BnDMP2CF2:CCCTTAGGACTAACGAACTCGC;
BnDMP2CR1:CACTTACCGGAATCTCTGCCTC。
将不同株系的PCR扩增产物进行Sanger测序,根据测序结果分别与野生型油菜Westar相应的BnDMP基因进行比对。根据以下原则分别对各个BnDMP的基因型进行鉴定。
自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的BnDMP基因突变,且另1条染色体上的BnDMP基因未突变),该株系为T0代转基因油菜杂合突变型株系;
自靶位点序列起具有特异单峰特征的序列,若与野生型油菜Westar的BnDMP基因序列相同,则该株系的基因型为野生型,即BnDMP基因序列没有发生突变;若与野生型油菜Westar的BnDMP基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的BnDMP基因发生突变),该株系为T0代转基因油菜纯合突变型株系。
5、T1代油菜的基因型鉴定
将步骤4获得的T0代转基因油菜BnDMP基因突变株系自交,收获种子后再播种,得到T1代转基因油菜。鉴定T1代转基因油菜的BnDMP基因的基因型,具体方法如下:以T1代转基因油菜的基因组DNA为模板,分别利用BnDMP1A、BnDMP2A和BnDMP2C基因的突变序列检测引物按照步骤4中的方法鉴定T1代转基因油菜3个BnDMP基因的基因型。
最终获得T1代转基因油菜BnDMP基因突变纯合株系bndmp-1和bndmp-2。具体突变情况如下:
T1代转基因油菜3个BnDMP基因突变纯合型株系bndmp-1与野生型油菜Westar的基因组DNA的差异仅在于在编码BnDMP1A的基因的两条同源染色体上均发生了碱基G的插入,该碱基G插入位置位于序列63第162-163位之间,且在编码BnDMP2A的基因的两条同源染色体上均发生了碱基G和碱基A的插入,该插入碱基G位于序列67第42-43位之间,该插入碱基A位于序列67第72-73位之间,且在编码BnDMP2C的基因的两条同源染色体上均发生了碱基A的插入,该插入碱基A位于序列69第42-43位之间和序列69第72-73位之间。
T1代转基因油菜3个BnDMP基因突变纯合型株系bndmp-2与野生型油菜Westar的基因组DNA的差异仅在于在编码BnDMP1A的基因的两条同源染色体上均发生了碱基G的插入,该碱基G插入位置位于序列63第162-163位之间,且在编码BnDMP2A的基因的两条同源染色体上均发生了碱基替换和碱基T的插入,该碱基替换为将序列67第43-53位所示的DNA分子替换为如下序列:TATAACA,该碱基T插入位置位于序列67第72-73位之间,且在编码BnDMP2C的基因的两条同源染色体上均发生了碱基A的插入,该插入碱基A位于序列69第42-43位之间和序列69第72-73位之间。
取上述T1代转基因油菜突变株系用于下述单倍体诱导能力分析实验。
二、BnDMP基因敲除的油菜突变体在诱导产生单倍体中的应用
(一)BnDMP基因敲除的油菜突变体的单倍体自交诱导能力鉴定
由于野生型油菜Westar为纯合的自交系,在此背景上敲除BnDMP基因所获得突变体自交后代无法通过分子标记去鉴定单倍体。因此,将BnDMP基因所获得不同类型组合的突变体自交所获得的种子种植,用如下方法对自交后代进行单倍体鉴别。
1、植株表型鉴别
将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常(图2a,c)。
2、流式细胞检测叶片鉴别
将上述步骤1中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体油菜叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是其单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体(图2b)。
BnDMP基因突变纯合型株系自交的后代单株中,若按照上述2种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表3中可以看出,油菜BnDMP基因突变后,在自交后代中可获得单倍体。
表3、bndmp突变体自交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
WT 343 0 0
bndmp-1 97 1 1.03
bndmp-2 45 2 4.44
注:WT为油菜野生型材料Westar。
(二)BnDMP基因敲除的油菜突变体的单倍体杂交诱导能力鉴定
将BnDMP基因所获得不同类型组合的突变体分别与油菜hau-A材料进行杂交获得后代,通过如下方法对后代中的单倍体进行鉴别。
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,四倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为弱荧光。
2、分子标记鉴别
将上述步骤1鉴定出的弱荧光的种子进一步种植,提取其基因组DNA,采用油菜hau-A材料和转基因油菜突变株系间多态性引物(A07F+A07R)进行PCR扩增,并将扩增产物进行琼脂糖带型检测,若待测单株的扩增产物表现为1条带,认为该单株条带为油菜hau-A材料带型,不存在父本材料的带型,则该单株是单倍体。若待测单株的扩增产物表现为2条带,认为该单株条带为油菜hau-A材料和转基因油菜突变株系杂合带型,则该单株是正常杂交的后代,是四倍体。
油菜单倍体鉴别引物序列如下:
A07F:CGGGGCCATAAAAACAGTGAAG;
A07R:GCCTTCAGCGACTTGAACATC。
3、植株表型鉴别
对上述步骤2鉴定出的单倍体植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常(图2a,c)。
4、流式细胞检测叶片鉴别
将上述步骤3获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体油菜叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是其单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体(图2b)。
BnDMP基因突变纯合型株系与油菜hau-A材料杂交的后代单株中,若按照上述4种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表4统计结果中可以看出,BnDMP基因突变纯合型株系与其他材料杂交,在后代中可获得单倍体。
表4、bndmp突变体杂交后代中单倍体诱导率统计
杂交组合 总植株数 单倍体数 单倍体诱导率(%)
hau-A×WT 557 0 0.00
hau-A×bndmp-1 570 22 3.86
hau-A×bndmp-2 91 1 1.10
注:WT为油菜野生型材料Westar。
实施例3、NtDMP基因敲除的烟草突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除NtDMP基因
利用CRISPR/Cas9系统敲除烟草中的NtDMP基因(NtDMP表示NtDMP1、NtDMP2和NtDMP3三个基因),获得NtDMP基因敲除的烟草突变体。具体步骤如下:
1、sgRNA序列的选择
分别在NtDMP1、NtDMP2和NtDMP3基因上设计靶位点序列,长度为20bp。
靶位点1位于序列59第111-130位,靶位点1序列为TTGCTGGTTGAGGCAATTCG。
靶位点2位于序列59第278-297位,靶位点2序列为AATCATTAGTGTAGTGACAG。
靶位点3位于序列57第88-107位,序列61第88-107位,靶位点3序列为ATCGGAACATCGTTATCTGG。
靶位点4位于序列57第383-402位,序列59第383-402位,序列61第383-402位,靶位点4序列为ATGGATTTGTGACACCAAGA。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体为将序列72所示的DNA分子插入pDIRECT-22C载体后得到的载体。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化至农杆菌感受态细胞GV3101(农杆菌GV3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌GV3101/CRISPR/Cas9。
再将重组菌GV3101/CRISPR/Cas9采用农杆菌侵染方法转化至野生型烟草K326(重组农杆菌进行28℃扩繁,扩繁后的菌液用于烟草K326侵染)中,经过卡那抗性筛选后获得T0代转基因烟草植株。
4、NtDMP基因发生突变的转基因植株鉴定
采集步骤3获得的T0代转基因烟草植株叶片,并提取基因组DNA作为模板,采用如下引物进行PCR扩增,得到不同株系的PCR扩增产物。
NtDMP1基因突变序列检测引物的序列如下:
NtDMP1+3F2:ACTGAAAACTTCATTCGTGATCATT;
NtDMP1R1:TCGCCACAAATATTAATCCACATGA。
NtDMP2基因突变序列检测引物的序列如下:
NtDMP3F:GCAAAGTACTGAGGGAATTGGG;
NtDMP2R:AGACGATCGGTCTGGTGATA。
NtDMP3基因突变序列检测引物的序列如下:
NtDMP1+3F2:ACTGAAAACTTCATTCGTGATCATT;
NtDMP3R2:TCAACCCACATGGATGAATTCTG。
将不同株系的PCR扩增产物进行Sanger测序,根据测序结果分别与野生型烟草K326相应的NtDMP基因进行比对。根据以下原则分别对各个NtDMP的基因型进行鉴定。
自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的NtDMP基因突变,且另1条染色体上的NtDMP基因未突变),该株系为T0代转基因烟草杂合突变型株系;
自靶位点序列起具有特异单峰特征的序列,若与野生型烟草K326的NtDMP基因序列相同,则该株系的基因型为野生型,即NtDMP基因序列没有发生突变;若与野生型烟草K326的NtDMP基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的NtDMP基因发生突变),该株系为T0代转基因烟草纯合突变型株系。
5、T1代转基因烟草的基因型鉴定
将步骤4获得的T0代转基因烟草NtDMP基因突变株系自交,收获种子后再播种,得到T1代转基因烟草。鉴定T1代转基因烟草的NtDMP基因的基因型,具体方法如下:以T1代转基因烟草的基因组DNA为模板,分别利用NtDMP1、NtDMP2和NtDMP3基因的突变序列检测引物按照步骤4中的方法鉴定T1代转基因烟草NtDMP1、NtDMP2和NtDMP3基因的基因型。
最终获得T1代转基因烟草NtDMP基因突变纯合株系ntdmp-1和ntdmp-2。具体突变情况如下:
T1代转基因烟草3个NtDMP基因突变纯合型株系ntdmp-1与野生型烟草K326的基因组DNA的差异仅在于在编码NtDMP1的基因的两条同源染色体上均发生了碱基G缺失和片段缺失,该缺失碱基G位于序列57第91位,该缺失片段位于序列57第115-399位,且在编码NtDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列59第116-281位,且在编码NtDMP3的基因的两条同源染色体上均发生了碱基G缺失和片段缺失,该缺失碱基G位于序列61第91位,该缺失片段位于序列61第115-399位。
T1代转基因烟草3个NtDMP基因突变纯合型株系ntdmp-2与野生型烟草K326的基因组DNA的差异仅在于在编码NtDMP1的基因的两条同源染色体上均发生了碱基G缺失和碱基A缺失,该缺失碱基G位于序列57第91位,该缺失碱基A位于序列57第114位,且在编码NtDMP2的基因的两条同源染色体上均发生了碱基替换,该碱基替换为将序列59第111-280位所示的DNA分子替换为碱基T,且在编码NtDMP3的基因的两条同源染色体上均发生了碱基A插入,该插入碱基A位于序列61第400-401位之间。
取上述T1代转基因烟草突变株系用于下述单倍体诱导能力分析实验。
二、NtDMP基因敲除的烟草突变体在诱导产生单倍体中的应用
(一)NtDMP基因敲除的烟草突变体的单倍体自交诱导能力鉴定
由于野生烟草K326为纯合的自交系,在此背景上敲除NtDMP基因所获得突变体自交后代无法通过分子标记去鉴定单倍体。因此,将NtDMP基因所获得几种类型突变体自交所获得的种子种植,用如下方法对自交后代进行单倍体鉴别。
1、植株表型鉴别
将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常(图3a)。
2、流式细胞检测叶片鉴别
将上述步骤1获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体烟草叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体(图3b)。
NtDMP基因突变纯合株系自交的后代单株中,若按照上述2种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表5中可以看出,NtDMP基因突变后,在自交后代中可获得单倍体。
表5、ntdmp突变体自交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
WT 329 0 0
ntdmp-1 1111 8 0.72
ntdmp-2 291 3 1.03
注:WT为烟草野生型材料K326。
(二)NtDMP基因敲除的烟草突变体的单倍体杂交诱导能力鉴定
将NtDMP基因所获得不同类型组合的突变体分别与野生型烟草K326材料进行杂交获得后代,通过如下方法对后代中的单倍体进行鉴别。
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,四倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为弱荧光。
2、分子标记鉴别
将上述步骤1鉴定出的弱荧光的种子进一步种植,提取其基因组DNA,采用野生型烟草K326材料和转基因烟草突变株系间多态性引物(NtDMP3F+NtDMP2R)进行PCR扩增,并将扩增产物进行琼脂糖带型检测,若待测单株的扩增产物表现为1条带,认为该单株条带为野生型烟草K326材料带型,不存在父本材料的带型,则该单株是单倍体。若待测单株的扩增产物表现为2条带,认为该单株条带为野生型烟草K326材料和转基因烟草突变株系杂合带型,则该单株是正常杂交的后代,是四倍体。
3、植株表型鉴别
对上述步骤2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常(图3a,c)。
4、流式细胞检测叶片鉴别
将上述步骤3获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体烟草叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体(图3b)。
NtDMP基因突变纯合株系与野生型烟草K326材料杂交的后代单株中,若按照上述4种方法鉴定均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表6中可以看出,NtDMP基因突变后与其他材料杂交,在后代中可获得单倍体。
表6、ntdmp突变体杂交后代中单倍体诱导率统计
杂交组合 总植株数 单倍体数 单倍体诱导率(%)
K326×WT 521 0 0.00
K326×ntdmp-1 356 3 0.84
K326×ntdmp-2 675 11 1.63
注:WT为烟草野生型材料K326。
实施例4、GhDMP基因敲除的棉花突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除GhDMP基因
利用CRISPR/Cas9系统敲除棉花中的GhDMP基因(GhDMP基因表示GhDMP1和GhDMP2两个基因),获得GhDMP基因敲除的棉花突变体。具体步骤如下:
1、sgRNA序列的选择
分别在GhDMP1和GhDMP2基因上设计靶位点序列,长度为20bp。
靶位点1位于序列53第42-61位,序列55第42-61位,靶位点1序列为TACTGCAACACCACCCCCAG。
靶位点2位于序列53第79-98位,序列55第79-98位,靶位点2序列为AGTCGAGGGAGGGAAGAGAG。
靶位点3位于序列53第316-335位,序列55第316-335位,靶位点3序列为CATTTCACCGATAGTTTCCG。
靶位点4位于序列53第326-345位,靶位点4序列为ATAGTTTCCGAGGCCCCGAT。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体为将序列73所示的DNA分子插入pDIRECT-22C载体后得到的载体。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化至农杆菌感受态细胞GV3101(农杆菌GV3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌GV3101/CRISPR/Cas9。
再将重组菌GV3101/CRISPR/Cas9采用农杆菌侵染方法转化野生型棉花华棉1号(重组农杆菌进行28℃扩繁,扩繁后的菌液用于野生型棉花华棉1号侵染)中,经过卡那抗性筛选后获得T0代转基因棉花植株。
4、GhDMP基因发生突变的转基因植株鉴定
采集步骤3获得的T0代转基因棉花植株叶片,并提取基因组DNA作为模板。采用如下引物进行PCR扩增,得到不同株系的PCR扩增产物。
GhDMP1基因突变序列检测引物的序列如下:
GhDMP1F:ACATTAACACCAAGAATGGCTCAA;
GhDMP1R:CAACACCGACATCACGGCAT。
GhDMP2基因突变序列检测引物的序列如下:
GhDMP2F:TGGCTGCTTCATTCATACTTATCG;
GhDMP2R:GACGCCGAATCTAGTCTTTGGA。
将不同株系的PCR扩增产物进行Sanger测序,根据测序结果分别与野生型棉花华棉1号相应的GhDMP基因进行比对。根据以下原则分别对各个GhDMP的基因型进行鉴定。
自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的GhDMP基因突变,且另1条染色体上的GhDMP基因未突变),该株系为T0代转基因棉花杂合突变型株系;
自靶位点序列起具有特异单峰特征的序列,若与野生型华棉1号的GhDMP基因序列相同,则该株系的基因型为野生型,即GhDMP基因序列没有发生突变;若与野生型华棉1号的GhDMP基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的GhDMP基因发生突变),该株系为T0代转基因棉花纯合突变型株系。
5、T1代转基因棉花的基因型鉴定
将步骤4获得的T0代转基因棉花GhDMP基因突变株系自交,收获种子后再播种,得到T1代转基因棉花。鉴定T1代转基因棉花的GhDMP基因的基因型,具体方法如下:以T1代转基因棉花的基因组DNA为模板,分别利用GhDMP1和GhDMP2基因的突变序列检测引物按照步骤4中的方法鉴定T1代转基因棉花GhDMP1和GhDMP2基因的基因型。
最终获得T1代转基因棉花GhDMP基因突变纯合株系ghdmp-1和ghdmp-2。具体突变情况如下:
T1代转基因棉花GhDMP基因突变纯合型株系ghdmp-1与野生型华棉1号的基因组DNA的差异仅在于在编码GhDMP1的基因的两条同源染色体上均发生了碱基C缺失,该缺失碱基C位于序列53第342位,且在编码GhDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列55第54-58位。
T1代转基因棉花GhDMP基因突变纯合型株系ghdmp-2与野生型华棉1号的基因组DNA的差异仅在于在编码GhDMP1的基因的两条同源染色体上均发生了碱基替换和片段缺失,该碱基替换为将序列53第345位碱基T替换成碱基A,该缺失片段位于序列53第358-359位,且在编码GhDMP2的基因的两条同源染色体上均发生了片段缺失,该缺失片段位于序列55第59-83位。
取上述T1代转基因棉花突变株系用于下述单倍体诱导能力分析实验。
二、GhDMP基因敲除的棉花突变体在诱导产生单倍体中的应用
(一)GhDMP基因敲除的棉花突变体的单倍体自交诱导能力鉴定
由于野生棉花华棉1号为纯合的自交系,在此背景上敲除GhDMP基因所获得突变体自交后代无法通过分子标记去鉴定单倍体。因此,将GhDMP基因所获得不同类型组合的突变体自交所获得的种子种植,用如下方法对自交后代进行单倍体鉴别。
1、植株表型鉴别
将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常。
2、流式细胞检测叶片鉴别
将上述步骤1中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体棉花叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体。
GhDMP基因突变纯合型株系自交的后代单株中,若按照上述2种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表7中可以看出,GhDMP基因突变后,在自交后代中可获得单倍体。
表7、ghdmp突变体自交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
WT 261 0 0
ghdmp-1 203 1 0.49
ghdmp-2 236 2 0.85
注:WT为棉花野生型材料华棉1号。
(二)GhDMP基因敲除的棉花突变体的单倍体杂交诱导能力鉴定
将GhDMP基因所获得不同类型组合的突变体分别与野生型华棉1号进行杂交获得后代,通过如下方法对后代中的单倍体进行鉴别。
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,四倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为弱荧光。
2、分子标记鉴别
将上述步骤1鉴定出的弱荧光的种子进一步种植,提取其基因组DNA,采用野生型华棉1号和转基因棉花突变株系间多态性引物(GhDMP1F+GhDMP1R)进行PCR扩增,并将扩增产物进行琼脂糖带型检测后进行测序,若待测单株的扩增产物测序峰图结果表现为单一峰且与野生型华棉1号序列一致,认为该单株为野生型华棉1号带型,不存在父本材料的带型,则该单株是单倍体。若待测单株的扩增产物测序峰图结果为杂合峰,认为该单株为野生型华棉1号和转基因棉花突变株系杂合带型,则该单株是正常杂交的后代,是四倍体。
3、植株表型鉴别
对上述步骤2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,四倍体则表现为植株高大,叶片宽大,披散,育性正常。
4、流式细胞检测叶片鉴别
将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以四倍体棉花叶片作为对照;再用流式细胞仪器检测信号,首先检测四倍体细胞核信号,并将四倍体细胞核信号峰位设为100(由于四倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与四倍体细胞核信号强度富集位置相同,该待测植株为四倍体。
GhDMP基因突变纯合型株系与野生型华棉1号杂交的后代单株中,若按照上述4种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表8中可以看出,GhDMP基因突变后与其他材料杂交,在后代中可获得单倍体。
表8、ghdmp突变体杂交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
华棉1号×WT 331 0 0
华棉1号×ghdmp-1 164 1 0.61
华棉1号×ghdmp-2 316 1 0.32
注:WT为棉花野生型材料华棉1号。
实施例5、GmDMP基因敲除的大豆突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除大豆的GmDMP基因
利用CRISPR/Cas9系统敲除大豆中的GmDMP基因(GmDMP基因表示GmDMP1和GmDMP2两个基因),获得GmDMP基因敲除的大豆突变体。具体步骤如下:
1、sgRNA序列的选择
分别在GmDMP1和GmDMP2基因上设计靶位点序列,长度为20bp。
靶位点1位于序列43第96-115位,靶位点1序列为GATGTTTCTTGGGTTGTGGA。
靶位点2位于序列43第112-131位,序列45第112-131位,靶位点2序列为CATCGTGCCCTAATGGCAAA。
靶位点3位于序列45第168-187位,靶位点3序列为CTGTGGGGAGGAAGTTACCG。
靶位点4位于序列43第350-369位,序列45第350-369位,靶位点4序列为ACTATGGCTTCGTCACCCCG。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体的核苷酸序列如序列表中序列74所示。其中,序列74的第227-1826位为Bar抗性筛选标记表达元件p35s:Bar,第1851-7084位为Cas9表达元件p35s:Cas9,第7143-9456位为启动子AtOLEO1驱动TagRFP的表达元件,第9481-10882位为GmDMP1和GmDMP2基因的gRNA表达元件。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化至农杆菌感受态细胞EHA105(农杆菌EHA105感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌EHA105/CRISPR/Cas9。
再将重组菌EHA105/CRISPR/Cas9采用农杆菌侵染方法转化野生型大豆威廉姆斯82(重组农杆菌进行28℃扩繁,扩繁后的菌液用于野生型大豆威廉姆斯82侵染)中,经过Bar抗性筛选后获得T0代转基因大豆植株。
4、GmDMP基因发生突变的转基因植株鉴定
采集步骤3获得的T0代转基因大豆植株叶片,并提取基因组DNA作为模板。由于GmDMP1与GmDMP2基因高度同源,无法设计各自特异性扩增的引物。因此先采用引物对(GmDMPF/R)进行PCR扩增,得到不同株系的PCR扩增产物连接T载体后转化大肠杆菌感受态细胞(T载体和大肠杆菌感受态细胞购自北京全式金生物,公众可通过购买获得),挑取鉴定单克隆。
GmDMP1基因和GmDMP2基因突变序列检测引物的序列如下:
GmDMPF:TCTAAACGAACAACAAATCGGCA;
GmDMPR:CGACCTTAAACCTGTCGTCT。
每个T0代转基因大豆植株叶片至少挑取10个以上的正确单克隆进行Sanger测序,根据测序结果分别与野生型大豆威廉姆斯82的GmDMP1基因和GmDMP2基因进行比对。根据以下原则分别对各个GmDMP的基因型进行鉴定。
野生型大豆威廉姆斯82的GmDMP1基因和GmDMP2基因靶点外的序列间存在SNP(表9),具体根据SNP可以区分单克隆的序列是来源于GmDMP1基因还是GmDMP2基因。根据以下原则确定GmDMP基因突变情况。
表9、GmDMP1基因和GmDMP2基因靶点外的序列间SNP表
SNP的位置 GmDMP1基因(序列43) GmDMP2基因(序列45)
58 C G
77 T C
90 C A
396 C T
若所有单克隆都与野生型威廉姆斯82的GmDMP基因序列相同,则该株系的基因型为野生型,即GmDMP基因序列没有发生突变;若部分单克隆与野生型威廉姆斯82的GmDMP基因序列不同,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的GhDMP基因突变,且另1条染色体上的GhDMP基因未突变),该株系为T0代转基因大豆杂合突变型株系;若所有单克隆与野生型威廉姆斯82的GmDMP基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的GmDMP基因发生突变),该株系为T0代转基因大豆纯合突变型株系。
5、T1代转基因大豆的基因型鉴定
将步骤4获得的T0代转基因大豆GmDMP基因突变株系自交,收获种子后再播种,得到T1代转基因大豆。鉴定T1代转基因大豆的GmDMP基因的基因型,具体方法如下:以T1代转基因大豆的基因组DNA为模板,分别利用GmDMP1和GmDMP2基因的突变序列检测引物按照步骤4中的方法鉴定T1代转基因大豆GmDMP1和GmDMP2基因的基因型。
最终获得T1代转基因大豆GmDMP基因突变纯合株系gmdmp-1和gmdmp-2。具体突变情况如下:
T1代转基因大豆GmDMP基因突变纯合型株系gmdmp-1与野生型威廉姆斯82的基因组DNA的差异仅在于在编码GmDMP1的基因的两条同源染色体上均发生了226bp片段缺失和2个碱基缺失,缺失片段和缺失碱基分别位于序列43第85-310位和第367-368位,且在编码GmDMP2的基因的两条同源染色体上均发生了192bp片段缺失,该缺失片段位于序列45第175-366位。
T1代转基因大豆GmDMP基因突变纯合型株系gmdmp-2与野生型威廉姆斯82的基因组DNA的差异仅在于在编码GmDMP1的基因的两条同源染色体上均发生了267bp片段缺失,该缺失片段位于序列43第101-367位,且在编码GmDMP2的基因的两条同源染色体上均发生了195bp片段缺失,该缺失片段位于序列45第171-365位。
取上述T1代转基因大豆突变株系用于下述单倍体诱导能力分析实验。
二、GmDMP基因敲除的大豆突变体在诱导产生单倍体中的应用
(一)GmDMP基因敲除的大豆突变体的单倍体自交诱导能力鉴定
T1代转基因大豆GmDMP基因突变纯合型株系gmdmp-1和gmdmp-2自交后代中均出现大量败育的种子(图4a),这表明敲除GmDMP基因影响了正常双受精,有可能诱导单倍体产生。由于野生大豆威廉姆斯82为纯合的自交系,在此背景上敲除GmDMP基因所获得突变体自交后代无法通过分子标记去鉴定单倍体。因此,将GmDMP基因所获得不同类型组合的突变体自交所获得的种子种植,用如下方法对自交后代进行单倍体鉴别。
1、植株表型鉴别
将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常(图4b)。
2、流式细胞检测叶片鉴别
将上述步骤1中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体大豆叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为100(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体。
GmDMP基因突变纯合型株系自交的后代单株中,若按照上述2种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表10中可以看出,GmDMP基因突变后,在自交后代中可获得单倍体。
表10、gmdmp突变体自交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
WT 205 0 0
gmdmp-1 135 1 0.74
gmdmp-2 93 1 1.1
注:WT为大豆野生型材料威廉姆斯82。
(二)GmDMP基因敲除的大豆突变体的单倍体杂交诱导能力鉴定
将GmDMP基因所获得不同类型组合的突变体分别与野生型威廉姆斯82进行杂交获得后代,通过如下方法对后代中的单倍体进行鉴别。
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,二倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为弱荧光。
2、分子标记鉴别
将上述步骤1鉴定出的弱荧光的种子进一步种植,提取其基因组DNA,采用野生型威廉姆斯82和转基因大豆突变株系间多态性引物(GmDMPF+GmDMPR)进行PCR扩增,并将扩增产物进行琼脂糖带型检测,若待测单株的扩增产物表现为1条带,认为该单株条带为野生型威廉姆斯82材料带型,不存在父本材料的带型,则该单株是单倍体。若待测单株的扩增产物表现为2条带,认为该单株条带为野生型威廉姆斯82和转基因大豆突变株系杂合带型,则该单株是正常杂交的后代,是二倍体。
3、植株表型鉴别
对上述步骤2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常(图4b)。
4、流式细胞检测叶片鉴别
将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体大豆叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为100(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体。若待测植株的信号峰出现在100附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体。
GmDMP基因突变纯合型株系与野生型威廉姆斯82杂交的后代单株中,若按照上述4种方法鉴定结果均为单倍体,则该植株为单倍体植株;若上述任一种方法鉴定结果不为单倍体,则该植株不为单倍体植株。
统计上述鉴定结果并按照如下公式计算单倍体诱导率:单倍体诱导率(%)=(单倍体株数/总株数)×100。从表11中可以看出,GmDMP基因突变后与其他材料杂交,在后代中可获得单倍体。
表11、gmdmp突变体杂交后代中单倍体诱导率统计
基因型 总株数 单倍体株数 单倍体诱导率(%)
威廉姆斯82×WT 106 0 0
威廉姆斯82×gmdmp-1 93 1 1.1
威廉姆斯82×gmdmp-2 121 1 0.83
注:WT为大豆野生型材料威廉姆斯82。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110>中国农业大学
<120>孤雌生殖单倍体诱导基因及其应用
<160>76
<170>PatentIn version 3.5
<210>1
<211>651
<212>DNA
<213>Artificial Sequence
<400>1
atggctcaac ctgaagaaat tggaatcaaa gtttacacct ctccgaagta tgaaccctct 60
tcttcaacac agcagcctgc tctgccagag acagggagtc tgagtggggg gcgaaaacga 120
cgagcagttg ccaatggtgt tcagaaaaca atctcgaaaa cctcgatgct cgttaatttt 180
ctcccaacag ggacccttct cacgtttgag atggcgctcc cgtcgatcta tggcaaaggg 240
cattgcagtt ctgtcagcat tgtgatgatg aatgttctca tggggatttg cactctttcg 300
tgtttcttct ttcactttac ggatagtttc cgtggtccgg atgggaaggt ttactacggc 360
tttgtgacac caagtggtct ctcgttgttt aatcctgctg gtgttgcagt tccacaggat 420
gataggtata aagttggatt caatgacttc gtccatgcgg ttatgtctgt gatggttttt 480
gtggccatcg cgttctcaga ccatcgtgtc acggattgtt tgtttcctgg acacgccaag 540
gaaatggatg aagtgatgca gagctttcct ttgatggtgg gaattgtttg cagtggtctg 600
tttcttattt tcccgacgac tcgctctggt gtcgggctct tgcctgcttg a 651
<210>2
<211>216
<212>PRT
<213>Artificial Sequence
<400>2
Met Ala Gln Pro Glu Glu Ile Gly Ile Lys Val Tyr Thr Ser Pro Lys
1 5 10 15
Tyr Glu Pro Ser Ser Ser Thr Gln Gln Pro Ala Leu Pro Glu Thr Gly
20 25 30
Ser Leu Ser Gly Gly Arg Lys Arg Arg Ala Val Ala Asn Gly Val Gln
35 40 45
Lys Thr Ile Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly
50 55 60
Thr Leu Leu Thr Phe Glu Met Ala Leu Pro Ser Ile Tyr Gly Lys Gly
65 70 75 80
His Cys Ser Ser Val Ser Ile Val Met Met Asn Val Leu Met Gly Ile
85 90 95
Cys Thr Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly
100 105 110
Pro Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Pro Ser Gly Leu Ser
115 120 125
Leu Phe Asn Pro Ala Gly Val Ala Val Pro Gln Asp Asp Arg Tyr Lys
130 135 140
Val Gly Phe Asn Asp Phe Val His Ala Val Met Ser Val Met Val Phe
145 150 155 160
Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asp Cys Leu Phe Pro
165 170 175
Gly His Ala Lys Glu Met Asp Glu Val Met Gln Ser Phe Pro Leu Met
180 185 190
Val Gly Ile Val Cys Ser Gly Leu Phe Leu Ile Phe Pro Thr Thr Arg
195 200 205
Ser Gly Val Gly Leu Leu Pro Ala
210 215
<210>3
<211>693
<212>DNA
<213>Artificial Sequence
<400>3
atgcctgagt tacacaaaag aacgagaaaa accagaagca aaatggatca aactgagcaa 60
agtgttggaa tcagagtcta ctcctccagc cctcaacaaa atcttgatcc cacagtaacc 120
gttgatcctt ctgccaataa tgctggtggc cgcaaacgcc gtatagtggc ccaaggcgtg 180
cagaacacca tctcgaaaac ctcgatgctt gtaaacttcc tgccaacagg aactttactc 240
acttatgaaa tggtcattcc ttctatttac cataacggtg aatgctcctc tgtcacaacc 300
atgatgattt acttcttgtt ggcgctttgc tcgctttcgt gctttttctt ccactttaca 360
gacagtttcc gcggtccaga tgggaaagtt tactatggta ttgtgacgcc taatggtttg 420
tccgtgttta agcctggttt ggatgttgaa gtgcctaaag aggacaggta caaggccggg 480
gttacggact ttgtgcatgc ctttctctct gtcctggtgt ttgtggctat agccttttcg 540
gattataggg ttactaattg tgtgtttcca gggcgtgaga aggatatgca tgaaatgatg 600
gagagttttc cgttgatggt tggaattatt tgcagcagtt tgtttcttgt gtttcctaat 660
agccgatctg gtattggatg catgactgct tga 693
<210>4
<211>230
<212>PRT
<213>Artificial Sequence
<400>4
Met Pro Glu Leu His Lys Arg Thr Arg Lys Thr Arg Ser Lys Met Asp
1 5 10 15
Gln Thr Glu Gln Ser Val Gly Ile Arg Val Tyr Ser Ser Ser Pro Gln
20 25 30
Gln Asn Leu Asp Pro Thr Val Thr Val Asp Pro Ser Ala Asn Asn Ala
35 40 45
Gly Gly Arg Lys Arg Arg Ile Val Ala Gln Gly Val Gln Asn Thr Ile
50 55 60
Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu
65 70 75 80
Thr Tyr Glu Met Val Ile Pro Ser Ile Tyr His Asn Gly Glu Cys Ser
85 90 95
Ser Val Thr Thr Met Met Ile Tyr Phe Leu Leu Ala Leu Cys Ser Leu
100 105 110
Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly
115 120 125
Lys Val Tyr Tyr Gly Ile Val Thr Pro Asn Gly Leu Ser Val Phe Lys
130 135 140
Pro Gly Leu Asp Val Glu Val Pro Lys Glu Asp Arg Tyr Lys Ala Gly
145 150 155 160
Val Thr Asp Phe Val His Ala Phe Leu Ser Val Leu Val Phe Val Ala
165 170 175
Ile Ala Phe Ser Asp Tyr Arg Val Thr Asn Cys Val Phe Pro Gly Arg
180 185 190
Glu Lys Asp Met His Glu Met Met Glu Ser Phe Pro Leu Met Val Gly
195 200 205
Ile Ile Cys Ser Ser Leu Phe Leu Val Phe Pro Asn Ser Arg Ser Gly
210 215 220
Ile Gly Cys Met Thr Ala
225 230
<210>5
<211>669
<212>DNA
<213>Artificial Sequence
<400>5
atggaacaac ctgatgaata cggtgtccgg gtctacaccc cctccccaca gcccaacttc 60
acccgggtcc caaccccgcc cccaccgccc ccgctagacc cctccgcccc tagcggtgct 120
gcccgaagaa ggcgcgcgat ggccaacggc ttccaaaaaa cactctcaaa aacctcaatg 180
ctagtaaact tcctcccgag cggcacactt ctaacgttcg agatggtcct tccctcggtc 240
tatggcaaag gcgaatgcac cggggtcaca accctcatga tcaatgtcct actaatgatt 300
tgcacaatgt cttgtttttt cttccatttt acggatagtt ttcgtggggc ggatggaaag 360
atttattacg ggtttgccac cccgtggggc ctaaaagtgt ttaagacggc cccaccgggt 420
gttgaagtgc cgaaagacga gaggtttaaa cttgggttct cggactttgt gcacgcgatg 480
atgtcgtcga tggtttttct agcgattgcg ttttcggacc atcgggttac gaattgtttg 540
tttcctaggc acacggagga gatggatgaa gttatgcaaa gttttccgtt gatggttggg 600
attgtgtgta gtggtttgtt tttagtgttt ccgaataccc gatacgggat tggatgtttg 660
tcggcttga 669
<210>6
<211>222
<212>PRT
<213>Artificial Sequence
<400>6
Met Glu Gln Pro Asp Glu Tyr Gly Val Arg Val Tyr Thr Pro Ser Pro
1 5 10 15
Gln Pro Asn Phe Thr Arg Val Pro Thr Pro Pro Pro Pro Pro Pro Leu
20 25 30
Asp Pro Ser Ala Pro Ser Gly Ala Ala Arg Arg Arg Arg Ala Met Ala
35 40 45
Asn Gly Phe Gln Lys Thr Leu Ser Lys Thr Ser Met Leu Val Asn Phe
50 55 60
Leu Pro Ser Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Val
65 70 75 80
Tyr Gly Lys Gly Glu Cys Thr Gly Val Thr Thr Leu Met Ile Asn Val
85 90 95
Leu Leu Met Ile Cys Thr Met Ser Cys Phe Phe Phe His Phe Thr Asp
100 105 110
Ser Phe Arg Gly Ala Asp Gly Lys Ile Tyr Tyr Gly Phe Ala Thr Pro
115 120 125
Trp Gly Leu Lys Val Phe Lys Thr Ala Pro Pro Gly Val Glu Val Pro
130 135 140
Lys Asp Glu Arg Phe Lys Leu Gly Phe Ser Asp Phe Val His Ala Met
145 150 155 160
Met Ser Ser Met Val Phe Leu Ala Ile Ala Phe Ser Asp His Arg Val
165 170 175
Thr Asn Cys Leu Phe Pro Arg His Thr Glu Glu Met Asp Glu Val Met
180 185 190
Gln Ser Phe Pro Leu Met Val Gly Ile Val Cys Ser Gly Leu Phe Leu
195 200 205
Val Phe Pro Asn Thr Arg Tyr Gly Ile Gly Cys Leu Ser Ala
210 215 220
<210>7
<211>651
<212>DNA
<213>Artificial Sequence
<400>7
atggaaccat caccaccata cgacgaaacc ggcatccgaa tctacacccc atcaccccaa 60
accacacaca atccaccacc acaaaccacc acacccaccc accgtaaacg cctccaaaaa 120
acgatctcaa aaagcgtcca aaaaaccctc tcaaaaacct cattactcgt caacttcctc 180
cccaccggta ctctactaac attcgaaatg gtcctaccct caatctacgg caaaggccac 240
tgcacaacag tcgccacgct catgatcaac ttcttactcg caatttgcac gttttcttgc 300
tttttctttc acttcactga cagttttcac gggcccgatg gtaagatata ctacgggttc 360
gtgacgcctt cggggttgaa ggtgtttaag ccgactaggg agatcgaggt gccgaaagac 420
gagaggtata agagtggatt tactgattat gtgcacgcgt tgatgtcgtc tatggtgttt 480
atgtcgatcg cgttatcgga tcataggatt acggattgtt tgtttcctgg gcatggaaag 540
gagatggatg aagttatgca gagttttcct ttgatggttg ggattgtgtg tagtggtttg 600
tttcttatgt ttcctaatac ccggtatggg attgggtgtt tgtcggcttg a 651
<210>8
<211>216
<212>PRT
<213>Artificial Sequence
<400>8
Met Glu Pro Ser Pro Pro Tyr Asp Glu Thr Gly Ile Arg Ile Tyr Thr
1 5 10 15
Pro Ser Pro Gln Thr Thr His Asn Pro Pro Pro Gln Thr Thr Thr Pro
20 25 30
Thr His Arg Lys Arg Leu Gln Lys Thr Ile Ser Lys Ser Val Gln Lys
35 40 45
Thr Leu Ser Lys Thr Ser Leu Leu Val Asn Phe Leu Pro Thr Gly Thr
50 55 60
Leu Leu Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Gly Lys Gly His
65 70 75 80
Cys Thr Thr Val Ala Thr Leu Met Ile Asn Phe Leu Leu Ala Ile Cys
85 90 95
Thr Phe Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe His Gly Pro
100 105 110
Asp Gly Lys Ile Tyr Tyr Gly Phe Val Thr Pro Ser Gly Leu Lys Val
115 120 125
Phe Lys Pro Thr Arg Glu Ile Glu Val Pro Lys Asp Glu Arg Tyr Lys
130 135 140
Ser Gly Phe Thr Asp Tyr Val His Ala Leu Met Ser Ser Met Val Phe
145 150 155 160
Met Ser Ile Ala Leu Ser Asp His Arg Ile Thr Asp Cys Leu Phe Pro
165 170 175
Gly His Gly Lys Glu Met Asp Glu Val Met Gln Ser Phe Pro Leu Met
180 185 190
Val Gly Ile Val Cys Ser Gly Leu Phe Leu Met Phe Pro Asn Thr Arg
195 200 205
Tyr Gly Ile Gly Cys Leu Ser Ala
210 215
<210>9
<211>672
<212>DNA
<213>Artificial Sequence
<400>9
atggagcaaa ctgaagaagg aatgggcatc agggtgtaca gtgcaacccc atcccgaaac 60
ccttctcttc ctcagttgct tccgggagtc atacccggcg ctgacgccgg aaacaaaaac 120
ggtggtggcc ggaaaaggcg tgcagtggca aagggaatgc agaaaaccat atccaaaacc 180
tcaatgctcg tgaacttcct ccccacaggg acccttttga ccttcgagat ggttctcccg 240
tccgtttacc gttacggcga ttgcacggcg atcaacacca tgatgatcca cgttctgtta 300
accctttgcg ctctctcctg cttcttcttc cacttcacgg acagctttcg cggccccgac 360
gggaaagttt actacggcat ggttacgccg aaagggttgg cggtgttcaa gaccgggctg 420
gacgtggaga ttccgacaga tgagaggtat aagttaggcc tgactgactt cgtgcatgca 480
atcatgtcag tgatggtgtt catggcaata gccttctctg atcatcgcgt gacgaattgc 540
ctgttccctg gacacgagaa agagatggat caggtgatgg aaagttttcc gctaatggtg 600
ggtattattt gcagtggctt gttccttgtg tttcctaata ccaggtatgg cgttggctgc 660
atggctgcgt ga 672
<210>10
<211>223
<212>PRT
<213>Artificial Sequence
<400>10
Met Glu Gln Thr Glu Glu Gly Met Gly Ile Arg Val Tyr Ser Ala Thr
1 5 10 15
Pro Ser Arg Asn Pro Ser Leu Pro Gln Leu Leu Pro Gly Val Ile Pro
20 25 30
Gly Ala Asp Ala Gly Asn Lys Asn Gly Gly Gly Arg Lys Arg Arg Ala
35 40 45
Val Ala Lys Gly Met Gln Lys Thr Ile Ser Lys Thr Ser Met Leu Val
50 55 60
Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro
65 70 75 80
Ser Val Tyr Arg Tyr Gly Asp Cys Thr Ala Ile Asn Thr Met Met Ile
85 90 95
His Val Leu Leu Thr Leu Cys Ala Leu Ser Cys Phe Phe Phe His Phe
100 105 110
Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val Tyr Tyr Gly Met Val
115 120 125
Thr Pro Lys Gly Leu Ala Val Phe Lys Thr Gly Leu Asp Val Glu Ile
130 135 140
Pro Thr Asp Glu Arg Tyr Lys Leu Gly Leu Thr Asp Phe Val His Ala
145 150 155 160
Ile Met Ser Val Met Val Phe Met Ala Ile Ala Phe Ser Asp His Arg
165 170 175
Val Thr Asn Cys Leu Phe Pro Gly His Glu Lys Glu Met Asp Gln Val
180 185 190
Met Glu Ser Phe Pro Leu Met Val Gly Ile Ile Cys Ser Gly Leu Phe
195 200 205
Leu Val Phe Pro Asn Thr Arg Tyr Gly Val Gly Cys Met Ala Ala
210 215 220
<210>11
<211>696
<212>DNA
<213>Artificial Sequence
<400>11
atggatcaaa ctgaacaacc agaaattggt atcaaaatct acactgcatc accttcatca 60
ttaaaccctt ctcaataccc tccatcacca tctcttcttc ctccctcaga cccggcctca 120
ggcccgcaac tcacatcctc aggtgcacca aaaaaaaaga gagttgcagt tgcaaaatca 180
gtccaaaaaa ccctatcaaa aacatccatg ttagcacatt tccttcctac aggaacccta 240
ctcacatttg agatggtact cccttctatt tatggtgttg gtgaatgttc atctgtaaca 300
actattatga ctattatctt acttatatta tgtgcacttt catgtttttt cttccatttt 360
actgatagtt ttaaggctcc tgatggacgg gtttactatg gttttgttac tcgaaatggg 420
ttggcggttt ttaaacctgg tttggatgtt gaagttccta aagaggataa atataacgta 480
cattttgctg attttgtgca tgctatgatg tctgttatgg tgttcatggc gattgcgttt 540
tcggatcatc gggtcactaa ctgtcttcta ccgggtcatg ctaaggaaat ggaggaagca 600
atggagagtt ttccattgat ggttggtgtt gtttgtagtt gtcttttcct tatttttcct 660
aaggctcgtt ttggtgttgg atgcatggct acttag 696
<210>12
<211>231
<212>PRT
<213>Artificial Sequence
<400>12
Met Asp Gln Thr Glu Gln Pro Glu Ile Gly Ile Lys Ile Tyr Thr Ala
1 5 10 15
Ser Pro Ser Ser Leu Asn Pro Ser Gln Tyr Pro Pro Ser Pro Ser Leu
20 25 30
Leu Pro Pro Ser Asp Pro Ala Ser Gly Pro Gln Leu Thr Ser Ser Gly
35 40 45
Ala Pro Lys Lys Lys Arg Val Ala Val Ala Lys Ser Val Gln Lys Thr
50 55 60
Leu Ser Lys Thr Ser Met Leu Ala His Phe Leu Pro Thr Gly Thr Leu
65 70 75 80
Leu Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Gly Val Gly Glu Cys
85 90 95
Ser Ser Val Thr Thr Ile Met Thr Ile Ile Leu Leu Ile Leu Cys Ala
100 105 110
Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Pro Asp
115 120 125
Gly Arg Val Tyr Tyr Gly Phe Val Thr Arg Asn Gly Leu Ala Val Phe
130 135 140
Lys Pro Gly Leu Asp Val Glu Val Pro Lys Glu Asp Lys Tyr Asn Val
145 150 155 160
His Phe Ala Asp Phe Val His Ala Met Met Ser Val Met Val Phe Met
165 170 175
Ala Ile Ala Phe Ser Asp His Arg Val Thr Asn Cys Leu Leu Pro Gly
180 185 190
His Ala Lys Glu Met Glu Glu Ala Met Glu Ser Phe Pro Leu Met Val
195 200 205
Gly Val Val Cys Ser Cys Leu Phe Leu Ile Phe Pro Lys Ala Arg Phe
210 215 220
Gly Val Gly Cys Met Ala Thr
225 230
<210>13
<211>669
<212>DNA
<213>Artificial Sequence
<400>13
atggacgaac acacagtaac ctccgatgaa gatctcggaa tcaaaatcta cacctccacg 60
ccgccgaacg aagaaccccc ctcctcctac actacagacc accacccccc caacgatggt 120
ggccggaaaa gacgagcaat ggcaaaagga atgcaaaaaa cactctcaaa aacctcaatg 180
ctggtaaact tccttccaac cggcactctc ctaaccttcg aaatgcttct cccgtcggtc 240
tccggcaagg gggagtgcac gccggtgaac acgatgatga taaacttcct cctgggctta 300
tgcgctctat cctgtttctt gtttcacttc acagacagtt tcaaaggcgt ggacgggaaa 360
gtgtattacg ggatcgtgac gccgagaggg ctggcggtgt tcaagacggg ggtgagggag 420
gaggaagtgc cgaaggagga gaggtttaaa gttgggataa cggattttgt tcacgcggtt 480
atgtctgtaa tggtattcat ggcgattgct ttctcggatc atagagtgac caattgtttg 540
tttccgggac atgtggcgga tatggaagag attatggaaa gctttccttt gatggtggga 600
accatttgta gtgctttgtt cttggtgttt cctaatacta gatatggtat tggttgtatg 660
gctaattga 669
<210>14
<211>222
<212>PRT
<213>Artificial Sequence
<400>14
Met Asp Glu His Thr Val Thr Ser Asp Glu Asp Leu Gly Ile Lys Ile
1 5 10 15
Tyr Thr Ser Thr Pro Pro Asn Glu Glu Pro Pro Ser Ser Tyr Thr Thr
20 25 30
Asp His His Pro Pro Asn Asp Gly Gly Arg Lys Arg Arg Ala Met Ala
35 40 45
Lys Gly Met Gln Lys Thr Leu Ser Lys Thr Ser Met Leu Val Asn Phe
50 55 60
Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met Leu Leu Pro Ser Val
65 70 75 80
Ser Gly Lys Gly Glu Cys Thr Pro Val Asn Thr Met Met Ile Asn Phe
85 90 95
Leu Leu Gly Leu Cys Ala Leu Ser Cys Phe Leu Phe His Phe Thr Asp
100 105 110
Ser Phe Lys Gly Val Asp Gly Lys Val Tyr Tyr Gly Ile Val Thr Pro
115 120 125
Arg Gly Leu Ala Val Phe Lys Thr Gly Val Arg Glu Glu Glu Val Pro
130 135 140
Lys Glu Glu Arg Phe Lys Val Gly Ile Thr Asp Phe Val His Ala Val
145 150 155 160
Met Ser Val Met Val Phe Met Ala Ile Ala Phe Ser Asp His Arg Val
165 170 175
Thr Asn Cys Leu Phe Pro Gly His Val Ala Asp Met Glu Glu Ile Met
180 185 190
Glu Ser Phe Pro Leu Met Val Gly Thr Ile Cys Ser Ala Leu Phe Leu
195 200 205
Val Phe Pro Asn Thr Arg Tyr Gly Ile Gly Cys Met Ala Asn
210 215 220
<210>15
<211>651
<212>DNA
<213>Artificial Sequence
<400>15
atggaggatc acacactaac caccacccat gaagatctcg gaatcaaaat ctatacctcc 60
acacccacca acgaagaaac agaccaccac cccgacggcg gtgcccggaa aagaagagca 120
atggcaaaag gaatgcaaaa aacactctca aaaacctcaa tgctagtaaa cttccttcca 180
accggcactc tcctaacctt cgaaatgctt ctgccgtcgg tctccggtaa gggggagtgc 240
acgccggtga acacaatgat gataaacttt ctcctgggcc tatgcgctct atcatgtttc 300
ttgtttcact tcacggacag tttcaaaggc gtggacggaa aagtttatta cgggatcgtg 360
acgccgcgag ggctggcggt gttcaaggcg ggggtgaggg aggtggaagt ggcgaaggag 420
gagaggttta aagtgaggat aacggatttt gttcatgcgg ttatgtctgt aatggtattc 480
atggcgatag cgttttcgga tcatagagtg accaattgtt tgtttggtgg agacgtgaag 540
gatatggaag aggttatgga aagctttcct ttgatggtgg caaccatttg tagtgctttg 600
ttttttgtgt ttcctaatac tcgatatggt attggctgta tgcctaattg a 651
<210>16
<211>216
<212>PRT
<213>Artificial Sequence
<400>16
Met Glu Asp His Thr Leu Thr Thr Thr His Glu Asp Leu Gly Ile Lys
1 5 10 15
Ile Tyr Thr Ser Thr Pro Thr Asn Glu Glu Thr Asp His His Pro Asp
20 25 30
Gly Gly Ala Arg Lys Arg Arg Ala Met Ala Lys Gly Met Gln Lys Thr
35 40 45
Leu Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu
50 55 60
Leu Thr Phe Glu Met Leu Leu Pro Ser Val Ser Gly Lys Gly Glu Cys
65 70 75 80
Thr Pro Val Asn Thr Met Met Ile Asn Phe Leu Leu Gly Leu Cys Ala
85 90 95
Leu Ser Cys Phe Leu Phe His Phe Thr Asp Ser Phe Lys Gly Val Asp
100 105 110
Gly Lys Val Tyr Tyr Gly Ile Val Thr Pro Arg Gly Leu Ala Val Phe
115 120 125
Lys Ala Gly Val Arg Glu Val Glu Val Ala Lys Glu Glu Arg Phe Lys
130 135 140
Val Arg Ile Thr Asp Phe Val His Ala Val Met Ser Val Met Val Phe
145 150 155 160
Met Ala Ile Ala Phe Ser Asp His Arg Val Thr Asn Cys Leu Phe Gly
165 170 175
Gly Asp Val Lys Asp Met Glu Glu Val Met Glu Ser Phe Pro Leu Met
180 185 190
Val Ala Thr Ile Cys Ser Ala Leu Phe Phe Val Phe Pro Asn Thr Arg
195 200 205
Tyr Gly Ile Gly Cys Met Pro Asn
210 215
<210>17
<211>657
<212>DNA
<213>Artificial Sequence
<400>17
atggaacaaa cacaacaaga aattggaatc aaaatctaca atacaacacc gccaccacaa 60
gaagtcatgg gggccgtaac gcagcagcct tctgatccac cggaacatgg caagaagcgt 120
cgtgccataa tggcgaaagg cgtgcaaaaa accctttcaa aaacttcctt acttggtaac 180
ttccttccat caggaacact cctcacattc gaaatggtcc ttccttcgat ctataggaac 240
ggccaatgta ctcacgtaca caccatcatg atccatttcc ttttaattat atgtgcactc 300
tcttgtttct tttttcactt tacagatagt tttcacggcg ctgatggtaa tgtttactat 360
ggttttgtta ccccgaaagg gttatccgtt tttaaaccag gacttgctgt tttggttcct 420
aacgacgaca aatacaaggt agggtttcaa gattttgttc atgcagttat gtcagttatg 480
gtgtttgtgg cgatcgcttt ttcggattat agggtgagta attgtttgtt tcctggacat 540
gaaagggaaa tggatcaagt tatggagagt tttccattga tggttggaat tgtttgtagc 600
ggtttgtttc ttatttttcc aacttcaagg cgtggaattg gatgcatgtc tgcctaa 657
<210>18
<211>218
<212>PRT
<213>Artificial Sequence
<400>18
Met Glu Gln Thr Gln Gln Glu Ile Gly Ile Lys Ile Tyr Asn Thr Thr
1 5 10 15
Pro Pro Pro Gln Glu Val Met Gly Ala Val Thr Gln Gln Pro Ser Asp
20 25 30
Pro Pro Glu His Gly Lys Lys Arg Arg Ala Ile Met Ala Lys Gly Val
35 40 45
Gln Lys Thr Leu Ser Lys Thr Ser Leu Leu Gly Asn Phe Leu Pro Ser
50 55 60
Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asn
65 70 75 80
Gly Gln Cys Thr His Val His Thr Ile Met Ile His Phe Leu Leu Ile
85 90 95
Ile Cys Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe His
100 105 110
Gly Ala Asp Gly Asn Val Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu
115 120 125
Ser Val Phe Lys Pro Gly Leu Ala Val Leu Val Pro Asn Asp Asp Lys
130 135 140
Tyr Lys Val Gly Phe Gln Asp Phe Val His Ala Val Met Ser Val Met
145 150 155 160
Val Phe Val Ala Ile Ala Phe Ser Asp Tyr Arg Val Ser Asn Cys Leu
165 170 175
Phe Pro Gly His Glu Arg Glu Met Asp Gln Val Met Glu Ser Phe Pro
180 185 190
Leu Met Val Gly Ile Val Cys Ser Gly Leu Phe Leu Ile Phe Pro Thr
195 200 205
Ser Arg Arg Gly Ile Gly Cys Met Ser Ala
210 215
<210>19
<211>729
<212>DNA
<213>Artificial Sequence
<400>19
atggaacaaa ctcaacaaga aattgggatc aaagtctaca atgcaactcc tccaccacaa 60
gaggccatag gcggcgtcac acaccagcct ttcgatccac cggaacctgg caagaaacgt 120
cgcgccataa tggcaaaagg tgtccaaaaa accctctcaa aaacatcctt actcggaaac 180
ttccttccaa caggaacact cataacattc gaaatggtcc ttccttcaat ctaccgaaat 240
ggtcaatgca ctcatgttca taccatcatg atccatttcc tcttaatcat gtgtgcactc 300
tcttgtttct tctttcactt taccgacagt tttcacggcg cggatggtaa cgtttactat 360
ggttttgcta ctcggaacgg gttgtctgtt tttaaaccgg gactcactgt tttggttcct 420
aatgatgaca agtacaaagt tgggtttcaa gatttcgtgc atgcggttat gtcggttatg 480
gtgtttgtgg ctatcgcttt ttcggattat agggttacta attgtttatt tcctggacat 540
gaaaaagaga tggatcaagt tatggagagt tttcctttga tggttggaat aatttgtagc 600
ggtttgttcc ttatttttcc tacttcaagg catggaattg gatgcatgtc ttcctaa 657
<210>20
<211>218
<212>PRT
<213>Artificial Sequence
<400>20
Met Glu Gln Thr Gln Gln Glu Ile Gly Ile Lys Val Tyr Asn Ala Thr
1 5 10 15
Pro Pro Pro Gln Glu Ala Ile Gly Gly Val Thr His Gln Pro Phe Asp
20 25 30
Pro Pro Glu Pro Gly Lys Lys Arg Arg Ala Ile Met Ala Lys Gly Val
35 40 45
Gln Lys Thr Leu Ser Lys Thr Ser Leu Leu Gly Asn Phe Leu Pro Thr
50 55 60
Gly Thr Leu Ile Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asn
65 70 75 80
Gly Gln Cys Thr His Val His Thr Ile Met Ile His Phe Leu Leu Ile
85 90 95
Met Cys Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe His
100 105 110
Gly Ala Asp Gly Asn Val Tyr Tyr Gly Phe Ala Thr Arg Asn Gly Leu
115 120 125
Ser Val Phe Lys Pro Gly Leu Thr Val Leu Val Pro Asn Asp Asp Lys
130 135 140
Tyr Lys Val Gly Phe Gln Asp Phe Val His Ala Val Met Ser Val Met
145 150 155 160
Val Phe Val Ala Ile Ala Phe Ser Asp Tyr Arg Val Thr Asn Cys Leu
165 170 175
Phe Pro Gly His Glu Lys Glu Met Asp Gln Val Met Glu Ser Phe Pro
180 185 190
Leu Met Val Gly Ile Ile Cys Ser Gly Leu Phe Leu Ile Phe Pro Thr
195 200 205
Ser Arg His Gly Ile Gly Cys Met Ser Ser
210 215
<210>21
<211>651
<212>DNA
<213>Artificial Sequence
<400>21
atggagccca accctcaaga cgctatcgga gtcaacatct acaccgcttc tcccaccgaa 60
gaatcaaccc aaatcccatc ctcttcccag gccactgctc aggttggccg gaaaaggcga 120
gcagttgcta agggagtgca gaaaacaata tccaaaactt caatgctcgt caacttcctt 180
ccaacgggga cccttctcac gtttgagatg gtcctcccgt ctgtctccgg caacggtcag 240
tgctctccgg ttagcaccca aatgatctac gcccttctgg gcctctgcac cctctcgtgc 300
ttcttctttc acttcacaga cagtttccga ggtcccgacg gcaaagtcta ttacgggttc 360
gtgaccccaa aaggtctatc ggtgttcaag gccgggcttg gcgtggaagt tccaaaggac 420
gacaagtaca gagttgggtt ctcggatttc gtccatgcga tcatgtcggt aatggttttc 480
gtggcgattg ctttctcgga tcatcgagtc acggattgta tttttcctgg acatgccaag 540
gacatggacg aagttatgga gagtttccct ctgatggttg ggattatatg cagtggtctc 600
ttcttggtct ttccaaatac tcgatttgga atcggatgca tggctacctg a 651
<210>22
<211>216
<212>PRT
<213>Artificial Sequence
<400>22
Met Glu Pro Asn Pro Gln Asp Ala Ile Gly Val Asn Ile Tyr Thr Ala
1 5 10 15
Ser Pro Thr Glu Glu Ser Thr Gln Ile Pro Ser Ser Ser Gln Ala Thr
20 25 30
Ala Gln Val Gly Arg Lys Arg Arg Ala Val Ala Lys Gly Val Gln Lys
35 40 45
Thr Ile Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr
50 55 60
Leu Leu Thr Phe Glu Met Val Leu Pro Ser Val Ser Gly Asn Gly Gln
65 70 75 80
Cys Ser Pro Val Ser Thr Gln Met Ile Tyr Ala Leu Leu Gly Leu Cys
85 90 95
Thr Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly Pro
100 105 110
Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu Ser Val
115 120 125
Phe Lys Ala Gly Leu Gly Val Glu Val Pro Lys Asp Asp Lys Tyr Arg
130 135 140
Val Gly Phe Ser Asp Phe Val His Ala Ile Met Ser Val Met Val Phe
145 150 155 160
Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asp Cys Ile Phe Pro
165 170 175
Gly His Ala Lys Asp Met Asp Glu Val Met Glu Ser Phe Pro Leu Met
180 185 190
Val Gly Ile Ile Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Thr Arg
195 200 205
Phe Gly Ile Gly Cys Met Ala Thr
210 215
<210>23
<211>666
<212>DNA
<213>Artificial Sequence
<400>23
atggagaaat cctcagaaga aatcggcata aaaatctaca ccgcctcccc gacactcgac 60
ctaccgccgc tttacccctg ttcgccgccg tcctccacta cccctctacc ctcaaacgcc 120
ggccggaaaa gacgagcggt ggcgagcggc gtgcagaaaa ccctctccaa aacctcgttg 180
ctcgccaact ttctacccac cgggaccctg ctcaccttcg aaatggtcct cccgtcggtc 240
tacgccaacg gggaatgctc ctctgtgacg acccacatga tatactcttt gttaggcctc 300
tgcactctct cttgcttctt cttccacttc acggattctt tccgggggcc cgacgggaaa 360
gtgtactacg ggttcgtgac tctaagcggg ctggcggttt tcaaaacggg cctcggggtg 420
gaggtgccga aagacgacag gtataaggta gggttgagcg atttcgtgca tgcactgatg 480
tctgttcttg tgtttgtggc gattgcattt tctgatcatc gggtcacggg ttgtgtgttc 540
ccgggtcatg cagcagagtt ggatgaagtg atgcagagtt ttccactgat ggtggggatc 600
atttgcagtg ggctgtttct tgtgtttcct acaactagat atggcatcgg ttgtgtgtct 660
gcttga 666
<210>24
<211>221
<212>PRT
<213>Artificial Sequence
<400>24
Met Glu Lys Ser Ser Glu Glu Ile Gly Ile Lys Ile Tyr Thr Ala Ser
1 5 10 15
Pro Thr Leu Asp Leu Pro Pro Leu Tyr Pro Cys Ser Pro Pro Ser Ser
20 25 30
Thr Thr Pro Leu Pro Ser Asn Ala Gly Arg Lys Arg Arg Ala Val Ala
35 40 45
Ser Gly Val Gln Lys Thr Leu Ser Lys Thr Ser Leu Leu Ala Asn Phe
50 55 60
Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Val
65 70 75 80
Tyr Ala Asn Gly Glu Cys Ser Ser Val Thr Thr His Met Ile Tyr Ser
85 90 95
Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe Phe His Phe Thr Asp
100 105 110
Ser Phe Arg Gly Pro Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Leu
115 120 125
Ser Gly Leu Ala Val Phe Lys Thr Gly Leu Gly Val Glu Val Pro Lys
130 135 140
Asp Asp Arg Tyr Lys Val Gly Leu Ser Asp Phe Val His Ala Leu Met
145 150 155 160
Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr
165 170 175
Gly Cys Val Phe Pro Gly His Ala Ala Glu Leu Asp Glu Val Met Gln
180 185 190
Ser Phe Pro Leu Met Val Gly Ile Ile Cys Ser Gly Leu Phe Leu Val
195 200 205
Phe Pro Thr Thr Arg Tyr Gly Ile Gly Cys Val Ser Ala
210 215 220
<210>25
<211>654
<212>DNA
<213>Artificial Sequence
<400>25
atggagcaaa ctggagaaga ttttggaatc aaaatctaca ctgcatcccc cagaaatgat 60
ccagtgccat tttcttcttc caatattcct caagcccctc aagaaccagg cgccaaaagg 120
cgagccgttg ctaaaggagt ccaaaaaact ctttcaaaaa cttcaatgct cgtaaacttc 180
cttcctacag gaaccctttt aacctttgaa atgattcttc catctgtaat caagaatgga 240
gagtgtactc atgtttctat tcttatgctt cttgtccttc ttggcctctg cgctgtttct 300
tgcttctttt ttcatttcac agacagtttc aaaggccctg acgggaaagt ttactatggc 360
tttgttactc caaaagggtt ggctgttttc aagcctggac ttgctgtgga agtgcctaaa 420
gatgagaggt ataaagttgg attcactgat ttcgttcatg ctatgatgtc tgtcatggtc 480
tttgtggcga ttgccttctc agatcatagg gtaaccgatt gtctgtttcc tggtcacgtt 540
aaggagatgg atcaagtgat ggagagtttt cctcttatgg ttggtatagt ctgcagtggc 600
ctgtttctgg tcttccctaa tactcgatat ggaataggtt gcatggccac ttga 654
<210>26
<211>217
<212>PRT
<213>Artificial Sequence
<400>26
Met Glu Gln Thr Gly Glu Asp Phe Gly Ile Lys Ile Tyr Thr Ala Ser
1 5 10 15
Pro Arg Asn Asp Pro Val Pro Phe Ser Ser Ser Asn Ile Pro Gln Ala
20 25 30
Pro Gln Glu Pro Gly Ala Lys Arg Arg Ala Val Ala Lys Gly Val Gln
35 40 45
Lys Thr Leu Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly
50 55 60
Thr Leu Leu Thr Phe Glu Met Ile Leu Pro Ser Val Ile Lys Asn Gly
65 70 75 80
Glu Cys Thr His Val Ser Ile Leu Met Leu Leu Val Leu Leu Gly Leu
85 90 95
Cys Ala Val Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Gly
100 105 110
Pro Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu Ala
115 120 125
Val Phe Lys Pro Gly Leu Ala Val Glu Val Pro Lys Asp Glu Arg Tyr
130 135 140
Lys Val Gly Phe Thr Asp Phe Val His Ala Met Met Ser Val Met Val
145 150 155 160
Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asp Cys Leu Phe
165 170 175
Pro Gly His Val Lys Glu Met Asp Gln Val Met Glu Ser Phe Pro Leu
180 185 190
Met Val Gly Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Thr
195 200 205
Arg Tyr Gly Ile Gly Cys Met Ala Thr
210 215
<210>27
<211>660
<212>DNA
<213>Artificial Sequence
<400>27
atggtccaaa ctggacaaga ttttggaatc aaaatctaca ctgcatctcc caagaatgac 60
ccaatgccat tctcttcttc ttccaatatt cctcaagccc ctaaagaacc agggtccaaa 120
aggcgagcgg tggccaaggg agttcagaaa accttttcta aaacttcgat gcttgtaaac 180
tttcttccta caggaaccct tttaaccttt gaaatgattc ttcctactgt aatcaagaat 240
ggagagtgta ctactcatgt ttctattctg atgcttcttg tccttcttgg cctctgcact 300
gtctcttgct ttttctttca tttcacagac agtttcaaag gctctgatgg gaaagtttac 360
tatggctttg ttactcctaa agggttagct gttttcaagc ctggtcttgc tgtggaagtg 420
cctaaagatg agaagtacaa agttggattc actgatttcg ttcatgccat catgtccgtc 480
atggtctttg tggcgattgc cttctccgat catagggtca ccgattgtct gtttcctggg 540
catgttaagg agatggatca agtgatggag agttttcctc ttatggttgg tatcgtttgc 600
agtggcctgt ttctgctttt ccctaataca cgatatgggg taggttgcat ggctacttga 660
<210>28
<211>219
<212>PRT
<213>Artificial Sequence
<400>28
Met Val Gln Thr Gly Gln Asp Phe Gly Ile Lys Ile Tyr Thr Ala Ser
1 5 10 15
Pro Lys Asn Asp Pro Met Pro Phe Ser Ser Ser Ser Asn Ile Pro Gln
20 25 30
Ala Pro Lys Glu Pro Gly Ser Lys Arg Arg Ala Val Ala Lys Gly Val
35 40 45
Gln Lys Thr Phe Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr
50 55 60
Gly Thr Leu Leu Thr Phe Glu Met Ile Leu Pro Thr Val Ile Lys Asn
65 70 75 80
Gly Glu Cys Thr Thr His Val Ser Ile Leu Met Leu Leu Val Leu Leu
85 90 95
Gly Leu Cys Thr Val Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe
100 105 110
Lys Gly Ser Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Pro Lys Gly
115 120 125
Leu Ala Val Phe Lys Pro Gly Leu Ala Val Glu Val Pro Lys Asp Glu
130 135 140
Lys Tyr Lys Val Gly Phe Thr Asp Phe Val His Ala Ile Met Ser Val
145 150 155 160
Met Val Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asp Cys
165 170 175
Leu Phe Pro Gly His Val Lys Glu Met Asp Gln Val Met Glu Ser Phe
180 185 190
Pro Leu Met Val Gly Ile Val Cys Ser Gly Leu Phe Leu Leu Phe Pro
195 200 205
Asn Thr Arg Tyr Gly Val Gly Cys Met Ala Thr
210 215
<210>29
<211>654
<212>DNA
<213>Artificial Sequence
<400>29
atggagcaaa ctggagaaga ttttggaatc aaaatctaca ctgcatcacc caaaaatgat 60
ccaatgccgt tctcttcttc caatactcct caagccccta aagcaccagg atccaaaagg 120
agagttgtcg ctaaaggcgt ccaaaaaact ctttcgaaaa cttcaatgct cgtaaacttc 180
cttcctacag gaacgctttt aacctttgag atggttctgc catcaattgt caagaacgga 240
gagtgtactc acatttctat tctgatgctt cttgtgcttc tcggtctctg tgctgtctct 300
tgcttcttct ttcatttcac tgacagtttc aaaggccctg atggcaaagt ttactatggc 360
tttgttactc caaatgggtt ggctgttttc aagcctggac ttgacgtcga tgtgcctaaa 420
gatgagaggt ttaaagttgg attcactgat tttgttcatg ctatgatgtc ggttatggtg 480
tttgtagcga ttgccttctc tgatcatagg gtcaccgatt gtctgtttcc gggacatgtt 540
aaggagatgg atcaagtgat ggagagtttt cctcttatgg ttggtattgt ctgcagtggc 600
ctgtttctgg tcttccctaa tactcgatat ggcataggtt gcatggctac ttga 654
<210>30
<211>217
<212>PRT
<213>Artificial Sequence
<400>30
Met Glu Gln Thr Gly Glu Asp Phe Gly Ile Lys Ile Tyr Thr Ala Ser
1 5 10 15
Pro Lys Asn Asp Pro Met Pro Phe Ser Ser Ser Asn Thr Pro Gln Ala
20 25 30
Pro Lys Ala Pro Gly Ser Lys Arg Arg Val Val Ala Lys Gly Val Gln
35 40 45
Lys Thr Leu Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly
50 55 60
Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Ile Val Lys Asn Gly
65 70 75 80
Glu Cys Thr His Ile Ser Ile Leu Met Leu Leu Val Leu Leu Gly Leu
85 90 95
Cys Ala Val Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Gly
100 105 110
Pro Asp Gly Lys Val Tyr Tyr Gly Phe Val Thr Pro Asn Gly Leu Ala
115 120 125
Val Phe Lys Pro Gly Leu Asp Val Asp Val Pro Lys Asp Glu Arg Phe
130 135 140
Lys Val Gly Phe Thr Asp Phe Val His Ala Met Met Ser Val Met Val
145 150 155 160
Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asp Cys Leu Phe
165 170 175
Pro Gly His Val Lys Glu Met Asp Gln Val Met Glu Ser Phe Pro Leu
180 185 190
Met Val Gly Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Thr
195 200 205
Arg Tyr Gly Ile Gly Cys Met Ala Thr
210 215
<210>31
<211>642
<212>DNA
<213>Artificial Sequence
<400>31
atggaacaag cagaaggaat tggaatcaaa atctacgatg cggctccgca ggagacaccc 60
tcacgcccct catctccgca gttggtccca gagacaggcc ggcgaaagcg agcagtggcg 120
aagggagtgc agaagaccct gtccaagacc tcaatgcttg tcaacttcct ccctacaggg 180
acccttctca ctttcgaaat gcttctgcca tcagtctccg gtgacggcca gtgctctccg 240
gtaaacacca tgatgattga ggtcctaatg ggcctctgtg tcctctcatg tttcttcttc 300
cattttacag acagtttcag agggccggac gggaaggtct actacgggtt tgtgacccca 360
agtggattat cgctgttcaa gtcaggactg ggtgtggagg tccccaagga cgaccgattc 420
aaggttgggt ttacagactt cgtgcatgcg atcatgtctg tgatggtttt cgtggccatt 480
gccttctctg atcatcgggt gacggattgt ctgttccggg gacatgtgaa ggagatggat 540
gaggtgatgg agagtttccc tctaatggtg ggtgtgatat gcagtagcct gtttctggtc 600
ttcccaaaca ctcgctatgg catagggtgc atggcagcct ga 642
<210>32
<211>213
<212>PRT
<213>Artificial Sequence
<400>32
Met Glu Gln Ala Glu Gly Ile Gly Ile Lys Ile Tyr Asp Ala Ala Pro
1 5 10 15
Gln Glu Thr Pro Ser Arg Pro Ser Ser Pro Gln Leu Val Pro Glu Thr
20 25 30
Gly Arg Arg Lys Arg Ala Val Ala Lys Gly Val Gln Lys Thr Leu Ser
35 40 45
Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr
50 55 60
Phe Glu Met Leu Leu Pro Ser Val Ser Gly Asp Gly Gln Cys Ser Pro
65 70 75 80
Val Asn Thr Met Met Ile Glu Val Leu Met Gly Leu Cys Val Leu Ser
85 90 95
Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys
100 105 110
Val Tyr Tyr Gly Phe Val Thr Pro Ser Gly Leu Ser Leu Phe Lys Ser
115 120 125
Gly Leu Gly Val Glu Val Pro Lys Asp Asp Arg Phe Lys Val Gly Phe
130 135 140
Thr Asp Phe Val His Ala Ile Met Ser Val Met Val Phe Val Ala Ile
145 150 155 160
Ala Phe Ser Asp His Arg Val Thr Asp Cys Leu Phe Arg Gly His Val
165 170 175
Lys Glu Met Asp Glu Val Met Glu Ser Phe Pro Leu Met Val Gly Val
180 185 190
Ile Cys Ser Ser Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly Ile
195 200 205
Gly Cys Met Ala Ala
210
<210>33
<211>699
<212>DNA
<213>Artificial Sequence
<400>33
atggatcaga aaagcgatgg agttgggatc aaaatctaca acaacgcagt gtacggggac 60
ccacatgaag acgagtccgc caagtcacca aagccacctt cttcttcctc acatcccctg 120
cctctggtac gactgaaccc agaccacata cacggcagga aacgacgtgc cgttgcgaag 180
ggggtccaga agaccttatc caagacctcc atgctcgcca actttctccc cacgggcacc 240
ctcctgacat tcgaaatggt gcttcccgcc atctaccgca gcggcgagtg cacacgtgtc 300
accaatatga tgacccacgt cctcctgggc ctgtgtgcca tgtcatgctt cttctttcac 360
ttgacagaca gtttccgtgg gcccgatggg aagttatatt acgggtttgt gactccaaaa 420
gggctggcgg tgttcaaacc gggcctgccc gtggaggtgc ccaaggacga gaggtacaaa 480
ctgggcctga cggacttcgt tcacgccgct atgtccgtta tggtgtttgc cgctatcgcg 540
ttttctgata ggcgcgttac ggactgtttg tttccggggc acgagaagga gatggatgaa 600
gtgatggaga gttttccgtt gatggtgggg atcgtgtgca gcggattgtt tctcgtgttt 660
cctactactc gctacgggat tggatgcgcg gcttcgtga 699
<210>34
<211>242
<212>PRT
<213>Artificial Sequence
<400>34
Met Asp Gln Lys Ser Asp Gly Val Gly Ile Lys Ile Tyr Asn Asn Ala
1 5 10 15
Val Tyr Gly Asp Pro His Glu Asp Glu Ser Ala Lys Ser Pro Lys Pro
20 25 30
Pro Ser Ser Ser Ser His Pro Leu Pro Leu Val Arg Leu Asn Pro Asp
35 40 45
His Ile His Gly Arg Lys Arg Arg Ala Val Ala Lys Gly Val Gln Lys
50 55 60
Thr Leu Ser Lys Thr Ser Met Leu Ala Asn Phe Leu Pro Thr Gly Thr
65 70 75 80
Leu Leu Thr Phe Glu Met Val Leu Pro Ala Ile Tyr Arg Ser Gly Glu
85 90 95
Cys Thr Arg Val Thr Asn Met Met Thr His Val Leu Leu Gly Leu Cys
100 105 110
Ala Met Ser Cys Phe Phe Phe His Leu Thr Asp Ser Phe Arg Gly Pro
115 120 125
Asp Gly Lys Leu Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu Ala Val
130 135 140
Phe Lys Pro Gly Leu Pro Val Glu Val Pro Lys Asp Glu Arg Tyr Lys
145 150 155 160
Leu Gly Leu Thr Asp Phe Val His Ala Ala Met Ser Val Met Val Phe
165 170 175
Ala Ala Ile Ala Phe Ser Asp Arg Arg Val Thr Asp Cys Leu Phe Pro
180 185 190
Gly His Glu Lys Glu Met Asp Glu Val Met Glu Ser Phe Pro Leu Met
195 200 205
Val Gly Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Thr Thr Arg
210 215 220
Tyr Gly Ile Gly Cys Ala Ala Ser
225 230
<210>35
<211>699
<212>DNA
<213>Artificial Sequence
<400>35
atggatcaga aaagcgatgg agttgggatc aaaatctaca acaacgcagt gtacggggac 60
ccacatgaag acgagtccgc caagtcacca aagccacctt cttcttcctc acatcccctg 120
cctctggtac gactgaaccc agaccacata cacggcagga aacgacgtgc cgttgcgaag 180
ggggtccaga agaccttatc caagacctcc atgctcgcca actttctccc cacgggcacc 240
ctcctgacat tcgaaatggt gcttcccgcc atctaccgca gcggcgagtg cacacgtgtc 300
accaatatga tgacccacgt cctcctgggc ctgtgtgcca tgtcatgctt cttctttcac 360
ttgacagaca gtttccgtgg gcccgatggg aagttatatt acgggtttgt gactccaaaa 420
gggctggcgg tgttcaaacc gggcctgccc gtggaggtgc ccaaggacga gaggtacaaa 480
ctgggcctga cggaattcgt tcacgccgct atgtccgtta tggtgtttgc cgctatcgcg 540
ttttctgata ggcgcgttac ggactgtttg tttccggggc acgagaagga gatggatgaa 600
gtgatggaga gttttccgtt gatggtgggg atcgtgtgca gcggattgtt tctcgtgttt 660
cctactactc gctacgggat tggatgcgcg gcttcgtga 699
<210>36
<211>242
<212>PRT
<213>Artificial Sequence
<400>36
Met Asp Gln Lys Ser Asp Gly Val Gly Ile Lys Ile Tyr Asn Asn Ala
1 5 10 15
Val Tyr Gly Asp Pro His Glu Asp Glu Ser Ala Lys Ser Pro Lys Pro
20 25 30
Pro Ser Ser Ser Ser His Pro Leu Pro Leu Val Arg Leu Asn Pro Asp
35 40 45
His Ile His Gly Arg Lys Arg Arg Ala Val Ala Lys Gly Val Gln Lys
50 55 60
Thr Leu Ser Lys Thr Ser Met Leu Ala Asn Phe Leu Pro Thr Gly Thr
65 70 75 80
Leu Leu Thr Phe Glu Met Val Leu Pro Ala Ile Tyr Arg Ser Gly Glu
85 90 95
Cys Thr Arg Val Thr Asn Met Met Thr His Val Leu Leu Gly Leu Cys
100 105 110
Ala Met Ser Cys Phe Phe Phe His Leu Thr Asp Ser Phe Arg Gly Pro
115 120 125
Asp Gly Lys Leu Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu Ala Val
130 135 140
Phe Lys Pro Gly Leu Pro Val Glu Val Pro Lys Asp Glu Arg Tyr Lys
145 150 155 160
Leu Gly Leu Thr Glu Phe Val His Ala Ala Met Ser Val Met Val Phe
165 170 175
Ala Ala Ile Ala Phe Ser Asp Arg Arg Val Thr Asp Cys Leu Phe Pro
180 185 190
Gly His Glu Lys Glu Met Asp Glu Val Met Glu Ser Phe Pro Leu Met
195 200 205
Val Gly Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Thr Thr Arg
210 215 220
Tyr Gly Ile Gly Cys Ala Ala Ser
225 230
<210>37
<211>735
<212>DNA
<213>Artificial Sequence
<400>37
atggatccgg atcaacccca agactctgga atcaaaatct acaacaacgc cgtgtacggc 60
gacccacccg accccgagga ccaggccaag cccaagtccg cctcctcctc ctcctgcatc 120
ggctccaacc ccagtaagcc accttcttca tctctccctc tcgtccgcct caaccacgac 180
caactccacg gccgcaaacg acgtgccgtc gccaaaggcg tccagaaaac catctccaaa 240
acctctatgc tcgtcaactt cctccccacc ggaaccctcc tcactttcga gatggtcctc 300
cccgccatct accgcaacgg tgaatgcacc accgtcacca ccaccatgac tcacgtcctc 360
ctagggatct gctccctctc ctgcttcttc ttccacttca ccgacagttt taaaggcgcc 420
gatgggaaga tgtactacgg cttcgtgact ccgaaggggt tggcggtttt caagccgggg 480
ctgacggtgg acgtgccaaa ggatgagagg tatagggtgg ggctgacgga ctttgttcat 540
gccataatgt cggtgatggt gttcacggcg attgcgtttt cggatcggcg tgtgacggac 600
tgtatgtttc ccgggcacga gaaggagatg gatgaggtaa tggagagttt cccgctgatg 660
gtgggtattg tttgcagtgg tttgtttctt gtgtttccga attctcgcca tgggattggc 720
tgcatggccg catga 735
<210>38
<211>244
<212>PRT
<213>Artificial Sequence
<400>38
Met Asp Pro Asp Gln Pro Gln Asp Ser Gly Ile Lys Ile Tyr Asn Asn
1 5 10 15
Ala Val Tyr Gly Asp Pro Pro Asp Pro Glu Asp Gln Ala Lys Pro Lys
20 25 30
Ser Ala Ser Ser Ser Ser Cys Ile Gly Ser Asn Pro Ser Lys Pro Pro
35 40 45
Ser Ser Ser Leu Pro Leu Val Arg Leu Asn His Asp Gln Leu His Gly
50 55 60
Arg Lys Arg Arg Ala Val Ala Lys Gly Val Gln Lys Thr Ile Ser Lys
65 70 75 80
Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe
85 90 95
Glu Met Val Leu Pro Ala Ile Tyr Arg Asn Gly Glu Cys Thr Thr Val
100 105 110
Thr Thr Thr Met Thr His Val Leu Leu Gly Ile Cys Ser Leu Ser Cys
115 120 125
Phe Phe Phe His Phe Thr Asp Ser Phe Lys Gly Ala Asp Gly Lys Met
130 135 140
Tyr Tyr Gly Phe Val Thr Pro Lys Gly Leu Ala Val Phe Lys Pro Gly
145 150 155 160
Leu Thr Val Asp Val Pro Lys Asp Glu Arg Tyr Arg Val Gly Leu Thr
165 170 175
Asp Phe Val His Ala Ile Met Ser Val Met Val Phe Thr Ala Ile Ala
180 185 190
Phe Ser Asp Arg Arg Val Thr Asp Cys Met Phe Pro Gly His Glu Lys
195 200 205
Glu Met Asp Glu Val Met Glu Ser Phe Pro Leu Met Val Gly Ile Val
210 215 220
Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Ser Arg His Gly Ile Gly
225 230 235 240
Cys Met Ala Ala
<210>39
<211>687
<212>DNA
<213>Artificial Sequence
<400>39
atggagcaaa ctagtgaagg aattggaata aaaatgtaca gtacatcgaa acgcgtcgat 60
aattcatctt ctatgtatcc tactaattta ccacaagatg atacaatccc agaattatct 120
caacctgcat taccaattgg tgggaaaaaa agaagagcaa tggcaaatgg tgtacaaaaa 180
acactttcaa aaacttcatt acttgttaat tttctaccaa caggcacact tttaacattt 240
gaaatgttac ttccatcagt atttggtaaa ggagattgtt caccaattac tacatttatg 300
attttaacat tacttggact ttgtactttg tcatgttttt tcttccattt taccgatagt 360
tttcgaggtc ctgatggcaa agtttactat ggttttgtta caccaagagg tttgaaagtt 420
ttcaagactg gacttggtgt tgatgtgcca aaagatgaaa ggtacattgt gggattgaca 480
gattttgtac atgcaatgat gtctgttttg gtgtttgtgg caattgcatt ttctgatcat 540
agagtgacac tttgtctatt tcctggacat gctaaagaac ttgatgaaat tatgaggagt 600
tttccattaa tggttggagt tatttgtagt ggactttttc ttgtttttcc taattctaga 660
tatggtgttg gatgtatgtc tgcttag 687
<210>40
<211>228
<212>PRT
<213>Artificial Sequence
<400>40
Met Glu Gln Thr Ser Glu Gly Ile Gly Ile Lys Met Tyr Ser Thr Ser
1 5 10 15
Lys Arg Val Asp Asn Ser Ser Ser Met Tyr Pro Thr Asn Leu Pro Gln
20 25 30
Asp Asp Thr Ile Pro Glu Leu Ser Gln Pro Ala Leu Pro Ile Gly Gly
35 40 45
Lys Lys Arg Arg Ala Met Ala Asn Gly Val Gln Lys Thr Leu Ser Lys
50 55 60
Thr Ser Leu Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe
65 70 75 80
Glu Met Leu Leu Pro Ser Val Phe Gly Lys Gly Asp Cys Ser Pro Ile
85 90 95
Thr Thr Phe Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys
100 105 110
Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val
115 120 125
Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Thr Gly
130 135 140
Leu Gly Val Asp Val Pro Lys Asp Glu Arg Tyr Ile Val Gly Leu Thr
145 150 155 160
Asp Phe Val His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala
165 170 175
Phe Ser Asp His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys
180 185 190
Glu Leu Asp Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile
195 200 205
Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Ser Arg Tyr Gly Val Gly
210 215 220
Cys Met Ser Ala
225
<210>41
<211>645
<212>DNA
<213>Artificial Sequence
<400>41
atggagcaac ttgaagatct tggaatcaaa gtctacaatg caaccccaca agaggcctct 60
ccatgcccat cttcctctcc tcggttggca cctgaacctg gccggaaaag gcgtgctgtc 120
gcaaagggag tgcagaaaac actctccaaa acctccatgc ttgtcaactt tcttcccact 180
ggaacacttc tcacatttga aatggtgctc ccttccatat accgcaatgg agaatgcagt 240
tcagtcagca ttctgatgat ccacatgctg ttgggactgt gctgcctctc atgtttcttc 300
ttccacttta ccgacggttt ccgggggccc gacgggaagg tgtactatgg ctttgtgaca 360
acaaaagggt tggctgtgtt caagcctgga cttgaagtgg aggttccaaa ggatgagagg 420
ttcaaggttg ggctgacgga ctttgtacat gcgacaatgt cggttatggt gttcatagcc 480
atagcctttt cggatcacag gattacggac tgtttgtttc ctggacatga gaaggacatg 540
gatgaggtga tggagagttt tccattgatg gtggggatag tttgcagtgg cctgtttctt 600
gtgtttccca atactagata tggtattggg tgcatggctg catga 645
<210>42
<211>214
<212>PRT
<213>Artificial Sequence
<400>42
Met Glu Gln Leu Glu Asp Leu Gly Ile Lys Val Tyr Asn Ala Thr Pro
1 5 10 15
Gln Glu Ala Ser Pro Cys Pro Ser Ser Ser Pro Arg Leu Ala Pro Glu
20 25 30
Pro Gly Arg Lys Arg Arg Ala Val Ala Lys Gly Val Gln Lys Thr Leu
35 40 45
Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu
50 55 60
Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asn Gly Glu Cys Ser
65 70 75 80
Ser Val Ser Ile Leu Met Ile His Met Leu Leu Gly Leu Cys Cys Leu
85 90 95
Ser Cys Phe Phe Phe His Phe Thr Asp Gly Phe Arg Gly Pro Asp Gly
100 105 110
Lys Val Tyr Tyr Gly Phe Val Thr Thr Lys Gly Leu Ala Val Phe Lys
115 120 125
Pro Gly Leu Glu Val Glu Val Pro Lys Asp Glu Arg Phe Lys Val Gly
130 135 140
Leu Thr Asp Phe Val His Ala Thr Met Ser Val Met Val Phe Ile Ala
145 150 155 160
Ile Ala Phe Ser Asp His Arg Ile Thr Asp Cys Leu Phe Pro Gly His
165 170 175
Glu Lys Asp Met Asp Glu Val Met Glu Ser Phe Pro Leu Met Val Gly
180 185 190
Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly
195 200 205
Ile Gly Cys Met Ala Ala
210
<210>43
<211>645
<212>DNA
<213>Artificial Sequence
<400>43
atggatctaa acgaacaaca aatcggcatc aaagtgtaca acaacaatgc aactccacca 60
cccgaacatg aaacactgaa cccctcttcc aaccctccac aacccaagaa acatcgtgcc 120
ctaatggcaa agggcgtcca aaaaacccta tcaaaaacct ccctcctcgg aaacttcctc 180
cccacaggaa ccctcctcac ttttgagatg gtcctcccct ccatatacaa gaacggccag 240
tgcacccacg ttcacaccct catgatccac ttcctcctct ttgtttgtgc cctctcctgc 300
ttcttcttcc acttcactga cagcttccac ggccccgatg gtgccgtcta ctatggcttc 360
gtcaccccga ggggcctcgc cgtcttcaag cccgccgtgg ccgtcccgga agacgacagg 420
tttaaggtcg ggttcaccga cttcgtccat gctgtcatgt cggtgatggt gtttgtggcc 480
attgctattt cagatcatag ggtcaccaat tgccttttcc ccgggaagga taaggatatg 540
gagcaagtga gggagagttt ccctttgatg gtggggattg tttgcagcgg tttgtttctg 600
gtctttccta ctttcagacg tgggattggt tgcatgtctg cctag 645
<210>44
<211>214
<212>PRT
<213>Artificial Sequence
<400>44
Met Asp Leu Asn Glu Gln Gln Ile Gly Ile Lys Val Tyr Asn Asn Asn
1 5 10 15
Ala Thr Pro Pro Pro Glu His Glu Thr Leu Asn Pro Ser Ser Asn Pro
20 25 30
Pro Gln Pro Lys Lys His Arg Ala Leu Met Ala Lys Gly Val Gln Lys
35 40 45
Thr Leu Ser Lys Thr Ser Leu Leu Gly Asn Phe Leu Pro Thr Gly Thr
50 55 60
Leu Leu Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Lys Asn Gly Gln
65 70 75 80
Cys Thr His Val His Thr Leu Met Ile His Phe Leu Leu Phe Val Cys
85 90 95
Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe His Gly Pro
100 105 110
Asp Gly Ala Val Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val
115 120 125
Phe Lys Pro Ala Val Ala Val Pro Glu Asp Asp Arg Phe Lys Val Gly
130 135 140
Phe Thr Asp Phe Val His Ala Val Met Ser Val Met Val Phe Val Ala
145 150 155 160
Ile Ala Ile Ser Asp His Arg Val Thr Asn Cys Leu Phe Pro Gly Lys
165 170 175
Asp Lys Asp Met Glu Gln Val Arg Glu Ser Phe Pro Leu Met Val Gly
180 185 190
Ile Val Cys Ser Gly Leu Phe Leu Val Phe Pro Thr Phe Arg Arg Gly
195 200 205
Ile Gly Cys Met Ser Ala
210
<210>45
<211>645
<212>DNA
<213>Artificial Sequence
<400>45
atggatctaa atgaacaaca aatcggcatc aaagtgtaca acaacaatgc aactccagca 60
cccgaacatg aaacaccgaa cccctcttca aaccctcctc aacccaagaa acatcgtgcc 120
ctaatggcaa agggcgtcca aaaaacccta tcaaaaacct ccctcctcgg taacttcctc 180
cccacaggaa ccctcctcac ttttgagatg gtcctcccct ccatatacaa gaacggccag 240
tgcacccaca ttcacaccct catgatccac ttcctcctct tggtttgtgc cctctcctgc 300
ttcttcttcc acttcaccga tagcttccac ggccccgacg gtgccgtcta ctatggcttc 360
gtcaccccga ggggcctcgc cgtcttcaag cccgctgtgg ccgtcccgga agacgacagg 420
tttaaggtcg ggttcaccga cttcatccat gccgtcatgt cggtgatggt gttcgtggcc 480
attgctattt cggatcatag ggtcaccaat tgccttttcc ccgggaagga taaggatatg 540
gagcaagtga gggagagttt ccctttgatg gtggggattg tttgcagtag tttgtttctg 600
gtctttccta ctttcagacg tgggattggt tgcatgtctg cctag 645
<210>46
<211>214
<212>PRT
<213>Artificial Sequence
<400>46
Met Asp Leu Asn Glu Gln Gln Ile Gly Ile Lys Val Tyr Asn Asn Asn
1 5 10 15
Ala Thr Pro Ala Pro Glu His Glu Thr Pro Asn Pro Ser Ser Asn Pro
20 25 30
Pro Gln Pro Lys Lys His Arg Ala Leu Met Ala Lys Gly Val Gln Lys
35 40 45
Thr Leu Ser Lys Thr Ser Leu Leu Gly Asn Phe Leu Pro Thr Gly Thr
50 55 60
Leu Leu Thr Phe Glu Met Val Leu Pro Ser Ile Tyr Lys Asn Gly Gln
65 70 75 80
Cys Thr His Ile His Thr Leu Met Ile His Phe Leu Leu Leu Val Cys
85 90 95
Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe His Gly Pro
100 105 110
Asp Gly Ala Val Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val
115 120 125
Phe Lys Pro Ala Val Ala Val Pro Glu Asp Asp Arg Phe Lys Val Gly
130 135 140
Phe Thr Asp Phe Ile His Ala Val Met Ser Val Met Val Phe Val Ala
145 150 155 160
Ile Ala Ile Ser Asp His Arg Val Thr Asn Cys Leu Phe Pro Gly Lys
165 170 175
Asp Lys Asp Met Glu Gln Val Arg Glu Ser Phe Pro Leu Met Val Gly
180 185 190
Ile Val Cys Ser Ser Leu Phe Leu Val Phe Pro Thr Phe Arg Arg Gly
195 200 205
Ile Gly Cys Met Ser Ala
210
<210>47
<211>678
<212>DNA
<213>Artificial Sequence
<400>47
atggagcaaa ctagtgaagg aattggaata aaaatgtata gtacatcgaa acgcgtcgat 60
aattcatcgt ctatgtatcc tactaattta ccacaaggtg aaataatccc agaattacca 120
ataccaattg gtggtaaaaa aagaagagca atggcaaatg gtgtacaaaa aacactttca 180
aaaacttcat tacttgttaa ttttctccca acgggaaccc ttttaacatt tgaaatgtta 240
cttccctcag tatttggtaa aggagattgt tcaccaatta ctacatttat gattttaacg 300
ttacttggac tttgtacttt gtcatgtttt ttctttcatt ttaccgatag ttttcgaggt 360
cctgatggta aaatttacta tggttttgtt acaccaagag gtttgaaagt tttcaagact 420
ggacttggtg tcgatgtgcc aaaagatgaa aggtacattg tgggagtgac agattttgta 480
catgcaatga tgtctgtttt ggtgtttgtg gcaattgcat tttctgatca cagagtaaca 540
ctttgtctat ttcctggaca tgctaaagaa cttgatgaaa ttatgaggag ttttccatta 600
atggttggag ttatttgtag tggacttttt cttgtttttc ctaattcgag atatggtgtt 660
ggatgtatgt ctgcttag 678
<210>48
<211>225
<212>PRT
<213>Artificial Sequence
<400>48
Met Glu Gln Thr Ser Glu Gly Ile Gly Ile Lys Met Tyr Ser Thr Ser
1 5 10 15
Lys Arg Val Asp Asn Ser Ser Ser Met Tyr Pro Thr Asn Leu Pro Gln
20 25 30
Gly Glu Ile Ile Pro Glu Leu Pro Ile Pro Ile Gly Gly Lys Lys Arg
35 40 45
Arg Ala Met Ala Asn Gly Val Gln Lys Thr Leu Ser Lys Thr Ser Leu
50 55 60
Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met Leu
65 70 75 80
Leu Pro Ser Val Phe Gly Lys Gly Asp Cys Ser Pro Ile Thr Thr Phe
85 90 95
Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe Phe
100 105 110
His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Ile Tyr Tyr Gly
115 120 125
Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Thr Gly Leu Gly Val
130 135 140
Asp Val Pro Lys Asp Glu Arg Tyr Ile Val Gly Val Thr Asp Phe Val
145 150 155 160
His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser Asp
165 170 175
His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys Glu Leu Asp
180 185 190
Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile Cys Ser Gly
195 200 205
Leu Phe Leu Val Phe Pro Asn Ser Arg Tyr Gly Val Gly Cys Met Ser
210 215 220
Ala
225
<210>49
<211>645
<212>DNA
<213>Artificial Sequence
<400>49
atggacgaac acacagtaac ctccgatgaa gatctcggaa tcaaaatcta cacctcaaca 60
ccccccaacg aagaaccccc ctcctccggc ggtggcggcc ggaaaaggcg agcaatggca 120
aaaggaatgc aaaaaacact ctcaaaaacc tcaatgctag taaacttcct tccaaccggc 180
actctcctaa ccttcgaaat gcttctgccg tcggtctccg ggaaggggga gtgcacgcat 240
gtgaacacga tgatgataaa ctttctcctg ggcttatgcg ctctatcgtg tttcttgttt 300
cacttcacag acagtttcaa aggcgtggac gggaaagttt attacgggat cgtgacgccc 360
agagggctgg cggtgttcaa gacgggggtg agggaggtgg aagtgccgaa ggaggaaagg 420
tttaaagtag ggataacgga ttttgttcac gccattatgt ctgtaatggt attcatggcg 480
atagcgtttt cggatcatag agtgaccaat tgtttgtttc ctggacatgt ggcggacatg 540
gaagaggtta tggaaagctt tcctttgatg gtgggaacca tttgtagtgc tttgtttttg 600
gtgtttccta atactagata tggtattggt tgtatggcta attga 645
<210>50
<211>242
<212>PRT
<213>Artificial Sequence
<400>50
Met Asp Glu His Thr Val Thr Ser Asp Glu Asp Leu Gly Ile Lys Ile
1 5 10 15
Tyr Thr Ser Thr Pro Pro Asn Glu Glu Pro Pro Ser Ser Gly Gly Gly
20 25 30
Gly Arg Lys Arg Arg Ala Met Ala Lys Gly Met Gln Lys Thr Leu Ser
35 40 45
Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr
50 55 60
Phe Glu Met Leu Leu Pro Ser Val Ser Gly Lys Gly Glu Cys Thr His
65 70 75 80
Val Asn Thr Met Met Ile Asn Phe Leu Leu Gly Leu Cys Ala Leu Ser
85 90 95
Cys Phe Leu Phe His Phe Thr Asp Ser Phe Lys Gly Val Asp Gly Lys
100 105 110
Val Tyr Tyr Gly Ile Val Thr Pro Arg Gly Leu Ala Val Phe Lys Thr
115 120 125
Gly Val Arg Glu Val Glu Val Pro Lys Glu Glu Arg Phe Lys Val Gly
130 135 140
Ile Thr Asp Phe Val His Ala Ile Met Ser Val Met Val Phe Met Ala
145 150 155 160
Ile Ala Phe Ser Asp His Arg Val Thr Asn Cys Leu Phe Pro Gly His
165 170 175
Val Ala Asp Met Glu Glu Val Met Glu Ser Phe Pro Leu Met Val Gly
180 185 190
Thr Ile Cys Ser Ala Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly
195 200 205
Ile Gly Cys Met Ala Asn
210
<210>51
<211>687
<212>DNA
<213>Artificial Sequence
<400>51
atggagcaaa gtagtgaggg aattggaata aaaatctaca gtgcatcaaa gcgcgtcgat 60
aattcttcgt cttcaatgta ccctactagt ttaccagaag atgttccaat tccagaattg 120
cctcaacaag catcaattgg tggcaaaaaa agtagagcaa tggcaagtgg tgttcaaaaa 180
acactttcga aaacttcact gcttgtgaat tttctaccaa caggaacatt attaacattt 240
gaaatgttac ttccatcagt atttggtaaa ggggattgtt caccaattac tacatttatg 300
attttgacac ttcttggatt atgcacattg tcatgcttct tcttccattt tactgatagt 360
tttcgcggtc ctgatgggaa agtttactat ggttttgtta caccaagagg attgaaagtt 420
ttcaagactg gacttggtgt cgaaatccca aaagatgaaa ggtacattgt gggattgaca 480
gattttgtac atgcaatgat gtctgtgttg gtgtttgtag caattgcatt ttcagatcat 540
agagtgacac tttgtctatt tcctggacat gcaaaagaac ttgatgaaat tatgaggagt 600
tttccattaa tggttggagt tatttgcagt ggactttttc ttgtttttcc gaatactaga 660
tatggtgttg gatgtatgtc tgcttaa 687
<210>52
<211>228
<212>PRT
<213>Artificial Sequence
<400>52
Met Glu Gln Ser Ser Glu Gly Ile Gly Ile Lys Ile Tyr Ser Ala Ser
1 5 10 15
Lys Arg Val Asp Asn Ser Ser Ser Ser Met Tyr Pro Thr Ser Leu Pro
20 25 30
Glu Asp Val Pro Ile Pro Glu Leu Pro Gln Gln Ala Ser Ile Gly Gly
35 40 45
Lys Lys Ser Arg Ala Met Ala Ser Gly Val Gln Lys Thr Leu Ser Lys
50 55 60
Thr Ser Leu Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe
65 70 75 80
Glu Met Leu Leu Pro Ser Val Phe Gly Lys Gly Asp Cys Ser Pro Ile
85 90 95
Thr Thr Phe Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys
100 105 110
Phe Phe Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val
115 120 125
Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Thr Gly
130 135 140
Leu Gly Val Glu Ile Pro Lys Asp Glu Arg Tyr Ile Val Gly Leu Thr
145 150 155 160
Asp Phe Val His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala
165 170 175
Phe Ser Asp His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys
180 185 190
Glu Leu Asp Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile
195 200 205
Cys Ser Gly Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly Val Gly
210 215 220
Cys Met Ser Ala
225
<210>53
<211>657
<212>DNA
<213>Artificial Sequence
<400>53
atggagcaaa cccaccatgg aattggcatc aaagtttaca ctactgcaac accaccccca 60
gaggaggacc ctacaccact ctcttccctc cctcgactgc caccagaagc cggccgcaaa 120
cggaaagtgg tagccaaagg agttcaaaaa accatttcca aaacttccat gcttgttaac 180
ttcctaccaa caggcaccct tttaactttc gaaatggttc ttccttctgt ttatcgccat 240
ggtgactgtt cccatgttac caccatcatg atatactccc tcttatgcct ttgcgcactc 300
tcttgcttct tcttccattt caccgatagt ttccgaggcc ccgatgggac tgtttactac 360
ggtttcgtca cccccaacgg acttgctctt ttcaaacctg gtcttgaagt tgaatccccg 420
aaagatgaca agtacaaggt tggacttact gatttcgttc atgccgtgat gtcggtgttg 480
gtgtttgtgg ccattgcttt ctcggatcat agagttacca actgtgtttt cccaggacat 540
gagaaggaaa tggaccaagt tatggagggt tttccgctta tggtggggat tatttgcagt 600
ggcttgtttc ttgtgtttcc aaagactaga ttcggcgttg gttgcatggc tgcttga 657
<210>54
<211>218
<212>PRT
<213>Artificial Sequence
<400>54
Met Glu Gln Thr His His Gly Ile Gly Ile Lys Val Tyr Thr Thr Ala
1 5 10 15
Thr Pro Pro Pro Glu Glu Asp Pro Thr Pro Leu Ser Ser Leu Pro Arg
20 25 30
Leu Pro Pro Glu Ala Gly Arg Lys Arg Lys Val Val Ala Lys Gly Val
35 40 45
Gln Lys Thr Ile Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr
50 55 60
Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Val Tyr Arg His
65 70 75 80
Gly Asp Cys Ser His Val Thr Thr Ile Met Ile Tyr Ser Leu Leu Cys
85 90 95
Leu Cys Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg
100 105 110
Gly Pro Asp Gly Thr Val Tyr Tyr Gly Phe Val Thr Pro Asn Gly Leu
115 120 125
Ala Leu Phe Lys Pro Gly Leu Glu Val Glu Ser Pro Lys Asp Asp Lys
130 135 140
Tyr Lys Val Gly Leu Thr Asp Phe Val His Ala Val Met Ser Val Leu
145 150 155 160
Val Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asn Cys Val
165 170 175
Phe Pro Gly His Glu Lys Glu Met Asp Gln Val Met Glu Gly Phe Pro
180 185 190
Leu Met Val Gly Ile Ile Cys Ser Gly Leu Phe Leu Val Phe Pro Lys
195 200 205
Thr Arg Phe Gly Val Gly Cys Met Ala Ala
210 215
<210>55
<211>657
<212>DNA
<213>Artificial Sequence
<400>55
atggagcaaa cccaccatgg aattggcatc aaagtttaca ctactgcaac accaccccca 60
gaggaggacc ctacaccact ctcttccctc cctcgactgc caccagaacc cagccgcaaa 120
cggaaagtgg tagccaaagg agttcaaaaa accatttcca aaacttccat gcttgtcaac 180
ttcctaccaa caggcaccct tttaactttc gaaatggttc ttccttctgt ttatcgccat 240
ggtgactgtt cccatgttac caccatcatg acatactccc tcttatgcct ttgcgcactc 300
tcttgcttct tcttccattt caccgatagt ttccgaggcc ccgacgggaa tgtttactac 360
ggtttcgtca cccccaacgg actggctctt ttcaaacctg gtcttgaagt cgaatccccg 420
aaagatgaca agtacaaggt tggacttact gatttcgttc atgctgtgat gtcggtgttg 480
gtgtttgtgg ccatcgcttt ctcggatcat agagttacca actgtgtttt cccaggacat 540
gagaaggaaa tggaccaagt tatggagggt tttccgctga tggtggggat tatttgcagt 600
ggtttgtttc ttgtgtttcc aaagactaga ttcggcgtcg gttgcatggc tgcttga 657
<210>56
<211>218
<212>PRT
<213>Artificial Sequence
<400>56
Met Glu Gln Thr His His Gly Ile Gly Ile Lys Val Tyr Thr Thr Ala
1 5 10 15
Thr Pro Pro Pro Glu Glu Asp Pro Thr Pro Leu Ser Ser Leu Pro Arg
20 25 30
Leu Pro Pro Glu Pro Ser Arg Lys Arg Lys Val Val Ala Lys Gly Val
35 40 45
Gln Lys Thr Ile Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr
50 55 60
Gly Thr Leu Leu Thr Phe Glu Met Val Leu Pro Ser Val Tyr Arg His
65 70 75 80
Gly Asp Cys Ser His Val Thr Thr Ile Met Thr Tyr Ser Leu Leu Cys
85 90 95
Leu Cys Ala Leu Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Arg
100 105 110
Gly Pro Asp Gly Asn Val Tyr Tyr Gly Phe Val Thr Pro Asn Gly Leu
115 120 125
Ala Leu Phe Lys Pro Gly Leu Glu Val Glu Ser Pro Lys Asp Asp Lys
130 135 140
Tyr Lys Val Gly Leu Thr Asp Phe Val His Ala Val Met Ser Val Leu
145 150 155 160
Val Phe Val Ala Ile Ala Phe Ser Asp His Arg Val Thr Asn Cys Val
165 170 175
Phe Pro Gly His Glu Lys Glu Met Asp Gln Val Met Glu Gly Phe Pro
180 185 190
Leu Met Val Gly Ile Ile Cys Ser Gly Leu Phe Leu Val Phe Pro Lys
195 200 205
Thr Arg Phe Gly Val Gly Cys Met Ala Ala
210 215
<210>57
<211>681
<212>DNA
<213>Artificial Sequence
<400>57
atggagcaaa gtactgaggg aattgggatc aaaatctaca gtgcatcaaa acgtgcagat 60
acatcaatat accctactaa tttaccacca gataacgatg ttccgatccc tgaattgcct 120
caaccagcaa ttggtggcaa aaaaagaaga gcaatggcaa atgggattca aaaaactctc 180
tcaaaaactt cattgcttgt caattttcta ccaacaggca cacttctaac ttttgaaatg 240
gtccttccat cagtctatgg caaaggcgat tgttcaccgg tcactacatt aatgatttta 300
acactacttg gcctttgtac tttgtcttgc ttcttcttcc attttaccga tagttttcgt 360
ggacccgatg ggaaagttta ctatggattt gtgacaccaa gagggttgaa agttttcaag 420
tctggactag gtgtggatgt gccaaaagat aagaggtacg tcgtgggatt taccgatttc 480
gtacatgcaa tgatgtctgt tttggtattt gtggcgattg cattttcgga tcatagagtg 540
acgctttgtc tattccctgg acatgcaaaa gaacttgatg aaattatgag gagttttcct 600
ttaatggtgg gagttatttg cagtggactt tttcttgttt ttcccaatac tagatatggt 660
attggatgta tgtctgctta a 681
<210>58
<211>226
<212>PRT
<213>Artificial Sequence
<400>58
Met Glu Gln Ser Thr Glu Gly Ile Gly Ile Lys Ile Tyr Ser Ala Ser
1 5 10 15
Lys Arg Ala Asp Thr Ser Ile Tyr Pro Thr Asn Leu Pro Pro Asp Asn
20 25 30
Asp Val Pro Ile Pro Glu Leu Pro Gln Pro Ala Ile Gly Gly Lys Lys
35 40 45
Arg Arg Ala Met Ala Asn Gly Ile Gln Lys Thr Leu Ser Lys Thr Ser
50 55 60
Leu Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met
65 70 75 80
Val Leu Pro Ser Val Tyr Gly Lys Gly Asp Cys Ser Pro Val Thr Thr
85 90 95
Leu Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe
100 105 110
Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val Tyr Tyr
115 120 125
Gly Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Ser Gly Leu Gly
130 135 140
Val Asp Val Pro Lys Asp Lys Arg Tyr Val Val Gly Phe Thr Asp Phe
145 150 155 160
Val His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser
165 170 175
Asp His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys Glu Leu
180 185 190
Asp Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile Cys Ser
195 200 205
Gly Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly Ile Gly Cys Met
210 215 220
Ser Ala
225
<210>59
<211>681
<212>DNA
<213>Artificial Sequence
<400>59
atggagcaaa gtactgaggg aattgggatc aaaatttaca gtgcatcaaa acgtgccgat 60
acatcaatgt accctactaa tttaccacca gacaacgatg ttccgatccc cgaattgcct 120
caaccagcaa ttggtggcaa gaaaagacga gcaatggcaa atggggttca aaaaacactc 180
tcaaaaactt cattgcttgt caatttcttg ccaacaggca cacttttaac ttttgaaatg 240
gtccttccat cagtctatgg caaaggcgat tgttcccctg tcactacact aatgatttta 300
acactacttg gcctttgtac tttgtcttgc ttcttcttcc attttaccga tagttttcgg 360
ggacccgacg ggaaagttta ctatggattt gtgacaccaa gaggattgaa agttttcaag 420
tccggactag gtgtggatgt gccaaaagat gagaggtacg tagtgggatt tacggatttc 480
gtgcatgcga tgatgtctgt tttggtattt gtggcgattg cattttcgga tcatagagtg 540
acgctttgtc tattccctgg acatgcaaaa gaacttgatg aaattatgag gagttttcct 600
ttaatggtgg gagttatttg cagtggactt tttcttgttt ttcccaatac tagatatggt 660
attggatgta tgtctgctta a 681
<210>60
<211>226
<212>PRT
<213>Artificial Sequence
<400>60
Met Glu Gln Ser Thr Glu Gly Ile Gly Ile Lys Ile Tyr Ser Ala Ser
1 5 10 15
Lys Arg Ala Asp Thr Ser Met Tyr Pro Thr Asn Leu Pro Pro Asp Asn
20 25 30
Asp Val Pro Ile Pro Glu Leu Pro Gln Pro Ala Ile Gly Gly Lys Lys
35 40 45
Arg Arg Ala Met Ala Asn Gly Val Gln Lys Thr Leu Ser Lys Thr Ser
50 55 60
Leu Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met
65 70 75 80
Val Leu Pro Ser Val Tyr Gly Lys Gly Asp Cys Ser Pro Val Thr Thr
85 90 95
Leu Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe
100 105 110
Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val Tyr Tyr
115 120 125
Gly Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Ser Gly Leu Gly
130 135 140
Val Asp Val Pro Lys Asp Glu Arg Tyr Val Val Gly Phe Thr Asp Phe
145 150 155 160
Val His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser
165 170 175
Asp His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys Glu Leu
180 185 190
Asp Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile Cys Ser
195 200 205
Gly Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly Ile Gly Cys Met
210 215 220
Ser Ala
225
<210>61
<211>681
<212>DNA
<213>Artificial Sequence
<400>61
atggagcaaa gtactgaggg aattgggatc aaaatctaca gtgcatcaaa acgtgcagat 60
acaacaatat accctactaa tttaccacca gataacgatg ttccgatccc tgaattgcct 120
caaccagcaa ttggtggcaa aaaaagaaga gcaatggcta atggggttca aaaaactctc 180
tcaaaaactt cattgcttgt caattttcta ccaacaggca cacttctaac ttttgaaatg 240
gtccttccat cagtctatgg caaaggcgat tgttcaccgg tcactacatt aatgatttta 300
acactacttg gcctttgtac tttgtcttgc ttcttcttcc attttaccga tagttttcgt 360
ggacccgatg ggaaagttta ctatggattt gtgacaccaa gagggttgaa agttttcaag 420
tctggactag gtgtggatgt gccaaaagat gagaggtacg tcgtgggatt tacggatttc 480
gtacatgcaa tgatgtctgt tttggtattt gtggcgattg cattttcgga tcatagagtg 540
acgctttgtc tattccctgg acatgcaaaa gaacttgatg aaattatgag gagttttcct 600
ttaatggtgg gagttatttg cagtggactt tttcttgttt tccccaatac tagatatggt 660
attggatgta tgtctgctta a 681
<210>62
<211>226
<212>PRT
<213>Artificial Sequence
<400>62
Met Glu Gln Ser Thr Glu Gly Ile Gly Ile Lys Ile Tyr Ser Ala Ser
1 5 10 15
Lys Arg Ala Asp Thr Thr Ile Tyr Pro Thr Asn Leu Pro Pro Asp Asn
20 25 30
Asp Val Pro Ile Pro Glu Leu Pro Gln Pro Ala Ile Gly Gly Lys Lys
35 40 45
Arg Arg Ala Met Ala Asn Gly Val Gln Lys Thr Leu Ser Lys Thr Ser
50 55 60
Leu Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met
65 70 75 80
Val Leu Pro Ser Val Tyr Gly Lys Gly Asp Cys Ser Pro Val Thr Thr
85 90 95
Leu Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe
100 105 110
Phe His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Val Tyr Tyr
115 120 125
Gly Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Ser Gly Leu Gly
130 135 140
Val Asp Val Pro Lys Asp Glu Arg Tyr Val Val Gly Phe Thr Asp Phe
145 150 155 160
Val His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser
165 170 175
Asp His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys Glu Leu
180 185 190
Asp Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile Cys Ser
195 200 205
Gly Leu Phe Leu Val Phe Pro Asn Thr Arg Tyr Gly Ile Gly Cys Met
210 215 220
Ser Ala
225
<210>63
<211>729
<212>DNA
<213>Artificial Sequence
<400>63
atggagaaaa cagaggaaag tgtcggaatc agagtctaca cgccgcaaaa accatcacca 60
tcgccaccgt ctcgctctcc caaaccctta ttaatctcat cacttccctc acttccccca 120
ggagccgcag ccggaggagg aagaggccgc aaacgccgca tggtcgctca aggagttcaa 180
aaaacggttt caaagacatc gatgatcgtc aacttcctcc cgacaggaac tctcctgatg 240
ttcgaaatgg ttctcccgtc tatctaccga gacggagact gcaacggaat caacacgctc 300
atgatccatc tcctcctcct tctctgcgca acgtcttgct tcttcttcca tttcaccgac 360
agtttcaaag ccgccgacga gaaaatctat tacggtttcg tgacgccgcg tggactcgcc 420
gtgttcatga aaccgccgcc gcctgagtgc ggaggcggag gagacgcgtt cgcggaagcc 480
gagattccgg tgactgatga gaggtataag ttgaaggtta acgactttgt tcatgcggtg 540
atgagcgttt tggtgtttat ggcgattgcg ttttcggaca ggagagtcac gggttgtctc 600
gttccgggga aacagaaaga gatggatcaa gttatggaga gtttcccatt aatggtcgga 660
atcgtttgca gtgctctatt tcttgtcttc ccgaccactc gacgtggtgt tggatgcatg 720
tctgcttga 729
<210>64
<211>242
<212>PRT
<213>Artificial Sequence
<400>64
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Arg Val Tyr Thr Pro Gln
1 5 10 15
Lys Pro Ser Pro Ser Pro Pro Ser Arg Ser Pro Lys Pro Leu Leu Ile
20 25 30
Ser Ser Leu Pro Ser Leu Pro Pro Gly Ala Ala Ala Gly Gly Gly Arg
35 40 45
Gly Arg Lys Arg Arg Met Val Ala Gln Gly Val Gln Lys Thr Val Ser
50 55 60
Lys Thr Ser Met Ile Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Met
65 70 75 80
Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asp Gly Asp Cys Asn Gly
85 90 95
Ile Asn Thr Leu Met Ile His Leu Leu Leu Leu Leu Cys Ala Thr Ser
100 105 110
Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Ala Asp Glu Lys
115 120 125
Ile Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val Phe Met Lys
130 135 140
Pro Pro Pro Pro Glu Cys Gly Gly Gly Gly Asp Ala Phe Ala Glu Ala
145 150 155 160
Glu Ile Pro Val Thr Asp Glu Arg Tyr Lys Leu Lys Val Asn Asp Phe
165 170 175
Val His Ala Val Met Ser Val Leu Val Phe Met Ala Ile Ala Phe Ser
180 185 190
Asp Arg Arg Val Thr Gly Cys Leu Val Pro Gly Lys Gln Lys Glu Met
195 200 205
Asp Gln Val Met Glu Ser Phe Pro Leu Met Val Gly Ile Val Cys Ser
210 215 220
Ala Leu Phe Leu Val Phe Pro Thr Thr Arg Arg Gly Val Gly Cys Met
225 230 235 240
Ser Ala
<210>65
<211>729
<212>DNA
<213>Artificial Sequence
<400>65
atggagaaaa cagaggaaag tgtcgggatc aaagtctaca cgccgcaaaa accatcacca 60
tcaccaccct ctcgttcgcc caaaccctta tcaatctcat cacttccttc acttccccca 120
ggagccgcag caggaggagg aagaggccgc aaacgccgca tggtcgctca aggagttcaa 180
aaaacggttt cgaagacatc gatgatcgtc aacttccttc cgacaggaac tctcctgatg 240
ttcgaaatgg ttctcccttc catctaccgc gacggagact gcaacggaat caatacacta 300
atgatccatc tcctgctcct tctctgcgca acctcctgct tcttcttcca tttcaccgac 360
agtttcaaag ccgccgacga gaaaatctat tacggtttcg tgacgccgcg tggactcgcc 420
gtgttcatga aaccgccgcc gcctgagttc ggaggcggag gagacgcgtt cgcggaagcg 480
gagatacctg tgaatgatga gaggtataag ttgaaggtta acgactttgt tcatgcagtg 540
atgagcgttt tggtgtttat ggcgattgcg ttttcggaca ggagagtcac gggttgtctc 600
gttccgggga aacagaaaga gatggatcaa gttatggaga gtttcccatt gatggtcgga 660
atcgtttgca gtgctctgtt tcttgtcttc ccgaccactc gacgtggtgt tggatgcatg 720
tctgcttga 729
<210>66
<211>242
<212>PRT
<213>Artificial Sequence
<400>66
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Lys Val Tyr Thr Pro Gln
1 5 10 15
Lys Pro Ser Pro Ser Pro Pro Ser Arg Ser Pro Lys Pro Leu Ser Ile
20 25 30
Ser Ser Leu Pro Ser Leu Pro Pro Gly Ala Ala Ala Gly Gly Gly Arg
35 40 45
Gly Arg Lys Arg Arg Met Val Ala Gln Gly Val Gln Lys Thr Val Ser
50 55 60
Lys Thr Ser Met Ile Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Met
65 70 75 80
Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asp Gly Asp Cys Asn Gly
85 90 95
Ile Asn Thr Leu Met Ile His Leu Leu Leu Leu Leu Cys Ala Thr Ser
100 105 110
Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Ala Asp Glu Lys
115 120 125
Ile Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val Phe Met Lys
130 135 140
Pro Pro Pro Pro Glu Phe Gly Gly Gly Gly Asp Ala Phe Ala Glu Ala
145 150 155 160
Glu Ile Pro Val Asn Asp Glu Arg Tyr Lys Leu Lys Val Asn Asp Phe
165 170 175
Val His Ala Val Met Ser Val Leu Val Phe Met Ala Ile Ala Phe Ser
180 185 190
Asp Arg Arg Val Thr Gly Cys Leu Val Pro Gly Lys Gln Lys Glu Met
195 200 205
Asp Gln Val Met Glu Ser Phe Pro Leu Met Val Gly Ile Val Cys Ser
210 215 220
Ala Leu Phe Leu Val Phe Pro Thr Thr Arg Arg Gly Val Gly Cys Met
225 230 235 240
Ser Ala
<210>67
<211>767
<212>DNA
<213>Artificial Sequence
<400>67
aaagaaacaa aataacagag attcacacga aaatggagaa aacagaggaa agcgttggga 60
tcagagttta cacgacggcg actccgccgc aaaaaccatc accaccaccg tctgagtcac 120
aaaaacccgt ctcaatctct tcacttccta cactcccggt aggagccgcc gcaggaggag 180
gaagaggtcg aaaacgtcgc atggtggcgc aaggagtcca aaaaacggta tcaaagacat 240
caatgctcgt aaactttctt ccaacaggaa cgctcttgat gttcgaaatg gttcttcctt 300
caatctaccg cgacggagac tgtaacggaa tcaaaacgct catgatccat ctcctcttgc 360
ttctttgcgc aatgtcttgt ttcttcttcc atttcaccga tagtttcaaa gcatccgatg 420
ggaacatcta ttacggtttc gtgacgccgc gtggactcgc ggttttcatg aaaccgccgc 480
cgccggagtt cggaggcggt gatgtgattg cggaggcaga gattccggtg agtgatgata 540
ggtataagtt gagggttaac gactttgttc atgcggtgat gagcgttttg gtgtttatgg 600
cgattgcgtt ttcggataga agagtcacgg gttgcttgtt tccagggaaa gagaaagaga 660
tggatcaagt tatggagagt tttccattga tggttggaat cgtttgtagt gctttgtttc 720
tcgttttccc gaccactcgc tacggtgttg gatgcatgtc cgcttga 767
<210>68
<211>244
<212>PRT
<213>Artificial Sequence
<400>68
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Arg Val Tyr Thr Thr Ala
1 5 10 15
Thr Pro Pro Gln Lys Pro Ser Pro Pro Pro Ser Glu Ser Gln Lys Pro
20 25 30
Val Ser Ile Ser Ser Leu Pro Thr Leu Pro Val Gly Ala Ala Ala Gly
35 40 45
Gly Gly Arg Gly Arg Lys Arg Arg Met Val Ala Gln Gly Val Gln Lys
50 55 60
Thr Val Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr
65 70 75 80
Leu Leu Met Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asp Gly Asp
85 90 95
Cys Asn Gly Ile Lys Thr Leu Met Ile His Leu Leu Leu Leu Leu Cys
100 105 110
Ala Met Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Ser
115 120 125
Asp Gly Asn Ile Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val
130 135 140
Phe Met Lys Pro Pro Pro Pro Glu Phe Gly Gly Gly Asp Val Ile Ala
145 150 155 160
Glu Ala Glu Ile Pro Val Ser Asp Asp Arg Tyr Lys Leu Arg Val Asn
165 170 175
Asp Phe Val His Ala Val Met Ser Val Leu Val Phe Met Ala Ile Ala
180 185 190
Phe Ser Asp Arg Arg Val Thr Gly Cys Leu Phe Pro Gly Lys Glu Lys
195 200 205
Glu Met Asp Gln Val Met Glu Ser Phe Pro Leu Met Val Gly Ile Val
210 215 220
Cys Ser Ala Leu Phe Leu Val Phe Pro Thr Thr Arg Tyr Gly Val Gly
225 230 235 240
Cys Met Ser Ala
<210>69
<211>434
<212>DNA
<213>Artificial Sequence
<400>69
aaagaaacaa aataacagag attcacacga aaatggagaa aacagaggaa agcgttggga 60
tcagagttta cacgacggcg actccgccgc aaaaaccatc accaccactg actcactcac 120
caaaacccgt ctcaatctcg tcacttccta cactcccagt aggagccgcc gcaggaggag 180
gaagagagat tccggtaagt gatgataggt atacgttgag ggttaacgac tttgttcatg 240
cgatgatgag cgttttggtg tttatggcga ttgcgttttc ggatagaaga gtcacgggtt 300
gcttgtttcc agggaaagag aaagagatgg atcaagttat ggagagtttt ccattgatgg 360
ttggaatcgt ttgtagtgct ttgtttctcg ttttcccgac cacatgctac ggtgttggat 420
gcatgtccgc ttga 434
<210>70
<211>133
<212>PRT
<213>Artificial Sequence
<400>70
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Arg Val Tyr Thr Thr Ala
1 5 10 15
Thr Pro Pro Gln Lys Pro Ser Pro Pro Leu Thr His Ser Pro Lys Pro
20 25 30
Val Ser Ile Ser Ser Leu Pro Thr Leu Pro Val Gly Ala Ala Ala Gly
35 40 45
Gly Gly Arg Glu Ile Pro Val Ser Asp Asp Arg Tyr Thr Leu Arg Val
50 55 60
Asn Asp Phe Val His Ala Met Met Ser Val Leu Val Phe Met Ala Ile
65 70 75 80
Ala Phe Ser Asp Arg Arg Val Thr Gly Cys Leu Phe Pro Gly Lys Glu
85 90 95
Lys Glu Met Asp Gln Val Met Glu Ser Phe Pro Leu Met Val Gly Ile
100 105 110
Val Cys Ser Ala Leu Phe Leu Val Phe Pro Thr Thr Cys Tyr Gly Val
115 120 125
Gly Cys Met Ser Ala
130
<210>71
<211>464
<212>DNA
<213>Artificial Sequence
<400>71
cacgaaaatg gagaaaacag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgttc actgccgtat aggcaggaga 120
aaacagagga aagtgtgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 180
atcaacttga aaaagtggca ccgagtcggt gcgttcactg ccgtataggc agtgggatca 240
gagtttacac gagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 300
acttgaaaaa gtggcaccga gtcggtgcgt tcactgccgt ataggcagga actccttgag 360
cgaccatggt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 420
gaaaaagtgg caccgagtcg gtgcgttcac tgccgtatag gcag 464
<210>72
<211>464
<212>DNA
<213>Artificial Sequence
<400>72
ttgctggttg aggcaattcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgttc actgccgtat aggcagaatc 120
attagtgtag tgacaggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 180
atcaacttga aaaagtggca ccgagtcggt gcgttcactg ccgtataggc agatcggaac 240
atcgttatct gggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 300
acttgaaaaa gtggcaccga gtcggtgcgt tcactgccgt ataggcagat ggatttgtga 360
caccaagagt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 420
gaaaaagtgg caccgagtcg gtgcgttcac tgccgtatag gcag 464
<210>73
<211>464
<212>DNA
<213>Artificial Sequence
<400>73
tactgcaaca ccacccccag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgttc actgccgtat aggcagagtc 120
gagggaggga agagaggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 180
atcaacttga aaaagtggca ccgagtcggt gcgttcactg ccgtataggc agcatttcac 240
cgatagtttc cggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 300
acttgaaaaa gtggcaccga gtcggtgcgt tcactgccgt ataggcagat agtttccgag 360
gccccgatgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg ttatcaactt 420
gaaaaagtgg caccgagtcg gtgcgttcac tgccgtatag gcag 464
<210>74
<211>17384
<212>DNA
<213>Artificial Sequence
<400>74
tacggttcct gctcggatct gttggaccgg acagtagtca tggttgatgg gctgcctgta 60
tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg 120
atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt 180
ttaatgtact ggggttgaac actctgtgcc gaattcggat ccggaggtca acatggtgga 240
gcacgacact ctggtctact ccaaaaatgt caaagataca gtctcagaag atcaaagggc 300
tattgagact tttcaacaaa ggataatttc gggaaacctc ctcggattcc attgcccagc 360
tatctgtcac ttcatcgaaa ggacagtaga aaaggaaggt ggctcctaca aatgccatca 420
ttgcgataaa ggaaaggcta tcattcaaga tctctctgcc gacagtggtc ccaaagatgg 480
acccccaccc acgaggagca tcgtggaaaa agaagaggtt ccaaccacgt ctacaaagca 540
agtggattga tgtgataaca tggtggagca cgacactctg gtctactcca aaaatgtcaa 600
agatacagtc tcagaagatc aaagggctat tgagactttt caacaaagga taatttcggg 660
aaacctcctc ggattccatt gcccagctat ctgtcacttc atcgaaagga cagtagaaaa 720
ggaaggtggc tcctacaaat gccatcattg cgataaagga aaggctatca ttcaagatct 780
ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga 840
agaggttcca accacgtcta caaagcaagt ggattgatgt gacatctcca ctgacgtaag 900
ggatgacgca caatcccact atccttcgca agacccttcc tctatataag gaagttcatt 960
tcatttggag aggacacgct cgagtataag agctcatttt tacaacaatt accaacaaca 1020
acaaacaaca aacaacatta caattacatt tacaattatc gatacaatga gcccagaacg 1080
acgcccggcc gacatccgcc gtgccaccga ggcggacatg ccggcggtct gcaccatcgt 1140
caaccactac atcgagacaa gcacggtcaa cttccgtacc gagccgcagg aaccgcagga 1200
gtggacggac gacctcgtcc gtctgcggga gcgctatccc tggctcgtcg ccgaggtgga 1260
cggcgaggtc gccggcatcg cctacgcggg cccctggaag gcacgcaacg cctacgactg 1320
gacggccgag tcgaccgtgt acgtctcccc ccgccaccag cggacgggac tgggctccac 1380
gctctacacc cacctgctga agtccctgga ggcacagggc ttcaagagcg tggtcgctgt 1440
catcgggctg cccaacgacc cgagcgtgcg catgcacgag gcgctcggat atgccccccg 1500
cggcatgctg cgggcggccg gcttcaagca cgggaactgg catgacgtgg gtttctggca 1560
gctggacttc agcctgccgg taccgccccg tccggtcctg cccgtcaccg agatttgagc 1620
ttctctagct agagtcgatc gacaagctcg agtttctcca taataatgtg tgagtagttc 1680
ccagataagg gaattagggt tcctataggg tttcgctcat gtgttgagca tataagaaac 1740
ccttagtatg tatttgtatt tgtaaaatac ttctatcaat aaaatttcta attcctaaaa 1800
ccaaaatcca gtactaaaat ccagatcgct gcaagaattc aagcttggag gtcaacatgg 1860
tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagatcaaa 1920
gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga ttccattgcc 1980
cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc 2040
atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag 2100
atggaccccc acccacgagg agcatcgtgg aaaaagaaga ggttccaacc acgtctacaa 2160
agcaagtgga ttgatgtgat aacatggtgg agcacgacac tctggtctac tccaaaaatg 2220
tcaaagatac agtctcagaa gatcaaaggg ctattgagac ttttcaacaa aggataattt 2280
cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcgaa aggacagtag 2340
aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggct atcattcaag 2400
atctctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 2460
aagaagaggt tccaaccacg tctacaaagc aagtggattg atgtgacatc tccactgacg 2520
taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata taaggaagtt 2580
catttcattt ggagaggaca cgctcgagta taagagctca tttttacaac aattaccaac 2640
aacaacaaac aacaaacaac attacaatta catttacaat tatcgataca atggacaaga 2700
agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc attacggacg 2760
agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc cacagcataa 2820
agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa gccacgcggc 2880
tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc tacctgcagg 2940
agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg ctggaggagt 3000
cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc aatatcgtgg 3060
acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag aagcttgtag 3120
acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat atgatcaaat 3180
ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat gtcgacaaac 3240
tctttatcca actggttcag acttacaatc agcttttcga agagaacccg atcaacgcat 3300
ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg cggctcgaaa 3360
acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat cttatcgccc 3420
tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa gatgccaagc 3480
ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc cagatcggcg 3540
accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt ctgctgagtg 3600
atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt atgatcaagc 3660
gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga cagcaactgc 3720
ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc ggatacattg 3780
acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg gaaaaaatgg 3840
acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc aaacagcgca 3900
ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac gctatcctca 3960
ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt gagaaaatcc 4020
tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc agattcgcgt 4080
ggatgactcg caaatcagaa gagactatca ctccctggaa cttcgaggaa gtcgtggata 4140
agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa aatctgccta 4200
acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt tataacgagc 4260
tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg tctggagagc 4320
agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc gtgaaacagc 4380
tcaaagaaga ttatttcaaa aagattgaat gtttcgactc tgttgaaatc agcggagtgg 4440
aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc attaaagaca 4500
aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc ctcaccctta 4560
cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct catctcttcg 4620
acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg cggctgtcaa 4680
gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg gattttctta 4740
agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac tctctcacct 4800
ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctc cacgagcaca 4860
tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc gttaaggtcg 4920
tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt atcgagatgg 4980
cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg atgaagagga 5040
ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca gttgaaaaca 5100
cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg gacatgtacg 5160
tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat atcgtgcccc 5220
agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc gataaaaata 5280
gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa aattattggc 5340
ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg actaaggctg 5400
aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag cttgttgaga 5460
cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac accaagtacg 5520
atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct aagctggttt 5580
cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat taccaccatg 5640
cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa tatcccaagc 5700
ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa atgatcgcaa 5760
agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc aatattatga 5820
attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga ccacttatcg 5880
aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc gcgacagtcc 5940
ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta cagaccggag 6000
gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc gcacgcaaaa 6060
aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct tacagtgtac 6120
tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc aaggaactgc 6180
tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac tttctcgagg 6240
cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag tactctctct 6300
ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg cagaaaggta 6360
acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc cactatgaaa 6420
agctcaaagg atctcccgaa gataatgagc agaagcagct gttcgtggaa caacacaaac 6480
actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg atcctcgccg 6540
acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag cccatcaggg 6600
agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg cctgcagcct 6660
tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag gaggtcctgg 6720
acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc gacctctctc 6780
agctcggtgg agacagcagg gctgacccca agaagaagag gaaggtgtga gcttatatga 6840
agatgaagat gaaatatttg gtgtgtcaaa taaaaagctt gtgtgcttaa gtttgtgttt 6900
ttttcttggc ttgttgtgtt atgaatttgt ggctttttct aatattaaat gaatgtaaga 6960
tcacattata atgaataaac aaatgtttct ataatccatt gtgaatgttt tgttggatct 7020
cttctgcagc atataactac tgtatgtgct atggtatgga ctatggaata tgattaaaga 7080
taagcgctac tagcaacata cgctggatta cgaattcgag ctcggaggat ccggagttct 7140
agaatgtcgc ggaacaaatt ttaaaactaa atcctaaatt tttctaattt tgttgccaat 7200
agtggatatg tgggccgtat agaaggaatc tattgaaggc ccaaacccat actgacgagc 7260
ccaaaggttc gttttgcgtt ttatgtttcg gttcgatgcc aacgccacat tctgagctag 7320
gcaaaaaaca aacgtgtctt tgaatagact cctctcgtta acacatgcag cggctgcatg 7380
gtgacgccat taacacgtgg cctacaattg catgatgtct ccattgacac gtgacttctc 7440
gtctcctttc ttaatatatc taacaaacac tcctacctct tccaaaatat atacacatct 7500
ttttgatcaa tctctcattc aaaatctcat tctctctagt aaacaagaac aaaaaaatgg 7560
cggatacagc tagaggaacc catcacgata tcatcggcag agatcagtac ccgatgatgg 7620
gccgagatcg tgaccagtac cagatgtccg gacgaggatc tgactactcc aagtctaggc 7680
agattgctaa agctgcaact gctgtcacag ctggtggttc cctccttgtt ctctccagcc 7740
ttacccttgt tggaactgtc atagctttga ctgttgcaac acctctgctc gttatcttca 7800
gcccaatcct tgtcccggct ctcatcacag ttgcactcct catcaccggt tttctttcct 7860
ctggagggtt tggcattgcc gctataaccg ttttctcttg gatttacaag taagcacaca 7920
tttatcatct tacttcataa ttttgtgcaa tatgtgcatg catgtgttga gccagtagct 7980
ttggatcaat ttttttggtc gaataacaaa tgtaacaata agaaattgca aattctaggg 8040
aacatttggt taactaaata cgaaatttga cctagctagc ttgaatgtgt ctgtgtatat 8100
catctatata ggtaaaatgc ttggtatgat acctattgat tgtgaatagg tacgcaacgg 8160
gagagcaccc acagggatca gacaagttgg acagtgcaag gatgaagttg ggaagcaaag 8220
ctcaggatct gaaagacaga gctcagtact acggacagca acatactggt ggggaacatg 8280
accgtgaccg tactcgtggt ggccagcaca ctactatgag cgagctgatt aaggagaaca 8340
tgcacatgaa gctgtacatg gagggcaccg tgaacaacca ccacttcaag tgcacatccg 8400
agggcgaagg caagccctac gagggcaccc agaccatgag aatcaaggtg gtcgagggcg 8460
gccctctccc cttcgccttc gacatcctgg ctaccagctt catgtacggc agcagaacct 8520
tcatcaacca cacccagggc atccccgact tctttaagca gtccttccct gagggcttca 8580
catgggagag agtcaccaca tacgaagatg ggggcgtgct gaccgctacc caggacacca 8640
gcctccagga cggctgcctc atctacaacg tcaagatcag aggggtgaac ttcccatcca 8700
acggccctgt gatgcagaag aaaacactcg gctgggaggc caacaccgag atgctgtacc 8760
ccgctgacgg cggcctggaa ggcagaagcg acatggccct gaagctcgtg ggcgggggcc 8820
acctgatctg caacttcaag accacataca gatccaagaa acccgctaag aacctcaaga 8880
tgcccggcgt ctactatgtg gaccacagac tggaaagaat caaggaggcc gacaaagaaa 8940
cctacgtcga gcagcacgag gtggctgtgg ccagatactg cgacctccct agcaaactgg 9000
ggcacaagtg agcttacccc actgatgtca tcgtcatagt ccaataactc caatgtcggg 9060
gagttagttt atgaggaata aagtgtttag aatttgatca gggggagata ataaaagccg 9120
agtttgaatc tttttgttat aagtaatgtt tatgtgtgtt tctatatgtt gtcaaatggt 9180
accatgtttt ttttcctctc tttttgtaac ttgcaagtgt tgtgttgtac tttatttggc 9240
ttctttgtaa gttggtaacg gtggtctata tatggaaaag gtcttgtttt gttaaactta 9300
tgttagttaa ctggattcgt ctttaaccac aaaaagtttt caataagcta caaatttaga 9360
cacgcaagcc gatgcagtca ttagtacata tatttattgc aagtgattac atggcaaccc 9420
aaacttcaaa aacagtaggt tgctccattt agtcgccgct cagagaattc gcatgcggag 9480
catcttcatt cttaagatat gaagataatc ttcaaaaggc ccctgggaat ctgaaagaag 9540
agaagcaggc ccatttatat gggaaagaac aatagtattt cttatatagg cccatttaag 9600
ttgaaaacaa tcttcaaaag tcccacatcg cttagataag aaaacgaagc tgagtttata 9660
tacagctaga gtcgaagtag tgattgatgt ttcttgggtt gtggagtttt agagctagaa 9720
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 9780
ctttttttct agacccagct ttcttgtaca aagttggcat tacgcttgtg gaattcctcg 9840
agggagcatc ttcattctta agatatgaag ataatcttca aaaggcccct gggaatctga 9900
aagaagagaa gcaggcccat ttatatggga aagaacaata gtatttctta tataggccca 9960
tttaagttga aaacaatctt caaaagtccc acatcgctta gataagaaaa cgaagctgag 10020
tttatataca gctagagtcg aagtagtgat tgactatggc ttcgtcaccc cggttttaga 10080
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 10140
gtcggtgctt tttttctaga cccagctttc ttgtacaaag ttggcattac gctgagcgaa 10200
ttccatatgg gagcatcttc attcttaaga tatgaagata atcttcaaaa ggcccctggg 10260
aatctgaaag aagagaagca ggcccattta tatgggaaag aacaatagta tttcttatat 10320
aggcccattt aagttgaaaa caatcttcaa aagtcccaca tcgcttagat aagaaaacga 10380
agctgagttt atatacagct agagtcgaag tagtgattgc atcgtgccct aatggcaaag 10440
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 10500
gcaccgagtc ggtgcttttt ttctagaccc agctttcttg tacaaagttg gcattacgct 10560
tgccgaattc ggatccggag catcttcatt cttaagatat gaagataatc ttcaaaaggc 10620
ccctgggaat ctgaaagaag agaagcaggc ccatttatat gggaaagaac aatagtattt 10680
cttatatagg cccatttaag ttgaaaacaa tcttcaaaag tcccacatcg cttagataag 10740
aaaacgaagc tgagtttata tacagctaga gtcgaagtag tgattgctgt ggggaggaag 10800
ttaccggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 10860
aaaagtggca ccgagtcggt gctttttttc tagacccagc tttcttgtac aaagttggca 10920
ttacgctgca agaattcaag cttggaggtc aacatggtgg agcacgacac tctggtctac 10980
tccaaaaatg tcaaagatac agtctcagaa gatcaaaggg ctattgagac ttttcaacaa 11040
aggataattt cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcgaa 11100
aggacagtag aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggct 11160
atcattcaag atctctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 11220
atcgtggaaa aagaagaggt tccaaccacg tctacaaagc aagtggattg atgtgataac 11280
atggtggagc acgacactct ggtctactcc aaaaatgtca aagatacagt ctcagaagat 11340
caaagggcta ttgagacttt tcaacaaagg ataatttcgg gaaacctcct cggattccat 11400
tgcccagcta tctgtcactt catcgaaagg acagtagaaa aggaaggtgg ctcctacaaa 11460
tgccatcatt gcgataaagg aaaggctatc attcaagatc tctctgccga cagtggtccc 11520
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagaggttcc aaccacgtct 11580
acaaagcaag tggattgatg tgacatctcc actgacgtaa gggatgacgc acaatcccac 11640
tatccttcgc aagacccttc ctctatataa ggaagttcat ttcatttgga gaggacacgc 11700
tcgagtataa gagctcattt ttacaacaat taccaacaac aacaaacaac aaacaacatt 11760
acaattacat ttacaattat cgatacaatg agaggatctg gatctgagtc tgatgagtct 11820
ggacttcctg ctatggaaat cgagtgtaga atcactggaa cccttaacgg tgttgagttc 11880
gagcttgttg gaggtggtga gggaactcct gagcagggaa gaatgactaa caagatgaag 11940
tctaccaagg gtgctcttac cttctctcca taccttcttt ctcacgttat gggatacgga 12000
ttctaccact tcggaactta cccatctgga tacgagaacc ctttccttca tgctatcaac 12060
aacggtggat acaccaacac taggatcgag aagtacgagg atggtggtgt tcttcacgtt 12120
agcttctctt acagatacga ggctggaaga gtgatcggag atttcaaggt tatgggaact 12180
ggattccctg aggattctgt tatcttcacc gacaagatca tcaggtctaa cgctactgtt 12240
gagcatcttc atcctatggg agataacgat ctcgatggat ctttcaccag aaccttctca 12300
cttagagatg gtggttacta ctcttctgtg gtggattctc acatgcactt caagtctgct 12360
atccaccctt ctatccttca aaacggtgga cctatgttcg ctttcagaag agttgaggaa 12420
gatcactcta acaccgagct tggaatcgtt gagtaccaac atgctttcaa gacccctgat 12480
gctgatgctg gtgaggaata ggcttctcta gctagagtcg atcgacaagc tcgagtttct 12540
ccataataat gtgtgagtag ttcccagata agggaattag ggttcctata gggtttcgct 12600
catgtgttga gcatataaga aacccttagt atgtatttgt atttgtaaaa tacttctatc 12660
aataaaattt ctaattccta aaaccaaaat ccagtactaa aatccagatc gctactagag 12720
gatgcacatg tgaccgaggg acacgaagtg atccgtttaa actatcagtg tttgacagga 12780
tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 12840
gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 12900
ctcgggagtc agccgtgcgg ctgcatgaaa tcctggccgg tttgtctgat gccaagctgg 12960
cggcctggcc ggccagcttg gccgctgaag aaaccgagcg ccgccgtcta aaaaggtgat 13020
gtgtatttga gtaaaacagc ttgcgtcatg cggtcgctgc gtatatgatg cgatgagtaa 13080
ataaacaaat acgcaagggg aacgcatgaa ggttatcgct gtacttaacc agaaaggcgg 13140
gtcaggcaag acgaccatcg caacccatct agcccgcgcc ctgcaactcg ccggggccga 13200
tgttctgtta gtcgattccg atccccaggg cagtgcccgc gattgggcgg ccgtgcggga 13260
agatcaaccg ctaaccgttg tcggcatcga ccgcccgacg attgaccgcg acgtgaaggc 13320
catcggccgg cgcgacttcg tagtgatcga cggagcgccc caggcggcgg acttggctgt 13380
gtccgcgatc aaggcagccg acttcgtgct gattccggtg cagccaagcc cttacgacat 13440
atgggccacc gccgacctgg tggagctggt taagcagcgc attgaggtca cggatggaag 13500
gctacaagcg gcctttgtcg tgtcgcgggc gatcaaaggc acgcgcatcg gcggtgaggt 13560
tgccgaggcg ctggccgggt acgagctgcc cattcttgag tcccgtatca cgcagcgcgt 13620
gagctaccca ggcactgccg ccgccggcac aaccgttctt gaatcagaac ccgagggcga 13680
cgctgcccgc gaggtccagg cgctggccgc tgaaattaaa tcaaaactca tttgagttaa 13740
tgaggtaaag agaaaatgag caaaagcaca aacacgctaa gtgccggccg tccgagcgca 13800
cgcagcagca aggctgcaac gttggccagc ctggcagaca cgccagccat gaagcgggtc 13860
aactttcagt tgccggcgga ggatcacacc aagctgaaga tgtacgcggt acgccaaggc 13920
aagaccatta ccgagctgct atctgaatac atcgcgcagc taccagagta aatgagcaaa 13980
tgaataaatg agtagatgaa ttttagcggc taaaggaggc ggcatggaaa atcaagaaca 14040
accaggcacc gacgccgtgg aatgccccat gtgtggagga acgggcggtt ggccaggcgt 14100
aagcggctgg gttgtctgcc ggccctgcaa tggcactgga acccccaagc ccgaggaatc 14160
ggcgtgacgg tcgcaaacca tccggcccgg tacaaatcgg cgcggcgctg ggtgatgacc 14220
tggtggagaa gttgaaggcc gcgcaggccg cccagcggca acgcatcgag gcagaagcac 14280
gccccggtga atcgtggcaa gcggccgctg atcgaatccg caaagaatcc cggcaaccgc 14340
cggcagccgg tgcgccgtcg attaggaagc cgcccaaggg cgacgagcaa ccagattttt 14400
tcgttccgat gctctatgac gtgggcaccc gcgatagtcg cagcatcatg gacgtggccg 14460
ttttccgtct gtcgaagcgt gaccgacgag ctggcgaggt gatccgctac gagcttccag 14520
acgggcacgt agaggtttcc gcagggccgg ccggcatggc cagtgtgtgg gattacgacc 14580
tggtactgat ggcggtttcc catctaaccg aatccatgaa ccgataccgg gaagggaagg 14640
gagacaagcc cggccgcgtg ttccgtccac acgttgcgga cgtactcaag ttctgccggc 14700
gagccgatgg cggaaagcag aaagacgacc tggtagaaac ctgcattcgg ttaaacacca 14760
cgcacgttgc catgcagcgt acgaagaagg ccaagaacgg ccgcctggtg acggtatccg 14820
agggtgaagc cttgattagc cgctacaaga tcgtaaagag cgaaaccggg cggccggagt 14880
acatcgagat cgagctagct gattggatgt accgcgagat cacagaaggc aagaacccgg 14940
acgtgctgac ggttcacccc gattactttt tgatcgatcc cggcatcggc cgttttctct 15000
accgcctggc acgccgcgcc gcaggcaagg cagaagccag atggttgttc aagacgatct 15060
acgaacgcag tggcagcgcc ggagagttca agaagttctg tttcaccgtg cgcaagctga 15120
tcgggtcaaa tgacctgccg gagtacgatt tgaaggagga ggcggggcag gctggcccga 15180
tcctagtcat gcgctaccgc aacctgatcg agggcgaagc atccgccggt tcctaatgta 15240
cggagcagat gctagggcaa attgccctag caggggaaaa aggtcgaaaa agcttctttc 15300
ctgtggatag cacgtacatt gggaacccaa agccgtacat tgggaaccgg aacccgtaca 15360
ttgggaaccc aaagccgtac attgggaacc ggtcacacat gtaagtgact gatataaaag 15420
agaaaaaagg cgatttttcc gcctaaaact ctttaaaact tattaaaact cttaaaaccc 15480
gcctggcctg tgcataactg tctggccagc gcacagccga acagctgcaa aaagcgccta 15540
cccttcggtc gctgcgctcc ctacgccccg ccgcttcgcg tcggcctatc gcggccgctg 15600
gccgctcaaa aatggctggc ctacggccag gcaatctacc agggcgcgga caagccgcgc 15660
cgtcgccact cgaccgccgg cgcccacatc aaggctccga gtgcgcggaa cccctatttg 15720
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 15780
gcttcaataa tattgaaaaa ggaagagtat ggctaaaatg agaatatcac cggaattgaa 15840
aaaactgatc gaaaaatacc gctgcgtaaa agatacggaa ggaatgtctc ctgctaaggt 15900
atataagctg gtgggagaaa atgaaaacct atatttaaaa atgacggaca gccggtataa 15960
agggaccacc tatgatgtgg aacgggaaaa ggacatgatg ctatggctgg aaggaaagct 16020
gcctgttcca aaggtcctgc actttgaacg gcatgatggc tggagcaatc tgctcatgag 16080
tgaggccgat ggcgtccttt gctcggaaga gtatgaagat gaacaaagcc ctgaaaagat 16140
tatcgagctg tatgcggagt gcatcaggct ctttcactcc atcgacatat cggattgtcc 16200
ctatacgaat agcttagaca gccgcttagc cgaattggat tacttactga ataacgatct 16260
ggccgatgtg gattgcgaaa actgggaaga ggacactcca tttaaagatc cgcgcgagct 16320
gtatgatttt ttaaagacgg aaaagcccga agaggaactt gtcttttccc acggcgacct 16380
gggagacagc aacatctttg tgaaagatgg caaagtaagt ggctttattg atcttgggag 16440
aagcggcagg gcggacaagt ggtatgacat tgccttctgc gtccggtcgc tcagggagga 16500
tatcggggaa gaacagtatg tcgagctatt ttttgactta ctggggatca agcctgattg 16560
ggagaaaata aaatattata ttttactgga tgaattgttt tagctgtcag accaagttta 16620
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 16680
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 16740
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 16800
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 16860
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 16920
tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 16980
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 17040
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 17100
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 17160
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 17220
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 17280
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 17340
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttt 17384
<210>75
<211>856
<212>DNA
<213>Artificial Sequence
<400>75
ccgtcgtact aaagatagtt cgaacaaaaa tccaaaacac atttctcatt tcacaaaaca 60
aacgaaaact attgagtcac aaaacacaga gagaatggag aaaacagagg aaagcgtcgg 120
aatcagagtt tacacgacga caacgacgca aaatccgtca ccaacatcgt ctcggtcgcc 180
caaacctgtc cctctctctt cactgcctat gcttccggca ggagccgccg cgggaggagg 240
aaaaggtaga aaacgtcgca tggtggcgaa aggagttcaa aaaacggttt cgaagacatc 300
aatgctcgtc aatttccttc cgacaggaac tctcttgatg ttcgaaatgg ttcttccgac 360
aatctaccgt gacggagact gtaacggaat caacacactc atgattcatc ttctcttgct 420
tctttgcgca atgtcttgtt tcttcttcca tttcaccgac agtttcaaag cctccgatgg 480
gaaaatttac tacggttttg tgactccacg tggactcgcg gtgttcatga aaccaccctc 540
gccggggttt ggaggcggag atgtgattgc agagaaggag attccggtga cggatgagag 600
gtataagttg agggttaatg actttgtgca ttcagtgatg agtgttttgg tttttatggc 660
gatcgcgttt tcggatcgga gagtcacagg gtgtttgttt ccaggaaaag agaaggagat 720
ggatcaagtt atggagagtt ttccgttaat ggtcggaatt gtttgcagtg ctttgtttct 780
tgtttttccg accagtcgat acggtgtcgg atgcatgtct acataataac taatttcact 840
tttctgttgt tttgtg 856
<210>76
<211>992
<212>DNA
<213>Artificial Sequence
<400>76
cgatgaaact ctataaccgt caataaccgc cgcgatttga aaaataaata caaaaatctc 60
attctccatt aaaccattta acacaacata cgaaaaactg gtaaatcaca aaagaaaaaa 120
acagagagaa acacacgaaa atggagaaaa cagaggaaag cgtcggaatc agagtttaca 180
cggcgactcc gccgcaaaaa ccatcaccat caccaccttc tcgttcacca aaacccgtct 240
taatctcttc attgccttcc ctcccgtcag gagccgccgc tggaggagga agaggtcgaa 300
aacgtcgcat ggtggcgcaa ggagttcaaa aaacggtttc gaagacatca atgctcgtca 360
acttccttcc gacaggaaca ctcttgatgt tcgaaatggt tcttccatca atataccgtg 420
acggagactg taacggaatc aacacactca tgattcatct cctcttgctt ctttgcgcaa 480
tgtcttgttt cttcttccat tttaccgaca gtttcaaagc atccgatggg aagatctact 540
acggtttcgt gacgccacgt ggactcgcgg tgttcatgaa accgccgcct ccagagtttg 600
gtggcggaga tgttatagcg gaggcagaga ttccggtgac tgatgatagg tataagttga 660
cggttaatga ctttgttcat gcagtgatga gcgttttggt gtttatggcg attgcgtttt 720
cggatcgaag agtcacggga tgtttgtttc cagggaaaga gaaagagatg gatcaagtta 780
tggagagttt tccaataatg gttggaattg tttgtagtgc tttgtttctt gtttttccga 840
ccactcgata tggtgttggt tgcatgactg gttaatttat tttcactttt ctgttttttg 900
gtttgtttta gtatctattt cgtattttcc ttgtaattta gattatctga tttaaactcc 960
aatgttctac tatttttatc tattgtattg tt 992

Claims (6)

1. m2所示的物质在培育植物单倍体诱导系或培育植物单倍体或提高植物单倍体诱导能力中的应用;
m2为敲除植物中编码蛋白质的基因的物质;
所述蛋白质的氨基酸序列如序列44或序列46所示;
所述植物为大豆。
2.一种植物单倍体诱导系的制备方法,为敲除受体植物中编码权利要求1中所述蛋白质的基因,得到植物单倍体诱导系;
所述植物为大豆。
3.一种植物单倍体诱导系的制备方法,其包括将按照权利要求2所述方法制备得到的植物单倍体诱导系进行自交的步骤;
所述植物为大豆。
4.一种提高植物单倍体诱导能力的方法,包括如下步骤:敲除受体植物中编码权利要求1中所述蛋白质的基因,得到植物单倍体诱导系;所述植物单倍体诱导系的单倍体诱导能力高于所述受体植物;
所述植物为大豆。
5.一种植物单倍体的制备方法,包括如下步骤:将按照权利要求2或3所述方法制备的植物单倍体诱导系或其后代进行自交或者作为父本与其他植物材料进行杂交,得到自交后代或杂交后代,即为所述植物单倍体;
所述植物为大豆。
6.根据权利要求5所述的方法,其特征在于:所述方法还包括如下步骤:将所述自交后代或所述杂交后代单株进行荧光标记鉴定和/或单倍体性状鉴定和/或叶片倍性鉴定和/或分子标记鉴定,选取至少一种方法鉴定为单倍体的后代单株为植物单倍体。
CN202111462060.1A 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因及其应用 Active CN114656546B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202311219047.2A CN117069813A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因BnDMP及其应用
CN202311215614.7A CN117285610A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因NtDMP及其应用
CN202311219347.0A CN117069814B (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因GhDMP及其应用

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011405532 2020-12-03
CN2020114055325 2020-12-03

Related Child Applications (3)

Application Number Title Priority Date Filing Date
CN202311219047.2A Division CN117069813A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因BnDMP及其应用
CN202311215614.7A Division CN117285610A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因NtDMP及其应用
CN202311219347.0A Division CN117069814B (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因GhDMP及其应用

Publications (2)

Publication Number Publication Date
CN114656546A CN114656546A (zh) 2022-06-24
CN114656546B true CN114656546B (zh) 2023-09-19

Family

ID=81852957

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202311215614.7A Pending CN117285610A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因NtDMP及其应用
CN202311219047.2A Pending CN117069813A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因BnDMP及其应用
CN202111462060.1A Active CN114656546B (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因及其应用
CN202311219347.0A Active CN117069814B (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因GhDMP及其应用

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202311215614.7A Pending CN117285610A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因NtDMP及其应用
CN202311219047.2A Pending CN117069813A (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因BnDMP及其应用

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311219347.0A Active CN117069814B (zh) 2020-12-03 2021-12-02 孤雌生殖单倍体诱导基因GhDMP及其应用

Country Status (2)

Country Link
CN (4) CN117285610A (zh)
WO (1) WO2022117024A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117285610A (zh) * 2020-12-03 2023-12-26 中国农业大学 孤雌生殖单倍体诱导基因NtDMP及其应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106998665A (zh) * 2014-08-28 2017-08-01 Kws种子欧洲股份公司 单倍体植物的产生
CN107223155A (zh) * 2014-11-12 2017-09-29 Kws种子欧洲股份公司 单倍体诱导系
CN107920486A (zh) * 2015-06-30 2018-04-17 明尼苏达大学董事会 用于加速基因组编辑的单倍体诱导系
CN109628480A (zh) * 2018-02-08 2019-04-16 中国农业大学 玉米孤雌生殖单倍体诱导基因ZmPLA1E及其应用
CN110546266A (zh) * 2017-02-28 2019-12-06 科沃施种子欧洲股份两合公司 高粱的单倍体化
CN111073875A (zh) * 2019-01-31 2020-04-28 中国农业大学 小麦单倍体诱导基因及其应用
CN111165350A (zh) * 2020-03-18 2020-05-19 中国农业大学 一种高效鉴别玉米单倍体幼胚的诱导系的选育方法
CN111763687A (zh) * 2019-03-12 2020-10-13 中国农业大学 一种基于基因编辑技术快速培育玉米单倍体诱导系的方法
CN111996209A (zh) * 2019-05-27 2020-11-27 中国农业大学 孤雌生殖单倍体诱导基因dmp及其应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009099580A2 (en) * 2008-02-05 2009-08-13 Monsanto Technology, Llc Isolated novel nucleic acid and protein molecules from soy and methods of using those molecules to generate transgenic plants with enhanced agronomic traits
US10448588B2 (en) * 2013-03-15 2019-10-22 Syngenta Participations Ag Haploid induction compositions and methods for use therefor
CN107434824B (zh) * 2016-05-25 2019-08-20 北京大学 OsTGA10蛋白及其编码基因在调控植物育性中的应用
WO2018015957A1 (en) * 2016-07-21 2018-01-25 Kaiima Bio Agritech Ltd. Compositions and methods for generating a haploid of a target plant
MX2019006069A (es) * 2016-12-02 2019-08-14 Syngenta Participations Ag Edicion genica e induccion de haploides simultaneas.
US10519456B2 (en) * 2016-12-02 2019-12-31 Syngenta Participations Ag Simultaneous gene editing and haploid induction
CN106701803B (zh) * 2017-01-13 2019-03-08 中国农业大学 玉米母本单倍体主效诱导基因及应用
US20190352652A1 (en) * 2017-10-04 2019-11-21 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
CN112005878B (zh) * 2020-08-24 2022-06-21 中国农业大学 一种快速选育玉米单倍体诱导系的方法及其应用
CN117285610A (zh) * 2020-12-03 2023-12-26 中国农业大学 孤雌生殖单倍体诱导基因NtDMP及其应用

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106998665A (zh) * 2014-08-28 2017-08-01 Kws种子欧洲股份公司 单倍体植物的产生
CN107223155A (zh) * 2014-11-12 2017-09-29 Kws种子欧洲股份公司 单倍体诱导系
CN107920486A (zh) * 2015-06-30 2018-04-17 明尼苏达大学董事会 用于加速基因组编辑的单倍体诱导系
CN110546266A (zh) * 2017-02-28 2019-12-06 科沃施种子欧洲股份两合公司 高粱的单倍体化
CN109628480A (zh) * 2018-02-08 2019-04-16 中国农业大学 玉米孤雌生殖单倍体诱导基因ZmPLA1E及其应用
CN111073875A (zh) * 2019-01-31 2020-04-28 中国农业大学 小麦单倍体诱导基因及其应用
CN111763687A (zh) * 2019-03-12 2020-10-13 中国农业大学 一种基于基因编辑技术快速培育玉米单倍体诱导系的方法
CN111996209A (zh) * 2019-05-27 2020-11-27 中国农业大学 孤雌生殖单倍体诱导基因dmp及其应用
CN111165350A (zh) * 2020-03-18 2020-05-19 中国农业大学 一种高效鉴别玉米单倍体幼胚的诱导系的选育方法

Non-Patent Citations (13)

* Cited by examiner, † Cited by third party
Title
A Kasaras、R Kunze.Expression, localisation and phylogeny of a novel family of plant-specific membrane proteins.《Plant Biology》.2010,第12卷(第12期),第140-152页. *
CENH3介导的单倍体诱导技术研究进展;段民孝等;《分子植物育种》;第15卷(第10期);第4127-4132页 *
Cotton DMP gene family: characterization, evolution, and expression profiles during development and stress;Shouhong Zhu等;《International Journal of Biological Macromolecules》;第183卷;第1257-1269页 *
Genbank.XM_003553040.2:PREDICTED: Glycine max protein DMP9 (LOC100802901), mRNA.《Genbank》.2018,标题、PROTEIN、CDS、ORIGIN部分. *
GenBank.XM_003553043.2:PREDICTED: Glycine max protein DMP9 (LOC100806096), mRNA.《GenBank》.2018,标题、PROTEIN、CDS、ORIGIN部分. *
GenBank.XM_004239348.3:PREDICTED: Solanum lycopersicum protein DMP8-like (LOC101263909), mRNA.《GenBank》.2018,标题、PROTEIN、CDS、ORIGIN部分. *
Genbank.XM_009132872.3:PREDICTED: Brassica rapa protein DMP9 (LOC103855829), mRNA.《Genbank》.2020,标题、PROTEIN、CDS、ORIGIN部分. *
Genbank.XM_033290102.1:PREDICTED: Brassica rapa protein DMP9 (LOC103863904), mRNA.《Genbank》.2020,标题、PROTEIN、CDS、ORIGIN部分. *
Yu Zhong等.A DMP-triggered in vivo maternal haploid induction system in the dicotyledonous Arabidopsi.《Nature Plants》.2020,第6卷(第5期),第466页右栏第3段、摘要. *
Yu Zhong等.Mutation of ZmDMP enhances haploid induction in maize.《Nature Plants》.2019,第5卷(第5期),第575-580页. *
景润春、卢洪.CRISPR/Cas9基因组定向编辑技术的发展与在作物遗传育种中的应用.《中国农业科学》.2016,2016年第49卷(第07期),第1219-1229页. *
玉米杂交诱导单倍生殖育种工具材料――单倍体诱导系;任军等;《玉米科学》;第28卷(第01期);第9-16页 *
陈海强等.植物单倍体诱导技术发展与创新.《遗传》.2020,2020年第42卷(第05期),第466-482页. *

Also Published As

Publication number Publication date
CN117069814B (zh) 2024-04-19
CN117069814A (zh) 2023-11-17
WO2022117024A1 (zh) 2022-06-09
CN117069813A (zh) 2023-11-17
CN114656546A (zh) 2022-06-24
CN117285610A (zh) 2023-12-26

Similar Documents

Publication Publication Date Title
CN106834341B (zh) 一种基因定点突变载体及其构建方法和应用
TWI414236B (zh) 玉米品件das-59122-7及測定該品件的方法
KR101303110B1 (ko) 옥수수 이벤트 mir604
AU2020264325A1 (en) Plant genome modification using guide rna/cas endonuclease systems and methods of use
TWI568851B (zh) 用於檢測大豆品件pdab9582.814.19.1的方法
JP6315481B2 (ja) トウモロコシイベントmon87411
CN106687594A (zh) 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
CN115175556B (zh) 与大豆中锈病抗性相关联的新颖的遗传基因座
CN101027396A (zh) Cry1F和Cry1Ac转基因棉花株系及其事件特异性鉴定
AU2019460919B2 (en) Nucleic acid sequence for detecting soybean plant DBN8002 and detection method therefor
JP5908834B2 (ja) 病原体抵抗性の植物
UA126433C2 (uk) Ген стійкості до іржі стебел пшениці і спосіб його застосування
CN112725374A (zh) 创制植物单倍体诱导系的方法及其应用
CN111118053B (zh) 水稻育性调控构建体及其转化事件和应用
WO2023155193A1 (zh) 用于检测大豆植物dbn8205的核酸序列及其检测方法
CN101189341B (zh) 用于制备抗真菌病原体的植物的多核苷酸和方法
CN114656546B (zh) 孤雌生殖单倍体诱导基因及其应用
WO2019223676A1 (zh) Clals蛋白、其编码基因及它们在预测西瓜除草剂抗性中的应用
CN109837295A (zh) 一种用基因编辑创制的水稻单倍体诱导系及其创制方法和应用
WO2018196744A1 (zh) 转基因大豆事件gc1-1外源插入片段旁侧序列及其应用
CN114134171A (zh) 一种抑制或杀灭东方黏虫的方法及其应用
Yang et al. Identification of resistance genes to Phytophthora sojae in domestic Soybean cultivars from China using particle bombardment
CN108795949B (zh) 一种水稻叶色调控相关基因OsWSL6及其编码蛋白质和应用
CN110129359B (zh) 检测基因编辑事件以及测定基因编辑效率的方法以及其应用
CN116926109B (zh) 一种植物程序化花粉自清除CRISPR/Cas基因编辑方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant