CN113645840A - 单倍体诱导物 - Google Patents

单倍体诱导物 Download PDF

Info

Publication number
CN113645840A
CN113645840A CN202080026032.2A CN202080026032A CN113645840A CN 113645840 A CN113645840 A CN 113645840A CN 202080026032 A CN202080026032 A CN 202080026032A CN 113645840 A CN113645840 A CN 113645840A
Authority
CN
China
Prior art keywords
amino acid
seq
plant
ser
haploid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080026032.2A
Other languages
English (en)
Inventor
M·克洛伊贝尔-迈茨
M·奥祖诺娃
F·布鲁尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KWS SAAT SE and Co KGaA
Original Assignee
KWS SAAT SE and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE and Co KGaA filed Critical KWS SAAT SE and Co KGaA
Publication of CN113645840A publication Critical patent/CN113645840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Botany (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Immunology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及具有单倍体诱导物的活性的植物,所述单倍体诱导物包含植物中KINETOCHORE NULL2(KNL2)蛋白的某些区域,特别是SANTA结构域内的突变。提供了生成单倍体细胞和双单倍体细胞的方法以及相应的植物和植物部分。本发明还涉及用于鉴定植物群中植物的方法,其中植物在KNL2蛋白中,特别是在SANTA结构域内具有至少一处突变,其赋予单倍体诱导物的活性。进一步提供了一组用于鉴定具有单倍体诱导物的活性的植物的寡核苷酸。

Description

单倍体诱导物
技术领域
本发明涉及具有单倍体诱导物的活性的植物。根据本发明,通过在植物中的KINETOCHORE NULL2(KNL2)蛋白的某些区域、特别是在SANTA结构域内导入突变,可以获得特别高的单倍体诱导率。本发明提供了产生单倍体细胞和双单倍体细胞的方法以及相应的植物和植物部分的方法。本发明还涉及一种在植物群体中鉴别植物的方法,其中所述植物在KNL2蛋白、特别是在SANTA结构域内具有至少一处突变,所述突变赋予单倍体诱导物的活性。本发明进一步提供了一组鉴别具有单倍体诱导物的活性的植物的寡核苷酸。本发明还涉及根据本发明的一组寡核苷酸在鉴别具有单倍体诱导物的活性的植物中的应用。
发明背景
单倍体的产生和应用是改良栽培植物最有力的生物技术手段之一。单倍体对育种者的优势在于,在多倍体杂交育种(dihaploidization)后第一代中就可以实现纯合性,产生双单倍体(doubled haploid)植物,无需费力的回交步骤即可获得高度的纯合性。此外,单倍体在植物研究和育种中的价值在于,双单倍体的生成细胞是减数分裂的产物,因此产生的群体构成了多样化重组体和同时基因固定个体的库。因此,双单倍体的产生不仅为作物改良提供了非常有用的遗传变异性可供选择,而且还是产生作图群体、重组近交以及即时纯合突变体和转基因品系的宝贵手段。
单倍体植物可以通过种间杂交获得,其中一个亲本基因组在受精后被消除。结果表明,受精后的基因组消除可以通过在拟南芥(Arabidopsis thaliana)中修饰着丝粒蛋白、即着丝粒特异性组蛋白CENH3而诱导(Ravi and Chan,Haploid plants produced bycentromere-mediated genome elimination,Nature,Vol.464,2010,615-619)。对于修饰的单倍体诱导品系,当单倍体诱导植物与野生型植物杂交时,后代中发生单倍化。有趣的是,单倍体诱导品系在自交时是稳定的,提示发育中的杂交胚中修饰的和野生型着丝粒之间的竞争导致诱导物亲本的着丝粒失活,从而导致单亲染色体消除。
KINETOCHORE NULL2(KNL2)是在有丝分裂和减数分裂期间识别着丝粒的起重要作用蛋白质,并参与将CENH3加载到着丝粒上(Lermontova I.(2013)ArabidosisKINETOCHORE NULL2 is an upstream component for Centromeric Histone H3 variantcenH3 deposition at centromeres,The Plant Cell,25,3389-3404)。在包括油菜籽、高粱等在内的许多植物物种中,KNL2包含通过蛋白质-蛋白质相互作用与组蛋白相互作用的SANTA结构域(SEQ ID NO:1-15)及直接与DNA相互作用的CENPCk结构域(SEQ ID NO:32-40)。这些结构域在不同作物物种中高度保守,分别由共有序列(SEQ ID NO:16-23)和(SEQID NO:41、42)表示。有结果显示KNL2中的突变导致拟南芥中的单倍体诱导(WO 2017/067714 A1)。然而,到目前为止,在其它植物物种、特别是在作物植物中,还没有KNL2诱导的单倍体诱导的报道。虽然Lermontova et al.2013报道了KNL2突变体在拟南芥中的诱导能力,但是到目前为止还不可能通过KNL2的诱变将拟南芥的单倍体诱导转移到作物植物中,只能达到非常低的诱导率(<1%)。
因此,本发明的一个目的是鉴别作物植物的KNL2蛋白中的序列基序,其中的突变赋予单倍体诱导物的活性。本发明的另一目的是提供表现出至少1%或更高的单倍体诱导率的作物植物。
发明概述
根据本发明第一方面,上述目的通过具有单倍体诱导物的活性及包含编码包含SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列的植物来实现,其中所述核苷酸序列包含至少一处突变,其导致在SANTA结构域中KNL2蛋白质的氨基酸序列的改变,并且所述改变赋予单倍体诱导物的活性。
在根据本发明各个方面的一个实施方式中,在上述植物中,野生型KNL2蛋白包含SEQ ID NO:24-27所示氨基酸序列,或包含与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列;或其中编码野生型KNL2蛋白的核苷酸序列选自如下一组:
(i)SEQ ID NO:28-31任一序列所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一序列所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(v)在严格条件下与(ii)的序列杂交的核苷酸序列;或
(vi)由于遗传密码的简并而不同于(i)、(ii)、(iii)或(v)的序列的核苷酸序列。
在根据本发明各个方面的另一实施方式中,在上述植物中,在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的至少一处突变,导致KNL2蛋白的改变,所述改变赋予单倍体诱导物的活性。优选地,所述改变是取代一个或多个氨基酸、插入或缺失一个或多个氨基酸、改变剪接位点或由于插入的终止密码子导致KNL2蛋白的过早终止。
在根据本发明各个方面的一个实施方式中,从上述植物和野生型植物或表达野生型KNL2蛋白的植物生成合子,产生至少0.5%、优选至少1.0%、至少2.0%、至少3.0%、至少4.0%、至少5.0%、至少6.0%或至少7.0%的单倍体后代。
在根据本发明各个方面的另一实施方式中,包含突变的核苷酸序列是内源基因或转基因。
在本发明各个方面的一个优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中,更优选在根据SEQID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的氨基酸的取代、插入或缺失。
在本发明各个方面的另一优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的一个或多个氨基酸的取代、插入或缺失。
在本发明各个方面的一个优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第71位氨基酸谷氨酸(E)、SEQID NO:25的第69位氨基酸谷氨酸(E)、SEQ ID NO:26的第95位氨基酸谷氨酸(E)、SEQ IDNO:27的第63位氨基酸谷氨酸(E),或对应于SEQ ID NO:20或88-102中任一序列的第4位氨基酸或SEQ ID NO:23或133-147中任一序列的第14位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于谷氨酸(E)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明各个方面的另一优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第73位氨基酸丝氨酸(S)、SEQID NO:25的第71位氨基酸丝氨酸(S)、SEQ ID NO:26的第97位氨基酸谷氨酸(E)、SEQ IDNO:26的第97位氨基酸缬氨酸(V)、SEQ ID NO:27的第65位氨基酸缬氨酸(V),或对应于SEQID NO:20或88-102中任一序列的第6位氨基酸或SEQ ID NO:23或133-147中任一序列的第16位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第69位氨基酸苏氨酸(T)、SEQ IDNO:25的第67位氨基酸苏氨酸(T)、SEQ ID NO:26的第93位氨基酸缬氨酸(V)、SEQ ID NO:27的第61位氨基酸谷氨酸(E),或对应于SEQ ID NO:20或88-102中任一序列的第2位氨基酸或SEQ ID NO:23或133-147中任一序列的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、苏氨酸(T)和缬氨酸(V)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第70位氨基酸亮氨酸(L)、SEQ IDNO:25的第68位氨基酸亮氨酸(L)、SEQ ID NO:26的第94位氨基酸亮氨酸(L)、SEQ ID NO:27的第62位氨基酸亮氨酸(L)、或对应于SEQ ID NO:20或88-102中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第13位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于亮氨酸(L)和异亮氨酸(I)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第72位氨基酸丙氨酸(A)、SEQ IDNO:25的第70位氨基酸丙氨酸(A)、SEQ ID NO:26的第96位氨基酸苏氨酸(T)、SEQ ID NO:27的第64位氨基酸苏氨酸(T),或对应于SEQ ID NO:20或88-102中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第15位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)、丝氨酸(S)、天冬氨酸(D)、酪氨酸(Y)的氨基酸,更优选取代为氨基酸异亮氨酸(I)或苏氨酸(T)。
在本发明各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第74位氨基酸天冬氨酸(D)、SEQID NO:25的第72位氨基酸天冬氨酸(D)、SEQ ID NO:26的第98位氨基酸谷氨酸(E),SEQ IDNO:27的第66位氨基酸天冬氨酸(D)、或对应于SEQ ID NO:20或88-102中任一序列的第7位氨基酸或SEQ ID NO:23或133-147中任一序列的第17位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、谷氨酸(E)和甘氨酸(G)的氨基酸,更优选取代为氨基酸天冬酰胺(N)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第75位氨基酸甘氨酸(G)、SEQ IDNO:25的第73位氨基酸甘氨酸(G)、SEQ ID NO:26的第99位氨基酸甘氨酸(G)、SEQ ID NO:27的第67位氨基酸甘氨酸(G)、或对应于SEQ ID NO:20或88-102中任一序列的第8位氨基酸或SEQ ID NO:23或133-147中任一序列的第18位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、天冬酰胺(N)和组氨酸(H)的氨基酸,更优选取代为精氨酸(R)或谷氨酸(E)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第58位氨基酸丝氨酸(S)、SEQ IDNO:25的第56位氨基酸丝氨酸(S)、SEQ ID NO:26的第82位氨基酸脯氨酸(P)、SEQ ID NO:27的第50位氨基酸丝氨酸(S)、或对应于SEQ ID NO:19或73-87中任一序列的第1位氨基酸或SEQ ID NO:23或133-147中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第60位氨基酸脯氨酸(P)、SEQID NO:25的第58位氨基酸脯氨酸(P)、SEQ ID NO:26的第84位氨基酸脯氨酸(P)、SEQ IDNO:27的第52位氨基酸脯氨酸(P)、或对应于SEQ ID NO:19或73-87中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)或丝氨酸(S)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第62位氨基酸亮氨酸(L)、SEQ IDNO:25的第60位氨基酸缬氨酸(V)、SEQ ID NO:26的第86位氨基酸丙氨酸(A)、SEQ ID NO:27的第54位氨基酸亮氨酸(L)、或对应于SEQ ID NO:19或73-87中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、丙氨酸(A)、亮氨酸(L)、缬氨酸(V)和苏氨酸(T)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第66位氨基酸天冬氨酸(D)、SEQ IDNO:25的第64位氨基酸天冬氨酸(D)、SEQ ID NO:26的第90位氨基酸苏氨酸(T)、在SEQ IDNO:27的第58位氨基酸天冬氨酸(D)、或对应于SEQ ID NO:19或73-87中任一序列的第9位氨基酸或SEQ ID NO:23或133-147中任一序列的第9位氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、苏氨酸(T)、丙氨酸(A)和谷氨酸(E)的氨基酸,更优选取代为天冬酰胺(N),或
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第67位氨基酸缬氨酸(V)、SEQID NO:25的第65位氨基酸缬氨酸(V)、SEQ ID NO:26的第91位氨基酸丝氨酸(S)、SEQ IDNO:27的第59位氨基酸亮氨酸(L)、或对应于SEQ ID NO:19或73-87中任一序列的第10位氨基酸或SEQ ID NO:23或133-147中任一序列的第10位氨基酸的氨基酸,取代为另一氨基酸酸,优选取代为不同于缬氨酸(V)、丝氨酸(S)、亮氨酸(L)、天冬酰胺(N)、酪氨酸(Y)、脯氨酸(P)、天冬氨酸(D)和谷氨酸(E)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第12位氨基酸亮氨酸(T)或对应于SEQ ID NO:17或43-57中任一序列的第2位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于苏氨酸(T)、缬氨酸(V)、苯丙氨酸(F)、丝氨酸(S)和亮氨酸(L)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第22位氨基酸脯氨酸(P)或对应于SEQ ID NO:16的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)或谷氨酸(E)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第33位氨基酸甘氨酸(G)或对应于SEQ ID NO:18或58-72中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、精氨酸(R)和丙氨酸(A)的氨基酸,更优选取代为氨基酸谷氨酸(E)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第49位氨基酸丝氨酸(S)或对应于SEQ ID NO:16的第34位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、苏氨酸(T)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第80位氨基酸精氨酸(R)或对应于SEQ ID NO:16的第65位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于精氨酸(R)的氨基酸,更优选取代为氨基酸组氨酸(H)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第84位氨基酸天冬酰胺(N)或对应于SEQ ID NO:21或103-117中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬酰胺(N)、酪氨酸(Y)和丝氨酸(S)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第88位氨基酸脯氨酸(P)或对应于SEQ ID NO:21或103-117中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第100位氨基酸脯氨酸(P)或对应于SEQ ID NO:22或118-132中任一序列的第7位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸和天冬氨酸(D)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:26的第68位氨基酸丙氨酸(A)、或对应于SEQ ID NO:18或58-72中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和丝氨酸(S)的氨基酸,更优选取代为氨基酸苏氨酸(T)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是通过在编码KNL2蛋白的核苷酸序列中插入终止密码子、无义突变、移码突变或剪接位点突变所致,所述KNL2蛋白具有SEQ ID NO:24-27所示氨基酸序列、或者与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列,或者是在SEQ ID NO:28-31所示编码KNL2蛋白的核苷酸序列、或者与SEQ ID NO:28-31所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的核苷酸序列中插入终止密码子、无义突变、移码突变或剪接位点突变所致。这种终止密码子或无义突变可能导致KNL2蛋白翻译过早终止。这种移码突变或剪接位点突变可能会改变读框,导致与原始KNL2蛋白完全不同的翻译。优选地,将终止密码子、无义突变或移码突变插入编码SANTA结构域的核苷酸序列和/或编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中,更优选将终止密码子是插入编码根据SEQ ID NO:23或133-147的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列,甚至更优选将终止密码子插入编码根据SEQ IDNO:20或88-102的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列,甚至最优选将终止密码子插入到编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中。
在本发明的各个方面的一个实施方式中,在上述植物中,将编码SEQ ID NO:24的第18位氨基酸谷氨酸(E)、SEQ ID NO:25的第16位氨基酸谷氨酰胺(Q)、SEQ ID NO:26的第45位氨基酸组氨酸(H)、SEQ ID NO:27的第8位氨基酸谷氨酰胺(Q)的密码子改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,将编码SEQ ID NO:24的第27位氨基酸色氨酸(W)、SEQ ID NO:25的第25位氨基酸色氨酸(W)、SEQ ID NO:26的第54位氨基酸色氨酸(W)、SEQ ID NO:27的第17位氨基酸色氨酸(W)的密码子改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,将编码SEQ ID NO:27的第17位氨基酸色氨酸(W)或SEQ ID NO:24-26任一序列的相应氨基酸的密码子改变为终止密码子。
在本发明的各个方面的又一实施方式中,在上述植物中,将编码SEQ ID NO:26的第54位氨基酸色氨酸(W)或SEQ ID NO:24、25和27任一序列的相应氨基酸的密码子改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,改变位于SEQ ID NO:28的第521位或SEQ ID NO:29的第540位的剪接位点,从而缺失或破坏剪接信号。
在本发明各个方面的另一实施方式中,在上述植物中,改变位于SEQ ID NO:31的第454位的剪接位点,从而缺失或破坏剪接信号。
在本发明的各个方面的一个实施方式中,在上述植物中,包含在SANTA结构域中导致KNL2蛋白的氨基酸序列改变的至少一处突变的核苷酸序列选自下组:SEQ ID NO:168-173、194、195、200-212和232。
在本发明的一个优选实施方式中,具有单倍体诱导物的活性的本发明植物就至少一处突变而言是纯合的。在本发明的另一实施方式中,具有单倍体诱导物的活性的本发明植物就至少一处突变而言是杂合的。
在根据本发明各个方面的另一实施方式中,提供了上述植物的部分,其优选幼枝、根、叶柄、芽、下胚轴、花或花器官、种子、花粉、花药、果实、胚珠、胚、植物组织或细胞。
根据一方面,本发明提供了一种单倍体植物,其可通过将衍生自根据上述任何实施方式的植物的或根据上述任何实施方式的植物产生的第一配子与衍生自或由表达野生型KNL2蛋白、优选仅表达野生型KNL2蛋白的植物产生的第二配子接触,以产生合子。
在本发明的单倍体植物的一个优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或雄配子,即花粉。
在本发明的单倍体植物的又一优选实施方式中,从中衍生第一配子或产生第一配子的植物是母本,从中衍生第二配子或产生第二配子的植物是父本,或者从中衍生第一配子或产生第一配子的植物是父本,从中衍生第二配子或产生第二配子的植物是母本。
根据另一方面,本发明还提供了一种双单倍体植物,通过将上述单倍体植物转化为双单倍体植物,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦(amiprophosmethyl)、氟乐灵、咖啡因和拿草特的染色体加倍剂处理,或在允许自发染色体加倍的条件下栽培转化。
根据另一方面,本发明涉及一种产生单倍体植物细胞的方法,包括以下步骤:
a)提供衍生自根据上述任一实施方式的具有单倍体诱导物的活性的植物或关于下文进一步描述的转基因植物的植物或由它们产生的非天然存在的第一配子;
b)通过将步骤a)的第一配子与衍生自或由相同属、优选相同物种的植物产生的第二配子接触产生合子,所述植物包含如上定义的编码野生型KNL2蛋白的核苷酸序列,及能表达野生型KNL2蛋白,优选仅表达野生型KNL2蛋白;
c)通过从所述合子中消除具有单倍体诱导物的活性的植物染色体而获得单倍体细胞。
在一个实施方式中,上述产生单倍体植物细胞的方法是产生单倍体植物或其部分的方法,除步骤a)至c)外还包括以下步骤:
d)在获得单倍体植物或其部分的条件下使所述单倍体细胞生长;和
e)获得单倍体植物或其部分。
在产生单倍体植物细胞、单倍体植物或其部分的方法的又一优选实施方式中,所述第一配子是雌配子,即卵细胞/胚珠,或是雄配子,即花粉。
在产生单倍体植物细胞、单倍体植物或其部分的方法的另一优选实施方式中,从中衍生第一配子或产生第一配子的植物是母本,从中衍生第二配子或产生第二配子的植物是父本,或者从中衍生第一配子或产生第一配子的植物是父本,从中衍生第二配子或产生第二配子的植物是母本。
根据另一方面,本发明提供了一种双单倍体植物细胞的产生方法,包括以下步骤:
a)提供衍生自或由根据上述任一实施方式的具有单倍体诱导物的活性的植物或关于下文进一步描述的转基因植物产生的非天然存在的第一配子;
b)通过将步骤a)的第一配子与衍生自或由相同属、优选相同物种的植物产生的第二配子接触,产生合子,所述植物包含如上定义的编码野生型KNL2蛋白的核苷酸序列,及能表达野生型KNL2蛋白,优选仅表达野生型KNL2蛋白;
c)通过从所述合子中消除具有单倍体诱导物的活性的植物染色体获得单倍体细胞;和
d)将单倍体细胞转化为双单倍体细胞,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特等染色体加倍剂处理,或在允许自发染色体加倍的条件下培养;及
e)获得双单倍体细胞。
在一个实施方式中,上述产生双单倍体植物或其部分的方法除包括步骤a)至e)外,还包括以下步骤:
f)在获得双单倍体植物或其部分的条件下生长所述双单倍体细胞;和
g)获得双单倍体植物或其部分。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的又一优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或是雄配子,即花粉。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的另一优选实施方式中,从中衍生第一配子或产生第一配子的植物是母本,从中衍生第二配子或产生第二配子的植物是父本,或从中衍生第一配子或产生第一配子的植物是父本,从中衍生第二配子或产生第二配子的植物是母本。
根据又一方面,本发明提供了一种在植物群体中鉴别植物或产生植物的方法,其中所述植物如上所述在编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变,其中所述方法包括以下步骤:
(a)使一个植物群体发生突变;
(b)筛选所述植物群体中是否存在至少一处突变,从而在所述植物物种中鉴别在编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变的植物,
其中所述至少一处突变赋予所鉴别植物中单倍体诱导物的活性。
在一个实施方式中,在上述鉴别植物群体中的植物的方法中,所述筛选步骤包括:
(b1)产生一组寡核苷酸,其靶向植物物种中编码KNL2蛋白的内源性核苷酸序列中的至少一处突变;
(b2)提供包括适合检测至少一处突变的一组寡核苷酸的测定;
(b3)通过所述测定针对至少一处突变的存在筛选所述植物群体,从而鉴别在编码KNL2蛋白的内源性核苷酸序列中具有所述至少一处突变的植物。
在一个实施方式中,在上述鉴别植物群体中植物的方法中,所述内源性核苷酸序列选自下组:
(i)SEQ ID NO:28-31任一所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(vi)在严格条件下与(iii)的序列杂交的核苷酸序列;或
(vii)由于遗传密码的简并不同于(i)、(ii)或(iii)的序列的核苷酸序列。
在上述鉴别植物群体中植物的方法的实施方式中,所述植物是欧洲油菜(Brassica napus),所述寡核苷酸系列包含选自于由SEQ ID NO:174-185组成的一组的序列。
在上述鉴别植物群体中植物的方法的另一实施方式中,如上定义的至少一处突变是例如内源性核苷酸序列编码区中或在内源性核苷酸序列的剪接位点中的至少一个核碱基的取代、插入或缺失,所述取代、插入或缺失导致如上所述赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变。
根据另一方面,本发明还提供了一组鉴别具有单倍体诱导物的活性的欧洲油菜植物的寡核苷酸,其中所述寡核苷酸系列包含SEQ ID NO:174-185任一所示序列。
根据又一方面,本发明还涉及一组寡核苷酸作为分子标记以鉴别具有根据本发明的单倍体诱导物的活性的植物的应用。
根据另一方面,本发明提供了编码KINETOCHORE NULL2(KNL2)蛋白或其包含SANTA结构域的功能片段的核苷酸序列,其中所述核苷酸序列包含导致SANTA结构域中KNL2蛋白的氨基酸改变的至少一处突变,其中所述核苷酸序列在所述植物中表达时赋予植物中单倍体诱导物的活性。
在本发明的核苷酸序列的一个实施方式中,(野生型,未突变的)KNL2蛋白包含SEQID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列;或其中编码野生型KNL2蛋白的核苷酸序列选自下组:
(i)SEQ ID NO:28-31任一所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性氨基酸序列的KNL2蛋白的核苷酸序列;
(vi)在严格条件下与(ii)的序列杂交的核苷酸序列;或
(vii)由于遗传密码的简并不同于(i)、(ii)、(iii)或(v)的序列的核苷酸序列。
在本发明的核苷酸序列的另一实施方式中,所述至少一处突变在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中,导致赋予单倍体诱导物的活性的KNL2蛋白的改变。优选地,所述改变是一个或多个氨基酸的取代、一个或多个氨基酸的插入或缺失、剪接位点的改变或由于插入的终止密码子所致KNL2蛋白的提前终止。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的氨基酸的取代、插入或缺失。
在本发明的核苷酸序列的进一步优选的实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQ IDNO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的氨基酸的取代、插入或缺失。
在本发明的核苷酸序列的一个优选实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第71位氨基酸谷氨酸(E)、SEQ ID NO:25的第69位氨基酸谷氨酸(E)、SEQ ID NO:26的第95位氨基酸谷氨酸(E)、SEQ ID NO:27的第63位氨基酸谷氨酸(E)、或对应于SEQ ID NO:20或88-102中任一序列的第4位氨基酸或SEQID NO:23或133-147中任一序列的第14位氨基酸的氨基酸,取代为另一氨基酸酸,优选取代为不同于谷氨酸(E)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明的核苷酸序列的另一优选实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第73位氨基酸丝氨酸(S)、SEQ ID NO:25的第71位氨基酸丝氨酸(S)、SEQ ID NO:26的第97位氨基酸谷氨酸(E)、SEQ ID NO:27的第65位氨基酸缬氨酸(V)、或对应于SEQ ID NO:20或88-102中任一序列的第6位氨基酸或SEQID NO:23或133-147中任一序列的第16位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第69位氨基酸苏氨酸(T)、SEQ ID NO:25的第67位氨基酸苏氨酸(T)、SEQ ID NO:26的第93位氨基酸缬氨酸(V)、SEQ ID NO:27的第61位氨基酸谷氨酸(E)、或对应于SEQ ID NO:20或88-102中任一序列的第2位氨基酸或SEQ IDNO:23或133-147中任一序列的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、苏氨酸(T)和缬氨酸(V)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第70位氨基酸亮氨酸(L)、SEQ ID NO:25的第68位氨基酸亮氨酸(L)、SEQ ID NO:26的第94位氨基酸亮氨酸(L)、SEQ ID NO:27的第62位氨基酸亮氨酸(L)、或对应于SEQ ID NO:20或88-102中任一序列的第3位氨基酸或SEQ IDNO:23或133-147中任一序列的第13位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于亮氨酸(L)和异亮氨酸(I)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第72位氨基酸丙氨酸(A)、SEQ ID NO:25的第70位氨基酸丙氨酸(A)、SEQ ID NO:26的第96位氨基酸苏氨酸(T)、SEQ ID NO:27的第64位氨基酸苏氨酸(T)、或对应于SEQ ID NO:20或88-102中任一序列的第5位氨基酸或SEQ IDNO:23或133-147中任一序列的第15位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)、丝氨酸(S)、天冬氨酸(D)、酪氨酸(Y)的氨基酸,更优选取代为氨基酸异亮氨酸(I)或苏氨酸(T)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第74位氨基酸天冬氨酸(D)、SEQ ID NO:25的第72位氨基酸天冬氨酸(D)、SEQ ID NO:26的第98位氨基酸谷氨酸(E)、SEQ ID NO:27的第66位氨基酸天冬氨酸(D)、或对应于SEQ ID NO:20或88-102中任一序列的第7位氨基酸或SEQ ID NO:23或133-147中任一序列的第17位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、谷氨酸(E)和甘氨酸(G)的氨基酸,更优选取代为氨基酸天冬酰胺(N)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第75位氨基酸甘氨酸(G)的取代、SEQ ID NO:25的第73位氨基酸甘氨酸(G)、SEQ ID NO:26的第99位氨基酸甘氨酸(G)、SEQ ID NO:27的第67位氨基酸甘氨酸(G)、或对应于SEQ ID NO:20或88-102中任一序列的第8位氨基酸或SEQ ID NO:23或133-147中任一序列的第18位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、天冬酰胺(N)和组氨酸(H)的氨基酸,更优选取代为精氨酸(R)或谷氨酸(E)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第58位氨基酸丝氨酸(S)、SEQ ID NO:25的第56位氨基酸丝氨酸(S)、SEQ ID NO:26的第82位氨基酸脯氨酸(P)、SEQ ID NO:27的第50位氨基酸丝氨酸(S)、或对应于SEQ ID NO:19或73-87中任一序列的第1位氨基酸或SEQ IDNO:23或133-147中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第60位氨基酸脯氨酸(P)、SEQ ID NO:25的第58位氨基酸脯氨酸(P)、SEQ ID NO:26的第84位氨基酸脯氨酸(P)、SEQ ID NO:27的第52位氨基酸脯氨酸(P)、或对应于SEQ ID NO:19或73-87中任一序列的第3位氨基酸或SEQ IDNO:23或133-147中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)或丝氨酸(S)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第62位氨基酸亮氨酸(L)、SEQ ID NO:25的第60位氨基酸缬氨酸(V)、SEQ ID NO:26的第86位氨基酸丙氨酸(A)、SEQ ID NO:27的第54位氨基酸亮氨酸(L)、或对应于SEQ ID NO:19或73-87中任一序列的第5位氨基酸或SEQ IDNO:23或133-147中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、丙氨酸(A)、亮氨酸(L)、缬氨酸(V)和苏氨酸(T)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第66位氨基酸天冬氨酸(D)、SEQ ID NO:25的第64位氨基酸天冬氨酸(D)、SEQ ID NO:26的第90位氨基酸苏氨酸(T)、SEQ ID NO:27的第58位氨基酸天冬氨酸(D)、或对应于SEQ ID NO:19或73-87中任一序列的第9位氨基酸或SEQID NO:23或133-147中任一序列的第9位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、苏氨酸(T)、丙氨酸(A)和谷氨酸(E)的氨基酸,更优选取代为天冬酰胺(N)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24的第67位氨基酸缬氨酸(V)、SEQ ID NO:25的第65位氨基酸缬氨酸(V)、SEQ ID NO:26的第91位氨基酸丝氨酸(S)、SEQ ID NO:27的第59位氨基酸亮氨酸(L)、或对应于SEQ ID NO:19或73-87中任一序列的第10位氨基酸或SEQ IDNO:23或133-147中任一序列的第10位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于缬氨酸(V)、丝氨酸(S)、亮氨酸(L)、天冬酰胺(N)、酪氨酸(Y)、脯氨酸(P)、天冬氨酸(D)和谷氨酸(E)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第12位氨基酸亮氨酸(T)或对应于SEQ ID NO:17或43-57中任一序列的第2位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于苏氨酸(T)、缬氨酸(V)、苯丙氨酸(F)、丝氨酸(S)和亮氨酸(L)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第22位氨基酸脯氨酸(P)或对应于SEQ ID NO:16的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)或谷氨酸(E)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第33位氨基酸甘氨酸(G)或对应于SEQ ID NO:18或58-72中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、精氨酸(R)和丙氨酸(A)的氨基酸,更优选取代为氨基酸谷氨酸(E)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第49位氨基酸丝氨酸(S)或对应于SEQ ID NO:16的第34位氨基酸的氨基酸,取代为另一种,优选取代为不同于丝氨酸(S)、苏氨酸(T)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第80位氨基酸精氨酸(R)或对应于SEQ ID NO:16的第65位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于精氨酸(R)的氨基酸,更优选取代为氨基酸组氨酸(H)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第84位氨基酸天冬酰胺(N)或对应于SEQ IDNO:21或103-117中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬酰胺(N)、酪氨酸(Y)和丝氨酸(S)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第88位氨基酸脯氨酸(P)或对应于SEQ ID NO:21或103-117中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27的第100位氨基酸脯氨酸(P)或对应于SEQ IDNO:22或118-132中任一序列的第7位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸和天冬氨酸(D)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:26的第68位氨基酸丙氨酸(A)或对应于SEQ ID NO:18或58-72中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和丝氨酸(S)的氨基酸,更优选取代为氨基酸苏氨酸(T)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是通过在编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列中、或者在SEQ ID NO:28-31所示编码KNL2蛋白的核苷酸序列中或与SEQ ID NO:28-31所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列相同性的核苷酸序列中,进行终止密码子的插入、无义突变、移码突变或剪接位点突变所致的。这种终止密码子或无义突变可导致KNL2蛋白翻译过早终止。这种移码突变或剪接位点突变可改变读框,导致与原始KNL2蛋白完全不同的翻译。优选地,将终止密码子、无义突变或移码突变插入编码SANTA结构域的核苷酸序列和/或编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中,更优选地,将终止密码子插入编码根据SEQ ID NO:23或133-147的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列中,甚至更优选将终止密码子插入编码根据SEQ ID NO:20或88-102的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列中,甚至最优选将终止密码子插入编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中。
在本发明的核苷酸序列的一个实施方式中,将编码SEQ ID NO:24的第18位氨基酸谷氨酸(E)、SEQ ID NO:25的第16位氨基酸谷氨酰胺(Q)、SEQ ID NO:26的第45位氨基酸组氨酸(H)、SEQ ID NO:27的第8位氨基酸谷氨酰胺(Q)的密码子改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,将编码SEQ ID NO:24的第27位氨基酸色氨酸(W)、SEQ ID NO:25的第25位氨基酸色氨酸(W)、SEQ ID NO:26的第54位氨基酸色氨酸(W)、SEQ ID NO:27的第17位氨基酸色氨酸(W)的密码子改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,将编码SEQ ID NO:27的第17位氨基酸色氨酸(W)或SEQ ID NO:24-26任一序列中相应氨基酸的密码子改变为终止密码子。
在本发明的核苷酸序列的又一实施方式中,将编码SEQ ID NO:26的第54位氨基酸色氨酸(W)或SEQ ID NO:24、25和27任一序列中的相应氨基酸的密码子改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,改变在SEQ ID NO:28的第521位或SEQID NO:29的第540位的剪接位点,从而缺失或破坏剪接信号。
在本发明的核苷酸序列的另一实施方式中,改变在SEQ ID NO:31的第454位的剪接位点,从而缺失或破坏剪接信号。
在本发明的核苷酸序列的一个实施方式中,包含在SANTA结构域中引起KNL2蛋白的氨基酸序列改变的至少一种突变的核苷酸序列选自SEQ ID NO:168-173、194、195、200-212和232。
根据另一方面,本发明提供了载体或表达盒,其包含本发明上述各方面提及的核苷酸序列。
在所述载体或表达盒的一个实施方式中,核苷酸序列的表达受启动子控制或所述核苷酸序列与启动子可操作地连接。
根据一方面,本发明提供了植物细胞,其包含本发明上述各方面提及的核苷酸序列、表达盒或载体。
根据另一方面,本发明提供了植物、其部分或种子,其包含上述核苷酸序列作为转基因、上述或载体或上述各方面提及的植物细胞。
根据一方面,本发明还提供了一种产生具有本发明前述方面提及的单倍体诱导物的活性的转基因植物或其部分的方法,包括以下步骤:将本发明前述各方面所述的核苷酸序列、载体或表达盒导入至少一个植物细胞中,从所述至少一种细胞中再生具有单倍体诱导物的活性的转基因植物或其部分。
根据又一方面,本发明提供了赋予植物单倍体诱导物的活性的方法,包括以下步骤:将前述本发明各方面所述的核苷酸序列、载体或表达盒导入植物或其部分中,及使所述核苷酸序列或表达盒表达。
根据又一方面,本发明提供了一种修饰植物基因组的方法,所述方法包括:提供包含至少一个基因组编辑组件(GEC)的第一植物;将第一植物与第二植物杂交,其中至少一个GEC修饰第二植物的基因组,从而产生第二植物的修饰基因组;获得由第一和第二植物杂交产生第三植物,其中第三植物包含第二植物的修饰基因组,及其中第三植物基本上没有GEC,其中第一植物是具有单倍体诱导物的活性的植物及包含编码包含SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列,其中所述核苷酸序列包含导致SANTA结构域中KNL2蛋白的氨基酸序列发生改变的至少一处突变,所述改变赋予如上所述的单倍体诱导物的活性。
在一个实施方式中,第一植物是母本单倍体诱导物,第三植物基本上没有第一植物的基因组,或者第一植物是父本单倍体诱导物,第三植物基本上没有第一植物的基因组。
在另一实施方式中,第二植物的修饰基因组选自核基因组、线粒体基因组和质体基因组。
在又一实施方式中,所述方法进一步包括:使第三植物或合子的核基因组加倍,从而产生包含加倍核基因组的第三植物,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特等染色体加倍剂处理。
在又一实施方式中,所述方法进一步包括:从包含加倍核基因组的第三植物或合子产生后代植物或种子,其中后代植物或种子的基因组包含第二植物的修饰基因组。
在又一实施方式中,第二植物的修饰基因组包含选自以下的至少一个修饰:
i.置换至少一个核苷酸;
ii.缺失至少一个核苷酸;
iii.插入至少一个核苷酸;或
iv.上述i至iii的任意组合。
在一个实施方式中,至少一个GEC包含选自如下一组的至少一种启动子:组成型启动子,可诱导启动子,组织特异性启动子,优选所述组织特异性启动子选自胚特异性启动子、配子特异性启动子和早期合子特异性启动子。
在另一实施方式中,至少一个GEC包含至少一种核酸内切酶,优选选自以下一组:CRISPR相关核酸酶,转录激活因子样效应核酸酶(TALEN),TALE样蛋白,锌指核酸酶和大范围核酸酶,或至少一种与催化受损的核酸内切酶融合的碱基编辑器,其优选识别所述细胞基因组中的预定位点。优选地,所述核酸内切酶选自CRISPR相关核酸酶、转录激活因子样效应核酸酶(TALEN)、TALE样蛋白、锌指核酸酶和大范围核酸酶。
在另一实施方式中,至少一个GEC包含至少一个供体多核苷酸模板和/或至少一个病毒复制子,优选双生病毒复制子或纳米病毒复制子。
在又一实施方式中,第一植物和第二植物是相同物种或不同物种。
附图简述
图1:不同植物物种的SANTA结构域的比对(SEQ ID NO:1-15)和衍生自这种比对的SANTA结构域的共有序列(SEQ ID NO:16)。在SANTA结构域内,已经定义了表示部分SANTA结构域的基序1至7。比对的不同植物物种的基序1如SEQ ID NO:43-57所示,基序1的相应共有序列如SEQ ID NO:17所示;比对的不同植物物种的基序2如SEQ ID NO:58-72所示,基序2的相应共有序列如SEQ ID NO:18所示;比对的不同植物物种的基序3如SEQ ID NO:73-87所示,基序3的相应共有序列如SEQ ID NO:19所示;比对的不同植物物种的基序4如SEQ IDNO:88-102所示,基序4的相应共有序列如SEQ ID NO:20所示;比对的不同植物物种的基序5如SEQ ID NO:103-117所示,基序5的相应共有序列如SEQ ID NO:21所示;比对的不同植物物种的基序6如SEQ ID NO:118-132所示,基序6的相应共有序列如SEQ ID NO:22所示;比对的不同植物物种的基序7如SEQ ID NO:133-147所示,基序7的相应共有序列如SEQ ID NO:23所示。从中衍生SANTA结构域的KNL2蛋白的全长序列如SEQ ID NO:24-27和157-167所示。
图2:不同植物物种的CENPCk结构域的比对(SEQ ID NO:32-40)和衍生自这种比对的CENPCk结构域的共有序列(SEQ ID NO:41)。在CENPCk结构域域内定义了一个基序,其表示CENPCk结构域的一部分。比对的不同植物物种的基序如SEQ ID NO:148-156所示,所述基序的相应共有序列如SEQ ID NO:42所示。从中衍生CENPCk结构域的KNL2蛋白的全长序列如SEQ ID NO:24-27和157-167所示。
定义
“单倍体植物”或“单倍体植物细胞”在本文中是指仅具有单倍化之前植物中存在的染色体组的一半的植物或植物细胞,每一染色体均不是一对染色体的一部分。单组染色体数称为单倍体数,给定符号为n。“配子”是单倍体细胞,其中两个在受精时组合形成具有n对染色体的“合子”,即总共2n条染色体。每对染色体包含来自每个配子的一条染色体,称为同源染色体。通常,具有成对同源染色体的细胞和生物体是“二倍体”。多倍体植物生物体可以包含四组染色体(四倍体;例如硬质小麦、棉花、马铃薯、油菜籽、烟草),则“单倍体植物”或“单倍体植物细胞”包含两组染色体;其它多倍体植物生物体包含六组染色体(六倍体;例如面包小麦、黑小麦、燕麦),则“单倍体植物”或“单倍体植物细胞”包含三组染色体等。“双单倍体植物”或“双单倍体植物细胞”是当单倍体植物或单倍体植物细胞经历染色体加倍时获得的。因此,双单倍体植物或植物细胞是纯合的。
在本发明的上下文中,“具有单倍体诱导物的活性的植物”或“单倍体诱导物”或“单倍体诱导物品系”是经基因修饰的植物或植物品系,当用野生型植物受精时,其在至少0.1%、至少0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、优选至少1%、优选至少2%、优选至少3%、更优选至少4%、更优选至少5%的情况中具有产生单倍体后代的能力。由于消除单倍体诱导物的染色体,所得单倍体后代仅包含野生型亲本的染色体。单倍体诱导物的活性可能与母本单倍体诱导和/或父本单倍体诱导有关。母本单倍体的诱导可以通过用相同物种的花粉授粉来启动。授粉之后可以是卵细胞受精和杂交胚的发育,其中在早期胚发生时发生父本染色体消除或不发生卵细胞受精,或者单倍体胚的发育是由极核授粉和胚乳发育引发的。通过用相同物种的花粉授粉的母本单倍体诱导通常是在一个物种内与选定的诱导基因型(品系、单杂交或群体)正当杂交的结果。其导致大多数常规杂交胚和较小比例的单倍体母本胚。与此相反,父本单倍体的诱导是衍生自雄配子细胞的单倍体和双单倍体的诱导和再生过程。
核苷酸序列中的“突变”是指导致(核酸)序列与原始序列有区别的至少一个差异的(核酸)序列中的任何变化。特别地,修饰可以通过插入或加入一个或多个核苷酸、或取代或缺失原始序列的一个或多个核苷酸或这些方式的任何组合来实现。当突变的核酸序列被翻译成多肽或蛋白质时,核苷酸序列中的突变可引起氨基酸序列的改变。蛋白质的未改变的氨基酸序列,即天然存在的氨基酸序列,是指野生型蛋白质。
“氨基酸序列的改变”表示通过在序列中取代、插入、加入或缺失一个或多个氨基酸或其任何组合所致氨基酸序列中的任何变化。如果所述改变导致在与野生型植物或不携带所述改变的植物受精后在早期合子中携带所述改变的植物基因组被消除,则所述改变“赋予单倍体诱导物的活性”。
在本发明的上下文中,“内源”基因、等位基因或蛋白质是指植物的非重组序列,因为所述序列天然存在于相应植物,特别是野生型植物中。术语“突变的”是指人为改变的序列。人为诱导的非转基因突变的实例包括将植物暴露于高剂量的化学、放射或其它诱变剂以选择突变体,包括基因组工程,例如通过TALE核酸酶、锌指核酸酶或CRISPR/Cas系统进行。或者,人为诱导的转基因突变,即重组改变,包括DNA或氨基酸序列的融合、插入、缺失和/或改变。
通过“接触第一和第二配子”,形成合子。然而,如果一个配子来自具有单倍体诱导物的活性的植物,而另一来自例如野生型植物,则有性杂交,即将两个基因组组合成例如具有两组染色体的二倍体基因组,在某些情况下被抑制,产生单倍体F1合子。这是由于单倍体诱导物的染色体消除和野生型亲本基因组的保守所致。相反,通过有性杂交,父母双方的基因通过同源重组混合以获得新的遗传组合和性状。此外,有性杂交产生可育后代,而通过基因组消除获得的单倍体后代通常是不育的,除非转化为双单倍体,否则无法进一步繁殖。因此,“通过消除单倍体诱导物的染色体从合子中获得单倍体细胞”不是自然过程发生的,而是人工单倍体诱导植物基因工程的结果。
“非天然存在的”配子是指人工配子,其不是天然存在的而是经过基因修饰的,特别是修饰为具有单倍体诱导物的活性。
本发明公开的核酸序列或核酸分子可以是“密码子优化的”。“密码子优化”意味着从供体生物合成产生或分离的DNA或RNA适应于不同受体生物的密码子使用,以改良转录率、mRNA加工和/或稳定性和/或翻译率,和/或随后的所述重组核酸在目标细胞或生物体中的蛋白质折叠。技术人员非常清楚,由于密码子简并,靶核酸可以在一个位置被修饰,而这种修饰仍然会在翻译后在该位置产生相同的氨基酸序列,这是通过密码子优化考虑靶细胞或生物体的物种特异性密码子使用实现的。反过来,如本文所定义的核酸序列可与编码相同蛋白质但已被密码子优化的不同序列具有一定程度的相同性。
每当本发明公开涉及核酸或氨基酸序列彼此的相同性百分比时,这些值定义为通过使用EMBOSS Water Pairwise Sequence Alignments(核苷酸)编程(www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html)核酸或者使用EMBOSS Water PairwiseSequence Alignments(蛋白质)编程(www.ebi.ac.uk/Tools/psa/emboss_water/)氨基酸序列获得的那些值。本文所用的比对或序列比较是指在两个序列的整个长度上相互比较的比对。由European Molecular Biology Laboratory(EMBL)European BioinformaticsInstitute(EBI)提供的用于局部序列比对的工具使用修改后的Smith-Waterman算法(见www.ebi.ac.uk/Tools/psa/and Smith,T.F.&Waterman,M.S."Identification of commonmolecular subsequences"Journal of Molecular Biology,1981 147(1):195-197)。当进行比对时,使用EMBL-EBI定义的默认参数。这些参数是:(i)对于氨基酸序列:矩阵=BLOSUM62,缺口开放罚分=10,缺口延伸罚分=0.5,或(ii)对于核酸序列:矩阵=DNAfull,缺口开放罚分=10,缺口延伸罚分=0.5。技术人员非常清楚这样的事实,例如,与分子从中衍生的原始生物体相比,如果相应的序列用于另一生物体中,则编码蛋白质的序列可以是“密码子优化的”。
在本发明的上下文中,特别对于以SEQ ID NO.示出的相应序列的全长确定序列相同性。
如本文所用,“表达盒”是由一种或多种基因或基因序列和控制其表达的序列组成的核酸分子。表达盒可包含启动子调控序列,也称为启动子,其可操作地连接于开放读框或另一基因序列,以及可包含聚腺苷酸化位点的3’非翻译区。启动子指导产生RNA和/或蛋白质的细胞机制。如本文所用,“可操作地连接”是指在植物中发生连接的DNA序列表达。表达盒可以是用于克隆DNA并将其导入细胞的载体的一部分。
核苷酸序列的“功能片段”是指核苷酸序列的一段序列,其包含功能片段源自其中的总核苷酸序列相同或相当的功能。因此,功能片段可以具有与所述总核苷酸序列至少50%、55%、60%、65%、70%、75%、80%、85%、90%、92%、94%、96%、97%、98%或99%程度的相同或同源的核苷酸序列。因此,核苷酸序列的功能片段可包含总核苷酸序列的至少150、160、180、200、250、300、350、400、450、500、600、700、800、900或1000个连续核苷酸的核苷酸序列。
术语“异源”是指导入的多核苷酸源自例如具有来自同一物种或另一物种的不同遗传背景的细胞或生物体,或者与原核或真核宿主细胞同源,但随后被定位在不同的遗传环境中,因此不同于任何天然可用的相应多核苷酸。除相应的内源基因外,还可以存在异源多核苷酸。
关于本发明,术语“调控序列”是指影响特异性和/或表达强度的核苷酸序列,例如调控序列赋予特定的组织特异性。这种类型的调控序列可以位于最小启动子的转录起始点上游,但也可以位于其下游,例如在转录的但未翻译的前导序列中或内含子内。
“启动子”是指能控制编码序列(即基因或其部分)或功能性RNA(即活性的但未翻译的RNA,例如miRNA、siRNA、反向重复RNA或形成发夹的RNA)的DNA序列。启动子通常位于基因的5’部分。启动子结构存在于生命的所有领域,即存在于细菌、古细菌和真核生物中,其中其具有不同的架构。启动子序列通常由与调节的序列相关的近端和远端元件组成,后者通常称为增强子。启动子可以具有广泛的活性,但其也可以具有组织或发育阶段特异性活性。例如,其可以在根、种子和分生组织细胞等细胞中具有活性。启动子可以以组成型方式具有活性,或者可以是诱导型的。诱导可以受到各种环境条件和刺激因素的刺激。现存在能使调节的序列高转录的强启动子和弱启动子。通常启动子是高度调节的。本发明公开的启动子可以包括天然存在于细胞中的内源启动子,或来自另一物种的人工或异源启动子,或人工或嵌合启动子,即在这个组合物中不是天然存在的启动子和由不同的启动子元件组成。优选地,启动子是组成型或可诱导型启动子,更优选是在花粉或胚珠中、或在花粉或胚珠衍生自之中的组织中或在花粉或胚珠邻近的组织中是活性的启动子,或在植物早期胚发生之前和/或期间具有活性的启动子。
发明详述
本发明涉及提供通过鉴别新的靶序列获得单倍体诱导植物和单倍体植物的手段和方法的几个方面,其中的突变引起KNL2蛋白氨基酸序列的改变,及所述改变赋予单倍体诱导物的活性。对于鉴别的靶序列,观察到特别大的单倍体诱导率,这显着改良了提供单倍体植物的方法的效力。
本发明提供了具有单倍体诱导物的活性的非转基因和转基因植物,其中所述植物包含在KINETOCHORE NULL2(KNL2)蛋白中的至少一处突变,以及提供了产生所述植物的方法。此外,本发明涉及鉴别编码KNL2蛋白的核苷酸序列中赋予单倍体诱导物生物学活性的突变的标记。
在本发明所有方面的一个优选实施方式中,KNL2蛋白中的至少一处突变是至少一处突变、至少两个突变、至少三个突变、至少四个突变或至少五个突变。
在进一步优选的实施方式中,导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变是一个氨基酸取代、一个氨基酸插入或一个氨基酸缺失,特别是仅一个氨基酸取代,一个氨基酸插入或一个氨基酸缺失。
在进一步优选的实施方式中,导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变是选自氨基酸取代、氨基酸插入或氨基酸缺失的两个改变,特别是仅选自氨基酸取代、氨基酸插入或氨基酸缺失的两个改变。
在进一步优选的实施方式中,导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变是选自氨基酸取代、氨基酸插入或氨基酸缺失的三个改变,特别是仅选自氨基酸置换、氨基酸插入或氨基酸缺失的三个改变。
在进一步优选的实施方式中,导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变是选自氨基酸取代、氨基酸插入或氨基酸缺失的四个改变,特别是仅选自氨基酸取代、氨基酸插入或氨基酸缺失的四个改变。
在进一步优选的实施方式中,导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变是选自氨基酸取代、氨基酸插入或氨基酸缺失的五个改变,特别是仅选自氨基酸取代、氨基酸插入或氨基酸缺失的五个改变。
在第一方面,提供了具有单倍体诱导物的活性及包含编码具有SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列的植物,其中所述核苷酸序列包含导致SANTA结构域中KNL2蛋白的氨基酸序列至少一处突变,及所述改变赋予单倍体诱导物的活性。
在本发明的上下文中,在作物植物中鉴别了赋予单倍体诱导物的活性的KNL2突变。特别地,可以示出KNL2蛋白的SANTA结构域中的突变实现了令人惊讶的高单倍体诱导率。
在根据本发明的各个方面的一个实施方式中,在上述植物中,KNL2蛋白包含SEQID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列;或其中编码野生型KNL2蛋白的核苷酸序列选自下组:
(i)SEQ ID NO:28-31任一所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(vi)在严格条件下与(iii)的序列杂交的核苷酸序列;或
(vii)由于遗传密码的简并不同于(i)、(ii)、(iii)或(v)的序列的核苷酸序列。
KNL2蛋白包含在不同作物植物中高度保守的区域,由如下所示的共有序列表示。在本发明的上下文中已经证实在鉴别的保守区域中的突变导致特别高的单倍体诱导率。
在根据本发明各个方面的另一实施方式中,在上述植物中,在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的至少一处突变,导致赋予单倍体诱导物的活性的KNL2蛋白的改变。优选地,所述改变是一个或多个氨基酸的取代、一个或多个氨基酸的插入或缺失、剪接位点的改变或KNL2蛋白由于插入的终止密码子而提前终止。所述突变优选导致上述鉴别的序列中至少一个氨基酸的取代。所述突变可以例如通过随机诱变、特别是化学诱变、优选通过EMS(甲磺酸乙酯)诱导的或ENU(N-乙基-N-亚硝基脲)诱导的TILLING或通过靶向诱变而导入,优选通过大范围核酸酶、锌指核酸酶、TALEN或CRISPR/Cas如CRISPR/Cas9或CRISPR/Cpf1或者通过碱基编辑器系统(Marzec,M.,&Hensel,G.(2018).Targeted Base Editing Systems Are Available for Plants.Trends inplant science,23(11),955-957.)进行。
上述植物以及本发明其它方面的植物和植物部分,源自选自下组的植物物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、黑麦(Secale cereale)、苹果(Malusdomestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptusgrandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotianatomentosiformis)、普通烟草(Nicotiana tabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻(Genlisea aurea)、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜花(Capsella bursa pastoris)、无苞芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、甘蓝型油菜、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芸苔(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.Sativa)、甜橙(Citrus sinensis)、麻风树(Jatrophacurcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、Ciceryamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicerjudaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Alliumfistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在根据本发明各个方面的优选实施方式中,从上述植物和野生型植物或表达野生型KNL2蛋白的植物生成合子可以产生至少0.5%、优选至少1.0%、至少2.0%、至少3.0%、至少4.0%、至少5.0%、至少6.0%或至少7.0%的单倍体后代。在本发明的上下文中已经证实在SANTA结构域的特定基序中的突变提供了超过1%及最高可达7%的单倍体诱导率。这表示改良了作物植物先前可能的单倍体诱导率,以及显着提高了生产具有所需性状的单倍体植物的效力。
在根据本发明各个方面的一个实施方式中,在上述植物中,包含至少一处突变的核苷酸序列是内源基因或转基因。
通过在内源性核苷酸序列中导入至少一处突变或作为转基因导入该序列,可以获得单倍体诱导物的活性。因此,可以选择完全无转基因的方法或可以提供根据本发明的转基因植物。然而,当在如下所述获得单倍体植物的方法中使用具有单倍体诱导物的活性的转基因植物时,单倍体诱导物的基因组被消除,获得不含转基因的单倍体植物。因此,可以提供非转基因单倍体植物,由于对转基因植物施加的监管限制,这是有利的。
在本发明各个方面的一个优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的氨基酸取代、插入或缺失。
在本发明各个方面的另一优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中、更优选在根据SEQID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的一个或多个氨基酸的取代、插入或缺失。
在本发明各个方面的一个优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第71位氨基酸谷氨酸(E)、SEQID NO:25第69位氨基酸谷氨酸(E)、SEQ ID NO:26第95位氨基酸谷氨酸(E)、SEQ ID NO:27第63位氨基酸谷氨酸(E)或在对应于SEQ ID NO:20或88-102任一序列中第4位氨基酸或SEQID NO:23或133-147中任一序列的第14位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于谷氨酸(E)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明各个方面的另一优选实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第73位氨基酸丝氨酸(S)、SEQID NO:25第71位氨基酸丝氨酸(S)、SEQ ID NO:26第97位氨基酸谷氨酸(E)、SEQ ID NO:27第65位氨基酸氨基酸缬氨酸(V)或对应于SEQ ID NO:20或88-102中任一序列的第6位氨基酸或SEQ ID NO:23或133-147中任一序列的第16位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第69位氨基酸苏氨酸(T)、SEQ IDNO:25第67位氨基酸苏氨酸(T)、SEQ ID NO:26第93位氨基酸缬氨酸(V)、SEQ ID NO:27第61位氨基酸谷氨酸(E)或对应于SEQ ID NO:20或88-102中任一序列的第2位氨基酸或SEQ IDNO:23或133-147中任一序列的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、苏氨酸(T)和缬氨酸(V)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第70位氨基酸亮氨酸(L)、SEQ IDNO:25第68位氨基酸亮氨酸(L)、SEQ ID NO:26第94位氨基酸亮氨酸(L)、SEQ ID NO:27第62位氨基酸亮氨酸(L)或对应于SEQ ID NO:20或88-102中任一序列的第3位氨基酸或SEQ IDNO:23或133-147中任一序列的第13位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于亮氨酸(L)和异亮氨酸(I)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第72位氨基酸丙氨酸(A)、SEQ IDNO:25第70位氨基酸丙氨酸(A)、SEQ ID NO:26第96位氨基酸苏氨酸(T)、SEQ ID NO:27第64位氨基酸氨基酸苏氨酸(T)或对应于SEQ ID NO:20或88-102中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第15位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)、丝氨酸(S)、天冬氨酸(D)、酪氨酸(Y)的氨基酸,更优选取代为氨基酸异亮氨酸(I)或苏氨酸(T)。
在本发明各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第74位氨基酸天冬氨酸(D)、SEQ IDNO:25第72位氨基酸(D)、SEQ ID NO:26第98位氨基酸谷氨酸(E)、SEQ ID NO:27第66位氨基酸天冬氨酸(D)或对应于SEQ ID NO:20或88-102中任一序列的第7位氨基酸或SEQ ID NO:23或133-147中任一序列的第17位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、谷氨酸(E)和甘氨酸(G)的氨基酸,更优选取代为氨基酸天冬酰胺(N)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第75位氨基酸甘氨酸(G)、SEQ IDNO:25第73位氨基酸甘氨酸(G)、SEQ ID NO:26第99位氨基酸甘氨酸(G)、SEQ ID NO:27第67位氨基酸甘氨酸(G)或对应于SEQ ID NO:20或88-102中任一序列的第8位氨基酸或SEQ IDNO:23或133-147中任一序列的第18位氨基酸的氨基酸,取代为另一氨基酸酸,优选取代为不同于甘氨酸(G)、天冬酰胺(N)和组氨酸(H)的氨基酸,更优选取代为氨基酸精氨酸(R)或谷氨酸(E)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第58位氨基酸丝氨酸(S)、SEQ IDNO:25第56位氨基酸丝氨酸(S)、SEQ ID NO:26第82位氨基酸脯氨酸(P)、SEQ ID NO:27第50位氨基酸丝氨酸(S)或对应于SEQ ID NO:19或73-87中任一序列的第1位氨基酸或SEQ IDNO:23或133-147中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第60位氨基酸脯氨酸(P)、SEQ IDNO:25第58位氨基酸脯氨酸(P)、SEQ ID NO:26第84位氨基酸脯氨酸(P)、SEQ ID NO:27第52位氨基酸脯氨酸(P)或对应于SEQ ID NO:19或73-87中任一序列的第3位氨基酸或SEQ IDNO:23或133-147中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)或丝氨酸(S)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第62位氨基酸亮氨酸(L)、SEQ IDNO:25第60位氨基酸缬氨酸(V),SEQ ID NO:26第86位氨基酸丙氨酸(A)、SEQ ID NO:27第54位氨基酸亮氨酸(L)或对应于SEQ ID NO:19或73-87中任一序列的第5位氨基酸或SEQ IDNO:23或133-147中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、丙氨酸(A)、亮氨酸(L)、异亮氨酸(I)、缬氨酸(V)和苏氨酸(T)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第66位氨基酸天冬氨酸(D)、SEQ IDNO:25第64位氨基酸天冬氨酸(D)、SEQ ID NO:26第90位氨基酸苏氨酸(T)、在SEQ ID NO:27第58位天冬氨酸(D)或对应于SEQ ID NO:19或73-87中任一序列的第9位氨基酸或SEQ IDNO:23或133-147中任一序列的第9位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、苏氨酸(T)、丙氨酸(A)和谷氨酸(E)的氨基酸,更优选取代为天冬酰胺(N)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第67位氨基酸缬氨酸(V)、SEQ IDNO:25第65位氨基酸缬氨酸(V)、SEQ ID NO:26第91位氨基酸丝氨酸(S)、SEQ ID NO:27第59位氨基酸亮氨酸(L)或对应于SEQ ID NO:19或73-87中任一序列的第10位氨基酸或SEQ IDNO:23或133-147中任一序列的第10位氨基酸的氨基酸,取代为另一氨基酸酸,优选取代为不同于缬氨酸(V)、丝氨酸(S)、亮氨酸(L)、天冬酰胺(N)、酪氨酸(Y)、脯氨酸(P)、天冬氨酸(D)和谷氨酸(E)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第12位氨基酸亮氨酸(T)或对应于SEQ ID NO:17或43-57中任一序列的第2位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于苏氨酸(T)、缬氨酸(V)、苯丙氨酸(F)、丝氨酸(S)和亮氨酸(L)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第22位氨基酸脯氨酸(P)或对应于SEQ ID NO:16第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)或谷氨酸(E)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第33位氨基酸甘氨酸(G)或对应于SEQ ID NO:18或58-72中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、精氨酸(R)和丙氨酸(A)的氨基酸,更优选取代为氨基酸谷氨酸(E)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第49位氨基酸丝氨酸(S)或对应于SEQ ID NO:16第34位氨基酸的氨基酸,确定为另一氨基酸,优选取代为不同于丝氨酸(S)、苏氨酸(T)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第80位氨基酸精氨酸(R)或对应于SEQ ID NO:16第65位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于精氨酸(R)的氨基酸,更优选取代为氨基酸组氨酸(H)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第84位氨基酸天冬酰胺(N)或对应于SEQ ID NO:21或103-117中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬酰胺(N)、酪氨酸(Y)和丝氨酸(S)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第88位氨基酸脯氨酸(P)或对应于SEQ ID NO:21或103-117中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第100位氨基酸脯氨酸(P)或对应于SEQ ID NO:22或118-132中任一序列的第7位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸和天冬氨酸(D)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:26第68位氨基酸丙氨酸(A)或对应于SEQ ID NO:18或58-72中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和丝氨酸(S)的氨基酸,更优选取代为氨基酸苏氨酸(T)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是由于在编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列中、或者在SEQ ID NO:28-31所示编码KNL2蛋白的核苷酸序列中或与SEQ ID NO:28-31所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列相同性的核苷酸序列中,插入终止密码子、无义突变、移码突变或剪接位点突变所致。这种终止密码子或无义突变可导致KNL2蛋白翻译过早终止。这种移码突变或剪接位点突变可改变读框,导致与原始KNL2蛋白完全不同的翻译。优选地,终止密码子、无义突变或移码突变被插入到编码SANTA结构域的核苷酸序列和/或编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中,更优选地,终止密码子被插入编码根据SEQ ID NO:23或133-147的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列,甚至更优选终止密码子被插入编码根据SEQ ID NO:20或88-102的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列,甚至最优选终止密码子被插入到编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中。
在本发明的各个方面的一个实施方式中,在上述植物中,编码SEQ ID NO:24第18位氨基酸谷氨酸(E)、SEQ ID NO:25第16位氨基酸谷氨酰胺(Q)、SEQ ID NO:26第45位氨基酸组氨酸(H)、SEQ ID NO:27第8位氨基酸谷氨酰胺(Q)的密码子被改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,编码SEQ ID NO:24第27位氨基酸色氨酸(W)、SEQ ID NO:25第25位氨基酸色氨酸(W)、SEQ ID NO:26第54位氨基酸色氨酸(W)、SEQ ID NO:27第17位氨基酸色氨酸(W)的密码子被改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,编码SEQ ID NO:27第17位氨基酸色氨酸(W)或SEQ ID NO:24-26任一序列的相应氨基酸的密码子被改变为终止密码子。
在本发明的各个方面的又一实施方式中,在上述植物中,编码在SEQ ID NO:26第54位氨基酸色氨酸(W)或SEQ ID NO:24、25和-27任一序列中相应氨基酸的密码子被改变为终止密码子。
在本发明各个方面的另一实施方式中,在上述植物中,SEQ ID NO:28第521位或SEQ ID NO:29第540位的剪接位点发生改变,从而剪接信号被缺失或破坏。
在本发明各个方面的另一实施方式中,在上述植物中,SEQ ID NO:31第454位的剪接位点被改变,从而剪接信号被缺失或破坏。
在本发明的各个方面的一个实施方式中,在上述植物中,包含在SANTA结构域中引起KNL2蛋白氨基酸序列改变的至少一处突变的核苷酸序列选自下组:SEQ ID NO:168-173、194、195、200-212和232。
在一个特别优选的实施方式中,所述植物是欧洲油菜物种的植物,如上所述的至少一处突变位于C基因组中KNL2的内源基因中。
在另一特别优选的实施方式中,所述植物是向日葵(Helianthus annuus)物种的植物,如上所述的至少一处突变在基因组中KNL2的内源基因中。
在另一特别优选的实施方式中,植物是高粱物种的植物,如上所述的至少一处突变位于基因组中KNL2的内源基因中。
在本发明的一个优选实施方式中,具有单倍体诱导物的活性的本发明植物就至少一处突变而言是纯合的。在本发明的另一实施方式中,具有单倍体诱导物的活性的本发明植物就至少一处突变而言是杂合的。
此外,通过上述KNL2蛋白氨基酸序列的改变和/或KNL2核苷酸序列的突变的组合,可以进一步增强产生单倍体后代的能力。因此,单倍体诱导物的活性和效力可以通过在一种植物中组合不同的鉴别的突变和/或修饰单倍体诱导物的遗传背景而进一步改良。有利地,这可以通过转基因以及非转基因方法来实现。不同突变的组合可以例如通过基因组编辑(例如CRISPR/Cas、TALEN、锌指核酸酶等)有效地实现,或者可以通过TILLING对突变单倍体诱导物进行第二次诱变。优选非转基因方法,因为违反对转基因生物(GMO)的管制需要巨大的成本,以及公众越来越排斥转基因生物(GMO)或通过转基因产生的植物,特别是供人类消费的作物,以及大量的市场授权程序,包括对这种转基因生物的严格安全评估。
在另一方面,本发明涉及具有上述单倍体诱导物的活性的任何植物,其中编码KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列另外包含导致在CENPCk结构域中KNL2蛋白氨基酸序列改变的至少一处突变。
在根据本发明各个方面的另一实施方式中,在上述植物中,所述至少一处突变导致在根据SEQ ID NO:32-41任一所示KNL2蛋白的CENPCk结构域中、优选在根据SEQ ID NO:42或148-156的CENPCk结构域的保守基序中的KNL2蛋白的改变。优选地,所述改变是一个或多个氨基酸的取代、一个或多个氨基酸的插入或缺失。更优选地,所述改变是选自下组的取代:
a)将在SEQ ID NO:24第410位氨基酸谷氨酸(E)、SEQ ID NO:25第413位氨基酸谷氨酸(E)或对应于SEQ ID NO:41或32-34或40中任一序列的第35位氨基酸或对应于SEQ IDNO:35-38或148-156中任一序列的第34位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于谷氨酸(E)、甘氨酸(G)、脯氨酸(P)、天冬氨酸(D)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K),
b)将在SEQ ID NO:27第390位氨基酸甘氨酸(G)或对应于SEQ ID NO:42或148-156中任一序列的第6位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于甘氨酸(G)的氨基酸,更优选取代为氨基酸精氨酸(R),
c)将SEQ ID NO:27第392位氨基酸缬氨酸(V)或对应于SEQ ID NO:42或148-156中任一序列的第8位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于缬氨酸(V)或亮氨酸(L)的氨基酸,更优选取代为氨基酸甲硫氨酸(M),和
d)将SEQ ID NO:27第408位氨基酸天冬氨酸(D)或对应于SEQ ID NO:41或32-34或40中任一序列的第25位氨基酸或对应于SEQ ID NO:35-39或148-156中任一序列的第34位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)的氨基酸,更优选取代为氨基酸天冬酰胺(N)。
一方面,本发明涉及如任一实施方式所述的植物的一部分,其优选是或源自幼枝、根、叶柄、芽、下胚轴、花或花器官、种子、花粉、花药、果实、胚珠、胚、植物组织或细胞。
在另一方面,本发明涉及一种单倍体植物,其可通过将衍生自具有根据本文所述的任何实施方式的单倍体诱导物的活性的植物的或在具有根据本文所述任何实施方式的单倍体诱导物的活性的植物产生的第一配子与第二配子接触产生合子而获得,所述第二配子衍生自或由表达野生型KNL2蛋白、优选仅表达野生型KNL2蛋白的植物产生。优选地,第二配子衍生自或由源自相同植物属、优选相同植物物种的植物产生,如第一配子从中衍生的或产生第一配子的植物。
在本发明的单倍体植物的一个优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或雄配子,即花粉。
在本发明的单倍体植物的又一优选实施方式中,第一配子衍生自其中或产生第一配子的植物是母本,第二配子衍生自其中或产生第二配子的植物是父本,或者第一配子衍生自其中或产生第一配子的植物是父本,第二配子衍生自其中或产生第二配子的植物是母本。
来自具有本文所述单倍体诱导物的活性的植物的配子不是天然存在的配子,其在KNL2蛋白的核苷酸序列中携带突变,这导致KNL2蛋白的SANTA结构域中氨基酸序列的改变,赋予了单倍体诱导物的活性。将来自具有本文所述单倍体诱导物的活性的植物的第一配子与来自表达野生型KNL2蛋白的植物的第二配子接触导致F1合子的形成,在某些情况下,从中消除第一配子的染色体,发生基因组无性杂交。如此获得的单倍体植物是对人工单倍体诱导植物进行基因工程以及将来自这种植物的配子与来自野生型植物或表达野生型KNL2蛋白的植物的配子选择性接触的步骤的结果。因此,本发明的单倍体植物不是通过天然发生的过程形成的。所述单倍体植物的染色体加倍提供了加倍的单倍体植物,其是纯合的且可以繁殖。
根据另一方面,本发明因此还涉及可通过将上述单倍体植物转化为双单倍体植物而获得的双单倍体植物,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特等染色体加倍剂处理,或在允许自发染色体加倍的条件下培养。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的又一优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或雄配子,即花粉。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的另一优选实施方式中,第一配子衍生子其中或产生第一配子的植物是母本,第二配子衍生自其中或产生第二配子的植物是父本,或者第一配子衍生自其中或产生第一配子的植物是父本,第二配子衍生自其中或产生第二配子的植物是母本。
根据又一方面,本发明还涉及一种产生单倍体植物细胞的方法,包括以下步骤:
a)提供衍生自具有本文任何实施方式所述的单倍体诱导物的活性的非转基因或转基因植物或由其产生的非天然存在的第一配子;
b)通过将来自步骤a)第一配子与衍生自或由相同属、优选相同物种的植物产生第二配子接触以产生合子,所述第二配子包含如上定义的编码野生型KNL2蛋白的核苷酸序列,且能表达野生型KNL2蛋白,优选仅表达野生型KNL2蛋白;
c)通过从F1合子消除具有单倍体诱导物的活性的植物染色体获得单倍体细胞。
本发明提供了一种获得具有所需性状的单倍体植物的新的且有效的方法,所述方法可有利地用于产生对于所需性状是纯合的双单倍体植物。这是通过提供来自具有本文任何实施方式所述的单倍体诱导物的活性的植物的非天然存在第一配子,并将第一配子与野生型植物或包含野生型KNL2蛋白的植物的第二配子接触以产生F1合子而实现。由于第一配子的基因修饰及与不带有相同修饰的第二配子的选择性组合,在一定百分比的情况下,第一配子的基因组被消除,从而产生单倍体细胞。在这种情况下,发生无性杂交,即来自两个配子的两组染色体的重组和混合。因此,所得单倍体细胞不是天然发生的天然杂交步骤的结果,即单倍体细胞不是通过包括植物全基因组有性杂交步骤和随后选择后代植物的植物产生方法获得的。单倍体植物是基因修饰的植物经设计的减数分裂的结果,其中来自亲本菌株的两组染色体的重组及混合、即全基因组的有性杂交受到抑制。因此,单倍体植物是一组染色体由于存在基因修饰的单倍体诱导物而消除以获得仅具有一组染色体的植物(n)的过程的产物。这与通过天然发生的减数分裂获得的植物形成鲜明对比,其中亲本品系的染色体被主动混合以获得具有两组染色体(2n)的二倍体植物,即每个亲本的一组染色体。
此外,本发明的产生单倍体植物细胞的方法不包括由于同源重组所致的基因混合,因此不包括混合单倍体诱导物的基因组与“野生型”植物的基因组。事实上,根据本发明的教导,“杂交”的意义是指单倍体后代中野生型亲本植物的单亲染色体消除和遗传库的保存。
单倍体诱导物与野生型植物的相互作用产生合子,其中由于不能吸引外部着丝粒组件,在早期胚发生期间丧失单倍体诱导物的染色体。未能附着在着丝粒纺锤体上会触发拯救途径,导致含有KNL2突变体的染色体被包裹,及导致这些染色体在微核中降解。在合子有丝分裂后,单倍体细胞含有一组染色体,其与来自野生型亲本植物的一组染色体相同。因此,在产生单倍体植物期间,野生型植物的基因组保持保守,而单倍体诱导物的基因组丧失,即单倍体诱导物与野生型植物的杂交不包括全基因组的有性杂交。在关于产生单倍体植物的方法的上下文中,术语“杂交”的意义因此意味着由于阻止全植物基因组的有性杂交而减少基因多样性和保持基因同质性,而传统意义上“有性杂交”中的“杂交”意味着基因多样性和异质性的增加。
本文描述的技术提供了通过在KNL2蛋白的SANTA结构域中的特异性突变而有效诱导作物植物例如油菜中单倍体形成的方法。首次证明在拟南芥中的单倍体诱导可以转移至作物植物中。与迄今为止基于CENH3的单倍体诱导物开发方面所做的所有工作相比,与拟南芥相比在油菜籽中观察到了强大的单倍体诱导水平。使用本文描述的技术,可以克服通过仅一种基因(例如CENH3)的诱变实现的作物植物中的低诱导率。
本文所述方法中使用的植物,源自选自下组的植物物种:大麦(Hordeumvulgare)、球茎大麦(Hordeum bulbusom)、高粱、甘蔗(Saccharum officinarium)、玉米(Zea mays)、小米(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticumaestivum)、黑麦(Secale cereale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、胡萝卜(Daucusglochidiatus)、甜菜(Beta vulgaris)、小胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、普通烟草(Nicotianatabacum)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、黄花螺旋狸藻(Genliseaaurea)、黄瓜(Cucumis sativus)、川桑(Morus notabilis)、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜花(Capsella bursa pastoris)、无苞芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、甘蓝型油菜、甘蓝(Brassicaoleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.Sativa)、甜橙(Citrussinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanusscarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、紫云英(Astragalussinicus)、百脉根(Lotus japonicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、大葱(Allium fistulosum)、大蒜(Allium sativum)和韭菜(Allium tuberosum)。
在一个实施方式中,产生单倍体植物细胞的方法是产生单倍体植物或其部分的方法,除步骤a)至c)外还包括以下步骤:
d)在获得单倍体植物或其部分的条件下培养单倍体细胞;和
e)获得单倍体植物或其部分。
在产生单倍体植物细胞、单倍体植物或其部分的方法的又一优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或雄配子,即花粉。
在产生单倍体植物细胞、单倍体植物或其部分的方法的另一优选实施方式中,第一配子衍生自其中或产生第一配子的植物是母本,第二配子衍生自其中或产生第二配子的植物是父本,或者第一配子衍生自其中或产生第一配子的植物是父本,第二配子衍生自其中或产生第二配子的植物是母本。
在上述产生单倍体植物细胞的方法的另一实施方式中,步骤c)产生至少0.5%、优选至少1.0%、至少2.0%、至少3.0%、至少4.0%、至少5.0%、至少6.0%或至少7.0%的单倍体后代。
另一方面,本发明提供了一种产生双单倍体植物细胞的方法,包括以下步骤:
a)提供衍生自其中或产生具有根据本文所述的任何实施方式的单倍体诱导物的活性的植物的非天然存在的第一配子;
b)通过将步骤a)的第一配子与衍生自其中或产生相同属、优选相同物种的植物的第二配子接触产生合子,所述第二配子包含如上定义的编码野生型KNL2蛋白的核苷酸序列,且能表达野生型KNL2蛋白,优选仅表达野生型KNL2蛋白;
c)通过从合子中消除具有单倍体诱导物的活性的植物染色体获得单倍体细胞;及
d)将单倍体细胞转化为双单倍体细胞,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特等染色体加倍剂处理或通过在允许自发染色体的条件下培养;
e)获得双单倍体细胞。
在一个实施方式中,上述产生双单倍体植物的方法除包括步骤a)至e)外,还包括以下步骤:
f)在获得双单倍体植物或其部分的条件下培养双单倍体细胞;和
g)获得双单倍体植物或其部分。
通过上述产生双单倍体植物细胞的方法,可以获得对于所需性状是纯合的细胞或植物,同时避免费力的回交步骤。
在如上所述产生双单倍体植物细胞的方法的另一实施方式中,步骤c)产生至少0.5%、优选至少1.0%、至少2.0%、至少3.0%、至少4.0%、至少5.0%、至少6.0%或至少7.0%的单倍体后代。
在如上所述的产生单倍体植物细胞的方法或产生双单倍体植物细胞的方法的一个优选实施方式中,非天然存在第一配子来自具有单倍体诱导物的活性及包含编码具有SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列的植物,其中所述核苷酸序列包含导致在SANTA结构域中KNL2蛋白氨基酸序列改变的至少一处突变,所述改变赋予单倍体诱导物的活性。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的又一优选实施方式中,第一配子是雌配子,即卵细胞/胚珠,或雄配子,即花粉。
在产生双单倍体植物细胞、双单倍体植物或其部分的方法的另一优选实施方式中,第一配子衍生自其中或产生第一配子的植物是母本,第二配子衍生自其中或产生第二配子的植物是父本,或者第一配子衍生自其中或产生第一配子的植物是父本,第二配子衍生自其中或产生第二配子的植物是母本。
根据另一方面,本发明还提供了一种在植物群体中鉴别植物或生产植物的方法,其中所述植物如上述在编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变,其中所述方法包括以下步骤:
(a)对一个植物群体进行诱变处理;
(b)筛选所述植物群体中是否存在至少一处突变,从而在植物群体中鉴别在编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变的植物,
其中所述至少一处突变赋予所鉴别植物中单倍体诱导物的活性。
在一个实施方式中,在上述在植物群体中鉴别植物或生产植物的方法中,所述筛选步骤包括:
(b1)产生一组寡核苷酸,其靶向植物物种中编码KNL2蛋白的内源性核苷酸序列中的至少一处突变;
(b2)提供包括适合检测所述至少一处突变的一组寡核苷酸的测定;
(b3)通过测定所述至少一处突变的存在来筛选所述植物群体,从而鉴别在编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变的植物。
靶向所述至少一处突变的一组寡核苷酸可以是一组引物以扩增包含所述突变的序列。技术人员已知如何设计适于检测所述至少一处突变的测定。所述突变可以例如通过对扩增的序列进行测序而检测。
在一个优选的实施方式中,在上述在植物群体中鉴别植物或生产植物的方法中,编码KNL2蛋白的内源性核苷酸序列中的至少一处突变导致SANTA结构域中KNL2蛋白的氨基酸序列改变,所述改变赋予单倍体诱导物的活性。
在上述在植物群体中鉴别植物或生产植物的方法的一个实施方式中,所述内源性核苷酸序列选自下组:
(i)SEQ ID NO:28-31任一所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(vi)在严格条件下与(iii)的序列杂交的核苷酸序列;或
(vii)由于遗传密码的简并而不同于(i)、(ii)或(iii)的序列的核苷酸序列。
在上述在植物群体中鉴别植物或生产植物的方法的另一实施方式中,所述植物是欧洲油菜,及所述一组寡核苷酸包含选自SEQ ID NO:174-185的序列。
在上述在植物群体中鉴别植物或生产植物的方法的一个实施方式中,所述至少一处突变是在内源性核苷酸序列编码区中置换、加入或缺失至少一个核碱基,与野生型蛋白质相比,所述置换、加入或缺失导致编码的KNL2蛋白中、优选在KNL2的SANTA结构域中的氨基酸置换,产生蛋白质活性或稳定性的改变。
根据另一方面,本发明还提供了鉴别具有单倍体诱导物的活性的欧洲油菜植物的一组寡核苷酸,其中所述一组寡核苷酸包含SEQ ID NO:174-185任一所示序列。
根据另一方面,本发明还提供了鉴别或生产具有单倍体诱导物的活性的欧洲油菜植物的一组寡核苷酸,其中所述一组寡核苷酸包含SEQ ID NO:174-185任一所示序列。
在本发明的一方面,包含所述突变的核苷酸序列是内源基因或转基因。
在一个实施方式中,将编码包含SANTA结构域的KNL2蛋白或其功能片段的核苷酸序列以转基因形式导入植物中,其中所述核苷酸序列包含至少一处突变,所述突变导致SANTA结构域中KNL2蛋白的氨基酸序列发生改变,所述改变基于所述核苷酸的表达而赋予植物单倍体诱导物的活性。优选地,这可以通过用包含所述核苷酸序列或其功能片段的载体进行稳定转化而完成,例如通过根癌农杆菌(Agrobacterium tumefaciens)或基因枪进行转化。技术人员熟知转化植物以将转基因导入植物基因组的方法。
在本发明的核苷酸序列的一个实施方式中,(野生型,未突变的)KNL2蛋白包含SEQID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列;或其中编码野生型KNL2蛋白的核苷酸序列选自下组:
(i)SEQ ID NO:28-31任一项所示核苷酸序列;
(ii)具有SEQ ID NO:228-231任一所示编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)或(ii)的序列至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核苷酸序列;
(v)编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(vi)在严格条件下与(iii)的序列杂交的核苷酸序列;或
(vii)由于遗传密码的简并而不同于(i)、(ii)、(iii)或(v)的序列的核苷酸序列。
在本发明的核苷酸序列的另一实施方式中,所述至少一处突变导致在根据SEQ IDNO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:19-23或73-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的赋予单倍体诱导物的活性的KNL2蛋白的改变。优选地,所述改变是一个或多个氨基酸的取代、一个或多个氨基酸的插入或缺失、剪接位点的改变或KNL2蛋白由于插入的终止密码子而提前终止。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16所示KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:19-23或73-147的SANTA结构域的保守基序中、更优选在根据SEQ ID NO:23或133-147的SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102的SANTA结构域的保守基序中的氨基酸的取代、插入或缺失。
在本发明的核苷酸序列的另一优选实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在根据SEQ ID NO:1-16所示KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:19-23或73-147所示SANTA结构域的保守基序中、更优选在根据SEQ IDNO:23或133-147所示SANTA结构域的保守基序中、甚至更优选在根据SEQ ID NO:20或88-102所示SANTA结构域的保守基序中的一个或多个氨基酸的取代、插入或缺失。
在本发明的核苷酸序列的一个优选实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第第71位氨基酸谷氨酸(E)、SEQ ID NO:25第69位氨基酸谷氨酸(E)、SEQ ID NO:26第95位氨基酸谷氨酸(E)、SEQ ID NO:27第63位氨基酸谷氨酸(E)或对应于SEQ ID NO:20或88-102中任一序列的第4位氨基酸或SEQ ID NO:23或133-147中任一序列的第14位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于谷氨酸(E)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明的核苷酸序列的另一优选实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第73位氨基酸丝氨酸(S)、SEQ ID NO:25第71位氨基酸丝氨酸(S)、SEQ ID NO:26第97位氨基酸谷氨酸(E)、SEQ ID NO:27第65位氨基酸缬氨酸(V)或对应于SEQ ID NO:20或88-102中任一序列的第6位氨基酸或SEQ ID NO:23或133-147中任一序列的第16位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第69位氨基酸苏氨酸(T)、SEQ ID NO:25第67位氨基酸苏氨酸(T)、SEQ ID NO:26第93位氨基酸缬氨酸(V)、SEQ ID NO:27第61位氨基酸谷氨酸(E)或对应于SEQ ID NO:20或88-102中任一序列的第2位氨基酸或SEQ ID NO:23或133-147中任一序列的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、苏氨酸(T)和缬氨酸(V)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第70位氨基酸亮氨酸(L)、SEQ ID NO:25第68位氨基酸亮氨酸(L)、SEQ ID NO:26第94位氨基酸亮氨酸(L)、SEQ ID NO:27第62位氨基酸亮氨酸(L)或对应于SEQ ID NO:20或88-102中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第13位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于亮氨酸(L)和异亮氨酸(I)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第72位氨基酸丙氨酸(A)、SEQ ID NO:25第70位氨基酸丙氨酸(A)、SEQ ID NO:26第96位氨基酸苏氨酸(T)、SEQ ID NO:27第64位氨基酸苏氨酸(T)或对应于SEQ ID NO:20或88-102中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第15位氨基酸的氨基酸,取代为另一氨基酸,优选地取代为不同于丙氨酸(A)、丝氨酸(S)、天冬氨酸(D)、酪氨酸(Y)的氨基酸,更优选取代为氨基酸异亮氨酸(I)或苏氨酸(T)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第74位氨基酸天冬氨酸(D)、SEQ ID NO:25第72位氨基酸天冬氨酸(D)、SEQ ID NO:26第98位氨基酸谷氨酸(E)、SEQ ID NO:27第66位氨基酸天冬氨酸(D)或对应于SEQ ID NO:20或88-102中任一序列的第7位氨基酸或SEQ ID NO:23或133-147中任一序列的第17位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、谷氨酸(E)和甘氨酸(G)的氨基酸,更优选取代为氨基酸天冬酰胺(N)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第75位氨基酸甘氨酸(G)、SEQ ID NO:25第73位氨基酸甘氨酸(G)、SEQ ID NO:26第99位氨基酸甘氨酸(G)、SEQ ID NO:27第67位氨基酸甘氨酸(G)或对应于SEQ ID NO:20或88-102中任一序列的第8位氨基酸或SEQ ID NO:23或133-147中任一序列的第18位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、天冬酰胺(N)和组氨酸(H)的氨基酸,更优选取代为精氨酸(R)或谷氨酸(E)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第58位氨基酸丝氨酸(S)、SEQ ID NO:25第56位氨基酸丝氨酸(S)、SEQ ID NO:26第82位氨基酸脯氨酸(P)、SEQ ID NO:27第50位氨基酸丝氨酸(S)或对应于SEQ ID NO:19或73-87中任一序列的第1位氨基酸或SEQ ID NO:23或133-147中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第60位氨基酸脯氨酸(P)、SEQ ID NO:25第58位氨基酸脯氨酸(P)、SEQ ID NO:26第84位氨基酸脯氨酸(P)、SEQ ID NO:27第52位氨基酸脯氨酸(P)或对应于SEQ ID NO:19或73-87中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)或丝氨酸(S)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第62位氨基酸亮氨酸(L)、SEQ ID NO:25第60位氨基酸缬氨酸(V)、SEQ ID NO:26第86位氨基酸丙氨酸(A)、SEQ ID NO:27第54位氨基酸亮氨酸(L)或对应于SEQ ID NO:19或73-87中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、丙氨酸(A)、亮氨酸(L)、缬氨酸(V)和苏氨酸(T)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的核苷酸序列的另一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第66位氨基酸天冬氨酸(D)、SEQ ID NO:25第64位氨基酸天冬氨酸(D)、SEQ ID NO:26第90位氨基酸苏氨酸(T)、SEQ ID NO:27第58位氨基酸天冬氨酸(D)或对应于SEQ ID NO:19或73-87中任一序列的第9位氨基酸或SEQ ID NO:23或133-147中任一序列的第9位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、苏氨酸(T)、丙氨酸(A)和谷氨酸(E)的氨基酸,更优选取代为天冬酰胺(N)。
在本发明的核苷酸序列的一个实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:24第67位氨基酸缬氨酸(V)、SEQ ID NO:25第65位氨基酸缬氨酸(V)、SEQ ID NO:26第91位氨基酸丝氨酸(S)、SEQ ID NO:27第59位氨基酸亮氨酸(L)或对应于SEQ ID NO:19或73-87中任一序列的第10位氨基酸或SEQ ID NO:23或133-147中任一序列的第10位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于缬氨酸(V)、丝氨酸(S)、亮氨酸(L)、天冬酰胺(N)、酪氨酸(Y)、脯氨酸(P)、天冬氨酸(D)和谷氨酸(E)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第12位氨基酸亮氨酸(T)或对应于SEQ ID NO:17或43-57中任一序列的第2位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于苏氨酸(T)、缬氨酸(V)、苯丙氨酸(F)、丝氨酸(S)和亮氨酸(L)的氨基酸,更优选取代为氨基酸异亮氨酸(I)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第22位氨基酸脯氨酸(P)或对应于SEQ ID NO:16第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)或谷氨酸(E)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第33位氨基酸甘氨酸(G)或对应于SEQ ID NO:18或58-72中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、精氨酸(R)和丙氨酸(A)的氨基酸,更优选取代为氨基酸谷氨酸(E)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第49位丝氨酸(S)或对应于SEQ IDNO:16第34位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、苏氨酸(T)的氨基酸,更优选取代为氨基酸苯丙氨酸(F)。
在本发明的各个方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第80位氨基酸精氨酸(R)或对应于SEQ ID NO:16第65位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于精氨酸(R)的氨基酸,更优选取代为氨基酸组氨酸(H)。
在本发明的各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第84位氨基酸天冬酰胺(N)或对应于SEQ ID NO:21或103-117中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬酰胺(N)、酪氨酸(Y)和丝氨酸(S)的氨基酸,更优选取代为氨基酸赖氨酸(K)。
在本发明各个方面的另一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第88位氨基酸脯氨酸(P)或对应于SEQ ID NO:21或103-117中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸(P)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸丝氨酸(S)。
在本发明各个方面的又一实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:27第100位氨基酸脯氨酸(P)或对应于SEQ ID NO:22或118-132中任一序列的第7位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于脯氨酸和天冬氨酸(D)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L)。
在本发明各方面的一个实施方式中,在上述植物中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是将在SEQ ID NO:26第68位氨基酸丙氨酸(A)或对应于SEQID NO:18或58-72中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和丝氨酸(S)的氨基酸,更优选取代为氨基酸苏氨酸(T)。
在本发明的核苷酸序列的又一实施方式中,赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是在编码具有SEQ ID NO:24-27所示氨基酸序列或与SEQ ID NO:24-27所示序列具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%,、97%、98%或99%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列中、或在编码SEQ ID NO:28-31所示KNL2蛋白的核苷酸序列或与SEQ ID NO:28-31具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性的核苷酸序列中,插入终止密码子、无义突变、移码突变或剪接位点突变所致。这种终止密码子或无义突变可导致KNL2蛋白翻译过早终止。这种移码突变或剪接位点突变可改变读框,导致与原始KNL2蛋白完全不同的翻译。优选地,终止密码子、无义突变或移码突变插入或修饰编码SANTA结构域的核苷酸序列和/或编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列,更优选终止密码子插入或修饰编码根据SEQ IDNO:23或133-147的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N-末端的氨基酸序列的核苷酸序列,甚至更优选将终止密码子插入编码根据SEQ ID NO:20或88-102的SANTA结构域的保守基序的核苷酸序列和/或编码位于所述保守基序N末端的氨基酸序列的核苷酸序列,甚至最优选将终止密码子插入编码位于SANTA结构域N末端的氨基酸序列的核苷酸序列中。
在本发明的核苷酸序列的一个实施方式中,编码SEQ ID NO:24第18位氨基酸谷氨酸(E)、SEQ ID NO:25第16位氨基酸谷氨酰胺(Q)、SEQ ID NO:26第45位氨基酸组氨酸(H)、SEQ ID NO:27第8位氨基酸谷氨酰胺(Q)的密码子被改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,编码SEQ ID NO:24第27位氨基酸色氨酸(W)、SEQ ID NO:25第25位氨基酸色氨酸(W)、SEQ ID NO:26第54位氨基酸色氨酸(W)、SEQID NO:27第17位氨基酸色氨酸(W)的密码子被改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,将编码SEQ ID NO:27第17位氨基酸色氨酸(W)或SEQ ID NO:24-26任一序列中相应氨基酸的密码子改变为终止密码子。
在本发明的核苷酸序列的又一实施方式中,编码SEQ ID NO:26第54位氨基酸色氨酸(W)或SEQ ID NO:24、25和-27任一序列中相应氨基酸的密码子被改变为终止密码子。
在本发明的核苷酸序列的另一实施方式中,改变位于SEQ ID NO:28第521位或SEQID NO:29第540位的剪接位点,从而缺失或破坏剪接信号。
在本发明的核苷酸序列的另一实施方式中,改变位于SEQ ID NO:31第454位的剪接位点,从而缺失或破坏剪接信号。
在本发明的核苷酸序列的一个实施方式中,包含导致在SANTA结构域中KNL2蛋白的氨基酸序列改变的至少一处突变的核苷酸序列选自SEQ ID NO:168-173、194、195、200-212和232。
根据另一方面,本发明提供了一种载体或表达盒,其包含本发明前述各方面的核苷酸序列。
在所述载体或表达盒的一个实施方式中,核苷酸序列的表达受启动子控制或所述核苷酸序列与启动子可操作地连接。
根据一方面,本发明提供了一种植物细胞,其包含本发明前述各方面的核苷酸序列、表达盒或载体。
根据另一方面,本发明提供了植物、植物一部分或种子,其包含作为转基因的上述核苷酸序列、上述载体或上述各方面提及的植物细胞。
根据一方面,本发明还提供了一种产生具有本发明前述各方面所述的单倍体诱导物的活性的转基因植物或其部分的方法,包括以下步骤:将本发明前述各方面所述的核苷酸序列、载体或表达盒导入至少一种植物细胞中,从所述至少一种细胞中再生具有单倍体诱导物的活性的转基因植物或一其部分。
根据又一方面,本发明提供了一种赋予植物单倍体诱导物的活性的方法,包括以下步骤:将如本发明的前述各方面所述的核苷酸序列、载体或表达盒导入植物或其部分中,使所述核苷酸序列或表达盒表达。
根据又一方面,本发明提供了一种修饰植物基因组的方法,所述方法包括:提供包含至少一种基因组编辑组件(GEC)的第一植物;将第一植物与第二植物杂交,其中至少一种GEC修饰第二植物的基因组,从而产生第二植物的修饰的基因组;获得由第一和第二植物杂交产生的第三植物,其中第三植物包含第二植物的修饰的基因组,及其中第三植物基本上没有GEC,其中第一植物是具有单倍体诱导物的活性的植物及包含编码具有SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列,其中所述核苷酸序列包含至少一处突变,所述突变导致在SANTA结构域中KNL2蛋白的氨基酸序列发生改变,所述改变赋予如上所述的单倍体诱导物的活性。
如本文所用,“基因编辑组件(GEC)”是指能引发基因组修饰的酶和/或供体多核苷酸模板。一方面,本文提供的GEC引发靶向基因组修饰。另一方面,本文提供的GEC引发非靶向基因组修饰。如本文所用,“靶向基因组修饰”是指使用位点特异性酶定向编辑预定的靶向多核苷酸序列。一方面,本文提供的GEC包含1、2或3种或更多种酶;0、1、2或3个或更多个供体多核苷酸模板;或能引起植物基因组中修饰的二者。一方面,通过修饰植物基因组的方法获得的植物、植物细胞或植物基因组包含至少1、2或至少3种GEC。另一方面,本文提供的花粉细胞包含至少1、2或至少3种GEC。在另一方面,本文提供的植物卵细胞包含至少1、2或至少3种GEC。一方面,本文提供的单倍体诱导植物包含至少1、2或至少3种GEC。另一方面,本文提供的植物基因组被1、2或3种或更多种GEC修饰。一方面,本发明公开提供了编码GEC的1、2、或3个或更多个核酸。一方面,本文提供的GEC包含1、2、或3种或更多种位点特异性酶。在另一方面,本文提供的GEC包含编码1、2或3种或更多种位点特异性酶的核酸序列。一方面,本文提供的GEC包含编码1、2或3个或更多个供体多核苷酸模板的核酸序列。如本文所用,“供体多核苷酸模板”是指包含待插入受体品系基因组的希望的多核苷酸序列的多核苷酸。
如本文所用,植物A基本上没有另一种植物B的基因组是指植物A没有至少95%、96%或97%的植物B的基因组,更优选没有98%、98.5%、99%或99.5%的植物B的基因组,最优选其没有植物B的全部(100%)基因组。
在一个实施方式中,第一植物是母本单倍体诱导物,第三植物基本上没有第一植物的基因组,或者第一植物是父本单倍体诱导物,第三植物基本上没有第一植物的基因组。
在另一实施方式中,第二植物的修饰的基因组选自核基因组、线粒体基因组和质体基因组。
一方面,本文提供的GEC修饰植物基因组。另一方面,本文提供的GEC修饰选自核基因组、线粒体基因组和质体基因组的植物基因组。另一方面,本文提供的GEC修饰母本植物基因组或父本植物基因组。一方面,编码本文提供的GEC的核酸序列位于母本基因组中。另一方面,编码本文提供的GEC的核酸序列位于父本基因组中。一方面,本文提供的GEC不会引起HI植物或细胞的基因组中的修饰。另一方面,本文提供的GEC确实引发HI植物或细胞基因组中的修饰,条件是所述修饰对HI植物或细胞不是致死的。
在又一实施方式中,所述方法进一步包括:使第三植物或合子的核基因组加倍,从而产生包含加倍核基因组的第三植物,优选通过用选自一氧化二氮、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特等染色体加倍剂处理。
在又一实施方式中,所述方法进一步包括:从包含加倍核基因组的第三植物或合子中产生后代植物或种子,其中所述后代植物或种子的基因组包含第二植物的修饰的基因组。
在又一实施方式中,第二植物的修饰的基因组包含选自以下的至少一种修饰:
i.置换至少一个核苷酸;
ii.缺失至少一个核苷酸;
iii.插入至少一个核苷酸;或
iv.上述i至iii的任意组合。
在一个实施方式中,至少一种GEC包含选自组成型启动子、可诱导型启动子和组织特异性启动子的至少一种启动子,优选地,所述组织特异性启动子选自胚特异性启动子、配子特异性启动子和早期合子特异性启动子。
在另一实施方式中,至少一种GEC包含至少一种核酸内切酶,优选选自CRISPR相关核酸酶、转录激活因子样效应核酸酶(TALEN)、TALE样蛋白、锌指核酸酶和大范围核酸酶,或与催化受损的核酸内切酶融合的至少一种碱基编辑器,其优选识别所述细胞基因组中的预定位点。优选地,核酸内切酶选自CRISPR相关核酸酶、转录激活因子样效应核酸酶(TALEN)、TALE样蛋白、锌指核酸酶和大范围核酸酶。
在另一实施方式中,至少一个GEC包含至少一个供体多核苷酸模板和/或至少一个病毒复制子,优选双生病毒复制子或纳米病毒复制子。已经开发了基于RNA病毒的病毒复制子系统。病毒复制子系统包含两个基本成分:复制酶基因和复制酶蛋白的靶序列。复制酶基因产物(“复制酶蛋白”)作用于靶序列以扩增靶序列和任何相关序列,统称为复制子。复制子前体可以以允许复制子形成和扩增随后被激活的方式稳定插入基因组中。一方面,本文提供的病毒复制子前体包含编码至少一种复制酶基因的至少一个核酸序列、复制酶基因产物的至少一个靶序列和至少一种GEC;当表达或扩增时,该核酸序列被称为“复制子”。复制酶蛋白可与复制子的靶序列结合,从而产生另外的复制子。除至少一种GEC外,待扩增的序列上还包括至少一种复制酶基因,从而产生复制酶蛋白的额外拷贝。产生复制子和复制酶蛋白的额外拷贝使得复制子在多重细胞分裂中持续存在,尽管已知的复制子不会在植物的整个生命周期中持续存在。由于复制子在物理上并不位于染色体上,因此在花粉细胞使卵细胞受精后父本或母本核基因组丧失后,其可能会持续存在于细胞中。一方面,本文提供的植物细胞在失去父本核基因组或母本核基因组后包含1、2、3或更多个病毒复制子。在另一方面,本文提供的复制子存在于细胞核中。在又一方面,本文提供的复制子存在于细胞的细胞质中。
一方面,本文提供的病毒复制子是双生病毒复制子或纳米病毒复制子。在双生病毒复制子系统的情况下,前体包含两个靶序列,称为LIR(纳米病毒复制子系统中的NVR),通过复制酶蛋白作用以产生包含LIR和存在于两个LIR之间的任何序列的复制子可以进行直接定向。纳米病毒复制子系统的工作方式与双生病毒复制子系统类似。或者,可以通过在复制酶靶序列(例如LIR、NVR)单拷贝和一个或多个GEC两侧具有一对位点特异性重组酶靶序列而生成复制子。当提供合适的重组酶时,其切除一个环状DNA分子,所述分子可以由识别复制酶靶序列的复制酶蛋白复制。
在又一实施方式中,第一植物和第二植物属于相同物种或不同物种。
实施例
在农作物植物中鉴别赋予单倍体诱导物的活性的KNL2突变
欧洲油菜:
为鉴别可赋予单倍体诱导物的活性的作物植物中的KNL2突变,基于衍生自拟南芥(Arabidopsis thaliana)的KNL2序列进行了同源性搜索。由此,可以在欧洲油菜的A和C基因组中鉴别出两个同源基因BnaAnng00390D(SEQ ID NO:28)和BnaCnng28840D(SEQ ID NO:29)。为鉴别点突变,使用基于春系品种PALMA的甲磺酸乙酯(EMS)TILLING群体。筛选所述群体中每个KNL2基因拷贝的两个片段(=2000bp)。第一个扩增子置于基因的5’末端,以鉴别完全敲除突变。第二个扩增子置于基因的CENPCk结构域,其被认为与DNA结合最相关。所需的扩增子开发和测序使用作为TraitGenetics服务的MiSeq测序法进行。使用TILLING分析管道分析序列原始数据。选择位于外显子并导致错义突变和剪接位点变化的突变用于进一步测试。总共选择了13个突变,其中3个用于位于基因组A的基因拷贝,10个用于位于基因组C的基因拷贝。
将鉴别的相应的杂合EMS TILLING植物在温室中自交,并开发平行竞争性等位基因特异性PCR(Competitive Allele Specific PCR)(KASPAR)标记以追踪每个突变。在接下来的世代中,通过KASPAR标记选择纯合突变植物,并将其作为雌或雄系与春季双单倍体(DH)品系杂交,以验证单倍体诱导率。使用相关突变的KASPAR标记和进一步的全基因组标记分析数百个所得种子的母本/父本诱导率。表1示出了所有突变和相应诱导率的概述。
表1:所有测试的突变和相应诱导率概述。*表示终止密码子;SS表示剪接位点中的突变(无法检测到蛋白质)。
Figure BDA0003286314110000351
从表1中可以看出,所有诱导的单倍体均示出F1杂交的雌性成分的单倍型。在六种突变的母本诱导系统中,观察到母本单倍体(母本-母本)的诱导率为1-7%,而在父本系统中,示出父本单倍体(父本-母本)的诱导率仅为0.6%。感兴趣的是,在A基因组拷贝中检测到没有针对突变的单倍体。在C基因组中,对于两个敲除突变(Q16*;W25*)和一个剪接侧突变(SS)观察到单倍体诱导。此外,在SANTA结构域(E69K和S71F)中的四个突变中有两个突变观察到诱导。
本文提供的数据清楚地表明,在KNL2蛋白的SANTA结构域中的特异性点突变可以观察到高达7%的诱导率,而迄今为止,在作物植物中只能实现非常低的诱导率(<1%)。
高粱:
同源基因Sb_A0A194YKU1已如上所述鉴别。为鉴别点突变,使用了甲磺酸乙酯(EMS)TILLING群体。筛选所述群体的完全敲除突变和基因的SANTA结构域或CENPCk结构域中的突变。使用TILLING分析管道分析序列原始数据。选择位于外显子并导致错义突变和剪接位点变化的突变用于进一步测试。总共选择了11个突变。
将鉴别的相应杂合EMS TILLING植物在温室中自交,开发平行竞争性等位基因特异性PCR(KASPAR)标记以追踪每个突变。在接下来的世代中,通过KASPAR标记选择纯合突变植物,并将其作为雌或雄系与春季双单倍体(DH)品系杂交,以验证单倍体诱导率。使用相关突变的KASPAR标记和进一步的全基因组标记分析了数百个所得种子的母本/父本诱导率。表2示出了所有突变和相应诱导率的概述。
表2:所有测试的突变和相应诱导率概述。*表示终止密码子;SS表示剪接位点的突变(无法检测到蛋白质)。
Figure BDA0003286314110000352
Figure BDA0003286314110000361
向日葵
同源基因Ha_A0A251U7G7已如上所述鉴别。为鉴别点突变,使用了甲磺酸乙酯(EMS)TILLING群体。筛选所述群体的完全敲除突变和基因的SANTA结构域或CENPCk结构域中的突变。使用TILLING分析管道分析序列原始数据。选择位于外显子并导致错义突变和剪接位点变化的突变用于进一步测试。总共选择了16个突变。
将鉴别的相应杂合EMS TILLING植物在温室中自交,开发平行竞争性等位基因特异性PCR(KASPAR)标记以追踪每个突变。在接下来的世代中,通过KASPAR标记选择纯合突变植物,并将其作为雌或雄系与春季双单倍体(DH)品系杂交,以验证单倍体诱导率。使用相关突变的KAPAR标记和进一步的全基因组标记分析数百个所得种子的母本/父本诱导率。所有突变的总结在表3中给出。诱导物的有丝分裂和减数分裂的细胞遗传学分析表明突变体作为单倍体诱导物的适用性。
表3:所有鉴别的突变和相应诱导率的概述。*表示终止密码子;SS表示剪接位点的突变(无法检测到蛋白质)。
基因 SEQ ID NO: 突变 位置 结构域
Ha_A0A251U7G7 DNA:200;蛋白质:214 T12I 12 SANTA
Ha_A0A251U7G7 DNA:201;蛋白质:215 W17* 17 SANTA
Ha_A0A251U7G7 DNA:202;蛋白质:216 P22S 22 SANTA
Ha_A0A251U7G7 DNA:203;蛋白质:217 P22L 22 SANTA
Ha_A0A251U7G7 DNA:204;蛋白质:218 G33E 33 SANTA
Ha_A0A251U7G7 DNA:205;蛋白质:219 S49F 49 SANTA
Ha_A0A251U7G7 DNA:206;蛋白质:220 P52L 52 SANTA
Ha_A0A251U7G7 DNA:207;蛋白质:221 T64I 64 SANTA
Ha_A0A251U7G7 DNA:208;蛋白质:222 R80H 80 SANTA
Ha_A0A251U7G7 DNA:209;蛋白质:223 N84K 84 SANTA
Ha_A0A251U7G7 DNA:210;蛋白质:224 P88S 88 SANTA
Ha_A0A251U7G7 DNA:211;蛋白质:225 P100L 100 SANTA
Ha_A0A251U7G7 DNA:212;蛋白质:226 P100S 100 SANTA
Ha_A0A251U7G7 DNA:213;蛋白质:227 G390R 390 CenPCk
Ha_A0A251U7G7 DNA:233;蛋白质:235 V392M 392 CenPCk
Ha_A0A251U7G7 DNA:234;蛋白质:236 D408N 408 CenPCk
Ha_A0A251U7G7 DNA:232 SS SS
序列表
<110> 科沃施种子欧洲股份两合公司
<120> 单倍体诱导物
<130> KWS0316PCT
<150> EP 19154617.5
<151> 2019-01-30
<160> 236
<170> PatentIn version 3.5
<210> 1
<211> 93
<212> PRT
<213> Arabidopsis thaliana
<400> 1
Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Lys Glu Phe Glu
1 5 10 15
Gly Lys Gln Phe Gly Val Ala Gly Phe Glu Glu Ser Val Glu Thr Arg
20 25 30
Ala Met Arg Val Phe Thr Ser Ser Pro Ile Thr Lys Ala Leu Asp Val
35 40 45
Phe Thr Leu Leu Ala Ser Asp Gly Ile Tyr Ile Thr Leu Arg Gly Phe
50 55 60
Leu Asn Lys Glu Arg Val Leu Lys Asn Gly Phe Asn Pro Glu Ile Ser
65 70 75 80
Arg Glu Phe Ile Phe Gly Phe Pro Pro Cys Trp Glu Arg
85 90
<210> 2
<211> 92
<212> PRT
<213> Brassica napus
<400> 2
Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu Phe Asp
1 5 10 15
Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr Gly Ala
20 25 30
Val Arg Val Phe Ala Ser Ser Pro Ile Val Lys Ala Phe Asp Val Phe
35 40 45
Thr Leu Glu Ala Ser Asp Gly Val Cys Ile Val Leu Arg Gly Phe Leu
50 55 60
Asn Lys Gln Arg Leu Val Leu Ser Gly Phe Leu Pro Gln Ile Cys Ser
65 70 75 80
Glu Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu Ser
85 90
<210> 3
<211> 90
<212> PRT
<213> Brassica napus
<400> 3
Val Ser Leu Ser Asp Trp Trp Leu Thr Lys Lys Ala Asn Glu Thr Gly
1 5 10 15
Leu Gly Val Ser Gly Phe Glu Ser Lys Gly Gly Pro Glu Val Arg Leu
20 25 30
Phe Ser Ser Ala Ala Ile Ser Thr Arg His Asp Ser Thr Thr Leu Glu
35 40 45
Thr Ser Asp Gly Leu Thr Val Ser Ile Ser Gly Phe Ile Asn Arg Ser
50 55 60
Arg Ser Phe Gln Asn Gly Phe Ser Ser Glu Asp Cys Asn Arg Phe Leu
65 70 75 80
Leu Gly Phe Pro Tyr His Trp Lys Asp Tyr
85 90
<210> 4
<211> 92
<212> PRT
<213> Brassica napus
<400> 4
Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu Phe Gln
1 5 10 15
Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr Gly Ala
20 25 30
Val Arg Val Phe Thr Ser Ser Pro Ile Leu Lys Ala Phe Asp Val Phe
35 40 45
Thr Leu Glu Ala Ser Asp Gly Val Cys Ile Val Leu Arg Gly Phe Leu
50 55 60
Asn Lys Pro Arg Leu Val His Ser Gly Phe Leu Pro Gln Ile Cys Ser
65 70 75 80
Glu Phe Ile Leu Gly Phe Pro Pro Tyr Trp Glu Ser
85 90
<210> 5
<211> 95
<212> PRT
<213> Helianthus annuus
<400> 5
Val Thr Leu Leu Asp Trp Trp Leu Thr Lys Pro Pro Thr Asn Asp His
1 5 10 15
Tyr Gln Thr Leu Thr Leu Gly Val Ala Gly Phe Thr Ser Gln Gln Asn
20 25 30
Arg Pro Ala Arg Cys Phe Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp
35 40 45
Leu Phe Glu Leu Glu Thr Val Asp Gly Val Cys Val Ile Leu Gln Gly
50 55 60
Phe Ile Asn Lys Gln Arg Thr Leu Glu Asn Gly Phe Ser Pro Gln Val
65 70 75 80
Phe Asp His Phe Phe Ile Gly Phe Pro Pro Tyr Trp Lys Glu Tyr
85 90 95
<210> 6
<211> 114
<212> PRT
<213> Helianthus annuus
<400> 6
Val Phe Leu His Gln Trp Trp Leu Ile Lys Val Glu Lys Glu Pro Lys
1 5 10 15
Leu Gly Val Gly Gly Phe Val Asn Arg Glu Thr Phe Gly Thr Arg Gly
20 25 30
Met Arg Leu Phe Gly Ser Pro Ser Thr Asn Lys Arg Gln Asn Val Asn
35 40 45
Ile Ile Asp Asp Gly Val Gln Val Tyr Gly Ser Ala Ala Ile Ala Lys
50 55 60
Arg His Asp Asn Asn Thr Leu Glu Ser Val Asp Gly Ile Ile Ile Arg
65 70 75 80
Ile Ser Gly Cys Ile Asn Lys Ser Arg Thr Leu Ser Tyr Gly Phe Ser
85 90 95
Pro Glu Val Cys Asp Ser Phe Leu Ser Gly Phe Pro Cys Ser Trp Glu
100 105 110
Asp Tyr
<210> 7
<211> 114
<212> PRT
<213> Helianthus annuus
<400> 7
Val Phe Leu His Gly Trp Trp Leu Ile Lys Leu Glu Ser Gln Ser Lys
1 5 10 15
Leu Gly Val Gly Gly Phe Leu Asn Arg Glu Thr Phe Glu Thr Arg Arg
20 25 30
Met Arg Leu Phe Gly Ser Pro Ser Thr Gly Lys Arg Pro Asn Ile Asn
35 40 45
Thr Ile Asp Asp Gly Val Gln Val Tyr Gly Ser Ala Ala Ile Val Lys
50 55 60
Arg His Asp Asn Tyr Thr Leu Glu Ala Glu Asp Gly Ile Ile Ile Ser
65 70 75 80
Ile Ser Gly Tyr Ile Ile Lys Ser Arg Thr Leu Ser Tyr Gly Phe Ser
85 90 95
Ser Glu Val Cys Asp Ser Phe Leu Ser Gly Phe Pro Cys Ser Trp Glu
100 105 110
Asp Tyr
<210> 8
<211> 104
<212> PRT
<213> Sorghum bicolor
<400> 8
Ile Leu Val Asp Trp Trp Leu Glu Arg Val Glu Gly Glu Glu Gly Lys
1 5 10 15
Ile Arg Val Ala Gly Thr Thr Phe Thr Pro Arg Met Ala Glu Gln Met
20 25 30
Arg Lys Gly Ala Ser Ser Ser Asn Met Arg Met Ala Val Arg Val Phe
35 40 45
Arg Ser Ser Ala Ile Val Lys Arg His Asp Tyr Thr Ser Ile Glu Ser
50 55 60
Glu Asp Gly Tyr Gln Ile Glu Ile Gly His Cys Leu Asn Ile Pro Lys
65 70 75 80
Thr Arg Glu Asn Gly Phe Ser Glu Glu Val Cys Glu Ser Phe Asp Phe
85 90 95
Gly Phe Pro Asp Leu Trp Gln Arg
100
<210> 9
<211> 89
<212> PRT
<213> Sorghum bicolor
<400> 9
Val Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln
1 5 10 15
Lys Ile Ala Val Ala Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu
20 25 30
Tyr Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu
35 40 45
Thr Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu
50 55 60
Arg Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu
65 70 75 80
Asn Gly Phe Pro Asp Trp Trp Gln Ser
85
<210> 10
<211> 89
<212> PRT
<213> Sorghum bicolor
<400> 10
Val Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln
1 5 10 15
Lys Ile Ala Val Ala Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu
20 25 30
Tyr Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu
35 40 45
Thr Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu
50 55 60
Arg Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu
65 70 75 80
Asn Gly Phe Pro Asp Trp Trp Gln Ser
85
<210> 11
<211> 86
<212> PRT
<213> Triticum aestivum
<400> 11
Val Thr Leu Trp Glu Trp Cys Pro Val Met Val Glu Gly Glu Glu Arg
1 5 10 15
Lys Leu Ala Val Ser Gly Phe Thr Glu Arg Asn Asp Ala Phe Thr Ser
20 25 30
Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu Gln Asp Glu Gly
35 40 45
Gly Val Val Val Leu Leu His Gly Ser Ile Asn Leu Leu Arg Met Arg
50 55 60
Glu Asn Gly Phe Ser Val Gln Ile Cys Glu Gln Phe Met Ile Gly Phe
65 70 75 80
Pro Ser Trp Trp Glu Thr
85
<210> 12
<211> 91
<212> PRT
<213> Triticum aestivum
<400> 12
Val Ala Leu Leu Asp Trp Trp Leu Val Arg Gly Gln Gly Gly Lys Ile
1 5 10 15
Arg Val Ala Gly Tyr Ile Asp Asn Val Glu Lys Asn Arg Ala Gly Arg
20 25 30
Val Ile Ser Ser Gly Ser Ile Thr Val Arg His Ala Asp Gly Thr Leu
35 40 45
Glu Thr Ala Asp Asn Lys Ile Val Leu Thr Arg Gly Pro Leu Asn Ile
50 55 60
Glu Gln Met His Cys Asn Gly Phe Ser Arg Glu Val Ser Glu Gln Phe
65 70 75 80
Arg Leu Gly Phe Pro Ile Gln Trp Glu Lys Tyr
85 90
<210> 13
<211> 86
<212> PRT
<213> Triticum aestivum
<400> 13
Val Thr Leu Cys Glu Trp Trp Pro Val Arg Val Glu Gly Glu Glu Arg
1 5 10 15
Lys Leu Ala Val Ser Gly Phe Thr Glu Arg Asn Asp Ala Phe Thr Ser
20 25 30
Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu Gln Asp Glu Gly
35 40 45
Gly Val Val Val Leu Leu His Gly Ser Ile Asn Leu Leu Arg Met Arg
50 55 60
Glu Asn Gly Phe Ser Val Gln Ile Cys Glu Gln Phe Met Ile Gly Phe
65 70 75 80
Pro Phe Trp Trp Glu Thr
85
<210> 14
<211> 86
<212> PRT
<213> Hordeum vulgare
<400> 14
Val Thr Leu Trp Glu Trp Trp Thr Val Arg Leu Lys Gly Glu Asp Arg
1 5 10 15
Lys Leu Ala Val Ser Ser Phe Thr Glu Lys Asn Asp Leu Phe Thr Ser
20 25 30
Ala Pro Ile Ala Gln Arg Tyr Glu Ser Leu Thr Leu Gln Tyr Glu Asp
35 40 45
Gly Val Val Val Leu Leu Tyr Gly Ser Phe Asn Ser Ser Arg Met Arg
50 55 60
Glu Asn Gly Phe Ser Met Gln Ile Cys Glu Arg Phe Met Ile Gly Phe
65 70 75 80
Pro Tyr Trp Trp Glu Thr
85
<210> 15
<211> 93
<212> PRT
<213> Glycine max
<400> 15
Val Thr Leu Tyr Asp Trp Trp Leu Val Ile Ala Lys Asn Asp Phe Gln
1 5 10 15
Gly Lys Arg Leu Ala Val Ala Gly Val Ser Ser Arg Lys Asp Glu Ala
20 25 30
Thr Arg Val Phe Val Ser Ala Ala Val Ile Lys Arg Tyr Asp Val Phe
35 40 45
Ser Leu Glu Thr Ala Asp Gly Ile Cys Val Ile Ile Arg Gly Phe Ile
50 55 60
Asn Glu Gln Arg Thr Leu Glu Asn Gly Phe Ser Ala Glu Val Phe His
65 70 75 80
His Phe Leu Phe Gly Phe Pro Pro Asp Trp Glu Arg Tyr
85 90
<210> 16
<211> 89
<212> PRT
<213> Artificial Sequence
<220>
<223> consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (14)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (24)..(25)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (27)..(29)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (34)..(34)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (39)..(39)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (44)..(45)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (53)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (56)..(56)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (58)..(58)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (60)..(60)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (63)..(64)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (67)..(68)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (73)..(73)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (77)..(78)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (80)..(81)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (85)..(86)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (89)..(89)
<223> Xaa can be any naturally occurring amino acid
<400> 16
Val Thr Leu Xaa Asp Trp Trp Leu Xaa Xaa Xaa Glu Gly Xaa Xaa Xaa
1 5 10 15
Lys Leu Xaa Val Ala Gly Phe Xaa Xaa Arg Xaa Xaa Xaa Val Arg Val
20 25 30
Phe Xaa Ser Ala Pro Ile Xaa Lys Arg His Asp Xaa Xaa Thr Leu Glu
35 40 45
Thr Glu Asp Gly Xaa Xaa Val Xaa Leu Xaa Gly Xaa Ile Asn Xaa Xaa
50 55 60
Arg Thr Xaa Xaa Asn Gly Phe Ser Xaa Glu Val Cys Xaa Xaa Phe Xaa
65 70 75 80
Xaa Gly Phe Pro Xaa Xaa Trp Glu Xaa
85
<210> 17
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 1 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(10)
<223> Xaa can be any naturally occurring amino acid
<400> 17
Val Thr Leu Xaa Asp Trp Trp Leu Xaa Xaa
1 5 10
<210> 18
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 2 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(9)
<223> Xaa can be any naturally occurring amino acid
<400> 18
Lys Leu Xaa Val Ala Gly Phe Xaa Xaa Arg
1 5 10
<210> 19
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 3 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid
<400> 19
Ser Ala Pro Ile Xaa Lys Arg His Asp Xaa
1 5 10
<210> 20
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 4 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(10)
<223> Xaa can be any naturally occurring amino acid
<400> 20
Xaa Thr Leu Glu Thr Glu Asp Gly Xaa Xaa
1 5 10
<210> 21
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 5 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (9)..(10)
<223> Xaa can be any naturally occurring amino acid
<400> 21
Asn Gly Phe Ser Xaa Glu Val Cys Xaa Xaa
1 5 10
<210> 22
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 6 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (7)..(8)
<223> Xaa can be any naturally occurring amino acid
<400> 22
Phe Xaa Xaa Gly Phe Pro Xaa Xaa Trp Glu
1 5 10
<210> 23
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> motif 7 of consensus sequence of SANTA domain of KNL2 in plants
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (10)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (19)..(20)
<223> Xaa can be any naturally occurring amino acid
<400> 23
Ser Ala Pro Ile Xaa Lys Arg His Asp Xaa Xaa Thr Leu Glu Thr Glu
1 5 10 15
Asp Gly Xaa Xaa
20
<210> 24
<211> 426
<212> PRT
<213> Brassica napus
<400> 24
Met Ala Asp Asn Pro Asn Pro Asn Pro Asp Glu Glu Asp Val Ser Tyr
1 5 10 15
Tyr Glu Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro
20 25 30
Ile Glu Phe Gln Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala
35 40 45
Glu Thr Gly Ala Val Arg Val Phe Thr Ser Ser Pro Ile Leu Lys Ala
50 55 60
Phe Asp Val Phe Thr Leu Glu Ala Ser Asp Gly Val Cys Ile Val Leu
65 70 75 80
Arg Gly Phe Leu Asn Lys Pro Arg Leu Val His Ser Gly Phe Leu Pro
85 90 95
Gln Ile Cys Ser Glu Phe Ile Leu Gly Phe Pro Pro Tyr Trp Glu Ser
100 105 110
Lys Cys Asn Leu Ser Phe Val Gly Leu Pro Ser Gly Ser Ala Ser Ile
115 120 125
Asn Lys Ala Ser Gly Thr Ile Leu Ser Pro Cys Asn Asn Asp Lys Lys
130 135 140
Arg Asn Leu Glu Asp Thr Pro Ala Arg Arg Arg Val Val Lys Thr Ile
145 150 155 160
Val Thr Ala Lys Lys Lys Lys Gln Asn Thr Val Glu Ile Ser Asp Arg
165 170 175
Pro Ser Arg Lys Lys Ser Leu Arg Leu Gln Ser Lys Ser Val Glu Leu
180 185 190
Met Ser Lys Leu Gln Thr Thr Ser Ser Thr Asn Asp Gly Leu Asp Lys
195 200 205
Ser Ala Lys Cys Ser Asp Asp Val Glu Lys Thr Asp Glu Ser Glu Val
210 215 220
Thr Asn Asn Gln Val Asp Gly Cys Gly Lys Lys Arg Val Asn His Gln
225 230 235 240
Ser Gly Thr Lys Val Lys Arg Lys Leu Asp Val Ser Glu Leu Gln Lys
245 250 255
Asn Pro Thr Thr Asn Asp Glu Ser Met Asp Asn Glu Glu Ile Ser Pro
260 265 270
Ser Pro Val Asp Gly Cys Gly Thr Asn Ser Lys Lys Ile Thr Ser Lys
275 280 285
Asn Ala Thr Leu Thr Ser Glu Glu Arg Asn Gly Lys Leu Lys Val Thr
290 295 300
Lys Thr Ser Leu Lys Asn Gly Lys Lys Ser Glu Lys Ile Leu Glu Gly
305 310 315 320
Asp Leu Asp Asp Val Val Val Glu Pro Met Thr Thr Thr His Ser Arg
325 330 335
Ser Ser Lys Val Lys His Asn Leu Ser Val Gly Lys Thr Ile Arg Lys
340 345 350
Ile Asp Phe Asp Leu Glu Val Thr Pro Glu Lys Asp Ala Thr Lys His
355 360 365
Asn Lys Thr Asn Ser Met Ser Ala Asp Ser Leu Gly Gln Lys Arg Val
370 375 380
Leu Val Ser Pro Leu Glu Tyr Trp Arg Asn Gln Leu Pro Val Tyr Asp
385 390 395 400
Lys Asp Arg Asn Leu Ile Gln Val Asn Glu Gly Arg Gln Thr Asn Ser
405 410 415
Thr Ser Ser Lys Gly Leu Phe Phe Phe Ser
420 425
<210> 25
<211> 434
<212> PRT
<213> Brassica napus
<400> 25
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu
20 25 30
Phe Asp Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr
35 40 45
Gly Ala Val Arg Val Phe Ala Ser Ser Pro Ile Val Lys Ala Phe Asp
50 55 60
Val Phe Thr Leu Glu Ala Ser Asp Gly Val Cys Ile Val Leu Arg Gly
65 70 75 80
Phe Leu Asn Lys Gln Arg Leu Val Leu Ser Gly Phe Leu Pro Gln Ile
85 90 95
Cys Ser Glu Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu Ser Lys Cys
100 105 110
Asn Leu Ser Phe Val Gly Leu Pro Ser Gly Ser Ala Ser Ile Asn Lys
115 120 125
Ala Ser Gly Ala Ile Leu Ser Pro Cys Asn Asn Asp Lys Lys Arg Asn
130 135 140
Leu Glu Asp Thr Lys Ser Thr Val Thr Ala Lys Lys Lys Lys Lys Asn
145 150 155 160
Thr Val Glu Ile Ser Asp Lys Pro Ser Arg Lys Lys Ser Ile Arg Leu
165 170 175
Gln Ser Lys Ser Val Glu Leu Met Ser Lys Val Gln Thr Thr Ser Ser
180 185 190
Thr Asn Asp Val Ser Asp Gly Leu Asp Lys Arg Gly Lys Ser Ser Asp
195 200 205
Asp Val Glu Lys Thr Asp Glu Cys Glu Val Ile Asn Asn Gln Val Asp
210 215 220
Gly Asn Val Val Glu Leu Val Asn His Gln Ser Gly Thr Lys Val Lys
225 230 235 240
Arg Lys Leu Asp Val Ser Gln Val Gln Lys Asn Pro Thr Thr Asn Asp
245 250 255
Gly Val Glu Arg Asp Glu Ser Met Val Asn Glu Glu Ile Ser Pro Ser
260 265 270
Pro Val Asp Gly Cys Gly Thr Asn Ser Lys Lys Ile Thr Ser Lys Asn
275 280 285
Ala Thr Leu Thr Ser Glu Glu Arg Asn Gly Lys Leu Lys Val Thr Lys
290 295 300
Thr Ser Leu Lys Asn Gly Lys Lys Ser Glu Lys Ile Leu Glu Gly Asp
305 310 315 320
Leu Asp Asp Val Val Val Glu Pro Met Met Thr Thr His Ser Arg Ser
325 330 335
Ser Lys Val Ile His Asn Leu Ser Val Gly Lys Thr Ile Arg Lys Ile
340 345 350
Asp Phe Asp Ala Glu Val Thr Pro Glu Lys Asp Ala Thr Lys Gln Lys
355 360 365
Thr Asn Ser Met Ser Ala Asp Ser Leu Gly Gln Lys Arg Ser Arg Ser
370 375 380
Gly Arg Val Leu Val Ser Pro Leu Glu Tyr Trp Arg Asn Gln Leu Pro
385 390 395 400
Val Tyr Asp Lys Asp Arg Asn Leu Ile Gln Val Asn Glu Gly His Gln
405 410 415
Thr Asn Ser Thr Ser Ser Lys Gly Lys Gly Ser Val Ser Arg Lys Pro
420 425 430
Arg Arg
<210> 26
<211> 513
<212> PRT
<213> Sorghum bicolor
<400> 26
Met Lys Pro Leu Pro Val Pro Glu Ala Gly Ser Pro His Arg Arg Gly
1 5 10 15
Met Pro Pro Ser Leu Leu Ser Pro Ser Ser Arg Ser Ala Val Pro Ala
20 25 30
Ala Ala Asp Gly Asp His Asp Ala Ala Val Ser Glu His Ala Cys Val
35 40 45
Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln Lys
50 55 60
Ile Ala Val Ala Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu Tyr
65 70 75 80
Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr
85 90 95
Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu Arg
100 105 110
Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu Asn
115 120 125
Gly Phe Pro Asp Trp Trp Gln Ser Cys Lys Pro Cys Asn Pro Lys Leu
130 135 140
Met Asn Ser His Thr Glu Cys Cys Ser Ser Asn Ala Ser Asn Ser Gly
145 150 155 160
Val Asp Ser Thr Gln Phe Tyr Leu Glu Arg Tyr Met Gln Gly Arg Arg
165 170 175
Leu Asp Ser Tyr Gly Thr Tyr Leu Ile Ser Lys Phe Pro Asp Ile Leu
180 185 190
Ala Ser Phe Leu His Asn Asp Ala Val Phe Gln Lys Ser Ser His Leu
195 200 205
Leu Asn Gly Lys Pro Arg Phe Glu Glu Tyr Thr Cys Asp Gly Asp Ile
210 215 220
Thr Thr Asn Glu Asn Ala Ala Ala Ser Ser Glu Ala Ala Thr Gly Asp
225 230 235 240
Gln Arg Ile Pro Glu Val Ser Leu Glu Val Arg Gly Cys Arg Lys Glu
245 250 255
Thr Gln His Met Ser Leu Thr Asp Lys Ala Ala Val Asp Glu Glu Met
260 265 270
Pro Ala Ser Val Tyr Leu Asp Met Gln Asn Ser Leu Cys Leu Ser Asn
275 280 285
Gly Thr Pro Ile Leu Glu Glu Tyr Thr Cys Asp Gly Tyr Ile Pro Pro
290 295 300
Asn Glu Asp Ala Ala Ala Ser Asn Asp Asp Asn Glu Arg Tyr Ile Ala
305 310 315 320
Thr Ser Lys Glu Val Asn Asn Met Glu Lys Ile Val Leu Val Thr Gly
325 330 335
Ser Pro Ser Arg Glu Arg Gly His Asp Asp Ile Ala Thr Asp Val Ala
340 345 350
Val Ser Glu Leu Val His Ser Thr Pro Ala Thr Gly Thr Tyr Arg Lys
355 360 365
Lys Thr Pro Val Ala Ser Leu Lys Ser Gln Gly Ser Trp Lys Glu Asn
370 375 380
Gln Pro Val Ala Ser Asn Lys Lys Met Lys Leu Ile Asp Pro Cys Leu
385 390 395 400
Gly Lys Gln His Val Gly Arg Pro Lys Lys Arg Ile Ser Pro His Ala
405 410 415
Lys Cys Gln Ser Ala Thr Arg Ser Pro Gly Thr Arg Asn Pro Ala Ser
420 425 430
Tyr Val Leu Trp Ser Pro Leu Thr Arg Asp Lys Ala Thr Ser Leu Ser
435 440 445
Met Ser Thr Pro Glu Asp Leu Glu Leu Lys Arg Ser Arg Ser Gly Arg
450 455 460
Val Ile Val Pro Lys Leu Asp Asn Trp Cys Gln Thr Ile Val Tyr Gly
465 470 475 480
Arg Asp Gly Leu Ile Ala Ala Val Ile Gly Leu Asp Ser Pro Ala Leu
485 490 495
Pro Lys Trp Ser Glu Ser Lys Thr Asp Arg Arg Lys Lys Arg Lys Thr
500 505 510
Lys
<210> 27
<211> 420
<212> PRT
<213> Helianthus annuus
<400> 27
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 28
<211> 2264
<212> DNA
<213> Brassica napus
<400> 28
cgtggaattc ttaccactaa actacagcca cttcattggt tcaaccctca aaactatatt 60
gcttaattaa aaatgcttcc cgcgcagtaa tgaagaaatc tcgcgccgaa gtcttctttt 120
tcattcccac tgttctaaag ccctaactct tcctcaatca atcgagaaag tattatctct 180
ctgctcctcc tcctccatcc atggctgaca atcctaatcc caatccagac gaggaagatg 240
tgtcgtatta cgagaaaacg gtgagtgagg ctattttctt aaaaacactt gctcggctct 300
cctgattcct ttaaactttg aatgtaaaaa aaaaggtggt cctgagagac tggtggctga 360
tcaaatgtcc aattgaattc caaggcaaac gatttggcgt tgctggtacc cagattgctg 420
agtaagttag gagtaaggag taaggaggag gagtcaaacc ctttttctat ttctgcttta 480
cttttaaagt attcttattg atgtttggga attgggaaca ggacaggagc agtgagggtg 540
tttacatcat ccccaatcct caaagccttt gatgttttca cactcgaagc ttctgacgga 600
gtctgcatcg tcctacgtgg ctttctcaac aaaccacgcc ttgttcactc tggattcctc 660
cctcaggtaa ttttatatac taattgaaag ctattgttaa tatgcctatt aatatgcctt 720
ttgtttgtct gtagatttgc agtgagttca tcttggggtt tcctccttac tgggaatcaa 780
aatgtaacct ttccttcgta ggactgcctt ctggatcagc ttctatcaat aaaggtttga 840
tcttttttgt agcaacatat ctgttttatg ttttctgttc ttataatgct tatgattaag 900
ctcttactgc agcttctggt accattttat caccttgtaa caacgacaag aaacggaatc 960
tagaggatac tccagctcgg agaagagtag ttaaaaccat tgtcactgct aagaagaaga 1020
agcagaacac tgtggagatt agtgatagac cttcaaggaa aaagtctctt cgtctgcagt 1080
ccaaatctgt tgaattgatg agtaaactcc agactacttc ttctactaat gatggtttgg 1140
acaagagtgc taagtgcagt gatgatgtag agaaaacaga tgaatctgag gttaccaata 1200
accaagttga tggatgtggt aagaagcgtg tgaatcatca gtctgggacc aaagtcaaaa 1260
ggaaacttga tgttagcgaa ctccagaaga atcctactac taatgatgaa tctatggata 1320
atgaagagat atcaccttca ccagtggatg ggtgtggtac taatagcaaa aagataacaa 1380
gtaagaatgc tacactgact tcagaagagc gaaatggtaa gctcaaggta actaaaacat 1440
ctctaaagaa tgggaagaaa agtgagaaga tccttgaagg tgatttggat gatgtagtag 1500
tagagcctat gacgacgact cattcaaggt cctccaaggt taaacacaac ttatcagttg 1560
ggaaaactat caggaagatc gactttgatc tggaggtaac taactttttt ttgtcacaat 1620
ctcatattct tgttatcaaa atattcatca taatgatacc cccgttgtta tgtaatgcga 1680
aggtaacacc agagaaagat gcgacgaaac ataacaagac caattcaatg tctgctgatt 1740
cattaggaca gaaacggtct agatcaggtt aattgataaa gagtaacttt cagagtctca 1800
gttgagagag cattcactaa agaaagaaag tttccatttc aattaattgc aggaagggtg 1860
ctagtgtccc cactagagta ctggcgcaac caacttcctg tttatgataa ggtttgtgat 1920
tatgtttact gtattaacac taaccatgag aacatgatct taactgtttc tgttctggtt 1980
ttgtaggatc ggaatcttat ccaagtaaac gaaggtcgtc agactaactc cacttcgtct 2040
aaaggtttgt tcttcttttc ttaaaagaat aaaagagggc ttccactata attatacaaa 2100
ctgctcttct tgatagggaa aggagatccg tttctcgaaa gccaagaaga tgaataatca 2160
agtaaacagc tttcaactac tttggtaatt agtgttatgg tctctgaaca tgtaatcatc 2220
ttgagcttat tgttggatcg tttaactctt aggatttgga gcta 2264
<210> 29
<211> 2350
<212> DNA
<213> Brassica napus
<400> 29
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 30
<211> 4846
<212> DNA
<213> Sorghum bicolor
<400> 30
ccactataat aatttattct cttaaaatta tctgttaaat atttaacagt attttttttc 60
ttttgctacc atgagctttt cagccacgcg ctgaacagtg ccgctacggc gctactacgt 120
ggagaggaaa cgaaaaaaga aagagagaaa aaaaaaagac cccgctccat tccgctactg 180
gcctactgcc gtgtttggaa atgaagcccc tacccgtacc cgaggcgggg agccctcacc 240
gccgcggcat gccaccgtcg ctgctcagcc cttcctcccg cagcgcggtt cccgccgccg 300
ccgacggcga ccatgacgcc gccgtctccg agcacgcctg cgtacgtacg cccgtcgccc 360
gccctaatgc tgctagggcg cgtgtcgatt cttttccttt ttctttcccc cgcccctctt 420
ccgtttcccc tttactggct gagacgcgtg tgccctgacg cgatttggtg ctgcgcgcgc 480
gcgcgcgtgc gtgcgtggtg gcctgcattt cgggtgtcta ggtcacgctg tccgagtggt 540
ggctggcaac cgcggaaggg gacgaccaga agatcgctgt cgccggcaca ttcgaacggt 600
aagcatttct tcggagggga aggggaaact agacgagcca tctctgaagg tccgggcttg 660
agtgggtggc aactagtttc gtttgttttt ctgggggttc gatcttgttg ttgaggagtg 720
gcatttggag tcctccgggg ggtatgcttc aaatttgtta ttgcaaattg atacctagat 780
tgactgattt tgagttgacg ccatgcactc ctaaagaata ggccaattta attttctcag 840
actattcttt tgtcaaattg attcaacaaa ccaatgttta tgccttttgt cctatgattc 900
attcttgaca tatgagggct attaatgcct tgactgaagc atggtgaaac ttctataagt 960
catgctgctt gtgtgtttaa gcatgattac cgttttctga agtaggctgc ttttcctctt 1020
gaaagagcta cggagtcttt cgctgataac aataattatc tattgcctgc tctgacagca 1080
atcaaacagt tcaggaatac tctcctgcac ctattgccaa gcgtcatacg tcttctgttc 1140
ttgagactga ggaaggaact gtacttcgcc tccatggttt acacaatgtt ttgcgaacct 1200
atcacaatgg atattcagct aaggtatgca catcctgttt tctgtttctt gtttccggca 1260
ccaattgaat gcctatttgg acaacttttt aagtgaatac agtatcaaga gcagatgata 1320
tcttttgttt tctctatcca tccagtgatt ctatttctgt gttcctctgg ctgaaagtta 1380
ttctcgattc gagcaatatc taccatctag aaaatatcat gtaccaaaaa aatgttttgc 1440
caaaatgcat gtccaaaagg attattcagc catgcacagc tctcacaaat gccttggtct 1500
tgactgcaaa ccatgcatgc aggtctacag tgagttcctg aatgggtttc ccgactggtg 1560
gcaaagttgc aagccgtgta atcccaagct gatgaactcg cacacagaat gttgttcttc 1620
taatgccagc aattctggag tggactccac tcaattttac ctggagagat atatgcaggg 1680
gagacgtttg gattcatatg gaacatattt gattagcaaa tttcctgaca ttttggcaag 1740
tttcttacac aatgatgctg tgttccaaaa atcatcacat ttattaaatg gaaagcccag 1800
atttgaagaa tatacttgtg atggtgatat cacgacaaat gaaaatgctg ctgcctcaag 1860
tgaagctgcc acaggtaagt gtaaaggaga ttatttagag gcttctattt ccttctctcc 1920
tacaaatatt tcatttcagt gatgtttctt atagagtgtt tgtgttacct taatttaggc 1980
gatcagagaa ttccagaagt ttcattggag gttcgtgggt gccgtaaaga gactcagcac 2040
atgtcattga ctgataaggc agcagtagat gaagaaatgc cagcttcagt ttatttggat 2100
atgcaaaact ctttgtgtct gtcaaatgga acaccaatat tggaggaata cacctgtgat 2160
ggttatattc caccaaatga agatgctgct gcttcaaatg atgacaatga aagatacata 2220
gctacatcaa aagaggtgaa taacatggaa aaaatagtct tggttacggg cagcccttca 2280
agagaaagag gccatgatga cattgctact gatgttgcag tcagtgaatt ggtacacagt 2340
actccagcaa caggcacatg taattatgtt agaacagata tttaatcctg caaatacatt 2400
attttgttgg tgtttctaat agtatttttt aaaataattt agatcgtaaa aagactcctg 2460
tggcttcttt gaagagtcaa ggttcctgga aggaaaatca gcccgtagct tcaaataaga 2520
aggtattgga tcaattaatg taaacatcag cttattcagg tgtgcaagtc ttgattgtgg 2580
tccacaggag cttaagcttg ttagctaata ggcatcgtgc agtattttat gttgttatta 2640
gtgactttgc tgtttactca tgatgacatg ttcatattta gcgtatttca gcctattgtc 2700
ctatttgtgt tactcattta tgtatatgca tatagatgaa gttgattgat ccgtgtcttg 2760
gaaagcagca tgtaggccgg ccaaagaagc gaatatctcc acatgcaaag tgtcaaagtg 2820
ctacaagatc tccagggacc aggaacccag cgtcatatgt aagtgcactt ttttatctgt 2880
tgtcataaac tttagaaagt ccatgattgc aagcagtagt gttttaactt gatgatggga 2940
tatagatcta taacaatctc atttggtttg tggaattgga ctgtatgaat tgtattgggg 3000
atccaatttg attccatgtg gagtcagaaa tgggttccaa tataattatt ttgtttgcat 3060
aggtaaggaa ctgtggaaaa caaaatttga ccaaataaat tctagctggt aatatgttac 3120
ttgctccgag aaatccaatt gcacagagaa cacaactcgt tgctttgctg ctagaccttt 3180
gacatgagaa gccctatcac agattcacag ccatgtcatg agcagtagca cacaagcaca 3240
ggagggtgga gccatacact cttttcccca cgtgctcagc catactaact attggcctgt 3300
gttggctcac ttgtcagcga tgacctggcc tcattccact atctccattg tctaccagac 3360
agatttgttt gcctagcctg ttgccggatc catgtcctat tcagctaacc agatggggcc 3420
taagtatttt gcatttttgc ttgagatcga gctattgcaa aagtgatcat gcttcaagta 3480
cagattctga tgtttttgga acaatttatc ttgacccagt agcatgagac tgatattttt 3540
tatatgtatt tattgcaatg ttcctgaatc acattaggtc ctttggtctc cgcttactcg 3600
tgataaggcc acatcgttgt ctatgtccac acctgaagat ctcgaactta aaagatccag 3660
atcaggcatg tctttgtttt tttttttttg gcaacaatct ttggttgttt tgactctgct 3720
gcttcattcc aaatactcat cgtactaaag aaatggaaat tttatttcag gtcgcgtgat 3780
tgtgcccaaa ttggataatt ggtgccaaac cattgtctat ggaagggttt gtttgttttc 3840
tctatttgtt atgttgttca atcttagcta ctttgtgtta taagaacaca tatactatgc 3900
tatgcttata tcttaactga aagggtaata aaggattaaa ggtatagtta atacatggta 3960
tcttaaattt agcaaatgaa cattccattg cactaagaga caatgtgaaa tactgtgatt 4020
tgctaaatgc cactgaattt gtgcacattt ctagatccct taattcagta tgtgatagag 4080
gtaattatat gactaacata aatttatcac agcggcaaga atgaaatatg ataattcact 4140
tctatacagt gcagtttgtg aagtagaagt ataaaccaag tgtcaaagtt ggttagtcaa 4200
gatgcctgtt ctattatatg catttcaaag ttttgttagc ctccagcgat gtattactgt 4260
catggtattt tttattttgc aatgggagac aatcccgaag aaagttcaga taaatggtga 4320
attatcatga cattctgatt ttgagcaatg tttttgtttc caaggcattt cctgtgctta 4380
gatctcatga agtgccttgt tcttgcagga tggtttgatc gcagctgtca ttggtctaga 4440
ttcgccagca ctgcccaaat gtttgtttgg aatctctcat ttgtccattc tgttgtcctt 4500
aagagcatgc tttccatgtt ttgagagaat tgcttaaaga aagtcaggtg atgccctatc 4560
tagtttcatg tcatgcaact tgtgtccttt gctctgcagg gagtgaatca aaaactgatc 4620
gaaggaagaa acgaaagact aaatgagcat cttccaggcg taattgctac ttggctactc 4680
caggcgaaga aaattggaac taacttaatg tgattactcc aggccaagaa aaccagaact 4740
aacttaatgt ggcgggttgg tcgcttttaa tagattttca gtagaggagc ctctcctgtt 4800
ctctctaaaa atatgtgtgt gtgtgtgtgt gggggggggg gggggg 4846
<210> 31
<211> 5678
<212> DNA
<213> Helianthus annuus
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 31
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 32
<211> 35
<212> PRT
<213> Arabidopsis thaliana
<400> 32
Gln Lys Arg Ser Arg Ser Gly Arg Val Leu Val Ser Ser Leu Glu Phe
1 5 10 15
Trp Arg Asn Gln Ile Pro Val Tyr Asp Met Asp Arg Asn Leu Ile Gln
20 25 30
Val Lys Asp
35
<210> 33
<211> 35
<212> PRT
<213> Brassica napus
<400> 33
Gln Lys Arg Ser Arg Ser Gly Arg Val Leu Val Ser Pro Leu Glu Tyr
1 5 10 15
Trp Arg Asn Gln Leu Pro Val Tyr Asp Lys Asp Arg Asn Leu Ile Gln
20 25 30
Val Asn Glu
35
<210> 34
<211> 35
<212> PRT
<213> Helianthus annuus
<400> 34
Gly Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe
1 5 10 15
Trp Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly
20 25 30
Val Gln Gly
35
<210> 35
<211> 34
<212> PRT
<213> Sorghum bicolor
<400> 35
Leu Lys Arg Ser Arg Ser Gly Arg Val Ile Val Pro Lys Leu Asp Asn
1 5 10 15
Trp Cys Gln Thr Ile Val Tyr Gly Arg Asp Gly Leu Ile Ala Ala Val
20 25 30
Ile Gly
<210> 36
<211> 34
<212> PRT
<213> Sorghum bicolor
<400> 36
Leu Lys Arg Ser Arg Ser Gly Arg Val Ile Val Pro Lys Leu Asp Asn
1 5 10 15
Trp Cys Gln Thr Ile Val Tyr Gly Arg Asp Gly Leu Ile Ala Ala Val
20 25 30
Ile Gly
<210> 37
<211> 34
<212> PRT
<213> Triticum aestivum
<400> 37
Met Arg Arg Thr Lys Ser Gly Arg Val Val Val Pro Leu Leu Asp Pro
1 5 10 15
Gly Ser Ser Arg Ile Val Tyr Asp Asn Asn Gly Leu Ile Ser Gly Val
20 25 30
Ala Pro
<210> 38
<211> 34
<212> PRT
<213> Triticum aestivum
<400> 38
Met Arg Arg Thr Lys Ser Gly Arg Val Val Val Pro Gln Leu Asp Pro
1 5 10 15
Gly Ser Ser Arg Ile Val Tyr Asp Asn Asn Gly Leu Ile Ser Gly Val
20 25 30
Ala Pro
<210> 39
<211> 30
<212> PRT
<213> Hordeum vulgare
<400> 39
Met Arg Arg Thr Arg Ser Gly Arg Val Ile Val Pro Gln Leu Asp Ser
1 5 10 15
Val Arg Ser Trp Val Val Tyr Asp Arg Ser Lys Ile Lys Leu
20 25 30
<210> 40
<211> 35
<212> PRT
<213> Glycine max
<400> 40
Phe Arg Lys Ser Arg Ser Gly Arg Leu Leu Leu Pro Pro Leu Glu Phe
1 5 10 15
Trp Arg Asn Gln Ile Pro Ile Tyr Asn Ala Asp His Glu Ile Thr Glu
20 25 30
Ile Arg Asp
35
<210> 41
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> consensus sequence of CENPCk domain of KNL2 in plants
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (18)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (26)..(26)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (28)..(32)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (34)..(35)
<223> Xaa can be any naturally occurring amino acid
<400> 41
Xaa Lys Arg Ser Arg Ser Gly Arg Val Xaa Val Pro Xaa Leu Asp Xaa
1 5 10 15
Trp Xaa Xaa Xaa Xaa Xaa Val Tyr Asp Xaa Asp Xaa Xaa Xaa Xaa Xaa
20 25 30
Val Xaa Xaa
35
<210> 42
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> motif of consensus sequence of CENPCk domain of KNL2 in plants
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa can be any naturally occurring amino acid
<400> 42
Lys Arg Ser Arg Ser Gly Arg Val Xaa Val Pro Xaa Leu Asp Xaa Trp
1 5 10 15
<210> 43
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 43
Val Val Leu Arg Asp Trp Trp Leu Ile Lys
1 5 10
<210> 44
<211> 10
<212> PRT
<213> Brassica napus
<400> 44
Val Val Leu Arg Asp Trp Trp Leu Ile Lys
1 5 10
<210> 45
<211> 10
<212> PRT
<213> Brassica napus
<400> 45
Val Ser Leu Ser Asp Trp Trp Leu Thr Lys
1 5 10
<210> 46
<211> 10
<212> PRT
<213> Brassica napus
<400> 46
Val Val Leu Arg Asp Trp Trp Leu Ile Lys
1 5 10
<210> 47
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 47
Val Thr Leu Leu Asp Trp Trp Leu Thr Lys
1 5 10
<210> 48
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 48
Val Phe Leu His Gln Trp Trp Leu Ile Lys
1 5 10
<210> 49
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 49
Val Phe Leu His Gly Trp Trp Leu Ile Lys
1 5 10
<210> 50
<211> 9
<212> PRT
<213> Sorghum bicolor
<400> 50
Ile Leu Val Asp Trp Trp Leu Glu Arg
1 5
<210> 51
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 51
Val Thr Leu Ser Glu Trp Trp Leu Ala Thr
1 5 10
<210> 52
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 52
Val Thr Leu Ser Glu Trp Trp Leu Ala Thr
1 5 10
<210> 53
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 53
Val Thr Leu Trp Glu Trp Cys Pro Val Met
1 5 10
<210> 54
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 54
Val Ala Leu Leu Asp Trp Trp Leu Val Arg
1 5 10
<210> 55
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 55
Val Thr Leu Cys Glu Trp Trp Pro Val Arg
1 5 10
<210> 56
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 56
Val Thr Leu Trp Glu Trp Trp Thr Val Arg
1 5 10
<210> 57
<211> 10
<212> PRT
<213> Glycine max
<400> 57
Val Thr Leu Tyr Asp Trp Trp Leu Val Ile
1 5 10
<210> 58
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 58
Gln Phe Gly Val Ala Gly Phe Glu Glu Ser
1 5 10
<210> 59
<211> 10
<212> PRT
<213> Brassica napus
<400> 59
Arg Phe Gly Val Ala Gly Thr Gln Ile Ala
1 5 10
<210> 60
<211> 10
<212> PRT
<213> Brassica napus
<400> 60
Gly Leu Gly Val Ser Gly Phe Glu Ser Lys
1 5 10
<210> 61
<211> 10
<212> PRT
<213> Brassica napus
<400> 61
Arg Phe Gly Val Ala Gly Thr Gln Ile Ala
1 5 10
<210> 62
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 62
Thr Leu Gly Val Ala Gly Phe Thr Ser Gln
1 5 10
<210> 63
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 63
Lys Leu Gly Val Gly Gly Phe Val Asn Arg
1 5 10
<210> 64
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 64
Lys Leu Gly Val Gly Gly Phe Leu Asn Arg
1 5 10
<210> 65
<211> 6
<212> PRT
<213> Sorghum bicolor
<400> 65
Lys Ile Arg Val Ala Gly
1 5
<210> 66
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 66
Lys Ile Ala Val Ala Gly Thr Phe Glu Arg
1 5 10
<210> 67
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 67
Lys Ile Ala Val Ala Gly Thr Phe Glu Arg
1 5 10
<210> 68
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 68
Lys Leu Ala Val Ser Gly Phe Thr Glu Arg
1 5 10
<210> 69
<211> 9
<212> PRT
<213> Triticum aestivum
<400> 69
Lys Ile Arg Val Ala Gly Tyr Ile Asp
1 5
<210> 70
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 70
Lys Leu Ala Val Ser Gly Phe Thr Glu Arg
1 5 10
<210> 71
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 71
Lys Leu Ala Val Ser Ser Phe Thr Glu Lys
1 5 10
<210> 72
<211> 10
<212> PRT
<213> Glycine max
<400> 72
Arg Leu Ala Val Ala Gly Val Ser Ser Arg
1 5 10
<210> 73
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 73
Ser Ser Pro Ile Thr Lys Ala Leu Asp Val
1 5 10
<210> 74
<211> 10
<212> PRT
<213> Brassica napus
<400> 74
Ser Ser Pro Ile Val Lys Ala Phe Asp Val
1 5 10
<210> 75
<211> 10
<212> PRT
<213> Brassica napus
<400> 75
Ser Ala Ala Ile Ser Thr Arg His Asp Ser
1 5 10
<210> 76
<211> 10
<212> PRT
<213> Brassica napus
<400> 76
Ser Ser Pro Ile Leu Lys Ala Phe Asp Val
1 5 10
<210> 77
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 77
Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu
1 5 10
<210> 78
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 78
Ser Ala Ala Ile Ala Lys Arg His Asp Asn
1 5 10
<210> 79
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 79
Ser Ala Ala Ile Val Lys Arg His Asp Asn
1 5 10
<210> 80
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 80
Ser Ser Ala Ile Val Lys Arg His Asp Tyr
1 5 10
<210> 81
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 81
Pro Ala Pro Ile Ala Lys Arg His Thr Ser
1 5 10
<210> 82
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 82
Pro Ala Pro Ile Ala Lys Arg His Thr Ser
1 5 10
<210> 83
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 83
Ser Ala Pro Ile Ala His Arg Tyr Glu Pro
1 5 10
<210> 84
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 84
Ser Gly Ser Ile Thr Val Arg His Ala Asp
1 5 10
<210> 85
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 85
Ser Ala Pro Ile Ala His Arg Tyr Glu Pro
1 5 10
<210> 86
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 86
Ser Ala Pro Ile Ala Gln Arg Tyr Glu Ser
1 5 10
<210> 87
<211> 10
<212> PRT
<213> Glycine max
<400> 87
Ser Ala Ala Val Ile Lys Arg Tyr Asp Val
1 5 10
<210> 88
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 88
Phe Thr Leu Leu Ala Ser Asp Gly Ile Tyr
1 5 10
<210> 89
<211> 10
<212> PRT
<213> Brassica napus
<400> 89
Phe Thr Leu Glu Ala Ser Asp Gly Val Cys
1 5 10
<210> 90
<211> 10
<212> PRT
<213> Brassica napus
<400> 90
Thr Thr Leu Glu Thr Ser Asp Gly Leu Thr
1 5 10
<210> 91
<211> 10
<212> PRT
<213> Brassica napus
<400> 91
Phe Thr Leu Glu Ala Ser Asp Gly Val Cys
1 5 10
<210> 92
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 92
Phe Glu Leu Glu Thr Val Asp Gly Val Cys
1 5 10
<210> 93
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 93
Asn Thr Leu Glu Ser Val Asp Gly Ile Ile
1 5 10
<210> 94
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 94
Tyr Thr Leu Glu Ala Glu Asp Gly Ile Ile
1 5 10
<210> 95
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 95
Thr Ser Ile Glu Ser Glu Asp Gly Tyr Gln
1 5 10
<210> 96
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 96
Ser Val Leu Glu Thr Glu Glu Gly Thr Val
1 5 10
<210> 97
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 97
Ser Val Leu Glu Thr Glu Glu Gly Thr Val
1 5 10
<210> 98
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 98
Leu Thr Leu Gln Asp Glu Gly Gly Val Val
1 5 10
<210> 99
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 99
Gly Thr Leu Glu Thr Ala Asp Asn Lys Ile
1 5 10
<210> 100
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 100
Leu Thr Leu Gln Asp Glu Gly Gly Val Val
1 5 10
<210> 101
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 101
Leu Thr Leu Gln Tyr Glu Asp Gly Val Val
1 5 10
<210> 102
<211> 10
<212> PRT
<213> Glycine max
<400> 102
Phe Ser Leu Glu Thr Ala Asp Gly Ile Cys
1 5 10
<210> 103
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 103
Asn Gly Phe Asn Pro Glu Ile Ser Arg Glu
1 5 10
<210> 104
<211> 10
<212> PRT
<213> Brassica napus
<400> 104
Ser Gly Phe Leu Pro Gln Ile Cys Ser Glu
1 5 10
<210> 105
<211> 10
<212> PRT
<213> Brassica napus
<400> 105
Asn Gly Phe Ser Ser Glu Asp Cys Asn Arg
1 5 10
<210> 106
<211> 10
<212> PRT
<213> Brassica napus
<400> 106
Ser Gly Phe Leu Pro Gln Ile Cys Ser Glu
1 5 10
<210> 107
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 107
Asn Gly Phe Ser Pro Gln Val Phe Asp His
1 5 10
<210> 108
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 108
Tyr Gly Phe Ser Pro Glu Val Cys Asp Ser
1 5 10
<210> 109
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 109
Tyr Gly Phe Ser Ser Glu Val Cys Asp Ser
1 5 10
<210> 110
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 110
Asn Gly Phe Ser Glu Glu Val Cys Glu Ser
1 5 10
<210> 111
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 111
Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu
1 5 10
<210> 112
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 112
Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu
1 5 10
<210> 113
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 113
Asn Gly Phe Ser Val Gln Ile Cys Glu Gln
1 5 10
<210> 114
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 114
Asn Gly Phe Ser Arg Glu Val Ser Glu Gln
1 5 10
<210> 115
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 115
Asn Gly Phe Ser Val Gln Ile Cys Glu Gln
1 5 10
<210> 116
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 116
Asn Gly Phe Ser Met Gln Ile Cys Glu Arg
1 5 10
<210> 117
<211> 10
<212> PRT
<213> Glycine max
<400> 117
Asn Gly Phe Ser Ala Glu Val Phe His His
1 5 10
<210> 118
<211> 10
<212> PRT
<213> Arabidopsis thaliana
<400> 118
Phe Ile Phe Gly Phe Pro Pro Cys Trp Glu
1 5 10
<210> 119
<211> 10
<212> PRT
<213> Brassica napus
<400> 119
Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu
1 5 10
<210> 120
<211> 10
<212> PRT
<213> Brassica napus
<400> 120
Phe Leu Leu Gly Phe Pro Tyr His Trp Lys
1 5 10
<210> 121
<211> 10
<212> PRT
<213> Brassica napus
<400> 121
Phe Ile Leu Gly Phe Pro Pro Tyr Trp Glu
1 5 10
<210> 122
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 122
Phe Phe Ile Gly Phe Pro Pro Tyr Trp Lys
1 5 10
<210> 123
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 123
Phe Leu Ser Gly Phe Pro Cys Ser Trp Glu
1 5 10
<210> 124
<211> 10
<212> PRT
<213> Helianthus annuus
<400> 124
Phe Leu Ser Gly Phe Pro Cys Ser Trp Glu
1 5 10
<210> 125
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 125
Phe Asp Phe Gly Phe Pro Asp Leu Trp Gln
1 5 10
<210> 126
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 126
Phe Leu Asn Gly Phe Pro Asp Trp Trp Gln
1 5 10
<210> 127
<211> 10
<212> PRT
<213> Sorghum bicolor
<400> 127
Phe Leu Asn Gly Phe Pro Asp Trp Trp Gln
1 5 10
<210> 128
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 128
Phe Met Ile Gly Phe Pro Ser Trp Trp Glu
1 5 10
<210> 129
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 129
Phe Arg Leu Gly Phe Pro Ile Gln Trp Glu
1 5 10
<210> 130
<211> 10
<212> PRT
<213> Triticum aestivum
<400> 130
Phe Met Ile Gly Phe Pro Phe Trp Trp Glu
1 5 10
<210> 131
<211> 10
<212> PRT
<213> Hordeum vulgare
<400> 131
Phe Met Ile Gly Phe Pro Tyr Trp Trp Glu
1 5 10
<210> 132
<211> 10
<212> PRT
<213> Glycine max
<400> 132
Phe Leu Phe Gly Phe Pro Pro Asp Trp Glu
1 5 10
<210> 133
<211> 20
<212> PRT
<213> Arabidopsis thaliana
<400> 133
Ser Ser Pro Ile Thr Lys Ala Leu Asp Val Phe Thr Leu Leu Ala Ser
1 5 10 15
Asp Gly Ile Tyr
20
<210> 134
<211> 20
<212> PRT
<213> Brassica napus
<400> 134
Ser Ser Pro Ile Val Lys Ala Phe Asp Val Phe Thr Leu Glu Ala Ser
1 5 10 15
Asp Gly Val Cys
20
<210> 135
<211> 20
<212> PRT
<213> Brassica napus
<400> 135
Ser Ala Ala Ile Ser Thr Arg His Asp Ser Thr Thr Leu Glu Thr Ser
1 5 10 15
Asp Gly Leu Thr
20
<210> 136
<211> 20
<212> PRT
<213> Brassica napus
<400> 136
Ser Ser Pro Ile Leu Lys Ala Phe Asp Val Phe Thr Leu Glu Ala Ser
1 5 10 15
Asp Gly Val Cys
20
<210> 137
<211> 20
<212> PRT
<213> Helianthus annuus
<400> 137
Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr Val
1 5 10 15
Asp Gly Val Cys
20
<210> 138
<211> 20
<212> PRT
<213> Helianthus annuus
<400> 138
Ser Ala Ala Ile Ala Lys Arg His Asp Asn Asn Thr Leu Glu Ser Val
1 5 10 15
Asp Gly Ile Ile
20
<210> 139
<211> 20
<212> PRT
<213> Helianthus annuus
<400> 139
Ser Ala Ala Ile Val Lys Arg His Asp Asn Tyr Thr Leu Glu Ala Glu
1 5 10 15
Asp Gly Ile Ile
20
<210> 140
<211> 20
<212> PRT
<213> Sorghum bicolor
<400> 140
Ser Ser Ala Ile Val Lys Arg His Asp Tyr Thr Ser Ile Glu Ser Glu
1 5 10 15
Asp Gly Tyr Gln
20
<210> 141
<211> 20
<212> PRT
<213> Sorghum bicolor
<400> 141
Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr Glu
1 5 10 15
Glu Gly Thr Val
20
<210> 142
<211> 20
<212> PRT
<213> Sorghum bicolor
<400> 142
Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr Glu
1 5 10 15
Glu Gly Thr Val
20
<210> 143
<211> 20
<212> PRT
<213> Triticum aestivum
<400> 143
Ser Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu Gln Asp Glu
1 5 10 15
Gly Gly Val Val
20
<210> 144
<211> 20
<212> PRT
<213> Triticum aestivum
<400> 144
Ser Gly Ser Ile Thr Val Arg His Ala Asp Gly Thr Leu Glu Thr Ala
1 5 10 15
Asp Asn Lys Ile
20
<210> 145
<211> 20
<212> PRT
<213> Triticum aestivum
<400> 145
Ser Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu Gln Asp Glu
1 5 10 15
Gly Gly Val Val
20
<210> 146
<211> 20
<212> PRT
<213> Hordeum vulgare
<400> 146
Ser Ala Pro Ile Ala Gln Arg Tyr Glu Ser Leu Thr Leu Gln Tyr Glu
1 5 10 15
Asp Gly Val Val
20
<210> 147
<211> 20
<212> PRT
<213> Glycine max
<400> 147
Ser Ala Ala Val Ile Lys Arg Tyr Asp Val Phe Ser Leu Glu Thr Ala
1 5 10 15
Asp Gly Ile Cys
20
<210> 148
<211> 16
<212> PRT
<213> Arabidopsis thaliana
<400> 148
Lys Arg Ser Arg Ser Gly Arg Val Leu Val Ser Ser Leu Glu Phe Trp
1 5 10 15
<210> 149
<211> 16
<212> PRT
<213> Brassica napus
<400> 149
Lys Arg Ser Arg Ser Gly Arg Val Leu Val Ser Pro Leu Glu Tyr Trp
1 5 10 15
<210> 150
<211> 16
<212> PRT
<213> Helianthus annuus
<400> 150
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
1 5 10 15
<210> 151
<211> 16
<212> PRT
<213> Sorghum bicolor
<400> 151
Lys Arg Ser Arg Ser Gly Arg Val Ile Val Pro Lys Leu Asp Asn Trp
1 5 10 15
<210> 152
<211> 16
<212> PRT
<213> Sorghum bicolor
<400> 152
Lys Arg Ser Arg Ser Gly Arg Val Ile Val Pro Lys Leu Asp Asn Trp
1 5 10 15
<210> 153
<211> 16
<212> PRT
<213> Triticum aestivum
<400> 153
Arg Arg Thr Lys Ser Gly Arg Val Val Val Pro Leu Leu Asp Pro Gly
1 5 10 15
<210> 154
<211> 16
<212> PRT
<213> Triticum aestivum
<400> 154
Arg Arg Thr Lys Ser Gly Arg Val Val Val Pro Gln Leu Asp Pro Gly
1 5 10 15
<210> 155
<211> 16
<212> PRT
<213> Hordeum vulgare
<400> 155
Arg Arg Thr Arg Ser Gly Arg Val Ile Val Pro Gln Leu Asp Ser Val
1 5 10 15
<210> 156
<211> 16
<212> PRT
<213> Glycine max
<400> 156
Arg Lys Ser Arg Ser Gly Arg Leu Leu Leu Pro Pro Leu Glu Phe Trp
1 5 10 15
<210> 157
<211> 598
<212> PRT
<213> Arabidopsis thaliana
<400> 157
Met Thr Glu Pro Asn Leu Asp Glu Asp Gly Ser Lys Ser Ser Phe Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Lys Glu
20 25 30
Phe Glu Gly Lys Gln Phe Gly Val Ala Gly Phe Glu Glu Ser Val Glu
35 40 45
Thr Arg Ala Met Arg Val Phe Thr Ser Ser Pro Ile Thr Lys Ala Leu
50 55 60
Asp Val Phe Thr Leu Leu Ala Ser Asp Gly Ile Tyr Ile Thr Leu Arg
65 70 75 80
Gly Phe Leu Asn Lys Glu Arg Val Leu Lys Asn Gly Phe Asn Pro Glu
85 90 95
Ile Ser Arg Glu Phe Ile Phe Gly Phe Pro Pro Cys Trp Glu Arg Val
100 105 110
Cys Asn Ser Cys Phe Glu Gly Asp Ser Phe Gly Thr Asp Val Asn Thr
115 120 125
Val Pro Ser Thr Ile Glu Lys Ala Cys Pro Pro Ile Leu Ser Pro Cys
130 135 140
Lys Tyr Ser Asn Arg Asn Leu Lys Asp Asn Pro Ala Glu Ser Arg Glu
145 150 155 160
Lys Ser Asn Val Thr Glu Thr Asp Ile Ala Glu Ile Asn Asp Lys Gly
165 170 175
Gly Ser Gly Ala Arg Asp Ile Lys Thr Ala Arg Arg Arg Ser Leu His
180 185 190
Leu Gln Ile Lys Arg Ile Leu Glu Ser Ser Lys Val Arg Lys Thr Ala
195 200 205
Asn Asp Gly Asp His Gly Ser Glu Phe Leu Asn Thr Ala Lys Arg Gly
210 215 220
Asp Val Glu Arg Asp Gly Cys Glu Val Ile Asn Asn Glu Asp Ser Glu
225 230 235 240
Trp Lys Leu Asp Glu Ser Glu Val Gln Asn Leu Cys Asn Asp Gly Asp
245 250 255
Asn Gly Ser Glu Gly Phe Ile Lys Ala Lys Ser Ser Asp Val Glu Lys
260 265 270
Asp Lys Ser Glu Ala Ile Asp Asn Asp Val Ile Ser Pro Ala Val Gly
275 280 285
Ser Gly Ile Lys His Thr Gly Ala Asp Asn Val Asp Lys Val Thr Ser
290 295 300
Ala Ser Ala Thr Gly Glu Ser Leu Thr Ser Glu Gln Gln Asn Gly Leu
305 310 315 320
Leu Val Thr Thr Ala Ser Pro His Ser Leu Leu Lys Asp Leu Ala Lys
325 330 335
Ser Ser Lys Pro Glu Lys Lys Gly Ile Ser Lys Lys Ser Gly Lys Ile
340 345 350
Leu Arg Ser Asp Asp Asn Val Val Asp Pro Met Asn Tyr Ser Gly Thr
355 360 365
Lys Val Lys Ser Ala Glu Asn Lys Arg Lys Ile Asp Ala Ser Lys Leu
370 375 380
Gln Ser Pro Thr Ser Asn Val Ala Glu His Ser Lys Glu Gly Leu Asn
385 390 395 400
Asn Ala Lys Ser Asn Asp Val Glu Lys Asp Val Cys Val Ala Ile Asn
405 410 415
Asn Glu Val Ile Ser Pro Val Lys Gly Phe Gly Lys Arg Leu Ser Gly
420 425 430
Thr Asp Val Glu Arg Leu Thr Ser Lys Asn Ala Thr Lys Glu Ser Leu
435 440 445
Thr Ser Val Gln Arg Lys Gly Arg Val Lys Val Ser Lys Ala Phe Gln
450 455 460
Asp Pro Leu Ser Lys Gly Lys Ser Lys Lys Ser Glu Lys Thr Leu Gln
465 470 475 480
Ser Asn Ser Asn Val Val Glu Pro Met Asn His Phe Arg Ser Glu Ala
485 490 495
Glu Glu Ala Glu Glu Asn Leu Ser Trp Glu Lys Ile Lys Arg Lys Ile
500 505 510
Asp Phe Asp Val Glu Val Thr Pro Glu Lys Lys Val Lys Gln Gln Lys
515 520 525
Thr Asn Ala Ala Ser Thr Asp Ser Leu Gly Gln Lys Arg Ser Arg Ser
530 535 540
Gly Arg Val Leu Val Ser Ser Leu Glu Phe Trp Arg Asn Gln Ile Pro
545 550 555 560
Val Tyr Asp Met Asp Arg Asn Leu Ile Gln Val Lys Asp Gly Ser Glu
565 570 575
Thr Asn Ser Ala Pro Ser Lys Gly Lys Gly Ser Asp Ser Arg Lys Arg
580 585 590
Arg Asn Leu Lys Ile Lys
595
<210> 158
<211> 1135
<212> PRT
<213> Brassica napus
<400> 158
Met Ala Thr Lys Ser Lys Leu Gln Ser Leu Ser Ala Arg Arg Ser Ser
1 5 10 15
Pro Arg Thr Arg Ser Gly Ala Val Arg Glu Pro Ile Ser Thr Pro Ala
20 25 30
Ala Pro Cys Ser Arg Phe Val Pro Lys Pro Asn Ser Asp Glu Ile Pro
35 40 45
Pro Arg Thr Pro Phe Ser Phe Lys Ser Ile Thr Pro Thr Thr Leu Lys
50 55 60
Ser Val Ser Leu Ser Asp Trp Trp Leu Thr Lys Lys Ala Asn Glu Thr
65 70 75 80
Gly Leu Gly Val Ser Gly Phe Glu Ser Lys Gly Gly Pro Glu Val Arg
85 90 95
Leu Phe Ser Ser Ala Ala Ile Ser Thr Arg His Asp Ser Thr Thr Leu
100 105 110
Glu Thr Ser Asp Gly Leu Thr Val Ser Ile Ser Gly Phe Ile Asn Arg
115 120 125
Ser Arg Ser Phe Gln Asn Gly Phe Ser Ser Glu Asp Cys Asn Arg Phe
130 135 140
Leu Leu Gly Phe Pro Tyr His Trp Lys Asp Tyr Thr Glu Glu Arg Phe
145 150 155 160
Val Glu Glu Glu Lys Asp His Cys Val Ser Phe Asp Asp Ile Pro Val
165 170 175
Asn Arg Leu Gln Asp Val Leu Phe Thr Ala Ser Pro Arg Phe Gln Ala
180 185 190
Lys Ile Leu Asp Asp Ala Val Asp Ser Leu Arg Asp Leu Leu Arg Ser
195 200 205
Ser Thr Glu Lys Pro Asp Lys Glu Cys Arg Thr Pro Arg Met Asp Gly
210 215 220
Gly Asn Glu Glu Ser Leu Val Leu Ser Val Val Gly Val Lys Thr Arg
225 230 235 240
Gly Met Val Arg Arg Arg Glu Glu Gly Glu Ala Ser Ile Gly Glu Arg
245 250 255
Val Leu Arg Ser Ser Lys Lys Asn Lys Leu Ile Lys Gly Ser His Gln
260 265 270
Asn Thr Arg Thr Lys Thr Ile Ser Leu Phe Leu Ser Asp Gln Cys Phe
275 280 285
Val Phe Tyr Ala Ser Ile Tyr Ala His His His Ile Arg Pro Leu Thr
290 295 300
Lys Thr Cys Cys Arg Glu Gln Arg Ala Met Arg Ile His Gly Gly Gly
305 310 315 320
Pro Ala Thr Ser Val Gln Ser Asn Pro Asn Gly Ser Asn Thr Ile Phe
325 330 335
Lys Val Pro Ser Ile Phe His His Val Phe Glu Tyr Thr Leu Lys Ile
340 345 350
Ile Asp Glu Asp Gly Asp Thr Phe Ala Arg Arg Ala Glu Met Tyr Tyr
355 360 365
Arg Lys Arg Pro Glu Ile Val Ser Phe Val Glu Glu Ala Phe Arg Ser
370 375 380
Tyr Arg Ala Leu Ala Glu Arg Tyr Asp His Leu Ser Arg Glu Leu Gln
385 390 395 400
Ser Ala Asn Arg Thr Ile Ala Thr Ala Phe Pro Glu His Val Gln Phe
405 410 415
Pro Leu Glu Asp Asp Glu Thr Glu Asp Phe Glu Gly Asn Pro Arg Lys
420 425 430
Gln Pro His Leu His Leu Ile Pro Lys Gly Ser Asn Ile Pro Gln Arg
435 440 445
Glu Ala Ala Val Val Ser Ser Gly Leu Ser Lys Glu Glu Gly Leu Glu
450 455 460
Glu Ile Asp Asn Leu Gln Lys Gly Ile Leu Ala Leu Gln Thr Glu Lys
465 470 475 480
Glu Phe Val Arg Ser Ser Tyr Glu Glu Ser Tyr Glu Arg Tyr Trp Asp
485 490 495
Leu Glu Asn Glu Val Ala Glu Met Gln Lys Arg Val Cys Ser Leu Gln
500 505 510
Asp Glu Phe Gly Leu Gly Ala Ala Ile Asp Asp Ser Asp Ala Arg Thr
515 520 525
Leu Met Ala Ser Thr Ala Leu Ser Ser Cys Lys Asp Thr Leu Ala Lys
530 535 540
Leu Glu Glu Lys Gln Lys Gln Ser Val Glu Glu Ala Glu Ile Glu Lys
545 550 555 560
Glu Arg Ile Thr Thr Ala Lys Glu Arg Phe Tyr Ala Leu Arg Asn Lys
565 570 575
Phe Glu Lys Pro Glu Ser Asp Asp His Asp Lys Phe Ile Lys Thr Glu
580 585 590
Ala Lys Val Asp Val Val Gln Glu Ser Ser Tyr Glu Ser Glu Arg Glu
595 600 605
Asp Ser Asn Glu Asn Leu Thr Val Val Lys Leu Ala Glu Lys Ile Asp
610 615 620
Asp Leu Val Gln Lys Ile Val Ser Leu Glu Ser Asn Ala Ser Ser His
625 630 635 640
Thr Ala Leu Val Lys Thr Leu Arg Ser Glu Thr Asp Gly Leu His Glu
645 650 655
His Ile Arg Gly Leu Glu Glu Asp Lys Ala Ala Leu Val Ser Asp Ser
660 665 670
Thr Asp Met Lys Gln Arg Ile Ala Val Leu Glu Lys Glu Leu Ser Glu
675 680 685
Val Arg Lys Leu Phe Gln Lys Val Glu Asp Gln Asn Lys Ser Leu Gln
690 695 700
Lys Gln Phe Lys Glu Ala Asn Trp Thr Ala Asp Asp Leu Ser Gly Lys
705 710 715 720
Leu Gln Asp Val Lys Met Asp Glu Asp Val Glu Gly Ala Gly Ile Phe
725 730 735
Gln Glu Leu Pro Ala Val Ser Gly Ser Glu Asp Tyr Leu Lys Ser Ile
740 745 750
Thr Lys Glu Thr Glu Arg Glu Lys Asp Glu Asp Glu Glu Thr Pro Asn
755 760 765
Trp Arg Gln Leu Leu Pro Asp Gly Met Glu Asp Arg Glu Lys Val Leu
770 775 780
Leu Asp Asp Tyr Thr Ser Val Leu Arg Asp Tyr Arg Gly Val Lys Arg
785 790 795 800
Lys Leu Gly Glu Val Glu Lys Lys Asn Arg Glu Gly Phe Phe Glu Leu
805 810 815
Ala Leu Gln Leu Arg Glu Leu Lys Asn Ala Val Ala Tyr Lys Asp Val
820 825 830
Glu Ile Gln Ser Leu Arg Gln Lys Leu Gly Thr Leu Glu Lys Asp Ser
835 840 845
Pro His Gln Val Glu Gly Asn Asn Gln Met Glu His Asp Gln Gly Gln
850 855 860
Arg Glu Ser Val Ser Ile Ser Pro Thr Ser Asn Phe Ser Val Arg Val
865 870 875 880
Lys Phe Ala Asp Val Asp Asp Ser Pro Arg Thr Lys Ile Pro Ala Val
885 890 895
Glu Asp Lys Val Arg Ala Asp Ile Asp Ala Val Leu Glu Glu Asn Leu
900 905 910
Glu Phe Trp Leu Arg Phe Ser Thr Ser Val His Gln Ile Gln Lys Phe
915 920 925
Gln Thr Thr Val Gln Asp Leu Lys Ser Glu Leu Thr Lys Leu Lys Ile
930 935 940
Gln Ser Lys Gln Gln Gln Glu Ser Ser Arg Ser Lys His Ala Ala Ala
945 950 955 960
Ser Glu Ala Lys Pro Ile Tyr Arg His Leu Arg Glu Ile Arg Thr Glu
965 970 975
Leu Gln Leu Trp Leu Glu Thr Ser Ala Val Leu Lys Asp Glu Leu Gln
980 985 990
Gly Arg Phe Ala Ser Leu Ala Asn Ile Gln Glu Glu Ile Gly Arg Val
995 1000 1005
Thr Ala His Ser Gly Gly Ser Lys Val Ser Asp Ser Glu Ile Ser
1010 1015 1020
Ser Tyr Gln Ala Ala Lys Phe His Gly Glu Ile Leu Asn Met Lys
1025 1030 1035
Gln Glu Asn Lys Arg Val Ser Ser Glu Leu Gln Ser Gly Leu Asp
1040 1045 1050
Arg Val Arg Val Leu Lys Thr Asp Val Glu Arg Ile Leu Ser Lys
1055 1060 1065
Leu Glu Glu Asp Ile Gly Ile Ser Ser Ala Thr Glu Ala Arg Thr
1070 1075 1080
Thr Pro Ser Lys Ser Ser Ser Ser Gly Lys Ala Arg Ile Pro Leu
1085 1090 1095
Arg Ser Phe Leu Phe Gly Val Lys Leu Lys Lys Gln Thr Lys Gln
1100 1105 1110
Lys Gln Ala Ser Ala Ser Leu Phe Ser Cys Val Ser Pro Phe Pro
1115 1120 1125
Ala Pro Gln Gln Glu Ser Ser
1130 1135
<210> 159
<211> 330
<212> PRT
<213> Helianthus annuus
<400> 159
Met Pro Asn Leu Val Ser Glu Ser Lys Thr Pro Ile Ser Ser Ser Lys
1 5 10 15
Arg Lys Ser Val Phe Leu His Gln Trp Trp Leu Ile Lys Val Glu Lys
20 25 30
Glu Pro Lys Leu Gly Val Gly Gly Phe Val Asn Arg Glu Thr Phe Gly
35 40 45
Thr Arg Gly Met Arg Leu Phe Gly Ser Pro Ser Thr Asn Lys Arg Gln
50 55 60
Asn Val Asn Ile Ile Asp Asp Gly Val Gln Val Tyr Gly Ser Ala Ala
65 70 75 80
Ile Ala Lys Arg His Asp Asn Asn Thr Leu Glu Ser Val Asp Gly Ile
85 90 95
Ile Ile Arg Ile Ser Gly Cys Ile Asn Lys Ser Arg Thr Leu Ser Tyr
100 105 110
Gly Phe Ser Pro Glu Val Cys Asp Ser Phe Leu Ser Gly Phe Pro Cys
115 120 125
Ser Trp Glu Asp Tyr Ala Ser Lys Ser Ser His Asp Arg Cys Asp Asp
130 135 140
Asp Ile Thr Lys Gln Ser Leu Pro Ala Ser Phe Asp Asp Leu Arg Val
145 150 155 160
Thr His Val Arg His Leu Leu Met Ser Gly Thr Asp Ser Cys Ala Leu
165 170 175
Asn Ser Ile Ile Phe Gly Asp Ile Met Lys His Thr Glu Lys Ile Leu
180 185 190
Asn Gln Ser Val Pro Ser Val Glu Lys Ile Ser Arg Asn Ser Ile Glu
195 200 205
Thr Glu Ala Asp His Asn Glu Asp Asp Val Ser Leu Ser Asn Leu Thr
210 215 220
Gln Lys Ile Thr Gly Glu Asp Ser Lys Ile Ala Val Asp Ser His Met
225 230 235 240
Ile Lys Ser Glu Glu Ile Glu Asp Val Glu Asp Ile Thr Glu Lys Ile
245 250 255
Ser Pro Lys Val Gln Ala Lys Gln Arg Lys His Leu Lys Leu Met Ser
260 265 270
Asp Gln Arg Leu Tyr Ala Glu Glu His Asp Pro Val Val Ala Gln Gln
275 280 285
Leu Asp Ile Trp Ile Thr Trp Tyr Cys Asp Ala Leu Thr Val Ser Ser
290 295 300
Cys Pro Pro Phe Leu Leu Thr Val Phe Ser Phe Ile Asn Cys Gly Gly
305 310 315 320
Glu Ile His Val Thr Met Ile Leu Asn Thr
325 330
<210> 160
<211> 329
<212> PRT
<213> Helianthus annuus
<400> 160
Met Lys Glu Thr Gln Asn Leu Asn Ser Glu Cys Ile Arg Ser Ser Ser
1 5 10 15
Leu Phe Ser Ser His Arg Ser Phe Lys Val Leu Glu Phe Thr Gln Ala
20 25 30
Ala Ile Asn Arg Leu Ser Ser Ala Ala Leu His Ser Cys Gln Thr Leu
35 40 45
Ser Val Asn Pro Lys Pro Pro Phe Leu His Gln Ser Val Asn Gln Tyr
50 55 60
Val Phe Leu His Gly Trp Trp Leu Ile Lys Leu Glu Ser Gln Ser Lys
65 70 75 80
Leu Gly Val Gly Gly Phe Leu Asn Arg Glu Thr Phe Glu Thr Arg Arg
85 90 95
Met Arg Leu Phe Gly Ser Pro Ser Thr Gly Lys Arg Pro Asn Ile Asn
100 105 110
Thr Ile Asp Asp Gly Val Gln Val Tyr Gly Ser Ala Ala Ile Val Lys
115 120 125
Arg His Asp Asn Tyr Thr Leu Glu Ala Glu Asp Gly Ile Ile Ile Ser
130 135 140
Ile Ser Gly Tyr Ile Ile Lys Ser Arg Thr Leu Ser Tyr Gly Phe Ser
145 150 155 160
Ser Glu Val Cys Asp Ser Phe Leu Ser Gly Phe Pro Cys Ser Trp Glu
165 170 175
Asp Tyr Ala Phe Lys Ser Phe His Asp Lys Cys Asp Asp Asp Thr Thr
180 185 190
Lys Gln Ser Leu Pro Ala Ser Phe Asp Asp Leu Pro Val Thr His Val
195 200 205
Arg His Leu Leu Met Ser Gly Thr Ala Leu Thr Ser Ile Ile Phe Arg
210 215 220
Asp Ile Met Lys His Thr Glu Lys Ile Leu Asn Gln Ser Val Pro Pro
225 230 235 240
Val Asp Lys Ile Ser Thr Asn Ser Ile Glu Val Asp His Asn Gln Asp
245 250 255
Asp Ile Ser Phe Ser Asn Ser Thr Gln Lys Lys Ile Thr Glu Glu Asp
260 265 270
Ile Asn Thr Ala Val Asp Ser His Met Lys Lys Ser Glu Glu Thr Glu
275 280 285
Asp Asp Gly Phe Met Ser Asp Ala Ile Arg Lys Ile Thr Gln Val Lys
290 295 300
Gln Ser Lys Val Leu Pro Arg Ile Tyr Pro Leu Arg Ser Arg Gln Lys
305 310 315 320
Glu Lys Thr Leu Glu Val Asp Asp Asp
325
<210> 161
<211> 458
<212> PRT
<213> Sorghum bicolor
<400> 161
Met Pro Ser Gln Pro Ala Pro Asp Ser Thr Gly Gly Ser Pro Arg Ile
1 5 10 15
Pro Val Ala Ser Ala Glu Ala Val Arg Arg Val Val Asp Phe Phe Lys
20 25 30
Thr Asn Gly Lys Leu Arg Ser Val Thr Gly Ala Ala Val Ser Ser Pro
35 40 45
Leu Leu Pro Arg Gly Ala Ala Thr Pro Pro Leu Ala Gly Met Pro Ser
50 55 60
Gln Pro Pro Gln Gly Ser Thr Gly Gly Ser Pro Arg Ile Ser Ala Pro
65 70 75 80
Phe Gln Pro Ala Pro Asp Tyr Thr Gly Gly Ser His Arg Thr Pro Ala
85 90 95
Pro Gly Ser Ile Gly Val Val Pro Arg Ile Pro Glu Leu Ser Ala Gln
100 105 110
Ala Val Asp Arg Ile Ala Arg Lys Cys Ile Ile Leu Val Asp Trp Trp
115 120 125
Leu Glu Arg Val Glu Gly Glu Glu Gly Lys Ile Arg Val Ala Gly Thr
130 135 140
Thr Phe Thr Pro Arg Met Ala Glu Gln Met Arg Lys Gly Ala Ser Ser
145 150 155 160
Ser Asn Met Arg Met Ala Val Arg Val Phe Arg Ser Ser Ala Ile Val
165 170 175
Lys Arg His Asp Tyr Thr Ser Ile Glu Ser Glu Asp Gly Tyr Gln Ile
180 185 190
Glu Ile Gly His Cys Leu Asn Ile Pro Lys Thr Arg Glu Asn Gly Phe
195 200 205
Ser Glu Glu Val Cys Glu Ser Phe Asp Phe Gly Phe Pro Asp Leu Trp
210 215 220
Gln Arg Leu Val Asn Pro Lys Met Val Pro Asp Asp Glu His Ala Leu
225 230 235 240
Ser Pro Ser Glu Thr Thr Thr Gly Pro Pro Ser Pro Ser Val Glu Asp
245 250 255
Tyr Met Ala Lys Phe Leu Ser Asp Ser Phe Ser Ser Lys Ile Gly Phe
260 265 270
Asp Phe Thr Glu Asn Asp Phe Asp Ser Gly Ser Ile Ser Ser Asp Ser
275 280 285
Lys Val Asp Gly Asn Ile Leu Ala Pro Ser Lys Ile Ser Ser Val Val
290 295 300
Asn Glu Gly Tyr Arg Ser Thr Val Gly Cys Gly Gln Ala Lys Lys Asp
305 310 315 320
Ala Asn Ile Gln Gln Glu Asn Met Pro Ser Cys Ser Ser Glu His Ala
325 330 335
Met Val Thr Pro Lys Phe Gly Lys Asp Ser Val Asn Leu Gly Thr Thr
340 345 350
Asp Ala Leu Glu Leu Pro Thr Glu Gly Met Thr Pro Lys Phe Gly Ala
355 360 365
Ile Arg Gly Ser Glu Asp Ser Ile Gly Arg Arg Leu Arg Ser Gly Lys
370 375 380
Val Leu Pro Ile Gly Gly Pro Met Lys Lys Gln Lys Lys Ile Gln Gln
385 390 395 400
Gln Met Val Asn Gln Gly Ala Thr Pro Ala Ala Asp Leu Thr Ser His
405 410 415
Glu Asn Asp Phe Ser Ala Ala Glu Val Val Val Lys Glu Asn Leu Gly
420 425 430
Ser Asp Asp Ser Cys Gly Lys Val Thr Gly Gln Gly Arg Ile Ala Glu
435 440 445
Gly Lys Gly Lys Arg Lys Arg Lys Arg Val
450 455
<210> 162
<211> 502
<212> PRT
<213> Sorghum bicolor
<400> 162
Met Lys Pro Leu Pro Val Pro Glu Ala Gly Ser Pro His Arg Arg Gly
1 5 10 15
Met Pro Pro Ser Leu Leu Ser Pro Ser Ser Arg Ser Ala Val Pro Ala
20 25 30
Ala Ala Asp Gly Asp His Asp Ala Ala Val Ser Glu His Ala Cys Val
35 40 45
Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln Lys
50 55 60
Ile Ala Val Ala Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu Tyr
65 70 75 80
Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr
85 90 95
Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu Arg
100 105 110
Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu Asn
115 120 125
Gly Phe Pro Asp Trp Trp Gln Ser Cys Lys Pro Cys Asn Pro Lys Leu
130 135 140
Met Asn Ser His Thr Glu Cys Cys Ser Ser Asn Ala Ser Asn Ser Gly
145 150 155 160
Val Asp Ser Thr Gln Phe Tyr Leu Glu Arg Tyr Met Gln Gly Arg Arg
165 170 175
Leu Asp Ser Tyr Gly Thr Tyr Leu Ile Ser Lys Phe Pro Asp Ile Leu
180 185 190
Ala Ser Phe Leu His Asn Asp Ala Val Phe Gln Lys Ser Ser His Leu
195 200 205
Leu Asn Gly Lys Pro Arg Phe Glu Glu Tyr Thr Cys Asp Gly Asp Ile
210 215 220
Thr Thr Asn Glu Asn Ala Ala Ala Ser Ser Glu Ala Ala Thr Gly Asp
225 230 235 240
Gln Arg Ile Pro Glu Val Ser Leu Glu Val Arg Gly Cys Arg Lys Glu
245 250 255
Thr Gln His Met Ser Leu Thr Asp Lys Ala Ala Val Asp Glu Glu Met
260 265 270
Pro Ala Ser Val Tyr Leu Asp Met Gln Asn Ser Leu Cys Leu Ser Asn
275 280 285
Gly Thr Pro Ile Leu Glu Glu Tyr Thr Cys Asp Gly Tyr Ile Pro Pro
290 295 300
Asn Glu Asp Ala Ala Ala Ser Asn Asp Asp Asn Glu Arg Tyr Ile Ala
305 310 315 320
Thr Ser Lys Glu Val Asn Asn Met Glu Lys Ile Val Leu Val Thr Gly
325 330 335
Ser Pro Ser Arg Glu Arg Gly His Asp Asp Ile Ala Thr Asp Val Ala
340 345 350
Val Ser Glu Leu Val His Ser Thr Pro Ala Thr Gly Thr Tyr Arg Lys
355 360 365
Lys Thr Pro Val Ala Ser Leu Lys Ser Gln Gly Ser Trp Lys Glu Asn
370 375 380
Gln Pro Val Ala Ser Asn Lys Lys His Val Gly Arg Pro Lys Lys Arg
385 390 395 400
Ile Ser Pro His Ala Lys Cys Gln Ser Ala Thr Arg Ser Pro Gly Thr
405 410 415
Arg Asn Pro Ala Ser Tyr Val Leu Trp Ser Pro Leu Thr Arg Asp Lys
420 425 430
Ala Thr Ser Leu Ser Met Ser Thr Pro Glu Asp Leu Glu Leu Lys Arg
435 440 445
Ser Arg Ser Gly Arg Val Ile Val Pro Lys Leu Asp Asn Trp Cys Gln
450 455 460
Thr Ile Val Tyr Gly Arg Asp Gly Leu Ile Ala Ala Val Ile Gly Leu
465 470 475 480
Asp Ser Pro Ala Leu Pro Lys Trp Ser Glu Ser Lys Thr Asp Arg Arg
485 490 495
Lys Lys Arg Lys Thr Lys
500
<210> 163
<211> 570
<212> PRT
<213> Triticum aestivum
<400> 163
Met Ala Lys Lys Thr Pro Ser Pro Pro Pro Arg Ala Arg Ser Arg Arg
1 5 10 15
Gly Ala Ala Pro Pro Ser Pro Thr Pro Ala Ala Ala Leu Ser Pro Pro
20 25 30
Phe Ser Pro Ala Pro Leu Arg Thr Arg Leu Gly Ala Ala Ala Ala Ala
35 40 45
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Ser Ser Pro Val
50 55 60
Glu His Pro Cys Val Thr Leu Trp Glu Trp Cys Pro Val Met Val Glu
65 70 75 80
Gly Glu Glu Arg Lys Leu Ala Val Ser Gly Phe Thr Glu Arg Asn Asp
85 90 95
Ala Phe Thr Ser Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu
100 105 110
Gln Asp Glu Gly Gly Val Val Val Leu Leu His Gly Ser Ile Asn Leu
115 120 125
Leu Arg Met Arg Glu Asn Gly Phe Ser Val Gln Ile Cys Glu Gln Phe
130 135 140
Met Ile Gly Phe Pro Ser Trp Trp Glu Thr Trp Asp Ser His Met Gly
145 150 155 160
Ser Tyr Pro Asn Cys Phe Ile Asp Pro Arg Glu Gly Ser Ala Gln Phe
165 170 175
Tyr Leu Glu Lys Phe Gln Leu Gly Asn Phe Ile Gln Lys Phe Gly Pro
180 185 190
Leu Phe Ile Glu Asp Leu Leu Asn Asn Ala Lys Asn Phe Pro Ile Asp
195 200 205
His Leu Asp Ala Phe Thr Glu Ser Ser Arg Phe Gln Glu Tyr Asn Cys
210 215 220
Gly Asn Asp Ala Ser Thr Lys Glu Asn Ser Ala Ala Ser Asp Asp Ala
225 230 235 240
Arg Pro Ala Thr Val Ala Asn Val Glu Ile Gly Leu Thr Ala Ser Ser
245 250 255
Ile Ser Gln Glu Arg Asp His Val Asp Ile Glu Cys Asn Val Ser Leu
260 265 270
Ala Ser Ala Glu Thr Tyr Thr Gly Asp Glu Thr Cys Lys Glu Ala Gly
275 280 285
Asn Gln Asn Asp Thr Met His Pro Asp Ala Arg Glu Asp Asp Ala Gly
290 295 300
Ser His Leu Phe Asn Ser Asp Trp Thr Cys Thr Met Phe Pro Asp His
305 310 315 320
Met Pro Asn Asp Ser Glu Gly Gly Asn Ala Thr Ser Ala Glu Asn Thr
325 330 335
Thr Met Ser Pro Asp Asn Met Pro Asn Asp Ser Glu Gly Gly Asn Val
340 345 350
Thr Ser Ala Lys Asn Ala Thr Met Ser Pro Asp His Met Ser Pro Asp
355 360 365
Asn Met Pro Asn Asp Ser Glu Gly Gly Asn Ala Pro Ser Ala Glu Asn
370 375 380
Ser Val Glu Leu Leu Ala Lys Tyr His Leu Ala Ile Val Pro Pro Glu
385 390 395 400
Ser Ala Asn Cys Cys Ser Glu Ile Pro Gly Ala Ser Gln Ser Val Glu
405 410 415
Pro Ser Ser Tyr Glu Ser Thr Pro Val Ala Ser Leu Lys Asn Gln His
420 425 430
Cys Leu Glu Thr Thr Glu His Ile Thr Leu Thr Gln Lys Ala Val Ser
435 440 445
Asn Glu Asp Thr Pro Ser Ser Ile His Ser Asp Val Gln Ser Gln Glu
450 455 460
Lys Gln Thr Val Gly Ser Ala Glu Lys Arg Arg Ser Ala Lys Gln Val
465 470 475 480
Leu Glu Arg Pro Thr Arg Ser Pro Met Thr Arg Thr Ser Ala Pro Tyr
485 490 495
Gly His Lys Ser Arg Leu Thr Arg Ser Arg Ala Gln Ser Leu Ser Ile
500 505 510
Ser Thr Pro Glu Cys Leu Lys Met Arg Arg Thr Lys Ser Gly Arg Val
515 520 525
Val Val Pro Leu Leu Asp Pro Gly Ser Ser Arg Ile Val Tyr Asp Asn
530 535 540
Asn Gly Leu Ile Ser Gly Val Ala Pro Val Asp Gly Lys Lys Ser Ala
545 550 555 560
Arg Pro Ala Arg Lys Thr Arg Gly Arg Leu
565 570
<210> 164
<211> 458
<212> PRT
<213> Triticum aestivum
<400> 164
Met Arg Thr Arg Ser Met Ala Ser Lys Pro Glu Pro Val Pro Ser Thr
1 5 10 15
His Gly Thr Ala Ala Arg Ala Pro Ala Arg Ala Ser Val Ser Ala Ser
20 25 30
Thr His Gly Thr Ala Ala Arg Ala Pro Ala Pro Ala Ser Val Ser Ala
35 40 45
Ser Thr His Gly Thr Val Ala Arg Ala Pro Ala Pro Ala Ser Val Ser
50 55 60
Ala Ser Thr His Gly Thr Ala Val Arg Ala Pro Ala Pro Ala Ser Val
65 70 75 80
Arg Ala Pro Thr Tyr Cys Ala Thr Val Gln Arg Cys Val Ala Leu Leu
85 90 95
Asp Trp Trp Leu Val Arg Gly Gln Gly Gly Lys Ile Arg Val Ala Gly
100 105 110
Tyr Ile Asp Asn Val Glu Lys Asn Arg Ala Gly Arg Val Ile Ser Ser
115 120 125
Gly Ser Ile Thr Val Arg His Ala Asp Gly Thr Leu Glu Thr Ala Asp
130 135 140
Asn Lys Ile Val Leu Thr Arg Gly Pro Leu Asn Ile Glu Gln Met His
145 150 155 160
Cys Asn Gly Phe Ser Arg Glu Val Ser Glu Gln Phe Arg Leu Gly Phe
165 170 175
Pro Ile Gln Trp Glu Lys Tyr Ala Asn Ser Asn Met Lys Gln Val Asn
180 185 190
Glu His Thr Leu Ser Pro Ala Lys Ser Thr Glu Tyr Cys Val Glu Lys
195 200 205
Phe Leu Arg Ser Ser Phe Ala Asn Ser Met Glu His Thr Leu Thr Glu
210 215 220
Phe Asp Phe Arg Thr Ser Lys Glu Ser Thr Gly Asn Thr Asp Gly Pro
225 230 235 240
Gly Leu Pro Asn Tyr Val Lys Pro Arg Ile Gln Glu Pro Ser Gly Asn
245 250 255
Ser Gly Gly Tyr Asp Ile Ser Val Ser Asn Met Ala Ala Ser Glu Gly
260 265 270
Leu Cys Asn Asp Arg Met Gly Met Pro Asp Glu Ser Phe Glu Asp Pro
275 280 285
Gly Pro Gly Glu Thr Cys Asn Gly Gln Ala Ser Arg Ala Asp Asn Ser
290 295 300
His Glu Asp Ile Glu Thr Asp Ala Ser Gly Gln Arg Ile Val Thr His
305 310 315 320
Ser Met Asp Ser Thr Leu Val Asn Asn Asp Ile Tyr Lys Ile Glu Glu
325 330 335
Glu His Gly Ser Ser Lys Leu Gly Asn Ser Ser Val Cys Pro Gly Thr
340 345 350
Glu His Val Leu Glu Ala Leu Asn Gln Gly Ala Ser Pro Glu Asn Gly
355 360 365
Ser Val Gln Cys Ser Arg Arg Leu Arg Ser Gly Lys Val Cys Gly Met
370 375 380
Ser Asn Gly Ala Ser Leu Lys Arg Arg Tyr Ser Lys Arg Lys Thr Met
385 390 395 400
Gln His Glu Thr Leu Cys Met Lys Val Ile Pro Thr Glu Glu Thr Thr
405 410 415
Pro Pro Ala Gly Pro Thr Cys His Lys Lys Gly Gly Ser Val Ala Gln
420 425 430
Ile Thr Ala Leu Asp Lys Leu Gln Ser His Asp Ser Gly Arg Lys Gly
435 440 445
Ser Gly Arg Pro Arg Lys Lys Ala Arg Arg
450 455
<210> 165
<211> 614
<212> PRT
<213> Triticum aestivum
<400> 165
Met Ala Lys Lys Thr Pro Ser Pro Pro Pro Arg Ala Arg Ser Arg Arg
1 5 10 15
Gly Ala Ala Pro Thr Ser Pro Thr Pro Ala Ala Ala Leu Ser Pro Pro
20 25 30
Phe Ser Pro Ala Pro Leu Arg Thr Arg Leu Gly Ala Ala Ala Val Ala
35 40 45
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ser Ser Ser Pro Val Glu His
50 55 60
Pro Cys Val Thr Leu Cys Glu Trp Trp Pro Val Arg Val Glu Gly Glu
65 70 75 80
Glu Arg Lys Leu Ala Val Ser Gly Phe Thr Glu Arg Asn Asp Ala Phe
85 90 95
Thr Ser Ala Pro Ile Ala His Arg Tyr Glu Pro Leu Thr Leu Gln Asp
100 105 110
Glu Gly Gly Val Val Val Leu Leu His Gly Ser Ile Asn Leu Leu Arg
115 120 125
Met Arg Glu Asn Gly Phe Ser Val Gln Ile Cys Glu Gln Phe Met Ile
130 135 140
Gly Phe Pro Phe Trp Trp Glu Thr Trp Asp Ser His Met Glu Ser Tyr
145 150 155 160
Pro Asn Cys Phe Ile Asp Pro Arg Glu Gly Ser Ala Gln Phe Tyr Leu
165 170 175
Glu Lys Phe Gln Leu Gly Asn Phe Ile Gln Lys Phe Gly Pro Ser Phe
180 185 190
Ile Glu Asp Leu Leu Asn Asn Ala Lys Asn Phe Pro Ile Asp His Leu
195 200 205
Asp Ala Phe Thr Glu Ser Ser Arg Phe Gln Glu Tyr Ile Cys Gly Asn
210 215 220
Asp Ala Ser Thr Lys Glu Asn Ser Ala Ala Ser Asp Asp Ala Arg Pro
225 230 235 240
Ala Thr Val Ala Asn Val Glu Ile Gly Leu Thr Ala Ser Ser Ile Ser
245 250 255
Gln Glu Arg Asp His Val Asp Ile Glu Cys Asn Val Ser Leu Ala Pro
260 265 270
Ala Glu Thr Tyr Thr Gly Asp Glu Thr Cys Lys Glu Ala Gly Asn Gln
275 280 285
Asn Asp Thr Met His Pro Asp Ala Arg Glu Glu Asp Ala Gly Ser His
290 295 300
Leu Phe Asn Ser Asp Trp Thr Cys Thr Met Cys Pro Asp His Met Pro
305 310 315 320
Asn Asp Ser Glu Gly Gly Asn Ala Thr Ser Ala Glu Asn Ala Thr Met
325 330 335
Ser Pro Asp Asn Met Pro Asn Asp Ser Glu Gly Gly Asn Val Thr Ser
340 345 350
Ala Lys Asn Ala Thr Met Ser Pro Asp His Met Ser Pro Asp Asn Met
355 360 365
Pro Asn Asp Ser Glu Gly Gly Asn Ala Thr Gly Ala Glu Asn Ser Val
370 375 380
Glu Leu Leu Ala Lys Tyr Pro Leu Ala Ile Val Pro Pro Glu Asn Ala
385 390 395 400
Asn Cys Cys Ser Glu Ile Pro Gly Ala Ser Gln Ser Val Glu Pro Ser
405 410 415
Ser Tyr Gln Ser Thr Pro Val Ala Ser Leu Lys Asn Gln His Cys Leu
420 425 430
Glu Thr Thr Glu His Ile Thr Leu Thr Gln Lys Ala Val Ser Asn Glu
435 440 445
Asp Thr Pro Ser Ser Ile His Ser Asp Val Gln Ser Gln Glu Lys Thr
450 455 460
Val Gly Ser Ala Glu Lys Arg Arg Ser Ala Lys Gln Val Leu Glu Arg
465 470 475 480
Pro Thr Arg Ser Pro Met Thr Arg Thr Ser Ala Pro Tyr Gly His Lys
485 490 495
Ser Arg Leu Thr Arg Ser Arg Ala Gln Ser Leu Ser Ile Ser Thr Pro
500 505 510
Glu Cys Leu Lys Met Arg Arg Thr Lys Ser Gly Arg Val Val Val Pro
515 520 525
Gln Leu Asp Pro Gly Ser Ser Arg Ile Val Tyr Asp Asn Asn Gly Leu
530 535 540
Ile Ser Gly Val Ala Pro Val Thr Gly Leu Glu Gln Val Ser Glu Thr
545 550 555 560
Cys Lys Glu Asp Lys Gly Ala Ser Leu Ser Asp Leu Leu Asp Cys Pro
565 570 575
Glu Ala Asn Asn Leu Glu Phe Arg His Gly Ser Pro Lys Ala Pro Ala
580 585 590
Pro Ala Pro Ser Gly Arg Arg Gln Tyr Leu Tyr Asn Gly Arg Cys Leu
595 600 605
Val Arg Cys Leu Glu Lys
610
<210> 166
<211> 486
<212> PRT
<213> Hordeum vulgare
<400> 166
Ser Leu Arg Ser Ala Pro Asn Met Ala Arg Lys Thr Arg Asn Pro Pro
1 5 10 15
Ser Arg Ala Arg Ser Arg Arg Gly Ala Pro Pro Pro Pro Ser Pro Ser
20 25 30
Ser Ser Thr Ala Ala Leu Ala Leu Ser Pro Pro Phe Ser Pro Val Arg
35 40 45
Phe Cys Gly Arg Leu Gly Ala Ala Glu Ala Ala Ala Ala Asp Val Glu
50 55 60
His Pro His Val Thr Leu Trp Glu Trp Trp Thr Val Arg Leu Lys Gly
65 70 75 80
Glu Asp Arg Lys Leu Ala Val Ser Ser Phe Thr Glu Lys Asn Asp Leu
85 90 95
Phe Thr Ser Ala Pro Ile Ala Gln Arg Tyr Glu Ser Leu Thr Leu Gln
100 105 110
Tyr Glu Asp Gly Val Val Val Leu Leu Tyr Gly Ser Phe Asn Ser Ser
115 120 125
Arg Met Arg Glu Asn Gly Phe Ser Met Gln Ile Cys Glu Arg Phe Met
130 135 140
Ile Gly Phe Pro Tyr Trp Trp Glu Thr Trp Asp Ser His Met Glu Ser
145 150 155 160
Tyr Pro Asn Leu Phe Ile His Pro Gln Glu Asp Ser Ile Gln Phe Tyr
165 170 175
Leu Glu Lys Phe Gln Leu Ala Asn Phe Ile Gln Lys Phe Ala Pro Phe
180 185 190
Leu Ile Lys Asp Leu Asn Asp Ala Lys Lys Leu Pro Ile Asn Asp Leu
195 200 205
Tyr Ala Phe Ile Gly Gly Ser Arg Phe Gln Glu His Asn Cys Gly Asn
210 215 220
Asp Val Ser Thr Lys Glu Ser Ser Ala Ala Ser Glu Asp Ala Arg Pro
225 230 235 240
Ala Val Val Ala Tyr Val Glu Ile Gly Leu Asn Pro Ser Ser Thr Ser
245 250 255
His Glu Arg Asp His Val Asn Ile Glu Gly Asn Val Ser Leu Ala Pro
260 265 270
Thr Glu Thr Tyr Ser Gly Asp Glu Thr Cys Lys Glu Ala Gly Asn Gln
275 280 285
Asn Asp Thr Met His Pro Asp Ala Arg Glu Asp Asp Val Gly Ser His
290 295 300
Leu Phe Asn Ser Asp Trp Thr Cys Thr Met Pro Pro Asn His Met Pro
305 310 315 320
Asn Asp Ser Glu Gly Gly Asn Ala Thr Asn Ala Glu Leu Leu Ala Leu
325 330 335
Asp Pro Leu Ala Arg Val Gln Pro Lys Ser Ser Asn Cys Cys Ser Glu
340 345 350
Ile Ala Gly Ala Phe Gln Ser Val Glu Pro Leu Ser Tyr Gln Ser Ala
355 360 365
Pro Val Ala Pro Leu Lys Asn Gln Gln Tyr Leu Glu Arg Asn Glu His
370 375 380
Ile Thr Leu Thr Gln Lys Ala Val Ser Asn Lys Thr Val Pro Ser Ser
385 390 395 400
Ile His Ser Asp Val Gln Ser Pro Lys Lys Thr Val Gly Ser Ala Lys
405 410 415
Lys Gln Arg Ser Ala Lys Gln Gly Leu Gly Arg Pro Thr Arg Leu Asn
420 425 430
Ser Ala Pro Tyr Ala Arg Leu Thr Arg Ser Arg Val Arg Ala Leu Ser
435 440 445
Ile Ser Thr Pro Glu Ser Leu Lys Met Arg Arg Thr Arg Ser Gly Arg
450 455 460
Val Ile Val Pro Gln Leu Asp Ser Val Arg Ser Trp Val Val Tyr Asp
465 470 475 480
Arg Ser Lys Ile Lys Leu
485
<210> 167
<211> 530
<212> PRT
<213> Glycine max
<400> 167
Met Ala Asp Ser Thr Pro Thr Ala Thr Pro Ser Asn Asp Ile Val Ser
1 5 10 15
Ser Ser Phe Arg Arg Thr Phe Phe Ser Phe Pro Lys Val Thr Leu Tyr
20 25 30
Asp Trp Trp Leu Val Ile Ala Lys Asn Asp Phe Gln Gly Lys Arg Leu
35 40 45
Ala Val Ala Gly Val Ser Ser Arg Lys Asp Glu Ala Thr Arg Val Phe
50 55 60
Val Ser Ala Ala Val Ile Lys Arg Tyr Asp Val Phe Ser Leu Glu Thr
65 70 75 80
Ala Asp Gly Ile Cys Val Ile Ile Arg Gly Phe Ile Asn Glu Gln Arg
85 90 95
Thr Leu Glu Asn Gly Phe Ser Ala Glu Val Phe His His Phe Leu Phe
100 105 110
Gly Phe Pro Pro Asp Trp Glu Arg Tyr Ala Leu Asp Cys Phe Lys Glu
115 120 125
Glu Pro Thr Thr Asp Ala Asp Leu Gly Ser Val Val Pro Asp Asn Ala
130 135 140
Pro Ala Ser Cys Pro Lys Ile Leu Ser Asp Gly Val Glu Lys Ser Ile
145 150 155 160
Pro Thr Cys Leu Val Ser Pro Glu Glu Ala Ser Gly Asp His Glu Met
165 170 175
Ser Phe Pro Glu Asn Glu Cys Asn Val Ser Lys Glu Met Gly Gly Val
180 185 190
His Val Ala Cys Ser Ser Gly Gly Lys Ser His Ser Phe Lys Leu His
195 200 205
Asn Ile Lys Val Cys Gln Gln Lys Lys Gln Pro Ala Ser Glu Cys Leu
210 215 220
Pro Asn His Pro Asp Asn Glu Asn Ser Ser Ser Val Ala Leu Glu Asn
225 230 235 240
Cys Asn Val Glu Arg Leu Glu Ser Pro Thr Thr Pro Ile Gln Pro Gln
245 250 255
Leu Trp Ser Glu Tyr Ser Asn Asp Ala Cys Val Glu Asn Ala Ile Pro
260 265 270
Thr Ser Leu Ala Ser Glu Glu Ala Pro Gly Asp His Glu Lys Ser Phe
275 280 285
Pro Glu Asn Glu Ser Asn Val Ser Lys Glu Ile Asn Gly Val Asn Val
290 295 300
Ala Cys Ser Ser Gly Gly Lys Ser Arg Ser Ala Arg Leu His Asp Ile
305 310 315 320
Lys Val Tyr Gln Gln Lys Lys Pro Ala Ser Gly Gly Ser Leu Lys His
325 330 335
Pro Asn Asn Glu Asn Ser Thr Ser Val Ala Leu Glu Asn Cys Asp Val
340 345 350
Lys Gly Leu Lys Ser Pro Ala Thr Pro Ile Gln Ser Gln Ser Ser Arg
355 360 365
Gln Leu Ser Thr Ser Pro Gly Gln Val Ile Lys Lys Ser Ala Ser Lys
370 375 380
Ile Ser Arg Thr Leu Ser Pro Lys Thr Glu Gly Cys Tyr Lys Lys Lys
385 390 395 400
Arg Val Thr Val Glu Thr Lys Val Val Met Pro Lys Gly Lys Leu Asn
405 410 415
Lys Ser Ala Ser Ala Leu Lys Asn Pro Arg Glu Lys Asp Leu Ser Pro
420 425 430
Leu Ala Lys Gly Ser Gln Gln Lys Ile Ser Thr Phe Thr Pro Glu Ser
435 440 445
Leu Ser Phe Arg Lys Ser Arg Ser Gly Arg Leu Leu Leu Pro Pro Leu
450 455 460
Glu Phe Trp Arg Asn Gln Ile Pro Ile Tyr Asn Ala Asp His Glu Ile
465 470 475 480
Thr Glu Ile Arg Asp Gly Ala Ser Leu Ile Ser Pro Cys Arg Gly Phe
485 490 495
Ser Pro Ser Leu Ser Arg Cys Ser Cys Thr Ser Ser Ile Lys Asp Leu
500 505 510
Ser Thr Ala Arg Leu Gly Thr Ile Asn Asn Asn Ser Pro Ile Lys Pro
515 520 525
Ile Cys
530
<210> 168
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in amino
acid exchange Q16stop
<400> 168
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacta gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 169
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in amino
acid exchange W25stop
<400> 169
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtagctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 170
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in amino
acid exchange W25stop
<400> 170
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtgactg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 171
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in amino
acid exchange E69K
<400> 171
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcaaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 172
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in amino
acid exchange S71F
<400> 172
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct ttcgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 173
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of KLN2 of C genome having mutation resuting in
elimination of splicing site at position 540
<400> 173
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacaa 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacgaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 174
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of T67I in SEQ ID NO: 25
<400> 174
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcayactc gaagcttccg atggagtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 175
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of L68S in SEQ ID NO: 25
<400> 175
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcacaytc gaagcttccg atggagtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 176
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of A70T in SEQ ID NO: 25
<400> 176
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcacactc gaarcttccg atggagtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 177
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of D72N in SEQ ID NO: 25
<400> 177
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcacactc gaagcttccr atggagtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 178
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of G73R in SEQ ID NO: 25
<400> 178
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcacactc gaagcttccg atrgagtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 179
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of G73E in SEQ ID NO: 25
<400> 179
tgggaattgg gaacaggaca ggagcagtga gggtgtttgc atcatcccca atcgtcaaag 60
cctttgatgt tttcacactc gaagcttccg atgragtctg catcgtccta cgtggctttc 120
tcaacaaaca acgccttgtt ctatct 146
<210> 180
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of S56L in SEQ ID NO: 25
<400> 180
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatyatc cccaatcgtc 60
aaagcctttg atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 181
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of P58S in SEQ ID NO: 25
<400> 181
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatcatc cycaatcgtc 60
aaagcctttg atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 182
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of P58L in SEQ ID NO: 25
<400> 182
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatcatc ccyaatcgtc 60
aaagcctttg atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 183
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of V60I in SEQ ID NO: 25
<400> 183
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatcatc cccaatcrtc 60
aaagcctttg atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 184
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of D64N in SEQ ID NO: 25
<400> 184
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc 60
aaagcctttr atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 185
<211> 147
<212> DNA
<213> Artificial Sequence
<220>
<223> Marker for detection of V65I in SEQ ID NO: 25
<400> 185
agtttgggaa ttgggaacag gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc 60
aaagcctttg atrttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 120
tttctcaaca aacaacgcct tgttcta 147
<210> 186
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of BnaCnng28840D
having mutation resulting in amino acid exchange Q16stop
<400> 186
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr
1 5 10 15
<210> 187
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of BnaCnng28840D
having mutation resulting in amino acid exchange W25stop
<400> 187
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp
20
<210> 188
<400> 188
000
<210> 189
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of BnaCnng28840D
having mutation resulting in amino acid exchange E69K
<400> 189
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu
20 25 30
Phe Asp Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr
35 40 45
Gly Ala Val Arg Val Phe Ala Ser Ser Pro Ile Val Lys Ala Phe Asp
50 55 60
Val Phe Thr Leu Lys Ala Ser Asp Gly Val Cys Ile Val Leu Arg Gly
65 70 75 80
Phe Leu Asn Lys Gln Arg Leu Val Leu Ser Gly Phe Leu Pro Gln Ile
85 90 95
Cys Ser Glu Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu Ser Lys Cys
100 105 110
Asn Leu Ser Phe Val Gly Leu Pro Ser Gly Ser Ala Ser Ile Asn Lys
115 120 125
Ala Ser Gly Ala Ile Leu Ser Pro Cys Asn Asn Asp Lys Lys Arg Asn
130 135 140
Leu Glu Asp Thr Lys Ser Thr Val Thr Ala Lys Lys Lys Lys Lys Asn
145 150 155 160
Thr Val Glu Ile Ser Asp Lys Pro Ser Arg Lys Lys Ser Ile Arg Leu
165 170 175
Gln Ser Lys Ser Val Glu Leu Met Ser Lys Val Gln Thr Thr Ser Ser
180 185 190
Thr Asn Asp Val Ser Asp Gly Leu Asp Lys Arg Gly Lys Ser Ser Asp
195 200 205
Asp Val Glu Lys Thr Asp Glu Cys Glu Val Ile Asn Asn Gln Val Asp
210 215 220
Gly Asn Val Val Glu Leu Val Asn His Gln Ser Gly Thr Lys Val Lys
225 230 235 240
Arg Lys Leu Asp Val Ser Gln Val Gln Lys Asn Pro Thr Thr Asn Asp
245 250 255
Gly Val Glu Arg Asp Glu Ser Met Val Asn Glu Glu Ile Ser Pro Ser
260 265 270
Pro Val Asp Gly Cys Gly Thr Asn Ser Lys Lys Ile Thr Ser Lys Asn
275 280 285
Ala Thr Leu Thr Ser Glu Glu Arg Asn Gly Lys Leu Lys Val Thr Lys
290 295 300
Thr Ser Leu Lys Asn Gly Lys Lys Ser Glu Lys Ile Leu Glu Gly Asp
305 310 315 320
Leu Asp Asp Val Val Val Glu Pro Met Met Thr Thr His Ser Arg Ser
325 330 335
Ser Lys Val Ile His Asn Leu Ser Val Gly Lys Thr Ile Arg Lys Ile
340 345 350
Asp Phe Asp Ala Glu Val Thr Pro Glu Lys Asp Ala Thr Lys Gln Lys
355 360 365
Thr Asn Ser Met Ser Ala Asp Ser Leu Gly Gln Lys Arg Ser Arg Ser
370 375 380
Gly Arg Val Leu Val Ser Pro Leu Glu Tyr Trp Arg Asn Gln Leu Pro
385 390 395 400
Val Tyr Asp Lys Asp Arg Asn Leu Ile Gln Val Asn Glu Gly His Gln
405 410 415
Thr Asn Ser Thr Ser Ser Lys Gly Lys Gly Ser Val Ser Arg Lys Pro
420 425 430
Arg Arg
<210> 190
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of BnaCnng28840D
having mutation resulting in amino acid exchange S71F
<400> 190
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu
20 25 30
Phe Asp Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr
35 40 45
Gly Ala Val Arg Val Phe Ala Ser Ser Pro Ile Val Lys Ala Phe Asp
50 55 60
Val Phe Thr Leu Glu Ala Phe Asp Gly Val Cys Ile Val Leu Arg Gly
65 70 75 80
Phe Leu Asn Lys Gln Arg Leu Val Leu Ser Gly Phe Leu Pro Gln Ile
85 90 95
Cys Ser Glu Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu Ser Lys Cys
100 105 110
Asn Leu Ser Phe Val Gly Leu Pro Ser Gly Ser Ala Ser Ile Asn Lys
115 120 125
Ala Ser Gly Ala Ile Leu Ser Pro Cys Asn Asn Asp Lys Lys Arg Asn
130 135 140
Leu Glu Asp Thr Lys Ser Thr Val Thr Ala Lys Lys Lys Lys Lys Asn
145 150 155 160
Thr Val Glu Ile Ser Asp Lys Pro Ser Arg Lys Lys Ser Ile Arg Leu
165 170 175
Gln Ser Lys Ser Val Glu Leu Met Ser Lys Val Gln Thr Thr Ser Ser
180 185 190
Thr Asn Asp Val Ser Asp Gly Leu Asp Lys Arg Gly Lys Ser Ser Asp
195 200 205
Asp Val Glu Lys Thr Asp Glu Cys Glu Val Ile Asn Asn Gln Val Asp
210 215 220
Gly Asn Val Val Glu Leu Val Asn His Gln Ser Gly Thr Lys Val Lys
225 230 235 240
Arg Lys Leu Asp Val Ser Gln Val Gln Lys Asn Pro Thr Thr Asn Asp
245 250 255
Gly Val Glu Arg Asp Glu Ser Met Val Asn Glu Glu Ile Ser Pro Ser
260 265 270
Pro Val Asp Gly Cys Gly Thr Asn Ser Lys Lys Ile Thr Ser Lys Asn
275 280 285
Ala Thr Leu Thr Ser Glu Glu Arg Asn Gly Lys Leu Lys Val Thr Lys
290 295 300
Thr Ser Leu Lys Asn Gly Lys Lys Ser Glu Lys Ile Leu Glu Gly Asp
305 310 315 320
Leu Asp Asp Val Val Val Glu Pro Met Met Thr Thr His Ser Arg Ser
325 330 335
Ser Lys Val Ile His Asn Leu Ser Val Gly Lys Thr Ile Arg Lys Ile
340 345 350
Asp Phe Asp Ala Glu Val Thr Pro Glu Lys Asp Ala Thr Lys Gln Lys
355 360 365
Thr Asn Ser Met Ser Ala Asp Ser Leu Gly Gln Lys Arg Ser Arg Ser
370 375 380
Gly Arg Val Leu Val Ser Pro Leu Glu Tyr Trp Arg Asn Gln Leu Pro
385 390 395 400
Val Tyr Asp Lys Asp Arg Asn Leu Ile Gln Val Asn Glu Gly His Gln
405 410 415
Thr Asn Ser Thr Ser Ser Lys Gly Lys Gly Ser Val Ser Arg Lys Pro
420 425 430
Arg Arg
<210> 191
<400> 191
000
<210> 192
<211> 2350
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of BnaCnng28840D having mutation resulting in amino
acid exchange E413K
<400> 192
ggaattctta ccactaaact acagccactt cgttggttga accctcaaaa ctatattcct 60
ttattacaaa atgcttcccg cggagtaatg aagaagatct cgcgccgaag tctttttttc 120
attttctaaa aagccccaac tctttcctca atacagttca gttcgactat ctctgtctct 180
ctctctctca ctctcactct ctcaatcaat cgagaaagta ctccctctgc tcctcctcca 240
tccatggctg acaatcccaa tccagacgac gacgatgtct cgtattacca gaaaacggtg 300
agtgaggcta ctttcttaaa ctctaatgag tcttacatca tcttcatctg tgtggggttt 360
taatgtaaaa aaaaaggtgg tcctgagaga ctggtggctg atcaaatgtc caattgaatt 420
cgatggcaaa cgatttggcg ttgctggtac ccagattgct gagtaagtaa ggagtagtga 480
aaccttttct caattttcgt ttttttccat tctttttaaa agtttgggaa ttgggaacag 540
gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc aaagcctttg atgttttcac 600
actcgaagct tccgatggag tctgcatcgt cctacgtggc tttctcaaca aacaacgcct 660
tgttctatct ggattcctcc ctcaggtcta tatatatata tatatatata ctagttgaaa 720
gctattatta atatgccttt tgttttcctg tagatttgca gtgagttcat cttggggttt 780
cctccttgtt gggaatcaaa atgtaacctt tccttcgtag gactgccttc tggatctgct 840
tctatcaata aaggtttgat cttttattag caacatctct gttattgtgt gtttttcctt 900
ttttttcctg atgcttatga ttagctttca ttgcagcttc tggtgccatt ttatcacctt 960
gtaacaacga caagaaacgg aatctagagg atactaaaag cactgtcact gctaagaaga 1020
agaagaagaa cacagtggag attagtgata aaccttcaag gaaaaagtct attcgtctgc 1080
agtccaaatc tgttgagttg atgagtaaag tccagactac ttcttctact aatgatgtta 1140
gtgatggttt ggacaagagg ggtaagagca gtgatgatgt agagaaaaca gatgaatgtg 1200
aggttatcaa taaccaagtt gatggcaatg tagtagagct tgtgaatcat cagtctggga 1260
ccaaagtcaa aaggaaactt gatgttagcc aagtccagaa gaatcctact actaatgatg 1320
gcgtcgaaag agatgaatct atggttaatg aagagatatc accttcacca gtggatggat 1380
gtggtactaa tagcaaaaag ataacgagta agaatgctac actgacttca gaagagcgaa 1440
atggtaagct caaggtaact aaaacatctc tgaagaatgg aaagaaaagt gagaagatcc 1500
ttgaaggtga tttggatgat gtagtagtag agcctatgat gactactcat tcaaggtcct 1560
ccaaggttat acacaactta tcagttggga aaactatcag gaagatcgac tttgatgcgg 1620
aggtaactaa ctttgttccc ctccccattt ttttttgtca caatcacata ttcttgttat 1680
caaaatattc aaatgttaat cataatgata cctccgttgt tatgtaatgc gaaggtaaca 1740
ccagagaaag atgcgacgaa acagaagacc aattcaatgt ctgctgattc attaggacag 1800
aaacggtcaa gatcaggtta atttgataga gagagtagaa gaacttattc actttcagag 1860
gctcagttga gagagcgttc actaaagaaa acaagtttcc attttaattg caggaagggt 1920
gctagtgtca ccactagagt actggcgcaa ccaacttcct gtttatgata aggtttgtga 1980
tgatgtttac tgaataacac taaccatgat gaggacatga ttttaactgt ttctgttctg 2040
gttttgtagg atcggaatct tatccaagta aacaaaggtc atcagactaa ctccacttca 2100
tctaaaggtt tgttcttctt ttcttaaaag aataaaagag ggctttcact ataattatac 2160
aaactgctct tcttgatagg gaaaggatcc gtttctcgaa agccaagaag atgaataatc 2220
aagtaaacag ctttcaacta ctttggtaat tagtgttatg gtctctgaac atgtaatcat 2280
cttaggctta ttgttggatc gtgatcgttt aacttcttgt ttttgcctaa atagagacct 2340
tagagttctt 2350
<210> 193
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of KLN2 of C genome
having mutation resulting in amino acid exchange E413K
<400> 193
Met Ala Asp Asn Pro Asn Pro Asp Asp Asp Asp Val Ser Tyr Tyr Gln
1 5 10 15
Lys Thr Val Val Leu Arg Asp Trp Trp Leu Ile Lys Cys Pro Ile Glu
20 25 30
Phe Asp Gly Lys Arg Phe Gly Val Ala Gly Thr Gln Ile Ala Glu Thr
35 40 45
Gly Ala Val Arg Val Phe Ala Ser Ser Pro Ile Val Lys Ala Phe Asp
50 55 60
Val Phe Thr Leu Glu Ala Ser Asp Gly Val Cys Ile Val Leu Arg Gly
65 70 75 80
Phe Leu Asn Lys Gln Arg Leu Val Leu Ser Gly Phe Leu Pro Gln Ile
85 90 95
Cys Ser Glu Phe Ile Leu Gly Phe Pro Pro Cys Trp Glu Ser Lys Cys
100 105 110
Asn Leu Ser Phe Val Gly Leu Pro Ser Gly Ser Ala Ser Ile Asn Lys
115 120 125
Ala Ser Gly Ala Ile Leu Ser Pro Cys Asn Asn Asp Lys Lys Arg Asn
130 135 140
Leu Glu Asp Thr Lys Ser Thr Val Thr Ala Lys Lys Lys Lys Lys Asn
145 150 155 160
Thr Val Glu Ile Ser Asp Lys Pro Ser Arg Lys Lys Ser Ile Arg Leu
165 170 175
Gln Ser Lys Ser Val Glu Leu Met Ser Lys Val Gln Thr Thr Ser Ser
180 185 190
Thr Asn Asp Val Ser Asp Gly Leu Asp Lys Arg Gly Lys Ser Ser Asp
195 200 205
Asp Val Glu Lys Thr Asp Glu Cys Glu Val Ile Asn Asn Gln Val Asp
210 215 220
Gly Asn Val Val Glu Leu Val Asn His Gln Ser Gly Thr Lys Val Lys
225 230 235 240
Arg Lys Leu Asp Val Ser Gln Val Gln Lys Asn Pro Thr Thr Asn Asp
245 250 255
Gly Val Glu Arg Asp Glu Ser Met Val Asn Glu Glu Ile Ser Pro Ser
260 265 270
Pro Val Asp Gly Cys Gly Thr Asn Ser Lys Lys Ile Thr Ser Lys Asn
275 280 285
Ala Thr Leu Thr Ser Glu Glu Arg Asn Gly Lys Leu Lys Val Thr Lys
290 295 300
Thr Ser Leu Lys Asn Gly Lys Lys Ser Glu Lys Ile Leu Glu Gly Asp
305 310 315 320
Leu Asp Asp Val Val Val Glu Pro Met Met Thr Thr His Ser Arg Ser
325 330 335
Ser Lys Val Ile His Asn Leu Ser Val Gly Lys Thr Ile Arg Lys Ile
340 345 350
Asp Phe Asp Ala Glu Val Thr Pro Glu Lys Asp Ala Thr Lys Gln Lys
355 360 365
Thr Asn Ser Met Ser Ala Asp Ser Leu Gly Gln Lys Arg Ser Arg Ser
370 375 380
Gly Arg Val Leu Val Ser Pro Leu Glu Tyr Trp Arg Asn Gln Leu Pro
385 390 395 400
Val Tyr Asp Lys Asp Arg Asn Leu Ile Gln Val Asn Lys Gly His Gln
405 410 415
Thr Asn Ser Thr Ser Ser Lys Gly Lys Gly Ser Val Ser Arg Lys Pro
420 425 430
Arg Arg
<210> 194
<211> 4846
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Sb_A0A194YKU1 having mutation resulting in amino
acid exchange A68T
<400> 194
ccactataat aatttattct cttaaaatta tctgttaaat atttaacagt attttttttc 60
ttttgctacc atgagctttt cagccacgcg ctgaacagtg ccgctacggc gctactacgt 120
ggagaggaaa cgaaaaaaga aagagagaaa aaaaaaagac cccgctccat tccgctactg 180
gcctactgcc gtgtttggaa atgaagcccc tacccgtacc cgaggcgggg agccctcacc 240
gccgcggcat gccaccgtcg ctgctcagcc cttcctcccg cagcgcggtt cccgccgccg 300
ccgacggcga ccatgacgcc gccgtctccg agcacgcctg cgtacgtacg cccgtcgccc 360
gccctaatgc tgctagggcg cgtgtcgatt cttttccttt ttctttcccc cgcccctctt 420
ccgtttcccc tttactggct gagacgcgtg tgccctgacg cgatttggtg ctgcgcgcgc 480
gcgcgcgtgc gtgcgtggtg gcctgcattt cgggtgtcta ggtcacgctg tccgagtggt 540
ggctggcaac cgcggaaggg gacgaccaga agatcgctgt caccggcaca ttcgaacggt 600
aagcatttct tcggagggga aggggaaact agacgagcca tctctgaagg tccgggcttg 660
agtgggtggc aactagtttc gtttgttttt ctgggggttc gatcttgttg ttgaggagtg 720
gcatttggag tcctccgggg ggtatgcttc aaatttgtta ttgcaaattg atacctagat 780
tgactgattt tgagttgacg ccatgcactc ctaaagaata ggccaattta attttctcag 840
actattcttt tgtcaaattg attcaacaaa ccaatgttta tgccttttgt cctatgattc 900
attcttgaca tatgagggct attaatgcct tgactgaagc atggtgaaac ttctataagt 960
catgctgctt gtgtgtttaa gcatgattac cgttttctga agtaggctgc ttttcctctt 1020
gaaagagcta cggagtcttt cgctgataac aataattatc tattgcctgc tctgacagca 1080
atcaaacagt tcaggaatac tctcctgcac ctattgccaa gcgtcatacg tcttctgttc 1140
ttgagactga ggaaggaact gtacttcgcc tccatggttt acacaatgtt ttgcgaacct 1200
atcacaatgg atattcagct aaggtatgca catcctgttt tctgtttctt gtttccggca 1260
ccaattgaat gcctatttgg acaacttttt aagtgaatac agtatcaaga gcagatgata 1320
tcttttgttt tctctatcca tccagtgatt ctatttctgt gttcctctgg ctgaaagtta 1380
ttctcgattc gagcaatatc taccatctag aaaatatcat gtaccaaaaa aatgttttgc 1440
caaaatgcat gtccaaaagg attattcagc catgcacagc tctcacaaat gccttggtct 1500
tgactgcaaa ccatgcatgc aggtctacag tgagttcctg aatgggtttc ccgactggtg 1560
gcaaagttgc aagccgtgta atcccaagct gatgaactcg cacacagaat gttgttcttc 1620
taatgccagc aattctggag tggactccac tcaattttac ctggagagat atatgcaggg 1680
gagacgtttg gattcatatg gaacatattt gattagcaaa tttcctgaca ttttggcaag 1740
tttcttacac aatgatgctg tgttccaaaa atcatcacat ttattaaatg gaaagcccag 1800
atttgaagaa tatacttgtg atggtgatat cacgacaaat gaaaatgctg ctgcctcaag 1860
tgaagctgcc acaggtaagt gtaaaggaga ttatttagag gcttctattt ccttctctcc 1920
tacaaatatt tcatttcagt gatgtttctt atagagtgtt tgtgttacct taatttaggc 1980
gatcagagaa ttccagaagt ttcattggag gttcgtgggt gccgtaaaga gactcagcac 2040
atgtcattga ctgataaggc agcagtagat gaagaaatgc cagcttcagt ttatttggat 2100
atgcaaaact ctttgtgtct gtcaaatgga acaccaatat tggaggaata cacctgtgat 2160
ggttatattc caccaaatga agatgctgct gcttcaaatg atgacaatga aagatacata 2220
gctacatcaa aagaggtgaa taacatggaa aaaatagtct tggttacggg cagcccttca 2280
agagaaagag gccatgatga cattgctact gatgttgcag tcagtgaatt ggtacacagt 2340
actccagcaa caggcacatg taattatgtt agaacagata tttaatcctg caaatacatt 2400
attttgttgg tgtttctaat agtatttttt aaaataattt agatcgtaaa aagactcctg 2460
tggcttcttt gaagagtcaa ggttcctgga aggaaaatca gcccgtagct tcaaataaga 2520
aggtattgga tcaattaatg taaacatcag cttattcagg tgtgcaagtc ttgattgtgg 2580
tccacaggag cttaagcttg ttagctaata ggcatcgtgc agtattttat gttgttatta 2640
gtgactttgc tgtttactca tgatgacatg ttcatattta gcgtatttca gcctattgtc 2700
ctatttgtgt tactcattta tgtatatgca tatagatgaa gttgattgat ccgtgtcttg 2760
gaaagcagca tgtaggccgg ccaaagaagc gaatatctcc acatgcaaag tgtcaaagtg 2820
ctacaagatc tccagggacc aggaacccag cgtcatatgt aagtgcactt ttttatctgt 2880
tgtcataaac tttagaaagt ccatgattgc aagcagtagt gttttaactt gatgatggga 2940
tatagatcta taacaatctc atttggtttg tggaattgga ctgtatgaat tgtattgggg 3000
atccaatttg attccatgtg gagtcagaaa tgggttccaa tataattatt ttgtttgcat 3060
aggtaaggaa ctgtggaaaa caaaatttga ccaaataaat tctagctggt aatatgttac 3120
ttgctccgag aaatccaatt gcacagagaa cacaactcgt tgctttgctg ctagaccttt 3180
gacatgagaa gccctatcac agattcacag ccatgtcatg agcagtagca cacaagcaca 3240
ggagggtgga gccatacact cttttcccca cgtgctcagc catactaact attggcctgt 3300
gttggctcac ttgtcagcga tgacctggcc tcattccact atctccattg tctaccagac 3360
agatttgttt gcctagcctg ttgccggatc catgtcctat tcagctaacc agatggggcc 3420
taagtatttt gcatttttgc ttgagatcga gctattgcaa aagtgatcat gcttcaagta 3480
cagattctga tgtttttgga acaatttatc ttgacccagt agcatgagac tgatattttt 3540
tatatgtatt tattgcaatg ttcctgaatc acattaggtc ctttggtctc cgcttactcg 3600
tgataaggcc acatcgttgt ctatgtccac acctgaagat ctcgaactta aaagatccag 3660
atcaggcatg tctttgtttt tttttttttg gcaacaatct ttggttgttt tgactctgct 3720
gcttcattcc aaatactcat cgtactaaag aaatggaaat tttatttcag gtcgcgtgat 3780
tgtgcccaaa ttggataatt ggtgccaaac cattgtctat ggaagggttt gtttgttttc 3840
tctatttgtt atgttgttca atcttagcta ctttgtgtta taagaacaca tatactatgc 3900
tatgcttata tcttaactga aagggtaata aaggattaaa ggtatagtta atacatggta 3960
tcttaaattt agcaaatgaa cattccattg cactaagaga caatgtgaaa tactgtgatt 4020
tgctaaatgc cactgaattt gtgcacattt ctagatccct taattcagta tgtgatagag 4080
gtaattatat gactaacata aatttatcac agcggcaaga atgaaatatg ataattcact 4140
tctatacagt gcagtttgtg aagtagaagt ataaaccaag tgtcaaagtt ggttagtcaa 4200
gatgcctgtt ctattatatg catttcaaag ttttgttagc ctccagcgat gtattactgt 4260
catggtattt tttattttgc aatgggagac aatcccgaag aaagttcaga taaatggtga 4320
attatcatga cattctgatt ttgagcaatg tttttgtttc caaggcattt cctgtgctta 4380
gatctcatga agtgccttgt tcttgcagga tggtttgatc gcagctgtca ttggtctaga 4440
ttcgccagca ctgcccaaat gtttgtttgg aatctctcat ttgtccattc tgttgtcctt 4500
aagagcatgc tttccatgtt ttgagagaat tgcttaaaga aagtcaggtg atgccctatc 4560
tagtttcatg tcatgcaact tgtgtccttt gctctgcagg gagtgaatca aaaactgatc 4620
gaaggaagaa acgaaagact aaatgagcat cttccaggcg taattgctac ttggctactc 4680
caggcgaaga aaattggaac taacttaatg tgattactcc aggccaagaa aaccagaact 4740
aacttaatgt ggcgggttgg tcgcttttaa tagattttca gtagaggagc ctctcctgtt 4800
ctctctaaaa atatgtgtgt gtgtgtgtgt gggggggggg gggggg 4846
<210> 195
<211> 4846
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Sb_A0A194YKU1 having mutation resulting in amino
acid exchange W54stop
<400> 195
ccactataat aatttattct cttaaaatta tctgttaaat atttaacagt attttttttc 60
ttttgctacc atgagctttt cagccacgcg ctgaacagtg ccgctacggc gctactacgt 120
ggagaggaaa cgaaaaaaga aagagagaaa aaaaaaagac cccgctccat tccgctactg 180
gcctactgcc gtgtttggaa atgaagcccc tacccgtacc cgaggcgggg agccctcacc 240
gccgcggcat gccaccgtcg ctgctcagcc cttcctcccg cagcgcggtt cccgccgccg 300
ccgacggcga ccatgacgcc gccgtctccg agcacgcctg cgtacgtacg cccgtcgccc 360
gccctaatgc tgctagggcg cgtgtcgatt cttttccttt ttctttcccc cgcccctctt 420
ccgtttcccc tttactggct gagacgcgtg tgccctgacg cgatttggtg ctgcgcgcgc 480
gcgcgcgtgc gtgcgtggtg gcctgcattt cgggtgtcta ggtcacgctg tccgagtggt 540
gactggcaac cgcggaaggg gacgaccaga agatcgctgt cgccggcaca ttcgaacggt 600
aagcatttct tcggagggga aggggaaact agacgagcca tctctgaagg tccgggcttg 660
agtgggtggc aactagtttc gtttgttttt ctgggggttc gatcttgttg ttgaggagtg 720
gcatttggag tcctccgggg ggtatgcttc aaatttgtta ttgcaaattg atacctagat 780
tgactgattt tgagttgacg ccatgcactc ctaaagaata ggccaattta attttctcag 840
actattcttt tgtcaaattg attcaacaaa ccaatgttta tgccttttgt cctatgattc 900
attcttgaca tatgagggct attaatgcct tgactgaagc atggtgaaac ttctataagt 960
catgctgctt gtgtgtttaa gcatgattac cgttttctga agtaggctgc ttttcctctt 1020
gaaagagcta cggagtcttt cgctgataac aataattatc tattgcctgc tctgacagca 1080
atcaaacagt tcaggaatac tctcctgcac ctattgccaa gcgtcatacg tcttctgttc 1140
ttgagactga ggaaggaact gtacttcgcc tccatggttt acacaatgtt ttgcgaacct 1200
atcacaatgg atattcagct aaggtatgca catcctgttt tctgtttctt gtttccggca 1260
ccaattgaat gcctatttgg acaacttttt aagtgaatac agtatcaaga gcagatgata 1320
tcttttgttt tctctatcca tccagtgatt ctatttctgt gttcctctgg ctgaaagtta 1380
ttctcgattc gagcaatatc taccatctag aaaatatcat gtaccaaaaa aatgttttgc 1440
caaaatgcat gtccaaaagg attattcagc catgcacagc tctcacaaat gccttggtct 1500
tgactgcaaa ccatgcatgc aggtctacag tgagttcctg aatgggtttc ccgactggtg 1560
gcaaagttgc aagccgtgta atcccaagct gatgaactcg cacacagaat gttgttcttc 1620
taatgccagc aattctggag tggactccac tcaattttac ctggagagat atatgcaggg 1680
gagacgtttg gattcatatg gaacatattt gattagcaaa tttcctgaca ttttggcaag 1740
tttcttacac aatgatgctg tgttccaaaa atcatcacat ttattaaatg gaaagcccag 1800
atttgaagaa tatacttgtg atggtgatat cacgacaaat gaaaatgctg ctgcctcaag 1860
tgaagctgcc acaggtaagt gtaaaggaga ttatttagag gcttctattt ccttctctcc 1920
tacaaatatt tcatttcagt gatgtttctt atagagtgtt tgtgttacct taatttaggc 1980
gatcagagaa ttccagaagt ttcattggag gttcgtgggt gccgtaaaga gactcagcac 2040
atgtcattga ctgataaggc agcagtagat gaagaaatgc cagcttcagt ttatttggat 2100
atgcaaaact ctttgtgtct gtcaaatgga acaccaatat tggaggaata cacctgtgat 2160
ggttatattc caccaaatga agatgctgct gcttcaaatg atgacaatga aagatacata 2220
gctacatcaa aagaggtgaa taacatggaa aaaatagtct tggttacggg cagcccttca 2280
agagaaagag gccatgatga cattgctact gatgttgcag tcagtgaatt ggtacacagt 2340
actccagcaa caggcacatg taattatgtt agaacagata tttaatcctg caaatacatt 2400
attttgttgg tgtttctaat agtatttttt aaaataattt agatcgtaaa aagactcctg 2460
tggcttcttt gaagagtcaa ggttcctgga aggaaaatca gcccgtagct tcaaataaga 2520
aggtattgga tcaattaatg taaacatcag cttattcagg tgtgcaagtc ttgattgtgg 2580
tccacaggag cttaagcttg ttagctaata ggcatcgtgc agtattttat gttgttatta 2640
gtgactttgc tgtttactca tgatgacatg ttcatattta gcgtatttca gcctattgtc 2700
ctatttgtgt tactcattta tgtatatgca tatagatgaa gttgattgat ccgtgtcttg 2760
gaaagcagca tgtaggccgg ccaaagaagc gaatatctcc acatgcaaag tgtcaaagtg 2820
ctacaagatc tccagggacc aggaacccag cgtcatatgt aagtgcactt ttttatctgt 2880
tgtcataaac tttagaaagt ccatgattgc aagcagtagt gttttaactt gatgatggga 2940
tatagatcta taacaatctc atttggtttg tggaattgga ctgtatgaat tgtattgggg 3000
atccaatttg attccatgtg gagtcagaaa tgggttccaa tataattatt ttgtttgcat 3060
aggtaaggaa ctgtggaaaa caaaatttga ccaaataaat tctagctggt aatatgttac 3120
ttgctccgag aaatccaatt gcacagagaa cacaactcgt tgctttgctg ctagaccttt 3180
gacatgagaa gccctatcac agattcacag ccatgtcatg agcagtagca cacaagcaca 3240
ggagggtgga gccatacact cttttcccca cgtgctcagc catactaact attggcctgt 3300
gttggctcac ttgtcagcga tgacctggcc tcattccact atctccattg tctaccagac 3360
agatttgttt gcctagcctg ttgccggatc catgtcctat tcagctaacc agatggggcc 3420
taagtatttt gcatttttgc ttgagatcga gctattgcaa aagtgatcat gcttcaagta 3480
cagattctga tgtttttgga acaatttatc ttgacccagt agcatgagac tgatattttt 3540
tatatgtatt tattgcaatg ttcctgaatc acattaggtc ctttggtctc cgcttactcg 3600
tgataaggcc acatcgttgt ctatgtccac acctgaagat ctcgaactta aaagatccag 3660
atcaggcatg tctttgtttt tttttttttg gcaacaatct ttggttgttt tgactctgct 3720
gcttcattcc aaatactcat cgtactaaag aaatggaaat tttatttcag gtcgcgtgat 3780
tgtgcccaaa ttggataatt ggtgccaaac cattgtctat ggaagggttt gtttgttttc 3840
tctatttgtt atgttgttca atcttagcta ctttgtgtta taagaacaca tatactatgc 3900
tatgcttata tcttaactga aagggtaata aaggattaaa ggtatagtta atacatggta 3960
tcttaaattt agcaaatgaa cattccattg cactaagaga caatgtgaaa tactgtgatt 4020
tgctaaatgc cactgaattt gtgcacattt ctagatccct taattcagta tgtgatagag 4080
gtaattatat gactaacata aatttatcac agcggcaaga atgaaatatg ataattcact 4140
tctatacagt gcagtttgtg aagtagaagt ataaaccaag tgtcaaagtt ggttagtcaa 4200
gatgcctgtt ctattatatg catttcaaag ttttgttagc ctccagcgat gtattactgt 4260
catggtattt tttattttgc aatgggagac aatcccgaag aaagttcaga taaatggtga 4320
attatcatga cattctgatt ttgagcaatg tttttgtttc caaggcattt cctgtgctta 4380
gatctcatga agtgccttgt tcttgcagga tggtttgatc gcagctgtca ttggtctaga 4440
ttcgccagca ctgcccaaat gtttgtttgg aatctctcat ttgtccattc tgttgtcctt 4500
aagagcatgc tttccatgtt ttgagagaat tgcttaaaga aagtcaggtg atgccctatc 4560
tagtttcatg tcatgcaact tgtgtccttt gctctgcagg gagtgaatca aaaactgatc 4620
gaaggaagaa acgaaagact aaatgagcat cttccaggcg taattgctac ttggctactc 4680
caggcgaaga aaattggaac taacttaatg tgattactcc aggccaagaa aaccagaact 4740
aacttaatgt ggcgggttgg tcgcttttaa tagattttca gtagaggagc ctctcctgtt 4800
ctctctaaaa atatgtgtgt gtgtgtgtgt gggggggggg gggggg 4846
<210> 196
<211> 4846
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Sb_A0A194YKU1 having mutation resulting in amino
acid exchange T440I
<400> 196
ccactataat aatttattct cttaaaatta tctgttaaat atttaacagt attttttttc 60
ttttgctacc atgagctttt cagccacgcg ctgaacagtg ccgctacggc gctactacgt 120
ggagaggaaa cgaaaaaaga aagagagaaa aaaaaaagac cccgctccat tccgctactg 180
gcctactgcc gtgtttggaa atgaagcccc tacccgtacc cgaggcgggg agccctcacc 240
gccgcggcat gccaccgtcg ctgctcagcc cttcctcccg cagcgcggtt cccgccgccg 300
ccgacggcga ccatgacgcc gccgtctccg agcacgcctg cgtacgtacg cccgtcgccc 360
gccctaatgc tgctagggcg cgtgtcgatt cttttccttt ttctttcccc cgcccctctt 420
ccgtttcccc tttactggct gagacgcgtg tgccctgacg cgatttggtg ctgcgcgcgc 480
gcgcgcgtgc gtgcgtggtg gcctgcattt cgggtgtcta ggtcacgctg tccgagtggt 540
ggctggcaac cgcggaaggg gacgaccaga agatcgctgt cgccggcaca ttcgaacggt 600
aagcatttct tcggagggga aggggaaact agacgagcca tctctgaagg tccgggcttg 660
agtgggtggc aactagtttc gtttgttttt ctgggggttc gatcttgttg ttgaggagtg 720
gcatttggag tcctccgggg ggtatgcttc aaatttgtta ttgcaaattg atacctagat 780
tgactgattt tgagttgacg ccatgcactc ctaaagaata ggccaattta attttctcag 840
actattcttt tgtcaaattg attcaacaaa ccaatgttta tgccttttgt cctatgattc 900
attcttgaca tatgagggct attaatgcct tgactgaagc atggtgaaac ttctataagt 960
catgctgctt gtgtgtttaa gcatgattac cgttttctga agtaggctgc ttttcctctt 1020
gaaagagcta cggagtcttt cgctgataac aataattatc tattgcctgc tctgacagca 1080
atcaaacagt tcaggaatac tctcctgcac ctattgccaa gcgtcatacg tcttctgttc 1140
ttgagactga ggaaggaact gtacttcgcc tccatggttt acacaatgtt ttgcgaacct 1200
atcacaatgg atattcagct aaggtatgca catcctgttt tctgtttctt gtttccggca 1260
ccaattgaat gcctatttgg acaacttttt aagtgaatac agtatcaaga gcagatgata 1320
tcttttgttt tctctatcca tccagtgatt ctatttctgt gttcctctgg ctgaaagtta 1380
ttctcgattc gagcaatatc taccatctag aaaatatcat gtaccaaaaa aatgttttgc 1440
caaaatgcat gtccaaaagg attattcagc catgcacagc tctcacaaat gccttggtct 1500
tgactgcaaa ccatgcatgc aggtctacag tgagttcctg aatgggtttc ccgactggtg 1560
gcaaagttgc aagccgtgta atcccaagct gatgaactcg cacacagaat gttgttcttc 1620
taatgccagc aattctggag tggactccac tcaattttac ctggagagat atatgcaggg 1680
gagacgtttg gattcatatg gaacatattt gattagcaaa tttcctgaca ttttggcaag 1740
tttcttacac aatgatgctg tgttccaaaa atcatcacat ttattaaatg gaaagcccag 1800
atttgaagaa tatacttgtg atggtgatat cacgacaaat gaaaatgctg ctgcctcaag 1860
tgaagctgcc acaggtaagt gtaaaggaga ttatttagag gcttctattt ccttctctcc 1920
tacaaatatt tcatttcagt gatgtttctt atagagtgtt tgtgttacct taatttaggc 1980
gatcagagaa ttccagaagt ttcattggag gttcgtgggt gccgtaaaga gactcagcac 2040
atgtcattga ctgataaggc agcagtagat gaagaaatgc cagcttcagt ttatttggat 2100
atgcaaaact ctttgtgtct gtcaaatgga acaccaatat tggaggaata cacctgtgat 2160
ggttatattc caccaaatga agatgctgct gcttcaaatg atgacaatga aagatacata 2220
gctacatcaa aagaggtgaa taacatggaa aaaatagtct tggttacggg cagcccttca 2280
agagaaagag gccatgatga cattgctact gatgttgcag tcagtgaatt ggtacacagt 2340
actccagcaa caggcacatg taattatgtt agaacagata tttaatcctg caaatacatt 2400
attttgttgg tgtttctaat agtatttttt aaaataattt agatcgtaaa aagactcctg 2460
tggcttcttt gaagagtcaa ggttcctgga aggaaaatca gcccgtagct tcaaataaga 2520
aggtattgga tcaattaatg taaacatcag cttattcagg tgtgcaagtc ttgattgtgg 2580
tccacaggag cttaagcttg ttagctaata ggcatcgtgc agtattttat gttgttatta 2640
gtgactttgc tgtttactca tgatgacatg ttcatattta gcgtatttca gcctattgtc 2700
ctatttgtgt tactcattta tgtatatgca tatagatgaa gttgattgat ccgtgtcttg 2760
gaaagcagca tgtaggccgg ccaaagaagc gaatatctcc acatgcaaag tgtcaaagtg 2820
ctacaagatc tccagggacc aggaacccag cgtcatatgt aagtgcactt ttttatctgt 2880
tgtcataaac tttagaaagt ccatgattgc aagcagtagt gttttaactt gatgatggga 2940
tatagatcta taacaatctc atttggtttg tggaattgga ctgtatgaat tgtattgggg 3000
atccaatttg attccatgtg gagtcagaaa tgggttccaa tataattatt ttgtttgcat 3060
aggtaaggaa ctgtggaaaa caaaatttga ccaaataaat tctagctggt aatatgttac 3120
ttgctccgag aaatccaatt gcacagagaa cacaactcgt tgctttgctg ctagaccttt 3180
gacatgagaa gccctatcac agattcacag ccatgtcatg agcagtagca cacaagcaca 3240
ggagggtgga gccatacact cttttcccca cgtgctcagc catactaact attggcctgt 3300
gttggctcac ttgtcagcga tgacctggcc tcattccact atctccattg tctaccagac 3360
agatttgttt gcctagcctg ttgccggatc catgtcctat tcagctaacc agatggggcc 3420
taagtatttt gcatttttgc ttgagatcga gctattgcaa aagtgatcat gcttcaagta 3480
cagattctga tgtttttgga acaatttatc ttgacccagt agcatgagac tgatattttt 3540
tatatgtatt tattgcaatg ttcctgaatc acattaggtc ctttggtctc cgcttattcg 3600
tgataaggcc acatcgttgt ctatgtccac acctgaagat ctcgaactta aaagatccag 3660
atcaggcatg tctttgtttt tttttttttg gcaacaatct ttggttgttt tgactctgct 3720
gcttcattcc aaatactcat cgtactaaag aaatggaaat tttatttcag gtcgcgtgat 3780
tgtgcccaaa ttggataatt ggtgccaaac cattgtctat ggaagggttt gtttgttttc 3840
tctatttgtt atgttgttca atcttagcta ctttgtgtta taagaacaca tatactatgc 3900
tatgcttata tcttaactga aagggtaata aaggattaaa ggtatagtta atacatggta 3960
tcttaaattt agcaaatgaa cattccattg cactaagaga caatgtgaaa tactgtgatt 4020
tgctaaatgc cactgaattt gtgcacattt ctagatccct taattcagta tgtgatagag 4080
gtaattatat gactaacata aatttatcac agcggcaaga atgaaatatg ataattcact 4140
tctatacagt gcagtttgtg aagtagaagt ataaaccaag tgtcaaagtt ggttagtcaa 4200
gatgcctgtt ctattatatg catttcaaag ttttgttagc ctccagcgat gtattactgt 4260
catggtattt tttattttgc aatgggagac aatcccgaag aaagttcaga taaatggtga 4320
attatcatga cattctgatt ttgagcaatg tttttgtttc caaggcattt cctgtgctta 4380
gatctcatga agtgccttgt tcttgcagga tggtttgatc gcagctgtca ttggtctaga 4440
ttcgccagca ctgcccaaat gtttgtttgg aatctctcat ttgtccattc tgttgtcctt 4500
aagagcatgc tttccatgtt ttgagagaat tgcttaaaga aagtcaggtg atgccctatc 4560
tagtttcatg tcatgcaact tgtgtccttt gctctgcagg gagtgaatca aaaactgatc 4620
gaaggaagaa acgaaagact aaatgagcat cttccaggcg taattgctac ttggctactc 4680
caggcgaaga aaattggaac taacttaatg tgattactcc aggccaagaa aaccagaact 4740
aacttaatgt ggcgggttgg tcgcttttaa tagattttca gtagaggagc ctctcctgtt 4800
ctctctaaaa atatgtgtgt gtgtgtgtgt gggggggggg gggggg 4846
<210> 197
<211> 513
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Sb_A0A194YKU1
having mutation resulting in amino acid exchange A68T
<400> 197
Met Lys Pro Leu Pro Val Pro Glu Ala Gly Ser Pro His Arg Arg Gly
1 5 10 15
Met Pro Pro Ser Leu Leu Ser Pro Ser Ser Arg Ser Ala Val Pro Ala
20 25 30
Ala Ala Asp Gly Asp His Asp Ala Ala Val Ser Glu His Ala Cys Val
35 40 45
Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln Lys
50 55 60
Ile Ala Val Thr Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu Tyr
65 70 75 80
Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr
85 90 95
Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu Arg
100 105 110
Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu Asn
115 120 125
Gly Phe Pro Asp Trp Trp Gln Ser Cys Lys Pro Cys Asn Pro Lys Leu
130 135 140
Met Asn Ser His Thr Glu Cys Cys Ser Ser Asn Ala Ser Asn Ser Gly
145 150 155 160
Val Asp Ser Thr Gln Phe Tyr Leu Glu Arg Tyr Met Gln Gly Arg Arg
165 170 175
Leu Asp Ser Tyr Gly Thr Tyr Leu Ile Ser Lys Phe Pro Asp Ile Leu
180 185 190
Ala Ser Phe Leu His Asn Asp Ala Val Phe Gln Lys Ser Ser His Leu
195 200 205
Leu Asn Gly Lys Pro Arg Phe Glu Glu Tyr Thr Cys Asp Gly Asp Ile
210 215 220
Thr Thr Asn Glu Asn Ala Ala Ala Ser Ser Glu Ala Ala Thr Gly Asp
225 230 235 240
Gln Arg Ile Pro Glu Val Ser Leu Glu Val Arg Gly Cys Arg Lys Glu
245 250 255
Thr Gln His Met Ser Leu Thr Asp Lys Ala Ala Val Asp Glu Glu Met
260 265 270
Pro Ala Ser Val Tyr Leu Asp Met Gln Asn Ser Leu Cys Leu Ser Asn
275 280 285
Gly Thr Pro Ile Leu Glu Glu Tyr Thr Cys Asp Gly Tyr Ile Pro Pro
290 295 300
Asn Glu Asp Ala Ala Ala Ser Asn Asp Asp Asn Glu Arg Tyr Ile Ala
305 310 315 320
Thr Ser Lys Glu Val Asn Asn Met Glu Lys Ile Val Leu Val Thr Gly
325 330 335
Ser Pro Ser Arg Glu Arg Gly His Asp Asp Ile Ala Thr Asp Val Ala
340 345 350
Val Ser Glu Leu Val His Ser Thr Pro Ala Thr Gly Thr Tyr Arg Lys
355 360 365
Lys Thr Pro Val Ala Ser Leu Lys Ser Gln Gly Ser Trp Lys Glu Asn
370 375 380
Gln Pro Val Ala Ser Asn Lys Lys Met Lys Leu Ile Asp Pro Cys Leu
385 390 395 400
Gly Lys Gln His Val Gly Arg Pro Lys Lys Arg Ile Ser Pro His Ala
405 410 415
Lys Cys Gln Ser Ala Thr Arg Ser Pro Gly Thr Arg Asn Pro Ala Ser
420 425 430
Tyr Val Leu Trp Ser Pro Leu Thr Arg Asp Lys Ala Thr Ser Leu Ser
435 440 445
Met Ser Thr Pro Glu Asp Leu Glu Leu Lys Arg Ser Arg Ser Gly Arg
450 455 460
Val Ile Val Pro Lys Leu Asp Asn Trp Cys Gln Thr Ile Val Tyr Gly
465 470 475 480
Arg Asp Gly Leu Ile Ala Ala Val Ile Gly Leu Asp Ser Pro Ala Leu
485 490 495
Pro Lys Trp Ser Glu Ser Lys Thr Asp Arg Arg Lys Lys Arg Lys Thr
500 505 510
Lys
<210> 198
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Sb_A0A194YKU1
having mutation resulting in amino acid exchange W54stop
<400> 198
Met Lys Pro Leu Pro Val Pro Glu Ala Gly Ser Pro His Arg Arg Gly
1 5 10 15
Met Pro Pro Ser Leu Leu Ser Pro Ser Ser Arg Ser Ala Val Pro Ala
20 25 30
Ala Ala Asp Gly Asp His Asp Ala Ala Val Ser Glu His Ala Cys Val
35 40 45
Thr Leu Ser Glu Trp
50
<210> 199
<211> 513
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Sb_A0A194YKU1
having mutation resulting in amino acid exchange T440I
<400> 199
Met Lys Pro Leu Pro Val Pro Glu Ala Gly Ser Pro His Arg Arg Gly
1 5 10 15
Met Pro Pro Ser Leu Leu Ser Pro Ser Ser Arg Ser Ala Val Pro Ala
20 25 30
Ala Ala Asp Gly Asp His Asp Ala Ala Val Ser Glu His Ala Cys Val
35 40 45
Thr Leu Ser Glu Trp Trp Leu Ala Thr Ala Glu Gly Asp Asp Gln Lys
50 55 60
Ile Ala Val Ala Gly Thr Phe Glu Arg Asn Gln Thr Val Gln Glu Tyr
65 70 75 80
Ser Pro Ala Pro Ile Ala Lys Arg His Thr Ser Ser Val Leu Glu Thr
85 90 95
Glu Glu Gly Thr Val Leu Arg Leu His Gly Leu His Asn Val Leu Arg
100 105 110
Thr Tyr His Asn Gly Tyr Ser Ala Lys Val Tyr Ser Glu Phe Leu Asn
115 120 125
Gly Phe Pro Asp Trp Trp Gln Ser Cys Lys Pro Cys Asn Pro Lys Leu
130 135 140
Met Asn Ser His Thr Glu Cys Cys Ser Ser Asn Ala Ser Asn Ser Gly
145 150 155 160
Val Asp Ser Thr Gln Phe Tyr Leu Glu Arg Tyr Met Gln Gly Arg Arg
165 170 175
Leu Asp Ser Tyr Gly Thr Tyr Leu Ile Ser Lys Phe Pro Asp Ile Leu
180 185 190
Ala Ser Phe Leu His Asn Asp Ala Val Phe Gln Lys Ser Ser His Leu
195 200 205
Leu Asn Gly Lys Pro Arg Phe Glu Glu Tyr Thr Cys Asp Gly Asp Ile
210 215 220
Thr Thr Asn Glu Asn Ala Ala Ala Ser Ser Glu Ala Ala Thr Gly Asp
225 230 235 240
Gln Arg Ile Pro Glu Val Ser Leu Glu Val Arg Gly Cys Arg Lys Glu
245 250 255
Thr Gln His Met Ser Leu Thr Asp Lys Ala Ala Val Asp Glu Glu Met
260 265 270
Pro Ala Ser Val Tyr Leu Asp Met Gln Asn Ser Leu Cys Leu Ser Asn
275 280 285
Gly Thr Pro Ile Leu Glu Glu Tyr Thr Cys Asp Gly Tyr Ile Pro Pro
290 295 300
Asn Glu Asp Ala Ala Ala Ser Asn Asp Asp Asn Glu Arg Tyr Ile Ala
305 310 315 320
Thr Ser Lys Glu Val Asn Asn Met Glu Lys Ile Val Leu Val Thr Gly
325 330 335
Ser Pro Ser Arg Glu Arg Gly His Asp Asp Ile Ala Thr Asp Val Ala
340 345 350
Val Ser Glu Leu Val His Ser Thr Pro Ala Thr Gly Thr Tyr Arg Lys
355 360 365
Lys Thr Pro Val Ala Ser Leu Lys Ser Gln Gly Ser Trp Lys Glu Asn
370 375 380
Gln Pro Val Ala Ser Asn Lys Lys Met Lys Leu Ile Asp Pro Cys Leu
385 390 395 400
Gly Lys Gln His Val Gly Arg Pro Lys Lys Arg Ile Ser Pro His Ala
405 410 415
Lys Cys Gln Ser Ala Thr Arg Ser Pro Gly Thr Arg Asn Pro Ala Ser
420 425 430
Tyr Val Leu Trp Ser Pro Leu Ile Arg Asp Lys Ala Thr Ser Leu Ser
435 440 445
Met Ser Thr Pro Glu Asp Leu Glu Leu Lys Arg Ser Arg Ser Gly Arg
450 455 460
Val Ile Val Pro Lys Leu Asp Asn Trp Cys Gln Thr Ile Val Tyr Gly
465 470 475 480
Arg Asp Gly Leu Ile Ala Ala Val Ile Gly Leu Asp Ser Pro Ala Leu
485 490 495
Pro Lys Trp Ser Glu Ser Lys Thr Asp Arg Arg Lys Lys Arg Lys Thr
500 505 510
Lys
<210> 200
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange T12I
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 200
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcattc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 201
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange W17stop
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 201
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtgactaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 202
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P22S
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 202
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaaccctcaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 203
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P22L
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 203
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccctaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 204
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange G33E
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 204
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag aggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 205
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange S49F
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 205
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttcttttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 206
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P52L
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 206
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgctcatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 207
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange T64I
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 207
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagat agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 208
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange R80H
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 208
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacaca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 209
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange N84K
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 209
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa gggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 210
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P88S
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 210
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
tctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 211
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P100L
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 211
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttccccct ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 212
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange P100S
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 212
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccctc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 213
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange G390R
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 213
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacaaga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 214
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange T12I
<400> 214
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Ile Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 215
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange W17stop
<400> 215
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
<210> 216
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P22S
<400> 216
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Ser Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 217
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P22L
<400> 217
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Leu Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 218
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange G33E
<400> 218
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Glu Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 219
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange S49F
<400> 219
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Phe Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 220
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P52L
<400> 220
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Leu Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 221
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange T64I
<400> 221
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Ile
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 222
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange R80H
<400> 222
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln His
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 223
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange N84K
<400> 223
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Lys Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 224
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P88S
<400> 224
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Ser Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 225
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P100L
<400> 225
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Leu Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 226
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange P100S
<400> 226
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Ser Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 227
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange G390R
<400> 227
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Arg Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 228
<211> 1281
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA sequence of Bn KNL2_A-Genom
<400> 228
atggctgaca atcctaatcc caatccagac gaggaagatg tgtcgtatta cgagaaaacg 60
gtggtcctga gagactggtg gctgatcaaa tgtccaattg aattccaagg caaacgattt 120
ggcgttgctg gtacccagat tgctgagaca ggagcagtga gggtgtttac atcatcccca 180
atcctcaaag cctttgatgt tttcacactc gaagcttctg acggagtctg catcgtccta 240
cgtggctttc tcaacaaacc acgccttgtt cactctggat tcctccctca gatttgcagt 300
gagttcatct tggggtttcc tccttactgg gaatcaaaat gtaacctttc cttcgtagga 360
ctgccttctg gatcagcttc tatcaataaa gcttctggta ccattttatc accttgtaac 420
aacgacaaga aacggaatct agaggatact ccagctcgga gaagagtagt taaaaccatt 480
gtcactgcta agaagaagaa gcagaacact gtggagatta gtgatagacc ttcaaggaaa 540
aagtctcttc gtctgcagtc caaatctgtt gaattgatga gtaaactcca gactacttct 600
tctactaatg atggtttgga caagagtgct aagtgcagtg atgatgtaga gaaaacagat 660
gaatctgagg ttaccaataa ccaagttgat ggatgtggta agaagcgtgt gaatcatcag 720
tctgggacca aagtcaaaag gaaacttgat gttagcgaac tccagaagaa tcctactact 780
aatgatgaat ctatggataa tgaagagata tcaccttcac cagtggatgg gtgtggtact 840
aatagcaaaa agataacaag taagaatgct acactgactt cagaagagcg aaatggtaag 900
ctcaaggtaa ctaaaacatc tctaaagaat gggaagaaaa gtgagaagat ccttgaaggt 960
gatttggatg atgtagtagt agagcctatg acgacgactc attcaaggtc ctccaaggtt 1020
aaacacaact tatcagttgg gaaaactatc aggaagatcg actttgatct ggaggtaact 1080
ccagagaaag atgcgacgaa acataacaag accaattcaa tgtctgctga ttcattagga 1140
cagaaacggg tgctagtgtc cccactagag tactggcgca accaacttcc tgtttatgat 1200
aaggatcgga atcttatcca agtaaacgaa ggtcgtcaga ctaactccac ttcgtctaaa 1260
ggtttgttct tcttttctta a 1281
<210> 229
<211> 1305
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA sequence of BnaCnng28840D
<400> 229
atggctgaca atcccaatcc agacgacgac gatgtctcgt attaccagaa aacggtggtc 60
ctgagagact ggtggctgat caaatgtcca attgaattcg atggcaaacg atttggcgtt 120
gctggtaccc agattgctga gacaggagca gtgagggtgt ttgcatcatc cccaatcgtc 180
aaagcctttg atgttttcac actcgaagct tccgatggag tctgcatcgt cctacgtggc 240
tttctcaaca aacaacgcct tgttctatct ggattcctcc ctcagatttg cagtgagttc 300
atcttggggt ttcctccttg ttgggaatca aaatgtaacc tttccttcgt aggactgcct 360
tctggatctg cttctatcaa taaagcttct ggtgccattt tatcaccttg taacaacgac 420
aagaaacgga atctagagga tactaaaagc actgtcactg ctaagaagaa gaagaagaac 480
acagtggaga ttagtgataa accttcaagg aaaaagtcta ttcgtctgca gtccaaatct 540
gttgagttga tgagtaaagt ccagactact tcttctacta atgatgttag tgatggtttg 600
gacaagaggg gtaagagcag tgatgatgta gagaaaacag atgaatgtga ggttatcaat 660
aaccaagttg atggcaatgt agtagagctt gtgaatcatc agtctgggac caaagtcaaa 720
aggaaacttg atgttagcca agtccagaag aatcctacta ctaatgatgg cgtcgaaaga 780
gatgaatcta tggttaatga agagatatca ccttcaccag tggatggatg tggtactaat 840
agcaaaaaga taacgagtaa gaatgctaca ctgacttcag aagagcgaaa tggtaagctc 900
aaggtaacta aaacatctct gaagaatgga aagaaaagtg agaagatcct tgaaggtgat 960
ttggatgatg tagtagtaga gcctatgatg actactcatt caaggtcctc caaggttata 1020
cacaacttat cagttgggaa aactatcagg aagatcgact ttgatgcgga ggtaacacca 1080
gagaaagatg cgacgaaaca gaagaccaat tcaatgtctg ctgattcatt aggacagaaa 1140
cggtcaagat caggaagggt gctagtgtca ccactagagt actggcgcaa ccaacttcct 1200
gtttatgata aggatcggaa tcttatccaa gtaaacgaag gtcatcagac taactccact 1260
tcatctaaag ggaaaggatc cgtttctcga aagccaagaa gatga 1305
<210> 230
<211> 1542
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA sequence of Sb_A0A194YKU1
<400> 230
atgaagcccc tacccgtacc cgaggcgggg agccctcacc gccgcggcat gccaccgtcg 60
ctgctcagcc cttcctcccg cagcgcggtt cccgccgccg ccgacggcga ccatgacgcc 120
gccgtctccg agcacgcctg cgtaacgctg tccgagtggt ggctggcaac cgcggaaggg 180
gacgaccaga agatcgctgt cgccggcaca ttcgaacgga atcaaacagt tcaggaatac 240
tctcctgcac ctattgccaa gcgtcatacg tcttctgttc ttgagactga ggaaggaact 300
gtacttcgcc tccatggttt acacaatgtt ttgcgaacct atcacaatgg atattcagct 360
aaggtataca gtgagttcct gaatgggttt cccgactggt ggcaaagttg caagccgtgt 420
aatcccaagc tgatgaactc gcacacagaa tgttgttctt ctaatgccag caattctgga 480
gtggactcca ctcaatttta cctggagaga tatatgcagg ggagacgttt ggattcatat 540
ggaacatatt tgattagcaa atttcctgac attttggcaa gtttcttaca caatgatgct 600
gtgttccaaa aatcatcaca tttattaaat ggaaagccca gatttgaaga atatacttgt 660
gatggtgata tcacgacaaa tgaaaatgct gctgcctcaa gtgaagctgc cacaggtgat 720
cagagaattc cagaagtttc attggaggtt cgtgggtgcc gtaaagagac tcagcacatg 780
tcattgactg ataaggcagc agtagatgaa gaaatgccag cttcagttta tttggatatg 840
caaaactctt tgtgtctgtc aaatggaaca ccaatattgg aggaatacac ctgtgatggt 900
tatattccac caaatgaaga tgctgctgct tcaaatgatg acaatgaaag atacatagct 960
acatcaaaag aggtgaataa catggaaaaa atagtcttgg ttacgggcag cccttcaaga 1020
gaaagaggcc atgatgacat tgctactgat gttgcagtca gtgaattggt acacagtact 1080
ccagcaacag gcacataccg taaaaagact cctgtggctt ctttgaagag tcaaggttcc 1140
tggaaggaaa atcagcccgt agcttcaaat aagaagatga agttgattga tccgtgtctt 1200
ggaaagcagc atgtaggccg gccaaagaag cgaatatctc cacatgcaaa gtgtcaaagt 1260
gctacaagat ctccagggac caggaaccca gcgtcatatg tcctttggtc tccgcttact 1320
cgtgataagg ccacatcgtt gtctatgtcc acacctgaag atctcgaact taaaagatcc 1380
agatcaggcc gcgtgattgt gcccaaattg gataattggt gccaaaccat tgtctatgga 1440
agggatggtt tgatcgcagc tgtcattggt ctagattcgc cagcactgcc caaatggagt 1500
gaatcaaaaa ctgatcgaag gaagaaacga aagactaaat ga 1542
<210> 231
<211> 1263
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA sequence of Ha_A0A251U7G7
<400> 231
atggcttctt gctcttactt ccagaagact gtcactctgc tagactggtg gctaaccaaa 60
cccccaacca acgatcacta tcaaacccta accctagggg ttgcaggctt cacttctcaa 120
cagaaccggc ctgctcgatg tttctcttct gcgcccatac tcaagatctt cgatttattt 180
gagttggaga cagttgatgg tgtatgcgtc attctccagg gttttattaa caaacaacgc 240
acccttgaaa atggattttc ccctcaggtg tttgatcatt tttttatcgg gttcccccct 300
tactggaaag aatactgtcc caagatagaa tctgctgcca aatgtgtcac aggagttcag 360
gaagaagact ccattgaagg atatggtaaa ccacataatt ctgatagcta cactgtggat 420
atgggagttc aagattgcaa agacgtaatg ttgaacaata aaagtagtaa tccatcctcg 480
gttgaaattt cacatgagca tataactgaa agatctccta cgacagcaga atttaaggat 540
gatccaagtc tcgagatgaa tcccgttgac tcatccacac catcaaagtg ttttggggtt 600
cctagcaggc gcgtgactag atctatgaaa aagccggata gcagtaaaca tagttttcta 660
ctatttaatg gcattgatcc tgggatttta ggcagttctg agaatttaaa caagaaggct 720
gtaaagatgg aatcaaaatg gaaacagatt gaccaaaatg gtgatgttac taaggataag 780
agaaacaacg atgatactgt tgtaagcagt gattcacata ttaacataag gataagtgat 840
ttagaggata cacacgtcac acctaagtgt tctgatccat caagtgtggg tgtgatagat 900
gtaaatgacg atgtgggaac taacatgaaa ggctacagaa acaagaaaaa aaacagagtt 960
aacattccac agaaagaagg tatacctgca acacatggaa ccagttccaa agcagtcaag 1020
actcagaaca ggtctaaaac caaactactg gttaaaagga aactcgtaac aagtcctaaa 1080
tcagcttttt caatgcgcaa gaaggaacga gatggaagtg caaacatgtt gtcgatagaa 1140
tcattcagtg ggaaaaaatc tagatcagga agagtggtcc taccgccttt ggaattctgg 1200
cgcaaccaaa agcttgttta tgatgaggat ggagaggtgt gtggagtcca aggacctatg 1260
taa 1263
<210> 232
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in
splicing error
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, or t
<400> 232
atgttcatat ntattctagt tagttagttg tgaaattgaa atgtaatttg ttgataagaa 60
ccggcctgct cgatgtttct cttctgcgcc catactcaag atcttcgatt 110
<210> 233
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange V392M
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 233
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agaatggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta tgatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 234
<211> 5678
<212> DNA
<213> Artificial Sequence
<220>
<223> genomic DNA of Ha_A0A251U7G7 having mutation resulting in amino
acid exchange D408N
<220>
<221> misc_feature
<222> (355)..(355)
<223> n is a, c, g, or t
<400> 234
ctcagggacc atttgtgcag tttactctaa agtttttaaa cccgagtttg attttagcgg 60
ttgcgagccc tagttgttga gatcaggacc tctgattcca atggcttctt gctcttactt 120
ccagaagact gtaagttttt cttcctaaat tcttccttcc ttccttcctt ccttccttcc 180
ttcattcctc acacatttcc ctctttcttg caggtcactc tgctagactg gtggctaacc 240
aaacccccaa ccaacgatca ctatcaaacc ctaaccctag gggttgcagg cttcacttct 300
caacagtcag tccgccctct ctctctctct ctctctctct aaatatgttc atatntattc 360
tagttagtta gttgtgaaat tgaaatgtaa tttgttgata ggaaccggcc tgctcgatgt 420
ttctcttctg cgcccatact caagatcttc gatttatttg agttggagac agttgatggt 480
gtatgcgtca ttctccaggg ttttattaac aaacaacgca cccttgaaaa tggattttcc 540
cctcaggtat tcttccctat ttttcatatg ctcttccaca caaagtattt ccttattttg 600
ttttaattaa ttgtatattt atatcaatca tccttttttc aaccctcaga cattggttac 660
aaccattaaa tcatatatca tagatcactt ttgtcaatat tactaatagc tgatctagaa 720
tttttgtgta taacaagata gctggataac taagaatctc aatgacgttt aatcatatta 780
cctaggtgga ccatttaggt cacataatag ttttttggcc attttgcaca tgttgacccg 840
atattttttt tttcgcttaa tccgagtatg aatttatatt attcttaaac aatactctag 900
ttttcttgaa taacatagtt taggaaattt tatgcagtaa aaatacactt taggtgactt 960
tgacccattt gacttgggtt agaatttttt gtttacacat ttgagccggg ggtctcactg 1020
gaagcagcct ctctattctt acggggtaga ggtaagactg tctacatctt accctcctca 1080
gaccctacct tagctttgct attggtggga tttaccgagt atgatgatga tttgaaccat 1140
tacaaataaa aacataacct gagttagccc attcgtaggt aaatggttga aatgtcgatc 1200
tctagttcta ttaaaatcca acattgacct tttctcacac ttttcccttt tgtaatatga 1260
tatttgttac atgtgcaggt gtttgatcat ttttttatcg ggttcccccc ttactggaaa 1320
gaatactgtc ccaagataga atctgctgcc aaatgtgtca caggaggtaa atacgaatcg 1380
ctttaagtag tagtttacta aaaacccaac gggtcaacaa tccaagggta acatgcttat 1440
tcatgttatt ctcgtctggc cacggattca tatcccatat ggctagttta gaagaaagtt 1500
ttatcgttca ttgaagattt aattggttgg ctgtttgttt acatcttaat gaggctctta 1560
atggttcaga cgtcttactg gtttagcact taatggttca tactgtttgt ttcgcgagca 1620
aatgtctgaa tggttcagac atttgtctct gaatgatcaa gcattataca aagtctgaat 1680
gattaagacc tctaatctta attggtcaga catttgactc tgaacggtta agtattatac 1740
tacctcttaa tggttcaaac ctcttactgg ttcagcactt aatgattcaa acctcttact 1800
gattcagcac ttaaccattc agaagttgcc aaacagccct ttagacgggt gtaattatgt 1860
acaaaatttt gcgagtatgg aacatgcatt tctcactttc tccatatgat aattatcttc 1920
agttcaggaa gaagactcca ttgaaggata tggtaaacca cataattctg atagctacac 1980
tgtggatatg ggagttcaag attgcaaaga cgtaatgttg aacaataaaa gtagtaatcc 2040
atcctcggtt gaaatttcac atgtatagtt ctcatctctc cattggcatt tatattttca 2100
attcgttgca atcttttgaa ataaaaaacc caaaaagaaa tttattctta gtacgtttgt 2160
ctcatggttg cctaaacaaa atgttttcaa gtgtctctta caccattaca atggcaagca 2220
tgagtggttg agccttgaaa cctgtgataa tattaacccg taactctttc tggatcttgg 2280
ggtcacatac aaccctctaa aaatgaatct tatttcttta aacaggagca tataactgaa 2340
agatctccta cgacagcaga atttaaggat gatccaagtc tcgagatgaa tcccgttgac 2400
tcatccacac catcaaagtg ttttggggtt cctagcaggc gcgtgactag atctatgaaa 2460
aagccggata gcagtaaaca tagttttcta ctatttaatg gcattgatcc tgggatttta 2520
ggcagttctg agaatttaaa caagaaggct gtaaagatgg aatcaaaatg gaaacagatt 2580
gaccaaaatg gtgatgttac taaggataag agaaacaacg atgatactgt tgtaagcagt 2640
gattcacata ttaacataag gataagtgat ttagaggata cacacgtcac acctaagtgt 2700
tctgatccat caagtgtggg tgtgatagat gtaaatgacg atgtgggaac taacatgaaa 2760
ggctacagaa acaagaaaaa aaacagagtt aacattccac agaaagaagg tatacctgca 2820
acacatggaa ccagttccaa agcagtcaag actcagaaca ggtctaaaac caaactactg 2880
gttaaaagga aactcgtaac aagtcctaaa tcagcttttt caatgcgcaa gaaggtaaat 2940
ctacaaacaa ctctgattat acttgtttgt tatggattaa caggttgtta ttgtatagga 3000
acgagatgga agtgcaaaca tgttgtcgat agaatcattc agtgggaaaa aatctagatc 3060
aggttagaga agcaaccata tatataagta gttggatgtc taaagcataa gataattaaa 3120
tggtttattt tatacagagt atatatgtgt gggcgctcgg ggggctaaaa tgaaagtaca 3180
ctaattttaa cgttaatttt actaatttcg tgaaaaaaac gttagaagtg gaggatggta 3240
atcatgcatc atgtggtggc gttgatagcc gaaagacaag ggagtacatg cactaatcgg 3300
cctttgtctt aattgctgcc gagtgttatg tgccttatgt ccaaggcttg atgcaaaact 3360
actatcgagc cgggggtctc ctggagtcag cctctctatt cctacggggt agggctgtct 3420
acatcttacc ctcgtcagac cctaccttag ctttgcaatt ggtgggattt actgagtatg 3480
atgatgatga tgattttata caaagtgaat ttcaaatttt gtccttttac tttatacccc 3540
ttttcaggcg gtgtcctttg tctttaaaat tgacgagttt tatacttcat gttttgaaat 3600
gttgcacgtt atgtccttta agcttaactc agttaatttt ttctgttaaa tttgatcatt 3660
cattactcaa gggcattttt gtctttatac caattacttt agaaacaact taataaataa 3720
aacaaaaaca aatttaaaaa actaaaacac tctcatatct cctctttctc tcaatcacca 3780
ctcccaacca gccatgacct actgccaaca ccaccaccac ccacccctta caaccatcca 3840
ccaccacccg accatcgcca ccaccggttc accaccccca gccgaccagc acaacacagc 3900
tcacaccctc tccccaattt caaaccccac aaataaaaaa cccccaattt caaattccta 3960
attcaaaccc acctcaatta ttatctgaat cggaatcaaa atcagatttt ggacgatgtt 4020
ccagacttca acttgattta ggggggtttg aattcaccgc aatcgaaccc cacacagact 4080
taacttcacc taaccataaa cacatcaccc cagccaccgt ttgcaccacc cacaacctcc 4140
ctctcatccc aaaactcttc cctaacttgt ccaaaacgat ccctcctgtc ctgtcggctg 4200
caacacccaa tttacaaacc cgaagctgat tcagaaccct atccatcttt ccttagtgta 4260
acacccaaaa ccctatccat cttcgccaaa accacctgat tcagaaccgc cactcagtca 4320
atcaccgccg gttgcccttt tgttcagttt aaaccgtcag tcaatcgccg ccggttgccc 4380
tatcctcgtc gagctcctat cgtacaccgc cgtcgtgttt gaatcaggtc ctccgccgcc 4440
ggagcctttt tgttcatttt aaaccatcat gttccttcac tgtttgaatg tttcaaatgg 4500
ttttcaacat tcagtagaga gagagggagg gaggttgaga gagagagggg ggacagtaaa 4560
gttaatttta tgtcttttta attattttac acaattgtcc ttagatttta aatatttgta 4620
aactaatccc tgaaaagtga aatgacaata ataccttcat gtgcaactca catgaccgga 4680
tttaacagaa aaatctaaca gggttcgggc taaaggacat aacgtgcaag attttaaaac 4740
accaagtaca agactcgtca atttgaaaaa taaaggacac cgcctgaaat tcactataaa 4800
gataaaggac aaaatttgaa attcactctt ttatacagga agagtggtcc taccgccttt 4860
ggaattctgg cgcaaccaaa agcttgttta taatgaggtt tgtgtttctt ttttaaattt 4920
ttgcctgttt ttaacacctg ttatatgact cagattacta aatgtgtgtg cgtcttagga 4980
attatgttgt ttaggattat ttctgtatgt ttataagttg catttttccc agtaacatac 5040
atatatatag cttttccaga acctgaaatg ttgacatgaa attgtttgat ataccattga 5100
cccactaatt tggtggtatg tttgagggcc ctgaagtagt aattgaatta aattaaagaa 5160
aatgaagttt ggggaggagg aaaacatgaa cagtttaaga tattaagtcg tattaaccag 5220
ataaatttga atttttattt tgaatgatta tttggtgtga gaatattgta aaaaaaagta 5280
aaatagcaat atgtaaactt cattaattaa taaggaagta aaatagcaat atgtaaactt 5340
cattaattaa caaggtctct ttttaaaatt cgctaaagac tccttaatga cgtgagtcgg 5400
gtcgtatgtg gggcaaggta ttaccgaagt gttggaagaa ttttgtttta gtgttatcta 5460
gtatctccta atctttgtta tcttatgata atcatgcttg aaattgaaca tgcgagtttc 5520
ttagtgttat tacaattttc aggatggaga ggtgtgtgga gtccaaggac ctatgtaaca 5580
acaatgaaga agaggtagtt tgcatgattt agcatataac gtagctagtt tttggggtgc 5640
actaacgatt gtttgaactt gacaccgatt gagacggg 5678
<210> 235
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange V392M
<400> 235
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Met Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asp Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420
<210> 236
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<223> amino acid sequence encoded by genomic DNA of Ha_A0A251U7G7
having mutation resulting in amino acid exchange D408N
<400> 236
Met Ala Ser Cys Ser Tyr Phe Gln Lys Thr Val Thr Leu Leu Asp Trp
1 5 10 15
Trp Leu Thr Lys Pro Pro Thr Asn Asp His Tyr Gln Thr Leu Thr Leu
20 25 30
Gly Val Ala Gly Phe Thr Ser Gln Gln Asn Arg Pro Ala Arg Cys Phe
35 40 45
Ser Ser Ala Pro Ile Leu Lys Ile Phe Asp Leu Phe Glu Leu Glu Thr
50 55 60
Val Asp Gly Val Cys Val Ile Leu Gln Gly Phe Ile Asn Lys Gln Arg
65 70 75 80
Thr Leu Glu Asn Gly Phe Ser Pro Gln Val Phe Asp His Phe Phe Ile
85 90 95
Gly Phe Pro Pro Tyr Trp Lys Glu Tyr Cys Pro Lys Ile Glu Ser Ala
100 105 110
Ala Lys Cys Val Thr Gly Val Gln Glu Glu Asp Ser Ile Glu Gly Tyr
115 120 125
Gly Lys Pro His Asn Ser Asp Ser Tyr Thr Val Asp Met Gly Val Gln
130 135 140
Asp Cys Lys Asp Val Met Leu Asn Asn Lys Ser Ser Asn Pro Ser Ser
145 150 155 160
Val Glu Ile Ser His Glu His Ile Thr Glu Arg Ser Pro Thr Thr Ala
165 170 175
Glu Phe Lys Asp Asp Pro Ser Leu Glu Met Asn Pro Val Asp Ser Ser
180 185 190
Thr Pro Ser Lys Cys Phe Gly Val Pro Ser Arg Arg Val Thr Arg Ser
195 200 205
Met Lys Lys Pro Asp Ser Ser Lys His Ser Phe Leu Leu Phe Asn Gly
210 215 220
Ile Asp Pro Gly Ile Leu Gly Ser Ser Glu Asn Leu Asn Lys Lys Ala
225 230 235 240
Val Lys Met Glu Ser Lys Trp Lys Gln Ile Asp Gln Asn Gly Asp Val
245 250 255
Thr Lys Asp Lys Arg Asn Asn Asp Asp Thr Val Val Ser Ser Asp Ser
260 265 270
His Ile Asn Ile Arg Ile Ser Asp Leu Glu Asp Thr His Val Thr Pro
275 280 285
Lys Cys Ser Asp Pro Ser Ser Val Gly Val Ile Asp Val Asn Asp Asp
290 295 300
Val Gly Thr Asn Met Lys Gly Tyr Arg Asn Lys Lys Lys Asn Arg Val
305 310 315 320
Asn Ile Pro Gln Lys Glu Gly Ile Pro Ala Thr His Gly Thr Ser Ser
325 330 335
Lys Ala Val Lys Thr Gln Asn Arg Ser Lys Thr Lys Leu Leu Val Lys
340 345 350
Arg Lys Leu Val Thr Ser Pro Lys Ser Ala Phe Ser Met Arg Lys Lys
355 360 365
Glu Arg Asp Gly Ser Ala Asn Met Leu Ser Ile Glu Ser Phe Ser Gly
370 375 380
Lys Lys Ser Arg Ser Gly Arg Val Val Leu Pro Pro Leu Glu Phe Trp
385 390 395 400
Arg Asn Gln Lys Leu Val Tyr Asn Glu Asp Gly Glu Val Cys Gly Val
405 410 415
Gln Gly Pro Met
420

Claims (16)

1.具有单倍体诱导物的活性及包含编码包含SANTA结构域的KINETOCHORE NULL2(KNL2)蛋白的核苷酸序列的植物,其中所述核苷酸序列包含至少一处突变,所述突变导致在SANTA结构域中所述KNL2蛋白的氨基酸序列的改变,并且所述改变赋予单倍体诱导物的活性。
2.根据权利要求1的植物,其中所述KNL2蛋白包含SEQ ID NO:24-27所示的氨基酸序列或与SEQ ID NO:24-27所示的序列具有至少75%序列相同性的氨基酸序列;或者
其中编码野生型KNL2蛋白的核苷酸序列选自:
(i)SEQ ID NO:28-31中任一序列所示的核苷酸序列;
(ii)具有SEQ ID NO:228-231中任一序列所示的编码序列的核苷酸序列;
(iii)与(i)或(ii)的序列互补的核苷酸序列;
(iv)与(i)的序列具有至少75%相同性的核苷酸序列;
(v)编码具有SEQ ID NO:24-27中所示的氨基酸序列或与SEQ ID NO:24-27中所示的序列具有至少75%序列相同性的氨基酸序列的KNL2蛋白的核苷酸序列;
(v)在严格条件下与(iii)的序列杂交的核苷酸序列;或者
(vi)由于遗传密码的简并而不同于(i)、(ii)、(iii)或(v)的序列的核苷酸序列。
3.根据权利要求1或2的植物,其中所述至少一处突变在对应于SEQ ID NO:1-16的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中导致赋予单倍体诱导物的活性的改变。
4.根据前述权利要求中任一项的植物,其中包含所述突变的核苷酸序列是内源性基因或转基因。
5.根据前述权利要求中任一项的植物,其中赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变:
A)是在根据SEQ ID NO:1-16的KNL2蛋白的SANTA结构域中、优选在根据SEQ ID NO:17-23或43-147的SANTA结构域的保守基序中的氨基酸取代、插入或缺失;或
B)是通过将终止密码子、无义突变、移码突变或剪接位点突变插入权利要求2定义的编码KNL2蛋白的核苷酸序列导致的。
6.根据权利要求5的植物,其中赋予单倍体诱导物的活性的KNL2蛋白的氨基酸序列的改变是
a.将SEQ ID NO:24的第71位氨基酸谷氨酸(E)、SEQ ID NO:25的第69位氨基酸谷氨酸(E)、SEQ ID NO:26的第95位氨基酸谷氨酸(E)、SEQ ID NO:27的第63位氨基酸谷氨酸(E),或对应于SEQ ID NO:20或88-102中任一序列的第4位氨基酸或SEQ ID NO:23或133-147中任一序列的第14位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于谷氨酸(E)和谷氨酰胺(Q)的氨基酸,更优选取代为氨基酸赖氨酸(K);
b.将SEQ ID NO:24的第73位氨基酸丝氨酸(S)、SEQ ID NO:25的第71位氨基酸丝氨酸(S)、SEQ ID NO:26的第97位氨基酸谷氨酸(E)、SEQ ID NO:27的第65位氨基酸缬氨酸(V),或对应于SEQ ID NO:20或88-102中任一序列的第6位氨基酸或SEQ ID NO:23或133-147中任一序列的第16位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸苯丙氨酸(F);
c.将SEQ ID NO:24的第69位氨基酸苏氨酸(T)、SEQ ID NO:25的第67位氨基酸苏氨酸(T)、SEQ ID NO:26的第93位氨基酸缬氨酸(V)、SEQ ID NO:27的第61位氨基酸谷氨酸(E),或对应于SEQ ID NO:20或88-102中任一序列的第2位氨基酸或SEQ ID NO:23或133-147中任一序列的第12位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、谷氨酸(E)、苏氨酸(T)和缬氨酸(V)的氨基酸,更优选取代为氨基酸异亮氨酸(I);
d.将SEQ ID NO:24的第70位氨基酸亮氨酸(L)、SEQ ID NO:25的第68位氨基酸亮氨酸(L)、SEQ ID NO:26的第94位氨基酸亮氨酸(L)、SEQ ID NO:27的第62位氨基酸亮氨酸(L)、或对应于SEQ ID NO:20或88-102中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第13位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于亮氨酸(L)和异亮氨酸(I)的氨基酸,更优选取代为氨基酸丝氨酸(S);
e.将SEQ ID NO:24的第72位氨基酸丙氨酸(A)、SEQ ID NO:25的第70位氨基酸丙氨酸(A)、SEQ ID NO:26的第96位氨基酸苏氨酸(T)、SEQ ID NO:27的第64位氨基酸苏氨酸(T),或对应于SEQ ID NO:20或88-102中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第15位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)、丝氨酸(S)、天冬氨酸(D)、酪氨酸(Y)的氨基酸,更优选取代为氨基酸异亮氨酸(I)或苏氨酸(T);
f.将SEQ ID NO:24的第74位氨基酸天冬氨酸(D)、SEQ ID NO:25的第72位氨基酸天冬氨酸(D)、SEQ ID NO:26的第98位氨基酸谷氨酸(E)、SEQ ID NO:27的第66位氨基酸天冬氨酸(D)或对应于SEQ ID NO:20或88-102中任一序列的第7位氨基酸或SEQ ID NO:23或133-147中任一序列的第17位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、谷氨酸(E)和甘氨酸(G)的氨基酸,更优选取代为氨基酸天冬酰胺(N);
g.将SEQ ID NO:24的第75位氨基酸甘氨酸(G)、SEQ ID NO:25的第73位氨基酸甘氨酸(G)、SEQ ID NO:26的第99位氨基酸甘氨酸(G)、SEQ ID NO:27的第67位氨基酸甘氨酸(G),或对应于SEQ ID NO:20或88-102中任一序列的第8位氨基酸或SEQ ID NO:23或133-147中任一序列的第18位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于甘氨酸(G)、天冬酰胺(N)和组氨酸(H)的氨基酸,更优选取代为精氨酸(R)或谷氨酸(E);
h.将SEQ ID NO:24的第58位氨基酸丝氨酸(S)、SEQ ID NO:25的第56位氨基酸丝氨酸(S)、SEQ ID NO:26的第82位氨基酸脯氨酸(P)、SEQ ID NO:27的第50位氨基酸丝氨酸(S),或对应于SEQ ID NO:19或73-87中任一序列的第1位氨基酸或SEQ ID NO:23或133-147中任一序列的第1位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L);
i.将SEQ ID NO:24的第60位氨基酸脯氨酸(P)、SEQ ID NO:25的第58位氨基酸脯氨酸(P)、SEQ ID NO:26的第84位氨基酸脯氨酸(P)、SEQ ID NO:27的第52位氨基酸脯氨酸(P),或对应于SEQ ID NO:19或73-87中任一序列的第3位氨基酸或SEQ ID NO:23或133-147中任一序列的第3位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丙氨酸(A)和脯氨酸(P)的氨基酸,更优选取代为氨基酸亮氨酸(L)或丝氨酸(S);
j.将SEQ ID NO:24的第62位氨基酸亮氨酸(L)、SEQ ID NO:25的第60位氨基酸缬氨酸(V)、SEQ ID NO:26的第86位氨基酸丙氨酸(A)、SEQ ID NO:27的第54位氨基酸亮氨酸(L),或对应于SEQ ID NO:19或73-87中任一序列的第5位氨基酸或SEQ ID NO:23或133-147中任一序列的第5位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于丝氨酸(S)、丙氨酸(A)、亮氨酸(L)、缬氨酸(V)和苏氨酸(T)的氨基酸,更优选取代为氨基酸异亮氨酸(I);
k.将SEQ ID NO:24的第66位氨基酸天冬氨酸(D)、SEQ ID NO:25的第64位氨基酸天冬氨酸(D)、SEQ ID NO:26的第90位氨基酸苏氨酸(T)、SEQ ID NO:27的第58位氨基酸(D),或对应于SEQ ID NO:19或73-87中任一序列的第9位氨基酸或SEQ ID NO:23或133-147中任一序列的第9位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于天冬氨酸(D)、苏氨酸(T)、丙氨酸(A)和谷氨酸(E)的氨基酸,更优选取代为天冬酰胺(N);或
l.将SEQ ID NO:24的第67位氨基酸缬氨酸(V)、SEQ ID NO:25的第65位氨基酸缬氨酸(V)、SEQ ID NO:26的第91位氨基酸丝氨酸(S)、SEQ ID NO:27的第59位氨基酸亮氨酸(L),或对应于SEQ ID NO:19或73-87中任一序列的第10位氨基酸或SEQ ID NO:23或133-147中任一序列的第10位氨基酸的氨基酸,取代为另一氨基酸,优选取代为不同于缬氨酸(V)、丝氨酸(S)、亮氨酸(L)、天冬酰胺(N)、酪氨酸(Y)、脯氨酸(P)、天冬氨酸(D)和谷氨酸(E),更优选取代为氨基酸异亮氨酸(I);或
m.将SEQ ID NO:27的第12位氨基酸亮氨酸(T)或对应于SEQ ID NO:17或43-57中任一序列的第2位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于苏氨酸(T)、缬氨酸(V)、苯丙氨酸(F)、丝氨酸(S)和亮氨酸(L)的氨基酸,更优选取代为氨基酸异亮氨酸(I);或
n.将SEQ ID NO:27的第22位氨基酸脯氨酸(P)或对应于SEQ ID NO:16的第12位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于脯氨酸(P)或谷氨酸(E)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L);或
o.将SEQ ID NO:27的第33位氨基酸甘氨酸(G)或对应于SEQ ID NO:18或58-72中任一序列的第3位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于甘氨酸(G)、精氨酸(R)和丙氨酸(A)的氨基酸,更优选取代为氨基酸谷氨酸(E);或
p.将SEQ ID NO:27的第49位氨基酸丝氨酸(S)或对应于SEQ ID NO:16的第34位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于丝氨酸(S)、苏氨酸(T)的氨基酸,更优选取代为氨基酸苯丙氨酸(F);或
q.将SEQ ID NO:27的第80位氨基酸精氨酸(R)或对应于SEQ ID NO:16的第65位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于精氨酸(R)的氨基酸,更优选取代为氨基酸组氨酸(H);或
r.将SEQ ID NO:27的第84位氨基酸天冬酰胺(N)或对应于SEQ ID NO:21或103-117中任一序列的第1位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于天冬酰胺(N)、酪氨酸(Y)和丝氨酸(S)的氨基酸,更优选取代为氨基酸赖氨酸(K);或
s.将SEQ ID NO:27的第88位氨基酸脯氨酸(P)或对应于SEQ ID NO:21或103-117中任一序列的第5位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于脯氨酸(P)、丙氨酸(A)和缬氨酸(V)的氨基酸,更优选取代为氨基酸丝氨酸(S);或
t.将SEQ ID NO:27的第100位氨基酸脯氨酸(P)或对应于SEQ ID NO:22或118-132中任一序列的第7位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于脯氨酸和天冬氨酸(D)的氨基酸,更优选取代为氨基酸丝氨酸(S)或亮氨酸(L);或
u.将SEQ ID NO:26的第68位氨基酸丙氨酸(A)或对应于SEQ ID NO:18或58-72中任一序列的第5位氨基酸的氨基酸取代为另一氨基酸,优选取代为不同于丙氨酸(A)和丝氨酸(S)的氨基酸,更优选取代为氨基酸苏氨酸(T)。
7.根据前述权利要求中任一项的植物部分,其优选幼枝、根、叶柄、芽、下胚轴、花或花器官、种子、花粉、花药、果实、胚珠、胚、植物组织或细胞。
8.通过将衍生自根据权利要求1-7的植物的第一配子与来自表达野生型KNL2蛋白的植物的第二配子接触以生成合子可获得的单倍体植物。
9.通过将根据权利要求8的单倍体植物转化为双单倍体植物可获得的双单倍体植物,优选通过用选自一氧化二氮气体、秋水仙碱、氨磺乐灵、甲基胺草膦、氟乐灵、咖啡因和拿草特的染色体加倍剂处理,或在允许自发染色体加倍的条件下栽培转化。
10.一种生成单倍体植物细胞的方法,包括以下步骤:
a)提供衍生自根据权利要求1至6任一项的具有单倍体诱导物的活性的植物的非天然存在的第一配子;
b)通过将步骤a)的第一配子与衍生自相同属、优选相同物种的植物的第二配子接触生成合子,其包含编码权利要求2中定义的野生型KNL2蛋白的核苷酸序列,并且能够表达野生型KNL2蛋白;
c)通过从所述合子中消除具有单倍体诱导物的活性的植物的染色体而获得单倍体细胞。
11.一种根据权利要求10生成单倍体植物的方法,其中除步骤a)至c)外所述方法包括以下步骤:
d)在获得单倍体植物或其部分的条件下使所述单倍体细胞生长;及
e)获得单倍体植物或其部分。
12.一种用于在植物群体中鉴别植物或用于生产植物的方法,其中所述植物在权利要求2中定义的编码KNL2蛋白的内源性核苷酸序列中具有至少一处突变,其中所述方法包括以下步骤:
(c)诱变植物物种的群体;
(d)针对所述至少一处突变的存在筛选所述植物群体,从而在所述植物物种中鉴别在编码所述KNL2蛋白的内源性核苷酸序列中具有所述至少一处突变的植物,
其中所述至少一处突变在所鉴别的植物中赋予单倍体诱导物的活性。
13.根据权利要求12的用于在植物群体中鉴别植物或用于生产植物的方法,其中筛选步骤包括:
(b1)生成一组寡核苷酸,其靶向植物物种中编码所述KNL2蛋白的内源性核苷酸序列中的至少一处突变;
(b2)提供包括适合检测所述至少一处突变的一组寡核苷酸的测定;
(b3)通过所述测定针对至少一处突变的存在筛选所述植物群体,从而鉴别在编码KNL2蛋白的内源性核苷酸序列中具有所述至少一处突变的植物。
14.根据权利要求12或13的用于在植物群体中鉴别植物或用于生产植物的方法,其中所述至少一处突变是权利要求2定义的核苷酸序列的编码区或者权利要求2定义的内源性核苷酸序列的剪接位点中至少一个核碱基的取代、插入或缺失。
15.一组寡核苷酸作为分子标记在鉴别根据权利要求1至6任一项的植物中的应用。
16.一种修饰植物基因组的方法,所述方法包括:
(a)提供包含至少一个基因组编辑组件(GEC)的第一植物;
(b)将第一植物与第二植物杂交,其中所述至少一个GEC修饰第二植物的基因组,从而生成第二植物的修饰的基因组;以及
(c)回收由所述第一和第二植物杂交产生的第三植物,
其中所述第三植物包含第二植物的修饰的基因组,并且其中所述第三植物基本上没有所述GEC,
其中所述第一植物是根据权利要求1至6任一项的植物。
CN202080026032.2A 2019-01-30 2020-01-30 单倍体诱导物 Pending CN113645840A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19154617.5 2019-01-30
EP19154617.5A EP3689135A1 (en) 2019-01-30 2019-01-30 Haploid inducers
PCT/EP2020/052290 WO2020157197A1 (en) 2019-01-30 2020-01-30 Haploid inducers

Publications (1)

Publication Number Publication Date
CN113645840A true CN113645840A (zh) 2021-11-12

Family

ID=65443649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080026032.2A Pending CN113645840A (zh) 2019-01-30 2020-01-30 单倍体诱导物

Country Status (8)

Country Link
US (1) US20220098607A1 (zh)
EP (2) EP3689135A1 (zh)
CN (1) CN113645840A (zh)
BR (1) BR112021014674A2 (zh)
CL (1) CL2021002009A1 (zh)
PE (1) PE20211534A1 (zh)
UY (1) UY38558A (zh)
WO (1) WO2020157197A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023222908A1 (en) * 2022-05-19 2023-11-23 Leibniz-Institut für Pflanzengenetik Und Kulturpflanzenforschung (IPK) Generation of haploid plants based on novel knl2

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016177887A1 (en) * 2015-05-07 2016-11-10 Limagrain Europe Polynucleotide responsible of haploid induction in maize plants and related processes
WO2017067714A1 (en) * 2015-10-22 2017-04-27 Leibniz-Institut für Pflanzengenetik Und Kulturpflanzenforschung (IPK) Generation of haploid plants based on knl2
CN106998665A (zh) * 2014-08-28 2017-08-01 Kws种子欧洲股份公司 单倍体植物的产生
CN107205354A (zh) * 2014-12-23 2017-09-26 Kws种子欧洲股份公司 单倍体诱导物
WO2018102816A1 (en) * 2016-12-02 2018-06-07 Syngenta Participations Ag Simultaneous gene editing and haploid induction
WO2018158301A1 (de) * 2017-02-28 2018-09-07 Kws Saat Se Haploidisierung in sorghum

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2018003978A (es) * 2015-10-02 2018-08-15 Keygene Nv Metodo para la produccion de plantas haploides y doble haploides posteriores.

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106998665A (zh) * 2014-08-28 2017-08-01 Kws种子欧洲股份公司 单倍体植物的产生
CN107205354A (zh) * 2014-12-23 2017-09-26 Kws种子欧洲股份公司 单倍体诱导物
WO2016177887A1 (en) * 2015-05-07 2016-11-10 Limagrain Europe Polynucleotide responsible of haploid induction in maize plants and related processes
WO2017067714A1 (en) * 2015-10-22 2017-04-27 Leibniz-Institut für Pflanzengenetik Und Kulturpflanzenforschung (IPK) Generation of haploid plants based on knl2
WO2018102816A1 (en) * 2016-12-02 2018-06-07 Syngenta Participations Ag Simultaneous gene editing and haploid induction
WO2018158301A1 (de) * 2017-02-28 2018-09-07 Kws Saat Se Haploidisierung in sorghum

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KUPPU S.等: "Point mutations in centromeric histone induce post-zygotic incompatibility and uniparental inheritance", 《PLOS GENETICS》 *
LERMONTOVA I.等: "Arabidopsis KINETOCHORE NULL2 is an upstream component for centromeric histone H3 variant cenH3 deposition at centromeres", 《THE PLANT CELL》 *
NA WANG等: "Centromere size and its relationship to haploid formation in plants", 《MOLECULAR PLANT》 *

Also Published As

Publication number Publication date
EP3689135A1 (en) 2020-08-05
BR112021014674A2 (pt) 2021-09-28
EP3917312A1 (en) 2021-12-08
WO2020157197A1 (en) 2020-08-06
UY38558A (es) 2020-08-31
US20220098607A1 (en) 2022-03-31
PE20211534A1 (es) 2021-08-16
CL2021002009A1 (es) 2022-04-29

Similar Documents

Publication Publication Date Title
CN107920486B (zh) 用于加速基因组编辑的单倍体诱导系
CN106164272B (zh) 修饰的植物
CN106998665B (zh) 单倍体植物的产生
US20220186238A1 (en) Diplospory gene
WO2013060136A1 (zh) 一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用
CN110546266A (zh) 高粱的单倍体化
CN110892074A (zh) 用于增加香蕉的保质期的组成物及方法
CN112725374A (zh) 创制植物单倍体诱导系的方法及其应用
CN111511199A (zh) 改良蓝色糊粉及其他分离系统
CN115811937A (zh) 杂合的cenh3单子叶植物及其用于单倍体诱导和同时基因组编辑的方法
EP3149175A1 (en) A dominant mutation in the tdm gene leading to diplogametes production in plants
CN108290934A (zh) 制备单倍体和随后的双单倍体植物的方法
WO2021239986A1 (en) Plant haploid induction
CN109971763A (zh) 花期调控基因cmp1和相关的载体及其应用
CN113645840A (zh) 单倍体诱导物
US10266840B2 (en) Sorghum yield enhancement gene
EP4033886A1 (en) Generation of haploids based on mutation of sad2
CN114072512A (zh) 不育基因及其相关构建体和应用
CN114854712B (zh) 玉米ZmWAK02基因在提高玉米灰斑病抗性中的应用
KR102448347B1 (ko) 무 웅성불임 판별하는 방법 및 무 웅성불임 식물체
KR20230010678A (ko) 표적화된 돌연변이유발에 의해 돌연변이체 식물을 수득하는 방법
CN113754747A (zh) 一种水稻雄性育性调控基因突变体及其分子标记和应用
JP2004283126A (ja) 細胞質雄性不稔回復遺伝子
CN108135145A (zh) 在种子生产中具有改变的性质的芸苔属植物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination