【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、花成に関する遺伝
子およびその遺伝子産物としての蛋白質と、その変異遺
伝子および変異蛋白質と、この変異遺伝子を導入するこ
とによって、栄養成長期間を短縮可能とするトランスジ
ェニック植物、およびその生産方法とに関するものであ
る。
【0002】
【従来の技術】一般に、植物においては、発芽後の栄養
成長から生殖成長に移行すると、それまで葉を形成して
いた茎の先端や腋芽の成長点の構造が変化して、花が形
成される。この栄養成長から生殖成長への移行現象を
「花成」という。つまり花成は、植物の繁殖に直結する
現象であるため、植物の生活環上で最も重要な現象であ
ると見なすことができる。
【0003】また、植物は繁殖のために種子を形成する
ことが一般的であるため、花成は、植物の生存において
も非常に重要な現象となる。すなわち、植物は、生活環
を通してほぼ一定の場所に固着して生活することがほと
んどであるが、花成を経て種子という形態をとると、強
い環境耐性を実現できる。したがって、植物は種子とな
ることで、生育に不適な環境から時間的・空間的に逃れ
ることが可能になり、生存の可能性を飛躍的に高めるこ
とができる。
【0004】換言すれば、花成を人為的に制御すること
が可能となれば、植物の繁殖と生育を効率的に制御でき
ることになる。それゆえ、従来より、花成の制御機構の
解明および理解は、学術的観点だけでなくアグリビジネ
スなどの産業的観点からも進められている。
【0005】特に近年では、シロイヌナズナ(Arabidop
sis thaliana)を用いた研究によって、分子遺伝学的な
検証に基づく花成の制御機構の解明と理解とが急速に進
んでいる。
【0006】シロイヌナズナは、世代時間が短い、生育
が容易、個体が比較的小さい、1個体から多数の種子が
得られるなど、実験植物としての利点が多い。しかも、
既知の植物中ではそのゲノムサイズが最も小さい(約1
35Mb)ため遺伝学の材料としても好んで用いられ
る。それゆえ、シロイヌナズナは、各種農作物などの産
業植物を含む高等植物のモデルとして注目されており、
早くからゲノム構造解析が進められ、近年、ゲノム構造
がほぼ明らかにされた。
【0007】上記シロイヌナズナを用いた研究によっ
て、花成の制御機構には、部分的に機能が重複する4つ
の制御経路が存在することが明らかとなっている。ま
た、各制御経路上で機能する重要な遺伝子(花成制御遺
伝子と称する)も同定され、個々の制御経路の解明およ
び理解も進んでいる。それゆえ、現在、花成の制御機構
において非常に大きな関心を集めているのが、上記4つ
の制御経路がどのように統合されて、最終的に花成を引
き起こすのかという点である。
【0008】本発明者らは、以前に、花成制御遺伝子の
一つであるFLOWERING LOCUS T遺伝子(FT遺伝子)を
クローニングして解析した結果、このFT遺伝子が上記
4つの花成制御経路を統合する「花成のスイッチ遺伝
子」の有力な候補であることを見出している(Y.Kobaya
shi, H.Kaya, K.Goto, M.Iwabuchi & T.Araki : Scienc
e, 286 1960-1962 (1999) 他)。上記FT遺伝子は、花
芽分裂組織決定遺伝子の最も重要なものとして知られて
いるLEAFY 遺伝子(LFY遺伝子)と同時に強制発現さ
せることで、植物の発芽後に、栄養成長を経ずに直ちに
花成して花芽を形成させることができる。
【0009】それゆえ、花成の制御機構の解明および理
解を進めることで、上記FT遺伝子を中心とした、花成
の人為的な制御系を確立できる可能性が示唆されてい
る。
【0010】
【発明が解決しようとする課題】しかしながら、上記F
T遺伝子については、実質的に研究が開始されたばかり
であるため、FT遺伝子の詳細な機能については分から
ないことも多い。このFT遺伝子が、上記4つの制御経
路を統合する作用に大きく関与していることはほぼ確実
であるが、上記LFY遺伝子のように、FT遺伝子と組
み合わせて発現させることで、花成をより効果的に促進
できるような他の花成制御遺伝子が存在する可能性も強
く示唆される。
【0011】このような他の花成制御遺伝子が見出され
れば、FT遺伝子の機能をより詳細に解明し、その理解
を進めることが可能となり、FT遺伝子を中心とする花
成の人為的制御系の確立の可能性をより一層高めること
が期待される。
【0012】また、上記他の花成制御遺伝子が、花成を
効果的に促進でき、かつ花や種子の形成にも影響がない
のであれば、この遺伝子のみでも、種苗産業分野へ有効
に利用できる可能性がある。
【0013】本発明は、上記問題点に鑑みてなされたも
のであって、その目的は、花成の制御機構の理解・解明
と、花成の人為的制御系の確立とに応用できる可能性が
高い、シロイヌナズナ由来の未知の花成制御遺伝子を見
出し、その塩基配列およびそれがコードする蛋白質のア
ミノ酸配列を決定するとともに、特定された上記花成制
御遺伝子を利用して、植物の花成を制御する方法を提案
することにある。
【0014】
【課題を解決するための手段】本発明者らは上記課題に
鑑み鋭意検討した結果、その一部改変することで、正常
な花の形態と正常な種子形成能に影響を及ぼさずに、花
成を促進させるという、花成を制御する方法を実現する
ことが可能であり、さらに、FT遺伝子を中心とする花
成の人為的制御系の確立にも利用できる可能性が高い新
たな花成制御遺伝子を見出し、本発明を完成させるに至
った。
【0015】すなわち、本発明にかかる遺伝子は、上記
の課題を解決するために見出された新規な花成制御遺伝
子であって、植物のゲノムから単離され、その一部を改
変した状態で植物中にて発現させることで、栄養成長期
間を短縮することを特徴としている。
【0016】上記遺伝子としては、たとえば、シロイヌ
ナズナの第4番染色体にコードされ、その一部を改変し
た状態で植物中にて発現させることで、栄養成長期間を
短縮し、好ましくは、その一部を改変した状態で、かつ
FT遺伝子の過剰発現状態で植物中にて発現させること
で、発芽後に本葉形成を回避して花を形成する花成制御
遺伝子CRYPTIC PRECOCIOUS遺伝子(CRP遺伝子)を挙
げることができる。
【0017】上記構成によれば、上記遺伝子の一部を改
変させた状態で、少なくともシロイヌナズナで発現させ
ることにより、通常よりも栄養成長の期間を短縮するこ
とが可能になる。しかも、FT遺伝子の過剰発現ととも
に発現させることで、発芽後すぐに花を形成することも
可能となる。すなわち、上記遺伝子を改変させれば、そ
れ単独でも花成の促進が可能となる上に、FT遺伝子を
過剰発現させれば、実質的に栄養成長を経ないで生殖成
長に移行できるため、花成を極めて促進させることがで
きる。
【0018】上記FT遺伝子は「花成のスイッチ遺伝
子」であることが公知であるが、本発明の完成により、
上記遺伝子がFT遺伝子を中心とする花成の制御機構に
重要に関与することが明らかとなった。その結果、本発
明にかかる遺伝子は、FT遺伝子を中心とする花成の人
為的制御系の確立に応用できる可能性が高いことが示唆
される。
【0019】上記遺伝子の具体的な一例であるCRP遺
伝子は、具体的には、配列番号1に示す塩基配列からな
るゲノムDNAであり、配列番号2に示す塩基配列をオ
ープンリーディングフレームとして含むDNAであり、
さらに、配列番号3に示す塩基配列を有するcDNAで
ある。
【0020】上記構成によれば、CRP遺伝子は約11
kbp(塩基対、base pair )のサイズを有するDNA
であり、そのオープンリーディングフレーム(ORF)
の塩基配列は、約6.7kbpのサイズを有しており、
そのcDNAは約7.1kbpのサイズを有している。
それゆえ、本発明では、CRP遺伝子をコードするポリ
ヌクレオチド、すなわちmRNA、cDNA、ゲノムD
NAおよびそのフラグメントを含む遺伝子を得ることが
できる。
【0021】なお、本発明における「遺伝子」または
「ポリヌクレオチド」には、RNAおよびDNAが含ま
れるものとする。RNAには、mRNAが含まれ、DN
Aには、たとえば、クローニングや化学合成技術または
それらの組み合わせで得られるようなcDNAおよびゲ
ノムDNAを包含するDNAが含まれる。また、DNA
は二本鎖でも、一本鎖でもよい。一本鎖DNAは、セン
ス鎖となるコード鎖でもよく、アンチセンス鎖となるア
ンチコード鎖でもよい。
【0022】さらに、上記構成によれば、CRP遺伝子
のORFは、2235のアミノ酸残基からなる蛋白質を
コードしていることが分かる。それゆえ、本発明にかか
るCRP蛋白質とは、配列番号4に示すアミノ酸配列を
有する蛋白質である。また、本発明にかかるDNAと
は、配列番号4に示すポリペプチドをコードする、上記
DNAとは異なる塩基配列を有するポリヌクレオチドで
あってもよい。したがって、本発明にかかるDNAに
は、配列番号4に示すアミノ酸配列を有する蛋白質をコ
ードするDNAであれば、配列番号2や配列番号3に示
す塩基配列を含むDNAでなくてもよい。
【0023】なお、上述した、配列番号4に示すポリペ
プチドをコードするポリヌクレオチドには、上記ポリペ
プチドをコードする単一の連続領域、またはイントロン
で中断されているような不連続領域を含むポリヌクレオ
チドが包含される。
【0024】上述したように、本発明にかかるCRP遺
伝子は、その一部を改変した状態で植物中にて発現させ
ることで、栄養成長期間を短縮するDNAであり、さら
に、FT遺伝子の過剰発現状態で植物中にて発現させる
ことで、ほぼ栄養成長期間を消失させるDNAである。
それゆえ、本発明にかかるDNAには、上記CRP遺伝
子の一部を改変した変異型CRP遺伝子も含まれ、特
に、CRP遺伝子のORFである、配列番号2に示す塩
基配列における塩基の一部を改変したDNAであって、
植物中で発現することにより栄養成長期間を短縮するこ
とを特徴とするDNA、すなわち変異型CRP遺伝子も
含まれる。
【0025】また、上記変異型CRP遺伝子のより好ま
しい一例としては、配列番号2に示す塩基配列中の第2
96番目の塩基をシトシンからチミンに置換されてなる
DNA、すなわち配列番号5に示す塩基配列を有するCR
YPTIC PRECOCIOUS-1D 変異遺伝子(CRP−1D変異遺
伝子)が挙げられる。
【0026】また、本発明にかかるCRP蛋白質の変異
体、すなわち変異型CRP蛋白質は、配列番号4に示す
アミノ酸配列を有する蛋白質の変異体であって、植物中
にて存在させることで発芽後の栄養成長期間を短縮させ
ることを特徴とする蛋白質であればよい。
【0027】この変異型CRP蛋白質のより好ましい一
例としては、配列番号4に示すアミノ酸配列中の第99
番目のアミノ酸がセリンからフェニルアラニンに置換さ
れてなる蛋白質、すなわち、配列番号6に示すアミノ酸
配列を有するCRP−1D変異蛋白質を挙げることがで
きる。
【0028】したがって、本発明にかかる変異型CRP
遺伝子としては、配列番号6に示すCRP−1D変異蛋
白質をコードするポリヌクレオチドであってもよい。
【0029】また、本発明にかかる他のCRP遺伝子
は、イネの第10番染色体にコードされ、配列番号1な
いし3の何れかに示す塩基配列を有するDNAと相同性
を有するDNAである。具体的には、たとえば、配列番
号7に示す塩基配列からなるDNAを挙げることがで
き、配列番号8に示す塩基配列をオープンリーディング
フレームとして含むDNAを挙げることができる。
【0030】上記イネ由来のCRP遺伝子(OsCRP
遺伝子と称する)は、イネゲノムのデータベースに対し
てホモロジー検索を行った結果得られたものであり、シ
ロイヌナズナ由来の上記CRP遺伝子と高い相同性を示
すものである。それゆえ上記構成によれば、OsCRP
遺伝子も、FT遺伝子を中心とする花成の人為的制御系
の確立に応用できる可能性が高いことが示唆される。
【0031】また、本発明にかかる他のCRP蛋白質と
しては、配列番号9に示すアミノ酸配列を有する蛋白
質、すなわちイネのCRP蛋白質(OsCRP蛋白質)
が挙げられる。それゆえ、本発明にかかるOsCRP遺
伝子となるDNAには、配列番号9に示すポリペプチド
をコードする、異なる塩基配列を有するポリヌクレオチ
ドであってもよい。
【0032】なお、本発明者らは、データベースに対す
る相同性の検索によって、タバコゲノム中にも、上記C
RP遺伝子と相同性を有すると考えられるNtCRP遺
伝子を見出している。このNtCRP遺伝子は、配列番
号10に示す塩基配列を部分塩基配列として含むもので
あり、その遺伝子産物としてのNtCRP蛋白質は、配
列番号11に示す部分アミノ酸配列を含むものである。
【0033】また、本発明における「相同性」とは、た
とえばポリヌクレオチドの場合、ロウ・ストリンジェン
ト条件下で、ハイブリダイゼーションが起こり得る程度
に類似性を有することを指す。また、本発明において
「相同性」を具体的な数値限定として示せば、たとえ
ば、汎用されている相同性検索アルゴリズムであるBL
AST(Basic Local Alignment Search Tool )[S.F.
Altschul, W.Gish, W.Miller, E.W.Myers & D.J.Lipma
n:J Mol Biol., 215(3)403-410(1990) ]によるアミノ
酸配列レベルの相同性検索で、P-value(BLAST2の
場合はE-value 。ただし、E-value <0.01の場合には、
E-value とP-value とはほぼ等しいと見なせる)が0.
001未満であるような一つまたは複数のhigh-scoring
segment pair(HSP)が存在することとする。な
お、上記数値限定における下限(最高度の相同性を意味
する)は0である。
【0034】本発明にかかる上記CRP遺伝子は、FT
遺伝子を過剰発現させてなるシロイヌナズナを突然変異
させることで得られる早咲き表現型を極端に昂進するcr
yptic precocious- 1D(crp−1D)突然変異体か
らクローニングされたものである。
【0035】それゆえ、本発明には、上記crp−1D
突然変異体のシロイヌナズナ、すなわち、第4番染色体
にコードされている、配列番号2に示す塩基配列をオー
プンリーディングフレームとして含むCRP遺伝子を、
配列番号5に示す塩基配列からなるCRP−1D変異遺
伝子となるように改変し、より好ましくは、過剰発現す
るようにFT遺伝子を導入してなるシロイヌナズナも含
まれる。
【0036】このような突然変異型のシロイヌナズナで
は、花成を促進させることができるだけでなく、形成さ
れる花にも種子にも異常が見られないため、実験植物と
して広く利用されているシロイヌナズナを迅速に繁殖さ
せるような用途に好ましく用いることが可能である。
【0037】なお、上記「過剰発現(高レベル発現)さ
せているFT遺伝子」とは、組織・発生段階を問わずに
高い転写活性を有するようなプロモーターによって発現
が制御されるFT遺伝子のことを指す。具体的には、た
とえば、カリフラワーモザイクウイルス(CaMV)の
35SRNAプロモーターにより発現が制御されるFT
遺伝子を挙げることができる。
【0038】また、本発明における有望な応用技術とし
ては、たとえば、上記CRP−1D変異遺伝子、また
は、CRP遺伝子の一部を改変した状態で植物中にて発
現させることで、栄養成長期間を短縮する変異型CRP
遺伝子を導入したことを特徴とするトランスジェニック
植物を挙げることができる。このトランスジェニック植
物においては、上記のように、プロモーターの選択によ
って、FT遺伝子を過剰発現するように導入してなるこ
とがより好ましい。
【0039】上記トランスジェニック植物は、上記CR
P−1D変異遺伝子、または、CRP遺伝子の一部を改
変した状態で植物中にて発現させることで、栄養成長期
間を短縮する変異型CRP遺伝子を植物に導入するステ
ップを少なくとも含み、好ましくは、過剰発現するよう
にFT遺伝子を導入するステップを含む生産方法によっ
て生産され得る。
【0040】上記構成または方法によれば、トランスジ
ェニック植物の栄養成長期間を短縮化することが可能で
あり、特に、FT遺伝子の過剰発現状態では、ほぼ栄養
成長を消失させることが可能である。それゆえ、本発明
を好適に応用できる用途として、花成促進による繁殖、
たとえば種子作物等を迅速に生産するような用途を挙げ
ることができる。
【0041】
【発明の実施の形態】本発明の実施の一形態について図
1ないし図53に基づいて説明すれば、以下の通りであ
る。なお、本発明はこれに限定されるものではない。
【0042】本発明にかかる新規な花成制御遺伝子とし
て、本実施の形態では、シロイヌナズナ由来の花成制御
遺伝子CRYPTIC PRECOCIOUS遺伝子(CRP遺伝子)を挙
げて説明する。上記CRP遺伝子は、突然変異によっ
て、野生型背景で花成早化の表現型のみを示し、さら
に、FLOWERING LOCUS T遺伝子(FT遺伝子)の過剰発
現背景では、これによって引き起こされる早熟花成を劇
的に昂進し、栄養成長相をほぼ完全に消失させる遺伝子
である。それゆえ、上記CRP遺伝子は、植物の花成制
御に重要に関わる新規な遺伝子であり、FT遺伝子の発
現に重大に関与すると考えられる。
【0043】上記CRP遺伝子は、図1に示すように、
12個のエクソン(図中帯形状で表示)と11個のイン
トロン(図中線で表示)とから構成されている。後述す
るcrp−1D突然変異は、図中矢印で示す位置に存在
する。なお、図1では、エクソンのうち、オープンリー
ディングフレーム(ORF)を網かけ部分として示し、
1kbのスケールも併記する。
【0044】上記CRP遺伝子のDNAとしては、図2
ないし図10および配列番号1の塩基配列に示すよう
に、11000塩基対(11kbp)のサイズを有して
いる。上記CRP遺伝子は、シロイヌナズナ・ゲノムの
第4番染色体に1コピーしか存在せず、シロイヌナズナ
・ゲノム中には、CRP遺伝子と相同性を有する遺伝子
は他には存在しない。なお、図2ないし図10および配
列番号1の塩基配列に示すCRP遺伝子をゲノムCRP
遺伝子と称する。
【0045】ゲノムCRP遺伝子のオープンリーディン
グフレーム(ORF)は、図11ないし図15および配
列番号2の塩基配列に示すように、6708塩基対すな
わち約6.7kbpのサイズを有している。また、ゲノ
ムCRP遺伝子から得られるcDNAクローンは、図1
6ないし図21および配列番号3の塩基配列に示すよう
に、7149塩基対すなわち約7.1kbpのサイズを
有している。
【0046】それゆえ、本発明にかかるCRP遺伝子と
してのDNAは、植物のゲノム中に含まれる形態、すな
わちイントロンなどの非コード配列を含む「ゲノム」形
DNAであってもよいし、逆転写酵素やポリメラーゼを
用いてmRNAを経て得られるcDNA、すなわちイン
トロンなどの非コード配列を含まない「転写」形DNA
であってもよい。
【0047】また、本発明にかかるCRP遺伝子として
のDNAには、コードされているCRP蛋白質の形成に
悪影響を与えないか妨げない限りにおいて、他のDNA
配列を含んでいてもよい。たとえば、後述する遺伝子組
み換え等に用いるために、リンカーを末端に含ませるこ
ともできる。
【0048】上記ゲノムCRP遺伝子は、図22および
図23並びに配列番号4のアミノ酸配列に示すように、
2235のアミノ酸残基からなるポリペプチドをコード
している。換言すれば、CRP遺伝子産物としての蛋白
質は、2235のアミノ酸残基からなる蛋白質である。
本発明では、この蛋白質をCRP蛋白質と称する。
【0049】上記CRP蛋白質は、キイロショウジョウ
バエ(Drosophila melanogaster )、ヒト、出芽酵母
(Saccharomyces cerevisiae)で転写メディエーター、
または転写コアクチベーターとして知られる蛋白質と部
分的な相同性を有している。すなわち、これら公知の転
写メディエーターなどの蛋白質とCRP蛋白質とは類似
した配列を含む領域を持つ。
【0050】たとえば、CRP蛋白質と、キイロショウ
ジョウバエの転写コアクチベーターkohtalo (kto)
蛋白質(2531アミノ酸)との間でアミノ酸配列を比
較すると、図24に示すように、CRP蛋白質における
61番目のアミノ酸:セリンから261番目のアミノ
酸:ロイシンまでの領域は、kto蛋白質と非常に類似
する配列を有している。特に、アミノ酸配列における6
2番目から67番目までの領域と、210番目から21
6番目までの領域とについては、CRP蛋白質とkto
蛋白質との間で完全に一致している。
【0051】一般に、転写調節因子による転写の調節、
すなわち転写反応の促進または抑制には、転写メディエ
ーターまたは転写コアクチベーターが介在するが、上記
kto蛋白質とCRP遺伝子との相同性から鑑みて、本
発明にかかるCRP遺伝子は、花成の制御機構に関わる
転写メディエーターまたは転写コアクチベーターをコー
ドする遺伝子であると推測される。
【0052】従来、このような花成の制御機構に関わる
転写メディエーターまたは転写コアクチベーターをコー
ドすると推測される遺伝子はクローニングされておら
ず、それゆえ、CRP遺伝子は、この種の遺伝子として
は初めてクローニングされたものとなる。
【0053】上記FT遺伝子は、花成の制御機構におい
て「花成のスイッチ遺伝子」として機能することが知ら
れている。そのため、本発明にかかるCRP遺伝子は、
FT遺伝子の発現の調節に応用できる可能性が高い。そ
れゆえ、本発明にかかるCRP遺伝子は、花成の人為的
な操作や花成の人為的な制御、さらには、FT遺伝子を
中心とする花成の人為的制御系の確立に、有効に利用で
きる可能性がある。
【0054】本発明にかかるCRP遺伝子のクローニン
グ方法としては、従来公知の方法を利用することが可能
であり、特に限定されるものではない。本発明において
は、その目的が、従来知られていない全く新規の花成制
御遺伝子をクローニングすることであったので、後述す
る実施例で説明するように、シロイヌナズナFT遺伝子
を過剰発現するトランスジェニック・シロイヌナズナ
(形質転換シロイヌナズナ)を、突然変異誘起剤エチル
メタンスルフォン酸で処理して得られる早咲き表現型の
突然変異体を用いて、シロイヌナズナのゲノムデータベ
ースからCRP遺伝子を同定し、クローニングしてい
る。
【0055】本発明では、シロイヌナズナ由来の上記C
RP遺伝子を用いて、他の植物からCRP遺伝子と相同
性を有するDNAをクローニングすることが可能であ
る。この場合のクローニング方法としても、従来公知の
方法を利用することが可能であり、特に限定されるもの
ではない。
【0056】具体的には、ゲノムの少なくとも一部がデ
ータベース化されている植物の場合には、上記CRP遺
伝子の塩基配列に基づいて相同性のある塩基配列をデー
タベース中から検索すればよい。本発明では、後述する
ように、少なくともイネおよびタバコからCRP遺伝子
との相同性を有する塩基配列を見出している。
【0057】また、ゲノムがデータベース化されていな
い植物の場合には、たとえば、従来公知のDNAライブ
ラリーを用いたハイブリダイゼーション法を用いること
もできる。具体的には、適切なクローニング・ベクター
を使用して対象となる植物からゲノムライブラリーまた
はcDNAライブラリーを調製するステップと、上記C
RP遺伝子の少なくとも一部をプローブとして用いてハ
イブリダイゼーションを行い、ライブラリーから上記プ
ローブにポジティブの断片を検出するステップとを含む
方法を用いることができる。
【0058】なお、本発明では、汎用されている相同性
検索アルゴリズムである上記BLASTによる塩基配列
およびアミノ酸配列レベルの相同性検索によって、後述
するように、イネおよびタバコのゲノムのデータベース
からCRP遺伝子との相同性を有する塩基配列を見出し
ている。
【0059】本発明にかかるCRP遺伝子の一部を改変
することによって、変異型CRP遺伝子が得られるが、
この変異型CRP遺伝子は、植物中にて発現させること
で、栄養成長期間を短縮することが可能なものが含まれ
る。中でも、より好ましい一例としては、本発明では、
配列番号2に示す塩基配列中の第296番目の塩基をシ
トシン(c/C)からチミン(t/T)に置換してなる
DNA、すなわち図25ないし図29および配列番号5
に示す塩基配列をORFとして有するCRYPTICPRECOCIOU
S-1D 変異遺伝子(CRP−1D変異遺伝子)が挙げら
れる。
【0060】このCRP−1D変異遺伝子のORFは、
上記第296番目の塩基の改変を除いては、上記CRP
遺伝子のORFと全く同じであり、サイズも6708塩
基対である。しかしながら、上記CRP−1D変異遺伝
子は、それ単体のみで植物中にて発現させても栄養成長
期間を短縮化して花成を促進する機能を有しており、さ
らには、FT遺伝子が過剰発現されている状態で、植物
中にて発現させれば、ほぼ栄養成長期間を無くすまでに
花成を促進するという機能を有している。
【0061】また、上記CRP遺伝子が上記CRP−1
D変異遺伝子に改変されることによって発現する突然変
異を、本発明では、後述する実施例に示すように、cryp
ticprecocious-1D (crp−1D)と命名しており、
本発明にかかるCRP遺伝子の名称もこれに由来してい
る。なお、このcrp−1D突然変異は優性である。
【0062】上記CRP−1D変異遺伝子産物は、図2
2および図23並びに配列番号4に示すアミノ酸配列を
有する蛋白質の変異体であって、図22および図23並
びに配列番号4に示すアミノ酸配列中の第99番目のア
ミノ酸がセリン(Ser )からフェニルアラニン(Phe )
に置換されてなる蛋白質、すなわち、図30および図3
1並びに配列番号6に示すアミノ酸配列を有するCRP
−1D変異蛋白質である。
【0063】このCRP−1D変異蛋白質は、上記第9
9番目のアミノ酸の置換を除いては、上記CRP蛋白質
のアミノ酸配列と全く同じであり、サイズも2235の
アミノ酸残基である。しかしながら、このCRP−1D
変異蛋白質を植物中にて存在させると、少なくとも、そ
の植物は、発芽後の栄養成長期間を短縮することができ
る。特に、FT遺伝子産物としてのFT蛋白質が過剰に
存在する状況では、上記植物の栄養成長期間をほぼ無く
すまでに短縮することが可能である。
【0064】上記crp−1D突然変異が優性であるこ
とから、上記第99番目のアミノ酸の置換により、CR
P−1D変異蛋白質は、CRP蛋白質と比較して、新し
い機能が賦与されたか、共存する正常なCRP蛋白質の
機能を阻害するような性質が賦与されたかの少なくとも
何れかであると推測される。
【0065】また、上記新しい機能または阻害性質の付
与から鑑みれば、本発明にかかる変異型CRP蛋白質と
しては、配列番号4に示すアミノ酸配列を有する蛋白質
の変異体であって、植物中にて存在させると発芽後の栄
養成長が短縮するものであれば、上記CRP−1D変異
蛋白質のみに限定されるものではない。
【0066】具体的には、第99番目のセリンを、フェ
ニルアラニンと共通する性質(芳香環を含む側鎖を持
つ、あるいは、大きな側鎖を持つ)のアミノ酸へ置換す
ることによっても、同様の機能が生じる可能性は高い。
また、複数のアミノ酸が置換されることによっても同様
の機能が生じる可能性もある。
【0067】したがって、本発明にかかる変異型CRP
蛋白質には、配列番号4に示すCRP蛋白質のアミノ酸
配列において、数個、具体的には、5〜10個、好まし
くは1〜5個、より好ましくは1〜3個、さらに好まし
くは1個のアミノ酸残基が置換、欠失または付加、ある
いはそれらの組み合わせが生じているポリペプチドが含
まれてもよい。勿論、特に好ましいのは、第99番目の
アミノ酸残基がセリンからフェニルアラニン、またはそ
れに類似するアミノ酸に置換されたポリペプチドであ
る。
【0068】本発明者らは、上述したように、シロイヌ
ナズナ由来のCRP遺伝子を用いて、イネ(Oryzae sat
iva )から相同遺伝子と考えられる遺伝子をクローニン
グしている。具体的には、データベースに登録されてい
るイネの第10番染色体の塩基配列の中から、CRP遺
伝子の相同遺伝子と考えられる塩基配列を見出し、この
塩基配列を有する遺伝子を、OsCRP遺伝子と命名し
た。なお、OsCRP遺伝子の検索に関しては、BLA
ST2による相同性検索で、E-value =0である。
【0069】上記OsCRP遺伝子としてのDNA(ゲ
ノムOsCRP遺伝子)は、図32ないし図41および
配列番号7の塩基配列に示すように、13000塩基対
(13kbp)のサイズを有している。ゲノムOsCR
P遺伝子が存在する領域は、現状では,イネ・ゲノムの
第10番染色体に1コピー存在している。したがって、
イネ・ゲノム中では、CRP遺伝子と相同性を有する遺
伝子が、少なくとも1コピー存在することになる。この
ゲノムOsCRP遺伝子のORFは、図42ないし図4
6および配列番号8の塩基配列に示すように、6561
塩基対すなわち約6.6kbpのサイズを有している。
【0070】上記ゲノムOsCRP遺伝子は、図47お
よび図48並びに配列番号9のアミノ酸配列に示すよう
に、2186のアミノ酸残基からなるポリペプチドをコ
ードしている。換言すれば、OsCRP遺伝子産物とし
てのOsCRP蛋白質は、2186のアミノ酸残基から
なる蛋白質である。
【0071】上記OsCRP蛋白質とCRP蛋白質との
間で、アミノ酸配列の相同性を見た場合、図49ないし
図51に示すように、上記kto蛋白質において相同性
の高かった領域を含む第48番目から第268番目の領
域、第534から第577番目までの領域、第634番
目から第654番目までの領域、第669から第689
番目までの領域、第924から第960番目までの領
域、第1669から第1693番目までの領域、第22
06から第2235番目までの領域等については、よく
保存されている。
【0072】上記の比較結果から、CRP遺伝子産物と
してのCRP蛋白質においては、アミノ酸配列における
第99番目のセリンと、第61番目のセリンから第26
1番目のロイシンまでの領域とが非常に重要であること
が分かる。
【0073】また、イネと同様に、データベースに登録
されているタバコ(Nicotiana tabacum )のゲノムの塩
基配列の中から、シロイヌナズナ由来のCRP遺伝子の
相同遺伝子の一部と推測される塩基配列を見出し、この
塩基配列を含む遺伝子を、NtCRP遺伝子と命名し
た。なお、NtCRP遺伝子の検索に関しては、予想さ
れる全アミノ酸配列の一割程度の長さであることもあ
り、BLAST2による相同性検索で、E-value =4e
-10 程度である。
【0074】図52および配列番号10に示す塩基配列
は、NtCRP遺伝子のORFの部分塩基配列(285
塩基対分)であり、CRP遺伝子における第1ないし第
3エクソンを含む領域に対して相同性を有している。ま
た、この部分塩基配列の遺伝子産物としての部分アミノ
酸配列は、図53および配列番号11に示すように、N
末端の96のアミノ酸残基分に相当する。
【0075】このように、本発明にかかるシロイヌナズ
ナ由来のCRP遺伝子と類似する遺伝子は、イネやタバ
コでも見出されており、さらにはキイロショウジョウバ
エ、ヒト、出芽酵母でも見出されている。したがって、
CRP遺伝子に類似する塩基配列のDNAは、幅広い種
のゲノム中で保存されていることが示唆される。
【0076】それゆえ、本発明にかかる変異型CRP遺
伝子を導入することで花成を促進させ得る植物として
は、シロイヌナズナに特に限定されず、幅広い種類の植
物を用いることができる可能性は非常に高い。特に、C
RP−1D変異遺伝子を植物に導入して高いレベルで発
現させれば、栄養成長期間を短縮し、花の形成を早める
ことができる可能性は非常に高いと推測される。この場
合でも、シロイヌナズナの場合と同様、花の形態・種子
形成能は正常であると推測される。特に、CRP−1D
変異遺伝子とFT遺伝子を同時に導入し、植物内で高い
レベルで発現させれば、実質的に、栄養成長期間を経ず
に花を形成させ得る可能性は非常に高い。しかも、この
場合にも、花の形態・種子形成能は正常であると推測さ
れる。
【0077】したがって、本発明には、少なくともCR
P−1D変異遺伝子を導入してなるトランスジェニック
植物も含まれ、FT遺伝子を過剰発現するとともに、C
RP−1D変異遺伝子を発現するトランスジェニック植
物も含まれる。
【0078】上記トランスジェニック植物では、CRP
−1D変異遺伝子が発現するため、花成を促進すること
が可能である。しかも、特にFT遺伝子が過剰発現する
条件下では、後述するシロイヌナズナを用いた実施例の
結果を考慮すれば、ほぼ栄養成長を回避し得るまで花成
を促進できる可能性が非常に高い。そのため、発芽から
迅速に種子を得ることが可能である。しかも花や種子の
形成能はほぼ正常であると推測されるため、本発明を好
適に応用できる分野の一つとして、植物の種子を迅速に
生産する用途を挙げることができる。
【0079】本発明における上記植物としては、花を形
成する植物を全て含めてよい。また、上記植物には、完
全な植物だけでなく、その一部、例えば、葉、種子、塊
茎、挿木等を含めてもよい。さらには、上記植物には、
予め形質転換された遺伝子組み換え植物やその子孫を起
源とする植物組織、プロトプラスト、細胞、カルス、器
官、植物種子、胚芽、花粉、卵細胞、接合子などの増殖
可能な植物材料;花、茎、実、葉、根などを含む植物の
一部;等も含めてよい。なお、上記植物材料は、有性的
または無性的にin vitroまたはin vivo で繁殖可能なも
のを指す。
【0080】本発明において、植物にCRP−1D変異
遺伝子やFT遺伝子を導入する方法としては、CRP−
1D変異遺伝子やFT遺伝子を含むベクターを用いて、
宿主細胞すなわち上記植物を形質転換することによって
導入する方法を用いることが可能である。
【0081】上記ベクターは、公知の形質転換方法によ
って植物(宿主細胞)に導入される。植物を形質転換す
る方法としては、具体的には、たとえば、マイクロイン
ジェクション法、エレクトロポレーション法、アグロバ
クテリウムによる形質転換法、直接遺伝子転移法、弾道
粒子加速法、プロトプラスト形質転換/再生法などを挙
げることができるが、特に限定されるものではない。ま
た、上記形質転換方法としては、標的となる植物の種
類、たとえば単子葉植物・双子葉植物などに応じて適宜
選択されるものであり、特に限定されるものではない。
【0082】本発明では、植物中でCRP−1D変異遺
伝子を安定して発現させる等の目的で、CRP−1D変
異遺伝子を組み換えてなる組み換えベクターを用いても
構わない。なお、上記組み換え方法については、従来公
知の方法を用いることが可能であり、特に限定されるも
のではない。なお、以下の説明で、CRP−1D変異遺
伝子の導入に関する技術は、組み換え技術等も含めて、
FT遺伝子の導入および発現にも応用できることは言う
までもない。
【0083】上記ベクターとしては、プラスミド、ファ
ージ、またはコスミドなどを挙げることができるが特に
限定されるものではない。上記CRP−1D変異遺伝子
やFT遺伝子は、シロイヌナズナ等由来となる植物から
単離された形態で、好ましくは組み換えられて、ベクタ
ー中に組み込まれればよい。
【0084】たとえば、上記組み換えの一例としては、
プロモーター・シグナル配列・転写ターミネーター等の
適切な調節配列とCRP−1D変異遺伝子(またはFT
遺伝子)とを連結するような例が挙げられる。上記植物
または植物細胞中で有効に機能し得るプロモーターとし
ては、たとえばカリフラワーモザイクウイルス(CaM
V)19SRNAプロモーターまたは35SRNAプロ
モーターおよびCaMV二重プロモーター;ノパリンシ
ンターゼプロモーター;病因関連(PR)蛋白プロモー
ター:等が挙げられるが特に限定されるものではない。
【0085】導入されたCRP−1D変異遺伝子は、植
物細胞中でベクターとして存在してもよいし、植物DN
A中に「外部」DNA、又は「付加」DNAとして含ま
れてもよい。ここで言う「外部」DNAとは、植物ゲノ
ム中には天然に存在しないが人為的操作の結果、植物ゲ
ノム中に挿入されたDNAを意味する。また上記「付
加」DNAとは、特定の植物ゲノム中に天然に存在する
が、人為的操作の結果、さらに追加して植物ゲノム中に
挿入されたDNAを意味する。
【0086】上記ベクターとして、一般的に用いられる
ものとしては、たとえば、アグロバクテリウム ツメフ
ァシエンス(Agrobacterium tumefaciens )のTiプラ
スミドを挙げることができる。このTiプラスミドは、
双子葉植物の形質転換にも単子葉植物の形質転換にも用
いることが可能である。この場合、上記CRP−1D変
異遺伝子は、TiプラスミドのT−DNAに組み込まれ
た上で、植物細胞に導入される。
【0087】上記Tiプラスミドを植物細胞に導入する
方法としては、特に限定されるものではなく、Tiプラ
スミドを「完全な」植物に感染させる、上記植物材料に
感染させる、あるいは、植物細胞をプロトプラスト化ま
たはスフェロプラスト化して、これをアグロバクテリウ
ム・ツメファシエンスと共に同時培養する等の方法を用
いることが可能である。
【0088】また、本発明では、シロイヌナズナ由来の
CRP−1D遺伝子を、植物細胞のゲノムに導入し、そ
の植物細胞から形質転換された「完全な」植物(形質転
換植物)を再生して、必要なら増殖させ、さらに、親世
代または継代される子孫世代として得られる形質転換植
物から、植物の所望の一部、たとえば種子を得るような
手法を用いることも可能である。なお、上記完全な植物
の増殖には、水耕栽培や温室栽培等を含む、一般的な従
来公知の農業の方法を利用すればよい。
【0089】また、本発明では、親世代の植物には、C
RP−1D変異遺伝子が安定して発現することが好まし
いが、子孫世代の植物では、必ずしも安定して発現する
必要はない。換言すれば、子孫世代の植物では、親世代
の植物に導入されたCRP−1D変異遺伝子を意図的に
消失させるような比較的「不安定」な形質転換法を選択
することも可能である。
【0090】たとえば、本発明の用途としては、植物の
種子を迅速に生産する用途を想定することができる。た
とえば、交配による育種の途中の段階で、少量でもよい
から少しでも早く種子を得たいような場合には、本発明
を好適に利用することができる。
【0091】この場合、CRP−1D変異遺伝子とFT
遺伝子とを発現させれば、対象となる植物の栄養成長期
間をほぼ消失させて、迅速に植物の種子を得ることが可
能である。しかしながら、上記対象となる植物が、たと
えば園芸用の花卉であり、産業上利用するには、栄養成
長でなければ生じない本葉が重要となる場合には、栄養
成長期間の消失は好ましくないことになる。そこで、こ
のような場合では、親世代のみで栄養成長期間を消失さ
せ、子孫世代では、少なくともCRP−1D変異遺伝子
が発現しないようにしておけば、上記問題点を解消する
ことが可能である。
【0092】本発明を利用することができる上記植物と
しては、花を形成する植物であればよい。具体的には、
アサガオなど花そのものを利用する鑑賞用や園芸用の花
卉、シロイヌナズナなどの実験植物、あるいは、花成後
に生じる種子(ここでは果実も含む)を利用する種子作
物を挙げることができる。特に種子作物の場合には、産
業上の利用では、たとえば上述したような、親世代で消
失した栄養成長を子孫世代で復活させるような必然性が
ない場合が多く、種子を迅速に生産できればよいため、
好ましい利用対象植物として挙げることが可能である。
【0093】上記種子作物としては、たとえば、イネ、
キビ、アワ、トウモロコシ、大麦、コムギ、モロコシ、
ライムギ、エンバク等の穀物類;大豆、小豆等のマメ科
植物;ワタ、ナタネ等のその他の種子を利用する植物;
トマト、キュウリ、ナスなどの実生の野菜;リンゴ、ナ
シ、サクランボ、ブドウ、柑橘類、バナナ等の果物;コ
コア、コーヒー等の嗜好品作物;等を挙げることができ
る。
【0094】このように、本発明にかかるトランスジェ
ニック植物は、上記CRP−1D変異遺伝子を植物に導
入したものであるので、栄養成長期間を短縮化すること
が可能である。特に、FT遺伝子の過剰発現状態では、
子葉が生じた後に、ほぼ栄養成長を経ずに花を形成する
可能性が高い。そのため、花成促進による植物の繁殖、
たとえば上記種子作物等を迅速に生産するような用途に
応用することが可能となっている。
【0095】さらには、本発明には、上述してきたトラ
ンスジェニック植物を生産する方法が含まれてもよい。
すなわち、ある特定の植物を迅速に生産したい場合に
は、上述した各種の形質転換法を用いて、CRP−1D
変異遺伝子、または、FT遺伝子およびCRP−1D変
異遺伝子を植物に導入すればよい。
【0096】また、本発明にかかる上記CRP遺伝子
は、後述する実施例で詳細に述べるように、FT遺伝子
を過剰発現させてなるシロイヌナズナを突然変異させる
ことで得られる早咲き表現型を極端に昂進するcryptic
precocious-1D (crp−1D)突然変異体からクロー
ニングされたものである。したがって、上記crp−1
D突然変異体のシロイヌナズナも十分利用価値を有す
る。
【0097】シロイヌナズナは、(1)世代時間が約5
〜6週間と非常に短いこと、(2)通常の実験室内で水
耕栽培によって生育できること、(3)植物体そのもの
が20〜30cm程度と小さいこと、(4)自家和合性
(同じ花の花粉で受精する)であるため、多数の種子
(1個体当たり数百から数千個)が得られること、
(5)染色体数が少ないため、遺伝子のマッピングが容
易であること、(6)ゲノムサイズが既知の植物中最小
であること等の利点があるため、小型の実験植物として
は、非常によく用いられている。
【0098】ここで、上記crp−1D突然変異型のシ
ロイヌナズナでは、後記の実施例で述べるように、花成
を促進させることができるだけでなく、形成される花に
も種子にも異常が見られない。それゆえ、実験用等にシ
ロイヌナズナを迅速に繁殖させるような用途には、上記
crp−1D突然変異型のシロイヌナズナを特に好まし
く用いることができる。
【0099】上記crp−1D突然変異型のシロイヌナ
ズナの生産方法は特に限定されるものではない。たとえ
ば、後記の実施例に示すように、FT遺伝子を過剰発現
するように形質転換したトランスジェニック・シロイヌ
ナズナ(形質転換シロイヌナズナ)を、従来公知の突然
変異誘起剤で処理することによって容易に得ることがで
きる。あるいは、上述した従来公知の形質転換法を用い
て、CRP−1D変異遺伝子を野生型のシロイヌナズナ
に導入してもよい。
【0100】なお、FT遺伝子を過剰発現させる方法と
しては、特に限定されるものではなく、前述したCRP
−1D変異遺伝子の導入に関する技術を応用すればよ
い。一般的には、組織・発生段階を問わずに高い転写活
性を有するプロモーターを選択することによって、FT
遺伝子を野生型よりも過剰に発現させればよい。たとえ
ば、カリフラワーモザイクウイルス(CAMV)の35
SRNAプロモーターにより発現が制御されるFT遺伝
子を好ましく用いることができる。
【0101】
【実施例】次に、本発明にかかるCRP遺伝子およびC
RP−1D変異遺伝子、並びにCRP蛋白質およびCR
P−1D変異蛋白質の具体的な取得方法について、図5
4および図55に基づいて、より詳細に説明する。な
お、本発明は、これに限定されるものではない。
【0102】〔突然変異体の取得〕文献1:Y.Kobayash
i, H.Kaya, K.Goto, M.Iwabuchi & T.Araki : Science,
286 1960-1962 (1999) に開示している、シロイヌナズ
ナ由来のFT遺伝子がCAMVの35SRNAプロモー
ターにより過剰発現(高レベル発現)するトランスジェ
ニック・シロイヌナズナ(形質転換シロイヌナズナ)
を、突然変異誘起剤エチルメタンスルフォン酸で処理し
た。このときの処理方法については、文献2:『新版・
モデル植物の実験プロトコール』(島本功・岡田清孝監
修 秀潤社 2001)の第63〜68頁に記載している処
理方法を用いた。
【0103】得られた形質転換シロイヌナズナの子孫か
ら、FT遺伝子の過剰発現による早咲き表現型を極端に
昂進する突然変異体の系統を見出し、その性質の遺伝性
を確認した。原因となる突然変異は優性であり、crypti
c precocious-1D (crp−1Dと略す)と命名した。
crp−1D突然変異体において突然変異をおこしてい
る遺伝子を突然変異の名称にもとづいて CRYPTIC PRECO
CIOUS (CRP)遺伝子と命名した。
【0104】〔crp−1D突然変異体の性質の評価〕
上記CRP遺伝子の遺伝子型としてcrp−1D突然変
異をホモ接合で有するシロイヌナズナと、対照標準(コ
ントロール)として、野生型ホモ接合のシロイヌナズナ
(正常なCRP遺伝子を有するシロイヌナズナ)とをそ
れぞれ15個体準備し、長日(16時間明・8時間暗)
の条件で生育させた。この生育時における栄養成長期間
の長さに基づいて、crp−1D突然変異体の性質を評
価した。なお、栄養成長期間の長さについては、栄養成
長の過程で形成されるロゼット葉の数を指標とした。
【0105】図54に示すように、発芽後4週間目にお
ける花成の状態を比較すると、crp−1D突然変異を
ホモ接合で有するシロイヌナズナ(図中、形質転換植物
と表現)ではすでに開花・結実が始まっているのに対し
て、野生型ホモ接合のシロイヌナズナではようやく蕾が
形成された程度であった。
【0106】また、最終的には、表1に示すように、野
生型のシロイヌナズナ(図中、非形質転換植物と表現)
では、crp−1D突然変異をホモ接合に持たせた場合
には、本葉を形成する栄養成長期間(3〜4週間)が数
日程度短縮された。なお、形成された花の形態や種子形
成能には異常はなかった。
【0107】
【表1】
【0108】さらに、上記crp−1D突然変異をホモ
接合で有するシロイヌナズナと、上記野生型ホモ接合の
シロイヌナズナを、シロイヌナズナ由来のFT遺伝子で
形質転換し、FT遺伝子を高いレベルで発現させた形質
転換シロイヌナズナとした上で、上記と同様の条件に
て、crp−1D突然変異体の性質を評価した。
【0109】図55(a)および表2に示すように、F
T遺伝子を過剰発現させると、正常なCRP遺伝子を有
する野生型ホモ接合の形質転換シロイヌナズナ(図中、
形質転換植物と表現)でも、子葉形成後、2〜4枚の本
葉を形成する短い栄養成長期間を経たのみで、花が形成
された(上記文献1参照)。
【0110】さらには、図55(b)および表2に示す
ように、同じ形質転換シロイヌナズナがcrp−1D突
然変異をヘテロ接合で有する場合では、発芽後、本葉を
形成することなく花が形成された。なお、何れの場合で
も、形成された花の形態や種子形成能には異常はなかっ
た。また、図55(a)・(b)では、発芽後1週間目
の結果を示している。
【0111】
【表2】
【0112】〔CRP遺伝子の同定〕まず、上記文献
2、および文献3:『モデル植物ラボマニュアル』(岩
淵雅樹・岡田清孝・島本功監修 シュプリンガー・フェ
アラーク東京 2000)の第51〜66頁に記載している
方法を用いて、crp−1D突然変異体を用いてCRP
遺伝子の染色体上における位置を決定した。その結果
と、データベースにあるシロイヌナズナのゲノムの塩基
配列情報にもとづいて、CRP遺伝子が存在する領域を
第4番染色体の約30000塩基対の範囲に限定した。
その領域内に予測された遺伝子について、野生型株とc
rp−1D突然変異株とで塩基配列の比較を行った。そ
の結果、1つの遺伝子が両者の間で異なる塩基配列を持
つことを確認し、その遺伝子がCRP遺伝子であると判
断した。
【0113】〔CRP遺伝子のcDNAクローンの取
得〕CRP遺伝子の塩基配列から、約7100塩基対の
cDNAが予想され、完全長cDNAクローンを単一の
クローンとして取得することは容易でないと判断した。
そこで、cDNAを前半分と後半分の2つに分けて、そ
れぞれを別々に取得したのち、それらを連結して完全長
cDNAクローンを作成した。
【0114】cDNAの中ほどに制限酵素SphIの認識・
切断部位が1箇所ある。そこで、前半分と後半分がいず
れも制限酵素SphIの認識・切断部位を含むように一部重
複するかたちでcDNAを二分し、文献4:『新版・植
物のPCR実験プロトコール』(島本功・佐々木卓治監
修 秀潤社 1997)の第106〜109頁に記載してい
る方法を用いて、それぞれをRT−PCR法により増幅
・取得した。その結果得られた前半分と後半分を制限酵
素SphIで切断し、DNAリガーゼにより連結し、完全長
cDNAクローンとした。
【0115】なお、本実施例でクローニングされたCR
P遺伝子およびCRP−1D変異遺伝子、これら遺伝子
にコードされているCRP蛋白質およびCRP−1D蛋
白質、並びに、前記実施の形態で述べたOsCRP遺伝
子とそれにコードされているOsCRP蛋白質、NtC
RP遺伝子とそれにコードされているNtCRP蛋白質
の配列について、改めて表3として以下にまとめてお
く。
【0116】
【表3】
【0117】
【発明の効果】以上のように、本発明にかかる遺伝子
は、植物のゲノムから単離され、その一部を改変した状
態で植物中にて発現させることで、栄養成長期間を短縮
する遺伝子であり、具体的には、シロイヌナズナの第4
番染色体にコードされるCRP遺伝子を挙げることがで
きる。上記遺伝子は、その一部を改変した状態で、かつ
FT遺伝子の過剰発現状態で植物中にて発現させること
で、発芽後に本葉形成を回避して花を形成するものであ
る。
【0118】それゆえ、上記構成では、花成を促進させ
るという、花成制御の一つの方法を実現できる上に、F
T遺伝子を中心とする花成の制御機構に重要に関与する
ことが明らかであるため、FT遺伝子を中心とする花成
の人為的制御系の確立に応用することができるという効
果を奏する。
【0119】上記CRP遺伝子は、具体的には、配列番
号1に示す塩基配列からなるDNAであり、配列番号2
に示す塩基配列をオープンリーディングフレームとして
含むDNAであり、さらに、配列番号3に示す塩基配列
を有するcDNAである。
【0120】また、本発明にかかるCRP蛋白質とは、
上記塩基配列を有するCRP遺伝子の遺伝子産物であ
り、配列番号4に示すアミノ酸配列を有する蛋白質であ
る。また、本発明にかかるDNAとは、配列番号4に示
すポリペプチドをコードする、上記DNAとは異なる塩
基配列を有するポリヌクレオチド(遺伝子)であっても
よい。
【0121】さらに、本発明にかかる変異型CRP遺伝
子は、CRP遺伝子のORFであり、配列番号2に示す
塩基配列における塩基の一部を改変したDNAであっ
て、植物中で発現することにより栄養成長期間を短縮す
るDNAである。この変異型CRP遺伝子のより好まし
い一例としては、配列番号2に示す塩基配列中の第29
6番目の塩基をシトシンからチミンに置換されてなるC
RP−1D変異遺伝子が挙げられる。
【0122】また、本発明にかかるCRP蛋白質の変異
体、すなわち変異型CRP蛋白質は、配列番号4に示す
アミノ酸配列を有する蛋白質の変異体であって、植物中
にて存在させることで発芽後の栄養成長が短縮する蛋白
質である。この変異型CRP蛋白質のより好ましい一例
としては、配列番号4に示すアミノ酸配列中の第99番
目のアミノ酸がセリンからフェニルアラニンに置換され
てなる蛋白質、すなわち、配列番号6に示すアミノ酸配
列を有するCRP−1D変異蛋白質が挙げられる。
【0123】したがって、本発明にかかる変異型CRP
遺伝子としては、配列番号6に示すCRP−1D変異蛋
白質をコードするDNAであってもよい。
【0124】また、本発明にかかる他のCRP遺伝子
は、イネの第10番染色体にコードされ、配列番号1な
いし3の何れかに示すDNAと相同性を有するDNA、
たとえば、配列番号7に示す塩基配列からなるDNAを
挙げることができ、配列番号8に示す塩基配列をオープ
ンリーディングフレームとして含むDNAを挙げること
ができる。
【0125】また、本発明にかかる他のCRP蛋白質と
しては、配列番号9に示すアミノ酸配列を有する蛋白
質、すなわちイネのCRP蛋白質(OsCRP蛋白質)
が挙げられる。
【0126】さらに、本発明には、上記crp−1D突
然変異体のシロイヌナズナも含まれる。このcrp−1
D突然変異体のシロイヌナズナでは、花成を促進させる
ことができるだけでなく、形成される花にも種子にも異
常が見られないため、実験植物として広く利用されてい
るシロイヌナズナを迅速に繁殖させるような用途に、特
に好ましく用いることができるという効果を奏する。
【0127】本発明における有望な応用技術としては、
たとえば、上記CRP−1D変異遺伝子、または、CR
P遺伝子の一部を改変した状態で植物中にて発現させる
ことで、栄養成長期間を短縮する変異型CRP遺伝子を
導入したことを特徴とするトランスジェニック植物が挙
げられる。また、上記CRP−1D変異遺伝子または変
異型CRP遺伝子を植物に導入するステップを少なくと
も含むことを特徴とするトランスジェニック植物の生産
方法が挙げられる。
【0128】上記構成または方法によれば、トランスジ
ェニック植物の栄養成長期間を短縮化することが可能で
あり、特に、FT遺伝子の過剰発現状態では、ほぼ栄養
成長を消失させることも可能である。その結果、花成す
る植物の繁殖、たとえば種子作物等を迅速に生産するよ
うな用途に応用することが可能となるという効果を奏す
る。
【0129】
【配列表】
SEQUENCE LISTING
<110> Japan Science and Technology Corporation
<120> シロイヌナズナ由来の花成制御遺伝子およびそれにコードされる蛋白質、
並びにその利用方法
<130> A182P15
<160> 11
<170> PatentIn Ver. 2.1
<210> 1
<211> 11000
<212> DNA
<213> Arabidopsis thaliana
<400> 1
aatttttttt atttgtttaa catgaatcta aattatactt gagactatag aaacaaatag 60
aatttataca agaaaaatgt acttaccaaa aaaaaaaata tatatccaag aaaaatgttg 120
aaacaattac tacatacttt gaagattgat ctaagcaaat attgatcgga tcatagtaat 180
gaattcgaaa tctaagacca tacaaaacat gccataggaa gagctttaaa aatccaaaaa 240
gaataaaaat ctgaaaaatc ccaaaaaagg aaataaaaat ggattcacaa gacgaaaccc 300
ttgttgcata gcatagcatc caccatcatg tcaaaactag tctaataaat aaaatactat 360
tttacccatt tagcccctag gagcttaggc aagagaacgc aaggacagaa tcggaaatat 420
aaaccagaaa aggttaagat tttcttacca gaacagtgtg tgttagatcg aaattcgatc 480
gatcaatcgc aaaaaaaaga gagtttgttg ttgttgttgc ttctctgctt ctattcgatt 540
attcttcttc tatttagtct ttgtttggtg tttgttctct tccttcttct tctttcctca 600
gagcacacga taactatttt cacatcccaa actacggaat cacaaaaatc tgcagataaa 660
ggaattgttt ttacacagca gagagagaga gcattcgttg tcctcattac accaaaaaag 720
tgcacaagag aagagattga aaaagaaaag agtcaaactt taacaaagcc caagactctt 780
ctttgcttct tcttcttctg ggccttgtta tttattgctt cttcttcctc tctgaatctc 840
tctcgcgctc tagatttccc ctttattgga aaaccctcaa tttctataaa gttccaagct 900
ttggttctgt tttcgtttac caaatctctc ccttgattcg tcgaatctcg tggttcttcg 960
agtttctctc atcagggtcg aggtcgaatt cgcggaattt cctgtcaaaa ccctaacttt 1020
gattcgactc cggattgtgg ggtcatctcg agctcctatt ggttagtttt cgatttgaaa 1080
ccctagcttt tatttatttt atcgtacgga ttaatatttg tttgcgtagt tcgatttggt 1140
atatttgatg atcatggtga ttgttttcta gctcagaaaa ggatttagtt ttagcagatt 1200
tttgtttgct tctatctgga tttgttcttc tctggtatgt atgtagcttg acgcagtgtg 1260
ttttcaactg ggaataaata cttccttctt cgataaagca tctaacttta attcagattc 1320
tgttttgtgt atagaaatat tgttcatgat gattatttgt atgtactaga attgtacttc 1380
cacgctttca tgttttctag tttggttgct tgattagggt tggcttatat ttactcaaga 1440
tacttatcat gcaaagctca gaatttcact ttaagtgatg tatgttatag ataaagtttc 1500
aggctaaata tttgaagaga atgtggaacg tattaggcga tttgaactat atgactgtta 1560
gagtaagcgt aatgagctct tttgagcagc tgatctgtga tatgattaca gacaactaaa 1620
tttcatagga atatatgaga attaaagccg agtttcaaaa cttctattgc acacacaata 1680
ttgagactat atgtaacttt agtgttttct tcttcttatt cagtgtaaat tcaacaccag 1740
gggtactttt atgtttcagg gtttacttcc atcaatgggg ttgcgctgtc gccagtgcta 1800
agttttatgc tgtaaggaga tattgaaaat aaaagtggaa gtccatgaaa aagtttctta 1860
tggtgctaga ctgtggattg gtgcttagag tttattgtgg tatgttgatg tcagaaccag 1920
tatgctggat atagttggga gaaatgcaaa ggtatcatgc tgccaactgc actagtgcag 1980
tcaacaatag tgctataggt ggtgcatccg cgagggactc aggacgagct gattcctctt 2040
cgattggaaa ctattcacta aactccaggc atgttgatag aaagaagtac ttacatagtt 2100
attttatatg ttgatacatt tgaagacgtt tgaatacttt ctttactgca ggagaccacc 2160
accgttgaca ccctacaagt tgaagtgtga aaaggacggt ctgaattccc ggtaattcct 2220
ctttcacctt atccctagtt taggtattcg ataaacacaa tatagatgat tttaaatttt 2280
gctgttttag atttgtagct tgggatttca ttcttttatc tccgataggc taagtccttg 2340
gagtacttgt taatggatga agttggcact cttttccatt tttgatttac ttccctagat 2400
gatttatact ttttctctat tgcagattag ggccgcctga ttttcatcct ccaacatcaa 2460
attctcccga agagaatctg accaaagagt atgttcaatt tggatacaag gaaactgttg 2520
atggacttaa ggtgcgatca actgaattta gcagctatgc ttttaatttt tttgtagtat 2580
cgtagttaat tatcattgac atgtttgcaa ttaaaataaa tatcttagat cttattttgg 2640
accatgccta tagtattttc ctatagatgc tcagcagtaa aataagaata gtttcttact 2700
gaggctgaat gttcattgta gcttgatagg ttgtaatgat gatttcttca atgtagtcat 2760
ataagatgct tacaactcag aaagtctaca ttattataag tttcatcttt tccgatgtta 2820
gagtttttaa ttccttattc cactagtttt cgcgcattat cttgtaattg aggttctgaa 2880
cctttggcct ttacaggaat ccgaagaaat tatattgtcc caggtccata ctttctcaaa 2940
gcctgttgtc cataagtgca aagaggtacg gtactagaaa ttatagacaa tgttgtctcc 3000
cttatttgtg atctctattg gagttcattt gtgtttcaca tgaagttaaa ttcaatttct 3060
atcccgcagg cagtcagaaa gtgtcttaga gctatcaatg aatctcgtgc actgaagcgc 3120
aaggtaatca agagactctc agactccaat ccttttcaat ttatcttttg tgcagagttc 3180
agggtttcgg tcccaatcat attgcttata attcataatc tccctattca attaactggc 3240
aggctggtca ggtttatggg gtgcctctct ctggttcgct tctatgtaag cctggatttc 3300
cagaacaaag gtcatgtggg gaggagacaa agaaaagatg gatcgaggta cctggccttt 3360
tattatgctt atctaaactt cttaacaatt ctcctctgat ccatgtttgt tgctgactcg 3420
tggcataact gccatatatt cttaaagaag aatacttaac tcattcttgc tctcattttt 3480
tcacagagtt tatcacaaca gcacaaacga ttgcgctctt tggctgataa cattcctgga 3540
tataggagaa aaaccttatt tgaagtcctt ataaggaaca atgtcccact attgagagct 3600
acttggttta taaaagtgac ttatctcaat caggtacatt gttgggcaat aaattggtat 3660
ctctaattga tttctctagg tgttggagga tatcaagttt tgcttataat ttgcaggtgc 3720
gacctagtcc tgctgctatt tcttcaggaa cacctgacaa gacacaagct tctcggtgtg 3780
agcaatggac aaaagatgtt attgaatatt tgcaatacct cttggatgaa cttttgtcac 3840
ggaatagctc atttcctgct cagcaaacta gagataggtc accacagatg ctttatacag 3900
gatcaatgca aaagaatagt ccagcatcaa caagccttta cggcgaggaa acatctctac 3960
attttaaatg gtggtatatg gtgcgtcttc tacagtggca ccatgctgaa gggcttcttt 4020
ttcctaatct cattgttgat tgggttctca agctcttaca ggtatgctgt tagattaatt 4080
gacttattca agatgaattt tcatttcttc agctttgtga atttccattt tgctttactg 4140
caggaaaagg agatctttga aattttgcag ctgctactcc ccattgtgta tggtgtttta 4200
gagagtattg ttctctctca gacatatgta cagagtcttg tagctattgc tgtccgtttc 4260
attcaggaac ctgctcctgg tggatctgat cttgttgata actctcgaag agcttatact 4320
ctatctgctc taattgagat ggttcgctac ttggtacttg ctgcacccga cacatttgtt 4380
gcttcagatt tctttcctct tcctccttcc gtagcagcat gtggacctaa tgatgtgagc 4440
tatacgtcaa aggcttatga gaatctggaa aagctgagaa gtaactctgc ggagatttct 4500
gcccagtttc aaggaagagg agttctttcc cggtttgagt tcctttcttt tgattatacc 4560
atttcaacca ttcaaagaag tgcagatgat ttggcaaaga tagctagcgc tggttaccct 4620
caacataacg tggctaaagc tgttcaggcc ttggataaag ctttgtcgga tggagatatc 4680
agagctgctt acagttatct ctttgaagac ctttgcaatg gagccgttga tgaggcctgg 4740
attactgacg tcagtccatg tttaagatca tcccttagat ggattggcgc tattagcaca 4800
tcctttgttt gctccgtttt tttccttata gaatgggcta catgtgattt tagagatttc 4860
cgtgctggtg tgcctaaaga tatcaagttc tctggcagaa aagattgttc tcaggtgtat 4920
ttagtcattc agcttctgaa gcaaaagatt ctgggtggag aattcacagc tcgcaaagga 4980
aagaattgtc gcaacaattt tcttggtgtt tctaaaccta gcggttcgat ggatgcattt 5040
gaaagcccgg gcccattaca tgatatcata gtctgttgga ttgatcagca tgaggtacac 5100
aagggaggag caaagcgctt gcaattactc gtttttgaac ttatacgttc tggaatcttt 5160
aatcccatag catatgtgag gcaactcata gttagcggga tgatcgatgt gattcaacct 5220
gctgttgatc ctgaaaggag aatgaggcac catcgcatat tgaaacagct acctgggtgt 5280
tttgtacatg aaaccttaga ggaagctcaa ctctttggag gggataagct ttccgaggct 5340
gtgagaactt attctaatga acggcgcctt cttcttcgag aactgcttgt tgagaaaggt 5400
aaatactgga ataatttagt tctctcagat cagaagtcaa agaaaatttc cacttccctt 5460
tcgtctgtta tttttccaag ggcgtgtaat gccaagagca atagtaaggg acctcgcaaa 5520
cataccaaga gtagtgtgga tattagagaa ctaaaggagc gcatatcagc tctactgcag 5580
tttccaggta tgtcatgtgg tgtggaaacc ccagtgcgag atgaattcca aaatagtgtt 5640
aagagatcaa gtggatctgt gtatagcaag atggatcaac cagaagctac accagggtgt 5700
gaagactgta gaagagcaaa aagaccaaaa atgaatgatg aaaagagctc ttgctatcaa 5760
gggaattcac caattgcatc agatgaagaa gataactggt ggatcaagaa aggatcgaaa 5820
actgtggagt cttctctgaa ggttgatcct cagatagaga taactaaaca agtaccacga 5880
ggtaggcaga agatggcgcg taagacacag tcgctggctc aactacaagc tgctagaatt 5940
gaaggtagcc agggcgcttc aacgagtcat gtttgtgata ataaagtaag ctgtcctcat 6000
catggccctg gagtggaagg agaaaatcag aaggtggttg atgtgtttag aacttccacc 6060
cctgtggata tggtatctgt tggaaactct ttgaagcagc tacagtttgt tgataagcga 6120
tctattgcag tttggcttac tactgcagtt cggcaacttg ttgaagagcc ccaaaagagc 6180
agtgtgagag ttgggcagtt caatagaggt gctccagttg aggagaagaa cacaattagg 6240
tggaagcttg gggcagacga gctatactcc atattatttc tcttggatat ctctcttgac 6300
ttggtttcag cggttaaatt tcttctttgg ttattgccga aggccaacag taccccaagt 6360
tttgccgtac agggtggaag aaaccttgta actgtaccaa ggaatgttga aaacaacatg 6420
tgtgaaatag gcgaggcgat tctagtatca tcactgagaa ggtggttttt acttccttca 6480
ataagtaaac actattcata tatatttttg attgtatttc tagaaattta atcggtttgt 6540
atcattaatt tctttcaggt atgaaaacat tctactttca gctgatcttg ttcctgaggc 6600
catgacagct ttgatgaacc gtgctgcatc acttatgtct agtaatggaa aaatttctgg 6660
atcagcagcc ttagtttata ctcgctatat tttgaaaaga tatggaagcc tccccagtgt 6720
tgtggaatgg cataacaatt tcaaagcaac atccgaaaag aagctacttt ctgaactaga 6780
tcatacgcga tcaggaaatg gtgagtatgg gaaccccctc ggggttccag caggagtaga 6840
taatccagat gactatttac gtaaaaaaat cagcattggc ggtgcacgtc cttcaagagt 6900
gggtttgagt atgcgagatg ttttgcaacg acatgttgaa gaggcgactc attatctcaa 6960
aaaactcatt gggactggta ctatgaaagc ctctctcgct gagaaaaatg atgacgggta 7020
tcaggtggct caacaaattg tagttggact aatggactgc attagacaga ctggcggtgc 7080
agctcaagag ggtgatccct ctttggtttc ttctgcggtt tctgcgatta taaacagtgt 7140
aggcctttca gtggcaagga ttacagattt ctctttggga aacatttatc agaatcatcc 7200
ttctggcgtt gattcatcta atattgcacg atacatttta cgaatccata taacctgtct 7260
gtgccttctt aaggaagctc ttggagagcg tcaaagccga gtgtttgaaa tagcacttgc 7320
aacagaaagt tccactgcgc ttactggagt ttttgctcct gtgaagggat cacgaggtca 7380
gcatcagcta tctcctgaat cctatgattc aaatgcaaac aattcaacaa tcgatatgtc 7440
gaatggtact ggaaaaatgg cgctgagcag agcgacaaaa attactgcag ctgtatctgc 7500
acttgttata ggttctatca cacatggtgt tataaccctt gagaggattg ttggtctact 7560
gagactaaag gattacttag atttcgttca gtttgtaagg cgtacaaaat cgagttctaa 7620
tggcagtgct agatccatgg gagcctctaa agtggaaagc cctattgaag tgtatgtaca 7680
ttggttcaga ctccttgttg gtaactgtaa aactgtttcg gaagggctgg ttttggagct 7740
tgtgggagaa tcttccgtgg tggctatatc acgcatgcag cgtatgcttc cgctgaaatt 7800
ggtcttccca ccagcctatt caattattgc gtttgttctg tggaggcctt ttgtttcaaa 7860
tagtaactct aactccagcg tccatgaaga cactcaccgc ctttatcagt ctttgacaat 7920
ggccttccat gatgttatta agcatcttcc tttccgagac gtgtgcttca gagacaccca 7980
gggactttat gaactgatag ttgctgattc cacagatgct gaatttgcgt cggtgtttga 8040
atcgcatgga ttggatatgc acttgaaatc tgtggccttt gctcctcttc gagcgcgtct 8100
tttcttaaat tccctaattg attgtaaggt gccatcctct ggttattccc atgaaggagt 8160
tagtgaagca aaaaaccgac atcagggaaa tggaacaaag cttgtggaca agcttgtatc 8220
tgtattagat tgcctgcagc ctgcaaaatt tcactggcag tgggttgaac tcaggctgct 8280
tctaaacgag caagcacttg ctgagaaact cgaaaatcat gatatgcctt tgacagatgc 8340
aatacgatct tcctgtccta cctctgagaa gcctgatgcc tctgagaatg agaaaaattt 8400
cattcaaatc ctcctcacaa ggttattggt tagacctgat gcggtccctc ttttctcaga 8460
agtggttcat ctcttcggta gatcggttga ggattcaatg ttgaagcaag ctgaatggtt 8520
tctagcaggc caagatgttc tttttggacg aaaaacaatc agacaaaaac tgattattgt 8580
aggtgaaagc aaaggactcc ccacgaaacc tcagttttgg aaaccttggg gttggtgcaa 8640
cagctctagt tccgatcata ttacagcaaa caaggcaggg aagaaaagga agtttgaaat 8700
tacttctatc gaagaagggg aagtgattga ggaaggttca ggttcaagaa aggtattatt 8760
accccgggta ttggatgaga atagtcccag tgttggctat gggattacaa ctgagagggc 8820
ttttgttcag ctagtgcttc catgcataga ccaaagctct gatgagtctc gaagtacctt 8880
tgtgaatgag ttggtaagac agtttagcaa tattgagcag caattaagtt cagttaccaa 8940
ccgcagtaca acaagcaaca agcaaatggg aactgcttct tctgggtctg agatttcatc 9000
aaataaagga agtacccgga agggccttcg cggtggtagc cctagtttgg caagaagatc 9060
ctcagccaat actactgaca cttcgccgcc gccttcccct gctgctttga gagcttctat 9120
gtctttgcgg ttgcaatttc ttctaagatt actgcctgtc atctgcgggt actgattctc 9180
ttccatcttc tttttcccca ttccgtttag caggatttgt tgaaaagtca aatgaaatgg 9240
ctcttccatg cagtattatc gaatgaaact attaaagcct gagttatctt tttgtatggc 9300
aatttatttt tcagggaacc ttcatttaag aacaccagac atgcacttgc gtctacaata 9360
gttcgtctac ttggaagcag agtagtttat gaagattatg ctgtatgttc tcctcgtagt 9420
gagctatcaa aggcagaaac agaatcaaca atagatcctt cttccatggc agatctctct 9480
agtgaagtct tatttgaccg gttactgttt gtactccatg ggctgttaag caatcaccag 9540
ccaaaatggc taaagccaag gccttcctct aatgaatcat ccaaagactt taccttgttt 9600
gatcgcgatg cagcagagag cttacaggtt tgtcaacaaa ttttaaaaaa tccttaaaag 9660
tctgtcttct tggctgcaaa gtacgattct tgaagttttt ttgttttttt tggttgtcaa 9720
ttaatgcaga atgagctttc gcggatgcag ttaccagaca ccattagatg gcggatccaa 9780
gcagcgatgc caatcctcct tccttctcta cgctgttctc tctcatgcca gcctcattct 9840
gttccgccaa ccgcactcac acttgttcag ccctctggat ctactgctgc tgctggaacc 9900
aatcaaagaa actcccctgc catatcgaaa agtggaactg cagcagcaca agggaagctg 9960
aagccgacaa tgttggcacc acatcaacaa caagaagcag acaacacgga tgtggttgac 10020
ccgtggacgc tcctcgaaga tgggacaagt tcaggtctat caagcagcaa cgcttcaaat 10080
agcagcgaca tggccaacct tcgagccacc tgttggctga aaggtgcagt cagggtcaga 10140
cggactgatc taacttacgt tggttcagta gacgacgaca gctgaattac tctactgttt 10200
catagttttt tgatgatcat gagagctctg gaaaagaaag gagcaaaaag cttggatctt 10260
cgggtgcctt agactgtact atcatttatt gaggggctca tgaagaagca agtcgtaatg 10320
aaagatctcc aatgagtctc tgttgtggct tcttcagatc tttgtatttt aattactaac 10380
cctttttgct tttttggtca tatcccccgg acccatactg gttcggaacc ctgttgtata 10440
tatagggaat tcgaaattaa ttgtctcagt ttcttgttcc attattattt atccactaaa 10500
ttcactgtta tcattcccct gaatttttat attgatgaac actttagtct ctctttttgc 10560
tcttagctat gtatatcttt tcaaggatct tacatttgat tttactttac aagagaggga 10620
aacagaaaca tagaactctt gtcaaaagtc tagtacgtac aactttattc actacctctc 10680
atggttttgt ctacatagag aacatcatca atccaagcaa ctatgttaaa agctaaacct 10740
tcaagtactc ttgagtagct ctccaacaca gcttttccaa catcctgcaa accaaaaagc 10800
acaacacttt ttaagtaatt actatagtgt actatcaaat tcaatgagac actctattct 10860
tcagttttta ccttattgta ctgaatcttg catatatcta atgatgtctg agacaattct 10920
ggataacgct gtttcaaaca gaagaggaga gtctcagctc tctcagccat aacatagttc 10980
ttgtctgttc tctctgtagt 11000
<210> 2
<211> 6708
<212> DNA
<213> Arabidopsis thaliana
<400> 2
atgcaaaggt atcatgctgc caactgcact agtgcagtca acaatagtgc tataggtggt 60
gcatccgcga gggactcagg acgagctgat tcctcttcga ttggaaacta ttcactaaac 120
tccaggagac caccaccgtt gacaccctac aagttgaagt gtgaaaagga cggtctgaat 180
tcccgattag ggccgcctga ttttcatcct ccaacatcaa attctcccga agagaatctg 240
accaaagagt atgttcaatt tggatacaag gaaactgttg atggacttaa ggaatccgaa 300
gaaattatat tgtcccaggt ccatactttc tcaaagcctg ttgtccataa gtgcaaagag 360
gcagtcagaa agtgtcttag agctatcaat gaatctcgtg cactgaagcg caaggctggt 420
caggtttatg gggtgcctct ctctggttcg cttctatgta agcctggatt tccagaacaa 480
aggtcatgtg gggaggagac aaagaaaaga tggatcgaga gtttatcaca acagcacaaa 540
cgattgcgct ctttggctga taacattcct ggatatagga gaaaaacctt atttgaagtc 600
cttataagga acaatgtccc actattgaga gctacttggt ttataaaagt gacttatctc 660
aatcaggtgc gacctagtcc tgctgctatt tcttcaggaa cacctgacaa gacacaagct 720
tctcggtgtg agcaatggac aaaagatgtt attgaatatt tgcaatacct cttggatgaa 780
cttttgtcac ggaatagctc atttcctgct cagcaaacta gagataggtc accacagatg 840
ctttatacag gatcaatgca aaagaatagt ccagcatcaa caagccttta cggcgaggaa 900
acatctctac attttaaatg gtggtatatg gtgcgtcttc tacagtggca ccatgctgaa 960
gggcttcttt ttcctaatct cattgttgat tgggttctca agctcttaca ggaaaaggag 1020
atctttgaaa ttttgcagct gctactcccc attgtgtatg gtgttttaga gagtattgtt 1080
ctctctcaga catatgtaca gagtcttgta gctattgctg tccgtttcat tcaggaacct 1140
gctcctggtg gatctgatct tgttgataac tctcgaagag cttatactct atctgctcta 1200
attgagatgg ttcgctactt ggtacttgct gcacccgaca catttgttgc ttcagatttc 1260
tttcctcttc ctccttccgt agcagcatgt ggacctaatg atgtgagcta tacgtcaaag 1320
gcttatgaga atctggaaaa gctgagaagt aactctgcgg agatttctgc ccagtttcaa 1380
ggaagaggag ttctttcccg gtttgagttc ctttcttttg attataccat ttcaaccatt 1440
caaagaagtg cagatgattt ggcaaagata gctagcgctg gttaccctca acataacgtg 1500
gctaaagctg ttcaggcctt ggataaagct ttgtcggatg gagatatcag agctgcttac 1560
agttatctct ttgaagacct ttgcaatgga gccgttgatg aggcctggat tactgacgtc 1620
agtccatgtt taagatcatc ccttagatgg attggcgcta ttagcacatc ctttgtttgc 1680
tccgtttttt tccttataga atgggctaca tgtgatttta gagatttccg tgctggtgtg 1740
cctaaagata tcaagttctc tggcagaaaa gattgttctc aggtgtattt agtcattcag 1800
cttctgaagc aaaagattct gggtggagaa ttcacagctc gcaaaggaaa gaattgtcgc 1860
aacaattttc ttggtgtttc taaacctagc ggttcgatgg atgcatttga aagcccgggc 1920
ccattacatg atatcatagt ctgttggatt gatcagcatg aggtacacaa gggaggagca 1980
aagcgcttgc aattactcgt ttttgaactt atacgttctg gaatctttaa tcccatagca 2040
tatgtgaggc aactcatagt tagcgggatg atcgatgtga ttcaacctgc tgttgatcct 2100
gaaaggagaa tgaggcacca tcgcatattg aaacagctac ctgggtgttt tgtacatgaa 2160
accttagagg aagctcaact ctttggaggg gataagcttt ccgaggctgt gagaacttat 2220
tctaatgaac ggcgccttct tcttcgagaa ctgcttgttg agaaaggtaa atactggaat 2280
aatttagttc tctcagatca gaagtcaaag aaaatttcca cttccctttc gtctgttatt 2340
tttccaaggg cgtgtaatgc caagagcaat agtaagggac ctcgcaaaca taccaagagt 2400
agtgtggata ttagagaact aaaggagcgc atatcagctc tactgcagtt tccaggtatg 2460
tcatgtggtg tggaaacccc agtgcgagat gaattccaaa atagtgttaa gagatcaagt 2520
ggatctgtgt atagcaagat ggatcaacca gaagctacac cagggtgtga agactgtaga 2580
agagcaaaaa gaccaaaaat gaatgatgaa aagagctctt gctatcaagg gaattcacca 2640
attgcatcag atgaagaaga taactggtgg atcaagaaag gatcgaaaac tgtggagtct 2700
tctctgaagg ttgatcctca gatagagata actaaacaag taccacgagg taggcagaag 2760
atggcgcgta agacacagtc gctggctcaa ctacaagctg ctagaattga aggtagccag 2820
ggcgcttcaa cgagtcatgt ttgtgataat aaagtaagct gtcctcatca tggccctgga 2880
gtggaaggag aaaatcagaa ggtggttgat gtgtttagaa cttccacccc tgtggatatg 2940
gtatctgttg gaaactcttt gaagcagcta cagtttgttg ataagcgatc tattgcagtt 3000
tggcttacta ctgcagttcg gcaacttgtt gaagagcccc aaaagagcag tgtgagagtt 3060
gggcagttca atagaggtgc tccagttgag gagaagaaca caattaggtg gaagcttggg 3120
gcagacgagc tatactccat attatttctc ttggatatct ctcttgactt ggtttcagcg 3180
gttaaatttc ttctttggtt attgccgaag gccaacagta ccccaagttt tgccgtacag 3240
ggtggaagaa accttgtaac tgtaccaagg aatgttgaaa acaacatgtg tgaaataggc 3300
gaggcgattc tagtatcatc actgagaagg tatgaaaaca ttctactttc agctgatctt 3360
gttcctgagg ccatgacagc tttgatgaac cgtgctgcat cacttatgtc tagtaatgga 3420
aaaatttctg gatcagcagc cttagtttat actcgctata ttttgaaaag atatggaagc 3480
ctccccagtg ttgtggaatg gcataacaat ttcaaagcaa catccgaaaa gaagctactt 3540
tctgaactag atcatacgcg atcaggaaat ggtgagtatg ggaaccccct cggggttcca 3600
gcaggagtag ataatccaga tgactattta cgtaaaaaaa tcagcattgg cggtgcacgt 3660
ccttcaagag tgggtttgag tatgcgagat gttttgcaac gacatgttga agaggcgact 3720
cattatctca aaaaactcat tgggactggt actatgaaag cctctctcgc tgagaaaaat 3780
gatgacgggt atcaggtggc tcaacaaatt gtagttggac taatggactg cattagacag 3840
actggcggtg cagctcaaga gggtgatccc tctttggttt cttctgcggt ttctgcgatt 3900
ataaacagtg taggcctttc agtggcaagg attacagatt tctctttggg aaacatttat 3960
cagaatcatc cttctggcgt tgattcatct aatattgcac gatacatttt acgaatccat 4020
ataacctgtc tgtgccttct taaggaagct cttggagagc gtcaaagccg agtgtttgaa 4080
atagcacttg caacagaaag ttccactgcg cttactggag tttttgctcc tgtgaaggga 4140
tcacgaggtc agcatcagct atctcctgaa tcctatgatt caaatgcaaa caattcaaca 4200
atcgatatgt cgaatggtac tggaaaaatg gcgctgagca gagcgacaaa aattactgca 4260
gctgtatctg cacttgttat aggttctatc acacatggtg ttataaccct tgagaggatt 4320
gttggtctac tgagactaaa ggattactta gatttcgttc agtttgtaag gcgtacaaaa 4380
tcgagttcta atggcagtgc tagatccatg ggagcctcta aagtggaaag ccctattgaa 4440
gtgtatgtac attggttcag actccttgtt ggtaactgta aaactgtttc ggaagggctg 4500
gttttggagc ttgtgggaga atcttccgtg gtggctatat cacgcatgca gcgtatgctt 4560
ccgctgaaat tggtcttccc accagcctat tcaattattg cgtttgttct gtggaggcct 4620
tttgtttcaa atagtaactc taactccagc gtccatgaag acactcaccg cctttatcag 4680
tctttgacaa tggccttcca tgatgttatt aagcatcttc ctttccgaga cgtgtgcttc 4740
agagacaccc agggacttta tgaactgata gttgctgatt ccacagatgc tgaatttgcg 4800
tcggtgtttg aatcgcatgg attggatatg cacttgaaat ctgtggcctt tgctcctctt 4860
cgagcgcgtc ttttcttaaa ttccctaatt gattgtaagg tgccatcctc tggttattcc 4920
catgaaggag ttagtgaagc aaaaaaccga catcagggaa atggaacaaa gcttgtggac 4980
aagcttgtat ctgtattaga ttgcctgcag cctgcaaaat ttcactggca gtgggttgaa 5040
ctcaggctgc ttctaaacga gcaagcactt gctgagaaac tcgaaaatca tgatatgcct 5100
ttgacagatg caatacgatc ttcctgtcct acctctgaga agcctgatgc ctctgagaat 5160
gagaaaaatt tcattcaaat cctcctcaca aggttattgg ttagacctga tgcggtccct 5220
cttttctcag aagtggttca tctcttcggt agatcggttg aggattcaat gttgaagcaa 5280
gctgaatggt ttctagcagg ccaagatgtt ctttttggac gaaaaacaat cagacaaaaa 5340
ctgattattg taggtgaaag caaaggactc cccacgaaac ctcagttttg gaaaccttgg 5400
ggttggtgca acagctctag ttccgatcat attacagcaa acaaggcagg gaagaaaagg 5460
aagtttgaaa ttacttctat cgaagaaggg gaagtgattg aggaaggttc aggttcaaga 5520
aaggtattat taccccgggt attggatgag aatagtccca gtgttggcta tgggattaca 5580
actgagaggg cttttgttca gctagtgctt ccatgcatag accaaagctc tgatgagtct 5640
cgaagtacct ttgtgaatga gttggtaaga cagtttagca atattgagca gcaattaagt 5700
tcagttacca accgcagtac aacaagcaac aagcaaatgg gaactgcttc ttctgggtct 5760
gagatttcat caaataaagg aagtacccgg aagggccttc gcggtggtag ccctagtttg 5820
gcaagaagat cctcagccaa tactactgac acttcgccgc cgccttcccc tgctgctttg 5880
agagcttcta tgtctttgcg gttgcaattt cttctaagat tactgcctgt catctgcggg 5940
gaaccttcat ttaagaacac cagacatgca cttgcgtcta caatagttcg tctacttgga 6000
agcagagtag tttatgaaga ttatgctgta tgttctcctc gtagtgagct atcaaaggca 6060
gaaacagaat caacaataga tccttcttcc atggcagatc tctctagtga agtcttattt 6120
gaccggttac tgtttgtact ccatgggctg ttaagcaatc accagccaaa atggctaaag 6180
ccaaggcctt cctctaatga atcatccaaa gactttacct tgtttgatcg cgatgcagca 6240
gagagcttac agaatgagct ttcgcggatg cagttaccag acaccattag atggcggatc 6300
caagcagcga tgccaatcct ccttccttct ctacgctgtt ctctctcatg ccagcctcat 6360
tctgttccgc caaccgcact cacacttgtt cagccctctg gatctactgc tgctgctgga 6420
accaatcaaa gaaactcccc tgccatatcg aaaagtggaa ctgcagcagc acaagggaag 6480
ctgaagccga caatgttggc accacatcaa caacaagaag cagacaacac ggatgtggtt 6540
gacccgtgga cgctcctcga agatgggaca agttcaggtc tatcaagcag caacgcttca 6600
aatagcagcg acatggccaa ccttcgagcc acctgttggc tgaaaggtgc agtcagggtc 6660
agacggactg atctaactta cgttggttca gtagacgacg acagctga 6708
<210> 3
<211> 7149
<212> DNA
<213> Arabidopsis thaliana
<400> 3
cgctgtcgcc agtgctaagt tttatgctgt aaggagatat tgaaaataaa agtggaagtc 60
catgaaaaag tttcttatgg tgctagactg tggattggtg cttagagttt attgtggtat 120
gttgatgtca gaaccagtat gctggatata gttgggagaa atgcaaaggt atcatgctgc 180
caactgcact agtgcagtca acaatagtgc tataggtggt gcatccgcga gggactcagg 240
acgagctgat tcctcttcga ttggaaacta ttcactaaac tccaggagac caccaccgtt 300
gacaccctac aagttgaagt gtgaaaagga cggtctgaat tcccgattag ggccgcctga 360
ttttcatcct ccaacatcaa attctcccga agagaatctg accaaagagt atgttcaatt 420
tggatacaag gaaactgttg atggacttaa ggaatccgaa gaaattatat tgtcccaggt 480
ccatactttc tcaaagcctg ttgtccataa gtgcaaagag gcagtcagaa agtgtcttag 540
agctatcaat gaatctcgtg cactgaagcg caaggctggt caggtttatg gggtgcctct 600
ctctggttcg cttctatgta agcctggatt tccagaacaa aggtcatgtg gggaggagac 660
aaagaaaaga tggatcgaga gtttatcaca acagcacaaa cgattgcgct ctttggctga 720
taacattcct ggatatagga gaaaaacctt atttgaagtc cttataagga acaatgtccc 780
actattgaga gctacttggt ttataaaagt gacttatctc aatcaggtgc gacctagtcc 840
tgctgctatt tcttcaggaa cacctgacaa gacacaagct tctcggtgtg agcaatggac 900
aaaagatgtt attgaatatt tgcaatacct cttggatgaa cttttgtcac ggaatagctc 960
atttcctgct cagcaaacta gagataggtc accacagatg ctttatacag gatcaatgca 1020
aaagaatagt ccagcatcaa caagccttta cggcgaggaa acatctctac attttaaatg 1080
gtggtatatg gtgcgtcttc tacagtggca ccatgctgaa gggcttcttt ttcctaatct 1140
cattgttgat tgggttctca agctcttaca ggaaaaggag atctttgaaa ttttgcagct 1200
gctactcccc attgtgtatg gtgttttaga gagtattgtt ctctctcaga catatgtaca 1260
gagtcttgta gctattgctg tccgtttcat tcaggaacct gctcctggtg gatctgatct 1320
tgttgataac tctcgaagag cttatactct atctgctcta attgagatgg ttcgctactt 1380
ggtacttgct gcacccgaca catttgttgc ttcagatttc tttcctcttc ctccttccgt 1440
agcagcatgt ggacctaatg atgtgagcta tacgtcaaag gcttatgaga atctggaaaa 1500
gctgagaagt aactctgcgg agatttctgc ccagtttcaa ggaagaggag ttctttcccg 1560
gtttgagttc ctttcttttg attataccat ttcaaccatt caaagaagtg cagatgattt 1620
ggcaaagata gctagcgctg gttaccctca acataacgtg gctaaagctg ttcaggcctt 1680
ggataaagct ttgtcggatg gagatatcag agctgcttac agttatctct ttgaagacct 1740
ttgcaatgga gccgttgatg aggcctggat tactgacgtc agtccatgtt taagatcatc 1800
ccttagatgg attggcgcta ttagcacatc ctttgtttgc tccgtttttt tccttataga 1860
atgggctaca tgtgatttta gagatttccg tgctggtgtg cctaaagata tcaagttctc 1920
tggcagaaaa gattgttctc aggtgtattt agtcattcag cttctgaagc aaaagattct 1980
gggtggagaa ttcacagctc gcaaaggaaa gaattgtcgc aacaattttc ttggtgtttc 2040
taaacctagc ggttcgatgg atgcatttga aagcccgggc ccattacatg atatcatagt 2100
ctgttggatt gatcagcatg aggtacacaa gggaggagca aagcgcttgc aattactcgt 2160
ttttgaactt atacgttctg gaatctttaa tcccatagca tatgtgaggc aactcatagt 2220
tagcgggatg atcgatgtga ttcaacctgc tgttgatcct gaaaggagaa tgaggcacca 2280
tcgcatattg aaacagctac ctgggtgttt tgtacatgaa accttagagg aagctcaact 2340
ctttggaggg gataagcttt ccgaggctgt gagaacttat tctaatgaac ggcgccttct 2400
tcttcgagaa ctgcttgttg agaaaggtaa atactggaat aatttagttc tctcagatca 2460
gaagtcaaag aaaatttcca cttccctttc gtctgttatt tttccaaggg cgtgtaatgc 2520
caagagcaat agtaagggac ctcgcaaaca taccaagagt agtgtggata ttagagaact 2580
aaaggagcgc atatcagctc tactgcagtt tccaggtatg tcatgtggtg tggaaacccc 2640
agtgcgagat gaattccaaa atagtgttaa gagatcaagt ggatctgtgt atagcaagat 2700
ggatcaacca gaagctacac cagggtgtga agactgtaga agagcaaaaa gaccaaaaat 2760
gaatgatgaa aagagctctt gctatcaagg gaattcacca attgcatcag atgaagaaga 2820
taactggtgg atcaagaaag gatcgaaaac tgtggagtct tctctgaagg ttgatcctca 2880
gatagagata actaaacaag taccacgagg taggcagaag atggcgcgta agacacagtc 2940
gctggctcaa ctacaagctg ctagaattga aggtagccag ggcgcttcaa cgagtcatgt 3000
ttgtgataat aaagtaagct gtcctcatca tggccctgga gtggaaggag aaaatcagaa 3060
ggtggttgat gtgtttagaa cttccacccc tgtggatatg gtatctgttg gaaactcttt 3120
gaagcagcta cagtttgttg ataagcgatc tattgcagtt tggcttacta ctgcagttcg 3180
gcaacttgtt gaagagcccc aaaagagcag tgtgagagtt gggcagttca atagaggtgc 3240
tccagttgag gagaagaaca caattaggtg gaagcttggg gcagacgagc tatactccat 3300
attatttctc ttggatatct ctcttgactt ggtttcagcg gttaaatttc ttctttggtt 3360
attgccgaag gccaacagta ccccaagttt tgccgtacag ggtggaagaa accttgtaac 3420
tgtaccaagg aatgttgaaa acaacatgtg tgaaataggc gaggcgattc tagtatcatc 3480
actgagaagg tatgaaaaca ttctactttc agctgatctt gttcctgagg ccatgacagc 3540
tttgatgaac cgtgctgcat cacttatgtc tagtaatgga aaaatttctg gatcagcagc 3600
cttagtttat actcgctata ttttgaaaag atatggaagc ctccccagtg ttgtggaatg 3660
gcataacaat ttcaaagcaa catccgaaaa gaagctactt tctgaactag atcatacgcg 3720
atcaggaaat ggtgagtatg ggaaccccct cggggttcca gcaggagtag ataatccaga 3780
tgactattta cgtaaaaaaa tcagcattgg cggtgcacgt ccttcaagag tgggtttgag 3840
tatgcgagat gttttgcaac gacatgttga agaggcgact cattatctca aaaaactcat 3900
tgggactggt actatgaaag cctctctcgc tgagaaaaat gatgacgggt atcaggtggc 3960
tcaacaaatt gtagttggac taatggactg cattagacag actggcggtg cagctcaaga 4020
gggtgatccc tctttggttt cttctgcggt ttctgcgatt ataaacagtg taggcctttc 4080
agtggcaagg attacagatt tctctttggg aaacatttat cagaatcatc cttctggcgt 4140
tgattcatct aatattgcac gatacatttt acgaatccat ataacctgtc tgtgccttct 4200
taaggaagct cttggagagc gtcaaagccg agtgtttgaa atagcacttg caacagaaag 4260
ttccactgcg cttactggag tttttgctcc tgtgaaggga tcacgaggtc agcatcagct 4320
atctcctgaa tcctatgatt caaatgcaaa caattcaaca atcgatatgt cgaatggtac 4380
tggaaaaatg gcgctgagca gagcgacaaa aattactgca gctgtatctg cacttgttat 4440
aggttctatc acacatggtg ttataaccct tgagaggatt gttggtctac tgagactaaa 4500
ggattactta gatttcgttc agtttgtaag gcgtacaaaa tcgagttcta atggcagtgc 4560
tagatccatg ggagcctcta aagtggaaag ccctattgaa gtgtatgtac attggttcag 4620
actccttgtt ggtaactgta aaactgtttc ggaagggctg gttttggagc ttgtgggaga 4680
atcttccgtg gtggctatat cacgcatgca gcgtatgctt ccgctgaaat tggtcttccc 4740
accagcctat tcaattattg cgtttgttct gtggaggcct tttgtttcaa atagtaactc 4800
taactccagc gtccatgaag acactcaccg cctttatcag tctttgacaa tggccttcca 4860
tgatgttatt aagcatcttc ctttccgaga cgtgtgcttc agagacaccc agggacttta 4920
tgaactgata gttgctgatt ccacagatgc tgaatttgcg tcggtgtttg aatcgcatgg 4980
attggatatg cacttgaaat ctgtggcctt tgctcctctt cgagcgcgtc ttttcttaaa 5040
ttccctaatt gattgtaagg tgccatcctc tggttattcc catgaaggag ttagtgaagc 5100
aaaaaaccga catcagggaa atggaacaaa gcttgtggac aagcttgtat ctgtattaga 5160
ttgcctgcag cctgcaaaat ttcactggca gtgggttgaa ctcaggctgc ttctaaacga 5220
gcaagcactt gctgagaaac tcgaaaatca tgatatgcct ttgacagatg caatacgatc 5280
ttcctgtcct acctctgaga agcctgatgc ctctgagaat gagaaaaatt tcattcaaat 5340
cctcctcaca aggttattgg ttagacctga tgcggtccct cttttctcag aagtggttca 5400
tctcttcggt agatcggttg aggattcaat gttgaagcaa gctgaatggt ttctagcagg 5460
ccaagatgtt ctttttggac gaaaaacaat cagacaaaaa ctgattattg taggtgaaag 5520
caaaggactc cccacgaaac ctcagttttg gaaaccttgg ggttggtgca acagctctag 5580
ttccgatcat attacagcaa acaaggcagg gaagaaaagg aagtttgaaa ttacttctat 5640
cgaagaaggg gaagtgattg aggaaggttc aggttcaaga aaggtattat taccccgggt 5700
attggatgag aatagtccca gtgttggcta tgggattaca actgagaggg cttttgttca 5760
gctagtgctt ccatgcatag accaaagctc tgatgagtct cgaagtacct ttgtgaatga 5820
gttggtaaga cagtttagca atattgagca gcaattaagt tcagttacca accgcagtac 5880
aacaagcaac aagcaaatgg gaactgcttc ttctgggtct gagatttcat caaataaagg 5940
aagtacccgg aagggccttc gcggtggtag ccctagtttg gcaagaagat cctcagccaa 6000
tactactgac acttcgccgc cgccttcccc tgctgctttg agagcttcta tgtctttgcg 6060
gttgcaattt cttctaagat tactgcctgt catctgcggg gaaccttcat ttaagaacac 6120
cagacatgca cttgcgtcta caatagttcg tctacttgga agcagagtag tttatgaaga 6180
ttatgctgta tgttctcctc gtagtgagct atcaaaggca gaaacagaat caacaataga 6240
tccttcttcc atggcagatc tctctagtga agtcttattt gaccggttac tgtttgtact 6300
ccatgggctg ttaagcaatc accagccaaa atggctaaag ccaaggcctt cctctaatga 6360
atcatccaaa gactttacct tgtttgatcg cgatgcagca gagagcttac agaatgagct 6420
ttcgcggatg cagttaccag acaccattag atggcggatc caagcagcga tgccaatcct 6480
ccttccttct ctacgctgtt ctctctcatg ccagcctcat tctgttccgc caaccgcact 6540
cacacttgtt cagccctctg gatctactgc tgctgctgga accaatcaaa gaaactcccc 6600
tgccatatcg aaaagtggaa ctgcagcagc acaagggaag ctgaagccga caatgttggc 6660
accacatcaa caacaagaag cagacaacac ggatgtggtt gacccgtgga cgctcctcga 6720
agatgggaca agttcaggtc tatcaagcag caacgcttca aatagcagcg acatggccaa 6780
ccttcgagcc acctgttggc tgaaaggtgc agtcagggtc agacggactg atctaactta 6840
cgttggttca gtagacgacg acagctgaat tactctactg tttcatagtt ttttgatgat 6900
catgagagct ctggaaaaga aaggagcaaa aagcttggat cttcgggtgc cttagactgt 6960
actatcattt attgaggggc tcatgaagaa gcaagtcgta atgaaagatc tccaatgagt 7020
ctctgttgtg gcttcttcag atctttgtat tttaattact aacccttttt gcttttttgg 7080
tcatatcccc cggacccata ctggttcgga accctgttgt atatataggg aattcgaaat 7140
taattgtct 7149
<210> 4
<211> 2235
<212> PRT
<213> Arabidopsis thaliana
<400> 4
Met Gln Arg Tyr His Ala Ala Asn Cys Thr Ser Ala Val Asn Asn Ser
1 5 10 15
Ala Ile Gly Gly Ala Ser Ala Arg Asp Ser Gly Arg Ala Asp Ser Ser
20 25 30
Ser Ile Gly Asn Tyr Ser Leu Asn Ser Arg Arg Pro Pro Pro Leu Thr
35 40 45
Pro Tyr Lys Leu Lys Cys Glu Lys Asp Gly Leu Asn Ser Arg Leu Gly
50 55 60
Pro Pro Asp Phe His Pro Pro Thr Ser Asn Ser Pro Glu Glu Asn Leu
65 70 75 80
Thr Lys Glu Tyr Val Gln Phe Gly Tyr Lys Glu Thr Val Asp Gly Leu
85 90 95
Lys Glu Ser Glu Glu Ile Ile Leu Ser Gln Val His Thr Phe Ser Lys
100 105 110
Pro Val Val His Lys Cys Lys Glu Ala Val Arg Lys Cys Leu Arg Ala
115 120 125
Ile Asn Glu Ser Arg Ala Leu Lys Arg Lys Ala Gly Gln Val Tyr Gly
130 135 140
Val Pro Leu Ser Gly Ser Leu Leu Cys Lys Pro Gly Phe Pro Glu Gln
145 150 155 160
Arg Ser Cys Gly Glu Glu Thr Lys Lys Arg Trp Ile Glu Ser Leu Ser
165 170 175
Gln Gln His Lys Arg Leu Arg Ser Leu Ala Asp Asn Ile Pro Gly Tyr
180 185 190
Arg Arg Lys Thr Leu Phe Glu Val Leu Ile Arg Asn Asn Val Pro Leu
195 200 205
Leu Arg Ala Thr Trp Phe Ile Lys Val Thr Tyr Leu Asn Gln Val Arg
210 215 220
Pro Ser Pro Ala Ala Ile Ser Ser Gly Thr Pro Asp Lys Thr Gln Ala
225 230 235 240
Ser Arg Cys Glu Gln Trp Thr Lys Asp Val Ile Glu Tyr Leu Gln Tyr
245 250 255
Leu Leu Asp Glu Leu Leu Ser Arg Asn Ser Ser Phe Pro Ala Gln Gln
260 265 270
Thr Arg Asp Arg Ser Pro Gln Met Leu Tyr Thr Gly Ser Met Gln Lys
275 280 285
Asn Ser Pro Ala Ser Thr Ser Leu Tyr Gly Glu Glu Thr Ser Leu His
290 295 300
Phe Lys Trp Trp Tyr Met Val Arg Leu Leu Gln Trp His His Ala Glu
305 310 315 320
Gly Leu Leu Phe Pro Asn Leu Ile Val Asp Trp Val Leu Lys Leu Leu
325 330 335
Gln Glu Lys Glu Ile Phe Glu Ile Leu Gln Leu Leu Leu Pro Ile Val
340 345 350
Tyr Gly Val Leu Glu Ser Ile Val Leu Ser Gln Thr Tyr Val Gln Ser
355 360 365
Leu Val Ala Ile Ala Val Arg Phe Ile Gln Glu Pro Ala Pro Gly Gly
370 375 380
Ser Asp Leu Val Asp Asn Ser Arg Arg Ala Tyr Thr Leu Ser Ala Leu
385 390 395 400
Ile Glu Met Val Arg Tyr Leu Val Leu Ala Ala Pro Asp Thr Phe Val
405 410 415
Ala Ser Asp Phe Phe Pro Leu Pro Pro Ser Val Ala Ala Cys Gly Pro
420 425 430
Asn Asp Val Ser Tyr Thr Ser Lys Ala Tyr Glu Asn Leu Glu Lys Leu
435 440 445
Arg Ser Asn Ser Ala Glu Ile Ser Ala Gln Phe Gln Gly Arg Gly Val
450 455 460
Leu Ser Arg Phe Glu Phe Leu Ser Phe Asp Tyr Thr Ile Ser Thr Ile
465 470 475 480
Gln Arg Ser Ala Asp Asp Leu Ala Lys Ile Ala Ser Ala Gly Tyr Pro
485 490 495
Gln His Asn Val Ala Lys Ala Val Gln Ala Leu Asp Lys Ala Leu Ser
500 505 510
Asp Gly Asp Ile Arg Ala Ala Tyr Ser Tyr Leu Phe Glu Asp Leu Cys
515 520 525
Asn Gly Ala Val Asp Glu Ala Trp Ile Thr Asp Val Ser Pro Cys Leu
530 535 540
Arg Ser Ser Leu Arg Trp Ile Gly Ala Ile Ser Thr Ser Phe Val Cys
545 550 555 560
Ser Val Phe Phe Leu Ile Glu Trp Ala Thr Cys Asp Phe Arg Asp Phe
565 570 575
Arg Ala Gly Val Pro Lys Asp Ile Lys Phe Ser Gly Arg Lys Asp Cys
580 585 590
Ser Gln Val Tyr Leu Val Ile Gln Leu Leu Lys Gln Lys Ile Leu Gly
595 600 605
Gly Glu Phe Thr Ala Arg Lys Gly Lys Asn Cys Arg Asn Asn Phe Leu
610 615 620
Gly Val Ser Lys Pro Ser Gly Ser Met Asp Ala Phe Glu Ser Pro Gly
625 630 635 640
Pro Leu His Asp Ile Ile Val Cys Trp Ile Asp Gln His Glu Val His
645 650 655
Lys Gly Gly Ala Lys Arg Leu Gln Leu Leu Val Phe Glu Leu Ile Arg
660 665 670
Ser Gly Ile Phe Asn Pro Ile Ala Tyr Val Arg Gln Leu Ile Val Ser
675 680 685
Gly Met Ile Asp Val Ile Gln Pro Ala Val Asp Pro Glu Arg Arg Met
690 695 700
Arg His His Arg Ile Leu Lys Gln Leu Pro Gly Cys Phe Val His Glu
705 710 715 720
Thr Leu Glu Glu Ala Gln Leu Phe Gly Gly Asp Lys Leu Ser Glu Ala
725 730 735
Val Arg Thr Tyr Ser Asn Glu Arg Arg Leu Leu Leu Arg Glu Leu Leu
740 745 750
Val Glu Lys Gly Lys Tyr Trp Asn Asn Leu Val Leu Ser Asp Gln Lys
755 760 765
Ser Lys Lys Ile Ser Thr Ser Leu Ser Ser Val Ile Phe Pro Arg Ala
770 775 780
Cys Asn Ala Lys Ser Asn Ser Lys Gly Pro Arg Lys His Thr Lys Ser
785 790 795 800
Ser Val Asp Ile Arg Glu Leu Lys Glu Arg Ile Ser Ala Leu Leu Gln
805 810 815
Phe Pro Gly Met Ser Cys Gly Val Glu Thr Pro Val Arg Asp Glu Phe
820 825 830
Gln Asn Ser Val Lys Arg Ser Ser Gly Ser Val Tyr Ser Lys Met Asp
835 840 845
Gln Pro Glu Ala Thr Pro Gly Cys Glu Asp Cys Arg Arg Ala Lys Arg
850 855 860
Pro Lys Met Asn Asp Glu Lys Ser Ser Cys Tyr Gln Gly Asn Ser Pro
865 870 875 880
Ile Ala Ser Asp Glu Glu Asp Asn Trp Trp Ile Lys Lys Gly Ser Lys
885 890 895
Thr Val Glu Ser Ser Leu Lys Val Asp Pro Gln Ile Glu Ile Thr Lys
900 905 910
Gln Val Pro Arg Gly Arg Gln Lys Met Ala Arg Lys Thr Gln Ser Leu
915 920 925
Ala Gln Leu Gln Ala Ala Arg Ile Glu Gly Ser Gln Gly Ala Ser Thr
930 935 940
Ser His Val Cys Asp Asn Lys Val Ser Cys Pro His His Gly Pro Gly
945 950 955 960
Val Glu Gly Glu Asn Gln Lys Val Val Asp Val Phe Arg Thr Ser Thr
965 970 975
Pro Val Asp Met Val Ser Val Gly Asn Ser Leu Lys Gln Leu Gln Phe
980 985 990
Val Asp Lys Arg Ser Ile Ala Val Trp Leu Thr Thr Ala Val Arg Gln
995 1000 1005
Leu Val Glu Glu Pro Gln Lys Ser Ser Val Arg Val Gly Gln Phe Asn
1010 1015 1020
Arg Gly Ala Pro Val Glu Glu Lys Asn Thr Ile Arg Trp Lys Leu Gly
1025 1030 1035 1040
Ala Asp Glu Leu Tyr Ser Ile Leu Phe Leu Leu Asp Ile Ser Leu Asp
1045 1050 1055
Leu Val Ser Ala Val Lys Phe Leu Leu Trp Leu Leu Pro Lys Ala Asn
1060 1065 1070
Ser Thr Pro Ser Phe Ala Val Gln Gly Gly Arg Asn Leu Val Thr Val
1075 1080 1085
Pro Arg Asn Val Glu Asn Asn Met Cys Glu Ile Gly Glu Ala Ile Leu
1090 1095 1100
Val Ser Ser Leu Arg Arg Tyr Glu Asn Ile Leu Leu Ser Ala Asp Leu
1105 1110 1115 1120
Val Pro Glu Ala Met Thr Ala Leu Met Asn Arg Ala Ala Ser Leu Met
1125 1130 1135
Ser Ser Asn Gly Lys Ile Ser Gly Ser Ala Ala Leu Val Tyr Thr Arg
1140 1145 1150
Tyr Ile Leu Lys Arg Tyr Gly Ser Leu Pro Ser Val Val Glu Trp His
1155 1160 1165
Asn Asn Phe Lys Ala Thr Ser Glu Lys Lys Leu Leu Ser Glu Leu Asp
1170 1175 1180
His Thr Arg Ser Gly Asn Gly Glu Tyr Gly Asn Pro Leu Gly Val Pro
1185 1190 1195 1200
Ala Gly Val Asp Asn Pro Asp Asp Tyr Leu Arg Lys Lys Ile Ser Ile
1205 1210 1215
Gly Gly Ala Arg Pro Ser Arg Val Gly Leu Ser Met Arg Asp Val Leu
1220 1225 1230
Gln Arg His Val Glu Glu Ala Thr His Tyr Leu Lys Lys Leu Ile Gly
1235 1240 1245
Thr Gly Thr Met Lys Ala Ser Leu Ala Glu Lys Asn Asp Asp Gly Tyr
1250 1255 1260
Gln Val Ala Gln Gln Ile Val Val Gly Leu Met Asp Cys Ile Arg Gln
1265 1270 1275 1280
Thr Gly Gly Ala Ala Gln Glu Gly Asp Pro Ser Leu Val Ser Ser Ala
1285 1290 1295
Val Ser Ala Ile Ile Asn Ser Val Gly Leu Ser Val Ala Arg Ile Thr
1300 1305 1310
Asp Phe Ser Leu Gly Asn Ile Tyr Gln Asn His Pro Ser Gly Val Asp
1315 1320 1325
Ser Ser Asn Ile Ala Arg Tyr Ile Leu Arg Ile His Ile Thr Cys Leu
1330 1335 1340
Cys Leu Leu Lys Glu Ala Leu Gly Glu Arg Gln Ser Arg Val Phe Glu
1345 1350 1355 1360
Ile Ala Leu Ala Thr Glu Ser Ser Thr Ala Leu Thr Gly Val Phe Ala
1365 1370 1375
Pro Val Lys Gly Ser Arg Gly Gln His Gln Leu Ser Pro Glu Ser Tyr
1380 1385 1390
Asp Ser Asn Ala Asn Asn Ser Thr Ile Asp Met Ser Asn Gly Thr Gly
1395 1400 1405
Lys Met Ala Leu Ser Arg Ala Thr Lys Ile Thr Ala Ala Val Ser Ala
1410 1415 1420
Leu Val Ile Gly Ser Ile Thr His Gly Val Ile Thr Leu Glu Arg Ile
1425 1430 1435 1440
Val Gly Leu Leu Arg Leu Lys Asp Tyr Leu Asp Phe Val Gln Phe Val
1445 1450 1455
Arg Arg Thr Lys Ser Ser Ser Asn Gly Ser Ala Arg Ser Met Gly Ala
1460 1465 1470
Ser Lys Val Glu Ser Pro Ile Glu Val Tyr Val His Trp Phe Arg Leu
1475 1480 1485
Leu Val Gly Asn Cys Lys Thr Val Ser Glu Gly Leu Val Leu Glu Leu
1490 1495 1500
Val Gly Glu Ser Ser Val Val Ala Ile Ser Arg Met Gln Arg Met Leu
1505 1510 1515 1520
Pro Leu Lys Leu Val Phe Pro Pro Ala Tyr Ser Ile Ile Ala Phe Val
1525 1530 1535
Leu Trp Arg Pro Phe Val Ser Asn Ser Asn Ser Asn Ser Ser Val His
1540 1545 1550
Glu Asp Thr His Arg Leu Tyr Gln Ser Leu Thr Met Ala Phe His Asp
1555 1560 1565
Val Ile Lys His Leu Pro Phe Arg Asp Val Cys Phe Arg Asp Thr Gln
1570 1575 1580
Gly Leu Tyr Glu Leu Ile Val Ala Asp Ser Thr Asp Ala Glu Phe Ala
1585 1590 1595 1600
Ser Val Phe Glu Ser His Gly Leu Asp Met His Leu Lys Ser Val Ala
1605 1610 1615
Phe Ala Pro Leu Arg Ala Arg Leu Phe Leu Asn Ser Leu Ile Asp Cys
1620 1625 1630
Lys Val Pro Ser Ser Gly Tyr Ser His Glu Gly Val Ser Glu Ala Lys
1635 1640 1645
Asn Arg His Gln Gly Asn Gly Thr Lys Leu Val Asp Lys Leu Val Ser
1650 1655 1660
Val Leu Asp Cys Leu Gln Pro Ala Lys Phe His Trp Gln Trp Val Glu
1665 1670 1675 1680
Leu Arg Leu Leu Leu Asn Glu Gln Ala Leu Ala Glu Lys Leu Glu Asn
1685 1690 1695
His Asp Met Pro Leu Thr Asp Ala Ile Arg Ser Ser Cys Pro Thr Ser
1700 1705 1710
Glu Lys Pro Asp Ala Ser Glu Asn Glu Lys Asn Phe Ile Gln Ile Leu
1715 1720 1725
Leu Thr Arg Leu Leu Val Arg Pro Asp Ala Val Pro Leu Phe Ser Glu
1730 1735 1740
Val Val His Leu Phe Gly Arg Ser Val Glu Asp Ser Met Leu Lys Gln
1745 1750 1755 1760
Ala Glu Trp Phe Leu Ala Gly Gln Asp Val Leu Phe Gly Arg Lys Thr
1765 1770 1775
Ile Arg Gln Lys Leu Ile Ile Val Gly Glu Ser Lys Gly Leu Pro Thr
1780 1785 1790
Lys Pro Gln Phe Trp Lys Pro Trp Gly Trp Cys Asn Ser Ser Ser Ser
1795 1800 1805
Asp His Ile Thr Ala Asn Lys Ala Gly Lys Lys Arg Lys Phe Glu Ile
1810 1815 1820
Thr Ser Ile Glu Glu Gly Glu Val Ile Glu Glu Gly Ser Gly Ser Arg
1825 1830 1835 1840
Lys Val Leu Leu Pro Arg Val Leu Asp Glu Asn Ser Pro Ser Val Gly
1845 1850 1855
Tyr Gly Ile Thr Thr Glu Arg Ala Phe Val Gln Leu Val Leu Pro Cys
1860 1865 1870
Ile Asp Gln Ser Ser Asp Glu Ser Arg Ser Thr Phe Val Asn Glu Leu
1875 1880 1885
Val Arg Gln Phe Ser Asn Ile Glu Gln Gln Leu Ser Ser Val Thr Asn
1890 1895 1900
Arg Ser Thr Thr Ser Asn Lys Gln Met Gly Thr Ala Ser Ser Gly Ser
1905 1910 1915 1920
Glu Ile Ser Ser Asn Lys Gly Ser Thr Arg Lys Gly Leu Arg Gly Gly
1925 1930 1935
Ser Pro Ser Leu Ala Arg Arg Ser Ser Ala Asn Thr Thr Asp Thr Ser
1940 1945 1950
Pro Pro Pro Ser Pro Ala Ala Leu Arg Ala Ser Met Ser Leu Arg Leu
1955 1960 1965
Gln Phe Leu Leu Arg Leu Leu Pro Val Ile Cys Gly Glu Pro Ser Phe
1970 1975 1980
Lys Asn Thr Arg His Ala Leu Ala Ser Thr Ile Val Arg Leu Leu Gly
1985 1990 1995 2000
Ser Arg Val Val Tyr Glu Asp Tyr Ala Val Cys Ser Pro Arg Ser Glu
2005 2010 2015
Leu Ser Lys Ala Glu Thr Glu Ser Thr Ile Asp Pro Ser Ser Met Ala
2020 2025 2030
Asp Leu Ser Ser Glu Val Leu Phe Asp Arg Leu Leu Phe Val Leu His
2035 2040 2045
Gly Leu Leu Ser Asn His Gln Pro Lys Trp Leu Lys Pro Arg Pro Ser
2050 2055 2060
Ser Asn Glu Ser Ser Lys Asp Phe Thr Leu Phe Asp Arg Asp Ala Ala
2065 2070 2075 2080
Glu Ser Leu Gln Asn Glu Leu Ser Arg Met Gln Leu Pro Asp Thr Ile
2085 2090 2095
Arg Trp Arg Ile Gln Ala Ala Met Pro Ile Leu Leu Pro Ser Leu Arg
2100 2105 2110
Cys Ser Leu Ser Cys Gln Pro His Ser Val Pro Pro Thr Ala Leu Thr
2115 2120 2125
Leu Val Gln Pro Ser Gly Ser Thr Ala Ala Ala Gly Thr Asn Gln Arg
2130 2135 2140
Asn Ser Pro Ala Ile Ser Lys Ser Gly Thr Ala Ala Ala Gln Gly Lys
2145 2150 2155 2160
Leu Lys Pro Thr Met Leu Ala Pro His Gln Gln Gln Glu Ala Asp Asn
2165 2170 2175
Thr Asp Val Val Asp Pro Trp Thr Leu Leu Glu Asp Gly Thr Ser Ser
2180 2185 2190
Gly Leu Ser Ser Ser Asn Ala Ser Asn Ser Ser Asp Met Ala Asn Leu
2195 2200 2205
Arg Ala Thr Cys Trp Leu Lys Gly Ala Val Arg Val Arg Arg Thr Asp
2210 2215 2220
Leu Thr Tyr Val Gly Ser Val Asp Asp Asp Ser
2225 2230 2235
<210> 5
<211> 6708
<212> DNA
<213> Arabidopsis thaliana
<400> 5
atgcaaaggt atcatgctgc caactgcact agtgcagtca acaatagtgc tataggtggt 60
gcatccgcga gggactcagg acgagctgat tcctcttcga ttggaaacta ttcactaaac 120
tccaggagac caccaccgtt gacaccctac aagttgaagt gtgaaaagga cggtctgaat 180
tcccgattag ggccgcctga ttttcatcct ccaacatcaa attctcccga agagaatctg 240
accaaagagt atgttcaatt tggatacaag gaaactgttg atggacttaa ggaattcgaa 300
gaaattatat tgtcccaggt ccatactttc tcaaagcctg ttgtccataa gtgcaaagag 360
gcagtcagaa agtgtcttag agctatcaat gaatctcgtg cactgaagcg caaggctggt 420
caggtttatg gggtgcctct ctctggttcg cttctatgta agcctggatt tccagaacaa 480
aggtcatgtg gggaggagac aaagaaaaga tggatcgaga gtttatcaca acagcacaaa 540
cgattgcgct ctttggctga taacattcct ggatatagga gaaaaacctt atttgaagtc 600
cttataagga acaatgtccc actattgaga gctacttggt ttataaaagt gacttatctc 660
aatcaggtgc gacctagtcc tgctgctatt tcttcaggaa cacctgacaa gacacaagct 720
tctcggtgtg agcaatggac aaaagatgtt attgaatatt tgcaatacct cttggatgaa 780
cttttgtcac ggaatagctc atttcctgct cagcaaacta gagataggtc accacagatg 840
ctttatacag gatcaatgca aaagaatagt ccagcatcaa caagccttta cggcgaggaa 900
acatctctac attttaaatg gtggtatatg gtgcgtcttc tacagtggca ccatgctgaa 960
gggcttcttt ttcctaatct cattgttgat tgggttctca agctcttaca ggaaaaggag 1020
atctttgaaa ttttgcagct gctactcccc attgtgtatg gtgttttaga gagtattgtt 1080
ctctctcaga catatgtaca gagtcttgta gctattgctg tccgtttcat tcaggaacct 1140
gctcctggtg gatctgatct tgttgataac tctcgaagag cttatactct atctgctcta 1200
attgagatgg ttcgctactt ggtacttgct gcacccgaca catttgttgc ttcagatttc 1260
tttcctcttc ctccttccgt agcagcatgt ggacctaatg atgtgagcta tacgtcaaag 1320
gcttatgaga atctggaaaa gctgagaagt aactctgcgg agatttctgc ccagtttcaa 1380
ggaagaggag ttctttcccg gtttgagttc ctttcttttg attataccat ttcaaccatt 1440
caaagaagtg cagatgattt ggcaaagata gctagcgctg gttaccctca acataacgtg 1500
gctaaagctg ttcaggcctt ggataaagct ttgtcggatg gagatatcag agctgcttac 1560
agttatctct ttgaagacct ttgcaatgga gccgttgatg aggcctggat tactgacgtc 1620
agtccatgtt taagatcatc ccttagatgg attggcgcta ttagcacatc ctttgtttgc 1680
tccgtttttt tccttataga atgggctaca tgtgatttta gagatttccg tgctggtgtg 1740
cctaaagata tcaagttctc tggcagaaaa gattgttctc aggtgtattt agtcattcag 1800
cttctgaagc aaaagattct gggtggagaa ttcacagctc gcaaaggaaa gaattgtcgc 1860
aacaattttc ttggtgtttc taaacctagc ggttcgatgg atgcatttga aagcccgggc 1920
ccattacatg atatcatagt ctgttggatt gatcagcatg aggtacacaa gggaggagca 1980
aagcgcttgc aattactcgt ttttgaactt atacgttctg gaatctttaa tcccatagca 2040
tatgtgaggc aactcatagt tagcgggatg atcgatgtga ttcaacctgc tgttgatcct 2100
gaaaggagaa tgaggcacca tcgcatattg aaacagctac ctgggtgttt tgtacatgaa 2160
accttagagg aagctcaact ctttggaggg gataagcttt ccgaggctgt gagaacttat 2220
tctaatgaac ggcgccttct tcttcgagaa ctgcttgttg agaaaggtaa atactggaat 2280
aatttagttc tctcagatca gaagtcaaag aaaatttcca cttccctttc gtctgttatt 2340
tttccaaggg cgtgtaatgc caagagcaat agtaagggac ctcgcaaaca taccaagagt 2400
agtgtggata ttagagaact aaaggagcgc atatcagctc tactgcagtt tccaggtatg 2460
tcatgtggtg tggaaacccc agtgcgagat gaattccaaa atagtgttaa gagatcaagt 2520
ggatctgtgt atagcaagat ggatcaacca gaagctacac cagggtgtga agactgtaga 2580
agagcaaaaa gaccaaaaat gaatgatgaa aagagctctt gctatcaagg gaattcacca 2640
attgcatcag atgaagaaga taactggtgg atcaagaaag gatcgaaaac tgtggagtct 2700
tctctgaagg ttgatcctca gatagagata actaaacaag taccacgagg taggcagaag 2760
atggcgcgta agacacagtc gctggctcaa ctacaagctg ctagaattga aggtagccag 2820
ggcgcttcaa cgagtcatgt ttgtgataat aaagtaagct gtcctcatca tggccctgga 2880
gtggaaggag aaaatcagaa ggtggttgat gtgtttagaa cttccacccc tgtggatatg 2940
gtatctgttg gaaactcttt gaagcagcta cagtttgttg ataagcgatc tattgcagtt 3000
tggcttacta ctgcagttcg gcaacttgtt gaagagcccc aaaagagcag tgtgagagtt 3060
gggcagttca atagaggtgc tccagttgag gagaagaaca caattaggtg gaagcttggg 3120
gcagacgagc tatactccat attatttctc ttggatatct ctcttgactt ggtttcagcg 3180
gttaaatttc ttctttggtt attgccgaag gccaacagta ccccaagttt tgccgtacag 3240
ggtggaagaa accttgtaac tgtaccaagg aatgttgaaa acaacatgtg tgaaataggc 3300
gaggcgattc tagtatcatc actgagaagg tatgaaaaca ttctactttc agctgatctt 3360
gttcctgagg ccatgacagc tttgatgaac cgtgctgcat cacttatgtc tagtaatgga 3420
aaaatttctg gatcagcagc cttagtttat actcgctata ttttgaaaag atatggaagc 3480
ctccccagtg ttgtggaatg gcataacaat ttcaaagcaa catccgaaaa gaagctactt 3540
tctgaactag atcatacgcg atcaggaaat ggtgagtatg ggaaccccct cggggttcca 3600
gcaggagtag ataatccaga tgactattta cgtaaaaaaa tcagcattgg cggtgcacgt 3660
ccttcaagag tgggtttgag tatgcgagat gttttgcaac gacatgttga agaggcgact 3720
cattatctca aaaaactcat tgggactggt actatgaaag cctctctcgc tgagaaaaat 3780
gatgacgggt atcaggtggc tcaacaaatt gtagttggac taatggactg cattagacag 3840
actggcggtg cagctcaaga gggtgatccc tctttggttt cttctgcggt ttctgcgatt 3900
ataaacagtg taggcctttc agtggcaagg attacagatt tctctttggg aaacatttat 3960
cagaatcatc cttctggcgt tgattcatct aatattgcac gatacatttt acgaatccat 4020
ataacctgtc tgtgccttct taaggaagct cttggagagc gtcaaagccg agtgtttgaa 4080
atagcacttg caacagaaag ttccactgcg cttactggag tttttgctcc tgtgaaggga 4140
tcacgaggtc agcatcagct atctcctgaa tcctatgatt caaatgcaaa caattcaaca 4200
atcgatatgt cgaatggtac tggaaaaatg gcgctgagca gagcgacaaa aattactgca 4260
gctgtatctg cacttgttat aggttctatc acacatggtg ttataaccct tgagaggatt 4320
gttggtctac tgagactaaa ggattactta gatttcgttc agtttgtaag gcgtacaaaa 4380
tcgagttcta atggcagtgc tagatccatg ggagcctcta aagtggaaag ccctattgaa 4440
gtgtatgtac attggttcag actccttgtt ggtaactgta aaactgtttc ggaagggctg 4500
gttttggagc ttgtgggaga atcttccgtg gtggctatat cacgcatgca gcgtatgctt 4560
ccgctgaaat tggtcttccc accagcctat tcaattattg cgtttgttct gtggaggcct 4620
tttgtttcaa atagtaactc taactccagc gtccatgaag acactcaccg cctttatcag 4680
tctttgacaa tggccttcca tgatgttatt aagcatcttc ctttccgaga cgtgtgcttc 4740
agagacaccc agggacttta tgaactgata gttgctgatt ccacagatgc tgaatttgcg 4800
tcggtgtttg aatcgcatgg attggatatg cacttgaaat ctgtggcctt tgctcctctt 4860
cgagcgcgtc ttttcttaaa ttccctaatt gattgtaagg tgccatcctc tggttattcc 4920
catgaaggag ttagtgaagc aaaaaaccga catcagggaa atggaacaaa gcttgtggac 4980
aagcttgtat ctgtattaga ttgcctgcag cctgcaaaat ttcactggca gtgggttgaa 5040
ctcaggctgc ttctaaacga gcaagcactt gctgagaaac tcgaaaatca tgatatgcct 5100
ttgacagatg caatacgatc ttcctgtcct acctctgaga agcctgatgc ctctgagaat 5160
gagaaaaatt tcattcaaat cctcctcaca aggttattgg ttagacctga tgcggtccct 5220
cttttctcag aagtggttca tctcttcggt agatcggttg aggattcaat gttgaagcaa 5280
gctgaatggt ttctagcagg ccaagatgtt ctttttggac gaaaaacaat cagacaaaaa 5340
ctgattattg taggtgaaag caaaggactc cccacgaaac ctcagttttg gaaaccttgg 5400
ggttggtgca acagctctag ttccgatcat attacagcaa acaaggcagg gaagaaaagg 5460
aagtttgaaa ttacttctat cgaagaaggg gaagtgattg aggaaggttc aggttcaaga 5520
aaggtattat taccccgggt attggatgag aatagtccca gtgttggcta tgggattaca 5580
actgagaggg cttttgttca gctagtgctt ccatgcatag accaaagctc tgatgagtct 5640
cgaagtacct ttgtgaatga gttggtaaga cagtttagca atattgagca gcaattaagt 5700
tcagttacca accgcagtac aacaagcaac aagcaaatgg gaactgcttc ttctgggtct 5760
gagatttcat caaataaagg aagtacccgg aagggccttc gcggtggtag ccctagtttg 5820
gcaagaagat cctcagccaa tactactgac acttcgccgc cgccttcccc tgctgctttg 5880
agagcttcta tgtctttgcg gttgcaattt cttctaagat tactgcctgt catctgcggg 5940
gaaccttcat ttaagaacac cagacatgca cttgcgtcta caatagttcg tctacttgga 6000
agcagagtag tttatgaaga ttatgctgta tgttctcctc gtagtgagct atcaaaggca 6060
gaaacagaat caacaataga tccttcttcc atggcagatc tctctagtga agtcttattt 6120
gaccggttac tgtttgtact ccatgggctg ttaagcaatc accagccaaa atggctaaag 6180
ccaaggcctt cctctaatga atcatccaaa gactttacct tgtttgatcg cgatgcagca 6240
gagagcttac agaatgagct ttcgcggatg cagttaccag acaccattag atggcggatc 6300
caagcagcga tgccaatcct ccttccttct ctacgctgtt ctctctcatg ccagcctcat 6360
tctgttccgc caaccgcact cacacttgtt cagccctctg gatctactgc tgctgctgga 6420
accaatcaaa gaaactcccc tgccatatcg aaaagtggaa ctgcagcagc acaagggaag 6480
ctgaagccga caatgttggc accacatcaa caacaagaag cagacaacac ggatgtggtt 6540
gacccgtgga cgctcctcga agatgggaca agttcaggtc tatcaagcag caacgcttca 6600
aatagcagcg acatggccaa ccttcgagcc acctgttggc tgaaaggtgc agtcagggtc 6660
agacggactg atctaactta cgttggttca gtagacgacg acagctga 6708
<210> 6
<211> 2235
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Gln Arg Tyr His Ala Ala Asn Cys Thr Ser Ala Val Asn Asn Ser
1 5 10 15
Ala Ile Gly Gly Ala Ser Ala Arg Asp Ser Gly Arg Ala Asp Ser Ser
20 25 30
Ser Ile Gly Asn Tyr Ser Leu Asn Ser Arg Arg Pro Pro Pro Leu Thr
35 40 45
Pro Tyr Lys Leu Lys Cys Glu Lys Asp Gly Leu Asn Ser Arg Leu Gly
50 55 60
Pro Pro Asp Phe His Pro Pro Thr Ser Asn Ser Pro Glu Glu Asn Leu
65 70 75 80
Thr Lys Glu Tyr Val Gln Phe Gly Tyr Lys Glu Thr Val Asp Gly Leu
85 90 95
Lys Glu Phe Glu Glu Ile Ile Leu Ser Gln Val His Thr Phe Ser Lys
100 105 110
Pro Val Val His Lys Cys Lys Glu Ala Val Arg Lys Cys Leu Arg Ala
115 120 125
Ile Asn Glu Ser Arg Ala Leu Lys Arg Lys Ala Gly Gln Val Tyr Gly
130 135 140
Val Pro Leu Ser Gly Ser Leu Leu Cys Lys Pro Gly Phe Pro Glu Gln
145 150 155 160
Arg Ser Cys Gly Glu Glu Thr Lys Lys Arg Trp Ile Glu Ser Leu Ser
165 170 175
Gln Gln His Lys Arg Leu Arg Ser Leu Ala Asp Asn Ile Pro Gly Tyr
180 185 190
Arg Arg Lys Thr Leu Phe Glu Val Leu Ile Arg Asn Asn Val Pro Leu
195 200 205
Leu Arg Ala Thr Trp Phe Ile Lys Val Thr Tyr Leu Asn Gln Val Arg
210 215 220
Pro Ser Pro Ala Ala Ile Ser Ser Gly Thr Pro Asp Lys Thr Gln Ala
225 230 235 240
Ser Arg Cys Glu Gln Trp Thr Lys Asp Val Ile Glu Tyr Leu Gln Tyr
245 250 255
Leu Leu Asp Glu Leu Leu Ser Arg Asn Ser Ser Phe Pro Ala Gln Gln
260 265 270
Thr Arg Asp Arg Ser Pro Gln Met Leu Tyr Thr Gly Ser Met Gln Lys
275 280 285
Asn Ser Pro Ala Ser Thr Ser Leu Tyr Gly Glu Glu Thr Ser Leu His
290 295 300
Phe Lys Trp Trp Tyr Met Val Arg Leu Leu Gln Trp His His Ala Glu
305 310 315 320
Gly Leu Leu Phe Pro Asn Leu Ile Val Asp Trp Val Leu Lys Leu Leu
325 330 335
Gln Glu Lys Glu Ile Phe Glu Ile Leu Gln Leu Leu Leu Pro Ile Val
340 345 350
Tyr Gly Val Leu Glu Ser Ile Val Leu Ser Gln Thr Tyr Val Gln Ser
355 360 365
Leu Val Ala Ile Ala Val Arg Phe Ile Gln Glu Pro Ala Pro Gly Gly
370 375 380
Ser Asp Leu Val Asp Asn Ser Arg Arg Ala Tyr Thr Leu Ser Ala Leu
385 390 395 400
Ile Glu Met Val Arg Tyr Leu Val Leu Ala Ala Pro Asp Thr Phe Val
405 410 415
Ala Ser Asp Phe Phe Pro Leu Pro Pro Ser Val Ala Ala Cys Gly Pro
420 425 430
Asn Asp Val Ser Tyr Thr Ser Lys Ala Tyr Glu Asn Leu Glu Lys Leu
435 440 445
Arg Ser Asn Ser Ala Glu Ile Ser Ala Gln Phe Gln Gly Arg Gly Val
450 455 460
Leu Ser Arg Phe Glu Phe Leu Ser Phe Asp Tyr Thr Ile Ser Thr Ile
465 470 475 480
Gln Arg Ser Ala Asp Asp Leu Ala Lys Ile Ala Ser Ala Gly Tyr Pro
485 490 495
Gln His Asn Val Ala Lys Ala Val Gln Ala Leu Asp Lys Ala Leu Ser
500 505 510
Asp Gly Asp Ile Arg Ala Ala Tyr Ser Tyr Leu Phe Glu Asp Leu Cys
515 520 525
Asn Gly Ala Val Asp Glu Ala Trp Ile Thr Asp Val Ser Pro Cys Leu
530 535 540
Arg Ser Ser Leu Arg Trp Ile Gly Ala Ile Ser Thr Ser Phe Val Cys
545 550 555 560
Ser Val Phe Phe Leu Ile Glu Trp Ala Thr Cys Asp Phe Arg Asp Phe
565 570 575
Arg Ala Gly Val Pro Lys Asp Ile Lys Phe Ser Gly Arg Lys Asp Cys
580 585 590
Ser Gln Val Tyr Leu Val Ile Gln Leu Leu Lys Gln Lys Ile Leu Gly
595 600 605
Gly Glu Phe Thr Ala Arg Lys Gly Lys Asn Cys Arg Asn Asn Phe Leu
610 615 620
Gly Val Ser Lys Pro Ser Gly Ser Met Asp Ala Phe Glu Ser Pro Gly
625 630 635 640
Pro Leu His Asp Ile Ile Val Cys Trp Ile Asp Gln His Glu Val His
645 650 655
Lys Gly Gly Ala Lys Arg Leu Gln Leu Leu Val Phe Glu Leu Ile Arg
660 665 670
Ser Gly Ile Phe Asn Pro Ile Ala Tyr Val Arg Gln Leu Ile Val Ser
675 680 685
Gly Met Ile Asp Val Ile Gln Pro Ala Val Asp Pro Glu Arg Arg Met
690 695 700
Arg His His Arg Ile Leu Lys Gln Leu Pro Gly Cys Phe Val His Glu
705 710 715 720
Thr Leu Glu Glu Ala Gln Leu Phe Gly Gly Asp Lys Leu Ser Glu Ala
725 730 735
Val Arg Thr Tyr Ser Asn Glu Arg Arg Leu Leu Leu Arg Glu Leu Leu
740 745 750
Val Glu Lys Gly Lys Tyr Trp Asn Asn Leu Val Leu Ser Asp Gln Lys
755 760 765
Ser Lys Lys Ile Ser Thr Ser Leu Ser Ser Val Ile Phe Pro Arg Ala
770 775 780
Cys Asn Ala Lys Ser Asn Ser Lys Gly Pro Arg Lys His Thr Lys Ser
785 790 795 800
Ser Val Asp Ile Arg Glu Leu Lys Glu Arg Ile Ser Ala Leu Leu Gln
805 810 815
Phe Pro Gly Met Ser Cys Gly Val Glu Thr Pro Val Arg Asp Glu Phe
820 825 830
Gln Asn Ser Val Lys Arg Ser Ser Gly Ser Val Tyr Ser Lys Met Asp
835 840 845
Gln Pro Glu Ala Thr Pro Gly Cys Glu Asp Cys Arg Arg Ala Lys Arg
850 855 860
Pro Lys Met Asn Asp Glu Lys Ser Ser Cys Tyr Gln Gly Asn Ser Pro
865 870 875 880
Ile Ala Ser Asp Glu Glu Asp Asn Trp Trp Ile Lys Lys Gly Ser Lys
885 890 895
Thr Val Glu Ser Ser Leu Lys Val Asp Pro Gln Ile Glu Ile Thr Lys
900 905 910
Gln Val Pro Arg Gly Arg Gln Lys Met Ala Arg Lys Thr Gln Ser Leu
915 920 925
Ala Gln Leu Gln Ala Ala Arg Ile Glu Gly Ser Gln Gly Ala Ser Thr
930 935 940
Ser His Val Cys Asp Asn Lys Val Ser Cys Pro His His Gly Pro Gly
945 950 955 960
Val Glu Gly Glu Asn Gln Lys Val Val Asp Val Phe Arg Thr Ser Thr
965 970 975
Pro Val Asp Met Val Ser Val Gly Asn Ser Leu Lys Gln Leu Gln Phe
980 985 990
Val Asp Lys Arg Ser Ile Ala Val Trp Leu Thr Thr Ala Val Arg Gln
995 1000 1005
Leu Val Glu Glu Pro Gln Lys Ser Ser Val Arg Val Gly Gln Phe Asn
1010 1015 1020
Arg Gly Ala Pro Val Glu Glu Lys Asn Thr Ile Arg Trp Lys Leu Gly
1025 1030 1035 1040
Ala Asp Glu Leu Tyr Ser Ile Leu Phe Leu Leu Asp Ile Ser Leu Asp
1045 1050 1055
Leu Val Ser Ala Val Lys Phe Leu Leu Trp Leu Leu Pro Lys Ala Asn
1060 1065 1070
Ser Thr Pro Ser Phe Ala Val Gln Gly Gly Arg Asn Leu Val Thr Val
1075 1080 1085
Pro Arg Asn Val Glu Asn Asn Met Cys Glu Ile Gly Glu Ala Ile Leu
1090 1095 1100
Val Ser Ser Leu Arg Arg Tyr Glu Asn Ile Leu Leu Ser Ala Asp Leu
1105 1110 1115 1120
Val Pro Glu Ala Met Thr Ala Leu Met Asn Arg Ala Ala Ser Leu Met
1125 1130 1135
Ser Ser Asn Gly Lys Ile Ser Gly Ser Ala Ala Leu Val Tyr Thr Arg
1140 1145 1150
Tyr Ile Leu Lys Arg Tyr Gly Ser Leu Pro Ser Val Val Glu Trp His
1155 1160 1165
Asn Asn Phe Lys Ala Thr Ser Glu Lys Lys Leu Leu Ser Glu Leu Asp
1170 1175 1180
His Thr Arg Ser Gly Asn Gly Glu Tyr Gly Asn Pro Leu Gly Val Pro
1185 1190 1195 1200
Ala Gly Val Asp Asn Pro Asp Asp Tyr Leu Arg Lys Lys Ile Ser Ile
1205 1210 1215
Gly Gly Ala Arg Pro Ser Arg Val Gly Leu Ser Met Arg Asp Val Leu
1220 1225 1230
Gln Arg His Val Glu Glu Ala Thr His Tyr Leu Lys Lys Leu Ile Gly
1235 1240 1245
Thr Gly Thr Met Lys Ala Ser Leu Ala Glu Lys Asn Asp Asp Gly Tyr
1250 1255 1260
Gln Val Ala Gln Gln Ile Val Val Gly Leu Met Asp Cys Ile Arg Gln
1265 1270 1275 1280
Thr Gly Gly Ala Ala Gln Glu Gly Asp Pro Ser Leu Val Ser Ser Ala
1285 1290 1295
Val Ser Ala Ile Ile Asn Ser Val Gly Leu Ser Val Ala Arg Ile Thr
1300 1305 1310
Asp Phe Ser Leu Gly Asn Ile Tyr Gln Asn His Pro Ser Gly Val Asp
1315 1320 1325
Ser Ser Asn Ile Ala Arg Tyr Ile Leu Arg Ile His Ile Thr Cys Leu
1330 1335 1340
Cys Leu Leu Lys Glu Ala Leu Gly Glu Arg Gln Ser Arg Val Phe Glu
1345 1350 1355 1360
Ile Ala Leu Ala Thr Glu Ser Ser Thr Ala Leu Thr Gly Val Phe Ala
1365 1370 1375
Pro Val Lys Gly Ser Arg Gly Gln His Gln Leu Ser Pro Glu Ser Tyr
1380 1385 1390
Asp Ser Asn Ala Asn Asn Ser Thr Ile Asp Met Ser Asn Gly Thr Gly
1395 1400 1405
Lys Met Ala Leu Ser Arg Ala Thr Lys Ile Thr Ala Ala Val Ser Ala
1410 1415 1420
Leu Val Ile Gly Ser Ile Thr His Gly Val Ile Thr Leu Glu Arg Ile
1425 1430 1435 1440
Val Gly Leu Leu Arg Leu Lys Asp Tyr Leu Asp Phe Val Gln Phe Val
1445 1450 1455
Arg Arg Thr Lys Ser Ser Ser Asn Gly Ser Ala Arg Ser Met Gly Ala
1460 1465 1470
Ser Lys Val Glu Ser Pro Ile Glu Val Tyr Val His Trp Phe Arg Leu
1475 1480 1485
Leu Val Gly Asn Cys Lys Thr Val Ser Glu Gly Leu Val Leu Glu Leu
1490 1495 1500
Val Gly Glu Ser Ser Val Val Ala Ile Ser Arg Met Gln Arg Met Leu
1505 1510 1515 1520
Pro Leu Lys Leu Val Phe Pro Pro Ala Tyr Ser Ile Ile Ala Phe Val
1525 1530 1535
Leu Trp Arg Pro Phe Val Ser Asn Ser Asn Ser Asn Ser Ser Val His
1540 1545 1550
Glu Asp Thr His Arg Leu Tyr Gln Ser Leu Thr Met Ala Phe His Asp
1555 1560 1565
Val Ile Lys His Leu Pro Phe Arg Asp Val Cys Phe Arg Asp Thr Gln
1570 1575 1580
Gly Leu Tyr Glu Leu Ile Val Ala Asp Ser Thr Asp Ala Glu Phe Ala
1585 1590 1595 1600
Ser Val Phe Glu Ser His Gly Leu Asp Met His Leu Lys Ser Val Ala
1605 1610 1615
Phe Ala Pro Leu Arg Ala Arg Leu Phe Leu Asn Ser Leu Ile Asp Cys
1620 1625 1630
Lys Val Pro Ser Ser Gly Tyr Ser His Glu Gly Val Ser Glu Ala Lys
1635 1640 1645
Asn Arg His Gln Gly Asn Gly Thr Lys Leu Val Asp Lys Leu Val Ser
1650 1655 1660
Val Leu Asp Cys Leu Gln Pro Ala Lys Phe His Trp Gln Trp Val Glu
1665 1670 1675 1680
Leu Arg Leu Leu Leu Asn Glu Gln Ala Leu Ala Glu Lys Leu Glu Asn
1685 1690 1695
His Asp Met Pro Leu Thr Asp Ala Ile Arg Ser Ser Cys Pro Thr Ser
1700 1705 1710
Glu Lys Pro Asp Ala Ser Glu Asn Glu Lys Asn Phe Ile Gln Ile Leu
1715 1720 1725
Leu Thr Arg Leu Leu Val Arg Pro Asp Ala Val Pro Leu Phe Ser Glu
1730 1735 1740
Val Val His Leu Phe Gly Arg Ser Val Glu Asp Ser Met Leu Lys Gln
1745 1750 1755 1760
Ala Glu Trp Phe Leu Ala Gly Gln Asp Val Leu Phe Gly Arg Lys Thr
1765 1770 1775
Ile Arg Gln Lys Leu Ile Ile Val Gly Glu Ser Lys Gly Leu Pro Thr
1780 1785 1790
Lys Pro Gln Phe Trp Lys Pro Trp Gly Trp Cys Asn Ser Ser Ser Ser
1795 1800 1805
Asp His Ile Thr Ala Asn Lys Ala Gly Lys Lys Arg Lys Phe Glu Ile
1810 1815 1820
Thr Ser Ile Glu Glu Gly Glu Val Ile Glu Glu Gly Ser Gly Ser Arg
1825 1830 1835 1840
Lys Val Leu Leu Pro Arg Val Leu Asp Glu Asn Ser Pro Ser Val Gly
1845 1850 1855
Tyr Gly Ile Thr Thr Glu Arg Ala Phe Val Gln Leu Val Leu Pro Cys
1860 1865 1870
Ile Asp Gln Ser Ser Asp Glu Ser Arg Ser Thr Phe Val Asn Glu Leu
1875 1880 1885
Val Arg Gln Phe Ser Asn Ile Glu Gln Gln Leu Ser Ser Val Thr Asn
1890 1895 1900
Arg Ser Thr Thr Ser Asn Lys Gln Met Gly Thr Ala Ser Ser Gly Ser
1905 1910 1915 1920
Glu Ile Ser Ser Asn Lys Gly Ser Thr Arg Lys Gly Leu Arg Gly Gly
1925 1930 1935
Ser Pro Ser Leu Ala Arg Arg Ser Ser Ala Asn Thr Thr Asp Thr Ser
1940 1945 1950
Pro Pro Pro Ser Pro Ala Ala Leu Arg Ala Ser Met Ser Leu Arg Leu
1955 1960 1965
Gln Phe Leu Leu Arg Leu Leu Pro Val Ile Cys Gly Glu Pro Ser Phe
1970 1975 1980
Lys Asn Thr Arg His Ala Leu Ala Ser Thr Ile Val Arg Leu Leu Gly
1985 1990 1995 2000
Ser Arg Val Val Tyr Glu Asp Tyr Ala Val Cys Ser Pro Arg Ser Glu
2005 2010 2015
Leu Ser Lys Ala Glu Thr Glu Ser Thr Ile Asp Pro Ser Ser Met Ala
2020 2025 2030
Asp Leu Ser Ser Glu Val Leu Phe Asp Arg Leu Leu Phe Val Leu His
2035 2040 2045
Gly Leu Leu Ser Asn His Gln Pro Lys Trp Leu Lys Pro Arg Pro Ser
2050 2055 2060
Ser Asn Glu Ser Ser Lys Asp Phe Thr Leu Phe Asp Arg Asp Ala Ala
2065 2070 2075 2080
Glu Ser Leu Gln Asn Glu Leu Ser Arg Met Gln Leu Pro Asp Thr Ile
2085 2090 2095
Arg Trp Arg Ile Gln Ala Ala Met Pro Ile Leu Leu Pro Ser Leu Arg
2100 2105 2110
Cys Ser Leu Ser Cys Gln Pro His Ser Val Pro Pro Thr Ala Leu Thr
2115 2120 2125
Leu Val Gln Pro Ser Gly Ser Thr Ala Ala Ala Gly Thr Asn Gln Arg
2130 2135 2140
Asn Ser Pro Ala Ile Ser Lys Ser Gly Thr Ala Ala Ala Gln Gly Lys
2145 2150 2155 2160
Leu Lys Pro Thr Met Leu Ala Pro His Gln Gln Gln Glu Ala Asp Asn
2165 2170 2175
Thr Asp Val Val Asp Pro Trp Thr Leu Leu Glu Asp Gly Thr Ser Ser
2180 2185 2190
Gly Leu Ser Ser Ser Asn Ala Ser Asn Ser Ser Asp Met Ala Asn Leu
2195 2200 2205
Arg Ala Thr Cys Trp Leu Lys Gly Ala Val Arg Val Arg Arg Thr Asp
2210 2215 2220
Leu Thr Tyr Val Gly Ser Val Asp Asp Asp Ser
2225 2230 2235
<210> 7
<211> 13000
<212> DNA
<213> Oryzae sativa
<400> 7
gttcatcctg gtgaatttat tgactgttca gtgtttggtc agtttaacag ctcaactgtt 60
ggtttaatga aaagatggaa aaatgatact tgattgttat ttggtagaaa cagtcacaat 120
tttcctggta tgaataagta gttaattcaa gctcattgtc ccagtttcga aacccatgtt 180
gcatgtaaac cctttgatgt gatttgtgaa gtagtcggtc caattgattc cttcaataca 240
gtggtggatc cagaaatttt cttgagcctg agcatgctta ggctgtgttt gagatgacat 300
ctatgatgag attatggtcc acatgcaaaa cgagacgagt gattagggta tggttaatta 360
ggtattaatt atccatagtt ttaaaaaaat ataacaaagc agaagagaga tagtgacctc 420
tgacaataat ctatcagcat caggagtcca ataacatgtt ctgcttgttt gccatttttt 480
tctacctgtc ttaaactagt gcacaattaa aagcctgctt tggtgctcaa atagtcgtgc 540
aggacaccat actaactaca aactgcaccg tatagaagca tgacgcctgg tgccgtttgt 600
tgcccgggag caaatgccat tggctagcag aggaacagca ccgaagtcca ttgcggcaaa 660
gactgggagc ccgggcagct gcccatgctg gctgggccct gaatccgccg ctgcttcaat 720
atatcatgaa actagctcat cgaattgtat tttcaccagt tcagagttgc ttacttgctt 780
cgattatctt gtgtccaact tggatgagtc actgtctgct gatcaggtcc atttttaaaa 840
ttatggcact agagatggtt gtgttctgaa caaaaattca atcaaaatca gtcgcagtct 900
actctagtgg gatttgtcct ttgaatcaga tggacatttt tttaattcaa aaactagatg 960
aatatcataa aaattgcctt tttaattttt atggtgtgat atcatttgaa aacgtatcac 1020
tgttagttat ggtaaatgaa agagaaaaca ttttgttctt tagtaggtca aacaatcttc 1080
actgtacagt gctctttttt atggttgtta ctccctccat cacattttga tcatcctcta 1140
agtaaatgac accaagacca aagacaccaa aatattcatc attctcaaat taatcctcat 1200
cgattaaagt gtttcatcgc ttcgtgtccc gtggattgct catgttttaa atattgcatg 1260
ccattgcacc aatagaaatt aatcttggtt ggttgcatgt aacacattca acgatgcaca 1320
tgtactcttt gcacaaataa acaaaaagac acttgttaga tgatgatcat tttaggaaga 1380
cttcaaaaac tttaggaaat gatcaaaatg ggatggaggg agtacttttt accttattct 1440
ggctgatgga ggcttcttac tagcagtttg agaggtcggc aaacggaaca gacaaaaaac 1500
ctgtttgcat aatgtaacta tcagcttata cctattgatc aatagataat gctttttcca 1560
tgagggtaac tccccacgtt ccattatcaa agataacaaa cacaagatcc tgttacatca 1620
ctctggcaca tctctcctgc accttgctaa gcaatatggt tgaaccaagt aactgacggg 1680
tagtttatag gatggttgtt cttatgggga cttcaaatgc atttagattg gcatggatga 1740
caagattgta ttcttcttat tttccagctg aagatgggaa gattatttgt tagtggcggg 1800
taaactacaa ttgcaccagc tgagaatgta accatggcca atgctgtact gtgacatctc 1860
acatggataa tattttattg ctggaatatt ttttttgaga aaattgctag aatattgatt 1920
ctaggaaaca gctatcgcca acaccgtcga atagttctgt ttgcatcaat tttgctttaa 1980
aatctcagca agaaattata ggagaacatt agctctttcc ttttttattt tctctctttc 2040
aggaagaatg ggggtattag ttgtaggagt agcactttca aatgtatgat cttccacatt 2100
taattttttt caaaggactt ttctacattt tgttcagact aaggttctac ctatgtttgt 2160
taagacatta acttagtgct gactgatgag catatgaacc tcctaatatg cttatgattc 2220
tatttttcag gcggcaacca ctggtagctc cttacaagct gaagtgtgac aaggaatcac 2280
tcaatgccag gcatgtttta ctcaacaact gatttgttcc tattgtctta ttgactatgt 2340
acataaatgt tttccatttt ctcatatcta gcttttctat tcttcaatat tcttactttt 2400
ttttcatttg catggagaag ttgcatattt gtattcgaaa acaactaaaa gttagtgttt 2460
cctttgtact atggattttg taggcttggt gcacctgact tctatcccca gacattgagt 2520
tgtgcagaag agaccttaac caaagaatat gtgcaatctg ggtacaagga taccgttgaa 2580
ggaattgagg tgtgctccag aaaccaaaag tttcaaatcc tatccctttt ttgtgacact 2640
gcttatctag ggttaatctt gtttcatata ttgtttgtct cattttcacg agtctcatgc 2700
cattaaaatc ttgagtccat aattttgtgt acattaggac cgcaatttct ttgttttgtt 2760
ttgactgaaa tttgttcctg gtggtgtttt tacaggaagc cagagagatt gtactcagtc 2820
agattccata cttgagcaaa ccagatattg ctacaaaatg caaggaggta aaaaggcaac 2880
caacatcaac ctaactagct ttatttttca tgcaatctta tgttgttaga acatttcttc 2940
ctgtcagagt gaagtgagaa gtaggttggt atgcggcatg attgaatgct gctggagatc 3000
aggaactaag atgggtagaa ttatgggaat cacatctttt atatataagc tgagatatgc 3060
atcacagggg gttaacagcc aaaactctac agcctacttg gtgctaattt tggataattg 3120
ccacctttgg attgttactg gctgcatagt ctgtcagaaa cttaggatta atattatgtg 3180
aatacgtaga tccatatgga agatgctgaa gaattgcttc ttttccctaa ggttgatgga 3240
ttgaactgaa tggttgaatg gattgaatct aatatttttc ttcccccttt gacctacccg 3300
attattgtgt tttccttctc taactgatat gtcttgtgaa aaaacttata ctttgactaa 3360
caattttatt ttttatttat caaggcacta aagaagcggt tcagagcgat caatgaatct 3420
cgtgctcaga agaggaaggt attttgattt gttgtagtta ctatgattag gatctctgct 3480
gtaaataagg atattttttg ttaaaccatt tcacaacttc aaaatgtttg tattgaaaat 3540
ttgacaaatg gggacttaac tgcattaatt agatttttac cacctaattc tagatagcta 3600
gcatctattt acatttttcc tgcaaaactt tgatcttttt aaagttaata ttggtctaaa 3660
atattccaaa tactctttcc taacaggctg gccaagttta tggggtccct ctttctggct 3720
cgttgctgac aaaacctggg atgtatccag agcaaatgca tagcaatgaa gacacacgca 3780
gaaaatggat cgaggtcaat caaattagcc tgtcattttc atcttctttt cctgtaatgt 3840
aatatttcat ttcatttatg cactttattg aataaagtga ggcaagtttg ctacaattaa 3900
gtgcggcgag tgtgccatcc aaataaccct tcatcttaag tagctatctt tctgtatatt 3960
atgagttctt gaaacatttc atactgtatc aaactgatgc atttcaaact ggactcacta 4020
tgtataaacg ggagcactgt gccgtccatc tcacctaatg tttcatttaa gaaactacag 4080
atttagggcg acattggtac caactttttt tttggtagaa ttgaagacta actgcaatat 4140
aattagaaaa cgattttctc taaagtcttt tctttttttg tcttgccgat ctgcgaggga 4200
tctcattgca accttaatct tccacctgac ttgaaatggc tgtgtaattc attcctttgc 4260
aggcccttgt gcaaccaaac aggcgtctat ggtcattagc agagcaagtt cctcgtggtt 4320
ttcggaggaa gttactcttt aattatctta tccgatataa tgtcccactg ttaagagcat 4380
catggcttgt gaaggttact taccttaatc aggtccgtta tttctgtgcc aaactgccac 4440
tgctcactag aatttagttc tgttatttca tgcttattag aaaattatat gatgttcgct 4500
tgatgatgcc tctttaattg caggttcaaa catcatccaa taatgtttca tctgctgctc 4560
ctgatagttt gcgatctcag cactggacaa aggatgttat tgaatacttg cagctgcttt 4620
tggacgaatt gtgttctaaa aatggctttt ttggacttcc atcttctcaa gaacagtcat 4680
tgccatgcct tgttgctgga gacagcccaa ttaagttaaa aaccggggca tcacctgcta 4740
gtgcagatgt tgaggagcct tcgctacact ttaaatggtc gtatatgatt cgtattgttc 4800
aatgtcatct catggaacaa ttacttgttc cgtcgttact tatcgaatgg gtatttaatc 4860
agctccaggt acagagtgca ttgataaagt aggttcatgc ttagtgatgt ttctcaagtg 4920
ctatgttgat cttctaatac caattttttt tctaacccac ttcctttcag gagagagact 4980
caactgaggt tttagaatta ctcttgccta ttgtactttc tttggttgat accataaccc 5040
tctcacagac atatatccac atgctggtgg aaatactgat tcaacgtctc agtgatgctt 5100
ctcctggcag cttaagtgtt aagaataacc caaaaaggtc atccattacc tctgctttag 5160
ttgagttact gcagtacttg atacttgctg ttcccgatac atttgtttct ttggattgct 5220
ttccacttcc atcagttgtg gctcctgatg tatacggtaa aggtgctctt ctgaaaatag 5280
caggtggtgg taaaattgct agctctagga gacagaatgc atctcgacac ctctcttgtg 5340
gttatgccat ttgttcagtt caaagacgtg catctgatct ttctttagtt gctaatccta 5400
atcttcaagt tcgtggggca gccaacgtag tgcaagcttt ggacaaagca cttgtaactg 5460
gaaacttgac agcagcatat acatcagtat tcaattatct atcagatacc ctgatggaag 5520
aaacatggat taaagaagtc agcccttgct tgcgatcttc tctgatgtgg atgggagctg 5580
ttgagttatc ccttgtctgc tctgtgtttt tcatttgtga gtgggcaaca tgtactttcc 5640
gtgattgccg tacatcacaa tgccaaaatg taaaattttc aggaagcaaa gatttctctc 5700
aggtctatat ggcagtttcc ctgttgaagg ataaaatgaa tgagataaat aatttatctt 5760
cttccaagag cagcagtcag cttgcaatga aggatcacct taaaagtgct actctgaatc 5820
attcttctat caaggtgaca gcaatggaga ctgcttctgg atttagagac agtacaggta 5880
gcattgatga gaataacaaa aaggatatct tcagcagccc aggtccactg catgacatta 5940
ttgtatgctg gttggatcaa catgagatta gtgatgcttc gggatttaaa agtgtggatg 6000
ttttcatgac tgaacttatt cgcagtggta tattttatcc tcagacatat gtgagacaac 6060
taattgttag tggaatcacc atttggaatg atagcttgtt tgatctggaa aagaaaacga 6120
ggcattacaa aattctgaag cacctgccag ggttttgctt atttaatatc cttgaggaag 6180
ctaagattgc tgaagatcaa gtcctttatg aaattgtgtc aacatattct agtgagcgtc 6240
gacttgtgct ttctgagctt tcaagtggtc tggctactga tgcaaatgtt gaaggcaggg 6300
tccctttgag ttcctgcctt cagaaacagc ctgatcttct aatggattca acagatgata 6360
atcatggcag agtggcagtt caagtagaag aggtaaaact tatgatatca ggtctgttga 6420
atttgggata ctctacactc ttggctgaat caggaagaga agaaacaaaa aaaaccaaga 6480
aaggacaaac agatttggta gactcagaag aagatgttgg gcatgcaaaa actggctgta 6540
aggatagtag taggaccaag agacagaagt tggataagaa cgtgtttcct ttccaagggt 6600
ccccattggt tcaatcagat gaggaagatt tttggtgggt aaggaaagag cagaagcagg 6660
aattgtttac tgttgaaaca atacatcagt caattgaaca aacaagtgga ggtaaggcaa 6720
cagtagtgca aaagacacaa aatatagcac aacttgcagc tgctagaatc gatggtagcc 6780
agggggcatc tactagtcac gtgtgtgata acaatctgag ttgtccccac cataaacctg 6840
gcactaactc tgacattctt aaagacgctg atcatatgag tatgttgact ctggctgaag 6900
ttggcaaatc acttaagaga cttagattgc ttgaaagaag atccatttca atctggctgc 6960
tgaagtccat aaaacaacta attgaaggag atgaagtgaa acattctaag gctaataact 7020
ccataagtgc ctccactgtg cagcatagtg gtaaaattgc atctggatgg aggtttggag 7080
aagatgaact tctgtcagtg ctgtacataa tggatacatg ttgtgattta ctctcctctg 7140
taaggttgct tatatggctt ctatcaaaga tttatattgg aaggaccaca tctggtcaag 7200
ttggaagagg tgttatgcac ccaaaacata aagaaaacca agttttccaa gtagccgaag 7260
cttttctgtt ctcatccttg ctcaggtaag ctgctttttt tttctctatt gttttcttct 7320
gaagtactgt tgactttcgt cctttaaatt cacttataat gtaactaaga aatttctttc 7380
caaatttgtc tttgcatgaa tttgcaaatg gtaaaagagt gcaaaaaaaa aaaagaaacg 7440
cgtgaaaaca ccaattaaac tgttacttgt gttgtctctg tctgtttgtt ggttttgtac 7500
ttttgcatcc atctttgcac aaaatattct gggcagattc tattttttta tggcttctat 7560
ggttctattg gtttctctgt tctgccacta ctatttatga ctaatatagt tcggttgtgt 7620
tctctgtttg gcccttctta gacactgaaa tgccacgtgc acgctttcca aactagcaaa 7680
atacccatgc actgcaatga atttcaaata atatatcaaa ttttttaact tggaaattgt 7740
atctttctcg gaaaaaatat atagaattag caagcgaaca tccaaccaaa aaaggcaagc 7800
cacatgcaca aaagaaatat ttattcatcc ttagggtgtg tctggaagag aagggagaga 7860
aggttgggaa cttctccccc gcgcacgcaa aatggggcgg ctcattagca cataattaat 7920
taagtattag ctataaaatt ttttaacaat ggattaatat gatttttaaa gcaactttcc 7980
tatttagtag tttggaaagc gtgcacgtgg aaaacgaggg agtagaagtt gggaacatgt 8040
agtatagaac acacccttag aagatcccat caactcgagg ggatggcaga ttcaccaata 8100
tactttgtgg tgctttcaag ttgtgtctca agtcatcgta tgtcattggc tgtacagaaa 8160
cacactataa tacatctgta tttgtgttgt gcaatatttt aaggcgtttc tttttcatta 8220
tatacacgta gcatttatat ggtttaatgg tgattgtttg aagagggcaa tgcatctgat 8280
tttcaagcaa tcatgtttgg actgttttgc gtcattgaat gctttgttgg aaaacactct 8340
tggtgcatct acttgtagtt catcacttca tcatgaccta gtgagtccta tcaatgacct 8400
gtgtaaacta caatgccatg catatttttc tttgtgtgaa gtgaaaaatg ggcaaataca 8460
ctgcagtggc aacagctgca gatgtaaact tagtgtttgc tgaagagtat gtgagatctt 8520
gtagtacaaa gtatccaatg gatcaactgt agttggaacc agacatgcat gttcaaattt 8580
tgttataact gtactaatga ttttattgtt tctaaaaaat caatcttgct gttcacatta 8640
ttgttttctt tgtcttttgg atattgcagg tatgagaaca tccttattgc aatggatctt 8700
ttgcccgagg ttttgagtgt ttcaatgaat agaactgttc ataagtcagg tgaaaggcag 8760
tctacttcag tagcttttgc ttatgctcga tatttcttaa ggaaatacag agatgtgact 8820
agtgttgcta ggtgggaaag aaattttagg tccacatctg ataaaaggct gcttgctgaa 8880
ctggatagtg gaaagtcaat cactggtgat tcaattattt ctggaatttc atcaggtgaa 8940
gaacttgatg ggcatgtcca taaaaaattg aatgggaaag caggagtact tccaagtatg 9000
aaggagatag tgcaacggca aactgacgag tttttacgca acctaaggga aaataatgct 9060
acagcaccaa agaacccatc tttttctgaa acggaagata gctatcaaac tgctcatgac 9120
attgttttgg gattggcaga ctgtatcaga caaaatggag gagcaaatcc agatggagat 9180
cattctttag ttgcttctgc tgtttctgca attgttgaca atgctgggca tgcaatagct 9240
aaacacttgg atatttcagg tggtaacaat ccaggtgtta cctcaattaa ttcattaaac 9300
ttgattcaac acattttgga tatccacata aactctctgg ccttgctaag agaaacttta 9360
ggtgatcgat ttagtagaat atttgaaata tctcttgctg ttgaagcttc ttcagctgtt 9420
gcagcatctt ttgctcctcc taaggctcac cgcagtcaac agtcttctga gacccatgat 9480
gaaagtggaa atcatgcaaa tgaagttcca agtaatccgt caaaatgttt taatgttaag 9540
gctgtaaaag tttctgctgc tgtttctgca ctagttgttg gagctattat ttatggggtt 9600
gtcagtctag agcggatgat ggtggtccta agattaaaag aaggtttgga cattctgcag 9660
ttcttaagaa tttccaaagc tagcacaaat ggtgtgaccc actccattgg aaatttcaaa 9720
attgacagtt ccactgaagt tttggtacat tggtttaaga ttctaatagg gaactgtaag 9780
acagtttata atggagtgat cgcagagatt ctaggtgatt cttatgtcct tgccttttca 9840
aggttgcaac ggacgcttcc attgggtata gttcttcctc cagcttattc aatatttgct 9900
atggtccttt ggcgaccata tttatatgac accagtacat cgaatcatga agacattcag 9960
ctttatcagt ctctactggg tgcaattagt gatatcacaa gacatcagcc ttttcgagat 10020
gtctgcttcc gtaacatgca tcttttctat gatcttctgg ctgcggatgt tggtgattca 10080
gagtttgctg caatcgttga acttcgaagc cctgatgaat gtttgaaagc tctttcacct 10140
cttcgtgccc gggttttcct gaatgctctt cttgattgtg aaataccagt aacaatgaga 10200
gacgatggta catatgcttt agagcctggt tgtgcagaag ctagtaccaa gaatgatgta 10260
aagtttccag agaggcttat agaaattctg aatgtcctac agcctgcaaa gttccattgg 10320
caatgggttg agttgaggct gcttttggat gagcaatctc ttattgagaa accaaagaat 10380
gtgccatatg taaaagcact tcgatcccta tcccctaatg ctgagaattt taccctctct 10440
gaaagggaaa aggggcttac tgaagttatt ttgtctaggc tacttgtcag acctgatgct 10500
gctcctctat actcagaact tattcacctt cttggaaagc tacaagagtc attcgtgatg 10560
ggtatcaaat ggttcttaca agggcaagat gttcttttgg gaaacaactc tgtaagacaa 10620
cagcttgtta acttgactca gcgcaaagga tttccaatga agacacagtt ttggaagcca 10680
tggggatggt caaaattagt cggatatgct aatgctaata aaagctccaa aaggaagtta 10740
gaagttactt caattgagga aagagaagtt gatggcttga ttgattctag aaaatccagt 10800
aataggaagt cgctaaatgt gggtacaagc ccagaagggc atggatctac ccaaaaatat 10860
tttactcagg aagcccttgc tgagttagtt ttgccatgca tagacagaag ttctagcgag 10920
tttcgctttg tatttgctgg tgatttgatc aaacatatgg gtgtgatcag tgagcatatt 10980
aaagcagcag tgtggaacgg tattaataaa ctgaatagtt caaatccttc aggaaatgaa 11040
ggtttgagta aacccaatgg ccgcaaagga atcttcagtg gtagtccgaa tatcaggaag 11100
catagccctg tacctaatga ttcaactact ccttccgcat cagctttacg atcatcaata 11160
tggttgcgcc tgcaattcat cattaggcta cttccagtaa ttattgcaga caggtaatat 11220
ttaatgattt tgtggcacat tctagcatta catgatttgt cctaaaaatt agaaaaccgg 11280
tctgggacga acagtcagcg atttagtttt ttttttttct gtttgctggg acttcaatct 11340
gaacaccttt atgaaaatag agggctactt ttcaattatc agtagatatc agcgagtggc 11400
atctggaatt caactaacag aacttaataa atatttaagc aggatggtta gtacttgggt 11460
agtgggttgt tgcaaatcaa gccttcagtg gttatgacaa tcatgtcatc gactttagat 11520
agagaattga atcacttgca ttacgagctt gactggatta gttagctgag tgggttctgg 11580
ctcctctaga ttgccatgaa tagctggaga aatgtgataa atatgagttt aagcatgctt 11640
aaataagtta tcttaatctt tccttgcgat acttttgctt taattgttag ttgtgtgaca 11700
tcttaagttc acagagttgc actttacgtc cttgaaatat ttatgctata ttctaacttt 11760
ttggctttgg atattttgta gtaacatgag gcaaacgcta gcttcctcct tattaagctt 11820
ggttggaaca cgtgtggtct atgaagatgc agattcactt gaaccttaca tggatgatgt 11880
cctgcttgat tgtccaagtg aaagcctatt cgataggctt ttatgtgtcc tgcaagcttt 11940
gcttggcaat agccaaccaa gttggctgaa gactaagcca agctccaagc cagctgttaa 12000
atttttgcgt gatctttctg caattgataa agaggtcact aagagcttgc aggtctgttt 12060
agtttttgca tattattgct ctcttttgct ttctgcaatt attcaagcct gtgacttctc 12120
tttacttggt ctgatggctt ctttgcatta tctgctctat tgcagtgtgc attagatcgc 12180
atggagttgc cagcaacaat caggcggcgg attcaagtgg ctatgccgat tctacctact 12240
tcccgcctct cctccataac atgtggtcct cctctactgt cctctgctgc actatcacca 12300
ttccagtgca gtacatctgc tgcagggcct caccaacaat ttcccctcaa ttggattcct 12360
accaatctct caagaagatg caaggcagcg ttgccttcac aggatcctaa catggaaata 12420
gatccttgga ctttgctgga agacggtaca agctgtccaa ataccaacag tggcagcaat 12480
tctgcaaatg gtgttaccgg tgaccatgcc aatctgaaag cttgcagctt tctcaaggat 12540
tctgtaaggg tgaggaggac tgacctgact tacattggct ctctggatga agacagctaa 12600
ccggcgcaat tatcacctcc ccctcataat tttgttgcaa acccgtaggt tgtaaataca 12660
tatgtgcaat gcatcgagca ttcttctgta ctttaaaaac atggtgtgga agagtgctat 12720
agcattttcc aatcaagatg gactcagttt aaccctggag tggatagttc ctagatgtaa 12780
tttattgaaa ctatctcctt tgttcttaag ggttgcgctt agtaggctgc attgcaaggt 12840
agctcaaatt tagctttatg acatagataa ttatatagtt agtcggagtt ctccttgggg 12900
gtgtttgtat actagtaaga tttgggtctc ccataatcca ttggtaatat gaatcagggt 12960
ggcctccttt tgccatgtat tcatggatct tactcttttt 13000
<210> 8
<211> 6561
<212> DNA
<213> Oryzae sativa
<400> 8
atgaaactag ctcatcgaat tgtattttca ccagttcaga gttgcttact tgcttcgatt 60
atcttgtgtc caacttggat gagtcactgt ctgctgatca ggcggcaacc actggtagct 120
ccttacaagc tgaagtgtga caaggaatca ctcaatgcca ggcttggtgc acctgacttc 180
tatccccaga cattgagttg tgcagaagag accttaacca aagaatatgt gcaatctggg 240
tacaaggata ccgttgaagg aattgaggaa gccagagaga ttgtactcag tcagattcca 300
tacttgagca aaccagatat tgctacaaaa tgcaaggagg cactaaagaa gcggttcaga 360
gcgatcaatg aatctcgtgc tcagaagagg aaggctggcc aagtttatgg ggtccctctt 420
tctggctcgt tgctgacaaa acctgggatg tatccagagc aaatgcatag caatgaagac 480
acacgcagaa aatggatcga ggcccttgtg caaccaaaca ggcgtctatg gtcattagca 540
gagcaagttc ctcgtggttt tcggaggaag ttactcttta attatcttat ccgatataat 600
gtcccactgt taagagcatc atggcttgtg aaggttactt accttaatca ggttcaaaca 660
tcatccaata atgtttcatc tgctgctcct gatagtttgc gatctcagca ctggacaaag 720
gatgttattg aatacttgca gctgcttttg gacgaattgt gttctaaaaa tggctttttt 780
ggacttccat cttctcaaga acagtcattg ccatgccttg ttgctggaga cagcccaatt 840
aagttaaaaa ccggggcatc acctgctagt gcagatgttg aggagccttc gctacacttt 900
aaatggtcgt atatgattcg tattgttcaa tgtcatctca tggaacaatt acttgttccg 960
tcgttactta tcgaatgggt atttaatcag ctccaggaga gagactcaac tgaggtttta 1020
gaattactct tgcctattgt actttctttg gttgatacca taaccctctc acagacatat 1080
atccacatgc tggtggaaat actgattcaa cgtctcagtg atgcttctcc tggcagctta 1140
agtgttaaga ataacccaaa aaggtcatcc attacctctg ctttagttga gttactgcag 1200
tacttgatac ttgctgttcc cgatacattt gtttctttgg attgctttcc acttccatca 1260
gttgtggctc ctgatgtata cggtaaaggt gctcttctga aaatagcagg tggtggtaaa 1320
attgctagct ctaggagaca gaatgcatct cgacacctct cttgtggtta tgccatttgt 1380
tcagttcaaa gacgtgcatc tgatctttct ttagttgcta atcctaatct tcaagttcgt 1440
ggggcagcca acgtagtgca agctttggac aaagcacttg taactggaaa cttgacagca 1500
gcatatacat cagtattcaa ttatctatca gataccctga tggaagaaac atggattaaa 1560
gaagtcagcc cttgcttgcg atcttctctg atgtggatgg gagctgttga gttatccctt 1620
gtctgctctg tgtttttcat ttgtgagtgg gcaacatgta ctttccgtga ttgccgtaca 1680
tcacaatgcc aaaatgtaaa attttcagga agcaaagatt tctctcaggt ctatatggca 1740
gtttccctgt tgaaggataa aatgaatgag ataaataatt tatcttcttc caagagcagc 1800
agtcagcttg caatgaagga tcaccttaaa agtgctactc tgaatcattc ttctatcaag 1860
gtgacagcaa tggagactgc ttctggattt agagacagta caggtagcat tgatgagaat 1920
aacaaaaagg atatcttcag cagcccaggt ccactgcatg acattattgt atgctggttg 1980
gatcaacatg agattagtga tgcttcggga tttaaaagtg tggatgtttt catgactgaa 2040
cttattcgca gtggtatatt ttatcctcag acatatgtga gacaactaat tgttagtgga 2100
atcaccattt ggaatgatag cttgtttgat ctggaaaaga aaacgaggca ttacaaaatt 2160
ctgaagcacc tgccagggtt ttgcttattt aatatccttg aggaagctaa gattgctgaa 2220
gatcaagtcc tttatgaaat tgtgtcaaca tattctagtg agcgtcgact tgtgctttct 2280
gagctttcaa gtggtctggc tactgatgca aatgttgaag gcagggtccc tttgagttcc 2340
tgccttcaga aacagcctga tcttctaatg gattcaacag atgataatca tggcagagtg 2400
gcagttcaag tagaagaggt aaaacttatg atatcaggtc tgttgaattt gggatactct 2460
acactcttgg ctgaatcagg aagagaagaa acaaaaaaaa ccaagaaagg acaaacagat 2520
ttggtagact cagaagaaga tgttgggcat gcaaaaactg gctgtaagga tagtagtagg 2580
accaagagac agaagttgga taagaacgtg tttcctttcc aagggtcccc attggttcaa 2640
tcagatgagg aagatttttg gtgggtaagg aaagagcaga agcaggaatt gtttactgtt 2700
gaaacaatac atcagtcaat tgaacaaaca agtggaggta aggcaacagt agtgcaaaag 2760
acacaaaata tagcacaact tgcagctgct agaatcgatg gtagccaggg ggcatctact 2820
agtcacgtgt gtgataacaa tctgagttgt ccccaccata aacctggcac taactctgac 2880
attcttaaag acgctgatca tatgagtatg ttgactctgg ctgaagttgg caaatcactt 2940
aagagactta gattgcttga aagaagatcc atttcaatct ggctgctgaa gtccataaaa 3000
caactaattg aaggagatga agtgaaacat tctaaggcta ataactccat aagtgcctcc 3060
actgtgcagc atagtggtaa aattgcatct ggatggaggt ttggagaaga tgaacttctg 3120
tcagtgctgt acataatgga tacatgttgt gatttactct cctctgtaag gttgcttata 3180
tggcttctat caaagattta tattggaagg accacatctg gtcaagttgg aagaggtgtt 3240
atgcacccaa aacataaaga aaaccaagtt ttccaagtag ccgaagcttt tctgttctca 3300
tccttgctca ggtatgagaa catccttatt gcaatggatc ttttgcccga ggttttgagt 3360
gtttcaatga atagaactgt tcataagtca ggtgaaaggc agtctacttc agtagctttt 3420
gcttatgctc gatatttctt aaggaaatac agagatgtga ctagtgttgc taggtgggaa 3480
agaaatttta ggtccacatc tgataaaagg ctgcttgctg aactggatag tggaaagtca 3540
atcactggtg attcaattat ttctggaatt tcatcaggtg aagaacttga tgggcatgtc 3600
cataaaaaat tgaatgggaa agcaggagta cttccaagta tgaaggagat agtgcaacgg 3660
caaactgacg agtttttacg caacctaagg gaaaataatg ctacagcacc aaagaaccca 3720
tctttttctg aaacggaaga tagctatcaa actgctcatg acattgtttt gggattggca 3780
gactgtatca gacaaaatgg aggagcaaat ccagatggag atcattcttt agttgcttct 3840
gctgtttctg caattgttga caatgctggg catgcaatag ctaaacactt ggatatttca 3900
ggtggtaaca atccaggtgt tacctcaatt aattcattaa acttgattca acacattttg 3960
gatatccaca taaactctct ggccttgcta agagaaactt taggtgatcg atttagtaga 4020
atatttgaaa tatctcttgc tgttgaagct tcttcagctg ttgcagcatc ttttgctcct 4080
cctaaggctc accgcagtca acagtcttct gagacccatg atgaaagtgg aaatcatgca 4140
aatgaagttc caagtaatcc gtcaaaatgt tttaatgtta aggctgtaaa agtttctgct 4200
gctgtttctg cactagttgt tggagctatt atttatgggg ttgtcagtct agagcggatg 4260
atggtggtcc taagattaaa agaaggtttg gacattctgc agttcttaag aatttccaaa 4320
gctagcacaa atggtgtgac ccactccatt ggaaatttca aaattgacag ttccactgaa 4380
gttttggtac attggtttaa gattctaata gggaactgta agacagttta taatggagtg 4440
atcgcagaga ttctaggtga ttcttatgtc cttgcctttt caaggttgca acggacgctt 4500
ccattgggta tagttcttcc tccagcttat tcaatatttg ctatggtcct ttggcgacca 4560
tatttatatg acaccagtac atcgaatcat gaagacattc agctttatca gtctctactg 4620
ggtgcaatta gtgatatcac aagacatcag ccttttcgag atgtctgctt ccgtaacatg 4680
catcttttct atgatcttct ggctgcggat gttggtgatt cagagtttgc tgcaatcgtt 4740
gaacttcgaa gccctgatga atgtttgaaa gctctttcac ctcttcgtgc ccgggttttc 4800
ctgaatgctc ttcttgattg tgaaatacca gtaacaatga gagacgatgg tacatatgct 4860
ttagagcctg gttgtgcaga agctagtacc aagaatgatg taaagtttcc agagaggctt 4920
atagaaattc tgaatgtcct acagcctgca aagttccatt ggcaatgggt tgagttgagg 4980
ctgcttttgg atgagcaatc tcttattgag aaaccaaaga atgtgccata tgtaaaagca 5040
cttcgatccc tatcccctaa tgctgagaat tttaccctct ctgaaaggga aaaggggctt 5100
actgaagtta ttttgtctag gctacttgtc agacctgatg ctgctcctct atactcagaa 5160
cttattcacc ttcttggaaa gctacaagag tcattcgtga tgggtatcaa atggttctta 5220
caagggcaag atgttctttt gggaaacaac tctgtaagac aacagcttgt taacttgact 5280
cagcgcaaag gatttccaat gaagacacag ttttggaagc catggggatg gtcaaaatta 5340
gtcggatatg ctaatgctaa taaaagctcc aaaaggaagt tagaagttac ttcaattgag 5400
gaaagagaag ttgatggctt gattgattct agaaaatcca gtaataggaa gtcgctaaat 5460
gtgggtacaa gcccagaagg gcatggatct acccaaaaat attttactca ggaagccctt 5520
gctgagttag ttttgccatg catagacaga agttctagcg agtttcgctt tgtatttgct 5580
ggtgatttga tcaaacatat gggtgtgatc agtgagcata ttaaagcagc agtgtggaac 5640
ggtattaata aactgaatag ttcaaatcct tcaggaaatg aaggtttgag taaacccaat 5700
ggccgcaaag gaatcttcag tggtagtccg aatatcagga agcatagccc tgtacctaat 5760
gattcaacta ctccttccgc atcagcttta cgatcatcaa tatggttgcg cctgcaattc 5820
atcattaggc tacttccagt aattattgca gacagtaaca tgaggcaaac gctagcttcc 5880
tccttattaa gcttggttgg aacacgtgtg gtctatgaag atgcagattc acttgaacct 5940
tacatggatg atgtcctgct tgattgtcca agtgaaagcc tattcgatag gcttttatgt 6000
gtcctgcaag ctttgcttgg caatagccaa ccaagttggc tgaagactaa gccaagctcc 6060
aagccagctg ttaaattttt gcgtgatctt tctgcaattg ataaagaggt cactaagagc 6120
ttgcagtgtg cattagatcg catggagttg ccagcaacaa tcaggcggcg gattcaagtg 6180
gctatgccga ttctacctac ttcccgcctc tcctccataa catgtggtcc tcctctactg 6240
tcctctgctg cactatcacc attccagtgc agtacatctg ctgcagggcc tcaccaacaa 6300
tttcccctca attggattcc taccaatctc tcaagaagat gcaaggcagc gttgccttca 6360
caggatccta acatggaaat agatccttgg actttgctgg aagacggtac aagctgtcca 6420
aataccaaca gtggcagcaa ttctgcaaat ggtgttaccg gtgaccatgc caatctgaaa 6480
gcttgcagct ttctcaagga ttctgtaagg gtgaggagga ctgacctgac ttacattggc 6540
tctctggatg aagacagcta a 6561
<210> 9
<211> 2186
<212> PRT
<213> Oryzae sativa
<400> 9
Met Lys Leu Ala His Arg Ile Val Phe Ser Pro Val Gln Ser Cys Leu
1 5 10 15
Leu Ala Ser Ile Ile Leu Cys Pro Thr Trp Met Ser His Cys Leu Leu
20 25 30
Ile Arg Arg Gln Pro Leu Val Ala Pro Tyr Lys Leu Lys Cys Asp Lys
35 40 45
Glu Ser Leu Asn Ala Arg Leu Gly Ala Pro Asp Phe Tyr Pro Gln Thr
50 55 60
Leu Ser Cys Ala Glu Glu Thr Leu Thr Lys Glu Tyr Val Gln Ser Gly
65 70 75 80
Tyr Lys Asp Thr Val Glu Gly Ile Glu Glu Ala Arg Glu Ile Val Leu
85 90 95
Ser Gln Ile Pro Tyr Leu Ser Lys Pro Asp Ile Ala Thr Lys Cys Lys
100 105 110
Glu Ala Leu Lys Lys Arg Phe Arg Ala Ile Asn Glu Ser Arg Ala Gln
115 120 125
Lys Arg Lys Ala Gly Gln Val Tyr Gly Val Pro Leu Ser Gly Ser Leu
130 135 140
Leu Thr Lys Pro Gly Met Tyr Pro Glu Gln Met His Ser Asn Glu Asp
145 150 155 160
Thr Arg Arg Lys Trp Ile Glu Ala Leu Val Gln Pro Asn Arg Arg Leu
165 170 175
Trp Ser Leu Ala Glu Gln Val Pro Arg Gly Phe Arg Arg Lys Leu Leu
180 185 190
Phe Asn Tyr Leu Ile Arg Tyr Asn Val Pro Leu Leu Arg Ala Ser Trp
195 200 205
Leu Val Lys Val Thr Tyr Leu Asn Gln Val Gln Thr Ser Ser Asn Asn
210 215 220
Val Ser Ser Ala Ala Pro Asp Ser Leu Arg Ser Gln His Trp Thr Lys
225 230 235 240
Asp Val Ile Glu Tyr Leu Gln Leu Leu Leu Asp Glu Leu Cys Ser Lys
245 250 255
Asn Gly Phe Phe Gly Leu Pro Ser Ser Gln Glu Gln Ser Leu Pro Cys
260 265 270
Leu Val Ala Gly Asp Ser Pro Ile Lys Leu Lys Thr Gly Ala Ser Pro
275 280 285
Ala Ser Ala Asp Val Glu Glu Pro Ser Leu His Phe Lys Trp Ser Tyr
290 295 300
Met Ile Arg Ile Val Gln Cys His Leu Met Glu Gln Leu Leu Val Pro
305 310 315 320
Ser Leu Leu Ile Glu Trp Val Phe Asn Gln Leu Gln Glu Arg Asp Ser
325 330 335
Thr Glu Val Leu Glu Leu Leu Leu Pro Ile Val Leu Ser Leu Val Asp
340 345 350
Thr Ile Thr Leu Ser Gln Thr Tyr Ile His Met Leu Val Glu Ile Leu
355 360 365
Ile Gln Arg Leu Ser Asp Ala Ser Pro Gly Ser Leu Ser Val Lys Asn
370 375 380
Asn Pro Lys Arg Ser Ser Ile Thr Ser Ala Leu Val Glu Leu Leu Gln
385 390 395 400
Tyr Leu Ile Leu Ala Val Pro Asp Thr Phe Val Ser Leu Asp Cys Phe
405 410 415
Pro Leu Pro Ser Val Val Ala Pro Asp Val Tyr Gly Lys Gly Ala Leu
420 425 430
Leu Lys Ile Ala Gly Gly Gly Lys Ile Ala Ser Ser Arg Arg Gln Asn
435 440 445
Ala Ser Arg His Leu Ser Cys Gly Tyr Ala Ile Cys Ser Val Gln Arg
450 455 460
Arg Ala Ser Asp Leu Ser Leu Val Ala Asn Pro Asn Leu Gln Val Arg
465 470 475 480
Gly Ala Ala Asn Val Val Gln Ala Leu Asp Lys Ala Leu Val Thr Gly
485 490 495
Asn Leu Thr Ala Ala Tyr Thr Ser Val Phe Asn Tyr Leu Ser Asp Thr
500 505 510
Leu Met Glu Glu Thr Trp Ile Lys Glu Val Ser Pro Cys Leu Arg Ser
515 520 525
Ser Leu Met Trp Met Gly Ala Val Glu Leu Ser Leu Val Cys Ser Val
530 535 540
Phe Phe Ile Cys Glu Trp Ala Thr Cys Thr Phe Arg Asp Cys Arg Thr
545 550 555 560
Ser Gln Cys Gln Asn Val Lys Phe Ser Gly Ser Lys Asp Phe Ser Gln
565 570 575
Val Tyr Met Ala Val Ser Leu Leu Lys Asp Lys Met Asn Glu Ile Asn
580 585 590
Asn Leu Ser Ser Ser Lys Ser Ser Ser Gln Leu Ala Met Lys Asp His
595 600 605
Leu Lys Ser Ala Thr Leu Asn His Ser Ser Ile Lys Val Thr Ala Met
610 615 620
Glu Thr Ala Ser Gly Phe Arg Asp Ser Thr Gly Ser Ile Asp Glu Asn
625 630 635 640
Asn Lys Lys Asp Ile Phe Ser Ser Pro Gly Pro Leu His Asp Ile Ile
645 650 655
Val Cys Trp Leu Asp Gln His Glu Ile Ser Asp Ala Ser Gly Phe Lys
660 665 670
Ser Val Asp Val Phe Met Thr Glu Leu Ile Arg Ser Gly Ile Phe Tyr
675 680 685
Pro Gln Thr Tyr Val Arg Gln Leu Ile Val Ser Gly Ile Thr Ile Trp
690 695 700
Asn Asp Ser Leu Phe Asp Leu Glu Lys Lys Thr Arg His Tyr Lys Ile
705 710 715 720
Leu Lys His Leu Pro Gly Phe Cys Leu Phe Asn Ile Leu Glu Glu Ala
725 730 735
Lys Ile Ala Glu Asp Gln Val Leu Tyr Glu Ile Val Ser Thr Tyr Ser
740 745 750
Ser Glu Arg Arg Leu Val Leu Ser Glu Leu Ser Ser Gly Leu Ala Thr
755 760 765
Asp Ala Asn Val Glu Gly Arg Val Pro Leu Ser Ser Cys Leu Gln Lys
770 775 780
Gln Pro Asp Leu Leu Met Asp Ser Thr Asp Asp Asn His Gly Arg Val
785 790 795 800
Ala Val Gln Val Glu Glu Val Lys Leu Met Ile Ser Gly Leu Leu Asn
805 810 815
Leu Gly Tyr Ser Thr Leu Leu Ala Glu Ser Gly Arg Glu Glu Thr Lys
820 825 830
Lys Thr Lys Lys Gly Gln Thr Asp Leu Val Asp Ser Glu Glu Asp Val
835 840 845
Gly His Ala Lys Thr Gly Cys Lys Asp Ser Ser Arg Thr Lys Arg Gln
850 855 860
Lys Leu Asp Lys Asn Val Phe Pro Phe Gln Gly Ser Pro Leu Val Gln
865 870 875 880
Ser Asp Glu Glu Asp Phe Trp Trp Val Arg Lys Glu Gln Lys Gln Glu
885 890 895
Leu Phe Thr Val Glu Thr Ile His Gln Ser Ile Glu Gln Thr Ser Gly
900 905 910
Gly Lys Ala Thr Val Val Gln Lys Thr Gln Asn Ile Ala Gln Leu Ala
915 920 925
Ala Ala Arg Ile Asp Gly Ser Gln Gly Ala Ser Thr Ser His Val Cys
930 935 940
Asp Asn Asn Leu Ser Cys Pro His His Lys Pro Gly Thr Asn Ser Asp
945 950 955 960
Ile Leu Lys Asp Ala Asp His Met Ser Met Leu Thr Leu Ala Glu Val
965 970 975
Gly Lys Ser Leu Lys Arg Leu Arg Leu Leu Glu Arg Arg Ser Ile Ser
980 985 990
Ile Trp Leu Leu Lys Ser Ile Lys Gln Leu Ile Glu Gly Asp Glu Val
995 1000 1005
Lys His Ser Lys Ala Asn Asn Ser Ile Ser Ala Ser Thr Val Gln His
1010 1015 1020
Ser Gly Lys Ile Ala Ser Gly Trp Arg Phe Gly Glu Asp Glu Leu Leu
1025 1030 1035 1040
Ser Val Leu Tyr Ile Met Asp Thr Cys Cys Asp Leu Leu Ser Ser Val
1045 1050 1055
Arg Leu Leu Ile Trp Leu Leu Ser Lys Ile Tyr Ile Gly Arg Thr Thr
1060 1065 1070
Ser Gly Gln Val Gly Arg Gly Val Met
His Pro Lys His Lys Glu Asn
Gln Val Phe Gln Val Ala Glu Ala Phe Leu Phe Ser Ser Leu Leu Arg
1090 1095 1100
Tyr Glu Asn Ile Leu Ile Ala Met Asp Leu Leu Pro Glu Val Leu Ser
1105 1110 1115 1120
Val Ser Met Asn Arg Thr Val His Lys Ser Gly Glu Arg Gln Ser Thr
1125 1130 1135
Ser Val Ala Phe Ala Tyr Ala Arg Tyr Phe Leu Arg Lys Tyr Arg Asp
1140 1145 1150
Val Thr Ser Val Ala Arg Trp Glu Arg Asn Phe Arg Ser Thr Ser Asp
1155 1160 1165
Lys Arg Leu Leu Ala Glu Leu Asp Ser Gly Lys Ser Ile Thr Gly Asp
1170 1175 1180
Ser Ile Ile Ser Gly Ile Ser Ser Gly Glu Glu Leu Asp Gly His Val
1185 1190 1195 1200
His Lys Lys Leu Asn Gly Lys Ala Gly Val Leu Pro Ser Met Lys Glu
1205 1210 1215
Ile Val Gln Arg Gln Thr Asp Glu Phe Leu Arg Asn Leu Arg Glu Asn
1220 1225 1230
Asn Ala Thr Ala Pro Lys Asn Pro Ser Phe Ser Glu Thr Glu Asp Ser
1235 1240 1245
Tyr Gln Thr Ala His Asp Ile Val Leu Gly Leu Ala Asp Cys Ile Arg
1250 1255 1260
Gln Asn Gly Gly Ala Asn Pro Asp Gly Asp His Ser Leu Val Ala Ser
1265 1270 1275 1280
Ala Val Ser Ala Ile Val Asp Asn Ala Gly His Ala Ile Ala Lys His
1285 1290 1295
Leu Asp Ile Ser Gly Gly Asn Asn Pro Gly Val Thr Ser Ile Asn Ser
1300 1305 1310
Leu Asn Leu Ile Gln His Ile Leu Asp Ile His Ile Asn Ser Leu Ala
1315 1320 1325
Leu Leu Arg Glu Thr Leu Gly Asp Arg Phe Ser Arg Ile Phe Glu Ile
1330 1335 1340
Ser Leu Ala Val Glu Ala Ser Ser Ala Val Ala Ala Ser Phe Ala Pro
1345 1350 1355 1360
Pro Lys Ala His Arg Ser Gln Gln Ser Ser Glu Thr His Asp Glu Ser
1365 1370 1375
Gly Asn His Ala Asn Glu Val Pro Ser Asn Pro Ser Lys Cys Phe Asn
1380 1385 1390
Val Lys Ala Val Lys Val Ser Ala Ala Val Ser Ala Leu Val Val Gly
1395 1400 1405
Ala Ile Ile Tyr Gly Val Val Ser Leu Glu Arg Met Met Val Val Leu
1410 1415 1420
Arg Leu Lys Glu Gly Leu Asp Ile Leu Gln Phe Leu Arg Ile Ser Lys
1425 1430 1435 1440
Ala Ser Thr Asn Gly Val Thr His Ser Ile Gly Asn Phe Lys Ile Asp
1445 1450 1455
Ser Ser Thr Glu Val Leu Val His Trp Phe Lys Ile Leu Ile Gly Asn
1460 1465 1470
Cys Lys Thr Val Tyr Asn Gly Val Ile Ala Glu Ile Leu Gly Asp Ser
1475 1480 1485
Tyr Val Leu Ala Phe Ser Arg Leu Gln Arg Thr Leu Pro Leu Gly Ile
1490 1495 1500
Val Leu Pro Pro Ala Tyr Ser Ile Phe Ala Met Val Leu Trp Arg Pro
1505 1510 1515 1520
Tyr Leu Tyr Asp Thr Ser Thr Ser Asn His Glu Asp Ile Gln Leu Tyr
1525 1530 1535
Gln Ser Leu Leu Gly Ala Ile Ser Asp Ile Thr Arg His Gln Pro Phe
1540 1545 1550
Arg Asp Val Cys Phe Arg Asn Met His Leu Phe Tyr Asp Leu Leu Ala
1555 1560 1565
Ala Asp Val Gly Asp Ser Glu Phe Ala Ala Ile Val Glu Leu Arg Ser
1570 1575 1580
Pro Asp Glu Cys Leu Lys Ala Leu Ser Pro Leu Arg Ala Arg Val Phe
1585 1590 1595 1600
Leu Asn Ala Leu Leu Asp Cys Glu Ile Pro Val Thr Met Arg Asp Asp
1605 1610 1615
Gly Thr Tyr Ala Leu Glu Pro Gly Cys Ala Glu Ala Ser Thr Lys Asn
1620 1625 1630
Asp Val Lys Phe Pro Glu Arg Leu Ile Glu Ile Leu Asn Val Leu Gln
1635 1640 1645
Pro Ala Lys Phe His Trp Gln Trp Val Glu Leu Arg Leu Leu Leu Asp
1650 1655 1660
Glu Gln Ser Leu Ile Glu Lys Pro Lys Asn Val Pro Tyr Val Lys Ala
1665 1670 1675 1680
Leu Arg Ser Leu Ser Pro Asn Ala Glu Asn Phe Thr Leu Ser Glu Arg
1685 1690 1695
Glu Lys Gly Leu Thr Glu Val Ile Leu Ser Arg Leu Leu Val Arg Pro
1700 1705 1710
Asp Ala Ala Pro Leu Tyr Ser Glu Leu Ile His Leu Leu Gly Lys Leu
1715 1720 1725
Gln Glu Ser Phe Val Met Gly Ile Lys Trp Phe Leu Gln Gly Gln Asp
1730 1735 1740
Val Leu Leu Gly Asn Asn Ser Val Arg Gln Gln Leu Val Asn Leu Thr
1745 1750 1755 1760
Gln Arg Lys Gly Phe Pro Met Lys Thr Gln Phe Trp Lys Pro Trp Gly
1765 1770 1775
Trp Ser Lys Leu Val Gly Tyr Ala Asn Ala Asn Lys Ser Ser Lys Arg
1780 1785 1790
Lys Leu Glu Val Thr Ser Ile Glu Glu Arg Glu Val Asp Gly Leu Ile
1795 1800 1805
Asp Ser Arg Lys Ser Ser Asn Arg Lys Ser Leu Asn Val Gly Thr Ser
1810 1815 1820
Pro Glu Gly His Gly Ser Thr Gln Lys Tyr Phe Thr Gln Glu Ala Leu
1825 1830 1835 1840
Ala Glu Leu Val Leu Pro Cys Ile Asp Arg Ser Ser Ser Glu Phe Arg
1845 1850 1855
Phe Val Phe Ala Gly Asp Leu Ile Lys His Met Gly Val Ile Ser Glu
1860 1865 1870
His Ile Lys Ala Ala Val Trp Asn Gly Ile Asn Lys Leu Asn Ser Ser
1875 1880 1885
Asn Pro Ser Gly Asn Glu Gly Leu Ser Lys Pro Asn Gly Arg Lys Gly
1890 1895 1900
Ile Phe Ser Gly Ser Pro Asn Ile Arg Lys His Ser Pro Val Pro Asn
1905 1910 1915 1920
Asp Ser Thr Thr Pro Ser Ala Ser Ala Leu Arg Ser Ser Ile Trp Leu
1925 1930 1935
Arg Leu Gln Phe Ile Ile Arg Leu Leu Pro Val Ile Ile Ala Asp Ser
1940 1945 1950
Asn Met Arg Gln Thr Leu Ala Ser Ser Leu Leu Ser Leu Val Gly Thr
1955 1960 1965
Arg Val Val Tyr Glu Asp Ala Asp Ser Leu Glu Pro Tyr Met Asp Asp
1970 1975 1980
Val Leu Leu Asp Cys Pro Ser Glu Ser
Leu Phe Asp Arg Leu Leu Cys
1985 1990
1995 2000
Val Leu Gln Ala Leu Leu Gly Asn Ser
Gln Pro Ser Trp Leu Lys Thr
Lys Pro Ser Ser Lys Pro Ala Val Lys Phe Leu Arg Asp Leu Ser Ala
2020 2025 2030
Ile Asp Lys Glu Val Thr Lys Ser Leu Gln Cys Ala Leu Asp Arg Met
2035 2040 2045
Glu Leu Pro Ala Thr Ile Arg Arg Arg Ile Gln Val Ala Met Pro Ile
2050 2055 2060
Leu Pro Thr Ser Arg Leu Ser Ser Ile Thr Cys Gly Pro Pro Leu Leu
2065 2070 2075 2080
Ser Ser Ala Ala Leu Ser Pro Phe Gln Cys Ser Thr Ser Ala Ala Gly
2085 2090 2095
Pro His Gln Gln Phe Pro Leu Asn Trp Ile Pro Thr Asn Leu Ser Arg
2100 2105 2110
Arg Cys Lys Ala Ala Leu Pro Ser Gln Asp Pro Asn Met Glu Ile Asp
2115 2120 2125
Pro Trp Thr Leu Leu Glu Asp Gly Thr Ser Cys Pro Asn Thr Asn Ser
2130 2135 2140
Gly Ser Asn Ser Ala Asn Gly Val Thr Gly Asp His Ala Asn Leu Lys
2145 2150 2155 2160
Ala Cys Ser Phe Leu Lys Asp Ser Val Arg Val Arg Arg Thr Asp Leu
2165 2170 2175
Thr Tyr Ile Gly Ser Leu Asp Glu Asp Ser
2180 2185
<210> 10
<211> 285
<212> DNA
<213> Nicotiana tabacum
atgcaaaggt atcatggtgg cagctgcact agtgcagtta ataacagcac tattgggggt 60
tcgtcagcca gggattcatc tcgggtggag tcagcctccc ttccgcctaa tttctccagg 120
cgtcccttac aactgacccc gtacaaattg aagtgcgata aggaacatct taattccaga 180
cttgggccac ctgattttct ccctcagact cctaattgcc ccgaggagac attgaccaaa 240
gaatatgtcc aatctggtta ccgggagact gttgaaggtc ttgag 285
<210> 11
<211> 96
<212> PRT
<213> Nicotiana tabacum
<400> 11
Met Gln Arg Tyr His Gly Gly Ser Cys Thr Ser Ala Val Asn Asn Ser
1 5 10 15
Thr Ile Gly Gly Ser Ser Ala Arg Asp Ser Ser Arg Val Glu Ser Ala
20 25 30
Ser Leu Pro Pro Asn Phe Ser Arg Arg Arg Pro Pro Pro Leu Thr Pro
35 40 45
Tyr Lys Leu Lys Cys Glu Lys Asp Gly Leu Asn Ser Arg Leu Gly Pro
50 55 60
Pro Asp Phe His Pro Pro Thr Ser Asn Ser Pro Glu Glu Asn Leu Thr
65 70 75 80
Lys Glu Tyr Val Gln Phe Gly Tyr Lys Glu Thr Val Asp Gly Leu Lys
85 90 95
【図面の簡単な説明】
【図1】本発明にかかるCRP遺伝子のエクソンおよび
イントロンの概略構造を示す遺伝子構造図である。
【図2】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す配列図である。
【図3】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図2の続きとなる配列図である。
【図4】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図3の続きとなる配列図である。
【図5】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図4の続きとなる配列図である。
【図6】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図5の続きとなる配列図である。
【図7】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図6の続きとなる配列図である。
【図8】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図7の続きとなる配列図である。
【図9】配列番号1に対応するゲノムCRP遺伝子の塩
基配列を示す、図8の続きとなる配列図である。
【図10】配列番号1に対応するゲノムCRP遺伝子の
塩基配列を示す、図9の続きとなる配列図である。
【図11】配列番号2に対応するゲノムCRP遺伝子の
ORFの塩基配列を示す配列図である。
【図12】配列番号2に対応するゲノムCRP遺伝子の
ORFの塩基配列を示す、図11の続きとなる配列図で
ある。
【図13】配列番号2に対応するゲノムCRP遺伝子の
ORFの塩基配列を示す、図12の続きとなる配列図で
ある。
【図14】配列番号2に対応するゲノムCRP遺伝子の
ORFの塩基配列を示す、図13の続きとなる配列図で
ある。
【図15】配列番号2に対応するゲノムCRP遺伝子の
ORFの塩基配列を示す、図14の続きとなる配列図で
ある。
【図16】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す配列図である。
【図17】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す、図16の続きとなる配列
図である。
【図18】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す、図17の続きとなる配列
図である。
【図19】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す、図18の続きとなる配列
図である。
【図20】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す、図19の続きとなる配列
図である。
【図21】配列番号3に対応するCRP遺伝子のcDN
Aクローンの塩基配列を示す、図20の続きとなる配列
図である。
【図22】配列番号4に対応するCRP蛋白質のアミノ
酸配列を示す配列図である。
【図23】配列番号4に対応するCRP蛋白質のアミノ
酸配列を示す、図22の続きとなる配列図である。
【図24】CRP蛋白質と、キイロショウジョウバエの
転写コアクチベーターkto蛋白質とにおけるアミノ酸
配列の相同性を示す比較配列図である。
【図25】配列番号5に対応するCRP−1D変異遺伝
子のORFの塩基配列を示す配列図である。
【図26】配列番号5に対応するCRP−1D変異遺伝
子のORFの塩基配列を示す、図25の続きとなる配列
図である。
【図27】配列番号5に対応するCRP−1D変異遺伝
子のORFの塩基配列を示す、図26の続きとなる配列
図である。
【図28】配列番号5に対応するCRP−1D変異遺伝
子のORFの塩基配列を示す、図27の続きとなる配列
図である。
【図29】配列番号5に対応するCRP−1D変異遺伝
子のORFの塩基配列を示す、図28の続きとなる配列
図である。
【図30】配列番号6に対応するCRP−1D変異蛋白
質のアミノ酸配列を示す配列図である。
【図31】配列番号6に対応するCRP−1D変異蛋白
質のアミノ酸配列を示す、図30の続きとなる配列図で
ある。
【図32】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す配列図である。
【図33】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図32の続きとなる配
列図である。
【図34】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図33の続きとなる配
列図である。
【図35】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図34の続きとなる配
列図である。
【図36】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図35の続きとなる配
列図である。
【図37】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図36の続きとなる配
列図である。
【図38】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図37の続きとなる配
列図である。
【図39】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図38の続きとなる配
列図である。
【図40】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図39の続きとなる配
列図である。
【図41】配列番号7に対応するイネ由来のゲノムOs
CRP遺伝子の塩基配列を示す、図40の続きとなる配
列図である。
【図42】配列番号8に対応するイネ由来のゲノムOs
CRP遺伝子のORFの塩基配列を示す配列図である。
【図43】配列番号8に対応するイネ由来のゲノムOs
CRP遺伝子のORFの塩基配列を示す、図42の続き
となる配列図である。
【図44】配列番号8に対応するイネ由来のゲノムOs
CRP遺伝子のORFの塩基配列を示す、図43の続き
となる配列図である。
【図45】配列番号8に対応するイネ由来のゲノムOs
CRP遺伝子のORFの塩基配列を示す、図44の続き
となる配列図である。
【図46】配列番号8に対応するイネ由来のゲノムOs
CRP遺伝子のORFの塩基配列を示す、図45の続き
となる配列図である。
【図47】配列番号9に対応するイネ由来のOsCRP
蛋白質のアミノ酸配列を示す配列図である。
【図48】配列番号9に対応するイネ由来のOsCRP
蛋白質のアミノ酸配列を示す、図47の続きとなる配列
図である。
【図49】OsCRP蛋白質とCRP蛋白質とにおける
アミノ酸配列の相同性を示す比較配列図である。
【図50】OsCRP蛋白質とCRP蛋白質とにおける
アミノ酸配列の相同性を示す、図49の続きとなる比較
配列図である。
【図51】OsCRP蛋白質とCRP蛋白質とにおける
アミノ酸配列の相同性を示す、図50の続きとなる比較
配列図である。
【図52】配列番号10に対応するタバコ由来のNtC
RP遺伝子のORFの部分塩基配列を示す配列図であ
る。
【図53】配列番号11に対応するタバコ由来のNtC
RP蛋白質の部分アミノ酸配列を示す配列図である。
【図54】crp−1D突然変異をホモ接合で有するシ
ロイヌナズナと、野生型ホモ接合のシロイヌナズナとに
おいて、発芽後4週間目での生育状態を示す図である。
【図55】(a)は、野生型ホモ接合のシロイヌナズナ
をFT遺伝子で形質転換して、FT遺伝子を高レベルで
発現させた場合の、発芽後1週間目の生育状態を示す図
であり、(b)は、シロイヌナズナをFT遺伝子で形質
転換して、FT遺伝子を高レベルで発現させた植物にc
rp−1D突然変異をヘテロ接合で持たせた場合の、発
芽後1週間目の生育状態を示す図である。
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 経塚 淳子
奈良県生駒市あすか野南2−14−11
Fターム(参考) 2B030 AB03 CA15 CA17 CA19
4B024 AA08 CA01 DA01 GA11 HA20
4B065 AA88X AA88Y AB01 AC12
BA01 BD50 CA24 CA53
4H045 AA10 AA30 BA10 CA30 EA05
FA74