JP2001258573A - 新規ファット3遺伝子及びそれにコードされる蛋白質 - Google Patents

新規ファット3遺伝子及びそれにコードされる蛋白質

Info

Publication number
JP2001258573A
JP2001258573A JP2000082725A JP2000082725A JP2001258573A JP 2001258573 A JP2001258573 A JP 2001258573A JP 2000082725 A JP2000082725 A JP 2000082725A JP 2000082725 A JP2000082725 A JP 2000082725A JP 2001258573 A JP2001258573 A JP 2001258573A
Authority
JP
Japan
Prior art keywords
ser
val
leu
asp
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000082725A
Other languages
English (en)
Inventor
Manabu Nakayama
学 中山
Takahiro Nagase
隆弘 長瀬
Osamu Obara
收 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kazusa DNA Research Institute Foundation
Original Assignee
Kazusa DNA Research Institute Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kazusa DNA Research Institute Foundation filed Critical Kazusa DNA Research Institute Foundation
Priority to JP2000082725A priority Critical patent/JP2001258573A/ja
Publication of JP2001258573A publication Critical patent/JP2001258573A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(57)【要約】 【課題】ヒト胎児脳由来のcDNAライブラリーから、
上記のようなヒトのFAT1(ファット1)遺伝子及びMEGF
1/fat2(ファット2)遺伝子に高いホモロジーを示す遺
伝子(DNA)をクローニングすること。 【解決手段】以下の(a)又は(b)のポリペプチドを
コードする塩基配列から成るDNA: (a)配列番号:1で示されるアミノ酸配列と同一又は
実質的に同一のアミノ酸配列から成るポリペプチド、
(b)配列番号:1で示されるアミノ酸配列において、
一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
列から成り、(a)のポリペプチド、ヒトファット1蛋
白質又はヒトファット2蛋白質と実質的に同質の生物学
的活性を有するポリペプチド、該DNAにコードされる
ポリペプチド、及び該ポリペプチドを含むヒトファット
3蛋白質。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、発生段階における
形態形成、組織形成過程における細胞の接着や分離に関
与するヒト及びラット由来の新規蛋白質であるファット
(fat)、及びそれをコードする遺伝子(DNA)に関す
る。
【0002】
【従来の技術】近年のノックアウトマウスの実験結果か
ら得られた知見から、重要な遺伝子の欠失が必ずしも病
気を引き起こすものではないことが明らかになってき
た。つまり、重要な遺伝子の欠失が起こると発生段階が
進まず、妊娠のかなり初期に流産してしまったり、逆に
重要な遺伝子ほど機能的に相補するシステムができあが
って無くなっても表現型にあらわれてこなかったりする
ことがある。このことは、ヒトの病気の大部分が単なる
遺伝子の欠失によって引き起こされるのではなくて、ア
ミノ酸置換によって蛋白質の機能や活性が一部分だけ変
化することにより引き起こされる事を意味する。また、
蛋白質の一部のアミノ酸を人工的に変化させても全く蛋
白質の機能や活性に変化を及ぼさない部分も多いことが
わかっている。
【0003】このような観点から、遺伝子には、ヒトの
病気を引き起こしやすい遺伝子とヒトの病気を引き起こ
しにくい遺伝子が存在することになる。Nakayama et. a
l.,1998で議論しているように、EGF様モチーフ(EGF -l
ike motif)やカドヘリンドメインなどのドメインをタ
ンデムに持つマルチドメインで構成される巨大な蛋白質
の遺伝子は、最も病気の責任遺伝子となる可能性の高い
遺伝子群の一つである。
【0004】細胞の接着(結合)はヒトを含めた多細胞
生物にとっては基本的な性質である。多細胞生物は1つ
の受精卵から細胞分裂を繰り返し、細胞の分化、形態形
成を経て成体が形成される。細胞接着は単に細胞同士を
結合しているという静的な過程ではなく、特有の接着構
造を形成し、特異的な結合を担い、様々な調節を受けて
さまざまな機能を果たしていることが考えられる。ま
た、細胞接着の機構を通して正常な形態形成が行われる
ため、この細胞接着に関わる蛋白質に突然変異が起こり
活性や機能が変化すると、正しい形態形成が行われない
ので奇形が生じると考えられる。細胞接着に直接的に関
与する因子は、膜蛋白質または細胞外マトリックスであ
ると考えられている。
【0005】カドヘリンはカルシウム依存的の細胞接着
を担う分子で、組織の構築や維持に関与している。クラ
シックタイプのカドヘリンは、一回膜貫通型の膜蛋白質
で、N末端側に細胞外ドメインが、またC末端側に細胞内
ドメインが存在している。細胞外ドメインには、カドヘ
リンを特徴づける約110個のアミノ酸からなるカドヘ
リンドメインの繰り返し構造(クラシックタイプのカド
ヘリンは、5個である。)が存在する。カドヘリンの細
胞接着活性は同じ型の分子同士が結合するホモフィリッ
クな結合様式であることが一般的である。カドヘリンド
メインの繰り返し構造を持つものは、クラシックカドヘ
リンやプロトカドヘリンなどのサブファミリーを含む大
きなファミリーを形成しており、特にプロトカドヘリン
の仲間は、プラナリアから哺乳類に至まで多くの分子が
見つかっている。細胞内ドメインは、クラシックタイプ
のカドヘリン同士は高いホモロジーを示すが、クラシッ
クタイプの以外のプロトカドヘリンは、ホモロジーがな
くそれぞれ特有の配列を持っている。このことは細胞内
ドメインが似ていれば、同じような機能をすることを示
している。
【0006】カドヘリンの機能としては発生段階におけ
る形態形成、組織形成過程における細胞の接着や分離に
関与し、また成体においてはこのようにして作られた組
織の維持に関わっていることが考えられている。このこ
とから、カドヘリンスーパーファミリーの突然変異は、
先天性奇形症候群の原因となりうる。また、カドヘリン
スーパーファミリーは、癌の転移との関連でも研究が進
んでいる。癌細胞の浸潤能と細胞間接着活性との間には
強い相関があり、癌細胞の接着能の低下、喪失は癌の転
移に促進的に働くことが示されている (Birchmeier,W.
et. al. 1994 Biochem. Biophy. Acta Rev. Cancer, 11
98;11-26) 。 実際、比較的若年齢で発症する胃癌の家
系においてE-カドヘリンの遺伝子に変異のあることが明
らかになっている。(Guilford, P. et. al. 1998 Natur
e, 392:402-405)
【0007】fatと名付けられたショウジョウバエの変
異体は、幼虫の時期に将来成虫の足や羽になる予定の場
所、成虫原基(imaginal disc )が異常に増殖する腫瘍
様の表原型を示す。このことから、fat遺伝子は増殖を
調節する腫瘍抑制遺伝子(Tumor Suppressor gene)であ
り、同時に形態形成に関与していると考えられている(M
ahoney, P. et al., 1991, Cell 67: 853-868)。その責
任遺伝子(fat)は34個のカドヘリンドメインと4個のEG
F様ドメインの繰り返し構造からなる5147アミノ酸から
なる巨大な蛋白質をコードする。ヒトのFAT1遺伝子は、
Dunne, J. らによって既に報告されている(Dunne, J.e
t. al., 1995, Genomics 30:207-223)。また、ヒトと
ラットのMEGF1/fat2遺伝子は、我々がクローニングし、
小脳特異的に発現していることを報告した(Nakayama,
M. et. al., 1998 Genomics 51: 27-34)。
【0008】
【本発明が解決する課題】今回、本発明者は、ヒト胎児
脳由来のcDNAライブラリーから、上記のようなヒト
のFAT1(ファット1)遺伝子及びMEGF1/fat2(ファット
2)遺伝子に高いホモロジーを示す遺伝子(DNA)を
クローニングすることに成功し、本発明を完成するに至
った。
【0009】
【課題を解決するための手段】即ち、本発明は第一の態
様として、以下の(a)又は(b)のポリペプチドをコ
ードする塩基配列から成るDNA: (a)配列番号:1で示されるアミノ酸配列と同一又は
実質的に同一のアミノ酸配列から成るポリペプチド、 (b)配列番号:1で示されるアミノ酸配列において、
一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
列から成り、(a)のポリペプチド、ヒトファット1蛋
白質又はヒトファット2蛋白質と実質的に同質の生物学
的活性を有するポリペプチド、に係る。本発明の第二の
態様として、以下の(a)又は(b)のDNA: (a)配列番号:2で示される塩基配列において、配列
番号:1で示されるアミノ酸配列をコードするDNA、
(b)(a)のDNAとストリンジェントな条件下でハ
イブリダイズし、(a)のポリペプチド、ヒトファット
1蛋白質又はヒトファット2蛋白質と実質的に同質の生
物学的活性を有する蛋白質をコードするDNAに係る。
以上の本発明の第一及び第二の態様であるDNAをまと
めて、以下、「本発明ヒトDNA」ともいう。本発明ヒ
トDNAは、ヒトファット3蛋白質のC末端側の一部分
にあたるポリペプチドをコードするものである。又、本
発明はこれらDNAを含むヒトファット3遺伝子にも係
る。更に、本発明は上記DNAにコードされるポリペプ
チド(以下、「本発明ヒトポリペプチド」ともい
う。)、及び該ポリペプチドを含むヒトファット3蛋白
質に係る。
【0010】本発明は又、以下の(a)又は(b)のポ
リペプチドをコードする塩基配列から成るラットファッ
ト3遺伝子: (a)配列番号:3で示されるアミノ酸配列と同一又は
実質的に同一のアミノ酸配列から成るポリペプチド、
(b)配列番号:3で示されるアミノ酸配列において、
一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
列から成り、(a)のポリペプチドと実質的に同質の生
物学的活性を有するポリペプチド、に係る。更に別の態
様として、以下の(a)又は(b)のDNAから成るラ
ットファット3遺伝子: (a)配列番号:4で示される塩基配列において、配列
番号:3で示されるアミノ酸配列をコードするDNA、
(b)(a)のDNAとストリンジェントな条件下でハ
イブリダイズし、(a)のポリペプチドと実質的に同質
の生物学的活性を有する蛋白質をコードするDNA、に
係る。更に、本発明は上記DNAにコードされるラット
ファット3蛋白質に係る。
【0011】本発明ヒトDNAは、市販されている(ク
ロンテック社)ヒト胎児脳由来のmRNAを出発材料と
して、本発明者が調製したcDNAライブラリーから、
cDNA断片として単離した後に、塩基配列を決定し同
定したものである。即ち、具体的には、小原他の方法
(DNA Research Vol.4,53−59(1997))に従って調製
したヒト胎児脳由来のcDNAライブラリーから、約4
5,000個の組換え体を選択し、in vitro翻訳系を用い、5
0kDa以上の蛋白質を発現できるcDNAクローンを4,500
個、選択を行なった(Ishikawa, K. I. et. al. 1997 DN
A RES. 5:307-313 )。次に、この4,500個のクローンの
両末端DNA配列を決定した。この中から、新規遺伝子を
含む500個のクローンのcDNAに関しての全塩基配列の決
定を行なった。次に、こうして得られた全塩基配列に基
づき、DNA解析プログラム(GCG, Fasta& Blast)を用いて
ホモロジー検索を行なうとともに、PROSITE databaseを
検索するための蛋白質解析プログラムである pftools
(Bairoch A, Bucher P, Hofmann K, Nucleic Acids Re
s. 1997 Jan 1;25(1):217-21)、及びPfam databaseを検
索するための蛋白質解析プログラムhmmer 2.1(Sonnhamm
er, E. L. L., Eddy, S.R., Birney, E., Bateman, A.,
and Durbin, R., Nucleic Acids Res 1998; 26, 320-3
22)を用いてモチーフ検索を行なった (Suyama et. al.
1999 Nucleic Acids Res. 27: 338-339)。その結果、
ヒトファット1蛋白質又はヒトファット2蛋白質と有意
な相同性とドメイン構造を有する本発明ヒトDNAを含
むクローンを見つけることができた。このようなスクリ
ーニングを行なうことによって、サザンハイブリダイゼ
ーションなどの従来の方法では取得することが難しいと
考えられる弱いホモロジーの遺伝子でも、クローニング
を行なうことができる。
【0012】尚、当業者であれば、本明細書によって初
めて開示された配列番号2に示した塩基配列に基づいて
クローンの5’側に適当なプライマー(例えば、5’- CA
C ATT CAG GAC ATA CTT GCC G -3’ (配列番号2の塩基
対第363〜384番目に対応する))を調製し、プラ
イマーと上記の市販されているヒト胎児脳由来のmRNAと
ハイブリダイゼーションを行なった後に逆転反応を行な
うことにより今回のクローンの上流側(遺伝子の5’
側)の領域を含むcDNAを特異的に合成することができ
る。この遺伝子の5’側の領域を含むcDNAをプラスミド
に挿入した後、配列番号2の一部分をプローブとして、
コロニーハイブリダイゼーションのような相同性クロー
ニングによって、本発明ヒトDNAを含むヒトファット
3遺伝子の全領域を調製することが可能である。配列番
号3として示してあるラットファット3の全アミノ酸配
列と比較することにより、上記の過程を経て取得された
DNAがヒトのファット3遺伝子の全領域を含むかどうか
を判別することは容易である。更に、ラットファット3
遺伝子をプローブとして用いれば、コロニーハイブリダ
イゼーションのような相同性クローニングによって、ヒ
トファット3遺伝子の全領域を調製することができる。
このように、本発明によって、ヒトファット3遺伝子の
一部分のDNA/アミノ酸配列とラットファット3の全ア
ミノ酸配列の両方が開示されている以上、当業者であれ
ば、これらの情報に基づき、ヒトファット3遺伝子の全
領域を容易に取得することが出来る。又、短い断片や得
られた配列に人工的な間違いが起こらないように十分な
注意を払いながら、RACE等のPCR法を使用するこ
とによっても、本発明ヒトDNAを含むヒトファット3
遺伝子の全領域を調製することが可能である。
【0013】又、本発明のラットファット3遺伝子は以
下のようにして調製した。即ち、まず、胎生15日目の
ラット胎児脳より精製を行ったRNAを用いて、小原他
の方法(DNA Research Vol.4,53−59(1997))に従っ
て調製したcDNAライブラリーから、配列番号2で示
してあるヒトファット3DNAをプロ−ブとして用いて
コロニーハイブリダイゼーション法にて相同性クローニ
ングを行った。次に、ラットファット3遺伝子の全領域
を取得するために、上記の方法で得られたクローンの塩
基配列を基にプライマーを調製し、プライマーと胎生1
5日目のラット胎児脳より得られたRNAとハイブリダ
イゼーションを行った後に、逆転写反応を行うことによ
り最初のクローンの上流側(遺伝子の5’側)の領域を
含むcDNAを特異的に合成した。更に、上記の方法を
繰り返すことにより、本発明のラットファット3遺伝子
の全領域を構成する、お互いに重なり合う領域を持つ3
種類のDNA断片を各々含む3種類のプラスミドが得ら
れた。これは、14.5kbpにも及ぶ長いcDNAで
あるという本発明のラットファット3遺伝子の特殊性に
よるものである。尚、当業者であれば、当該技術分野で
周知の適当な制限酵素及びDNA組換技術によって、こ
れら3種類のDNA断片から、本発明のラットファット
3遺伝子の全領域を含む一本のcDNAを容易に調製す
ることができるので、本発明によって、実質的にラット
ファット3遺伝子の全領域を含む一本鎖cDNAが得ら
れたものといえる。
【0014】更に、本発明は、本発明ヒトDNA、本発
明ヒトDNAを含むヒトファット3遺伝子又はラットフ
ァット3遺伝子を含有する組換えベクター、該組換えベ
クターを保持する形質転換体、該形質転換体を培養し、
本発明ヒトポリペプチド若しくは該ポリペプチドを含む
ヒトファット3蛋白質又はラットファット3蛋白質を生
成、蓄積せしめ、これを採取することを特徴とする、本
発明ヒトポリペプチド若しくは該ポリペプチドを含むヒ
トファット3蛋白質又はラットファット3蛋白質、又は
その塩の製造方法、及び、こうして得られる本発明ヒト
ポリペプチド若しくは該ポリペプチドを含むヒトファッ
ト3蛋白質若しくはラットファット蛋白質3又はその塩
を提供する。又、本発明は、本発明ヒトDNAを含有し
てなる医薬、本発明ヒトポリペプチド若しくはその部分
ペプチド又は該ポリペプチドを含むヒトファット3蛋白
質をコードするDNAに実質的に相補的な塩基配列を有
するアンチセンスヌクレオチド又はそれらを含有してな
る医薬、本発明ヒトポリペプチド若しくはその部分ペプ
チド又は該ポリペプチドを含むヒトファット3蛋白質を
含有してなる医薬、本発明ヒトポリペプチド若しくはそ
の部分ペプチド又は該ポリペプチドを含むヒトファット
3蛋白質又はそれらの塩に対する抗体、本発明ヒトポリ
ペプチド若しくはその部分ペプチド又は該ポリペプチド
を含むヒトファット3蛋白質又はそれらの塩を用いるこ
とを特徴とする、それら物質と特異的に結合する物質の
スクリーニング方法、並びにスクリーニング用キット等
も提供する。
【0015】
【発明の実施の形態】本発明ヒトDNAとしては、前述
した本発明ヒトポリペプチドをコードする塩基配列から
成るものであればいかなるものであってもよい。また、
ヒトの脳、又は、それ以外の組織、例えば、心臓、肺、
肝臓、脾臓、腎臓、精巣、等の細胞・組織に由来するc
DNAライブラリー等から同定・単離されたcDNA、
又は、合成DNAのいずれでもよい。ライブラリー作成
に使用するベクターは、バクテリオファージ、プラスミ
ド、コスミド、ファージミドなどいずれであってもよ
い。また、前記した細胞・組織よりtotalRNA画分ま
たはmRNA画分を調製したものを用いて、直接Revers
eTranscriptase Polymerase Chain Reaction(以下、
「RT-PCR法」と略称する)によって増幅すること
もできる。
【0016】配列番号:1又は3で示されるアミノ酸配
列と実質的に同一のアミノ酸配列とは、配列番号:1で
示される全アミノ酸配列との相同性の程度が、全体の平
均で約80%以上、好ましくは約90%以上であるアミ
ノ酸配列を意味する。従って、本発明の配列番号:1で
示されるアミノ酸配列と実質的に同一のアミノ酸配列か
ら成るポリペプチドとしては、例えば、前記の配列番
号:1で示されるアミノ酸配列に対して上記の相同性を
有し、配列番号:1で示されるアミノ酸配列から成るポ
リペプチド、ヒトファット1蛋白質又はヒトファット2
蛋白質と実質的に同質の生物学的活性を有するポリペプ
チドを挙げることが出来る。ここで、実質的に同質と
は、それらの活性が性質的に同質であることを示す。
又、本発明ヒトポリペプチドには、例えば、配列番号:
1で示されるアミノ酸配列中の一部(好ましくは、1〜
20個程度、より好ましくは1〜10個程度、さらに好
ましくは数個)のアミノ酸が欠失、置換又は付加したア
ミノ酸配列、或いはそれらを組み合わせたアミノ酸配列
から成り、配列番号:1で示されるアミノ酸配列から成
るポリペプチド、ヒトファット1蛋白質又はヒトファッ
ト2蛋白質と実質的に同質の生物学的活性を有するポリ
ペプチドも含まれる。
【0017】更に、本発明ヒトDNAは、例えば、配列
番号:2で示される塩基配列において、配列番号:1で
示されるアミノ酸配列をコードするDNA、又は、該D
NAとストリンジェントな条件下でハイブリダイズし、
配列番号:1で示されるアミノ酸配列から成るポリペプ
チド、ヒトファット1蛋白質又はヒトファット2蛋白質
と同質の生物学的活性を有するポリペプチド(蛋白質)
をコードするDNAであればいずれのものでもよい。か
かる条件下で、配列番号:2で示される塩基配列におい
て、配列番号:1で示されるアミノ酸配列をコードする
DNAとハイブリダイズできるDNAとしては、例え
ば、該DNAの全塩基配列との相同性の程度が、全体の
平均で約80%以上、好ましくは約90%以上である塩
基配列を含有するDNA等を挙げることが出来る。ハイ
ブリダイゼーションは、モレキュラー・クローニング
(Molecular Cloning)2nd(J. Sambrook etal., Cold
Spring Harbor Lab. Press, 1989)に記載の方法等、
当業界で公知の方法あるいはそれに準じる方法に従って
行なうことができる。また、市販のライブラリーを使用
する場合、添付の使用説明書に記載の方法に従って行な
うことができる。ここで、「ストリンジェントな条件」
とは、例えば、DIG DNA Labeling (ベーリンガー・マン
ハイム社製 Cat No. 1175033)でプローブをラベルし
た場合に、32℃のDIG Easy Hyb 溶液(ベーリンガー・
マンハイム社製 Cat No. 1603558)中でハイブリダイ
ズさせ、40℃の0.1xSSC 溶液(0.1%[w/v]SDSを含む)中
でメンブレンを洗浄する条件(1xSSCは0.15M NaCl,0.
015M クエン酸ナトリウムである)でのサザンブロット
ハイブリダイゼーションで本発明ヒトDNAプローブに
ハイブリダイズする程度の条件である。尚、本発明に係
るラットファット3遺伝子及びラットファット3蛋白質
に関しても、上記のヒトDNA及びヒトポリペプチドに
関する各定義は当てはまるものである。
【0018】本発明ヒトDNAのクローニングの手段と
しては、本発明ヒトポリペプチドの部分等の適当な塩基
配列を有する合成DNAプライマーを用いてPCR法に
よって増幅するか、または適当なベクターに組み込んだ
DNAを本発明ヒトポリペプチドの一部あるいは全領域
をコードするDNA断片もしくは合成DNAを用いて標
識したものとのハイブリダイゼーションによって選別す
ることができる。ハイブリダイゼーションの方法は、例
えば、Molecular Cloning 2nd(J. Sambrook et al.,
Cold Spring Harbor Lab. Press, 1989)に記載の方法
などに従って行なうことができる。また、市販のライブ
ラリーを使用する場合、添付の使用説明書に記載の方法
に従って行なうことができる。DNAの塩基配列の変換
は、公知のキット、例えば、SuperScript II 逆転写酵
素キット(ギブコBRL社)等を用いて、Gapped duple
x法やKunkel法などの公知の方法あるいはそれらに準じ
る方法に従って行なうことができる。クローン化された
ポリペプチドをコードするDNAは目的によりそのま
ま、または所望により制限酵素で消化したり、リンカー
を付加したりして使用することができる。該DNAはそ
の5’末端側に翻訳開始コドンとしてのATGを有し、
また3’末端側には翻訳終止コドンとしてのTAA、T
GAまたはTAGを有していてもよい。これらの翻訳開
始コドンや翻訳終止コドンは、適当な合成DNAアダプ
ターを用いて付加することもできる。
【0019】本発明の蛋白質の発現ベクターは、当該技
術分野で公知の方法に従って作成することが出来る。例
えば、(1)本発明ヒトDNA又は本発明ヒトDNAを
含むヒトファット3遺伝子を含有するDNA断片を切り
出し、(2)該DNA断片を適当な発現ベクター中のプ
ロモーターの下流に連結することにより製造することが
できる。ベクターとしては、大腸菌由来のプラスミド
(例、pBR322,pBR325,pUC18,pU
C118)、枯草菌由来のプラスミド(例、pUB11
0,pTP5,pC194)、酵母由来プラスミド
(例、pSH19,pSH15)、λファージなどのバ
クテリオファージ、レトロウイルス,ワクシニアウイル
ス,バキュロウイルスなどの動物ウイルス等を利用する
ことが出来る。本発明で用いられるプロモーターとして
は、遺伝子の発現に用いる宿主に対応した適切なプロモ
ーターであればいかなるものでもよい。例えば、宿主が
大腸菌である場合は、trpプロモーター、lacプロ
モーター、recAプロモーター、λPLプロモータ
ー、lppプロモーターなどが、宿主が枯草菌である場
合は、SPO1プロモーター、SPO2プロモーター、
penPプロモーターなど、宿主が酵母である場合は、
PHO5プロモーター、PGKプロモーター、GAPプ
ロモーター、ADHプロモーターなどが好ましい。動物
細胞を宿主として用いる場合は、SRαプロモーター、
SV40プロモーター、LTRプロモーター、CMVプ
ロモーター、HSV-TKプロモーターなどが挙げられ
る。
【0020】発現ベクターには、以上の他に、所望によ
り当該技術分野で公知の、エンハンサー、スプライシン
グシグナル、ポリA付加シグナル、選択マーカー、SV
40複製オリジン(以下、SV40oriと略称する場
合がある)等を付加することができる。また、必要に応
じて、本発明のDNAにコードされた蛋白質を他の蛋白
質(例えば、グルタチオンSトランスフェラーゼ及びプ
ロテインA)との融合蛋白質として発現させることも可
能である。このような融合蛋白質は、適用名プロテアー
ゼを使用して切断し、それぞれの蛋白質に分離すること
が出来る。
【0021】宿主細胞としては、例えば、エシェリヒア
属菌、バチルス属菌、酵母、昆虫細胞、昆虫、動物細胞
などが用いられる。エシェリヒア属菌の具体例として
は、エシェリヒア・コリ(Escherichia coli)K12・
DH1(Proc. Natl. Acad. Sci. USA,60巻,1
60(1968)),JM103(Nucleic Acids Resear
ch,9巻,309(1981)),JA221(Journal
of Molecular Biology,120巻,517(197
8)),及びHB101(Journal of Molecular Biolog
y,41巻,459(1969))等が用いられる。バチ
ルス属菌としては、例えば、バチルス・サチルス(Baci
llus subtilis)MI114(Gene,24巻,255(1
983)),207−21〔Journal of Biochemistry,
95巻,87(1984)〕等が用いられる。酵母として
は、例えば、サッカロマイセス セレビシエ(Saccaromy
ces cerevisiae)AH22,AH22R-,NA87−
11A,DKD−5D,20B−12、シゾサッカロマ
イセス ポンベ(Schizosaccaromyces pombe)NCYC
1913,NCYC2036、サッカロマイセス ピキ
ア パストリス(Saccaromycespicjia pastoris)等が用
いられる。動物細胞としては、例えば、サル細胞COS
−7,Vero,チャイニーズハムスター細胞CHO(以
下、CHO細胞と略記),dhfr遺伝子欠損チャイニ
ーズハムスター細胞CHO(以下、CHO(dhfr
-)細胞と略記),マウスL細胞,マウスAtT−2
0,マウスミエローマ細胞,ラットGH3,ヒトFL細
胞などが用いられる。
【0022】これら宿主細胞の形質転換は、当該技術分
野で公知の方法に従って行うことが出来る。例えば、以
下に記載の文献を参照することが出来る。Proc. Natl.
Acad. Sci. USA,69巻,2110(1972); Ge
ne,17巻,107(1982);Molecular & General
Genetics,168巻,111(1979);Methods in
Enzymology,194巻,182−187(1991);
Proc. Natl. Acad. Sci. USA),75巻,1929
(1978);細胞工学別冊8 新 細胞工学実験プロトコ
ール.263−267(1995)(秀潤社発行);及
び Virology,52巻,456(1973)。
【0023】このようにして得られた、本発明ヒトDN
A又は本発明ヒトDNAを含むヒトファット3遺伝子を
含有する発現ベクターで形質転換された形質転換体は、
当該技術分野で公知の方法に従って培養することが出来
る。例えば、以下に記載の文献を参照することが出来
る。例えば、宿主がエシェリヒア属菌の場合、培養は通
常約15〜43℃で約3〜24時間行ない、必要によ
り、通気や撹拌を加えることもできる。宿主がバチルス
属菌の場合、培養は通常、約30〜40℃で約6〜24
時間行ない、必要により通気や撹拌を加えることもでき
る。宿主が酵母である形質転換体を培養する際、培養は
通常、pH約5〜8に調整された培地を用いて約20℃
〜35℃で約24〜72時間行ない、必要に応じて通気
や撹拌を加えることもできる。宿主が動物細胞である形
質転換体を培養する際、pHは約6〜8に調整された培
地を用いて、通常約30℃〜40℃で約15〜60時間
行ない、必要に応じて通気や撹拌を加えることもでき
る。
【0024】上記培養物から本発明ヒトポリペプチド又
はヒトファット3蛋白質を分離精製するには、例えば、
培養後、公知の方法で菌体あるいは細胞を集め、これを
適当な緩衝液に懸濁し、超音波、リゾチームおよび/ま
たは凍結融解などによって菌体あるいは細胞を破壊した
のち、遠心分離やろ過により蛋白質の粗抽出液を得る。
緩衝液の中に尿素や塩酸グアニジンなどの蛋白質変性剤
や、トリトンX−100TMなどの界面活性剤が含まれて
いてもよい。培養液中に蛋白質が分泌される場合には、
培養終了後、公知の方法で菌体あるいは細胞と上清とを
分離し、上清を集める。このようにして得られた培養上
清、あるいは抽出液中に含まれる蛋白質の精製は、公知
の分離・精製法を適切に組み合わせて行なうことができ
る。こうして得られた本発明ヒトポリペプチド(蛋白
質)は、公知の方法あるいはそれに準じる方法によって
塩に変換することができ、逆に塩で得られた場合には公
知の方法あるいはそれに準じる方法により、遊離体また
は他の塩に変換することができる。更に、組換え体が産
生する蛋白質を、精製前または精製後に、トリプシン及
びキモトリプシンのような適当な蛋白修飾酵素を作用さ
せることにより、任意に修飾を加えたり、ポリペプチド
を部分的に除去することもできる。本発明ヒトポリペプ
チド(蛋白質)又はその塩の存在は、様々な結合アッセ
イ及び特異抗体を用いたエンザイムイムノアッセイ等に
より測定することができる。
【0025】本発明ヒトポリペプチド(蛋白質)は、C
末端が通常カルボキシル基(−COOH)またはカルボ
キシレート(−COO-)であるが、C末端がアミド(−
CONH2)またはエステル(−COOR)であっても
よい。ここでエステルにおけるRとしては、例えば、メ
チル、エチル、n−プロピル、イソプロピルもしくはn
−ブチルなどのC1-6アルキル基、例えば、シクロペン
チル、シクロヘキシルなどのC3-8シクロアルキル基、
例えば、フェニル、α−ナフチルなどのC6-12アリール
基、例えば、ベンジル、フェネチルなどのフェニル−C
1-2アルキル基もしくはα−ナフチルメチルなどのα−
ナフチル−C1-2アルキル基などのC7-14アラルキル基
のほか、経口用エステルとして汎用されるピバロイルオ
キシメチルエステルなどが用いられる。
【0026】本発明ヒトポリペプチド(蛋白質)がC末
端以外にカルボキシル基(またはカルボキシレート)を
有している場合、カルボキシル基がアミド化またはエス
テル化されているものも本発明の蛋白質に含まれる。こ
の場合のエステルとしては、例えば上記したC末端のエ
ステルなどが用いられる。さらに、本発明の蛋白質に
は、N末端のメチオニン残基のアミノ基が保護基(例え
ば、ホルミル基、アセチル基などのC1-6アシル基な
ど)で保護されているもの、生体内で切断されて生成す
るN末端のグルタミン酸残基がピログルタミン化したも
の、分子内のアミノ酸の側鎖上にある、例えばOH、C
OOH、NH2、SHなどが適当な保護基(例えば、ホ
ルミル基、アセチル基などのC1-6アシル基など)で保
護されているもの、あるいは糖鎖が結合したいわゆる糖
蛋白質などの複合蛋白質なども含まれる。
【0027】本発明の蛋白質の部分ペプチドとしては、
前記した本発明ヒトポリペプチド(蛋白質)の部分ペプ
チドであって、実質的に同質の活性を有するものであれ
ばいずれのものでもよい。例えば、本発明ヒトポリペプ
チド(蛋白質)の構成アミノ酸配列のうち少なくとも2
0個以上、好ましくは50個以上、さらに好ましくは7
0個以上、より好ましくは100個以上、最も好ましく
は200個以上のアミノ酸配列を有し、例えば、ショウ
ジョウバエファット蛋白質と実質的に同質の生物学的活
性を有するするペプチドなどが用いられる。又、本発明
の部分ペプチドはC末端が通常カルボキシル基(−CO
OH)またはカルボキシレート(−COO-)である
が、前記した本発明の蛋白質のごとく、C末端がアミド
(−CONH2 )またはエステル(−COOR)であっ
てもよい。さらに、本発明の部分ペプチドには、前記し
た本発明の蛋白質と同様に、N末端のメチオニン残基の
アミノ基が保護基で保護されているもの、N端側が生体
内で切断され生成したグルタミル基がピログルタミン酸
化したもの、分子内のアミノ酸の側鎖上の置換基が適当
な保護基で保護されているもの、あるいは糖鎖が結合し
たいわゆる糖ペプチドなどの複合ペプチドなども含まれ
る。
【0028】本発明ヒトポリペプチド(蛋白質)又はそ
の部分ペプチドの塩としては、とりわけ生理学的に許容
される酸付加塩が好ましい。この様な塩としては、例え
ば、無機酸(例えば、塩酸、リン酸、臭化水素酸、硫
酸)との塩、あるいは有機酸(例えば、酢酸、ギ酸、プ
ロピオン酸、フマル酸、マレイン酸、コハク酸、酒石
酸、クエン酸、リンゴ酸、蓚酸、安息香酸、メタンスル
ホン酸、ベンゼンスルホン酸)との塩などが用いられ
る。
【0029】本発明ヒトポリペプチド(蛋白質)、その
部分ペプチドもしくはそれらの塩またはそれらのアミド
体は、当該技術分野で公知の化学合成方法を用いて調製
することも出来る。例えば、通常市販されている蛋白質
合成用樹脂を用い、α−アミノ基と側鎖官能基を適当に
保護したアミノ酸を、目的とする蛋白質の配列通りに、
当業界において自体公知の各種縮合方法に従い、樹脂上
で縮合させる。反応の最後に樹脂から蛋白質を切り出す
と同時に各種保護基を除去し、さらに高希釈溶液中で分
子内ジスルフィド結合形成反応を実施し、目的の蛋白
質、その部分ペプチドまたはそれらのアミド体を取得す
る。上記した保護アミノ酸の縮合に関しては、例えば、
DCC、N,N'-ジイソプロピルカルボジイミド、及びN-エチ
ル-N'-(3-ジメチルアミノプロリル)カルボジイミドの
ようなカルボジイミド類に代表される蛋白質合成に使用
できる各種活性化試薬を用いることができる。これらに
よる活性化にはラセミ化抑制添加剤(例えば、HOBt, HO
OBt)とともに保護アミノ酸を直接樹脂に添加するかまた
は、対称酸無水物またはHOBtエステルあるいはHOOBtエ
ステルとしてあらかじめ保護アミノ酸の活性化を行なっ
た後に樹脂に添加することができる。
【0030】保護アミノ酸の活性化や樹脂との縮合に用
いられる溶媒としては、酸アミド類、ハロゲン化炭化水
素類、アルコール類、スルオキシド類、及びエーテル類
等、当業界において蛋白質縮合反応に使用しうることが
知られている溶媒から適宜選択されうる。反応温度は蛋
白質結合形成反応に使用され得ることが知られている範
囲から適宜選択され、通常約−20℃〜50℃の範囲か
ら適宜選択される。活性化されたアミノ酸誘導体は通常
1.5〜4倍過剰で用いられる。ニンヒドリン反応を用
いたテストの結果、縮合が不十分な場合には保護基の脱
離を行うことなく縮合反応を繰り返すことにより十分な
縮合を行なうことができる。反応を繰り返しても十分な
縮合が得られないときには、無水酢酸またはアセチルイ
ミダゾールを用いて未反応アミノ酸をアセチル化して、
後の反応に影響を及ぼさないようにすることができる。
原料の各アミノ基、カルボキシル基、及びセリン水酸基
等の保護基としても、当該技術分野において、通常使用
される基を使用することができる。原料の反応に関与す
べきでない官能基の保護ならびに保護基、およびその保
護基の脱離、反応に関与する官能基の活性化などは公知
の基または公知の手段から適宜選択しうる。
【0031】本発明の部分ペプチドまたはそれらの塩
は、当該技術分野において自体公知のペプチドの合成法
に従って、あるいは本発明の蛋白質を適当なペプチダー
ゼで切断することによって製造することができる。ペプ
チドの合成法としては、例えば、固相合成法、液相合成
法のいずれによっても良い。公知の縮合方法や保護基の
脱離としては、例えば、以下の(1)〜(3)に記載さ
れた方法が挙げられる。 (1)泉屋信夫他、ペプチド合成の基礎と実験、 丸善
(株) (1975年) (2)矢島治明 および榊原俊平、生化学実験講座 1、
蛋白質の化学IV、 205、(1977年) (3)矢島治明監修、続医薬品の開発 第14巻 ペプチド
合成 広川書店 反応後の精製も自体公知の方法、例えば、溶媒抽出・蒸
留・カラムクロマトグラフィー・液体クロマトグラフィ
ー・再結晶などを組み合わせて本発明の部分ペプチドを
精製単離することができる。上記方法で得られる部分ペ
プチドが遊離体である場合は、公知の方法によって適当
な塩に変換することができるし、逆に塩で得られた場合
は、公知の方法によって遊離体に変換することができ
る。
【0032】本発明ヒトポリペプチド(蛋白質)、その
部分ペプチドまたはそれらの塩に対する抗体は、それら
を認識し得るものであれば、ポリクローナル抗体、モノ
クローナル抗体の何れであってもよい。本発明ヒトポリ
ペプチド(蛋白質)、その部分ペプチドまたはそれらの
塩に対する抗体は、本発明ヒトポリペプチド(蛋白質)
を抗原として用い、公知の抗体または抗血清の製造法に
従って製造することができる。本発明の抗体は、体液や
組織などの被検体中に存在する本発明ヒトポリペプチド
(蛋白質)等を検出するために使用することができる。
また、これらを精製するために使用する抗体カラムの作
製、精製時の各分画中の本発明ヒトポリペプチド(蛋白
質)の検出、被検細胞内における本発明ヒトポリペプチ
ド(蛋白質)の挙動の分析などのために使用することが
できる。
【0033】更に、本発明の抗体は、公知の方法による
被検液中の本発明ヒトポリペプチド(蛋白質)等の定
量、特に、モノクローナル抗体を使用したサンドイッチ
免疫測定法による定量、及び組織染色等による検出など
に使用することができる。それによって、例えば、本発
明ヒトポリペプチド(蛋白質)等が関与する疾病の診断
を行なうことができる。これらの目的には、抗体分子そ
のものを用いてもよく、また、抗体分子のF(ab')2
、Fab'、あるいはFab画分を用いてもよい。本発
明の抗体を用いる本発明の蛋白質等の定量法は、特に制
限されるべきものではなく、被測定液中の抗原量(例え
ば、蛋白質量)に対応した抗体、抗原もしくは抗体−抗
原複合体の量を化学的または物理的手段により検出し、
これを既知量の抗原を含む標準液を用いて作製した標準
曲線より算出する測定法であれば、いずれの測定法を用
いてもよい。例えば、ネフロメトリー、競合法、イムノ
メトリック法およびサンドイッチ法が好適に用いられる
が、感度、特異性の点で、後述するサンドイッチ法を用
いるのが好ましい。標識物質を用いる測定法に用いられ
る標識剤としては、当該技術分野で公知の、例えば、放
射性同位元素、酵素、蛍光物質、発光物質などを用いる
ことが出来る。
【0034】これらの測定・検出方法に関する一般的な
技術手段の詳細については、総説、成書などを参照する
ことができる。例えば、入江 寛編「続ラジオイムノア
ッセイ〕(講談社、昭和54年発行)、石川栄治ら編
「酵素免疫測定法」(第3版)(医学書院、昭和62年
発行)、「Methods in ENZYMOLOGY」Vol. 70(Immunoche
mical Techniques(Part A))、 同書 Vol. 73(Immunoche
mical Techniques(PartB))、 同書 Vol. 74(Immunochem
ical Techniques(Part C))、 同書 Vol. 84(Immunochem
ical Techniques(Part D:Selected Immunoassays))、
同書 Vol. 92(Immunochemical Techniques(Part E:Mono
clonal Antibodies and General Immunoassay Method
s))、 同書 Vol. 121(Immunochemical Techniques(Part
I:HybridomaTechnology and Monoclonal Antibodies))
(以上、アカデミックプレス社発行)などを参照すること
ができる。
【0035】本発明ヒトポリペプチド(蛋白質)又はそ
の部分ペプチドをコードするDNAに実質的に相補的な
塩基配列を有するアンチセンスDNAとしては、当該D
NAの塩基配列に実質的に相補的な塩基配列を有し、該
DNAの発現を抑制し得る作用を有するものであれば、
いずれのアンチセンスDNAであってもよい。実質的に
相補的な塩基配列とは、例えば、本発明ヒトDNAに相
補的な塩基配列の全塩基配列または部分塩基配列と約9
5%以上、最も好ましくは100%の相同性を有する塩
基配列などが挙げられる。又、これらアンチセンスDN
Aと同様の作用を有する核酸配列(RNAまたはDNA
の修飾体)も本発明でいうアンチセンスDNAに含まれ
る。これらのアンチセンスDNAは、公知のDNA合成
装置などを用いて製造することができる。
【0036】更に、本発明ヒトポリペプチド(蛋白質)
等は、これら物質の活性を阻害する化合物またはその塩
のスクリーニングのための試薬として有用である。すな
わち、本発明は、本発明ヒトポリペプチド(蛋白質)、
その部分ペプチドまたはそれらの塩を用いることを特徴
とする、該物質又はそれらの塩の活性を阻害する化合物
(以下、「阻害剤」ともいう)のスクリーニング方法、
及びその為のスクリーニング用キットを提供する。本発
明のスクリーニング方法またはスクリーニング用キット
を用いて得られる化合物またはその塩は、上記した試験
化合物から選ばれた化合物であり、本発明ヒトポリペプ
チド(蛋白質)等の生物学的活性を阻害する化合物であ
る。該化合物またはその塩は、本発明の蛋白質等の活性
を直接阻害するものであってもよいし、本発明ヒトポリ
ペプチド(蛋白質)等の発現を阻害することによって間
接的に本発明ヒトポリペプチド(蛋白質)等の活性を阻
害するものであってもよい。該化合物の塩としては、例
えば、薬学的に許容可能な塩などが用いられる。例え
ば、無機塩基との塩、有機塩基との塩、無機酸との塩、
有機酸との塩、塩基性または酸性アミノ酸との塩などが
あげられる。本発明ヒトポリペプチド(蛋白質)等の生
物学的活性を阻害する化合物も上記各種疾病に対する治
療・予防剤などの医薬として使用できる可能性がある。
【0037】本発明ヒトDNA及び該DNAを含むファ
ット3遺伝子をプローブとして使用することにより、ヒ
トにおけるファット3又はその部分ペプチドをコードす
るDNAまたはmRNAの異常(遺伝子異常)を検出す
ることができるので、例えば、該DNAまたはmRNA
の損傷、突然変異あるいは発現低下や、該DNAまたは
mRNAの増加あるいは発現過多などの遺伝子診断剤と
して有用である。本発明のDNAを用いる上記の遺伝子
診断は、例えば、公知のノーザンハイブリダイゼーショ
ンやPCR−SSCP法(Genomics,第5巻,874〜
879頁(1989年)、Proceedings of the Nationa
l Academy of Sciences of the UnitedStates of Ameri
ca,第86巻,2766〜2770頁(1989年))
などにより実施することができる。更に、ファット3遺
伝子に異常があったり、欠損している場合あるいは発現
量が減少している場合、生体内において正常な機能を発
揮できない患者に対しては、公知手段に従って(1)レ
トロウイルスベクター、アデノウイルスベクター、アデ
ノウイルスアソシエーテッドウイルスベクターなどの適
当なベクターをベヒクルとして使用する遺伝子治療によ
って、本発明ヒトDNA又はファット遺伝子を該患者体
内に導入し、発現させるか、又は(2)本発明の蛋白質
等を該患者に注入すること等によって、該患者において
本発明の蛋白質等の機能を発揮させることができるもの
と考えられる。本発明ヒトDNA又はファット3遺伝子
を、該DNAを単独、又は、摂取促進のための補助剤と
ともに、遺伝子銃やハイドロゲルカテーテルのようなカ
テーテルによって投与することも可能である。
【0038】尚、以上に述べたヒトDNA及びヒトポリ
ペプチドに関する各操作は、本発明のラットファット3
遺伝子及びラットファット3蛋白質にも同様に応用する
ことが可能である。又、本明細書および図面において、
塩基やアミノ酸などを略号で表示する場合、IUPAC
−IUB Commision on Biochemical Nomenclature に
よる略号あるいは当該分野における慣用略号に基づくも
のであり、またアミノ酸に関し光学異性体があり得る場
合は、特に明示しなければL体を示すものとする。
【0039】本願明細書の配列表の配列番号は、以下の
配列を示す。 〔配列番号:1〕ヒトファット3蛋白質のC末端側の一
部分である本発明ヒトポリペプチドのアミノ酸配列(ア
ミノ酸数:1097)を示す。 〔配列番号:2〕配列番号:1で示されるアミノ酸配列
を有する本発明ヒトポリペプチドをコードするDNAの
塩基配列を含む、クローンfh00385の全塩基配列(53
39塩基対)を示す。 〔配列番号:3〕ラットファット3蛋白質のアミノ酸配
列(アミノ酸数:4555)を示す。 〔配列番号:4〕配列番号:クローンrFAT3F, rFAT3S
及び rFAT3T から得られた、3で示されるアミノ酸配列
を有する本発明ラットファット3蛋白質をコードするD
NAの塩基配列を含む全塩基配列(14530塩基対)
を示す。
【0040】
【実施例】以下に、実施例により本発明をさらに具体的
に説明するが、本発明はそれに限定されるものではな
い。なお、実施例における各種遺伝子操作は、Molecula
r cloning 2nd.ed.(Cold Spring Harbor Lab.Press,1
989)に記載されている方法に従った。
【0041】
【実施例1】(1)ヒト胎児脳由来cDNAライブラリ
ーの構築 NotI部位を有するオリゴヌクレオチド(GACTA
GTTCTAGATCGCGAGCGGCCGCCC
(T)15)(ギブコBRL社)をプライマーとして、
ヒト脳由来mRNA(クローンテック社)を鋳型にSupe
rScriptII逆転写酵素キット(ギブコBRL社)で2本
鎖cDNAを合成した。SalI部位を有するアダプタ
ー(ギブコBRL社)をcDNAとライゲーションし
た。その後、NotI消化し、1%濃度の低融解アガロ
ース電気泳動により、3kb以上のDNA断片を精製し
た。精製cDNA断片を、SalI−NotI制限酵素
処理したpBluescript IISK+ プラスミドとライゲーシ
ョンした。大腸菌 ElectroMax DH10B 株(ギブコBRL
社)にエレクトロポレーション法によりこの組換えプラ
スミドを導入した。次いで、こうして構築したcDNA
ライブラリーから、約45,000個の組換え体を選択し、in
vitro翻訳系を用い、50kDa以上の蛋白質を発現できるc
DNAクローンを4,500個、選択を行なった(Ishikawa, K.-
I. et. al. 1997 DNA RES. 5:307-313 )。次に、この4,
500個のクローンの両末端DNA配列を決定した。この中か
ら、新規遺伝子を含む500個のクローンのcDNAに関して
の全塩基配列の決定を行なった。配列決定には、PEア
プライドバイオシステム社製のDNAシークエンサー
(ABI PRISM377)と同社製反応キットを使用した。大部
分の配列はショットガンクローンをダイターミネーター
法を用いて決定した。一部の塩基配列については、決定
した塩基配列を元にしてオリゴヌクレオチドを合成し、
プライマーウォーキング法で決定した。
【0042】(2)ホモロジー検索による本発明DNA
を含むクローンの決定 次に、こうして得られた全塩基配列に基づき、DNA解析
プログラム(Fasta & Blast)を用いたホモロジー検索を
実施したところ、公開されているデータベースの中のヒ
トファット1及びヒトファット2と高いホモロジーを示
す候補クローンfh00385が見出された。更に、別のDNA解
析プログラム(BESTFIT)を用いて、このクローンfh00385
とヒトファット1及びヒトファット2の塩基配列を比較
したところ、全塩基配列において、アミノ酸レベルでそ
れぞれ約43%と約38%のホモロジーを示し、DNA
レベルでは約59%と約58%のホモロジーを示す本発
明DNAをクローンfh00385が有していることが判明し
た。因みに,ヒトファット1とヒトファット2とのホモ
ロジーは、アミノ酸レベル及びDNAレベルで、夫々約
44%及び約56%である。
【0043】(3)ラットファット3遺伝子 まず、胎生15日目のラット胎児脳より精製を行ったR
NAを用いて、小原他の方法(DNA Research Vol.4,53
−59(1997))に従って調製したcDNAライブラリー
から、配列番号2で示してあるヒトファット3DNAを
プローブとして用いてコロニーハイブリダイゼーション
法にて相同性クローニングを行ない、クローンを得た。
次に、ラットファット3遺伝子の全領域を取得するため
に、上記の方法で得られたクローンrFAT3Fの塩基配列を
基にプライマーを調製し、プライマーと胎生15日目の
ラット胎児脳より得られたRNAとハイブリダイゼーシ
ョンを行った後に、逆転写反応を行うことにより最初の
クローンrFAT3Fの上流側(遺伝子の5’側)の領域を含
むcDNAを特異的に合成した。この遺伝子の5’側領
域を含むcDNAをプラスミドに挿入した後、クローン
rFAT3Fの一部分をプローブとしてコロニーハイブリダイ
ゼーション法で相同性クローニングを行った。このよう
にして得られたクローンrFAT3S の全塩基配列を決定し
た。更に、上記方法を繰り返すことにより、クローンrF
AT3T を取得し、この全塩基配列を決定した。このよう
にして、本発明のラットファット3遺伝子の全領域を取
得した。
【0044】DNA/蛋白質解析プログラム(BESTFIT)を用
いて、本発明ラットファット3遺伝子とヒトファット3
遺伝子と比較したところ、アミノ酸レベル及びDNAレ
ベルでそれぞれ93%と84%と高いホモロジーを示し
た。因みに、DNA/蛋白質解析プログラム(BESTFIT)を用
いて、本発明ラットファット3遺伝子とヒトファット1
遺伝子と比較したところ、アミノ酸レベル及びDNAレ
ベルでそれぞれ53%と60%のホモロジーを示した。
又、本発明ラットファット3遺伝子とヒトファット2遺
伝子と比較したところ、アミノ酸レベル及びDNAレベ
ルでそれぞれ40%と56%のホモロジーを示した。次
に、本発明ラットファット3遺伝子とラットファット1
遺伝子と比較したところ、アミノ酸レベル及びDNAレ
ベルでそれぞれ53%と60%のホモロジーを示した。
又、本発明ラットファット3遺伝子とラットファット2
遺伝子と比較したところ、アミノ酸レベル及びDNAレ
ベルでそれぞれ44%と55%のホモロジーを有してい
ることが判明した。因みに、ラットファット1遺伝子と
ラットファット2遺伝子とのホモロジーは、アミノ酸レ
ベル及びDNAレベルで、夫々46%及び57%であ
る。
【0045】(4)モチーフ検索 更に,本発明DNAに関して、PROSITE databaseを検索
するための蛋白質解析プログラムである pftools (Bair
och A, Bucher P, Hofmann K, Nucleic AcidsRes. 1997
Jan 1;25(1):217-21)、及びPfam databaseを検索する
ための蛋白質解析プログラムhmmer 2.1(Sonnhammer, E.
L. L., Eddy, S. R., Birney, E., Bateman, A., and
Durbin, R., Nucleic Acids Res 1998; 26, 320-322)
を用いてモチーフ検索を行なった (Suyama et. al. 199
9 Nucleic Acids Res. 27: 338-339)。本発明ヒトDN
Aは、5339塩基対あり、1097個のアミノ酸から
なる蛋白質をコードしている。現在、取得している本発
明ヒトポリペプチドである部分配列の分子構造は、N末
端側から1個のカドヘリンドメイン(アミノ酸配列番号
69-152)、1個のEGF様モチーフ(アミノ酸配列番
号307-340)、ラミニンGドメイン(アミノ酸配列
番号373-505)、更に3つのEGF様ドメイン(アミ
ノ酸配列番号533-565、572-603、610-
641)、1つの膜貫通ドメイン(アミノ酸配列番号66
3-684)、及び細胞内ドメイン(アミノ酸配列番号685-1
097)から構成されていることが判明した。一方、上記
(3)で得られたラットの全長のcDNAをPfamで解析した
結果から、ラットファット3蛋白質は33個のカドヘリ
ンドメイン、4個のEGF様ドメイン及び1個のラミニンG
ドメインを持つ4555アミノ酸からなる巨大な蛋白質
であることが判明した。既に記載したように、本発明ポ
リペプチド(ヒトファット3遺伝子)とラットファット
3遺伝子はアミノ酸及びDNAレベルで高いホモロジー
を示し、更に、上記のように、それぞれのドメイン構造
も全く同じであるので、本発明ヒトDNAはヒトファッ
ト3遺伝子の一部であり、そのアミノ酸配列から、互い
に同様の機能を有し、これらがコードする蛋白質はカル
シウムに結合し、カルシウムによる機能の調節が行なわ
れていることが予測される。
【0046】又、RT−ELISA方法(Nagase T, Is
hikawa K, Suyama M, Kikuno R, Miyajima N, Tanaka
A, Kotani H, Nomura N, Ohara O, DNA Res 1998 5:277
-286)により分析した結果、胎児の脳でもっとも強く多
く発現していることが明らかになった。更に、GeneBrid
ge 4 radiation hybrid panel (Research Genetics, In
c.)を使用したRHマッピング(Radiation Hybrid) (1. D.
Cox, M. Burmeister, et al.(1990). Science 250: 2
45-250; 2. M. James, C. Richard III, et al. (199
4)., Nature Genetics 8: 70-75.; 3. M. Boehnke, K.
Lange, and D. Cox (1991). Am. J. Hum. Genet. 49:
1174-1188)の結果から、本発明DNAはマーカーAFM248
MC9に最も近くマップされ、遺伝子座は、11q14であるこ
とが判明した。
【0047】
【発明の効果】これらのことから、本発明に係る新規フ
ァット(fat)3遺伝子は、神経疾患を含めた先天性奇
形症候群を診断、治療する上で必要不可欠な役割を果た
すと考えられる。又、本発明に係るDNA配列およびそ
の遺伝子座を明らかにしたことにより、候補遺伝子解析
法(candidate gene analysis)を用いてこの遺伝子が責
任遺伝子である病気の同定は飛躍的に簡便になった。ま
た、ノーザンハイブリダイゼーションによる各組織によ
る発現のパターンの情報は、神経疾患を含めた先天性奇
形症候群を診断、治療する上で非常に有益な知見であ
る。このように、本発明ヒトDNA及び該DNAを含む
ファット3遺伝子、それらがコードするポリペプチド又
は蛋白質、該蛋白質に対する抗体、アンチセンスDNA
等は、神経疾患を含めた先天性奇形症候群を治療する為
の各種治療・予防方法に医薬として使用することが考え
られる。
【0048】
【配列表】 SEQUENCE LISTING <110> Kazusa DNA Research Institute <120> Novel Fat gene and the protein encoded by said gene <160> 4 <210> 1 <211> 1097 <212> PRT <213> Homo Sapiens <400> Glu Glu Phe Val Leu Asp Pro His Gly Ile Leu Arg Ser Ala Val 15 5 10 15 Val Phe Gln His Thr Glu Ser Leu Glu Tyr Val Leu Cys Val Gln 30 20 25 30 Ala Lys Asp Ser Gly Lys Pro Gln Gln Val Ser His Thr Tyr Ile 45 35 40 45 Arg Val Arg Val Ile Glu Glu Ser Thr His Lys Pro Thr Ala Ile 60 50 55 60 Pro Leu Glu Ile Phe Ile Val Thr Met Glu Asp Asp Phe Pro Gly 75 65 70 75 Gly Val Ile Gly Lys Ile His Ala Thr Asp Gln Asp Met Tyr Asp 90 80 85 90 Val Leu Thr Phe Ala Leu Lys Ser Glu Gln Lys Ser Leu Phe Lys 105 95 100 105 Val Asn Ser His Asp Gly Lys Ile Ile Ala Leu Gly Gly Leu Asp 120 110 115 120 Ser Gly Lys Tyr Val Leu Asn Val Ser Val Ser Asp Gly Arg Phe 135 125 130 135 Gln Val Pro Ile Asp Val Val Val His Val Glu Gln Leu Val His 150 140 145 150 Glu Met Leu Gln Asn Thr Val Thr Ile Arg Phe Glu Asn Val Ser 165 155 160 165 Pro Glu Asp Phe Val Gly Leu His Met His Gly Phe Arg Arg Thr 180 170 175 180 Leu Arg Asn Ala Val Leu Thr Gln Lys Gln Asp Ser Leu Arg Ile 185 190 195 Ile Ser Ile Gln Pro Val Ala Gly Thr Asn Gln Leu Asp Met Leu 210 200 205 210 Phe Ala Val Glu Met His Ser Ser Glu Phe Tyr Lys Pro Ala Tyr 225 215 220 225 Leu Ile Gln Lys Leu Ser Asn Ala Arg Arg His Leu Glu Asn Ile 240 230 235 240 Met Arg Ile Ser Ala Ile Leu Glu Lys Asn Cys Ser Gly Leu Asp 255 245 250 255 Cys Gln Glu Gln His Cys Glu Gln Gly Leu Ser Leu Asp Ser His 270 260 265 270 Ala Leu Met Thr Tyr Ser Thr Ala Arg Ile Ser Phe Val Cys Pro 285 275 280 285 Arg Phe Tyr Arg Asn Val Arg Cys Thr Cys Asn Gly Gly Leu Cys 300 290 295 300 Pro Gly Ser Asn Asp Pro Cys Val Glu Lys Pro Cys Pro Gly Asp 315 305 310 315 Met Gln Cys Val Gly Tyr Glu Ala Ser Arg Arg Pro Phe Leu Cys 330 320 325 330 Gln Cys Pro Pro Gly Lys Leu Gly Glu Cys Ser Gly His Thr Ser 345 335 340 345 Leu Ser Phe Ala Gly Asn Ser Tyr Ile Lys Tyr Arg Leu Ser Glu 360 350 355 360 Asn Ser Lys Glu Glu Asp Phe Lys Leu Ala Leu Arg Leu Arg Thr 375 365 370 375 Leu Gln Ser Asn Gly Ile Ile Met Tyr Thr Arg Ala Asn Pro Cys 390 380 385 390 Ile Ile Leu Lys Ile Val Asp Gly Lys Leu Trp Phe Gln Leu Asp 405 395 400 405 Cys Gly Ser Gly Pro Gly Ile Leu Gly Ile Ser Gly Arg Ala Val 420 410 415 420 Asn Asp Gly Ser Trp His Ser Val Phe Leu Glu Leu Asn Arg Asn 435 425 430 435 Phe Thr Ser Leu Ser Leu Asp Asp Ser Tyr Val Glu Arg Arg Arg 450 440 445 450 Ala Pro Leu Tyr Phe Gln Thr Leu Ser Thr Glu Ser Ser Ile Tyr 465 455 460 465 Phe Gly Ala Leu Val Gln Ala Asp Asn Ile Arg Ser Leu Thr Asp 480 470 475 480 Thr Arg Val Thr Gln Val Leu Ser Gly Phe Gln Gly Cys Leu Asp 495 485 490 495 Ser Val Ile Leu Asn Asn Asn Glu Leu Pro Leu Gln Asn Lys Arg 510 500 505 510 Ser Ser Phe Ala Glu Val Val Gly Leu Thr Glu Leu Lys Leu Gly 525 515 520 525 Cys Val Leu Tyr Pro Asp Ala Cys Lys Arg Ser Pro Cys Gln His 540 530 535 540 Gly Gly Ser Cys Thr Gly Leu Pro Ser Gly Gly Tyr Gln Cys Thr 555 545 550 555 Cys Leu Ser Gln Phe Thr Gly Arg Asn Cys Glu Ser Glu Ile Thr 570 560 565 570 Ala Cys Phe Pro Asn Pro Cys Arg Asn Gly Gly Ser Cys Asp Pro 585 575 580 585 Ile Gly Asn Thr Phe Ile Cys Asn Cys Lys Ala Gly Leu Thr Gly 600 590 595 600 Val Thr Cys Glu Glu Asp Ile Asn Glu Cys Glu Arg Glu Glu Cys 615 605 610 615 Glu Asn Gly Gly Ser Cys Val Asn Val Phe Gly Ser Phe Leu Cys 630 620 625 630 Asn Cys Thr Pro Gly Tyr Val Gly Gln Tyr Cys Gly Leu Arg Pro 645 635 640 645 Val Val Val Pro Asn Ile Gln Ala Gly His Ser Tyr Val Gly Lys 660 650 655 660 Glu Glu Leu Ile Gly Ile Ala Val Val Leu Phe Val Ile Phe Ile 675 665 670 675 Leu Val Val Leu Phe Ile Val Phe Arg Lys Lys Val Phe Arg Lys 690 680 685 690 Asn Tyr Ser Arg Asn Asn Ile Thr Leu Val Gln Asp Pro Ala Thr 705 695 700 705 Ala Ala Leu Leu Asn Lys Ser Asn Gly Ile Pro Phe Arg Asn Leu 720 710 715 720 Arg Gly Ser Gly Asp Gly Arg Asn Val Tyr Gln Glu Val Gly Pro 735 725 730 735 Pro Gln Val Pro Val Arg Pro Met Ala Tyr Thr Pro Cys Phe Gln 750 740 745 750 Ser Asp Ser Arg Ser Asn Leu Asp Lys Ile Val Asp Gly Leu Gly 765 755 760 765 Gly Glu His Gln Glu Met Thr Thr Phe His Pro Glu Ser Pro Arg 780 770 775 780 Ile Leu Thr Ala Arg Arg Gly Val Val Val Cys Ser Val Ala Pro 795 785 790 795 Asn Leu Pro Ala Val Ser Pro Cys Arg Ser Asp Cys Asp Ser Ile 810 800 805 810 Arg Lys Asn Gly Trp Asp Ala Gly Thr Glu Asn Lys Gly Val Asp 825 815 820 825 Asp Pro Gly Glu Val Thr Cys Phe Ala Gly Ser Asn Lys Gly Ser 840 830 835 840 Asn Ser Glu Val Gln Ser Leu Ser Ser Phe Gln Ser Asp Ser Gly 855 845 850 855 Asp Asp Asn Ala Ser Ile Val Thr Val Ile Gln Leu Val Asn Asn 870 860 865 870 Val Val Asp Thr Ile Glu Asn Glu Val Ser Val Met Asp Gln Gly 885 875 880 885 Gln Asn Tyr Asn Arg Ala Tyr His Trp Asp Thr Ser Asp Trp Met 900 890 895 900 Pro Gly Ala Arg Leu Ser Asp Ile Glu Glu Val Pro Asn Tyr Glu 915 905 910 915 Asn Gln Asp Gly Gly Ser Ala His Gln Gly Ser Thr Arg Glu Leu 930 920 925 930 Glu Ser Asp Tyr Tyr Leu Gly Gly Tyr Asp Ile Asp Ser Glu Tyr 945 935 940 945 Pro Pro Pro His Glu Glu Glu Phe Leu Ser Gln Asp Gln Leu Pro 960 950 955 960 Pro Pro Leu Pro Glu Asp Phe Pro Asp Gln Tyr Glu Ala Leu Pro 975 965 970 975 Pro Ser Gln Pro Val Ser Leu Ala Ser Thr Leu Ser Pro Asp Cys 990 980 985 990 Arg Arg Arg Pro Gln Phe His Pro Ser Gln Tyr Leu Pro Pro His 1005 995 1000 1005 Pro Phe Pro Asn Glu Thr Asp Leu Val Gly Pro Pro Ala Ser Cys 1020 1010 1015 1020 Glu Phe Ser Thr Phe Ala Val Ser Met Asn Gln Gly Thr Glu Pro 1035 1025 1030 1035 Thr Gly Pro Ala Asp Ser Val Ser Leu Ser Leu His Asn Ser Arg 1050 1040 1045 1050 Gly Thr Ser Ser Ser Asp Val Ser Ala Asn Cys Gly Phe Asp Asp 1065 1055 1060 1065 Ser Glu Val Ala Met Ser Asp Tyr Glu Ser Val Gly Glu Leu Ser 1080 1070 1075 1080 Leu Ala Ser Leu His Ile Pro Phe Val Glu Thr Gln His Gln Thr 1095 1085 1090 1095 Gln Val 1097 <210> 2 <211> 5339 <212> DNA <213> Homo Sapiens <400> gag gag ttt gtg ttg gac cct cat ggg atc ttg cgg tcg gct gtg 45 Glu Glu Phe Val Leu Asp Pro His Gly Ile Leu Arg Ser Ala Val gtc ttc cag cac aca gag tct ctg gaa tac gtg ttg tgt gtc cag 90 Val Phe Gln His Thr Glu Ser Leu Glu Tyr Val Leu Cys Val Gln gca aag gat tca ggc aaa ccc cag caa gtt tct cac act tac atc 135 Ala Lys Asp Ser Gly Lys Pro Gln Gln Val Ser His Thr Tyr Ile cgc gtg cga gtc att gag gaa agc acc cac aag ccc aca gcc att 180 Arg Val Arg Val Ile Glu Glu Ser Thr His Lys Pro Thr Ala Ile ccc ctg gaa att ttc att gtc acc atg gag gat gac ttt cct ggt 225 Pro Leu Glu Ile Phe Ile Val Thr Met Glu Asp Asp Phe Pro Gly ggg gtc att ggg aag att cat gcc aca gat caa gac atg tat gat 270 Gly Val Ile Gly Lys Ile His Ala Thr Asp Gln Asp Met Tyr Asp gtg ctc aca ttt gcc ctg aaa tcg gag cag aaa agc tta ttt aaa 315 Val Leu Thr Phe Ala Leu Lys Ser Glu Gln Lys Ser Leu Phe Lys gtg aac agt cac gat ggg aaa atc atc gcc ctg gga ggc ctg gac 360 Val Asn Ser His Asp Gly Lys Ile Ile Ala Leu Gly Gly Leu Asp agc ggc aag tat gtc ctg aat gtg tct gtg agt gat ggt cgc ttc 405 Ser Gly Lys Tyr Val Leu Asn Val Ser Val Ser Asp Gly Arg Phe cag gta ccc att gat gtg gtc gtg cat gtg gag cag ttg gtg cat 450 Gln Val Pro Ile Asp Val Val Val His Val Glu Gln Leu Val His gag atg ctg cag aac act gtc acc atc cgc ttt gaa aat gtg tcc 495 Glu Met Leu Gln Asn Thr Val Thr Ile Arg Phe Glu Asn Val Ser cct gag gac ttc gtg ggg ctg cac atg cat ggg ttc cgg cgc acc 540 Pro Glu Asp Phe Val Gly Leu His Met His Gly Phe Arg Arg Thr ctg cgg aat gca gtc ctc acc cag aag cag gac agc ctg cgc atc 585 Leu Arg Asn Ala Val Leu Thr Gln Lys Gln Asp Ser Leu Arg Ile atc agc atc cag ccc gtg gca ggc acc aac caa ctg gac atg ctg 630 Ile Ser Ile Gln Pro Val Ala Gly Thr Asn Gln Leu Asp Met Leu ttt gcg gtg gag atg cac agc agc gag ttc tac aag cca gcc tac 675 Phe Ala Val Glu Met His Ser Ser Glu Phe Tyr Lys Pro Ala Tyr ctg atc cag aag ctg tcc aat gct aga aga cac ctg gag aat atc 720 Leu Ile Gln Lys Leu Ser Asn Ala Arg Arg His Leu Glu Asn Ile atg cgc atc tca gcc atc ttg gag aag aac tgc tca ggg ctg gac 765 Met Arg Ile Ser Ala Ile Leu Glu Lys Asn Cys Ser Gly Leu Asp tgt cag gaa cag cat tgt gag caa ggc ttg tca ctc gat tcc cac 810 Cys Gln Glu Gln His Cys Glu Gln Gly Leu Ser Leu Asp Ser His gcg ctc atg acc tac agc acg gct cgc atc agc ttt gtg tgt ccg 855 Ala Leu Met Thr Tyr Ser Thr Ala Arg Ile Ser Phe Val Cys Pro cgt ttc tac agg aac gtg cgt tgc acc tgc aat gga gga ctg tgt 900 Arg Phe Tyr Arg Asn Val Arg Cys Thr Cys Asn Gly Gly Leu Cys ccg ggg tcc aac gat cct tgt gtg gag aag ccg tgt cca ggg gac 945 Pro Gly Ser Asn Asp Pro Cys Val Glu Lys Pro Cys Pro Gly Asp atg cag tgt gtc ggt tat gaa gcc agc agg aga ccg ttc ctc tgc 990 Met Gln Cys Val Gly Tyr Glu Ala Ser Arg Arg Pro Phe Leu Cys cag tgt cca cca ggg aag ctc gga gag tgc tca ggg cac act tct 1035 Gln Cys Pro Pro Gly Lys Leu Gly Glu Cys Ser Gly His Thr Ser ctc agc ttt gct gga aac agt tac atc aaa tat cgg ctt tct gaa 1080 Leu Ser Phe Ala Gly Asn Ser Tyr Ile Lys Tyr Arg Leu Ser Glu aat agc aaa gaa gag gat ttc aaa cta gct ctg cgt ctt cga aca 1125 Asn Ser Lys Glu Glu Asp Phe Lys Leu Ala Leu Arg Leu Arg Thr ctg caa agc aat ggg att ata atg tac acc aga gca aat ccc tgc 1170 Leu Gln Ser Asn Gly Ile Ile Met Tyr Thr Arg Ala Asn Pro Cys ata att ctg aag att gtg gat ggc aag ctg tgg ttc cag ctg gac 1215 Ile Ile Leu Lys Ile Val Asp Gly Lys Leu Trp Phe Gln Leu Asp tgc ggc agc ggc cct gga atc ttg ggc atc tcg ggc cgt gct gtc 1260 Cys Gly Ser Gly Pro Gly Ile Leu Gly Ile Ser Gly Arg Ala Val aac gac ggg agc tgg cac tcg gtc ttc ctg gag ctc aac cgc aat 1305 Asn Asp Gly Ser Trp His Ser Val Phe Leu Glu Leu Asn Arg Asn ttc acg agc ctg tcc ctg gat gac agc tac gtg gag cgg cgc cgg 1350 Phe Thr Ser Leu Ser Leu Asp Asp Ser Tyr Val Glu Arg Arg Arg gcg ccc ctc tac ttc cag acg ctg agc act gag agt agc atc tac 1395 Ala Pro Leu Tyr Phe Gln Thr Leu Ser Thr Glu Ser Ser Ile Tyr ttc ggc gcc ctg gtg caa gcg gat aac atc cgc agc ctg act gac 1440 Phe Gly Ala Leu Val Gln Ala Asp Asn Ile Arg Ser Leu Thr Asp acg cgg gtc acg cag gtg ctc agc ggc ttc cag ggc tgc ctg gac 1485 Thr Arg Val Thr Gln Val Leu Ser Gly Phe Gln Gly Cys Leu Asp tcg gtg ata ctg aat aac aat gag ctg ccg ctg cag aac aag cgc 1530 Ser Val Ile Leu Asn Asn Asn Glu Leu Pro Leu Gln Asn Lys Arg agc agc ttc gcg gag gtg gtg ggc ctg acg gag ctg aag ctg ggc 1575 Ser Ser Phe Ala Glu Val Val Gly Leu Thr Glu Leu Lys Leu Gly tgc gtg ctc tat ccc gac gcc tgc aag cgc agc ccg tgc cag cac 1620 Cys Val Leu Tyr Pro Asp Ala Cys Lys Arg Ser Pro Cys Gln His ggg ggc agc tgc act ggc ctg cca tcg ggg ggc tat cag tgt acc 1665 Gly Gly Ser Cys Thr Gly Leu Pro Ser Gly Gly Tyr Gln Cys Thr tgt ctc tca cag ttt acg ggg aga aac tgt gaa tct gag att aca 1710 Cys Leu Ser Gln Phe Thr Gly Arg Asn Cys Glu Ser Glu Ile Thr gcc tgc ttc cca aac ccc tgc cgg aat gga gga tcc tgc gat cca 1755 Ala Cys Phe Pro Asn Pro Cys Arg Asn Gly Gly Ser Cys Asp Pro ata gga aac act ttc atc tgc aat tgt aaa gct ggg ctc act gga 1800 Ile Gly Asn Thr Phe Ile Cys Asn Cys Lys Ala Gly Leu Thr Gly gtc acg tgt gag gag gac atc aat gag tgc gaa cga gag gag tgt 1845 Val Thr Cys Glu Glu Asp Ile Asn Glu Cys Glu Arg Glu Glu Cys gag aac gga ggc tcc tgc gtg aac gtg ttc ggc tcc ttc ctc tgc 1890 Glu Asn Gly Gly Ser Cys Val Asn Val Phe Gly Ser Phe Leu Cys aac tgc acg ccg ggc tac gtg ggc cag tac tgc ggg ctg cgc ccc 1935 Asn Cys Thr Pro Gly Tyr Val Gly Gln Tyr Cys Gly Leu Arg Pro gtg gtg gta ccc aat atc cag gct ggc cac tcc tac gtg ggg aag 1980 Val Val Val Pro Asn Ile Gln Ala Gly His Ser Tyr Val Gly Lys gag gag ctc atc ggc atc gcc gtg gtc ctc ttc gtc atc ttc atc 2025 Glu Glu Leu Ile Gly Ile Ala Val Val Leu Phe Val Ile Phe Ile ctg gtg gtt ctc ttc ata gtc ttc cgc aag aag gtc ttc cgc aag 2070 Leu Val Val Leu Phe Ile Val Phe Arg Lys Lys Val Phe Arg Lys aac tac tcc cgc aac aac atc acg cta gtg cag gac ccg gcc acc 2115 Asn Tyr Ser Arg Asn Asn Ile Thr Leu Val Gln Asp Pro Ala Thr gcc gcc ctg ctt aac aag agc aat ggc atc ccg ttc cgg aac ctg 2160 Ala Ala Leu Leu Asn Lys Ser Asn Gly Ile Pro Phe Arg Asn Leu cgc ggc agt ggg gac ggc cgc aac gtc tac cag gag gtg ggg ccc 2205 Arg Gly Ser Gly Asp Gly Arg Asn Val Tyr Gln Glu Val Gly Pro ccg cag gtc ccc gtg cgc ccc atg gcc tac aca ccc tgc ttc cag 2250 Pro Gln Val Pro Val Arg Pro Met Ala Tyr Thr Pro Cys Phe Gln agt gac tcc agg agc aac ctg gat aag atc gtg gac ggg ctg gga 2295 Ser Asp Ser Arg Ser Asn Leu Asp Lys Ile Val Asp Gly Leu Gly ggc gag cac cag gaa atg acc acg ttt cac cct gag tcg ccc cgc 2340 Gly Glu His Gln Glu Met Thr Thr Phe His Pro Glu Ser Pro Arg atc ctg aca gcc cgg cgg ggc gtg gtc gtg tgc agt gtg gcc ccc 2385 Ile Leu Thr Ala Arg Arg Gly Val Val Val Cys Ser Val Ala Pro aac ctc ccc gcc gtg tca ccc tgc cgc tcc gac tgc gac tcc atc 2430 Asn Leu Pro Ala Val Ser Pro Cys Arg Ser Asp Cys Asp Ser Ile cgg aag aat ggc tgg gac gcg gga act gag aac aaa ggg gtt gat 2475 Arg Lys Asn Gly Trp Asp Ala Gly Thr Glu Asn Lys Gly Val Asp gac ccg gga gaa gtg acc tgc ttt gca ggt agt aat aaa ggc agc 2520 Asp Pro Gly Glu Val Thr Cys Phe Ala Gly Ser Asn Lys Gly Ser aac tct gaa gtt cag tcc ctc agc tcc ttc cag tca gat tct ggt 2565 Asn Ser Glu Val Gln Ser Leu Ser Ser Phe Gln Ser Asp Ser Gly gac gac aat gcc tcc ata gtg act gtc att cag ctt gtc aac aat 2610 Asp Asp Asn Ala Ser Ile Val Thr Val Ile Gln Leu Val Asn Asn gta gtt gac act ata gag aat gaa gtg tct gtc atg gac caa gga 2655 Val Val Asp Thr Ile Glu Asn Glu Val Ser Val Met Asp Gln Gly cag aac tac aac cga gcc tat cac tgg gac acc tct gat tgg atg 2700 Gln Asn Tyr Asn Arg Ala Tyr His Trp Asp Thr Ser Asp Trp Met cca ggg gcc cgc ctg tcg gac ata gag gaa gtg ccc aac tat gag 2745 Pro Gly Ala Arg Leu Ser Asp Ile Glu Glu Val Pro Asn Tyr Glu aac cag gat gga ggg tct gca cac cag ggg agc aca cgg gag ctg 2790 Asn Gln Asp Gly Gly Ser Ala His Gln Gly Ser Thr Arg Glu Leu gag agc gat tac tac ctg ggt ggt tat gac att gac agt gaa tac 2835 Glu Ser Asp Tyr Tyr Leu Gly Gly Tyr Asp Ile Asp Ser Glu Tyr cca ccc cct cat gaa gag gag ttc ttg agt cag gac cag ctg cct 2880 Pro Pro Pro His Glu Glu Glu Phe Leu Ser Gln Asp Gln Leu Pro cct cct ctc cca gag gac ttc cca gac caa tat gag gcc ctg cca 2925 Pro Pro Leu Pro Glu Asp Phe Pro Asp Gln Tyr Glu Ala Leu Pro ccc tcc cag cct gtc tcc ctg gcc agc aca ctg agc cca gac tgc 2970 Pro Ser Gln Pro Val Ser Leu Ala Ser Thr Leu Ser Pro Asp Cys agg aga agg ccc cag ttt cat cct agc cag tat ctc cct cct cac 3015 Arg Arg Arg Pro Gln Phe His Pro Ser Gln Tyr Leu Pro Pro His cca ttc ccc aac gaa acg gat ttg gtg ggc ccg cct gcc agc tgt 3060 Pro Phe Pro Asn Glu Thr Asp Leu Val Gly Pro Pro Ala Ser Cys gaa ttt agt act ttt gct gtg agc atg aac cag ggc aca gag ccc 3105 Glu Phe Ser Thr Phe Ala Val Ser Met Asn Gln Gly Thr Glu Pro aca ggc cca gca gac agc gtg tct ctg tcc ttg cac aat tcc aga 3150 Thr Gly Pro Ala Asp Ser Val Ser Leu Ser Leu His Asn Ser Arg ggc acc tca tcc tcg gat gtg tct gcc aac tgc ggc ttt gac gat 3195 Gly Thr Ser Ser Ser Asp Val Ser Ala Asn Cys Gly Phe Asp Asp tcc gaa gta gcc atg agt gac tac gag agc gtg gga gag ctc agc 3240 Ser Glu Val Ala Met Ser Asp Tyr Glu Ser Val Gly Glu Leu Ser ctc gcc agc ctt cac att ccc ttt gtg gag act cag cat cag act 3285 Leu Ala Ser Leu His Ile Pro Phe Val Glu Thr Gln His Gln Thr caa gtg 3291 Gln Val tagacatcac atcttgggta cttcaccctg tttgttacag aaaagtggaa gcagattggc 3351 tgggcttctg tcccagtgga gcattgtctg tggaatgaga agggaatact gtatttttcc 3411 actagaaact tcttcacaag tcatactgtc ccaacaagca agcttgattc cagttgggtg 3471 aaaatgaaag gctcagaaat tgtttttgag aggtgactgg taatccttga tgtaggtacc 3531 tatgttcaca gctaaaaatg caaagaggga aaaattattt cacccactaa gttatacagc 3591 cagtcttgta tggctttgtg cagtattgtg ccctggaaag tgttacagca tcagtccttg 3651 cagtattaaa aactggcaac aatcaaagag gcattgttgc atgtaatttt gagccaatga 3711 aatgaaaata gtagtaatga ttgttggaaa agttagtctc ttaggcgaaa gagaagagaa 3771 acaaatatta ttaaacaaac cagaaaatgg gctgaagcct tttaaatcaa ctctattttt 3831 ttgataagct gcccaatttt cagctataaa attaggcttg aataacatgt ttagtatgct 3891 cagttatttc tgtttgtttg tgttaagcat ccaatctaat atagttgggt tttatgatct 3951 tcaagaaagg tatcaatgaa gagcaacatg aggctttttg ggttccattt ggtgggtggg 4011 ggaggaagtt aaagttgttt gaacattaga aagaatgtga ttatctggtt ggttttgtgt 4071 tttctggtaa atattccagt tggtaaatct aacattgcta cagaagttgg ctttgttcat 4131 atagcttctc tacaattaga tatttttaga agtttaagca aaactcacaa attcaggggg 4191 gaaaaaagaa aaaaacgata ccttcaaagt ttgcggccta gataatcaca attcttcata 4251 atgcagagga aaggtgtctg ttattctaaa tcggtagcat caccattata aatacaatta 4311 tgttaagaaa agaggaaagt agactagtta ttgtgtataa attataatag tgtgtgtgtg 4371 tctgggccta tgtacaaata tgtgcttgca ctcagtaagg ctgctcttga ggaaagctaa 4431 tgtgaaggtt ttgggaaatg gaccatgttg aaaattctgc cggcgagcat ggcatacctt 4491 tcaatttctc tgatctctat ggtgttagag aaacatcaaa tgccatattt tactctggtt 4551 cagttaactt tattttggta ctgccaataa agcaaaattg tgcttttttt ttttttctca 4611 agacagagtc ttgctctgtc acccaggcta gagtgcaatg gcatgatctc agctcactgc 4671 aatctccacc tcctgggttc aagcgattct cctgcctcag cctcccaggt tgctggggtt 4731 acaggtgtgt gccaccacgc ctggctaatt ttttgtattt ttagtagaga tggggtttca 4791 ccatgttggc caggctggtc tcaaactcct gacctcgtaa tccacctgcc gtggcctccc 4851 aaagtgctgg gattacaggc atgagccacc gtgcccagcc caaaactgtg ctttttaaaa 4911 acagtatttt gttataattt tccagaactt acctctgttt taaaagtgtg taatgtttga 4971 ttacaccctg ggattccctt ctcatctgtg ggctttggcc atgatttcca aaattaacag 5031 gagaatcatt ccactggaaa tataacaatc cagtcctcaa aactgaaagt tgacaggttg 5091 agggactttc cttttttgct tcaatcagat tacggccgcc tgtgcagtgg ccatggtaaa 5151 tatatgcata tttgcactat ctgcttaatg agcaaatctg tgtccacagt ttctgatgac 5211 atatggcatt ggtgtgtaaa ttgtactgtc cctagtctgt gcattattca ctcagacata 5271 tttttagtta tttcaattgc gtttaatcca cttctttttt atgagtcagt gtttctgaat 5331 gtttatgc 5339 <210> 3 <211> 4555 <212> PRT <213> Rattus norvegicus <400> Met Gly Val Thr Met Arg His Cys Ile Asp Thr Arg Pro Pro Ser 15 5 10 15 Cys Leu Ile Phe Leu Leu Leu Lys Leu Cys Ala Thr Val Ser Gln 30 20 25 30 Gly Leu Pro Gly Thr Gly Pro Leu Gly Phe His Phe Thr His Ala 45 35 40 45 Leu Tyr Asn Ala Thr Val Tyr Glu Asn Ser Ala Ala Arg Thr Tyr 60 50 55 60 Val Asn Ser Gln Ser Arg Met Gly Ile Thr Leu Ile Asp Leu Ser 75 65 70 75 Trp Asp Ile Lys Tyr Arg Ile Val Ser Gly Asp Glu Glu Gly Phe 90 80 85 90 Phe Lys Ala Glu Glu Val Ile Ile Ala Asp Phe Cys Phe Leu Arg 105 95 100 105 Ile Arg Thr Lys Gly Gly Asn Ser Ala Ile Leu Asn Arg Glu Ile 120 110 115 120 Gln Asp Asn Tyr Leu Leu Ile Ile Lys Gly Ser Val Arg Gly Glu 135 125 130 135 Asp Leu Glu Ala Trp Thr Lys Val Asn Ile Gln Val Leu Asp Met 150 140 145 150 Asn Asp Leu Arg Pro Leu Phe Ser Pro Thr Thr Tyr Ser Val Thr 165 155 160 165 Ile Ala Glu Ser Thr Pro Leu Arg Thr Ser Val Ala Gln Val Thr 180 170 175 180 Ala Thr Asp Ala Asp Ile Gly Ser Asn Gly Glu Phe Tyr Tyr Tyr 195 185 190 195 Phe Lys Asn Lys Val Asp Leu Phe Ser Val His Pro Thr Ser Gly 210 200 205 210 Val Ile Ser Leu Ser Gly Arg Leu Asn Tyr Asp Glu Lys Asn Arg 225 215 220 225 Tyr Asp Leu Glu Ile Leu Ala Val Asp Arg Gly Met Lys Leu Tyr 240 230 235 240 Gly Asn Asn Gly Val Ser Ser Thr Ala Lys Leu Tyr Val His Ile 255 245 250 255 Glu Arg Ile Asn Glu His Ala Pro Ile Ile His Val Val Thr His 270 260 265 270 Thr Pro Phe Ser Leu Asp Lys Glu Pro Thr Tyr Ala Val Val Thr 285 275 280 285 Val Asp Asp Leu Asp Glu Gly Ala Asn Gly Glu Ile Glu Ser Val 300 290 295 300 Ser Ile Val Asp Gly Asp Pro Leu Glu Gln Phe Phe Leu Ala Lys 315 305 310 315 Glu Gly Lys Trp Met Asn Glu Tyr Lys Val Lys Glu Arg Arg Gln 330 320 325 330 Val Asp Trp Glu Ser Phe Ser Tyr Gly Tyr Asn Leu Thr Ile Gln 345 335 340 345 Ala Lys Asp Lys Gly Ser Pro Gln Lys Phe Ser Glu Leu Lys Thr 360 350 355 360 Val His Ile Ala Asn Pro Arg Arg Asp Ser Thr Pro Ile Lys Phe 375 365 370 375 Glu Lys Asp Val Tyr Asp Ile Ser Ile Ser Glu Phe Ser Pro Pro 390 380 385 390 Gly Val Met Val Ala Ile Val Lys Val Asn Pro Glu Pro Leu Asp 405 395 400 405 Val Glu Tyr Lys Leu Leu Pro Gly Lys Asp Ala Glu Tyr Phe Lys 420 410 415 420 Ile Asn Pro Arg Ser Gly Leu Ile Val Thr Ala Gln Pro Leu Asn 435 425 430 435 Thr Val Lys Lys Glu Val Tyr Lys Leu Glu Val Ser Asp Lys Glu 450 440 445 450 Gly Asp Ala Lys Ala Gln Val Thr Ile Gly Ile Glu Asp Ala Asn 465 455 460 465 Asp His Thr Pro Glu Phe Gln Glu Thr Leu Tyr Glu Thr Phe Val 480 470 475 480 Asn Glu Ser Val Pro Val Gly Thr Asn Val Leu Thr Val Ser Ala 495 485 490 495 Ser Asp Lys Asp Lys Gly Glu Asn Gly Tyr Ile Thr Tyr Ser Ile 510 500 505 510 Ala Ser Leu Asn Leu Leu Pro Phe Ala Ile Asn Gln Phe Thr Gly 525 515 520 525 Val Ile Ser Thr Thr Glu Glu Leu Asp Phe Glu Ser Ser Pro Glu 540 530 535 540 Thr Tyr Arg Phe Ile Val Arg Ala Ser Asp Trp Gly Ser Pro Tyr 555 545 550 555 Arg His Glu Ser Glu Val Asn Val Thr Ile Arg Val Gly Asn Val 570 560 565 570 Asn Asp Asn Ser Pro Leu Phe Glu Lys Val Ala Cys Gln Gly Val 585 575 580 585 Ile Ser Tyr Asp Phe Pro Val Gly Gly His Ile Thr Ala Ile Ser 600 590 595 600 Ala Ile Asp Ile Asp Glu Leu Glu Leu Val Lys Tyr Lys Ile Ile 615 605 610 615 Ser Gly Asn Glu Leu Gly Phe Phe Tyr Leu Asn Pro Asp Ser Gly 630 620 625 630 Val Leu Gln Leu Lys Lys Ser Leu Met Asn Ser Gly Ile Lys Asn 645 635 640 645 Gly Asn Phe Ala Leu Arg Ile Thr Ala Thr Asp Gly Glu Asn Phe 660 650 655 660 Ala Asp Pro Met Ala Ile Asn Ile Ser Val Leu His Gly Lys Val 675 665 670 675 Ser Ser Lys Ser Phe Ser Cys Arg Glu Thr Arg Val Ala Gln Lys 690 680 685 690 Leu Ala Glu Lys Leu Leu Ile Lys Ala Lys Ala Asn Gly Lys Leu 705 695 700 705 Asn Gln Glu Asp Gly Phe Leu Asp Phe Tyr Ser Ile Asn Arg Gln 720 710 715 720 Gly Pro His Phe Asp Lys Ser Phe Pro Ser Asp Val Ala Val Lys 735 725 730 735 Glu Asn Met Pro Val Gly Thr Asn Ile Leu Lys Ile Lys Ala Tyr 750 740 745 750 Asp Ala Asp Ser Gly Phe Asn Gly Lys Val Leu Phe Thr Ile Ser 765 755 760 765 Asp Gly Asn Thr Asp Ser Cys Phe Asn Ile Asp Met Glu Thr Gly 780 770 775 780 Gln Leu Lys Val Leu Met Pro Met Asp Arg Glu His Thr Asp Leu 795 785 790 795 Tyr Val Leu Asn Ile Thr Ile Tyr Asp Leu Gly Lys Pro Gln Lys 810 800 805 810 Ser Ser Trp Arg Leu Leu Thr Val Asn Val Glu Asp Ala Asn Asp 825 815 820 825 Asn Ser Pro Val Phe Leu Gln Asp Ser Tyr Ser Val Ser Ile Leu 840 830 835 840 Glu Ser Ser Ser Ile Gly Thr Glu Ile Ile Gln Val Glu Ala Arg 855 845 850 855 Asp Lys Asp Leu Gly Ser Asn Gly Glu Val Thr Tyr Ser Val Leu 870 860 865 870 Thr Asp Thr His Gln Phe Val Ile Asn Ser Ser Thr Gly Ile Val 885 875 880 885 Tyr Ile Ala Asp Gln Leu Asp Arg Glu Ser Lys Ala Asn Tyr Ser 900 890 895 900 Leu Lys Ile Glu Ala Arg Asp Lys Ala Glu Ser Gly Gln Gln Leu 915 905 910 915 Phe Ser Val Val Thr Leu Lys Ile Phe Leu Asp Asp Val Asn Asp 930 920 925 930 Cys Ser Pro Ala Phe Ile Pro Ser Ser Tyr Ser Val Lys Val Leu 945 935 940 945 Glu Asp Leu Pro Val Gly Thr Val Ile Ala Trp Leu Glu Thr Gln 960 950 955 960 Asp Pro Asp Leu Gly Leu Gly Gly Gln Val Arg Tyr Ser Leu Val 975 965 970 975 Asn Asp Tyr Asn Gly Arg Phe Glu Ile Asp Lys Ala Ser Gly Ala 990 980 985 990 Ile Arg Leu Ser Lys Glu Leu Asp Tyr Glu Lys Gln Gln Phe Tyr 1005 995 1000 1005 Asn Leu Thr Val Arg Ala Lys Asp Lys Gly Arg Pro Val Ser Leu 1020 1010 1015 1020 Ser Ser Ile Ser Phe Val Glu Val Glu Val Val Asp Val Asn Glu 1035 1025 1030 1035 Asn Leu His Thr Pro Tyr Phe Pro Asp Phe Ala Val Val Gly Ser 1050 1040 1045 1050 Val Lys Glu Asn Ser Arg Ile Gly Thr Ser Val Leu Gln Val Thr 1065 1055 1060 1065 Ala His Asp Glu Asp Ser Gly Arg Asp Gly Glu Ile Gln Tyr Ser 1080 1070 1075 1080 Ile Arg Asp Gly Ser Gly Leu Gly Arg Phe Asn Ile Asp Asp Glu 1095 1085 1090 1095 Ser Gly Val Ile Thr Ala Ala Asp Ile Leu Asp Arg Glu Thr Thr 1110 1100 1105 1110 Ala Ser Tyr Trp Leu Thr Val Tyr Ala Thr Asp Arg Gly Val Val 1125 1115 1120 1125 Pro Leu Tyr Ser Thr Ile Glu Val Tyr Ile Glu Val Glu Asp Val 1140 1130 1135 1140 Asn Asp Asn Ala Pro Leu Thr Ser Glu Pro Ile Tyr Tyr Pro Val 1155 1145 1150 1155 Val Met Glu Asn Ser Pro Lys Asp Val Ser Val Ile Gln Ile Gln 1170 1160 1165 1170 Ala Glu Asp Pro Asp Ser Gly Ser Asn Glu Lys Leu Thr Tyr Arg 1185 1175 1180 1185 Ile Thr Ser Gly Asn Pro Gln Asn Phe Phe Ala Ile Asn Ile Lys 1200 1190 1195 1200 Thr Gly Leu Ile Thr Thr Thr Ser Arg Lys Leu Asp Arg Glu Gln 1215 1205 1210 1215 Gln Ala Glu His Phe Leu Glu Val Thr Val Thr Asp Gly Gly Ser 1230 1220 1225 1230 Ser Pro Lys Gln Ser Thr Ile Trp Val Val Val Gln Val Leu Asp 1245 1235 1240 1245 Glu Asn Asp Asn Lys Pro Gln Phe Pro Glu Lys Val Tyr Gln Ile 1260 1250 1255 1260 Lys Leu Pro Glu Arg Asp Arg Lys Lys Arg Gly Glu Pro Ile Tyr 1275 1265 1270 1275 Arg Ala Phe Ala Phe Asp Arg Asp Glu Gly Pro Asn Ala Glu Ile 1290 1280 1285 1290 Ser Tyr Ser Ile Val Asp Gly Asn Asp Asp Gly Lys Phe Phe Ile 1305 1295 1300 1305 Asp Pro Lys Thr Gly Met Val Ser Ser Arg Lys Gln Phe Thr Ala 1320 1310 1315 1320 Gly Ser Tyr Asp Ile Leu Thr Ile Lys Ala Val Asp Asn Gly Arg 1335 1325 1330 1335 Pro Gln Lys Ser Ser Thr Ala Arg Leu His Ile Glu Trp Ile Lys 1350 1340 1345 1350 Lys Pro Pro Pro Ser Pro Ile Pro Leu Thr Phe Asp Glu Pro Phe 1365 1355 1360 1365 Tyr Asn Phe Thr Ile Met Glu Ser Asp Lys Val Thr Glu Ile Val 1380 1370 1375 1380 Gly Val Val Ser Val Gln Pro Ala Asn Thr Pro Leu Trp Phe Asp 1395 1385 1390 1395 Ile Ile Gly Gly Asn Phe Asp Ser Ser Phe Asp Ala Glu Lys Gly 1410 1400 1405 1410 Val Gly Thr Ile Val Ile Ala Lys Pro Leu Asp Ala Glu Gln Arg 1425 1415 1420 1425 Ser Val Tyr Asn Met Ser Val Glu Val Thr Asp Gly Thr Asn Val 1440 1430 1435 1440 Ala Val Thr Gln Val Phe Ile Thr Val Leu Asp Asn Asn Asp Asn 1445 1445 1450 1455 Gly Pro Glu Phe Ser Gln Pro His Tyr Asp Val Thr Ile Ser Glu 1470 1460 1465 1470 Asp Val Pro Pro Asp Thr Glu Ile Leu Gln Ile Glu Ala Thr Asp 1485 1475 1480 1485 Arg Asp Glu Lys His Lys Leu Ser Tyr Thr Ile His Ser Ser Ile 1500 1490 1495 1500 Asp Ala Ile Ser Met Arg Lys Phe Arg Ile Asp Pro Ser Thr Gly 1515 1505 1510 1515 Val Leu Tyr Thr Ala Glu Arg Leu Asp His Glu Ala Gln Asp Lys 1530 1520 1525 1530 His Ile Leu Asn Ile Met Val Arg Asp Gln Glu Phe Pro Tyr Arg 1545 1535 1540 1545 Arg Asn Leu Ala Arg Val Ile Val Asn Val Glu Asp Ala Asn Asp 1560 1550 1555 1560 His Ser Pro Tyr Phe Thr Asn Pro Leu Tyr Glu Ala Ser Val Phe 1575 1565 1570 1575 Glu Ser Ala Ala Leu Gly Ser Val Val Leu Gln Val Thr Ala Leu 1590 1580 1585 1590 Asp Lys Asp Lys Gly Glu Asn Ala Glu Leu Ile Tyr Ser Ile Glu 1605 1595 1600 1605 Ala Gly Asn Thr Gly Asn Thr Phe Lys Ile Glu Pro Val Leu Gly 1620 1610 1615 1620 Ile Ile Thr Ile Ser Lys Glu Pro Asp Met Thr Ala Met Gly Gln 1635 1625 1630 1635 Phe Val Leu Ser Val Lys Val Thr Asp Gln Gly Ser Pro Pro Met 1650 1640 1645 1650 Ser Ala Thr Ala Ile Val Arg Ile Ser Ile Ser Met Ser Asp Asn 1665 1655 1660 1665 Ser His Pro Lys Phe Thr His Lys Asp Tyr Gln Ala Glu Val Asn 1680 1670 1675 1680 Glu Asn Val Asp Ile Gly Thr Ser Val Ile Leu Ile Ser Ala Ile 1695 1685 1690 1695 Ser Gln Ser Thr Leu Ile Tyr Glu Val Lys Asp Gly Asn Ile Asn 1710 1700 1705 1710 Gly Val Phe Thr Ile Asn Pro Tyr Ser Gly Val Ile Thr Thr Arg 1725 1715 1720 1725 Arg Ala Leu Asp Tyr Glu His Thr Ser Ser Tyr Gln Leu Ile Ile 1740 1730 1735 1740 Gln Ala Thr Asn Met Ala Gly Met Ala Ser Asn Ala Thr Val Ser 1755 1745 1750 1755 Val Gln Val Val Asp Glu Asn Asp Asn Pro Pro Val Phe Leu Phe 1770 1760 1765 1770 Ser Gln Tyr Ser Gly Ser Leu Ser Glu Ala Ala Pro Ile Asn Ser 1785 1775 1780 1785 Leu Val Arg Ser Leu Asp Asn Ser Pro Leu Val Ile Arg Ala Thr 1800 1790 1795 1800 Asp Ala Asp Ser Asn Gln Asn Ala Leu Leu Val Tyr Gln Ile Val 1815 1805 1810 1815 Glu Ser Thr Ala Lys Lys Phe Phe Thr Val Asp Ser Ser Thr Gly 1830 1820 1825 1830 Ala Ile Arg Thr Ile Ala Asn Leu Asp His Glu Val Ile Ala His 1845 1835 1840 1845 Phe His Phe His Val His Val Arg Asp Ser Gly Asn Pro Gln Leu 1860 1850 1855 1860 Thr Ala Glu Ser Pro Val Glu Val Asn Ile Glu Val Thr Asp Val 1875 1865 1870 1875 Asn Asp Asn Pro Pro Val Phe Thr Gln Ala Val Phe Glu Thr Val 1890 1880 1885 1890 Leu Leu Leu Pro Thr Tyr Val Gly Val Glu Val Leu Lys Val Ser 1905 1895 1900 1905 Ala Thr Asp Pro Asp Ser Glu Val Pro Pro Glu Leu Thr Tyr Ser 1920 1910 1915 1920 Leu Met Glu Gly Ser Val Asp His Phe Leu Met Asp Pro Asn Thr 1935 1925 1930 1935 Gly Val Leu Thr Ile Lys Asn Asn Asn Leu Ser Lys Asp His Tyr 1950 1940 1945 1950 Met Leu Ile Val Arg Val Ser Asp Gly Lys Phe Tyr Ser Thr Ala 1965 1955 1960 1965 Met Val Thr Ile Met Val Lys Glu Ala Met Asp Ser Gly Leu His 1980 1970 1975 1980 Phe Thr Gln Ser Phe Tyr Ser Thr Ser Ile Ser Glu Asn Ser Thr 1995 1985 1990 1995 Asn Ile Thr Lys Val Ala Ile Val Asn Ala Val Gly Asn Arg Leu 2010 2000 2005 2010 Asn Glu Pro Leu Lys Tyr Ser Ile Leu Asn Pro Gly Asn Lys Phe 2025 2015 2020 2025 Lys Ile Lys Ser Thr Ser Gly Val Ile Gln Thr Thr Gly Val Pro 2040 2030 2035 2040 Phe Asp Arg Glu Glu Gln Glu Leu Tyr Glu Leu Val Val Glu Ala 2055 2045 2050 2055 Ser Arg Glu Leu Asp His Leu Arg Val Ala Arg Val Val Val Arg 2070 2060 2065 2070 Val Asn Ile Glu Asp Val Asn Asp Asn Ser Pro Val Phe Val Gly 2085 2075 2080 2085 Leu Pro Tyr Tyr Ala Ala Val Gln Val Asp Ala Glu Pro Gly Thr 2100 2090 2095 2100 Leu Ile Tyr Arg Val Thr Ala Ile Asp Lys Asp Lys Gly Ala Asn 2115 2105 2110 2115 Gly Glu Val Thr Tyr Val Leu Gln Asp Asp Tyr Gly His Phe Glu 2130 2120 2125 2130 Ile Asn Pro Asn Ser Gly Asn Val Ile Leu Lys Glu Ala Phe Asn 2145 2135 2140 2145 Ser Asp Leu Ser Asn Ile Asp Tyr Gly Val Thr Ile Leu Ala Lys 2160 2150 2155 2160 Asp Gly Gly Thr Pro Ser Leu Ser Thr Phe Val Glu Leu Pro Ile 2175 2165 2170 2175 Thr Ile Val Asn Lys Ala Met Pro Val Phe Asp Lys Pro Phe Tyr 2190 2180 2185 2190 Thr Ala Ser Ile Asn Glu Asp Ile Ser Ile Asn Thr Pro Ile Leu 2205 2195 2200 2205 Ser Ile Asn Ala Thr Ser Pro Glu Gly Gln Gly Ile Ile Tyr Leu 2220 2210 2215 2220 Ile Ile Asp Gly Asp Pro Phe Gln Gln Phe Asn Ile Asp Phe Asp 2235 2225 2230 2235 Thr Gly Val Leu Lys Val Ile Ser Pro Leu Asp Tyr Glu Val Met 2250 2240 2245 2250 Ser Val Tyr Lys Leu Thr Val Arg Ala Ser Asp Ala Leu Thr Gly 2265 2255 2260 2265 Ala Arg Ala Glu Val Thr Val Asp Leu Leu Val Asp Asp Val Asn 2280 2270 2275 2280 Asp Asn Pro Pro Val Phe Asp Gln Pro Thr Tyr Asn Thr Thr Leu 2295 2285 2290 2295 Ser Glu Ser Ser Leu Ile Gly Thr Pro Val Leu Gln Leu Val Ser 2310 2300 2305 2310 Thr Asp Ala Asp Ser Gly Asn Asn Asn Leu Val His Tyr Gln Ile 2325 2315 2320 2325 Val Gln Asp Thr Tyr Asn Ser Thr Asp Tyr Phe His Ile Asp Ser 2340 2330 2335 2340 Ser Ser Gly Leu Ile Leu Thr Ala Arg Met Leu Asp His Glu Leu 2355 2345 2350 2355 Val Gln His Cys Thr Leu Lys Val Thr Ala Thr Asp Asn Gly Phe 2370 2360 2365 2370 Pro Ser Leu Ser Ser Glu Val Leu Val Gln Ile Tyr Ile Ser Asp 2385 2375 2380 2385 Val Asn Asp Asn Pro Pro Val Phe Asn Gln Leu Ile Tyr Glu Ser 2400 2390 2395 2400 Tyr Val Ser Glu Leu Ala Pro Arg Gly His Phe Val Thr Cys Val 2415 2405 2410 2415 Gln Ala Ser Asp Ala Asp Ser Ser Asp Phe Asp Arg Leu Glu Tyr 2430 2420 2425 2430 Ser Ile Leu Ser Gly Asn Asp Arg Thr Ser Phe Leu Met Asp Ser 2445 2435 2440 2445 Lys Ser Gly Val Leu Thr Leu Ser Ser His Arg Lys Gln Arg Met 2460 2450 2455 2460 Glu Pro Leu Tyr Ser Leu Asn Val Ser Val Ser Asp Gly Leu Phe 2475 2465 2470 2475 Thr Ser Thr Ala Gln Val His Ile Arg Val Leu Gly Ala Asn Leu 2490 2480 2485 2490 Tyr Ser Pro Ala Phe Ser Gln Ser Thr Tyr Val Ala Glu Val Arg 2505 2495 2500 2505 Glu Asn Ala Ala Ser Gly Thr Lys Val Ile His Val Arg Ala Thr 2520 2510 2515 2520 Asp Gly Asp Pro Gly Thr Tyr Gly Gln Val Ser Tyr Ser Ile Ile 2535 2525 2530 2535 Asn Asp Phe Ala Lys Asp Arg Phe Leu Ile Asp Ser Asn Gly Gln 2550 2540 2545 2550 Ile Ile Thr Thr Glu Arg Leu Asp Arg Glu Asn Pro Leu Glu Gly 2565 2555 2560 2565 Asp Ile Ser Ile Tyr Leu Arg Ala Leu Asp Gly Gly Gly Arg Thr 2580 2570 2575 2580 Thr Phe Cys Thr Val Arg Val Ile Val Val Asp Glu Asn Asp Asn 2595 2585 2590 2595 Ala Pro Gln Phe Met Thr Leu Glu Tyr Arg Ala Ser Val Arg Ala 2610 2600 2605 2610 Asp Val Gly Arg Gly His Leu Val Thr Gln Val Gln Ala Leu Asp 2625 2615 2620 2625 Pro Asp Asp Gly Ala Asn Ser Arg Ile Thr Tyr Ser Leu Tyr Ser 2640 2630 2635 2640 Glu Ala Ser Val Ser Val Ala Asp Leu Leu Glu Ile Asp Pro Asp 2655 2645 2650 2655 Asn Gly Trp Met Val Thr Lys Gly Asn Phe Asn Gln Leu Arg Asn 2670 2660 2665 2670 Thr Val Leu Ser Phe Phe Val Lys Ala Val Asp Gly Gly Ile Pro 2685 2675 2680 2685 Val Arg His Ser Leu Ile Pro Val Tyr Ile His Val Leu Pro Pro 2700 2690 2695 2700 Glu Thr Phe Leu Pro Ser Phe Thr Gln Ser Gln Tyr Ser Phe Thr 2715 2705 2710 2715 Ile Ala Glu Asp Thr Ser Ile Gly Ser Thr Ile Asp Thr Leu Arg 2730 2720 2725 2730 Ile Leu Pro Asn Gln Ser Val Arg Phe Ser Thr Val Asn Gly Glu 2745 2735 2740 2745 Arg Pro Glu Asn Asn Lys Glu Asn Val Phe Ile Ile Glu Gln Glu 2760 2750 2755 2760 Thr Gly Ala Ile Lys Leu Asp Lys Arg Leu Asp His Glu Val Ser 2775 2765 2770 2775 Pro Ala Phe His Phe Lys Val Ala Ala Thr Ile Pro Leu Asp Lys 2790 2780 2785 2790 Val Asp Ile Val Phe Thr Val Asp Val Asp Val Lys Val Leu Asp 2805 2795 2800 2805 Leu Asn Asp Asn Lys Pro Val Phe Glu Thr Ser Ser Tyr Glu Thr 2820 2810 2815 2820 Ile Ile Met Glu Gly Met Pro Val Gly Thr Lys Leu Ala Gln Val 2835 2825 2830 2835 Arg Ala Ile Asp Thr Asp Trp Gly Ala Asn Gly Gln Val Thr Tyr 2850 2840 2845 2850 Ser Leu His Ser Asp Ser His Leu Glu Lys Val Met Glu Ala Phe 2865 2855 2860 2865 Asn Ile Asp Ser Asn Thr Gly Trp Ile Ser Thr Leu Lys Asp Leu 2880 2870 2875 2880 Asp His Glu Thr Asp Pro Thr Phe Ser Phe Phe Val Val Ala Ser 2895 2885 2890 2895 Asp Leu Gly Glu Ala Phe Ser Leu Ser Ser Met Ala Leu Val Ser 2910 2900 2905 2910 Val Lys Val Thr Asp Ile Asn Asp Asn Ala Pro Val Phe Ala His 2925 2915 2920 2925 Glu Val Tyr Arg Gly Asn Val Lys Glu Ser Asp Pro Pro Gly Glu 2940 2930 2935 2940 Val Val Ala Val Leu Ser Thr Leu Asp Lys Asp Thr Ser Asn Ile 2955 2945 2950 2955 Asn Arg Gln Val Ser Tyr His Ile Thr Gly Gly Asn Pro Arg Gly 2970 2960 2965 2970 Arg Phe Ala Leu Gly Met Val Gln Ser Glu Trp Lys Val Tyr Val 2985 2975 2980 2985 Lys Arg Pro Leu Asp Arg Glu Glu Gln Asp Ile Tyr Phe Leu Asn 3000 2990 2995 3000 Ile Thr Ala Ser Asp Gly Leu Phe Val Thr Gln Ala Met Val Glu 3015 3005 3010 3015 Val Thr Val Ser Asp Val Asn Asp Asn Ser Pro Val Cys Asp Gln 3030 3020 3025 3030 Val Ala Tyr Ser Ala Ser Leu Pro Glu Asp Ile Pro Ser Asn Lys 3045 3035 3040 3045 Ile Ile Leu Lys Val Ser Ala Lys Asp Ala Asp Ile Gly Ser Asn 3060 3050 3055 3060 Gly Asp Ile Arg Tyr Ser Leu Tyr Gly Ser Gly Asn Ser Asp Phe 3075 3065 3070 3075 Phe Leu Asp Pro Glu Ser Gly Glu Leu Lys Thr Leu Ala Leu Leu 3090 3080 3085 3090 Asp Arg Glu Arg Val Pro Val Tyr Asn Leu Ile Ala Arg Ala Thr 3105 3095 3100 3105 Asp Gly Gly Gly Arg Phe Cys Ser Ser Thr Val Leu Leu Leu Leu 3120 3110 3115 3120 Glu Asp Val Asn Asp Asn Pro Pro Val Phe Ser Ser Asn His Tyr 3135 3125 3130 3135 Thr Ala Cys Val Tyr Glu Asn Thr Ala Thr Lys Ala Leu Leu Thr 3150 3140 3145 3150 Arg Val Gln Ala Val Asp Pro Asp Val Gly Ile Asn Arg Lys Val 3165 3155 3160 3165 Val Tyr Ser Leu Glu Asp Ser Ala Ser Gly Val Phe Ser Ile Asp 3180 3170 3175 3180 Ser Ser Ser Gly Val Ile Val Leu Glu Gln Pro Leu Asp Arg Glu 3195 3185 3190 3195 Gln Gln Ser Ser Tyr Asn Ile Ser Val Arg Ala Thr Asp Gln Ser 3210 3200 3205 3210 Pro Gly Gln Ser Leu Ser Ser Leu Thr Ser Val Thr Ile Thr Val 3225 3215 3220 3225 Leu Asp Ile Asn Asp Asn Pro Pro Val Phe Glu Arg Arg Asp Tyr 3240 3230 3235 3240 Leu Val Thr Val Pro Glu Asp Thr Ser Leu Gly Thr Gln Val Leu 3255 3245 3250 3255 Ser Val Phe Ala Thr Ser Lys Asp Ile Gly Thr Asn Ala Glu Ile 3270 3260 3265 3270 Thr Tyr Leu Ile Arg Ser Gly Asn Glu Gln Gly Lys Phe Arg Ile 3285 3275 3280 3285 Asn Pro Lys Thr Gly Gly Ile Ser Val Leu Glu Ala Leu Asp Tyr 3300 3290 3295 3300 Glu Met Cys Lys Arg Phe Tyr Leu Val Val Glu Ala Lys Asp Gly 3315 3305 3310 3315 Gly Thr Pro Ala Leu Ser Thr Ala Ala Thr Val Ser Ile Asp Leu 3330 3320 3325 3330 Thr Asp Val Asn Asp Asn Pro Pro Arg Phe Ser Gln Asp Val Tyr 3345 3335 3340 3345 Ser Ala Val Ile Ser Glu Asp Ala Leu Glu Gly Asp Ser Val Ile 3360 3350 3355 3360 Leu Leu Ile Ala Glu Asp Val Asp Ser Lys Pro Asn Gly Gln Ile 3375 3365 3370 3375 Arg Phe Ser Ile Val Gly Gly Asp Arg Asp Asn Glu Phe Ala Val 3390 3380 3385 3390 Asp Pro Ile Leu Gly Leu Val Lys Val Lys Lys Lys Leu Asp Arg 3405 3395 3400 3405 Glu Arg Val Ser Gly Tyr Ser Leu Leu Ile Gln Ala Val Asp Ser 3420 3410 3415 3420 Gly Ile Pro Ala Met Ser Ser Thr Thr Thr Val Asn Ile Asp Ile 3435 3425 3430 3435 Ser Asp Val Asn Asp Asn Ser Pro Val Phe Thr Pro Ala Asn Tyr 3450 3440 3445 3450 Thr Ala Val Ile Gln Glu Asn Lys Pro Val Gly Thr Ser Ile Leu 3465 3455 3460 3465 Gln Leu Val Val Thr Asp Arg Asp Ser Phe His Asn Gly Pro Pro 3480 3470 3475 3480 Phe Ser Phe Ser Ile Leu Ser Gly Asn Glu Asp Glu Glu Phe Met 3495 3485 3490 3495 Leu Asp Ser His Gly Ile Leu Arg Ser Ala Val Val Phe Arg His 3510 3500 3505 3510 Met Glu Ser Pro Glu Tyr Leu Leu Cys Ile Gln Ala Lys Asp Ser 3525 3515 3520 3525 Gly Lys Pro Gln Gln Val Ser His Thr Tyr Ile Arg Val Arg Val 3540 3530 3535 3540 Ile Glu Glu Ser Thr His Lys Pro Thr Ala Ile Pro Leu Glu Ile 3555 3545 3550 3555 Phe Ile Val Thr Met Glu Asp Asp Phe Pro Gly Gly Val Ile Gly 3570 3560 3565 3570 Lys Ile His Ala Thr Asp Gln Asp Met Tyr Asp Val Leu Thr Phe 3585 3575 3580 3585 Ala Leu Lys Ser Glu Gln Lys Ser Leu Phe Lys Val Asn Ser His 3600 3590 3595 3600 Asp Gly Lys Ile Ile Ala Leu Gly Gly Leu Asp Ser Gly Lys Tyr 3615 3605 3610 3615 Val Leu Asn Val Ser Val Ser Asp Gly Arg Phe Gln Val Pro Ile 3630 3620 3625 3630 Asp Val Val Val His Val Glu Gln Leu Val His Glu Met Leu Gln 3645 3635 3640 3645 Asn Thr Val Thr Ile Arg Phe Glu Asn Val Ser Pro Glu Asp Phe 3660 3650 3655 3660 Val Gly Leu His Met His Gly Phe Arg Arg Ile Leu Arg Asn Ala 3675 3665 3670 3675 Val Leu Thr Gln Lys Gln Asp Ser Leu Arg Ile Ile Ser Ile Gln 3690 3680 3685 3690 Pro Val Val Gly Thr Asn Gln Leu Asp Met Leu Phe Ala Val Glu 3705 3695 3700 3705 Met His Ser Ser Glu Phe Tyr Lys Pro Ala Tyr Leu Ile Gln Lys 3720 3710 3715 3720 Leu Ser Asn Ala Arg Arg His Leu Glu Asn Val Met His Ile Ala 3735 3725 3730 3735 Ala Ile Leu Glu Lys Asn Cys Ser Gly Leu Asp Cys Gln Glu Gln 3750 3740 3745 3750 His Cys Glu Gln Gly Leu Ser Leu Asp Ser His Ala Leu Met Thr 3765 3755 3760 3765 Tyr Ser Thr Ala Arg Ile Ser Phe Val Cys Pro Arg Phe Tyr Arg 3780 3770 3775 3780 Asn Val Arg Cys Thr Cys Asn Gly Gly Val Cys Pro Gly Ser Asn 3795 3785 3790 3795 Asp Pro Cys Val Glu Lys Pro Cys Pro Glu Asp Met Gln Cys Val 3810 3800 3805 3810 Gly Tyr Glu Ala Ser Arg Arg Pro Phe Leu Cys Gln Cys Pro Pro 3825 3815 3820 3825 Gly Lys Leu Gly Glu Cys Ser Gly His Thr Ser Leu Ser Phe Ala 3840 3830 3835 3840 Gly Asn Ser Tyr Ile Lys Tyr Arg Leu Ser Glu Asn Ser Arg Glu 3855 3845 3850 3855 Glu Asp Phe Lys Leu Ala Leu Arg Leu Arg Thr Leu Gln Ser Asn 3870 3860 3865 3870 Gly Ile Ile Met Tyr Thr Arg Ala Asn Pro Cys Met Ile Leu Lys 3885 3875 3880 3885 Ile Val Glu Gly Lys Leu Trp Phe Gln Leu Asp Cys Gly Ser Gly 3900 3890 3895 3900 Pro Gly Ile Leu Gly Ile Ser Ser Arg Ala Val Asn Asp Gly Ser 3915 3905 3910 3915 Trp His Ser Val Phe Leu Glu Leu Asn Arg Asn Phe Thr Ser Leu 3930 3920 3925 3930 Ser Leu Asp Asp Ser Tyr Val Glu Arg Arg Arg Ala Pro Leu Tyr 3945 3935 3940 3945 Phe Gln Thr Leu Ser Thr Asp Ser Ala Ile Phe Phe Gly Ala Leu 3960 3950 3955 3960 Val Gln Ala Asp Asn Ile Arg Ser Leu Thr Asp Thr Arg Val Thr 3975 3965 3970 3975 Gln Val Leu Gly Gly Phe Gln Gly Cys Leu Asp Ser Val Val Leu 3990 3980 3985 3990 Asn His Asn Glu Leu Pro Leu Gln Asn Lys Arg Ser Ser Phe Ala 4005 3995 4000 4005 Glu Val Val Gly Leu Thr Glu Leu Lys Leu Gly Cys Val Leu Tyr 4020 4010 4015 4020 Pro Asp Ala Cys Gln Arg Ser Pro Cys Leu His Gly Gly Ser Cys 4035 4025 4030 4035 Ser Gly Leu Pro Ser Gly Gly Tyr Gln Cys Ser Cys Leu Ser Gln 4050 4040 4045 4050 Phe Thr Gly Thr Asn Cys Glu Ser Glu Ile Thr Ala Cys Phe Pro 4065 4055 4060 4065 Asn Pro Cys Arg Asn Gly Gly Ser Cys Asp Pro Ile Gly Asn Thr 4080 4070 4075 4080 Phe Ile Cys Ser Cys Lys Ala Gly Leu Thr Gly Val Thr Cys Glu 4095 4085 4090 4095 Asp Asp Val Asp Glu Cys Glu Arg Glu Glu Cys Glu Asn Gly Gly 4110 4100 4105 4110 Ser Cys Val Asn Leu Phe Gly Ser Phe Phe Cys Asn Cys Thr Pro 4125 4115 4120 4125 Gly Tyr Val Gly Gln Tyr Cys Gly Leu Arg Pro Val Val Val Pro 4140 4130 4135 4140 Asn Ile Gln Ala Gly His Ser Tyr Val Gly Lys Glu Glu Leu Ile 4155 4145 4150 4155 Gly Ile Ala Val Val Leu Phe Val Ile Phe Thr Leu Ile Val Leu 4170 4160 4165 4170 Phe Ile Val Phe Arg Lys Lys Val Phe Arg Lys Asn Tyr Ser Arg 4185 4175 4180 4185 Asn Asn Ile Thr Leu Val Gln Asp Pro Ala Thr Ala Ala Leu Leu 4200 4190 4195 4200 His Lys Ser Asn Gly Ile Pro Phe Arg Ser Leu Arg Ala Gly Asp 4215 4205 4210 4215 Gly Arg Asn Val Tyr Gln Glu Val Gly Pro Pro Gln Val Pro Val 4230 4220 4225 4230 Arg Pro Met Ala Tyr Thr Pro Cys Phe Gln Ser Asp Ser Arg Ser 4245 4235 4240 4245 Asn Leu Asp Lys Gly Leu Asp Ala Leu Gly Gly Glu Pro Gln Glu 4260 4250 4255 4260 Leu Ser Thr Phe His Pro Glu Ser Pro Arg Ile Leu Thr Ala Arg 4275 4265 4270 4275 Arg Gly Val Val Val Cys Ser Val Ala Pro Asn Leu Pro Ala Val 4290 4280 4285 4290 Ser Pro Cys Arg Ser Asp Cys Asp Ser Ile Arg Lys Asn Gly Trp 4305 4295 4300 4305 Asp Thr Gly Ser Glu Asn Lys Gly Ala Glu Asp Thr Gly Glu Val 4320 4310 4315 4320 Thr Cys Phe Ala Asn Ser Asn Lys Gly Ser Asn Ser Glu Val Gln 4335 4325 4330 4335 Ser Leu Asn Ser Phe Gln Ser Asp Ser Gly Asp Asp Asn Ala Tyr 4350 4340 4345 4350 His Trp Asp Thr Ser Asp Trp Met Pro Gly Ala Arg Leu Ser Asp 4365 4355 4360 4365 Ile Glu Glu Met Pro Asn Tyr Glu Ser Gln Asp Gly Gly Ala Val 4380 4370 4375 4380 His Gln Gly Ser Thr Arg Glu Leu Glu Ser Asp Tyr Tyr Leu Gly 4395 4385 4390 4395 Gly Tyr Asp Ile Asp Ser Glu Tyr Pro Pro Pro His Glu Glu Glu 4410 4400 4405 4410 Phe Leu Ser Gln Asp Gln Leu Pro Pro Pro Leu Pro Glu Asp Phe 4425 4415 4420 4425 Pro Glu Gln Tyr Glu Ala Leu Pro Pro Ser Gln Pro Thr Ser Leu 4440 4430 4435 4440 Thr Gly Thr Met Ser Pro Asp Cys Arg Arg Arg Pro Arg Phe His 4455 4445 4450 4455 Pro Ser Gln Tyr Leu Pro Pro His Pro Leu Pro Gly Glu Thr Asp 4470 4460 4465 4470 Leu Gly Gly Pro Pro Ser Ser Cys Asp Phe Ser Thr Phe Ala Val 4485 4475 4480 4485 Ser Met Asn Gln Gly Thr Glu Val Met Ala Pro Thr Asp Ser Val 4500 4490 4495 4500 Ser Leu Ser Leu His Asn Ser Arg Gly Thr Ser Ser Ser Asp Met 4515 4505 4510 4515 Ser Ala Arg Cys Gly Phe Asp Asp Ser Glu Val Ala Met Ser Asp 4530 4520 4525 4530 Tyr Glu Ser Ala Gly Glu Leu Ser Leu Thr Asn Leu His Ile Pro 4545 4535 4540 4545 Phe Val Glu Thr Gln His Gln Thr Gln Val 4555 4550 4555 <210> 4 <211> 14530 <212> DNA <213> Rattus norvegicus <400> ccacgcgtcc gcggacgcgt gggtgtgaaa ggttctaaat gacacccgac tttgaaccgg 60 tgcgacagtt tggccgagat gccaggagcg gatccctgtt gttttgacgg gaagatgaac 120 acgaatggtt tgggagaacg catgattttt ggcgggcgtc aggactggct gtgctatttg 180 aaaagagaat agcgctagtc tggtcatccc agggatgctg aacagccctt gctgctcctt 240 gtgggcacgt tgaaggctca gtgtggcgcg ccgcgagtcc tttcccgaag gacggacatg 300 tgataaa atg ggt gtg acc atg aga cac tgt att gac aca agg cct 346 Met Gly Val Thr Met Arg His Cys Ile Asp Thr Arg Pro cct tcc tgc ctc att ttc ctg ctc ctg aag ctg tgt gcc acc gtc 391 Pro Ser Cys Leu Ile Phe Leu Leu Leu Lys Leu Cys Ala Thr Val tcc cag ggg ctg cca gga aca ggg ccc ttg ggc ttc cac ttc acg 436 Ser Gln Gly Leu Pro Gly Thr Gly Pro Leu Gly Phe His Phe Thr cat gct ctc tat aac gct aca gtg tat gag aac tca gca gcg cgg 481 His Ala Leu Tyr Asn Ala Thr Val Tyr Glu Asn Ser Ala Ala Arg acc tat gtc aac agc cag agc aga atg ggc atc acc tta ata gac 526 Thr Tyr Val Asn Ser Gln Ser Arg Met Gly Ile Thr Leu Ile Asp ctg tcc tgg gac atc aag tac aga ata gtg tcc ggt gat gag gaa 571 Leu Ser Trp Asp Ile Lys Tyr Arg Ile Val Ser Gly Asp Glu Glu gga ttt ttc aaa gct gag gag gtc att att gca gat ttc tgc ttt 616 Gly Phe Phe Lys Ala Glu Glu Val Ile Ile Ala Asp Phe Cys Phe ctc agg ata aga act aaa ggt ggc aat tct gcc ata ttg aac agg 661 Leu Arg Ile Arg Thr Lys Gly Gly Asn Ser Ala Ile Leu Asn Arg gaa atc caa gac aat tat tta tta atc ata aaa ggt tct gtc aga 706 Glu Ile Gln Asp Asn Tyr Leu Leu Ile Ile Lys Gly Ser Val Arg gga gaa gac ttg gaa gca tgg acc aaa gta aac atc cag gtt tta 751 Gly Glu Asp Leu Glu Ala Trp Thr Lys Val Asn Ile Gln Val Leu gac atg aat gac ttg agg cct ctg ttt tca cca acc acc tac tcg 796 Asp Met Asn Asp Leu Arg Pro Leu Phe Ser Pro Thr Thr Tyr Ser gtc acc atc gca gaa agc aca cca ctc agg act agc gtt gcc cag 841 Val Thr Ile Ala Glu Ser Thr Pro Leu Arg Thr Ser Val Ala Gln gtg acg gcc aca gat gca gat atc ggt tcc aat ggg gaa ttc tac 886 Val Thr Ala Thr Asp Ala Asp Ile Gly Ser Asn Gly Glu Phe Tyr tac tac ttc aaa aac aag gtt gat ctt ttt tca gtt cac ccc acg 931 Tyr Tyr Phe Lys Asn Lys Val Asp Leu Phe Ser Val His Pro Thr agt ggt gtc atc tct tta agt gga cgg ttg aat tat gac gag aag 976 Ser Gly Val Ile Ser Leu Ser Gly Arg Leu Asn Tyr Asp Glu Lys aac aga tat gat cta gaa atc tta gca gtg gac cgg ggg atg aaa 1021 Asn Arg Tyr Asp Leu Glu Ile Leu Ala Val Asp Arg Gly Met Lys ctc tat ggc aat aat gga gtg agc agt act gcc aag ctt tat gtt 1066 Leu Tyr Gly Asn Asn Gly Val Ser Ser Thr Ala Lys Leu Tyr Val cac att gaa cgc ata aac gaa cat gct cca att atc cat gtg gtc 1111 His Ile Glu Arg Ile Asn Glu His Ala Pro Ile Ile His Val Val act cac aca cct ttc tca ttg gac aag gag cca aca tat gca gta 1156 Thr His Thr Pro Phe Ser Leu Asp Lys Glu Pro Thr Tyr Ala Val gtg aca gtt gat gac ctg gat gag ggg gcc aat gga gag atc gaa 1201 Val Thr Val Asp Asp Leu Asp Glu Gly Ala Asn Gly Glu Ile Glu tct gtt tcc att gtg gat gga gat cct tta gag cag ttc ttc ctg 1246 Ser Val Ser Ile Val Asp Gly Asp Pro Leu Glu Gln Phe Phe Leu gct aag gaa gga aag tgg atg aat gag tat aaa gtc aag gag aga 1291 Ala Lys Glu Gly Lys Trp Met Asn Glu Tyr Lys Val Lys Glu Arg agg cag gtg gac tgg gaa agc ttc tcc tat ggc tat aac ctc act 1336 Arg Gln Val Asp Trp Glu Ser Phe Ser Tyr Gly Tyr Asn Leu Thr att caa gca aaa gac aaa ggg tca cct cag aag ttc tca gaa cta 1381 Ile Gln Ala Lys Asp Lys Gly Ser Pro Gln Lys Phe Ser Glu Leu aag aca gtc cac att gct aac ccc agg aga gac agc acc cca ata 1426 Lys Thr Val His Ile Ala Asn Pro Arg Arg Asp Ser Thr Pro Ile aag ttt gaa aag gat gtc tat gac atc agt ata agt gag ttt tcc 1471 Lys Phe Glu Lys Asp Val Tyr Asp Ile Ser Ile Ser Glu Phe Ser cct cct ggt gtc atg gta gcc atc gtc aag gtc aat cct gag cca 1516 Pro Pro Gly Val Met Val Ala Ile Val Lys Val Asn Pro Glu Pro ctg gac gtg gaa tac aaa cta ttg cct ggt aag gat gca gag tac 1561 Leu Asp Val Glu Tyr Lys Leu Leu Pro Gly Lys Asp Ala Glu Tyr ttc aaa att aat ccc agg tca ggt ctt atc gtc aca gcc cag ccc 1606 Phe Lys Ile Asn Pro Arg Ser Gly Leu Ile Val Thr Ala Gln Pro ttg aat aca gtc aag aag gaa gtt tat aaa ctg gaa gtg tca gac 1651 Leu Asn Thr Val Lys Lys Glu Val Tyr Lys Leu Glu Val Ser Asp aag gaa gga gac gca aag gca caa gtc act att ggg att gaa gat 1696 Lys Glu Gly Asp Ala Lys Ala Gln Val Thr Ile Gly Ile Glu Asp gcc aat gac cac acc cca gaa ttc cag gag aca ctg tat gag act 1741 Ala Asn Asp His Thr Pro Glu Phe Gln Glu Thr Leu Tyr Glu Thr ttt gtg aat gag agt gtc cct gtt ggt aca aat gtt ctc act gtg 1786 Phe Val Asn Glu Ser Val Pro Val Gly Thr Asn Val Leu Thr Val tct gcc tct gat aag gat aaa ggg gaa aat ggt tac atc acc tac 1831 Ser Ala Ser Asp Lys Asp Lys Gly Glu Asn Gly Tyr Ile Thr Tyr agc atc gcc agc cta aac ctt tta ccg ttt gcc att aac cag ttc 1876 Ser Ile Ala Ser Leu Asn Leu Leu Pro Phe Ala Ile Asn Gln Phe aca ggt gtg atc agc aca act gaa gag tta gat ttc gaa tcc tcc 1921 Thr Gly Val Ile Ser Thr Thr Glu Glu Leu Asp Phe Glu Ser Ser cca gaa aca tat aga ttc att gtg aga gcc tct gac tgg ggc tcc 1966 Pro Glu Thr Tyr Arg Phe Ile Val Arg Ala Ser Asp Trp Gly Ser cca tac cgc cat gaa agt gag gtc aat gtg acc att cga gta gga 2011 Pro Tyr Arg His Glu Ser Glu Val Asn Val Thr Ile Arg Val Gly aat gtc aat gac aac agc cct ctc ttt gaa aaa gtg gct tgc cag 2056 Asn Val Asn Asp Asn Ser Pro Leu Phe Glu Lys Val Ala Cys Gln gga gtt att tca tat gac ttt cct gtt ggg ggt cac atc acg gcc 2101 Gly Val Ile Ser Tyr Asp Phe Pro Val Gly Gly His Ile Thr Ala atc tct gct att gat att gac gaa ctt gaa ctt gta aag tac aaa 2146 Ile Ser Ala Ile Asp Ile Asp Glu Leu Glu Leu Val Lys Tyr Lys atc att tct gga aat gaa ctt ggg ttt ttt tat tta aac cca gac 2191 Ile Ile Ser Gly Asn Glu Leu Gly Phe Phe Tyr Leu Asn Pro Asp tct ggc gtt ttg cag ctt aag aag tca ctg atg aat tct ggc att 2236 Ser Gly Val Leu Gln Leu Lys Lys Ser Leu Met Asn Ser Gly Ile aaa aat ggc aat ttt gcc ctc aga atc aca gct act gat gga gaa 2281 Lys Asn Gly Asn Phe Ala Leu Arg Ile Thr Ala Thr Asp Gly Glu aac ttt gca gac ccc atg gcc att aac atc tca gtt ctc cat ggg 2326 Asn Phe Ala Asp Pro Met Ala Ile Asn Ile Ser Val Leu His Gly aaa gtg tct tca aag agc ttc agt tgc aga gaa acg cgt gtg gct 2371 Lys Val Ser Ser Lys Ser Phe Ser Cys Arg Glu Thr Arg Val Ala cag aaa ttg gca gag aaa cta ctc att aaa gca aaa gct aat ggg 2416 Gln Lys Leu Ala Glu Lys Leu Leu Ile Lys Ala Lys Ala Asn Gly aaa ctg aat caa gaa gat gga ttt ctt gac ttt tat tcg att aat 2461 Lys Leu Asn Gln Glu Asp Gly Phe Leu Asp Phe Tyr Ser Ile Asn agg caa gga cca cat ttt gac aag tct ttt ccc tct gat gtg gct 2506 Arg Gln Gly Pro His Phe Asp Lys Ser Phe Pro Ser Asp Val Ala gta aag gag aac atg cca gta gga act aac atc ctg aag att aaa 2551 Val Lys Glu Asn Met Pro Val Gly Thr Asn Ile Leu Lys Ile Lys gcc tat gat gcc gac tct ggc ttc aat ggg aag gtg cta ttt aca 2596 Ala Tyr Asp Ala Asp Ser Gly Phe Asn Gly Lys Val Leu Phe Thr ata tca gat gga aac aca gac agc tgc ttc aat att gat atg gag 2641 Ile Ser Asp Gly Asn Thr Asp Ser Cys Phe Asn Ile Asp Met Glu act gga caa ctt aaa gtc ctc atg ccc atg gac cga gag cat aca 2686 Thr Gly Gln Leu Lys Val Leu Met Pro Met Asp Arg Glu His Thr gac ctc tat gtc ctc aac ata act atc tat gac ctt gga aag cca 2731 Asp Leu Tyr Val Leu Asn Ile Thr Ile Tyr Asp Leu Gly Lys Pro cag aaa tcg tca tgg cgt ttg ctg act gtc aac gtg gag gat gct 2776 Gln Lys Ser Ser Trp Arg Leu Leu Thr Val Asn Val Glu Asp Ala aat gac aat agc cca gtg ttt ctt cag gac agc tac tca gtc agc 2821 Asn Asp Asn Ser Pro Val Phe Leu Gln Asp Ser Tyr Ser Val Ser att ctt gaa agt tca agt att gga aca gag att att caa gtg gaa 2866 Ile Leu Glu Ser Ser Ser Ile Gly Thr Glu Ile Ile Gln Val Glu gca aga gac aaa gac cta ggt tct aat ggt gag gta aca tac tca 2911 Ala Arg Asp Lys Asp Leu Gly Ser Asn Gly Glu Val Thr Tyr Ser gtc ttg aca gac acg cac cag ttt gtc atc aat agc tca act ggg 2956 Val Leu Thr Asp Thr His Gln Phe Val Ile Asn Ser Ser Thr Gly att gtc tat ata gcc gat caa ttg gac aga gaa tcc aaa gcc aac 3001 Ile Val Tyr Ile Ala Asp Gln Leu Asp Arg Glu Ser Lys Ala Asn tat tct ttg aaa ata gaa gcc agg gac aaa gca gaa agt ggc cag 3046 Tyr Ser Leu Lys Ile Glu Ala Arg Asp Lys Ala Glu Ser Gly Gln cag ctg ttt tct gtt gtc acc ctg aag atc ttt cta gat gat gtc 3091 Gln Leu Phe Ser Val Val Thr Leu Lys Ile Phe Leu Asp Asp Val aat gac tgt tct cca gca ttt atc cct agt agc tac agt gtg aaa 3136 Asn Asp Cys Ser Pro Ala Phe Ile Pro Ser Ser Tyr Ser Val Lys gtc ctt gaa gat ctt cca gtt ggc aca gtc att gcc tgg ctt gag 3181 Val Leu Glu Asp Leu Pro Val Gly Thr Val Ile Ala Trp Leu Glu act cag gat cct gac ctt gga ttg ggg ggg caa gta cgt tac tca 3226 Thr Gln Asp Pro Asp Leu Gly Leu Gly Gly Gln Val Arg Tyr Ser ttg gtc aat gat tat aat ggg aga ttt gaa att gac aag gca agt 3271 Leu Val Asn Asp Tyr Asn Gly Arg Phe Glu Ile Asp Lys Ala Ser ggt gcc atc cgc ttg agc aaa gag ctt gac tat gaa aag cag cag 3316 Gly Ala Ile Arg Leu Ser Lys Glu Leu Asp Tyr Glu Lys Gln Gln ttc tac aac ctg aca gtc agg gcc aaa gac aaa ggg cgg cct gtc 3361 Phe Tyr Asn Leu Thr Val Arg Ala Lys Asp Lys Gly Arg Pro Val tct ctg tca tca att tct ttt gtt gag gtg gag gtg gta gat gtc 3406 Ser Leu Ser Ser Ile Ser Phe Val Glu Val Glu Val Val Asp Val aat gaa aac ctt cat aca cca tat ttc cca gac ttt gct gtt gtt 3451 Asn Glu Asn Leu His Thr Pro Tyr Phe Pro Asp Phe Ala Val Val gga tct gtc aaa gaa aac tca cgg att gga aca agc gtg ctg cag 3496 Gly Ser Val Lys Glu Asn Ser Arg Ile Gly Thr Ser Val Leu Gln gtg act gcc cat gat gag gat tct ggt agg gat gga gag atc cag 3541 Val Thr Ala His Asp Glu Asp Ser Gly Arg Asp Gly Glu Ile Gln tac tcc atc aga gac ggc agt ggt ctt ggg agg ttc aat ata gac 3586 Tyr Ser Ile Arg Asp Gly Ser Gly Leu Gly Arg Phe Asn Ile Asp gat gag agt gga gtc atc act gct gct gac att ctt gat cga gag 3631 Asp Glu Ser Gly Val Ile Thr Ala Ala Asp Ile Leu Asp Arg Glu aca aca gcg tcc tac tgg ctg aca gtg tat gcc aca gac cgg ggc 3676 Thr Thr Ala Ser Tyr Trp Leu Thr Val Tyr Ala Thr Asp Arg Gly gtg gtc cct ctt tac tcc acc att gag gtc tac ata gaa gta gaa 3721 Val Val Pro Leu Tyr Ser Thr Ile Glu Val Tyr Ile Glu Val Glu gat gtg aac gac aat gcc cca ctg acc tca gag ccc atc tat tat 3766 Asp Val Asn Asp Asn Ala Pro Leu Thr Ser Glu Pro Ile Tyr Tyr ccc gtt gtc atg gag aat tct ccg aag gat gtg tct gtc att cag 3811 Pro Val Val Met Glu Asn Ser Pro Lys Asp Val Ser Val Ile Gln att caa gct gaa gat ccc gac tct ggt tcc aat gaa aaa ctg acc 3856 Ile Gln Ala Glu Asp Pro Asp Ser Gly Ser Asn Glu Lys Leu Thr tat agg att aca agt gga aac cca cag aac ttt ttc gcc atc aat 3901 Tyr Arg Ile Thr Ser Gly Asn Pro Gln Asn Phe Phe Ala Ile Asn atc aaa aca ggt ctg att acc acg act tca agg aaa ttg gat cga 3946 Ile Lys Thr Gly Leu Ile Thr Thr Thr Ser Arg Lys Leu Asp Arg gag cag cag gca gaa cat ttt ctt gag gtg aca gtg acg gat ggc 3991 Glu Gln Gln Ala Glu His Phe Leu Glu Val Thr Val Thr Asp Gly ggt tct tct ccg aaa cag tca acc att tgg gtg gta gtt cag gtt 4036 Gly Ser Ser Pro Lys Gln Ser Thr Ile Trp Val Val Val Gln Val cta gat gaa aat gac aac aag ccc cag ttc cct gag aag gtc tac 4081 Leu Asp Glu Asn Asp Asn Lys Pro Gln Phe Pro Glu Lys Val Tyr cag atc aag ctt cca gag cgt gac cga aag aag agg ggt gaa ccc 4126 Gln Ile Lys Leu Pro Glu Arg Asp Arg Lys Lys Arg Gly Glu Pro att tac agg gct ttt gca ttt gac aga gac gaa ggc ccc aat gca 4171 Ile Tyr Arg Ala Phe Ala Phe Asp Arg Asp Glu Gly Pro Asn Ala gaa atc tcc tac agt att gtg gat ggg aac gat gat gga aag ttc 4216 Glu Ile Ser Tyr Ser Ile Val Asp Gly Asn Asp Asp Gly Lys Phe ttt att gac ccg aaa act ggc atg gtc tct tcc aga aag caa ttc 4261 Phe Ile Asp Pro Lys Thr Gly Met Val Ser Ser Arg Lys Gln Phe aca gca gga agt tat gac atc ctg acg atc aag gct gtg gac aat 4306 Thr Ala Gly Ser Tyr Asp Ile Leu Thr Ile Lys Ala Val Asp Asn ggc cgc cca cag aaa tcc tcc act gcc cgc ctc cac atc gaa tgg 4351 Gly Arg Pro Gln Lys Ser Ser Thr Ala Arg Leu His Ile Glu Trp att aag aag ccc cca cct tca cct ata cca ttg aca ttc gat gaa 4396 Ile Lys Lys Pro Pro Pro Ser Pro Ile Pro Leu Thr Phe Asp Glu cca ttt tac aac ttc acc atc atg gag agt gac aaa gta aca gag 4441 Pro Phe Tyr Asn Phe Thr Ile Met Glu Ser Asp Lys Val Thr Glu att gta ggg gtg gtg tct gtg cag cca gct aac acc cct ctg tgg 4486 Ile Val Gly Val Val Ser Val Gln Pro Ala Asn Thr Pro Leu Trp ttt gac atc atc ggg ggg aat ttt gac agc tct ttt gat gca gag 4531 Phe Asp Ile Ile Gly Gly Asn Phe Asp Ser Ser Phe Asp Ala Glu aag ggt gtt gga aca att gtc att gca aag cct ttg gat gca gag 4576 Lys Gly Val Gly Thr Ile Val Ile Ala Lys Pro Leu Asp Ala Glu caa agg tca gtc tac aac atg agc gtg gag gtc acc gat gga aca 4621 Gln Arg Ser Val Tyr Asn Met Ser Val Glu Val Thr Asp Gly Thr aat gtt gct gtc act cag gta ttt att acg gtg ctg gat aat aat 4666 Asn Val Ala Val Thr Gln Val Phe Ile Thr Val Leu Asp Asn Asn gat aat ggc cca gaa ttc tcc cag cca cat tat gat gtg acc att 4711 Asp Asn Gly Pro Glu Phe Ser Gln Pro His Tyr Asp Val Thr Ile tct gag gac gtg cct cct gac acg gag ata ctg cag att gag gcc 4756 Ser Glu Asp Val Pro Pro Asp Thr Glu Ile Leu Gln Ile Glu Ala aca gac aga gat gag aag cac aag cta agc tac acc atc cac agt 4801 Thr Asp Arg Asp Glu Lys His Lys Leu Ser Tyr Thr Ile His Ser agc atc gat gcc atc agc atg agg aaa ttc cgg ata gac ccc agt 4846 Ser Ile Asp Ala Ile Ser Met Arg Lys Phe Arg Ile Asp Pro Ser aca ggc gtg ctc tac act gct gaa agg ctg gac cat gag gcc cag 4891 Thr Gly Val Leu Tyr Thr Ala Glu Arg Leu Asp His Glu Ala Gln gac aag cac atc ctc aac ata atg gtc aga gat cag gaa ttt cct 4936 Asp Lys His Ile Leu Asn Ile Met Val Arg Asp Gln Glu Phe Pro tac cga aga aac ttg gcc cga gtc att gtg aat gtg gaa gat gct 4981 Tyr Arg Arg Asn Leu Ala Arg Val Ile Val Asn Val Glu Asp Ala aac gac cat agt cct tac ttc acc aat cca ctg tat gaa gca tcg 5026 Asn Asp His Ser Pro Tyr Phe Thr Asn Pro Leu Tyr Glu Ala Ser gtg ttc gaa tca gca gct ctg gga tca gtt gtt ctg caa gtg aca 5071 Val Phe Glu Ser Ala Ala Leu Gly Ser Val Val Leu Gln Val Thr gct ctg gac aaa gac aag ggg gaa aac gca gag ctc ata tat tcc 5116 Ala Leu Asp Lys Asp Lys Gly Glu Asn Ala Glu Leu Ile Tyr Ser att gaa gca ggg aac aca ggg aac acg ttt aag att gaa cca gtc 5161 Ile Glu Ala Gly Asn Thr Gly Asn Thr Phe Lys Ile Glu Pro Val ctg ggc atc atc acc att tcc aaa gag cca gac atg aca gcc atg 5206 Leu Gly Ile Ile Thr Ile Ser Lys Glu Pro Asp Met Thr Ala Met ggt cag ttt gtc ctg tca gtt aaa gtc aca gat caa ggc tcg cca 5251 Gly Gln Phe Val Leu Ser Val Lys Val Thr Asp Gln Gly Ser Pro cca atg tct gcc act gca att gtc cgc atc tcc atc agc atg tct 5296 Pro Met Ser Ala Thr Ala Ile Val Arg Ile Ser Ile Ser Met Ser gat aac tcc cac ccc aag ttc act cac aaa gac tac caa gct gaa 5341 Asp Asn Ser His Pro Lys Phe Thr His Lys Asp Tyr Gln Ala Glu gta aat gaa aat gtg gat att gga acg tct gtc atc ctg atc tca 5386 Val Asn Glu Asn Val Asp Ile Gly Thr Ser Val Ile Leu Ile Ser gcc atc agc cag tca acc cta atc tat gaa gtc aaa gat gga aac 5431 Ala Ile Ser Gln Ser Thr Leu Ile Tyr Glu Val Lys Asp Gly Asn atc aat gga gtc ttt acc ata aat cca tat tct gga gtc atc acc 5476 Ile Asn Gly Val Phe Thr Ile Asn Pro Tyr Ser Gly Val Ile Thr act agg aga gct ctg gat tat gaa cat acc tct tcc tat caa ctc 5521 Thr Arg Arg Ala Leu Asp Tyr Glu His Thr Ser Ser Tyr Gln Leu atc att cag gcc act aac atg gca ggc atg gct tcc aat gcc acc 5566 Ile Ile Gln Ala Thr Asn Met Ala Gly Met Ala Ser Asn Ala Thr gtc agt gtg cag gtt gtg gat gaa aat gat aac ccc cct gtg ttt 5611 Val Ser Val Gln Val Val Asp Glu Asn Asp Asn Pro Pro Val Phe ctc ttt tct caa tac tca ggt agc ctg agt gag gct gcc ccc atc 5656 Leu Phe Ser Gln Tyr Ser Gly Ser Leu Ser Glu Ala Ala Pro Ile aac agc ctt gtc agg agc cta gac aac agc cca ctg gta atc cga 5701 Asn Ser Leu Val Arg Ser Leu Asp Asn Ser Pro Leu Val Ile Arg gcc aca gac gct gac agt aac caa aac gca ctc ctg gtg tat cag 5746 Ala Thr Asp Ala Asp Ser Asn Gln Asn Ala Leu Leu Val Tyr Gln atc gtg gag tcc aca gcc aag aag ttc ttc aca gtg gac tct agc 5791 Ile Val Glu Ser Thr Ala Lys Lys Phe Phe Thr Val Asp Ser Ser aca gga gcc att aga aca atc gcc aac ctg gac cat gaa gtc atc 5836 Thr Gly Ala Ile Arg Thr Ile Ala Asn Leu Asp His Glu Val Ile gca cac ttc cac ttc cat gtg cac gtg aga gac agc ggg aac cca 5881 Ala His Phe His Phe His Val His Val Arg Asp Ser Gly Asn Pro cag cta act gca gag agt cca gtt gag gtc aac att gag gtg aca 5926 Gln Leu Thr Ala Glu Ser Pro Val Glu Val Asn Ile Glu Val Thr gat gtg aat gat aat cca ccc gtg ttc act cag gct gtg ttt gaa 5971 Asp Val Asn Asp Asn Pro Pro Val Phe Thr Gln Ala Val Phe Glu act gtc ttg ctt ctc ccc acc tac gtt ggt gtg gag gtt cta aag 6016 Thr Val Leu Leu Leu Pro Thr Tyr Val Gly Val Glu Val Leu Lys gtg agc gcc aca gac cct gac tct gag gta ccc cct gaa ctg aca 6061 Val Ser Ala Thr Asp Pro Asp Ser Glu Val Pro Pro Glu Leu Thr tac agt ctc atg gaa gga agt gtg gat cat ttt cta atg gac cca 6106 Tyr Ser Leu Met Glu Gly Ser Val Asp His Phe Leu Met Asp Pro aat act gga gtg ctt acc ata aaa aat aat aat ctc tcc aaa gat 6151 Asn Thr Gly Val Leu Thr Ile Lys Asn Asn Asn Leu Ser Lys Asp cac tac atg cta ata gtc aga gta tct gat ggg aag ttc tac agt 6196 His Tyr Met Leu Ile Val Arg Val Ser Asp Gly Lys Phe Tyr Ser act gcc atg gtc acc atc atg gtt aaa gaa gcc atg gac agt ggc 6241 Thr Ala Met Val Thr Ile Met Val Lys Glu Ala Met Asp Ser Gly ctc cac ttc aca caa agc ttt tat tcc acc tcc att tca gag aac 6286 Leu His Phe Thr Gln Ser Phe Tyr Ser Thr Ser Ile Ser Glu Asn agc aca aac ata acc aaa gtt gct att gtc aat gca gtt gga aac 6331 Ser Thr Asn Ile Thr Lys Val Ala Ile Val Asn Ala Val Gly Asn cgc ctt aat gag ccc tta aaa tac agc atc tta aac cca gga aat 6376 Arg Leu Asn Glu Pro Leu Lys Tyr Ser Ile Leu Asn Pro Gly Asn aaa ttc aag ata aaa tct acc tca gga gtc att caa acc aca gga 6421 Lys Phe Lys Ile Lys Ser Thr Ser Gly Val Ile Gln Thr Thr Gly gtc ccc ttt gac cgt gaa gaa cag gag tta tat gag ttg gtg gtg 6466 Val Pro Phe Asp Arg Glu Glu Gln Glu Leu Tyr Glu Leu Val Val gaa gcc agt cgt gag cta gac cat ttg cgt gtg gcg agg gtg gta 6511 Glu Ala Ser Arg Glu Leu Asp His Leu Arg Val Ala Arg Val Val gtc agg gtt aac att gaa gat gta aat gac aac tct cct gtc ttt 6556 Val Arg Val Asn Ile Glu Asp Val Asn Asp Asn Ser Pro Val Phe gtg ggt ctc cct tac tat gct gct gtg caa gtt gat gct gag cca 6601 Val Gly Leu Pro Tyr Tyr Ala Ala Val Gln Val Asp Ala Glu Pro ggg act ctg ata tac cgg gta aca gcc atc gac aaa gat aaa ggt 6646 Gly Thr Leu Ile Tyr Arg Val Thr Ala Ile Asp Lys Asp Lys Gly gcc aat gga gaa gtg acc tac gtc ttg cag gat gac tat ggt cac 6691 Ala Asn Gly Glu Val Thr Tyr Val Leu Gln Asp Asp Tyr Gly His ttt gaa att aac cct aat tca ggg aat gtg att tta aaa gaa gcg 6736 Phe Glu Ile Asn Pro Asn Ser Gly Asn Val Ile Leu Lys Glu Ala ttc aac tca gat ctc tcc aac att gac tat gga gtc acc att ctt 6781 Phe Asn Ser Asp Leu Ser Asn Ile Asp Tyr Gly Val Thr Ile Leu gcc aag gat ggt ggc act cct tct ctg tcc aca ttt gtg gaa ctt 6826 Ala Lys Asp Gly Gly Thr Pro Ser Leu Ser Thr Phe Val Glu Leu ccc atc acc att gtt aac aaa gca atg cct gtg ttt gat aag cct 6871 Pro Ile Thr Ile Val Asn Lys Ala Met Pro Val Phe Asp Lys Pro ttt tat aca gca tca atc aat gaa gat atc tca ata aac act ccc 6916 Phe Tyr Thr Ala Ser Ile Asn Glu Asp Ile Ser Ile Asn Thr Pro atc ctc agc atc aat gcc acc agc cca gaa ggc cag ggc atc ata 6961 Ile Leu Ser Ile Asn Ala Thr Ser Pro Glu Gly Gln Gly Ile Ile tac ctc atc atc gat gga gat ccc ttc caa cag ttt aac att gac 7006 Tyr Leu Ile Ile Asp Gly Asp Pro Phe Gln Gln Phe Asn Ile Asp ttt gac act ggg gtc cta aaa gtc att agt cct ttg gat tat gaa 7051 Phe Asp Thr Gly Val Leu Lys Val Ile Ser Pro Leu Asp Tyr Glu gtc atg tca gtt tac aag ttg aca gtg aga gct agt gat gct ctt 7096 Val Met Ser Val Tyr Lys Leu Thr Val Arg Ala Ser Asp Ala Leu act ggt gcc agg gct gaa gtc act gtg gac ctg cta gtg gat gat 7141 Thr Gly Ala Arg Ala Glu Val Thr Val Asp Leu Leu Val Asp Asp gtc aat gat aac cct cct gtt ttt gat cag ccc act tac aac aca 7186 Val Asn Asp Asn Pro Pro Val Phe Asp Gln Pro Thr Tyr Asn Thr aca cta tct gaa tcg tct ctt att gga aca cct gtt ctg caa ctt 7231 Thr Leu Ser Glu Ser Ser Leu Ile Gly Thr Pro Val Leu Gln Leu gtg tca act gac gca gac tcg gga aac aac aac ctg gtc cat tat 7276 Val Ser Thr Asp Ala Asp Ser Gly Asn Asn Asn Leu Val His Tyr cag att gtc cag gat act tac aat agc aca gac tac ttt cac ata 7321 Gln Ile Val Gln Asp Thr Tyr Asn Ser Thr Asp Tyr Phe His Ile gat agt tca agt ggc tta att ctg aca gcg agg atg cta gac cat 7366 Asp Ser Ser Ser Gly Leu Ile Leu Thr Ala Arg Met Leu Asp His gaa ttg gtg caa cac tgc acc ttg aaa gtc aca gca act gat aat 7411 Glu Leu Val Gln His Cys Thr Leu Lys Val Thr Ala Thr Asp Asn ggt ttt cca tcc cta agc agt gaa gtc ctg gtt caa atc tac att 7456 Gly Phe Pro Ser Leu Ser Ser Glu Val Leu Val Gln Ile Tyr Ile tct gat gtc aat gac aac cct cca gtt ttt aat cag ctc att tat 7501 Ser Asp Val Asn Asp Asn Pro Pro Val Phe Asn Gln Leu Ile Tyr gaa tct tat gtg agt gaa tta gcc ccc cgg ggt cat ttt gta acc 7546 Glu Ser Tyr Val Ser Glu Leu Ala Pro Arg Gly His Phe Val Thr tgt gtg caa gcc tca gat gca gac agc tct gac ttt gac cgg ttg 7591 Cys Val Gln Ala Ser Asp Ala Asp Ser Ser Asp Phe Asp Arg Leu gaa tac agc att tta tct ggg aat gat cga acc agc ttt ctg atg 7636 Glu Tyr Ser Ile Leu Ser Gly Asn Asp Arg Thr Ser Phe Leu Met gac agc aag agt gga gtt ctc aca ctg tct agc cac cgg aag cag 7681 Asp Ser Lys Ser Gly Val Leu Thr Leu Ser Ser His Arg Lys Gln cgt atg gag cct ctg tat agt ctc aat gtg tct gtg tct gat gga 7726 Arg Met Glu Pro Leu Tyr Ser Leu Asn Val Ser Val Ser Asp Gly ctg ttt acc agc act gcc cag gtt cac atc agg gtt ctt ggg gct 7771 Leu Phe Thr Ser Thr Ala Gln Val His Ile Arg Val Leu Gly Ala aat ttg tac agc cct gcc ttt tca caa agc aca tac gta gct gag 7816 Asn Leu Tyr Ser Pro Ala Phe Ser Gln Ser Thr Tyr Val Ala Glu gta aga gag aat gca gcc tct ggg aca aag gtc att cat gtc cga 7861 Val Arg Glu Asn Ala Ala Ser Gly Thr Lys Val Ile His Val Arg gcc aca gat ggg gat cca gga aca tat gga cag gtc agc tat tcc 7906 Ala Thr Asp Gly Asp Pro Gly Thr Tyr Gly Gln Val Ser Tyr Ser atc atc aat gac ttt gcc aag gat cgg ttc ctc ata gac agc aat 7951 Ile Ile Asn Asp Phe Ala Lys Asp Arg Phe Leu Ile Asp Ser Asn gga cag atc atc acg aca gaa aga cta gac cgt gaa aac cct ctg 7996 Gly Gln Ile Ile Thr Thr Glu Arg Leu Asp Arg Glu Asn Pro Leu gaa gga gat att agt att tat ctg agg gcc ctg gat ggt gga ggg 8041 Glu Gly Asp Ile Ser Ile Tyr Leu Arg Ala Leu Asp Gly Gly Gly aga act acg ttc tgc acc gtg cgg gtg att gtg gtg gat gag aat 8086 Arg Thr Thr Phe Cys Thr Val Arg Val Ile Val Val Asp Glu Asn gac aat gcc cct cag ttc atg aca ctg gaa tac agg gcc agc gtc 8131 Asp Asn Ala Pro Gln Phe Met Thr Leu Glu Tyr Arg Ala Ser Val aga gct gac gtg gga agg ggc cac ttg gtc aca caa gtt caa gct 8176 Arg Ala Asp Val Gly Arg Gly His Leu Val Thr Gln Val Gln Ala ttg gat cca gat gat gga gca aac tct agg att aca tat tcc ctc 8221 Leu Asp Pro Asp Asp Gly Ala Asn Ser Arg Ile Thr Tyr Ser Leu tat agt gag gcc tca gtg tca gtg gct gac ctc ttg gaa att gat 8266 Tyr Ser Glu Ala Ser Val Ser Val Ala Asp Leu Leu Glu Ile Asp cct gat aat ggc tgg atg gtg acc aaa ggc aat ttt aac caa cta 8311 Pro Asp Asn Gly Trp Met Val Thr Lys Gly Asn Phe Asn Gln Leu aga aac acg gtg ctg tcc ttc ttc gtg aag gca gta gat ggt ggc 8356 Arg Asn Thr Val Leu Ser Phe Phe Val Lys Ala Val Asp Gly Gly att cca gtc aga cac tcc ctc atc ccc gtc tac atc cat gtc ctg 8401 Ile Pro Val Arg His Ser Leu Ile Pro Val Tyr Ile His Val Leu ccc cct gaa acg ttt ctg cct tca ttc acc cag tct cag tac tcc 8446 Pro Pro Glu Thr Phe Leu Pro Ser Phe Thr Gln Ser Gln Tyr Ser ttt acc att gca gaa gat aca tcc att gga agc aca ata gac acc 8491 Phe Thr Ile Ala Glu Asp Thr Ser Ile Gly Ser Thr Ile Asp Thr ttg agg att cta ccc aat caa agt gtc cgg ttc agc acg gtt aat 8536 Leu Arg Ile Leu Pro Asn Gln Ser Val Arg Phe Ser Thr Val Asn gga gaa cgg cca gag aat aac aaa gag aat gtc ttc atc ata gaa 8581 Gly Glu Arg Pro Glu Asn Asn Lys Glu Asn Val Phe Ile Ile Glu caa gag aca ggt gct atc aag ctt gac aaa cgc ctt gac cat gaa 8626 Gln Glu Thr Gly Ala Ile Lys Leu Asp Lys Arg Leu Asp His Glu gtc agc cca gct ttc cac ttt aaa gta gca gct act ata ccc ttg 8671 Val Ser Pro Ala Phe His Phe Lys Val Ala Ala Thr Ile Pro Leu gac aaa gtg gat att gtt ttc act gtg gat gta gat gtc aag gtg 8716 Asp Lys Val Asp Ile Val Phe Thr Val Asp Val Asp Val Lys Val tta gat ctg aat gac aac aaa cca gtc ttt gaa aca tcg agc tat 8761 Leu Asp Leu Asn Asp Asn Lys Pro Val Phe Glu Thr Ser Ser Tyr gaa acg atc ata atg gag ggg atg cct gtc ggc acc aag ctt gcc 8806 Glu Thr Ile Ile Met Glu Gly Met Pro Val Gly Thr Lys Leu Ala cag gtg aga gcc ata gac acg gac tgg gga gcc aat gga cag gtc 8851 Gln Val Arg Ala Ile Asp Thr Asp Trp Gly Ala Asn Gly Gln Val act tac tcc cta cac tca gat tcc cat ctt gaa aag gta atg gag 8896 Thr Tyr Ser Leu His Ser Asp Ser His Leu Glu Lys Val Met Glu gca ttc aat ata gac agc aac aca gga tgg atc agt aca ctg aag 8941 Ala Phe Asn Ile Asp Ser Asn Thr Gly Trp Ile Ser Thr Leu Lys gac ctg gac cat gag aca gat ccc acc ttc tcc ttc ttt gtg gtg 8986 Asp Leu Asp His Glu Thr Asp Pro Thr Phe Ser Phe Phe Val Val gct tcc gac ctc gga gag gct ttc tct ctc tct tcc atg gct ctg 9031 Ala Ser Asp Leu Gly Glu Ala Phe Ser Leu Ser Ser Met Ala Leu gtc tcg gtc aag gtg aca gat ata aat gac aat gca cca gtc ttt 9076 Val Ser Val Lys Val Thr Asp Ile Asn Asp Asn Ala Pro Val Phe gct cat gag gtg tac cga gga aac gtg aag gag agt gac ccg ccg 9121 Ala His Glu Val Tyr Arg Gly Asn Val Lys Glu Ser Asp Pro Pro ggg gag gtg gta gct gtt ctc agc aca ttg gac aaa gac acc tcc 9166 Gly Glu Val Val Ala Val Leu Ser Thr Leu Asp Lys Asp Thr Ser aac ata aat cgc caa gtg agc tac cac att aca gga ggg aac ccc 9211 Asn Ile Asn Arg Gln Val Ser Tyr His Ile Thr Gly Gly Asn Pro cga gga cgg ttt gcc ctg ggc atg gtg cag agt gag tgg aag gtc 9256 Arg Gly Arg Phe Ala Leu Gly Met Val Gln Ser Glu Trp Lys Val tat gtg aag agg cct ctg gat cga gag gaa caa gac att tac ttc 9301 Tyr Val Lys Arg Pro Leu Asp Arg Glu Glu Gln Asp Ile Tyr Phe ctc aat atc act gcc tct gat gga ctc ttt gtc aca cag gcc atg 9346 Leu Asn Ile Thr Ala Ser Asp Gly Leu Phe Val Thr Gln Ala Met gta gaa gtg act gtc agt gac gta aat gac aac agc cca gtg tgt 9391 Val Glu Val Thr Val Ser Asp Val Asn Asp Asn Ser Pro Val Cys gat cag gtt gca tac tca gca tca ctt cct gaa gac att ccg tca 9436 Asp Gln Val Ala Tyr Ser Ala Ser Leu Pro Glu Asp Ile Pro Ser aat aaa atc atc ctg aag gtc agt gcc aag gat gcg gac att gga 9481 Asn Lys Ile Ile Leu Lys Val Ser Ala Lys Asp Ala Asp Ile Gly tcc aat gga gat ata cga tac tca ctc tat ggt tct gga aac agt 9526 Ser Asn Gly Asp Ile Arg Tyr Ser Leu Tyr Gly Ser Gly Asn Ser gac ttt ttt cta gat cca gaa agt ggt gag tta aaa acc ttg gcc 9571 Asp Phe Phe Leu Asp Pro Glu Ser Gly Glu Leu Lys Thr Leu Ala ttg ttg gac cgg gag agg gtc cca gtg tac aac ctg att gcc agg 9616 Leu Leu Asp Arg Glu Arg Val Pro Val Tyr Asn Leu Ile Ala Arg gcc act gat gga ggt ggc cgc ttc tgc agc tcc act gtc ctc ctg 9661 Ala Thr Asp Gly Gly Gly Arg Phe Cys Ser Ser Thr Val Leu Leu ctc cta gaa gat gtg aat gat aac ccc cct gtg ttt tcc tcc aac 9706 Leu Leu Glu Asp Val Asn Asp Asn Pro Pro Val Phe Ser Ser Asn cac tac act gca tgt gtc tat gag aac acg gcc act aag gct ctg 9751 His Tyr Thr Ala Cys Val Tyr Glu Asn Thr Ala Thr Lys Ala Leu ctg acc aga gtg caa gcg gtg gac cct gat gtt ggc atc aac agg 9796 Leu Thr Arg Val Gln Ala Val Asp Pro Asp Val Gly Ile Asn Arg aag gtt gtg tat tcc ctg gag gac tca gcc agt gga gtc ttc tcc 9841 Lys Val Val Tyr Ser Leu Glu Asp Ser Ala Ser Gly Val Phe Ser atc gac agc tcc tct ggt gtc atc gtt ctg gaa cag cct cta gat 9886 Ile Asp Ser Ser Ser Gly Val Ile Val Leu Glu Gln Pro Leu Asp cga gag cag cag tca tcc tat aac atc agt gtg cgg gcc aca gac 9931 Arg Glu Gln Gln Ser Ser Tyr Asn Ile Ser Val Arg Ala Thr Asp cag agt cct gga cag tcc ctc tcc tct ctc acc tcg gtc acc atc 9976 Gln Ser Pro Gly Gln Ser Leu Ser Ser Leu Thr Ser Val Thr Ile act gtc ctg gac att aat gac aac ccc cct gta ttt gag agg agg 10021 Thr Val Leu Asp Ile Asn Asp Asn Pro Pro Val Phe Glu Arg Arg gat tac ctg gta aca gtg cct gag gac act tcc ctt ggc acc caa 10066 Asp Tyr Leu Val Thr Val Pro Glu Asp Thr Ser Leu Gly Thr Gln gtc ctg tct gtt ttt gcc acc agc aaa gat att ggt acc aat gct 10111 Val Leu Ser Val Phe Ala Thr Ser Lys Asp Ile Gly Thr Asn Ala gag ata act tac ctc atc cgg tct ggg aat gaa caa ggg aaa ttt 10156 Glu Ile Thr Tyr Leu Ile Arg Ser Gly Asn Glu Gln Gly Lys Phe agg atc aac cca aag aca ggg ggt att tct gtc ttg gaa gcg ctg 10201 Arg Ile Asn Pro Lys Thr Gly Gly Ile Ser Val Leu Glu Ala Leu gac tat gaa atg tgc aaa aga ttt tac ctt gtg gtg gaa gct aaa 10246 Asp Tyr Glu Met Cys Lys Arg Phe Tyr Leu Val Val Glu Ala Lys gac gga ggc acc cca gcc ctc agc acg gca gcc act gtc agc atc 10291 Asp Gly Gly Thr Pro Ala Leu Ser Thr Ala Ala Thr Val Ser Ile gac ctc aca gat gtg aat gat aac cct cct cgg ttc agc caa gat 10336 Asp Leu Thr Asp Val Asn Asp Asn Pro Pro Arg Phe Ser Gln Asp gtc tac agt gct gtc atc agt gag gat gcc tta gag ggg gac tct 10381 Val Tyr Ser Ala Val Ile Ser Glu Asp Ala Leu Glu Gly Asp Ser gtc att ctg ctg ata gca gaa gat gtg gat agc aag cct aat gga 10426 Val Ile Leu Leu Ile Ala Glu Asp Val Asp Ser Lys Pro Asn Gly cag att cgg ttt tcc atc gtg ggt gga gat agg gac aat gaa ttt 10471 Gln Ile Arg Phe Ser Ile Val Gly Gly Asp Arg Asp Asn Glu Phe gct gtc gat ccc atc ttg gga ctt gtg aaa gtt aag aag aaa ctg 10516 Ala Val Asp Pro Ile Leu Gly Leu Val Lys Val Lys Lys Lys Leu gac cgg gag cgg gtg tca gga tac tcc ctg ctc atc cag gca gta 10561 Asp Arg Glu Arg Val Ser Gly Tyr Ser Leu Leu Ile Gln Ala Val gat agt ggc att cct gca atg tcc tca acg aca act gtc aac att 10606 Asp Ser Gly Ile Pro Ala Met Ser Ser Thr Thr Thr Val Asn Ile gat att tct gat gtg aac gac aac agt cca gtg ttt aca cct gcc 10651 Asp Ile Ser Asp Val Asn Asp Asn Ser Pro Val Phe Thr Pro Ala aac tac act gcc gtg atc cag gaa aat aag cca gtg ggt acc agc 10696 Asn Tyr Thr Ala Val Ile Gln Glu Asn Lys Pro Val Gly Thr Ser atc tta cag ctt gtg gtg aca gac aga gac tcc ttt cac aat ggg 10741 Ile Leu Gln Leu Val Val Thr Asp Arg Asp Ser Phe His Asn Gly cct ccc ttt tcc ttc tct att ttg tcg gga aat gaa gat gag gag 10786 Pro Pro Phe Ser Phe Ser Ile Leu Ser Gly Asn Glu Asp Glu Glu ttc atg ctg gac tcc cat ggg atc ctt cgg tca gca gtg gtc ttc 10831 Phe Met Leu Asp Ser His Gly Ile Leu Arg Ser Ala Val Val Phe cgg cac atg gag tcc cca gaa tac cta ctg tgc atc cag gca aaa 10876 Arg His Met Glu Ser Pro Glu Tyr Leu Leu Cys Ile Gln Ala Lys gac tca gga aaa cca cag caa gtt tcc cac acc tac atc cgt gtc 10921 Asp Ser Gly Lys Pro Gln Gln Val Ser His Thr Tyr Ile Arg Val cgg gtc att gag gaa agc acc cac aaa ccc aca gcc atc cct ctg 10966 Arg Val Ile Glu Glu Ser Thr His Lys Pro Thr Ala Ile Pro Leu gaa att ttc atc gtc acc atg gag gat gat ttt cct ggt ggg gtc 11011 Glu Ile Phe Ile Val Thr Met Glu Asp Asp Phe Pro Gly Gly Val att gga aaa atc cac gcc acg gat cag gac atg tat gat gtg ctg 11056 Ile Gly Lys Ile His Ala Thr Asp Gln Asp Met Tyr Asp Val Leu acg ttt gcc ctg aaa tca gaa cag aag agt ctg ttc aaa gtg aac 11101 Thr Phe Ala Leu Lys Ser Glu Gln Lys Ser Leu Phe Lys Val Asn agt cac gat gga aaa atc att gct ctg gga ggc ctg gac agt ggg 11146 Ser His Asp Gly Lys Ile Ile Ala Leu Gly Gly Leu Asp Ser Gly aag tat gtc ctg aat gtg tct gtg agt gat ggc cgc ttc caa gtg 11191 Lys Tyr Val Leu Asn Val Ser Val Ser Asp Gly Arg Phe Gln Val ccc atc gat gtc gtt gta cac gtg gag caa ctg gtg cac gag atg 11236 Pro Ile Asp Val Val Val His Val Glu Gln Leu Val His Glu Met ctg caa aac acc gtc aca att cgc ttt gag aat gtg tct ccc gag 11281 Leu Gln Asn Thr Val Thr Ile Arg Phe Glu Asn Val Ser Pro Glu gac ttt gtg ggg ctg cac atg cac ggc ttc cgg cgc att ctg cgg 11326 Asp Phe Val Gly Leu His Met His Gly Phe Arg Arg Ile Leu Arg aat gcg gtc ctc acc cag aag cag gac agc ctg cgc atc atc agc 11371 Asn Ala Val Leu Thr Gln Lys Gln Asp Ser Leu Arg Ile Ile Ser atc caa ccc gtg gtg ggc act aac cag ctg gac atg ctg ttt gct 11416 Ile Gln Pro Val Val Gly Thr Asn Gln Leu Asp Met Leu Phe Ala gtg gag atg cac agc agc gag ttc tac aaa cca gcc tac ctg atc 11461 Val Glu Met His Ser Ser Glu Phe Tyr Lys Pro Ala Tyr Leu Ile cag aag ttg tcc aac gcc agg aga cac ctg gaa aac gtc atg cat 11506 Gln Lys Leu Ser Asn Ala Arg Arg His Leu Glu Asn Val Met His ata gca gcc atc ttg gaa aag aac tgc tcg gga ttg gac tgt cag 11551 Ile Ala Ala Ile Leu Glu Lys Asn Cys Ser Gly Leu Asp Cys Gln gag cag cac tgt gag cag ggc ttg tca ctg gat tcc cac gca ctc 11596 Glu Gln His Cys Glu Gln Gly Leu Ser Leu Asp Ser His Ala Leu atg acc tac agc acg gct cgc atc agc ttc gtg tgt cca cgt ttc 11641 Met Thr Tyr Ser Thr Ala Arg Ile Ser Phe Val Cys Pro Arg Phe tat agg aac gtg cgc tgc aca tgt aat gga gga gtg tgt ccc ggg 11686 Tyr Arg Asn Val Arg Cys Thr Cys Asn Gly Gly Val Cys Pro Gly tcc aac gat cct tgt gtg gaa aaa ccg tgt cca gaa gac atg caa 11731 Ser Asn Asp Pro Cys Val Glu Lys Pro Cys Pro Glu Asp Met Gln tgt gtg ggt tat gag gcc agc agg aga cca ttt ctc tgc cag tgt 11776 Cys Val Gly Tyr Glu Ala Ser Arg Arg Pro Phe Leu Cys Gln Cys cca cca ggg aaa ctc gga gag tgc tca ggg cac act tct ctc agc 11821 Pro Pro Gly Lys Leu Gly Glu Cys Ser Gly His Thr Ser Leu Ser ttt gct ggc aac agt tac atc aag tat cgg ctt tct gaa aac agc 11866 Phe Ala Gly Asn Ser Tyr Ile Lys Tyr Arg Leu Ser Glu Asn Ser cga gaa gag gac ttc aag cta gcg ctg cgt ctg aga acc ttg cag 11911 Arg Glu Glu Asp Phe Lys Leu Ala Leu Arg Leu Arg Thr Leu Gln agc aat ggt atc ata atg tac acc cgg gcc aac ccc tgc atg att 11956 Ser Asn Gly Ile Ile Met Tyr Thr Arg Ala Asn Pro Cys Met Ile ctg aag att gtg gaa ggc aag ctg tgg ttc cag ctg gac tgt ggc 12001 Leu Lys Ile Val Glu Gly Lys Leu Trp Phe Gln Leu Asp Cys Gly agc ggc cct ggg atc ctg ggc atc tcc agc cgc gct gtc aat gat 12046 Ser Gly Pro Gly Ile Leu Gly Ile Ser Ser Arg Ala Val Asn Asp ggg agc tgg cac tca gtc ttc ttg gag ctc aat cgc aat ttc acc 12091 Gly Ser Trp His Ser Val Phe Leu Glu Leu Asn Arg Asn Phe Thr agc ctg tcc ctg gac gac agc tac gtg gag cgt cgt agg gcg ccc 12136 Ser Leu Ser Leu Asp Asp Ser Tyr Val Glu Arg Arg Arg Ala Pro ctg tac ttc cag acc tta agc acc gac agt gcc atc ttc ttt gga 12181 Leu Tyr Phe Gln Thr Leu Ser Thr Asp Ser Ala Ile Phe Phe Gly gcg ctg gtg cag gca gat aat att cgc agc ctg acg gac aca cgt 12226 Ala Leu Val Gln Ala Asp Asn Ile Arg Ser Leu Thr Asp Thr Arg gtt acg cag gtc ctc ggt ggc ttc cag ggt tgc ctg gac tcc gtg 12271 Val Thr Gln Val Leu Gly Gly Phe Gln Gly Cys Leu Asp Ser Val gtg ctc aat cac aac gag cta ccc ctc caa aac aag cgc agc agc 12316 Val Leu Asn His Asn Glu Leu Pro Leu Gln Asn Lys Arg Ser Ser ttc gcg gag gtc gtg ggt ctc acg gag ctg aag ttg ggc tgt gtg 12361 Phe Ala Glu Val Val Gly Leu Thr Glu Leu Lys Leu Gly Cys Val ctc tac ccc gac gcg tgc caa cgc agc cca tgt ctg cat ggg ggc 12406 Leu Tyr Pro Asp Ala Cys Gln Arg Ser Pro Cys Leu His Gly Gly agc tgc agc ggt ctg ccc tct ggc ggc tat cag tgt tcc tgt ctc 12451 Ser Cys Ser Gly Leu Pro Ser Gly Gly Tyr Gln Cys Ser Cys Leu tcg cag ttc acg ggg aca aac tgt gaa tca gag atc aca gcc tgc 12496 Ser Gln Phe Thr Gly Thr Asn Cys Glu Ser Glu Ile Thr Ala Cys ttc cct aac cct tgc cgg aat gga gga tcc tgt gac ccc ata gga 12541 Phe Pro Asn Pro Cys Arg Asn Gly Gly Ser Cys Asp Pro Ile Gly aac acc ttc atc tgc agc tgt aaa gcc ggc ctc aca ggt gtc acg 12586 Asn Thr Phe Ile Cys Ser Cys Lys Ala Gly Leu Thr Gly Val Thr tgc gag gat gac gtt gac gag tgt gag cga gaa gag tgt gag aac 12631 Cys Glu Asp Asp Val Asp Glu Cys Glu Arg Glu Glu Cys Glu Asn ggg ggt tcc tgt gtc aac ctg ttc ggc tcc ttc ttc tgc aac tgc 12676 Gly Gly Ser Cys Val Asn Leu Phe Gly Ser Phe Phe Cys Asn Cys acg cca ggc tat gta ggc cag tac tgt ggc ttg cgc cct gtg gtt 12721 Thr Pro Gly Tyr Val Gly Gln Tyr Cys Gly Leu Arg Pro Val Val gtg ccc aac atc caa gct ggc cac tca tac gtg gga aag gag gag 12766 Val Pro Asn Ile Gln Ala Gly His Ser Tyr Val Gly Lys Glu Glu ctg ata ggc atc gct gtg gtc ctc ttt gtc atc ttc acc ctg att 12811 Leu Ile Gly Ile Ala Val Val Leu Phe Val Ile Phe Thr Leu Ile gtg ctc ttc atc gtc ttt cgc aag aag gtc ttt cga aag aac tac 12856 Val Leu Phe Ile Val Phe Arg Lys Lys Val Phe Arg Lys Asn Tyr tct cgc aac aac atc aca tta gtg cag gac ccg gcc aca gct gcg 12901 Ser Arg Asn Asn Ile Thr Leu Val Gln Asp Pro Ala Thr Ala Ala ttg ctg cat aag agc aat ggc atc ccc ttc cgc agc ctg cgt gca 12946 Leu Leu His Lys Ser Asn Gly Ile Pro Phe Arg Ser Leu Arg Ala gga gat ggg cgc aac gtg tac cag gag gtg ggg ccc ccg cag gtg 12991 Gly Asp Gly Arg Asn Val Tyr Gln Glu Val Gly Pro Pro Gln Val ccg gtg cgc ccc atg gcc tac aca ccc tgc ttc cag agc gac tca 13036 Pro Val Arg Pro Met Ala Tyr Thr Pro Cys Phe Gln Ser Asp Ser agg agc aac ctg gac aaa ggc ctg gac gcg ctg ggt ggg gaa cca 13081 Arg Ser Asn Leu Asp Lys Gly Leu Asp Ala Leu Gly Gly Glu Pro cag gag ctg agc aca ttt cac ccg gaa tcg cca cgc atc ctc aca 13126 Gln Glu Leu Ser Thr Phe His Pro Glu Ser Pro Arg Ile Leu Thr gca agg cga ggt gtg gtg gtg tgc agc gtg gct ccc aac ctc cca 13171 Ala Arg Arg Gly Val Val Val Cys Ser Val Ala Pro Asn Leu Pro gct gtg tca ccc tgc cgc tca gac tgc gac tcc atc cgg aag aat 13216 Ala Val Ser Pro Cys Arg Ser Asp Cys Asp Ser Ile Arg Lys Asn ggc tgg gac aca gga tct gaa aac aaa ggg gct gaa gac aca gga 13261 Gly Trp Asp Thr Gly Ser Glu Asn Lys Gly Ala Glu Asp Thr Gly gaa gtg acc tgc ttc gca aac agt aat aaa ggc agc aac tca gaa 13306 Glu Val Thr Cys Phe Ala Asn Ser Asn Lys Gly Ser Asn Ser Glu gtt cag tcc ctc aac tcc ttc cag tcg gat tct ggc gat gac aac 13351 Val Gln Ser Leu Asn Ser Phe Gln Ser Asp Ser Gly Asp Asp Asn gcc tat cac tgg gac acc tct gac tgg atg cct ggg gca cgg ctg 13396 Ala Tyr His Trp Asp Thr Ser Asp Trp Met Pro Gly Ala Arg Leu tct gat att gaa gaa atg ccc aac tat gag agc caa gat gga ggg 13441 Ser Asp Ile Glu Glu Met Pro Asn Tyr Glu Ser Gln Asp Gly Gly gca gta cac cag ggt agc aca aga gag ctg gag agt gac tac tac 13486 Ala Val His Gln Gly Ser Thr Arg Glu Leu Glu Ser Asp Tyr Tyr cta ggc gga tat gac atc gat agt gaa tac ccg cca cct cat gaa 13531 Leu Gly Gly Tyr Asp Ile Asp Ser Glu Tyr Pro Pro Pro His Glu gaa gag ttc ctg agt cag gat cag cta ccc cca cca ctg cca gag 13576 Glu Glu Phe Leu Ser Gln Asp Gln Leu Pro Pro Pro Leu Pro Glu gac ttc cct gaa cag tat gag gcc ctg cct ccc tcc cag ccc acc 13621 Asp Phe Pro Glu Gln Tyr Glu Ala Leu Pro Pro Ser Gln Pro Thr tca ctc act ggc acc atg agc cca gac tgc agg aga agg ccc cgg 13666 Ser Leu Thr Gly Thr Met Ser Pro Asp Cys Arg Arg Arg Pro Arg ttt cac ccc agc cag tac ctt cct cct cac cca ctc cct ggt gaa 13711 Phe His Pro Ser Gln Tyr Leu Pro Pro His Pro Leu Pro Gly Glu aca gat ttg ggg ggc cca ccc tcc agc tgt gat ttt agt act ttt 13756 Thr Asp Leu Gly Gly Pro Pro Ser Ser Cys Asp Phe Ser Thr Phe gca gta agc atg aac cag ggc aca gag gtc atg gcc ccc aca gac 13801 Ala Val Ser Met Asn Gln Gly Thr Glu Val Met Ala Pro Thr Asp agt gtg tct ctg tcc ttg cac aat tcc aga ggc acc tca tcc tca 13846 Ser Val Ser Leu Ser Leu His Asn Ser Arg Gly Thr Ser Ser Ser gat atg tca gcc cgc tgt ggc ttt gat gat tct gag gta gcc atg 13891 Asp Met Ser Ala Arg Cys Gly Phe Asp Asp Ser Glu Val Ala Met agt gac tac gag agc gcg ggc gag ctc agc ctc acc aac ctt cac 13936 Ser Asp Tyr Glu Ser Ala Gly Glu Leu Ser Leu Thr Asn Leu His att ccc ttt gtg gaa acg cag cac cag acc cag gtg 13972 Ile Pro Phe Val Glu Thr Gln His Gln Thr Gln Val tagaggacac ccgtaggtgc tgtgcccaga ctattacagc atggaagaaa agaagctgta 14032 cttgtgttgg atggagagaa gtctgtggaa atgtggattt tctatgagga acgccttcgc 14092 aagtcttact gtcacaagca agctggactc tcagagtgac acggagaggc tcagaactgt 14152 ttcaggggga caggggagct gacagacttt gttgtgggtg ttggtggctt ggaatgcaaa 14212 ggagaagaaa tgagtttact aagttaaatg ggagatcctg aatggcattg tgtattattg 14272 tgacccggaa agtacggaac cagagatcct tacagtattt agcctgccac catcagaggg 14332 gcatcattgc atgttttttg gggccaagga agtgagaata gtagatatgt ctgtcagaaa 14392 agttagtgtt gtagatgaag gagaagtgag agctaagcac gagtgtgggc ggaagcctta 14452 gaagccaaca ctgttgtttg aaagagctgc ctaattttca gctataaaat taggtttgag 14512 taacaaaaaa aaaaaaaa 14530
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G01N 33/53 G01N 33/566 33/566 C12R 1:91) //(C12N 15/09 ZNA C12N 15/00 ZNAA C12R 1:91) C12R 1:91) (72)発明者 小原 收 千葉県木更津市矢那1532番3号 財団法人 かずさディー・エヌ・エー研究所内 Fターム(参考) 2G045 AA40 DA12 DA13 DA14 DA36 DA77 FB02 FB03 4B024 AA01 AA11 BA80 CA09 HA01 HA14 4H045 AA10 BA10 CA45 EA50 FA74

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 以下の(a)又は(b)のポリペプチド
    をコードする塩基配列から成るDNA: (a)配列番号:1で示されるアミノ酸配列と同一又は
    実質的に同一のアミノ酸配列から成るポリペプチド、 (b)配列番号:1で示されるアミノ酸配列において、
    一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
    列から成り、(a)のポリペプチド、ヒトファット1蛋
    白質又はヒトファット2蛋白質と実質的に同質の生物学
    的活性を有するポリペプチド。
  2. 【請求項2】 以下の(a)又は(b)のDNA: (a)配列番号:2で示される塩基配列において、配列
    番号:1で示されるアミノ酸配列をコードするDNA、 (b)(a)のDNAとストリンジェントな条件下でハ
    イブリダイズし、(a)のポリペプチド、ヒトファット
    1蛋白質又はヒトファット2蛋白質と実質的に同質の生
    物学的活性を有する蛋白質をコードするDNA。
  3. 【請求項3】 請求項1又は2記載のDNAを含むヒト
    ファット3遺伝子。
  4. 【請求項4】 以下の(a)又は(b)のポリペプチ
    ド: (a)配列番号:1で示されるアミノ酸配列と同一又は
    実質的に同一のアミノ酸配列から成るポリペプチド、 (b)配列番号:1で示されるアミノ酸配列において、
    一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
    列から成り、(a)のポリペプチド、ヒトファット1蛋
    白質又はヒトファット2蛋白質と実質的に同質の生物学
    的活性を有するポリペプチド。
  5. 【請求項5】 請求項4に記載のポリペプチドを含むヒ
    トファット3蛋白質。
  6. 【請求項6】 以下の(a)又は(b)のポリペプチド
    をコードする塩基配列から成るラットファット3遺伝
    子: (a)配列番号:3で示されるアミノ酸配列と同一又は
    実質的に同一のアミノ酸配列から成るポリペプチド、 (b)配列番号:3で示されるアミノ酸配列において、
    一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
    列から成り、(a)のポリペプチドと実質的に同質の生
    物学的活性を有するポリペプチド。
  7. 【請求項7】 以下の(a)又は(b)のDNAから成
    るラットファット3遺伝子: (a)配列番号:4で示される塩基配列において、配列
    番号:3で示されるアミノ酸配列をコードするDNA、 (b)(a)のDNAとストリンジェントな条件下でハ
    イブリダイズし、(a)のポリペプチドと実質的に同質
    の生物学的活性を有する蛋白質をコードするDNA。
  8. 【請求項8】 以下の(a)又は(b)のポリペプチド
    から成るラットファット3蛋白質: (a)配列番号:1で示されるアミノ酸配列と同一又は
    実質的に同一のアミノ酸配列から成るポリペプチド、 (b)配列番号:1で示されるアミノ酸配列において、
    一部のアミノ酸が欠失、置換又は付加されたアミノ酸配
    列から成り、(a)のポリペプチドと実質的に同質の生
    物学的活性を有するポリペプチド。
JP2000082725A 2000-03-23 2000-03-23 新規ファット3遺伝子及びそれにコードされる蛋白質 Pending JP2001258573A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000082725A JP2001258573A (ja) 2000-03-23 2000-03-23 新規ファット3遺伝子及びそれにコードされる蛋白質

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000082725A JP2001258573A (ja) 2000-03-23 2000-03-23 新規ファット3遺伝子及びそれにコードされる蛋白質

Publications (1)

Publication Number Publication Date
JP2001258573A true JP2001258573A (ja) 2001-09-25

Family

ID=18599488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000082725A Pending JP2001258573A (ja) 2000-03-23 2000-03-23 新規ファット3遺伝子及びそれにコードされる蛋白質

Country Status (1)

Country Link
JP (1) JP2001258573A (ja)

Similar Documents

Publication Publication Date Title
JP2002112772A (ja) 新規ポリペプチドおよびそのdna
JPH10117789A (ja) ヒトセリンプロテアーゼ
US20030186333A1 (en) Down syndrome critical region 1-like protein
JP2003334088A (ja) ヒト由来の新規Klotho様タンパク質及びその遺伝子
WO2002052005A1 (fr) Genes et proteines codees par ceux-ci
US20030124543A1 (en) Breast cancer marker
JP2001258573A (ja) 新規ファット3遺伝子及びそれにコードされる蛋白質
US20030175754A1 (en) RVP-1 variant differentially expressed in crohns disease
US20060160082A1 (en) Novel genes and proteins encoded thereby
JP2002153290A (ja) 新規unc5H4遺伝子及びそれにコードされる蛋白質
JP2002360254A (ja) 新規膜結合型−分泌型megf8遺伝子及びそれにコードされる蛋白質
JP2003289881A (ja) アルツハイマー病関連遺伝子のスクリーニング方法
JP2000228984A (ja) 新規hPer3遺伝子及びそれにコードされる蛋白質
JP2004187668A (ja) HAT(Half−A−TPR)繰り返しモチ−フ及びプロリンに富む配列を有する新規ポリペプチド及びそれをコードするDNA
JP2004073076A (ja) BTB/POZドメインとKelch繰り返し配列を有する新規ポリペプチド及びそれをコードするDNA
US20030129655A1 (en) Nucleic acids encoding GTPase activating proteins
JP2004283094A (ja) イムノグロブリン様繰り返しドメイン及びプロリンに富む配列を有する新規ポリペプチド及びそれをコードするdna
JP2004024068A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2004073126A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2004222680A (ja) FHA、RINGfinger及びD111/G−patchドメインを有する新規ポリペプチド及びそれをコードするDNA
JP2004024068A6 (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2004173637A (ja) 新規遺伝子及びそれにコードされる蛋白質
JP2001327295A (ja) 新規ヒトダクサス遺伝子及びそれにコードされる蛋白質
JP2004081204A (ja) RasGEFモチーフを有する新規ポリペプチド及びそれをコードするDNA
JP2001238685A (ja) 新規遺伝子およびその用途

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100223