JP2002300880A - 新規ユビキチン特異プロテアーゼ - Google Patents

新規ユビキチン特異プロテアーゼ

Info

Publication number
JP2002300880A
JP2002300880A JP2001105813A JP2001105813A JP2002300880A JP 2002300880 A JP2002300880 A JP 2002300880A JP 2001105813 A JP2001105813 A JP 2001105813A JP 2001105813 A JP2001105813 A JP 2001105813A JP 2002300880 A JP2002300880 A JP 2002300880A
Authority
JP
Japan
Prior art keywords
leu
ser
glu
asp
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001105813A
Other languages
English (en)
Inventor
Osamu Obara
收 小原
Takahiro Nagase
隆弘 長瀬
Michio Oishi
道夫 大石
Hiroshi Yokota
博 横田
Naoya Wada
直也 和田
Takashi Okamoto
貴史 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichi Pharmaceutical Co Ltd
Kazusa DNA Research Institute Foundation
Original Assignee
Daiichi Pharmaceutical Co Ltd
Kazusa DNA Research Institute Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichi Pharmaceutical Co Ltd, Kazusa DNA Research Institute Foundation filed Critical Daiichi Pharmaceutical Co Ltd
Priority to JP2001105813A priority Critical patent/JP2002300880A/ja
Publication of JP2002300880A publication Critical patent/JP2002300880A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

(57)【要約】 (修正有) 【課題】新規の脱ユビキチン化活性を有するプロテアー
ゼ(USP)およびこれに由来するペプチドまたはポリ
ペプチド、これらをコードするポリヌクレオチドを提供
し、遺伝子工学手法による、新規USP由来のペプチド
またはポリペプチドの製造法を提供すること。 【解決手段】ヒト由来特定のアミノ酸配列で示されるポ
リペプチド、前記ポリペプチドを含有するポリペプチ
ド、前記ポリペプチドと少なくとも約70%のアミノ酸
配列上の相同性を有しかつ脱ユビキチン化活性を有する
ポリペプチド、および前記アミノ酸配列において1ない
し数個のアミノ酸の欠失、置換、付加あるいは挿入とい
った変異を有し、かつ脱ユビキチン化活性を有するポリ
ペプチド、から選択されるポリペプチド、および該ポリ
ペプチドをコードするポリヌクレオチドまたはその相補
鎖。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、新規な脱ユビキチン化
活性を有するプロテアーゼ(以下USPと呼ぶこともあ
る)に関するものである。さらに詳しくは、新規USP
のアミノ酸配列の全部または一部を有するペプチドまた
はポリペプチド、該ペプチドまたはポリペプチドをコー
ドするポリヌクレオチドまたはその相補鎖であるポリヌ
クレオチド、該ポリヌクレオチドを含有する組換えベク
ター、該組換えベクターを含む形質転換体、該ペプチド
またはポリペプチドに対する抗体、該ペプチドまたは該
ポリヌクレオチドと相互作用を有する化合物、該ポリペ
プチドもしくは該ポリヌクレオチドに作用する脱ユビキ
チン化活性阻害化合物または脱ユビキチン化活性賦活化
合物、これらの1種以上を含む医薬組成物、該ペプチド
または該ポリヌクレオチドを検定することからなる診断
手段、該形質転換体または該組換えベクターを使ったペ
プチドまたはポリペプチドの製造方法、該ペプチドまた
は該ポリヌクレオチドと相互作用を有する化合物のスク
リーニング方法に関係する。
【0002】
【従来の技術】ユビキチン(以下Ubと略称することもあ
る)は76個のアミノ酸からなるペプチド鎖であり、そ
のアミノ酸配列は酵母からヒトまで高度に保存されてい
る。Ubの生体内での役割は様々であり、発癌(引用文献
1-4)、細胞周期(引用文献5-7)、ウイルス感染(引用
文献8)および神経変性疾患(引用文献9-11)等多くの
生体反応に関与している。
【0003】Ubの最も重要な機能は、26Sプロテアソ
ームでの蛋白分解におけるシグナルとしての働きであ
る。ユビキチン活性化酵素(E1)、ユビキチン結合酵素
(E2)およびユビキチンリガーゼ(E3)といった一連の
ユビキチン化酵素によって、Ubは標的蛋白質にイソペプ
チド結合し、ポリユビキチン鎖を形成する。そのポリユ
ビキチン鎖が分解シグナルとなりプロテアソームに認識
され、ユビキチン化された蛋白質は分解される。
【0004】一方、生体は蛋白質からUbを遊離させ、蛋
白質の分解を抑制する機能も備えている。その脱ユビキ
チン化反応を担うのが脱ユビキチン化酵素(DUB)であ
る。DUBは、その構造から大きく2つのファミリーに分
類されている(引用文献12-14)。一つはユビキチンC
末端ヒドラーゼ(Ubiquitin C-terminal hydrase)(UC
H)と呼ばれるもので、分子量20kDaから30kD
aのものが多く、異種間で一次構造が保存されている。
UCHは主にUbのC末端に低分子が結合している場合にUb
を遊離させる。もう一つはユビキチン特異プロテアーゼ
(Ubiquitin specific protease)(USP)と呼ばれるも
ので、その分子量は40kDaから150kDaと様々
であり、アミノ酸配列の共通性が少ない。USPはその活
性ドメインとしてシステイン(Cys)ドメイン(Cys bo
x)、ヒスチジン(His)ドメイン(His box) およびア
スパラギン酸(Asp)ドメインを持ち、Cysドメイン内に
存在するシステイン残基を活性部位とするシステインプ
ロテアーゼである。USPはUbのC末端に高分子が結合し
ている場合にUbを遊離させる。
【0005】
【発明が解決しようとする課題】本発明が解決しようと
する課題の一つは、新規なUSPを見いだし、生体内に
おける該USPの制御を可能にすることである。より具
体的には、本発明の課題は新規な特性をもつUSPを提
供することであり、それに伴い有用性がある新規USP
由来のペプチドまたはポリペプチド、これらをコードす
るポリヌクレオチドを提供することである。また本発明
の別の課題は、新規USP由来のペプチドまたはポリペ
プチドに対する抗体を提供することである。さらに本発
明の別の課題は、新規USPの脱ユビキチン化活性の阻
害剤・拮抗剤・賦活剤等の同定を行うことであり、同定
された化合物を提供することである。またこれらを利用
した医薬組成物および診断のための測定方法を提供する
ことである。さらにまた、上記ポリヌクレオチドを用い
て遺伝子工学手法による新規USP由来のペプチドまた
はポリペプチドの製造法を提供することである。
【0006】
【課題を解決するための手段】本発明は、 1.下記の群より選ばれるポリペプチド; 配列表の配列番号1または配列番号2に記載のアミノ
酸配列からなるポリペプチド、 前記のポリペプチドを含有するポリペプチド、 前記のポリペプチドと少なくとも約70%のアミノ
酸配列上の相同性を有しかつ脱ユビキチン化活性を有す
るポリペプチド、および 前記アミノ酸配列において1ないし数個のアミノ酸の
欠失、置換、付加あるいは挿入といった変異を有し、か
つ脱ユビキチン化活性を有するポリペプチド、 2.配列表の配列番号1または配列番号2に記載のアミ
ノ酸配列の少なくとも約5個の連続するアミノ酸配列を
有するペプチド、 3.前項1または2のポリペプチドまたはペプチドをコ
ードするポリヌクレオチドまたはその相補鎖、 4.配列表の配列番号3または配列番号4に記載の塩基
配列からなるポリヌクレオチドまたはその相補鎖、 5.配列表の配列番号3または配列番号4に記載の塩基
配列からなるポリヌクレオチドまたはその相補鎖の少な
くとも約15個の連続する塩基配列からなるポリヌクレ
オチド、 6.前項3から5のいずれかのポリヌクレオチドまたは
その相補鎖とストリンジェントな条件下でハイブリダイ
ゼーションするポリヌクレオチド、 7.前項3から6のいずれかのポリヌクレオチドを含有
する組換えベクター、 8.前項7の組換えベクターを形質導入された形質転換
体、 9.前項8の形質転換体を培養する工程または前項7の
組換えベクターを利用した無細胞蛋白質合成手段を含
む、前項1または2のポリペプチドまたはペプチドの製
造方法、 10.前項1または2のポリペプチドまたはペプチドを
免疫学的に認識する抗体、 11.脱ユビキチン化活性を抑制する、前項10の抗
体、 12.前項1のポリペプチドと相互作用して脱ユビキチ
ン化活性を阻害もしくは活性化する化合物、および/ま
たは前項3もしくは4のポリヌクレオチドと相互作用し
てその発現を阻害もしくは促進する化合物のスクリーニ
ング方法であって、前項1もしくは2のポリペプチドも
しくはペプチド、前項3から6のいずれかのポリヌクレ
オチド、前項7のベクター、前項8の形質転換体、前項
10もしくは11の抗体のうちの少なくともいずれか1
つを用いることを特徴とするスクリーニング方法、 13.前項12の方法で同定される化合物、 14.前項1のポリペプチドと相互作用して脱ユビキチ
ン化活性を阻害もしくは活性化する化合物、または前項
3もしくは4のポリヌクレオチドと相互作用してその発
現を阻害もしくは促進する化合物、 15.前項1または2のポリペプチドもしくはペプチ
ド、前項3から6のいずれかのポリヌクレオチド、前項
7のベクター、前項8の形質転換体、前項10もしくは
11の抗体、または前項13もしくは14の化合物のう
ちの少なくともいずれか1つを含有することを特徴とす
る医薬組成物、 16.前項1のポリペプチドの発現または脱ユビキチン
化活性に関連した疾病の診断のための測定方法であっ
て、(a)該ポリペプチドをコードしている核酸および
/または(b)試料中の該ポリペプチドをマーカーとし
て分析することを含む測定方法、 17.前項1もしくは2のポリペプチドもしくはペプチ
ド、前項3から6のいずれかのポリヌクレオチド、また
は前項10もしくは11の抗体のうちの少なくとも1つ
を含んでなる、(a)該ポリペプチドまたは蛋白質をコ
ードしている核酸および/または(b)試料中の該ポリ
ペプチドをマーカーとして分析することを含む測定方法
に使用する試薬キット、 18.前項1のポリペプチドと相互作用して脱ユビキチ
ン化活性を阻害もしくは活性化する化合物、および/ま
たは前項3もしくは4のポリヌクレオチドと相互作用し
てその発現を阻害もしくは促進する化合物のスクリーニ
ング方法であって、前項1もしくは2のポリペプチドも
しくはペプチド、前項3から6のいずれかのポリヌクレ
オチド、前項7のベクター、前項8の形質転換体、前項
10もしくは11の抗体のうちの少なくともいずれか1
つを用いることを特徴とするスクリーニング方法で得ら
れる化合物を含有する神経変性疾患の予防・治療剤、 19.前項1または2のポリペプチドもしくはペプチ
ド、前項3から6のいずれかのポリヌクレオチド、前項
7のベクター、前項8の形質転換体、前項10もしくは
11の抗体、または前項13もしくは14の化合物のう
ちの少なくともいずれか1つを含有することを特徴とす
る神経変性疾患の予防・治療剤、 20.前項18または前項19に記載の神経変性疾患が
アルツハイマー病および/またはパーキンソン病である
神経変性疾患の予防・治療剤、からなる。
【0007】
【発明の実施の形態】(新規USP)本発明において提
供される新規USPは、ヒトcDNAライブラリーか
ら、新規なアミノ酸配列を有する物質としてそのcDN
Aが取得されたものである。当該新規USPは、ヒトの
腎臓、卵巣、胎盤、小脳での発現が比較的高いことがノ
ザンブロッティング法で確認された。当該新規USPは
脱ユビキチン化活性を持ち、その配列中に少なくともC
ysドメインおよびHisドメインを保有する。このド
メイン部位における相同性を除き、当該新規USPは既
知USPとそのアミノ酸配列において殆ど相同性を有さ
ない。
【0008】(ポリペプチドまたはペプチド)本発明に
係る新規USPは、配列表の配列番号1に記載のアミノ
酸配列からなるポリペプチドまたは該ポリペプチドを含
む配列番号2に記載のアミノ酸配列からなるポリペプチ
ドである。さらに本発明に係るポリペプチドまたはペプ
チドは、配列表の配列番号1または配列番号2に記載の
アミノ酸配列からなるポリペプチドの少なくとも一部分
を含有するポリペプチドまたはペプチドから選択され
る。その選択されるポリペプチドまたはペプチドは、配
列表の配列番号1または配列番号2に記載のアミノ酸配
列からなるポリペプチドと、アミノ酸配列上で約40%
以上、好ましくは約70%以上、より好ましくは約80
%以上、さらに好ましくは約90%、特に好ましくは約
95%以上の相同性を有する。この相同性をもつポリペ
プチドまたはペプチドの選択は、脱ユビキチン化活性の
有無の確認により行うことができる。脱ユビキチン化活
性は、例えば後述する実施例に示したように、ヒトユビ
キチンのC末端にグルタチオンS−トランスフェラーゼ
(GST)を付加したものを基質として、該基質からユビ
キチンを遊離させうるか否かを、ユビキチン遊離後のG
STを抗GST抗体によりイムノブロッティング法等の
公知の方法で検出することにより測定できる。
【0009】アミノ酸配列の相同性を決定する技術は、
自体公知であり、例えばアミノ酸配列を直接決定する方
法、cDNAのヌクレオチド配列を決定後これにコード
されるアミノ酸配列を推定する方法等が可能である。
【0010】本発明に係るポリペプチドまたはペプチド
は、配列表の配列番号1または配列番号2に記載のアミ
ノ酸配列からなるポリペプチドの部分配列を有するポリ
ペプチドまたはペプチドを包含し、これらは例えば試薬
・標準物質・免疫原として利用できる。その最小単位と
しては5個以上のアミノ酸、好ましくは8個以上のアミ
ノ酸、より好ましくは10個以上、さらに好ましくは1
5個以上の連続するアミノ酸で構成されるアミノ酸配列
からなり、好ましくは免疫学的に同定しうるポリペプチ
ドまたはペプチドも本発明の対象とする。これらのペプ
チドは、試薬もしくは標準物質、または後述するように
新規USPに特異的な抗体を作製するための抗原として
単独またはキャリアと結合して使用できる。
【0011】本発明の範囲には、上記のようにキャリア
等の別種の蛋白質または物質を結合したものも包含され
る。例えば、本発明に係るポリペプチド等の検出もしく
は精製を容易にするために、または別の機能を付加する
ために、そのN末端側やC末端側に別の蛋白質、例えば
アルカリホスファターゼ、β−ガラクトシダーゼ、Ig
G等の免疫グロブリンFc断片またはFLAG−tag
等のペプチドを直接またはリンカーペプチド等を介して
間接的に遺伝子工学的手法等の公知の方法を用いて付加
することもできる。
【0012】さらに、上記ポリペプチドまたはペプチド
を基にして脱ユビキチン化活性の存在を指標とすること
により、1以上、例えば1〜100個、好ましくは1〜
30個、より好ましくは1〜20個、さらに好ましくは
1〜10個で特に好ましくは1ないし数個のアミノ酸の
欠失・置換・付加あるいは挿入といった変異を有するア
ミノ酸配列からなるポリペプチドまたはペプチドも提供
される。欠失・置換・付加あるいは挿入の手段は自体公
知であり、例えば、部位特異的変異導入法、遺伝子相同
組換え法、プライマー伸長法またはポリメラーゼ連鎖増
幅法(PCR)を単独または適宜組み合わせて、例えば
サムブルック等編[モレキュラークローニング,ア ラ
ボラトリーマニュアル 第2版]コールドスプリングハ
ーバーラボラトリー,1989、村松正實編[ラボマニ
ュアル遺伝子工学]丸善株式会社,1988、エールリ
ッヒ,HE.編[PCRテクノロジー,DNA増幅の原
理と応用]ストックトンプレス,1989等の成書に記
載の方法に準じて、あるいはそれらの方法を改変して実
施することができ、例えばUlmerの技術(Scie
nce,219,666,1983)を利用することが
できる。
【0013】上記のような変異の導入において、当該蛋
白質の基本的な性質(物性、活性、または免疫学的活性
等)を変化させないという観点からは、例えば、同族ア
ミノ酸(極性アミノ酸、非極性アミノ酸、疎水性アミノ
酸、親水性アミノ酸、陽性荷電アミノ酸、陰性荷電アミ
ノ酸、芳香族アミノ酸等)の間での相互置換は容易に想
定される。
【0014】本発明においては、配列表の配列番号1ま
たは配列番号2に記載のアミノ酸配列からなるポリペプ
チドが有する生理活性と同様の活性を有するポリペプチ
ドまたはその最小活性単位(領域もしくはドメイン)も
提供されるが、それら以外にも、活性の強度または基質
特異性を変更したポリペプチドも提供される。これら
は、例えば配列表の配列番号1または配列番号2に記載
のアミノ酸配列からなるポリペプチド様物質もしくは該
ポリペプチドの拮抗物質として、または該ポリペプチド
の生理活性を調節する物質のスクリーニング等に使用す
る試薬として有用である。なお、ヒト以外の動物種の相
同遺伝子産物も当然本発明の範囲に包含される。
【0015】本明細書において、ペプチド、オリゴペプ
チドもしくはオリゴマーとも称する短鎖をポリペプチ
ド、また、長鎖のものを蛋白質ということもある。ペプ
チドは、ペプチド結合または修飾されたペプチド結合に
より互いに結合している2個またはそれ以上のアミノ酸
を意味する。
【0016】(ポリヌクレオチド)本発明の1つの態様
は、上記ポリペプチドまたはペプチドのアミノ酸配列、
例えば配列表の配列番号1または配列番号2に記載のア
ミノ酸配列をコードするポリヌクレオチドおよびその相
補鎖である。好ましくは、配列番号3または配列番号4
に記載の塩基配列からなるポリヌクレオチドおよび該ポ
リヌクレオチドに対する相補鎖である。これらは例えば
上記新規USPの製造に有用な遺伝子情報を提供するも
のであり、あるいは核酸に関する試薬・標準品としても
利用できる。
【0017】別の態様において本発明は、上記ポリペプ
チドまたはペプチドのアミノ酸配列、例えば配列表の配
列番号1または配列番号2に記載のアミノ酸配列をコー
ドするポリヌクレオチド、好ましくは配列表の配列番号
3または配列番号4の塩基配列からなるポリヌクレオチ
ドまたはその相補鎖の対応する領域にストリンジェント
な条件下でハイブリダイゼーションするポリヌクレオチ
ドを提供する。ハイブリダイゼーションの条件は、例え
ばサムブルック等編[モレキュラークローニング,ア
ラボラトリーマニュアル 第2版]コールドスプリング
ハーバーラボラトリー,(1989)等に従うことがで
きる。これらのポリヌクレオチドは目的のポリヌクレオ
チド、特に配列表の配列番号3または配列番号4に記載
の塩基配列からなるポリヌクレオチドまたはその相補鎖
にハイブリダイゼーションするものであれば必ずしも相
補的配列でなくとも良い。例えば、配列表の配列番号3
または配列番号4に記載の塩基配列からなるポリペプチ
ドまたはその相補鎖に対する相同性において、少なくと
も約40%、例えば、約70%以上、好ましくは約80
%以上、より好ましくは約90%以上、さらに好ましく
は約95%以上であればよい。また本発明に係るポリヌ
クレオチドは、上記ポリヌクレオチドの指定された塩基
の領域に対応する連続する10個以上のヌクレオチド、
好ましくは15個以上、より好ましくは20個以上の配
列からなるポリヌクレオチド、オリゴヌクレオチドおよ
び該相補鎖を包含する。
【0018】これらのポリヌクレオチドは、本発明に係
るポリペプチド等の製造においても、新規USPをコー
ドする核酸、例えばその遺伝子もしくはmRNAの検出
のためのプローブもしくはプライマーとしても、または
遺伝子発現を調節するためのアンチセンスオリゴヌクレ
オチド等としても有用である。その意味で、本発明に係
るポリヌクレオチドおよびオリゴヌクレオチドは翻訳領
域のみでなく、非翻訳領域に対応するものも包含する。
ここで、新規USPまたは該USPと同様の活性を有す
るポリペプチドをコードするポリヌクレオチドの選別
は、例えば公知の蛋白質発現系を利用して発現蛋白質の
確認を行い、その生理活性特に脱ユビキチン化活性を指
標にして行うことができる。蛋白質発現に無細胞蛋白質
発現系を利用する場合は、例えば胚芽、家兎網状赤血球
等由来のリボソーム系の技術を利用できる(Natur
e、179、160〜161、1957)。
【0019】(形質転換体)また本発明は、大腸菌、酵
母、枯草菌、昆虫細胞、動物細胞等の自体公知の宿主を
利用した遺伝子組換え技術によっても、本発明に係る新
規USPおよびその由来物からなるペプチドおよびポリ
ペプチドは提供可能である。本発明の具体例において
は、大腸菌を利用したが、無論これに限定されるもので
はない。
【0020】形質転換は、自体公知の手段が応用され、
例えばレプリコンとして、プラスミド、染色体、ウイル
ス等を利用して宿主の形質転換が行われる。より好まし
い系としては、遺伝子の安定性を考慮するならば、染色
体内へのインテグレート法であるが、簡便には核外遺伝
子を利用した自律複製系の利用である。
【0021】ベクターは、選択した宿主の種類により選
別され、発現目的の遺伝子配列と複製そして制御に関す
る情報を担持した遺伝子配列とを構成要素とする。組合
せは原核細胞、真核細胞によって分別され、プロモータ
ー、リボソーム結合部位、ターミネーター、シグナル配
列、エンハンサー等を自体公知の方法によって組合せ利
用できる。
【0022】形質転換体は、自体公知の各々の宿主の培
養条件に最適な条件を選択して培養される。培養は、発
現産生される新規USPおよびその由来物からなるペプ
チドおよびポリペプチドの酵素活性特に脱ユビキチン化
活性をマーカーにして行ってもよいが、培地中の形質転
換体量を指標にして継代培養またはバッチによって、生
産してもよい。
【0023】(新規USPおよびその由来物回収)培地
からの新規USPおよびその由来物からなるペプチドお
よびポリペプチドの回収は、脱ユビキチン化活性を指標
にして、分子篩、イオンカラムクロマトグラフィー、ア
フィニティクロマトグラフィー等を組合せるか、溶解度
差にもとづく硫安、アルコール等の分画手段により精製
回収できる。好ましくは、アミノ酸配列の情報に基づ
き、該アミノ酸配列に対する抗体を作成し、ポリクロー
ナル抗体またはモノクロ−ナル抗体によって、特異的に
吸着回収する方法を用いる。
【0024】(抗体)抗体は、本発明に係る新規USP
およびその由来物からなるペプチドまたはポリペプチド
の抗原決定基を選別し、作製する。抗原は新規USPま
たはその断片でもよく、少なくとも8個、好ましくは少
なくとも10個、より好ましくは少なくとも12個、さ
らに好ましくは15個以上のアミノ酸で構成される。新
規USPに特異的な抗体を作製するためには、USPフ
ァミリーの保存領域以外の新規USPに固有なアミノ酸
配列からなる領域を用いることが好ましい。この領域の
アミノ酸配列は、必ずしも配列表の配列番号1または配
列番号2に記載のものと相同である必要はなく、蛋白質
の立体構造上の外部への露出部位が好ましく、露出部位
のアミノ酸配列が一次構造上で不連続であっても、該露
出部位について連続的なアミノ酸配列であればよい。抗
体は免疫学的に新規USPおよびその由来物からなるペ
プチドまたはポリペプチドを結合または認識する限り特
に限定されない。この結合または認識の有無は、公知の
抗原抗体結合反応によって決定される。
【0025】抗体を産生するためには、本発明に係る新
規USPおよびその由来物からなるペプチドまたはポリ
ペプチドを、アジュバントの存在または非存在下で、単
独または担体に結合して、動物に対して体液性応答およ
び/または細胞性応答等の免疫誘導を行うことによって
行われる。担体は、それ自体が宿主に対して有害作用を
おこさなければ、特に限定されず例えばセルロース、重
合アミノ酸、アルブミン等が例示される。免疫される動
物は、マウス、ラット、ウサギ、ヤギ、ウマ等が好適に
用いられる。ポリクローナル抗体は、自体公知の血清か
らの抗体回収法によって取得される。好ましい手段とし
ては、免疫アフィニティークロマトグラフィー法であ
る。
【0026】モノクロ−ナル抗体を生産するためには、
上記の免疫手段が施された動物から抗体産生細胞(例え
ば、脾臓またはリンパ節由来)を回収し、自体公知の永
久増殖性細胞(例えば、P3X63Ag8株等のミエロ
ーマ株)への形質転換手段を導入することによって行わ
れる。例えば、該抗体産生細胞と永久増殖性細胞とのハ
イブリドーマをクローン化し、本発明に係るUSPを特
異的に認識する抗体を選別し、該ハイブリドーマの培養
液から抗体を回収する。
【0027】USPの活性を抑制し得るポリクローナル
抗体またはモノクローナル抗体は、直接本発明に係る新
規USPに結合し、脱ユビキチン化活性を制御可能であ
る。そのため、USPが関連する各種疾患の治療・予防
のために有用である。さらにこれらの抗体は、上記US
Pおよびその由来物であるポリペプチドまたはペプチド
の精製用抗体、試薬、または標識マーカー等として利用
できる。
【0028】(同定・スクリーニング)かくして調製さ
れた新規USPおよびその由来物からなるペプチドまた
はポリペプチド、これらをコードするポリヌクレオチド
およびその相補鎖、これらのアミノ酸配列および塩基配
列の情報に基づき形質転換させた細胞、またはこれらを
用いる蛋白質合成系ならびに新規USPおよびその由来
物からなるペプチドまたはポリペプチドを免疫学的に認
識する抗体は、単独または複数手段を組合せることによ
って、新規USPおよびその由来物からなるペプチドお
よびポリペプチドに対する活性阻害剤または活性賦活剤
の同定・スクリーニングに有効な手段を提供する。例え
ば、ペプチドまたはポリペプチドの立体構造に基づくド
ラッグデザインによる拮抗剤の選別、蛋白質合成系を利
用した遺伝子レベルでの発現調整剤の選別、抗体を利用
した抗体認識物質の選別等が、自体公知の医薬品スクリ
ーニングシステムにおいて、利用可能である。
【0029】また、本発明に係る新規USPおよびその
由来物からなるペプチドまたはポリペプチドを用いて、
スクリーニングされる化合物とこれらペプチドまたはポ
リペプチドとの間の相互作用を可能にする条件を選別
し、この相互作用の有無を検出することのできるシグナ
ル(マーカー)を使用する系を導入し、このシグナル
(マーカー)の存在・不存在を検出することにより、本
発明に係る新規USPおよびその由来物からなるペプチ
ドおよびポリペプチドの活性、例えば脱ユビキチン化活
性、を賦活または阻害する化合物を同定可能である。
【0030】(化合物、医薬組成物)上記手段により同
定された化合物は、新規USPおよびその由来物からな
るペプチドおよびポリペプチドの活性、例えば脱ユビキ
チン化活性、の活性阻害剤、活性拮抗剤、または活性賦
活剤の候補化合物として、利用可能である。また、遺伝
子レベルでの新規USPおよびその由来物の系に対する
発現阻害剤、発現拮抗剤、発現賦活剤の候補化合物とし
ても利用可能である。その効果は、USPの発現や活性
の増加、減少または欠失等が関連する各種病的症状の予
防・治療を期待できる。後述するように、神経変性疾患
との係わりが重要であることから、同疾患の予防・治療
剤となる。かくして選別された候補化合物は、生物学的
有用性と毒性のバランスを考慮して選別することによっ
て、医薬組成物として調製可能である。
【0031】また本発明に係る新規USPおよびその由
来物からなるペプチドまたはポリペプチド、これらをコ
ードするポリヌクレオチドおよびその相補鎖、これらの
塩基配列を含むベクター、ならびに新規USPおよびそ
の由来物からなるペプチドまたはポリペプチドを免疫学
的に認識する抗体は、それ自体が、診断マーカーや試薬
等の疾病診断手段として、または新規USPの活性の阻
害、拮抗、もしくは賦活等の機能を利用して治療薬等の
医薬手段として使用し得る。なお、製剤化にあたって
は、自体公知のペプチドまたはポリペプチド、蛋白質、
ポリヌクレオチド、抗体等各対象に応じた製剤化手段を
導入すればよい。
【0032】本発明に係る新規USPの発現およびその
活性の減少や欠失等に関連する異常な症状の治療には、
1つの方法として当該USP自体あるいはUSPをコー
ドする遺伝子を活性化する治療上有効量の化合物(促進
剤)を医薬上許容される担体とともに投与し、そのこと
により異常な症状を改善することを特徴とする方法が挙
げられる。あるいは、遺伝子治療を用いて、対象中の細
胞内で当該USPを生成なさしめてもよい。上記ポリヌ
クレオチドを利用した遺伝子治療は、公知の方法が利用
できるが、例えば、上記のごとく本発明に係るポリヌク
レオチドを組み入れた複製欠損レトロウイルスベクター
を作製して遺伝子治療に利用すればよい。また、遺伝子
治療において、治療に使用する蛋白質を対象中において
生成させることもできる。例えば、蛋白質をコードして
いるDNAまたはRNAを用いて、例えばレトロウイル
スプラスミドベクターを用いることによりエクスビボ
(exvivo)において対象由来の細胞を処理し、次いで、
細胞を対象に導入することもできる。
【0033】本発明に係る新規USPの発現およびその
活性が過剰な場合、有効量の上記阻害剤化合物を医薬上
許容される担体とともに対象に投与して、当該USPの
活性を阻害し、そのことにより異常な症状を改善するこ
ともできる。さらに、発現ブロック法を用いて内在性の
上記USPをコードしている遺伝子の発現を阻害しても
よい。細胞内で生成させた、あるいは別個に投与された
当該遺伝子のアンチセンス配列を使用して当該遺伝子の
発現を阻害できる。これらのオリゴヌクレオチドは、上
記本発明に係るポリヌクレオチドを基にして設計し合成
できる。当該オリゴヌクレオチドはそれ自体投与するこ
とができ、あるいは関連オリゴマーをインビボで発現さ
せることもできる。
【0034】USPの発現や活性の増加、減少もしくは
欠失等の機能障害はUSPが係るユビキチンシステムの
異常をきたす。ユビキチンシステムの機能の一つは、生
体内で生じた異常蛋白の除去や転写因子、シグナル伝達
因子の分解による量的調節等である(引用文献21)。そ
のため、USPの異常と発癌や神経変性疾患との関わり
が示唆されている(引用文献21-23)。例えば、アルツ
ハイマー病やパーキンソン病で観察される蛋白凝集体の
多くが抗ユビキチン抗体に反応することから(引用文献
21)、神経変性疾患とUSPの機能異常との関係が示唆
される。上記本発明に係るUSPは、腎臓、卵巣および
胎盤と同様に小脳での発現が比較的高いことから、当該
USPがこれらの神経変性疾患と関わりがある可能性が
高い。また、当該USPを細胞内蛋白局在予測プログラ
ムPSORTにより解析したところ、核内に局在するこ
とが予測された。USPは染色体構造の維持にも関与し
ており、ユビキチン化されたヒストンの脱ユビキチン化
が染色体凝集に重要であることが知られている (引用
文献24)。最近、USPファミリーの1つであるUSP
16がH2Aを脱ユビキチン化することが報告されたが
(引用文献25)、本発明に係るUSPもヒストンの脱ユ
ビキチン化に関与している可能性がある。生体内には多
くのUSPが存在しており、それぞれ異なる基質特異性
や生理機能を有していると思われる。従って、本発明
は、USPの関与する生体機能の解明、とりわけ、発癌
プロセスの解明や、神経変性疾患、例えばアルツハイマ
ー病やパーキンソン病等の解明、ならびにそれらの予防
・治療剤および診断を可能とする上で非常に有用なもの
である。
【0035】(診断のための測定方法および試薬)本発
明に係る新規なUSPおよびその由来物からなるペプチ
ドまたはポリペプチド、これらをコードするポリヌクレ
オチドおよびその相補鎖、ならびに当該USPおよびそ
の由来物からなるペプチドまたはポリペプチドを免疫学
的に認識する抗体は、それ自体を単独で、診断マーカー
や試薬等として使用可能である。また本発明は、これら
のうちの1種またはそれ以上を充填した、1個またはそ
れ以上の容器を含んでなる試薬キットも提供する。な
お、製剤化にあたっては、自体公知のペプチドまたはポ
リペプチド、蛋白質、ポリヌクレオチド、または抗体等
それぞれに応じた製剤化手段を導入すればよい。
【0036】本発明に係る新規USPおよびその由来物
からなるペプチドまたはポリペプチドの発現または活性
に関連した疾患の診断手段は、例えば当該USPをコー
ドしている核酸との相互作用や反応性を利用して、相応
する核酸の存在量を決定すること、および/または当該
USPについて個体中の生体内分布を決定すること、お
よび/または当該USPの存在、個体由来の試料中の存
在量を決定することによって行われる。詳しくは、新規
USPを診断マーカーとして検定するのである。試料中
の当該USPの検出またはその存在量の決定に用いるこ
とができる測定法は当業者に周知である。このような測
定法には、ラジオイムノアッセイ、競争結合アッセイ、
ウェスタンブロット分析およびELISAアッセイ等が
ある。また、本発明に係る新規USPをコードするポリ
ヌクレオチドの検出法および定量法としては、例えば増
幅、PCR、RTPCR、RNアーゼ保護、ノーザンブ
ロッティングおよびその他のハイブリダイゼーション法
を用いてRNAレベルで測定することができる。
【0037】測定される試料として、個体由来の細胞、
例えば血液、尿、唾液、髄液、組織生検または剖検材料
等を挙げることができる。また、測定される核酸は、上
記各試料から自体公知の核酸調製法により得られる。核
酸は、ゲノムDNAを検出に直接使用してもよく、ある
いは分析前にPCRもしくはその他の増幅法を用いるこ
とにより酵素的に増幅してもよい。RNAまたはcDN
Aを同様に用いてもよい。正常遺伝子型との比較におい
て、増幅生成物のサイズ変化により欠失および挿入を検
出することができる。増幅DNAを標識した上記USP
をコードするDNAにハイブリダイゼーションさせるこ
とにより点突然変異を同定することができる。
【0038】上記測定により本発明に係るUSPおよび
該USPをコードするDNAの変異、減少、増加を検出
することにより、当該USPが関連する疾患、例えば、
癌あるいは神経変性疾患等、特にアルツハイマー病やパ
ーキンソン病等の診断が可能となる。
【0039】
【実施例】以下、本発明を実施例に基づき具体的に説明
するが、本発明は下記の実施例に限定されない。本発明
に係るUSPは、かずさDNA研究所のヒト長鎖cDN
A解析情報データベースから、バイオインフォーマティ
クス(bioinformatics)により、新規プロテアーゼ候補
遺伝子として抽出されたクローンpg01082を基に、その
全長cDNA配列が決定された。当該クローンは、11
45個のアミノ酸をコードするCDSを含む6642b
pのクローンであり(配列表の配列番号1)、プロテア
ーゼモチーフ検索から、USPのCysドメイン(Cys bo
x)(G-[LIVMFY]-x(1,3)-[AGC]-[NASM]-x-C-[FYW]-[L
IVMFC]-[NST]-[SACV]-x-[LIVMS]-Q)とHisドメイン(Hi
s-box)(Y-x-L-x-[SAG]-[LIVMFT]-x(2)-H-x-G-x(4,
5)-G-H-Y)およびアスパラギン酸(Asp)ドメインを有
する。なお、本発明に係る遺伝子は、Cys box内におい
て既知の当該ドメイン配列と一致していないアミノ酸残
基が一つ存在する。
【0040】A.大腸菌を用いた組換えpg01082の発現 1.組換えpg01082発現プラスミドの構築 組換えpg01082発現プラスミドをGATEWAYTM Cloning Tec
hnology(Life Technologies社)を用いて作製した。ま
ず、ヒト脳cDNAライブラリー(引用文献26)より得
たpg01082クローン(pBluescript II SK+のSalI-NotI部
位に挿入)を鋳型として、Advantage-HF2 PCR Kit(Clo
ntech社)を用いて推定ORF領域(ヌクレオチド番号1
0-3438)を増幅した後、BP clonase enzymeを用いた組
換え反応によりエントリーベクター(pDONR201)に挿入
し、pDONR-01082を作成した。なお、プライマーはattB-
01082(+)(5'-GGG ACA AGT TTG TAC AAA AAA GCA GGC
TTA ATG CTT CTT CCT ACA TGT CCT AAT ATG-3')とattB
-01082(+)(5'-GGG GAC CAC TTT GTA CAA GAA AGC TG
G GTC TCA ACA ACT TAA AGA AAG GAT TGG CTG-3')を使
用した。次に、pDONR-01082とN-terminal His-tagged P
rotein発現用ベクターであるpDEST17を用いて、LR clon
ase enzymeによる組替え反応によりHis-tagged pg01082
発現プラスミド(pHis-01082)を作成した。発現プラス
ミドは、NaClにより発現誘導が可能な大腸菌(E. col
i)BL21-SI(Life Technologies社)に導入した。な
お、増幅したORF領域にPCRエラー等の変異が起き
ていないことはシーケンシングにより確認した。シーケ
ンス反応はThermo Sequenase Cy5.5 Dye Terminator Cy
cle Sequencing Kitを、泳動および解析はGene Rapid
(いずれもAmersham pharmacia biotech社)を用い、添
付の説明書に従い実施した。
【0041】2. pg01082の大腸菌での発現誘導 LBON/Amp培地〔NaClを含まず、100μg/mlのアン
ピシリン(ampicillin)を含むLB培地〕に1/10量の前
培養液を接種し、25℃にてOD600が約1.0にな
るまで培養後、NaClを終濃度0.3Mになるように添加
し、さらに約6時間培養後、菌体を回収した。菌体をリ
ン酸緩衝食塩水(PBS)に懸濁後、超音波処理、遠心に
より上清を回収し、抽出液とした。抽出液を7.5%SD
S-PAGEにより分離後、抗His-tag抗体(Penta-HisTM Ant
ibody, QIAGEN社)を用いたイムノブロッティングによ
り蛋白質を検出した。なお、検出にはECL western blot
ting detection kit(Amersham pharmacia biotech社)
を使用した。
【0042】3.インビトロ(iv vitro)での脱ユビキ
チン化活性の検出 His-tagged USP15発現プラスミドpHis-USP15を、ヒト脳
cDNAライブラリー(引用文献26)から得たUSP15 cD
NA(KIAA0529クローン)を鋳型として、上記と同様にGA
TEWAYTM Cloning Technologyを用いて作成した。なお、
KIAA0529はUSP15のN末端3アミノ酸残基(Met-Ala-Gl
u)が欠失していたため、Bakerらの方法に従い(引用文
献15)、この3残基に対応するコドンをプライマー内に
設計し、完全なORFとした。pHis-USP15はpg01082と
同様に大腸菌BL21-SIに導入した。
【0043】大腸菌抽出液の調製は、pHis-01082または
pHis-USP15を保持する大腸菌BL21-SIを上記と同様に誘
導培養した後、菌体を回収した。菌体を培養液の1/10量
の50mM His-HCl, pH7.6/ 5mM EDTA/ 1mM DTTに懸濁後、
超音波処理により菌体を破壊し、遠心分離により上清を
回収した。これを活性測定用の大腸菌抽出液とした。
【0044】基質(Ub-M-GST)の調製は、ヒトユビキチ
ンのC末端にグルタチオンS−トランスフェラーゼ(GS
T)を結合させたUb-M-GSTの発現プラスミド、pTV118N/U
b-GSTを保持する大腸菌(E. coli)DH5αを37℃にて
OD600が約1.0になるまで培養後、IPTGを終
濃度10mMになるように添加し、さらに約4時間培養
後、菌体を回収した。菌体を50 mM Tris-HCl, pH7.6/ 5
mM EDTA/ 1 mM DTT/10% glycerol に懸濁し、リゾチー
ム、超音波処理により破壊後、遠心分離により上清を回
収し、グルタチオン・セファロース4B(Amersham pha
rmacia biotech社)を用いてUb-M-GSTを精製した。精製
物は50 mM Tris-HCl, pH7.6/ 5 mM EDTA/ 1 mM DTT/ 10
% glycerolに対して透析を行った後、使用時まで−80
℃にて保存した。
【0045】インビトロでの脱ユビキチン化反応は上記
の調製した各大腸菌抽出液10μlとUb-M-GST 5μl
(2.5μg)を50 mM Tris-HCl, pH7.6/ 5 mM EDTA/
1 mMDTT中にて混合後(計20μl)、37℃にて16
時間インキュベートした。反応液を15%または5−2
0% SDS-PAGEにより分離した後、1次抗体として抗G
ST抗体(Amersham pharmacia biotech社)、2次抗体
としてHRP(ホースラディシュパーオキシダーゼ)標
識抗ヤギ抗体(Alpha diagnostic international社)用
いたイムノブロッティングによりUb-M-GSTおよび遊離し
たGSTを検出した。なお、検出はECL western blotti
ng detection kitを使用した。
【0046】大腸菌を用いた組換えpg01082の発現は、p
g01082でのCDSの5′末端が翻訳開始コドンのATGで
はないため、最初(1st)のATGがさらに上流に存在する
可能性が考えられたが、pg01082のCDSにおける最初
のATGからの領域をORFとし、アミノ酸番号4から1
145までの1142個のアミノ酸を発現させた(配列
表の配列番号1)。pg01082のこの領域をN-terminal Hi
s-tagged proteinとして大腸菌BL21-SI株を用いて誘導
発現させたところ、予想される分子量(135 kDa)の蛋
白の発現が抗His抗体を用いたイムノブロッティングに
おいても検出されなかった。検出されない原因として発
現系が上手く動いていない可能性も考えられたが、発現
量が極めて微量である可能性(検出限界以下)も考え、
以下の活性の有無を検討した。
【0047】大腸菌にはUSPが存在しないことから、
上記で誘導発現させた大腸菌の抽出液を用いてpg01082
の脱ユビキチン化活性について検討した。しかしなが
ら、UbのC末端にGSTを結合させた人工基質、Ub-M-G
STに対する検討を行った結果、活性は検出されなかった
(図1)。ただし、脱ユビキチン化活性を有することが
報告されているUSP15(引用文献15)では活性が検出さ
れたことから(図1)、試験系には問題が無いことを確
認した。
【0048】B.共発現系での脱ユビキチン化活性の検
出 1.共発現用各種基質(Ub-X-GST)発現プラスミドの構
築 pTV118N/Ub-GSTを鋳型としてUb-GSTコード領域をPCR
により増幅させた後、GATEWAYTM Cloning Technologyを
用いて大腸菌発現用ベクター、pDEST14に挿入し、pDEST
14Ub-GSTを作成した。次に、pDEST14Ub-GSTからT7プ
ロモーターおよびUb-GSTコード領域を含む領域をSphIお
よびHindIII処理により切り出し、p15A由来の開始点(o
ri)を持つpACYC184(ニッポンジーン社)のSphI-HindI
II間に組み込み、pACUb-M-GSTを作成した。これを共発
現用Ub-M-GST発現プラスミドとした。次に、pACUb-M-GS
TをSalIおよびHindIIIで処理し、T7プロモーターおよ
びUb-GSTコード領域を含む領域をpBluescriptII SK
(+)(Stratagene社)のSalI-HindIII間に組み込み、p
BSUbGSTを作成した。さらに、pBSUbGSTを鋳型に、QuikC
hange Site-Directed Mutagenesis Kit(Stratagene
社)を用いてGSTのN末端のアミノ酸に対応するコド
ンをATG〔メチオニン(Met)〕からCCG〔プロリン(Pr
o)〕、ATC〔イソロイシン(Ile)〕およびCGT〔アルギ
ニン(Arg)〕に変換させたpBSUb-P-GST、pBSUb-I-GST
およびpBSUb-R-GSTを作成した。コドンの変換は、シー
ケンシングにより確認した。次に、各pBSUb-X-GSTをHin
dIIIおよびSphIで処理し、T7プロモーターおよびUb-X
-GSTコード領域を含む領域をpACYC184のHindIII-SphI間
に組み込み、各共発現用Ub-X-GST発現プラスミド、pACU
b-X-GSTを作成した。作成した4種類のpACUb-X-GSTは大
腸菌BL21-SIに導入し、塩化カルシウム法によりコンピ
テントセル化した。
【0049】2.His-tagged pg01082C508A発現プラス
ミドの構築 pg01082の推定活性残基である508番目のシステイン
(508-Cys)のアラニン(Ala)への置換は、QuikChange
Site-Directed Mutagenesis Kitを用いて行った。使用
したプライマーは、508-CysのコドンであるTGTがAlaの
コドンであるGCGに置換するように設計した(5'-CTT AC
T AAC CTT GGA GCT ACT GCG TAC TTA GCTTCT ACT ATT C
AG-3')。変異の導入をシーケンシングにて確認し、His
-taggedpg01082C508A発現プラスミド、pHis-01082C508A
を得た。
【0050】3.共発現株の作成 各pACUb-X-GSTをそれぞれ保持する大腸菌BL21-SIコンピ
テントセルにpHis-01082、pHis-01082C508A、pHis-USP1
5またはpHis-Lucを加え、形質転換した。形質転換体
は、100μg/mlアンピシリンおよび34μg/m
lクロラムフェニコールを含むLBON (NaClを含まない
LB培地) プレート上にて選択し、各種共発現株を得
た。なお、ヒスチジン付加ルシフェラーゼ(His-tagged
luciferase)発現プラスミドであるpHis-Lucは、pGL3-
Lucベクター(Promega社)を鋳型として、上記と同様に
GATEWAYTM Cloning Technologyを用いて作成した。
【0051】4.共発現試験 各種共発現株を100μg/mlアンピシリンおよび3
4μg/mlクロラムフェニコールを含むLBON培地中で
OD600が約0.7から1.0になるまで25℃にて
培養後、NaClを終濃度0.3Mになるように添加し、さ
らに約9時間培養後、菌体を回収した。上記大腸菌抽出
液の調製に従い抽出液を調製した後、抽出液をSDS-PAGE
により分離し、上記と同様に抗GST抗体を用いたイム
ノブロッティングによりUb-X-GSTおよび遊離のGSTを
検出した。
【0052】既知のUSPの中にはインビトロの系では
活性が認められないものの、基質との共発現系では活性
が認められるものもある (引用文献18)。そこで、pg0
1082についてもこの可能性を考え、共発現系での活性の
検出を試み、酵素発現用プラスミドが有するpBR322系の
oriとcompatibility(互換性)を示すp15Aのoriを有す
る基質(Ub-GST)発現用プラスミドを使用することによ
り、酵素と基質を同一菌体内で共発現させた(引用文献
16)。その結果、Ub-M-GSTに対するpg01082の脱ユビキ
チン化活性が、この共発現系で遊離のGSTが検出され
たことから、認められ、pg01082がUSPの一つである
ことが確認された(図2)。また、陽性コントロールと
してUSP15、陰性コントロールとしてルシフェラーゼ
(図中ではLucと表示)をそれぞれ同様に共発現させた
結果、USP15では活性が認められ、ルシフェラーゼでは
活性が認められなかったことから(図2)、試験系の妥
当性も確認された。
【0053】pg01082の脱ユビキチン化活性における基
質特異性を検討するために、Ub-M-GSTにおいてUbのC末
端直後のアミノ酸であるMetをPro、IleおよびArgに置換
させたUb-P-GST、Ub-I-GSTおよびUb-R-GSTを発現させる
各共発現用プラスミドを作成し、これら基質に対する活
性を共発現系で調べた。その結果、Ub-R-GSTに対しては
活性が認められたが、Ub-I-GSTおよびUb-P-GSTに対して
は活性は認められなかった(図2)。Ub-P-GSTに対して
活性を示すことが報告されているUSP15は(引用文献1
7)、Ub-P-GSTを含め全ての基質に対して活性が認めら
れた (図2)。
【0054】USPはシステインプロテアーゼの一つで
あり、Cys box内に存在するCys残基が活性部位であるこ
とが知られている。そこで、pg01082における推定活性
部位である508-CysをAlaに置換した変異体(pg01082
C508A)を上記のように作成し、Ub-M-GSTおよびUb-R-GS
Tを基質とした共発現系での脱ユビキチン化活性への影
響を検討した結果、pg01082C508Aにおいて両基質に対す
る活性の消失が認められた(図3)。本発明に係るUS
Pは、既知のUSPと同様に、508-Cysが活性に重要で
あることが確認された。また、pg01082はUb-M-GSTおよ
びUb-R-GSTに対しては活性が認められたが、Ub-I-GSTお
よびUb-P-GSTに対しては活性を示さず、基質選択性があ
ることが明らかとなった。一般にUb-P-GSTは切れにくい
基質であることが知られており、酵母に存在するUSP
は全てUb-P-GSTに対する活性が低い(引用文献17,1
9)。Ub-P-GSTに活性を示すヒトのUSPとしてUSP
4(引用文献17)とUSP15(引用文献15)が報告さ
れており、pg01082はこれらのUSPとは生体内で異な
る基質選択性を持つものと考えられた。
【0055】C.全長USP(hk03615x2)の調製 pg01082を基礎として、これのC末、N末を伸張させたh
k03615x2の調製を行った。まず、pg01082のC末端を更
に伸長させたクローンであるhk03615x1(図4A)が取
得された。pg01082の1138番目のアミノ酸でグルタ
ミン(1138-Gln)以下のC末端8アミノ酸はフレームシ
フトにより生じた配列であり、実際は1137番目のア
ルギニン(1137-Arg)からc末端側に更に1014個の
アミノ酸が付加されることが明らかとなった。また、N
末端側をさらに1261個のアミノ酸伸長させたクロー
ンであるhh02365mrp1(図4A)も取得し、これら3つ
のクローンをin silico上で連結させると、3395個
のアミノ酸をコードするORFを有するcDNA(hk03
615x2)となることが明らかとなった(ORFは18番
目のMetを1st Metとして規定した。ちなみに、CDSで
は3412個のアミノ酸をコードする。図4A中、CD
Sにおける1st Met含むN末端側18個のアミノ酸を一
文字表記しているが、三文字表記では、Leu Arg Arg As
n Leu Gln ArgVal Leu Ile Leu Leu Val Tyr Gly Val G
ln Met)(図4B)。よって、生体内では3381アミ
ノ酸からなるhk03615x2が存在しており、上記脱ユビキ
チン化活性の確認は、hk03615x2内の触媒ドメイン(cat
alytic domain)に対応する領域について行ったことと
なる。
【0056】
【発明の効果】本発明は、USPの関与する生体機能の
解明、とりわけ、発癌プロセスの解明や、神経変性疾
患、例えばアルツハイマー病やパーキンソン病等の解
明、ならびにそれらの予防、治療および診断を可能とす
る上で非常に有用なものである。
【0057】
【引用文献】1. Honda, R., Tanaka, H. and Yasuda,
H. Oncoprotein MDM2 is a ubiquitinligase E3 for tu
mor supressor p53. FEBS Letter. 420, 25 (1997) 2. Gupta, K., Copeland, N. G., Gilbert, D. J., Jen
kins, N. A. and Gray,D. A. Unp, a mouse gene relat
ed to the oncogene. Oncogene 8, 2307 (1993) 3. Gray, D. A., Inazawa, J., Gupta, K., Wong, A.,
Ueda, R. and Takahashi, T. Elevated expression of
Unph, a proto-oncogene at 3p21.3, in human lung tu
mors. Oncogene 10, 2179 (1995) 4. Papa, F. R. and Hochsrasser, M. The yeast DOA4
gene encodes a deubiquitinating enzyme related to
a product of the human tre-2 oncogene. Nature 366,
313 (1993) 5. Hershko, A. and Ciechanover, A. The ubiquitin s
ystem. Annu. Rev. Biochem. 67, 425 (1998) 6. Zhu, Y., Carroll, M., Papa, F. R., Hochstrasse
r, M. and D'andrea, A.D. DUB-1, a deubiquitinating
enzyme with growth-supressing activity. Proc.Nat
l. Acad. Sci. 93, 3275 (1996) 7. Zhu, Y., Lambert, K., Corless, C., Copeland, N.
G., Gilbert, D. J., Jenkins, N. A. and D'Andrea,
A. D. DUB-2 is a member of a novel family ofcytoki
ne-inducible deubiquitinating enzymes. J. Biol. Ch
em. 272, 51 (1997) 8. Everett, R. D., Meredith, M., Orr, A., Cross,
A., Kathoria, M. and Parkinson, J. A novel ubiquit
in-specific protease is dynamically associated wit
h the PML nuclear domain and binds to a herpesviru
s regulatory protein. EMBO J. 16, 1519 (1997) 9. Alves-Rodrigues, A., Gregori, L. and Figueiredo
-Pereira, ME. Ubiquitin, cellular inclusions and t
heir role in neurodegeneration. Trends Neurosci. 2
1, 516 (1998) 10. Leroy, E., Boyer, R., Auburger, G., Leube, B.,
Ulm, G., Mezey, E., Harta, G., Brownstein, M. J.,
Jonnalagada, S., Chernova, T., Dehejia, A.,Laveda
n, C., Gasser, T., Steinbach, P. J., Wilkinson, K.
D. and Polymeropoulos, M. H. The ubiquitin pathwa
y in Parkinson's disease. Nature 395,(1998) 11. Saigoh, K., Wang. Y., Suh, J. G., Yamanishi,
T., Sakai, Y., Kiyosawa, H., Harada, T., Ichihara,
N., Wakana, S., Kikuchi, T. and Wada, K. Intragen
ic deletion in the gene encoding ubiquitin carboxy
-terminal hydrolase in gad mice. Nature Genet. 23,
47 (1999) 12. Chung, C. H., and Beak, S. H., Deubiquitinatin
g enzymes: Their diversity and emerging roles. Bio
chem. Biophys. Res. Commun. 266, 633 (1999) 13. Wilkinson, K. D. Regulation of ubiquitin-depen
dent process by deubiquitinating enzymes. FASEB J.
11, 1245 (1997) 14. D'Andrea, A. and Pellman, D. Deubiquitinating
enzymes: a new class of biological reaulator. Cri
t. Rev. Biochem. Mol. Biol. 33, 337 (1998) 15. Baker, R. T., Wang, Xiao-Wen, Woollatt, E., Wh
ite, J. and SutherlandG. R. Identification, functi
onal characterization, and chromosomal localizatio
n of USP15, a novel human ubiquitin-specific prote
ase related tothe UNP oncoprotein, and a systemati
c nomenclature for human ubiquitin-specific protea
se. Genomics 59, 264 (1999) 16. Rao-Naik, C., Chandler, J. S, McArdle, B. and
Callis, J. Ubiquitin-specific proteases from Arabi
dopsis thaliana: Cloning of AtUBP5 and analysis of
substrate specificity of AtUBP3, AtUBP4 and AtUBP
5 using Escherichia coli in vivo and in vitro assa
ys. Arch Biochem Biophys. 379, 198 (2000) 17. Gilchrist, C. A., Gray, D. A. and Baker, R. T.
A ubiquitin-specificprotease that efficiently cle
aves the ubiquitin-proline bond. J. Biol. Chem. 27
2, 32280 (1997) 18. Chandler, J. S., McArdle, B. and Callis, J. At
UBP3 and AtUBP4 are two closely related Arabidopsi
s thaliana ubiquitin-specific proteases present in
the nucleus. Mol Gen Genet. 255, 302 (1997) 19. Bachmair, A., Finley, D. and Varshavsky, A. In
vivo half-life of a protein is a function of its
amino-terminal residue. Science 234, 179 (1986) 20. Wilkinson, K. D., Tashayev, V. L., O'Connor,
L. B., Larsen, C. N., Kasperek, E. and Pickart, C.
M. Metabolism of the polyubiquitin degradation si
gnal: structure, mechanism, and role of isopeptida
se T. Biochemistry 34, 14535 (1995) 21. 鈴木俊顕、志村秀樹、服部信孝、ユビキチンと神経
変性疾患、実験医学18,1478 (2000) 22. 鈴木俊顕、脱ユビキチン化酵素の多彩な作用、実験
医学 19, 193 (2001) 23. 阿南正、中尾光善、ユビキチン病の分子機構、蛋白
質 核酸 酵素44, 776 (1999) 24. Bradbury, E. M. Reversible histone modificatio
ns and the chromosomecell cycle. BioEssays 14, 9
(1992) 25. Cai, S. Y., Babbitt, R. W. and Marchesi, V. T.
A mutant deubiquitinating enzyme (Ubp-M) associ
ates with mitotic chromosomes and blocks cell divi
sion. Proc. Natl. Acad. Sci. U. S. A. 96, 2828 (1
999) 26.小原收、長瀬隆弘、野村信夫、蛋白質 核酸 酵素42,
2851 (1997)
【0058】
【配列表】 SEQUENCE LISTING <110> DAIICHI PHARMACEUTICAL CO., LTD Kazusa DNA Research Institute <120> Novel Ubiquitin specific protease <130> NP01-1027 <140> <141> <160> 4 <170> PatentIn Ver. 2.1 <210> 1 <211> 1137 <212> PRT <213> Homo sapiens <400> 1 Glu Leu Leu Met Leu Leu Pro Thr Cys Pro Asn Met Leu Met Ala Phe 1 5 10 15 Gln Asn Ile Ser Asp Glu Gln Ser Asn Asp Gly Phe Asn Trp Lys Glu 20 25 30 Leu Leu Lys Ile Lys Ser Ala His Lys Leu Leu Tyr Ala Leu Glu Ile 35 40 45 Ile Glu Ala Leu Gly Lys Pro Asn Arg Arg Ile Arg Arg Glu Ser Thr 50 55 60 Gly Ser Tyr Ser Asp Leu Tyr Pro Asp Ser Asp Asp Ser Ser Glu Asp 65 70 75 80 Gln Val Glu Asn Ser Lys Asn Ser Trp Ser Cys Lys Phe Val Ala Ala 85 90 95 Gly Gly Leu Gln Gln Leu Leu Glu Ile Phe Asn Ser Gly Ile Leu Glu 100 105 110 Pro Lys Glu Gln Glu Ser Trp Thr Val Trp Gln Leu Asp Cys Leu Ala 115 120 125 Cys Leu Leu Lys Leu Ile Cys Gln Phe Ala Val Asp Pro Ser Asp Leu 130 135 140 Asp Leu Ala Tyr His Asp Val Phe Ala Trp Ser Gly Ile Ala Glu Ser 145 150 155 160 His Arg Lys Arg Thr Trp Pro Gly Lys Ser Arg Lys Ala Ala Gly Asp 165 170 175 His Ala Lys Gly Leu His Ile Pro Arg Leu Thr Glu Val Phe Leu Val 180 185 190 Leu Val Gln Gly Thr Ser Leu Ile Gln Arg Leu Met Ser Val Ala Tyr 195 200 205 Thr Tyr Asp Asn Leu Ala Pro Arg Val Leu Lys Ala Gln Ser Asp His 210 215 220 Arg Ser Arg His Glu Val Ser His Tyr Ser Met Trp Leu Leu Val Ser 225 230 235 240 Trp Ala His Cys Cys Ser Leu Val Lys Ser Ser Leu Ala Asp Ser Asp 245 250 255 His Leu Gln Asp Trp Leu Lys Lys Leu Thr Leu Leu Ile Pro Glu Thr 260 265 270 Ala Val Arg His Glu Ser Cys Ser Gly Leu Tyr Lys Leu Ser Leu Ser 275 280 285 Gly Leu Asp Gly Gly Asp Ser Ile Asn Arg Ser Phe Leu Leu Leu Ala 290 295 300 Ala Ser Thr Leu Leu Lys Phe Leu Pro Asp Ala Gln Ala Leu Lys Pro 305 310 315 320 Ile Arg Ile Asp Asp Tyr Glu Glu Glu Pro Ile Leu Lys Pro Gly Cys 325 330 335 Lys Glu Tyr Phe Trp Leu Leu Cys Lys Leu Val Asp Asn Ile His Ile 340 345 350 Lys Asp Ala Ser Gln Thr Thr Leu Leu Asp Leu Asp Ala Leu Ala Arg 355 360 365 His Leu Ala Asp Cys Ile Arg Ser Arg Glu Ile Leu Asp His Gln Asp 370 375 380 Gly Asn Val Glu Asp Asp Gly Leu Thr Gly Leu Leu Arg Leu Ala Thr 385 390 395 400 Ser Val Val Lys His Lys Pro Pro Phe Lys Phe Ser Arg Glu Gly Gln 405 410 415 Glu Phe Leu Arg Asp Ile Phe Asn Leu Leu Phe Leu Leu Pro Ser Leu 420 425 430 Lys Asp Arg Gln Gln Pro Lys Cys Lys Ser His Ser Ser Arg Ala Ala 435 440 445 Ala Tyr Asp Leu Leu Val Glu Met Val Lys Gly Ser Val Glu Asn Tyr 450 455 460 Arg Leu Ile His Asn Trp Val Met Ala Gln His Met Gln Ser His Ala 465 470 475 480 Pro Tyr Lys Trp Asp Tyr Trp Pro His Glu Asp Val Arg Ala Glu Cys 485 490 495 Arg Phe Val Gly Leu Thr Asn Leu Gly Ala Thr Cys Tyr Leu Ala Ser 500 505 510 Thr Ile Gln Gln Leu Tyr Met Ile Pro Glu Ala Arg Gln Ala Val Phe 515 520 525 Thr Ala Lys Tyr Ser Glu Asp Met Lys His Lys Thr Thr Leu Leu Glu 530 535 540 Leu Gln Lys Met Phe Thr Tyr Leu Met Glu Ser Glu Cys Lys Ala Tyr 545 550 555 560 Asn Pro Arg Pro Phe Cys Lys Thr Tyr Thr Met Asp Lys Gln Pro Leu 565 570 575 Asn Thr Gly Glu Gln Lys Asp Met Thr Glu Phe Phe Thr Asp Leu Ile 580 585 590 Thr Lys Ile Glu Glu Met Ser Pro Glu Leu Lys Asn Thr Val Lys Ser 595 600 605 Leu Phe Gly Gly Val Ile Thr Asn Asn Val Val Ser Leu Asp Cys Glu 610 615 620 His Val Ser Gln Thr Ala Glu Glu Phe Tyr Thr Val Arg Cys Gln Val 625 630 635 640 Ala Asp Met Lys Asn Ile Tyr Glu Ser Leu Asp Glu Val Thr Ile Lys 645 650 655 Asp Thr Leu Glu Gly Asp Asn Met Tyr Thr Cys Ser His Cys Gly Lys 660 665 670 Lys Val Arg Ala Glu Lys Arg Ala Cys Phe Lys Lys Leu Pro Arg Ile 675 680 685 Leu Ser Phe Asn Thr Met Arg Tyr Thr Phe Asn Met Val Thr Met Met 690 695 700 Lys Glu Lys Val Asn Thr His Phe Ser Phe Pro Leu Arg Leu Asp Met 705 710 715 720 Thr Pro Tyr Thr Glu Asp Phe Leu Met Gly Lys Ser Glu Arg Lys Glu 725 730 735 Gly Phe Lys Glu Val Ser Asp His Ser Lys Asp Ser Glu Ser Tyr Glu 740 745 750 Tyr Asp Leu Ile Gly Val Thr Val His Thr Gly Thr Ala Asp Gly Gly 755 760 765 His Tyr Tyr Ser Phe Ile Arg Asp Ile Val Asn Pro His Ala Tyr Lys 770 775 780 Asn Asn Lys Trp Tyr Leu Phe Asn Asp Ala Glu Val Lys Pro Phe Asp 785 790 795 800 Ser Ala Gln Leu Ala Ser Glu Cys Phe Gly Gly Glu Met Thr Thr Lys 805 810 815 Thr Tyr Asp Ser Val Thr Asp Lys Phe Met Asp Phe Ser Phe Glu Lys 820 825 830 Thr His Ser Ala Tyr Met Leu Phe Tyr Lys Arg Met Glu Pro Glu Glu 835 840 845 Glu Asn Gly Arg Glu Tyr Lys Phe Asp Val Ser Ser Glu Leu Leu Glu 850 855 860 Trp Ile Trp His Asp Asn Met Gln Phe Leu Gln Asp Lys Asn Ile Phe 865 870 875 880 Glu His Thr Tyr Phe Gly Phe Met Trp Gln Leu Cys Ser Cys Ile Pro 885 890 895 Ser Thr Leu Pro Asp Pro Lys Ala Val Ser Leu Met Thr Ala Lys Leu 900 905 910 Ser Thr Ser Phe Val Leu Glu Thr Phe Ile His Ser Lys Glu Lys Pro 915 920 925 Thr Met Leu Gln Trp Ile Glu Leu Leu Thr Lys Gln Phe Asn Asn Ser 930 935 940 Gln Ala Ala Cys Glu Trp Phe Leu Asp Arg Met Ala Asp Asp Asp Trp 945 950 955 960 Trp Pro Met Gln Ile Leu Ile Lys Cys Pro Asn Gln Ile Val Arg Gln 965 970 975 Met Phe Gln Arg Leu Cys Ile His Val Ile Gln Arg Leu Arg Pro Val 980 985 990 His Ala His Leu Tyr Leu Gln Pro Gly Met Glu Asp Gly Ser Asp Asp 995 1000 1005 Met Asp Thr Ser Val Glu Asp Ile Gly Gly Arg Ser Cys Val Thr Arg 1010 1015 1020 Phe Val Arg Thr Leu Leu Leu Ile Met Glu His Gly Val Lys Pro His 1025 1030 1035 1040 Ser Lys His Leu Thr Glu Tyr Phe Ala Phe Leu Tyr Glu Phe Ala Lys 1045 1050 1055 Met Gly Glu Glu Glu Ser Gln Phe Leu Leu Ser Leu Gln Ala Ile Ser 1060 1065 1070 Thr Met Val His Phe Tyr Met Gly Thr Lys Gly Pro Glu Asn Pro Gln 1075 1080 1085 Val Glu Val Leu Ser Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu 1090 1095 1100 Asp Ile Leu Ser Leu Ala Glu Glu Lys Tyr Arg Pro Ala Ala Leu Glu 1105 1110 1115 1120 Lys Met Ile Ala Leu Val Ala Leu Leu Val Glu Gln Ser Arg Ser Glu 1125 1130 1135 Arg <210> 2 <211> 3412 <212> PRT <213> Homo sapiens <400> 2 Leu Arg Arg Asn Leu Gln Arg Val Leu Ile Leu Leu Val Tyr Gly Val 1 5 10 15 Gln Met Arg Arg Lys Asn Ser Tyr Tyr Val Trp Gln Lys Ile Phe Gln 20 25 30 Ile Gln Phe Pro Leu Tyr Thr Ala Tyr Lys His Asn Thr His Pro Thr 35 40 45 Ile Glu Asp Ile Ser Thr Gln Glu Ser Asn Ile Leu Gly Ala Phe Cys 50 55 60 Asp Met Asn Asp Val Glu Val Pro Leu His Leu Leu Arg Tyr Val Cys 65 70 75 80 Leu Phe Cys Gly Lys Asn Gly Leu Ser Leu Met Lys Asp Cys Phe Glu 85 90 95 Tyr Gly Thr Pro Glu Thr Leu Pro Phe Leu Ile Ala His Ala Phe Ile 100 105 110 Thr Val Val Ser Asn Ile Arg Ile Trp Leu His Ile Pro Ala Val Met 115 120 125 Gln His Ile Ile Pro Phe Arg Thr Tyr Val Ile Arg Tyr Leu Cys Lys 130 135 140 Leu Ser Asp Gln Glu Leu Arg Gln Ser Ala Ala Arg Asn Met Ala Asp 145 150 155 160 Leu Met Trp Ser Thr Val Lys Glu Pro Leu Asp Thr Thr Leu Cys Phe 165 170 175 Asp Lys Glu Ser Leu Asp Leu Ala Phe Lys Tyr Phe Met Ser Pro Thr 180 185 190 Leu Thr Met Arg Leu Ala Gly Leu Ser Gln Ile Thr Asn Gln Leu His 195 200 205 Thr Phe Asn Asp Val Cys Asn Asn Glu Ser Leu Val Ser Asp Thr Glu 210 215 220 Thr Ser Ile Ala Lys Glu Leu Ala Asp Trp Leu Ile Ser Asn Asn Val 225 230 235 240 Val Glu His Ile Phe Gly Pro Asn Leu His Ile Glu Ile Ile Lys Gln 245 250 255 Cys Gln Val Ile Leu Asn Phe Leu Ala Ala Glu Gly Arg Leu Ser Thr 260 265 270 Gln His Ile Asp Cys Ile Trp Ala Ala Ala Gln Leu Lys His Cys Ser 275 280 285 Arg Tyr Ile His Asp Leu Phe Pro Ser Leu Ile Lys Asn Leu Asp Pro 290 295 300 Val Pro Leu Arg His Leu Leu Asn Leu Val Ser Ala Leu Glu Pro Ser 305 310 315 320 Val His Thr Glu Gln Thr Leu Tyr Leu Ala Ser Met Leu Ile Lys Ala 325 330 335 Leu Trp Asn Asn Ala Leu Ala Ala Lys Ala Gln Leu Ser Lys Gln Ser 340 345 350 Ser Phe Ala Ser Leu Leu Asn Thr Asn Ile Pro Ile Gly Asn Lys Lys 355 360 365 Glu Glu Glu Glu Leu Arg Arg Thr Ala Pro Ser Pro Trp Ser Pro Ala 370 375 380 Ala Ser Pro Gln Ser Ser Asp Asn Ser Asp Thr His Gln Ser Gly Gly 385 390 395 400 Ser Asp Ile Glu Met Asp Glu Gln Leu Ile Asn Arg Thr Lys His Val 405 410 415 Gln Gln Arg Leu Ser Asp Thr Glu Glu Ser Met Gln Gly Ser Ser Asp 420 425 430 Glu Thr Ala Asn Ser Gly Glu Asp Gly Ser Ser Gly Pro Gly Ser Ser 435 440 445 Ser Gly His Ser Asp Gly Ser Ser Asn Glu Val Asn Ser Ser His Ala 450 455 460 Ser Gln Ser Ala Gly Ser Pro Gly Ser Glu Val Gln Ser Glu Asp Ile 465 470 475 480 Ala Asp Ile Glu Ala Leu Lys Glu Glu Asp Glu Asp Asp Asp His Gly 485 490 495 His Asn Pro Pro Lys Ser Ser Cys Gly Thr Asp Leu Arg Asn Arg Lys 500 505 510 Leu Glu Ser Gln Ala Gly Ile Cys Leu Gly Asp Ser Gln Gly Thr Ser 515 520 525 Glu Arg Asn Gly Thr Ser Ser Gly Thr Gly Lys Asp Leu Val Phe Asn 530 535 540 Thr Glu Ser Leu Pro Ser Val Asp Asn Arg Met Arg Met Leu Asp Ala 545 550 555 560 Cys Ser His Ser Glu Asp Pro Glu His Asp Ile Ser Gly Glu Met Asn 565 570 575 Ala Thr His Ile Ala Gln Gly Ser Gln Glu Ser Cys Ile Thr Arg Thr 580 585 590 Gly Asp Phe Leu Gly Glu Thr Ile Gly Asn Glu Leu Phe Asn Cys Arg 595 600 605 Gln Phe Ile Gly Pro Gln His His His His His His His His His His 610 615 620 His His Asp Gly His Met Val Asp Asp Met Leu Ser Ala Asp Asp Val 625 630 635 640 Ser Cys Ser Ser Ser Gln Val Ser Ala Lys Ser Glu Lys Asn Met Ala 645 650 655 Asp Phe Asp Gly Glu Glu Ser Gly Cys Glu Glu Glu Leu Val Gln Ile 660 665 670 Asn Ser His Ala Glu Leu Thr Ser His Leu Gln Gln His Leu Pro Asn 675 680 685 Leu Ala Ser Ile Tyr His Glu His Leu Ser Gln Gly Pro Val Val His 690 695 700 Lys His Gln Phe Asn Ser Asn Ala Val Thr Asp Ile Asn Leu Asp Asn 705 710 715 720 Val Cys Lys Lys Gly Asn Thr Leu Leu Trp Asp Ile Val Gln Asp Glu 725 730 735 Asp Ala Val Asn Leu Ser Glu Gly Leu Ile Asn Glu Ala Glu Lys Leu 740 745 750 Leu Cys Ser Leu Val Cys Trp Phe Thr Asp Arg Gln Ile Arg Met Arg 755 760 765 Phe Ile Glu Gly Cys Leu Glu Asn Leu Gly Asn Asn Arg Ser Val Val 770 775 780 Ile Ser Leu Arg Leu Leu Pro Lys Leu Phe Gly Thr Phe Gln Gln Phe 785 790 795 800 Gly Ser Ser Tyr Asp Thr His Trp Ile Thr Met Trp Ala Glu Lys Glu 805 810 815 Leu Asn Met Met Lys Leu Phe Phe Asp Asn Leu Val Tyr Tyr Ile Gln 820 825 830 Thr Val Arg Glu Gly Arg Gln Lys His Ala Leu Tyr Ser His Ser Ala 835 840 845 Glu Val Gln Val Arg Leu Gln Phe Leu Thr Cys Val Phe Ser Thr Leu 850 855 860 Gly Ser Pro Asp His Phe Arg Leu Ser Leu Glu Gln Val Asp Ile Leu 865 870 875 880 Trp His Cys Leu Val Glu Asp Ser Glu Cys Tyr Asp Asp Ala Leu His 885 890 895 Trp Phe Leu Asn Gln Val Arg Ser Lys Asp Gln His Ala Met Gly Met 900 905 910 Glu Thr Tyr Lys His Leu Phe Leu Glu Lys Met Pro Gln Leu Lys Pro 915 920 925 Glu Thr Ile Ser Met Thr Gly Leu Asn Leu Phe Gln His Leu Cys Asn 930 935 940 Leu Ala Arg Leu Ala Thr Ser Ala Tyr Asp Gly Cys Ser Asn Ser Glu 945 950 955 960 Leu Cys Gly Met Asp Gln Phe Trp Gly Ile Ala Leu Arg Ala Gln Ser 965 970 975 Gly Asp Val Ser Arg Ala Ala Ile Gln Tyr Ile Asn Ser Tyr Tyr Ile 980 985 990 Asn Gly Lys Thr Gly Leu Glu Lys Glu Gln Glu Phe Ile Ser Lys Cys 995 1000 1005 Met Glu Ser Leu Met Ile Ala Ser Ser Ser Leu Glu Gln Glu Ser His 1010 1015 1020 Ser Ser Leu Met Val Ile Glu Arg Gly Leu Leu Met Leu Lys Thr His 1025 1030 1035 1040 Leu Glu Ala Phe Arg Arg Arg Phe Ala Tyr His Leu Arg Gln Trp Gln 1045 1050 1055 Ile Glu Gly Thr Gly Ile Ser Ser His Leu Lys Ala Leu Ser Asp Lys 1060 1065 1070 Gln Ser Leu Pro Leu Arg Val Val Cys Gln Pro Ala Gly Leu Pro Asp 1075 1080 1085 Lys Met Thr Ile Glu Met Tyr Pro Ser Asp Gln Val Ala Asp Leu Arg 1090 1095 1100 Ala Glu Val Thr His Trp Tyr Glu Asn Leu Gln Lys Glu Gln Ile Asn 1105 1110 1115 1120 Gln Gln Ala Gln Leu Gln Glu Phe Gly Gln Ser Asn Arg Lys Gly Glu 1125 1130 1135 Phe Pro Gly Gly Leu Met Gly Pro Val Arg Met Ile Ser Ser Gly His 1140 1145 1150 Glu Leu Thr Thr Asp Tyr Asp Glu Lys Ala Leu His Glu Leu Gly Phe 1155 1160 1165 Lys Asp Met Gln Met Val Phe Val Ser Leu Gly Ala Pro Arg Arg Glu 1170 1175 1180 Arg Lys Gly Glu Gly Val Gln Leu Pro Ala Ser Cys Leu Pro Pro Pro 1185 1190 1195 1200 Gln Lys Asp Asn Ile Pro Met Leu Leu Leu Leu Gln Glu Pro His Leu 1205 1210 1215 Thr Thr Leu Phe Asp Leu Leu Glu Met Leu Ala Ser Phe Lys Pro Pro 1220 1225 1230 Ser Gly Lys Val Ala Val Asp Asp Ser Glu Ser Leu Arg Cys Glu Glu 1235 1240 1245 Leu His Leu His Ala Glu Asn Leu Ser Arg Arg Val Trp Glu Leu Leu 1250 1255 1260 Met Leu Leu Pro Thr Cys Pro Asn Met Leu Met Ala Phe Gln Asn Ile 1265 1270 1275 1280 Ser Asp Glu Gln Ser Asn Asp Gly Phe Asn Trp Lys Glu Leu Leu Lys 1285 1290 1295 Ile Lys Ser Ala His Lys Leu Leu Tyr Ala Leu Glu Ile Ile Glu Ala 1300 1305 1310 Leu Gly Lys Pro Asn Arg Arg Ile Arg Arg Glu Ser Thr Gly Ser Tyr 1315 1320 1325 Ser Asp Leu Tyr Pro Asp Ser Asp Asp Ser Ser Glu Asp Gln Val Glu 1330 1335 1340 Asn Ser Lys Asn Ser Trp Ser Cys Lys Phe Val Ala Ala Gly Gly Leu 1345 1350 1355 1360 Gln Gln Leu Leu Glu Ile Phe Asn Ser Gly Ile Leu Glu Pro Lys Glu 1365 1370 1375 Gln Glu Ser Trp Thr Val Trp Gln Leu Asp Cys Leu Ala Cys Leu Leu 1380 1385 1390 Lys Leu Ile Cys Gln Phe Ala Val Asp Pro Ser Asp Leu Asp Leu Ala 1395 1400 1405 Tyr His Asp Val Phe Ala Trp Ser Gly Ile Ala Glu Ser His Arg Lys 1410 1415 1420 Arg Thr Trp Pro Gly Lys Ser Arg Lys Ala Ala Gly Asp His Ala Lys 1425 1430 1435 1440 Gly Leu His Ile Pro Arg Leu Thr Glu Val Phe Leu Val Leu Val Gln 1445 1450 1455 Gly Thr Ser Leu Ile Gln Arg Leu Met Ser Val Ala Tyr Thr Tyr Asp 1460 1465 1470 Asn Leu Ala Pro Arg Val Leu Lys Ala Gln Ser Asp His Arg Ser Arg 1475 1480 1485 His Glu Val Ser His Tyr Ser Met Trp Leu Leu Val Ser Trp Ala His 1490 1495 1500 Cys Cys Ser Leu Val Lys Ser Ser Leu Ala Asp Ser Asp His Leu Gln 1505 1510 1515 1520 Asp Trp Leu Lys Lys Leu Thr Leu Leu Ile Pro Glu Thr Ala Val Arg 1525 1530 1535 His Glu Ser Cys Ser Gly Leu Tyr Lys Leu Ser Leu Ser Gly Leu Asp 1540 1545 1550 Gly Gly Asp Ser Ile Asn Arg Ser Phe Leu Leu Leu Ala Ala Ser Thr 1555 1560 1565 Leu Leu Lys Phe Leu Pro Asp Ala Gln Ala Leu Lys Pro Ile Arg Ile 1570 1575 1580 Asp Asp Tyr Glu Glu Glu Pro Ile Leu Lys Pro Gly Cys Lys Glu Tyr 1585 1590 1595 1600 Phe Trp Leu Leu Cys Lys Leu Val Asp Asn Ile His Ile Lys Asp Ala 1605 1610 1615 Ser Gln Thr Thr Leu Leu Asp Leu Asp Ala Leu Ala Arg His Leu Ala 1620 1625 1630 Asp Cys Ile Arg Ser Arg Glu Ile Leu Asp His Gln Asp Gly Asn Val 1635 1640 1645 Glu Asp Asp Gly Leu Thr Gly Leu Leu Arg Leu Ala Thr Ser Val Val 1650 1655 1660 Lys His Lys Pro Pro Phe Lys Phe Ser Arg Glu Gly Gln Glu Phe Leu 1665 1670 1675 1680 Arg Asp Ile Phe Asn Leu Leu Phe Leu Leu Pro Ser Leu Lys Asp Arg 1685 1690 1695 Gln Gln Pro Lys Cys Lys Ser His Ser Ser Arg Ala Ala Ala Tyr Asp 1700 1705 1710 Leu Leu Val Glu Met Val Lys Gly Ser Val Glu Asn Tyr Arg Leu Ile 1715 1720 1725 His Asn Trp Val Met Ala Gln His Met Gln Ser His Ala Pro Tyr Lys 1730 1735 1740 Trp Asp Tyr Trp Pro His Glu Asp Val Arg Ala Glu Cys Arg Phe Val 1745 1750 1755 1760 Gly Leu Thr Asn Leu Gly Ala Thr Cys Tyr Leu Ala Ser Thr Ile Gln 1765 1770 1775 Gln Leu Tyr Met Ile Pro Glu Ala Arg Gln Ala Val Phe Thr Ala Lys 1780 1785 1790 Tyr Ser Glu Asp Met Lys His Lys Thr Thr Leu Leu Glu Leu Gln Lys 1795 1800 1805 Met Phe Thr Tyr Leu Met Glu Ser Glu Cys Lys Ala Tyr Asn Pro Arg 1810 1815 1820 Pro Phe Cys Lys Thr Tyr Thr Met Asp Lys Gln Pro Leu Asn Thr Gly 1825 1830 1835 1840 Glu Gln Lys Asp Met Thr Glu Phe Phe Thr Asp Leu Ile Thr Lys Ile 1845 1850 1855 Glu Glu Met Ser Pro Glu Leu Lys Asn Thr Val Lys Ser Leu Phe Gly 1860 1865 1870 Gly Val Ile Thr Asn Asn Val Val Ser Leu Asp Cys Glu His Val Ser 1875 1880 1885 Gln Thr Ala Glu Glu Phe Tyr Thr Val Arg Cys Gln Val Ala Asp Met 1890 1895 1900 Lys Asn Ile Tyr Glu Ser Leu Asp Glu Val Thr Ile Lys Asp Thr Leu 1905 1910 1915 1920 Glu Gly Asp Asn Met Tyr Thr Cys Ser His Cys Gly Lys Lys Val Arg 1925 1930 1935 Ala Glu Lys Arg Ala Cys Phe Lys Lys Leu Pro Arg Ile Leu Ser Phe 1940 1945 1950 Asn Thr Met Arg Tyr Thr Phe Asn Met Val Thr Met Met Lys Glu Lys 1955 1960 1965 Val Asn Thr His Phe Ser Phe Pro Leu Arg Leu Asp Met Thr Pro Tyr 1970 1975 1980 Thr Glu Asp Phe Leu Met Gly Lys Ser Glu Arg Lys Glu Gly Phe Lys 1985 1990 1995 2000 Glu Val Ser Asp His Ser Lys Asp Ser Glu Ser Tyr Glu Tyr Asp Leu 2005 2010 2015 Ile Gly Val Thr Val His Thr Gly Thr Ala Asp Gly Gly His Tyr Tyr 2020 2025 2030 Ser Phe Ile Arg Asp Ile Val Asn Pro His Ala Tyr Lys Asn Asn Lys 2035 2040 2045 Trp Tyr Leu Phe Asn Asp Ala Glu Val Lys Pro Phe Asp Ser Ala Gln 2050 2055 2060 Leu Ala Ser Glu Cys Phe Gly Gly Glu Met Thr Thr Lys Thr Tyr Asp 2065 2070 2075 2080 Ser Val Thr Asp Lys Phe Met Asp Phe Ser Phe Glu Lys Thr His Ser 2085 2090 2095 Ala Tyr Met Leu Phe Tyr Lys Arg Met Glu Pro Glu Glu Glu Asn Gly 2100 2105 2110 Arg Glu Tyr Lys Phe Asp Val Ser Ser Glu Leu Leu Glu Trp Ile Trp 2115 2120 2125 His Asp Asn Met Gln Phe Leu Gln Asp Lys Asn Ile Phe Glu His Thr 2130 2135 2140 Tyr Phe Gly Phe Met Trp Gln Leu Cys Ser Cys Ile Pro Ser Thr Leu 2145 2150 2155 2160 Pro Asp Pro Lys Ala Val Ser Leu Met Thr Ala Lys Leu Ser Thr Ser 2165 2170 2175 Phe Val Leu Glu Thr Phe Ile His Ser Lys Glu Lys Pro Thr Met Leu 2180 2185 2190 Gln Trp Ile Glu Leu Leu Thr Lys Gln Phe Asn Asn Ser Gln Ala Ala 2195 2200 2205 Cys Glu Trp Phe Leu Asp Arg Met Ala Asp Asp Asp Trp Trp Pro Met 2210 2215 2220 Gln Ile Leu Ile Lys Cys Pro Asn Gln Ile Val Arg Gln Met Phe Gln 2225 2230 2235 2240 Arg Leu Cys Ile His Val Ile Gln Arg Leu Arg Pro Val His Ala His 2245 2250 2255 Leu Tyr Leu Gln Pro Gly Met Glu Asp Gly Ser Asp Asp Met Asp Thr 2260 2265 2270 Ser Val Glu Asp Ile Gly Gly Arg Ser Cys Val Thr Arg Phe Val Arg 2275 2280 2285 Thr Leu Leu Leu Ile Met Glu His Gly Val Lys Pro His Ser Lys His 2290 2295 2300 Leu Thr Glu Tyr Phe Ala Phe Leu Tyr Glu Phe Ala Lys Met Gly Glu 2305 2310 2315 2320 Glu Glu Ser Gln Phe Leu Leu Ser Leu Gln Ala Ile Ser Thr Met Val 2325 2330 2335 His Phe Tyr Met Gly Thr Lys Gly Pro Glu Asn Pro Gln Val Glu Val 2340 2345 2350 Leu Ser Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu Asp Ile Leu 2355 2360 2365 Ser Leu Ala Glu Glu Lys Tyr Arg Pro Ala Ala Leu Glu Lys Met Ile 2370 2375 2380 Ala Leu Val Ala Leu Leu Val Glu Gln Ser Arg Ser Glu Arg His Leu 2385 2390 2395 2400 Thr Leu Ser Gln Thr Asp Met Ala Ala Leu Thr Gly Gly Lys Gly Phe 2405 2410 2415 Pro Phe Leu Phe Gln His Ile Arg Asp Gly Ile Asn Ile Arg Gln Thr 2420 2425 2430 Cys Asn Leu Ile Phe Ser Leu Cys Arg Tyr Asn Asn Arg Leu Ala Glu 2435 2440 2445 His Ile Val Ser Met Leu Phe Thr Ser Ile Ala Lys Leu Thr Pro Glu 2450 2455 2460 Ala Ala Asn Pro Phe Phe Lys Leu Leu Thr Met Leu Met Glu Phe Ala 2465 2470 2475 2480 Gly Gly Pro Pro Gly Met Pro Pro Phe Ala Ser Tyr Ile Leu Gln Arg 2485 2490 2495 Ile Trp Glu Val Ile Glu Tyr Asn Pro Ser Gln Cys Leu Asp Trp Leu 2500 2505 2510 Ala Val Gln Thr Pro Arg Asn Lys Leu Ala His Ser Trp Val Leu Gln 2515 2520 2525 Asn Met Glu Asn Trp Val Glu Arg Phe Leu Leu Ala His Asn Tyr Pro 2530 2535 2540 Arg Val Arg Thr Ser Ala Ala Tyr Leu Leu Val Ser Leu Ile Pro Ser 2545 2550 2555 2560 Asn Ser Phe Arg Gln Met Phe Arg Ser Thr Arg Ser Leu His Ile Pro 2565 2570 2575 Thr Arg Asp Leu Pro Leu Ser Pro Asp Thr Thr Val Val Leu His Gln 2580 2585 2590 Val Tyr Asn Val Leu Leu Gly Leu Leu Ser Arg Ala Lys Leu Tyr Val 2595 2600 2605 Asp Ala Ala Val His Gly Thr Thr Lys Leu Val Pro Tyr Phe Ser Phe 2610 2615 2620 Met Thr Tyr Cys Leu Ile Ser Lys Thr Glu Lys Leu Met Phe Ser Thr 2625 2630 2635 2640 Tyr Phe Met Asp Leu Trp Asn Leu Phe Gln Pro Lys Leu Ser Glu Pro 2645 2650 2655 Ala Ile Ala Thr Asn His Asn Lys Gln Ala Leu Leu Ser Phe Trp Tyr 2660 2665 2670 Asn Val Cys Ala Asp Cys Pro Glu Asn Ile Arg Leu Ile Val Gln Asn 2675 2680 2685 Pro Val Val Thr Lys Asn Ile Ala Phe Asn Tyr Ile Leu Ala Asp His 2690 2695 2700 Asp Asp Gln Asp Val Val Leu Phe Asn Arg Gly Met Leu Pro Ala Tyr 2705 2710 2715 2720 Tyr Gly Ile Leu Arg Leu Cys Cys Glu Gln Ser Pro Ala Phe Thr Arg 2725 2730 2735 Gln Leu Ala Ser His Gln Asn Ile Gln Trp Ala Phe Lys Asn Leu Thr 2740 2745 2750 Pro His Ala Ser Gln Tyr Pro Gly Ala Val Glu Glu Leu Phe Asn Leu 2755 2760 2765 Met Gln Leu Phe Ile Ala Gln Arg Pro Asp Met Arg Glu Glu Glu Leu 2770 2775 2780 Glu Asp Ile Lys Gln Phe Lys Lys Thr Thr Ile Ser Cys Tyr Leu Arg 2785 2790 2795 2800 Cys Leu Asp Gly Arg Ser Cys Trp Thr Thr Leu Ile Ser Ala Phe Arg 2805 2810 2815 Ile Leu Leu Glu Ser Asp Glu Asp Arg Leu Leu Val Val Phe Asn Arg 2820 2825 2830 Gly Leu Ile Leu Met Thr Glu Ser Phe Asn Thr Leu His Met Met Tyr 2835 2840 2845 His Glu Ala Thr Ala Cys His Val Thr Gly Asp Leu Val Glu Leu Leu 2850 2855 2860 Ser Ile Phe Leu Ser Val Leu Lys Ser Thr Arg Pro Tyr Leu Gln Arg 2865 2870 2875 2880 Lys Asp Val Lys Gln Ala Leu Ile Gln Trp Gln Glu Arg Ile Glu Phe 2885 2890 2895 Ala His Lys Leu Leu Thr Leu Leu Asn Ser Tyr Ser Pro Pro Glu Leu 2900 2905 2910 Arg Asn Ala Cys Ile Asp Val Leu Lys Glu Leu Val Leu Leu Ser Pro 2915 2920 2925 His Asp Phe Leu His Thr Leu Val Pro Phe Leu Gln His Asn His Cys 2930 2935 2940 Thr Tyr His His Ser Asn Ile Pro Met Ser Leu Gly Pro Tyr Phe Pro 2945 2950 2955 2960 Cys Arg Glu Asn Ile Lys Leu Ile Gly Gly Lys Ser Asn Ile Arg Pro 2965 2970 2975 Pro Arg Pro Glu Leu Asn Met Cys Leu Leu Pro Thr Met Val Glu Thr 2980 2985 2990 Ser Lys Gly Lys Asp Asp Val Tyr Asp Arg Met Leu Leu Asp Tyr Phe 2995 3000 3005 Phe Ser Tyr His Gln Phe Ile His Leu Leu Cys Arg Val Ala Ile Asn 3010 3015 3020 Cys Glu Lys Phe Thr Glu Thr Leu Val Lys Leu Ser Val Leu Val Ala 3025 3030 3035 3040 Tyr Glu Gly Leu Pro Leu His Leu Ala Leu Phe Pro Lys Leu Trp Thr 3045 3050 3055 Glu Leu Cys Gln Thr Gln Ser Ala Met Ser Lys Asn Cys Ile Lys Leu 3060 3065 3070 Leu Cys Glu Asp Pro Val Phe Ala Glu Tyr Ile Lys Cys Ile Leu Met 3075 3080 3085 Asp Glu Arg Thr Phe Leu Asn Asn Asn Ile Val Tyr Thr Phe Met Thr 3090 3095 3100 His Phe Leu Leu Lys Val Gln Ser Gln Val Phe Ser Glu Ala Asn Cys 3105 3110 3115 3120 Ala Asn Leu Ile Ser Thr Leu Ile Thr Asn Leu Ile Ser Gln Tyr Gln 3125 3130 3135 Asn Leu Gln Ser Asp Phe Ser Asn Arg Val Glu Ile Ser Lys Ala Ser 3140 3145 3150 Ala Ser Leu Asn Gly Asp Leu Arg Ala Leu Ala Leu Leu Leu Ser Val 3155 3160 3165 His Thr Pro Lys Gln Leu Asn Pro Ala Leu Ile Pro Thr Leu Gln Glu 3170 3175 3180 Leu Leu Ser Lys Cys Arg Thr Cys Leu Gln Gln Arg Asn Ser Leu Gln 3185 3190 3195 3200 Glu Gln Glu Ala Lys Glu Arg Lys Thr Lys Asp Asp Glu Gly Ala Thr 3205 3210 3215 Pro Ile Lys Arg Arg Arg Val Ser Ser Asp Glu Glu His Thr Val Asp 3220 3225 3230 Ser Cys Ile Ser Asp Met Lys Thr Glu Thr Arg Glu Val Leu Thr Pro 3235 3240 3245 Thr Ser Thr Ser Asp Asn Glu Thr Arg Asp Ser Ser Ile Ile Asp Pro 3250 3255 3260 Gly Thr Glu Gln Asp Leu Pro Ser Pro Glu Asn Ser Ser Val Lys Glu 3265 3270 3275 3280 Tyr Arg Met Glu Val Pro Ser Ser Phe Ser Glu Asp Met Ser Asn Ile 3285 3290 3295 Arg Ser Gln His Ala Glu Glu Gln Ser Asn Asn Gly Arg Tyr Asp Asp 3300 3305 3310 Cys Lys Glu Phe Lys Asp Leu His Cys Ser Lys Asp Ser Thr Leu Ala 3315 3320 3325 Glu Glu Glu Ser Glu Phe Pro Ser Thr Ser Ile Ser Ala Val Leu Ser 3330 3335 3340 Asp Leu Ala Asp Leu Arg Ser Cys Asp Gly Gln Ala Leu Pro Ser Gln 3345 3350 3355 3360 Asp Pro Glu Val Ala Leu Ser Leu Ser Cys Gly His Ser Arg Gly Leu 3365 3370 3375 Phe Ser His Met Gln Gln His Asp Ile Leu Asp Thr Leu Cys Arg Thr 3380 3385 3390 Ile Glu Ser Thr Ile His Val Val Thr Arg Ile Ser Gly Lys Gly Asn 3395 3400 3405 Gln Ala Ala Ser 3410 <210> 3 <211> 3411 <212> DNA <213> Homo sapiens <400> 3 gagctactga tgcttcttcc tacatgtcct aatatgttga tggcattcca gaatatctca 60 gatgagcaga gtaatgatgg atttaattgg aaagaacttc tcaaaattaa gagcgcccac 120 aagctattgt atgctctgga aattattgaa gcactgggaa aacctaatag aagaataagg 180 agggagtcta cgggaagtta cagtgatctt tatccagatt cagatgattc aagtgaggat 240 caagtggaaa atagtaaaaa ttcctggagt tgcaagtttg ttgctgctgg agggcttcaa 300 cagttattag aaatttttaa ttctggaatt ctagagccta aagagcagga atcatggact 360 gtgtggcagc tagactgtct tgcttgcttg ctgaagttaa tatgccagtt tgcagtagat 420 ccatccgatt tggatttagc ttatcatgat gtctttgcct ggtctggtat agcggaaagc 480 cataggaaaa gaacctggcc tggcaaatca aggaaggctg ctggtgatca tgctaagggt 540 cttcatatac cacgattaac agaggtattt cttgttcttg tccaaggaac cagtttgatt 600 cagcgactta tgtctgttgc ttatacgtat gataatctgg ctcctagagt tttaaaagct 660 cagtctgatc acaggtctag acatgaagtt tcacattatt caatgtggct cttggtgagt 720 tgggctcatt gctgttcttt agtgaaatct agccttgctg atagcgatca tttacaagat 780 tggctaaaga aattgactct ccttattcct gagactgcag ttcgtcatga atcatgcagt 840 ggtctctata agttatccct gtcagggctg gatggaggag actcaatcaa tcgttctttt 900 ctgctattgg ctgcctcaac attattgaaa tttcttcctg atgctcaagc actcaaacct 960 attaggatag atgattatga ggaagaacca atattaaaac caggatgtaa agagtatttt 1020 tggttgttat gcaaattagt tgacaacata catataaagg acgctagtca gacaacgctc 1080 ctcgacttag atgccttggc aagacatttg gctgactgta ttcgaagtag ggagatcctt 1140 gatcatcagg atggtaatgt agaagatgat gggcttacag gactcctaag gcttgcaaca 1200 agtgttgtta aacacaaacc accctttaaa ttttcaaggg aaggacagga atttttgaga 1260 gatatcttca atctcctgtt tttgttgcca agtctaaagg accgacaaca gccaaagtgc 1320 aaatcacatt cttcaagagc tgccgcttac gatttgttag tagagatggt aaaggggtct 1380 gttgagaact acaggctaat acacaactgg gttatggcac aacacatgca gtcccatgca 1440 ccttataaat gggattactg gcctcatgaa gatgtccgtg ctgaatgtag atttgttggc 1500 cttactaacc ttggagctac ttgttactta gcttctacta ttcagcaact ttatatgata 1560 cctgaggcaa gacaggctgt cttcactgcc aagtattcag aggatatgaa gcacaagacc 1620 actcttctgg agcttcagaa aatgtttaca tatttaatgg agagtgaatg caaagcatat 1680 aatcctagac ctttctgtaa aacatacacc atggataagc agcctctgaa tactggggaa 1740 cagaaagata tgacagagtt ttttactgat ctaattacca aaatcgaaga aatgtctccc 1800 gaactgaaaa ataccgtcaa aagtttattt ggaggtgtaa ttacaaacaa tgttgtatcc 1860 ttggattgtg aacatgttag tcaaactgct gaagagtttt atactgtgag gtgccaagtg 1920 gctgatatga agaacattta tgaatctctt gatgaagtta ctataaaaga cactttggaa 1980 ggtgataaca tgtatacttg ttctcattgt gggaagaaag tacgagctga aaaaagggca 2040 tgttttaaga aattgcctcg cattttgagt ttcaatacta tgagatacac atttaatatg 2100 gtcacgatga tgaaagagaa agtgaataca cacttttcct tcccattacg tttggacatg 2160 acgccctata cagaagattt tcttatggga aagagtgaga ggaaagaagg ttttaaagaa 2220 gtcagtgatc attcaaaaga ctcagagagc tatgaatatg acttgatagg agtgactgtt 2280 cacacaggaa cggcagatgg tggacactat tatagcttta tcagagatat agtaaatccc 2340 catgcttata aaaacaataa atggtatctt tttaatgatg ctgaggtaaa accttttgat 2400 tctgctcaac ttgcatctga atgttttggt ggagagatga cgaccaagac ctatgattct 2460 gttacagata aatttatgga cttctctttt gaaaagacac acagtgcata tatgctgttt 2520 tacaaacgca tggaaccaga ggaagaaaat ggcagagaat acaaatttga tgtttcgtca 2580 gagttactag agtggatttg gcatgataac atgcagtttc ttcaagacaa aaacattttt 2640 gaacatacat attttggatt tatgtggcaa ttgtgtagtt gtattcccag tacattacca 2700 gatcctaaag ctgtgtcctt aatgacagca aagttaagca cttcctttgt cctagagaca 2760 tttattcatt ctaaagaaaa gcccacgatg cttcagtgga ttgaactgtt gacgaaacag 2820 tttaataata gtcaggcagc ttgtgagtgg tttttagatc gtatggctga tgacgactgg 2880 tggccaatgc agatactaat taagtgccct aatcaaattg tgagacagat gtttcagcgt 2940 ttgtgtatcc atgtgattca gaggctgaga cctgtgcatg ctcatctcta tttgcagcca 3000 ggaatggaag atgggtcaga tgatatggat acctcagtag aagatattgg tggtcgttca 3060 tgtgtcactc gctttgtgag aaccctgtta ttaattatgg aacatggtgt aaaacctcac 3120 agtaaacatc ttacagagta ttttgccttc ctttacgaat ttgcaaaaat gggtgaagaa 3180 gagagccaat ttttgctttc attgcaagct atatctacaa tggtacattt ttacatggga 3240 acaaaaggac ctgaaaatcc tcaagttgaa gtgttatcag aggaagaagg ggaagaagaa 3300 gaggaggaag aagatatcct ctctctggca gaagaaaaat acaggccagc tgcccttgaa 3360 aagatgatag ctttagttgc tcttttggtt gaacagtctc gatcagaaag g 3411 <210> 4 <211> 11269 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (480)..(10718) <400> 4 attctcttgc tccccgcccc gtcgggatca gtcagtgtga tccgaagcgg gggagggggg 60 gggcggcggc cgaacgatgt gcgagaactg cgcagacctg gtggaggtgt taaatgaaat 120 atcagatgta gaaggtggtg atggactgca gctcagaaag gaacatactc tcaaaatatt 180 tacttacatc aattcctgga cacagaggca atgtctatgc tgcttcaagg aatataagca 240 tttggagatt tttaatcaag tagtgtgtgc acttattaac ttagtgattg cccaagttca 300 agtgctccgg gaccagcttt gtaaacattg tactaccatt aacatagatt ccacgtggca 360 agatgagagt aatcaagcag aagaaccact gaatatagat agagagtgta atgaaggaag 420 tacagaaaga caaaaatcaa tagaaaaaaa atcaaactct acaagaattt gtaatctga 479 ctg agg agg aat ctt caa aga gtt ctg atc ctt tta gtt tat gga gta 527 Leu Arg Arg Asn Leu Gln Arg Val Leu Ile Leu Leu Val Tyr Gly Val 1 5 10 15 cag atg aga agg aaa aac tct tac tat gtg tgg caa aaa att ttt caa 575 Gln Met Arg Arg Lys Asn Ser Tyr Tyr Val Trp Gln Lys Ile Phe Gln 20 25 30 att cag ttt ccc tta tat act gct tac aag cat aat act cac cct act 623 Ile Gln Phe Pro Leu Tyr Thr Ala Tyr Lys His Asn Thr His Pro Thr 35 40 45 att gag gat ata tca act caa gaa agt aac ata tta ggg gca ttc tgt 671 Ile Glu Asp Ile Ser Thr Gln Glu Ser Asn Ile Leu Gly Ala Phe Cys 50 55 60 gat atg aat gat gta gaa gta cca ttg cat ttg ctt cgt tat gta tgt 719 Asp Met Asn Asp Val Glu Val Pro Leu His Leu Leu Arg Tyr Val Cys 65 70 75 80 ttg ttt tgt ggg aaa aat ggc ctt tct ctc atg aag gat tgc ttt gaa 767 Leu Phe Cys Gly Lys Asn Gly Leu Ser Leu Met Lys Asp Cys Phe Glu 85 90 95 tat gga act cct gaa act ttg cca ttt ctt ata gca cat gcg ttt att 815 Tyr Gly Thr Pro Glu Thr Leu Pro Phe Leu Ile Ala His Ala Phe Ile 100 105 110 aca gtt gtg tct aat att aga ata tgg cta cat att ccc gct gtc atg 863 Thr Val Val Ser Asn Ile Arg Ile Trp Leu His Ile Pro Ala Val Met 115 120 125 cag cac att ata cct ttt agg acc tat gtt att agg tat tta tgc aag 911 Gln His Ile Ile Pro Phe Arg Thr Tyr Val Ile Arg Tyr Leu Cys Lys 130 135 140 ctc tcg gat cag gag tta cga cag agt gca gct cgt aac atg gct gac 959 Leu Ser Asp Gln Glu Leu Arg Gln Ser Ala Ala Arg Asn Met Ala Asp 145 150 155 160 tta atg tgg agc aca gtc aaa gaa cca ttg gat aca aca tta tgc ttt 1007 Leu Met Trp Ser Thr Val Lys Glu Pro Leu Asp Thr Thr Leu Cys Phe 165 170 175 gat aaa gaa agc cta gat ctt gca ttt aag tac ttt atg tca cct act 1055 Asp Lys Glu Ser Leu Asp Leu Ala Phe Lys Tyr Phe Met Ser Pro Thr 180 185 190 ttg act atg agg ttg gct gga ttg agt cag ata aca aat caa ctc cat 1103 Leu Thr Met Arg Leu Ala Gly Leu Ser Gln Ile Thr Asn Gln Leu His 195 200 205 acc ttc aat gat gtg tgc aat aat gaa tca tta gta tcg gac aca gaa 1151 Thr Phe Asn Asp Val Cys Asn Asn Glu Ser Leu Val Ser Asp Thr Glu 210 215 220 acg tcc att gca aaa gaa ctt gca gac tgg ctt att agc aac aat gtg 1199 Thr Ser Ile Ala Lys Glu Leu Ala Asp Trp Leu Ile Ser Asn Asn Val 225 230 235 240 gtg gag cat ata ttt gga cca aat tta cat att gag att atc aaa cag 1247 Val Glu His Ile Phe Gly Pro Asn Leu His Ile Glu Ile Ile Lys Gln 245 250 255 tgc caa gtg att ttg aat ttt ttg gca gca gaa ggg cga ctg agt act 1295 Cys Gln Val Ile Leu Asn Phe Leu Ala Ala Glu Gly Arg Leu Ser Thr 260 265 270 caa cat att gac tgt att tgg gct gca gca cag ttg aaa cat tgt agt 1343 Gln His Ile Asp Cys Ile Trp Ala Ala Ala Gln Leu Lys His Cys Ser 275 280 285 cgg tat ata cat gac tta ttt cct tca ctc atc aag aat ttg gat ccc 1391 Arg Tyr Ile His Asp Leu Phe Pro Ser Leu Ile Lys Asn Leu Asp Pro 290 295 300 gta cca ctt aga cat cta ctt aat ctg gtc tca gct ctt gag cca agt 1439 Val Pro Leu Arg His Leu Leu Asn Leu Val Ser Ala Leu Glu Pro Ser 305 310 315 320 gtt cat act gaa cag aca ctg tac ttg gca tcc atg tta att aaa gca 1487 Val His Thr Glu Gln Thr Leu Tyr Leu Ala Ser Met Leu Ile Lys Ala 325 330 335 ctg tgg aat aac gca cta gca gct aag gct cag tta tct aaa cag agt 1535 Leu Trp Asn Asn Ala Leu Ala Ala Lys Ala Gln Leu Ser Lys Gln Ser 340 345 350 tct ttt gca tct tta tta aat act aat att ccc att gga aat aag aaa 1583 Ser Phe Ala Ser Leu Leu Asn Thr Asn Ile Pro Ile Gly Asn Lys Lys 355 360 365 gag gaa gaa gag ctt aga aga aca gct cca tca cct tgg tca cct gca 1631 Glu Glu Glu Glu Leu Arg Arg Thr Ala Pro Ser Pro Trp Ser Pro Ala 370 375 380 gct agt cct caa agc agt gat aat agc gat aca cat caa agt gga ggt 1679 Ala Ser Pro Gln Ser Ser Asp Asn Ser Asp Thr His Gln Ser Gly Gly 385 390 395 400 agt gac att gaa atg gat gag caa ctt att aat aga acc aaa cat gtg 1727 Ser Asp Ile Glu Met Asp Glu Gln Leu Ile Asn Arg Thr Lys His Val 405 410 415 caa caa cga ctt tca gac aca gag gaa tcc atg cag gga agt tct gac 1775 Gln Gln Arg Leu Ser Asp Thr Glu Glu Ser Met Gln Gly Ser Ser Asp 420 425 430 gaa act gcc aac agt ggt gaa gat gga agc agt ggt cct ggt agc agt 1823 Glu Thr Ala Asn Ser Gly Glu Asp Gly Ser Ser Gly Pro Gly Ser Ser 435 440 445 agt ggg cat agt gat gga tct agc aat gag gtt aat tct agc cac gca 1871 Ser Gly His Ser Asp Gly Ser Ser Asn Glu Val Asn Ser Ser His Ala 450 455 460 agc cag tca gct ggg agc cct ggc agt gag gta cag tca gaa gac att 1919 Ser Gln Ser Ala Gly Ser Pro Gly Ser Glu Val Gln Ser Glu Asp Ile 465 470 475 480 gca gat att gaa gcc ctc aaa gag gaa gat gaa gac gat gat cat ggt 1967 Ala Asp Ile Glu Ala Leu Lys Glu Glu Asp Glu Asp Asp Asp His Gly 485 490 495 cat aat cct ccc aaa agc agt tgt ggt aca gat ctt cgg aat aga aag 2015 His Asn Pro Pro Lys Ser Ser Cys Gly Thr Asp Leu Arg Asn Arg Lys 500 505 510 tta gag agt caa gca ggc att tgc ctg ggg gac tcc caa ggc acg tca 2063 Leu Glu Ser Gln Ala Gly Ile Cys Leu Gly Asp Ser Gln Gly Thr Ser 515 520 525 gaa aga aat ggg aca agc agc gga aca gga aag gac ctg gtt ttt aac 2111 Glu Arg Asn Gly Thr Ser Ser Gly Thr Gly Lys Asp Leu Val Phe Asn 530 535 540 act gaa tca ttg cca tca gta gat aat cga atg cga atg ctg gat gct 2159 Thr Glu Ser Leu Pro Ser Val Asp Asn Arg Met Arg Met Leu Asp Ala 545 550 555 560 tgt tca cac tct gaa gac cca gaa cat gat att tca ggg gaa atg aat 2207 Cys Ser His Ser Glu Asp Pro Glu His Asp Ile Ser Gly Glu Met Asn 565 570 575 gct act cat ata gca caa ggg tct cag gag tct tgt atc aca cga act 2255 Ala Thr His Ile Ala Gln Gly Ser Gln Glu Ser Cys Ile Thr Arg Thr 580 585 590 ggg gac ttc ctt ggg gag act att ggg aat gaa tta ttt aat tgt cga 2303 Gly Asp Phe Leu Gly Glu Thr Ile Gly Asn Glu Leu Phe Asn Cys Arg 595 600 605 caa ttt att ggt cca cag cat cac cac cac cac cac cac cat cac cac 2351 Gln Phe Ile Gly Pro Gln His His His His His His His His His His 610 615 620 cac cac gat ggg cat atg gtt gat gat atg cta agt gca gat gat gtc 2399 His His Asp Gly His Met Val Asp Asp Met Leu Ser Ala Asp Asp Val 625 630 635 640 agt tgt agt agc tcc cag gtt agt gca aaa tca gaa aaa aat atg gct 2447 Ser Cys Ser Ser Ser Gln Val Ser Ala Lys Ser Glu Lys Asn Met Ala 645 650 655 gat ttt gat ggt gaa gaa tct gga tgt gaa gag gag cta gtt cag att 2495 Asp Phe Asp Gly Glu Glu Ser Gly Cys Glu Glu Glu Leu Val Gln Ile 660 665 670 aat tca cat gcg gaa ctg aca tct cac ctc caa caa cat ctt ccc aat 2543 Asn Ser His Ala Glu Leu Thr Ser His Leu Gln Gln His Leu Pro Asn 675 680 685 tta gct tcc att tac cat gaa cat ctt agt caa gga cct gta gtt cat 2591 Leu Ala Ser Ile Tyr His Glu His Leu Ser Gln Gly Pro Val Val His 690 695 700 aaa cat caa ttc aac agt aat gct gtt aca gac att aat ttg gat aat 2639 Lys His Gln Phe Asn Ser Asn Ala Val Thr Asp Ile Asn Leu Asp Asn 705 710 715 720 gtt tgc aag aaa gga aat act ttg ttg tgg gat ata gtc caa gat gaa 2687 Val Cys Lys Lys Gly Asn Thr Leu Leu Trp Asp Ile Val Gln Asp Glu 725 730 735 gat gca gtt aat ctt tct gaa gga tta ata aat gaa gca gag aaa ctt 2735 Asp Ala Val Asn Leu Ser Glu Gly Leu Ile Asn Glu Ala Glu Lys Leu 740 745 750 ctt tgt tcg tta gta tgt tgg ttt aca gat aga caa att cga atg aga 2783 Leu Cys Ser Leu Val Cys Trp Phe Thr Asp Arg Gln Ile Arg Met Arg 755 760 765 ttc att gaa ggt tgc ctt gaa aac ttg gga aac aac aga tca gta gta 2831 Phe Ile Glu Gly Cys Leu Glu Asn Leu Gly Asn Asn Arg Ser Val Val 770 775 780 att tca ctt cgt ctt ctt cca aaa cta ttt ggt act ttt cag cag ttt 2879 Ile Ser Leu Arg Leu Leu Pro Lys Leu Phe Gly Thr Phe Gln Gln Phe 785 790 795 800 ggg agc agt tac gat aca cac tgg ata aca atg tgg gca gaa aaa gaa 2927 Gly Ser Ser Tyr Asp Thr His Trp Ile Thr Met Trp Ala Glu Lys Glu 805 810 815 ctg aac atg atg aag ctt ttc ttt gat aat ttg gta tac tac att caa 2975 Leu Asn Met Met Lys Leu Phe Phe Asp Asn Leu Val Tyr Tyr Ile Gln 820 825 830 act gtg aga gaa gga aga caa aaa cat gca ctg tac agc cat agt gct 3023 Thr Val Arg Glu Gly Arg Gln Lys His Ala Leu Tyr Ser His Ser Ala 835 840 845 gaa gtt caa gtt cgt ctt caa ttc ttg act tgt gta ttt tca act ctg 3071 Glu Val Gln Val Arg Leu Gln Phe Leu Thr Cys Val Phe Ser Thr Leu 850 855 860 gga tca cct gat cat ttc agg tta agt tta gag caa gtt gac atc tta 3119 Gly Ser Pro Asp His Phe Arg Leu Ser Leu Glu Gln Val Asp Ile Leu 865 870 875 880 tgg cat tgt tta gta gaa gat tct gaa tgt tat gat gat gca ctc cat 3167 Trp His Cys Leu Val Glu Asp Ser Glu Cys Tyr Asp Asp Ala Leu His 885 890 895 tgg ttt tta aat caa gtt cga agt aaa gat caa cat gct atg ggt atg 3215 Trp Phe Leu Asn Gln Val Arg Ser Lys Asp Gln His Ala Met Gly Met 900 905 910 gaa acc tac aaa cat ctt ttc ctg gag aag atg ccc cag cta aaa cct 3263 Glu Thr Tyr Lys His Leu Phe Leu Glu Lys Met Pro Gln Leu Lys Pro 915 920 925 gaa aca att agc atg act ggc tta aac ctg ttt cag cat ctc tgt aac 3311 Glu Thr Ile Ser Met Thr Gly Leu Asn Leu Phe Gln His Leu Cys Asn 930 935 940 ttg gct cga ttg gct acc agt gcc tat gat ggt tgt tca aat tct gag 3359 Leu Ala Arg Leu Ala Thr Ser Ala Tyr Asp Gly Cys Ser Asn Ser Glu 945 950 955 960 ctg tgt ggt atg gac caa ttt tgg ggc att gct tta aga gca caa tct 3407 Leu Cys Gly Met Asp Gln Phe Trp Gly Ile Ala Leu Arg Ala Gln Ser 965 970 975 ggt gat gtc agt cga gca gct atc cag tat att aac tcc tat tat att 3455 Gly Asp Val Ser Arg Ala Ala Ile Gln Tyr Ile Asn Ser Tyr Tyr Ile 980 985 990 aat ggt aaa aca ggt ttg gag aag gag caa gaa ttt att agt aag tgc 3503 Asn Gly Lys Thr Gly Leu Glu Lys Glu Gln Glu Phe Ile Ser Lys Cys 995 1000 1005 atg gag agt ctt atg ata gct tct agc agt ctt gaa cag gaa tca cac 3551 Met Glu Ser Leu Met Ile Ala Ser Ser Ser Leu Glu Gln Glu Ser His 1010 1015 1020 tca agt ctc atg gtt ata gaa aga gga ctc ctt atg ctg aag aca cat 3599 Ser Ser Leu Met Val Ile Glu Arg Gly Leu Leu Met Leu Lys Thr His 1025 1030 1035 1040 ctg gaa gcg ttt agg aga agg ttt gca tat cat ctg aga cag tgg caa 3647 Leu Glu Ala Phe Arg Arg Arg Phe Ala Tyr His Leu Arg Gln Trp Gln 1045 1050 1055 att gaa ggc act ggt att agt agt cat ttg aaa gca ctg agt gac aaa 3695 Ile Glu Gly Thr Gly Ile Ser Ser His Leu Lys Ala Leu Ser Asp Lys 1060 1065 1070 cag tct ctg ccg cta agg gtt gta tgc cag cca gct gga ctt cct gac 3743 Gln Ser Leu Pro Leu Arg Val Val Cys Gln Pro Ala Gly Leu Pro Asp 1075 1080 1085 aag atg act att gaa atg tat cct agt gac cag gta gca gat ctt agg 3791 Lys Met Thr Ile Glu Met Tyr Pro Ser Asp Gln Val Ala Asp Leu Arg 1090 1095 1100 gct gaa gta act cat tgg tat gaa aat tta cag aaa gaa caa ata aat 3839 Ala Glu Val Thr His Trp Tyr Glu Asn Leu Gln Lys Glu Gln Ile Asn 1105 1110 1115 1120 caa caa gct cag ctt cag gag ttt ggt caa agc aac cga aaa gga gag 3887 Gln Gln Ala Gln Leu Gln Glu Phe Gly Gln Ser Asn Arg Lys Gly Glu 1125 1130 1135 ttt cct gga ggc ctc atg gga cct gtc agg atg att tca tct gga cac 3935 Phe Pro Gly Gly Leu Met Gly Pro Val Arg Met Ile Ser Ser Gly His 1140 1145 1150 gag tta aca aca gat tat gat gaa aaa gca ctt cat gag ctt ggt ttt 3983 Glu Leu Thr Thr Asp Tyr Asp Glu Lys Ala Leu His Glu Leu Gly Phe 1155 1160 1165 aag gat atg cag atg gta ttt gta tct ttg ggt gca cca agg aga gag 4031 Lys Asp Met Gln Met Val Phe Val Ser Leu Gly Ala Pro Arg Arg Glu 1170 1175 1180 cgg aaa ggg gaa ggt gtt cag ctg cca gca tct tgc ctc cca ccc cct 4079 Arg Lys Gly Glu Gly Val Gln Leu Pro Ala Ser Cys Leu Pro Pro Pro 1185 1190 1195 1200 cag aag gac aac att cca atg ctt ttg ctt tta caa gag cct cat tta 4127 Gln Lys Asp Asn Ile Pro Met Leu Leu Leu Leu Gln Glu Pro His Leu 1205 1210 1215 act act ctt ttt gat tta tta gag atg ctt gca tca ttt aaa cca ccc 4175 Thr Thr Leu Phe Asp Leu Leu Glu Met Leu Ala Ser Phe Lys Pro Pro 1220 1225 1230 tca gga aaa gtg gca gtg gat gat agt gag agc tta cga tgt gaa gaa 4223 Ser Gly Lys Val Ala Val Asp Asp Ser Glu Ser Leu Arg Cys Glu Glu 1235 1240 1245 ctt cat ctt cat gca gaa aat ctg tct agg cgg gtc tgg gag cta ctg 4271 Leu His Leu His Ala Glu Asn Leu Ser Arg Arg Val Trp Glu Leu Leu 1250 1255 1260 atg ctt ctt cct aca tgt cct aat atg ttg atg gca ttc cag aat atc 4319 Met Leu Leu Pro Thr Cys Pro Asn Met Leu Met Ala Phe Gln Asn Ile 1265 1270 1275 1280 tca gat gag cag agt aat gat gga ttt aat tgg aaa gaa ctt ctc aaa 4367 Ser Asp Glu Gln Ser Asn Asp Gly Phe Asn Trp Lys Glu Leu Leu Lys 1285 1290 1295 att aag agc gcc cac aag cta ttg tat gct ctg gaa att att gaa gca 4415 Ile Lys Ser Ala His Lys Leu Leu Tyr Ala Leu Glu Ile Ile Glu Ala 1300 1305 1310 ctg gga aaa cct aat aga aga ata agg agg gag tct acg gga agt tac 4463 Leu Gly Lys Pro Asn Arg Arg Ile Arg Arg Glu Ser Thr Gly Ser Tyr 1315 1320 1325 agt gat ctt tat cca gat tca gat gat tca agt gag gat caa gtg gaa 4511 Ser Asp Leu Tyr Pro Asp Ser Asp Asp Ser Ser Glu Asp Gln Val Glu 1330 1335 1340 aat agt aaa aat tcc tgg agt tgc aag ttt gtt gct gct gga ggg ctt 4559 Asn Ser Lys Asn Ser Trp Ser Cys Lys Phe Val Ala Ala Gly Gly Leu 1345 1350 1355 1360 caa cag tta tta gaa att ttt aat tct gga att cta gag cct aaa gag 4607 Gln Gln Leu Leu Glu Ile Phe Asn Ser Gly Ile Leu Glu Pro Lys Glu 1365 1370 1375 cag gaa tca tgg act gtg tgg cag cta gac tgt ctt gct tgc ttg ctg 4655 Gln Glu Ser Trp Thr Val Trp Gln Leu Asp Cys Leu Ala Cys Leu Leu 1380 1385 1390 aag tta ata tgc cag ttt gca gta gat cca tcc gat ttg gat tta gct 4703 Lys Leu Ile Cys Gln Phe Ala Val Asp Pro Ser Asp Leu Asp Leu Ala 1395 1400 1405 tat cat gat gtc ttt gcc tgg tct ggt ata gcg gaa agc cat agg aaa 4751 Tyr His Asp Val Phe Ala Trp Ser Gly Ile Ala Glu Ser His Arg Lys 1410 1415 1420 aga acc tgg cct ggc aaa tca agg aag gct gct ggt gat cat gct aag 4799 Arg Thr Trp Pro Gly Lys Ser Arg Lys Ala Ala Gly Asp His Ala Lys 1425 1430 1435 1440 ggt ctt cat ata cca cga tta aca gag gta ttt ctt gtt ctt gtc caa 4847 Gly Leu His Ile Pro Arg Leu Thr Glu Val Phe Leu Val Leu Val Gln 1445 1450 1455 gga acc agt ttg att cag cga ctt atg tct gtt gct tat acg tat gat 4895 Gly Thr Ser Leu Ile Gln Arg Leu Met Ser Val Ala Tyr Thr Tyr Asp 1460 1465 1470 aat ctg gct cct aga gtt tta aaa gct cag tct gat cac agg tct aga 4943 Asn Leu Ala Pro Arg Val Leu Lys Ala Gln Ser Asp His Arg Ser Arg 1475 1480 1485 cat gaa gtt tca cat tat tca atg tgg ctc ttg gtg agt tgg gct cat 4991 His Glu Val Ser His Tyr Ser Met Trp Leu Leu Val Ser Trp Ala His 1490 1495 1500 tgc tgt tct tta gtg aaa tct agc ctt gct gat agc gat cat tta caa 5039 Cys Cys Ser Leu Val Lys Ser Ser Leu Ala Asp Ser Asp His Leu Gln 1505 1510 1515 1520 gat tgg cta aag aaa ttg act ctc ctt att cct gag act gca gtt cgt 5087 Asp Trp Leu Lys Lys Leu Thr Leu Leu Ile Pro Glu Thr Ala Val Arg 1525 1530 1535 cat gaa tca tgc agt ggt ctc tat aag tta tcc ctg tca ggg ctg gat 5135 His Glu Ser Cys Ser Gly Leu Tyr Lys Leu Ser Leu Ser Gly Leu Asp 1540 1545 1550 gga gga gac tca atc aat cgt tct ttt ctg cta ttg gct gcc tca aca 5183 Gly Gly Asp Ser Ile Asn Arg Ser Phe Leu Leu Leu Ala Ala Ser Thr 1555 1560 1565 tta ttg aaa ttt ctt cct gat gct caa gca ctc aaa cct att agg ata 5231 Leu Leu Lys Phe Leu Pro Asp Ala Gln Ala Leu Lys Pro Ile Arg Ile 1570 1575 1580 gat gat tat gag gaa gaa cca ata tta aaa cca gga tgt aaa gag tat 5279 Asp Asp Tyr Glu Glu Glu Pro Ile Leu Lys Pro Gly Cys Lys Glu Tyr 1585 1590 1595 1600 ttt tgg ttg tta tgc aaa tta gtt gac aac ata cat ata aag gac gct 5327 Phe Trp Leu Leu Cys Lys Leu Val Asp Asn Ile His Ile Lys Asp Ala 1605 1610 1615 agt cag aca acg ctc ctc gac tta gat gcc ttg gca aga cat ttg gct 5375 Ser Gln Thr Thr Leu Leu Asp Leu Asp Ala Leu Ala Arg His Leu Ala 1620 1625 1630 gac tgt att cga agt agg gag atc ctt gat cat cag gat ggt aat gta 5423 Asp Cys Ile Arg Ser Arg Glu Ile Leu Asp His Gln Asp Gly Asn Val 1635 1640 1645 gaa gat gat ggg ctt aca gga ctc cta agg ctt gca aca agt gtt gtt 5471 Glu Asp Asp Gly Leu Thr Gly Leu Leu Arg Leu Ala Thr Ser Val Val 1650 1655 1660 aaa cac aaa cca ccc ttt aaa ttt tca agg gaa gga cag gaa ttt ttg 5519 Lys His Lys Pro Pro Phe Lys Phe Ser Arg Glu Gly Gln Glu Phe Leu 1665 1670 1675 1680 aga gat atc ttc aat ctc ctg ttt ttg ttg cca agt cta aag gac cga 5567 Arg Asp Ile Phe Asn Leu Leu Phe Leu Leu Pro Ser Leu Lys Asp Arg 1685 1690 1695 caa cag cca aag tgc aaa tca cat tct tca aga gct gcc gct tac gat 5615 Gln Gln Pro Lys Cys Lys Ser His Ser Ser Arg Ala Ala Ala Tyr Asp 1700 1705 1710 ttg tta gta gag atg gta aag ggg tct gtt gag aac tac agg cta ata 5663 Leu Leu Val Glu Met Val Lys Gly Ser Val Glu Asn Tyr Arg Leu Ile 1715 1720 1725 cac aac tgg gtt atg gca caa cac atg cag tcc cat gca cct tat aaa 5711 His Asn Trp Val Met Ala Gln His Met Gln Ser His Ala Pro Tyr Lys 1730 1735 1740 tgg gat tac tgg cct cat gaa gat gtc cgt gct gaa tgt aga ttt gtt 5759 Trp Asp Tyr Trp Pro His Glu Asp Val Arg Ala Glu Cys Arg Phe Val 1745 1750 1755 1760 ggc ctt act aac ctt gga gct act tgt tac tta gct tct act att cag 5807 Gly Leu Thr Asn Leu Gly Ala Thr Cys Tyr Leu Ala Ser Thr Ile Gln 1765 1770 1775 caa ctt tat atg ata cct gag gca aga cag gct gtc ttc act gcc aag 5855 Gln Leu Tyr Met Ile Pro Glu Ala Arg Gln Ala Val Phe Thr Ala Lys 1780 1785 1790 tat tca gag gat atg aag cac aag acc act ctt ctg gag ctt cag aaa 5903 Tyr Ser Glu Asp Met Lys His Lys Thr Thr Leu Leu Glu Leu Gln Lys 1795 1800 1805 atg ttt aca tat tta atg gag agt gaa tgc aaa gca tat aat cct aga 5951 Met Phe Thr Tyr Leu Met Glu Ser Glu Cys Lys Ala Tyr Asn Pro Arg 1810 1815 1820 cct ttc tgt aaa aca tac acc atg gat aag cag cct ctg aat act ggg 5999 Pro Phe Cys Lys Thr Tyr Thr Met Asp Lys Gln Pro Leu Asn Thr Gly 1825 1830 1835 1840 gaa cag aaa gat atg aca gag ttt ttt act gat cta att acc aaa atc 6047 Glu Gln Lys Asp Met Thr Glu Phe Phe Thr Asp Leu Ile Thr Lys Ile 1845 1850 1855 gaa gaa atg tct ccc gaa ctg aaa aat acc gtc aaa agt tta ttt gga 6095 Glu Glu Met Ser Pro Glu Leu Lys Asn Thr Val Lys Ser Leu Phe Gly 1860 1865 1870 ggt gta att aca aac aat gtt gta tcc ttg gat tgt gaa cat gtt agt 6143 Gly Val Ile Thr Asn Asn Val Val Ser Leu Asp Cys Glu His Val Ser 1875 1880 1885 caa act gct gaa gag ttt tat act gtg agg tgc caa gtg gct gat atg 6191 Gln Thr Ala Glu Glu Phe Tyr Thr Val Arg Cys Gln Val Ala Asp Met 1890 1895 1900 aag aac att tat gaa tct ctt gat gaa gtt act ata aaa gac act ttg 6239 Lys Asn Ile Tyr Glu Ser Leu Asp Glu Val Thr Ile Lys Asp Thr Leu 1905 1910 1915 1920 gaa ggt gat aac atg tat act tgt tct cat tgt ggg aag aaa gta cga 6287 Glu Gly Asp Asn Met Tyr Thr Cys Ser His Cys Gly Lys Lys Val Arg 1925 1930 1935 gct gaa aaa agg gca tgt ttt aag aaa ttg cct cgc att ttg agt ttc 6335 Ala Glu Lys Arg Ala Cys Phe Lys Lys Leu Pro Arg Ile Leu Ser Phe 1940 1945 1950 aat act atg aga tac aca ttt aat atg gtc acg atg atg aaa gag aaa 6383 Asn Thr Met Arg Tyr Thr Phe Asn Met Val Thr Met Met Lys Glu Lys 1955 1960 1965 gtg aat aca cac ttt tcc ttc cca tta cgt ttg gac atg acg ccc tat 6431 Val Asn Thr His Phe Ser Phe Pro Leu Arg Leu Asp Met Thr Pro Tyr 1970 1975 1980 aca gaa gat ttt ctt atg gga aag agt gag agg aaa gaa ggt ttt aaa 6479 Thr Glu Asp Phe Leu Met Gly Lys Ser Glu Arg Lys Glu Gly Phe Lys 1985 1990 1995 2000 gaa gtc agt gat cat tca aaa gac tca gag agc tat gaa tat gac ttg 6527 Glu Val Ser Asp His Ser Lys Asp Ser Glu Ser Tyr Glu Tyr Asp Leu 2005 2010 2015 ata gga gtg act gtt cac aca gga acg gca gat ggt gga cac tat tat 6575 Ile Gly Val Thr Val His Thr Gly Thr Ala Asp Gly Gly His Tyr Tyr 2020 2025 2030 agc ttt atc aga gat ata gta aat ccc cat gct tat aaa aac aat aaa 6623 Ser Phe Ile Arg Asp Ile Val Asn Pro His Ala Tyr Lys Asn Asn Lys 2035 2040 2045 tgg tat ctt ttt aat gat gct gag gta aaa cct ttt gat tct gct caa 6671 Trp Tyr Leu Phe Asn Asp Ala Glu Val Lys Pro Phe Asp Ser Ala Gln 2050 2055 2060 ctt gca tct gaa tgt ttt ggt gga gag atg acg acc aag acc tat gat 6719 Leu Ala Ser Glu Cys Phe Gly Gly Glu Met Thr Thr Lys Thr Tyr Asp 2065 2070 2075 2080 tct gtt aca gat aaa ttt atg gac ttc tct ttt gaa aag aca cac agt 6767 Ser Val Thr Asp Lys Phe Met Asp Phe Ser Phe Glu Lys Thr His Ser 2085 2090 2095 gca tat atg ctg ttt tac aaa cgc atg gaa cca gag gaa gaa aat ggc 6815 Ala Tyr Met Leu Phe Tyr Lys Arg Met Glu Pro Glu Glu Glu Asn Gly 2100 2105 2110 aga gaa tac aaa ttt gat gtt tcg tca gag tta cta gag tgg att tgg 6863 Arg Glu Tyr Lys Phe Asp Val Ser Ser Glu Leu Leu Glu Trp Ile Trp 2115 2120 2125 cat gat aac atg cag ttt ctt caa gac aaa aac att ttt gaa cat aca 6911 His Asp Asn Met Gln Phe Leu Gln Asp Lys Asn Ile Phe Glu His Thr 2130 2135 2140 tat ttt gga ttt atg tgg caa ttg tgt agt tgt att ccc agt aca tta 6959 Tyr Phe Gly Phe Met Trp Gln Leu Cys Ser Cys Ile Pro Ser Thr Leu 2145 2150 2155 2160 cca gat cct aaa gct gtg tcc tta atg aca gca aag tta agc act tcc 7007 Pro Asp Pro Lys Ala Val Ser Leu Met Thr Ala Lys Leu Ser Thr Ser 2165 2170 2175 ttt gtc cta gag aca ttt att cat tct aaa gaa aag ccc acg atg ctt 7055 Phe Val Leu Glu Thr Phe Ile His Ser Lys Glu Lys Pro Thr Met Leu 2180 2185 2190 cag tgg att gaa ctg ttg acg aaa cag ttt aat aat agt cag gca gct 7103 Gln Trp Ile Glu Leu Leu Thr Lys Gln Phe Asn Asn Ser Gln Ala Ala 2195 2200 2205 tgt gag tgg ttt tta gat cgt atg gct gat gac gac tgg tgg cca atg 7151 Cys Glu Trp Phe Leu Asp Arg Met Ala Asp Asp Asp Trp Trp Pro Met 2210 2215 2220 cag ata cta att aag tgc cct aat caa att gtg aga cag atg ttt cag 7199 Gln Ile Leu Ile Lys Cys Pro Asn Gln Ile Val Arg Gln Met Phe Gln 2225 2230 2235 2240 cgt ttg tgt atc cat gtg att cag agg ctg aga cct gtg cat gct cat 7247 Arg Leu Cys Ile His Val Ile Gln Arg Leu Arg Pro Val His Ala His 2245 2250 2255 ctc tat ttg cag cca gga atg gaa gat ggg tca gat gat atg gat acc 7295 Leu Tyr Leu Gln Pro Gly Met Glu Asp Gly Ser Asp Asp Met Asp Thr 2260 2265 2270 tca gta gaa gat att ggt ggt cgt tca tgt gtc act cgc ttt gtg aga 7343 Ser Val Glu Asp Ile Gly Gly Arg Ser Cys Val Thr Arg Phe Val Arg 2275 2280 2285 acc ctg tta tta att atg gaa cat ggt gta aaa cct cac agt aaa cat 7391 Thr Leu Leu Leu Ile Met Glu His Gly Val Lys Pro His Ser Lys His 2290 2295 2300 ctt aca gag tat ttt gcc ttc ctt tac gaa ttt gca aaa atg ggt gaa 7439 Leu Thr Glu Tyr Phe Ala Phe Leu Tyr Glu Phe Ala Lys Met Gly Glu 2305 2310 2315 2320 gaa gag agc caa ttt ttg ctt tca ttg caa gct ata tct aca atg gta 7487 Glu Glu Ser Gln Phe Leu Leu Ser Leu Gln Ala Ile Ser Thr Met Val 2325 2330 2335 cat ttt tac atg gga aca aaa gga cct gaa aat cct caa gtt gaa gtg 7535 His Phe Tyr Met Gly Thr Lys Gly Pro Glu Asn Pro Gln Val Glu Val 2340 2345 2350 tta tca gag gaa gaa ggg gaa gaa gaa gag gag gaa gaa gat atc ctc 7583 Leu Ser Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu Asp Ile Leu 2355 2360 2365 tct ctg gca gaa gaa aaa tac agg cca gct gcc ctt gaa aag atg ata 7631 Ser Leu Ala Glu Glu Lys Tyr Arg Pro Ala Ala Leu Glu Lys Met Ile 2370 2375 2380 gct tta gtt gct ctt ttg gtt gaa cag tct cga tca gaa agg cat ttg 7679 Ala Leu Val Ala Leu Leu Val Glu Gln Ser Arg Ser Glu Arg His Leu 2385 2390 2395 2400 aca tta tca cag act gac atg gca gca tta aca gga gga aag gga ttt 7727 Thr Leu Ser Gln Thr Asp Met Ala Ala Leu Thr Gly Gly Lys Gly Phe 2405 2410 2415 ccc ttc ttg ttt caa cat att cgt gat ggc atc aat ata aga caa act 7775 Pro Phe Leu Phe Gln His Ile Arg Asp Gly Ile Asn Ile Arg Gln Thr 2420 2425 2430 tgt aat ctg att ttc agc ctg tgt cga tac aat aat cga ctt gca gaa 7823 Cys Asn Leu Ile Phe Ser Leu Cys Arg Tyr Asn Asn Arg Leu Ala Glu 2435 2440 2445 cat att gta tct atg ctt ttc aca tca ata gca aag ttg act cct gag 7871 His Ile Val Ser Met Leu Phe Thr Ser Ile Ala Lys Leu Thr Pro Glu 2450 2455 2460 gca gcc aat cct ttc ttt aag ttg ttg act atg cta atg gag ttt gct 7919 Ala Ala Asn Pro Phe Phe Lys Leu Leu Thr Met Leu Met Glu Phe Ala 2465 2470 2475 2480 ggt gga cct cca gga atg cct ccc ttt gca tct tat att ctg cag agg 7967 Gly Gly Pro Pro Gly Met Pro Pro Phe Ala Ser Tyr Ile Leu Gln Arg 2485 2490 2495 ata tgg gag gtg att gaa tac aat cct tct cag tgt cta gat tgg ttg 8015 Ile Trp Glu Val Ile Glu Tyr Asn Pro Ser Gln Cys Leu Asp Trp Leu 2500 2505 2510 gca gtg cag aca ccc cga aat aaa ctg gca cac agc tgg gtc tta cag 8063 Ala Val Gln Thr Pro Arg Asn Lys Leu Ala His Ser Trp Val Leu Gln 2515 2520 2525 aat atg gaa aac tgg gtc gag cgg ttt ctt ttg gct cac aat tat cct 8111 Asn Met Glu Asn Trp Val Glu Arg Phe Leu Leu Ala His Asn Tyr Pro 2530 2535 2540 aga gtg agg act tct gca gct tat ctt ctg gtg tcc ctt ata cca agc 8159 Arg Val Arg Thr Ser Ala Ala Tyr Leu Leu Val Ser Leu Ile Pro Ser 2545 2550 2555 2560 aat tca ttc cgt cag atg ttc cgg tca aca agg tct ttg cac atc cca 8207 Asn Ser Phe Arg Gln Met Phe Arg Ser Thr Arg Ser Leu His Ile Pro 2565 2570 2575 acc cgt gac ctt cca ctc agt cca gac aca aca gta gtc cta cat cag 8255 Thr Arg Asp Leu Pro Leu Ser Pro Asp Thr Thr Val Val Leu His Gln 2580 2585 2590 gtc tac aac gtg ctc ctt ggt ttg ctc tca aga gcc aaa ctt tat gtt 8303 Val Tyr Asn Val Leu Leu Gly Leu Leu Ser Arg Ala Lys Leu Tyr Val 2595 2600 2605 gat gct gct gtt cat ggc act aca aag cta gtg ccc tat ttt agc ttt 8351 Asp Ala Ala Val His Gly Thr Thr Lys Leu Val Pro Tyr Phe Ser Phe 2610 2615 2620 atg act tac tgt tta att tcc aaa act gag aag ctg atg ttt tcc aca 8399 Met Thr Tyr Cys Leu Ile Ser Lys Thr Glu Lys Leu Met Phe Ser Thr 2625 2630 2635 2640 tat ttc atg gat ttg tgg aac ctt ttc cag cct aaa ctt tct gag cca 8447 Tyr Phe Met Asp Leu Trp Asn Leu Phe Gln Pro Lys Leu Ser Glu Pro 2645 2650 2655 gca ata gct aca aat cac aat aaa cag gct ttg ctt tca ttt tgg tac 8495 Ala Ile Ala Thr Asn His Asn Lys Gln Ala Leu Leu Ser Phe Trp Tyr 2660 2665 2670 aat gtc tgt gct gac tgt cca gag aat atc cgc ctt att gtt cag aac 8543 Asn Val Cys Ala Asp Cys Pro Glu Asn Ile Arg Leu Ile Val Gln Asn 2675 2680 2685 cca gtg gta acc aag aac att gcc ttc aat tac atc ctt gct gac cat 8591 Pro Val Val Thr Lys Asn Ile Ala Phe Asn Tyr Ile Leu Ala Asp His 2690 2695 2700 gat gat cag gat gtg gtg ctt ttt aac cgt ggg atg ctg cca gcg tac 8639 Asp Asp Gln Asp Val Val Leu Phe Asn Arg Gly Met Leu Pro Ala Tyr 2705 2710 2715 2720 tat ggc att ctg agg ctc tgc tgt gag cag tct cct gca ttc aca cga 8687 Tyr Gly Ile Leu Arg Leu Cys Cys Glu Gln Ser Pro Ala Phe Thr Arg 2725 2730 2735 caa ctg gct tct cac cag aac atc cag tgg gcc ttt aag aat ctt aca 8735 Gln Leu Ala Ser His Gln Asn Ile Gln Trp Ala Phe Lys Asn Leu Thr 2740 2745 2750 cca cat gcc agc caa tac cct gga gca gta gaa gaa ctg ttt aac ctg 8783 Pro His Ala Ser Gln Tyr Pro Gly Ala Val Glu Glu Leu Phe Asn Leu 2755 2760 2765 atg cag ctg ttt ata gct cag agg cca gat atg aga gaa gaa gaa tta 8831 Met Gln Leu Phe Ile Ala Gln Arg Pro Asp Met Arg Glu Glu Glu Leu 2770 2775 2780 gaa gat att aaa cag ttc aag aaa aca acc ata agt tgt tac tta cgt 8879 Glu Asp Ile Lys Gln Phe Lys Lys Thr Thr Ile Ser Cys Tyr Leu Arg 2785 2790 2795 2800 tgc tta gat ggc cgc tcc tgc tgg act act tta ata agt gcc ttc aga 8927 Cys Leu Asp Gly Arg Ser Cys Trp Thr Thr Leu Ile Ser Ala Phe Arg 2805 2810 2815 ata cta tta gaa tct gat gaa gac aga ctt ctt gtt gta ttt aat cga 8975 Ile Leu Leu Glu Ser Asp Glu Asp Arg Leu Leu Val Val Phe Asn Arg 2820 2825 2830 gga ttg att cta atg aca gag tct ttc aac act ttg cac atg atg tat 9023 Gly Leu Ile Leu Met Thr Glu Ser Phe Asn Thr Leu His Met Met Tyr 2835 2840 2845 cac gaa gct aca gct tgc cat gtg act gga gat tta gta gaa ctt ctg 9071 His Glu Ala Thr Ala Cys His Val Thr Gly Asp Leu Val Glu Leu Leu 2850 2855 2860 tca ata ttt ctt tcg gtt ttg aag tct aca cgc cct tat ctt cag aga 9119 Ser Ile Phe Leu Ser Val Leu Lys Ser Thr Arg Pro Tyr Leu Gln Arg 2865 2870 2875 2880 aaa gat gtg aaa caa gca tta atc cag tgg cag gag cga att gaa ttt 9167 Lys Asp Val Lys Gln Ala Leu Ile Gln Trp Gln Glu Arg Ile Glu Phe 2885 2890 2895 gcc cat aaa ctg tta act ctt ctt aat tcc tat agt cct cca gaa ctt 9215 Ala His Lys Leu Leu Thr Leu Leu Asn Ser Tyr Ser Pro Pro Glu Leu 2900 2905 2910 aga aat gcc tgt ata gat gtc ctc aag gaa ctt gta ctt ttg agt ccc 9263 Arg Asn Ala Cys Ile Asp Val Leu Lys Glu Leu Val Leu Leu Ser Pro 2915 2920 2925 cat gat ttt ctt cat act ctg gtt ccc ttt cta caa cac aac cat tgt 9311 His Asp Phe Leu His Thr Leu Val Pro Phe Leu Gln His Asn His Cys 2930 2935 2940 act tac cat cac agt aat ata cca atg tct ctt gga cct tat ttc cct 9359 Thr Tyr His His Ser Asn Ile Pro Met Ser Leu Gly Pro Tyr Phe Pro 2945 2950 2955 2960 tgt cga gaa aat atc aag cta ata gga ggg aaa agc aat att cgg cct 9407 Cys Arg Glu Asn Ile Lys Leu Ile Gly Gly Lys Ser Asn Ile Arg Pro 2965 2970 2975 ccg cgc cct gaa ctc aat atg tgc ctc ttg ccc aca atg gtg gaa acc 9455 Pro Arg Pro Glu Leu Asn Met Cys Leu Leu Pro Thr Met Val Glu Thr 2980 2985 2990 agt aag ggc aaa gat gac gtt tat gat cgt atg ctg cta gac tac ttc 9503 Ser Lys Gly Lys Asp Asp Val Tyr Asp Arg Met Leu Leu Asp Tyr Phe 2995 3000 3005 ttt tct tat cat cag ttc atc cat cta tta tgc cga gtt gca atc aac 9551 Phe Ser Tyr His Gln Phe Ile His Leu Leu Cys Arg Val Ala Ile Asn 3010 3015 3020 tgt gaa aaa ttt act gaa aca tta gtt aag ctg agt gtc cta gtt gcc 9599 Cys Glu Lys Phe Thr Glu Thr Leu Val Lys Leu Ser Val Leu Val Ala 3025 3030 3035 3040 tat gaa ggt ttg cca ctt cat ctt gca ctg ttc ccc aaa ctt tgg act 9647 Tyr Glu Gly Leu Pro Leu His Leu Ala Leu Phe Pro Lys Leu Trp Thr 3045 3050 3055 gag cta tgc cag act cag tct gct atg tca aaa aac tgc atc aag ctt 9695 Glu Leu Cys Gln Thr Gln Ser Ala Met Ser Lys Asn Cys Ile Lys Leu 3060 3065 3070 ttg tgt gaa gat cct gtt ttc gca gaa tat att aaa tgt atc cta atg 9743 Leu Cys Glu Asp Pro Val Phe Ala Glu Tyr Ile Lys Cys Ile Leu Met 3075 3080 3085 gat gaa aga act ttt tta aac aac aac att gtc tac acg ttc atg aca 9791 Asp Glu Arg Thr Phe Leu Asn Asn Asn Ile Val Tyr Thr Phe Met Thr 3090 3095 3100 cat ttc ctt cta aag gtt caa agt caa gtg ttt tct gaa gca aac tgt 9839 His Phe Leu Leu Lys Val Gln Ser Gln Val Phe Ser Glu Ala Asn Cys 3105 3110 3115 3120 gcc aat ttg atc agc act ctt att aca aac ttg ata agc cag tat cag 9887 Ala Asn Leu Ile Ser Thr Leu Ile Thr Asn Leu Ile Ser Gln Tyr Gln 3125 3130 3135 aac cta cag tct gat ttc tcc aac cga gtt gaa att tcc aaa gca agt 9935 Asn Leu Gln Ser Asp Phe Ser Asn Arg Val Glu Ile Ser Lys Ala Ser 3140 3145 3150 gct tct tta aat ggg gac ctg agg gca ctc gct ttg ctc ctg tca gta 9983 Ala Ser Leu Asn Gly Asp Leu Arg Ala Leu Ala Leu Leu Leu Ser Val 3155 3160 3165 cac act ccc aaa cag tta aac cca gct cta att cca act ctg caa gag 10031 His Thr Pro Lys Gln Leu Asn Pro Ala Leu Ile Pro Thr Leu Gln Glu 3170 3175 3180 ctt tta agc aaa tgc agg act tgt ctg caa cag aga aac tca ctc caa 10079 Leu Leu Ser Lys Cys Arg Thr Cys Leu Gln Gln Arg Asn Ser Leu Gln 3185 3190 3195 3200 gag caa gaa gcc aaa gaa aga aaa act aaa gat gat gaa gga gca act 10127 Glu Gln Glu Ala Lys Glu Arg Lys Thr Lys Asp Asp Glu Gly Ala Thr 3205 3210 3215 ccc att aaa agg cgg cgt gtt agc agt gat gag gag cac act gta gac 10175 Pro Ile Lys Arg Arg Arg Val Ser Ser Asp Glu Glu His Thr Val Asp 3220 3225 3230 agc tgc atc agt gac atg aaa aca gaa acc agg gag gtc ctg acc cca 10223 Ser Cys Ile Ser Asp Met Lys Thr Glu Thr Arg Glu Val Leu Thr Pro 3235 3240 3245 acg agc act tct gac aat gag acc aga gac tcc tca att att gat cca 10271 Thr Ser Thr Ser Asp Asn Glu Thr Arg Asp Ser Ser Ile Ile Asp Pro 3250 3255 3260 gga act gag caa gat ctt cct tcc cct gaa aat agt tct gtt aaa gaa 10319 Gly Thr Glu Gln Asp Leu Pro Ser Pro Glu Asn Ser Ser Val Lys Glu 3265 3270 3275 3280 tac cga atg gaa gtt cca tct tcg ttt tca gaa gac atg tca aat atc 10367 Tyr Arg Met Glu Val Pro Ser Ser Phe Ser Glu Asp Met Ser Asn Ile 3285 3290 3295 agg tca cag cat gca gaa gaa cag tcc aac aat ggt aga tat gac gat 10415 Arg Ser Gln His Ala Glu Glu Gln Ser Asn Asn Gly Arg Tyr Asp Asp 3300 3305 3310 tgt aaa gaa ttt aaa gac ctc cac tgt tcc aag gat tct acc cta gct 10463 Cys Lys Glu Phe Lys Asp Leu His Cys Ser Lys Asp Ser Thr Leu Ala 3315 3320 3325 gag gaa gaa tct gag ttc cct tct act tct atc tct gca gtt ctg tct 10511 Glu Glu Glu Ser Glu Phe Pro Ser Thr Ser Ile Ser Ala Val Leu Ser 3330 3335 3340 gac tta gct gac ttg aga agc tgt gat ggc caa gct ttg ccc tcc cag 10559 Asp Leu Ala Asp Leu Arg Ser Cys Asp Gly Gln Ala Leu Pro Ser Gln 3345 3350 3355 3360 gac cct gag gtt gct tta tct ctc agt tgt ggc cat tcc aga gga ctc 10607 Asp Pro Glu Val Ala Leu Ser Leu Ser Cys Gly His Ser Arg Gly Leu 3365 3370 3375 ttt agt cat atg cag caa cat gac att tta gat acc ctg tgt agg acc 10655 Phe Ser His Met Gln Gln His Asp Ile Leu Asp Thr Leu Cys Arg Thr 3380 3385 3390 att gaa tct aca atc cat gtc gtc aca agg ata tct ggc aaa gga aac 10703 Ile Glu Ser Thr Ile His Val Val Thr Arg Ile Ser Gly Lys Gly Asn 3395 3400 3405 caa gct gct tct tga cattaggtgt agcatgtcta cttttaagtc cctcaccccc 10758 Gln Ala Ala Ser 3410 aacccccatg ctgtttgtat aagttttgct tatttgtttt tgtgcttcag tttgtccagt 10818 gctctctgct tgaatggcaa gatagattta taggcttaat tcttggtcag gcagaactcc 10878 agatgaaaaa aacttgcatc ttcagtatac ttcctaaagg gcaatcagat aatggatatg 10938 ttttatgtaa ttaagagttc actttagtgg ctttcattta atatggctgt ctgggaagaa 10998 cagggttgcc tagccctgta caatgtaatt taaacttaca gcatttttac tgtgtatgat 11058 atggtgtcct ctgtgccagt tttgtacctt atagaggcag attgcctccg atcgctgtgg 11118 ttcttattat caaaattaag tttacttgta tacggaacaa ccacaagaaa tttgattctg 11178 taaagaatcc tctttagctg tggcctggca gtatataaat ggtgctttat ttaacagaat 11238 acctgtggag gaaataaagc acacttgatg t 11269
【図面の簡単な説明】
【図1】 pg01082のインビトロでの脱ユビキチン化活
性の検出を示す図である。レーン1は、緩衝液単独、レ
ーン2は陽性コントロール、レーン3および4はpg0108
2発現プラスミド含有大腸菌(E.coli)BL21-SIの発現誘
導および発現非誘導により得られた抽出物の結果を示
す。
【図2】 共発現系でのpg01082の脱ユビキチン化活性
の検出を示す図である。レーン1、4、7、10がpg01
082であり、レーン2、5、8、11は陰性コントロー
ルのルシフェラーゼであり、レーン3、6、9、12は
陽性コントロールである。
【図3】 活性部位変異の影響を示す図である。レーン
1と5が、508番目のシステインがアラニンに置換さ
れたpg01082(pg01082c508A)である。
【図4】 hk03615x2とpg01082とがコードするアミノ酸
配列の関係を示す模式図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) A61K 45/00 A61P 25/00 4C084 48/00 25/16 4C085 A61P 25/00 25/28 4C086 25/16 43/00 111 4H045 25/28 C07K 16/40 43/00 111 C12N 1/15 C07K 16/40 1/19 C12N 1/15 1/21 1/19 9/64 Z 1/21 C12Q 1/37 5/10 1/68 A 9/64 G01N 33/15 Z C12Q 1/37 33/50 Z 1/68 33/53 D G01N 33/15 M 33/50 33/566 33/53 C12N 15/00 ZNAA 5/00 A 33/566 A61K 37/02 (72)発明者 長瀬 隆弘 千葉県木更津市矢那1532番3号 財団法人 かずさディー・エヌ・エー研究所内 (72)発明者 大石 道夫 千葉県木更津市矢那1532番3号 財団法人 かずさディー・エヌ・エー研究所内 (72)発明者 横田 博 東京都江戸川区北葛西1丁目16番13号 第 一製薬株式会社東京研究開発センター内 (72)発明者 和田 直也 東京都江戸川区北葛西1丁目16番13号 第 一製薬株式会社東京研究開発センター内 (72)発明者 岡本 貴史 東京都江戸川区北葛西1丁目16番13号 第 一製薬株式会社東京研究開発センター内 Fターム(参考) 2G045 AA40 DA12 DA13 DA36 FB02 FB03 4B024 AA01 AA11 BA14 CA04 CA09 CA20 DA06 EA04 GA11 HA14 4B050 CC01 CC03 DD11 EE01 LL01 LL03 LL05 4B063 QA01 QA05 QA13 QA17 QA19 QQ21 QQ41 QQ43 QQ53 QQ61 QQ89 QR08 QR32 QR35 QR40 QR42 QR55 QR62 QS16 QS25 QX02 4B065 AA01X AA26X AA58X AA72X AA87X AA93Y AB01 AC14 BA02 CA33 CA44 CA46 4C084 AA02 AA06 AA13 BA01 BA08 BA22 BA23 CA53 DC50 NA14 ZA022 ZA152 ZA162 ZC022 4C085 AA13 AA14 BB11 CC04 CC05 CC13 DD22 DD33 DD34 EE01 4C086 AA01 AA02 EA16 MA01 MA02 MA03 MA04 MA07 NA14 ZA02 ZA15 ZA16 ZC02 4H045 AA11 AA30 CA40 DA75 EA20 EA50 FA71

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 下記の群より選ばれるポリペプチド; 配列表の配列番号1または配列番号2に記載のアミノ
    酸配列からなるポリペプチド、 前記のポリペプチドを含有するポリペプチド、 前記のポリペプチドと少なくとも約70%のアミノ
    酸配列上の相同性を有しかつ脱ユビキチン化活性を有す
    るポリペプチド、および 前記アミノ酸配列において1ないし数個のアミノ酸の
    欠失、置換、付加あるいは挿入といった変異を有し、か
    つ脱ユビキチン化活性を有するポリペプチド。
  2. 【請求項2】 配列表の配列番号1または配列番号2に
    記載のアミノ酸配列の少なくとも約5個の連続するアミ
    ノ酸配列を有するペプチド。
  3. 【請求項3】 請求項1または2に記載のポリペプチド
    またはペプチドをコードするポリヌクレオチドまたはそ
    の相補鎖。
  4. 【請求項4】 配列表の配列番号3または配列番号4に
    記載の塩基配列からなるポリヌクレオチドまたはその相
    補鎖。
  5. 【請求項5】 配列表の配列番号3または配列番号4に
    記載の塩基配列からなるポリヌクレオチドまたはその相
    補鎖の少なくとも約15個の連続する塩基配列からなる
    ポリヌクレオチド。
  6. 【請求項6】 請求項3から5のいずれか1項に記載の
    ポリヌクレオチドまたはその相補鎖とストリンジェント
    な条件下でハイブリダイゼーションするポリヌクレオチ
    ド。
  7. 【請求項7】 請求項3から6のいずれか1項に記載の
    ポリヌクレオチドを含有する組換えベクター。
  8. 【請求項8】 請求項7に記載の組換えベクターを形質
    導入された形質転換体。
  9. 【請求項9】 請求項8に記載の形質転換体を培養する
    工程または請求項7に記載の組換えベクターを利用した
    無細胞蛋白質合成手段を含む、請求項1または2に記載
    のポリペプチドまたはペプチドの製造方法。
  10. 【請求項10】 請求項1または2に記載のポリペプチ
    ドまたはペプチドを免疫学的に認識する抗体。
  11. 【請求項11】 脱ユビキチン化活性を抑制する、請求
    項10に記載の抗体。
  12. 【請求項12】 請求項1に記載のポリペプチドと相互
    作用して脱ユビキチン化活性を阻害もしくは活性化する
    化合物、および/または請求項3もしくは4に記載のポ
    リヌクレオチドと相互作用してその発現を阻害もしくは
    促進する化合物のスクリーニング方法であって、請求項
    1もしくは2に記載のポリペプチドもしくはペプチド、
    請求項3から6のいずれか1項に記載のポリヌクレオチ
    ド、請求項7に記載のベクター、請求項8に記載の形質
    転換体、請求項10もしくは11に記載の抗体のうちの
    少なくともいずれか1つを用いることを特徴とするスク
    リーニング方法。
  13. 【請求項13】 請求項12に記載の方法で同定される
    化合物。
  14. 【請求項14】 請求項1に記載のポリペプチドと相互
    作用して脱ユビキチン化活性を阻害もしくは活性化する
    化合物、または請求項3もしくは4に記載のポリヌクレ
    オチドと相互作用してその発現を阻害もしくは促進する
    化合物。
  15. 【請求項15】 請求項1または2に記載のポリペプチ
    ドもしくはペプチド、請求項3から6のいずれか1項に
    記載のポリヌクレオチド、請求項7に記載のベクター、
    請求項8に記載の形質転換体、請求項10もしくは11
    に記載の抗体、または請求項13もしくは14に記載の
    化合物のうちの少なくともいずれか1つを含有すること
    を特徴とする医薬組成物。
  16. 【請求項16】 請求項1に記載のポリペプチドの発現
    または脱ユビキチン化活性に関連した疾病の診断のため
    の測定方法であって、(a)該ポリペプチドをコードし
    ている核酸および/または(b)試料中の該ポリペプチ
    ドをマーカーとして分析することを含む測定方法。
  17. 【請求項17】 請求項1もしくは2に記載のポリペプ
    チドもしくはペプチド、請求項3から6のいずれか1項
    に記載のポリヌクレオチド、または請求項10もしくは
    11に記載の抗体のうちの少なくとも1つを含んでな
    る、(a)該ポリペプチドまたは蛋白質をコードしてい
    る核酸および/または(b)試料中の該ポリペプチドを
    マーカーとして分析することを含む測定方法に使用する
    試薬キット。
  18. 【請求項18】 請求項1に記載のポリペプチドと相互
    作用して脱ユビキチン化活性を阻害もしくは活性化する
    化合物、および/または請求項3もしくは4に記載のポ
    リヌクレオチドと相互作用してその発現を阻害もしくは
    促進する化合物のスクリーニング方法であって、請求項
    1もしくは2に記載のポリペプチドもしくはペプチド、
    請求項3から6のいずれか1項に記載のポリヌクレオチ
    ド、請求項7に記載のベクター、請求項8に記載の形質
    転換体、請求項10もしくは11に記載の抗体のうちの
    少なくともいずれか1つを用いることを特徴とするスク
    リーニング方法で得られる化合物を含有する神経変性疾
    患の予防・治療剤。
  19. 【請求項19】 請求項1または2に記載のポリペプチ
    ドもしくはペプチド、請求項3から6のいずれか1項に
    記載のポリヌクレオチド、請求項7に記載のベクター、
    請求項8に記載の形質転換体、請求項10もしくは11
    に記載の抗体、または請求項13もしくは14に記載の
    化合物のうちの少なくともいずれか1つを含有すること
    を特徴とする神経変性疾患の予防・治療剤。
  20. 【請求項20】 請求項18または請求項19に記載の
    神経変性疾患がアルツハイマー病および/またはパーキ
    ンソン病である神経変性疾患の予防・治療剤。
JP2001105813A 2001-04-04 2001-04-04 新規ユビキチン特異プロテアーゼ Withdrawn JP2002300880A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001105813A JP2002300880A (ja) 2001-04-04 2001-04-04 新規ユビキチン特異プロテアーゼ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001105813A JP2002300880A (ja) 2001-04-04 2001-04-04 新規ユビキチン特異プロテアーゼ

Publications (1)

Publication Number Publication Date
JP2002300880A true JP2002300880A (ja) 2002-10-15

Family

ID=18958432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001105813A Withdrawn JP2002300880A (ja) 2001-04-04 2001-04-04 新規ユビキチン特異プロテアーゼ

Country Status (1)

Country Link
JP (1) JP2002300880A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005014804A3 (en) * 2003-08-06 2005-06-30 Novartis Ag Ubiquitin-specific protease
JP2015517813A (ja) * 2012-05-28 2015-06-25 ザ・ロイヤル・インスティテューション・フォア・ザ・アドバンスメント・オブ・ラーニング/マクギル・ユニヴァーシティ 炎症を可能にするポリペプチドおよびその使用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005014804A3 (en) * 2003-08-06 2005-06-30 Novartis Ag Ubiquitin-specific protease
JP2015517813A (ja) * 2012-05-28 2015-06-25 ザ・ロイヤル・インスティテューション・フォア・ザ・アドバンスメント・オブ・ラーニング/マクギル・ユニヴァーシティ 炎症を可能にするポリペプチドおよびその使用

Similar Documents

Publication Publication Date Title
JP4007611B2 (ja) 免疫抑制剤標的蛋白質
EP0738394B1 (en) Ubiquitin conjugating enzymes
WO1995033819A2 (en) Cdk4 (cyclin dependent kinase 4) binding proteins
WO1995018974A9 (en) Ubiquitin conjugating enzymes
US6503742B1 (en) Ubiquitin ligases and uses related thereto
US6015692A (en) CDC37 cell-cycle regulatory protein and uses related thereto
Gijsbers et al. Functional characterization of the non-catalytic ectodomains of the nucleotide pyrophosphatase/phosphodiesterase NPP1
WO1999004033A1 (en) Assay to detect inhibitors of i-kappa-b proteolyse
US7718763B2 (en) Substrate polyeptides for von Willebrand factor cleaving protease ADAMTS-13
US5801015A (en) Nucleic acid encoding a Candida cell cycle regulatory protein, TYP1 polypeptide
US6747128B2 (en) Components of ubiquitin ligase complexes, and uses related thereto
US7070940B2 (en) Method for determining the ability of a compound to modify the interaction between parkin and the p38 protein
US6872558B1 (en) Heparanase-2 a member of the heparanase protein family
JP2002300880A (ja) 新規ユビキチン特異プロテアーゼ
JP4895808B2 (ja) Copdキナーゼ(rcキナーゼ)において制御される、キナーゼの制御
WO2005019472A1 (ja) シノビオリン活性調節作用の検出方法
US6300093B1 (en) Islet cell antigen 1851
US20060110769A1 (en) Regulation of novel human prolyl 4-hydroxylases
US20030077288A1 (en) Compositions and methods for treatment of muscle wasting
US5981699A (en) Human ubiquitin conjugating enzyme
JP2003506017A (ja) セリパンクリン
JP4232423B2 (ja) 新規ユビキチン特異プロテアーゼ
US20070212705A1 (en) Pseudomonas aeruginosa l-d carboxypeptidase a, expression and activity
US20030104362A1 (en) Cell-cycle regulatory proteins from human pathogens, and uses related thereto
AU695944C (en) Ubiquitin conjugating enzymes

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080701