JP2004229640A

JP2004229640A - 新規タンパク質及びそれをコードするｄｎａ

Info

Publication number: JP2004229640A
Application number: JP2003115750A
Authority: JP
Inventors: Yoshihide Hayashizaki; 良英林崎; Mamoru Kamiya; 守神谷; Hideo Kubodera; 英夫久保寺
Original assignee: Mitsubishi Chemical Corp; Dnaform KK; RIKEN Institute of Physical and Chemical Research
Current assignee: Mitsubishi Chemical Corp; Dnaform KK; RIKEN Institute of Physical and Chemical Research
Priority date: 2002-04-19
Filing date: 2003-04-21
Publication date: 2004-08-19

Abstract

【課題】カタログ化された完全長ｃＤＮＡライブラリーに含まれるｃＤＮＡクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするＤＮＡの利用方法を提案すること。
【解決手段】以下の（ａ）または（ｂ）のタンパク質。（ａ）複数の特定のアミノ酸配列からなるタンパク質。（ｂ）ａ記載のアミノ酸配列において１若しくは数個のアミノ酸が欠失、置換及び／または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【選択図】なし

Description

【０００１】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするＤＮＡ、該タンパク質をコードする完全長ｃＤＮＡ、該ＤＮＡを有する組換えベクター、該ＤＮＡの部分配列から成るオリゴヌクレオチド、該ＤＮＡを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【０００２】
【従来の技術】
ｃＤＮＡの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長ｃＤＮＡをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるｃＤＮＡに重複がないという意味であり、各ｃＤＮＡが１種類ずつ含まれているライブラリーのことである。
【０００３】
完全長ｃＤＮＡクローニング法については、特開平９−２４８１８７号公報及び特開平１０−１２７２９１号公報に記載されている。この方法は、ｍＲＮＡの５’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたｍＲＮＡを鋳型とし、ｏｌｉｇｏｄＴをプライマーとして逆転写によりＲＮＡ−ＤＮＡ複合体を作製し、この複合体の内、ｍＲＮＡの完全長に対応するＤＮＡを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【０００４】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている（特開平１０−８４９６１号公報）。さらに、合成された完全長ｃＤＮＡライブラリーに含まれるＤＮＡ断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている（特開平１１−９２７３号公報）。
【０００５】
このような技術により作製された完全長ｃＤＮＡライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている（特開２０００−３２５０８０号公報；Ｃａｒｎｉｎｃｉ，Ｐ．ｅｔａｌ．，Ｇｅｎｏｍｉｃｓ，３７，３２７−３３６（１９９６））。
かくして得られるカタログ化された完全長ｃＤＮＡライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えば、その塩基配列は同定されるが、該ｃＤＮＡがコードするタンパク質の生理活性は依然不明のままである。
【０００６】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長ｃＤＮＡライブラリーに含まれるｃＤＮＡクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするＤＮＡの利用方法を提案することを目的とする。
【０００７】
【課題を解決するための手段】
本発明者らは、マウス完全長ｃＤＮＡライブラリー中のｃＤＮＡクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列にプロテアーゼ活性を有するタンパク質に特異的な配列を見出し、これらのｃＤＮＡがコードするタンパク質がプロテアーゼ活性を有すると同定した。また、（ｉ）これらのｃＤＮＡの各組織における発現量を解析し、（ｉｉ）該ｃＤＮＡがコードするタンパク質の発現を阻害した個体の表現型の変化を解析し、（ｉ）および／または（ｉｉ）の解析結果から該ｃＤＮＡがコードするタンパク質の有する機能を総合的に解析した。さらに、これらのｃＤＮＡに対する新規なヒトのオルソログＤＮＡを取得し解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【０００８】
すなわち本発明によれば、以下の（１）〜（１５）に記載の発明が提供される。
（１）以下の（ａ）または（ｂ）のタンパク質。
（ａ）配列番号２５〜４８、６０〜６２、６５または６６のいずれかに記載のアミノ酸配列からなるタンパク質。
（ｂ）配列番号２５〜４８、６０〜６２、６５または６６のいずれかに記載のアミノ酸配列において１若しくは数個のアミノ酸が欠失、置換及び／または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【０００９】
（２）（１）に記載のタンパク質をコードするＤＮＡ。
（３）（１）に記載のタンパク質をコードする完全長ｃＤＮＡ。
（４）以下の（ａ）、（ｂ）又は（ｃ）の何れかのＤＮＡ。
（ａ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列を有するＤＮＡ。
（ｂ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列において、１若しくは数個の塩基が欠失、置換及び／または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ。
（ｃ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列を有するＤＮＡとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ。
【００１０】
（５）（２）〜（４）のいずれかに記載のＤＮＡを含む組換えベクター。
（６）（２）〜（４）のいずれかに記載のＤＮＡまたは（５）に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
（７）（６）に記載の細胞により産生される、（１）に記載の組み換えタンパク質。
（８）（２）〜（４）の何れかに記載のＤＮＡの塩基配列中の連続した５〜１００塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【００１１】
（９）（１）または（７）に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
（１０）抗体がモノクローナル抗体である（９）に記載の抗体。
（１１）モノクローナル抗体が（１）または（７）に記載のタンパク質のプロテアーゼ活性を中和する作用を有することを特徴とする（１０）に記載の抗体。
【００１２】
（１２）（１）または（７）に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
（１３）（６）に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているＤＮＡの発現レベルの変化を検出することを特徴とする、該ＤＮＡの発現調節物質のスクリーニング方法。
【００１３】
（１４）（１）に記載のタンパク質のアミノ酸配列から選択される少なくとも１以上のアミノ酸配列情報、および／または（２）〜（４）のいずれかに記載のＤＮＡの塩基配列から選択される少なくとも１以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
（１５）（１）に記載のタンパク質、および／または（２）〜（４）のいずれかに記載のＤＮＡを結合させた担体。
【００１４】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
（１）完全長ｃＤＮＡの取得及び塩基配列の解析
本発明のＤＮＡは、配列番号２５〜４８、６０〜６２、６５または６６に記載のアミノ酸配列からなるタンパク質、またはアミノ酸配列において、１若しくは数個（ここで言う数個の数は特には限定されないが、例えば２０個以下、好ましくは１５個以下、より好ましくは１０個以下、さらに好ましくは５個以下を意味する）のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのｃＤＮＡの全長を含むものでもよい。
【００１５】
具体的には、ｃＤＮＡの全長を含むＤＮＡとしては、例えば配列番号１〜２４、５７〜５９、６３または６４に記載の塩基配列からなるＤＮＡ等が挙げられる。また、その翻訳領域としては、配列番号１の塩基番号１５３１〜２６３１、配列番号２の塩基番号９９２〜４２７０、配列番号３の塩基番号８〜１４５９、配列番号４の塩基番号１〜２０３４、配列番号５の塩基番号１０〜４１１、配列番号６の塩基番号７５〜８４８、配列番号７の塩基番号９８〜１３５１、配列番号８の塩基番号５２６〜２２４４、配列番号９の塩基番号２５６〜１５００、配列番号１０の塩基番号６８〜１０４２、配列番号１１の塩基番号２８０〜１１９１、配列番号１２の塩基番号３４４〜９５８、配列番号１３の塩基番号１５９〜１１９０、配列番号１４の塩基番号４７６〜９７９、配列番号１５の塩基番号２２７〜１５８２、配列番号１６の塩基番号１７４〜１４９３、配列番号１７の塩基番号１３４〜１４５３、配列番号１８の塩基番号１６７〜１４８６、配列番号１９の塩基番号１６〜１３３５、配列番号２０の塩基番号７６〜１３２６、配列番号２１の塩基番号２６〜１３４５、配列番号２２の塩基番号４６６〜１４７６、配列番号２３の塩基番号２７７〜３３４２、配列番号２４の塩基番号６２３〜１４１１、配列番号５７の塩基番号３３２〜８２６、配列番号５８の塩基番号８１９〜２１０２、配列番号５９の塩基番号１１１０〜１８８９、配列番号６３の塩基番号１〜１２９６、配列番号６４の塩基番号１〜１６８０に示される配列を有するものが挙げられる。さらに上記のｃＤＮＡの全長でなくても、上記翻訳領域とその３’及び／または５’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のＤＮＡに含まれる。
【００１６】
本発明のＤＮＡは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりｍＲＮＡを調製する。次に、このｍＲＮＡを鋳型としてｃＤＮＡを合成するが、このとき完全長のｃＤＮＡを合成するために５’キャップ（^７ＭｅＧ_ｐｐｐＮ）サイトに特異的なジオール構造にタグになる分子を化学結合させ、このｍＲＮＡを鋳型としてｏｌｉｇｏｄＴをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のｃＤＮＡのみを分離する方法（特開平９−２４８１８７号公報、特開平１０−１２７２９１号公報）を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法（特開平１０−８４９６１号公報）を用いるのが好ましい。ここで、高温下とは４０〜８０℃を意味する。
【００１７】
このようにして取得されたｃＤＮＡは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のＤＮＡを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター（特開平１１−９２７３号公報）が好ましく用いられる。かくして得られるｃＤＮＡライブラリーは、全てのクローンが均一に存在している（以下、これを「カタログ化されている」と称することがある）訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法（特開２０００−３２５０８０号公報、Ｃａｒｎｉｎｃｉ，Ｐ．ｅｔａｌ．，Ｇｅｎｏｍｉｃｓ，３７，３２７−３３６（１９９６））を用いることが好ましい。
【００１８】
カタログ化されたｃＤＮＡライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のＤＮＡは、ｃＤＮＡ全長の場合にはその末端１００ベースの配列について得られた塩基配列を、ＢＬＡＳＴ（ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＢＬＡＳＴ／；ＮａｔｉｏｎａｌＣｅｎｔｅｒｏｆＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ）を用いて、ＮＣＢＩのＧｅｎｂａｎｋ、ＥＭＢＬ、ＤＤＢＪ、ＰＤＢ等のデータベースについて検索し、最も高い相同性を示す配列でも相同性が３０％以下であり、かつ該ＤＮＡの翻訳領域の全長について最も高い相同性を示す配列でもその相同性が４０％以下であるものを新規として以下の解析に供することとした。
【００１９】
このような完全長ｃＤＮＡの塩基配列を有するＤＮＡとしては、例えば、配列番号１〜２４、５７〜５９、６３または６４に記載の塩基配列からなるＤＮＡ等が挙げられる。また、その翻訳領域としては、配列番号１の塩基番号１５３１〜２６３１、配列番号２の塩基番号９９２〜４２７０、配列番号３の塩基番号８〜１４５９、配列番号４の塩基番号１〜２０３４、配列番号５の塩基番号１０〜４１１、配列番号６の塩基番号７５〜８４８、配列番号７の塩基番号９８〜１３５１、配列番号８の塩基番号５２６〜２２４４、配列番号９の塩基番号２５６〜１５００、配列番号１０の塩基番号６８〜１０４２、配列番号１１の塩基番号２８０〜１１９１、配列番号１２の塩基番号３４４〜９５８、配列番号１３の塩基番号１５９〜１１９０、配列番号１４の塩基番号４７６〜９７９、配列番号１５の塩基番号２２７〜１５８２、配列番号１６の塩基番号１７４〜１４９３、配列番号１７の塩基番号１３４〜１４５３、配列番号１８の塩基番号１６７〜１４８６、配列番号１９の塩基番号１６〜１３３５、配列番号２０の塩基番号７６〜１３２６、配列番号２１の塩基番号２６〜１３４５、配列番号２２の塩基番号４６６〜１４７６、配列番号２３の塩基番号２７７〜３３４２、配列番号２４の塩基番号６２３〜１４１１、配列番号５７の塩基番号３３２〜８２６、配列番号５８の塩基番号８１９〜２１０２、配列番号５９の塩基番号１１１０〜１８８９、配列番号６３の塩基番号１〜１２９６、配列番号６４の塩基番号１〜１６８０に示される配列を有するものが挙げられる。
【００２０】
かくして取得された新規な塩基配列を、ＢＬＡＳＴ（Ｂａｓｉｃｌｏｃａｌａｌｉｇｎｍｅｎｔｓｅａｒｃｈｔｏｏｌ；Ａｌｔｓｃｈｕｌ，Ｓ．Ｆ．，ｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．，２１５，４０３−４１０（１９９０））による相同性検索（ｈｏｍｏｌｏｇｙｓｅａｒｃｈ）や、ＨＭＭＥＲ（隠れＭａｒｋｏｖモデルによる配列解析手法；Ｅｄｄｙ，Ｓ．Ｒ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ１４，７５５−７６３（１９９８））の機能群のひとつであるＨＭＭＰＦＡＭ（ｈｔｔｐ：／／ｐｆａｍ．ｗｕｓｔｌ．ｅｄｕ）による蛋白質特徴検索（ｐｒｏｆｉｌｅｓｅａｒｃｈ）等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【００２１】
ＢＬＡＳＴによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のＤＮＡのこれに対応する部分とのｉｄｅｎｔｉｔｙがｅ−ｖａｌｕｅとして１０^−４以下のものか、あるいは３０％以上のものを示す。
【００２２】
例えば、上位にヒットした触媒ドメイン配列の多くがプロテアーゼとしての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、プロテアーゼ活性を持つであろうという予測が成り立つ。
【００２３】
ＨＭＭＰＦＡＭでは、Ｐｆａｍという蛋白質プロファイルを集積したデータベース中にあるエントリーが有する塩基配列の特徴を、解析対象である塩基配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【００２４】
配列番号１に記載の塩基配列がコードするアミノ酸配列（配列番号２５）は、ＢＬＡＳＴサーチにより、ＡＤＡＭＴＳ１８ｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：０．０、７０８アミノ酸残基で７５％の相同性を、ｍｅｔａｌｌｏｐｒｏｔｅａｓｅｄｉｓｉｎｔｅｇｒｉｎ１６ｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｔｙｐｅＩｍｏｔｉｆとｅ−ｖａｌｕｅ：０．０、６７１アミノ酸残基で６１％の相同性を、Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｍｏｔｉｆｓ１２とｅ−ｖａｌｕｅ：５×１０^−１５２で、７０２アミノ酸残基で４２％の相同性を、さらにＡｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｍｏｔｉｆｓ１０と相同性を有する。
また、配列番号１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号４１２−１１３７がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１に示す塩基配列がコードするアミノ酸配列からなるタンパク質はｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｓであると推測される。また、このタンパク質は、文献情報（Ｇｅｎｅ２００２Ｊａｎ２３；２８３（１−２）：４９−６２）から関節炎や癌に関わることが推測される。
【００２５】
配列番号２に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＡＤＡＭＴＳ１８ｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：０．０、８０７アミノ酸残基で９０％の相同性を、ＡＤＡＭＴＳ１６とｅ−ｖａｌｕｅ：０．０、８１６アミノ酸残基で６１％の相同性を、さらにＡＤＡＭＴＳ１２とｅ−ｖａｌｕｅ：０．０、７８６アミノ酸残基で４３％の相同性を有する。
また、配列番号２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号１３５４−１９６９がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる配列）が見出される。また、塩基番号７９６−１１７２がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる塩基配列）が見出される。
これらの結果より、配列番号２に示す塩基配列がコードするアミノ酸配列からなるタンパク質はｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｓであると推測される。このタンパク質は、文献情報（Ｇｅｎｅ２００２Ｊａｎ２３；２８３（１−２）：４９−６２）から関節炎や癌に関わることが推測される。
【００２６】
配列番号３に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＰｒｏｂａｂｌｅｓｅｒｉｎｅｐｒｏｔｅａｓｅＨＴＲＡ４ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：５×１０^−１７５、４７０アミノ酸残基と６７％の相同性を、ｉｎｓｕｌｉｎ−ｌｉｋｅｇｒｏｗｔｈｆａｃｔｏｒｂｉｎｄｉｎｇｐｒｏｔｅｉｎ５ｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：５×１０^−１４７、４８５アミノ酸残基と５５％の相同性を有する。
また、配列番号３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号５５９−１１１１がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号３に示す塩基配列がコードするアミノ酸配列からなるタンパク質はセリンプロテアーゼであると推測される。
【００２７】
配列番号４に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ｍｅｔａｌｌｏｐｒｏｔｅａｓｅ／ｄｉｓｉｎｔｅｇｒｉｎとｅ−ｖａｌｕｅ：５×１０^−１５４、２９７アミノ酸残基と８５％の相同性を、ＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）とｅ−ｖａｌｕｅ：５×１０^−１５２、６４１アミノ酸残基と４３％の相同性を、さらにＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）と、ｅ−ｖａｌｕｅ：５×１０^−１５１、６４２アミノ酸残基と４３％の相同性を有する。
また、配列番号４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号５５９−１１５２がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる塩基配列）、塩基番号１９０−５２８がコードするアミノ酸配列にペプチダーゼファミリーＭ１２Ｂの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる配列）が見出される。
これらの結果より、配列番号４に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。また、このタンパク質は、文献情報（ＭｏｌＨｕｍＲｅｐｒｏｄ１９９８Ｍａｙ；４（５）：４２９−３７）から精子生成に関わることが推測される。
【００２８】
配列番号５に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ｔｒａｎｓｍｅｍｂｒａｎｅｐｒｏｔｅｉｎｔＭＤＣＩとｅ−ｖａｌｕｅ：３×１０^−１７、１１８アミノ酸残基と４３％の相同性を、ｔＭＤＣＩとｅ−ｖａｌｕｅ：６×１０^−１７、１１８アミノ酸残基と４２％の相同性を、さらにＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）とｅ−ｖａｌｕｅ：２×１０^−１６、１１３アミノ酸残基と４６％の相同性を有する。
また、配列番号５に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号１９９−４７２がコードするアミノ酸配列にペプチダーゼファミリーＭ１２Ｂの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる配列）が見出される。
これらの結果より、配列番号５に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報（ＭｏｌＨｕｍＲｅｐｒｏｄ１９９８Ｍａｙ；４（５）：４２９−３７）から精子生成に関わることが推測される。
【００２９】
配列番号６に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｓｅｑｕｅｎｃｅ１０ｆｒｏｍＰａｔｅｎｔＷＯ０１３６６４５とｅ−ｖａｌｕｅ：２×１０^−７５、２８６アミノ酸残基と４９％の相同性を、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：３×１０^−７５、２８３アミノ酸残基と４８％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：１×１０^−７２、２８２アミノ酸残基と４７％の相同性を有する。
また、配列番号６に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号１５０−８２７がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号６に示す塩基配列がコードするタンパク質は細胞の増殖や接着を制御するセリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から扁平上皮細胞癌で発現が抑制されていることが推測される。
【００３０】
配列番号７に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｓｅｑｕｅｎｃｅ１０ｆｒｏｍＰａｔｅｎｔＷＯ０１３６６４５とｅ−ｖａｌｕｅ：５×１０^−１１３、４１８アミノ酸残基と５１％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：２×１０^−９６、４１９アミノ酸残基と４２％の相同性を、さらにＡｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：６×１０^−９５、４２０アミノ酸残基と４１％の相同性を有する。
また、配列番号７に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号６５３−１３３０がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号７に示す塩基配列がコードするタンパク質はトリプシン様セリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から慢性的気管疾患患者の痰から得られ、気管での発現が顕著に高いことが推測される。
【００３１】
配列番号８に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｓｅｑｕｅｎｃｅ７ｆｒｏｍＰａｔｅｎｔＷＯ０１５７１９４とｅ−ｖａｌｕｅ：５×１０^−１０４、４１８アミノ酸残基と３７％の相同性を、ｓｅｒｉｎｅｐｒｏｔｅａｓｅＴＡＤＧ１５とｅ−ｖａｌｕｅ：５×１０^−１０３、６５０アミノ酸残基と３９％の相同性を、さらにＭｅｍｂｒａｎｅ−ｔｙｐｅｓｅｒｉｎｅｐｒｏｔｅａｓｅ１とｅ−ｖａｌｕｅ：５×１０^−１０３、６５０アミノ酸残基と３９％の相同性を有する。
また、配列番号８に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号１５２８−２２１７がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号８に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は文献情報（ＪＢｉｏｌＣｈｅｍ１９９９Ｊｕｎ２５；２７４（２６）：１８２３１−６）からヒト乳癌に関係することが推測される。
【００３２】
配列番号９に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ｈａｔｃｈｉｎｇｅｎｚｙｍｅＥＨＥ７とｅ−ｖａｌｕｅ：２×１０^−４８、２４７アミノ酸残基と４０％の相同性を、Ｈｉｇｈｃｈｏｒｉｏｌｙｔｉｃｅｎｚｙｍｅ２ｐｒｅｃｕｒｓｏｒ（Ｈａｔｃｈｉｎｇｅｎｚｙｍｅｚｉｎｃ−ｐｒｏｔｅａｓｅＨＣＥ２ｓｕｂｕｎｉｔ）とｅ−ｖａｌｕｅ：２×１０^−４２、２４６アミノ酸残基と４０％の相同性を有する。
また、配列番号９に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号４６６−１０４１がコードするアミノ酸配列にメタロプロテアーゼであるａｓｔａｃｉｎの特徴を示す配列（ＰｆａｍにＡｓｔａｃｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号９に示す塩基配列がコードするタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報（ＤｅｖＢｉｏｌ１９９２Ｏｃｔ；１５３（２）：２５０−８）からａｓｔａｃｉｎ（ｐｒｏｔｅａｓｅ）に属することが推測される。
【００３３】
配列番号１０に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄとｅ−ｖａｌｕｅ：８×１０^−６３、３４３アミノ酸残基と４７％の相同性を、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：２×１０^−３３、２８０アミノ酸残基と３６％の相同性を有する。
また、配列番号１０に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号３９２−７３９がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１０に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【００３４】
配列番号１１に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄとｅ−ｖａｌｕｅ：８×１０^−６３、３４３アミノ酸残基と４７％の相同性を、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：３×１０^−３３、２７８アミノ酸残基と３５％の相同性を有する。
また、配列番号１１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号６０４−９５１がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１１に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【００３５】
配列番号１２に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄとｅ−ｖａｌｕｅ：２×１０^−５４、２０７アミノ酸残基と５１％の相同性を、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：４×１０^−３１、２０３アミノ酸残基と３６％の相同性を有する。
また、配列番号１２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号３９８−７４５がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１２に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【００３６】
配列番号１３に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄとｅ−ｖａｌｕｅ：７×１０^−６３、３４３アミノ酸残基と４７％の相同性を、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：３×１０^−３３、２７８アミノ酸残基と３５％の相同性を有する。
また、配列番号１３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号６０３−９５０がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１３に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【００３７】
配列番号１４に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄとｅ−ｖａｌｕｅ：３×１０^−５４、２０１アミノ酸残基と５２％の相同性を、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：４×１０^−３１、２０３アミノ酸残基と３６％の相同性を有する。
また、配列番号１４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号３９２−７３９がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）が見出される。
これらの結果から、配列番号１４に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【００３８】
配列番号１５に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｓｅｑｕｅｎｃｅ５ｆｒｏｍＰａｔｅｎｔＷＯ０１５７０８１とｅ−ｖａｌｕｅ：０．０、４６９アミノ酸残基と９４％の相同性を、ＡｑｕａｌｙｓｉｎＩｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：５×１０^−４５、３５５アミノ酸残基と３４％の相同性を有する。
また、配列番号１５に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号７１４−１６０２がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列（ＰｆａｍにＰｅｐｔｉｄａｓｅ＿Ｓ８としてエントリーされる配列）が見出される。
これらの結果から、配列番号１５に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。
【００３９】
配列番号１６に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−９６、４２１アミノ酸残基と４３％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：２×１０^−８９、４１７アミノ酸残基と４０％の相同性を、さらにＡｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：１×１０^−８８、４３９アミノ酸残基に亘り４０％の相同性を有する。
また、配列番号１６に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号７９５−１４７２がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号１６に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらの文献情報等により、配列番号１６に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【００４０】
配列番号１７に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：３×１０^−９６、４２１アミノ酸残基と４３％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：３×１０^−８９、４１７アミノ酸残基と４０％の相同性を、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−８８、４３９アミノ酸残基と４０％の相同性を有する。
また、配列番号１７に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号７５５−１４３２がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号１７に示す塩基配列がコードするアミノ酸配列はセリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号１７に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【００４１】
配列番号１８に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：３×１０^−９６、４２１アミノ酸残基と４３％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：３×１０^−８９、４１７アミノ酸残基と４０％の相同性を、さらにＡｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−８８、４３９アミノ酸残基と４０％の相同性を有する。
また、配列番号１８に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号７８８−１４６５がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号１８に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また他の文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号１８に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【００４２】
配列番号１９に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：３×１０^−９６、４２１アミノ酸残基と４３％の相同性を、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：３×１０^−８９、４１７アミノ酸残基と４０％の相同性を、さらにＡｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−８８、４３９アミノ酸残基に亘り４０％の相同性を有する。
また、配列番号１９に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号６３７−１３１４がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号１９に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、他の文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号１９に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【００４３】
配列番号２０に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｓｅｑｕｅｎｃｅ１ｆｒｏｍＰａｔｅｎｔＷＯ０１７３０７４とｅ−ｖａｌｕｅ：５×１０^−１２２、４１７アミノ酸残基と５１％の相同性を、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：５×１０^−９３、４２０アミノ酸残基と４０％の相同性を、さらにａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：２×１０^−９２、４２０アミノ酸残基と３８％の相同性を有する。
また、配列番号２０に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号６２８−１３０５がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号２０に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号２０に示す塩基配列がコードするタンパク質は、さらに上皮における炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【００４４】
配列番号２１に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ｔｅｓｔｅｓ−ｓｐｅｃｉｆｉｃｐｒｏｔｅｉｎＴＳＰ５０とｅ−ｖａｌｕｅ：５×１０^−１２８、４３９アミノ酸残基と５４％の相同性を、Ｂｒａｉｎ−ｓｐｅｃｉｆｉｃｓｅｒｉｎｅｐｒｏｔｅａｓｅ４ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−３６、２８１アミノ酸残基と３３％の相同性を、さらにＭａｒａｐｓｉｎｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：１×１０^−３５、２５３アミノ酸残基と３２％の相同性を、さらにＴｅｓｔｉｓｉｎｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：９×１０^−３５、２７３アミノ酸残基と３２％の相同性を有する。
また、配列番号２１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号５２２−１２４６がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）が見出される。
これらの結果より、配列番号２１に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報（ＢｉｏｃｈｅｍＢｉｏｐｈｙｓＲｅｓＣｏｍｍｕｎ１９９８Ｎｏｖ１８；２５２（２）：３０７−１２）から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが推測される。これらのことから、配列番号２１に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであると推測される。
【００４５】
配列番号２２に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、機能未知蛋白質とｅ−ｖａｌｕｅ：０．０、３５５アミノ酸残基と９８％の相同性を、ＫＩＡＡ１２０３ｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：４×１０^−２３、１１８アミノ酸残基と５０％の相同性を、ＨｏｍｏｓａｐｉｅｎｓｄｅｕｂｉｑｕｉｔｉｎａｔｉｎｇｅｎｚｙｍｅＵｎｐＥＳとｅ−ｖａｌｕｅ：２×１０^−８、６６アミノ酸残基に亘り４８％の相同性を、さらにＵｂｉｑｕｉｔｉｎｃａｒｂｏｘｙｌ−ｔｅｒｍｉｎａｌｈｙｄｒｏｌａｓｅ４とｅ−ｖａｌｕｅ：２×１０^−８、６６アミノ酸残基と４８％の相同性を有する。
また、配列番号２２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号２−２０５がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−２としてエントリーされる配列）が見出される。
これらの結果より、配列番号２２に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報（Ｏｎｃｏｇｅｎｅ１９９５Ｊｕｎ１；１０（１１）：２１７９−８３）から、ｎｕｃｌｅａｒｕｂｉｑｕｉｔｉｎｐｒｏｔｅａｓｅであり，その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号２２に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【００４６】
配列番号２３に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、機能未知蛋白質とｅ−ｖａｌｕｅ：０．０、８２７アミノ酸残基と９９％の相同性を、ＫＩＡＡ１２０３ｐｒｏｔｅｉｎとｅ−ｖａｌｕｅ：１×１０^−６７、２３４アミノ酸残基と５５％の相同性を、さらにｕｂｉｑｕｉｔｉｎ−ｓｐｅｃｉｆｉｃｐｒｏｔｅａｓｅとｅ−ｖａｌｕｅ：８×１０^−５６、６５３アミノ酸残基と２９％の相同性を有する。
また、配列番号２３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号２４４−３３７がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−１としてエントリーされる配列）が見出される。また、塩基番号１８８５−２０７０がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−２としてエントリーされる配列）が見出される。
これらの結果より、配列番号２３に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報（Ｏｎｃｏｇｅｎｅ１９９５Ｊｕｎ１；１０（１１）：２１７９−８３）から、ｎｕｃｌｅａｒｕｂｉｑｕｉｔｉｎｐｒｏｔｅａｓｅであり，その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号２３に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【００４７】
配列番号２４に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ｃａｒｂｏｘｙｐｅｐｔｉｄａｓｅｈｏｍｏｌｏｇとｅ−ｖａｌｕｅ：１×１０^−９３、３３１アミノ酸残基と４８％の相同性を、ＣａｒｂｏｘｙｐｅｐｔｉｄａｓｅＢｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：２×１０^−９２、３２７アミノ酸残基と４８％の相同性を、さらにＣａｒｂｏｘｙｐｅｐｔｉｄａｓｅＢｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：４×１０^−９０、３３０アミノ酸残基と４６％の相同性を有する。
また、配列番号２４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと塩基番号５０９−１３５７がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列（ＰｆａｍにＺｎ＿ｃａｒｂＯｐｅｐｔとしてエントリーされる配列）が見出される。
これらの結果より、配列番号２４に示す塩基配列がコードするタンパク質はカルボキシペプチダーゼであると推測される。この蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９８８Ｎｏｖ２５；２６３（３３）：１７８３７−４５）から、膵臓に発現するカルボキシペプチダーゼであることが、また他の文献情報（ＪＢｉｏｌＣｈｅｍ１９９２Ｆｅｂ５；２６７（４）：２５７５−８１）から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが推測される。これらのことから、配列番号２４に示す塩基配列がコードするタンパク質は、さらに膵臓疾患に関わるカルボキシペプチダーゼであると推測される。
【００４８】
配列番号５７に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＨｏｍｏｓａｐｉｅｎｓｃｏｍｐｌｅｍｅｎｔＣ１ｒ−ｌｉｋｅｐｒｏｔｅｉｎａｓｅｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：１×１０^−４９、１５２アミノ酸残基に亘り６３％の一致度で、またＨｏｍｏｓａｐｉｅｎｓｃＤＮＡＦＬＪ１４０２２ｗｅａｋｌｙｓｉｍｉｌａｒｔｏＣＯＭＰＬＥＭＥＮＴＣ１ＲＣＯＭＰＯＮＥＮＴＰＲＥＣＵＲＳＯＲとｅ−ｖａｌｕｅ：１×１０^−４８、１５２アミノ酸残基に亘り６２％の一致度で、さらにＨｕｍａｎｍＲＮＡｆｏｒｃｏｍｐｌｅｍｅｎｔｃｏｍｐｏｎｅｎｔＣ１ｒとｅ−ｖａｌｕｅ：７×１０^−１８、１０３アミノ酸残基に亘り３９％の一致度でヒットする。
これらの結果より、配列番号５７に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであると推測される。
【００４９】
配列番号５８に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、Ｘ．ｌａｅｖｉｓｍＲＮＡｆｏｒｘｏｌｌｏｉｄとｅ−ｖａｌｕｅ：２×１０^−５８、４３６アミノ酸残基に亘り３０％の一致度で、またＤｏｒｓａｌ−ｖｅｎｔｒａｌｐａｔｔｅｒｎｉｎｇｔｏｌｌｏｉｄｐｒｏｔｅｉｎｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：４×１０^−５８、４４５アミノ酸残基に亘り３０％の一致度で、さらにＢｏｎｅｍｏｒｐｈｏｇｅｎｅｔｉｃｐｒｏｔｅｉｎ１ｐｒｅｃｕｒｓｏｒとｅ−ｖａｌｕｅ：７×１０^−５７、４３６アミノ酸残基に亘り３０％の一致度でヒットする。
また、配列番号６１に示すアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと配列番号６１のアミノ酸番号３０−３７０のアミノ酸配列に３箇所にわたってＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされる配列）が見出される。
これらの結果より、配列番号５８に示す塩基配列がコードするタンパク質は分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測される。
【００５０】
配列番号５９に記載の塩基配列がコードするアミノ酸配列は、ＢＬＡＳＴサーチにより、ＭｕｓｍｕｓｃｕｌｕｓＣＳＭＤ１（Ｃｓｍｄ１）とｅ−ｖａｌｕｅ：５×１０^−１０８、２５７アミノ酸残基に亘り６８％の一致度で、またＨｏｍｏｓａｐｉｅｎｓＣＵＢａｎｄｓｕｓｈｉｍｕｌｔｉｐｌｅｄｏｍａｉｎｓｐｒｏｔｅｉｎ１ｓｈｏｒｔｆｏｒｍとｅ−ｖａｌｕｅ：１×１０^−４８、１５３アミノ酸残基に亘り６７％の一致度でヒットする。
また、配列番号６２に示すアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行うと、配列番号６２のアミノ酸番号２５−３８２および２０３−２５６のアミノ酸配列にわたってＣｏｍｐｌｅｍｅｎｔｃｏｎｔｒｏｌｐｒｏｔｅｉｎ（ＣＣＰ）ｍｏｄｕｌｅｓまたはｓｈｏｒｔｃｏｎｓｅｎｓｕｓｒｅｐｅａｔｓ（ＳＣＲ）の特徴を示す配列（Ｐｆａｍにｓｕｓｈｉとしてエントリーされる配列）が見出され、アミノ酸番号８７−１９５のアミノ酸配列にＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされる配列）が見出される。これらの結果より、配列番号５９に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであると推測される。
【００５１】
本発明のＤＮＡは、翻訳配列中に塩基の欠失もしくは挿入を有した状態で取得されることがあるが、上記のような相同性検索やたんぱく質特徴検索を行った結果、該ＤＮＡの塩基配列中の欠失もしくは挿入が推測された場合には、当業者において通常用いられているライブラリースクリーニングやＰＣＲクローニング等の方法を用いて塩基の欠失もしくは挿入の無い完全長ｃＤＮＡを取得することができる。かくして得られる完全長ｃＤＮＡを用いて本発明のタンパク質を発現させ、これを機能解析に用いることができる。
【００５２】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のＤＮＡは上記の配列番号１〜２４、５７〜５９、６３または６４に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、１若しくは数個（ここで言う数個の数は特には限定されないが、例えば６０個以下、好ましくは３０個以下、より好ましくは２０個以下、さらに好ましくは１０個以下、特に好ましくは５個以下を意味する。）の塩基が欠失、置換及び／または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ等も含まれる。これらＤＮＡには前記したとおり、配列番号２５〜４８、６０〜６２、６５または６６に記載のタンパク質のアミノ酸配列において１若しくは数個のアミノ酸配列が欠失、置換及び／または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードするものが含まれる。
ここで、ストリンジェントな条件でハイブリダイズするＤＮＡとは、配列番号１〜２４、５７〜５９、６３または６４に記載の塩基配列とＢＬＡＳＴ解析で８０％以上、好ましくは９０％以上、さらに好ましくは９５％以上の相同性を有する塩基配列を含むＤＮＡ等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が４０〜７０℃、好ましくは６０〜６５℃等で反応を行い、塩濃度が１５ｍＭ〜３００ｍＭ、好ましくは１５ｍＭ〜６０ｍＭ等の洗浄液中で洗浄を行う方法に従って行うことができる。
【００５３】
さらに、本発明のＤＮＡは、上述の方法により取得されたものでも、また合成されたものでもよい。ＤＮＡの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット（宝酒造社製）や、クイックチェンジサイトダイレクテッドミュータジェネシスキット（ストラタジーン社製）等の市販キットで容易に行うことができる。
【００５４】
また、配列番号１〜２４または５７〜５９に記載の塩基配列は、マウスを由来とするものであるが、上記したｃＤＮＡライブラリーの作製法に従ってヒトのｃＤＮＡライブラリーを作製し、該ライブラリーに対して配列番号１〜２４または５７〜５９の塩基配列を有するＤＮＡ断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号１〜２４または５７〜５９に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするＤＮＡ（以下、これを「ヒトホモログＤＮＡ」と称することがある）を取得することもできる。本発明の配列番号１〜２４または５７〜５９に記載の塩基配列またはその相補配列を有するＤＮＡとストリンジェントな条件でハイブリダイズするＤＮＡには、このようなヒトホモログＤＮＡも含まれる。
【００５５】
また、インフォマティックスを利用して、ヒトホモログＤＮＡが有する塩基配列を予測し、該塩基配列を基に上記のヒトｃＤＮＡライブラリーなどからヒトホモログＤＮＡを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、（ｉ）目的とするｃＤＮＡの塩基配列をクエリーとして、ヒト等のｃＤＮＡデータベース（インフォマティックスにより予測されるｃＤＮＡデータベースを含む）に対しＢＬＡＳＴなどを用いて相同性検索を行う方法や、（ｉｉ）目的とするｃＤＮＡの塩基配列をクエリーとして、ヒト等のＥＳＴデータベースに対しＢＬＡＳＴなどを用いて相同性検索を行い、ヒットしたＥＳＴが有する配列を目的とするｃＤＮＡの塩基配列を参照して連結する方法、さらに（ｉｉｉ）目的とするｃＤＮＡの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しＢＬＡＳＴなどを用いて相同性検索を行い、目的とするｃＤＮＡの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してＧｅｎｓｃａｎ（ｈｔｔｐ：／／ｇｅｎｅｓ．ｍｉｔ．ｅｄｕ／ＧＥＮＳＣＡＮ．ｈｔｍｌ）やＳｉｍ４（ＧｅｎｏｍｅＲｅｓ．，８：９７６−７４（１９９８））等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【００５６】
マウス由来のｃＤＮＡのヒトホモログＤＮＡの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号１〜２４、５７〜５９に記載の塩基配列を有するｃＤＮＡはいずれも新規であり、上記（ｉ）の方法では、ヒトホモログＤＮＡの塩基配列を取得できないと考えられるため、（ｉｉ）あるいは（ｉｉｉ）に記載の方法などが好ましく用いられる。
【００５７】
かくして予測されたヒトホモログＤＮＡの塩基配列を基に、上記のヒトｃＤＮＡライブラリーから、配列番号１〜２４、５７〜５９に記載の塩基配列を有するＤＮＡに対するヒトホモログＤＮＡを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログＤＮＡの５’端、および３’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトｃＤＮＡライブラリーを鋳型としてＰＣＲを行う方法や、予測されたヒトホモログＤＮＡの一部の配列をプローブとして、上記ヒトｃＤＮＡライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【００５８】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログＤＮＡの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。２種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【００５９】
つまり、上記でホモログとして取得されたヒト由来のＤＮＡは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のＤＮＡがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける同一の機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【００６０】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。（ｉ）まず、本発明のｃＤＮＡの塩基配列と、取得されたヒトホモログＤＮＡの塩基配列について相同性を解析する。次に、本発明のｃＤＮＡの塩基配列をクエリーとして、ＤＤＢＪ、ＥＭＢＬ、ＧｅｎＢａｎｋなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログＤＮＡとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、（ｉｉ）取得されたヒトホモログＤＮＡの塩基配列と、対応する本発明のｃＤＮＡの塩基配列について相同性を解析する。次に、取得されたヒトホモログＤＮＡの塩基配列をクエリーとして、ＤＤＢＪ、ＥＭＢＬ、ＧｅｎＢａｎｋなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のｃＤＮＡとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記（ｉ）および（ｉｉ）を確認することにより、取得されたヒトホモログＤＮＡが、本発明のｃＤＮＡに対応するヒトオルソログＤＮＡであると同定することができる。上記（ｉ）および（ｉｉ）に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記（ｉ）および（ｉｉ）に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【００６１】
かくして取得されたヒトホモログＤＮＡ、あるいはオルソログＤＮＡの塩基配列を、ＢＬＡＳＴによる相同性検索やＨＭＭＰＦＡＭによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定および確認することができる。
さらに、取得されたヒトホモログＤＮＡの完全長ｃＤＮＡを用いて本発明のタンパク質を発現させ、これを活性の確認および機能解析等に用いることができる。
【００６２】
本発明のｃＤＮＡのヒトオルソログＤＮＡとして、例えば配列番号６３または６４に記載の塩基配列を有するＤＮＡが挙げられ、また本発明のタンパク質のヒトオルソログタンパク質として、配列番号６５または６６に記載のアミノ酸配列を有するタンパク質等が挙げられる。
【００６３】
配列番号６３に記載の塩基配列がコードするアミノ酸配列（配列番号６５）についてＨＭＭＰＦＡＭによるタンパク質特徴検索を行ったところ、アミノ酸番号９２−２８３に、Ａｓｔａｃｉｎ（ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａ）（ＰｆａｍにＡｓｔａｃｉｎとしてエントリーされるアミノ酸配列）を見出した。ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号６３に記載の塩基配列がコードするアミノ酸配列は、ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【００６４】
配列番号６４に記載の塩基配列がコードするアミノ酸配列（配列番号６６）に関して、ＢＬＡＳＴを用いて相同性検索を行ったところ、ＮＲＤＢタンパク質データベース（ＳＷＩＳＳ−ＰＲＯＴ、ＰＩＲ、ＴＲＥＭＢＬＥ、ＧＥＮＰＥＰＴ、ＰＤＢから作成された重複のないアミノ酸配列のデータベース）および特許配列のデータベース中に、配列番号６１に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号６４に記載の塩基配列がコードするアミノ酸配列は、配列番号５８に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【００６５】
配列番号６６に記載のアミノ酸配列について、ＨＭＭＰＦＡＭによるタンパク質特徴検索を行ったところ、アミノ酸番号３０−１４０、１４５−２５２、２５７−３７０にＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされるアミノ酸配列）を見出した。ＣＵＢドメインは、１１０アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質（補体系のプロテアーゼ等）に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号６６に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムｔｍＨＭＭ（Ｓ．Ｍｏｌｌｅｒ，Ｍ．Ｄ．Ｒ．Ｃｒｏｎｉｎｇ，Ｒ．Ａｐｗｅｉｌｅｒ．Ｅｖａｌｕａｔｉｏｎｏｆｍｅｔｈｏｄｓｆｏｒｔｈｅｐｒｅｄｉｃｔｉｏｎｏｆｍｅｍｂｒａｎｅｓｐａｎｎｉｎｇｒｅｇｉｏｎｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，１７（７）：６４６−６５３，２００１．）を用いて膜貫通部位を予測したところ、Ｃ末端のアミノ酸残基（アミノ酸番号５３６−５５８）に膜貫通部位が予測された。
以上のことから、配列番号６４に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の１つであることが推測された。
【００６６】
（２）新規ｃＤＮＡがコードするタンパク質
本発明のＤＮＡがコードするタンパク質の翻訳領域は、例えば、該ＤＮＡが有する塩基配列について３種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号２５〜４８、６０〜６２、６５または６６に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において１若しくは数個のアミノ酸が置換、欠失、及び／または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するものも含まれる。
【００６７】
本発明のタンパク質の取得方法としては、上記（１）に記載の本発明のＤＮＡを適当な方法により転写／翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【００６８】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したプロテアーゼ活性を有するものであれば本発明の範囲に含まれる。
【００６９】
本発明のタンパク質の産生を行う際、本発明のＤＮＡを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該ＤＮＡが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該ＤＮＡが導入される宿主に適したプロモーター等の発現制御領域ＤＮＡが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、ｐＥＴ３、ｐＥＴ１１（ストラタジーン社製）ｐＧＥＸ（アマシャムファルマシアバイオテク社製）等が挙げられ、酵母の場合ではｐＥＳＰ−Ｉエクスプレッションベクター（ストラタジーン社製）等が挙げられ、さらに昆虫細胞の場合ではＢａｃＰＡＫ６（クロンテック社製）等が用いられる。また宿主が動物細胞の場合では、ＺＡＰＥｘｐｒｅｓｓ（ストラタジーン社製）、ｐＳＶＫ３（アマシャムファルマシアバイオテク社製）等が挙げられる。
【００７０】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはＴ３、Ｔ７、ｔａｃ、ｌａｃプロモーター等を用いることができ、酵母の場合にはｎｍｔ１プロモーター、Ｇａｌ１プロモーター等を用いることができる。また宿主が動物細胞の場合にはＳＶ４０プロモーター、ＣＭＶプロモーター等が好ましく用いられる。
【００７１】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のＤＮＡの挿入は、該ＤＮＡまたはこれを含むＤＮＡ断片をベクター中のプロモーターの下流に該遺伝子ＤＮＡがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【００７２】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、ＤＮＡ導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法（Ｊ．Ｍｏｌ．Ｂｉｏｌ．，５３，１５４，（１９７０））、リン酸カルシウム法（Ｓｃｉｅｎｃｅ，２２１，５５１，（１９８３））、ＤＥＡＥデキストラン法（Ｓｃｉｅｎｃｅ，２１５，１６６，（１９８２））、インビトロパッケージング法（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，７２，５８１，（１９７５））、ウィルスベクター法（Ｃｅｌｌ，３７，１０５３，（１９８４））、および電気パルス法（Ｃｈｕ．ｅｔａｌ．，Ｎｕｃ．ＡｃｉｄｓＲｅｓ．，１５，１３３１（１９８７））等が挙げられる。
【００７３】
ＤＮＡ導入体を作製するための宿主としては、本発明のＤＮＡが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス（節足動物多角体ウイルス）−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではＢＬ２１、ＸＬ−２Ｂｌｕｅ（ストラタジーン社製）等、酵母ではＳＰ−Ｑ０１（ストラタジーン社製）等、バキュロウィルスではＡｃＮＰＶ（Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２６３，７４０６，（１９８８））とその宿主であるＳｆ−９（Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２６３，７４０６，（１９８８））等が挙げられる。また動物細胞としてはマウス繊維芽細胞Ｃ１２７（Ｊ．Ｖｉｏｌ．，２６，２９１，（１９７８））やチャイニーズハムスター卵巣細胞ＣＨＯ細胞（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，７７，４２１６，（１９８０））等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来ＣＯＳ−７（ＡＴＣＣＣＲＬ１６５１：アメリカンタイプカルチャーコレクション保存細胞）が用いられる。
【００７４】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のＤＮＡ断片を宿主微生物の染色体中に直接挿入する相同組換え技術（Ａ．Ａ．Ｖｅｒｔｅｓｅｔａｌ．，Ｂｉｏｓｃｉ．Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｃｈｅｍ．，５７，２０３６，（１９９３））、あるいはトランスポゾンや挿入配列（Ａ．Ａ．Ｖｅｒｔｅｓｅｔａｌ．，ＭｏｌｅｃｕｌａｒＭｉｃｒｏｂｉｏｌ．，１１，７３９，（１９９４））等を用いてＤＮＡ導入体を作製することもできる。
【００７５】
得られた培養物は細胞、あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および／または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記（１）で取得された本発明のＤＮＡを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、ＤＮＡからｍＲＮＡへの転写、およびｍＲＮＡからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにＤＮＡを加えることによってそのＤＮＡがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液（大腸菌Ｓ３０抽出液）に基づいて調製された転写翻訳系が挙げられる。
【００７６】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−Ｓ−トランスフェラーゼ（ＧＳＴ）、マルトース結合タンパク質等をコードするＤＮＡ領域を、前記した転写翻訳されるべきＤＮＡに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【００７７】
目的とするタンパク質の発現は、ＳＤＳ−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー（シグマ社製）等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること（プロセッシング）が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、プロテアーゼ活性を有するものであれば、本発明のタンパク質に含まれる。
かくして得られたタンパク質は、他のタンパク質、ＤＮＡとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【００７８】
（３）オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記（１）に記載の方法で取得した本発明のＤＮＡまたはその断片を用いて、ＤＮＡ合成機などを用いる常法により、本発明のＤＮＡの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【００７９】
該オリゴヌクレオチドとしては、上記ＤＮＡの有する塩基配列中の連続した５〜１００塩基と同じ配列を有するＤＮＡまたは該ＤＮＡと相補的な配列を有するＤＮＡを挙げることができる。具体例としては、配列番号１〜２４、５７〜５９、６３または６４のいずれかで表される塩基配列中の連続した５〜１００塩基と同じ配列を有するＤＮＡまたは該ＤＮＡと相補的な配列を有するＤＮＡを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度（Ｔｍ）および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には５〜１００塩基であり、好ましくは１０〜６０塩基であり、より好ましくは１５〜５０塩基である。
【００８０】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がＮ３’−Ｐ５’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがＣ−５プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがＣ−５チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがＣ−５プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン（ｐｈｅｎｏｘａｚｉｎｅ−ｍｏｄｉｆｉｅｄｃｙｔｏｓｉｎｅ）で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが２’−Ｏ−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが２’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【００８１】
また、本発明のオリゴヌクレオチドは、これを２本鎖ＲＮＡとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するＲＮＡインターフェアレンス法（以下、これを「ＲＮＡｉ法」と称することがある）に用いることができる。ＲＮＡインターフェアレンス法については、例えば、（Ｅｌｂａｓｈｉｒ，Ｓ．，ｅｔａｌ．，Ｎａｔｕｒｅ，４１１，４９４−４９８（２００１））に記載の方法等を用いることができる。また、上記２本鎖ＲＮＡは必ずしも全てがＲＮＡである必要はなく、例えば、ＷＯ０２／１０３７４号公報に記載のもの等も用いることができる。
【００８２】
ここで、標的遺伝子としては、本発明のＤＮＡであれば、如何なるものであってもよい。これらＤＮＡの少なくとも一部の塩基配列と実質的に同一な配列からなる２本鎖ＲＮＡ（以下、これを「２本鎖ポリヌクレオチド」と称することがある）とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい１５ｂｐ以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と８０％以上の相同性を有することを意味する。ヌクレオチドの鎖長は１５ｂｐから標的遺伝子のオープンリーディングフレーム（ＯＲＦ）の全長までの如何なる長さでもよいが、１５〜５００ｂｐ程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、３０ｂｐ以上の長い２本鎖ＲＮＡに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており（Ｍａｒｅｕｓ，Ｐ．Ｉ．，ｅｔａｌ．，Ｉｎｔｅｒｆｅｒｏｎ，５，１１５−１８０（１９８３））、該２本鎖ＲＮＡが細胞内に侵入すると、ＰＫＲ（ｄｓＲＮＡ−ｒｅｓｐｏｎｓｉｖｅｐｒｏｔｅｉｎｋｉｎａｓｅ：Ｂａｓｓ，Ｂ．Ｌ．，Ｎａｔｕｒｅ，４１１，４２８−４２９（２００１））を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に２’、５’ｏｌｉｇｏａｄｅｎｙｌａｔｅｓｙｎｔｈｅｔａｓｅ（Ｂａｓｓ，Ｂ．Ｌ．，Ｎａｔｕｒｅ，４１１，４２８−４２９（２００１））を介してＲｎａｓｅＬの活性化が起こり、細胞内のＲＮＡの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には１５〜３０ｂｐ、好ましくは１９〜２４ｂｐ、より好ましくは２１ｂｐの２本鎖ポリヌクレオチドを用いることが好ましい。２本鎖ポリヌクレオチドはその全体が２本鎖である必要はなく、５’、または３’末端が一部突出したものも含むが、３’末端が一部突出したものを用いることが好ましい。２本鎖ポリヌクレオチドは相補性を有する２本鎖のポリヌクレオチドを意味するが、自己相補性を有する１本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する１本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【００８３】
２本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する１本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより２本鎖とすることができる。会合の方法として具体的には、例えば、合成した１本鎖ポリヌクレオチドを混合し、２本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した２本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する１本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【００８４】
このようにして調製した２本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でＲＮＡに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａ）、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【００８５】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【００８６】
被導入体への２本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、２本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口（皮下、筋肉内及び静脈内投与を含む）、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、２本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、２本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【００８７】
導入する２本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも１コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により２本鎖ポリヌクレオチドを導入する場合、０．１〜１０００ｎＭが好ましい。
ＲＮＡインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【００８８】
（４）本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ（抗原決定基）として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばＥｐｉｔｏｐｅＡｄｖｉｓｅｒ（富士通九州システムエンジニアリング社製）等の市販のソフトウェアを用いることができる。
【００８９】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【００９０】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばＢＡＬＢ／ｃマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合０．３〜０．５ｍｇ／１回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【００９１】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法（以下、これを「ＥＬＩＳＡ法」と称することがある）やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【００９２】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる（Ｍｉｌｓｔｅｉｎ，ｅｔａｌ．，Ｎａｔｕｒｅ，２５６，４９５（１９７５））ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【００９３】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば８−アザグアニン耐性マウス（ＢＡＬＢ／ｃ由来等）ミエローマ細胞株であるＰ３Ｘ６３−Ａｇ８．６５３（ＡＴＣＣ：ＣＲＬ−１５８０）、Ｐ３−ＮＳ１／１Ａｇ４．１（理研セルバンク：ＲＣＢ００９５）等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばＲＰＭＩ１６４０やイスコフ改変ダルベッコ培地（ＩＭＤＭ）、あるいはダルベッコ改変イーグル培地（ＤＭＥＭ）等に、５０％ポリエチレングリコール（ＰＥＧ）を溶解したもの等を用いることにより行うことができる。また電気融合法（Ｕ．Ｚｉｍｍｅｒ− ｍａｎｎ．ｅｔａｌ．，Ｎａｔｕｒｗｉｓｓｅｎｓｃｈａｆｔｅｎ，６８，５７７（１９８１））によっても行うことができる。
【００９４】
ハイブリドーマは、用いたミエローマ細胞株が８−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン（ＨＡＴ）液を含む正常培地（ＨＡＴ培地）中で５％ＣＯ_２、３７℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【００９５】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したＳｅｖｅｒｅｃｏｍｂｉｎｅｄｉｍｍｕｎｅｄｅｆｉｃｉｅｎｃｙ（ＳＣＩＤ）マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる（Ｍｏｓｉｅｒ，Ｄ．Ｅ．，ｅｔａｌ．Ｎａｔｕｒｅ，３３５，２５６−２５９（１９８８）；Ｄｕｃｈｏｓａｌ，Ｍ．Ａ．，ｅｔａｌ．，Ｎａｔｕｒｅ，３５５，２５８−２６２（１９９２））。
【００９６】
また、取得したヒト型抗体を産生するハイブリドーマからＲＮＡを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてＦａｂ部分とＦｃ部分を切断し、アフィニティカラム等を用いてＦａｂ部分を回収することによって作製することができる。
【００９７】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するプロテアーゼ活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記（２）で作製したＤＮＡ導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【００９８】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、１〜９０重量％の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【００９９】
（５）本発明のタンパク質が有する活性の確認および機能の解析
本発明のタンパク質は、これを上記（２）に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記（１）で推測した活性を有していることを確認することができる。さらに上記（４）のとおりに作製した抗体等との組み合わせにより解析することもできる。
本発明のタンパク質が、プロテアーゼ活性を有することは、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる活性測定方法により解析することができる。
【０１００】
具体的には、プロテアーゼ活性の測定に用いられる反応液としては、トリプシン、キモトリプシン、エラスターゼ等が属するセリンプロテアーゼに関しては中性から弱塩基性の緩衝液、パパイン、カテプシン等が属するシステインプロテアーゼには中性から弱酸性の緩衝液、ペプシン、キモシン等が属するアスパラギン酸プロテアーゼには酸性溶液、カルボキシペプチダーゼＡ、Ｂ、サーモリシン等が属する金属プロテアーゼには中性緩衝液が用いられ、Ｃａ^２＋、Ｚｎ^２＋等の金属イオンが要求される場合は、これらを添加する。
【０１０１】
基質としては、種々のペプチドおよびタンパク質が用いられる。ペプチドを用いる場合、ペプチド結合が加水分解された際に７−ａｍｉｎｏ−４−ｍｅｔｈｙｌ−ｃｏｕｍａｒｉｎ或いはｐ−ｎｉｔｒｏａｎｉｌｉｎｅが遊離するように、切断アミノ酸残基のカルボキシル末端側に４−ｍｅｔｈｏ−ｃｏｕｍａｒｙｌ−７−ａｍｉｄｅ基およびｐ−ｎｉｔｒｏａｎｉｌｉｄｅ基を結合した基質を設計しておけば、前者は蛍光で、後者は可視での分光的測定が可能である。タンパク質基質を用いる場合は、基質タンパク質或いはウシ血清アルブミン、カゼイン等の多くのプロテアーゼ基質となり得るタンパク質に酵素を作用させ、切断の有無を電気泳動法或いはクロマトグラフィーによって確認する。
【０１０２】
本発明のタンパク質であるプロテアーゼが有する活性は、上記の通り確認することができるが、これらの方法に限定されるものではない。また、これらの活性測定系は、後述する本発明のタンパク質の機能賦活物質（アゴニストなど）や機能阻害物質（アンタゴニストなど）のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【０１０３】
また、本発明のタンパク質の機能解析の方法として一般的には、例えば、（ｉ）各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、（ｉｉ）他のタンパク質、ＤＮＡとの相互作用を解析する方法、（ｉｉｉ）適当な細胞あるいは個体へ導入して表現型の変化を解析する方法、（ｉｖ）適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。また、このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【０１０４】
（ｉ）の方法においては、本発明のタンパク質の発現を、ｍＲＮＡレベルあるいはタンパク質レベルで解析することができる。ｍＲＮＡレベルで発現量を解析する場合は、例えば、ｉｎｓｉｔｕハイブリダイゼーション法（Ｉｎｓｉｔｕｈｙｂｒｉｄｉｚａｔｉｏｎ：ＡｐｐｌｉｃａｔｉｏｎｔｏＤｅｖｅｌｏｐｍｅｎｔａｌＢｉｏｌｏｇｙ＆Ｍｅｄｉｃｉｎｅ．，Ｅｄ．ｂｙＨａｒｒｉｓ，Ｎ．ａｎｄＷｉｌｋｉｎｓｏｎ，Ｄ．Ｇ．，ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ（１９９０））、ＤＮＡチップを利用したハイブリダイゼーション法、定量ＰＣＲ法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ＥＬＩＳＡ法、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質に公知のバリアントが存在する場合には、解析対象タンパク質をコードするｃＤＮＡにのみ存在し、公知のバリアントをコードするｃＤＮＡとはハイブリダイズしないプローブを用いることが好ましい。定量ＰＣＲ法の場合には、対象ｃＤＮＡと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法（Ｗｏｎｇ，Ｙ．，ＮｅｕｒｏｓｃｉｅｎｃｅＬｅｔ．，３２０：１４１−１４５（２００２））等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【０１０５】
（ｉｉ）の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【０１０６】
（ｉｉｉ）の方法では、本発明のｃＤＮＡを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。ＤＮＡの細胞への導入法としては、上記（２）に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、対象タンパク質に公知のバリアントが存在する場合には、公知のものも同様に細胞へ導入し、比較解析することにより、対象タンパク質が関連する表現型を同定することができる。また、本発明のタンパク質は酵素活性またはタンパク質分解酵素阻害活性を有するものであることがわかっているので、これらの酵素またはタンパク質分解酵素阻害タンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【０１０７】
（ｉｖ）の方法では、上記（３）に記載したオリゴヌクレオチドを用いた方法や、ＲＮＡインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に、公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【０１０８】
（６）本発明のタンパク質が有する活性を調節する物質のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能（活性）を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質（以下、これを「調節物質」と称することがある）を得ることができる。
【０１０９】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まず本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する機能（プロテアーゼ活性）の変化を指標として被検物質を選抜する方法を用いることができる。
【０１１０】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質との相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記（４）に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【０１１１】
プロテアーゼ活性の変化の解析は、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。具体的には、上記（５）に記載の方法等を用いて行うことができる。
前記の通り、本発明のプロテアーゼ活性を有するタンパク質は、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、上記スクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、関節炎などの炎症性疾患、免疫性疾患、肺癌、膵臓癌、卵巣癌、扁平上皮癌、網膜芽腫などの癌、運動統合機能障害、神経変性疾患、脊髄小脳変性症などの中枢性疾患、糖尿病や肥満などの内分泌疾患、喘息などの呼吸器系疾患、骨粗鬆症、不妊症などの治療薬や避妊薬として用いることができる。
【０１１２】
ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のＤＮＡ、あるいは組み換えタンパク質については、上記したヒトホモログＤＮＡあるいはヒトホモログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【０１１３】
かかるプロテアーゼ活性の調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、１〜９０重量％の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【０１１４】
（７）本発明のＤＮＡの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするｍＲＮＡの発現量を解析する方法等が挙げられる。具体的には、例えば、上記（２）に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をＥＬＩＳＡ等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするｍＲＮＡ量を、定量的逆転写ＰＣＲ法や、ノーザンブロット法等により解析することにより行うことができる。
【０１１５】
被検物質としては、上記（６）に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはｍＲＮＡ量と比べてその量が増加すれば、物質は本発明のＤＮＡの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のＤＮＡの発現阻害物質として用いられ得ると判断することができる。
【０１１６】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、１〜９０重量％の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【０１１７】
（８）本発明のＤＮＡ導入動物
上記（１）に記載の、本発明のＤＮＡを含む導入ＤＮＡを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のＤＮＡが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後１日目の卵管から受精卵を摘出し、該受精卵に導入ＤＮＡをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体（仮親）の子宮に移植して出産させる。新生仔に目的のＤＮＡが導入されているか否かは、該個体の細胞から抽出したＤＮＡのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【０１１８】
かくして得られた本発明のＤＮＡ導入動物は、この個体を交配し、導入されたＤＮＡが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のＤＮＡが導入された非ヒト哺乳動物は、本発明のＤＮＡの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【０１１９】
（９）本発明のタンパク質及びそれをコードする塩基配列を含むＤＮＡの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列を有するＤＮＡ及びその部分断片は、それらを基盤上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「ＤＮＡチップ」または「ＤＮＡアレイ」（ＤＮＡマイクロアレイ及びＤＮＡマクロアレイ）と称することがある。これらのプロテインチップ、又はＤＮＡチップもしくはアレイには、本発明のタンパク質やＤＮＡ以外に、他のタンパク質やＤＮＡが含まれていてもよい。
【０１２０】
ここで、タンパク質やＤＮＡを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非ＲＩ的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはＤＮＡの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、ＤＮＡチップ、あるいはＤＮＡアレイも、本発明の範囲に含まれる。
【０１２１】
また、本発明のタンパク質のアミノ酸配列及びＤＮＡの塩基配列は、配列情報としても用いることができる。このＤＮＡの塩基配列には、対応するＲＮＡの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするＤＮＡの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、ＣＤ−ＲＯＭ、ＭＯ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＡＭ等の光ディスク、半導体メモリ等を挙げることができる。
【０１２２】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例１ｃＤＮＡライブラリーの調製
（１）ｍＲＮＡの調製
ｍＲＮＡ調製マウス（Ｃ５７ＢＬ／６）各器官または組織０．５〜１ｇを１０ｍｌの懸濁液でホモジェナイズし、ｐＨ４．０の２Ｍ酢酸ナトリウム１ｍｌと、同量のフェノール／クロロホルム（体積比５：１）混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、ＲＮＡが水相から分離沈澱した。この試料を氷の上で１時間インキュベーションした後、１５分間４，０００ｒｐｍで冷却遠心機にかけ、沈澱物を回収した。この検体を７０％エタノールで洗い、８ｍｌの水に溶解後２ｍｌの５ＭＮａＣｌ、１％ＣＴＡＢ（ｃｅｔｙｌｔｒｉｍｅｔｈｙ− ｌａｍｍｏｎｉｕｍｂｒｏｍｉｄｅ）、４Ｍ尿素、５０ｍＭＴｒｉｓを含むｐＨ７．０の水溶液１６ｍｌを加えることでＲＮＡを沈澱させ、ポリサッカライドを除いた（ＣＴＡＢ沈澱）。
【０１２３】
続いて室温で４，０００ｒｐｍ、１５分間遠心機にかけ、ＲＮＡを４ｍｌの７Ｍグアニジン−Ｃｌに溶解した。そして２倍量のエタノールを加えた後、氷上で１時間インキュベーションし、４，０００ｒｐｍ、１５分間遠心機にかけ、生じた沈澱物を７０％エタノールで洗いＲＮＡを回収した、これを再度水に溶解し、ＲＮＡの純度をＯＤ比２６０／２８０（＞１．８）と２３０／２６０（＜０．４５）を読むことによって計測した。
【０１２４】
（２）第１鎖ｃＤＮＡの調製
上記（１）で調製したｍＲＮＡ１５μｇを使って逆転写酵素３，０００ｕｎｉｔにより、最終容量１６５μｌの反応液中で、５−メチル−ｄＣＴＰ、ｄＡＴＰ、ｄＴＴＰ、ｄＧＴＰを各々０．５４ｍＭ、０．６Ｍトレハロース、５０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ８．３）、７５ｍＭＫＣｌ、３ｍＭＭｇＣｌ２、１０ｍＭＤＴＴ、５２ｎｇ／μｌＢＳＡ、ＲＮａｓｅインヒビター５ｕｎｉｔの条件下で逆転写反応を行った。制限酵素ＸｈｏＩの認識配列を含むオリゴヌクレオチド（配列番号４９）（配列中、ＶはＡ，Ｇ又はＣを示し、ＮはＡ，Ｇ，Ｃ又はＴを示す）１２．６μｌをプライマーとして用いた。
【０１２５】
この反応を始める際、反応液の１／４を採取し、それに１．５μｌの［α−^３２Ｐ］−ｄＧＴＰ（３０００Ｃｉ／ｍｍｏｌ、１０μＣｉ／μｌ；Ａｍｅｒｓｈａｍ社製）を加えるこことにより、第１鎖ｃＤＮＡの合成効率を測定した。ＲＩ標識した反応液の０．５μｌをＤＥ−８１ペーパー上にスポットし、０．５Ｍリン酸ナトリウム緩衝液（ｐＨ７．０）で３回洗った前後のＲＩ活性を測定し、計算した。その後、ＲＩ標識した反応液と非標識の反応液を混合し、０．５ＭＥＤＴＡ８μｌ、１０％ＳＤＳ２μｌ、プロテイナーゼ（Ｐｒｏｔｅｉｎａｓｅ）Ｋ２０μｇを加え、４５℃で１５分間加熱した。フェノール／クロロホルムによる抽出、エタノール沈澱後、沈澱をＲＮａｓｅフリーに処理してある水（以下ＲＮａｓｅフリー水とする）４７μｌに溶解した。
【０１２６】
（３）５’キャップ構造及び３’末端へのビオチン付加
ＲＮＡジオールのビオチン化ＲＮＡのジオール部位（Ｃａｐ構造のある５’末端と、ポリＡ鎖のある３’末端のリボースの双方に存在）にビオチンを結合させるために、２段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化ＲＮＡ体のカップリング反応である。まず、逆転写反応で得られたＲＮＡ−第１鎖ｃＤＮＡ複合体１５μｇを、６．６ｍＭ酢酸ナトリウム緩衝液（ｐＨ４．５）と、酸化剤として過ヨウ素酸ナトリウムを用いて５０μｌの反応液中で処理した。この酸化反応は遮光条件の下、氷上で４５分間行った。
【０１２７】
続いて、５Ｍ塩化ナトリウム１１μｌ、１０％ＳＤＳ０．５μｌ、そして同量のイソプロパノールを加え、６０分間氷上に放置した後、４℃で１５分間１５，０００ｒｐｍ遠心し沈澱を取得した。沈澱物は７０％エタノールで洗い、ＲＮａｓｅフリー水５０μｌに再溶解させた。その試料に１Ｍ酢酸ナトリウム（ｐＨ６．１）５μｌ、１０％ＳＤＳ５μｌ、１０ｍＭビオチンヒドラジド（Ｓｉｇｍａ社製）１５０μｌを加え、室温（２２〜２６℃）で終夜反応させた。最後に、５μｌの５ＭＮａＣｌ、１Ｍ酢酸ナトリウム（ｐＨ６．１）７５μｌ、及び２．５倍量のエタノールを加え、１時間の氷上冷却後、４℃において１５分間遠心し、ビオチン化した。反応後、反応液を１５分間遠心し、再度ＲＮＡ−ＤＮＡ複合体を沈澱させた。沈澱物は７０％エタノールで１回、更に８０％エタノールで１回洗い、ＲＮａｓｅフリー水７０μｌに溶解した。
【０１２８】
（４）ＲＮａｓｅＩによる完全長ｃＤＮＡの選択
上記（３）で取得したビオチン化ＲＮＡ−ＤＮＡ複合体について、１本鎖ＲＮＡを消化するＲＮａｓｅＩで処理することにより、逆転写反応時に完全なｃＤＮＡの伸長が得られなかったｍＲＮＡ、およびｍＲＮＡの３’末端に標識されたビオチン残基を取り除いた。具体的には、上記（３）で得られた試料７０μｌに１０×ＲＮａｓｅＩバッファー（１００ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．５）、５０ｍＭＥＤＴＡ、２ＭＮａＯＡｃ）１０μｌ、ＲＮａｓｅＩ（ＲＮａｓｅＯｎｅ^ＴＭ；Ｐｒｏｍｅｇａ社製）２００ｕｎｉｔを加えて、３７℃で１５分間１本鎖ＲＮＡを消化した。
【０１２９】
（５）完全長ｃＤＮＡの採取
ストレプトアビジンコートしたマグネティックビーズにｃＤＮＡが非特異的吸着するのを防止するため、１００μｇの酵母ｔＲＮＡ（ＤＮａｓｅＩ処理したもの）を５ｍｇ（５００μｌ）のマグネティックビーズ（ｍａｇｎｅｔｉｃｐｏｒｏｕｓｇｌａｓｓ（ＭＰＧ）ｐａｒｔｉｃｌｅｓｃｏａｔｅｄｗｉｔｈｓｔｒｅｐｔａｖｉｄｉｎ（ＣＰＧ，ＮＪ））に加え、１時間氷上に放置した後、５０ｍＭＥＤＴＡ、２ＭＮａＣｌの溶液にて洗った。
このビーズを５０ｍＭＥＤＴＡ、２ＭＮａＣｌの溶液５００μｌ中に懸濁し、（４）で取得したＲＮａｓｅＩ処理を施されたｃＤＮＡを加えた。室温にて３０分間撹拌することで、マグネティックビーズと完全長ｃＤＮＡを結合させた。完全長ｃＤＮＡを捕獲したビーズを５０ｍＭＥＤＴＡ、２ＭＮａＣｌの溶液で４回、０．４％ＳＤＳ、５０μｇ／μｌ酵母ｔＲＮＡで１回、１０ｍＭＮａＣｌ、０．２ｍＭＥＤＴＡ、１０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．５）、２０％グリセロールで１回、５０μｇ／μｌ酵母ｔＲＮＡ水溶液で１回、ＲＮａｓｅＨバッファー（２０ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ７．５）、１０ｍＭＭｇＣｌ_２、２０ｍＭＫＣｌ、０．１ｍＭＥＤＴＡ、０．１ｍＭジチオスレイトール（ＤＴＴ）で１回洗浄した後、ＲＮａｓｅＨ用バッファー１００μｌに懸濁し、ＲＮａｓｅＨ３ｕｎｉｔを加え、３７℃下３０分間加温した。その後、１０％ＳＤＳ１μｌ、０．５ＭＥＤＴＡ２μｌを加えて、１０分間、６５℃に曝し、その上清を回収した。
このようにして回収された１本鎖完全長ｃＤＮＡはフェノール／クロロホルムで抽出され、スピードバッグにて液量を１００μｌ以下に減じてからＧ２５／Ｇ１００Ｓｅｐｈａｄｅｘクロマトグラフィーに付した。ＲＩ活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン２μｇを加え、エタノール沈澱にて得られた沈澱物を３０μｌの超純水に溶解した。
【０１３０】
（６）１本鎖ｃＤＮＡへのオリゴｄＧ付加
上記（５）で回収された１本鎖ｃＤＮＡ３０μｌは、最終容量５０μｌの反応液中で、２００ｍＭカコジル酸ナトリウム（ｐＨ６．９）、１ｍＭＭｇＣｌ_２、１ｍＭＣｏＣｌ_２、１ｍＭ２−メルカプトエタノール、１００μＭｄＧＴＰの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ（ＴａＫａＲａ社製）３２ｕｎｉｔを用いて３７℃で３０分間のオリゴｄＧ付加反応に付した。反応終了時にＥＤＴＡを５０ｍＭとなるように加え、一連のフェノール／クロロホルムによる抽出、エタノール沈澱を経て、３１μｌの超純水に溶解した。
【０１３１】
（７）第２鎖ｃＤＮＡ合成
第１鎖ｃＤＮＡを鋳型にした第２鎖ｃＤＮＡの合成は以下のように行った。最終容量６０μｌの反応系で、第２鎖低バッファー（２００ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ８．７５）、１００ｍＭＫＣｌ、１００ｍＭ（ＮＨ_４）_２ＳＯ_４、２０ｍＭＭｇＳＯ_４、１％ＴｒｉｔｏｎＸ−１００、１ｍｇ／μｌＢＳＡ）３μｌ、第２鎖高バッファー（２００ｍＭＴｒｉｓ−ＨＣｌ（ｐＨ９．２）、６００ｍＭＫＣｌ、２０ｍＭＭｇＣｌ_２）３μｌ、ｄＣＴＰ、ｄＡＴＰ、ｄＴＴＰ、ｄＧＴＰ各々０．２５ｍＭ、β−ＮＡＤＨ６μｌ、オリゴｄＧ付加された第１鎖ｃＤＮＡ３１μｌ、第２鎖プライマー−アダプター（配列番号５０）６００ｎｇを加え、ＥｘＴａｑＤＮＡポリメラーゼ（ＴａＫａＲａＥｘＴａｑ；ＴａＫａＲａ社製）１５ｕｎｉｔ、耐熱性ＤＮＡリガーゼ（Ａｍｐｌｉｇａｓｅ；Ｅｐｉｃｅｎｔｒｅ社製）１５０ｕｎｉｔ、耐熱性ＲＮａｓｅＨ（Ｈｙｂｒｉｄａｓｅ；Ｅｐｉｃｅｎｔｒｅ社製）３ｕｎｉｔによって第２鎖ｃＤＮＡを合成した。
【０１３２】
０．５ＭＥＤＴＡを１μｌ加えることで反応を停止させ、更に蛋白成分を溶解するために、１０％ＳＤＳ１μｌ、プロテイナーゼ（Ｐｒｏｔｅｉｎａｓｅ）Ｋ１０μｇの存在下に４５℃で１５分間加熱し、最終的にフェノール／クロロホルムによる抽出、エタノール沈澱にて精製した２本鎖完全長ｃＤＮＡを得た。
【０１３３】
（８）ライブラリーの調製
以上の方法により得られた二本鎖完全長ｃＤＮＡは、λＺＡＰＩＩＩベクターに挿入し、ライブラリーとして回収した。λＺＡＰＩＩＩベクターはλＺＡＰＩＩ（ＳＴＲＡＴＡＧＥＮＥ社製）ベクターのマルチクローニングサイトの一部の配列配列番号５１を配列番号５２に改変し、二つのＳｆｉＩサイトを新たに導入したものである。
【０１３４】
さらにλＰＳ（ＲＩＫＥＮ）ベクターを作製し、ｃＤＮＡを挿入した。λＰＳ（ＲＩＫＥＮ）（λ−ＦＬＣ−１と命名（ＦＬＣとはＦＵＬＬ−ＬＥＮＧＴＨｃＤＮＡを意味する））とは、ＭｏＢｉＴｅｃ社（ドイツ）のλＰＳベクターをｃＤＮＡ用に改変したものである。即ち１０ｋｂｐｓｔｕｆｆｅｒの両側に存在するクローニングサイトにｃＤＮＡ挿入に便利なＢａｍＨＩならびにＳａｌＩを各々導入するとともに、０．５ｋｂから１３ｋｂ程度までのｃＤＮＡがクローニングできるようにＸｂａＩサイトに６ｋｂのＤＮＡ断片を挿入したものである（特開２０００−３２５０８０号公報）。このλ−ＦＬＣ−１を用いると、例えば肺臓ｃＤＮＡライブラリーの場合には、インサートの平均鎖長は２．５７ｋｂとなり、実際に０．５ｋｂから１２ｋｂまでのインサートをクローニングすることが出来た。従来法のλＺＡＰの場合には、インサートの平均鎖長は０．９７ｋｂであったことから、λ−ＦＬＣ−１を用いることによって、サイズの大きなｃＤＮＡもλＺＡＰに比べて効率よくクローニングできることがわかる。
【０１３５】
実施例２完全長ｃＤＮＡライブラリーのノーマライゼーション／サブトラクション
（１）ドライバーの調製
実施例１（１）で作製したｍＲＮＡ（以下、これを「（ａ）ＲＮＡドライバー」と称することがある）、及びｉｎｖｉｔｒｏ転写反応で作成したＲＮＡをドライバーとして用いた。後者のＲＮＡはさらに２種類（以下、これを「（ｂ）ＲＮＡドライバー、及び「（ｃ）ＲＮＡドライバー」と称する）に分けられる。１つはノーマライゼーションにより除かれたＲＮＡ−ｃＤＮＡからｃＤＮＡを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後１つの出発材料あたり１０００から２０００プラークを混ぜ合わせて１つのライブラリー（ミニライブラリー）とし、常法によりプラスミドＤＮＡに変換する（ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドＤＮＡを得る）。
【０１３６】
得られたＤＮＡについてｉｎｖｉｔｒｏ転写反応（Ｔ３ＲＮＡポリメラーゼまたはＴ７ＲＮＡポリメラーゼを用いる）を行い、ＤＮａｓｅＩ（ＲＱ１−ＲＮａｓｅｆｒｅｅ；Ｐｒｏｍｅｇａ社製）、ＰｒｏｔｅｉｎａｓｅＫ処理後、フェノール／クロロホルム抽出をしてＲＮＡ（ｂ）ＲＮＡドライバーを得た。この際、通常出発材料としては９種類（すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃）の組織からそれぞれミニライブラリーを作成して、９種類のミニライブラリーを混合してＲＮＡを得る。もう一つのＲＮＡはすでに重複のないクローンとして保存されているライブラリー（クローン数約２万個）を培養し、得られたＤＮＡについて（ｂ）ＲＮＡドライバーと同様にｉｎｖｉｔｒｏ転写反応を行い（ｃ）ＲＮＡドライバーとした。
【０１３７】
これら３種のＲＮＡは、Ｌａｂｅｌ−ＩＴＢｉｏｔｉｎＬａｂｅｌｉｎｇＫｉｔ（ＭｉｒｕｓＣｏｒｐｏｒａｔｉｏｎ製）を用いてビオチン化標識を行ったあと、１：１：１の割合でテスターｃＤＮＡに添加し、Ｒｏｔ１０での反応（４２℃）を行い、ストレプトアビジンビーズ（ＣＰＧ）処理を行って回収した上清について、第２鎖の合成を行った。
【０１３８】
実施例３完全長ｃＤＮＡクローンの塩基配列決定
（１）クローンのｒｅａｒｒａｙ
各クラスタからひとつの代表クローンを選んだ。代表クローンはＱ−ｂｏｔ（ＧＥＮＥＴＩＸＬＩＭＩＴＥＤ製）で選択し、３８４穴プレートにａｒｒａｙ化した。その際、大腸菌は３０℃で１８〜２４時間、５０μｌのＬＢ培地で培養した。このとき、ｃＤＮＡライブラリーがＰＳベクターに導入され大腸菌ＤＨ１０Ｂを形質転換している場合には１００ｍｇ／ｍｌのアンピシリン及び５０ｍｇ／ｍｌのカナマイシンを添加し、Ｚａｐベクターに導入し、ＳＯＬＲシステムに導入している場合には１００ｍｇ／ｍｌのアンピシリン及び２５ｍｇ／ｍｌのストレプトアビジンを添加して行った。
【０１３９】
（２）プラスミドの抽出とＩｎｓＳｉｚｉｎｇ
上記（１）で培養した各クローンは、さらに１００ｍｇ／ｍｌのアンピシリンを含む１．３ｍｌのＨＴ液中で培養され、遠心分離により菌体を回収した後、ＱＩＡｐｒｅｐ９６Ｔｕｒｂｏ（ＱＩＡＧＥＮ社製）を用いてプラスミドＤＮＡを回収、精製した。取得されたプラスミド中に挿入されているｃＤＮＡの鎖長を調べるために、上記で取得したプラスミドＤＮＡの１／３０を制限酵素ＰｙｕＩＩで消化し、１％のａｇａｒｏｓｅゲル電気泳動を行った。
【０１４０】
（３）配列決定
かくして取得されたプラスミド中に挿入された完全長ｃＤＮＡの全長の塩基配列解析には、３種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが２．５ｋｂより短いものと長いものの２つのカテゴリに分けた。このうち２．５ｋｂより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがＰＳの場合には配列番号５３（センス鎖）、及び５４（アンチセンス鎖）に記載のプライマーを用いて、またベクターがＺａｐの場合には配列番号５５（センス鎖）、及び５６（アンチセンス鎖）に記載のプライマーを用いてＴｈｅｒｍｏｓｅｑｕｅｎａｓｅＰｒｉｍｅｒＣｙｃｌｅＳｅｑｕｅｎｃｉｎｇＫｉｔ（ＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａＢｉｏｔｅｃｈ社製）で反応し、ＬｉｃｏｒＤＮＡ４２００（ｌｏｎｇｒｅａｄｓｅｑｕｅｎｃｅｒ）を用いて解析した。
【０１４１】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ＡＢＩＰｒｉｓｍ３７７及び／またはＡＢＩＰｒｉｓｍ３７００（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓＩｎｃ．製）とＢｉｇＤｙｅｔｅｒｍｉｎａｔｏｒｋｉｔとＣｙｃｌｅＳｅｑｕｅｎｃｉｎｇＦＳｒｅａｄｙＲｅａｃｔｉｏｎＫｉｔ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓＩｎｃ．製）を用いた。
【０１４２】
また、挿入されているｃＤＮＡが２．５ｋｂより長いクローンの配列決定は、ショットガン法によった。その際、ＳｈｉｍａｄｚｕＲＩＳＡ３８４とＤＹＥｎａｍｉｃＥＴｔｅｒｍｉｎａｔｏｒｃｙｃｌｅｓｅｑｕｅｎｃｉｎｇｋｉｔ（ＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａＢｉｏｔｅｃｈ社製）を用いた。ショットガンライブラリを作製するために、４８の独立な代表クローンからＰＣＲで増殖した４８のＤＮＡフラグメントを用いた。増幅されたＤＮＡ断片の末端をＴ４ＤＮＡポリメラーゼによって平滑化した。
このＤＮＡ断片を、ｐＵＣ１８ベクターへ挿入し、更に該組み換えベクターにより大腸菌ＤＨ１０Ｂを形質転換した。この大腸菌から上記（２）と同様にしてプラスミドを調製した。
【０１４３】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、ＤｏｕｂｌｅＳｔｒｏｋｅＳｈｅａｒｉｎｇＤｅｖｉｃｅ（ＦｉｏｒｅＩｎｃ．製）によるｓｈｅａｒｉｎｇを行った。ショットガン法による塩基配列決定は、１２〜１５クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【０１４４】
実施例４各完全長ｃＤＮＡクローンの塩基配列の解析
実施例３で決定した完全長ｃＤＮＡクローンの全塩基配列について、ＢＬＡＳＴによる相同性検索や、ＨＭＭＰＦＡＭによるタンパク質特徴検索を行い、各完全長ｃＤＮＡクローンがコードするタンパク質の機能を推定した。
【０１４５】
（１）ｄｎａｆｏｒｍ３７９０１（配列番号１、２５）
ｄｎａｆｏｒｍ３７９０１は、配列番号１に示すように、４５９３塩基から成り、そのうち塩基番号１５３１から２６３１までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、３６６アミノ酸残基から成る（配列番号２５）。配列番号１がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＪ３１１９０３、ＡＤＡＭＴＳ１８ｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：０．０で、また７０８アミノ酸残基に亘り７５％の一致度で、また（ｉｉ）データベース登録記号ＡＪ３１５７３４、ｍｅｔａｌｌｏｐｒｏｔｅａｓｅｄｉｓｉｎｔｅｇｒｉｎ１６ｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｔｙｐｅＩｍｏｔｉｆが、ｅ−ｖａｌｕｅ：０．０で、６７１アミノ酸残基に亘り６１％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｐ５８３９７、Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｍｏｔｉｆｓ１２が、ｅ−ｖａｌｕｅ：５×１０^−１５２で、７０２アミノ酸残基に亘り４２％の一致度で、（ｉｖ）データベース登録記号Ｑ９Ｈ３２４、Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｗｉｔｈｔｈｒｏｍｂｏｓｐｏｎｄｉｎｍｏｔｉｆｓ１０がヒットした。これらの結果より配列番号２５に示したアミノ酸配列からなるタンパク質はｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｓであることが推測された。
また、上記のタンパク質は、文献情報（Ｇｅｎｅ２００２Ｊａｎ２３；２８３（１−２）：４９−６２）から関節炎や癌に関わることが知られている。
また、配列番号１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１の塩基番号４１２−１１３７がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号１に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【０１４６】
（２）ｄｎａｆｏｒｍ４６３５０（配列番号２、２６）
ｄｎａｆｏｒｍ４６３５０は、配列番号２に示すように、４３３５塩基から成り、そのうち塩基番号９９２から４２７０までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、１０９２アミノ酸残基から成る（配列番号２６）。配列番号２がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＪ３１１９０３、ＡＤＡＭＴＳ１８ｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：０．０で、また８０７アミノ酸残基に亘り９０％の一致度で、また（ｉｉ）データベース登録記号ＡＪ３１５７３４、ＡＤＡＭＴＳ１６が、ｅ−ｖａｌｕｅ：０．０で、８１６アミノ酸残基に亘り６１％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｐ５８３９７、ＡＤＡＭＴＳ１２が、ｅ−ｖａｌｕｅ：０．０で、７８６アミノ酸残基に亘り４３％の一致度でヒットした。これらの結果より配列番号２６に示したアミノ酸配列からなるタンパク質はｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｓであることが推測された。
また、上記のタンパク質は、文献情報（Ｇｅｎｅ２００２Ｊａｎ２３；２８３（１−２）：４９−６２）から関節炎や癌に関わることが知られている。
また、配列番号２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２の塩基番号１３５４−１９６９がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる配列）を見出した。また、配列番号２の塩基番号７９６−１１７２がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる配列）を見出した。
これらのことから配列番号２に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【０１４７】
（３）ｄｎａｆｏｒｍ５１３２５（配列番号３、２７）
ｄｎａｆｏｒｍ５１３２５は、配列番号３に示すように、１５７７塩基から成り、そのうち塩基番号８から１４５９までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４８３アミノ酸残基から成る（配列番号２７）。配列番号３がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｐ８３１０５、ＰｒｏｂａｂｌｅｓｅｒｉｎｅｐｒｏｔｅａｓｅＨＴＲＡ４ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：５×１０^−１７５で、また４７０アミノ酸残基に亘り６７％の一致度で、また（ｉｉ）データベース登録記号ＡＦ１７９３６９、ｉｎｓｕｌｉｎ−ｌｉｋｅｇｒｏｗｔｈｆａｃｔｏｒｂｉｎｄｉｎｇｐｒｏｔｅｉｎ５ｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：５×１０^−１４７で、４８５アミノ酸残基に亘り５５％の一致度でヒットした。これらの結果より配列番号２７に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、配列番号３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号３の塩基番号５５９−１１１１がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号３に示す塩基配列がコードするタンパク質は成長因子を制御する機能を有するトリプシン様セリンプロテアーゼであることが推測された。
【０１４８】
（４）ｄｎａｆｏｒｍ９５７８（配列番号４、２８）
ｄｎａｆｏｒｍ９５７８は、配列番号４に示すように、２２３５塩基から成り、そのうち塩基番号１から２０３４までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、６７７アミノ酸残基から成る（配列番号２８）。配列番号４がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＪ１３１５６３、ｍｅｔａｌｌｏｐｒｏｔｅａｓｅ／ｄｉｓｉｎｔｅｇｒｉｎが、ｅ−ｖａｌｕｅ：５×１０^−１５４で、また２９７アミノ酸残基に亘り８５％の一致度で、また（ｉｉ）データベース登録記号Ｑ９５１９４、ＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）が、ｅ−ｖａｌｕｅ：５×１０^−１５２で、６４１アミノ酸残基に亘り４３％の一致度で、また（ｉｉｉ）データベース登録記号Ｑ９Ｙ３Ｑ７、ＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）が、ｅ−ｖａｌｕｅ：５×１０^−１５１で、６４２アミノ酸残基に亘り４３％の一致度でヒットした。これらの結果より配列番号２８に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記（ｉｉ）のタンパク質は、データベース中の文献情報（ＭｏｌＨｕｍＲｅｐｒｏｄ１９９８Ｍａｙ；４（５）：４２９−３７）から精子生成に関わることが明らかとなった。
また、配列番号４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号４の塩基番号５５９−１１５２がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列（ＰｆａｍにＲｅｐｒｏｌｙｓｉｎとしてエントリーされる塩基配列）を、塩基番号１９０−５２８がコードするアミノ酸配列にペプチダーゼファミリーＭ１２Ｂの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる配列）を見出した。
これらのことから配列番号４に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【０１４９】
（５）ｄｎａｆｏｒｍ１３２９８（配列番号５、２９）
ｄｎａｆｏｒｍ１３２９８は、配列番号５に示すように、７４６塩基から成り、そのうち塩基番号１０から４１１までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、１３３アミノ酸残基から成る（配列番号２９）。配列番号５がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｙ０７９０３、ｔｒａｎｓｍｅｍｂｒａｎｅｐｒｏｔｅｉｎｔＭＤＣＩが、ｅ−ｖａｌｕｅ：３×１０^−１７で、また１１８アミノ酸残基に亘り４３％の一致度で、また（ｉｉ）データベース登録記号Ｘ７６６３７、ｔＭＤＣＩが、ｅ−ｖａｌｕｅ：６×１０^−１７で、１１８アミノ酸残基に亘り４２％の一致度で、また（ｉｉｉ）データベース登録記号Ｑ９５１９４、ＡＤＡＭ１８ｐｒｅｃｕｒｓｏｒ（Ａｄｉｓｉｎｔｅｇｒｉｎａｎｄｍｅｔａｌｌｏｐｒｏｔｅｉｎａｓｅｄｏｍａｉｎ１８）が、ｅ−ｖａｌｕｅ：２×１０^−１６で、１１３アミノ酸残基に亘り４６％の一致度でヒットした。これらの結果より配列番号２９に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記（ｉｉｉ）のタンパク質は、データベース中の文献情報（ＭｏｌＨｕｍＲｅｐｒｏｄ１９９８Ｍａｙ；４（５）：４２９−３７）から精子生成に関わることが明らかとなった。
また、配列番号５に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号５の塩基番号１９９−４７２がコードするアミノ酸配列にペプチダーゼファミリーＭ１２Ｂの特徴を示す配列（ＰｆａｍにＰｅｐ＿Ｍ１２Ｂ＿ｐｒｏｐｅｐとしてエントリーされる配列）を見出した。
これらのことから配列番号５に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【０１５０】
（６）ｄｎａｆｏｒｍ２８９８３（配列番号６、３０）
ｄｎａｆｏｒｍ２８９８３は、配列番号６に示すように、２３７３塩基から成り、そのうち塩基番号７５から８４８までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、２５７アミノ酸残基から成る（配列番号３０）。配列番号６がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＸ１９０５３９、Ｓｅｑｕｅｎｃｅ１０ｆｒｏｍＰａｔｅｎｔＷＯ０１３６６４５が、ｅ−ｖａｌｕｅ：２×１０^−７５で、また２８６アミノ酸残基に亘り４９％の一致度で、また（ｉｉ）データベース登録記号Ｑ９ＵＬ５２、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：３×１０^−７５で、２８３アミノ酸残基に亘り４８％の一致度で、また（ｉｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：１×１０^−７２で、２８２アミノ酸残基に亘り４７％の一致度でヒットした。これらの結果より配列番号３０に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉｉ）のタンパク質は、データベース中の文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から扁平上皮細胞癌で発現が押さえられていることが明らかとなった。
また、配列番号６に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号６の塩基番号１５０−８２７がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号６に示す塩基配列がコードするタンパク質は細胞増殖や接着を制御する機能を有するプロテアーゼであることが推測された。
【０１５１】
（７）ｄｎａｆｏｒｍ３６４５１（配列番号７、３１）
ｄｎａｆｏｒｍ３６４５１は、配列番号７に示すように、２８７７塩基から成り、そのうち塩基番号９８から１３５１までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４１７アミノ酸残基から成る（配列番号３１）。配列番号７がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＸ１９０５３９、Ｓｅｑｕｅｎｃｅ１０ｆｒｏｍＰａｔｅｎｔＷＯ０１３６６４５が、ｅ−ｖａｌｕｅ：５×１０^−１１３で、また４１８アミノ酸残基に亘り５１％の一致度で、また（ｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：２×１０^−９６で、４１９アミノ酸残基に亘り４２％の一致度で、また（ｉｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：６×１０^−９５で、４２０アミノ酸残基に亘り４１％の一致度でヒットした。これらの結果より配列番号３１に示したアミノ酸配列からなるタンパク質はトリプシン様セリンプロテアーゼであることが推測された。
また、上記（ｉｉｉ）のタンパク質は、データベース中の文献情報（ＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から慢性的気管疾患患者の痰から得られ，調査した１７の組織中気管での発現が顕著に高いことが明らかとなった。
また、配列番号７に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号７の塩基番号６５３−１３３０がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号７に示す塩基配列がコードするタンパク質は気管疾患を制御する機能を有するプロテアーゼであることが推測された。
【０１５２】
（８）ｄｎａｆｏｒｍ３０３７５（配列番号８、３２）
ｄｎａｆｏｒｍ３０３７５は、配列番号８に示すように、２３３５塩基から成り、そのうち塩基番号５２６から２２４４までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、５７２アミノ酸残基から成る（配列番号３２）。配列番号８がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＸ２０７９０３、Ｓｅｑｕｅｎｃｅ７ｆｒｏｍＰａｔｅｎｔＷＯ０１５７１９４が、ｅ−ｖａｌｕｅ：５×１０^−１０４で、また４１８アミノ酸残基に亘り３７％の一致度で、また（ｉｉ）データベース登録記号ＡＦ０５７１４５、ｓｅｒｉｎｅｐｒｏｔｅａｓｅＴＡＤＧ１５が、ｅ−ｖａｌｕｅ：５×１０^−１０３で、６５０アミノ酸残基に亘り３９％の一致度で、また（ｉｉｉ）データベース登録記号Ｑ９Ｙ５Ｙ６、Ｍｅｍｂｒａｎｅ−ｔｙｐｅｓｅｒｉｎｅｐｒｏｔｅａｓｅ１が、ｅ−ｖａｌｕｅ：５×１０^−１０３で、６５０アミノ酸残基に亘り３９％の一致度でヒットした。これらの結果より配列番号３２に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉｉｉ）のタンパク質は、データベース中の文献情報（ＪＢｉｏｌＣｈｅｍ１９９９Ｊｕｎ２５；２７４（２６）：１８２３１−６）からヒト乳癌に関係することが明らかとなった。
また、配列番号８に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号８の塩基番号１５２８ − ２２１７がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号８に示す塩基配列がコードするタンパク質は乳癌を制御する機能を有するプロテアーゼであることが推測された。
【０１５３】
（９）ｄｎａｆｏｒｍ２６１６３（配列番号９、３３）
ｄｎａｆｏｒｍ２６１６３は、配列番号９に示すように、２３７７塩基から成り、そのうち塩基番号２５６から１５００までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４１４アミノ酸残基から成る（配列番号３３）。配列番号９がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＢ０７１４２５、ｈａｔｃｈｉｎｇｅｎｚｙｍｅＥＨＥ７が、ｅ−ｖａｌｕｅ：２×１０^−４８で、また２４７アミノ酸残基に亘り４０％の一致度で、また（ｉｉ）データベース登録記号Ｐ３１５８１、Ｈｉｇｈｃｈｏｒｉｏｌｙｔｉｃｅｎｚｙｍｅ２ｐｒｅｃｕｒｓｏｒ（Ｈａｔｃｈｉｎｇｅｎｚｙｍｅｚｉｎｃ−ｐｒｏｔｅａｓｅＨＣＥ２ｓｕｂｕｎｉｔ）が、ｅ−ｖａｌｕｅ：２×１０^−４２で、２４６アミノ酸残基に亘り４０％の一致度ででヒットした。これらの結果より配列番号３３に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記（ｉｉ）のタンパク質は、データベース中の文献情報（ＤｅｖＢｉｏｌ１９９２Ｏｃｔ；１５３（２）：２５０−８）からａｓｔａｃｉｎ（ｐｒｏｔｅａｓｅ）に属することが明らかとなった。
また、配列番号９に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号９の塩基番号４６６ − １０４１がコードするアミノ酸配列にメタロプロテアーゼであるａｓｔａｃｉｎの特徴を示す配列（ＰｆａｍにＡｓｔａｃｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号９に示す塩基配列がコードするタンパク質はＡｓｔａｃｉｎ様プロテアーゼであることが推測された。
【０１５４】
（１０）ｄｎａｆｏｒｍ３３０４２（配列番号１０、３４）
ｄｎａｆｏｒｍ３３０４２は、配列番号１０に示すように、３６１４塩基から成り、そのうち塩基番号６８から１０４２までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、３２４アミノ酸残基から成る（配列番号３４）。配列番号１０がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＥ００３５６７、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄが、ｅ−ｖａｌｕｅ：８×１０^−６３で、また３４３アミノ酸残基に亘り４７％の一致度で、また（ｉｉ）データベース登録記号Ｐ４３５５８、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：２×１０^−３３で、２８０アミノ酸残基に亘り３６％の一致度ででヒットした。
また、配列番号１０に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１０の塩基番号３９２−７３９がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）を見出した。
これらのことから配列番号１０に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【０１５５】
（１１）ｄｎａｆｏｒｍ３７１０３（配列番号１１、３５）
ｄｎａｆｏｒｍ３７１０３は、配列番号１１に示すように、３７９３塩基から成り、そのうち塩基番号２８０から１１９１までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、３０３アミノ酸残基から成る（配列番号３５）。配列番号１１がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＥ００３５６７、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄが、ｅ−ｖａｌｕｅ：８×１０^−６３で、また３４３アミノ酸残基に亘り４７％の一致度で、また（ｉｉ）データベース登録記号Ｐ４３５５８、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：３×１０^−３３で、２７８アミノ酸残基に亘り３５％の一致度ででヒットした。
また、配列番号１１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１１の塩基番号６０４−９５１がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）を見出した。
これらのことから配列番号１１に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【０１５６】
（１２）ｄｎａｆｏｒｍ４４９９０（配列番号１２、３６）
ｄｎａｆｏｒｍ４４９９０は、配列番号１２に示すように、３６４６塩基から成り、そのうち塩基番号３４４から９８５までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、２１３アミノ酸残基から成る（配列番号３６）。配列番号１２がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＥ００３５６７、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄが、ｅ−ｖａｌｕｅ：２×１０^−５４で、また２０７アミノ酸残基に亘り５１％の一致度で、また（ｉｉ）データベース登録記号Ｐ４３５５８、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：４×１０^−３１で、２０３アミノ酸残基に亘り３６％の一致度でヒットした。
また、配列番号１２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１２の塩基番号３９８−７４５がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）を見出した。
これらのことから配列番号１２に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【０１５７】
（１３）ｄｎａｆｏｒｍ４５３６７（配列番号１３、３７）
ｄｎａｆｏｒｍ４５３６７は、配列番号１３に示すように、３４１８塩基から成り、そのうち塩基番号１５９から１１９０までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、３４３アミノ酸残基から成る（配列番号３７）。配列番号１３がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＥ００３５６７、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄが、ｅ−ｖａｌｕｅ：７×１０^−６３で、また３４３アミノ酸残基に亘り４７％の一致度で、また（ｉｉ）データベース登録記号Ｐ４３５５８、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：３×１０^−３３で、２７８アミノ酸残基に亘り３５％の一致度ででヒットした。
また、配列番号１３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１３の塩基番号６０３−９５０がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）を見出した。
これらのことから配列番号１３に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【０１５８】
（１４）ｄｎａｆｏｒｍ５１８７２（配列番号１４、３８）
ｄｎａｆｏｒｍ５１８７２は、配列番号１４に示すように、３６１７塩基から成り、そのうち塩基番号４７６から９７９までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、１６７アミノ酸残基から成る（配列番号３８）。配列番号１４がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＥ００３５６７、Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｇｅｎｏｍｉｃｓｃａｆｆｏｌｄが、ｅ−ｖａｌｕｅ：３×１０^−５４で、また２０１アミノ酸残基に亘り５２％の一致度で、また（ｉｉ）データベース登録記号Ｐ４３５５８、Ｈｙｐｏｔｈｅｔｉｃａｌ３３．５ｋＤａｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：４×１０^−３１で、２０３アミノ酸残基に亘り３６％の一致度ででヒットした。
また、配列番号１４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１４の塩基番号３９２−７３９がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列（ＰｆａｍにＯＴＵとしてエントリーされる配列）を見出した。
これらのことから配列番号１４に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【０１５９】
（１５）ｄｎａｆｏｒｍ３９５３１（配列番号１５、３９）
ｄｎａｆｏｒｍ３９５３１は、配列番号１５に示すように、２８０３塩基から成り、そのうち塩基番号２２７から１５８２までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４５１アミノ酸残基から成る（配列番号３９）。配列番号１５がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＸ２０７６８８、Ｓｅｑｕｅｎｃｅ５ｆｒｏｍＰａｔｅｎｔＷＯ０１５７０８１が、ｅ−ｖａｌｕｅ：０．０で、また４６９アミノ酸残基に亘り９４％の一致度で、また（ｉｉ）データベース登録記号Ｐ０８５９４、ＡｑｕａｌｙｓｉｎＩｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：５×１０^−４５で、３５５アミノ酸残基に亘り３４％の一致度でヒットした。
また、配列番号１５に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１５の塩基番号７１４−１６０２がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列（ＰｆａｍにＰｅｐｔｉｄａｓｅ＿Ｓ８としてエントリーされる配列）を見出した。
これらのことから配列番号１５に示す塩基配列がコードするタンパク質はセリンプロテアーゼであることが推測された。
【０１６０】
（１６）ｄｎａｆｏｒｍ２５９００（配列番号１６、４０）
ｄｎａｆｏｒｍ２５９００は、配列番号１６に示すように、２２２２塩基から成り、そのうち塩基番号１７４から１４９３までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４３９アミノ酸残基から成る（配列番号４０）。配列番号１６がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｑ９ＵＬ５２、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−９６で、また４２１アミノ酸残基に亘り４３％の一致度で、また（ｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：２×１０^−８９で、４１７アミノ酸残基に亘り４０％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：１×１０^−８８で、４３９アミノ酸残基に亘り４０％の一致度でヒットした。これらの結果より配列番号４０に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉ）のタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記（ｉｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号１６に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１６の塩基番号７９５−１４７２がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号１６に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【０１６１】
（１７）ｄｎａｆｏｒｍ２６５６０（配列番号１７、４１）
ｄｎａｆｏｒｍ２６５６０は、配列番号１７に示すように、３５６８塩基から成り、そのうち塩基番号１３４から１４５３までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４３９アミノ酸残基から成る（配列番号４１）。配列番号１７がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｑ９ＵＬ５２、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：３×１０^−９６で、また４２１アミノ酸残基に亘り４３％の一致度で、また（ｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：３×１０^−８９で、４１７アミノ酸残基に亘り４０％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−８８で、４３９アミノ酸残基に亘り４０％の一致度でヒットした。これらの結果より配列番号４１に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉ）のタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記（ｉｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号１７に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１７の塩基番号７５５−１４３２がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号１７に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【０１６２】
（１８）ｄｎａｆｏｒｍ３２８２７（配列番号１８、４２）
ｄｎａｆｏｒｍ３２８２７は、配列番号１８に示すように、３５９９塩基から成り、そのうち塩基番号１６７から１４８６までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４３９アミノ酸残基から成る（配列番号４２）。配列番号１８がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｑ９ＵＬ５２、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：３×１０^−９６で、また４２１アミノ酸残基に亘り４３％の一致度で、また（ｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：３×１０^−８９で、４１７アミノ酸残基に亘り４０％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−８８で、４３９アミノ酸残基に亘り４０％の一致度でヒットした。これらの結果より配列番号４２に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉ）のタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記（ｉｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号１８に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１８の塩基番号７８８−１４６５がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号１８に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【０１６３】
（１９）ｄｎａｆｏｒｍ３３６６１（配列番号１９、４３）
ｄｎａｆｏｒｍ３３６６１は、配列番号１９に示すように、３８１７塩基から成り、そのうち塩基番号１６から１３３５までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４３９アミノ酸残基から成る（配列番号４３）。配列番号１９がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｑ９ＵＬ５２、ＳｅｒｉｎｅｐｒｏｔｅａｓｅＤＥＳＣ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：３×１０^−９６で、また４２１アミノ酸残基に亘り４３％の一致度で、また（ｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：３×１０^−８９で、４１７アミノ酸残基に亘り４０％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−８８で、４３９アミノ酸残基に亘り４０％の一致度でヒットした。これらの結果より配列番号４３に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉ）のタンパク質は、文献情報（ＢｒＪＣａｎｃｅｒ２００１Ｊａｎ；８４（２）：２３７−４３）から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記（ｉｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号１９に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号１９の塩基番号６３７−１３１４がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号１９に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【０１６４】
（２０）ｄｎａｆｏｒｍ３４９５０（配列番号２０、４４）
ｄｎａｆｏｒｍ３４９５０は、配列番号２０に示すように、３３５５塩基から成り、そのうち塩基番号７６から１３２６までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４１６アミノ酸残基から成る（配列番号４４）。配列番号２０がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＸ２６２４１０、Ｓｅｑｕｅｎｃｅ１ｆｒｏｍＰａｔｅｎｔＷＯ０１７３０７４が、ｅ−ｖａｌｕｅ：５×１０^−１２２で、また４１７アミノ酸残基に亘り５１％の一致度で、また（ｉｉ）データベース登録記号Ｏ６０２３５、Ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：５×１０^−９３で、４２０アミノ酸残基に亘り４０％の一致度で、さらに（ｉｉｉ）データベース登録記号ＡＦ４５３７７６、ａｉｒｗａｙｔｒｙｐｓｉｎ−ｌｉｋｅｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：２×１０^−９２で、４２０アミノ酸残基に亘り３８％の一致度でヒットした。これらの結果より配列番号４４に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９８Ｍａｙ８；２７３（１９）：１１８９５−９０１）から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号２０に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２０の塩基番号６２８−１３０５がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号２０に示す塩基配列がコードするタンパク質は上皮における炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【０１６５】
（２１）ｄｎａｆｏｒｍ４０９９７（配列番号２１、４５）
ｄｎａｆｏｒｍ４０９９７は、配列番号２１に示すように、１４５６塩基から成り、そのうち塩基番号２６から１３４５までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４３９アミノ酸残基から成る（配列番号４５）。配列番号２１がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＦ１００７０７、ｔｅｓｔｅｓ−ｓｐｅｃｉｆｉｃｐｒｏｔｅｉｎＴＳＰ５０が、ｅ−ｖａｌｕｅ：５×１０^−１２８で、また４３９アミノ酸残基に亘り５４％の一致度で、また（ｉｉ）データベース登録記号Ｑ９ＧＺＮ４、Ｂｒａｉｎ−ｓｐｅｃｉｆｉｃｓｅｒｉｎｅｐｒｏｔｅａｓｅ４ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−３６で、２８１アミノ酸残基に亘り３３％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｑ９ＢＱＲ３、Ｍａｒａｐｓｉｎｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：１×１０^−３５で、２５３アミノ酸残基に亘り３２％の一致度で、さらに（ｉｖ）データベース登録記号Ｑ９Ｙ６Ｍ０、Ｔｅｓｔｉｓｉｎｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：９×１０^−３５で、２７３アミノ酸残基に亘り３２％の一致度でヒットした。これらの結果より配列番号４５に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記（ｉｖ）の蛋白質は、文献情報（ＢｉｏｃｈｅｍＢｉｏｐｈｙｓＲｅｓＣｏｍｍｕｎ１９９８Ｎｏｖ１８；２５２（２）：３０７−１２）から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが知られている。
また、配列番号２１に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２１の塩基番号５２２−１２４６がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列（Ｐｆａｍにｔｒｙｐｓｉｎとしてエントリーされる配列）を見出した。
これらのことから配列番号２１に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであることが推測された。
【０１６６】
（２２）ｄｎａｆｏｒｍ４３５０９（配列番号２２、４６）
ｄｎａｆｏｒｍ４３５０９は、配列番号２２に示すように、１６００塩基から成り、そのうち塩基番号４６６から１４７６までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、３３６アミノ酸残基から成る（配列番号４６）。配列番号２２がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＢＣ０２１４７４、機能未知蛋白質が、ｅ−ｖａｌｕｅ：０．０で、また３５５アミノ酸残基に亘り９８％の一致度で、また（ｉｉ）データベース登録記号ＡＢ０３３０２９、ＫＩＡＡ１２０３ｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：４×１０^−２３で、１１８アミノ酸残基に亘り５０％の一致度で、さらに（ｉｉｉ）データベース登録記号ＡＦ０１７３０６、ＨｏｍｏｓａｐｉｅｎｓｄｅｕｂｉｑｕｉｔｉｎａｔｉｎｇｅｎｚｙｍｅＵｎｐＥＳが、ｅ−ｖａｌｕｅ：２×１０^−８で、６６アミノ酸残基に亘り４８％の一致度で、さらに（ｉｖ）データベース登録記号Ｑ１３１０７、Ｕｂｉｑｕｉｔｉｎｃａｒｂｏｘｙｌ−ｔｅｒｍｉｎａｌｈｙｄｒｏｌａｓｅ４が、ｅ−ｖａｌｕｅ：２×１０^−８で、６６アミノ酸残基に亘り４８％の一致度でヒットした。これらの結果より配列番号４６に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記（ｉｉｉ）と（ｉｖ）の蛋白質は、文献情報（Ｏｎｃｏｇｅｎｅ１９９５Ｊｕｎ１；１０（１１）：２１７９−８３）から、ｎｕｃｌｅａｒｕｂｉｑｕｉｔｉｎｐｒｏｔｅａｓｅであり，その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号２２に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２２の塩基番号２−２０５がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−２としてエントリーされる配列）を見出した。
これらのことから配列番号２２に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【０１６７】
（２３）ｄｎａｆｏｒｍ５５０１７（配列番号２３、４７）
ｄｎａｆｏｒｍ５５０１７は、配列番号２３に示すように、４２９８塩基から成り、そのうち塩基番号２７７から３３４２までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、１０２１アミノ酸残基から成る（配列番号４７）。配列番号２３がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＢＣ０２１４７４、機能未知蛋白質が、ｅ−ｖａｌｕｅ：０．０で、また８２７アミノ酸残基に亘り９９％の一致度で、また（ｉｉ）データベース登録記号ＡＢ０３３０２９、ＫＩＡＡ１２０３ｐｒｏｔｅｉｎが、ｅ−ｖａｌｕｅ：１×１０^−６７で、２３４アミノ酸残基に亘り５５％の一致度で、さらに（ｉｉｉ）データベース登録記号ＡＦ０４８７０５、ｕｂｉｑｕｉｔｉｎ−ｓｐｅｃｉｆｉｃｐｒｏｔｅａｓｅが、ｅ−ｖａｌｕｅ：８×１０^−５６で、６５３アミノ酸残基に亘り２９％の一致度でヒットした。これらの結果より配列番号４７に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記（ｉｉｉ）の蛋白質は、文献情報（Ｏｎｃｏｇｅｎｅ１９９５Ｊｕｎ１；１０（１１）：２１７９−８３）から、ｎｕｃｌｅａｒｕｂｉｑｕｉｔｉｎｐｒｏｔｅａｓｅであり，その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号２３に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２３の塩基番号２４４−３３７がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−１としてエントリーされる配列）を見出した。また、配列番号２３の塩基番号１８８５−２０７０がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列（ＰｆａｍにＵＣＨ−２としてエントリーされる配列）を見出した。
これらのことから配列番号２３に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【０１６８】
（２４）ｄｎａｆｏｒｍ６５０２７（配列番号２４、４８）
ｄｎａｆｏｒｍ６５０２７は、配列番号２４に示すように、１８１６塩基から成り、そのうち塩基番号６２３から１４１１までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、２６２アミノ酸残基から成る（配列番号４８）。配列番号２４がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＦ１９０２７４、ｃａｒｂｏｘｙｐｅｐｔｉｄａｓｅｈｏｍｏｌｏｇが、ｅ−ｖａｌｕｅ：１×１０^−９３で、また３３１アミノ酸残基に亘り４８％の一致度で、また（ｉｉ）データベース登録記号Ｐ１９２２３、ＣａｒｂｏｘｙｐｅｐｔｉｄａｓｅＢｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：２×１０^−９２で、３２７アミノ酸残基に亘り４８％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｐ１５０８６、ＣａｒｂｏｘｙｐｅｐｔｉｄａｓｅＢｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：４×１０^−９０で、３３０アミノ酸残基に亘り４６％の一致度でヒットした。これらの結果より配列番号４８に示したアミノ酸配列からなるタンパク質はカルボキシペプチダーゼであることが推測された。
また、上記（ｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９８８Ｎｏｖ２５；２６３（３３）：１７８３７−４５）から、膵臓に発現するカルボキシペプチダーゼであることが、上記（ｉｉｉ）の蛋白質は、文献情報（ＪＢｉｏｌＣｈｅｍ１９９２Ｆｅｂ５；２６７（４）：２５７５−８１）から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが知られている。
また、配列番号２４に示す塩基配列がコードするアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号２４の塩基番号５０９−１３５７がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列（ＰｆａｍにＺｎ＿ｃａｒｂＯｐｅｐｔとしてエントリーされる配列）を見出した。
これらのことから配列番号２４に示す塩基配列がコードするタンパク質は、膵臓疾患に関わるカルボキシペプチダーゼであることが推測された。
【０１６９】
（２５）ｄｎａｆｏｒｍ３５２２５（配列番号５７、６０）
ｄｎａｆｏｒｍ３５２２５は、配列番号５７に示すように、１０３６塩基から成り、そのうち塩基番号３３２から８２６までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、１６４アミノ酸残基から成る（配列番号６０）。配列番号５７がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＦ１７８９８５、ＨｏｍｏｓａｐｉｅｎｓｃｏｍｐｌｅｍｅｎｔＣ１ｒ−ｌｉｋｅｐｒｏｔｅｉｎａｓｅｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：１×１０^−４９で、また１５２アミノ酸残基に亘り６３％の一致度で、また（ｉｉ）データベース登録記号ＡＫ０２４０８４、ＨｏｍｏｓａｐｉｅｎｓｃＤＮＡＦＬＪ１４０２２ｗｅａｋｌｙｓｉｍｉｌａｒｔｏＣＯＭＰＬＥＭＥＮＴＣ１ＲＣＯＭＰＯＮＥＮＴＰＲＥＣＵＲＳＯＲが、ｅ−ｖａｌｕｅ：１×１０^−４８で、１５２アミノ酸残基に亘り６２％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｘ０４７０１、ＨｕｍａｎｍＲＮＡｆｏｒｃｏｍｐｌｅｍｅｎｔｃｏｍｐｏｎｅｎｔＣ１ｒが、ｅ−ｖａｌｕｅ：７×１０^−１８で、１０３アミノ酸残基に亘り３９％の一致度でヒットした。これらの結果より、配列番号５７に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであることが推測された。
【０１７０】
（２６）ｄｎａｆｏｒｍ４６８７０（配列番号５８、６１）
ｄｎａｆｏｒｍ４６８７０は、配列番号５８に示すように、２６１３塩基から成り、そのうち塩基番号８１９から２１０２までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、４２７アミノ酸残基から成る（配列番号５８）。配列番号５８がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号Ｙ０９６６１、Ｘ．ｌａｅｖｉｓｍＲＮＡｆｏｒｘｏｌｌｏｉｄが、ｅ−ｖａｌｕｅ：２×１０^−５８で、また４３６アミノ酸残基に亘り３０％の一致度で、また（ｉｉ）データベース登録記号Ｏ５７４６０、Ｄｏｒｓａｌ−ｖｅｎｔｒａｌｐａｔｔｅｒｎｉｎｇｔｏｌｌｏｉｄｐｒｏｔｅｉｎｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：４×１０^−５８で、４４５アミノ酸残基に亘り３０％の一致度で、さらに（ｉｉｉ）データベース登録記号Ｐ９８０６３、Ｂｏｎｅｍｏｒｐｈｏｇｅｎｅｔｉｃｐｒｏｔｅｉｎ１ｐｒｅｃｕｒｓｏｒが、ｅ−ｖａｌｕｅ：７×１０^−５７で、４３６アミノ酸残基に亘り３０％の一致度でヒットした。
また、配列番号６１に示すアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ配列番号６１のアミノ酸番号３０−３７０のアミノ酸配列に３箇所にわたってＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされる配列）を見出した。
これらの結果より、配列番号５８に示す塩基配列がコードするタンパク質は発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであることが推測された。
【０１７１】
（２７）ｄｎａｆｏｒｍ４１５８３（配列番号５９、６２）
ｄｎａｆｏｒｍ４１５８３は、配列番号５９に示すように、２８４１塩基から成り、そのうち塩基番号１１１０から１８８９までがオープンリーディングフレーム（終止コドンを含む）になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、２５９アミノ酸残基から成る（配列番号６２）。配列番号５９がコードするアミノ酸配列についてＢＬＡＳＴを用いて相同性検索を行ったところ、ＳＰＴＲ蛋白質データベース（ＳＷＩＳＳ−ＰＲＯＴ蛋白質配列データベースとＴｒＥＭＢＬ核酸翻訳データベースを統合したもの）中に、（ｉ）データベース登録記号ＡＹ０１７４７５、ＭｕｓｍｕｓｃｕｌｕｓＣＳＭＤ１（Ｃｓｍｄ１）が、ｅ−ｖａｌｕｅ：５×１０^−１０８で、また２５７アミノ酸残基に亘り６８％の一致度で、また（ｉｉ）データベース登録記号ＡＹ０１７３０７、ＨｏｍｏｓａｐｉｅｎｓＣＵＢａｎｄｓｕｓｈｉｍｕｌｔｉｐｌｅｄｏｍａｉｎｓｐｒｏｔｅｉｎ１ｓｈｏｒｔｆｏｒｍが、ｅ−ｖａｌｕｅ：１×１０^−４８で、１５３アミノ酸残基に亘り６７％の一致度でヒットした。
また、配列番号６２に示すアミノ酸配列について、ＨＭＭＰＦＡＭによる蛋白質特徴検索を行ったところ、配列番号６２のアミノ酸番号２５−３８２および２０３−２５６のアミノ酸配列にわたってＣｏｍｐｌｅｍｅｎｔｃｏｎｔｒｏｌｐｒｏｔｅｉｎ（ＣＣＰ）ｍｏｄｕｌｅｓまたはｓｈｏｒｔｃｏｎｓｅｎｓｕｓｒｅｐｅａｔｓ（ＳＣＲ）の特徴を示す配列（Ｐｆａｍにｓｕｓｈｉとしてエントリーされる配列）を見出し、アミノ酸番号８７−１９５のアミノ酸配列にＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされる配列）を見出した。
これらの結果より、配列番号５９に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであることが推測された。
【０１７２】
実施例５ＤＮＡマイクロアレイを用いた組織発現解析
ＤＮＡマイクロアレイを用いた組織発現解析は、Ｍｉｋｉ，Ｒ．，ｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，９８，２１９９−２２０４（２００１）の記載に従って行った。（１）ＤＮＡマイクロアレイの作成
２種類のマウス全長ｃＤＮＡの塩基配列（ｄｎａｆｏｒｍ９５７８、ｄｎａｆｏｒｍ３７９０１）を、Ｍ１３フォワードおよびリバースプライマーを用いて増幅後、このＰＣＲ産物をイソプロパノールにて沈澱させ１５μｌの３×ＳＳＣ液に溶解した。これらの２種類のＤＮＡ溶液をポリＬリジンコートしたガラススライドに、１６チップ（ＳＭＰ３、ＴｅｌｅＣｈｅｍＩｎｔｅｒｎａｔｉｏｎａｌ、Ｓｕｎｎｙｖａｌｅ、ＣＡ）のＤＮＡアレイヤーを用いてスポットし、ＤＮＡマイクロアレイを作成した（方法の詳細はｈｔｔｐ：／／ｃｍｇｍ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｐｂｒｏｗｎ／ｍｇｕｉｄｅ／ｉｎｄｅｘ．ｈｔｍｌに記載されている）。マウスβアクチンとグリセルアルデヒド‐３‐フォスフェートデヒドロゲナーゼのｃＤＮＡをポジティブコントロールとし、シロイヌナズナのｃＤＮＡをネガティブコントロールとして用いた。
このＤＮＡマイクロアレイの検出感度は、１細胞当たりｍＲＮＡ１ないし３コピーであった。ターゲット配列との一致度がおよそ８０％のクローンのシグナル強度は、完全に配列が一致するクローンの１０分の１であった。ターゲット配列との一致度が８０％未満のクローンのシグナル強度は、バックグランドレベルであった。
【０１７３】
（２）プローブの調製
Ｃ５７ＢＬ／６Ｊマウスの胎児、新生仔、アダルトの４９組織（腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、盲腸、胎盤、心臓、舌、胸腺、胸腺（妊娠１日目）、小脳、延髄、嗅脳、副精巣、眼球、皮質、小胞腺、子宮、卵巣および子宮（妊娠１１日目）、骨、筋肉、乳腺（授乳１０日目）、１０日齢胎児全身、１１日齢胎児全身、１３日齢胎児全身、１１日齢胎児頭部、１２日齢胎児頭部、１３日齢胎児頭部、１５日齢胎児頭部、１６日齢胎児頭部、１７日齢胎児頭部、１６日齢胎児肺、１３日齢胎児肝臓、１４日齢胎児肝臓、０日齢新生児全頭部、６日齢新生児全頭部、１０日齢新生児全頭部、１０日齢新生児腸、０日齢新生児肺、１０日齢新生児小脳、０日齢新生児皮膚、１０日齢新生児皮膚、ＳＶ４０感染）または、２２組織（腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、胎盤、心臓、胸腺、小脳、子宮、骨、筋肉、背側腎臓由来脂肪細胞、副精巣由来脂肪細胞、内臓脂肪、１０日齢新生児小脳、１０日齢新生児皮膚）から抽出したｍＲＮＡ１μｇを定法に従いランダムプライム逆転写反応を行い蛍光色素Ｃｙ３（ＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａ社）を取りこませた。他方、１７．５日齢の胎児全身から抽出したｍＲＮＡ１μｇをランダムプライム逆転写反応を行い、蛍光色素Ｃｙ５を取りこませ発現解析のリファレンスとした。ＣｙＤｙｅ標識ｃＤＮＡプローブは、ＣｙＳｃｒｉｂｅＧＦＸＰｕｒｉｆｉｃａｔｉｏｎＫｉｔ（ＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａ社）を用いて精製し、滅菌水１７μｌにてカラムから溶出した。これに３μｌの１０μｇ／μｌｏｌｉｇｏ（ｄＡ），３μｌの酵母ｔＲＮＡ２０μｇ／μｌ，１μｌの２０μｇ／μｌマウスＣｏｔ１ＤＮＡ，５．１μｌの２０ＸＳＳＣ，および０．９μｌの１０％ＳＤＳからなるブロッキング溶液を混和してＣｙＤｙｅ標識ｃＤＮＡプローブを調製した。
【０１７４】
（３）ＤＮＡマイクロアレイのハイブリダイゼイション
発現解析対象組織由来ｃＤＮＡプローブ（Ｃｙ３標識）とリファレンスの１７．５日齢胎児由来ｃＤＮＡプローブ（Ｃｙ５標識）を混和した溶液３０μｌを９５℃にて１分間熱処理を行い室温にて冷却した。ＤＮＡマイクロアレーに上記プローブ溶液を添加しカバースリップを被せ、Ｈｙｂｒｉｃａｓｅｔｔｅ（ＡｒｒａｙＩｔ社）中にて６５℃一晩ハイブリダイズさせた。次に、ＤＮＡマイクロアレーを２ＸＳＳＣ，０．１％ＳＤＳを用いて洗浄し、続いて１ＸＳＳＣにて２分間、０．１ＸＳＳＣにて２分間リンスした。マイクロアレーはＳｃａｎＡｒｒａｙ５０００共焦点レーザースキャナーを用いてスキャンし、画像をＩＭＡＧＥＮＥ（ＢｉｏＤｉｓｃｏｖｅｒｙ社）で解析した。
【０１７５】
（４）データ解析
各組織中のｍＲＮＡ量（Ｃｙ３標識）は、リファレンスの１７．５日齢の胎児全身ｍＲＮＡ量（Ｃｙ５標識）との比（Ｃｙ３／Ｃｙ５）を対数（ｌｏｇ_２）で表示した。すなわち、解析対象とする各マウス全長ｃＤＮＡに対応するｍＲＮＡ発現量が、リファレンス組織中よりも各組識中の方が多い場合は正の数値で、少ない場合は負の数値で、等しい場合は０で示される。データの正確性を増すために実験は独立に２回行い、再現性の有る結果を採用した。その結果を表１及び表２に示す。一般的に、ＤＮＡアレイを使用した発現解析結果は、２倍程度の増減は実験誤差とみなすため、結果の数値が１以上の場合にはある組織中のｍＲＮＡ量がリファレンスである１７．５日齢の胎児全身のｍＲＮＡ量と比較して２倍以上であり、有意に増加しており、逆に、結果の数値が−１以下の場合はある組織中のｍＲＮＡ量が、リファレンスである１７．５日齢の胎児全身のｍＲＮＡ量と比較して２分の１以下であり、有意に減少していると解釈した。また、組織間のｍＲＮＡ発現量を比較検討する際は、各組織における数値の差が１であればｍＲＮＡ量は２倍、２であればｍＲＮＡ量は４倍であり、逆に、組織間の数値の差が−１であればｍＲＮＡ量は１／２倍、−２であればｍＲＮＡ量は１／４倍となる。
なお、マイクロアレイにスポットしたＤＮＡと同じクラスタに属し、該ＤＮＡと少なくとも２００塩基に亘り８０％以上の塩基配列の一致度を有する領域を有するマウスｃＤＮＡクローン（ｄｎａｆｏｒｍ４６３５０）についても、表１及び表２に解析対象ｃＤＮＡとして記載し、マイクロアレイにスポットした該ＤＮＡの測定結果の数値を代用して記載した。
【０１７６】
【表１】

【０１７７】
【表２】

【０１７８】
表１及び表２から明らかなように、ｄｎａｆｏｒｍ３７９０１は、それ自身をマイクロアレイにスポットしてターゲット配列とした発現解析により、リファレンス（１７．５日齢の胎児全身）に比べて、小脳・新生児小脳で発現が増加していることが分かる。このように中枢神経系に特徴的な発現を示している。ｄｎａｆｏｒｍ４６３５０は、クラスター内のメンバーの上記ｄｎａｆｏｒｍ３７９０１をターゲット配列とした発現解析により、リファレンスに比べて、小脳・新生児小脳で発現が増加していることが分かる。
ｄｎａｆｏｒｍ９５７８は、それ自身をターゲット配列とした発現解析により、リファレンスに比べて、特に、精巣で強力に発現していることが分かり、これは著しい特徴と見なされる。
【０１７９】
実施例６ヒトオルソログＤＮＡの取得およびその塩基配列の解析
（１）ｄｎａｆｏｒｍ２６１６３のヒトオルソログＤＮＡ（配列番号６３、６５）
ｄｎａｆｏｒｍ２６１６３の塩基配列（配列番号９）を問い合わせとして、ヒトゲノムドラフト配列（ＮＣＢＩＢｕｉｌｄ３０；ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ａｂｏｕｔ／Ｄｏｃ／ｈｓ＃ｇｅｎｏｍｅｉｎｔｒｏ．ｈｔｍｌ）に対してＢＬＡＳＴ検索を行ったところ、相同性の高い領域として２番染色体の２ｑ１１．２の９４．６５Ｍｂから９４．６８Ｍｂの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムＧｅｎｓｃａｎ（ｈｔｔｐ：／／ｇｅｎｅｓ．ｍｉｔ．ｅｄｕ／ＧＥＮＳＣＡＮ．ｈｔｍｌ）を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号９の塩基配列は、配列番号６３のヒト塩基配列と約１２８０塩基対の長さに渡って７３．６％の相同性をもつことがわかった。
【０１８０】
また、配列番号６３の塩基配列から配列番号６５のヒトアミノ酸配列に翻訳されると予測された。配列番号６５のアミノ酸配列とｄｎａｆｏｒｍ２６１６３のオープンリーディングフレームから予測されるアミノ酸配列（配列番号３３）との間には、４１５アミノ酸配列に渡って６７％の相同性があった。
さらに、配列番号６５のアミノ酸配列を問い合わせとして、マウスｃＤＮＡライブラリーＦＡＮＴＯＭデータベース（ｈｔｔｐ：／／ｆａｎｔｏｍ．ｇｓｃ．ｒｉｋｅｎ．ｇｏ．ｊｐ／）に対してＢＬＡＳＴによる相同性検索を行ったところ、配列番号３３のアミノ酸配列が最も相同性が高かった。
【０１８１】
なお、公開塩基配列データベースであるｅｍｂｌｅデータベースと特許データベースであるＧｅｎｓｅｑデータベースに対してのＢＬＡＳＴ相同性検索においては、配列番号６３の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
従って、配列番号６３が、配列番号９に対する新規なヒトオルソログＤＮＡの塩基配列であると考えられた。ｄｎａｆｏｒｍ２６１６３のヒトオルソログＤＮＡのオープンリーディングフレーム（終止コドンを含む）は１２９６塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は４３１アミノ酸残基からなる。
配列番号６３に記載の塩基配列がコードするアミノ酸配列（配列番号６５）についてＨＭＭＰＦＡＭによるタンパク質特徴検索を行ったところ、アミノ酸番号９２−２８３に、Ａｓｔａｃｉｎ（ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａ）（ＰｆａｍにＡｓｔａｃｉｎとしてエントリーされるアミノ酸配列）を見出した。ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号６３に記載の塩基配列がコードするアミノ酸配列は、ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【０１８２】
（２）ｄｎａｆｏｒｍ４６８７０のヒトオルソログＤＮＡ（配列番号６４、６６）
ｄｎａｆｏｒｍ４６８７０の塩基配列（配列番号５８）を問い合わせとして、ヒトゲノムドラフト配列（ＮＣＢＩＢｕｉｌｄ３０；ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ａｂｏｕｔ／Ｄｏｃ／ｈｓ＃ｇｅｎｏｍｅｉｎｔｒｏ．ｈｔｍｌ）に対してＢＬＡＳＴ検索を行ったところ、相同性の高い領域として１番染色体の１ｐ３２．３の５４．４２Ｍｂから５４．４６Ｍｂの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムＧｅｎｓｃａｎ（ｈｔｔｐ：／／ｇｅｎｅｓ．ｍｉｔ．ｅｄｕ／ＧＥＮＳＣＡＮ．ｈｔｍｌ）を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号５８の塩基配列は、配列番号６４のヒト塩基配列と約１７００塩基対の長さに渡って７３．１％の相同性をもつことがわかった。
また、配列番号６４の塩基配列から配列番号６６のヒトアミノ酸配列に翻訳されると予測された。配列番号６６のアミノ酸配列とｄｎａｆｏｒｍ４６８７０のオープンリーディングフレームから予測されるアミノ酸配列（配列番号６１）との間には、３７２アミノ酸配列に渡って８７％の相同性があった。
【０１８３】
さらに、配列番号６６のアミノ酸配列を問い合わせとして、マウスｃＤＮＡライブラリーＦＡＮＴＯＭデータベース（ｈｔｔｐ：／／ｆａｎｔｏｍ．ｇｓｃ．ｒｉｋｅｎ．ｇｏ．ｊｐ／）に対してＢＬＡＳＴによる相同性検索を行ったところ、配列番号６１のアミノ酸配列が最も相同性が高かった。
なお、公開塩基配列データベースであるｅｍｂｌｅデータベースと特許データベースであるＧｅｎｓｅｑデータベースに対してのＢＬＡＳＴ相同性検索においては、配列番号６４の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
【０１８４】
従って、配列番号６４が、配列番号５８に対する新規なヒトオルソログＤＮＡの塩基配列であると考えられた。ｄｎａｆｏｒｍ４６８７０のヒトオルソログＤＮＡのオープンリーディングフレーム（終止コドンを含む）は１６８０塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は５５９アミノ酸残基からなる。
配列番号６４に記載の塩基配列がコードするアミノ酸配列（配列番号６６）に関して、ＢＬＡＳＴを用いて相同性検索を行ったところ、ＮＲＤＢタンパク質データベース（ＳＷＩＳＳ−ＰＲＯＴ、ＰＩＲ、ＴＲＥＭＢＬＥ、ＧＥＮＰＥＰＴ、ＰＤＢから作成された重複のないアミノ酸配列のデータベース）および特許配列のデータベース中に、配列番号６１に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号６４に記載の塩基配列がコードするアミノ酸配列を有するタンパク質は、配列番号５８に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【０１８５】
配列番号６６に記載のアミノ酸配列について、ＨＭＭＰＦＡＭによるタンパク質特徴検索を行ったところ、アミノ酸番号３０−１４０、１４５−２５２、２５７−３７０にＣＵＢｄｏｍａｉｎの特徴を示す配列（ＰｆａｍにＣＵＢとしてエントリーされるアミノ酸配列）を見出した。ＣＵＢドメインは、１１０アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質（補体系のプロテアーゼ等）に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号６６に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムｔｍＨＭＭ（Ｓ．Ｍｏｌｌｅｒ，Ｍ．Ｄ．Ｒ．Ｃｒｏｎｉｎｇ，Ｒ．Ａｐｗｅｉｌｅｒ．Ｅｖａｌｕａｔｉｏｎｏｆｍｅｔｈｏｄｓｆｏｒｔｈｅｐｒｅｄｉｃｔｉｏｎｏｆｍｅｍｂｒａｎｅｓｐａｎｎｉｎｇｒｅｇｉｏｎｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，１７（７）：６４６−６５３，２００１．）を用いて膜貫通部位を予測したところ、Ｃ末端のアミノ酸残基（アミノ酸番号５３６−５５８）に膜貫通部位が予測された。
以上のことから、配列番号６４に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の１つであることが推測された。
【０１８６】
実施例７ＰＣＲ法を用いた組織発現解析
本発明のタンパク質をコードするｍＲＮＡの正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法（ＨｉｇｕｃｈｉＲ，ｅｔａｌ．，Ｂｉｏｔｅｃｈｎｏｌｏｇｙ，１１：１０２６−３０（１９９３））に従い、ＰＣＲ法を用いた組織発現解析を行った。
（１）ｃＤＮＡ合成
以下のマウス（森脇和郎、外１名編、ＭｏｌｅｃｕｌａｒＭｅｄｉｃｉｎｅ別冊、Ｖｏｌ．３６「自然発症疾患モデル動物」、中山書店、１９９９年）の１９組織からトータルＲＮＡを抽出し、オリゴｄＴをプライマーとして逆転写酵素を用いてｃＤＮＡ合成を行った。
（ａ）正常マウスの組織および糖尿病モデルマウスの組織
▲１▼ 対照マウスＣ５７ＢＬ／ＫｓＪ − ＋ｍ／＋ｍＪｃｌ（メス、８週齢）の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲２▼ 糖尿病モデルマウスＣ５７ＢＬ／ＫｓＪ − ｄｂ／ｄｂＪｃｌ（メス、８週齢）の膵臓、脂肪細胞、肝臓、眼
（ｂ）老化促進マウスの組織
▲１▼ 正常老化マウスＳＡＭＲ１／ＴＡＳｌｃ（オス、１３週齢）の海馬、前頭葉皮質
▲２▼ 老化促進マウスＳＡＭＰ８／ＴａＳｌｃ（オス、１５週齢）の海馬、前頭葉皮質
（ｃ）癌転移モデルマウスの組織
▲１▼ 対照マウスＢａｌｂ／ｃ（メス、５週齢）の正常結腸
▲２▼ 癌転移モデルマウスＢａｌｂ／ｃ（メス、６週齢）結腸癌（マウス腹腔に結腸癌細胞Ｃｏｌｏｎ２６を移植し、２週間後に結腸癌を摘出）
【０１８７】
（２）ＰＣＲ法による定量
下記の３個の、本発明のタンパク質をコードしているｍＲＮＡの発現は、ライトサイクラー定量ＰＣＲ装置（ロシュ・ダイアグノスティクス社）とＬｉｇｈｔＣｙｃｌｅｒ−ＦａｓｔＳｔａｒｔＤＮＡマスターＳＹＢＲＧｒｅｅｎＩ試薬を用いて、製品に添付されているプロトコールに従い定量した。定量ＰＣＲに用いた合成ＤＮＡ配列を以下に示す。
（ａ）ｄｎａｆｏｒｍ２８９８３
５’側プライマー：ＡＡＧＴＴＴＴＧＧＡＣＧＧＡＣＣＣＴＴＡ（配列番号６７）
３’側プライマー：ＧＡＣＴＴＧＡＡＡＡＧＴＣＧＣＡＴＣＡＧＧ（配列番号６８）
（ｂ）ｄｎａｆｏｒｍ３３０４２
５’側プライマー：ＡＣＡＡＴＧＣＴＴＧＧＡＣＣＡＴＣＣＴＴ（配列番号６９）
３’側プライマー：ＴＧＧＣＣＡＡＡＡＣＣＡＣＣＴＴＡＴＴＣ（配列番号７０）
（ｃ）ｄｎａｆｏｒｍ４６８７０
５’側プライマー：ＴＧＧＣＡＡＴＧＧＴＡＣＴＧＴＴＧＧＡＣ（配列番号７１）
３’側プライマー：ＡＧＣＴＧＣＡＣＴＣＣＧＴＧＴＴＧＴＡＧ（配列番号７２）
定量結果はＧｌｙｃｅｒａｌｄｅｈｙｄｅ３−ｐｈｏｓｐｈａｔｅｄｅｈｙｄｒｏｇｅｎａｓｅ（ＧＡＰＤＨ）を内部標準として補正した。即ち、各組織での対象遺伝子の発現量（コピー数／μｌ）をＧＡＰＤＨの発現量（コピー数／μｌ）で除し、定数（１×１０^６）を乗して表示した。その結果を表３に示す。
【０１８８】
【表３】

【０１８９】
表３から明らかな通り、ｄｎａｆｏｒｍ２８９８３は眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少した。ｄｎａｆｏｒｍ３３０４２は全身で強く発現しており、特に肺、膵臓で強力に発現し、糖尿病の肝臓および結腸癌で発現が減少した。ｄｎａｆｏｒｍ４６８７０は発現量が極めて低く、脂肪組織や視床に弱く発現した。上記クローンのｃＤＮＡおよび該ｃＤＮＡによってコードされるタンパク質は、糖尿病や癌などの治療や診断に応用できる。また該ｃＤＮＡによってコードされるタンパク質は、上記のようなｍＲＮＡ発現の変動が見られる組織あるいはｍＲＮＡ発現量の多い組織に関わる疾患に関与している可能性がある。
【０１９０】
実施例８ハエホモログＤＮＡを用いたＲＮＡｉ法による機能解析
（１）マウスｃＤＮＡのハエホモログＤＮＡの解析および取得
上記で得られたマウス全長ｃＤＮＡの塩基配列（クローン名：ｄｎａｆｏｒｍ２８９８３、ｄｎａｆｏｒｍ３３０４２）に対するハエ遺伝子のホモログを以下に示す配列解析により予測した。配列解析は、ＯＲＦから翻訳されるタンパク質を考え、アミノ酸配列レベルで行った。マウスクローンｄｎａｆｏｒｍ２８９８３、ｄｎａｆｏｒｍ３３０４２として、配列番号３０、３４に示すアミノ酸配列を含むマウス全長ｃＤＮＡクローン（配列番号６、１０）とハエクローン（ＢｅｒｋｅｌｅｙＤｒｏｓｏｐｈｉｌａＧｅｎｏｍｅＰｒｏｊｅｃｔ（ＢＤＧＰ）ＤｒｏｓｏｐｈｉｌａＧｅｎｏｍｉｃＳｅｑｕｅｎｃｅＲｅｌｅａｓｅ３．０）との間においてペアワイズな配列比較をＮＣＢＩＢＬＡＳＴＰ２．２．２（Ａｌｔｓｃｈｕｌｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５，３３８９−３４０２（１９９７））により行い、２種のクローン間において互いに最も良いＥ−ｖａｌｕｅの値を示した関係にあるハエの遺伝子を、予測されたホモログＤＮＡとして同定した（Ｔａｔｕｓｏｖ，Ｋｏｏｎｉｎ＆Ｌｉｐｍａｎ，Ｓｃｉｅｎｃｅ２７８，６３１（１９９７））。結果として、マウスｃＤＮＡ（ｄｎａｆｏｒｍ２８９８３、ｄｎａｆｏｒｍ３３０４２）に対するハエホモログＤＮＡを見つけることができた。ハエホモログＤＮＡの遺伝子番号は、それぞれ、マウス：ｄｎａｆｏｒｍ２８９８３に対してハエ：ＣＧ４８２１（トランスクリプト番号：ＣＧ４８２１−ＰＢ）、マウス：ｄｎａｆｏｒｍ３３０４２に対してハエ：ＣＧ４６０３（トランスクリプト番号：ＣＧ４６０３−ＰＡ）であった。
【０１９１】
（２）ハエ系統の樹立
（ｉ）逆向き反復配列（ｉｎｖｅｒｔｅｄｒｅｐｅａｔ）ベクターの作製
上記ハエｃＤＮＡ（ＣＧ４８２１、ＣＧ４６０３）のＯＲＦ、５’側約５００ｂｐの断片（以下これを「目的のｃＤＮＡ」と称することがある）を、ハエのｃＤＮＡライブラリー（ＢｅｒｋｅｌｅｙＤｒｏｓｏｐｈｉｌａＧｅｎｏｍｅＰｒｏｊｅｃｔ（ｈｔｔｐ：／／ｗｗｗ．ｆｒｕｉｔｆｌｙ．ｏｒｇ）で同定されたｕｎｉｇｅｎｅｓｅｔ；Ｉｎｖｉｔｒｏｇｅｎ社）を鋳型としたＰＣＲによって増幅した。ＰＣＲプライマーは、ＣｐｏＩＡ７（配列番号７３：ＡＡＡＴＴＴＣＧＧＡＣＣＧの３’末端に、目的のｃＤＮＡの５’末端の２１ベースの塩基配列を結合させたもの）とＳｆｉＩＡ３（配列番号７４：ＡＡＡＴＴＴＧＧＣＣＡＴＡＴＡＧＧＣＣの３’末端に、目的のｃＤＮＡの３’末端の２１ベースの塩基配列を結合させたもの）のセット、およびＳｆｉＩＢ７（配列番号７５：ＡＡＡＴＴＴＧＧＣＣＴＡＣＡＴＧＧＣＣに記載の塩基配列の３’末端に、目的のｃＤＮＡの５’末端の２１ベースの塩基配列を結合させたもの）とＣｐｏＩＢ３（配列番号７６：塩基配列：ＡＡＡＴＴＴＣＧＧＴＣＣＧの３’末端に、目的のｃＤＮＡの３’末端の２１ベースの塩基配列を結合させたもの）のセットを用いた。
【０１９２】
上記の各セットのプライマーを用いてＰＣＲ増幅した約５００ｂｐのＤＮＡ断片をＳｆｉＩで消化し、この消化断片をハエクローニング用ベクター（ｐＵＡＳＴＣＳ１：上田龍他、細胞工学、ｖｏｌ２１，Ｎｏ．８，９２３−９３２（２００２））をＳｆｉＩで消化したサイト間に挿入しクローニングした。さらに、このベクターをＣｐｏＩで消化したサイト間に、上記ＰＣＲで増幅したＤＮＡ断片をＣｐｏＩ消化したＤＮＡ断片を挿入しクローニングした。この２回のサブクローニングにより、ハエｃＤＮＡのＯＲＦの約５００ｂｐの断片が、ＵＡＳ配列（ＧＡＬ上流活性化配列）の下流に隣接したヒートショックプロテイン７０のベーシックプロモーターの制御下に、逆向きで２カ所挿入されたベクター（ｉｎｖｅｒｔｅｄｒｅｐｅａｔベクター）が取得された。
【０１９３】
上記で用いたハエトランスフォーメション用ベクターであるｐＵＡＳＴベクターはトランスポゾンＰ因子を利用したベクターで、ＵＡＳ配列とヒートショックプロテイン７０のベーシックプロモーターを利用して、転写促進タンパク質ＧＡＬ４がＵＡＳ配列に結合することによりＵＡＳ配列の下流に挿入した逆向き反復配列の転写を誘導できるベクターである。
【０１９４】
（ｉｉ）ハエの形質転換
通常のＰ因子形質転換法である、上田龍他、細胞工学、ｖｏｌ２１，Ｎｏ．８，９２３−９３２（２００２）に記載の方法に則って、上記（ｉ）で調製したｉｎｖｅｒｔｅｄｒｅｐｅａｔベクターＤＮＡをＷ^１１１８系統のハエ（Ｉｎｄｉａｎａｓｔｏｃｋｃｅｎｔｅｒ：ｈｔｔｐ：／／ｆｌｙｂａｓｅ．ｂｉｏ．ｉｎｄｉａｎａ．ｅｄｕ／ｓｔｏｃｋｓ／ｆｂｓｔｏｃｋ．ｈｆｏｒｍ）の初期胚にマイクロマニュピレーターを用いて微量注入した。これを培養して孵化させ、成虫とした後に、上記文献記載の手順に準じて交配を行った。この交配で、ダブルバランサーとしてＷ^１１１８系統のＳｐ／ＳＭ１、Ｃｙ：Ｐｒ／ＴＭ３、ＳｂＳｅｒを用いた。この交配により、上記ｉｎｖｅｒｔｅｄｒｅｐｅａｔベクターが挿入した染色体を、ホモ接合に持ったハエ（以下、これを「ＩＲ系統」と称する）が作製された。
【０１９５】
（３）ＲＮＡｉ効果の誘導
（ｉ）ＧＡＬ４ドライバーとの交配による変異誘導
上記（２）で得られたＩＲ系統のハエをＡｃｔ５Ｃ−ＧＡＬ４系統のハエ（Ｉｎｄｉａｎａｓｔｏｃｋｃｅｎｔｅｒ：ｈｔｔｐ：／／ｆｌｙｂａｓｅ．ｂｉｏ．ｉｎｄｉａｎａ．ｅｄｕ／ｓｔｏｃｋｓ／ｆｂｓｔｏｃｋ．ｈｆｏｒｍ）と交配した（図１）。Ａｃｔ５Ｃ−ＧＡＬ４は、全身の細胞で発現する細胞性アクチン遺伝子（Ａｃｔ５Ｃ）のプロモーターに酵母ＧＡＬ４遺伝子をつないだｆｕｓｉｏｎｇｅｎｅを遺伝子導入した系統である。従って、このＡｃｔ５Ｃ−ＧＡＬ４導入遺伝子を持ったハエでは全ての細胞で、ＧＡＬ４タンパク質が発現している。
【０１９６】
ＩＲ系統のハエと、Ａｃｔ５Ｃ−ＧＡＬ４系統のハエを交配した子孫（Ｆ１世代、以下これを「ＲＮＡｉ個体」と称する）では、図１にあるように２種類の導入遺伝子が存在する。従って、全ての細胞でＧＡＬ４タンパク質が発現し、ＩＲベクターを強制転写するため、ｄｓＲＮＡが細胞に出現し、ＲＮＡｉ効果を発揮し、ターゲットｍＲＮＡが発現した場合にこれを分解する。従って、その個体の全ての細胞でターゲット遺伝子の機能阻害が起こる。ターゲットｍＲＮＡが発現していない細胞では何の効果ももたらさない。
【０１９７】
（４）表現型の解析および結果
上記（３）で誘導されたＲＮＡｉ効果で、それぞれのマウスｃＤＮＡ（ｄｎａｆｏｒｍ２８９８３、ｄｎａｆｏｒｍ３３０４２）のハエホモログＤＮＡ（ＣＧ４８２１、ＣＧ４６０３）がコードするタンパク質の機能が阻害されたことによるハエ個体の表現型の変化を観察した。その結果、ＣＧ４８２１のＲＮＡｉ個体およびＣＧ４６０３のＲＮＡｉ個体は致死、すなわち蛹にはなるが脱皮して成虫となる個体は０％であることが判明した。
【０１９８】
ＲＮＡｉ技術を用いて上記ハエ遺伝子の発現抑制を行い機能阻害することにより、ハエ個体が致死または半致死となったことから、該遺伝子は発生あるいは個体の生存・機能維持に重要な役割を果たしていることが分かった。前記の通り、ｄｎａｆｏｒｍ２８９８３（配列番号６）がコードするタンパク質（配列番号３０）は、腫瘍を制御する機能を有するプロテアーゼであることが推測されており、ＲＮＡｉ個体中においては、ハエホモログＤＮＡがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。また、ｄｎａｆｏｒｍ３３０４２（配列番号１０）がコードするタンパク質（配列番号３４）は、システインプロテアーゼであることが推測されており、マウスの全身で強く発現し癌組織では発現が減少していることから、ＲＮＡｉ個体中においては、ハエホモログＤＮＡがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。
上記の通り、ｄｎａｆｏｒｍ２８９８３およびｄｎａｆｏｒｍ３３０４２がコードするタンパク質はプロテアーゼ活性を有しており、発生・分化・生理的機能あるいは病態との関連で重要な役割を果たしていることが推察される。
【０１９９】
実施例９各完全長ｃＤＮＡがコードするタンパク質の総合的機能解析
上記実施例４の塩基配列の解析結果ならびに実施例５〜８の組織発現および機能解析結果から、本発明のタンパク質は、次の性質を有することが明らかとなった。
（１）ｄｎａｆｏｒｍ３７９０１（配列番号１、２５）
ｄｎａｆｏｒｍ３７９０１のオープンリーディングフレームから予測されるアミノ酸配列（配列番号２５）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例５より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、小脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【０２００】
（２）ｄｎａｆｏｒｍ４６３５０（配列番号２、２６）
ｄｎａｆｏｒｍ４６３５０のオープンリーディングフレームから予測されるアミノ酸配列（配列番号２６）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例５より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【０２０１】
（３）ｄｎａｆｏｒｍ９５７８（配列番号４、２８）
ｄｎａｆｏｒｍ９５７８のオープンリーディングフレームから予測されるアミノ酸配列（配列番号２８）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４より生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例５より、どの組織でも全体的により強く発現する傾向があるが、特に、精巣で強力に発現していることが示された。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、生殖細胞の生成や接着などの機能の制御に関わると考えられ、不妊や避妊、免疫疾患・炎症性疾患の治療薬となる可能性がある。
【０２０２】
（４）ｄｎａｆｏｒｍ２８９８３（配列番号６、３０）
ｄｎａｆｏｒｍ２８９８３のオープンリーディングフレームから予測されるアミノ酸配列（配列番号３０）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４より腫瘍を制御する機能を有するプロテアーゼであると推測された。また、本タンパク質は、実施例７より、眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少することが示された。また実施例８より、本タンパク質のハエホモログタンパク質（ＣＧ４８２１がコードするタンパク質）の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、ＣＧ４８２１のＲＮＡｉ個体は致死であったことから、ＲＮＡｉ個体中においては、ハエホモログＤＮＡがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、扁平上皮癌・網膜芽腫などの癌、糖尿病・肥満などの内分泌疾患、喘息などの呼吸器系疾患、などの治療薬となる可能性がある。
【０２０３】
（５）ｄｎａｆｏｒｍ２６１６３（配列番号９、３３）
ｄｎａｆｏｒｍ２６１６３のオープンリーディングフレームから予測されるアミノ酸配列（配列番号３３）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４よりメタロプロテアーゼの１種であるａｓｔａｃｉｎ様プロテアーゼであると推測された。また、本タンパク質に対するヒトオルソログタンパク質は、実施例６より、ＰｅｐｔｉｄａｓｅｆａｍｉｌｙＭ１２Ａに属する亜鉛を必要とするペプチド分解酵素であることが推測された。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、不妊・避妊、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【０２０４】
（６）ｄｎａｆｏｒｍ３３０４２（配列番号１０、３４）
ｄｎａｆｏｒｍ３３０４２のオープンリーディングフレームから予測されるアミノ酸配列（配列番号３４）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４よりシステインプロテアーゼであると推測された。また、本タンパク質は、実施例７より、全身で強く発現しており、特に肺、膵臓で強力に発現する一方で、糖尿病の肝臓および結腸癌で発現が減少していることが示された。また実施例８より、本タンパク質のハエホモログタンパク質（ＣＧ４６０３がコードするタンパク質）の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、ＣＧ４６０３のＲＮＡｉ個体は致死であったが、本タンパク質は、マウスの全身で強く発現し癌組織では発現が減少していることから、ＲＮＡｉ個体中においては、ハエホモログＤＮＡがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、肺・膵臓・卵巣などの癌、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【０２０５】
（７）ｄｎａｆｏｒｍ４６８７０（配列番号５８、６１）
ｄｎａｆｏｒｍ４６８７０のオープンリーディングフレームから予測されるアミノ酸配列（配列番号６１）を有するタンパク質（以下、「本タンパク質」と称する）は、実施例４より発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測された。また、本タンパク質は、実施例６において本タンパク質に対するヒトオルソログ分子を予測したところ本タンパク質と同様にＣＵＢ細胞外ドメインを持つことから、本タンパク質は、特に発生段階により制御される膜蛋白質と推測された。また、実施例７より、発現量が極めて低く、脂肪組織や視床に弱く発現していることが分かった。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、糖尿病・肥満などの内分泌疾患、骨粗しょう症、不妊などの治療薬となる可能性がある。
【０２０６】
【発明の効果】
本発明のタンパク質およびそれをコードするＤＮＡは、プロテアーゼ活性等を有することから、該タンパク質あるいはそれをコードするＤＮＡを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
【０２０７】
近年、プロテアーゼの生理機能に関する研究の進展にともない、プロテアーゼが細胞機能の重要な制御因子として機能していることが明らかになってきた。プロテアーゼ活性の制御を確実に行うことにより、生体反応を一方向に確実に進めるためには、プロテアーゼ反応が有利であることがわかり、タンパク質の限定分解が多くの重要な細胞機能の制御に関わっていることが明らかとなってきた。したがって、プロテアーゼ活性の異常は様々な疾患の原因となる。
【０２０８】
例えば、筋ジストロフィー症はＣＡＮＰと呼ばれる中性プロテアーゼの活性亢進が原因である。また、腫瘍組織が増殖或いは転移する際に、その養分補給を司る血管の新生が起こるが、その際、メタルプロテアーゼによるマトリックスの破壊が起こる。さらに、腫瘍増殖の場合には、システインプロテアーゼ（チオールプロテアーゼ）の活性亢進が生じることも知られている。このような場合には、関連するプロテアーゼの活性を抑制することが、関連疾患進行の阻止、或いは治療に結びつくと考えられる。
【０２０９】
逆に、プロテアーゼ活性が抑制されることにより、疾患が進行する例としては、アルツハイマー病に代表される神経変性疾患が上げられる。アルツハイマー病の場合は、β−アミロイドペプチドの蓄積が原因の一つと考えられており、それは分解酵素であるネプリライシンの異常が原因と考えられている。
【０２１０】
また、フィブリンの蓄積による血栓は、線溶系酵素であるプラスミン量を増加させることにより治療可能である。この目的のために、プラスミン前駆体タンパク質であるプラスミノーゲンのプラスミンへの変換を、セリンプロテアーゼの一種であるプラスミノーゲンアクチベーターにより促進する。
【０２１１】
上記の通り、プロテアーゼは、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、本発明のスクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、抗癌剤（抗腫瘍剤）、抗炎症剤、神経変性疾患治療剤等となり得る。
本出願は、２００２年４月１９日付けの日本特許出願（特願２００２−１１７７９４）、２００２年５月２日付けの日本特許出願（特願２００２−１３０８７１）、および２００２年１２月４日付けの日本特許出願（特願２００２−３５２５５９）に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【０２１２】
【配列表】

【図面の簡単な説明】
【図１】図１は、ＲＮＡｉ個体中の導入遺伝子の誘導方法を示す概念図である。

Claims

以下の（ａ）または（ｂ）のタンパク質。
（ａ）配列番号２５〜４８、６０〜６２、６５または６６のいずれかに記載のアミノ酸配列からなるタンパク質。
（ｂ）配列番号２５〜４８、６０〜６２、６５または６６のいずれかに記載のアミノ酸配列において１若しくは数個のアミノ酸が欠失、置換及び／または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
請求項１に記載のタンパク質をコードするＤＮＡ。
請求項１に記載のタンパク質をコードする完全長ｃＤＮＡ。
以下の（ａ）、（ｂ）又は（ｃ）の何れかのＤＮＡ。
（ａ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列を有するＤＮＡ。
（ｂ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列において、１若しくは数個の塩基が欠失、置換及び／または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ。
（ｃ）配列番号１〜２４、５７〜５９、６３または６４のいずれかに記載の塩基配列を有するＤＮＡとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするＤＮＡ。
請求項２〜４のいずれかに記載のＤＮＡを含む組換えベクター。
請求項２〜４のいずれかに記載のＤＮＡまたは請求項５に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
請求項６に記載の細胞により産生される、請求項１に記載の組み換えタンパク質。
請求項２〜４の何れかに記載のＤＮＡの塩基配列中の連続した５〜１００塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
請求項１または７に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
抗体がモノクローナル抗体である請求項９に記載の抗体。
モノクローナル抗体が請求項１または７に記載のタンパク質のプロテアーゼ活性を中和する作用を有することを特徴とする請求項１０に記載の抗体。
請求項１または７に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
請求項６に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているＤＮＡの発現レベルの変化を検出することを特徴とする、該ＤＮＡの発現調節物質のスクリーニング方法。
請求項１に記載のタンパク質のアミノ酸配列から選択される少なくとも１以上のアミノ酸配列情報、および／または請求項２〜４のいずれかに記載のＤＮＡの塩基配列から選択される少なくとも１以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
請求項１に記載のタンパク質、および／または請求項２〜４のいずれかに記載のＤＮＡを結合させた担体。