JP2004229640A - 新規タンパク質及びそれをコードするdna - Google Patents
新規タンパク質及びそれをコードするdna Download PDFInfo
- Publication number
- JP2004229640A JP2004229640A JP2003115750A JP2003115750A JP2004229640A JP 2004229640 A JP2004229640 A JP 2004229640A JP 2003115750 A JP2003115750 A JP 2003115750A JP 2003115750 A JP2003115750 A JP 2003115750A JP 2004229640 A JP2004229640 A JP 2004229640A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- seq
- amino acid
- sequence
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
【課題】カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案すること。
【解決手段】以下の (a) または (b) のタンパク質。(a)複数の特定のアミノ酸配列からなるタンパク質。(b)a記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【選択図】 なし
【解決手段】以下の (a) または (b) のタンパク質。(a)複数の特定のアミノ酸配列からなるタンパク質。(b)a記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【選択図】 なし
Description
【0001】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
cDNAの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長cDNAをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるcDNAに重複がないという意味であり、各cDNAが1種類ずつ含まれているライブラリーのことである。
【0003】
完全長cDNAクローニング法については、特開平9−248187号公報及び特開平10−127291号公報に記載されている。この方法は、mRNAの5’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたmRNAを鋳型とし、oligo dTをプライマーとして逆転写によりRNA−DNA複合体を作製し、この複合体の内、mRNAの完全長に対応するDNAを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【0004】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている(特開平10−84961号公報)。さらに、合成された完全長cDNAライブラリーに含まれるDNA断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている(特開平11−9273号公報)。
【0005】
このような技術により作製された完全長cDNAライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))。
かくして得られるカタログ化された完全長cDNAライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えば、その塩基配列は同定されるが、該cDNAがコードするタンパク質の生理活性は依然不明のままである。
【0006】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0007】
【課題を解決するための手段】
本発明者らは、マウス完全長cDNAライブラリー中のcDNAクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列にプロテアーゼ活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質がプロテアーゼ活性を有すると同定した。また、(i)これらのcDNAの各組織における発現量を解析し、(ii)該cDNAがコードするタンパク質の発現を阻害した個体の表現型の変化を解析し、(i)および/または(ii)の解析結果から該cDNAがコードするタンパク質の有する機能を総合的に解析した。さらに、これらのcDNAに対する新規なヒトのオルソログDNAを取得し解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0008】
すなわち本発明によれば、以下の(1)〜(15)に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【0009】
(2) (1)に記載のタンパク質をコードするDNA。
(3) (1)に記載のタンパク質をコードする完全長cDNA。
(4) 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。
(c)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。
【0010】
(5) (2)〜(4)のいずれかに記載のDNAを含む組換えベクター。
(6) (2)〜(4)のいずれかに記載のDNAまたは(5)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(7) (6)に記載の細胞により産生される、(1)に記載の組み換えタンパク質。
(8) (2)〜(4)の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【0011】
(9) (1)または(7)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(10) 抗体がモノクローナル抗体である(9)に記載の抗体。
(11) モノクローナル抗体が(1)または(7)に記載のタンパク質のプロテアーゼ活性を中和する作用を有することを特徴とする(10)に記載の抗体。
【0012】
(12) (1)または(7)に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
(13) (6)に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
【0013】
(14) (1)に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または(2)〜(4)のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(15) (1)に記載のタンパク質、および/または(2)〜(4)のいずれかに記載のDNAを結合させた担体。
【0014】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得及び塩基配列の解析
本発明のDNAは、配列番号25〜48、60〜62、65または66に記載のアミノ酸配列からなるタンパク質、またはアミノ酸配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば20個以下、好ましくは15個以下、より好ましくは10個以下、さらに好ましくは5個以下を意味する)のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0015】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜24、57〜59、63または64に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号1531〜2631、配列番号2の塩基番号992〜4270、配列番号3の塩基番号8〜1459、配列番号4の塩基番号1〜2034、配列番号5の塩基番号10〜411、配列番号6の塩基番号75〜848、配列番号7の塩基番号98〜1351、配列番号8の塩基番号526〜2244、配列番号9の塩基番号256〜1500、配列番号10の塩基番号68〜1042、配列番号11の塩基番号280〜1191、配列番号12の塩基番号344〜958、配列番号13の塩基番号159〜1190、配列番号14の塩基番号476〜979、配列番号15の塩基番号227〜1582、配列番号16の塩基番号174〜1493、配列番号17の塩基番号134〜1453、配列番号18の塩基番号167〜1486、配列番号19の塩基番号16〜1335、配列番号20の塩基番号76〜1326、配列番号21の塩基番号26〜1345、配列番号22の塩基番号466〜1476、配列番号23の塩基番号277〜3342、配列番号24の塩基番号623〜1411、配列番号57の塩基番号332〜826、配列番号58の塩基番号819〜2102、配列番号59の塩基番号1110〜1889、配列番号63の塩基番号1〜1296、配列番号64の塩基番号1〜1680に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’及び/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0016】
本発明のDNAは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてcDNAを合成するが、このとき完全長のcDNAを合成するために5’キャップ(7MeGpppN)サイトに特異的なジオール構造にタグになる分子を化学結合させ、このmRNAを鋳型としてoligo dTをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のcDNAのみを分離する方法(特開平9−248187号公報、特開平10−127291号公報)を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法(特開平10−84961号公報)を用いるのが好ましい。ここで、高温下とは40〜80℃を意味する。
【0017】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のDNAを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター(特開平11−9273号公報)が好ましく用いられる。かくして得られるcDNAライブラリーは、全てのクローンが均一に存在している(以下、これを「カタログ化されている」と称することがある)訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法(特開2000−325080号公報、Carninci, P. et al.,Genomics, 37, 327−336(1996))を用いることが好ましい。
【0018】
カタログ化されたcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、cDNA全長の場合にはその末端100ベースの配列について得られた塩基配列を、BLAST(http://www.ncbi.nlm.nih.gov/BLAST/;National Center of Biotechnology Information)を用いて、NCBIのGenbank、EMBL、DDBJ、PDB等のデータベースについて検索し、最も高い相同性を示す配列でも相同性が30%以下であり、かつ該DNAの翻訳領域の全長について最も高い相同性を示す配列でもその相同性が40%以下であるものを新規として以下の解析に供することとした。
【0019】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜24、57〜59、63または64に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号1531〜2631、配列番号2の塩基番号992〜4270、配列番号3の塩基番号8〜1459、配列番号4の塩基番号1〜2034、配列番号5の塩基番号10〜411、配列番号6の塩基番号75〜848、配列番号7の塩基番号98〜1351、配列番号8の塩基番号526〜2244、配列番号9の塩基番号256〜1500、配列番号10の塩基番号68〜1042、配列番号11の塩基番号280〜1191、配列番号12の塩基番号344〜958、配列番号13の塩基番号159〜1190、配列番号14の塩基番号476〜979、配列番号15の塩基番号227〜1582、配列番号16の塩基番号174〜1493、配列番号17の塩基番号134〜1453、配列番号18の塩基番号167〜1486、配列番号19の塩基番号16〜1335、配列番号20の塩基番号76〜1326、配列番号21の塩基番号26〜1345、配列番号22の塩基番号466〜1476、配列番号23の塩基番号277〜3342、配列番号24の塩基番号623〜1411、配列番号57の塩基番号332〜826、配列番号58の塩基番号819〜2102、配列番号59の塩基番号1110〜1889、配列番号63の塩基番号1〜1296、配列番号64の塩基番号1〜1680に示される配列を有するものが挙げられる。
【0020】
かくして取得された新規な塩基配列を、BLAST(Basic local alignment search tool;Altschul, S.F., et al.,J. Mol. Biol., 215, 403−410(1990)) による相同性検索 (homology search)や、HMMER(隠れMarkovモデルによる配列解析手法; Eddy, S. R., Bioinformatics 14, 755−763 (1998)) の機能群のひとつである HMMPFAM(http://pfam.wustl.edu)による蛋白質特徴検索 (profile search)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0021】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のDNAのこれに対応する部分とのidentityがe−valueとして10−4以下のものか、あるいは30%以上のものを示す。
【0022】
例えば、上位にヒットした触媒ドメイン配列の多くがプロテアーゼとしての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、プロテアーゼ活性を持つであろうという予測が成り立つ。
【0023】
HMMPFAMでは、Pfamという蛋白質プロファイルを集積したデータベース中にあるエントリーが有する塩基配列の特徴を、解析対象である塩基配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【0024】
配列番号1に記載の塩基配列がコードするアミノ酸配列(配列番号25)は、BLASTサーチにより、ADAMTS18 proteinとe−value:0.0、708アミノ酸残基で75%の相同性を、metalloprotease disintegrin 16 with thrombospon din type I motifとe−value:0.0、671アミノ酸残基で61%の相同性を、A disintegrin and metalloproteinase with thrombospondin motifs 12とe−value:5×10−152で、702アミノ酸残基で42%の相同性を、さらにA disintegrin and metalloproteinase with thrombospondin motifs 10と相同性を有する。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号412−1137がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)が見出される。
これらの結果から、配列番号1に示す塩基配列がコードするアミノ酸配列からなるタンパク質はmetalloproteinasesであると推測される。また、このタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが推測される。
【0025】
配列番号2に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、ADAMTS18 proteinとe−value:0.0、807アミノ酸残基で90%の相同性を、ADAMTS16とe−value:0.0、816アミノ酸残基で61%の相同性を、さらにADAMTS12とe−value:0.0、786アミノ酸残基で43%の相同性を有する。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号1354−1969がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)が見出される。また、塩基番号796−1172がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる塩基配列)が見出される。
これらの結果より、配列番号2に示す塩基配列がコードするアミノ酸配列からなるタンパク質はmetalloproteinasesであると推測される。このタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが推測される。
【0026】
配列番号3に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Probable serine protease HTRA4 precursorとe−value:5×10−175、470アミノ酸残基と67%の相同性を、insulin−like growth factor binding protein 5 proteaseとe−value:5×10−147、485アミノ酸残基と55%の相同性を有する。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号559−1111がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号3に示す塩基配列がコードするアミノ酸配列からなるタンパク質はセリンプロテアーゼであると推測される。
【0027】
配列番号4に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、metalloprotease/disintegrinとe−value:5×10−154、297アミノ酸残基と85%の相同性を、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)とe−value:5×10−152、641アミノ酸残基と43%の相同性を、さらにADAM 18 precursor (A disintegrin and metalloproteinase domain 18)と、e−value:5×10−151、642アミノ酸残基と43%の相同性を有する。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号559−1152がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列(PfamにReprolysinとしてエントリーされる塩基配列)、塩基番号190−528がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)が見出される。
これらの結果より、配列番号4に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。また、このタンパク質は、文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが推測される。
【0028】
配列番号5に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、transmembrane protein tMDC Iとe−value:3×10−17、118アミノ酸残基と43%の相同性を、tMDC Iとe−value:6×10−17、118アミノ酸残基と42%の相同性を、さらにADAM 18 precursor (A disintegrin and metalloproteinase domain 18)とe−value:2×10−16、113アミノ酸残基と46%の相同性を有する。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号199−472がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)が見出される。
これらの結果より、配列番号5に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが推測される。
【0029】
配列番号6に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 10 from Patent WO0136645とe−value:2×10−75、286アミノ酸残基と49%の相同性を、Serine protease DESC1 precursorとe−value:3×10−75、283アミノ酸残基と48%の相同性を、airway trypsin−like proteaseとe−value:1×10−72、282アミノ酸残基と47%の相同性を有する。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号150−827がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号6に示す塩基配列がコードするタンパク質は細胞の増殖や接着を制御するセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から扁平上皮細胞癌で発現が抑制されていることが推測される。
【0030】
配列番号7に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 10 from Patent WO0136645とe−value:5×10−113、418アミノ酸残基と51%の相同性を、airway trypsin−like proteaseとe−value:2×10−96、419アミノ酸残基と42%の相同性を、さらにAirway trypsin−like protease precursorとe−value:6×10−95、420アミノ酸残基と41%の相同性を有する。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号653−1330がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号7に示す塩基配列がコードするタンパク質はトリプシン様セリンプロテアーゼであると推測される。このタンパク質は、文献情報(Biol Chem 1998 May 8;273(19):11895−901)から慢性的気管疾患患者の痰から得られ、気管での発現が顕著に高いことが推測される。
【0031】
配列番号8に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 7 from Patent WO0157194とe−value:5×10−104、418アミノ酸残基と37%の相同性を、serine protease TADG15とe−value:5×10−103、650アミノ酸残基と39%の相同性を、さらにMembrane−type serine protease 1とe−value:5×10−103、650アミノ酸残基と39%の相同性を有する。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号1528−2217がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号8に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は文献情報(J Biol Chem 1999 Jun 25;274(26):18231−6)からヒト乳癌に関係することが推測される。
【0032】
配列番号9に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、hatching enzyme EHE7とe−value:2×10−48、247アミノ酸残基と40%の相同性を、High choriolytic enzyme 2 precursor(Hatching enzymezinc−protease HCE 2 subunit)とe−value:2×10−42、246アミノ酸残基と40%の相同性を有する。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号466−1041がコードするアミノ酸配列にメタロプロテアーゼであるastacinの特徴を示す配列(PfamにAstacinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号9に示す塩基配列がコードするタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報(Dev Biol 1992 Oct;153(2):250−8)からastacin (protease)に属することが推測される。
【0033】
配列番号10に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:8×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:2×10−33、280アミノ酸残基と36%の相同性を有する。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号10に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0034】
配列番号11に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:8×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:3×10−33、278アミノ酸残基と35%の相同性を有する。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号604−951がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号11に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0035】
配列番号12に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:2×10−54、207アミノ酸残基と51%の相同性を、Hypothetical 33.5 kDa proteinとe−value:4×10−31、203アミノ酸残基と36%の相同性を有する。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号398−745がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号12に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0036】
配列番号13に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:7×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:3×10−33、278アミノ酸残基と35%の相同性を有する。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号603−950がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号13に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0037】
配列番号14に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:3×10−54、201アミノ酸残基と52%の相同性を、Hypothetical 33.5 kDa proteinとe−value:4×10−31、203アミノ酸残基と36%の相同性を有する。
また、配列番号14に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号14に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0038】
配列番号15に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 5 from Patent WO0157081とe−value:0.0、469アミノ酸残基と94%の相同性を、Aqualysin I precursorとe−value:5×10−45、355アミノ酸残基と34%の相同性を有する。
また、配列番号15に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号714−1602がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列(PfamにPeptidase_S8としてエントリーされる配列)が見出される。
これらの結果から、配列番号15に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。
【0039】
配列番号16に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:2×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:2×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:1×10−88、439アミノ酸残基に亘り40%の相同性を有する。
また、配列番号16に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号795−1472がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号16に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらの文献情報等により、配列番号16に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0040】
配列番号17に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、Airway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基と40%の相同性を有する。
また、配列番号17に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号755−1432がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号17に示す塩基配列がコードするアミノ酸配列はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号17に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0041】
配列番号18に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基と40%の相同性を有する。
また、配列番号18に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号788−1465がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号18に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号18に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0042】
配列番号19に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基に亘り40%の相同性を有する。
また、配列番号19に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号637−1314がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号19に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号19に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0043】
配列番号20に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 1 from Patent WO0173074とe−value:5×10−122、417アミノ酸残基と51%の相同性を、Airway trypsin−like protease precursorとe−value:5×10−93、420アミノ酸残基と40%の相同性を、さらにairway trypsin−like proteaseとe−value:2×10−92、420アミノ酸残基と38%の相同性を有する。
また、配列番号20に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号628−1305がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号20に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号20に示す塩基配列がコードするタンパク質は、さらに上皮における炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0044】
配列番号21に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、testes−specific protein TSP50とe−value:5×10−128、439アミノ酸残基と54%の相同性を、Brain−specific serine protease 4 precursorとe−value:2×10−36、281アミノ酸残基と33%の相同性を、さらにMarapsin precursorとe−value:1×10−35、253アミノ酸残基と32%の相同性を、さらにTestisin precursorとe−value:9×10−35、273アミノ酸残基と32%の相同性を有する。
また、配列番号21に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号522−1246がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号21に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報(Biochem Biophys Res Commun 1998 Nov 18;252(2):307−12)から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが推測される。 これらのことから、配列番号21に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであると推測される。
【0045】
配列番号22に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、機能未知蛋白質とe−value:0.0、355アミノ酸残基と98%の相同性を、KIAA1203 proteinとe−value:4×10−23、118アミノ酸残基と50%の相同性を、Homo sapiens deubiquitinating enzyme UnpESとe−value:2×10−8、66アミノ酸残基に亘り48%の相同性を、さらにUbiquitin carboxyl−terminal hydrolase 4とe−value:2×10−8、66アミノ酸残基と48%の相同性を有する。
また、配列番号22に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号2−205がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)が見出される。
これらの結果より、配列番号22に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号22に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【0046】
配列番号23に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、機能未知蛋白質とe−value:0.0、827アミノ酸残基と99%の相同性を、KIAA1203 proteinとe−value:1×10−67、234アミノ酸残基と55%の相同性を、さらにubiquitin−specific proteaseとe−value:8×10−56、653アミノ酸残基と29%の相同性を有する。
また、配列番号23に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号244−337がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−1としてエントリーされる配列)が見出される。また、塩基番号1885−2070がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)が見出される。
これらの結果より、配列番号23に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号23に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【0047】
配列番号24に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、carboxypeptidase homologとe−value:1×10−93、331アミノ酸残基と48%の相同性を、Carboxypeptidase B precursorとe−value:2×10−92、327アミノ酸残基と48%の相同性を、さらにCarboxypeptidase B precursorとe−value:4×10−90、330アミノ酸残基と46%の相同性を有する。
また、配列番号24に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号509−1357がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列(PfamにZn_carbOpeptとしてエントリーされる配列)が見出される。
これらの結果より、配列番号24に示す塩基配列がコードするタンパク質はカルボキシペプチダーゼであると推測される。この蛋白質は、文献情報(J Biol Chem 1988 Nov 25;263(33):17837−45)から、膵臓に発現するカルボキシペプチダーゼであることが、また他の文献情報(J Biol Chem 1992 Feb 5;267(4):2575−81)から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが推測される。これらのことから、配列番号24に示す塩基配列がコードするタンパク質は、さらに膵臓疾患に関わるカルボキシペプチダーゼであると推測される。
【0048】
配列番号57に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Homo sapiens complement C1r−like proteinase precursorとe−value:1×10−49、152アミノ酸残基に亘り63%の一致度で、またHomo sapiens cDNA FLJ14022 weakly similar to COMPLEMENT C1R COMPONENT PRECURSORとe−value:1×10−48、152アミノ酸残基に亘り62%の一致度で、さらにHuman mRNA for complement component C1rとe−value:7×10−18、103アミノ酸残基に亘り39%の一致度でヒットする。
これらの結果より、配列番号57に示す塩基配列がコードするタンパク質は 補体系のメタロプロテアーゼであると推測される。
【0049】
配列番号58に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、X.laevis mRNA for xolloidとe−value:2×10−58、436アミノ酸残基に亘り30%の一致度で、またDorsal−ventral patterning tolloid protein precursorとe−value:4×10−58、445アミノ酸残基に亘り30%の一致度で、さらにBone morphogenetic protein 1 precursorとe−value:7×10−57、436アミノ酸残基に亘り30%の一致度でヒットする。
また、配列番号61に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号61のアミノ酸番号30−370のアミノ酸配列に3箇所にわたってCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)が見出される。
これらの結果より、配列番号58に示す塩基配列がコードするタンパク質は分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測される。
【0050】
配列番号59に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus CSMD1 (Csmd1)とe−value:5×10−108、257アミノ酸残基に亘り68%の一致度で、またHomo sapiens CUB and sushi multiple domains protein 1 short formとe−value:1×10−48、153アミノ酸残基に亘り67%の一致度でヒットする。
また、配列番号62に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと、配列番号62のアミノ酸番号25−382および203−256のアミノ酸配列にわたってComplement control protein (CCP) modules またはshort consensus repeats (SCR)の特徴を示す配列(Pfamにsushiとしてエントリーされる配列)が見出され、アミノ酸番号87−195のアミノ酸配列にCUB domainの特徴を示す配列(PfamにCUBとしてエントリーされる配列)が見出される。これらの結果より、配列番号59に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであると推測される。
【0051】
本発明のDNAは、翻訳配列中に塩基の欠失もしくは挿入を有した状態で取得されることがあるが、上記のような相同性検索やたんぱく質特徴検索を行った結果、該DNAの塩基配列中の欠失もしくは挿入が推測された場合には、当業者において通常用いられているライブラリースクリーニングやPCRクローニング等の方法を用いて塩基の欠失もしくは挿入の無い完全長cDNAを取得することができる。かくして得られる完全長cDNAを用いて本発明のタンパク質を発現させ、これを機能解析に用いることができる。
【0052】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜24、57〜59、63または64に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば60個以下、好ましくは30個以下、より好ましくは20個以下、さらに好ましくは10個以下、特に好ましくは5個以下を意味する。)の塩基が欠失、置換及び/または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつプロテアーゼ活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号25〜48、60〜62、65または66に記載のタンパク質のアミノ酸配列において1若しくは数個のアミノ酸配列が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードするものが含まれる。
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜24、57〜59、63または64に記載の塩基配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
【0053】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0054】
また、配列番号1〜24または57〜59に記載の塩基配列は、マウスを由来とするものであるが、上記したcDNAライブラリーの作製法に従ってヒトのcDNAライブラリーを作製し、該ライブラリーに対して配列番号1〜24または57〜59の塩基配列を有するDNA断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号1〜24または57〜59に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNA(以下、これを「ヒトホモログDNA」と称することがある)を取得することもできる。本発明の配列番号1〜24または57〜59に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトホモログDNAも含まれる。
【0055】
また、インフォマティックスを利用して、ヒトホモログDNAが有する塩基配列を予測し、該塩基配列を基に上記のヒトcDNAライブラリーなどからヒトホモログDNAを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、(i)目的とするcDNAの塩基配列をクエリーとして、ヒト等のcDNAデータベース(インフォマティックスにより予測されるcDNAデータベースを含む)に対しBLASTなどを用いて相同性検索を行う方法や、(ii)目的とするcDNAの塩基配列をクエリーとして、ヒト等のESTデータベースに対しBLASTなどを用いて相同性検索を行い、ヒットしたESTが有する配列を目的とするcDNAの塩基配列を参照して連結する方法、さらに(iii)目的とするcDNAの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しBLASTなどを用いて相同性検索を行い、目的とするcDNAの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してGenscan(http:// genes. mit.edu/GENSCAN.html)やSim4(Genome Res., 8: 976−74 (1998))等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【0056】
マウス由来のcDNAのヒトホモログDNAの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号1〜24、57〜59に記載の塩基配列を有するcDNAはいずれも新規であり、上記(i)の方法では、ヒトホモログDNAの塩基配列を取得できないと考えられるため、(ii)あるいは(iii)に記載の方法などが好ましく用いられる。
【0057】
かくして予測されたヒトホモログDNAの塩基配列を基に、上記のヒトcDNAライブラリーから、配列番号1〜24、57〜59に記載の塩基配列を有するDNAに対するヒトホモログDNAを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログDNAの5’端、および3’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトcDNAライブラリーを鋳型としてPCRを行う方法や、予測されたヒトホモログDNAの一部の配列をプローブとして、上記ヒトcDNAライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【0058】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログDNAの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。2種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【0059】
つまり、上記でホモログとして取得されたヒト由来のDNAは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のDNAがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける同一の機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【0060】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。(i)まず、本発明のcDNAの塩基配列と、取得されたヒトホモログDNAの塩基配列について相同性を解析する。次に、本発明のcDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、(ii)取得されたヒトホモログDNAの塩基配列と、対応する本発明のcDNAの塩基配列について相同性を解析する。次に、取得されたヒトホモログDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のcDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記(i)および(ii)を確認することにより、取得されたヒトホモログDNAが、本発明のcDNAに対応するヒトオルソログDNAであると同定することができる。上記(i)および(ii)に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記(i)および(ii)に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【0061】
かくして取得されたヒトホモログDNA、あるいはオルソログDNAの塩基配列を、BLASTによる相同性検索やHMMPFAMによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定および確認することができる。
さらに、取得されたヒトホモログDNAの完全長cDNAを用いて本発明のタンパク質を発現させ、これを活性の確認および機能解析等に用いることができる。
【0062】
本発明のcDNAのヒトオルソログDNAとして、例えば配列番号63または64に記載の塩基配列を有するDNAが挙げられ、また本発明のタンパク質のヒトオルソログタンパク質として、配列番号65または66に記載のアミノ酸配列を有するタンパク質等が挙げられる。
【0063】
配列番号63に記載の塩基配列がコードするアミノ酸配列(配列番号65)についてHMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号92−283に、Astacin (Peptidase family M12A) (PfamにAstacinとしてエントリーされるアミノ酸配列)を見出した。Peptidase family M12Aに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号63に記載の塩基配列がコードするアミノ酸配列は、Peptidase family M12Aに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【0064】
配列番号64に記載の塩基配列がコードするアミノ酸配列(配列番号66)に関して、BLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中に、配列番号61に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、配列番号58に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【0065】
配列番号66に記載のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号30−140、145−252、257−370にCUB domainの特徴を示す配列(PfamにCUB としてエントリーされるアミノ酸配列)を見出した。CUBドメインは、110アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質(補体系のプロテアーゼ等)に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号66に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムtmHMM(S. Moller, M.D.R. Croning, R. Apweiler.Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics, 17(7):646−653, 2001.)を用いて膜貫通部位を予測したところ、C末端のアミノ酸残基(アミノ酸番号536−558)に膜貫通部位が予測された。
以上のことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の1つであることが推測された。
【0066】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号25〜48、60〜62、65または66に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1若しくは数個のアミノ酸が置換、欠失、及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するものも含まれる。
【0067】
本発明のタンパク質の取得方法としては、上記(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0068】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したプロテアーゼ活性を有するものであれば本発明の範囲に含まれる。
【0069】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0070】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0071】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0072】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol.Biol.,53,154, (1970))、リン酸カルシウム法(Science,221,551, (1983))、DEAEデキストラン法(Science,215,166,(1982))、インビトロパッケージング法(Proc.Natl.Acad. Sci.USA,72,581,(1975))、ウィルスベクター法(Cell,37,1053,(1984))、および電気パルス法(Chu.et al.,Nuc.Acids Res.,15,1331(1987))等が挙げられる。
【0073】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263, 7406, (1988))とその宿主であるSf−9(J.Biol.Chem.,263,7406,(1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291,(1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc.Natl.Acad. Sci. USA,77,4216, (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7(ATCC CRL1651:アメリカンタイプカルチャーコレクション保存細胞)が用いられる。
【0074】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(A.A.Vertes et al.,Biosci.Biotechnol. Biochem.,57,2036,(1993))、あるいはトランスポゾンや挿入配列(A.A. Vertes et al. , Molecular Microbiol.,11,739, (1994))等を用いてDNA導入体を作製することもできる。
【0075】
得られた培養物は細胞、あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
【0076】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0077】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、プロテアーゼ活性を有するものであれば、本発明のタンパク質に含まれる。
かくして得られたタンパク質は、他のタンパク質、DNAとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0078】
(3)オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【0079】
該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜24、57〜59、63または64のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0080】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【0081】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するRNAインターフェアレンス法(以下、これを「RNAi法」と称することがある)に用いることができる。RNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411, 494−498(2001))に記載の方法等を用いることができる。また、上記2本鎖RNAは必ずしも全てがRNAである必要はなく、例えば、WO02/10374号公報に記載のもの等も用いることができる。
【0082】
ここで、標的遺伝子としては、本発明のDNAであれば、如何なるものであってもよい。これらDNAの少なくとも一部の塩基配列と実質的に同一な配列からなる2本鎖RNA(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までの如何なる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5, 115−180(1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase:Bass, B.L., Nature, 411, 428−429(2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’、5’oligoadenylate synthetase(Bass, B.L., Nature, 411, 428−429(2001))を介してRnase Lの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、より好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’、または3’末端が一部突出したものも含むが、3’末端が一部突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0083】
2本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法として具体的には、例えば、合成した1本鎖ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0084】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0085】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【0086】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0087】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
RNAインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0088】
(4)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。
【0089】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0090】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0091】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0092】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein,et al.,Nature,256, 495(1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0093】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(U. Zimmer− mann. et al., Naturwissenschaften,68, 577(1981))によっても行うことができる。
【0094】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0095】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256−259 (1988); Duchosal, M. A., et al., Nature, 355, 258−262( 1992))。
【0096】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0097】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するプロテアーゼ活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0098】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0099】
(5)本発明のタンパク質が有する活性の確認および機能の解析
本発明のタンパク質は、これを上記(2)に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記(1)で推測した活性を有していることを確認することができる。さらに上記(4)のとおりに作製した抗体等との組み合わせにより解析することもできる。
本発明のタンパク質が、プロテアーゼ活性を有することは、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる活性測定方法により解析することができる。
【0100】
具体的には、プロテアーゼ活性の測定に用いられる反応液としては、トリプシン、キモトリプシン、エラスターゼ等が属するセリンプロテアーゼに関しては中性から弱塩基性の緩衝液、パパイン、カテプシン等が属するシステインプロテアーゼには中性から弱酸性の緩衝液、ペプシン、キモシン等が属するアスパラギン酸プロテアーゼには酸性溶液、カルボキシペプチダーゼA、B、サーモリシン等が属する金属プロテアーゼには中性緩衝液が用いられ、Ca2+、Zn2+等の金属イオンが要求される場合は、これらを添加する。
【0101】
基質としては、種々のペプチドおよびタンパク質が用いられる。ペプチドを用いる場合、ペプチド結合が加水分解された際に7−amino−4−methyl−coumarin或いはp−nitroanilineが遊離するように、切断アミノ酸残基のカルボキシル末端側に4−metho−coumaryl−7−amide基およびp−nitroanilide基を結合した基質を設計しておけば、前者は蛍光で、後者は可視での分光的測定が可能である。タンパク質基質を用いる場合は、基質タンパク質或いはウシ血清アルブミン、カゼイン等の多くのプロテアーゼ基質となり得るタンパク質に酵素を作用させ、切断の有無を電気泳動法或いはクロマトグラフィーによって確認する。
【0102】
本発明のタンパク質であるプロテアーゼが有する活性は、上記の通り確認することができるが、これらの方法に限定されるものではない。また、これらの活性測定系は、後述する本発明のタンパク質の機能賦活物質(アゴニストなど)や機能阻害物質(アンタゴニストなど)のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【0103】
また、本発明のタンパク質の機能解析の方法として一般的には、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入して表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。また、このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【0104】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA法、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質に公知のバリアントが存在する場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象cDNAと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0105】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0106】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、対象タンパク質に公知のバリアントが存在する場合には、公知のものも同様に細胞へ導入し、比較解析することにより、対象タンパク質が関連する表現型を同定することができる。また、本発明のタンパク質は酵素活性またはタンパク質分解酵素阻害活性を有するものであることがわかっているので、これらの酵素またはタンパク質分解酵素阻害タンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0107】
(iv)の方法では、上記(3)に記載したオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に、公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0108】
(6)本発明のタンパク質が有する活性を調節する物質のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0109】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まず本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する機能(プロテアーゼ活性)の変化を指標として被検物質を選抜する方法を用いることができる。
【0110】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質との相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(4)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【0111】
プロテアーゼ活性の変化の解析は、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。具体的には、上記(5)に記載の方法等を用いて行うことができる。
前記の通り、本発明のプロテアーゼ活性を有するタンパク質は、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、上記スクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、関節炎などの炎症性疾患、免疫性疾患、肺癌、膵臓癌、卵巣癌、扁平上皮癌、網膜芽腫などの癌、運動統合機能障害、神経変性疾患、脊髄小脳変性症などの中枢性疾患、糖尿病や肥満などの内分泌疾患、喘息などの呼吸器系疾患、骨粗鬆症、不妊症などの治療薬や避妊薬として用いることができる。
【0112】
ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のDNA、あるいは組み換えタンパク質については、上記したヒトホモログDNAあるいはヒトホモログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【0113】
かかるプロテアーゼ活性の調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0114】
(7)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、上記(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0115】
被検物質としては、上記(6)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0116】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0117】
(8)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0118】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0119】
(9)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNA及びその部分断片は、それらを基盤上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。
【0120】
ここで、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0121】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。このDNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD−R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0122】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 cDNAライブラリーの調製
(1)mRNAの調製
mRNA調製マウス(C57BL/6)各器官または組織0.5〜1gを10mlの懸濁液でホモジェナイズし、pH4.0 の2M 酢酸ナトリウム1ml と、同量のフェノール/クロロホルム(体積比5:1)混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、RNAが水相から分離沈澱した。この試料を氷の上で1時間インキュベーションした後、15分間4,000rpmで冷却遠心機にかけ、沈澱物を回収した。この検体を70%エタノールで洗い、8mlの水に溶解後2mlの5M NaCl、1 % CTAB(cetyltrimethy− lammonium bromide)、4M尿素、50mM Trisを含むpH7.0 の水溶液16mlを加えることでRNAを沈澱させ、ポリサッカライドを除いた(CTAB沈澱)。
【0123】
続いて室温で4,000rpm、15分間遠心機にかけ、RNAを4mlの7Mグアニジン−Clに溶解した。そして2倍量のエタノールを加えた後、氷上で1時間インキュベーションし、4,000rpm、15分間遠心機にかけ、生じた沈澱物を70%エタノールで洗いRNAを回収した、これを再度水に溶解し、RNAの純度をOD比260/280(>1.8)と230/260(<0.45)を読むことによって計測した。
【0124】
(2)第1鎖cDNAの調製
上記(1)で調製したmRNA 15μgを使って逆転写酵素3,000unit により、最終容量165μlの反応液中で、5−メチル−dCTP、dATP、dTTP、dGTPを各々0.54mM、0.6Mトレハロース、50mM Tris−HCl(pH8.3)、75mM KCl、3mM MgCl2、10mM DTT、52ng/μl BSA、RNaseインヒビター5unitの条件下で逆転写反応を行った。制限酵素XhoIの認識配列を含むオリゴヌクレオチド(配列番号49)(配列中、VはA,G又はCを示し、NはA,G,C又はTを示す)12.6μlをプライマーとして用いた。
【0125】
この反応を始める際、反応液の1/4を採取し、それに1.5μlの[α−32P]−dGTP(3000Ci/mmol、10μCi/μl;Amersham社製)を加えるこことにより、第1鎖cDNAの合成効率を測定した。RI標識した反応液の0.5μlをDE−81ペーパー上にスポットし、0.5Mリン酸ナトリウム緩衝液(pH7.0)で3回洗った前後のRI活性を測定し、計算した。その後、RI標識した反応液と非標識の反応液を混合し、0.5M EDTA 8μl、10% SDS 2μl、プロテイナーゼ(Proteinase)K 20μgを加え、45℃で15分間加熱した。フェノール/クロロホルムによる抽出、エタノール沈澱後、沈澱をRNaseフリーに処理してある水(以下RNaseフリー水とする)47μlに溶解した。
【0126】
(3)5’キャップ構造及び3’末端へのビオチン付加
RNAジオールのビオチン化RNAのジオール部位(Cap構造のある5’末端と、ポリA鎖のある3’末端のリボースの双方に存在)にビオチンを結合させるために、2段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化RNA体のカップリング反応である。まず、逆転写反応で得られたRNA−第1鎖cDNA複合体15μgを、6.6mM酢酸ナトリウム緩衝液(pH4.5)と、酸化剤として過ヨウ素酸ナトリウムを用いて50μlの反応液中で処理した。この酸化反応は遮光条件の下、氷上で45分間行った。
【0127】
続いて、5M塩化ナトリウム11μl、10% SDS 0.5μl、そして同量のイソプロパノールを加え、60分間氷上に放置した後、4℃で15分間15,000rpm遠心し沈澱を取得した。沈澱物は70%エタノールで洗い、RNaseフリー水50μlに再溶解させた。その試料に1M酢酸ナトリウム(pH6.1)5μl、10% SDS 5μl、10mMビオチンヒドラジド(Sigma社製)150μlを加え、室温(22〜26℃)で終夜反応させた。最後に、5μlの5M NaCl、1M酢酸ナトリウム(pH6.1)75μl、及び2.5倍量のエタノールを加え、1時間の氷上冷却後、4℃において15分間遠心し、ビオチン化した。反応後、反応液を15分間遠心し、再度RNA−DNA複合体を沈澱させた。沈澱物は70%エタノールで1回、更に80%エタノールで1回洗い、RNaseフリー水70μlに溶解した。
【0128】
(4)RNase Iによる完全長cDNAの選択
上記(3)で取得したビオチン化RNA−DNA複合体について、1本鎖RNAを消化するRNase Iで処理することにより、逆転写反応時に完全なcDNAの伸長が得られなかったmRNA、およびmRNAの3’末端に標識されたビオチン残基を取り除いた。具体的には、上記(3)で得られた試料70μlに10×RNase Iバッファー(100mM Tris−HCl(pH7.5)、50mM EDTA、2M NaOAc)10μl、RNase I(RNase OneTM;Promega社製)200unitを加えて、37℃で15分間1本鎖RNAを消化した。
【0129】
(5)完全長cDNAの採取
ストレプトアビジンコートしたマグネティックビーズにcDNAが非特異的吸着するのを防止するため、100μgの酵母tRNA(DNase I処理したもの)を5mg(500μl)のマグネティックビーズ(magnetic porous glass(MPG)particles coated with streptavidin(CPG,NJ))に加え、1時間氷上に放置した後、50mM EDTA、2M NaClの溶液にて洗った。
このビーズを50mM EDTA、2M NaClの溶液500μl中に懸濁し、(4)で取得したRNase I処理を施されたcDNAを加えた。室温にて30分間撹拌することで、マグネティックビーズと完全長cDNAを結合させた。完全長cDNAを捕獲したビーズを50mM EDTA、2M NaClの溶液で4回、0.4% SDS、50μg/μl酵母tRNAで1回、10mMNaCl、0.2mM EDTA、10mMTris−HCl(pH7.5)、20% グリセロールで1回、50μg/μl酵母tRNA水溶液で1回、RNase H バッファー(20mMTris−HCl(pH7.5)、10mM MgCl2、 20mM KCl、0.1mM EDTA、0.1mM ジチオスレイトール(DTT)で1回洗浄した後、RNase H用バッファー100μlに懸濁し、RNase H 3unitを加え、37℃下30分間加温した。その後、10% SDS 1μl、0.5M EDTA 2μlを加えて、10分間、65℃に曝し、その上清を回収した。
このようにして回収された1本鎖完全長cDNAはフェノール/クロロホルムで抽出され、スピードバッグにて液量を100μl以下に減じてからG25/G100Sephadexクロマトグラフィーに付した。RI活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン2μg を加え、エタノール沈澱にて得られた沈澱物を30μlの超純水に溶解した。
【0130】
(6)1本鎖cDNAへのオリゴdG付加
上記(5)で回収された1本鎖cDNA30μlは、最終容量50μlの反応液中で、200mMカコジル酸ナトリウム(pH6.9)、1mM MgCl2、1mM CoCl2、1mM 2−メルカプトエタノール、100μM dGTPの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TaKaRa社製)32unitを用いて37℃で30分間のオリゴdG付加反応に付した。反応終了時にEDTAを50mMとなるように加え、一連のフェノール/クロロホルムによる抽出、エタノール沈澱を経て、31μlの超純水に溶解した。
【0131】
(7)第2鎖cDNA合成
第1鎖cDNAを鋳型にした第2鎖cDNAの合成は以下のように行った。最終容量60μlの反応系で、第2鎖低バッファー(200mM Tris−HCl(pH8.75)、100mM KCl、100mM(NH4)2SO4、20mM MgSO4、1%Triton X−100、1mg/μlBSA)3μl、第2鎖高バッファー(200mM Tris−HCl(pH9.2)、600mM KCl、20mM MgCl2)3μl、dCTP、dATP、dTTP、dGTP各々0.25mM、β−NADH 6μl、オリゴdG付加された第1鎖cDNA31μl、第2鎖プライマー−アダプター(配列番号50)600ng を加え、Ex Taq DNAポリメラーゼ(TaKaRa Ex Taq;TaKaRa社製)15unit、耐熱性DNAリガーゼ(Ampligase;Epicentre社製)150unit、耐熱性RNase H(Hybridase;Epicentre社製)3unitによって第2鎖cDNAを合成した。
【0132】
0.5M EDTAを1μl加えることで反応を停止させ、更に蛋白成分を溶解するために、10% SDS 1μl、プロテイナーゼ(Proteinase) K 10μgの存在下に45℃で15分間加熱し、最終的にフェノール/クロロホルムによる抽出、エタノール沈澱にて精製した2本鎖完全長cDNAを得た。
【0133】
(8)ライブラリーの調製
以上の方法により得られた二本鎖完全長cDNAは、λZAPIIIベクターに挿入し、ライブラリーとして回収した。λZAPIIIベクターはλZAPII(STRATAGENE社製)ベクターのマルチクローニングサイトの一部の配列配列番号51を配列番号52に改変し、二つのSfiIサイトを新たに導入したものである。
【0134】
さらにλPS(RIKEN)ベクターを作製し、cDNAを挿入した。λPS(RIKEN)(λ−FLC−1と命名(FLCとはFULL−LENGTH cDNAを意味する))とは、MoBiTec社(ドイツ)のλPSベクターをcDNA用に改変したものである。即ち10kbp stufferの両側に存在するクローニングサイトにcDNA挿入に便利なBamHIならびにSalIを各々導入するとともに、0.5kbから13kb程度までのcDNAがクローニングできるようにXbaIサイトに6kbのDNA断片を挿入したものである(特開2000−325080号公報)。このλ−FLC−1を用いると、例えば肺臓cDNAライブラリーの場合には、インサートの平均鎖長は2.57kbとなり、実際に0.5kbから12kbまでのインサートをクローニングすることが出来た。従来法のλZAPの場合には、インサートの平均鎖長は0.97kbであったことから、λ−FLC−1を用いることによって、サイズの大きなcDNAもλZAPに比べて効率よくクローニングできることがわかる。
【0135】
実施例2 完全長cDNAライブラリーのノーマライゼーション/サブトラクション
(1)ドライバーの調製
実施例1(1)で作製したmRNA(以下、これを「(a)RNAドライバー」と称することがある)、及びin vitro転写反応で作成したRNAをドライバーとして用いた。後者のRNAはさらに2種類(以下、これを「(b)RNAドライバー、及び「(c)RNAドライバー」と称する)に分けられる。1つはノーマライゼーションにより除かれたRNA−cDNAからcDNAを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後1つの出発材料あたり1000から2000プラークを混ぜ合わせて1つのライブラリー(ミニライブラリー)とし、常法によりプラスミドDNAに変換する(ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドDNAを得る)。
【0136】
得られたDNAについてin vitro転写反応(T3RNAポリメラーゼまたはT7RNAポリメラーゼを用いる)を行い、DNase I(RQ1−RNase free;Promega社製)、ProteinaseK処理後、フェノール/クロロホルム抽出をしてRNA(b)RNAドライバーを得た。この際、通常出発材料としては9種類(すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃)の組織からそれぞれミニライブラリーを作成して、9種類のミニライブラリーを混合してRNAを得る。もう一つのRNAはすでに重複のないクローンとして保存されているライブラリー(クローン数約2万個)を培養し、得られたDNAについて(b)RNAドライバーと同様にin vitro転写反応を行い(c)RNAドライバーとした。
【0137】
これら3種のRNAは、Label−IT Biotin LabelingKit(Mirus Corporation製)を用いてビオチン化標識を行ったあと、1:1:1の割合でテスターcDNAに添加し、Rot10での反応(42℃)を行い、ストレプトアビジンビーズ(CPG)処理を行って回収した上清について、第2鎖の合成を行った。
【0138】
実施例3 完全長cDNAクローンの塩基配列決定
(1)クローンのrearray
各クラスタからひとつの代表クローンを選んだ。代表クローンはQ−bot(GENETIX LIMITED製)で選択し、384穴プレートにarray化した。その際、大腸菌は30℃で18〜24時間、50μlのLB培地で培養した。このとき、cDNAライブラリーがPSベクターに導入され大腸菌DH10Bを形質転換している場合には100mg/mlのアンピシリン及び50mg/mlのカナマイシンを添加し、Zapベクターに導入し、SOLRシステムに導入している場合には100mg/mlのアンピシリン及び25mg/mlのストレプトアビジンを添加して行った。
【0139】
(2)プラスミドの抽出とInsSizing
上記(1)で培養した各クローンは、さらに100mg/mlのアンピシリンを含む1.3mlのHT液中で培養され、遠心分離により菌体を回収した後、QIAprep 96 Turbo(QIAGEN社製)を用いてプラスミドDNAを回収、精製した。取得されたプラスミド中に挿入されているcDNAの鎖長を調べるために、上記で取得したプラスミドDNAの1/30を制限酵素PyuIIで消化し、1%のagaroseゲル電気泳動を行った。
【0140】
(3)配列決定
かくして取得されたプラスミド中に挿入された完全長cDNAの全長の塩基配列解析には、3種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが2.5kbより短いものと長いものの2つのカテゴリに分けた。このうち2.5kbより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがPSの場合には配列番号53(センス鎖)、及び54(アンチセンス鎖)に記載のプライマーを用いて、またベクターがZapの場合には配列番号55(センス鎖)、及び56(アンチセンス鎖)に記載のプライマーを用いてThermosequenase Primer Cycle Sequencing Kit(Amersham Pharmacia Biotech社製)で反応し、Licor DNA4200(long read sequencer)を用いて解析した。
【0141】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ABI Prism377及び/またはABI Prism3700(Applied Biosystems Inc.製)とBigDye terminator kitとCycle Sequencing FS ready Reaction Kit(Applied Biosystems Inc.製)を用いた。
【0142】
また、挿入されているcDNAが2.5kbより長いクローンの配列決定は、ショットガン法によった。その際、Shimadzu RISA 384とDYEnamic ET terminator cycle sequencing kit(Amersham Pharmacia Biotech社製)を用いた。ショットガンライブラリを作製するために、48の独立な代表クローンからPCRで増殖した48のDNAフラグメントを用いた。増幅されたDNA断片の末端をT4 DNAポリメラーゼによって平滑化した。
このDNA断片を、pUC18ベクターへ挿入し、更に該組み換えベクターにより大腸菌DH10Bを形質転換した。この大腸菌から上記(2)と同様にしてプラスミドを調製した。
【0143】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、Double Stroke Shearing Device(Fiore Inc.製)によるshearingを行った。ショットガン法による塩基配列決定は、12〜15クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【0144】
実施例4 各完全長cDNAクローンの塩基配列の解析
実施例3で決定した完全長cDNAクローンの全塩基配列について、BLASTによる相同性検索や、HMMPFAMによるタンパク質特徴検索を行い、各完全長cDNAクローンがコードするタンパク質の機能を推定した。
【0145】
(1)dnaform37901(配列番号1、25)
dnaform37901は、配列番号1に示すように、4593塩基から成り、そのうち塩基番号1531から2631までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、366アミノ酸残基から成る(配列番号25)。配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ311903、ADAMTS18 proteinが、e−value:0.0で、また708アミノ酸残基に亘り75%の一致度で、また(ii)データベース登録記号AJ315734、metalloprotease disintegrin 16 with thrombospon din type I motifが、e−value:0.0で、671アミノ酸残基に亘り61%の一致度で、さらに(iii)データベース登録記号P58397、A disintegrin and metalloproteinase with thrombospondin motifs 12が、e−value:5×10−152で、702アミノ酸残基に亘り42%の一致度で、(iv)データベース登録記号Q9H324、A disintegrin and metalloproteinase with thrombospondin motifs 10がヒットした。これらの結果より配列番号25に示したアミノ酸配列からなるタンパク質はmetalloproteinasesであることが推測された。
また、上記のタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが知られている。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号1の塩基番号412−1137がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)を見出した。
これらのことから配列番号1に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【0146】
(2)dnaform46350(配列番号2、26)
dnaform46350は、配列番号2に示すように、4335塩基から成り、そのうち塩基番号992から4270までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、1092アミノ酸残基から成る (配列番号26)。配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ311903、ADAMTS18 proteinが、e−value:0.0で、また807アミノ酸残基に亘り90%の一致度で、また(ii)データベース登録記号AJ315734、ADAMTS16が、e−value:0.0で、816アミノ酸残基に亘り61%の一致度で、さらに(iii)データベース登録記号P58397、ADAMTS12が、e−value:0.0で、786アミノ酸残基に亘り43%の一致度でヒットした。これらの結果より配列番号26に示したアミノ酸配列からなるタンパク質はmetalloproteinasesであることが推測された。
また、上記のタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが知られている。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号2の塩基番号1354−1969がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)を見出した。また、配列番号2の塩基番号796−1172がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号2に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【0147】
(3)dnaform51325(配列番号3、27)
dnaform51325は、配列番号3に示すように、1577塩基から成り、そのうち塩基番号8から1459までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、483アミノ酸残基から成る (配列番号27)。配列番号3がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P83105、Probable serine protease HTRA4 precursorが、e−value:5×10−175で、また470アミノ酸残基に亘り67%の一致度で、また(ii)データベース登録記号AF179369、insulin−like growth factor binding protein 5 proteaseが、e−value:5×10−147で、485アミノ酸残基に亘り55%の一致度でヒットした。これらの結果より配列番号27に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号3の塩基番号559−1111がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号3に示す塩基配列がコードするタンパク質は成長因子を制御する機能を有するトリプシン様セリンプロテアーゼであることが推測された。
【0148】
(4)dnaform9578(配列番号4、28)
dnaform9578は、配列番号4に示すように、2235塩基から成り、そのうち塩基番号1から2034までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、677アミノ酸残基から成る (配列番号28)。配列番号4がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ131563、metalloprotease/disintegrinが、e−value:5×10−154で、また297アミノ酸残基に亘り85%の一致度で、また(ii)データベース登録記号Q95194、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:5×10−152で、641アミノ酸残基に亘り43%の一致度で、また(iii)データベース登録記号Q9Y3Q7、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:5×10−151で、642アミノ酸残基に亘り43%の一致度でヒットした。これらの結果より配列番号28に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが明らかとなった。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号4の塩基番号559−1152がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列(PfamにReprolysinとしてエントリーされる塩基配列)を、塩基番号190−528がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号4に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【0149】
(5)dnaform13298(配列番号5、29)
dnaform13298は、配列番号5に示すように、746塩基から成り、そのうち塩基番号10から411までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、133アミノ酸残基から成る (配列番号29)。配列番号5がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Y07903、transmembrane protein tMDC Iが、e−value:3×10−17で、また118アミノ酸残基に亘り43%の一致度で、また(ii)データベース登録記号X76637、tMDC Iが、e−value:6×10−17で、118アミノ酸残基に亘り42%の一致度で、また(iii)データベース登録記号Q95194、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:2×10−16で、113アミノ酸残基に亘り46%の一致度でヒットした。これらの結果より配列番号29に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが明らかとなった。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号5の塩基番号199−472がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号5に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【0150】
(6)dnaform28983(配列番号6、30)
dnaform28983は、配列番号6に示すように、2373塩基から成り、そのうち塩基番号75から848までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、257アミノ酸残基から成る (配列番号30)。配列番号6がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX190539、Sequence 10 from Patent WO0136645が、e−value:2×10−75で、また286アミノ酸残基に亘り49%の一致度で、また(ii)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−75で、283アミノ酸残基に亘り48%の一致度で、また(iii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:1×10−72で、282アミノ酸残基に亘り47%の一致度でヒットした。これらの結果より配列番号30に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Br J Cancer 2001 Jan;84(2):237−43)から扁平上皮細胞癌で発現が押さえられていることが明らかとなった。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号6の塩基番号150−827がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号6に示す塩基配列がコードするタンパク質は細胞増殖や接着を制御する機能を有するプロテアーゼであることが推測された。
【0151】
(7)dnaform36451(配列番号7、31)
dnaform36451は、配列番号7に示すように、2877塩基から成り、そのうち塩基番号98から1351までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、417アミノ酸残基から成る (配列番号31)。配列番号7がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX190539、Sequence 10 from Patent WO0136645が、e−value:5×10−113で、また418アミノ酸残基に亘り51%の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−96で、419アミノ酸残基に亘り42%の一致度で、また(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:6×10−95で、420アミノ酸残基に亘り41%の一致度でヒットした。これらの結果より配列番号31に示したアミノ酸配列からなるタンパク質はトリプシン様セリンプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(Biol Chem 1998 May 8;273(19):11895−901)から慢性的気管疾患患者の痰から得られ,調査した17の組織中気管での発現が顕著に高いことが明らかとなった。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号7の塩基番号653−1330がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号7に示す塩基配列がコードするタンパク質は気管疾患を制御する機能を有するプロテアーゼであることが推測された。
【0152】
(8)dnaform30375(配列番号8、32)
dnaform30375は、配列番号8に示すように、2335塩基から成り、そのうち塩基番号526から2244までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、572アミノ酸残基から成る (配列番号32)。配列番号8がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX207903、Sequence 7 from Patent WO0157194が、e−value:5×10−104で、また418アミノ酸残基に亘り37 %の一致度で、また(ii)データベース登録記号AF057145、serine protease TADG15が、e−value:5×10−103で、650アミノ酸残基に亘り39 %の一致度で、また(iii)データベース登録記号Q9Y5Y6、Membrane−type serine protease 1が、e−value:5×10−103で、650アミノ酸残基に亘り39 %の一致度でヒットした。これらの結果より配列番号32に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(J Biol Chem 1999 Jun 25;274(26):18231−6)からヒト乳癌に関係することが明らかとなった。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号8の塩基番号1528 − 2217がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号8に示す塩基配列がコードするタンパク質は乳癌を制御する機能を有するプロテアーゼであることが推測された。
【0153】
(9)dnaform26163(配列番号9、33)
dnaform26163は、配列番号9に示すように、2377塩基から成り、そのうち塩基番号256から1500までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、414アミノ酸残基から成る (配列番号33)。配列番号9がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AB071425、hatching enzyme EHE7が、e−value:2×10−48で、また247アミノ酸残基に亘り40 %の一致度で、また(ii)データベース登録記号P31581、High choriolytic enzyme 2 precursor(Hatching enzymezinc−protease HCE 2 subunit)が、e−value:2×10−42で、246アミノ酸残基に亘り40 %の一致度ででヒットした。これらの結果より配列番号33に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Dev Biol 1992 Oct;153(2):250−8)からastacin (protease)に属することが明らかとなった。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号9の塩基番号466 − 1041がコードするアミノ酸配列にメタロプロテアーゼであるastacinの特徴を示す配列(PfamにAstacinとしてエントリーされる配列)を見出した。
これらのことから配列番号9に示す塩基配列がコードするタンパク質はAstacin 様プロテアーゼであることが推測された。
【0154】
(10)dnaform33042(配列番号10、34)
dnaform33042は、配列番号10に示すように、3614塩基から成り、そのうち塩基番号68から1042までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、324アミノ酸残基から成る (配列番号34)。配列番号10がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:8×10−63で、また343アミノ酸残基に亘り47%の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:2×10−33で、280アミノ酸残基に亘り36%の一致度ででヒットした。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号10の塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号10に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0155】
(11)dnaform37103(配列番号11、35)
dnaform37103は、配列番号11に示すように、3793塩基から成り、そのうち塩基番号280から1191までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、303アミノ酸残基から成る (配列番号35)。配列番号11がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:8×10−63で、また343アミノ酸残基に亘り47 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:3×10−33で、278アミノ酸残基に亘り35 %の一致度ででヒットした。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号11の塩基番号604−951がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号11に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0156】
(12)dnaform44990(配列番号12、36)
dnaform44990は、配列番号12に示すように、3646塩基から成り、そのうち塩基番号344から985までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、213アミノ酸残基から成る (配列番号36)。配列番号12がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:2×10−54で、また207アミノ酸残基に亘り51 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:4×10−31で、203アミノ酸残基に亘り36 %の一致度でヒットした。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号12の塩基番号398−745がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号12に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0157】
(13)dnaform45367(配列番号13、37)
dnaform45367は、配列番号13に示すように、3418塩基から成り、そのうち塩基番号159から1190までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、343アミノ酸残基から成る (配列番号37)。配列番号13がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:7×10−63で、また343アミノ酸残基に亘り47%の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:3×10−33で、278アミノ酸残基に亘り35 %の一致度ででヒットした。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号13の塩基番号603−950がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号13に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0158】
(14)dnaform51872(配列番号14、38)
dnaform51872は、配列番号14に示すように、3617塩基から成り、そのうち塩基番号476から979までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、167アミノ酸残基から成る (配列番号38)。配列番号14がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:3×10−54で、また201アミノ酸残基に亘り52 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:4×10−31で、203アミノ酸残基に亘り36 %の一致度ででヒットした。
また、配列番号14に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号14の塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号14に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0159】
(15)dnaform39531(配列番号15、39)
dnaform39531は、配列番号15に示すように、2803塩基から成り、そのうち塩基番号227から1582までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、451アミノ酸残基から成る (配列番号39)。配列番号15がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX207688、Sequence 5 from Patent WO0157081が、e−value:0.0で、また469アミノ酸残基に亘り94%の一致度で、また(ii)データベース登録記号P08594、Aqualysin I precursorが、e−value:5×10−45で、355アミノ酸残基に亘り34 %の一致度でヒットした。
また、配列番号15に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号15の塩基番号714−1602がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列(PfamにPeptidase_S8としてエントリーされる配列)を見出した。
これらのことから配列番号15に示す塩基配列がコードするタンパク質はセリンプロテアーゼであることが推測された。
【0160】
(16)dnaform25900(配列番号16、40)
dnaform25900は、配列番号16に示すように、2222塩基から成り、そのうち塩基番号174から1493までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号40)。配列番号16がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:2×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:1×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号40に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号16に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号16の塩基番号795−1472がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号16に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0161】
(17)dnaform26560(配列番号17、41)
dnaform26560は、配列番号17に示すように、3568塩基から成り、そのうち塩基番号134から1453までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号41)。配列番号17がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43%の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号41に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号17に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号17の塩基番号755−1432がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号17に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0162】
(18)dnaform32827(配列番号18、42)
dnaform32827は、配列番号18に示すように、3599塩基から成り、そのうち塩基番号167から1486までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号42)。配列番号18がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号42に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号18に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号18の塩基番号788−1465がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号18に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0163】
(19)dnaform33661(配列番号19、43)
dnaform33661は、配列番号19に示すように、3817塩基から成り、そのうち塩基番号16から1335までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号43)。配列番号19がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号43に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号19に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号19の塩基番号637−1314がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号19に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0164】
(20)dnaform34950(配列番号20、44)
dnaform34950は、配列番号20に示すように、3355塩基から成り、そのうち塩基番号76から1326までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、416アミノ酸残基から成る (配列番号44)。配列番号20がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX262410、Sequence 1 from Patent WO0173074が、e−value:5×10−122で、また417アミノ酸残基に亘り51 %の一致度で、また(ii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:5×10−93で、420アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−92で、420アミノ酸残基に亘り38 %の一致度でヒットした。これらの結果より配列番号44に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(ii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号20に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号20の塩基番号628−1305がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号20に示す塩基配列がコードするタンパク質は上皮における炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0165】
(21)dnaform40997(配列番号21、45)
dnaform40997は、配列番号21に示すように、1456塩基から成り、そのうち塩基番号26から1345までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号45)。配列番号21がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF100707、testes−specific protein TSP50が、e−value:5×10−128で、また439アミノ酸残基に亘り54 %の一致度で、また(ii)データベース登録記号Q9GZN4、Brain−specific serine protease 4 precursorが、e−value:2×10−36で、281アミノ酸残基に亘り33 %の一致度で、さらに(iii)データベース登録記号Q9BQR3、Marapsin precursorが、e−value:1×10−35で、253アミノ酸残基に亘り32 %の一致度で、さらに(iv)データベース登録記号Q9Y6M0、Testisin precursorが、e−value:9×10−35で、273アミノ酸残基に亘り32 %の一致度でヒットした。これらの結果より配列番号45に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(iv)の蛋白質は、文献情報(Biochem Biophys Res Commun 1998 Nov 18;252(2):307−12)から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが知られている。
また、配列番号21に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号21の塩基番号522−1246がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号21に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであることが推測された。
【0166】
(22)dnaform43509(配列番号22、46)
dnaform43509は、配列番号22に示すように、1600塩基から成り、そのうち塩基番号466から1476までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、336アミノ酸残基から成る (配列番号46)。配列番号22がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号BC021474、機能未知蛋白質が、e−value:0.0で、また355アミノ酸残基に亘り98 %の一致度で、また(ii)データベース登録記号AB033029、KIAA1203 proteinが、e−value:4×10−23で、118アミノ酸残基に亘り50 %の一致度で、さらに(iii)データベース登録記号AF017306、Homo sapiens deubiquitinating enzyme UnpESが、e−value:2×10−8で、66アミノ酸残基に亘り48 %の一致度で、さらに(iv)データベース登録記号Q13107、Ubiquitin carboxyl−terminal hydrolase 4が、e−value:2×10−8で、66アミノ酸残基に亘り48 %の一致度でヒットした。これらの結果より配列番号46に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記(iii)と(iv)の蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号22に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号22の塩基番号2−205がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)を見出した。
これらのことから配列番号22に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【0167】
(23)dnaform55017(配列番号23、47)
dnaform55017は、配列番号23に示すように、4298塩基から成り、そのうち塩基番号277から3342までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、1021アミノ酸残基から成る (配列番号47)。配列番号23がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号BC021474、機能未知蛋白質が、e−value:0.0で、また827アミノ酸残基に亘り99 %の一致度で、また(ii)データベース登録記号AB033029、KIAA1203 proteinが、e−value:1×10−67で、234アミノ酸残基に亘り55 %の一致度で、さらに(iii)データベース登録記号AF048705、ubiquitin−specific proteaseが、e−value:8×10−56で、653アミノ酸残基に亘り29 %の一致度でヒットした。これらの結果より配列番号47に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記(iii)の蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号23に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号23の塩基番号244−337がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−1としてエントリーされる配列)を見出した。また、配列番号23の塩基番号1885−2070がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)を見出した。
これらのことから配列番号23に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【0168】
(24)dnaform65027(配列番号24、48)
dnaform65027は、配列番号24に示すように、1816塩基から成り、そのうち塩基番号623から1411までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、262アミノ酸残基から成る (配列番号48)。配列番号24がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF190274、carboxypeptidase homologが、e−value:1×10−93で、また331アミノ酸残基に亘り48 %の一致度で、また(ii)データベース登録記号P19223、Carboxypeptidase B precursorが、e−value:2×10−92で、327アミノ酸残基に亘り48 %の一致度で、さらに(iii)データベース登録記号P15086、Carboxypeptidase B precursorが、e−value:4×10−90で、330アミノ酸残基に亘り46 %の一致度でヒットした。これらの結果より配列番号48に示したアミノ酸配列からなるタンパク質はカルボキシペプチダーゼであることが推測された。
また、上記(ii)の蛋白質は、文献情報(J Biol Chem 1988 Nov 25;263(33):17837−45)から、膵臓に発現するカルボキシペプチダーゼであることが、上記(iii)の蛋白質は、文献情報(J Biol Chem 1992 Feb 5;267(4):2575−81)から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが知られている。
また、配列番号24に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号24の塩基番号509−1357がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列(PfamにZn_carbOpeptとしてエントリーされる配列)を見出した。
これらのことから配列番号24に示す塩基配列がコードするタンパク質は、膵臓疾患に関わるカルボキシペプチダーゼであることが推測された。
【0169】
(25)dnaform 35225(配列番号57、60)
dnaform 35225は、配列番号57に示すように、1036塩基から成り、そのうち塩基番号332から826までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、164アミノ酸残基から成る (配列番号60)。配列番号57がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF178985、Homo sapiens complement C1r−like proteinase precursor が、e−value:1×10−49で、また152アミノ酸残基に亘り63%の一致度で、また(ii)データベース登録記号AK024084、Homo sapiens cDNA FLJ14022 weakly similar to COMPLEMENT C1R COMPONENT PRECURSOR が、e−value:1×10−48で、152アミノ酸残基に亘り62%の一致度で、さらに(iii)データベース登録記号X04701、Human mRNA for complement component C1r が、e−value:7×10−18で、103アミノ酸残基に亘り39%の一致度でヒットした。これらの結果より、配列番号57に示す塩基配列がコードするタンパク質は 補体系のメタロプロテアーゼであることが推測された。
【0170】
(26)dnaform46870(配列番号58、61)
dnaform46870は、配列番号58に示すように、2613塩基から成り、そのうち塩基番号819から2102までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、427アミノ酸残基から成る (配列番号58)。配列番号58がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Y09661、X.laevis mRNA for xolloid が、e−value:2×10−58で、また436アミノ酸残基に亘り30%の一致度で、また(ii)データベース登録記号O57460、Dorsal−ventral patterning tolloid protein precursorが、e−value:4×10−58で、445アミノ酸残基に亘り30%の一致度で、さらに(iii)データベース登録記号P98063、Bone morphogenetic protein 1 precursorが、e−value:7×10−57で、436アミノ酸残基に亘り30%の一致度でヒットした。
また、配列番号61に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号61のアミノ酸番号30−370のアミノ酸配列に3箇所にわたってCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)を見出した。
これらの結果より、配列番号58に示す塩基配列がコードするタンパク質は発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであることが推測された。
【0171】
(27)dnaform 41583(配列番号59、62)
dnaform 41583は、配列番号59に示すように、2841塩基から成り、そのうち塩基番号1110から1889までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、259アミノ酸残基から成る (配列番号62)。配列番号59がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AY017475、Mus musculus CSMD1 (Csmd1) が、e−value:5×10−108で、また257アミノ酸残基に亘り68%の一致度で、また(ii)データベース登録記号AY017307、Homo sapiens CUB and sushi multiple domains protein 1 short form が、e−value:1×10−48で、153アミノ酸残基に亘り67%の一致度でヒットした。
また、配列番号62に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号62のアミノ酸番号25−382および 203−256 のアミノ酸配列にわたってComplement control protein (CCP) modules またはshort consensus repeats (SCR)の特徴を示す配列(Pfamに sushi としてエントリーされる配列)を見出し、アミノ酸番号87−195のアミノ酸配列にCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)を見出した。
これらの結果より、配列番号59に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであることが推測された。
【0172】
実施例5 DNAマイクロアレイを用いた組織発現解析
DNAマイクロアレイを用いた組織発現解析は、Miki, R., et al., Proc. Natl. Acad. Sci. USA, 98, 2199−2204 (2001)の記載に従って行った。(1)DNAマイクロアレイの作成
2種類のマウス全長cDNAの塩基配列(dnaform9578、dnaform37901)を、M13フォワードおよびリバースプライマーを用いて増幅後、このPCR産物をイソプロパノールにて沈澱させ15μlの3×SSC液に溶解した。これらの2種類のDNA溶液をポリLリジンコートしたガラススライドに、16チップ(SMP3、TeleChem International、Sunnyvale、CA)のDNAアレイヤーを用いてスポットし、DNAマイクロアレイを作成した(方法の詳細は http://cmgm.stanford.edu/pbrown/mguide/index.htmlに記載されている)。マウスβアクチンとグリセルアルデヒド‐3‐フォスフェートデヒドロゲナーゼのcDNAをポジティブコントロールとし、シロイヌナズナのcDNAをネガティブコントロールとして用いた。
このDNAマイクロアレイの検出感度は、1細胞当たりmRNA1ないし3コピーであった。ターゲット配列との一致度がおよそ80%のクローンのシグナル強度は、完全に配列が一致するクローンの10分の1であった。ターゲット配列との一致度が80%未満のクローンのシグナル強度は、バックグランドレベルであった。
【0173】
(2)プローブの調製
C57BL/6Jマウスの胎児、新生仔、アダルトの49組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、盲腸、胎盤、心臓、舌、胸腺、胸腺(妊娠1日目)、小脳、延髄、嗅脳、副精巣、眼球、皮質、小胞腺、子宮、卵巣および子宮(妊娠11日目)、骨、筋肉、乳腺(授乳10日目)、10日齢胎児全身、11日齢胎児全身、13日齢胎児全身、11日齢胎児頭部、12日齢胎児頭部、13日齢胎児頭部、15日齢胎児頭部、16日齢胎児頭部、17日齢胎児頭部、16日齢胎児肺、13日齢胎児肝臓、14日齢胎児肝臓、0日齢新生児全頭部、6日齢新生児全頭部、10日齢新生児全頭部、10日齢新生児腸、0日齢新生児肺、10日齢新生児小脳、0日齢新生児皮膚、10日齢新生児皮膚、SV40感染)または、22組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、胎盤、心臓、胸腺、小脳、子宮、骨、筋肉、背側腎臓由来脂肪細胞、副精巣由来脂肪細胞、内臓脂肪、10日齢新生児小脳、10日齢新生児皮膚)から抽出したmRNA1μgを定法に従いランダムプライム逆転写反応を行い蛍光色素Cy3(Amersham Pharmacia社)を取りこませた。他方、17.5日齢の胎児全身から抽出したmRNA1μgをランダムプライム逆転写反応を行い、蛍光色素Cy5を取りこませ発現解析のリファレンスとした。CyDye標識cDNAプローブは、CyScribe GFX Purification Kit(Amersham Pharmacia社)を用いて精製し、滅菌水17μlにてカラムから溶出した。これに3μlの10μg/μl oligo(dA),3μlの酵母tRNA 20μg/μl,1μlの20μg/μlマウスCot1 DNA,5.1μlの20XSSC,および0.9μlの10% SDSからなるブロッキング溶液を混和してCyDye標識cDNAプローブを調製した。
【0174】
(3)DNAマイクロアレイのハイブリダイゼイション
発現解析対象組織由来cDNAプローブ(Cy3標識)とリファレンスの17.5日齢胎児由来cDNAプローブ(Cy5標識)を混和した溶液30μlを95℃にて1分間熱処理を行い室温にて冷却した。DNAマイクロアレーに上記プローブ溶液を添加しカバースリップを被せ、Hybricasette(ArrayIt社)中にて65℃一晩ハイブリダイズさせた。次に、DNAマイクロアレーを2XSSC,0.1% SDSを用いて洗浄し、続いて1XSSCにて2分間、0.1XSSCにて2分間リンスした。マイクロアレーはScanArray5000共焦点レーザースキャナーを用いてスキャンし、画像をIMAGENE(BioDiscovery社)で解析した。
【0175】
(4)データ解析
各組織中のmRNA量(Cy3標識)は、リファレンスの17.5日齢の胎児全身mRNA量(Cy5標識)との比(Cy3/Cy5)を対数(log2)で表示した。すなわち、解析対象とする各マウス全長cDNAに対応するmRNA発現量が、リファレンス組織中よりも各組識中の方が多い場合は正の数値で、少ない場合は負の数値で、等しい場合は0で示される。データの正確性を増すために実験は独立に2回行い、再現性の有る結果を採用した。その結果を表1及び表2に示す。 一般的に、DNAアレイを使用した発現解析結果は、2倍程度の増減は実験誤差とみなすため、結果の数値が1以上の場合にはある組織中のmRNA量がリファレンスである17.5日齢の胎児全身のmRNA量と比較して2倍以上であり、有意に増加しており、逆に、結果の数値が−1以下の場合はある組織中のmRNA量が、リファレンスである17.5日齢の胎児全身のmRNA量と比較して2分の1以下であり、有意に減少していると解釈した。また、組織間のmRNA発現量を比較検討する際は、各組織における数値の差が1であればmRNA量は2倍、2であればmRNA量は4倍であり、逆に、組織間の数値の差が−1であればmRNA量は1/2倍、−2であればmRNA量は1/4倍となる。
なお、マイクロアレイにスポットしたDNAと同じクラスタに属し、該DNAと少なくとも200塩基に亘り80%以上の塩基配列の一致度を有する領域を有するマウスcDNAクローン(dnaform46350)についても、表1及び表2に解析対象cDNAとして記載し、マイクロアレイにスポットした該DNAの測定結果の数値を代用して記載した。
【0176】
【表1】
【0177】
【表2】
【0178】
表1及び表2から明らかなように、dnaform37901は、それ自身をマイクロアレイにスポットしてターゲット配列とした発現解析により、リファレンス(17.5日齢の胎児全身)に比べて、小脳・新生児小脳で発現が増加していることが分かる。このように中枢神経系に特徴的な発現を示している。dnaform46350は、クラスター内のメンバーの上記dnaform37901をターゲット配列とした発現解析により、リファレンスに比べて、小脳・新生児小脳で発現が増加していることが分かる。
dnaform9578は、それ自身をターゲット配列とした発現解析により、リファレンスに比べて、特に、精巣で強力に発現していることが分かり、これは著しい特徴と見なされる。
【0179】
実施例6 ヒトオルソログDNAの取得およびその塩基配列の解析
(1)dnaform26163のヒトオルソログDNA(配列番号63、65)
dnaform26163の塩基配列(配列番号9)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として2番染色体の2q11.2の94.65Mbから94.68Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan ( http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号9の塩基配列は、配列番号63のヒト塩基配列と約1280塩基対の長さに渡って73.6%の相同性をもつことがわかった。
【0180】
また、配列番号63の塩基配列から配列番号65のヒトアミノ酸配列に翻訳されると予測された。配列番号65のアミノ酸配列とdnaform26163のオープンリーディングフレームから予測されるアミノ酸配列(配列番号33)との間には、415アミノ酸配列に渡って67%の相同性があった。
さらに、配列番号65のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号33のアミノ酸配列が最も相同性が高かった。
【0181】
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号63の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
従って、配列番号63が、配列番号9に対する新規なヒトオルソログDNAの塩基配列であると考えられた。dnaform26163のヒトオルソログDNAのオープンリーディングフレーム(終止コドンを含む)は1296塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は431アミノ酸残基からなる。
配列番号63に記載の塩基配列がコードするアミノ酸配列(配列番号65)についてHMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号92−283に、Astacin (Peptidase family M12A) (PfamにAstacinとしてエントリーされるアミノ酸配列)を見出した。Peptidase family M12Aに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号63に記載の塩基配列がコードするアミノ酸配列は、Peptidase family M12Aに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【0182】
(2)dnaform46870のヒトオルソログDNA(配列番号64、66)
dnaform46870の塩基配列(配列番号58)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として1番染色体の1p32.3の54.42Mbから54.46Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan ( http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号58の塩基配列は、配列番号64のヒト塩基配列と約1700塩基対の長さに渡って73.1%の相同性をもつことがわかった。
また、配列番号64の塩基配列から配列番号66のヒトアミノ酸配列に翻訳されると予測された。配列番号66のアミノ酸配列とdnaform46870のオープンリーディングフレームから予測されるアミノ酸配列(配列番号61)との間には、372アミノ酸配列に渡って87%の相同性があった。
【0183】
さらに、配列番号66のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号61のアミノ酸配列が最も相同性が高かった。
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号64の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
【0184】
従って、配列番号64が、配列番号58に対する新規なヒトオルソログDNAの塩基配列であると考えられた。dnaform46870のヒトオルソログDNAのオープンリーディングフレーム(終止コドンを含む)は1680塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は559アミノ酸残基からなる。
配列番号64に記載の塩基配列がコードするアミノ酸配列(配列番号66)に関して、BLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中に、配列番号61に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号64に記載の塩基配列がコードするアミノ酸配列を有するタンパク質は、配列番号58に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【0185】
配列番号66に記載のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号30−140、145−252、257−370にCUB domainの特徴を示す配列(PfamにCUB としてエントリーされるアミノ酸配列)を見出した。CUBドメインは、110アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質(補体系のプロテアーゼ等)に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号66に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムtmHMM(S. Moller, M.D.R. Croning, R. Apweiler.Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics, 17(7):646−653, 2001.)を用いて膜貫通部位を予測したところ、C末端のアミノ酸残基(アミノ酸番号536−558)に膜貫通部位が予測された。
以上のことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の1つであることが推測された。
【0186】
実施例7 PCR法を用いた組織発現解析
本発明のタンパク質をコードするmRNAの正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
(1)cDNA合成
以下のマウス(森脇和郎、外1名編、Molecular Medicine別冊、Vol. 36「自然発症疾患モデル動物 」、中山書店、1999年)の19組織からトータルRNAを抽出し、オリゴdTをプライマーとして逆転写酵素を用いてcDNA合成を行った。
(a)正常マウスの組織および糖尿病モデルマウスの組織
▲1▼ 対照マウスC57BL/KsJ − +m/+m Jcl(メス、8週齢)の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲2▼ 糖尿病モデルマウスC57BL/KsJ − db/db Jcl(メス、8週齢)の膵臓、脂肪細胞、肝臓、眼
(b)老化促進マウスの組織
▲1▼ 正常老化マウス SAM R1/TA Slc(オス、13週齢)の海馬、前頭葉皮質
▲2▼ 老化促進マウス SAM P8/Ta Slc(オス、15週齢)の海馬、前頭葉皮質
(c) 癌転移モデルマウスの組織
▲1▼ 対照マウスBalb/c(メス、5週齢)の正常結腸
▲2▼ 癌転移モデルマウスBalb/c(メス、6週齢)結腸癌(マウス腹腔に結腸癌細胞Colon26を移植し、2週間後に結腸癌を摘出)
【0187】
(2)PCR法による定量
下記の3個の、本発明のタンパク質をコードしているmRNAの発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
(a)dnaform28983
5’側プライマー:AAGTTTTGGACGGACCCTTA(配列番号67)
3’側プライマー:GACTTGAAAAGTCGCATCAGG(配列番号68)
(b)dnaform33042
5’側プライマー:ACAATGCTTGGACCATCCTT(配列番号69)
3’側プライマー:TGGCCAAAACCACCTTATTC(配列番号70)
(c)dnaform46870
5’側プライマー:TGGCAATGGTACTGTTGGAC(配列番号71)
3’側プライマー:AGCTGCACTCCGTGTTGTAG(配列番号72)
定量結果はGlyceraldehyde 3−phosphate dehydrogenase (GAPDH) を内部標準として補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)を GAPDHの発現量(コピー数/μl)で除し、定数(1×106)を乗して表示した。 その結果を表3に示す。
【0188】
【表3】
【0189】
表3から明らかな通り、dnaform28983は眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少した。dnaform33042は全身で強く発現しており、特に肺、膵臓で強力に発現し、糖尿病の肝臓および結腸癌で発現が減少した。dnaform46870は発現量が極めて低く、脂肪組織や視床に弱く発現した。上記クローンのcDNAおよび該cDNAによってコードされるタンパク質は、糖尿病や癌などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0190】
実施例8 ハエホモログDNAを用いたRNAi法による機能解析
(1)マウスcDNAのハエホモログDNAの解析および取得
上記で得られたマウス全長cDNAの塩基配列(クローン名:dnaform28983、dnaform33042)に対するハエ遺伝子のホモログを以下に示す配列解析により予測した。配列解析は、ORFから翻訳されるタンパク質を考え、アミノ酸配列レベルで行った。マウスクローンdnaform28983、dnaform33042として、配列番号30、34に示すアミノ酸配列を含むマウス全長cDNAクローン(配列番号6、10)とハエクローン(Berkeley Drosophila Genome Project(BDGP) Drosophila Genomic Sequence Release 3.0)との間においてペアワイズな配列比較をNCBI BLASTP 2.2.2 (Altschul et al., Nucleic Acids Res. 25, 3389−3402 (1997))により行い、2種のクローン間において互いに最も良いE−valueの値を示した関係にあるハエの遺伝子を、予測されたホモログDNAとして同定した(Tatusov, Koonin & Lipman, Science 278, 631 (1997))。結果として、マウスcDNA(dnaform28983、dnaform33042)に対するハエホモログDNAを見つけることができた。ハエホモログDNAの遺伝子番号は、それぞれ、マウス:dnaform28983に対してハエ:CG4821(トランスクリプト番号:CG4821−PB)、マウス:dnaform33042に対してハエ:CG4603(トランスクリプト番号:CG4603−PA)であった。
【0191】
(2)ハエ系統の樹立
(i)逆向き反復配列(inverted repeat)ベクターの作製
上記ハエcDNA(CG4821、CG4603)のORF、5’側約500bpの断片(以下これを「目的のcDNA」と称することがある)を、ハエのcDNAライブラリー(Berkeley Drosophila Genome Project( http://www.fruitfly.org)で同定されたunigeneset; Invitrogen社)を鋳型としたPCRによって増幅した。PCRプライマーは、CpoIA7(配列番号73:AAATTTCGGACCGの3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とSfiIA3(配列番号74:AAATTTGGCCATATAGGCCの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセット、およびSfiIB7(配列番号75:AAATTTGGCCTACATGGCCに記載の塩基配列の3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とCpoIB3(配列番号76:塩基配列:AAATTTCGGTCCGの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセットを用いた。
【0192】
上記の各セットのプライマーを用いてPCR増幅した約500bpのDNA断片をSfiIで消化し、この消化断片をハエクローニング用ベクター(pUASTCS1:上田龍他、細胞工学、vol21, No.8, 923−932(2002))をSfiIで消化したサイト間に挿入しクローニングした。さらに、このベクターをCpoIで消化したサイト間に、上記PCRで増幅したDNA断片をCpoI消化したDNA断片を挿入しクローニングした。この2回のサブクローニングにより、ハエcDNAのORFの約500bpの断片が、UAS配列(GAL上流活性化配列)の下流に隣接したヒートショックプロテイン70のベーシックプロモーターの制御下に、逆向きで2カ所挿入されたベクター(inverted repeat ベクター)が取得された。
【0193】
上記で用いたハエトランスフォーメション用ベクターであるpUASTベクターはトランスポゾンP因子を利用したベクターで、UAS配列とヒートショックプロテイン70のベーシックプロモーターを利用して、転写促進タンパク質GAL4がUAS配列に結合することによりUAS配列の下流に挿入した逆向き反復配列の転写を誘導できるベクターである。
【0194】
(ii)ハエの形質転換
通常のP因子形質転換法である、上田龍他、細胞工学、vol21, No.8, 923−932(2002)に記載の方法に則って、上記(i)で調製したinverted repeat ベクターDNAをW1118系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)の初期胚にマイクロマニュピレーターを用いて微量注入した。これを培養して孵化させ、成虫とした後に、上記文献記載の手順に準じて交配を行った。この交配で、ダブルバランサーとしてW1118系統のSp/SM1、Cy:Pr/TM3、Sb Serを用いた。この交配により、上記inverted repeatベクターが挿入した染色体を、ホモ接合に持ったハエ(以下、これを「IR系統」と称する)が作製された。
【0195】
(3)RNAi効果の誘導
(i)GAL4ドライバーとの交配による変異誘導
上記(2)で得られたIR系統のハエをAct5C−GAL4系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)と交配した(図1)。Act5C−GAL4は、全身の細胞で発現する細胞性アクチン遺伝子(Act5C)のプロモーターに酵母GAL4遺伝子をつないだfusion geneを遺伝子導入した系統である。従って、このAct5C−GAL4導入遺伝子を持ったハエでは全ての細胞で、GAL4タンパク質が発現している。
【0196】
IR系統のハエと、Act5C−GAL4系統のハエを交配した子孫(F1世代、以下これを「RNAi個体」と称する)では、図1にあるように2種類の導入遺伝子が存在する。従って、全ての細胞でGAL4タンパク質が発現し、IRベクターを強制転写するため、dsRNAが細胞に出現し、RNAi効果を発揮し、ターゲットmRNAが発現した場合にこれを分解する。従って、その個体の全ての細胞でターゲット遺伝子の機能阻害が起こる。ターゲットmRNAが発現していない細胞では何の効果ももたらさない。
【0197】
(4)表現型の解析および結果
上記(3)で誘導されたRNAi効果で、それぞれのマウスcDNA(dnaform28983、dnaform33042)のハエホモログDNA(CG4821、CG4603)がコードするタンパク質の機能が阻害されたことによるハエ個体の表現型の変化を観察した。その結果、CG4821のRNAi個体およびCG4603のRNAi個体は致死、すなわち蛹にはなるが脱皮して成虫となる個体は0%であることが判明した。
【0198】
RNAi技術を用いて上記ハエ遺伝子の発現抑制を行い機能阻害することにより、ハエ個体が致死または半致死となったことから、該遺伝子は発生あるいは個体の生存・機能維持に重要な役割を果たしていることが分かった。前記の通り、dnaform28983(配列番号6)がコードするタンパク質(配列番号30)は、腫瘍を制御する機能を有するプロテアーゼであることが推測されており、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。また、dnaform33042(配列番号10)がコードするタンパク質(配列番号34)は、システインプロテアーゼであることが推測されており、マウスの全身で強く発現し癌組織では発現が減少していることから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。
上記の通り、dnaform28983およびdnaform33042がコードするタンパク質はプロテアーゼ活性を有しており、発生・分化・生理的機能あるいは病態との関連で重要な役割を果たしていることが推察される。
【0199】
実施例9 各完全長cDNAがコードするタンパク質の総合的機能解析
上記実施例4の塩基配列の解析結果ならびに実施例5〜8の組織発現および機能解析結果から、本発明のタンパク質は、次の性質を有することが明らかとなった。
(1)dnaform37901(配列番号1、25)
dnaform37901のオープンリーディングフレームから予測されるアミノ酸配列(配列番号25)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、小脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【0200】
(2)dnaform46350(配列番号2、26)
dnaform46350のオープンリーディングフレームから予測されるアミノ酸配列(配列番号26)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【0201】
(3)dnaform9578(配列番号4、28)
dnaform9578のオープンリーディングフレームから予測されるアミノ酸配列(配列番号28)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、どの組織でも全体的により強く発現する傾向があるが、特に、精巣で強力に発現していることが示された。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、生殖細胞の生成や接着などの機能の制御に関わると考えられ、不妊や避妊、免疫疾患・炎症性疾患の治療薬となる可能性がある。
【0202】
(4)dnaform28983(配列番号6、30)
dnaform28983のオープンリーディングフレームから予測されるアミノ酸配列(配列番号30)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より腫瘍を制御する機能を有するプロテアーゼであると推測された。また、本タンパク質は、実施例7より、眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少することが示された。また実施例8より、本タンパク質のハエホモログタンパク質(CG4821がコードするタンパク質)の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、CG4821のRNAi個体は致死であったことから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、扁平上皮癌・網膜芽腫などの癌、糖尿病・肥満などの内分泌疾患、喘息などの呼吸器系疾患、などの治療薬となる可能性がある。
【0203】
(5)dnaform26163(配列番号9、33)
dnaform26163のオープンリーディングフレームから予測されるアミノ酸配列(配列番号33)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりメタロプロテアーゼの1種であるastacin様プロテアーゼであると推測された。また、本タンパク質に対するヒトオルソログタンパク質は、実施例6より、Peptidase family M12Aに属する亜鉛を必要とするペプチド分解酵素であることが推測された。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、不妊・避妊、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【0204】
(6)dnaform33042(配列番号10、34)
dnaform33042のオープンリーディングフレームから予測されるアミノ酸配列(配列番号34)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりシステインプロテアーゼであると推測された。また、本タンパク質は、実施例7より、全身で強く発現しており、特に肺、膵臓で強力に発現する一方で、糖尿病の肝臓および結腸癌で発現が減少していることが示された。また実施例8より、本タンパク質のハエホモログタンパク質(CG4603がコードするタンパク質)の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、CG4603のRNAi個体は致死であったが、本タンパク質は、マウスの全身で強く発現し癌組織では発現が減少していることから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、肺・膵臓・卵巣などの癌、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【0205】
(7)dnaform46870(配列番号58、61)
dnaform46870のオープンリーディングフレームから予測されるアミノ酸配列(配列番号61)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測された。また、本タンパク質は、実施例6において本タンパク質に対するヒトオルソログ分子を予測したところ本タンパク質と同様にCUB細胞外ドメインを持つことから、本タンパク質は、特に発生段階により制御される膜蛋白質と推測された。また、実施例7より、発現量が極めて低く、脂肪組織や視床に弱く発現していることが分かった。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、糖尿病・肥満などの内分泌疾患、骨粗しょう症、不妊などの治療薬となる可能性がある。
【0206】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAは、プロテアーゼ活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
【0207】
近年、プロテアーゼの生理機能に関する研究の進展にともない、プロテアーゼが細胞機能の重要な制御因子として機能していることが明らかになってきた。プロテアーゼ活性の制御を確実に行うことにより、生体反応を一方向に確実に進めるためには、プロテアーゼ反応が有利であることがわかり、タンパク質の限定分解が多くの重要な細胞機能の制御に関わっていることが明らかとなってきた。したがって、プロテアーゼ活性の異常は様々な疾患の原因となる。
【0208】
例えば、筋ジストロフィー症はCANPと呼ばれる中性プロテアーゼの活性亢進が原因である。また、腫瘍組織が増殖或いは転移する際に、その養分補給を司る血管の新生が起こるが、その際、メタルプロテアーゼによるマトリックスの破壊が起こる。さらに、腫瘍増殖の場合には、システインプロテアーゼ(チオールプロテアーゼ)の活性亢進が生じることも知られている。このような場合には、関連するプロテアーゼの活性を抑制することが、関連疾患進行の阻止、或いは治療に結びつくと考えられる。
【0209】
逆に、プロテアーゼ活性が抑制されることにより、疾患が進行する例としては、アルツハイマー病に代表される神経変性疾患が上げられる。アルツハイマー病の場合は、β−アミロイドペプチドの蓄積が原因の一つと考えられており、それは分解酵素であるネプリライシンの異常が原因と考えられている。
【0210】
また、フィブリンの蓄積による血栓は、線溶系酵素であるプラスミン量を増加させることにより治療可能である。この目的のために、プラスミン前駆体タンパク質であるプラスミノーゲンのプラスミンへの変換を、セリンプロテアーゼの一種であるプラスミノーゲンアクチベーターにより促進する。
【0211】
上記の通り、プロテアーゼは、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、本発明のスクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、抗癌剤(抗腫瘍剤)、抗炎症剤、神経変性疾患治療剤等となり得る。
本出願は、2002年4月19日付けの日本特許出願(特願2002−117794)、2002年5月2日付けの日本特許出願(特願2002−130871)、および2002年12月4日付けの日本特許出願(特願2002−352559)に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【0212】
【配列表】
【図面の簡単な説明】
【図1】図1は、RNAi個体中の導入遺伝子の誘導方法を示す概念図である。
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
cDNAの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長cDNAをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるcDNAに重複がないという意味であり、各cDNAが1種類ずつ含まれているライブラリーのことである。
【0003】
完全長cDNAクローニング法については、特開平9−248187号公報及び特開平10−127291号公報に記載されている。この方法は、mRNAの5’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたmRNAを鋳型とし、oligo dTをプライマーとして逆転写によりRNA−DNA複合体を作製し、この複合体の内、mRNAの完全長に対応するDNAを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【0004】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている(特開平10−84961号公報)。さらに、合成された完全長cDNAライブラリーに含まれるDNA断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている(特開平11−9273号公報)。
【0005】
このような技術により作製された完全長cDNAライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))。
かくして得られるカタログ化された完全長cDNAライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えば、その塩基配列は同定されるが、該cDNAがコードするタンパク質の生理活性は依然不明のままである。
【0006】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0007】
【課題を解決するための手段】
本発明者らは、マウス完全長cDNAライブラリー中のcDNAクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列にプロテアーゼ活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質がプロテアーゼ活性を有すると同定した。また、(i)これらのcDNAの各組織における発現量を解析し、(ii)該cDNAがコードするタンパク質の発現を阻害した個体の表現型の変化を解析し、(i)および/または(ii)の解析結果から該cDNAがコードするタンパク質の有する機能を総合的に解析した。さらに、これらのcDNAに対する新規なヒトのオルソログDNAを取得し解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0008】
すなわち本発明によれば、以下の(1)〜(15)に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。
【0009】
(2) (1)に記載のタンパク質をコードするDNA。
(3) (1)に記載のタンパク質をコードする完全長cDNA。
(4) 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。
(c)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。
【0010】
(5) (2)〜(4)のいずれかに記載のDNAを含む組換えベクター。
(6) (2)〜(4)のいずれかに記載のDNAまたは(5)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(7) (6)に記載の細胞により産生される、(1)に記載の組み換えタンパク質。
(8) (2)〜(4)の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【0011】
(9) (1)または(7)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(10) 抗体がモノクローナル抗体である(9)に記載の抗体。
(11) モノクローナル抗体が(1)または(7)に記載のタンパク質のプロテアーゼ活性を中和する作用を有することを特徴とする(10)に記載の抗体。
【0012】
(12) (1)または(7)に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
(13) (6)に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
【0013】
(14) (1)に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または(2)〜(4)のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(15) (1)に記載のタンパク質、および/または(2)〜(4)のいずれかに記載のDNAを結合させた担体。
【0014】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得及び塩基配列の解析
本発明のDNAは、配列番号25〜48、60〜62、65または66に記載のアミノ酸配列からなるタンパク質、またはアミノ酸配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば20個以下、好ましくは15個以下、より好ましくは10個以下、さらに好ましくは5個以下を意味する)のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0015】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜24、57〜59、63または64に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号1531〜2631、配列番号2の塩基番号992〜4270、配列番号3の塩基番号8〜1459、配列番号4の塩基番号1〜2034、配列番号5の塩基番号10〜411、配列番号6の塩基番号75〜848、配列番号7の塩基番号98〜1351、配列番号8の塩基番号526〜2244、配列番号9の塩基番号256〜1500、配列番号10の塩基番号68〜1042、配列番号11の塩基番号280〜1191、配列番号12の塩基番号344〜958、配列番号13の塩基番号159〜1190、配列番号14の塩基番号476〜979、配列番号15の塩基番号227〜1582、配列番号16の塩基番号174〜1493、配列番号17の塩基番号134〜1453、配列番号18の塩基番号167〜1486、配列番号19の塩基番号16〜1335、配列番号20の塩基番号76〜1326、配列番号21の塩基番号26〜1345、配列番号22の塩基番号466〜1476、配列番号23の塩基番号277〜3342、配列番号24の塩基番号623〜1411、配列番号57の塩基番号332〜826、配列番号58の塩基番号819〜2102、配列番号59の塩基番号1110〜1889、配列番号63の塩基番号1〜1296、配列番号64の塩基番号1〜1680に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’及び/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0016】
本発明のDNAは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてcDNAを合成するが、このとき完全長のcDNAを合成するために5’キャップ(7MeGpppN)サイトに特異的なジオール構造にタグになる分子を化学結合させ、このmRNAを鋳型としてoligo dTをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のcDNAのみを分離する方法(特開平9−248187号公報、特開平10−127291号公報)を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法(特開平10−84961号公報)を用いるのが好ましい。ここで、高温下とは40〜80℃を意味する。
【0017】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のDNAを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター(特開平11−9273号公報)が好ましく用いられる。かくして得られるcDNAライブラリーは、全てのクローンが均一に存在している(以下、これを「カタログ化されている」と称することがある)訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法(特開2000−325080号公報、Carninci, P. et al.,Genomics, 37, 327−336(1996))を用いることが好ましい。
【0018】
カタログ化されたcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、cDNA全長の場合にはその末端100ベースの配列について得られた塩基配列を、BLAST(http://www.ncbi.nlm.nih.gov/BLAST/;National Center of Biotechnology Information)を用いて、NCBIのGenbank、EMBL、DDBJ、PDB等のデータベースについて検索し、最も高い相同性を示す配列でも相同性が30%以下であり、かつ該DNAの翻訳領域の全長について最も高い相同性を示す配列でもその相同性が40%以下であるものを新規として以下の解析に供することとした。
【0019】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜24、57〜59、63または64に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号1531〜2631、配列番号2の塩基番号992〜4270、配列番号3の塩基番号8〜1459、配列番号4の塩基番号1〜2034、配列番号5の塩基番号10〜411、配列番号6の塩基番号75〜848、配列番号7の塩基番号98〜1351、配列番号8の塩基番号526〜2244、配列番号9の塩基番号256〜1500、配列番号10の塩基番号68〜1042、配列番号11の塩基番号280〜1191、配列番号12の塩基番号344〜958、配列番号13の塩基番号159〜1190、配列番号14の塩基番号476〜979、配列番号15の塩基番号227〜1582、配列番号16の塩基番号174〜1493、配列番号17の塩基番号134〜1453、配列番号18の塩基番号167〜1486、配列番号19の塩基番号16〜1335、配列番号20の塩基番号76〜1326、配列番号21の塩基番号26〜1345、配列番号22の塩基番号466〜1476、配列番号23の塩基番号277〜3342、配列番号24の塩基番号623〜1411、配列番号57の塩基番号332〜826、配列番号58の塩基番号819〜2102、配列番号59の塩基番号1110〜1889、配列番号63の塩基番号1〜1296、配列番号64の塩基番号1〜1680に示される配列を有するものが挙げられる。
【0020】
かくして取得された新規な塩基配列を、BLAST(Basic local alignment search tool;Altschul, S.F., et al.,J. Mol. Biol., 215, 403−410(1990)) による相同性検索 (homology search)や、HMMER(隠れMarkovモデルによる配列解析手法; Eddy, S. R., Bioinformatics 14, 755−763 (1998)) の機能群のひとつである HMMPFAM(http://pfam.wustl.edu)による蛋白質特徴検索 (profile search)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0021】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のDNAのこれに対応する部分とのidentityがe−valueとして10−4以下のものか、あるいは30%以上のものを示す。
【0022】
例えば、上位にヒットした触媒ドメイン配列の多くがプロテアーゼとしての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、プロテアーゼ活性を持つであろうという予測が成り立つ。
【0023】
HMMPFAMでは、Pfamという蛋白質プロファイルを集積したデータベース中にあるエントリーが有する塩基配列の特徴を、解析対象である塩基配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【0024】
配列番号1に記載の塩基配列がコードするアミノ酸配列(配列番号25)は、BLASTサーチにより、ADAMTS18 proteinとe−value:0.0、708アミノ酸残基で75%の相同性を、metalloprotease disintegrin 16 with thrombospon din type I motifとe−value:0.0、671アミノ酸残基で61%の相同性を、A disintegrin and metalloproteinase with thrombospondin motifs 12とe−value:5×10−152で、702アミノ酸残基で42%の相同性を、さらにA disintegrin and metalloproteinase with thrombospondin motifs 10と相同性を有する。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号412−1137がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)が見出される。
これらの結果から、配列番号1に示す塩基配列がコードするアミノ酸配列からなるタンパク質はmetalloproteinasesであると推測される。また、このタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが推測される。
【0025】
配列番号2に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、ADAMTS18 proteinとe−value:0.0、807アミノ酸残基で90%の相同性を、ADAMTS16とe−value:0.0、816アミノ酸残基で61%の相同性を、さらにADAMTS12とe−value:0.0、786アミノ酸残基で43%の相同性を有する。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号1354−1969がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)が見出される。また、塩基番号796−1172がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる塩基配列)が見出される。
これらの結果より、配列番号2に示す塩基配列がコードするアミノ酸配列からなるタンパク質はmetalloproteinasesであると推測される。このタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが推測される。
【0026】
配列番号3に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Probable serine protease HTRA4 precursorとe−value:5×10−175、470アミノ酸残基と67%の相同性を、insulin−like growth factor binding protein 5 proteaseとe−value:5×10−147、485アミノ酸残基と55%の相同性を有する。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号559−1111がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号3に示す塩基配列がコードするアミノ酸配列からなるタンパク質はセリンプロテアーゼであると推測される。
【0027】
配列番号4に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、metalloprotease/disintegrinとe−value:5×10−154、297アミノ酸残基と85%の相同性を、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)とe−value:5×10−152、641アミノ酸残基と43%の相同性を、さらにADAM 18 precursor (A disintegrin and metalloproteinase domain 18)と、e−value:5×10−151、642アミノ酸残基と43%の相同性を有する。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号559−1152がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列(PfamにReprolysinとしてエントリーされる塩基配列)、塩基番号190−528がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)が見出される。
これらの結果より、配列番号4に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。また、このタンパク質は、文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが推測される。
【0028】
配列番号5に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、transmembrane protein tMDC Iとe−value:3×10−17、118アミノ酸残基と43%の相同性を、tMDC Iとe−value:6×10−17、118アミノ酸残基と42%の相同性を、さらにADAM 18 precursor (A disintegrin and metalloproteinase domain 18)とe−value:2×10−16、113アミノ酸残基と46%の相同性を有する。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号199−472がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)が見出される。
これらの結果より、配列番号5に示す塩基配列がコードするアミノ酸配列からなるタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが推測される。
【0029】
配列番号6に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 10 from Patent WO0136645とe−value:2×10−75、286アミノ酸残基と49%の相同性を、Serine protease DESC1 precursorとe−value:3×10−75、283アミノ酸残基と48%の相同性を、airway trypsin−like proteaseとe−value:1×10−72、282アミノ酸残基と47%の相同性を有する。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号150−827がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号6に示す塩基配列がコードするタンパク質は細胞の増殖や接着を制御するセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から扁平上皮細胞癌で発現が抑制されていることが推測される。
【0030】
配列番号7に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 10 from Patent WO0136645とe−value:5×10−113、418アミノ酸残基と51%の相同性を、airway trypsin−like proteaseとe−value:2×10−96、419アミノ酸残基と42%の相同性を、さらにAirway trypsin−like protease precursorとe−value:6×10−95、420アミノ酸残基と41%の相同性を有する。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号653−1330がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号7に示す塩基配列がコードするタンパク質はトリプシン様セリンプロテアーゼであると推測される。このタンパク質は、文献情報(Biol Chem 1998 May 8;273(19):11895−901)から慢性的気管疾患患者の痰から得られ、気管での発現が顕著に高いことが推測される。
【0031】
配列番号8に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 7 from Patent WO0157194とe−value:5×10−104、418アミノ酸残基と37%の相同性を、serine protease TADG15とe−value:5×10−103、650アミノ酸残基と39%の相同性を、さらにMembrane−type serine protease 1とe−value:5×10−103、650アミノ酸残基と39%の相同性を有する。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号1528−2217がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号8に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は文献情報(J Biol Chem 1999 Jun 25;274(26):18231−6)からヒト乳癌に関係することが推測される。
【0032】
配列番号9に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、hatching enzyme EHE7とe−value:2×10−48、247アミノ酸残基と40%の相同性を、High choriolytic enzyme 2 precursor(Hatching enzymezinc−protease HCE 2 subunit)とe−value:2×10−42、246アミノ酸残基と40%の相同性を有する。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号466−1041がコードするアミノ酸配列にメタロプロテアーゼであるastacinの特徴を示す配列(PfamにAstacinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号9に示す塩基配列がコードするタンパク質はメタロプロテアーゼであると推測される。このタンパク質は、文献情報(Dev Biol 1992 Oct;153(2):250−8)からastacin (protease)に属することが推測される。
【0033】
配列番号10に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:8×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:2×10−33、280アミノ酸残基と36%の相同性を有する。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号10に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0034】
配列番号11に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:8×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:3×10−33、278アミノ酸残基と35%の相同性を有する。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号604−951がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号11に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0035】
配列番号12に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:2×10−54、207アミノ酸残基と51%の相同性を、Hypothetical 33.5 kDa proteinとe−value:4×10−31、203アミノ酸残基と36%の相同性を有する。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号398−745がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号12に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0036】
配列番号13に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:7×10−63、343アミノ酸残基と47%の相同性を、Hypothetical 33.5 kDa proteinとe−value:3×10−33、278アミノ酸残基と35%の相同性を有する。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号603−950がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号13に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0037】
配列番号14に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Drosophila melanogaster genomic scaffoldとe−value:3×10−54、201アミノ酸残基と52%の相同性を、Hypothetical 33.5 kDa proteinとe−value:4×10−31、203アミノ酸残基と36%の相同性を有する。
また、配列番号14に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)が見出される。
これらの結果から、配列番号14に示す塩基配列がコードするタンパク質はシステインプロテアーゼであると推測される。
【0038】
配列番号15に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 5 from Patent WO0157081とe−value:0.0、469アミノ酸残基と94%の相同性を、Aqualysin I precursorとe−value:5×10−45、355アミノ酸残基と34%の相同性を有する。
また、配列番号15に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号714−1602がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列(PfamにPeptidase_S8としてエントリーされる配列)が見出される。
これらの結果から、配列番号15に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。
【0039】
配列番号16に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:2×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:2×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:1×10−88、439アミノ酸残基に亘り40%の相同性を有する。
また、配列番号16に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号795−1472がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号16に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらの文献情報等により、配列番号16に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0040】
配列番号17に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、Airway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基と40%の相同性を有する。
また、配列番号17に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号755−1432がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号17に示す塩基配列がコードするアミノ酸配列はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されるトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号17に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0041】
配列番号18に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基と40%の相同性を有する。
また、配列番号18に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号788−1465がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号18に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号18に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0042】
配列番号19に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Serine protease DESC1 precursorとe−value:3×10−96、421アミノ酸残基と43%の相同性を、airway trypsin−like proteaseとe−value:3×10−89、417アミノ酸残基と40%の相同性を、さらにAirway trypsin−like protease precursorとe−value:2×10−88、439アミノ酸残基に亘り40%の相同性を有する。
また、配列番号19に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号637−1314がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号19に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。このタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、他の文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号19に示す塩基配列がコードするタンパク質は、さらに上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0043】
配列番号20に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Sequence 1 from Patent WO0173074とe−value:5×10−122、417アミノ酸残基と51%の相同性を、Airway trypsin−like protease precursorとe−value:5×10−93、420アミノ酸残基と40%の相同性を、さらにairway trypsin−like proteaseとe−value:2×10−92、420アミノ酸残基と38%の相同性を有する。
また、配列番号20に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号628−1305がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号20に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが推測される。これらのことから、配列番号20に示す塩基配列がコードするタンパク質は、さらに上皮における炎症に関わる機能を有するセリンプロテアーゼであると推測される。
【0044】
配列番号21に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、testes−specific protein TSP50とe−value:5×10−128、439アミノ酸残基と54%の相同性を、Brain−specific serine protease 4 precursorとe−value:2×10−36、281アミノ酸残基と33%の相同性を、さらにMarapsin precursorとe−value:1×10−35、253アミノ酸残基と32%の相同性を、さらにTestisin precursorとe−value:9×10−35、273アミノ酸残基と32%の相同性を有する。
また、配列番号21に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号522−1246がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)が見出される。
これらの結果より、配列番号21に示す塩基配列がコードするタンパク質はセリンプロテアーゼであると推測される。この蛋白質は、文献情報(Biochem Biophys Res Commun 1998 Nov 18;252(2):307−12)から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが推測される。 これらのことから、配列番号21に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであると推測される。
【0045】
配列番号22に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、機能未知蛋白質とe−value:0.0、355アミノ酸残基と98%の相同性を、KIAA1203 proteinとe−value:4×10−23、118アミノ酸残基と50%の相同性を、Homo sapiens deubiquitinating enzyme UnpESとe−value:2×10−8、66アミノ酸残基に亘り48%の相同性を、さらにUbiquitin carboxyl−terminal hydrolase 4とe−value:2×10−8、66アミノ酸残基と48%の相同性を有する。
また、配列番号22に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号2−205がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)が見出される。
これらの結果より、配列番号22に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号22に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【0046】
配列番号23に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、機能未知蛋白質とe−value:0.0、827アミノ酸残基と99%の相同性を、KIAA1203 proteinとe−value:1×10−67、234アミノ酸残基と55%の相同性を、さらにubiquitin−specific proteaseとe−value:8×10−56、653アミノ酸残基と29%の相同性を有する。
また、配列番号23に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号244−337がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−1としてエントリーされる配列)が見出される。また、塩基番号1885−2070がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)が見出される。
これらの結果より、配列番号23に示す塩基配列がコードするタンパク質はプロテアーゼであると推測される。この蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが推測される。これらのことから、配列番号23に示す塩基配列がコードするタンパク質は、さらに腫瘍形成に関わるチオールプロテアーゼであると推測される。
【0047】
配列番号24に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、carboxypeptidase homologとe−value:1×10−93、331アミノ酸残基と48%の相同性を、Carboxypeptidase B precursorとe−value:2×10−92、327アミノ酸残基と48%の相同性を、さらにCarboxypeptidase B precursorとe−value:4×10−90、330アミノ酸残基と46%の相同性を有する。
また、配列番号24に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと塩基番号509−1357がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列(PfamにZn_carbOpeptとしてエントリーされる配列)が見出される。
これらの結果より、配列番号24に示す塩基配列がコードするタンパク質はカルボキシペプチダーゼであると推測される。この蛋白質は、文献情報(J Biol Chem 1988 Nov 25;263(33):17837−45)から、膵臓に発現するカルボキシペプチダーゼであることが、また他の文献情報(J Biol Chem 1992 Feb 5;267(4):2575−81)から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが推測される。これらのことから、配列番号24に示す塩基配列がコードするタンパク質は、さらに膵臓疾患に関わるカルボキシペプチダーゼであると推測される。
【0048】
配列番号57に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Homo sapiens complement C1r−like proteinase precursorとe−value:1×10−49、152アミノ酸残基に亘り63%の一致度で、またHomo sapiens cDNA FLJ14022 weakly similar to COMPLEMENT C1R COMPONENT PRECURSORとe−value:1×10−48、152アミノ酸残基に亘り62%の一致度で、さらにHuman mRNA for complement component C1rとe−value:7×10−18、103アミノ酸残基に亘り39%の一致度でヒットする。
これらの結果より、配列番号57に示す塩基配列がコードするタンパク質は 補体系のメタロプロテアーゼであると推測される。
【0049】
配列番号58に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、X.laevis mRNA for xolloidとe−value:2×10−58、436アミノ酸残基に亘り30%の一致度で、またDorsal−ventral patterning tolloid protein precursorとe−value:4×10−58、445アミノ酸残基に亘り30%の一致度で、さらにBone morphogenetic protein 1 precursorとe−value:7×10−57、436アミノ酸残基に亘り30%の一致度でヒットする。
また、配列番号61に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと配列番号61のアミノ酸番号30−370のアミノ酸配列に3箇所にわたってCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)が見出される。
これらの結果より、配列番号58に示す塩基配列がコードするタンパク質は分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測される。
【0050】
配列番号59に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus CSMD1 (Csmd1)とe−value:5×10−108、257アミノ酸残基に亘り68%の一致度で、またHomo sapiens CUB and sushi multiple domains protein 1 short formとe−value:1×10−48、153アミノ酸残基に亘り67%の一致度でヒットする。
また、配列番号62に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと、配列番号62のアミノ酸番号25−382および203−256のアミノ酸配列にわたってComplement control protein (CCP) modules またはshort consensus repeats (SCR)の特徴を示す配列(Pfamにsushiとしてエントリーされる配列)が見出され、アミノ酸番号87−195のアミノ酸配列にCUB domainの特徴を示す配列(PfamにCUBとしてエントリーされる配列)が見出される。これらの結果より、配列番号59に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであると推測される。
【0051】
本発明のDNAは、翻訳配列中に塩基の欠失もしくは挿入を有した状態で取得されることがあるが、上記のような相同性検索やたんぱく質特徴検索を行った結果、該DNAの塩基配列中の欠失もしくは挿入が推測された場合には、当業者において通常用いられているライブラリースクリーニングやPCRクローニング等の方法を用いて塩基の欠失もしくは挿入の無い完全長cDNAを取得することができる。かくして得られる完全長cDNAを用いて本発明のタンパク質を発現させ、これを機能解析に用いることができる。
【0052】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜24、57〜59、63または64に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば60個以下、好ましくは30個以下、より好ましくは20個以下、さらに好ましくは10個以下、特に好ましくは5個以下を意味する。)の塩基が欠失、置換及び/または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつプロテアーゼ活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号25〜48、60〜62、65または66に記載のタンパク質のアミノ酸配列において1若しくは数個のアミノ酸配列が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質をコードするものが含まれる。
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜24、57〜59、63または64に記載の塩基配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
【0053】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0054】
また、配列番号1〜24または57〜59に記載の塩基配列は、マウスを由来とするものであるが、上記したcDNAライブラリーの作製法に従ってヒトのcDNAライブラリーを作製し、該ライブラリーに対して配列番号1〜24または57〜59の塩基配列を有するDNA断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号1〜24または57〜59に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNA(以下、これを「ヒトホモログDNA」と称することがある)を取得することもできる。本発明の配列番号1〜24または57〜59に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトホモログDNAも含まれる。
【0055】
また、インフォマティックスを利用して、ヒトホモログDNAが有する塩基配列を予測し、該塩基配列を基に上記のヒトcDNAライブラリーなどからヒトホモログDNAを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、(i)目的とするcDNAの塩基配列をクエリーとして、ヒト等のcDNAデータベース(インフォマティックスにより予測されるcDNAデータベースを含む)に対しBLASTなどを用いて相同性検索を行う方法や、(ii)目的とするcDNAの塩基配列をクエリーとして、ヒト等のESTデータベースに対しBLASTなどを用いて相同性検索を行い、ヒットしたESTが有する配列を目的とするcDNAの塩基配列を参照して連結する方法、さらに(iii)目的とするcDNAの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しBLASTなどを用いて相同性検索を行い、目的とするcDNAの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してGenscan(http:// genes. mit.edu/GENSCAN.html)やSim4(Genome Res., 8: 976−74 (1998))等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【0056】
マウス由来のcDNAのヒトホモログDNAの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号1〜24、57〜59に記載の塩基配列を有するcDNAはいずれも新規であり、上記(i)の方法では、ヒトホモログDNAの塩基配列を取得できないと考えられるため、(ii)あるいは(iii)に記載の方法などが好ましく用いられる。
【0057】
かくして予測されたヒトホモログDNAの塩基配列を基に、上記のヒトcDNAライブラリーから、配列番号1〜24、57〜59に記載の塩基配列を有するDNAに対するヒトホモログDNAを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログDNAの5’端、および3’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトcDNAライブラリーを鋳型としてPCRを行う方法や、予測されたヒトホモログDNAの一部の配列をプローブとして、上記ヒトcDNAライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【0058】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログDNAの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。2種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【0059】
つまり、上記でホモログとして取得されたヒト由来のDNAは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のDNAがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける同一の機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【0060】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。(i)まず、本発明のcDNAの塩基配列と、取得されたヒトホモログDNAの塩基配列について相同性を解析する。次に、本発明のcDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、(ii)取得されたヒトホモログDNAの塩基配列と、対応する本発明のcDNAの塩基配列について相同性を解析する。次に、取得されたヒトホモログDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のcDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記(i)および(ii)を確認することにより、取得されたヒトホモログDNAが、本発明のcDNAに対応するヒトオルソログDNAであると同定することができる。上記(i)および(ii)に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記(i)および(ii)に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【0061】
かくして取得されたヒトホモログDNA、あるいはオルソログDNAの塩基配列を、BLASTによる相同性検索やHMMPFAMによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定および確認することができる。
さらに、取得されたヒトホモログDNAの完全長cDNAを用いて本発明のタンパク質を発現させ、これを活性の確認および機能解析等に用いることができる。
【0062】
本発明のcDNAのヒトオルソログDNAとして、例えば配列番号63または64に記載の塩基配列を有するDNAが挙げられ、また本発明のタンパク質のヒトオルソログタンパク質として、配列番号65または66に記載のアミノ酸配列を有するタンパク質等が挙げられる。
【0063】
配列番号63に記載の塩基配列がコードするアミノ酸配列(配列番号65)についてHMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号92−283に、Astacin (Peptidase family M12A) (PfamにAstacinとしてエントリーされるアミノ酸配列)を見出した。Peptidase family M12Aに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号63に記載の塩基配列がコードするアミノ酸配列は、Peptidase family M12Aに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【0064】
配列番号64に記載の塩基配列がコードするアミノ酸配列(配列番号66)に関して、BLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中に、配列番号61に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、配列番号58に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【0065】
配列番号66に記載のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号30−140、145−252、257−370にCUB domainの特徴を示す配列(PfamにCUB としてエントリーされるアミノ酸配列)を見出した。CUBドメインは、110アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質(補体系のプロテアーゼ等)に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号66に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムtmHMM(S. Moller, M.D.R. Croning, R. Apweiler.Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics, 17(7):646−653, 2001.)を用いて膜貫通部位を予測したところ、C末端のアミノ酸残基(アミノ酸番号536−558)に膜貫通部位が予測された。
以上のことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の1つであることが推測された。
【0066】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号25〜48、60〜62、65または66に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1若しくは数個のアミノ酸が置換、欠失、及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するものも含まれる。
【0067】
本発明のタンパク質の取得方法としては、上記(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0068】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したプロテアーゼ活性を有するものであれば本発明の範囲に含まれる。
【0069】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0070】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0071】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0072】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol.Biol.,53,154, (1970))、リン酸カルシウム法(Science,221,551, (1983))、DEAEデキストラン法(Science,215,166,(1982))、インビトロパッケージング法(Proc.Natl.Acad. Sci.USA,72,581,(1975))、ウィルスベクター法(Cell,37,1053,(1984))、および電気パルス法(Chu.et al.,Nuc.Acids Res.,15,1331(1987))等が挙げられる。
【0073】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263, 7406, (1988))とその宿主であるSf−9(J.Biol.Chem.,263,7406,(1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291,(1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc.Natl.Acad. Sci. USA,77,4216, (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7(ATCC CRL1651:アメリカンタイプカルチャーコレクション保存細胞)が用いられる。
【0074】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(A.A.Vertes et al.,Biosci.Biotechnol. Biochem.,57,2036,(1993))、あるいはトランスポゾンや挿入配列(A.A. Vertes et al. , Molecular Microbiol.,11,739, (1994))等を用いてDNA導入体を作製することもできる。
【0075】
得られた培養物は細胞、あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
【0076】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0077】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、プロテアーゼ活性を有するものであれば、本発明のタンパク質に含まれる。
かくして得られたタンパク質は、他のタンパク質、DNAとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0078】
(3)オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【0079】
該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜24、57〜59、63または64のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0080】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
【0081】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するRNAインターフェアレンス法(以下、これを「RNAi法」と称することがある)に用いることができる。RNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411, 494−498(2001))に記載の方法等を用いることができる。また、上記2本鎖RNAは必ずしも全てがRNAである必要はなく、例えば、WO02/10374号公報に記載のもの等も用いることができる。
【0082】
ここで、標的遺伝子としては、本発明のDNAであれば、如何なるものであってもよい。これらDNAの少なくとも一部の塩基配列と実質的に同一な配列からなる2本鎖RNA(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までの如何なる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5, 115−180(1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase:Bass, B.L., Nature, 411, 428−429(2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’、5’oligoadenylate synthetase(Bass, B.L., Nature, 411, 428−429(2001))を介してRnase Lの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、より好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’、または3’末端が一部突出したものも含むが、3’末端が一部突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0083】
2本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法として具体的には、例えば、合成した1本鎖ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0084】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0085】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【0086】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0087】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
RNAインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0088】
(4)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。
【0089】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0090】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0091】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0092】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein,et al.,Nature,256, 495(1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0093】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(U. Zimmer− mann. et al., Naturwissenschaften,68, 577(1981))によっても行うことができる。
【0094】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0095】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256−259 (1988); Duchosal, M. A., et al., Nature, 355, 258−262( 1992))。
【0096】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0097】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するプロテアーゼ活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0098】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0099】
(5)本発明のタンパク質が有する活性の確認および機能の解析
本発明のタンパク質は、これを上記(2)に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記(1)で推測した活性を有していることを確認することができる。さらに上記(4)のとおりに作製した抗体等との組み合わせにより解析することもできる。
本発明のタンパク質が、プロテアーゼ活性を有することは、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる活性測定方法により解析することができる。
【0100】
具体的には、プロテアーゼ活性の測定に用いられる反応液としては、トリプシン、キモトリプシン、エラスターゼ等が属するセリンプロテアーゼに関しては中性から弱塩基性の緩衝液、パパイン、カテプシン等が属するシステインプロテアーゼには中性から弱酸性の緩衝液、ペプシン、キモシン等が属するアスパラギン酸プロテアーゼには酸性溶液、カルボキシペプチダーゼA、B、サーモリシン等が属する金属プロテアーゼには中性緩衝液が用いられ、Ca2+、Zn2+等の金属イオンが要求される場合は、これらを添加する。
【0101】
基質としては、種々のペプチドおよびタンパク質が用いられる。ペプチドを用いる場合、ペプチド結合が加水分解された際に7−amino−4−methyl−coumarin或いはp−nitroanilineが遊離するように、切断アミノ酸残基のカルボキシル末端側に4−metho−coumaryl−7−amide基およびp−nitroanilide基を結合した基質を設計しておけば、前者は蛍光で、後者は可視での分光的測定が可能である。タンパク質基質を用いる場合は、基質タンパク質或いはウシ血清アルブミン、カゼイン等の多くのプロテアーゼ基質となり得るタンパク質に酵素を作用させ、切断の有無を電気泳動法或いはクロマトグラフィーによって確認する。
【0102】
本発明のタンパク質であるプロテアーゼが有する活性は、上記の通り確認することができるが、これらの方法に限定されるものではない。また、これらの活性測定系は、後述する本発明のタンパク質の機能賦活物質(アゴニストなど)や機能阻害物質(アンタゴニストなど)のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【0103】
また、本発明のタンパク質の機能解析の方法として一般的には、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入して表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。また、このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【0104】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA法、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質に公知のバリアントが存在する場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象cDNAと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0105】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0106】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、対象タンパク質に公知のバリアントが存在する場合には、公知のものも同様に細胞へ導入し、比較解析することにより、対象タンパク質が関連する表現型を同定することができる。また、本発明のタンパク質は酵素活性またはタンパク質分解酵素阻害活性を有するものであることがわかっているので、これらの酵素またはタンパク質分解酵素阻害タンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0107】
(iv)の方法では、上記(3)に記載したオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に、公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0108】
(6)本発明のタンパク質が有する活性を調節する物質のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0109】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まず本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する機能(プロテアーゼ活性)の変化を指標として被検物質を選抜する方法を用いることができる。
【0110】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質との相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(4)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【0111】
プロテアーゼ活性の変化の解析は、各種プロテアーゼの性質に基づいて、それ自体既知の通常用いられる方法により行うことができる。具体的には、上記(5)に記載の方法等を用いて行うことができる。
前記の通り、本発明のプロテアーゼ活性を有するタンパク質は、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、上記スクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、関節炎などの炎症性疾患、免疫性疾患、肺癌、膵臓癌、卵巣癌、扁平上皮癌、網膜芽腫などの癌、運動統合機能障害、神経変性疾患、脊髄小脳変性症などの中枢性疾患、糖尿病や肥満などの内分泌疾患、喘息などの呼吸器系疾患、骨粗鬆症、不妊症などの治療薬や避妊薬として用いることができる。
【0112】
ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のDNA、あるいは組み換えタンパク質については、上記したヒトホモログDNAあるいはヒトホモログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【0113】
かかるプロテアーゼ活性の調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0114】
(7)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、上記(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0115】
被検物質としては、上記(6)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0116】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0117】
(8)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0118】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0119】
(9)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNA及びその部分断片は、それらを基盤上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。
【0120】
ここで、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0121】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。このDNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD−R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0122】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 cDNAライブラリーの調製
(1)mRNAの調製
mRNA調製マウス(C57BL/6)各器官または組織0.5〜1gを10mlの懸濁液でホモジェナイズし、pH4.0 の2M 酢酸ナトリウム1ml と、同量のフェノール/クロロホルム(体積比5:1)混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、RNAが水相から分離沈澱した。この試料を氷の上で1時間インキュベーションした後、15分間4,000rpmで冷却遠心機にかけ、沈澱物を回収した。この検体を70%エタノールで洗い、8mlの水に溶解後2mlの5M NaCl、1 % CTAB(cetyltrimethy− lammonium bromide)、4M尿素、50mM Trisを含むpH7.0 の水溶液16mlを加えることでRNAを沈澱させ、ポリサッカライドを除いた(CTAB沈澱)。
【0123】
続いて室温で4,000rpm、15分間遠心機にかけ、RNAを4mlの7Mグアニジン−Clに溶解した。そして2倍量のエタノールを加えた後、氷上で1時間インキュベーションし、4,000rpm、15分間遠心機にかけ、生じた沈澱物を70%エタノールで洗いRNAを回収した、これを再度水に溶解し、RNAの純度をOD比260/280(>1.8)と230/260(<0.45)を読むことによって計測した。
【0124】
(2)第1鎖cDNAの調製
上記(1)で調製したmRNA 15μgを使って逆転写酵素3,000unit により、最終容量165μlの反応液中で、5−メチル−dCTP、dATP、dTTP、dGTPを各々0.54mM、0.6Mトレハロース、50mM Tris−HCl(pH8.3)、75mM KCl、3mM MgCl2、10mM DTT、52ng/μl BSA、RNaseインヒビター5unitの条件下で逆転写反応を行った。制限酵素XhoIの認識配列を含むオリゴヌクレオチド(配列番号49)(配列中、VはA,G又はCを示し、NはA,G,C又はTを示す)12.6μlをプライマーとして用いた。
【0125】
この反応を始める際、反応液の1/4を採取し、それに1.5μlの[α−32P]−dGTP(3000Ci/mmol、10μCi/μl;Amersham社製)を加えるこことにより、第1鎖cDNAの合成効率を測定した。RI標識した反応液の0.5μlをDE−81ペーパー上にスポットし、0.5Mリン酸ナトリウム緩衝液(pH7.0)で3回洗った前後のRI活性を測定し、計算した。その後、RI標識した反応液と非標識の反応液を混合し、0.5M EDTA 8μl、10% SDS 2μl、プロテイナーゼ(Proteinase)K 20μgを加え、45℃で15分間加熱した。フェノール/クロロホルムによる抽出、エタノール沈澱後、沈澱をRNaseフリーに処理してある水(以下RNaseフリー水とする)47μlに溶解した。
【0126】
(3)5’キャップ構造及び3’末端へのビオチン付加
RNAジオールのビオチン化RNAのジオール部位(Cap構造のある5’末端と、ポリA鎖のある3’末端のリボースの双方に存在)にビオチンを結合させるために、2段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化RNA体のカップリング反応である。まず、逆転写反応で得られたRNA−第1鎖cDNA複合体15μgを、6.6mM酢酸ナトリウム緩衝液(pH4.5)と、酸化剤として過ヨウ素酸ナトリウムを用いて50μlの反応液中で処理した。この酸化反応は遮光条件の下、氷上で45分間行った。
【0127】
続いて、5M塩化ナトリウム11μl、10% SDS 0.5μl、そして同量のイソプロパノールを加え、60分間氷上に放置した後、4℃で15分間15,000rpm遠心し沈澱を取得した。沈澱物は70%エタノールで洗い、RNaseフリー水50μlに再溶解させた。その試料に1M酢酸ナトリウム(pH6.1)5μl、10% SDS 5μl、10mMビオチンヒドラジド(Sigma社製)150μlを加え、室温(22〜26℃)で終夜反応させた。最後に、5μlの5M NaCl、1M酢酸ナトリウム(pH6.1)75μl、及び2.5倍量のエタノールを加え、1時間の氷上冷却後、4℃において15分間遠心し、ビオチン化した。反応後、反応液を15分間遠心し、再度RNA−DNA複合体を沈澱させた。沈澱物は70%エタノールで1回、更に80%エタノールで1回洗い、RNaseフリー水70μlに溶解した。
【0128】
(4)RNase Iによる完全長cDNAの選択
上記(3)で取得したビオチン化RNA−DNA複合体について、1本鎖RNAを消化するRNase Iで処理することにより、逆転写反応時に完全なcDNAの伸長が得られなかったmRNA、およびmRNAの3’末端に標識されたビオチン残基を取り除いた。具体的には、上記(3)で得られた試料70μlに10×RNase Iバッファー(100mM Tris−HCl(pH7.5)、50mM EDTA、2M NaOAc)10μl、RNase I(RNase OneTM;Promega社製)200unitを加えて、37℃で15分間1本鎖RNAを消化した。
【0129】
(5)完全長cDNAの採取
ストレプトアビジンコートしたマグネティックビーズにcDNAが非特異的吸着するのを防止するため、100μgの酵母tRNA(DNase I処理したもの)を5mg(500μl)のマグネティックビーズ(magnetic porous glass(MPG)particles coated with streptavidin(CPG,NJ))に加え、1時間氷上に放置した後、50mM EDTA、2M NaClの溶液にて洗った。
このビーズを50mM EDTA、2M NaClの溶液500μl中に懸濁し、(4)で取得したRNase I処理を施されたcDNAを加えた。室温にて30分間撹拌することで、マグネティックビーズと完全長cDNAを結合させた。完全長cDNAを捕獲したビーズを50mM EDTA、2M NaClの溶液で4回、0.4% SDS、50μg/μl酵母tRNAで1回、10mMNaCl、0.2mM EDTA、10mMTris−HCl(pH7.5)、20% グリセロールで1回、50μg/μl酵母tRNA水溶液で1回、RNase H バッファー(20mMTris−HCl(pH7.5)、10mM MgCl2、 20mM KCl、0.1mM EDTA、0.1mM ジチオスレイトール(DTT)で1回洗浄した後、RNase H用バッファー100μlに懸濁し、RNase H 3unitを加え、37℃下30分間加温した。その後、10% SDS 1μl、0.5M EDTA 2μlを加えて、10分間、65℃に曝し、その上清を回収した。
このようにして回収された1本鎖完全長cDNAはフェノール/クロロホルムで抽出され、スピードバッグにて液量を100μl以下に減じてからG25/G100Sephadexクロマトグラフィーに付した。RI活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン2μg を加え、エタノール沈澱にて得られた沈澱物を30μlの超純水に溶解した。
【0130】
(6)1本鎖cDNAへのオリゴdG付加
上記(5)で回収された1本鎖cDNA30μlは、最終容量50μlの反応液中で、200mMカコジル酸ナトリウム(pH6.9)、1mM MgCl2、1mM CoCl2、1mM 2−メルカプトエタノール、100μM dGTPの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TaKaRa社製)32unitを用いて37℃で30分間のオリゴdG付加反応に付した。反応終了時にEDTAを50mMとなるように加え、一連のフェノール/クロロホルムによる抽出、エタノール沈澱を経て、31μlの超純水に溶解した。
【0131】
(7)第2鎖cDNA合成
第1鎖cDNAを鋳型にした第2鎖cDNAの合成は以下のように行った。最終容量60μlの反応系で、第2鎖低バッファー(200mM Tris−HCl(pH8.75)、100mM KCl、100mM(NH4)2SO4、20mM MgSO4、1%Triton X−100、1mg/μlBSA)3μl、第2鎖高バッファー(200mM Tris−HCl(pH9.2)、600mM KCl、20mM MgCl2)3μl、dCTP、dATP、dTTP、dGTP各々0.25mM、β−NADH 6μl、オリゴdG付加された第1鎖cDNA31μl、第2鎖プライマー−アダプター(配列番号50)600ng を加え、Ex Taq DNAポリメラーゼ(TaKaRa Ex Taq;TaKaRa社製)15unit、耐熱性DNAリガーゼ(Ampligase;Epicentre社製)150unit、耐熱性RNase H(Hybridase;Epicentre社製)3unitによって第2鎖cDNAを合成した。
【0132】
0.5M EDTAを1μl加えることで反応を停止させ、更に蛋白成分を溶解するために、10% SDS 1μl、プロテイナーゼ(Proteinase) K 10μgの存在下に45℃で15分間加熱し、最終的にフェノール/クロロホルムによる抽出、エタノール沈澱にて精製した2本鎖完全長cDNAを得た。
【0133】
(8)ライブラリーの調製
以上の方法により得られた二本鎖完全長cDNAは、λZAPIIIベクターに挿入し、ライブラリーとして回収した。λZAPIIIベクターはλZAPII(STRATAGENE社製)ベクターのマルチクローニングサイトの一部の配列配列番号51を配列番号52に改変し、二つのSfiIサイトを新たに導入したものである。
【0134】
さらにλPS(RIKEN)ベクターを作製し、cDNAを挿入した。λPS(RIKEN)(λ−FLC−1と命名(FLCとはFULL−LENGTH cDNAを意味する))とは、MoBiTec社(ドイツ)のλPSベクターをcDNA用に改変したものである。即ち10kbp stufferの両側に存在するクローニングサイトにcDNA挿入に便利なBamHIならびにSalIを各々導入するとともに、0.5kbから13kb程度までのcDNAがクローニングできるようにXbaIサイトに6kbのDNA断片を挿入したものである(特開2000−325080号公報)。このλ−FLC−1を用いると、例えば肺臓cDNAライブラリーの場合には、インサートの平均鎖長は2.57kbとなり、実際に0.5kbから12kbまでのインサートをクローニングすることが出来た。従来法のλZAPの場合には、インサートの平均鎖長は0.97kbであったことから、λ−FLC−1を用いることによって、サイズの大きなcDNAもλZAPに比べて効率よくクローニングできることがわかる。
【0135】
実施例2 完全長cDNAライブラリーのノーマライゼーション/サブトラクション
(1)ドライバーの調製
実施例1(1)で作製したmRNA(以下、これを「(a)RNAドライバー」と称することがある)、及びin vitro転写反応で作成したRNAをドライバーとして用いた。後者のRNAはさらに2種類(以下、これを「(b)RNAドライバー、及び「(c)RNAドライバー」と称する)に分けられる。1つはノーマライゼーションにより除かれたRNA−cDNAからcDNAを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後1つの出発材料あたり1000から2000プラークを混ぜ合わせて1つのライブラリー(ミニライブラリー)とし、常法によりプラスミドDNAに変換する(ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドDNAを得る)。
【0136】
得られたDNAについてin vitro転写反応(T3RNAポリメラーゼまたはT7RNAポリメラーゼを用いる)を行い、DNase I(RQ1−RNase free;Promega社製)、ProteinaseK処理後、フェノール/クロロホルム抽出をしてRNA(b)RNAドライバーを得た。この際、通常出発材料としては9種類(すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃)の組織からそれぞれミニライブラリーを作成して、9種類のミニライブラリーを混合してRNAを得る。もう一つのRNAはすでに重複のないクローンとして保存されているライブラリー(クローン数約2万個)を培養し、得られたDNAについて(b)RNAドライバーと同様にin vitro転写反応を行い(c)RNAドライバーとした。
【0137】
これら3種のRNAは、Label−IT Biotin LabelingKit(Mirus Corporation製)を用いてビオチン化標識を行ったあと、1:1:1の割合でテスターcDNAに添加し、Rot10での反応(42℃)を行い、ストレプトアビジンビーズ(CPG)処理を行って回収した上清について、第2鎖の合成を行った。
【0138】
実施例3 完全長cDNAクローンの塩基配列決定
(1)クローンのrearray
各クラスタからひとつの代表クローンを選んだ。代表クローンはQ−bot(GENETIX LIMITED製)で選択し、384穴プレートにarray化した。その際、大腸菌は30℃で18〜24時間、50μlのLB培地で培養した。このとき、cDNAライブラリーがPSベクターに導入され大腸菌DH10Bを形質転換している場合には100mg/mlのアンピシリン及び50mg/mlのカナマイシンを添加し、Zapベクターに導入し、SOLRシステムに導入している場合には100mg/mlのアンピシリン及び25mg/mlのストレプトアビジンを添加して行った。
【0139】
(2)プラスミドの抽出とInsSizing
上記(1)で培養した各クローンは、さらに100mg/mlのアンピシリンを含む1.3mlのHT液中で培養され、遠心分離により菌体を回収した後、QIAprep 96 Turbo(QIAGEN社製)を用いてプラスミドDNAを回収、精製した。取得されたプラスミド中に挿入されているcDNAの鎖長を調べるために、上記で取得したプラスミドDNAの1/30を制限酵素PyuIIで消化し、1%のagaroseゲル電気泳動を行った。
【0140】
(3)配列決定
かくして取得されたプラスミド中に挿入された完全長cDNAの全長の塩基配列解析には、3種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが2.5kbより短いものと長いものの2つのカテゴリに分けた。このうち2.5kbより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがPSの場合には配列番号53(センス鎖)、及び54(アンチセンス鎖)に記載のプライマーを用いて、またベクターがZapの場合には配列番号55(センス鎖)、及び56(アンチセンス鎖)に記載のプライマーを用いてThermosequenase Primer Cycle Sequencing Kit(Amersham Pharmacia Biotech社製)で反応し、Licor DNA4200(long read sequencer)を用いて解析した。
【0141】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ABI Prism377及び/またはABI Prism3700(Applied Biosystems Inc.製)とBigDye terminator kitとCycle Sequencing FS ready Reaction Kit(Applied Biosystems Inc.製)を用いた。
【0142】
また、挿入されているcDNAが2.5kbより長いクローンの配列決定は、ショットガン法によった。その際、Shimadzu RISA 384とDYEnamic ET terminator cycle sequencing kit(Amersham Pharmacia Biotech社製)を用いた。ショットガンライブラリを作製するために、48の独立な代表クローンからPCRで増殖した48のDNAフラグメントを用いた。増幅されたDNA断片の末端をT4 DNAポリメラーゼによって平滑化した。
このDNA断片を、pUC18ベクターへ挿入し、更に該組み換えベクターにより大腸菌DH10Bを形質転換した。この大腸菌から上記(2)と同様にしてプラスミドを調製した。
【0143】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、Double Stroke Shearing Device(Fiore Inc.製)によるshearingを行った。ショットガン法による塩基配列決定は、12〜15クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【0144】
実施例4 各完全長cDNAクローンの塩基配列の解析
実施例3で決定した完全長cDNAクローンの全塩基配列について、BLASTによる相同性検索や、HMMPFAMによるタンパク質特徴検索を行い、各完全長cDNAクローンがコードするタンパク質の機能を推定した。
【0145】
(1)dnaform37901(配列番号1、25)
dnaform37901は、配列番号1に示すように、4593塩基から成り、そのうち塩基番号1531から2631までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、366アミノ酸残基から成る(配列番号25)。配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ311903、ADAMTS18 proteinが、e−value:0.0で、また708アミノ酸残基に亘り75%の一致度で、また(ii)データベース登録記号AJ315734、metalloprotease disintegrin 16 with thrombospon din type I motifが、e−value:0.0で、671アミノ酸残基に亘り61%の一致度で、さらに(iii)データベース登録記号P58397、A disintegrin and metalloproteinase with thrombospondin motifs 12が、e−value:5×10−152で、702アミノ酸残基に亘り42%の一致度で、(iv)データベース登録記号Q9H324、A disintegrin and metalloproteinase with thrombospondin motifs 10がヒットした。これらの結果より配列番号25に示したアミノ酸配列からなるタンパク質はmetalloproteinasesであることが推測された。
また、上記のタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが知られている。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号1の塩基番号412−1137がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)を見出した。
これらのことから配列番号1に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【0146】
(2)dnaform46350(配列番号2、26)
dnaform46350は、配列番号2に示すように、4335塩基から成り、そのうち塩基番号992から4270までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、1092アミノ酸残基から成る (配列番号26)。配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ311903、ADAMTS18 proteinが、e−value:0.0で、また807アミノ酸残基に亘り90%の一致度で、また(ii)データベース登録記号AJ315734、ADAMTS16が、e−value:0.0で、816アミノ酸残基に亘り61%の一致度で、さらに(iii)データベース登録記号P58397、ADAMTS12が、e−value:0.0で、786アミノ酸残基に亘り43%の一致度でヒットした。これらの結果より配列番号26に示したアミノ酸配列からなるタンパク質はmetalloproteinasesであることが推測された。
また、上記のタンパク質は、文献情報(Gene 2002 Jan 23;283(1−2):49−62)から関節炎や癌に関わることが知られている。
また、配列番号2に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号2の塩基番号1354−1969がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにReprolysinとしてエントリーされる配列)を見出した。また、配列番号2の塩基番号796−1172がコードするアミノ酸配列にメタロプロテアーゼの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号2に示す塩基配列がコードするタンパク質は関節炎や癌に関わる機能を有するメタロプロテアーゼであることが推測された。
【0147】
(3)dnaform51325(配列番号3、27)
dnaform51325は、配列番号3に示すように、1577塩基から成り、そのうち塩基番号8から1459までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、483アミノ酸残基から成る (配列番号27)。配列番号3がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号P83105、Probable serine protease HTRA4 precursorが、e−value:5×10−175で、また470アミノ酸残基に亘り67%の一致度で、また(ii)データベース登録記号AF179369、insulin−like growth factor binding protein 5 proteaseが、e−value:5×10−147で、485アミノ酸残基に亘り55%の一致度でヒットした。これらの結果より配列番号27に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、配列番号3に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号3の塩基番号559−1111がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号3に示す塩基配列がコードするタンパク質は成長因子を制御する機能を有するトリプシン様セリンプロテアーゼであることが推測された。
【0148】
(4)dnaform9578(配列番号4、28)
dnaform9578は、配列番号4に示すように、2235塩基から成り、そのうち塩基番号1から2034までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、677アミノ酸残基から成る (配列番号28)。配列番号4がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ131563、metalloprotease/disintegrinが、e−value:5×10−154で、また297アミノ酸残基に亘り85%の一致度で、また(ii)データベース登録記号Q95194、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:5×10−152で、641アミノ酸残基に亘り43%の一致度で、また(iii)データベース登録記号Q9Y3Q7、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:5×10−151で、642アミノ酸残基に亘り43%の一致度でヒットした。これらの結果より配列番号28に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが明らかとなった。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号4の塩基番号559−1152がコードするアミノ酸配列にメタロプロテアーゼであるレプロライシンの特徴を示す配列(PfamにReprolysinとしてエントリーされる塩基配列)を、塩基番号190−528がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号4に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【0149】
(5)dnaform13298(配列番号5、29)
dnaform13298は、配列番号5に示すように、746塩基から成り、そのうち塩基番号10から411までがオープンリーディングフレーム (終止コドンを含む)になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、133アミノ酸残基から成る (配列番号29)。配列番号5がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Y07903、transmembrane protein tMDC Iが、e−value:3×10−17で、また118アミノ酸残基に亘り43%の一致度で、また(ii)データベース登録記号X76637、tMDC Iが、e−value:6×10−17で、118アミノ酸残基に亘り42%の一致度で、また(iii)データベース登録記号Q95194、ADAM 18 precursor (A disintegrin and metalloproteinase domain 18)が、e−value:2×10−16で、113アミノ酸残基に亘り46%の一致度でヒットした。これらの結果より配列番号29に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(Mol Hum Reprod 1998 May;4(5):429−37)から精子生成に関わることが明らかとなった。
また、配列番号5に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号5の塩基番号199−472がコードするアミノ酸配列にペプチダーゼファミリーM12Bの特徴を示す配列(PfamにPep_M12B_propepとしてエントリーされる配列)を見出した。
これらのことから配列番号5に示す塩基配列がコードするタンパク質は生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであることが推測された。
【0150】
(6)dnaform28983(配列番号6、30)
dnaform28983は、配列番号6に示すように、2373塩基から成り、そのうち塩基番号75から848までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、257アミノ酸残基から成る (配列番号30)。配列番号6がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX190539、Sequence 10 from Patent WO0136645が、e−value:2×10−75で、また286アミノ酸残基に亘り49%の一致度で、また(ii)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−75で、283アミノ酸残基に亘り48%の一致度で、また(iii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:1×10−72で、282アミノ酸残基に亘り47%の一致度でヒットした。これらの結果より配列番号30に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Br J Cancer 2001 Jan;84(2):237−43)から扁平上皮細胞癌で発現が押さえられていることが明らかとなった。
また、配列番号6に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号6の塩基番号150−827がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号6に示す塩基配列がコードするタンパク質は細胞増殖や接着を制御する機能を有するプロテアーゼであることが推測された。
【0151】
(7)dnaform36451(配列番号7、31)
dnaform36451は、配列番号7に示すように、2877塩基から成り、そのうち塩基番号98から1351までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、417アミノ酸残基から成る (配列番号31)。配列番号7がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX190539、Sequence 10 from Patent WO0136645が、e−value:5×10−113で、また418アミノ酸残基に亘り51%の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−96で、419アミノ酸残基に亘り42%の一致度で、また(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:6×10−95で、420アミノ酸残基に亘り41%の一致度でヒットした。これらの結果より配列番号31に示したアミノ酸配列からなるタンパク質はトリプシン様セリンプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(Biol Chem 1998 May 8;273(19):11895−901)から慢性的気管疾患患者の痰から得られ,調査した17の組織中気管での発現が顕著に高いことが明らかとなった。
また、配列番号7に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号7の塩基番号653−1330がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号7に示す塩基配列がコードするタンパク質は気管疾患を制御する機能を有するプロテアーゼであることが推測された。
【0152】
(8)dnaform30375(配列番号8、32)
dnaform30375は、配列番号8に示すように、2335塩基から成り、そのうち塩基番号526から2244までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、572アミノ酸残基から成る (配列番号32)。配列番号8がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX207903、Sequence 7 from Patent WO0157194が、e−value:5×10−104で、また418アミノ酸残基に亘り37 %の一致度で、また(ii)データベース登録記号AF057145、serine protease TADG15が、e−value:5×10−103で、650アミノ酸残基に亘り39 %の一致度で、また(iii)データベース登録記号Q9Y5Y6、Membrane−type serine protease 1が、e−value:5×10−103で、650アミノ酸残基に亘り39 %の一致度でヒットした。これらの結果より配列番号32に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(iii)のタンパク質は、データベース中の文献情報(J Biol Chem 1999 Jun 25;274(26):18231−6)からヒト乳癌に関係することが明らかとなった。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号8の塩基番号1528 − 2217がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号8に示す塩基配列がコードするタンパク質は乳癌を制御する機能を有するプロテアーゼであることが推測された。
【0153】
(9)dnaform26163(配列番号9、33)
dnaform26163は、配列番号9に示すように、2377塩基から成り、そのうち塩基番号256から1500までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、414アミノ酸残基から成る (配列番号33)。配列番号9がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AB071425、hatching enzyme EHE7が、e−value:2×10−48で、また247アミノ酸残基に亘り40 %の一致度で、また(ii)データベース登録記号P31581、High choriolytic enzyme 2 precursor(Hatching enzymezinc−protease HCE 2 subunit)が、e−value:2×10−42で、246アミノ酸残基に亘り40 %の一致度ででヒットした。これらの結果より配列番号33に示したアミノ酸配列からなるタンパク質はメタロプロテアーゼであることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Dev Biol 1992 Oct;153(2):250−8)からastacin (protease)に属することが明らかとなった。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号9の塩基番号466 − 1041がコードするアミノ酸配列にメタロプロテアーゼであるastacinの特徴を示す配列(PfamにAstacinとしてエントリーされる配列)を見出した。
これらのことから配列番号9に示す塩基配列がコードするタンパク質はAstacin 様プロテアーゼであることが推測された。
【0154】
(10)dnaform33042(配列番号10、34)
dnaform33042は、配列番号10に示すように、3614塩基から成り、そのうち塩基番号68から1042までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、324アミノ酸残基から成る (配列番号34)。配列番号10がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:8×10−63で、また343アミノ酸残基に亘り47%の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:2×10−33で、280アミノ酸残基に亘り36%の一致度ででヒットした。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号10の塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号10に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0155】
(11)dnaform37103(配列番号11、35)
dnaform37103は、配列番号11に示すように、3793塩基から成り、そのうち塩基番号280から1191までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、303アミノ酸残基から成る (配列番号35)。配列番号11がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:8×10−63で、また343アミノ酸残基に亘り47 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:3×10−33で、278アミノ酸残基に亘り35 %の一致度ででヒットした。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号11の塩基番号604−951がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号11に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0156】
(12)dnaform44990(配列番号12、36)
dnaform44990は、配列番号12に示すように、3646塩基から成り、そのうち塩基番号344から985までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、213アミノ酸残基から成る (配列番号36)。配列番号12がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:2×10−54で、また207アミノ酸残基に亘り51 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:4×10−31で、203アミノ酸残基に亘り36 %の一致度でヒットした。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号12の塩基番号398−745がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号12に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0157】
(13)dnaform45367(配列番号13、37)
dnaform45367は、配列番号13に示すように、3418塩基から成り、そのうち塩基番号159から1190までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、343アミノ酸残基から成る (配列番号37)。配列番号13がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:7×10−63で、また343アミノ酸残基に亘り47%の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:3×10−33で、278アミノ酸残基に亘り35 %の一致度ででヒットした。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号13の塩基番号603−950がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号13に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0158】
(14)dnaform51872(配列番号14、38)
dnaform51872は、配列番号14に示すように、3617塩基から成り、そのうち塩基番号476から979までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、167アミノ酸残基から成る (配列番号38)。配列番号14がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AE003567、Drosophila melanogaster genomic scaffoldが、e−value:3×10−54で、また201アミノ酸残基に亘り52 %の一致度で、また(ii)データベース登録記号P43558、Hypothetical 33.5 kDa proteinが、e−value:4×10−31で、203アミノ酸残基に亘り36 %の一致度ででヒットした。
また、配列番号14に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号14の塩基番号392−739がコードするアミノ酸配列にシステインプロテアーゼの特徴を示す配列(PfamにOTUとしてエントリーされる配列)を見出した。
これらのことから配列番号14に示す塩基配列がコードするタンパク質はシステインプロテアーゼであることが推測された。
【0159】
(15)dnaform39531(配列番号15、39)
dnaform39531は、配列番号15に示すように、2803塩基から成り、そのうち塩基番号227から1582までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、451アミノ酸残基から成る (配列番号39)。配列番号15がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX207688、Sequence 5 from Patent WO0157081が、e−value:0.0で、また469アミノ酸残基に亘り94%の一致度で、また(ii)データベース登録記号P08594、Aqualysin I precursorが、e−value:5×10−45で、355アミノ酸残基に亘り34 %の一致度でヒットした。
また、配列番号15に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号15の塩基番号714−1602がコードするアミノ酸配列にセリンプロテアーゼの特徴を示す配列(PfamにPeptidase_S8としてエントリーされる配列)を見出した。
これらのことから配列番号15に示す塩基配列がコードするタンパク質はセリンプロテアーゼであることが推測された。
【0160】
(16)dnaform25900(配列番号16、40)
dnaform25900は、配列番号16に示すように、2222塩基から成り、そのうち塩基番号174から1493までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号40)。配列番号16がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:2×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:1×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号40に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号16に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号16の塩基番号795−1472がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号16に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0161】
(17)dnaform26560(配列番号17、41)
dnaform26560は、配列番号17に示すように、3568塩基から成り、そのうち塩基番号134から1453までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号41)。配列番号17がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43%の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号41に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号17に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号17の塩基番号755−1432がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号17に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0162】
(18)dnaform32827(配列番号18、42)
dnaform32827は、配列番号18に示すように、3599塩基から成り、そのうち塩基番号167から1486までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号42)。配列番号18がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号42に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号18に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号18の塩基番号788−1465がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号18に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0163】
(19)dnaform33661(配列番号19、43)
dnaform33661は、配列番号19に示すように、3817塩基から成り、そのうち塩基番号16から1335までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号43)。配列番号19がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9UL52、Serine protease DESC1 precursorが、e−value:3×10−96で、また421アミノ酸残基に亘り43 %の一致度で、また(ii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:3×10−89で、417アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:2×10−88で、439アミノ酸残基に亘り40 %の一致度でヒットした。これらの結果より配列番号43に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(i)のタンパク質は、文献情報(Br J Cancer 2001 Jan;84(2):237−43)から、頭部、頚部、上皮、前立腺、精巣で特徴的に発現し、扁平上皮腫瘍で発現が抑制されていることが、また上記(iii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号19に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号19の塩基番号637−1314がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号19に示す塩基配列がコードするタンパク質は上皮における腫瘍、炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0164】
(20)dnaform34950(配列番号20、44)
dnaform34950は、配列番号20に示すように、3355塩基から成り、そのうち塩基番号76から1326までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、416アミノ酸残基から成る (配列番号44)。配列番号20がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AX262410、Sequence 1 from Patent WO0173074が、e−value:5×10−122で、また417アミノ酸残基に亘り51 %の一致度で、また(ii)データベース登録記号O60235、Airway trypsin−like protease precursorが、e−value:5×10−93で、420アミノ酸残基に亘り40 %の一致度で、さらに(iii)データベース登録記号AF453776、airway trypsin−like proteaseが、e−value:2×10−92で、420アミノ酸残基に亘り38 %の一致度でヒットした。これらの結果より配列番号44に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(ii)の蛋白質は、文献情報(J Biol Chem 1998 May 8;273(19):11895−901)から、慢性的気道疾患患者の痰から単離されたトリプシン様セリンプロテアーゼであることが知られている。
また、配列番号20に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号20の塩基番号628−1305がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号20に示す塩基配列がコードするタンパク質は上皮における炎症に関わる機能を有するセリンプロテアーゼであることが推測された。
【0165】
(21)dnaform40997(配列番号21、45)
dnaform40997は、配列番号21に示すように、1456塩基から成り、そのうち塩基番号26から1345までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、439アミノ酸残基から成る (配列番号45)。配列番号21がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF100707、testes−specific protein TSP50が、e−value:5×10−128で、また439アミノ酸残基に亘り54 %の一致度で、また(ii)データベース登録記号Q9GZN4、Brain−specific serine protease 4 precursorが、e−value:2×10−36で、281アミノ酸残基に亘り33 %の一致度で、さらに(iii)データベース登録記号Q9BQR3、Marapsin precursorが、e−value:1×10−35で、253アミノ酸残基に亘り32 %の一致度で、さらに(iv)データベース登録記号Q9Y6M0、Testisin precursorが、e−value:9×10−35で、273アミノ酸残基に亘り32 %の一致度でヒットした。これらの結果より配列番号45に示したアミノ酸配列からなるタンパク質はセリンプロテアーゼであることが推測された。
また、上記(iv)の蛋白質は、文献情報(Biochem Biophys Res Commun 1998 Nov 18;252(2):307−12)から、好酸球から単離されたもので、骨格筋・腎臓以外の多くの組織で見られ、精巣・前立腺で最も多く、肺・脾臓・膵臓で中程度に発現されているセリンプロテアーゼであることが知られている。
また、配列番号21に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号21の塩基番号522−1246がコードするアミノ酸配列にセリンプロテアーゼであるトリプシンの特徴を示す配列(Pfamにtrypsinとしてエントリーされる配列)を見出した。
これらのことから配列番号21に示す塩基配列がコードするタンパク質は、多くの組織、特に精巣・前立腺における機能を有するセリンプロテアーゼであることが推測された。
【0166】
(22)dnaform43509(配列番号22、46)
dnaform43509は、配列番号22に示すように、1600塩基から成り、そのうち塩基番号466から1476までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、336アミノ酸残基から成る (配列番号46)。配列番号22がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号BC021474、機能未知蛋白質が、e−value:0.0で、また355アミノ酸残基に亘り98 %の一致度で、また(ii)データベース登録記号AB033029、KIAA1203 proteinが、e−value:4×10−23で、118アミノ酸残基に亘り50 %の一致度で、さらに(iii)データベース登録記号AF017306、Homo sapiens deubiquitinating enzyme UnpESが、e−value:2×10−8で、66アミノ酸残基に亘り48 %の一致度で、さらに(iv)データベース登録記号Q13107、Ubiquitin carboxyl−terminal hydrolase 4が、e−value:2×10−8で、66アミノ酸残基に亘り48 %の一致度でヒットした。これらの結果より配列番号46に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記(iii)と(iv)の蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号22に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号22の塩基番号2−205がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)を見出した。
これらのことから配列番号22に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【0167】
(23)dnaform55017(配列番号23、47)
dnaform55017は、配列番号23に示すように、4298塩基から成り、そのうち塩基番号277から3342までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、1021アミノ酸残基から成る (配列番号47)。配列番号23がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号BC021474、機能未知蛋白質が、e−value:0.0で、また827アミノ酸残基に亘り99 %の一致度で、また(ii)データベース登録記号AB033029、KIAA1203 proteinが、e−value:1×10−67で、234アミノ酸残基に亘り55 %の一致度で、さらに(iii)データベース登録記号AF048705、ubiquitin−specific proteaseが、e−value:8×10−56で、653アミノ酸残基に亘り29 %の一致度でヒットした。これらの結果より配列番号47に示したアミノ酸配列からなるタンパク質はプロテアーゼであることが推測された。
また、上記(iii)の蛋白質は、文献情報(Oncogene 1995 Jun 1;10(11):2179−83)から、nuclear ubiquitin proteaseであり,その過剰発現は腫瘍形成に関わる可能性があることが知られている。
また、配列番号23に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号23の塩基番号244−337がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−1としてエントリーされる配列)を見出した。また、配列番号23の塩基番号1885−2070がコードするアミノ酸配列にチオールプロテアーゼであるユビキチンカルボニルターミナルハイドロレースの特徴を示す配列(PfamにUCH−2としてエントリーされる配列)を見出した。
これらのことから配列番号23に示す塩基配列がコードするタンパク質は、腫瘍形成に関わるチオールプロテアーゼであることが推測された。
【0168】
(24)dnaform65027(配列番号24、48)
dnaform65027は、配列番号24に示すように、1816塩基から成り、そのうち塩基番号623から1411までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、262アミノ酸残基から成る (配列番号48)。配列番号24がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF190274、carboxypeptidase homologが、e−value:1×10−93で、また331アミノ酸残基に亘り48 %の一致度で、また(ii)データベース登録記号P19223、Carboxypeptidase B precursorが、e−value:2×10−92で、327アミノ酸残基に亘り48 %の一致度で、さらに(iii)データベース登録記号P15086、Carboxypeptidase B precursorが、e−value:4×10−90で、330アミノ酸残基に亘り46 %の一致度でヒットした。これらの結果より配列番号48に示したアミノ酸配列からなるタンパク質はカルボキシペプチダーゼであることが推測された。
また、上記(ii)の蛋白質は、文献情報(J Biol Chem 1988 Nov 25;263(33):17837−45)から、膵臓に発現するカルボキシペプチダーゼであることが、上記(iii)の蛋白質は、文献情報(J Biol Chem 1992 Feb 5;267(4):2575−81)から、膵臓炎・膵臓移植拒絶反応に関与するカルボキシペプチダーゼであることが知られている。
また、配列番号24に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号24の塩基番号509−1357がコードするアミノ酸配列にカルボキシペプチダーゼの特徴を示す配列(PfamにZn_carbOpeptとしてエントリーされる配列)を見出した。
これらのことから配列番号24に示す塩基配列がコードするタンパク質は、膵臓疾患に関わるカルボキシペプチダーゼであることが推測された。
【0169】
(25)dnaform 35225(配列番号57、60)
dnaform 35225は、配列番号57に示すように、1036塩基から成り、そのうち塩基番号332から826までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、164アミノ酸残基から成る (配列番号60)。配列番号57がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF178985、Homo sapiens complement C1r−like proteinase precursor が、e−value:1×10−49で、また152アミノ酸残基に亘り63%の一致度で、また(ii)データベース登録記号AK024084、Homo sapiens cDNA FLJ14022 weakly similar to COMPLEMENT C1R COMPONENT PRECURSOR が、e−value:1×10−48で、152アミノ酸残基に亘り62%の一致度で、さらに(iii)データベース登録記号X04701、Human mRNA for complement component C1r が、e−value:7×10−18で、103アミノ酸残基に亘り39%の一致度でヒットした。これらの結果より、配列番号57に示す塩基配列がコードするタンパク質は 補体系のメタロプロテアーゼであることが推測された。
【0170】
(26)dnaform46870(配列番号58、61)
dnaform46870は、配列番号58に示すように、2613塩基から成り、そのうち塩基番号819から2102までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、427アミノ酸残基から成る (配列番号58)。配列番号58がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Y09661、X.laevis mRNA for xolloid が、e−value:2×10−58で、また436アミノ酸残基に亘り30%の一致度で、また(ii)データベース登録記号O57460、Dorsal−ventral patterning tolloid protein precursorが、e−value:4×10−58で、445アミノ酸残基に亘り30%の一致度で、さらに(iii)データベース登録記号P98063、Bone morphogenetic protein 1 precursorが、e−value:7×10−57で、436アミノ酸残基に亘り30%の一致度でヒットした。
また、配列番号61に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号61のアミノ酸番号30−370のアミノ酸配列に3箇所にわたってCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)を見出した。
これらの結果より、配列番号58に示す塩基配列がコードするタンパク質は発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであることが推測された。
【0171】
(27)dnaform 41583(配列番号59、62)
dnaform 41583は、配列番号59に示すように、2841塩基から成り、そのうち塩基番号1110から1889までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、259アミノ酸残基から成る (配列番号62)。配列番号59がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AY017475、Mus musculus CSMD1 (Csmd1) が、e−value:5×10−108で、また257アミノ酸残基に亘り68%の一致度で、また(ii)データベース登録記号AY017307、Homo sapiens CUB and sushi multiple domains protein 1 short form が、e−value:1×10−48で、153アミノ酸残基に亘り67%の一致度でヒットした。
また、配列番号62に示すアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号62のアミノ酸番号25−382および 203−256 のアミノ酸配列にわたってComplement control protein (CCP) modules またはshort consensus repeats (SCR)の特徴を示す配列(Pfamに sushi としてエントリーされる配列)を見出し、アミノ酸番号87−195のアミノ酸配列にCUB domainの特徴を示す配列(Pfamに CUB としてエントリーされる配列)を見出した。
これらの結果より、配列番号59に示す塩基配列がコードするタンパク質は補体系のメタロプロテアーゼであることが推測された。
【0172】
実施例5 DNAマイクロアレイを用いた組織発現解析
DNAマイクロアレイを用いた組織発現解析は、Miki, R., et al., Proc. Natl. Acad. Sci. USA, 98, 2199−2204 (2001)の記載に従って行った。(1)DNAマイクロアレイの作成
2種類のマウス全長cDNAの塩基配列(dnaform9578、dnaform37901)を、M13フォワードおよびリバースプライマーを用いて増幅後、このPCR産物をイソプロパノールにて沈澱させ15μlの3×SSC液に溶解した。これらの2種類のDNA溶液をポリLリジンコートしたガラススライドに、16チップ(SMP3、TeleChem International、Sunnyvale、CA)のDNAアレイヤーを用いてスポットし、DNAマイクロアレイを作成した(方法の詳細は http://cmgm.stanford.edu/pbrown/mguide/index.htmlに記載されている)。マウスβアクチンとグリセルアルデヒド‐3‐フォスフェートデヒドロゲナーゼのcDNAをポジティブコントロールとし、シロイヌナズナのcDNAをネガティブコントロールとして用いた。
このDNAマイクロアレイの検出感度は、1細胞当たりmRNA1ないし3コピーであった。ターゲット配列との一致度がおよそ80%のクローンのシグナル強度は、完全に配列が一致するクローンの10分の1であった。ターゲット配列との一致度が80%未満のクローンのシグナル強度は、バックグランドレベルであった。
【0173】
(2)プローブの調製
C57BL/6Jマウスの胎児、新生仔、アダルトの49組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、盲腸、胎盤、心臓、舌、胸腺、胸腺(妊娠1日目)、小脳、延髄、嗅脳、副精巣、眼球、皮質、小胞腺、子宮、卵巣および子宮(妊娠11日目)、骨、筋肉、乳腺(授乳10日目)、10日齢胎児全身、11日齢胎児全身、13日齢胎児全身、11日齢胎児頭部、12日齢胎児頭部、13日齢胎児頭部、15日齢胎児頭部、16日齢胎児頭部、17日齢胎児頭部、16日齢胎児肺、13日齢胎児肝臓、14日齢胎児肝臓、0日齢新生児全頭部、6日齢新生児全頭部、10日齢新生児全頭部、10日齢新生児腸、0日齢新生児肺、10日齢新生児小脳、0日齢新生児皮膚、10日齢新生児皮膚、SV40感染)または、22組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、胎盤、心臓、胸腺、小脳、子宮、骨、筋肉、背側腎臓由来脂肪細胞、副精巣由来脂肪細胞、内臓脂肪、10日齢新生児小脳、10日齢新生児皮膚)から抽出したmRNA1μgを定法に従いランダムプライム逆転写反応を行い蛍光色素Cy3(Amersham Pharmacia社)を取りこませた。他方、17.5日齢の胎児全身から抽出したmRNA1μgをランダムプライム逆転写反応を行い、蛍光色素Cy5を取りこませ発現解析のリファレンスとした。CyDye標識cDNAプローブは、CyScribe GFX Purification Kit(Amersham Pharmacia社)を用いて精製し、滅菌水17μlにてカラムから溶出した。これに3μlの10μg/μl oligo(dA),3μlの酵母tRNA 20μg/μl,1μlの20μg/μlマウスCot1 DNA,5.1μlの20XSSC,および0.9μlの10% SDSからなるブロッキング溶液を混和してCyDye標識cDNAプローブを調製した。
【0174】
(3)DNAマイクロアレイのハイブリダイゼイション
発現解析対象組織由来cDNAプローブ(Cy3標識)とリファレンスの17.5日齢胎児由来cDNAプローブ(Cy5標識)を混和した溶液30μlを95℃にて1分間熱処理を行い室温にて冷却した。DNAマイクロアレーに上記プローブ溶液を添加しカバースリップを被せ、Hybricasette(ArrayIt社)中にて65℃一晩ハイブリダイズさせた。次に、DNAマイクロアレーを2XSSC,0.1% SDSを用いて洗浄し、続いて1XSSCにて2分間、0.1XSSCにて2分間リンスした。マイクロアレーはScanArray5000共焦点レーザースキャナーを用いてスキャンし、画像をIMAGENE(BioDiscovery社)で解析した。
【0175】
(4)データ解析
各組織中のmRNA量(Cy3標識)は、リファレンスの17.5日齢の胎児全身mRNA量(Cy5標識)との比(Cy3/Cy5)を対数(log2)で表示した。すなわち、解析対象とする各マウス全長cDNAに対応するmRNA発現量が、リファレンス組織中よりも各組識中の方が多い場合は正の数値で、少ない場合は負の数値で、等しい場合は0で示される。データの正確性を増すために実験は独立に2回行い、再現性の有る結果を採用した。その結果を表1及び表2に示す。 一般的に、DNAアレイを使用した発現解析結果は、2倍程度の増減は実験誤差とみなすため、結果の数値が1以上の場合にはある組織中のmRNA量がリファレンスである17.5日齢の胎児全身のmRNA量と比較して2倍以上であり、有意に増加しており、逆に、結果の数値が−1以下の場合はある組織中のmRNA量が、リファレンスである17.5日齢の胎児全身のmRNA量と比較して2分の1以下であり、有意に減少していると解釈した。また、組織間のmRNA発現量を比較検討する際は、各組織における数値の差が1であればmRNA量は2倍、2であればmRNA量は4倍であり、逆に、組織間の数値の差が−1であればmRNA量は1/2倍、−2であればmRNA量は1/4倍となる。
なお、マイクロアレイにスポットしたDNAと同じクラスタに属し、該DNAと少なくとも200塩基に亘り80%以上の塩基配列の一致度を有する領域を有するマウスcDNAクローン(dnaform46350)についても、表1及び表2に解析対象cDNAとして記載し、マイクロアレイにスポットした該DNAの測定結果の数値を代用して記載した。
【0176】
【表1】
【0177】
【表2】
【0178】
表1及び表2から明らかなように、dnaform37901は、それ自身をマイクロアレイにスポットしてターゲット配列とした発現解析により、リファレンス(17.5日齢の胎児全身)に比べて、小脳・新生児小脳で発現が増加していることが分かる。このように中枢神経系に特徴的な発現を示している。dnaform46350は、クラスター内のメンバーの上記dnaform37901をターゲット配列とした発現解析により、リファレンスに比べて、小脳・新生児小脳で発現が増加していることが分かる。
dnaform9578は、それ自身をターゲット配列とした発現解析により、リファレンスに比べて、特に、精巣で強力に発現していることが分かり、これは著しい特徴と見なされる。
【0179】
実施例6 ヒトオルソログDNAの取得およびその塩基配列の解析
(1)dnaform26163のヒトオルソログDNA(配列番号63、65)
dnaform26163の塩基配列(配列番号9)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として2番染色体の2q11.2の94.65Mbから94.68Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan ( http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号9の塩基配列は、配列番号63のヒト塩基配列と約1280塩基対の長さに渡って73.6%の相同性をもつことがわかった。
【0180】
また、配列番号63の塩基配列から配列番号65のヒトアミノ酸配列に翻訳されると予測された。配列番号65のアミノ酸配列とdnaform26163のオープンリーディングフレームから予測されるアミノ酸配列(配列番号33)との間には、415アミノ酸配列に渡って67%の相同性があった。
さらに、配列番号65のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号33のアミノ酸配列が最も相同性が高かった。
【0181】
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号63の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
従って、配列番号63が、配列番号9に対する新規なヒトオルソログDNAの塩基配列であると考えられた。dnaform26163のヒトオルソログDNAのオープンリーディングフレーム(終止コドンを含む)は1296塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は431アミノ酸残基からなる。
配列番号63に記載の塩基配列がコードするアミノ酸配列(配列番号65)についてHMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号92−283に、Astacin (Peptidase family M12A) (PfamにAstacinとしてエントリーされるアミノ酸配列)を見出した。Peptidase family M12Aに属する蛋白質は、亜鉛を必要とするペプチドの分解酵素である。従って、配列番号63に記載の塩基配列がコードするアミノ酸配列は、Peptidase family M12Aに属する亜鉛を必要とするペプチドの分解酵素であることが推測された。
【0182】
(2)dnaform46870のヒトオルソログDNA(配列番号64、66)
dnaform46870の塩基配列(配列番号58)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として1番染色体の1p32.3の54.42Mbから54.46Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan ( http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、配列番号58の塩基配列は、配列番号64のヒト塩基配列と約1700塩基対の長さに渡って73.1%の相同性をもつことがわかった。
また、配列番号64の塩基配列から配列番号66のヒトアミノ酸配列に翻訳されると予測された。配列番号66のアミノ酸配列とdnaform46870のオープンリーディングフレームから予測されるアミノ酸配列(配列番号61)との間には、372アミノ酸配列に渡って87%の相同性があった。
【0183】
さらに、配列番号66のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号61のアミノ酸配列が最も相同性が高かった。
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号64の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
【0184】
従って、配列番号64が、配列番号58に対する新規なヒトオルソログDNAの塩基配列であると考えられた。dnaform46870のヒトオルソログDNAのオープンリーディングフレーム(終止コドンを含む)は1680塩基からなり、オープンリーディングフレームから予測されるアミノ酸配列は559アミノ酸残基からなる。
配列番号64に記載の塩基配列がコードするアミノ酸配列(配列番号66)に関して、BLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中に、配列番号61に示すマウスのアミノ酸配列以上の相同性を示す配列はなかった。このことから、配列番号64に記載の塩基配列がコードするアミノ酸配列を有するタンパク質は、配列番号58に記載の塩基配列がコードするアミノ酸配列を有するマウスタンパク質に対するヒトオルソログタンパク質であることが推測された。
【0185】
配列番号66に記載のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号30−140、145−252、257−370にCUB domainの特徴を示す配列(PfamにCUB としてエントリーされるアミノ酸配列)を見出した。CUBドメインは、110アミノ酸残基の細胞外ドメインで、機能的に様々な蛋白質(補体系のプロテアーゼ等)に見られ、特に発生段階により制御される蛋白質にみられる。また、配列番号66に記載のアミノ酸配列について、膜貫通ヘリックスを予測するプログラムtmHMM(S. Moller, M.D.R. Croning, R. Apweiler.Evaluation of methods for the prediction of membrane spanning regions. Bioinformatics, 17(7):646−653, 2001.)を用いて膜貫通部位を予測したところ、C末端のアミノ酸残基(アミノ酸番号536−558)に膜貫通部位が予測された。
以上のことから、配列番号64に記載の塩基配列がコードするアミノ酸配列は、補体系のプロテアーゼ等の、特に発生段階により制御される膜蛋白質の1つであることが推測された。
【0186】
実施例7 PCR法を用いた組織発現解析
本発明のタンパク質をコードするmRNAの正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
(1)cDNA合成
以下のマウス(森脇和郎、外1名編、Molecular Medicine別冊、Vol. 36「自然発症疾患モデル動物 」、中山書店、1999年)の19組織からトータルRNAを抽出し、オリゴdTをプライマーとして逆転写酵素を用いてcDNA合成を行った。
(a)正常マウスの組織および糖尿病モデルマウスの組織
▲1▼ 対照マウスC57BL/KsJ − +m/+m Jcl(メス、8週齢)の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲2▼ 糖尿病モデルマウスC57BL/KsJ − db/db Jcl(メス、8週齢)の膵臓、脂肪細胞、肝臓、眼
(b)老化促進マウスの組織
▲1▼ 正常老化マウス SAM R1/TA Slc(オス、13週齢)の海馬、前頭葉皮質
▲2▼ 老化促進マウス SAM P8/Ta Slc(オス、15週齢)の海馬、前頭葉皮質
(c) 癌転移モデルマウスの組織
▲1▼ 対照マウスBalb/c(メス、5週齢)の正常結腸
▲2▼ 癌転移モデルマウスBalb/c(メス、6週齢)結腸癌(マウス腹腔に結腸癌細胞Colon26を移植し、2週間後に結腸癌を摘出)
【0187】
(2)PCR法による定量
下記の3個の、本発明のタンパク質をコードしているmRNAの発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
(a)dnaform28983
5’側プライマー:AAGTTTTGGACGGACCCTTA(配列番号67)
3’側プライマー:GACTTGAAAAGTCGCATCAGG(配列番号68)
(b)dnaform33042
5’側プライマー:ACAATGCTTGGACCATCCTT(配列番号69)
3’側プライマー:TGGCCAAAACCACCTTATTC(配列番号70)
(c)dnaform46870
5’側プライマー:TGGCAATGGTACTGTTGGAC(配列番号71)
3’側プライマー:AGCTGCACTCCGTGTTGTAG(配列番号72)
定量結果はGlyceraldehyde 3−phosphate dehydrogenase (GAPDH) を内部標準として補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)を GAPDHの発現量(コピー数/μl)で除し、定数(1×106)を乗して表示した。 その結果を表3に示す。
【0188】
【表3】
【0189】
表3から明らかな通り、dnaform28983は眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少した。dnaform33042は全身で強く発現しており、特に肺、膵臓で強力に発現し、糖尿病の肝臓および結腸癌で発現が減少した。dnaform46870は発現量が極めて低く、脂肪組織や視床に弱く発現した。上記クローンのcDNAおよび該cDNAによってコードされるタンパク質は、糖尿病や癌などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0190】
実施例8 ハエホモログDNAを用いたRNAi法による機能解析
(1)マウスcDNAのハエホモログDNAの解析および取得
上記で得られたマウス全長cDNAの塩基配列(クローン名:dnaform28983、dnaform33042)に対するハエ遺伝子のホモログを以下に示す配列解析により予測した。配列解析は、ORFから翻訳されるタンパク質を考え、アミノ酸配列レベルで行った。マウスクローンdnaform28983、dnaform33042として、配列番号30、34に示すアミノ酸配列を含むマウス全長cDNAクローン(配列番号6、10)とハエクローン(Berkeley Drosophila Genome Project(BDGP) Drosophila Genomic Sequence Release 3.0)との間においてペアワイズな配列比較をNCBI BLASTP 2.2.2 (Altschul et al., Nucleic Acids Res. 25, 3389−3402 (1997))により行い、2種のクローン間において互いに最も良いE−valueの値を示した関係にあるハエの遺伝子を、予測されたホモログDNAとして同定した(Tatusov, Koonin & Lipman, Science 278, 631 (1997))。結果として、マウスcDNA(dnaform28983、dnaform33042)に対するハエホモログDNAを見つけることができた。ハエホモログDNAの遺伝子番号は、それぞれ、マウス:dnaform28983に対してハエ:CG4821(トランスクリプト番号:CG4821−PB)、マウス:dnaform33042に対してハエ:CG4603(トランスクリプト番号:CG4603−PA)であった。
【0191】
(2)ハエ系統の樹立
(i)逆向き反復配列(inverted repeat)ベクターの作製
上記ハエcDNA(CG4821、CG4603)のORF、5’側約500bpの断片(以下これを「目的のcDNA」と称することがある)を、ハエのcDNAライブラリー(Berkeley Drosophila Genome Project( http://www.fruitfly.org)で同定されたunigeneset; Invitrogen社)を鋳型としたPCRによって増幅した。PCRプライマーは、CpoIA7(配列番号73:AAATTTCGGACCGの3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とSfiIA3(配列番号74:AAATTTGGCCATATAGGCCの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセット、およびSfiIB7(配列番号75:AAATTTGGCCTACATGGCCに記載の塩基配列の3’末端に、目的のcDNAの5’末端の21ベースの塩基配列を結合させたもの)とCpoIB3(配列番号76:塩基配列:AAATTTCGGTCCGの3’末端に、目的のcDNAの3’末端の21ベースの塩基配列を結合させたもの)のセットを用いた。
【0192】
上記の各セットのプライマーを用いてPCR増幅した約500bpのDNA断片をSfiIで消化し、この消化断片をハエクローニング用ベクター(pUASTCS1:上田龍他、細胞工学、vol21, No.8, 923−932(2002))をSfiIで消化したサイト間に挿入しクローニングした。さらに、このベクターをCpoIで消化したサイト間に、上記PCRで増幅したDNA断片をCpoI消化したDNA断片を挿入しクローニングした。この2回のサブクローニングにより、ハエcDNAのORFの約500bpの断片が、UAS配列(GAL上流活性化配列)の下流に隣接したヒートショックプロテイン70のベーシックプロモーターの制御下に、逆向きで2カ所挿入されたベクター(inverted repeat ベクター)が取得された。
【0193】
上記で用いたハエトランスフォーメション用ベクターであるpUASTベクターはトランスポゾンP因子を利用したベクターで、UAS配列とヒートショックプロテイン70のベーシックプロモーターを利用して、転写促進タンパク質GAL4がUAS配列に結合することによりUAS配列の下流に挿入した逆向き反復配列の転写を誘導できるベクターである。
【0194】
(ii)ハエの形質転換
通常のP因子形質転換法である、上田龍他、細胞工学、vol21, No.8, 923−932(2002)に記載の方法に則って、上記(i)で調製したinverted repeat ベクターDNAをW1118系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)の初期胚にマイクロマニュピレーターを用いて微量注入した。これを培養して孵化させ、成虫とした後に、上記文献記載の手順に準じて交配を行った。この交配で、ダブルバランサーとしてW1118系統のSp/SM1、Cy:Pr/TM3、Sb Serを用いた。この交配により、上記inverted repeatベクターが挿入した染色体を、ホモ接合に持ったハエ(以下、これを「IR系統」と称する)が作製された。
【0195】
(3)RNAi効果の誘導
(i)GAL4ドライバーとの交配による変異誘導
上記(2)で得られたIR系統のハエをAct5C−GAL4系統のハエ(Indiana stock center: http://flybase.bio.indiana.edu/stocks/fbstock.hform)と交配した(図1)。Act5C−GAL4は、全身の細胞で発現する細胞性アクチン遺伝子(Act5C)のプロモーターに酵母GAL4遺伝子をつないだfusion geneを遺伝子導入した系統である。従って、このAct5C−GAL4導入遺伝子を持ったハエでは全ての細胞で、GAL4タンパク質が発現している。
【0196】
IR系統のハエと、Act5C−GAL4系統のハエを交配した子孫(F1世代、以下これを「RNAi個体」と称する)では、図1にあるように2種類の導入遺伝子が存在する。従って、全ての細胞でGAL4タンパク質が発現し、IRベクターを強制転写するため、dsRNAが細胞に出現し、RNAi効果を発揮し、ターゲットmRNAが発現した場合にこれを分解する。従って、その個体の全ての細胞でターゲット遺伝子の機能阻害が起こる。ターゲットmRNAが発現していない細胞では何の効果ももたらさない。
【0197】
(4)表現型の解析および結果
上記(3)で誘導されたRNAi効果で、それぞれのマウスcDNA(dnaform28983、dnaform33042)のハエホモログDNA(CG4821、CG4603)がコードするタンパク質の機能が阻害されたことによるハエ個体の表現型の変化を観察した。その結果、CG4821のRNAi個体およびCG4603のRNAi個体は致死、すなわち蛹にはなるが脱皮して成虫となる個体は0%であることが判明した。
【0198】
RNAi技術を用いて上記ハエ遺伝子の発現抑制を行い機能阻害することにより、ハエ個体が致死または半致死となったことから、該遺伝子は発生あるいは個体の生存・機能維持に重要な役割を果たしていることが分かった。前記の通り、dnaform28983(配列番号6)がコードするタンパク質(配列番号30)は、腫瘍を制御する機能を有するプロテアーゼであることが推測されており、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。また、dnaform33042(配列番号10)がコードするタンパク質(配列番号34)は、システインプロテアーゼであることが推測されており、マウスの全身で強く発現し癌組織では発現が減少していることから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。
上記の通り、dnaform28983およびdnaform33042がコードするタンパク質はプロテアーゼ活性を有しており、発生・分化・生理的機能あるいは病態との関連で重要な役割を果たしていることが推察される。
【0199】
実施例9 各完全長cDNAがコードするタンパク質の総合的機能解析
上記実施例4の塩基配列の解析結果ならびに実施例5〜8の組織発現および機能解析結果から、本発明のタンパク質は、次の性質を有することが明らかとなった。
(1)dnaform37901(配列番号1、25)
dnaform37901のオープンリーディングフレームから予測されるアミノ酸配列(配列番号25)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、小脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【0200】
(2)dnaform46350(配列番号2、26)
dnaform46350のオープンリーディングフレームから予測されるアミノ酸配列(配列番号26)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より関節炎や癌に関わる機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、中枢神経系に特徴的な発現を示しており、特に小脳・新生児小脳で発現が増加していることから、脳の発生分化に関与している可能性がある。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、関節炎などの免疫疾患・炎症性疾患、癌、中枢性疾患、例えば運動統合機能障害、脊髄小脳変性症、などに関わる可能性がある。
【0201】
(3)dnaform9578(配列番号4、28)
dnaform9578のオープンリーディングフレームから予測されるアミノ酸配列(配列番号28)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より生殖細胞等の生成を制御する機能を有するメタロプロテアーゼであると推測された。また、本タンパク質は、実施例5より、どの組織でも全体的により強く発現する傾向があるが、特に、精巣で強力に発現していることが示された。このことから、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、生殖細胞の生成や接着などの機能の制御に関わると考えられ、不妊や避妊、免疫疾患・炎症性疾患の治療薬となる可能性がある。
【0202】
(4)dnaform28983(配列番号6、30)
dnaform28983のオープンリーディングフレームから予測されるアミノ酸配列(配列番号30)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より腫瘍を制御する機能を有するプロテアーゼであると推測された。また、本タンパク質は、実施例7より、眼に強力に発現し、脂肪組織で強く発現したが、糖尿病脂肪組織で発現が減少することが示された。また実施例8より、本タンパク質のハエホモログタンパク質(CG4821がコードするタンパク質)の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、CG4821のRNAi個体は致死であったことから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で、細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、扁平上皮癌・網膜芽腫などの癌、糖尿病・肥満などの内分泌疾患、喘息などの呼吸器系疾患、などの治療薬となる可能性がある。
【0203】
(5)dnaform26163(配列番号9、33)
dnaform26163のオープンリーディングフレームから予測されるアミノ酸配列(配列番号33)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりメタロプロテアーゼの1種であるastacin様プロテアーゼであると推測された。また、本タンパク質に対するヒトオルソログタンパク質は、実施例6より、Peptidase family M12Aに属する亜鉛を必要とするペプチド分解酵素であることが推測された。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、不妊・避妊、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【0204】
(6)dnaform33042(配列番号10、34)
dnaform33042のオープンリーディングフレームから予測されるアミノ酸配列(配列番号34)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4よりシステインプロテアーゼであると推測された。また、本タンパク質は、実施例7より、全身で強く発現しており、特に肺、膵臓で強力に発現する一方で、糖尿病の肝臓および結腸癌で発現が減少していることが示された。また実施例8より、本タンパク質のハエホモログタンパク質(CG4603がコードするタンパク質)の機能が阻害されたことによるハエ個体の表現型の変化を観察した結果、CG4603のRNAi個体は致死であったが、本タンパク質は、マウスの全身で強く発現し癌組織では発現が減少していることから、RNAi個体中においては、ハエホモログDNAがコードするプロテアーゼの活性が阻害されたことにより、個体の発生・分化の過程で細胞増殖が正常に進行せず、個体は致死となったものと考えられる。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、肺・膵臓・卵巣などの癌、糖尿病・肥満などの内分泌疾患、などの治療薬となる可能性がある。
【0205】
(7)dnaform46870(配列番号58、61)
dnaform46870のオープンリーディングフレームから予測されるアミノ酸配列(配列番号61)を有するタンパク質(以下、「本タンパク質」と称する)は、実施例4より発生分化、骨形成、精子形成などに関わるメタロプロテアーゼであると推測された。また、本タンパク質は、実施例6において本タンパク質に対するヒトオルソログ分子を予測したところ本タンパク質と同様にCUB細胞外ドメインを持つことから、本タンパク質は、特に発生段階により制御される膜蛋白質と推測された。また、実施例7より、発現量が極めて低く、脂肪組織や視床に弱く発現していることが分かった。したがって、本タンパク質または本タンパク質の発現制御物質、機能賦活物質、あるいは機能阻害物質は、癌、糖尿病・肥満などの内分泌疾患、骨粗しょう症、不妊などの治療薬となる可能性がある。
【0206】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAは、プロテアーゼ活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
【0207】
近年、プロテアーゼの生理機能に関する研究の進展にともない、プロテアーゼが細胞機能の重要な制御因子として機能していることが明らかになってきた。プロテアーゼ活性の制御を確実に行うことにより、生体反応を一方向に確実に進めるためには、プロテアーゼ反応が有利であることがわかり、タンパク質の限定分解が多くの重要な細胞機能の制御に関わっていることが明らかとなってきた。したがって、プロテアーゼ活性の異常は様々な疾患の原因となる。
【0208】
例えば、筋ジストロフィー症はCANPと呼ばれる中性プロテアーゼの活性亢進が原因である。また、腫瘍組織が増殖或いは転移する際に、その養分補給を司る血管の新生が起こるが、その際、メタルプロテアーゼによるマトリックスの破壊が起こる。さらに、腫瘍増殖の場合には、システインプロテアーゼ(チオールプロテアーゼ)の活性亢進が生じることも知られている。このような場合には、関連するプロテアーゼの活性を抑制することが、関連疾患進行の阻止、或いは治療に結びつくと考えられる。
【0209】
逆に、プロテアーゼ活性が抑制されることにより、疾患が進行する例としては、アルツハイマー病に代表される神経変性疾患が上げられる。アルツハイマー病の場合は、β−アミロイドペプチドの蓄積が原因の一つと考えられており、それは分解酵素であるネプリライシンの異常が原因と考えられている。
【0210】
また、フィブリンの蓄積による血栓は、線溶系酵素であるプラスミン量を増加させることにより治療可能である。この目的のために、プラスミン前駆体タンパク質であるプラスミノーゲンのプラスミンへの変換を、セリンプロテアーゼの一種であるプラスミノーゲンアクチベーターにより促進する。
【0211】
上記の通り、プロテアーゼは、諸種の生理機能に関与する制御因子として重要な機能を有しており、生体内における該タンパク質の異常は様々な疾患の原因となる。従って、本発明のスクリーニング方法により得られたプロテアーゼ活性の調節物質は、諸種の疾患の治療剤、例えば、抗癌剤(抗腫瘍剤)、抗炎症剤、神経変性疾患治療剤等となり得る。
本出願は、2002年4月19日付けの日本特許出願(特願2002−117794)、2002年5月2日付けの日本特許出願(特願2002−130871)、および2002年12月4日付けの日本特許出願(特願2002−352559)に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【0212】
【配列表】
【図面の簡単な説明】
【図1】図1は、RNAi個体中の導入遺伝子の誘導方法を示す概念図である。
Claims (15)
- 以下の (a) または (b) のタンパク質。
(a)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号25〜48、60〜62、65または66のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつプロテアーゼ活性を有するタンパク質。 - 請求項1に記載のタンパク質をコードするDNA。
- 請求項1に記載のタンパク質をコードする完全長cDNA。
- 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。
(c)配列番号1〜24、57〜59、63または64のいずれかに記載の塩基配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつプロテアーゼ活性を有するタンパク質をコードするDNA。 - 請求項2〜4のいずれかに記載のDNAを含む組換えベクター。
- 請求項2〜4のいずれかに記載のDNAまたは請求項5に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
- 請求項6に記載の細胞により産生される、請求項1に記載の組み換えタンパク質。
- 請求項2〜4の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
- 請求項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
- 抗体がモノクローナル抗体である請求項9に記載の抗体。
- モノクローナル抗体が請求項1または7に記載のタンパク質のプロテアーゼ活性を中和する作用を有することを特徴とする請求項10に記載の抗体。
- 請求項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
- 請求項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
- 請求項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または請求項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
- 請求項1に記載のタンパク質、および/または請求項2〜4のいずれかに記載のDNAを結合させた担体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003115750A JP2004229640A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002117794 | 2002-04-19 | ||
JP2002130871 | 2002-05-02 | ||
JP2002352559 | 2002-12-04 | ||
JP2003115750A JP2004229640A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004229640A true JP2004229640A (ja) | 2004-08-19 |
Family
ID=32966617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003115750A Pending JP2004229640A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004229640A (ja) |
-
2003
- 2003-04-21 JP JP2003115750A patent/JP2004229640A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2064550B1 (en) | Use of prrg4 in methods of tumor diagnosis | |
US9139630B2 (en) | Compositions and methods for preparing recombinant MG53 and methods for optimizing same | |
WO1997046678A1 (en) | Nucleic acids and polypeptides related to presenilin | |
WO1997046678A9 (en) | Nucleic acids and polypeptides related to presenilin | |
JP2004229640A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041181A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229647A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229652A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229648A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229644A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229649A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229653A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041180A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229650A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229646A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229643A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041178A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229651A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041179A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004024249A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004000201A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229645A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229642A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229641A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229639A (ja) | 新規タンパク質及びそれをコードするdna |