JP2004229642A - 新規タンパク質及びそれをコードするdna - Google Patents
新規タンパク質及びそれをコードするdna Download PDFInfo
- Publication number
- JP2004229642A JP2004229642A JP2003115847A JP2003115847A JP2004229642A JP 2004229642 A JP2004229642 A JP 2004229642A JP 2003115847 A JP2003115847 A JP 2003115847A JP 2003115847 A JP2003115847 A JP 2003115847A JP 2004229642 A JP2004229642 A JP 2004229642A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- dna
- seq
- sequence
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案すること。
【解決手段】以下の (a) または (b) のタンパク質。(a)特定のアミノ酸配列からなるタンパク質。(b)上記アミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質。
【選択図】 なし
【解決手段】以下の (a) または (b) のタンパク質。(a)特定のアミノ酸配列からなるタンパク質。(b)上記アミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質。
【選択図】 なし
Description
【0001】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
cDNAの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長cDNAをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるcDNAに重複がないという意味であり、各cDNAが1種類ずつ含まれているライブラリーのことである。
【0003】
完全長cDNAクローニング法については、特開平9−248187号公報及び特開平10−127291号公報に記載されている。この方法は、mRNAの5’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたmRNAを鋳型とし、oligo dTをプライマーとして逆転写によりRNA−DNA複合体を作製し、この複合体の内、mRNAの完全長に対応するDNAを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【0004】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている(特開平10−84961号公報)。さらに、合成された完全長cDNAライブラリーに含まれるDNA断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている(特開平11−9273号公報)。
【0005】
このような技術により作製された完全長cDNAライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))。
【0006】
かくして得られるカタログ化された完全長cDNAライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えばその塩基配列は同定されるが、該cDNAがコードするタンパク質の生理活性は依然不明のままである。
【0007】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0008】
【課題を解決するための手段】
本発明者らは、マウス完全長cDNAライブラリー中のcDNAクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列にDNA結合活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質がDNA結合活性を有すると同定した。さらに、これらのcDNAの各組織における発現量や、該cDNAがコードするタンパク質を実際に取得してその相互作用を解析した。また、これらのcDNAがコードするタンパク質のDNA結合活性または転写制御活性を解析した。さらには、該cDNAの塩基配列をもとにヒトホモログDNAを取得し、得られたヒトホモログDNAの各組織における発現量を解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0009】
すなわち本発明によれば、以下の(1)〜(15)に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a)配列番号14〜26または36のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号14〜26または36のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質。
【0010】
(2) 上記(1)に記載のタンパク質をコードするDNA。
(3) 上記(1)に記載のタンパク質をコードする完全長cDNA。
(4) 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜13または35のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜13または35のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。
(c)配列番号1〜13または35のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。
【0011】
(5) 上記(2)〜(4)のいずれかに記載のDNAを含む組換えベクター。
(6) 上記(2)〜(4)のいずれかに記載のDNAまたは上記(5)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(7) 上記(6)に記載の細胞により産生される、上記(1)に記載のタンパク質。
【0012】
(8) 上記(2)から(4)の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【0013】
(9) 上記(1)または(7)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(10) 抗体がモノクローナル抗体である上記(9)に記載の抗体。
(11) モノクローナル抗体が上記(1)または(7)に記載のタンパク質のDNA結合活性を中和する作用を有することを特徴とする上記(10)に記載の抗体。
【0014】
(12) 上記(1)または(7)に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
(13) 上記(6)に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
(14) 上記(1)に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ配列情報、および/または上記(2)〜(4)のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(15) 上記(1)に記載のタンパク質、および/または上記(2)〜(4)のいずれかに記載のDNAを結合させた担体。
【0015】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得及び塩基配列の解析
本発明のDNAは、配列番号14〜26または36に記載のアミノ酸配列からなるタンパク質、または該アミノ酸配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば20個以下、好ましくは15個以下、より好ましくは10個以下、さらに好ましくは5個以下を意味する)のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0016】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜13または35に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号134〜1690、配列番号2の塩基番号1751〜2197、配列番号3の塩基番号662〜3259、配列番号4の塩基番号661〜1476、配列番号5の塩基番号213〜1703、配列番号6の塩基番号122〜1612、配列番号7の塩基番号156〜560、配列番号8の塩基番号149〜1591、配列番号9の塩基番号597〜1982、配列番号10の塩基番号230〜907、配列番号11の塩基番号566〜1228、配列番号12の塩基番号487〜2127、配列番号13の塩基番号167〜2950、配列番号35の塩基番号1〜2904に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’及び/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0017】
本発明のDNAは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば、下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてcDNAを合成するが、このとき完全長のcDNAを合成するために5’キャップ(7MeGpppN)サイトに特異的なジオール構造にタグになる分子を化学結合させ、このmRNAを鋳型としてoligo dTをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のcDNAのみを分離する方法(特開平9−248187号公報;特開平10−127291号公報)を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法(特開平10−84961号公報)を用いるのが好ましい。ここで、高温下とは40〜80℃を意味する。
【0018】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のDNAを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター(特開平11−9273号公報)が好ましく用いられる。かくして得られるcDNAライブラリーは、全てのクローンが均一に存在している(以下、これを「カタログ化されている」と称することがある)訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))を用いることが好ましい。
【0019】
カタログ化されたcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、cDNA全長の場合にはその末端100ベースの配列について得られた塩基配列をNCBIのGenBank、EMBL、DDBJ、PDB等のデータベースについてBLAST(http://www.ncbi.nlm.nih.gov/BLAST/;National Center of Biotechnology Information)を用いて検索し、最も高い相同性を示す配列でも相同性が30%以下であり、かつ該DNAの翻訳領域の全長について最も高い相同性を示す配列でもその相同性が40%以下であるものを新規として以下の解析に供することとした。
【0020】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜13または35に記載の塩基配列を有するものが挙げられる。また、その翻訳領域としては、配列番号1の塩基番号134〜1690、配列番号2の塩基番号1751〜2197、配列番号3の塩基番号662〜3259、配列番号4の塩基番号661〜1476、配列番号5の塩基番号213〜1703、配列番号6の塩基番号122〜1612、配列番号7の塩基番号156〜560、配列番号8の塩基番号149〜1591、配列番号9の塩基番号597〜1982、配列番号10の塩基番号230〜907、配列番号11の塩基番号566〜1228、配列番号12の塩基番号487〜2127、配列番号13の塩基番号167〜2950、配列番号35の塩基番号1〜2904に示される配列に示される配列を有するものが挙げられる。
【0021】
かくして取得された新規な塩基配列を、BLAST(Basic local alignment search tool;Altschul, S.F., et al.,J. Mol. Biol., 215, 403−410(1990)) による相同性検索 (homology search)や、HMMER(隠れMarkovモデルによる配列解析手法; Eddy, S. R., Bioinformatics 14, 755−763 (1998)) の機能群のひとつである HMMPFAMによるタンパク質特徴検索 (profile search:http://pfam.wustl.edu)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0022】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のDNAのこれに対応する部分とのidentityがe−valueとして10−4以下のものか、あるいは30%以上のものを示す。
【0023】
例えば、上位にヒットした触媒ドメイン配列の多くがDNA結合タンパク質としての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、DNA結合活性を持つであろうという予測が成り立つ。
【0024】
HMMPFAMでは、Pfamというタンパク質プロファイルを集積したデータベース中にあるエントリーが有する塩基配列の特徴を、解析対象である塩基配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【0025】
配列番号1に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、RIKEN full−length enriched library, clone:9530049C15, SCAN domain containing protein と、e−value:5×10−171、100%の相同性を、またZinc finger protein 192 (LD5−1)は、SCAN box domainをもつKruppel gene familyであるが、e−value:2×10−94、42%の相同性を、さらにHomo sapiens zinc finger protein (ZFP)と、e−value:4×10−93、41%の相同性を有する。これらの結果より、配列番号1に記載の塩基配列がコードするタンパク質はZinc finger proteinであることが推測できる。
また、配列番号1に示す塩基配列がコードするアミノ酸配列には、HMMPFAMによる蛋白質特徴検索により、ZF−C2H2の特徴を示す配列(PfamにLIMとしてエントリーされる塩基配列)が7回見出される。
これらのことから、配列番号1に示す塩基配列がコードするタンパク質はzinc finger型の転写因子であることが推測できる。
【0026】
配列番号2に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、RIKEN cDNA 2810411K16と、e−value:2×10−76、139アミノ酸にわたって100%の相同性を、RIKEN full−length enriched library, clone:2810411K16:SCAN domain containing proteinと、e−value:6×10−76、139アミノ酸にわたって99%の相同性を、Homo sapiens cDNA FLJ14478 fis, clone MAMMA1001633と、e−value:1×10−61、140アミノ酸にわたって86%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号1880〜2167にSCAN配列が見出され、これらのことから、配列番号2に示す塩基配列がコードするタンパク質はDNA結合蛋白質であることが推測できる。
【0027】
配列番号3に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Homo sapiens, clone MGC:13310 IMAGE:4110431と、e−value:5×10−145、919アミノ酸にわたって40%の相同性を、また、Zinc finger protein 180 (HHZ168)と、e−value:2×10−63、231アミノ酸にわたって51%の相同性を、さらに、Rattus norvegicus Cys2/His2 zinc finger protein (rKr1)と、e−value:6×10−63、192アミノ酸にわたって56%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号786〜3275にzf−C2H2が6箇所見出され、この特徴から、配列番号3に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0028】
配列番号4に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Macaca fascicularis brain cDNA, clone:QccE−18103.と、e−value:2×10−95、220アミノ酸にわたって79%の相同性を、またHomo sapiens putative transcription factor CR53と、e−value:1×10−32、56%の相同性を、さらに、Homo sapiens, Similar to zinc finger protein 202, clone MGC:15660 IMAGE:3347511と、e−value:1×10−32、134アミノ酸にわたって56%の相同性を有する。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと、SCAN配列(PfamにSCANとしてエントリーされる塩基配列)が見出される。
これらのことから、配列番号4に示す塩基配列がコードするタンパク質は転写因子であることが推測できる。
【0029】
配列番号5に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus, zinc finger proliferation 1と、e−value:6×10−97、491アミノ酸にわたって41%の相同性を、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)と、e−value:2×10−96、491アミノ酸にわたって41%の相同性を、さらに、Hypothetical zinc finger protein KIAA0426と、e−value:2×10−95、532アミノ酸にわたって44%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号929〜1585にzf−C2H2が8回見出され、これらの特徴から、配列番号5に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0030】
配列番号6に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus, zinc finger proliferation 1, clone MGC:18498 IMAGE:3981599と、e−value:6×10−97、491アミノ酸にわたって41%の相同性を、また、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)と、e−value:2×10−96、491アミノ酸にわたって41%の相同性を、さらに、Hypothetical zinc finger protein KIAA0426と、e−value:2×10−95、532アミノ酸にわたって44%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号929〜1585にzf−C2H2が8回見出され、この特徴から、配列番号6に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0031】
配列番号7に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、STATc transcriptional repressorと、e−value:4×10−28で、127アミノ酸にわたって53%の相同性を、また、forkhead−related transcription factor 2と、e−value:4×10−23で、109アミノ酸にわたって58%の相同性を、さらに、Transcription regulatory protein SNF5と、e−value:2×10−24で、118アミノ酸にわたって61%のの相同性を有する。
また、STATc transcriptional repressorは、データベース中の文献情報(Mol. Cell, 7(4), 779−88(2001))から初期の発生速度と末端分化のタイミングの制御に関ること、および、ecmA遺伝子の発現を制御するリプレッサーとして機能することが、またforkhead−related transcription factor 2は、データベース中の文献情報(J. Biol. Chem. 1998, 273 (36):23335−43)から肺および胎盤に発現されている転写因子でいくつかの肺特異的遺伝子のcis因子に結合することが、さらにTranscription regulatory protein SNF5は、データベース中の文献情報(Mol. Cell. Biol., 1990, 10 (11):5616−25)からグルコースおよびリン酸により制御される遺伝子の転写制御に関わることがそれぞれわかる。
これらの特徴より、配列番号7に記載の塩基配列がコードするタンパク質は転写因子であることが推測できる。
【0032】
配列番号8に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、zinc finger protein 151 (pHZ−67)と、e−value:1×10−25で、121アミノ酸にわたって48%の相同性を、また、Myc−interacting zinc finger proteinと、e−value:2×10−25で、121アミノ酸にわたって48%の相同性を有する。これらの結果より、配列番号8に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記Myc−interacting zinc finger proteinタンパク質は、データベース中の文献情報(Curr Top Microbiol Immunol 1997;224:137−46)から、Myc−interacting zinc finger proteinであることがわかる。
また、HMMPFAMによる蛋白質特徴検索により、配列番号8に記載の塩基配列がコードするアミノ酸配列に蛋白質二量化に関わる特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)が見出される。また、Zinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)も1ヶ所見出される。
これらの特徴から、配列番号8に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0033】
配列番号9に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Hypothetical zinc finger protein KIAA1473と、e−value:1×10−59で、295アミノ酸にわたって37%の相同性を、また、Zinc finger protein 135と、e−value:2×10−58で、277アミノ酸にわたって39%の相同性を有している。これらの結果より、配列番号9に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記Zinc finger protein 135タンパク質は、データベース中の文献情報(Genomics 1995 May 20;27(2):259−64)から、zinc finger Kruppel familyであることが明らかとなっており、発達障害などに関わることが分かる。
また、HMMPFAMによる蛋白質特徴検索により配列番号9に記載の塩基配列がコードするアミノ酸配列にZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が9ヶ所で見出される。
これらの特徴から、配列番号9に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0034】
配列番号10に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチの結果、PR−domain zinc finger protein 5と、e−value:3×10−13で、62アミノ酸にわたって50%の相同性を、また、zinc finger protein with interaction domainと、e−value:2×10−12で、81アミノ酸にわたって43%の相同性を有している。これらの結果より、配列番号10に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記zinc finger protein with interaction domainタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、zinc finger protein with interaction domainであることが分かる。
また、HMMPFAMによる蛋白質特徴検索により、配列番号10に記載の塩基配列がコードするアミノ酸配列にZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が2ヶ所見出される。
これらの特徴から、配列番号10に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0035】
配列番号11に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、PR−domain zinc finger protein 5と、e−value:4×10−13で、62アミノ酸にわたって50%の相同性を、また、zinc finger protein with interaction domainと、e−value:3×10−11で、81アミノ酸にわたって41%の相同性を有している。これらの結果より、配列番号11に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号11に記載の塩基配列がコードするアミノ酸配列にはZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が2ヶ所見出される。
これらの特徴から、配列番号11に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0036】
配列番号12に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus zinc finger transcription factor Kaisoと、e−value:2×10−27で、94アミノ酸にわたって58%の相同性を、また、Xenopus laevis BTB/POZ zinc finger transcription factor XKaisoが、e−value:2×10−29で、136アミノ酸にわたって48%の相同性を有している。
また、HMMPFAMによる蛋白質特徴検索により、配列番号12に記載の塩基配列がコードするアミノ酸配列にBTB (for BR−C, ttk and bab) or POZ(for Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)、Msx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)、Zinc finger, C2H2 type の特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が見出される。
これらの特徴より、配列番号12に示す塩基配列がコードするタンパク質はzinc fingerを持ったKaiso様の転写因子であることが推測できる。
【0037】
配列番号13に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Xenopus laevis DNA−methylation dependent transcriptional repressor Kaiso−like protein(Kaiso)と、e−value:4×10−32で、137アミノ酸にわたって48%の相同性を、また、Xenopus laevis BTB/POZ zinc finger transcription factor XKaisoと、e−value:4×10−32で、137アミノ酸にわたって48%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により、配列番号13に記載の塩基配列がコードするアミノ酸配列にBTB (BR−C, ttk and bab) or POZ(Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)、Msx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)、Zinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が見出される。
これらの特徴より、配列番号13に示す塩基配列はzinc fingerを持ったKaiso様の転写因子遺伝子配列の一部分であることが推測できる。
【0038】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜13または35に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば60個以下、好ましく30個以下、より好ましくは20個以下、さらに好ましくは10個以下、特に好ましくは5個以下を意味する。)の塩基が欠失、置換及び/または付加された塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつDNA結合活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号14〜26または36に記載のタンパク質のアミノ酸配列において1若しくは数個のアミノ酸配列が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードするものが含まれる。
【0039】
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜13または35に示される塩基配列またはその相補配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
【0040】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0041】
また、配列番号1〜13に記載の塩基配列は、マウスを由来とするものであるが、上記したcDNAライブラリーの作製法に従ってヒトのcDNAライブラリーを作製し、該ライブラリーに対して配列番号1〜13の塩基配列を有するDNA断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号1〜13に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNAを取得することもできる。本発明の配列番号1〜13に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトのホモログをコードするDNAも含まれる。
【0042】
また、インフォマティックスを利用して、ヒトホモログDNAが有する塩基配列を予測し、該塩基配列を基に上記のヒトcDNAライブラリーなどからヒトホモログDNAを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、(i)目的とするcDNAの塩基配列をクエリーとして、ヒト等のcDNAデータベース(インフォマティックスにより予測されるcDNAデータベースを含む)に対しBLASTなどを用いて相同性検索を行う方法や、(ii)目的とするcDNAをクエリーとしてヒト等のESTデータベースに対しBLASTなどを用いて相同性検索を行い、ヒットしたESTが有する配列を目的とするcDNAの塩基配列を参照して連結する方法、さらに(iii)目的とするcDNAの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しBLASTなどを用いて相同性検索を行い、目的とするcDNAの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してGenscan(http://genes.mit.edu/GENSCAN.html)やSim4(Genome Res., 8: 976−74 (1998))等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【0043】
マウス由来のcDNAのヒトホモログDNAの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号1〜13に記載の塩基配列を有するcDNAはいずれも新規であり、上記(i)の方法では、ヒトホモログDNAの塩基配列を取得できないと考えられるため、(ii)あるいは(iii)に記載の方法などが好ましく用いられる。
【0044】
かくして予測されたヒトホモログDNAの塩基配列を基に、上記のヒトcDNAライブラリーから、配列番号1〜13に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNAを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログDNAの5’端、および3’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトcDNAライブラリーを鋳型としてPCRを行う方法や、予測されたヒトホモログDNAの一部の配列をプローブとして、上記ヒトcDNAライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【0045】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。2種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【0046】
つまり、上記でホモログとして取得されたヒト由来のDNAは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のDNAがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【0047】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。
(1)まず、本発明のcDNAの塩基配列と、取得されたヒトホモログDNAの塩基配列について相同性を解析する。次に、本発明のcDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、(2)取得されたヒトホモログDNAの塩基配列と、対応する本発明のcDNAの塩基配列について相同性を解析する。次に、取得されたヒトホモログDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のcDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記(1)および(2)を確認することにより、取得されたヒトホモログが、本発明のcDNAに対応するヒトオルソログであると同定することができる。上記(1)および(2)に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記(1)および(2)に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【0048】
かくして取得されたヒトホモログDNA、あるいはオルソログDNAの塩基配列を、BLASTによる相同性検索やHMMPFAMによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定および確認することができる。本発明のcDNAのヒトオルソログとして、例えば配列番号35に記載の塩基配列を有するDNAが挙げられ、また本発明のタンパク質のヒトオルソログタンパク質として、配列番号36に記載のアミノ酸配列を有するタンパク質等が挙げられる。
本発明の配列番号1〜13に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトホモログ、あるいはオルソログタンパク質をコードするDNAも含まれる。
【0049】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号14〜26または36に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1若しくは数個のアミノ酸が置換、欠失、及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するものも含まれる。
【0050】
本発明のタンパク質の取得方法としては、上記(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0051】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したDNA結合活性を有するものであれば本発明の範囲に含まれる。
【0052】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0053】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0054】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0055】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol.Biol.,53,154, (1970))、リン酸カルシウム法(Science,221,551, (1983))、DEAEデキストラン法(Science,215,166,(1982))、インビトロパッケージング法(Proc.Natl.Acad. Sci.USA,72,581,(1975))、ウィルスベクター法(Cell,37,1053,(1984))、および電気パルス法(Chu.et al.,Nuc.Acids Res.,15,1331(1987))等が挙げられる。
【0056】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J.Biol.Chem.,263,7406,(1988))とその宿主であるSf−9(J.Biol.Chem.,263,7406,(1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291,(1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc.Natl.Acad. Sci. USA,77,4216, (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7(ATCC CRL1651:アメリカン タイプ カルチャー コレクション保存細胞)が用いられる。
【0057】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(A. A. Vertes et al., Biosci. Biotechnol. Biochem., 57, 2036, (1993))、あるいはトランスポゾンや挿入配列(A. A. Vertes et al., Molecular Microbiol., 11, 739, (1994))等を用いてDNA導入体を作製することもできる。
【0058】
得られた培養物は、細胞あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
【0059】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0060】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、DNA結合活性を有するものであれば、本発明のタンパク質に含まれる。
【0061】
かくして得られたタンパク質は、他のタンパク質、DNAとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0062】
(3)オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【0063】
該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜13または35のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0064】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等を挙げることができる。
【0065】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するRNAインターフェアレンス法(以下、これを「RNAi法」と称することがある)に用いることができる。RNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411, 494−498(2001))に記載の方法等を用いることができる。また、上記2本鎖RNAは必ずしも全てがRNAである必要はなく、例えば、WO02/10374号公報に記載のもの等も用いることができる。
【0066】
ここで、標的遺伝子としては、本発明のDNAであれば、如何なるものであってもよい。これらDNAの少なくとも一部の塩基配列と実質的に同一な配列からなる2本鎖RNA(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までの如何なる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5, 115−180(1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase:Bass, B.L., Nature, 411, 428−429(2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’、5’oligoadenylate synthetase(Bass, B.L., Nature, 411, 428−429(2001))を介してRNaseLの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、最も好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’、または3’末端が一部突出したものも含むが、3’末端が2塩基突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0067】
2本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法として具体的には、例えば、合成した1本鎖ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0068】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0069】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【0070】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0071】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
RNAインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0072】
(4)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。
【0073】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0074】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0075】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0076】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein,et al.,Nature,256, 495(1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0077】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(U. Zimmer− mann. et al., Naturwissenschaften,68, 577(1981))によっても行うことができる。
【0078】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0079】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256−259 (1988); Duchosal, M. A., et al., Nature, 355, 258−262(1992))。
【0080】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0081】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するDNA結合活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0082】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0083】
(5)本発明のタンパク質が有する活性の確認および解析
本発明のタンパク質は、これを上記(2)に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記(1)で推測した活性を有していることを確認することができる。さらに上記(4)のとおりに作製した抗体等との組み合わせにより解析することもできる。
本発明のタンパク質が、DNA結合活性を有することは、例えば、適当な二本鎖DNAを該組み換えタンパク質に接触させ、該組み換えタンパク質の該DNA鎖への結合性を測定することにより確認することができる。具体的な方法としては、例えば、以下に説明する方法等が挙げられる。
【0084】
反応液としては、60mM塩化カリウム、1mMジチオトレイトール、10%グリセロール、1μg poly(dI−dC)を含む中性から弱塩基性緩衝液、例えば20mMトリス−塩酸或いはHEPES緩衝液(pH7〜8)を用い、適当な長さの二本鎖DNAと本発明の組み換えタンパク質を加えることにより反応を開始する。一定条件下で反応後、該組み換えタンパク質とDNAの結合物を検出することによりタンパク質の二本鎖DNA結合活性を判断する。
【0085】
組み換えタンパク質とDNAの結合は、分子の大きさとして検出する方法、電荷の差異として検出する方法、両者の親和性を測定する方法等を用いて検出することが可能である。
分子の大きさを検出する方法としては、分子ふるいクロマトグラフィーによる測定が挙げられる。上記反応液を、生理食塩水或いは0.1Mリン酸緩衝液(pH7.4)、0.1M HEPES(pH7.5)で平衡化した分子ふるいクロマトグラフィー用カラムに添加し、同溶液にて展開する。組み換えタンパク質、DNAそれぞれの溶出位置と比較して、より高分子量側に両者の結合物が溶出される。
【0086】
電荷の差として検出する方法としては、イオン交換クロマトグラフィー、ゲル電気泳動法、キャピラリー電気泳動法を含む電気泳動法が挙げられる。ゲル電気泳動法は、電荷の差と分子の大きさの差が移動度の差として現れる。上記反応液を、ポリアクリルアミドゲル中で電気泳動し、泳動後のゲルを銀染色、クマーシーブリリアントブルー染色、或いは蛍光染色し、組み換えタンパク質単独の場合と比較して、結合物は移動度の異なるバンドとして確認される。この2法の場合、DNAの一方の末端を蛍光ラベルしておくことによって、DNAの溶出位置、移動度の差として、より高感度で検出することも可能である。
【0087】
両者の親和性を測定する方法としては、アフィニティークロマトグラフィー、表面プラズモン共鳴法等が挙げられる。これらの方法では、DNAを担体に固定しておき、そこに組み換えタンパク質を接触させ、その結合量を測定し活性の強さとする。アフィニティークロマトグラフィーでは、結合した組み換えタンパク質を高濃度の塩溶液、変性剤、遊離のDNA等で溶出し、溶出したタンパク質量を測定する。表面プラズモン共鳴法では、固定化DNAに結合したタンパク質量を、表面プラズモン共鳴で測定し、結合したタンパク質濃度で親和性の強さを測定することができる。
【0088】
また、DNA・RNAに結合し転写に関連するタンパク質では、一般的に、既知の転写関連因子が認識し標的とするプロモーターやエンハンサー等の遺伝子転写調節領域(以下、「標的転写調節領域」と称する)のDNAおよびその部分断片を用いて、これらに対する結合能を測定することにより網羅的に転写制御活性を解析する方法が知られている(特開2001−314190号公報)。解析に使用する標的転写調節領域のDNAおよびその部分断片として、既知の標的転写調節領域の塩基配列(以下、これを「標的配列」と称することがある)を有するものだけでなく、既知の標的転写調節領域の塩基配列をデーターベース解析し分類してそれぞれ設計した、転写関連因子が共通して認識する標的転写調節領域の共通塩基配列(以下、これを「コンセンサス標的配列」と称することがある)を有するものを使用してもよい。既知の転写関連因子としては、例えば、v−jun, c−jun, junB, junD, dJRA, c−fos, fosB1, fosB2, Fra−1, LRF−1, v−maf, mafG, NF−E2 p45, aNF−E2, fNF−E2, Nrf short form, GCN4, yAP−1, CREB−2, ATF−3, CRE−BP1, CRE−BP3, ATF−a, CREB−341, CREB−327, CREM, dCREB2, dCREB2−b, dCREB2−c, dCREB2−d, dCREB2−q, dCREB2−r, dCREB2−s, C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP−10, VBP, Hlf, CPRF−2, EmBP−1b, EmBP−1b, GBF1, GBF2, GBF3, CPRF−1, TAF−1, HBP−1a, GBF9, GBF1, GBF12, CPRF−3, TGA1a, TGA1b, O2, STE4, OPI1, E2A, E47, ITF−2/SEF2−1B, SEF−1A, MyoD, p42Tal−1, HEN−1, AhR, Arnt, USF, NF−1A1, NF−1A1.1, NF−1A6, NF−1B1, NF−1B1, NF−1B2, NF−1C2/CTF−2, CTF−4, CTF−6, RF−X1, AP2alphaA/AP−2alpha1, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gamma, GR, AR, ER, RXR−alpha, PPARalpha, PPARgamma, COUP−TF1,HNF−4alpha1, HNF−4alpha2, CF1, GATA−1, GATA−2, GATA−3, GATA−4, AREA/NIT−2, Sp1, YY1, Egr−1, Egr−2, Egr−3, Snail, CF2−II, Evi−1, Ikaros, MZF−1, Tramtrack69K, HOX9, CDP, HNF−1A, Nkx−2.2, Nkx−2.5, TTF−1, Oct−1A, Oct−1B, Oct−1C, Oct−2, Oct−2.1/Oct−2B, Pax−3, Pax−6, Pax−1, HSF1(short), HSF2, dHSF, fungalHSF, c−Myb, A−Myb, v−Myb, P(long), P(short), C1(long), C1(short), c−Ets−1#p54, Ets−1#deltaiV/VII, Ets−2, Elk−1, SAP−1, SAP−1b, Erg−1, p55erg, Fli−1b, E4TF1−60/GABP−alpha, E74A, IRF−1, IRF−2, p50, NF−ATc, NF−Atp, p91, p84, STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6, p53, MEF−2A, SRF, E2, TBP, SRY, Sox−5, Sox−9, mat−Mc, CP1A, CP1B, CBF−C, AML1a, 等が知られており、これらの転写関連因子の標的転写調節領域の塩基配列もそれぞれ報告されている(田村隆明、外2名編、「Bio Science 実験医学別冊 新用語ライブラリー 転写因子」、第2版、株式会社羊土社、1999年12月)。
【0089】
本発明のDNA結合活性を有するタンパク質と標的転写調節領域のDNAおよびその部分断片との結合は、それ自体公知の測定系を使用して検出することができる。例えば、標的転写調節領域のDNAおよびその部分断片を固定化したプレートに本発明のタンパク質を含む被検試料を添加し、両者の直接的な結合をSPR(Surface Plasmon Resonance, 表面プラズモン共鳴)法を用いて検出することができる。その場合には、前記したような転写に関連するタンパク質が認識する標的転写調節領域のDNAまたはその部分断片をセンサーチップに固定化する。DNA及びその部分断片は、アニーリングさせたものを固定化する。また、前記のように、本発明のタンパク質または標的転写調節領域のDNAおよびその部分断片を蛍光標識したものを用いて、両者の結合を検出することもできる。
【0090】
本発明のタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することにより蛋白質発現を誘導し、本発明のタンパク質を取得することができる。
【0091】
また、転写に関連するタンパク質は、疾患に関与する種々の遺伝子の転写を調節する転写因子(以下、「疾患関連転写因子」と称する)への作用を解析することにより、該タンパク質が特定の疾患に直接的または間接的に関与しているか否かを解析することも有用である。疾患関連転写因子としては、例えば、PPAR, p53, NFκB, AP−1, HIF−1, CREB等が知られており、これら既知の因子への作用を上記と同様の方法等を用いて解析すればよい。
【0092】
例えば、SPR法を用いて解析を行う場合には、前記疾患関連転写因子が有する標的転写調節領域のDNAまたはその部分断片が特に好ましく用いられる。このようなDNAまたは部分断片が固定化されたセンサーチップに本発明のタンパク質を含む被検試料を適宜添加し、センサーチップ表面のDNAと被検試料中に含まれる該タンパク質との間の相互作用を解析する。固定化DNAと親和性を有する場合、コントロールに比較してSPR応答値が上がり、転写関連因子が固定化DNAと親和性を有していることが推定できる。このような解析により、本発明のタンパク質が特定の疾患においてどのような機能を有しているかを解析することができる。
【0093】
ここで、本発明のタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することにより蛋白質発現を誘導し、本発明のタンパク質を取得することができる。
【0094】
疾患関連転写因子は、該疾患関連転写因子が含まれている細胞抽出液または細胞核抽出液から取得することができる。また、前述のように、疾患関連転写因子をコードするDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、疾患関連転写因子をコードするcDNAを使用し、その全長または一部を適当な発現ベクターに挿入し、これを大腸菌などの微生物、昆虫細胞、酵母、動物細胞または動物に導入し、疾患関連転写因子が発現したこれらの遺伝子導入細胞の培養上清または細胞内、組織、体液より、組換え蛋白質である疾患関連転写因子を取得することができる。
【0095】
なお、本発明のタンパク質が有する活性の確認は、上記した方法に限定されるものではない。また、これらの機能アッセイ系は、後述する本発明のタンパク質の機能賦活物質や機能阻害物質のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【0096】
本発明のタンパク質の機能解析の方法として一般的には、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入し、表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【0097】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA法、ウエスタンブロット法などが挙げられる。ここで、解析の対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象バリアントと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0098】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質が公知のバリアントが存在するスプライシングバリアントの場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0099】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、公知のバリアントが存在するスプライシングバリアントの場合には、公知のものも同様に細胞へ導入し、比較解析することにより解析対象バリアントに関連する表現型を同定することができる。また、本発明のタンパク質はDNA結合活性を有するものであることがわかっているので、DNA結合タンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0100】
(iv)の方法では、後述するオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0101】
(6)本発明のタンパク質が有する活性を調節する分子のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0102】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まずはじめに本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を用いることができる。
【0103】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質の相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(4)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【0104】
具体的な解析方法としては、例えば、DNA結合活性を調節する物質を解析する場合には、上記(5)に記載の方法等を用いて行うことができる。二本鎖DNAとの結合性が、物質の非存在下の場合と比べて増加した場合には、該物質はDNA結合活性化物質として機能する可能性があり、また低下、または阻害された場合には物質はDNA結合阻害物質として機能する可能性があると同定できる。ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のDNA、あるいは組み換えタンパク質については、上記したヒトのホモログタンパク質またはオルソログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、これらの生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【0105】
本発明のタンパク質が有するDNA結合活性としては、例えば、DNA構造に変化を与えて遺伝子発現を調節する機能が挙げられ、遺伝子発現調節タンパク質、あるいは、転写因子などが属する。転写因子は、癌に関連するパスウェイ上のシグナル伝達機能、心筋発達に関連するパスウェイ上のシグナル伝達機能、精子の分化・運動性を制御するパスウェイ上のシグナル伝達機能、生殖細胞分化を制御するパスウェイ上のシグナル伝達機能、細胞分化を制御するパスウェイ上のシグナル伝達機能、グリセロール3燐酸を生成する機能、神経細胞の発生・分化・増殖・生存維持を制御するパスウェイ上のシグナル伝達機能、アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能他、各種細胞の発生、分化、成長、増殖、生存、再生、および、細胞機能等を制御するパスウェイのシグナル伝達機能等、各種シグナル伝達において最終的にDNAに結合して遺伝子の発現制御に関わる因子である。従って、これらシグナル伝達に関わる各種疾患治療剤のスクリーニングの標的とすることができる。本スクリーニング方法により同定できる化合物は、抗ガン剤、糖尿病治療剤、抗炎症剤、神経変性疾患治療剤、心疾患治療剤、不妊治療剤、再生組織誘導剤、アルツハイマー病治療剤、肥満治療剤、糖尿病治療剤、心臓血管疾患治療剤、代謝異常治療剤、食欲不振、過食症などの治療剤等として用いられ得るものである。
【0106】
かかる調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0107】
(7)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、上記(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0108】
被検物質としては、上記(6)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0109】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0110】
(8)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0111】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0112】
(9)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜13または35のいずれかに記載の塩基配列を有するDNA及びその部分断片は、配列番号14〜26または36のいずれかに記載のアミノ酸配列を有するタンパク質及びその部分断片は、それらを基盤上に結合させた担体としてもちいられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。
【0113】
ここで、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0114】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。ここで、DNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD−R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0115】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 cDNAライブラリーの調製
(1)mRNAの調製
mRNA調製マウス(C57BL/6)各器官または組織0.5〜1gを10mlの懸濁液でホモジェナイズし、pH4.0 の2M 酢酸ナトリウム1ml と、同量のフェノール/ クロロホルム(体積比5:1)混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、RNAが水相から分離沈澱した。この試料を氷の上で1時間インキュベーションした後、15分間4,000rpmで冷却遠心機にかけ、沈澱物を回収した。この検体を70%エタノールで洗い、8mlの水に溶解後、2mlの5M NaCl、1 % CTAB(cetyltrimethy− lammonium bromide)、4M尿素、50mM Trisを含むpH7.0 の水溶液16mlを加えることでRNAを沈澱させ、ポリサッカライドを除いた(CTAB沈澱)。
【0116】
続いて室温で4,000rpm、15分間遠心機にかけ、RNAを4mlの7Mグアニジン−C1に溶解した。そして2倍量のエタノールを加えた後、氷上で1時間インキュベーションし、4,000rpm、15分間遠心機にかけ、生じた沈澱物を70%エタノールで洗いRNAを回収した、これを再度水に溶解し、RNAの純度をOD比260/280(>1.8)と230/260(<0.45)を読むことによって計測した。
【0117】
(2)第1鎖cDNAの調製
上記(1)で調製したmRNA 15μgを使って逆転写酵素3,000unit により、最終容量165μlの反応液中で、5−メチル−dCTP、dATP、dTTP、dGTPを各々0.54mM、0.6Mトレハロース、50mM Tris−HCl(pH8.3)、75mM KCl、3mM MgCl2、10mM DTT、52ng/μl BSA、RNaseインヒビター 5unitの条件下で逆転写反応を行った。制限酵素XhoIの認識配列を含むオリゴヌクレオチド(配列番号27)(配列中、VはA,G,又はCを示し、NはA, G, C,又はTを示す)12.6μlをプライマーとして用いた。
【0118】
この反応を始める際、反応液の1/4を採取し、それに1.5μlの[α−32P]−dGTP(3000Ci/mmol、10μCi/μl;Amersham社製)を加えるこことにより、第1鎖cDNAの合成効率を測定した。RI標識した反応液の0.5μlをDE−81ペーパー上にスポットし、0.5Mリン酸ナトリウム緩衝液(pH7.0)で3回洗った前後のRI活性を測定し、計算した。その後、RI標識した反応液と非標識の反応液を混合し、0.5M EDTA 8μl、10%SDS 2μl、プロテイナーゼ(Proteinase)K 20μgを加え、45℃で15分間加熱した。フェノール/クロロホルムによる抽出、エタノール沈澱後、沈澱をRNaseフリーに処理してある水(以下RNaseフリー水とする)47μlに溶解した。
【0119】
(3)5’キャップ構造及び3’末端へのビオチン付加
RNAジオールのビオチン化RNAのジオール部位(Cap構造のある5’末端と、ポリA鎖のある3’末端のリボースの双方に存在)にビオチンを結合させるために、2段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化RNA体のカップリング反応である。まず、逆転写反応で得られたRNA−第1鎖cDNA複合体15μgを、6.6mM酢酸ナトリウム緩衝液(pH4.5)と、酸化剤として過ヨウ素酸ナトリウムを用いて50μlの反応液中で処理した。この酸化反応は遮光条件の下、氷上で45分間行った。
【0120】
続いて、5M塩化ナトリウム11μl、10% SDS 0.5μl、そして同量のイソプロパノールを加え、60分間氷上に放置した後、4℃で15分間15,000rpm遠心し沈澱を取得した。沈澱物は70%エタノールで洗い、RNaseフリー水50μlに再溶解させた。その試料に1M酢酸ナトリウム(pH6.1)5μl、10% SDS 5μl、10mMビオチンヒドラジド(Sigma社製)150μlを加え、室温(22〜26℃)で終夜反応させた。最後に、5μlの5M NaCl、1M酢酸ナトリウム(pH6.1)75μl、及び2.5倍量のエタノールを加え、1時間の氷上冷却後、4℃において15分間遠心し、ビオチン化した。反応後、反応液を15分間遠心し、再度RNA−DNA複合体を沈澱させた。沈澱物は70%エタノールで1回、更に80%エタノールで1回洗い、RNaseフリー水70μlに溶解した。
【0121】
(4)RNase Iによる完全長cDNAの選択
上記(3)で取得したビオチン化RNA−DNA複合体について、1本鎖RNAを消化するRNase Iで処理することにより、逆転写反応時に完全なcDNAの伸長が得られなかったmRNA、およびmRNAの3’末端に標識されたビオチン残基を取り除いた。具体的には、上記(3)で得られた試料70μlに10×RNase Iバッファー(100mM Tris−HCl(pH7.5)、50mM EDTA、2M NaOAc)10μl、RNase I(RNase OneTM;Promega社製)200unitを加えて、37℃で15分間1本鎖RNAを消化した。
【0122】
(5)完全長cDNAの採取
ストレプトアビジンコートしたマグネティックビーズにcDNAが非特異的吸着するのを防止するため、100μgの酵母tRNA(DNaseI処理したもの)を5mg(500μl)のマグネティックビーズ(magnetic porous glass(MPG)particles coated withstreptavidin(CPG,NJ))に加え、1時間氷上に放置した後、50mM EDTA、2M NaClの溶液にて洗った。
【0123】
このビーズを50mM EDTA、2M NaClの溶液500μl中に懸濁し、上記(4)で取得したRNase I処理を施されたcDNAを加えた。室温にて30分間撹拌することで、マグネティックビーズと完全長cDNAを結合させた。完全長cDNAを捕獲したビーズを50mM EDTA、2M NaClの溶液で4回、0.4%SDS、50μg/μl酵母tRNAで1回、10mM NaCl、0.2mM EDTA、10mMTris−HCl(pH7.5)、20% グリセロールで1回、50μg/μl酵母tRNA水溶液で1回、RNase H用バッファー(20mMTris−HCl(pH7.5)、10mM MgCl2、20mM KCl、0.1mM EDTA、0.1mM ジチオスレイトール(DTT))で1回洗浄した後、RNase H用バッファー100μlに懸濁し、RNase H 3unitを加え、37℃下30分間加温した。その後、10%SDS 1μl、0.5M EDTA 2μlを加えて、10分間、65℃に曝し、その上清を回収した。
【0124】
このようにして回収された1本鎖完全長cDNAはフェノール/クロロホルムで抽出され、スピードバッグにて液量を100μl以下に減じてからG25/G100Sephadexクロマトグラフィーに付した。RI活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン2μgを加え、エタノール沈澱にて得られた沈澱物を30μlの超純水に溶解した。
【0125】
(6)1本鎖cDNAへのオリゴdG付加
上記(5)で回収された1本鎖cDNA30μlは、最終容量50μlの反応液中で、200mMカコジル酸ナトリウム(pH6.9)、1mM MgCl2、1mM CoCl2、1mM 2−メルカプトエタノール、100μM dGTPの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TaKaRa社製)32unitを用いて37℃で30分間のオリゴdG付加反応に付した。反応終了時にEDTAを50mMとなるように加え、一連のフェノール/クロロホルムによる抽出、エタノール沈澱を経て、31μlの超純水に溶解した。
【0126】
(7)第2鎖cDNA合成
第1鎖cDNAを鋳型にした第2鎖cDNAの合成は以下のように行った。最終容量60μlの反応系で、第2鎖低バッファー(200mM Tris−HCl(pH8.75)、100mM KCl、100mM (NH4)2SO4、20mM MgSO4、1%Triton X−100、1mg/μl BSA)3μl、第2鎖高バッファー(200mM Tris−HCl(pH9.2)、600mM KCl、20mM MgCl2)3μl、dCTP、dATP、dTTP、dGTP各々0.25mM、β−NADH 6μl、オリゴdG付加された第1鎖cDNA31μl、第2鎖プライマー−アダプター(配列番号28)600ng を加え、Ex Taq DNAポリメラーゼ(TaKaRa ExTaq;TaKaRa社製)15unit、耐熱性DNAリガーゼ(Ampligase;Epicentre社製)150unit、耐熱性RNase H(Hybridase;Epicentre社製)3unitによって第2鎖cDNAを合成した。
【0127】
0.5M EDTAを1μl加えることで反応を停止させ、更にタンパク成分を溶解するために、10%SDS 1μl、プロテイナーゼ(Proteinase) K 10μgの存在下に45℃で15分間加熱し、最終的にフェノール/クロロホルムによる抽出、エタノール沈澱にて精製した2本鎖完全長cDNAを得た。
【0128】
(8)ライブラリーの調製
以上の方法により得られた二本鎖完全長cDNAは、λZAPIIIベクターに挿入し、ライブラリーとして回収した。λZAPIIIベクターはλZAPII(STRATAGENE社製)ベクターのマルチクローニングサイトの一部の配列である配列番号29を配列番号30に改変し、二つのSfiIサイトを新たに導入したものである。
【0129】
さらにλPS(RIKEN)ベクターを作製し、cDNAを挿入した。λPS(RIKEN)(λ−FLC−1と命名(FLCとはFULL−LENGTH cDNAを意味する))とは、MoBiTec社(ドイツ)のλPSベクターをcDNA用に改変したものである。即ち10kbp stufferの両側に存在するクローニングサイトにcDNA挿入に便利なBamHIならびにSalIを各々導入するとともに、0.5kbから13kb程度までのcDNAがクローニングできるようにXbaIサイトに6kbのDNA断片を挿入したものである(特開2000−325080号公報)。このλ−FLC−1を用いると、例えば肺臓cDNAライブラリーの場合には、インサートの平均鎖長は2.57kbとなり、実際に0.5kbから12kbまでのインサートをクローニングすることが出来た。従来法のλZAPの場合には、インサートの平均鎖長は0.97kbであったことから、λ−FLC−1を用いることによって、サイズの大きなcDNAもλZAPに比べて効率よくクローニングできることがわかる。
【0130】
実施例2 完全長cDNAライブラリーのノーマライゼーション/サブトラクション
(1)ドライバーの調製
実施例1(1)で作製したmRNA(以下、これを「(a)RNAドライバー」と称することがある)、及びin vitro転写反応で作成したRNAをドライバーとして用いた。後者のRNAはさらに2種類(以下、これを「(b)RNAドライバー」、及び「(c)RNAドライバー」と称する)に分けられる。1つはノーマライゼーションにより除かれたRNA−cDNAからcDNAを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後1つの出発材料あたり1000から2000プラークを混ぜ合わせて1つのライブラリー(ミニライブラリー)とし、常法によりプラスミドDNAに変換する(ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドDNAを得る)。
【0131】
得られたDNAについてin vitro転写反応(T3RNAポリメラーゼまたはT7RNAポリメラーゼを用いる)を行い、DNase I(RQ1−RNase free;Promega社製)、Proteinase K処理後、フェノール/クロロホルム抽出をしてRNA(b)RNAドライバーを得た。この際、通常出発材料としては9種類(すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃)の組織からそれぞれミニライブラリーを作成して、9種類のミニライブラリーを混合してRNAを得る。もう一つのRNAはすでに重複のないクローンとして保存されているライブラリー(クローン数約2万個)を培養し、得られたDNAについて(b)RNAドライバーと同様にin vitro転写反応を行い(c)RNAドライバーとした。
【0132】
これら3種のRNAは、Label−IT Biotin LabelingKit(Mirus Corporation製)を用いてビオチン化標識を行ったあと、1:1:1の割合でテスターcDNAに添加し、Rot10での反応(42℃)を行い、ストレプトアビジンビーズ(CPG)処理を行って回収した上清について、第2鎖の合成を行った。
【0133】
実施例3 完全長cDNAクローンの塩基配列決定
(1)クローンのrearray
各クラスタからひとつの代表クローンを選んだ。代表クローンはQ−bot(GENETIX LIMITED製)で選択し、384穴プレートにarray化した。その際、大腸菌は30℃で18〜24時間、50μlのLB培地で培養した。このとき、cDNAライブラリーがPSベクターに導入され大腸菌DH10Bを形質転換している場合には100mg/mlのアンピシリン及び50mg/mlのカナマイシンを添加し、Zapベクターに導入し、SOLRシステムに導入している場合には100mg/mlのアンピシリン及び25mg/mlのストレプトアビジンを添加して行った。
【0134】
(2)プラスミドの抽出とInsSizing
上記(1)で培養した各クローンは、さらに100mg/mlのアンピシリンを含む1.3mlのHT液中で培養され、遠心分離により菌体を回収した後、QIAprep 96 Turbo(QIAGEN社製)を用いてプラスミドDNAを回収、精製した。取得されたプラスミド中に挿入されているcDNAの鎖長を調べるために、上記で取得したプラスミドDNAの1/30を制限酵素PvuIIで消化し、1%のagaroseゲル電気泳動を行った。
【0135】
(3)配列決定
かくして取得されたプラスミド中に挿入された完全長cDNAの全長の塩基配列解析には、3種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが2.5kbより短いものと長いものの2つのカテゴリに分けた。このうち2.5kbより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがPSの場合には配列番号31(センス鎖)、及び32(アンチセンス鎖)に記載のプライマーを用いて、またベクターがZapの場合には配列番号33(センス鎖)、及び34(アンチセンス鎖)に記載のプライマーを用いてThermosequenase Primer Cycle Sequencing Kit(Amersham Pharmacia Biotech社製)で反応し、Licor DNA4200(long read sequencer)を用いて解析した。
【0136】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ABI Prism377及び/またはABI Prism3700(Applied Biosystems Inc.製)とBigDye terminator kitとCycle Sequencing FS ready Reaction Kit(Applied Biosystems Inc.製)を用いた。
【0137】
また、挿入されているcDNAが2.5kbより長いクローンの配列決定は、ショットガン法によった。その際、Shimadzu RISA 384とDYEnamic ET terminator cycle sequencing kit(Amersham Pharmacia Biotech社製)を用いた。ショットガンライブラリを作製するために、48の独立な代表クローンからPCRで増殖した48のDNAフラグメントを用いた。増幅されたDNA断片の末端をT4 DNAポリメラーゼによって平滑化した。
このDNA断片を、pUC18ベクターへ挿入し、更に該組み換えベクターにより大腸菌DH10Bを形質転換した。この大腸菌から上記(2)と同様にしてプラスミドを調製した。
【0138】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、Double Stroke Shearing Device(Fiore Inc.製)によるshearingを行った。ショットガン法による塩基配列決定は、12〜15クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【0139】
実施例4 塩基配列の解析
(1)dnaform34837(配列番号1、14)
dnaform34837は、配列番号1に示すように、3717塩基から成り、そのうち塩基番号134から1690までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、518アミノ酸残基から成る (配列番号14)。配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号trembl|AK020600|AK020600_1、RIKEN full−length enriched library, clone:9530049C15, SCAN domain containing protein が、e−value:5×10−171、100%の一致度で、また(ii)データベース登録記号trembl|U88080|U88080_1、 Zinc finger protein 192 (LD5−1)は、SCAN box domainをもつKruppel gene familyであり、e−value:2×10−94、42%の一致度である。さらに、(iii)データベース登録記号gp|AF154846|8099348、Homo sapiens zinc finger protein (ZFP)が、e−value:4×10−93、41%の一致度でヒットした。これらの結果より配列番号14に示したアミノ酸配列からなるタンパク質はZinc finger proteinであることが推測された。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、ZF−C2H2の特徴を示す配列(PfamにLIMとしてエントリーされる塩基配列)が7回見出された。
これらのことから、配列番号1に示す塩基配列がコードするタンパク質はzinc finger型の転写因子であることが推測された。
【0140】
(2)dnaform63166(配列番号2、15)
dnaform63166は、配列番号2に示すように、3607塩基から成り、そのうち塩基番号612から2126までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、504アミノ酸残基から成る (配列番号15)。配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gpnew|BC021456|18204788、RIKEN cDNA 2810411K16、e−value:2×10−76、139アミノ酸にわたって100%の一致度で、また(ii)データベース登録記号trembl|AK013086|AK013086_1、RIKEN full−length enriched library, clone:2810411K16:SCAN domain containing proteinが、e−value:6×10−76、139アミノ酸にわたって99%の一致度で、さらに(iii)データベース登録記号gp|AK027384|14042023、Homo sapiens cDNA FLJ14478 fis, clone MAMMA1001633が、e−value:1×10−61、140アミノ酸にわたって86%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号1880〜2167にSCAN配列が見出され、この特徴からDNA結合蛋白質であることが推測された。
【0141】
(3)dnaform33383(配列番号3、16)
dnaform33383は、配列番号3に示すように、3704塩基から成り、そのうち塩基番号662から3259までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は865アミノ酸残基から成る (配列番号16)。配列番号3がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC008827|14250716、Homo sapiens, clone MGC:13310 IMAGE:4110431、e−value:5×10−145、919アミノ酸にわたって40%の一致度で、また(ii)データベース登録記号trembl|AF192913|AF192913_1、Zinc finger protein 180 (HHZ168)が、e−value:2×10−63、231アミノ酸にわたって51%の一致度で、さらに(iii)データベース登録記号gp|U41164|1127843、Rattus norvegicus Cys2/His2 zinc finger protein (rKr1)が、e−value:6×10−63、192アミノ酸にわたって56%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号2786〜3275にzf−C2H2が6箇所見出され、この特徴からDNA結合蛋白質であることが推測された。
【0142】
(4)dnaform39530(配列番号4、17)
dnaform39530は、配列番号4に示すように、2397塩基から成り、そのうち塩基番号661から1476までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、271アミノ酸残基から成る (配列番号17)。配列番号4がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|AB052171|11611589、Macaca fascicularis brain cDNA, clone:QccE−18103.が、e−value:2×10−95、220アミノ酸にわたって79%の一致度で、また(ii)データベース登録記号trembl|AF017433|AF017433_1,Homo sapiens putative transcription factor CR53は、e−value:1×10−32、56%の一致度である。さらに(iii)データベース登録記号gp|BC007287|13938317、Homo sapiens, Similar to zinc finger protein 202, clone MGC:15660 IMAGE:3347511が、e−value:1×10−32、134アミノ酸にわたって56%の一致度でヒットした。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号775〜1062にSCAN配列(PfamにSCANとしてエントリーされる配列)を見出した。
これらのことから、配列番号4に示す塩基配列がコードするタンパク質は転写因子であることが推測された。
【0143】
(5)dnaform38861(配列番号5、18)
dnaform38861は、配列番号5に示すように、2621塩基から成り、そのうち塩基番号213から1703までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は496アミノ酸残基から成る (配列番号18)。配列番号5がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC010591|14714873、Mus musculus, zinc finger proliferation 1、e−value:6×10−97、491アミノ酸にわたって41%の一致度で、また(ii)データベース登録記号trembl|D10630|MMZFP51_1、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)が、e−value:2×10−96、491アミノ酸にわたって41%の一致度で、さらに(iii)データベース登録記号trembl|AB007886|AB007886_1、Hypothetical zinc finger protein KIAA0426が、e−value:2×10−95、532アミノ酸にわたって44%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号929〜1585に zf−C2H2が8回見出され、この特徴からDNA結合蛋白質であることが推測された。
【0144】
(6)dnaform60441(配列番号6、19)
dnaform60441は、配列番号6に示すように、1830塩基から成り、そのうち塩基番号122から1612までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は496アミノ酸残基から成る (配列番号19)。配列番号6がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC010591|14714873、Mus musculus, zinc finger proliferation 1, clone MGC:18498 IMAGE:3981599、e−value:6×10−97、491アミノ酸にわたって41%の一致度で、また(ii)データベース登録記号trembl|D10630|MMZFP51_1、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)が、e−value:2×10−96、491アミノ酸にわたって41%の一致度で、さらに(iii)データベース登録記号trembl|AB007886|AB007886_1、Hypothetical zinc finger protein KIAA0426が、e−value:2×10−95、532アミノ酸にわたって44%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号929〜1585に zf−C2H2が8回見出され、この特徴からDNA結合蛋白質であることが推測された。
【0145】
(7)dnaform42515(配列番号7、20)
dnaform42515は、配列番号7に示すように、2311塩基から成り、そのうち塩基番号156から560までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、134アミノ酸残基から成る (配列番号20)。配列番号7がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ301670,STATc transcriptional repressorが、e−value:4×10−28で、また127アミノ酸にわたって53%の一致度で、また(ii)データベース登録記号P58463、forkhead−related transcription factor 2が、e−value:4×10−23で、109アミノ酸にわたって58%の一致度で、さらに(iii)データベース登録記号P18480、Transcription regulatory protein SNF5が、e−value:2×10−24で、118アミノ酸にわたって61%の一致度でヒットした。
また、上記(i)のタンパク質は、データベース中の文献情報(Mol. Cell, 7(4), 779−88(2001))から初期の発生速度と末端分化のタイミングの制御に関ること、および、ecmA遺伝子の発現を制御するリプレッサーとして機能することが、また上記(ii)のタンパク質は、データベース中の文献情報(J. Biol. Chem. 1998, 273 (36):23335−43)から肺および胎盤に発現されている転写因子でいくつかの肺特異的遺伝子のcis因子に結合することが、さらに上記(iii)のタンパク質は、データベース中の文献情報(Mol. Cell. Biol., 1990, 10 (11):5616−25)からグルコースおよびリン酸により制御される遺伝子の転写制御に関わることがそれぞれ明らかとなった。
これらの結果より、配列番号7に記載の塩基配列がコードするタンパク質は転写因子であることが推測された。
【0146】
(8)dnaform41143(配列番号8、21)
dnaform41143は、配列番号8に示すように、2646塩基から成り、そのうち塩基番号149から1591までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、480アミノ酸残基から成る (配列番号21)。配列番号8がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AL034555、zinc finger protein 151 (pHZ−67)が、e−value:1×10−25で、また121アミノ酸にわたって48%の一致度で、また(ii)データベース登録記号Q13105、Myc−interacting zinc finger proteinが、e−value:2×10−25で、121アミノ酸にわたって48%の一致度でヒットした。これらの結果より、配列番号21に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Curr Top Microbiol Immunol 1997;224:137−46)から、Myc−interacting zinc finger proteinであることが明らかとなった。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号9−121に蛋白質二量化に関わる特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)が見出された。また、Zinc finger domain(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)も1ヶ所で見出された。
これらのことから配列番号8に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0147】
(9)dnaform34196(配列番号9、22)
dnaform34196は、配列番号9に示すように、2796塩基から成り、そのうち塩基番号597から1982までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、461アミノ酸残基から成る (配列番号22)。配列番号9がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9P255、Hypothetical zinc finger protein KIAA1473が、e−value:1×10−59で、また295アミノ酸にわたって37%の一致度で、また(ii)データベース登録記号P52742、Zinc finger protein 135が、e−value:2×10−58で、277アミノ酸にわたって39%の一致度でヒットした。これらの結果より、配列番号22に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genomics 1995 May 20;27(2):259−64)から、zinc finger Kruppel familyであることが明らかとなっており、発達障害などに関わることが分かった。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号43〜299にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)が9ヶ所で見出された。
これらのことから、配列番号9に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0148】
(10)dnaform37479(配列番号10、23)
dnaform37479は、配列番号10に示すように、2717塩基から成り、そのうち塩基番号230から907までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、225アミノ酸残基から成る (配列番号23)。配列番号10がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9NQX1、PR−domain zinc finger protein 5が、e−value:3×10−13で、62アミノ酸にわたって50%の一致度で、また(ii)データベース登録記号X82018、zinc finger protein with interaction domainが、e−value:2×10−12で、81アミノ酸にわたって43%の一致度でヒットした。これらの結果より、配列番号23に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、(zinc finger protein with interaction domainであることが分かった。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号12−34と40−63にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)が2ヶ所で見出された。
これらのことから、配列番号10に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0149】
(11)dnaform59635(配列番号11、24)
dnaform59635は、配列番号11に示すように、2709塩基から成り、そのうち塩基番号566から1228までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、220アミノ酸残基から成る (配列番号24)。配列番号11がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9NQX1、PR−domain zinc finger protein 5が、e−value:4×10−13で、62アミノ酸にわたって50%の一致度で、また(ii)データベース登録記号X82018、zinc finger protein with interaction domainが、e−value:3×10−11で、81アミノ酸にわたって41%の一致度でヒットした。これらの結果より、配列番号24に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、(zinc finger protein with interaction domainであることが分かった。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号12−34と40−63にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)を見出した。
これらのことから、配列番号11に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0150】
(12)dnaform33773(配列番号12、25)
dnaform33773は、配列番号12に示すように、3249塩基から成り、そのうち塩基番号487から2127までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、546アミノ酸残基から成る (配列番号25)。配列番号12がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF097416、Mus musculus zinc finger transcription factor Kaisoが、e−value:2×10−27で、また94アミノ酸にわたって58%の一致度で、また(ii)データベース登録記号AF420316、Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso が、e−value:2×10−29で、136アミノ酸にわたって48%の一致度でヒットした。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号25のアミノ酸番号17−131の領域にBTB(for BR−C, ttk and bab) or POZ(for Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)を見出し、アミノ酸番号337−380の領域にMsx−interacting−zinc finger の特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)を見い出し、アミノ酸番号340−508の領域に4カ所にわたってZinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見いだした。
これらの結果より、配列番号12に示す塩基配列がコードするタンパク質はzinc fingerを持ったKaiso様の転写因子であることが推測された。
【0151】
(13)dnaform51218(配列番号13、26)
dnaform51218は、配列番号13に示すように、2950塩基から成り、そのうち塩基番号167から続くフレームで2950(配列の最後の塩基)まで終止コドン以外のアミノ酸のコドンが続く。167から2950の領域がコードするアミノ酸配列は、927アミノ酸残基から成る (配列番号26)。配列番号13がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AY044336、Xenopus laevis DNA−methylation dependent transcriptional repressor Kaiso−like protein (Kaiso) が、e−value:4×10−32で、また137アミノ酸にわたって48%の一致度で、また(ii)データベース登録記号AF420316、Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso が、e−value:4×10−32で、137アミノ酸にわたって48%の一致度でヒットした。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号26のアミノ酸番号17−131の領域にBTB(BR−C, ttk and bab) or POZ(Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)を見出し、アミノ酸番号337−380の領域にMsx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)を見い出し、アミノ酸番号340−537の領域に5カ所にわたってZinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見いだした。
これらの結果より、配列番号13に示す塩基配列はzinc fingerを持ったKaiso様の転写因子遺伝子配列の一部分であることが推測された。
【0152】
実施例5 DNAマイクロアレーを用いた組織発現解析
組織発現解析は、Miki, R., et al., Proc. Natl. Acad. Sci. USA, 98, 2199−2204 (2001)の記載に従って行った。
(1)DNAマイクロアレーの作成
2種類のマウス全長cDNAの塩基配列(dnaform33383、dnaform34196)および解析対象のマウス全長cDNAと同じクラスタに属する(該cDNAと相同な塩基配列を有する)1種類のマウスcDNAライブラリーFANTOM( HYPERLINK http://fantom.gsc.riken.go.jp/ http://fantom.gsc.riken.go.jp/)由来のcDNAの塩基配列(FANTOM NO:9530049C15)を、M13フォワードおよびリバースプライマーを用いて増幅後、このPCR産物をイソプロパノールにて沈澱させ15μlの3×SSC液に溶解した。これらの3種類のDNA溶液をポリLリジンコートしたガラススライドに、16チップ(SMP3、TeleChem International、Sunnyvale、CA)のDNAアレイヤーを用いてスポットし、DNAマイクロアレーを作成した(方法の詳細はhttp://cmgm.stanford.edu/pbrown/mguide/index.htmlに記載されている)。マウスβアクチンとグリセルアルデヒド‐3‐フォスフェートデヒドロゲナーゼのcDNAをポジティブコントロールとし、シロイヌナズナのcDNAをネガティブコントロールとして用いた。
【0153】
このDNAマイクロアレーの検出感度は、1細胞当たりmRNA1ないし3コピーであった。ターゲット配列との一致度がおよそ80%のクローンのシグナル強度は、完全に配列が一致するクローンの10分の1であった。ターゲット配列との一致度が80%未満のクローンのシグナル強度は、バックグランドレベルであった。
【0154】
(2)プローブの調製
C57BL/6Jマウスの胎児、新生仔、アダルトの22組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、胎盤、心臓、胸腺、小脳、子宮、骨、筋肉、背側腎臓由来脂肪細胞、副精巣由来脂肪細胞、内臓脂肪、10日齢新生児小脳、10日齢新生児皮膚)から抽出したmRNA1μgを定法に従いランダムプライム逆転写反応を行い蛍光色素Cy3(Amersham Pharmacia社)を取りこませた。他方、17.5日齢の胎児全身から抽出したmRNA1μgをランダムプライム逆転写反応を行い、蛍光色素Cy5を取りこませ発現解析のリファレンスとした。CyDye標識cDNAプローブは、CyScribe GFX Purification Kit(Amersham Pharmacia社)を用いて精製し、滅菌水17μlにてカラムから溶出した。これに3μlの10μg/μl oligo(dA),3μlの酵母tRNA 20μg/μl,1μlの20μg/μlマウスCot1 DNA,5.1μlの20XSSC,および0.9μlの10%SDSからなるブロッキング溶液を混和してCyDye標識cDNAプローブを調製した。
【0155】
(3)DNAマイクロアレーのハイブリダイゼイション
発現解析対象組織由来cDNAプローブ(Cy3標識)とリファレンスの17.5日齢胎児由来cDNAプローブ(Cy5標識)を混和した溶液30μlを95℃にて1分間熱処理を行い室温にて冷却した。DNAマイクロアレーに上記プローブ溶液を添加しカバースリップを被せ、Hybricasette(ArrayIt社)中にて65℃一晩ハイブリダイズさせた。次に、DNAマイクロアレーを2XSSC,0.1%SDSを用いて洗浄し、続いて1XSSCにて2分間、0.1XSSCにて2分間リンスした。マイクロアレーはScanArray5000共焦点レーザースキャナーを用いてスキャンし、画像をIMAGENE(BioDiscovery社)で解析した。
【0156】
(4)データ解析
各組織中のmRNA量(Cy3標識)は、リファレンスの17.5日齢の胎児全身mRNA量(Cy5標識)との比(Cy3/Cy5)を対数(log2)で表示した。すなわち、解析対象とする各マウス全長cDNAに対応するmRNA発現量が、リファレンス組織中よりも各組識中の方が多い場合は正の数値で、少ない場合は負の数値で、等しい場合は0で示される。データの正確性を増すために実験は独立に2回行い、再現性の有る結果を採用した。結果を以下の表1に示す。
【0157】
一般的に、DNAアレーを使用した発現解析では、2倍程度の増減は実験誤差とみなされる。このことから、表1に示す結果の数値が1以上の場合にはある組織中のmRNA量が対照である17.5日齢の胎児全身のmRNA量と比較して2倍以上であり、有意に増加していると解釈した。逆に、結果の数値が−1以下の場合は、ある組織中のmRNA量が対照である17.5日齢の胎児全身のmRNA量と比較して2分の1以下であり、有意に減少していると解釈した。また、任意の組織間のmRNA発現量を比較検討する際は、各組織における数値の差が1であればmRNA量は2倍、2であればmRNA量は4倍であり、逆に、組織間の数値の差が−1であればmRNA量は1/2倍、−2であればmRNA量は1/4倍であることを意味する。
【0158】
なお、マイクロアレイにスポットしたDNAと同じクラスタに属し、該DNAと少なくとも200塩基に亘り80%以上の塩基配列の一致度を有する領域を有するマウスcDNAクローンについても、表1に解析対象cDNAとして記載し、マイクロアレイにスポットした該DNAの測定結果の数値を代用して記載した。
【0159】
【表1】
【0160】
dnaform34837は、FANTOM No:9530049C15をプローブとした発現解析により、膵臓でのみ発現が増加していることがわかった。dnaform33383は、それ自身をプローブとした発現解析により、広い組織範囲で発現が低下していることがわかった。dnaform39530は、dnaform33383をプローブとした発現解析により、広い組織範囲で発現が低下していることがわかった。dnaform34916は、それ自身をプローブとした発現解析により、精巣でのみ発現が低下していることがわかった。
【0161】
実施例6 PCR法を用いた組織発現解析
本発明のタンパク質をコードするmRNAの正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0162】
(1)cDNA合成
以下のマウス(森脇和郎、外1名編、Molecular Medicine別冊、Vol. 36「自然発症疾患モデル動物 」、中山書店、1999年)の19組織からトータルRNAを抽出し、オリゴdTをプライマーとして逆転写酵素を用いてcDNA合成を行った。
(a)正常マウスの組織および糖尿病モデルマウスの組織
▲1▼対照マウスC57BL/KsJ − +m/+m Jcl(メス、8週齢)の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲2▼糖尿病モデルマウスC57BL/KsJ − db/db Jcl(メス、8週齢)の膵臓、脂肪細胞、肝臓、眼
(b)老化促進マウスの組織
▲1▼正常老化マウス SAM R1/TA Slc(オス、13週齢)の海馬、前頭葉皮質
▲2▼老化促進マウス SAM P8/Ta Slc(オス、15週齢)の海馬、前頭葉皮質
(c) 癌転移モデルマウスの組織
▲1▼対照マウスBalb/c(メス、5週齢)の正常結腸
▲2▼癌転移モデルマウスBalb/c(メス、6週齢)の結腸癌(マウス腹腔に結腸癌細胞Colon26を移植し、2週間後に結腸癌を摘出)
【0163】
(2)PCR法による定量
下記の6個の、本発明のタンパク質をコードしているmRNAの発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
【0164】
(a)dnaform33773
5’側プライマー:AGGATTGGCGAACTATCCAG(配列番号37)
3’側プライマー:CCACGAGTGAACATTTGCAT(配列番号38)
(b)dnaform38861
5’側プライマー:ACTCAGAGAGCCAGCCAGAA(配列番号39)
3’側プライマー:TGTTGGAACCGTTTCCTGAG(配列番号40)
(c)dnaform41143
5’側プライマー:GCTGCACAAACGGTCTCATA(配列番号41)
3’側プライマー:ACCAAGAGGTGCAACAGAGG(配列番号42)
(d)dnaform42515
5’側プライマー:TGTGCTGTCATCTGAGACTTGA(配列番号43)
3’側プライマー:CCTTGTACACAACCAAGGGTAGA(配列番号44)
(e)dnaform51218
5’側プライマー:AGGATTGGCGAACTATCCAG(配列番号45)
3’側プライマー:CTCCACGAGTGAACATTTGC(配列番号46)
(f)dnaform60441
5’側プライマー:TCAGGAAACGGTTCCAACAT(配列番号47)
3’側プライマー:TCCTTGGAGGATTTCTTCTCTG(配列番号48)
【0165】
定量結果はGlyceraldehyde 3−phosphate dehydrogenase(GAPDH)を内部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)をGAPDHの発現量(コピー数/μl)で除し、定数(1×106)(注:10の6乗)を乗して表示した。
【0166】
結果をまとめると、dnaform33773は全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現した。dnaform38861は全身で強く発現するが、特に膵臓、肺で強力に発現した。dnaform41143は全身で発現するが、膵臓、肺、脂肪で比較的強く発現した。dnaform42515は脳に特異的に発現し、特に前頭様皮質で強力に発現した。dnaform51218は全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現した。dnaform60441は全身で発現するが、特に膵臓、肺で強く発現した。上記クローンのcDNAおよび該cDNAによってコードされるタンパク質は、糖尿病や癌などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0167】
【表2】
【0168】
実施例7 タンパク質−タンパク質相互作用解析
哺乳動物細胞におけるtwo−hybrid法(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001))を用いて、2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列がコードするタンパク質のタンパク質−タンパク質相互作用を網羅的に解析した。
(1)PCR法を用いた迅速なサンプル調製
哺乳動物細胞でのtwo−hybrid実験は、CheckMate mammalian two−hybrid system(Promega社製)を利用した。タンパク質−タンパク質相互解析用のサンプルは、CMVプロモーターの下流にGal4遺伝子のDNA結合領域を挿入したプラスミドベクターpBIND、CMVプロモーターの下流にVP16遺伝子の転写活性化領域を挿入したプラスミドベクターpACT,および5個のGal4結合領域とTATAボックスの下流にレポーターであるルシフェラーゼ遺伝子を挿入したプラスミドベクターpG5lucを鋳型として調製した。Gal4遺伝子と2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列との融合遺伝子、並びにVP16遺伝子とマウスcDNAライブラリーFANTOM(http://fantom.gsc.riken.go.jp/)の各クローンが有する完全長cDNAのタンパク質コード配列との融合遺伝子は、基本的にPromega社のプロトコールに従い共通配列部分を用いた連結と2段階PCR法を組み合わせて作成した(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001) )。マウスcDNAのタンパク質コード配列を、5’側に共通配列をもち3’側に遺伝子特異的な配列をもつフォワードプライマーおよびM13ユニバーサルプライマーとを用いてPCR増幅した後、上記増幅産物とpBINDまたはpACTのPCR増幅産物(3’側に共通配列を付加した)とを混和し、それぞれネスティドプライマーを用いて第2段のPCR増幅を行い、Gal4とマウスタンパク質の融合タンパク質を発現させるベクター(BINDサンプル)またはVP16とマウスタンパク質の融合タンパク質を発現させるベクター(ACTサンプル)を構築した。
【0169】
(2)ハイスループットな哺乳動物細胞でのtwo−hybrid実験
PCR法で調製したBINDおよびACTサンプルは、それ以上の精製を行わずに直接使用した。BINDサンプルおよびACTサンプルのそれぞれ0.25μl、30ngのpG5luc、および9.5μlのOpti−MEM培地(Lifetech社製)を384ウェルプレートに分注した。Opti−MEM培地にて32倍希釈したLF2000トランスフェクション試薬(Lifetech社製)10μlをウェルに加えて混和し20分間インキュベーション後、F12培地にて1,300細胞/μlに懸濁したCHO−K1チャイニーズハムスター細胞液20μlを加えて良く懸濁した。アッセイサンプルをCO2インキュベーター内で20時間培養後、ルシフェラーゼ活性はSteady−Glo Luciferase Assay System(Promega社製)を用いて測定し、相互作用を確認した。
【0170】
この結果、2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列がコードするタンパク質は、以下に示す特定のタンパク質(マウスcDNAライブラリーFANTOMの特定のクローンが有するcDNAのタンパク質コード配列がコードする特定のタンパク質)との相互作用をそれぞれ有していることが明らかとなった。
【0171】
【表3】
【0172】
(3)考察
Dnaform33773にコードされる本発明のタンパク質は、SRP40と分子間相互作用することがわかった。SRP40は、mRNA前駆体のスプライシング反応に関与する蛋白質の一群であるSR蛋白質のひとつであって、phosphatidylinositol 3−kinaseが関与するprotein kinase C beta II mRNAのスプライシング経路に必要な蛋白質である。このSRP40がprotein kinase C beta IIの発現を調節し、この働きによりinsulin依存的な糖代謝が制御されていることが知られている(J.Biol.Chem., 276(25):22648−54, 2001) 。したがって、SRP40の異常は糖尿病の原因となりうる。Dnaform33773にコードされる本発明のタンパク質は、Zincfingerをもち、転写制御活性を有することが予想されており、これらの結果を総合的に解析すると、糖尿病の原因となりうるSRP40と結合するDnaform33773にコードされるタンパク質は、糖尿病の原因となりうる蛋白質であると推測できる。
Dnaform34837にコードされる本発明のタンパク質は、Pregnane X receptor 2(PXR2)と相互作用することがわかった。PXR2は核内ステロイド受容体の1つで、ステロイド化合物を介する情報伝達系に複合的に関与する核内受容体の1つである。肝臓においては細胞質に存在し、リガンドに曝露されることによりRXR(Retinoid X receptor)とヘテロ二量体を形成して核に移行し、特異的遺伝子発現に関与していることで知られている。具体的には、例えば、PXRは医薬品に応答してチトクロームP450(CYP)酵素等の薬物代謝系を誘導することが知られており、生体内での異物(医薬品)センサーとして機能していると推測されている。また、このPXRの異常は、糖尿病、高脂血症、高血圧、虚血性心疾患といったいわゆる生活習慣病の原因となり、様々な内分泌疾患を引き起こすことが知られている。Dnaform34837にコードされる本発明のタンパク質はZinc−finger proteinであり、転写制御活性を有する蛋白質であることが予測されており、核内に存在して特定のDNA配列に結合することによって情報伝達系に関与していることが予想される。以上の結果を総合的に解析すると、Dnaform34837は、PXR2と共存する条件でヘテロ二量体を形成し、転写制御に関与する可能性があるタンパク質であると推測できる。
【0173】
実施例8 ヒトオルソログDNAの取得
(1)dnaform33383のヒトオルソログDNAの予測
dnaform33383の塩基配列(配列番号3)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として16番染色体の6p12.1の24.62Mbから24.66Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan(http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、3520塩基よりなる配列(配列番号49)を得た。この塩基配列は、塩基番号319−3219に2904塩基のオープンリーディングフレーム(配列番号35)を含んでいた。配列番号3のマウス塩基配列は、配列番号35のヒト塩基配列と約2580塩基対の長さに渡って81%の相同性をもつことがわかった。
【0174】
また、配列番号35の塩基配列から配列番号36のヒトアミノ酸配列に翻訳されると予測された。配列番号36のアミノ酸配列とdnaform33383のオープンリーディングフレームから予測されるアミノ酸配列(配列番号16)との間には、864アミノ酸配列に渡って81%の相同性があった。
さらに、配列番号36のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号16のアミノ酸配列が最も相同性が高かった。
【0175】
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号35の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
従って、配列番号35が、配列番号3に対する新規なヒトオルソログDNAであると考えられた。
(2)取得されたヒトオルソログDNAの塩基配列の解析
上記(1)で予測されたヒトオルソログDNAの塩基配列および該塩基配列によりコードされるアミノ酸配列について、さらなる解析を行った。
まず、配列番号36に示されるアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中には、配列番号16に記載のマウスのアミノ酸配列以上に相同性を示す配列はなかった。このことからも、配列番号36に記載のアミノ酸配列を有するタンパク質は、配列番号16に記載のアミノ酸配列配列を有するマウスタンパク質のヒトオルソログタンパク質であることが推測された。
配列番号36に記載のヒトアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号39−134にSCAN domain(PfamにSCANとしてエントリーされるアミノ酸配列)を、アミノ酸番号229−269にKRAB box region(PfamにKRABとしてエントリーされるアミノ酸配列)を、アミノ酸番号775−797、803−825、831−853、859−881、887−909、915−937にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。
SCAN domainは一部のC2H2タイプのZnフィンガータンパク質のN末端に見られる保存されたモチーフで、オリゴマー形成の調節と転写制御の役割をもつことが知られている。またKruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
以上のことから、配列番号36に記載のアミノ酸配列を有するタンパク質は、Kruppel−associated box(KRAB)を持つC2H2タイプのZnフィンガータンパク質で、転写の抑制にかかわる転写因子であることが推測された。
【0176】
(3)dnaform33383のヒトオルソログDNAの取得
上記(1)および(2)において新規なヒトオルソログDNAが予測されたことから、以下のとおり、このcDNAのクローニングをおこなった。
まず、このcDNAを取得する遺伝資源となる組織を選択するために、フォワードプライマー1(配列番号50)とリバースプライマー1(配列番号51)を用いてヒト組織由来cDNA(Clontech社製)を鋳型としたPCRを行ったところ、子宮、前立腺、脳下垂体、脳、胎児脳、海馬、視床で目的とする約150bpのDNAの増幅が確認された。フォワードプライマー1は配列番号35の塩基番号1294−1313に相当し、リバースプライマー1は配列番号35の塩基番号1443−1424に相当する。
【0177】
次に、オープンリーディングフレーム全長を取得するために、これら組織由来のcDNAを鋳型としてフォワードプライマー2(配列番号52)とリバースプライマー2(配列番号53)を用いたPCRを行った。これらのプライマーは、配列番号49のヒト塩基配列においてオープンリーディングフレームの外側に位置する配列を用いて設計されたプライマーであって、フォワードプライマー2は配列番号49の塩基番号253−272に相当し、リバースプライマー2は配列番号49の塩基番号3256−3237に相当する。
【0178】
PCRの結果、子宮、前立腺、脳下垂体、胎児脳、海馬、視床で予測値と一致する2.9kbのDNAが増幅した。これらのうち子宮、前立腺、胎児脳に由来するPCR増幅DNA断片を鋳型に直接シークエンスを行ったところ、3種とも同じ配列を有しており、PCRによるミスはないことがわかった。そこで、子宮由来のPCR増幅DNA断片をpCR4Blunting−TOPOベクター(Invitrogen社製)にライゲーションして、得られた独立のコロニー3個から由来するプラスミドのシークエンスをおこなったところ、3つとも配列番号49の塩基番号253−3256(配列番号35に記載された、ヒトのオープンリーディングフレーム全長に相当する塩基配列を含む)と全く同じ配列が挿入されていた。
以上のことから、予想されたヒト転写物(タンパク質)が実際に発現していることが示され、そのcDNAを取得することができたことがわかった。かくして取得されたヒトホモログDNAを、ZG1001と名付けた。
【0179】
このヒト塩基配列に由来するアミノ酸配列(配列番号36)とマウス塩基配列に由来するアミノ酸配列(配列番号16)とを比較すると、ヒトアミノ酸配列上のアミノ酸番号64−913と、マウスアミノ酸配列上のアミノ酸番号7−856の部分で一致度が高く、N末端はヒトアミノ酸配列の方が59アミノ酸長く、C末端は36アミノ酸長かった。
さらに、ヒト塩基配列(配列番号35)とマウス塩基配列(配列番号3)をそれぞれヒトゲノム、マウスゲノムにマッピングすると、両者とも7つのエクソンにコードされていた。それぞれのN末端、C末端をコードする部分は、一致度が高い部分から一致度が低い部分にかけてひとつのエクソンであった。すなわち、これらの配列のN末端及びC末端の違いは、エクソンの使い分けではなく種による違いであることがわかった。
【0180】
実施例9 標的転写調節領域に対する結合能の解析
(1)無細胞蛋白質合成系を用いた本発明の蛋白質の調製
本発明のタンパク質をコードするDNAを含むプラスミドに対して、Proc.Natl.Acad.Sci.USA,99,14652−14657 (2002)に記載されている方法に準じてPCR反応を行い、転写用のDNA断片を調製した。このDNAを鋳型としてSP6 RNA Polymerase(Promega社製)を用いて転写反応を行ない、mRNAを合成し、エタノール沈殿操作により得られたmRNAを精製した。このmRNAを用いたタンパク合成は、特開2002−204689号公報、およびProc.Natl.Acad.Sci.USA,99:14652−14657(2002)に準じた重層法による無細胞蛋白質合成系を用いて行った。重層法無細胞蛋白質合成系にて使用する翻訳溶液(25μl)には、Proc.Natl.Acad.Sci.USA,97:559−564(2000)に従って調製された6μlの小麦胚芽抽出液および上述したmRNA(0.02nmol)を添加して用い、その組成は24 mM Hepes/KOH(pH 7.8), 1.2 mM ATP, 0.25 mM GTP, 16 mM creatine phosphate, 10 μg creatine kinase, ribonuclease inhibitor(20units), 2 mM DTT, 0.4 mM spermidine, 0.3 mM L型アミノ酸(20種), 2.7 mM magnesium acetate, 100 mM potassium acetate, 5 μg 小麦胚芽由来tRNA, 0.05% Nonidet P−40および0.005% NaN3から成る。また翻訳用緩衝液は31.3mM HEPES/KOH(pH7.8) , 2.67mM Mg(OAc)2 , 93mM KOAc , 1.2mM ATP, 0.257mM GTP , 16mM creatine phosphate, 2.1mM DTT, 0.41mM spermidine, 0.3mML型アミノ酸(20種), 1μM E−64 , 0.005% NaN3 , 0.05% NP−40から成る。重層法による無細胞蛋白質合成は、まず96穴プレートに翻訳用緩衝液を125μlずつ加えて、この翻訳用緩衝液が入ったそれぞれの穴に底からゆっくりと翻訳溶液を重層し、このプレートを26℃インキュベーターで保温して16時間反応させることにより行った。
【0181】
(2)標的配列を固定化したセンサーチップを用いたSPR測定方法
BIAapplications handbook, chapter4.4の記載に従い、センサーチップ表面にビオチン化した以下の53種類の二重鎖DNAを別々に固定化した。センサーチップはSAタイプ(ビアコア社製)を用い、SPR測定および解析は、BIACORE3000(ビアコア社製)を用いた。
【0182】
公知の転写因子と、設計した標的転写調節領域のDNAまたはDNA断片の塩基配列(以下、これを「標的配列」と称することがある)、または、複数の転写因子が共通して認識する標的転写調節領域のDNAまたはDNA断片の塩基配列(以下、これを「コンセンサス標的配列」と称することがある)の関係は、次の通りである。
[1]v−jun, c−jun, junB, junD, dJRA, c−fos, fosB1, fosB2, Fra−1, LRF−1, v−maf, mafG, NF−E2 p45, aNF−E2, fNF−E2, Nrf short form, GCN4, yAP−1, CREB−2, ATF−3, CRE−BP1, CRE−BP3, ATF−a, CREB−341, CREB−327, CREM, dCREB2, dCREB2−b, dCREB2−c, dCREB2−d, dCREB2−q, dCREB2−r, dCREB2−sのコンセンサス標的配列:TGATGACGT(配列番号54)
[2]C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP−10のコンセンサス標的配列:AAGTGGCGAAAGAGACA(配列番号55)
[3]VBP, Hlf, CPRF−2, EmBP−1b, EmBP−1b, GBF1, GBF2, GBF3, CPRF−1, TAF−1, HBP−1a, GBF9, GBF1, GBF12, CPRF−3, TGA1a, TGA1b, O2, STE4のコンセンサス標的配列:AGAAGCACGTGG(配列番号56)
[4]OPI1, E2A, E47, ITF−2/SEF2−1B, SEF−1A, MyoD, p42Tal−1のコンセンサス標的配列:AACAGATGGT(配列番号57)
[5]HEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号58)
[6]AhR, Arnt のコンセンサス標的配列:GGGGATTGCGTG(配列番号59)
[7]USFの標的配列:GTCACGTGGT(配列番号60)
[8]NF−1A1, NF−1A1.1, NF−1A6, NF−1B1, NF−1B1, NF−1B2, NF−1C2/CTF−2, CTF−4, CTF−6のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号61)
[9]RF−X1の標的配列:GGTAACATAGCAAC(配列番号62)
[10]AP2alphaA/AP−2alpha1, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gammaのコンセンサス標的配列:CGCCCCCCGGCG(配列番号63)
[11]GRの標的配列:GGTACAAAATGTTCT(配列番号64)
[12]ARの標的配列:AACATTATGTTCT(配列番号65)
[13]ERの標的配列:AAGGGAAAATGACCCCC(配列番号66)
[14]RXR−alphaの標的配列:GGTCATAGGGGT(配列番号67)
[15]PPARalphaの標的配列:CTAGGGCAAAGGTCA(配列番号68)
[16]PPARgammaの標的配列:GGTCAAAGGTCA(配列番号69)
[17]COUP−TF1,HNF−4alpha1, HNF−4alpha2の標的配列:TGAACTTTGA(配列番号70)
[18]CF1の標的配列:GGGGTCACC(配列番号71)
[19]GATA−1, GATA−2, GATA−3, GATA−4のコンセンサス標的配列:CCAGATAAGG(配列番号72)
[20]AREA/NIT−2の標的配列:TATCTC(配列番号73)
[21]Sp1の標的配列:GGGGGGGGGG(配列番号74)
[22]YY1の標的配列:CGGCCATCTTGGCT(配列番号75)
[23]Egr−1, Egr−2, Egr−3のコンセンサス標的配列:TGCGTGGGCG(配列番号76)
[24]Snailの標的配列:CACCTGTTTTCA(配列番号77)
[25]CF2−IIの標的配列:GTATATATA(配列番号78)
[26]Evi−1の標的配列:AGATAAGATAA(配列番号79)
[27]Ikaros, MZF−1のコンセンサス標的配列:TTGGGAGG(配列番号80)
[28]Tramtrack69Kの標的配列:GGACCTGC(配列番号81)
[29]HOX9の標的配列:TGACAGTTTAACGA(配列番号82)
[30]CDPの標的配列:CCAATAATCGAT(配列番号83)
[31]HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号84)
[32]Nkx−2.2, Nkx−2.5, TTF−1のコンセンサス標的配列:TTAAGTGGTT(配列番号85)
[33]Oct−1A, Oct−1B, Oct−1C のコンセンサス標的配列:ATGCAAAT(配列番号86)
[34]Oct−2, Oct−2.1/Oct−2Bのコンセンサス標的配列:TATTTGCAT(配列番号87)
[35]Pax−3, Pax−6のコンセンサス標的配列:CGTCACGCTTGA(配列番号88)
[36]Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号89)
[37]HSF1(short), HSF2, dHSF, fungalHSFのコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号90)
[38]c−Myb, A−Myb, v−Myb, P(long), P(short), C1(long), C1(short)のコンセンサス標的配列:AACGGGCCC(配列番号91)
[39]c−Ets−1#p54, Ets−1#deltaiV/VII, Ets−2, Elk−1, SAP−1, SAP−1b, Erg−1, p55erg, Fli−1b, E4TF1−60/GABP−alpha, E74Aのコンセンサス標的配列:GACAGGAAGTG(配列番号92)
[40]IRF−1, IRF−2の標的配列:GAAAAGCGAAACC(配列番号93)
[41]p50の標的配列:GGGGACTTTCC(配列番号94)
[42]NF−ATc, NF−Atpのコンセンサス標的配列:AGGAAAA(配列番号95)
[43]p91, p84のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号96)
[44]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号97)
[45]p53の標的配列:GGACATGCCCGGGCATGTC(配列番号98)
[46]MEF−2Aの標的配列:CTCTAAAAATA(配列番号99)
[47]SRFの標的配列:CCATATATGGACAT(配列番号100)
[48]E2の標的配列:AACCAAAAACGGTAA(配列番号101)
[49]TBPの標的配列:TATAAAA(配列番号102)
[50]SRY, Sox−5, Sox−9の標的配列:AAAAAACAATAGGG(配列番号103)
[51]mat−Mcの標的配列:TCATTGTT(配列番号104)
[52]CP1A, CP1B, CBF−Cのコンセンサス標的配列:CTGATTGGCTACC(配列番号105)
[53]AML1aの標的配列:TGTGGT(配列番号106)
【0183】
まず、上記53種類の標的配列(配列番号54〜配列番号106)を有するDNAに関し、それぞれの5’側にビオチンが付加したDNAとその相補な塩基配列を有するDNAを定法により個別にアニーリングさせ、合計53種類の二本鎖化したDNAを調製した。一方、解析に用いるセンサーチップは、1枚に付きフローセルが4分割されている。フローセル1は何も固定化せずコントロール区として用い、フローセル2、3および4はそれぞれ上記で調製した二本鎖DNAを3種類ずつ固定化した。センサーチップのDNAの固定化密度を一定にするため、DNA固定化によるSPR応答値の上昇(ΔRU−DNA)をDNA分子量(MW)で割った値(D)が各フローセルで一定になるようにΔRU−DNAを調節した。同様の要領で、残りのDNAについても固定化を行った。
【0184】
以上のようにセンサーチップの作製ができた後、クローンのcDNAがコードする本発明のタンパク質との結合活性解析を行った。SPR法によるDNAとタンパク質間の結合活性解析は既に多数報告がある。本実施例では、Molecular Microbiology, 36(3), 557−569(2000)の測定条件を参考にして行った。まず、フローセル1−2−3−4が直列につながった流路に設定しておく。そこにランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させた後、各フローセルのベースライン値(SPR−baseline)を測定する。次に、蛋白質溶液を同流量で流し、蛋白質分子とDNA鎖との間で特異的結合を形成させる。一定時間注入後、各フローセルのSPR応答値(SPR−bound)を測定した。
【0185】
(4)SPR法により得られた測定結果の解析方法
SPR応答値からベースライン値を差し引き([SPR−bound]−[SPR−baseline])することにより、真の結合量(B)を求め、さらに、標準化した値(nB)を求めた。
測定結果より、dnaform33383,33733,34196,34837,37479,38861,39530,41143,42515,51218,59635,60441,63166の13クローンのcDNAによってコードされる本発明のタンパク質は、前記[1]〜[53]の計53種類の標的配列(配列番号54〜配列番号106)を有するDNAの少なくとも一つに対して結合活性を有していることがわかった。
【0186】
実施例10 ヒト組織発現解析
上記実施例8において、dnaform33383についてはヒトオルソログ(ZG1001)が取得された。そこで、本発明のヒトタンパク質をコードするmRNAの正常ヒトおよび疾患患者での組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0187】
(1)cDNA合成
以下のヒトの9組織のmRNAはClontech社から購入し、オリゴdTをプライマーとした逆転写反応を行いcDNAを合成した。
正常脳、正常海馬、正常視床、正常腎臓、正常肝臓、正常膵臓、正常骨格筋、正常脂肪、正常脾臓
以下のヒトの8組織のcDNAはClontech社から購入した。
正常乳房、乳癌、正常結腸、結腸癌、正常肺、肺癌、正常胃、胃癌
以下のヒトの2組織のcDNAはBiochain社から購入した。
正常前頭葉、アルツハイマー病前頭葉
以下のヒトの1組織の全RNAはユニーテック社から購入し、mRNAを抽出後、cDNA合成を行った。
正常末梢血白血球
【0188】
(2)PCR法による定量
本発明のヒトタンパク質をコードしているmRNA(dnaform33383のヒトオルソログ ZG1001のmRNA)の発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社製)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
5’側プライマー:GCTCCGTCCACTGATAAACC(配列番号107)
3’側プライマー:GCGGATAAATTCGATGCCTA(配列番号108)
定量結果は、Glyceraldehyde 3−phosphate dehydrogenase(GAPDH)を内部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)をGAPDHの発現量(コピー数/μl)で除し、定数(1×105)(注:10の5乗)を乗して表示した。その結果を表4に示す。
【0189】
【表4】
【0190】
表4から明らかな通り、ZG1001のmRNAは膵臓、脾臓、および脳で発現し、乳癌で発現が増加した。
この結果より、上記cDNAおよび該cDNAによってコードされるタンパク質は、癌やアルツハイマー病などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0191】
実施例11 各完全長cDNAがコードするタンパク質の総合解析
(1)dnaform34837(配列番号1、14)
dnaform34837のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、膵臓および副精巣由来脂肪細胞で強く発現することが分かった。さらに、タンパク質−タンパク質相互作用解析では、該cDNAにコードされるタンパク質が核内ステロイド受容体の一つであるPXR2と相互作用することが確認された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核に存在し、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0192】
(2)dnaform63166(配列番号2、15)
dnaform63166のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、延髄および乳腺で強く発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核に存在し、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0193】
(3)dnaform33383(配列番号3、16)
dnaform33383のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。前記実施例4に記載したPFAM検索の結果によると、本タンパク質はC末端に6個のC2H2 type Zinc Finger構造をもち、N末端側に蛋白相互作用にかかわるSCAN domain, KRAB domainをもつ蛋白質である。また、PreLocによる蛋白質細胞内局在予測によると、核局在が強く示唆される。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想される多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。従って、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0194】
(4)dnaform39530(配列番号4、17)
dnaform39530のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることを示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0195】
(5)dnaform38861(配列番号5、18)
dnaform38861のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現し、特に膵臓、肺で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0196】
(6)dnaform60441(配列番号6、19)
dnaform60441のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現し、特に膵臓、肺で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0197】
(7)dnaform42515(配列番号7、20)
dnaform42515のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、脳に特異的に発現し、特に前頭様皮質で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌や神経疾患などの治療や診断に応用できる。
【0198】
(8)dnaform41143(配列番号8、21)
dnaform41143のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で発現するが、膵臓、肺、脂肪で比較的強く発現した。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0199】
(9)dnaform34196(配列番号9、22)
dnaform34196のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0200】
(10)dnaform37479(配列番号10、23)
dnaform37479のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0201】
(11)dnaform59635(配列番号11、24)
dnaform59635のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0202】
(12)dnaform33773(配列番号12、25)
dnaform33773のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現することが分かった。さらに、タンパク質−タンパク質相互作用解析では、該cDNAにコードされるタンパク質が糖尿病の原因となりうるSRP40と相互作用することも確認された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌および神経疾患などの治療や診断に応用できる。
【0203】
(13)dnaform51218(配列番号13、26)
dnaform51218のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌および神経疾患などの治療や診断に応用できる。
【0204】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAはDNA結合活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
本出願は、2002年4月19日付けの日本特許出願(特願2002−117840)、2002年4月30日付けの日本特許出願(特願2002−128418)、および2002年12月4日付けの日本特許出願(特願2002−352469)に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【0205】
【配列表】
【発明の属する技術分野】
本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、及び該タンパク質に特異的に結合する抗体等に関する。
【0002】
【従来の技術】
cDNAの取得及びその塩基配列解析は、生体内に発現するタンパク質の生理活性を解析し、その活性に基づくタンパク質の利用方法を開発するうえで不可欠である。さらに、全遺伝子種に対応する完全長cDNAをカタログ化したライブラリーの作製は、ヒトゲノムプロジェクトの重要な課題の一つである。カタログ化したライブラリーとは、ライブラリーに含まれるcDNAに重複がないという意味であり、各cDNAが1種類ずつ含まれているライブラリーのことである。
【0003】
完全長cDNAクローニング法については、特開平9−248187号公報及び特開平10−127291号公報に記載されている。この方法は、mRNAの5’キャップサイトに存在するジオール構造にタグになる分子を結合させる工程、前記タグ分子を結合させたmRNAを鋳型とし、oligo dTをプライマーとして逆転写によりRNA−DNA複合体を作製し、この複合体の内、mRNAの完全長に対応するDNAを有するものをタグ分子の機能を利用して分離する工程を含むことを特徴とする方法である。
【0004】
また効率のよい逆転写法として、鋳型が高次構造を形成しないような高温で行うための方法も開発されている(特開平10−84961号公報)。さらに、合成された完全長cDNAライブラリーに含まれるDNA断片についてその鎖長に関わらず一律にクローニングすることができるクローニングベクターも開発されている(特開平11−9273号公報)。
【0005】
このような技術により作製された完全長cDNAライブラリーは、ライブラリーの個々の要素として全て均等に異なるものが含まれている訳ではなく、存在割合の高いクローンや逆に極微量にしか存在しないクローンもある。この極微量にしか存在しないクローンは新規である可能性が高いため、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法も開発されている(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))。
【0006】
かくして得られるカタログ化された完全長cDNAライブラリーの各クローンについて、公知の方法により塩基配列の解析を行えばその塩基配列は同定されるが、該cDNAがコードするタンパク質の生理活性は依然不明のままである。
【0007】
【発明が解決しようとする課題】
本発明は、カタログ化された完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうち配列が新規なものについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
【0008】
【課題を解決するための手段】
本発明者らは、マウス完全長cDNAライブラリー中のcDNAクローンが有する塩基配列を解析し、該配列の相同性に基づきデータベースを検索したところ、該配列にDNA結合活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質がDNA結合活性を有すると同定した。さらに、これらのcDNAの各組織における発現量や、該cDNAがコードするタンパク質を実際に取得してその相互作用を解析した。また、これらのcDNAがコードするタンパク質のDNA結合活性または転写制御活性を解析した。さらには、該cDNAの塩基配列をもとにヒトホモログDNAを取得し、得られたヒトホモログDNAの各組織における発現量を解析した。本発明は、これらの知見に基づいて成し遂げられたものである。
【0009】
すなわち本発明によれば、以下の(1)〜(15)に記載の発明が提供される。
(1) 以下の (a) または (b) のタンパク質。
(a)配列番号14〜26または36のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号14〜26または36のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質。
【0010】
(2) 上記(1)に記載のタンパク質をコードするDNA。
(3) 上記(1)に記載のタンパク質をコードする完全長cDNA。
(4) 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜13または35のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜13または35のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。
(c)配列番号1〜13または35のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。
【0011】
(5) 上記(2)〜(4)のいずれかに記載のDNAを含む組換えベクター。
(6) 上記(2)〜(4)のいずれかに記載のDNAまたは上記(5)に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
(7) 上記(6)に記載の細胞により産生される、上記(1)に記載のタンパク質。
【0012】
(8) 上記(2)から(4)の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
【0013】
(9) 上記(1)または(7)に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
(10) 抗体がモノクローナル抗体である上記(9)に記載の抗体。
(11) モノクローナル抗体が上記(1)または(7)に記載のタンパク質のDNA結合活性を中和する作用を有することを特徴とする上記(10)に記載の抗体。
【0014】
(12) 上記(1)または(7)に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
(13) 上記(6)に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
(14) 上記(1)に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ配列情報、および/または上記(2)〜(4)のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
(15) 上記(1)に記載のタンパク質、および/または上記(2)〜(4)のいずれかに記載のDNAを結合させた担体。
【0015】
【発明の実施の形態】
以下、本発明をさらに詳細に説明する。
(1)完全長cDNAの取得及び塩基配列の解析
本発明のDNAは、配列番号14〜26または36に記載のアミノ酸配列からなるタンパク質、または該アミノ酸配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば20個以下、好ましくは15個以下、より好ましくは10個以下、さらに好ましくは5個以下を意味する)のアミノ酸残基の置換、欠失、挿入、付加、若しくは逆位を含むアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードし得るものであれば如何なるものであってもよい。具体的には、該アミノ酸配列をコードする翻訳領域のみでも、あるいはそのcDNAの全長を含むものでもよい。
【0016】
具体的には、cDNAの全長を含むDNAとしては、例えば配列番号1〜13または35に記載の塩基配列からなるDNA等が挙げられる。また、その翻訳領域としては、配列番号1の塩基番号134〜1690、配列番号2の塩基番号1751〜2197、配列番号3の塩基番号662〜3259、配列番号4の塩基番号661〜1476、配列番号5の塩基番号213〜1703、配列番号6の塩基番号122〜1612、配列番号7の塩基番号156〜560、配列番号8の塩基番号149〜1591、配列番号9の塩基番号597〜1982、配列番号10の塩基番号230〜907、配列番号11の塩基番号566〜1228、配列番号12の塩基番号487〜2127、配列番号13の塩基番号167〜2950、配列番号35の塩基番号1〜2904に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’及び/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
【0017】
本発明のDNAは、これを取得できる方法であれば如何なる方法により取得したものでもよいが、具体的には、例えば、下述の方法により取得することができる。まず、適当な動物、好ましくは哺乳動物の組織等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてcDNAを合成するが、このとき完全長のcDNAを合成するために5’キャップ(7MeGpppN)サイトに特異的なジオール構造にタグになる分子を化学結合させ、このmRNAを鋳型としてoligo dTをプライマーとして逆転写した後に、タグ分子の機能を利用して完全長のcDNAのみを分離する方法(特開平9−248187号公報;特開平10−127291号公報)を用いることが好ましい。また、逆転写の際には、鋳型が高次構造を形成して逆転写の効率が低下することを阻止するために、トレハロース等の存在下で、耐熱性逆転写酵素を用いて高温下で逆転写を行う方法(特開平10−84961号公報)を用いるのが好ましい。ここで、高温下とは40〜80℃を意味する。
【0018】
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、様々な鎖長のDNAを一律にクローニングすることが可能な、クローニングサイトの両末端にリコンビナーゼ認識配列を有し、感染以外の方法で宿主に挿入される直鎖状のベクター(特開平11−9273号公報)が好ましく用いられる。かくして得られるcDNAライブラリーは、全てのクローンが均一に存在している(以下、これを「カタログ化されている」と称することがある)訳ではなく、このライブラリー中に極微量にしか存在しないクローンこそ新規である確率が高い。そこで、このようなクローンを濃縮するためのサブトラクション法やノーマライゼーション法(特開2000−325080号公報;Carninci, P. et al.,Genomics, 37, 327−336(1996))を用いることが好ましい。
【0019】
カタログ化されたcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、cDNA全長の場合にはその末端100ベースの配列について得られた塩基配列をNCBIのGenBank、EMBL、DDBJ、PDB等のデータベースについてBLAST(http://www.ncbi.nlm.nih.gov/BLAST/;National Center of Biotechnology Information)を用いて検索し、最も高い相同性を示す配列でも相同性が30%以下であり、かつ該DNAの翻訳領域の全長について最も高い相同性を示す配列でもその相同性が40%以下であるものを新規として以下の解析に供することとした。
【0020】
このような完全長cDNAの塩基配列を有するDNAとしては、例えば、配列番号1〜13または35に記載の塩基配列を有するものが挙げられる。また、その翻訳領域としては、配列番号1の塩基番号134〜1690、配列番号2の塩基番号1751〜2197、配列番号3の塩基番号662〜3259、配列番号4の塩基番号661〜1476、配列番号5の塩基番号213〜1703、配列番号6の塩基番号122〜1612、配列番号7の塩基番号156〜560、配列番号8の塩基番号149〜1591、配列番号9の塩基番号597〜1982、配列番号10の塩基番号230〜907、配列番号11の塩基番号566〜1228、配列番号12の塩基番号487〜2127、配列番号13の塩基番号167〜2950、配列番号35の塩基番号1〜2904に示される配列に示される配列を有するものが挙げられる。
【0021】
かくして取得された新規な塩基配列を、BLAST(Basic local alignment search tool;Altschul, S.F., et al.,J. Mol. Biol., 215, 403−410(1990)) による相同性検索 (homology search)や、HMMER(隠れMarkovモデルによる配列解析手法; Eddy, S. R., Bioinformatics 14, 755−763 (1998)) の機能群のひとつである HMMPFAMによるタンパク質特徴検索 (profile search:http://pfam.wustl.edu)等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。
【0022】
BLASTによる相同性検索においては、検索の結果得られた相同性が十分有意なヒット配列に付随する種々のアノテーション情報から、解析対象としているクローンの機能を推定することができる。ここで、十分有意なヒット配列とは、登録されている配列の触媒ドメイン部分と本発明のDNAのこれに対応する部分とのidentityがe−valueとして10−4以下のものか、あるいは30%以上のものを示す。
【0023】
例えば、上位にヒットした触媒ドメイン配列の多くがDNA結合タンパク質としての機能を確認されたものであるならば、それと配列上類似である解析対象クローンもまた同じ機能、即ち、DNA結合活性を持つであろうという予測が成り立つ。
【0024】
HMMPFAMでは、Pfamというタンパク質プロファイルを集積したデータベース中にあるエントリーが有する塩基配列の特徴を、解析対象である塩基配列が有するかどうかを洗い出す方法による解析が行われる。プロファイルは一連の同一特徴を持つタンパク質群から抽出されており、一配列対一配列の全長に亘る比較では明確化できない機能でも、配列中にその特徴領域があればこれを見出し、機能予測ができる。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
【0025】
配列番号1に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、RIKEN full−length enriched library, clone:9530049C15, SCAN domain containing protein と、e−value:5×10−171、100%の相同性を、またZinc finger protein 192 (LD5−1)は、SCAN box domainをもつKruppel gene familyであるが、e−value:2×10−94、42%の相同性を、さらにHomo sapiens zinc finger protein (ZFP)と、e−value:4×10−93、41%の相同性を有する。これらの結果より、配列番号1に記載の塩基配列がコードするタンパク質はZinc finger proteinであることが推測できる。
また、配列番号1に示す塩基配列がコードするアミノ酸配列には、HMMPFAMによる蛋白質特徴検索により、ZF−C2H2の特徴を示す配列(PfamにLIMとしてエントリーされる塩基配列)が7回見出される。
これらのことから、配列番号1に示す塩基配列がコードするタンパク質はzinc finger型の転写因子であることが推測できる。
【0026】
配列番号2に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、RIKEN cDNA 2810411K16と、e−value:2×10−76、139アミノ酸にわたって100%の相同性を、RIKEN full−length enriched library, clone:2810411K16:SCAN domain containing proteinと、e−value:6×10−76、139アミノ酸にわたって99%の相同性を、Homo sapiens cDNA FLJ14478 fis, clone MAMMA1001633と、e−value:1×10−61、140アミノ酸にわたって86%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号1880〜2167にSCAN配列が見出され、これらのことから、配列番号2に示す塩基配列がコードするタンパク質はDNA結合蛋白質であることが推測できる。
【0027】
配列番号3に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Homo sapiens, clone MGC:13310 IMAGE:4110431と、e−value:5×10−145、919アミノ酸にわたって40%の相同性を、また、Zinc finger protein 180 (HHZ168)と、e−value:2×10−63、231アミノ酸にわたって51%の相同性を、さらに、Rattus norvegicus Cys2/His2 zinc finger protein (rKr1)と、e−value:6×10−63、192アミノ酸にわたって56%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号786〜3275にzf−C2H2が6箇所見出され、この特徴から、配列番号3に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0028】
配列番号4に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Macaca fascicularis brain cDNA, clone:QccE−18103.と、e−value:2×10−95、220アミノ酸にわたって79%の相同性を、またHomo sapiens putative transcription factor CR53と、e−value:1×10−32、56%の相同性を、さらに、Homo sapiens, Similar to zinc finger protein 202, clone MGC:15660 IMAGE:3347511と、e−value:1×10−32、134アミノ酸にわたって56%の相同性を有する。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行うと、SCAN配列(PfamにSCANとしてエントリーされる塩基配列)が見出される。
これらのことから、配列番号4に示す塩基配列がコードするタンパク質は転写因子であることが推測できる。
【0029】
配列番号5に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus, zinc finger proliferation 1と、e−value:6×10−97、491アミノ酸にわたって41%の相同性を、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)と、e−value:2×10−96、491アミノ酸にわたって41%の相同性を、さらに、Hypothetical zinc finger protein KIAA0426と、e−value:2×10−95、532アミノ酸にわたって44%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号929〜1585にzf−C2H2が8回見出され、これらの特徴から、配列番号5に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0030】
配列番号6に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus, zinc finger proliferation 1, clone MGC:18498 IMAGE:3981599と、e−value:6×10−97、491アミノ酸にわたって41%の相同性を、また、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)と、e−value:2×10−96、491アミノ酸にわたって41%の相同性を、さらに、Hypothetical zinc finger protein KIAA0426と、e−value:2×10−95、532アミノ酸にわたって44%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により塩基番号929〜1585にzf−C2H2が8回見出され、この特徴から、配列番号6に記載の塩基配列がコードするタンパク質がDNA結合蛋白質であることが推測できる。
【0031】
配列番号7に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、STATc transcriptional repressorと、e−value:4×10−28で、127アミノ酸にわたって53%の相同性を、また、forkhead−related transcription factor 2と、e−value:4×10−23で、109アミノ酸にわたって58%の相同性を、さらに、Transcription regulatory protein SNF5と、e−value:2×10−24で、118アミノ酸にわたって61%のの相同性を有する。
また、STATc transcriptional repressorは、データベース中の文献情報(Mol. Cell, 7(4), 779−88(2001))から初期の発生速度と末端分化のタイミングの制御に関ること、および、ecmA遺伝子の発現を制御するリプレッサーとして機能することが、またforkhead−related transcription factor 2は、データベース中の文献情報(J. Biol. Chem. 1998, 273 (36):23335−43)から肺および胎盤に発現されている転写因子でいくつかの肺特異的遺伝子のcis因子に結合することが、さらにTranscription regulatory protein SNF5は、データベース中の文献情報(Mol. Cell. Biol., 1990, 10 (11):5616−25)からグルコースおよびリン酸により制御される遺伝子の転写制御に関わることがそれぞれわかる。
これらの特徴より、配列番号7に記載の塩基配列がコードするタンパク質は転写因子であることが推測できる。
【0032】
配列番号8に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、zinc finger protein 151 (pHZ−67)と、e−value:1×10−25で、121アミノ酸にわたって48%の相同性を、また、Myc−interacting zinc finger proteinと、e−value:2×10−25で、121アミノ酸にわたって48%の相同性を有する。これらの結果より、配列番号8に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記Myc−interacting zinc finger proteinタンパク質は、データベース中の文献情報(Curr Top Microbiol Immunol 1997;224:137−46)から、Myc−interacting zinc finger proteinであることがわかる。
また、HMMPFAMによる蛋白質特徴検索により、配列番号8に記載の塩基配列がコードするアミノ酸配列に蛋白質二量化に関わる特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)が見出される。また、Zinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)も1ヶ所見出される。
これらの特徴から、配列番号8に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0033】
配列番号9に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Hypothetical zinc finger protein KIAA1473と、e−value:1×10−59で、295アミノ酸にわたって37%の相同性を、また、Zinc finger protein 135と、e−value:2×10−58で、277アミノ酸にわたって39%の相同性を有している。これらの結果より、配列番号9に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記Zinc finger protein 135タンパク質は、データベース中の文献情報(Genomics 1995 May 20;27(2):259−64)から、zinc finger Kruppel familyであることが明らかとなっており、発達障害などに関わることが分かる。
また、HMMPFAMによる蛋白質特徴検索により配列番号9に記載の塩基配列がコードするアミノ酸配列にZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が9ヶ所で見出される。
これらの特徴から、配列番号9に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0034】
配列番号10に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチの結果、PR−domain zinc finger protein 5と、e−value:3×10−13で、62アミノ酸にわたって50%の相同性を、また、zinc finger protein with interaction domainと、e−value:2×10−12で、81アミノ酸にわたって43%の相同性を有している。これらの結果より、配列番号10に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、上記zinc finger protein with interaction domainタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、zinc finger protein with interaction domainであることが分かる。
また、HMMPFAMによる蛋白質特徴検索により、配列番号10に記載の塩基配列がコードするアミノ酸配列にZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が2ヶ所見出される。
これらの特徴から、配列番号10に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0035】
配列番号11に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、PR−domain zinc finger protein 5と、e−value:4×10−13で、62アミノ酸にわたって50%の相同性を、また、zinc finger protein with interaction domainと、e−value:3×10−11で、81アミノ酸にわたって41%の相同性を有している。これらの結果より、配列番号11に記載の塩基配列がコードするアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
また、HMMPFAMによる蛋白質特徴検索を行ったところ配列番号11に記載の塩基配列がコードするアミノ酸配列にはZinc finger domain (Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が2ヶ所見出される。
これらの特徴から、配列番号11に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測できる。
【0036】
配列番号12に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Mus musculus zinc finger transcription factor Kaisoと、e−value:2×10−27で、94アミノ酸にわたって58%の相同性を、また、Xenopus laevis BTB/POZ zinc finger transcription factor XKaisoが、e−value:2×10−29で、136アミノ酸にわたって48%の相同性を有している。
また、HMMPFAMによる蛋白質特徴検索により、配列番号12に記載の塩基配列がコードするアミノ酸配列にBTB (for BR−C, ttk and bab) or POZ(for Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)、Msx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)、Zinc finger, C2H2 type の特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が見出される。
これらの特徴より、配列番号12に示す塩基配列がコードするタンパク質はzinc fingerを持ったKaiso様の転写因子であることが推測できる。
【0037】
配列番号13に記載の塩基配列がコードするアミノ酸配列は、BLASTサーチにより、Xenopus laevis DNA−methylation dependent transcriptional repressor Kaiso−like protein(Kaiso)と、e−value:4×10−32で、137アミノ酸にわたって48%の相同性を、また、Xenopus laevis BTB/POZ zinc finger transcription factor XKaisoと、e−value:4×10−32で、137アミノ酸にわたって48%の相同性を有する。
また、HMMPFAMによる蛋白質特徴検索により、配列番号13に記載の塩基配列がコードするアミノ酸配列にBTB (BR−C, ttk and bab) or POZ(Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)、Msx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)、Zinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)が見出される。
これらの特徴より、配列番号13に示す塩基配列はzinc fingerを持ったKaiso様の転写因子遺伝子配列の一部分であることが推測できる。
【0038】
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜13または35に記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1若しくは数個(ここで言う数個の数は特には限定されないが、例えば60個以下、好ましく30個以下、より好ましくは20個以下、さらに好ましくは10個以下、特に好ましくは5個以下を意味する。)の塩基が欠失、置換及び/または付加された塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA、並びに、これらとストリンジェントな条件下でハイブリダイズし、かつDNA結合活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号14〜26または36に記載のタンパク質のアミノ酸配列において1若しくは数個のアミノ酸配列が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードするものが含まれる。
【0039】
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜13または35に示される塩基配列またはその相補配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
【0040】
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテッドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
【0041】
また、配列番号1〜13に記載の塩基配列は、マウスを由来とするものであるが、上記したcDNAライブラリーの作製法に従ってヒトのcDNAライブラリーを作製し、該ライブラリーに対して配列番号1〜13の塩基配列を有するDNA断片をプローブとしたハイブリダイゼーションを行うことにより、配列番号1〜13に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNAを取得することもできる。本発明の配列番号1〜13に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトのホモログをコードするDNAも含まれる。
【0042】
また、インフォマティックスを利用して、ヒトホモログDNAが有する塩基配列を予測し、該塩基配列を基に上記のヒトcDNAライブラリーなどからヒトホモログDNAを取得することもできる。
一般的に、インフォマティックスを利用して目的とするタンパク質のホモログタンパク質をコードする塩基配列を予測する方法としては、例えば、(i)目的とするcDNAの塩基配列をクエリーとして、ヒト等のcDNAデータベース(インフォマティックスにより予測されるcDNAデータベースを含む)に対しBLASTなどを用いて相同性検索を行う方法や、(ii)目的とするcDNAをクエリーとしてヒト等のESTデータベースに対しBLASTなどを用いて相同性検索を行い、ヒットしたESTが有する配列を目的とするcDNAの塩基配列を参照して連結する方法、さらに(iii)目的とするcDNAの塩基配列をクエリーとして、ヒトなどのゲノムデータベースに対しBLASTなどを用いて相同性検索を行い、目的とするcDNAの遺伝子が存在するゲノム上の位置を特定し、そのゲノム領域に対してGenscan(http://genes.mit.edu/GENSCAN.html)やSim4(Genome Res., 8: 976−74 (1998))等を用いて、該ゲノム中の遺伝子部分の塩基配列を予測する方法等が挙げられる。
【0043】
マウス由来のcDNAのヒトホモログDNAの塩基配列を予測する場合、上記の方法のいずれも用いることができるが、本発明の配列番号1〜13に記載の塩基配列を有するcDNAはいずれも新規であり、上記(i)の方法では、ヒトホモログDNAの塩基配列を取得できないと考えられるため、(ii)あるいは(iii)に記載の方法などが好ましく用いられる。
【0044】
かくして予測されたヒトホモログDNAの塩基配列を基に、上記のヒトcDNAライブラリーから、配列番号1〜13に記載の塩基配列がコードするタンパク質のヒトのホモログタンパク質をコードするDNAを取得することもできる。具体的な取得方法としては、例えば、予測されたヒトホモログDNAの5’端、および3’端の塩基配列に相補的な塩基配列を有するプライマーを用いて、上記ヒトcDNAライブラリーを鋳型としてPCRを行う方法や、予測されたヒトホモログDNAの一部の配列をプローブとして、上記ヒトcDNAライブラリーに対してハイブリダイゼーションを行う方法等が挙げられる。
【0045】
一般的に、目的遺伝子が有する塩基配列とホモロジーの高い塩基配列を有する類似遺伝子を「ホモログ」と呼び、上記の方法においてもヒトホモログの取得を目的としているが、遺伝子の機能解析においては、塩基配列が類似していることだけではなく、ホモログとして取得された遺伝子が、目的遺伝子のファミリーメンバーであることを確認することが重要である。2種類の生物間で「ホモログ」として取得された遺伝子は、共通の祖先遺伝子から進化した同一の遺伝子である「オルソログ」である可能性と、また、共通の祖先遺伝子からの重複によって生じた異なる遺伝子である「パラログ」である可能性がある。
【0046】
つまり、上記でホモログとして取得されたヒト由来のDNAは、これを、本発明のタンパク質と同一の機能を有すると解するには、また、該ヒト由来のDNAがコードするタンパク質の機能を、本発明のタンパク質のマウスにおける機能として推定検証するには、上記ヒトホモログが本発明のマウス遺伝子の近縁種のオルソログであることを確認することが好ましい。
【0047】
オルソログであることの確認方法は、例えば、以下の方法などが用いられる。
(1)まず、本発明のcDNAの塩基配列と、取得されたヒトホモログDNAの塩基配列について相同性を解析する。次に、本発明のcDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるヒト塩基配列について相同性検索を行い、取得されたヒトホモログDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列の一致度より高いことを確認する。さらに、(2)取得されたヒトホモログDNAの塩基配列と、対応する本発明のcDNAの塩基配列について相同性を解析する。次に、取得されたヒトホモログDNAの塩基配列をクエリーとして、DDBJ、EMBL、GenBankなどの国際塩基配列データベースや、特許データベースに含まれるマウス塩基配列について相同性検索を行い、本発明のcDNAとクエリーの塩基配列の一致度が、データベースから得られた塩基配列とクエリーの塩基配列との一致度より高いことを確認する。上記(1)および(2)を確認することにより、取得されたヒトホモログが、本発明のcDNAに対応するヒトオルソログであると同定することができる。上記(1)および(2)に記載した相同性の解析はアミノ酸配列の比較を用いても良く、また、分子進化系統樹を描いて検討することもできる。また、上記(1)および(2)に記載した相同性解析による一致度は、クエリーの全長にわたる一致度として解析することが好ましい。
【0048】
かくして取得されたヒトホモログDNA、あるいはオルソログDNAの塩基配列を、BLASTによる相同性検索やHMMPFAMによる蛋白質特徴検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定および確認することができる。本発明のcDNAのヒトオルソログとして、例えば配列番号35に記載の塩基配列を有するDNAが挙げられ、また本発明のタンパク質のヒトオルソログタンパク質として、配列番号36に記載のアミノ酸配列を有するタンパク質等が挙げられる。
本発明の配列番号1〜13に記載の塩基配列またはその相補配列を有するDNAとストリンジェントな条件でハイブリダイズするDNAには、このようなヒトホモログ、あるいはオルソログタンパク質をコードするDNAも含まれる。
【0049】
(2)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明の翻訳領域としてそのアミノ酸配列を決めること等ができる。このようなアミノ酸配列として例えば、配列番号14〜26または36に記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1若しくは数個のアミノ酸が置換、欠失、及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するものも含まれる。
【0050】
本発明のタンパク質の取得方法としては、上記(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクター若しくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
【0051】
かくして得られるタンパク質が遊離体で得られた場合には、公知の方法あるいはそれに準じる方法によって塩に変換することができ、逆に塩で得られた場合には遊離体、又は他の塩に変換することができる。この様な本発明のタンパク質の塩も本発明のタンパク質に含まれる。また、上記形質転換体が産生するタンパク質を、精製前、又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記したDNA結合活性を有するものであれば本発明の範囲に含まれる。
【0052】
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
【0053】
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物、または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
【0054】
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
【0055】
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol.Biol.,53,154, (1970))、リン酸カルシウム法(Science,221,551, (1983))、DEAEデキストラン法(Science,215,166,(1982))、インビトロパッケージング法(Proc.Natl.Acad. Sci.USA,72,581,(1975))、ウィルスベクター法(Cell,37,1053,(1984))、および電気パルス法(Chu.et al.,Nuc.Acids Res.,15,1331(1987))等が挙げられる。
【0056】
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J.Biol.Chem.,263,7406,(1988))とその宿主であるSf−9(J.Biol.Chem.,263,7406,(1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J.Viol.,26,291,(1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc.Natl.Acad. Sci. USA,77,4216, (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7(ATCC CRL1651:アメリカン タイプ カルチャー コレクション保存細胞)が用いられる。
【0057】
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(A. A. Vertes et al., Biosci. Biotechnol. Biochem., 57, 2036, (1993))、あるいはトランスポゾンや挿入配列(A. A. Vertes et al., Molecular Microbiol., 11, 739, (1994))等を用いてDNA導入体を作製することもできる。
【0058】
得られた培養物は、細胞あるいは菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられ、特に好ましい具体例としては、ウサギ網状赤血球、小麦胚芽、大腸菌からの抽出液(大腸菌S30抽出液)に基づいて調製された転写翻訳系が挙げられる。
【0059】
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、例えばエピトープペプチド、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
【0060】
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、DNA結合活性を有するものであれば、本発明のタンパク質に含まれる。
【0061】
かくして得られたタンパク質は、他のタンパク質、DNAとの相互作用等を解析することにより、生体内における多面的な機能を知ることができる。上記相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。
【0062】
(3)オリゴヌクレオチドの調製及び該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。
【0063】
該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜13または35のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
【0064】
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine−modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等を挙げることができる。
【0065】
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製し、被導入体へ導入し、標的遺伝子の発現を阻害するRNAインターフェアレンス法(以下、これを「RNAi法」と称することがある)に用いることができる。RNAインターフェアレンス法については、例えば、(Elbashir, S., et al., Nature, 411, 494−498(2001))に記載の方法等を用いることができる。また、上記2本鎖RNAは必ずしも全てがRNAである必要はなく、例えば、WO02/10374号公報に記載のもの等も用いることができる。
【0066】
ここで、標的遺伝子としては、本発明のDNAであれば、如何なるものであってもよい。これらDNAの少なくとも一部の塩基配列と実質的に同一な配列からなる2本鎖RNA(以下、これを「2本鎖ポリヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までの如何なる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞おいては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5, 115−180(1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA−responsive protein kinase:Bass, B.L., Nature, 411, 428−429(2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’、5’oligoadenylate synthetase(Bass, B.L., Nature, 411, 428−429(2001))を介してRNaseLの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物、または該動物由来の細胞、あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、最も好ましくは21bpの2本鎖ポリヌクレオチドを用いることが好ましい。2本鎖ポリヌクレオチドはその全体が2本鎖である必要はなく、5’、または3’末端が一部突出したものも含むが、3’末端が2塩基突出したものを用いることが好ましい。2本鎖ポリヌクレオチドは相補性を有する2本鎖のポリヌクレオチドを意味するが、自己相補性を有する1本鎖ポリヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖ポリヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
【0067】
2本鎖ポリヌクレオチドの調製方法としては、特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は、相補性を有する1本鎖ポリヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法として具体的には、例えば、合成した1本鎖ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖ポリヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖ポリヌクレオチドを適当な酵素により分解する等して除去する。
【0068】
このようにして調製した2本鎖ポリヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであれば如何なるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業で使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
【0069】
被導入体は、細胞、組織、あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞及び内分泌腺または外分泌腺の細胞が含まれる。
【0070】
被導入体への2本鎖ポリヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖ポリヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィルス感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖ポリヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖ポリヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
【0071】
導入する2本鎖ポリヌクレオチドの量は、導入体や、標的遺伝子によって適宜選択することができるが、細胞あたり少なくとも1コピー導入されるに充分量を導入することが好ましい。具体的には、例えば、被導入体がヒト培養細胞で、カルシウムフォスフェート法により2本鎖ポリヌクレオチドを導入する場合、0.1〜1000nMが好ましい。
RNAインターフェアレンスによる本発明の遺伝子の導入体内での発現抑制により、本発明の遺伝子がコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
【0072】
(4)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。
【0073】
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
【0074】
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
【0075】
免疫後、適宜試験的に採血を行って固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、遠析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
【0076】
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein,et al.,Nature,256, 495(1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
【0077】
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体の何れから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(U. Zimmer− mann. et al., Naturwissenschaften,68, 577(1981))によっても行うことができる。
【0078】
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
【0079】
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al. Nature, 335, 256−259 (1988); Duchosal, M. A., et al., Nature, 355, 258−262(1992))。
【0080】
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一価性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
【0081】
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有するDNA結合活性を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(2)で作製したDNA導入体に抗体を接触させ、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
【0082】
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0083】
(5)本発明のタンパク質が有する活性の確認および解析
本発明のタンパク質は、これを上記(2)に記載のとおり組み換えタンパク質として作製し、これを解析することにより上記(1)で推測した活性を有していることを確認することができる。さらに上記(4)のとおりに作製した抗体等との組み合わせにより解析することもできる。
本発明のタンパク質が、DNA結合活性を有することは、例えば、適当な二本鎖DNAを該組み換えタンパク質に接触させ、該組み換えタンパク質の該DNA鎖への結合性を測定することにより確認することができる。具体的な方法としては、例えば、以下に説明する方法等が挙げられる。
【0084】
反応液としては、60mM塩化カリウム、1mMジチオトレイトール、10%グリセロール、1μg poly(dI−dC)を含む中性から弱塩基性緩衝液、例えば20mMトリス−塩酸或いはHEPES緩衝液(pH7〜8)を用い、適当な長さの二本鎖DNAと本発明の組み換えタンパク質を加えることにより反応を開始する。一定条件下で反応後、該組み換えタンパク質とDNAの結合物を検出することによりタンパク質の二本鎖DNA結合活性を判断する。
【0085】
組み換えタンパク質とDNAの結合は、分子の大きさとして検出する方法、電荷の差異として検出する方法、両者の親和性を測定する方法等を用いて検出することが可能である。
分子の大きさを検出する方法としては、分子ふるいクロマトグラフィーによる測定が挙げられる。上記反応液を、生理食塩水或いは0.1Mリン酸緩衝液(pH7.4)、0.1M HEPES(pH7.5)で平衡化した分子ふるいクロマトグラフィー用カラムに添加し、同溶液にて展開する。組み換えタンパク質、DNAそれぞれの溶出位置と比較して、より高分子量側に両者の結合物が溶出される。
【0086】
電荷の差として検出する方法としては、イオン交換クロマトグラフィー、ゲル電気泳動法、キャピラリー電気泳動法を含む電気泳動法が挙げられる。ゲル電気泳動法は、電荷の差と分子の大きさの差が移動度の差として現れる。上記反応液を、ポリアクリルアミドゲル中で電気泳動し、泳動後のゲルを銀染色、クマーシーブリリアントブルー染色、或いは蛍光染色し、組み換えタンパク質単独の場合と比較して、結合物は移動度の異なるバンドとして確認される。この2法の場合、DNAの一方の末端を蛍光ラベルしておくことによって、DNAの溶出位置、移動度の差として、より高感度で検出することも可能である。
【0087】
両者の親和性を測定する方法としては、アフィニティークロマトグラフィー、表面プラズモン共鳴法等が挙げられる。これらの方法では、DNAを担体に固定しておき、そこに組み換えタンパク質を接触させ、その結合量を測定し活性の強さとする。アフィニティークロマトグラフィーでは、結合した組み換えタンパク質を高濃度の塩溶液、変性剤、遊離のDNA等で溶出し、溶出したタンパク質量を測定する。表面プラズモン共鳴法では、固定化DNAに結合したタンパク質量を、表面プラズモン共鳴で測定し、結合したタンパク質濃度で親和性の強さを測定することができる。
【0088】
また、DNA・RNAに結合し転写に関連するタンパク質では、一般的に、既知の転写関連因子が認識し標的とするプロモーターやエンハンサー等の遺伝子転写調節領域(以下、「標的転写調節領域」と称する)のDNAおよびその部分断片を用いて、これらに対する結合能を測定することにより網羅的に転写制御活性を解析する方法が知られている(特開2001−314190号公報)。解析に使用する標的転写調節領域のDNAおよびその部分断片として、既知の標的転写調節領域の塩基配列(以下、これを「標的配列」と称することがある)を有するものだけでなく、既知の標的転写調節領域の塩基配列をデーターベース解析し分類してそれぞれ設計した、転写関連因子が共通して認識する標的転写調節領域の共通塩基配列(以下、これを「コンセンサス標的配列」と称することがある)を有するものを使用してもよい。既知の転写関連因子としては、例えば、v−jun, c−jun, junB, junD, dJRA, c−fos, fosB1, fosB2, Fra−1, LRF−1, v−maf, mafG, NF−E2 p45, aNF−E2, fNF−E2, Nrf short form, GCN4, yAP−1, CREB−2, ATF−3, CRE−BP1, CRE−BP3, ATF−a, CREB−341, CREB−327, CREM, dCREB2, dCREB2−b, dCREB2−c, dCREB2−d, dCREB2−q, dCREB2−r, dCREB2−s, C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP−10, VBP, Hlf, CPRF−2, EmBP−1b, EmBP−1b, GBF1, GBF2, GBF3, CPRF−1, TAF−1, HBP−1a, GBF9, GBF1, GBF12, CPRF−3, TGA1a, TGA1b, O2, STE4, OPI1, E2A, E47, ITF−2/SEF2−1B, SEF−1A, MyoD, p42Tal−1, HEN−1, AhR, Arnt, USF, NF−1A1, NF−1A1.1, NF−1A6, NF−1B1, NF−1B1, NF−1B2, NF−1C2/CTF−2, CTF−4, CTF−6, RF−X1, AP2alphaA/AP−2alpha1, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gamma, GR, AR, ER, RXR−alpha, PPARalpha, PPARgamma, COUP−TF1,HNF−4alpha1, HNF−4alpha2, CF1, GATA−1, GATA−2, GATA−3, GATA−4, AREA/NIT−2, Sp1, YY1, Egr−1, Egr−2, Egr−3, Snail, CF2−II, Evi−1, Ikaros, MZF−1, Tramtrack69K, HOX9, CDP, HNF−1A, Nkx−2.2, Nkx−2.5, TTF−1, Oct−1A, Oct−1B, Oct−1C, Oct−2, Oct−2.1/Oct−2B, Pax−3, Pax−6, Pax−1, HSF1(short), HSF2, dHSF, fungalHSF, c−Myb, A−Myb, v−Myb, P(long), P(short), C1(long), C1(short), c−Ets−1#p54, Ets−1#deltaiV/VII, Ets−2, Elk−1, SAP−1, SAP−1b, Erg−1, p55erg, Fli−1b, E4TF1−60/GABP−alpha, E74A, IRF−1, IRF−2, p50, NF−ATc, NF−Atp, p91, p84, STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6, p53, MEF−2A, SRF, E2, TBP, SRY, Sox−5, Sox−9, mat−Mc, CP1A, CP1B, CBF−C, AML1a, 等が知られており、これらの転写関連因子の標的転写調節領域の塩基配列もそれぞれ報告されている(田村隆明、外2名編、「Bio Science 実験医学別冊 新用語ライブラリー 転写因子」、第2版、株式会社羊土社、1999年12月)。
【0089】
本発明のDNA結合活性を有するタンパク質と標的転写調節領域のDNAおよびその部分断片との結合は、それ自体公知の測定系を使用して検出することができる。例えば、標的転写調節領域のDNAおよびその部分断片を固定化したプレートに本発明のタンパク質を含む被検試料を添加し、両者の直接的な結合をSPR(Surface Plasmon Resonance, 表面プラズモン共鳴)法を用いて検出することができる。その場合には、前記したような転写に関連するタンパク質が認識する標的転写調節領域のDNAまたはその部分断片をセンサーチップに固定化する。DNA及びその部分断片は、アニーリングさせたものを固定化する。また、前記のように、本発明のタンパク質または標的転写調節領域のDNAおよびその部分断片を蛍光標識したものを用いて、両者の結合を検出することもできる。
【0090】
本発明のタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することにより蛋白質発現を誘導し、本発明のタンパク質を取得することができる。
【0091】
また、転写に関連するタンパク質は、疾患に関与する種々の遺伝子の転写を調節する転写因子(以下、「疾患関連転写因子」と称する)への作用を解析することにより、該タンパク質が特定の疾患に直接的または間接的に関与しているか否かを解析することも有用である。疾患関連転写因子としては、例えば、PPAR, p53, NFκB, AP−1, HIF−1, CREB等が知られており、これら既知の因子への作用を上記と同様の方法等を用いて解析すればよい。
【0092】
例えば、SPR法を用いて解析を行う場合には、前記疾患関連転写因子が有する標的転写調節領域のDNAまたはその部分断片が特に好ましく用いられる。このようなDNAまたは部分断片が固定化されたセンサーチップに本発明のタンパク質を含む被検試料を適宜添加し、センサーチップ表面のDNAと被検試料中に含まれる該タンパク質との間の相互作用を解析する。固定化DNAと親和性を有する場合、コントロールに比較してSPR応答値が上がり、転写関連因子が固定化DNAと親和性を有していることが推定できる。このような解析により、本発明のタンパク質が特定の疾患においてどのような機能を有しているかを解析することができる。
【0093】
ここで、本発明のタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することにより蛋白質発現を誘導し、本発明のタンパク質を取得することができる。
【0094】
疾患関連転写因子は、該疾患関連転写因子が含まれている細胞抽出液または細胞核抽出液から取得することができる。また、前述のように、疾患関連転写因子をコードするDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、疾患関連転写因子をコードするcDNAを使用し、その全長または一部を適当な発現ベクターに挿入し、これを大腸菌などの微生物、昆虫細胞、酵母、動物細胞または動物に導入し、疾患関連転写因子が発現したこれらの遺伝子導入細胞の培養上清または細胞内、組織、体液より、組換え蛋白質である疾患関連転写因子を取得することができる。
【0095】
なお、本発明のタンパク質が有する活性の確認は、上記した方法に限定されるものではない。また、これらの機能アッセイ系は、後述する本発明のタンパク質の機能賦活物質や機能阻害物質のスクリーニングや本発明のタンパク質の発現調節物質のスクリーニングにも用いることができる。
【0096】
本発明のタンパク質の機能解析の方法として一般的には、例えば、(i)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(ii)他のタンパク質、DNAとの相互作用を解析する方法、(iii)適当な細胞あるいは個体へ導入し、表現型の変化を解析する方法、(iv)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。このような方法によれば、対象タンパク質に特異的な活性を多面的に解析することができる。
【0097】
(i)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine., Ed. by Harris, N. and Wilkinson, D. G., Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA法、ウエスタンブロット法などが挙げられる。ここで、解析の対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象バリアントと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141−145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合にも、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
【0098】
(ii)の方法においては、本発明のタンパク質と既知のタンパク質との相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質が公知のバリアントが存在するスプライシングバリアントの場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
【0099】
(iii)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(2)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、公知のバリアントが存在するスプライシングバリアントの場合には、公知のものも同様に細胞へ導入し、比較解析することにより解析対象バリアントに関連する表現型を同定することができる。また、本発明のタンパク質はDNA結合活性を有するものであることがわかっているので、DNA結合タンパク質が関連する疾患に見られる表現型等に注目して解析することも好ましい。
【0100】
(iv)の方法では、後述するオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質に公知のバリアントが存在する場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
【0101】
(6)本発明のタンパク質が有する活性を調節する分子のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
【0102】
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、且つ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であれば如何なるものであってもよい。例えば、まずはじめに本発明のタンパク質と被検物質とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を用いることができる。
【0103】
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であれば如何なるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質の相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(4)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。
【0104】
具体的な解析方法としては、例えば、DNA結合活性を調節する物質を解析する場合には、上記(5)に記載の方法等を用いて行うことができる。二本鎖DNAとの結合性が、物質の非存在下の場合と比べて増加した場合には、該物質はDNA結合活性化物質として機能する可能性があり、また低下、または阻害された場合には物質はDNA結合阻害物質として機能する可能性があると同定できる。ここで、医薬活性成分のスクリーニングを目的とするため、用いる本発明のDNA、あるいは組み換えタンパク質については、上記したヒトのホモログタンパク質またはオルソログタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、これらの生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。
【0105】
本発明のタンパク質が有するDNA結合活性としては、例えば、DNA構造に変化を与えて遺伝子発現を調節する機能が挙げられ、遺伝子発現調節タンパク質、あるいは、転写因子などが属する。転写因子は、癌に関連するパスウェイ上のシグナル伝達機能、心筋発達に関連するパスウェイ上のシグナル伝達機能、精子の分化・運動性を制御するパスウェイ上のシグナル伝達機能、生殖細胞分化を制御するパスウェイ上のシグナル伝達機能、細胞分化を制御するパスウェイ上のシグナル伝達機能、グリセロール3燐酸を生成する機能、神経細胞の発生・分化・増殖・生存維持を制御するパスウェイ上のシグナル伝達機能、アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能他、各種細胞の発生、分化、成長、増殖、生存、再生、および、細胞機能等を制御するパスウェイのシグナル伝達機能等、各種シグナル伝達において最終的にDNAに結合して遺伝子の発現制御に関わる因子である。従って、これらシグナル伝達に関わる各種疾患治療剤のスクリーニングの標的とすることができる。本スクリーニング方法により同定できる化合物は、抗ガン剤、糖尿病治療剤、抗炎症剤、神経変性疾患治療剤、心疾患治療剤、不妊治療剤、再生組織誘導剤、アルツハイマー病治療剤、肥満治療剤、糖尿病治療剤、心臓血管疾患治療剤、代謝異常治療剤、食欲不振、過食症などの治療剤等として用いられ得るものである。
【0106】
かかる調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0107】
(7)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、上記(2)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
【0108】
被検物質としては、上記(6)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
【0109】
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
【0110】
(8)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体子宮に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より、具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の子宮に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
【0111】
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
【0112】
(9)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜13または35のいずれかに記載の塩基配列を有するDNA及びその部分断片は、配列番号14〜26または36のいずれかに記載のアミノ酸配列を有するタンパク質及びその部分断片は、それらを基盤上に結合させた担体としてもちいられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。
【0113】
ここで、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
【0114】
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。ここで、DNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD−R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
【0115】
【実施例】
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
実施例1 cDNAライブラリーの調製
(1)mRNAの調製
mRNA調製マウス(C57BL/6)各器官または組織0.5〜1gを10mlの懸濁液でホモジェナイズし、pH4.0 の2M 酢酸ナトリウム1ml と、同量のフェノール/ クロロホルム(体積比5:1)混液を加え抽出した。抽出後水層に同量のイソプロパノールを加えると、RNAが水相から分離沈澱した。この試料を氷の上で1時間インキュベーションした後、15分間4,000rpmで冷却遠心機にかけ、沈澱物を回収した。この検体を70%エタノールで洗い、8mlの水に溶解後、2mlの5M NaCl、1 % CTAB(cetyltrimethy− lammonium bromide)、4M尿素、50mM Trisを含むpH7.0 の水溶液16mlを加えることでRNAを沈澱させ、ポリサッカライドを除いた(CTAB沈澱)。
【0116】
続いて室温で4,000rpm、15分間遠心機にかけ、RNAを4mlの7Mグアニジン−C1に溶解した。そして2倍量のエタノールを加えた後、氷上で1時間インキュベーションし、4,000rpm、15分間遠心機にかけ、生じた沈澱物を70%エタノールで洗いRNAを回収した、これを再度水に溶解し、RNAの純度をOD比260/280(>1.8)と230/260(<0.45)を読むことによって計測した。
【0117】
(2)第1鎖cDNAの調製
上記(1)で調製したmRNA 15μgを使って逆転写酵素3,000unit により、最終容量165μlの反応液中で、5−メチル−dCTP、dATP、dTTP、dGTPを各々0.54mM、0.6Mトレハロース、50mM Tris−HCl(pH8.3)、75mM KCl、3mM MgCl2、10mM DTT、52ng/μl BSA、RNaseインヒビター 5unitの条件下で逆転写反応を行った。制限酵素XhoIの認識配列を含むオリゴヌクレオチド(配列番号27)(配列中、VはA,G,又はCを示し、NはA, G, C,又はTを示す)12.6μlをプライマーとして用いた。
【0118】
この反応を始める際、反応液の1/4を採取し、それに1.5μlの[α−32P]−dGTP(3000Ci/mmol、10μCi/μl;Amersham社製)を加えるこことにより、第1鎖cDNAの合成効率を測定した。RI標識した反応液の0.5μlをDE−81ペーパー上にスポットし、0.5Mリン酸ナトリウム緩衝液(pH7.0)で3回洗った前後のRI活性を測定し、計算した。その後、RI標識した反応液と非標識の反応液を混合し、0.5M EDTA 8μl、10%SDS 2μl、プロテイナーゼ(Proteinase)K 20μgを加え、45℃で15分間加熱した。フェノール/クロロホルムによる抽出、エタノール沈澱後、沈澱をRNaseフリーに処理してある水(以下RNaseフリー水とする)47μlに溶解した。
【0119】
(3)5’キャップ構造及び3’末端へのビオチン付加
RNAジオールのビオチン化RNAのジオール部位(Cap構造のある5’末端と、ポリA鎖のある3’末端のリボースの双方に存在)にビオチンを結合させるために、2段階の反応を行った。それらは、ジオール基の酸化とそれに続くビオチンヒドラジドと酸化RNA体のカップリング反応である。まず、逆転写反応で得られたRNA−第1鎖cDNA複合体15μgを、6.6mM酢酸ナトリウム緩衝液(pH4.5)と、酸化剤として過ヨウ素酸ナトリウムを用いて50μlの反応液中で処理した。この酸化反応は遮光条件の下、氷上で45分間行った。
【0120】
続いて、5M塩化ナトリウム11μl、10% SDS 0.5μl、そして同量のイソプロパノールを加え、60分間氷上に放置した後、4℃で15分間15,000rpm遠心し沈澱を取得した。沈澱物は70%エタノールで洗い、RNaseフリー水50μlに再溶解させた。その試料に1M酢酸ナトリウム(pH6.1)5μl、10% SDS 5μl、10mMビオチンヒドラジド(Sigma社製)150μlを加え、室温(22〜26℃)で終夜反応させた。最後に、5μlの5M NaCl、1M酢酸ナトリウム(pH6.1)75μl、及び2.5倍量のエタノールを加え、1時間の氷上冷却後、4℃において15分間遠心し、ビオチン化した。反応後、反応液を15分間遠心し、再度RNA−DNA複合体を沈澱させた。沈澱物は70%エタノールで1回、更に80%エタノールで1回洗い、RNaseフリー水70μlに溶解した。
【0121】
(4)RNase Iによる完全長cDNAの選択
上記(3)で取得したビオチン化RNA−DNA複合体について、1本鎖RNAを消化するRNase Iで処理することにより、逆転写反応時に完全なcDNAの伸長が得られなかったmRNA、およびmRNAの3’末端に標識されたビオチン残基を取り除いた。具体的には、上記(3)で得られた試料70μlに10×RNase Iバッファー(100mM Tris−HCl(pH7.5)、50mM EDTA、2M NaOAc)10μl、RNase I(RNase OneTM;Promega社製)200unitを加えて、37℃で15分間1本鎖RNAを消化した。
【0122】
(5)完全長cDNAの採取
ストレプトアビジンコートしたマグネティックビーズにcDNAが非特異的吸着するのを防止するため、100μgの酵母tRNA(DNaseI処理したもの)を5mg(500μl)のマグネティックビーズ(magnetic porous glass(MPG)particles coated withstreptavidin(CPG,NJ))に加え、1時間氷上に放置した後、50mM EDTA、2M NaClの溶液にて洗った。
【0123】
このビーズを50mM EDTA、2M NaClの溶液500μl中に懸濁し、上記(4)で取得したRNase I処理を施されたcDNAを加えた。室温にて30分間撹拌することで、マグネティックビーズと完全長cDNAを結合させた。完全長cDNAを捕獲したビーズを50mM EDTA、2M NaClの溶液で4回、0.4%SDS、50μg/μl酵母tRNAで1回、10mM NaCl、0.2mM EDTA、10mMTris−HCl(pH7.5)、20% グリセロールで1回、50μg/μl酵母tRNA水溶液で1回、RNase H用バッファー(20mMTris−HCl(pH7.5)、10mM MgCl2、20mM KCl、0.1mM EDTA、0.1mM ジチオスレイトール(DTT))で1回洗浄した後、RNase H用バッファー100μlに懸濁し、RNase H 3unitを加え、37℃下30分間加温した。その後、10%SDS 1μl、0.5M EDTA 2μlを加えて、10分間、65℃に曝し、その上清を回収した。
【0124】
このようにして回収された1本鎖完全長cDNAはフェノール/クロロホルムで抽出され、スピードバッグにて液量を100μl以下に減じてからG25/G100Sephadexクロマトグラフィーに付した。RI活性を持った分画はシリコン処理したマイクロチューブに収集するとともに、グリコーゲン2μgを加え、エタノール沈澱にて得られた沈澱物を30μlの超純水に溶解した。
【0125】
(6)1本鎖cDNAへのオリゴdG付加
上記(5)で回収された1本鎖cDNA30μlは、最終容量50μlの反応液中で、200mMカコジル酸ナトリウム(pH6.9)、1mM MgCl2、1mM CoCl2、1mM 2−メルカプトエタノール、100μM dGTPの条件のもと、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TaKaRa社製)32unitを用いて37℃で30分間のオリゴdG付加反応に付した。反応終了時にEDTAを50mMとなるように加え、一連のフェノール/クロロホルムによる抽出、エタノール沈澱を経て、31μlの超純水に溶解した。
【0126】
(7)第2鎖cDNA合成
第1鎖cDNAを鋳型にした第2鎖cDNAの合成は以下のように行った。最終容量60μlの反応系で、第2鎖低バッファー(200mM Tris−HCl(pH8.75)、100mM KCl、100mM (NH4)2SO4、20mM MgSO4、1%Triton X−100、1mg/μl BSA)3μl、第2鎖高バッファー(200mM Tris−HCl(pH9.2)、600mM KCl、20mM MgCl2)3μl、dCTP、dATP、dTTP、dGTP各々0.25mM、β−NADH 6μl、オリゴdG付加された第1鎖cDNA31μl、第2鎖プライマー−アダプター(配列番号28)600ng を加え、Ex Taq DNAポリメラーゼ(TaKaRa ExTaq;TaKaRa社製)15unit、耐熱性DNAリガーゼ(Ampligase;Epicentre社製)150unit、耐熱性RNase H(Hybridase;Epicentre社製)3unitによって第2鎖cDNAを合成した。
【0127】
0.5M EDTAを1μl加えることで反応を停止させ、更にタンパク成分を溶解するために、10%SDS 1μl、プロテイナーゼ(Proteinase) K 10μgの存在下に45℃で15分間加熱し、最終的にフェノール/クロロホルムによる抽出、エタノール沈澱にて精製した2本鎖完全長cDNAを得た。
【0128】
(8)ライブラリーの調製
以上の方法により得られた二本鎖完全長cDNAは、λZAPIIIベクターに挿入し、ライブラリーとして回収した。λZAPIIIベクターはλZAPII(STRATAGENE社製)ベクターのマルチクローニングサイトの一部の配列である配列番号29を配列番号30に改変し、二つのSfiIサイトを新たに導入したものである。
【0129】
さらにλPS(RIKEN)ベクターを作製し、cDNAを挿入した。λPS(RIKEN)(λ−FLC−1と命名(FLCとはFULL−LENGTH cDNAを意味する))とは、MoBiTec社(ドイツ)のλPSベクターをcDNA用に改変したものである。即ち10kbp stufferの両側に存在するクローニングサイトにcDNA挿入に便利なBamHIならびにSalIを各々導入するとともに、0.5kbから13kb程度までのcDNAがクローニングできるようにXbaIサイトに6kbのDNA断片を挿入したものである(特開2000−325080号公報)。このλ−FLC−1を用いると、例えば肺臓cDNAライブラリーの場合には、インサートの平均鎖長は2.57kbとなり、実際に0.5kbから12kbまでのインサートをクローニングすることが出来た。従来法のλZAPの場合には、インサートの平均鎖長は0.97kbであったことから、λ−FLC−1を用いることによって、サイズの大きなcDNAもλZAPに比べて効率よくクローニングできることがわかる。
【0130】
実施例2 完全長cDNAライブラリーのノーマライゼーション/サブトラクション
(1)ドライバーの調製
実施例1(1)で作製したmRNA(以下、これを「(a)RNAドライバー」と称することがある)、及びin vitro転写反応で作成したRNAをドライバーとして用いた。後者のRNAはさらに2種類(以下、これを「(b)RNAドライバー」、及び「(c)RNAドライバー」と称する)に分けられる。1つはノーマライゼーションにより除かれたRNA−cDNAからcDNAを回収し、ファージベクターにクローニングしたものである。大腸菌に感染後1つの出発材料あたり1000から2000プラークを混ぜ合わせて1つのライブラリー(ミニライブラリー)とし、常法によりプラスミドDNAに変換する(ファージをヘルパーファージとともに再度大腸菌に感染させ、ファージミドとし、さらにもう一度感染させてプラスミドDNAを得る)。
【0131】
得られたDNAについてin vitro転写反応(T3RNAポリメラーゼまたはT7RNAポリメラーゼを用いる)を行い、DNase I(RQ1−RNase free;Promega社製)、Proteinase K処理後、フェノール/クロロホルム抽出をしてRNA(b)RNAドライバーを得た。この際、通常出発材料としては9種類(すい臓、肝臓、肺、腎臓、脳、脾臓、睾丸、小腸、胃)の組織からそれぞれミニライブラリーを作成して、9種類のミニライブラリーを混合してRNAを得る。もう一つのRNAはすでに重複のないクローンとして保存されているライブラリー(クローン数約2万個)を培養し、得られたDNAについて(b)RNAドライバーと同様にin vitro転写反応を行い(c)RNAドライバーとした。
【0132】
これら3種のRNAは、Label−IT Biotin LabelingKit(Mirus Corporation製)を用いてビオチン化標識を行ったあと、1:1:1の割合でテスターcDNAに添加し、Rot10での反応(42℃)を行い、ストレプトアビジンビーズ(CPG)処理を行って回収した上清について、第2鎖の合成を行った。
【0133】
実施例3 完全長cDNAクローンの塩基配列決定
(1)クローンのrearray
各クラスタからひとつの代表クローンを選んだ。代表クローンはQ−bot(GENETIX LIMITED製)で選択し、384穴プレートにarray化した。その際、大腸菌は30℃で18〜24時間、50μlのLB培地で培養した。このとき、cDNAライブラリーがPSベクターに導入され大腸菌DH10Bを形質転換している場合には100mg/mlのアンピシリン及び50mg/mlのカナマイシンを添加し、Zapベクターに導入し、SOLRシステムに導入している場合には100mg/mlのアンピシリン及び25mg/mlのストレプトアビジンを添加して行った。
【0134】
(2)プラスミドの抽出とInsSizing
上記(1)で培養した各クローンは、さらに100mg/mlのアンピシリンを含む1.3mlのHT液中で培養され、遠心分離により菌体を回収した後、QIAprep 96 Turbo(QIAGEN社製)を用いてプラスミドDNAを回収、精製した。取得されたプラスミド中に挿入されているcDNAの鎖長を調べるために、上記で取得したプラスミドDNAの1/30を制限酵素PvuIIで消化し、1%のagaroseゲル電気泳動を行った。
【0135】
(3)配列決定
かくして取得されたプラスミド中に挿入された完全長cDNAの全長の塩基配列解析には、3種類のシークエンサを用いた。また、プラスミドは挿入配列の長さが2.5kbより短いものと長いものの2つのカテゴリに分けた。このうち2.5kbより短い挿入配列を有するクローンについては両端から塩基配列を解析した。その際、プラスミドはベクターがPSの場合には配列番号31(センス鎖)、及び32(アンチセンス鎖)に記載のプライマーを用いて、またベクターがZapの場合には配列番号33(センス鎖)、及び34(アンチセンス鎖)に記載のプライマーを用いてThermosequenase Primer Cycle Sequencing Kit(Amersham Pharmacia Biotech社製)で反応し、Licor DNA4200(long read sequencer)を用いて解析した。
【0136】
上記塩基配列解析により解析ができなかったギャップは、プライマウォーキング法により決定した。その際、ABI Prism377及び/またはABI Prism3700(Applied Biosystems Inc.製)とBigDye terminator kitとCycle Sequencing FS ready Reaction Kit(Applied Biosystems Inc.製)を用いた。
【0137】
また、挿入されているcDNAが2.5kbより長いクローンの配列決定は、ショットガン法によった。その際、Shimadzu RISA 384とDYEnamic ET terminator cycle sequencing kit(Amersham Pharmacia Biotech社製)を用いた。ショットガンライブラリを作製するために、48の独立な代表クローンからPCRで増殖した48のDNAフラグメントを用いた。増幅されたDNA断片の末端をT4 DNAポリメラーゼによって平滑化した。
このDNA断片を、pUC18ベクターへ挿入し、更に該組み換えベクターにより大腸菌DH10Bを形質転換した。この大腸菌から上記(2)と同様にしてプラスミドを調製した。
【0138】
それらの代表クローンについては、両末端からの塩基配列解析によって塩基配列を決定し、該塩基配列をコンピューター上で連結した後、Double Stroke Shearing Device(Fiore Inc.製)によるshearingを行った。ショットガン法による塩基配列決定は、12〜15クローンの重複をもって行った。この塩基配列決定により配列が決定できなかったギャップは、上記と同様にプライマウォーキングによって決定した。
【0139】
実施例4 塩基配列の解析
(1)dnaform34837(配列番号1、14)
dnaform34837は、配列番号1に示すように、3717塩基から成り、そのうち塩基番号134から1690までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、518アミノ酸残基から成る (配列番号14)。配列番号1がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号trembl|AK020600|AK020600_1、RIKEN full−length enriched library, clone:9530049C15, SCAN domain containing protein が、e−value:5×10−171、100%の一致度で、また(ii)データベース登録記号trembl|U88080|U88080_1、 Zinc finger protein 192 (LD5−1)は、SCAN box domainをもつKruppel gene familyであり、e−value:2×10−94、42%の一致度である。さらに、(iii)データベース登録記号gp|AF154846|8099348、Homo sapiens zinc finger protein (ZFP)が、e−value:4×10−93、41%の一致度でヒットした。これらの結果より配列番号14に示したアミノ酸配列からなるタンパク質はZinc finger proteinであることが推測された。
また、配列番号1に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、ZF−C2H2の特徴を示す配列(PfamにLIMとしてエントリーされる塩基配列)が7回見出された。
これらのことから、配列番号1に示す塩基配列がコードするタンパク質はzinc finger型の転写因子であることが推測された。
【0140】
(2)dnaform63166(配列番号2、15)
dnaform63166は、配列番号2に示すように、3607塩基から成り、そのうち塩基番号612から2126までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、504アミノ酸残基から成る (配列番号15)。配列番号2がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gpnew|BC021456|18204788、RIKEN cDNA 2810411K16、e−value:2×10−76、139アミノ酸にわたって100%の一致度で、また(ii)データベース登録記号trembl|AK013086|AK013086_1、RIKEN full−length enriched library, clone:2810411K16:SCAN domain containing proteinが、e−value:6×10−76、139アミノ酸にわたって99%の一致度で、さらに(iii)データベース登録記号gp|AK027384|14042023、Homo sapiens cDNA FLJ14478 fis, clone MAMMA1001633が、e−value:1×10−61、140アミノ酸にわたって86%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号1880〜2167にSCAN配列が見出され、この特徴からDNA結合蛋白質であることが推測された。
【0141】
(3)dnaform33383(配列番号3、16)
dnaform33383は、配列番号3に示すように、3704塩基から成り、そのうち塩基番号662から3259までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は865アミノ酸残基から成る (配列番号16)。配列番号3がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC008827|14250716、Homo sapiens, clone MGC:13310 IMAGE:4110431、e−value:5×10−145、919アミノ酸にわたって40%の一致度で、また(ii)データベース登録記号trembl|AF192913|AF192913_1、Zinc finger protein 180 (HHZ168)が、e−value:2×10−63、231アミノ酸にわたって51%の一致度で、さらに(iii)データベース登録記号gp|U41164|1127843、Rattus norvegicus Cys2/His2 zinc finger protein (rKr1)が、e−value:6×10−63、192アミノ酸にわたって56%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号2786〜3275にzf−C2H2が6箇所見出され、この特徴からDNA結合蛋白質であることが推測された。
【0142】
(4)dnaform39530(配列番号4、17)
dnaform39530は、配列番号4に示すように、2397塩基から成り、そのうち塩基番号661から1476までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、271アミノ酸残基から成る (配列番号17)。配列番号4がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|AB052171|11611589、Macaca fascicularis brain cDNA, clone:QccE−18103.が、e−value:2×10−95、220アミノ酸にわたって79%の一致度で、また(ii)データベース登録記号trembl|AF017433|AF017433_1,Homo sapiens putative transcription factor CR53は、e−value:1×10−32、56%の一致度である。さらに(iii)データベース登録記号gp|BC007287|13938317、Homo sapiens, Similar to zinc finger protein 202, clone MGC:15660 IMAGE:3347511が、e−value:1×10−32、134アミノ酸にわたって56%の一致度でヒットした。
また、配列番号4に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号775〜1062にSCAN配列(PfamにSCANとしてエントリーされる配列)を見出した。
これらのことから、配列番号4に示す塩基配列がコードするタンパク質は転写因子であることが推測された。
【0143】
(5)dnaform38861(配列番号5、18)
dnaform38861は、配列番号5に示すように、2621塩基から成り、そのうち塩基番号213から1703までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は496アミノ酸残基から成る (配列番号18)。配列番号5がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC010591|14714873、Mus musculus, zinc finger proliferation 1、e−value:6×10−97、491アミノ酸にわたって41%の一致度で、また(ii)データベース登録記号trembl|D10630|MMZFP51_1、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)が、e−value:2×10−96、491アミノ酸にわたって41%の一致度で、さらに(iii)データベース登録記号trembl|AB007886|AB007886_1、Hypothetical zinc finger protein KIAA0426が、e−value:2×10−95、532アミノ酸にわたって44%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号929〜1585に zf−C2H2が8回見出され、この特徴からDNA結合蛋白質であることが推測された。
【0144】
(6)dnaform60441(配列番号6、19)
dnaform60441は、配列番号6に示すように、1830塩基から成り、そのうち塩基番号122から1612までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は496アミノ酸残基から成る (配列番号19)。配列番号6がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号gp|BC010591|14714873、Mus musculus, zinc finger proliferation 1, clone MGC:18498 IMAGE:3981599、e−value:6×10−97、491アミノ酸にわたって41%の一致度で、また(ii)データベース登録記号trembl|D10630|MMZFP51_1、mouse Zinc finger protein 38 (Zfp−38) (CtFIN51) (Transcription factor RU49)が、e−value:2×10−96、491アミノ酸にわたって41%の一致度で、さらに(iii)データベース登録記号trembl|AB007886|AB007886_1、Hypothetical zinc finger protein KIAA0426が、e−value:2×10−95、532アミノ酸にわたって44%の一致度でヒットした。
また、HMMPFAMによる蛋白質特徴検索を行ったところ、塩基番号929〜1585に zf−C2H2が8回見出され、この特徴からDNA結合蛋白質であることが推測された。
【0145】
(7)dnaform42515(配列番号7、20)
dnaform42515は、配列番号7に示すように、2311塩基から成り、そのうち塩基番号156から560までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、134アミノ酸残基から成る (配列番号20)。配列番号7がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AJ301670,STATc transcriptional repressorが、e−value:4×10−28で、また127アミノ酸にわたって53%の一致度で、また(ii)データベース登録記号P58463、forkhead−related transcription factor 2が、e−value:4×10−23で、109アミノ酸にわたって58%の一致度で、さらに(iii)データベース登録記号P18480、Transcription regulatory protein SNF5が、e−value:2×10−24で、118アミノ酸にわたって61%の一致度でヒットした。
また、上記(i)のタンパク質は、データベース中の文献情報(Mol. Cell, 7(4), 779−88(2001))から初期の発生速度と末端分化のタイミングの制御に関ること、および、ecmA遺伝子の発現を制御するリプレッサーとして機能することが、また上記(ii)のタンパク質は、データベース中の文献情報(J. Biol. Chem. 1998, 273 (36):23335−43)から肺および胎盤に発現されている転写因子でいくつかの肺特異的遺伝子のcis因子に結合することが、さらに上記(iii)のタンパク質は、データベース中の文献情報(Mol. Cell. Biol., 1990, 10 (11):5616−25)からグルコースおよびリン酸により制御される遺伝子の転写制御に関わることがそれぞれ明らかとなった。
これらの結果より、配列番号7に記載の塩基配列がコードするタンパク質は転写因子であることが推測された。
【0146】
(8)dnaform41143(配列番号8、21)
dnaform41143は、配列番号8に示すように、2646塩基から成り、そのうち塩基番号149から1591までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、480アミノ酸残基から成る (配列番号21)。配列番号8がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AL034555、zinc finger protein 151 (pHZ−67)が、e−value:1×10−25で、また121アミノ酸にわたって48%の一致度で、また(ii)データベース登録記号Q13105、Myc−interacting zinc finger proteinが、e−value:2×10−25で、121アミノ酸にわたって48%の一致度でヒットした。これらの結果より、配列番号21に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Curr Top Microbiol Immunol 1997;224:137−46)から、Myc−interacting zinc finger proteinであることが明らかとなった。
また、配列番号8に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号9−121に蛋白質二量化に関わる特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)が見出された。また、Zinc finger domain(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)も1ヶ所で見出された。
これらのことから配列番号8に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0147】
(9)dnaform34196(配列番号9、22)
dnaform34196は、配列番号9に示すように、2796塩基から成り、そのうち塩基番号597から1982までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、461アミノ酸残基から成る (配列番号22)。配列番号9がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9P255、Hypothetical zinc finger protein KIAA1473が、e−value:1×10−59で、また295アミノ酸にわたって37%の一致度で、また(ii)データベース登録記号P52742、Zinc finger protein 135が、e−value:2×10−58で、277アミノ酸にわたって39%の一致度でヒットした。これらの結果より、配列番号22に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genomics 1995 May 20;27(2):259−64)から、zinc finger Kruppel familyであることが明らかとなっており、発達障害などに関わることが分かった。
また、配列番号9に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号43〜299にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)が9ヶ所で見出された。
これらのことから、配列番号9に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0148】
(10)dnaform37479(配列番号10、23)
dnaform37479は、配列番号10に示すように、2717塩基から成り、そのうち塩基番号230から907までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、225アミノ酸残基から成る (配列番号23)。配列番号10がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9NQX1、PR−domain zinc finger protein 5が、e−value:3×10−13で、62アミノ酸にわたって50%の一致度で、また(ii)データベース登録記号X82018、zinc finger protein with interaction domainが、e−value:2×10−12で、81アミノ酸にわたって43%の一致度でヒットした。これらの結果より、配列番号23に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、(zinc finger protein with interaction domainであることが分かった。
また、配列番号10に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号12−34と40−63にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)が2ヶ所で見出された。
これらのことから、配列番号10に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0149】
(11)dnaform59635(配列番号11、24)
dnaform59635は、配列番号11に示すように、2709塩基から成り、そのうち塩基番号566から1228までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、220アミノ酸残基から成る (配列番号24)。配列番号11がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号Q9NQX1、PR−domain zinc finger protein 5が、e−value:4×10−13で、62アミノ酸にわたって50%の一致度で、また(ii)データベース登録記号X82018、zinc finger protein with interaction domainが、e−value:3×10−11で、81アミノ酸にわたって41%の一致度でヒットした。これらの結果より、配列番号24に示したアミノ酸配列からなるタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
また、上記(ii)のタンパク質は、データベース中の文献情報(Genes Dev 1994 Jul 15;8(14):1664−77)から、(zinc finger protein with interaction domainであることが分かった。
また、配列番号11に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、アミノ酸番号12−34と40−63にZinc finger domain (Pfamにzf−C2H2としてエントリーされる配列)を見出した。
これらのことから、配列番号11に示す塩基配列がコードするタンパク質はZinc finger型DNA結合蛋白質であることが推測された。
【0150】
(12)dnaform33773(配列番号12、25)
dnaform33773は、配列番号12に示すように、3249塩基から成り、そのうち塩基番号487から2127までがオープンリーディングフレーム (終止コドンを含む) になっていた。オープンリーディングフレームから予測されるアミノ酸配列は、546アミノ酸残基から成る (配列番号25)。配列番号12がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AF097416、Mus musculus zinc finger transcription factor Kaisoが、e−value:2×10−27で、また94アミノ酸にわたって58%の一致度で、また(ii)データベース登録記号AF420316、Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso が、e−value:2×10−29で、136アミノ酸にわたって48%の一致度でヒットした。
また、配列番号12に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号25のアミノ酸番号17−131の領域にBTB(for BR−C, ttk and bab) or POZ(for Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)を見出し、アミノ酸番号337−380の領域にMsx−interacting−zinc finger の特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)を見い出し、アミノ酸番号340−508の領域に4カ所にわたってZinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見いだした。
これらの結果より、配列番号12に示す塩基配列がコードするタンパク質はzinc fingerを持ったKaiso様の転写因子であることが推測された。
【0151】
(13)dnaform51218(配列番号13、26)
dnaform51218は、配列番号13に示すように、2950塩基から成り、そのうち塩基番号167から続くフレームで2950(配列の最後の塩基)まで終止コドン以外のアミノ酸のコドンが続く。167から2950の領域がコードするアミノ酸配列は、927アミノ酸残基から成る (配列番号26)。配列番号13がコードするアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、SPTR蛋白質データベース (SWISS−PROT蛋白質配列データベースとTrEMBL核酸翻訳データベースを統合したもの) 中に、(i)データベース登録記号AY044336、Xenopus laevis DNA−methylation dependent transcriptional repressor Kaiso−like protein (Kaiso) が、e−value:4×10−32で、また137アミノ酸にわたって48%の一致度で、また(ii)データベース登録記号AF420316、Xenopus laevis BTB/POZ zinc finger transcription factor XKaiso が、e−value:4×10−32で、137アミノ酸にわたって48%の一致度でヒットした。
また、配列番号13に示す塩基配列がコードするアミノ酸配列について、HMMPFAMによる蛋白質特徴検索を行ったところ、配列番号26のアミノ酸番号17−131の領域にBTB(BR−C, ttk and bab) or POZ(Pox virus and Zinc finger)ドメインの特徴を示す配列(PfamにBTBとしてエントリーされるアミノ酸配列)を見出し、アミノ酸番号337−380の領域にMsx−interacting−zinc fingerの特徴を示す配列(Pfamにzf−MIZとしてエントリーされるアミノ酸配列)を見い出し、アミノ酸番号340−537の領域に5カ所にわたってZinc finger, C2H2 typeの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見いだした。
これらの結果より、配列番号13に示す塩基配列はzinc fingerを持ったKaiso様の転写因子遺伝子配列の一部分であることが推測された。
【0152】
実施例5 DNAマイクロアレーを用いた組織発現解析
組織発現解析は、Miki, R., et al., Proc. Natl. Acad. Sci. USA, 98, 2199−2204 (2001)の記載に従って行った。
(1)DNAマイクロアレーの作成
2種類のマウス全長cDNAの塩基配列(dnaform33383、dnaform34196)および解析対象のマウス全長cDNAと同じクラスタに属する(該cDNAと相同な塩基配列を有する)1種類のマウスcDNAライブラリーFANTOM( HYPERLINK http://fantom.gsc.riken.go.jp/ http://fantom.gsc.riken.go.jp/)由来のcDNAの塩基配列(FANTOM NO:9530049C15)を、M13フォワードおよびリバースプライマーを用いて増幅後、このPCR産物をイソプロパノールにて沈澱させ15μlの3×SSC液に溶解した。これらの3種類のDNA溶液をポリLリジンコートしたガラススライドに、16チップ(SMP3、TeleChem International、Sunnyvale、CA)のDNAアレイヤーを用いてスポットし、DNAマイクロアレーを作成した(方法の詳細はhttp://cmgm.stanford.edu/pbrown/mguide/index.htmlに記載されている)。マウスβアクチンとグリセルアルデヒド‐3‐フォスフェートデヒドロゲナーゼのcDNAをポジティブコントロールとし、シロイヌナズナのcDNAをネガティブコントロールとして用いた。
【0153】
このDNAマイクロアレーの検出感度は、1細胞当たりmRNA1ないし3コピーであった。ターゲット配列との一致度がおよそ80%のクローンのシグナル強度は、完全に配列が一致するクローンの10分の1であった。ターゲット配列との一致度が80%未満のクローンのシグナル強度は、バックグランドレベルであった。
【0154】
(2)プローブの調製
C57BL/6Jマウスの胎児、新生仔、アダルトの22組織(腎臓、脳、脾臓、肺、肝臓、精巣、膵臓、胃、小腸、結腸、胎盤、心臓、胸腺、小脳、子宮、骨、筋肉、背側腎臓由来脂肪細胞、副精巣由来脂肪細胞、内臓脂肪、10日齢新生児小脳、10日齢新生児皮膚)から抽出したmRNA1μgを定法に従いランダムプライム逆転写反応を行い蛍光色素Cy3(Amersham Pharmacia社)を取りこませた。他方、17.5日齢の胎児全身から抽出したmRNA1μgをランダムプライム逆転写反応を行い、蛍光色素Cy5を取りこませ発現解析のリファレンスとした。CyDye標識cDNAプローブは、CyScribe GFX Purification Kit(Amersham Pharmacia社)を用いて精製し、滅菌水17μlにてカラムから溶出した。これに3μlの10μg/μl oligo(dA),3μlの酵母tRNA 20μg/μl,1μlの20μg/μlマウスCot1 DNA,5.1μlの20XSSC,および0.9μlの10%SDSからなるブロッキング溶液を混和してCyDye標識cDNAプローブを調製した。
【0155】
(3)DNAマイクロアレーのハイブリダイゼイション
発現解析対象組織由来cDNAプローブ(Cy3標識)とリファレンスの17.5日齢胎児由来cDNAプローブ(Cy5標識)を混和した溶液30μlを95℃にて1分間熱処理を行い室温にて冷却した。DNAマイクロアレーに上記プローブ溶液を添加しカバースリップを被せ、Hybricasette(ArrayIt社)中にて65℃一晩ハイブリダイズさせた。次に、DNAマイクロアレーを2XSSC,0.1%SDSを用いて洗浄し、続いて1XSSCにて2分間、0.1XSSCにて2分間リンスした。マイクロアレーはScanArray5000共焦点レーザースキャナーを用いてスキャンし、画像をIMAGENE(BioDiscovery社)で解析した。
【0156】
(4)データ解析
各組織中のmRNA量(Cy3標識)は、リファレンスの17.5日齢の胎児全身mRNA量(Cy5標識)との比(Cy3/Cy5)を対数(log2)で表示した。すなわち、解析対象とする各マウス全長cDNAに対応するmRNA発現量が、リファレンス組織中よりも各組識中の方が多い場合は正の数値で、少ない場合は負の数値で、等しい場合は0で示される。データの正確性を増すために実験は独立に2回行い、再現性の有る結果を採用した。結果を以下の表1に示す。
【0157】
一般的に、DNAアレーを使用した発現解析では、2倍程度の増減は実験誤差とみなされる。このことから、表1に示す結果の数値が1以上の場合にはある組織中のmRNA量が対照である17.5日齢の胎児全身のmRNA量と比較して2倍以上であり、有意に増加していると解釈した。逆に、結果の数値が−1以下の場合は、ある組織中のmRNA量が対照である17.5日齢の胎児全身のmRNA量と比較して2分の1以下であり、有意に減少していると解釈した。また、任意の組織間のmRNA発現量を比較検討する際は、各組織における数値の差が1であればmRNA量は2倍、2であればmRNA量は4倍であり、逆に、組織間の数値の差が−1であればmRNA量は1/2倍、−2であればmRNA量は1/4倍であることを意味する。
【0158】
なお、マイクロアレイにスポットしたDNAと同じクラスタに属し、該DNAと少なくとも200塩基に亘り80%以上の塩基配列の一致度を有する領域を有するマウスcDNAクローンについても、表1に解析対象cDNAとして記載し、マイクロアレイにスポットした該DNAの測定結果の数値を代用して記載した。
【0159】
【表1】
【0160】
dnaform34837は、FANTOM No:9530049C15をプローブとした発現解析により、膵臓でのみ発現が増加していることがわかった。dnaform33383は、それ自身をプローブとした発現解析により、広い組織範囲で発現が低下していることがわかった。dnaform39530は、dnaform33383をプローブとした発現解析により、広い組織範囲で発現が低下していることがわかった。dnaform34916は、それ自身をプローブとした発現解析により、精巣でのみ発現が低下していることがわかった。
【0161】
実施例6 PCR法を用いた組織発現解析
本発明のタンパク質をコードするmRNAの正常マウスおよび疾患マウスでの組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0162】
(1)cDNA合成
以下のマウス(森脇和郎、外1名編、Molecular Medicine別冊、Vol. 36「自然発症疾患モデル動物 」、中山書店、1999年)の19組織からトータルRNAを抽出し、オリゴdTをプライマーとして逆転写酵素を用いてcDNA合成を行った。
(a)正常マウスの組織および糖尿病モデルマウスの組織
▲1▼対照マウスC57BL/KsJ − +m/+m Jcl(メス、8週齢)の全脳、視床、肺、腎臓、骨髄、膵臓、脂肪細胞、肝臓、眼
▲2▼糖尿病モデルマウスC57BL/KsJ − db/db Jcl(メス、8週齢)の膵臓、脂肪細胞、肝臓、眼
(b)老化促進マウスの組織
▲1▼正常老化マウス SAM R1/TA Slc(オス、13週齢)の海馬、前頭葉皮質
▲2▼老化促進マウス SAM P8/Ta Slc(オス、15週齢)の海馬、前頭葉皮質
(c) 癌転移モデルマウスの組織
▲1▼対照マウスBalb/c(メス、5週齢)の正常結腸
▲2▼癌転移モデルマウスBalb/c(メス、6週齢)の結腸癌(マウス腹腔に結腸癌細胞Colon26を移植し、2週間後に結腸癌を摘出)
【0163】
(2)PCR法による定量
下記の6個の、本発明のタンパク質をコードしているmRNAの発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
【0164】
(a)dnaform33773
5’側プライマー:AGGATTGGCGAACTATCCAG(配列番号37)
3’側プライマー:CCACGAGTGAACATTTGCAT(配列番号38)
(b)dnaform38861
5’側プライマー:ACTCAGAGAGCCAGCCAGAA(配列番号39)
3’側プライマー:TGTTGGAACCGTTTCCTGAG(配列番号40)
(c)dnaform41143
5’側プライマー:GCTGCACAAACGGTCTCATA(配列番号41)
3’側プライマー:ACCAAGAGGTGCAACAGAGG(配列番号42)
(d)dnaform42515
5’側プライマー:TGTGCTGTCATCTGAGACTTGA(配列番号43)
3’側プライマー:CCTTGTACACAACCAAGGGTAGA(配列番号44)
(e)dnaform51218
5’側プライマー:AGGATTGGCGAACTATCCAG(配列番号45)
3’側プライマー:CTCCACGAGTGAACATTTGC(配列番号46)
(f)dnaform60441
5’側プライマー:TCAGGAAACGGTTCCAACAT(配列番号47)
3’側プライマー:TCCTTGGAGGATTTCTTCTCTG(配列番号48)
【0165】
定量結果はGlyceraldehyde 3−phosphate dehydrogenase(GAPDH)を内部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)をGAPDHの発現量(コピー数/μl)で除し、定数(1×106)(注:10の6乗)を乗して表示した。
【0166】
結果をまとめると、dnaform33773は全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現した。dnaform38861は全身で強く発現するが、特に膵臓、肺で強力に発現した。dnaform41143は全身で発現するが、膵臓、肺、脂肪で比較的強く発現した。dnaform42515は脳に特異的に発現し、特に前頭様皮質で強力に発現した。dnaform51218は全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現した。dnaform60441は全身で発現するが、特に膵臓、肺で強く発現した。上記クローンのcDNAおよび該cDNAによってコードされるタンパク質は、糖尿病や癌などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0167】
【表2】
【0168】
実施例7 タンパク質−タンパク質相互作用解析
哺乳動物細胞におけるtwo−hybrid法(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001))を用いて、2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列がコードするタンパク質のタンパク質−タンパク質相互作用を網羅的に解析した。
(1)PCR法を用いた迅速なサンプル調製
哺乳動物細胞でのtwo−hybrid実験は、CheckMate mammalian two−hybrid system(Promega社製)を利用した。タンパク質−タンパク質相互解析用のサンプルは、CMVプロモーターの下流にGal4遺伝子のDNA結合領域を挿入したプラスミドベクターpBIND、CMVプロモーターの下流にVP16遺伝子の転写活性化領域を挿入したプラスミドベクターpACT,および5個のGal4結合領域とTATAボックスの下流にレポーターであるルシフェラーゼ遺伝子を挿入したプラスミドベクターpG5lucを鋳型として調製した。Gal4遺伝子と2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列との融合遺伝子、並びにVP16遺伝子とマウスcDNAライブラリーFANTOM(http://fantom.gsc.riken.go.jp/)の各クローンが有する完全長cDNAのタンパク質コード配列との融合遺伝子は、基本的にPromega社のプロトコールに従い共通配列部分を用いた連結と2段階PCR法を組み合わせて作成した(Suzuki, H., et al., Genome Research, 11, 1758−1765 (2001) )。マウスcDNAのタンパク質コード配列を、5’側に共通配列をもち3’側に遺伝子特異的な配列をもつフォワードプライマーおよびM13ユニバーサルプライマーとを用いてPCR増幅した後、上記増幅産物とpBINDまたはpACTのPCR増幅産物(3’側に共通配列を付加した)とを混和し、それぞれネスティドプライマーを用いて第2段のPCR増幅を行い、Gal4とマウスタンパク質の融合タンパク質を発現させるベクター(BINDサンプル)またはVP16とマウスタンパク質の融合タンパク質を発現させるベクター(ACTサンプル)を構築した。
【0169】
(2)ハイスループットな哺乳動物細胞でのtwo−hybrid実験
PCR法で調製したBINDおよびACTサンプルは、それ以上の精製を行わずに直接使用した。BINDサンプルおよびACTサンプルのそれぞれ0.25μl、30ngのpG5luc、および9.5μlのOpti−MEM培地(Lifetech社製)を384ウェルプレートに分注した。Opti−MEM培地にて32倍希釈したLF2000トランスフェクション試薬(Lifetech社製)10μlをウェルに加えて混和し20分間インキュベーション後、F12培地にて1,300細胞/μlに懸濁したCHO−K1チャイニーズハムスター細胞液20μlを加えて良く懸濁した。アッセイサンプルをCO2インキュベーター内で20時間培養後、ルシフェラーゼ活性はSteady−Glo Luciferase Assay System(Promega社製)を用いて測定し、相互作用を確認した。
【0170】
この結果、2種類のマウス全長cDNAの塩基配列(dnaform33773、dnaform34837)のタンパク質コード配列がコードするタンパク質は、以下に示す特定のタンパク質(マウスcDNAライブラリーFANTOMの特定のクローンが有するcDNAのタンパク質コード配列がコードする特定のタンパク質)との相互作用をそれぞれ有していることが明らかとなった。
【0171】
【表3】
【0172】
(3)考察
Dnaform33773にコードされる本発明のタンパク質は、SRP40と分子間相互作用することがわかった。SRP40は、mRNA前駆体のスプライシング反応に関与する蛋白質の一群であるSR蛋白質のひとつであって、phosphatidylinositol 3−kinaseが関与するprotein kinase C beta II mRNAのスプライシング経路に必要な蛋白質である。このSRP40がprotein kinase C beta IIの発現を調節し、この働きによりinsulin依存的な糖代謝が制御されていることが知られている(J.Biol.Chem., 276(25):22648−54, 2001) 。したがって、SRP40の異常は糖尿病の原因となりうる。Dnaform33773にコードされる本発明のタンパク質は、Zincfingerをもち、転写制御活性を有することが予想されており、これらの結果を総合的に解析すると、糖尿病の原因となりうるSRP40と結合するDnaform33773にコードされるタンパク質は、糖尿病の原因となりうる蛋白質であると推測できる。
Dnaform34837にコードされる本発明のタンパク質は、Pregnane X receptor 2(PXR2)と相互作用することがわかった。PXR2は核内ステロイド受容体の1つで、ステロイド化合物を介する情報伝達系に複合的に関与する核内受容体の1つである。肝臓においては細胞質に存在し、リガンドに曝露されることによりRXR(Retinoid X receptor)とヘテロ二量体を形成して核に移行し、特異的遺伝子発現に関与していることで知られている。具体的には、例えば、PXRは医薬品に応答してチトクロームP450(CYP)酵素等の薬物代謝系を誘導することが知られており、生体内での異物(医薬品)センサーとして機能していると推測されている。また、このPXRの異常は、糖尿病、高脂血症、高血圧、虚血性心疾患といったいわゆる生活習慣病の原因となり、様々な内分泌疾患を引き起こすことが知られている。Dnaform34837にコードされる本発明のタンパク質はZinc−finger proteinであり、転写制御活性を有する蛋白質であることが予測されており、核内に存在して特定のDNA配列に結合することによって情報伝達系に関与していることが予想される。以上の結果を総合的に解析すると、Dnaform34837は、PXR2と共存する条件でヘテロ二量体を形成し、転写制御に関与する可能性があるタンパク質であると推測できる。
【0173】
実施例8 ヒトオルソログDNAの取得
(1)dnaform33383のヒトオルソログDNAの予測
dnaform33383の塩基配列(配列番号3)を問い合わせとして、ヒトゲノムドラフト配列(NCBI Build 30;http://www.ncbi.nlm.nih.gov/About/Doc/hs#genomeintro.html)に対してBLAST検索を行ったところ、相同性の高い領域として16番染色体の6p12.1の24.62Mbから24.66Mbの領域を見出した。
該ゲノム配列領域に対して、遺伝子予測プログラムGenscan(http://genes.mit.edu/GENSCAN.html) を用いて遺伝子領域予測を行い、得られた予測転写産物配列に対して相同性検索を行ったところ、3520塩基よりなる配列(配列番号49)を得た。この塩基配列は、塩基番号319−3219に2904塩基のオープンリーディングフレーム(配列番号35)を含んでいた。配列番号3のマウス塩基配列は、配列番号35のヒト塩基配列と約2580塩基対の長さに渡って81%の相同性をもつことがわかった。
【0174】
また、配列番号35の塩基配列から配列番号36のヒトアミノ酸配列に翻訳されると予測された。配列番号36のアミノ酸配列とdnaform33383のオープンリーディングフレームから予測されるアミノ酸配列(配列番号16)との間には、864アミノ酸配列に渡って81%の相同性があった。
さらに、配列番号36のアミノ酸配列を問い合わせとして、マウスcDNAライブラリー FANTOMデータベース(http://fantom.gsc.riken.go.jp/)に対してBLASTによる相同性検索を行ったところ、配列番号16のアミノ酸配列が最も相同性が高かった。
【0175】
なお、公開塩基配列データベースであるembleデータベースと特許データベースであるGenseqデータベースに対してのBLAST相同性検索においては、配列番号35の塩基配列よりも相同性の高いヒト塩基配列は検索できなかった。
従って、配列番号35が、配列番号3に対する新規なヒトオルソログDNAであると考えられた。
(2)取得されたヒトオルソログDNAの塩基配列の解析
上記(1)で予測されたヒトオルソログDNAの塩基配列および該塩基配列によりコードされるアミノ酸配列について、さらなる解析を行った。
まず、配列番号36に示されるアミノ酸配列についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBLE、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)および特許配列のデータベース中には、配列番号16に記載のマウスのアミノ酸配列以上に相同性を示す配列はなかった。このことからも、配列番号36に記載のアミノ酸配列を有するタンパク質は、配列番号16に記載のアミノ酸配列配列を有するマウスタンパク質のヒトオルソログタンパク質であることが推測された。
配列番号36に記載のヒトアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号39−134にSCAN domain(PfamにSCANとしてエントリーされるアミノ酸配列)を、アミノ酸番号229−269にKRAB box region(PfamにKRABとしてエントリーされるアミノ酸配列)を、アミノ酸番号775−797、803−825、831−853、859−881、887−909、915−937にZinc Finger,C2H2 type domainの特徴を示す配列(Pfamにzf−C2H2としてエントリーされるアミノ酸配列)を見出した。
SCAN domainは一部のC2H2タイプのZnフィンガータンパク質のN末端に見られる保存されたモチーフで、オリゴマー形成の調節と転写制御の役割をもつことが知られている。またKruppel−associated box(KRAB)はC2H2タイプのZnフィンガータンパク質の約1/3に見られ、N末端部分に存在し、DNAとの結合の際には転写の抑制にはたらき、Znフィンガードメインとともに細胞分化・発生に関与することが知られている。
以上のことから、配列番号36に記載のアミノ酸配列を有するタンパク質は、Kruppel−associated box(KRAB)を持つC2H2タイプのZnフィンガータンパク質で、転写の抑制にかかわる転写因子であることが推測された。
【0176】
(3)dnaform33383のヒトオルソログDNAの取得
上記(1)および(2)において新規なヒトオルソログDNAが予測されたことから、以下のとおり、このcDNAのクローニングをおこなった。
まず、このcDNAを取得する遺伝資源となる組織を選択するために、フォワードプライマー1(配列番号50)とリバースプライマー1(配列番号51)を用いてヒト組織由来cDNA(Clontech社製)を鋳型としたPCRを行ったところ、子宮、前立腺、脳下垂体、脳、胎児脳、海馬、視床で目的とする約150bpのDNAの増幅が確認された。フォワードプライマー1は配列番号35の塩基番号1294−1313に相当し、リバースプライマー1は配列番号35の塩基番号1443−1424に相当する。
【0177】
次に、オープンリーディングフレーム全長を取得するために、これら組織由来のcDNAを鋳型としてフォワードプライマー2(配列番号52)とリバースプライマー2(配列番号53)を用いたPCRを行った。これらのプライマーは、配列番号49のヒト塩基配列においてオープンリーディングフレームの外側に位置する配列を用いて設計されたプライマーであって、フォワードプライマー2は配列番号49の塩基番号253−272に相当し、リバースプライマー2は配列番号49の塩基番号3256−3237に相当する。
【0178】
PCRの結果、子宮、前立腺、脳下垂体、胎児脳、海馬、視床で予測値と一致する2.9kbのDNAが増幅した。これらのうち子宮、前立腺、胎児脳に由来するPCR増幅DNA断片を鋳型に直接シークエンスを行ったところ、3種とも同じ配列を有しており、PCRによるミスはないことがわかった。そこで、子宮由来のPCR増幅DNA断片をpCR4Blunting−TOPOベクター(Invitrogen社製)にライゲーションして、得られた独立のコロニー3個から由来するプラスミドのシークエンスをおこなったところ、3つとも配列番号49の塩基番号253−3256(配列番号35に記載された、ヒトのオープンリーディングフレーム全長に相当する塩基配列を含む)と全く同じ配列が挿入されていた。
以上のことから、予想されたヒト転写物(タンパク質)が実際に発現していることが示され、そのcDNAを取得することができたことがわかった。かくして取得されたヒトホモログDNAを、ZG1001と名付けた。
【0179】
このヒト塩基配列に由来するアミノ酸配列(配列番号36)とマウス塩基配列に由来するアミノ酸配列(配列番号16)とを比較すると、ヒトアミノ酸配列上のアミノ酸番号64−913と、マウスアミノ酸配列上のアミノ酸番号7−856の部分で一致度が高く、N末端はヒトアミノ酸配列の方が59アミノ酸長く、C末端は36アミノ酸長かった。
さらに、ヒト塩基配列(配列番号35)とマウス塩基配列(配列番号3)をそれぞれヒトゲノム、マウスゲノムにマッピングすると、両者とも7つのエクソンにコードされていた。それぞれのN末端、C末端をコードする部分は、一致度が高い部分から一致度が低い部分にかけてひとつのエクソンであった。すなわち、これらの配列のN末端及びC末端の違いは、エクソンの使い分けではなく種による違いであることがわかった。
【0180】
実施例9 標的転写調節領域に対する結合能の解析
(1)無細胞蛋白質合成系を用いた本発明の蛋白質の調製
本発明のタンパク質をコードするDNAを含むプラスミドに対して、Proc.Natl.Acad.Sci.USA,99,14652−14657 (2002)に記載されている方法に準じてPCR反応を行い、転写用のDNA断片を調製した。このDNAを鋳型としてSP6 RNA Polymerase(Promega社製)を用いて転写反応を行ない、mRNAを合成し、エタノール沈殿操作により得られたmRNAを精製した。このmRNAを用いたタンパク合成は、特開2002−204689号公報、およびProc.Natl.Acad.Sci.USA,99:14652−14657(2002)に準じた重層法による無細胞蛋白質合成系を用いて行った。重層法無細胞蛋白質合成系にて使用する翻訳溶液(25μl)には、Proc.Natl.Acad.Sci.USA,97:559−564(2000)に従って調製された6μlの小麦胚芽抽出液および上述したmRNA(0.02nmol)を添加して用い、その組成は24 mM Hepes/KOH(pH 7.8), 1.2 mM ATP, 0.25 mM GTP, 16 mM creatine phosphate, 10 μg creatine kinase, ribonuclease inhibitor(20units), 2 mM DTT, 0.4 mM spermidine, 0.3 mM L型アミノ酸(20種), 2.7 mM magnesium acetate, 100 mM potassium acetate, 5 μg 小麦胚芽由来tRNA, 0.05% Nonidet P−40および0.005% NaN3から成る。また翻訳用緩衝液は31.3mM HEPES/KOH(pH7.8) , 2.67mM Mg(OAc)2 , 93mM KOAc , 1.2mM ATP, 0.257mM GTP , 16mM creatine phosphate, 2.1mM DTT, 0.41mM spermidine, 0.3mML型アミノ酸(20種), 1μM E−64 , 0.005% NaN3 , 0.05% NP−40から成る。重層法による無細胞蛋白質合成は、まず96穴プレートに翻訳用緩衝液を125μlずつ加えて、この翻訳用緩衝液が入ったそれぞれの穴に底からゆっくりと翻訳溶液を重層し、このプレートを26℃インキュベーターで保温して16時間反応させることにより行った。
【0181】
(2)標的配列を固定化したセンサーチップを用いたSPR測定方法
BIAapplications handbook, chapter4.4の記載に従い、センサーチップ表面にビオチン化した以下の53種類の二重鎖DNAを別々に固定化した。センサーチップはSAタイプ(ビアコア社製)を用い、SPR測定および解析は、BIACORE3000(ビアコア社製)を用いた。
【0182】
公知の転写因子と、設計した標的転写調節領域のDNAまたはDNA断片の塩基配列(以下、これを「標的配列」と称することがある)、または、複数の転写因子が共通して認識する標的転写調節領域のDNAまたはDNA断片の塩基配列(以下、これを「コンセンサス標的配列」と称することがある)の関係は、次の通りである。
[1]v−jun, c−jun, junB, junD, dJRA, c−fos, fosB1, fosB2, Fra−1, LRF−1, v−maf, mafG, NF−E2 p45, aNF−E2, fNF−E2, Nrf short form, GCN4, yAP−1, CREB−2, ATF−3, CRE−BP1, CRE−BP3, ATF−a, CREB−341, CREB−327, CREM, dCREB2, dCREB2−b, dCREB2−c, dCREB2−d, dCREB2−q, dCREB2−r, dCREB2−sのコンセンサス標的配列:TGATGACGT(配列番号54)
[2]C/EBPalpha, C/EBPbeta, p34C/EBPbeta, CHOP−10のコンセンサス標的配列:AAGTGGCGAAAGAGACA(配列番号55)
[3]VBP, Hlf, CPRF−2, EmBP−1b, EmBP−1b, GBF1, GBF2, GBF3, CPRF−1, TAF−1, HBP−1a, GBF9, GBF1, GBF12, CPRF−3, TGA1a, TGA1b, O2, STE4のコンセンサス標的配列:AGAAGCACGTGG(配列番号56)
[4]OPI1, E2A, E47, ITF−2/SEF2−1B, SEF−1A, MyoD, p42Tal−1のコンセンサス標的配列:AACAGATGGT(配列番号57)
[5]HEN−1の標的配列:GGGGCGCAGCTGCGGCCC(配列番号58)
[6]AhR, Arnt のコンセンサス標的配列:GGGGATTGCGTG(配列番号59)
[7]USFの標的配列:GTCACGTGGT(配列番号60)
[8]NF−1A1, NF−1A1.1, NF−1A6, NF−1B1, NF−1B1, NF−1B2, NF−1C2/CTF−2, CTF−4, CTF−6のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号61)
[9]RF−X1の標的配列:GGTAACATAGCAAC(配列番号62)
[10]AP2alphaA/AP−2alpha1, AP2alpha2, AP2alpha3, AP2alpha4, AP2alphaB, AP2beta, AP2gammaのコンセンサス標的配列:CGCCCCCCGGCG(配列番号63)
[11]GRの標的配列:GGTACAAAATGTTCT(配列番号64)
[12]ARの標的配列:AACATTATGTTCT(配列番号65)
[13]ERの標的配列:AAGGGAAAATGACCCCC(配列番号66)
[14]RXR−alphaの標的配列:GGTCATAGGGGT(配列番号67)
[15]PPARalphaの標的配列:CTAGGGCAAAGGTCA(配列番号68)
[16]PPARgammaの標的配列:GGTCAAAGGTCA(配列番号69)
[17]COUP−TF1,HNF−4alpha1, HNF−4alpha2の標的配列:TGAACTTTGA(配列番号70)
[18]CF1の標的配列:GGGGTCACC(配列番号71)
[19]GATA−1, GATA−2, GATA−3, GATA−4のコンセンサス標的配列:CCAGATAAGG(配列番号72)
[20]AREA/NIT−2の標的配列:TATCTC(配列番号73)
[21]Sp1の標的配列:GGGGGGGGGG(配列番号74)
[22]YY1の標的配列:CGGCCATCTTGGCT(配列番号75)
[23]Egr−1, Egr−2, Egr−3のコンセンサス標的配列:TGCGTGGGCG(配列番号76)
[24]Snailの標的配列:CACCTGTTTTCA(配列番号77)
[25]CF2−IIの標的配列:GTATATATA(配列番号78)
[26]Evi−1の標的配列:AGATAAGATAA(配列番号79)
[27]Ikaros, MZF−1のコンセンサス標的配列:TTGGGAGG(配列番号80)
[28]Tramtrack69Kの標的配列:GGACCTGC(配列番号81)
[29]HOX9の標的配列:TGACAGTTTAACGA(配列番号82)
[30]CDPの標的配列:CCAATAATCGAT(配列番号83)
[31]HNF−1Aの標的配列:GGTTAATGATTAACCAC(配列番号84)
[32]Nkx−2.2, Nkx−2.5, TTF−1のコンセンサス標的配列:TTAAGTGGTT(配列番号85)
[33]Oct−1A, Oct−1B, Oct−1C のコンセンサス標的配列:ATGCAAAT(配列番号86)
[34]Oct−2, Oct−2.1/Oct−2Bのコンセンサス標的配列:TATTTGCAT(配列番号87)
[35]Pax−3, Pax−6のコンセンサス標的配列:CGTCACGCTTGA(配列番号88)
[36]Pax−1の標的配列:CCGTTCCGCTCTAGATAT(配列番号89)
[37]HSF1(short), HSF2, dHSF, fungalHSFのコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号90)
[38]c−Myb, A−Myb, v−Myb, P(long), P(short), C1(long), C1(short)のコンセンサス標的配列:AACGGGCCC(配列番号91)
[39]c−Ets−1#p54, Ets−1#deltaiV/VII, Ets−2, Elk−1, SAP−1, SAP−1b, Erg−1, p55erg, Fli−1b, E4TF1−60/GABP−alpha, E74Aのコンセンサス標的配列:GACAGGAAGTG(配列番号92)
[40]IRF−1, IRF−2の標的配列:GAAAAGCGAAACC(配列番号93)
[41]p50の標的配列:GGGGACTTTCC(配列番号94)
[42]NF−ATc, NF−Atpのコンセンサス標的配列:AGGAAAA(配列番号95)
[43]p91, p84のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号96)
[44]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号97)
[45]p53の標的配列:GGACATGCCCGGGCATGTC(配列番号98)
[46]MEF−2Aの標的配列:CTCTAAAAATA(配列番号99)
[47]SRFの標的配列:CCATATATGGACAT(配列番号100)
[48]E2の標的配列:AACCAAAAACGGTAA(配列番号101)
[49]TBPの標的配列:TATAAAA(配列番号102)
[50]SRY, Sox−5, Sox−9の標的配列:AAAAAACAATAGGG(配列番号103)
[51]mat−Mcの標的配列:TCATTGTT(配列番号104)
[52]CP1A, CP1B, CBF−Cのコンセンサス標的配列:CTGATTGGCTACC(配列番号105)
[53]AML1aの標的配列:TGTGGT(配列番号106)
【0183】
まず、上記53種類の標的配列(配列番号54〜配列番号106)を有するDNAに関し、それぞれの5’側にビオチンが付加したDNAとその相補な塩基配列を有するDNAを定法により個別にアニーリングさせ、合計53種類の二本鎖化したDNAを調製した。一方、解析に用いるセンサーチップは、1枚に付きフローセルが4分割されている。フローセル1は何も固定化せずコントロール区として用い、フローセル2、3および4はそれぞれ上記で調製した二本鎖DNAを3種類ずつ固定化した。センサーチップのDNAの固定化密度を一定にするため、DNA固定化によるSPR応答値の上昇(ΔRU−DNA)をDNA分子量(MW)で割った値(D)が各フローセルで一定になるようにΔRU−DNAを調節した。同様の要領で、残りのDNAについても固定化を行った。
【0184】
以上のようにセンサーチップの作製ができた後、クローンのcDNAがコードする本発明のタンパク質との結合活性解析を行った。SPR法によるDNAとタンパク質間の結合活性解析は既に多数報告がある。本実施例では、Molecular Microbiology, 36(3), 557−569(2000)の測定条件を参考にして行った。まず、フローセル1−2−3−4が直列につながった流路に設定しておく。そこにランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させた後、各フローセルのベースライン値(SPR−baseline)を測定する。次に、蛋白質溶液を同流量で流し、蛋白質分子とDNA鎖との間で特異的結合を形成させる。一定時間注入後、各フローセルのSPR応答値(SPR−bound)を測定した。
【0185】
(4)SPR法により得られた測定結果の解析方法
SPR応答値からベースライン値を差し引き([SPR−bound]−[SPR−baseline])することにより、真の結合量(B)を求め、さらに、標準化した値(nB)を求めた。
測定結果より、dnaform33383,33733,34196,34837,37479,38861,39530,41143,42515,51218,59635,60441,63166の13クローンのcDNAによってコードされる本発明のタンパク質は、前記[1]〜[53]の計53種類の標的配列(配列番号54〜配列番号106)を有するDNAの少なくとも一つに対して結合活性を有していることがわかった。
【0186】
実施例10 ヒト組織発現解析
上記実施例8において、dnaform33383についてはヒトオルソログ(ZG1001)が取得された。そこで、本発明のヒトタンパク質をコードするmRNAの正常ヒトおよび疾患患者での組織発現変動を検討するために、定法(Higuchi R, et al., Biotechnology, 11: 1026−30 (1993))に従い、PCR法を用いた組織発現解析を行った。
【0187】
(1)cDNA合成
以下のヒトの9組織のmRNAはClontech社から購入し、オリゴdTをプライマーとした逆転写反応を行いcDNAを合成した。
正常脳、正常海馬、正常視床、正常腎臓、正常肝臓、正常膵臓、正常骨格筋、正常脂肪、正常脾臓
以下のヒトの8組織のcDNAはClontech社から購入した。
正常乳房、乳癌、正常結腸、結腸癌、正常肺、肺癌、正常胃、胃癌
以下のヒトの2組織のcDNAはBiochain社から購入した。
正常前頭葉、アルツハイマー病前頭葉
以下のヒトの1組織の全RNAはユニーテック社から購入し、mRNAを抽出後、cDNA合成を行った。
正常末梢血白血球
【0188】
(2)PCR法による定量
本発明のヒトタンパク質をコードしているmRNA(dnaform33383のヒトオルソログ ZG1001のmRNA)の発現は、ライトサイクラー定量PCR装置(ロシュ・ダイアグノスティクス社製)とLightCycler−FastStart DNAマスターSYBR Green I試薬を用いて、製品に添付されているプロトコールに従い定量した。定量PCRに用いた合成DNA配列を以下に示す。
5’側プライマー:GCTCCGTCCACTGATAAACC(配列番号107)
3’側プライマー:GCGGATAAATTCGATGCCTA(配列番号108)
定量結果は、Glyceraldehyde 3−phosphate dehydrogenase(GAPDH)を内部標準として、補正した。即ち、各組織での対象遺伝子の発現量(コピー数/μl)をGAPDHの発現量(コピー数/μl)で除し、定数(1×105)(注:10の5乗)を乗して表示した。その結果を表4に示す。
【0189】
【表4】
【0190】
表4から明らかな通り、ZG1001のmRNAは膵臓、脾臓、および脳で発現し、乳癌で発現が増加した。
この結果より、上記cDNAおよび該cDNAによってコードされるタンパク質は、癌やアルツハイマー病などの治療や診断に応用できる。また該cDNAによってコードされるタンパク質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性がある。
【0191】
実施例11 各完全長cDNAがコードするタンパク質の総合解析
(1)dnaform34837(配列番号1、14)
dnaform34837のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、膵臓および副精巣由来脂肪細胞で強く発現することが分かった。さらに、タンパク質−タンパク質相互作用解析では、該cDNAにコードされるタンパク質が核内ステロイド受容体の一つであるPXR2と相互作用することが確認された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核に存在し、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0192】
(2)dnaform63166(配列番号2、15)
dnaform63166のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、延髄および乳腺で強く発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核に存在し、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0193】
(3)dnaform33383(配列番号3、16)
dnaform33383のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。前記実施例4に記載したPFAM検索の結果によると、本タンパク質はC末端に6個のC2H2 type Zinc Finger構造をもち、N末端側に蛋白相互作用にかかわるSCAN domain, KRAB domainをもつ蛋白質である。また、PreLocによる蛋白質細胞内局在予測によると、核局在が強く示唆される。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想される多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。従って、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0194】
(4)dnaform39530(配列番号4、17)
dnaform39530のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることを示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0195】
(5)dnaform38861(配列番号5、18)
dnaform38861のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現し、特に膵臓、肺で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0196】
(6)dnaform60441(配列番号6、19)
dnaform60441のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現し、特に膵臓、肺で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0197】
(7)dnaform42515(配列番号7、20)
dnaform42515のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、脳に特異的に発現し、特に前頭様皮質で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌や神経疾患などの治療や診断に応用できる。
【0198】
(8)dnaform41143(配列番号8、21)
dnaform41143のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で発現するが、膵臓、肺、脂肪で比較的強く発現した。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0199】
(9)dnaform34196(配列番号9、22)
dnaform34196のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0200】
(10)dnaform37479(配列番号10、23)
dnaform37479のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる
【0201】
(11)dnaform59635(配列番号11、24)
dnaform59635のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、mRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌などの治療や診断に応用できる。
【0202】
(12)dnaform33773(配列番号12、25)
dnaform33773のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現することが分かった。さらに、タンパク質−タンパク質相互作用解析では、該cDNAにコードされるタンパク質が糖尿病の原因となりうるSRP40と相互作用することも確認された。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌および神経疾患などの治療や診断に応用できる。
【0203】
(13)dnaform51218(配列番号13、26)
dnaform51218のcDNAにコードされるタンパク質は、前記実施例9に記載のSPR測定装置(BIACORE社製)を用いた53種の標的配列を有するDNAに対する結合実験の結果、該標的配列の少なくとも1つに結合し、該蛋白質が結合した標的配列に選択性を持ったDNA結合蛋白質であることが示された。また、発現解析からは、全身で強く発現するが、特に肺、膵臓、脂肪、脳で強力に発現することが分かった。
前記実施例4に記載の解析およびこれらの実験結果から、この蛋白質は核での存在が予想され、多量体あるいは他の蛋白質との相互作用をする可能性のあるDNA結合蛋白質であると考えられる。したがって、該cDNAおよび該cDNAによってコードされる蛋白質は、上記のようなmRNA発現の変動が見られる組織あるいはmRNA発現量の多い組織に関わる疾患に関与している可能性があり、たとえば糖尿病や癌および神経疾患などの治療や診断に応用できる。
【0204】
【発明の効果】
本発明のタンパク質およびそれをコードするDNAはDNA結合活性等を有することから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。
本出願は、2002年4月19日付けの日本特許出願(特願2002−117840)、2002年4月30日付けの日本特許出願(特願2002−128418)、および2002年12月4日付けの日本特許出願(特願2002−352469)に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【0205】
【配列表】
Claims (15)
- 以下の (a) または (b) のタンパク質。
(a)配列番号14〜26または36のいずれかに記載のアミノ酸配列からなるタンパク質。
(b)配列番号14〜26または36のいずれかに記載のアミノ酸配列において1若しくは数個のアミノ酸が欠失、置換及び/または付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質。 - 請求項1に記載のタンパク質をコードするDNA。
- 請求項1に記載のタンパク質をコードする完全長cDNA。
- 以下の (a) 、 (b)又は(c) の何れかのDNA。
(a)配列番号1〜13または35のいずれかに記載の塩基配列を有するDNA。
(b)配列番号1〜13または35のいずれかに記載の塩基配列において、1若しくは数個の塩基が欠失、置換及び/または付加された塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。
(c)配列番号1〜13または35のいずれかに記載の塩基配列あるいはその相補配列を有するDNAとストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつDNA結合活性を有するタンパク質をコードするDNA。 - 請求項2〜4のいずれかに記載のDNAを含む組換えベクター。
- 請求項2〜4のいずれかに記載のDNAまたは請求項5に記載の組み換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
- 請求項6に記載の細胞により産生される、請求項1に記載のタンパク質。
- 請求項2から4の何れかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、及び、当該センス又はアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
- 請求項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
- 抗体がモノクローナル抗体である請求項9に記載の抗体。
- モノクローナル抗体が請求項1または7に記載のタンパク質のDNA結合活性を中和する作用を有することを特徴とする請求項10に記載の抗体。
- 請求項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
- 請求項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
- 請求項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報、および/または請求項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
- 請求項1に記載のタンパク質、および/または請求項2〜4のいずれかに記載のDNAを結合させた担体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003115847A JP2004229642A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002117840 | 2002-04-19 | ||
JP2002128418 | 2002-04-30 | ||
JP2002352469 | 2002-12-04 | ||
JP2003115847A JP2004229642A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004229642A true JP2004229642A (ja) | 2004-08-19 |
Family
ID=32966618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003115847A Pending JP2004229642A (ja) | 2002-04-19 | 2003-04-21 | 新規タンパク質及びそれをコードするdna |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004229642A (ja) |
-
2003
- 2003-04-21 JP JP2003115847A patent/JP2004229642A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2004003198A1 (ja) | アレルギー性疾患の検査方法、および治療のための薬剤 | |
US7172867B2 (en) | Methods of testing for allergic diseases, and therapeutic agents for treating same | |
JP2004229642A (ja) | 新規タンパク質及びそれをコードするdna | |
US20050123966A1 (en) | Diagnostic and prognostic methods and compositions for seizure- and plasticity-related disorders | |
US7148011B2 (en) | Method of testing for allergic diseases | |
JP2004041179A (ja) | 新規タンパク質及びそれをコードするdna | |
WO2003089466A1 (fr) | Nouvelles proteines et adn codant de celles-ci | |
JP2004229646A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229650A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229643A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229651A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229648A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229649A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2005052101A (ja) | 新規タンパク質およびそれをコードするdna | |
JP2004229644A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229653A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041180A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2005021093A (ja) | 新規タンパク質およびそれをコードするdna | |
JP2004041178A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004041181A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004261179A (ja) | 新規タンパク質およびそれをコードするdna | |
JP2004229640A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229652A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229641A (ja) | 新規タンパク質及びそれをコードするdna | |
JP2004229639A (ja) | 新規タンパク質及びそれをコードするdna |