JP2004261179A - 新規タンパク質およびそれをコードするdna - Google Patents

新規タンパク質およびそれをコードするdna Download PDF

Info

Publication number
JP2004261179A
JP2004261179A JP2004037143A JP2004037143A JP2004261179A JP 2004261179 A JP2004261179 A JP 2004261179A JP 2004037143 A JP2004037143 A JP 2004037143A JP 2004037143 A JP2004037143 A JP 2004037143A JP 2004261179 A JP2004261179 A JP 2004261179A
Authority
JP
Japan
Prior art keywords
protein
seq
dna
amino acid
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004037143A
Other languages
English (en)
Inventor
Takao Isogai
隆夫 磯貝
Junichi Yamamoto
順一 山本
Tetsuo Nishikawa
哲夫 西川
Yuko Isono
祐子 五十野
Tomoyasu Sugiyama
友康 杉山
Tetsutsugu Otsuki
哲嗣 大槻
Ai Wakamatsu
愛 若松
Shizuko Ishii
静子 石井
Keiichi Nagai
啓一 永井
Ryotaro Irie
亮太郎 入江
Daichi Naka
大地 仲
Wakako Watabe
和加子 渡部
Kunji Kawai
勲二 河合
Hideo Kubodera
英夫 久保寺
Atsushi Kondo
淳 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Association for Biotechnology
Original Assignee
Research Association for Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Association for Biotechnology filed Critical Research Association for Biotechnology
Priority to JP2004037143A priority Critical patent/JP2004261179A/ja
Publication of JP2004261179A publication Critical patent/JP2004261179A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

【課題】 完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し
、このうち全長として配列が新規なcDNAについては、これがコードするタンパク質の生理活性を特定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案すること。
【解決手段】 以下の(a)または(b)のタンパク質;(a)配列番号12〜22に記載
のアミノ酸配列からなるタンパク質、(b)配列番号12〜22に記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質。
【選択図】 なし。

Description

本発明は、新規なタンパク質、該タンパク質をコードするDNA、該タンパク質をコードする完全長cDNA、該DNAを有する組換えベクター、該DNAの部分配列から成るオリゴヌクレオチド、該DNAを導入した遺伝子導入細胞、および該タンパク質に特異的に結合する抗体等に関する。
現在、世界的なレベルで様々な生物のゲノム配列の解明とその解析が進められている。既に約百数十の原核微生物、下等真核生物の出芽酵母、多細胞性真核生物である線虫で、その全ゲノム配列が決定された。30億塩基対といわれるヒトのゲノムについては2001年2月にその塩基配列のドラフトが発表されていたが、2003年4月に完全配列が解読され公表された。ゲノム配列を明らかにする目的は、全ての遺伝子の機能や制御、あるいは遺伝子間、タンパク質間、細胞間さらには個体間における相互作用のネットワークとして複雑な生命現象を理解するところにある。種々の生物種のゲノム情報から生命現象を解明していくことは、単に学術分野における研究課題として重要であるのみならず、そこで得られる研究成果をいかに産業上の応用へと発展させていくかという点で、その社会的な意義も大きい。
ところが単にゲノム配列を決定しただけでは、全ての遺伝子の機能を明らかにできるわけではない。例えば酵母では、ゲノム配列から推定された約6,000の遺伝子の約半数しか、その機能を推定できなかった。一方、ヒトには約10万種類のタンパク質が存在するといわれる。そこで、ゲノム配列から明らかにされてくる膨大な量の新しい遺伝子の機能を、迅速かつ効率的に解明していくための「ハイスループット遺伝子機能解析システム」の確立が、強く望まれている。
真核生物のゲノム配列では、多くの場合、一つの遺伝子がイントロンによって複数のエクソンに分断されている。そのため、ゲノム配列情報だけからそこにコードされるタンパク質の構造を正確に予測するには、多くの問題がある。一方、イントロンが除かれたmRNAから作製されるcDNAでは、タンパク質のアミノ酸配列の情報が一つの連続した配列情報として得られるため、容易にその一次構造を明らかにすることが可能である。ヒトのcDNAの研究では、これまでに500万以上のEST (Expressed Sequence Tag) データが公共データベースに公開されている。
これらの情報は、ヒト遺伝子構造の解明やゲノム配列におけるエクソン領域の予測、あるいはその発現プロファイルの推定など、様々な角度から利用されている。ところが、これらのヒトEST情報の多くはcDNAの3’末端側近傍に集中しているため、特にmRNAの5’末端近傍の情報が極端に不足している状況にある。また、世界の研究機関 (ヘリックス研究所、かずさDNA研究所、東大医科学研究所、ドイツ癌研究センター、MGCプロジェクトなど) で行われている解析の結果明らかにされているcDNAは4万数千に上り、数的には3万数千と言われる遺伝子座の大半をカバーしていると思われるが、全長クローンとして取得されているcDNAの割合は80%程度であることや、重複やスプライスバリアントが含まれていることを考慮すると、まだ取得されていないcDNAは多数存在していると考えられる。
完全長cDNAを取得できれば、その5’末端配列からゲノム配列上でのmRNA転写開始点が推定できる上、その配列の中に含まれるmRNAの安定性や翻訳段階での発現制御に関わる因子の解析が可能である。また、翻訳開始コドンであるatgを5’側に含むことから、正しいフレームでタンパク質への翻訳を行うことができる。したがって、適当な遺伝子発現系を適用することで、そのcDNAがコードするタンパク質を大量に生産したり、タンパク質を発現させてその生物学的活性を解析することも可能になる。このように、完全長cDNAの解析からはゲノム配列解析を相補する重要な情報が得られる。また、発現可能な全長cDNAクローンは、その遺伝子の機能の実証的な解析や産業分野での応用への展開において、その重要性はきわめて高い。
また、同一のゲノムにコードされたタンパク質であっても、それをコードするmRNAが転写される際、ゲノム中一部のエクソンが挿入・欠失して結合する異性体(以下、これを「スプライシングバリアントmRNA」と称することがある)がある。実際、これらのmRNAが翻訳されて生成される、複数種の類似のタンパク質(以下、これらを「スプライシングバリアント」と称することがある)が生体内において確認されている。スプライシングバリアントは、組織特異的、発生段階特異的、あるいは疾患特異的に発現し、それぞれ異なる機能を有していると考えられている。
例えば、エストロゲン受容体βは、10種類のエクソン欠失スプライシングバリアントmRNAが様々なヒト組織より同定されている。このうち9種類が正常乳房組織で発現しているが、その中で、5番と6番のエクソンを欠いたmRNAの発現が、大部分の癌組織で有意に減少することが明らかにされている。また、5番のエクソンを欠いたmRNAは、癌の進行度に応じて、有意にその発現量が変動することが明らかにされている(例えば、非特許文献1を参照。)。このようにスプライシングバリアントの発現量が病態と有意な相関を示すことがある。
このようなスプライシングバリアントのmRNAあるいはcDNAも、従来のcDNAライブラリーやESTからは取得されにくく、転写開始点を含む完全長cDNAライブラリーにより取得される可能性の高いクローンである。
特に、転写因子は、転写反応または遺伝子発現と呼ばれるDNAからmRNAを合成する段階に関与する、DNAに親和性を有するタンパク質であり、極めて多くの因子が知られている。転写反応は、遺伝子産物であるタンパク質の合成量を調節する重要な反応であり、細胞の機能、構造にかかわるタンパク質量を制御していることになる。この転写反応は一群の転写因子によって引き起こされ、例えばRNAポリメラーゼは、TATAボックスや転写開始部位から構成されるプロモーターと呼ばれる転写制御領域の特定の塩基配列を有するDNAに結合し、RNAポリメラーゼを組込んで種々の転写因子が集合した転写複合体を形成してmRNAの合成を開始する。プロモーターに依存する転写反応は遺伝子特異性がなく基本転写と呼ばれ、RNAポリメラーゼおよびRNAポリメラーゼと転写複合体を形成してRNAポリメラーゼに近い部分で働く転写因子は、基本転写因子と呼ばれている。この基本転写とは別に、細胞は生理的環境の変化や外界からの刺激に対し、基本転写のレベルを上下させたり、時期もしくは組織特異的な発現を調節する機構を有している。このような基本転写の調節をつかさどる転写調節領域の特定の塩基配列を有するDNAはエンハンサーもしくはサイレンサーとも呼ばれ、通常はプロモーターの上流に存在し、この領域に結合する転写調節因子(遺伝子特異的転写調節因子、遺伝子発現調節因子もしくは遺伝子発現調節タンパク質とも呼ばれる)が直接もしくは別の転写調節補因子(メディエーター、コファクターもしくは介在因子とも呼ばれる)を介して基本転写因子と相互作用することにより基本転写の調節を行っている(以下、このような基本転写の調節活性を「転写調節活性」と称し、また転写調節因子と転写調節補因子を併せて「転写調節因子」と称することがある)。すなわち、転写因子は、基本転写因子と転写調節因子の2つのカテゴリーに分類される(以下、基本転写因子と転写調節因子を併せて「転写因子」、「転写関連蛋白質」または「DNA・RNA結合蛋白質」と称することがある)。基本転写因子は遺伝子特異性がなく数も少ないが、転写調節因子は非常に多くのものが知られており、その数は類似因子やファミリーを含めると1000のオーダーに達すると考えられているし、その結合部位も多様である。
細胞内または細胞間刺激に対する応答において転写反応を調節することは、例えば、そのような調節が生物の発達に必要な場合に、または生物環境の変化に対する生物の生存に必要な場合にしばしば所望される。しかし、転写反応が不適切に作動または停止することにより、疾患が引き起こされることがある。例えば、エストロゲン介在性遺伝子発現がいくつかの種類の乳癌または卵巣癌に関与することを示唆する証拠が報告されている。また、白血病に伴う染色体転座部位からさまざまな転写調節因子遺伝子が発見されており、この中に転写調節因子同士の融合キメラ分子をコードするものが多数存在することから、転写調節因子の活性の異常が白血病に深く関与する可能性が示唆されている(例えば、非特許文献2を参照。)。このように、転写調節因子の中には、疾患に関与する種々の遺伝子の転写を調節する転写調節因子(以下、これを「疾患関連転写調節因子」と称することがある)が存在する。例えば、疾患関連転写調節因子として、PPARファミリー(例えばPPARα、PPARγ)、p53、NFκB、AP−1、HIF−1、Smadファミリー(例えばSmad1,Smad2,Smad3,Smad4,Smad5,Smad6,Smad7,Smad8)等が知られている。
また、プロテインキナーゼはタンパク質リン酸化を介する細胞内シグナル伝達系(リン酸化カスケード)を調節することにより、種々の生命現象の制御に関わっていることが知られており、疾患との関係が解明されている遺伝子が多い(例えば、非特許文献3を参照。)が、このリン酸化カスケードにおいてリン酸化されて活性化される一群の転写調節因子が関与することも知られており、これらの転写調節因子もプロテインキナーゼと同様に疾患に関与する可能性が示唆されている(例えば、非特許文献4を参照。)。
しかし、上記のとおり、ヒトの体内には約千種もの異なる転写調節因子が存在すると推定されており、まだ多くの転写調節因子遺伝子がクローニングされないままに残されている。したがって、ヒトにおいて分離が進んでいないスプライシングバリアントを含む新規な転写調節因子の全長cDNAを提供する意義は大きい。また、転写調節因子は、治療のための標的分子として、またタンパク質自身に医薬品としての有用性を期待できる。したがって、これらのタンパク質をコードするcDNAの全長を明らかにすることには大きな意義がある。
Poola I et al., J. Steroid Biochem. Mol. Biol., 82: 169-179 (2002). Look, A. T., Science, 278: 1059-1064 (1997) Hunter, T., Cell, 50: 823-829 (1987) Ninomiya-Tsuji, J. et al., Nature 398: 252-256 (1999)
本発明は、完全長cDNAライブラリーに含まれるcDNAクローンの塩基配列を解析し、このうちスプライシングバリアントを含む全長として配列が新規なcDNAについては、これがコードするタンパク質の生理活性を解析および同定し、該生理活性に基づくタンパク質およびそれをコードするDNAの利用方法を提案することを目的とする。
本発明者らは、オリゴキャップ法(Maruyama, K., et al., Gene, 138: 171-174(1994); Suzuki, Y. et al., Gene, 200: 149-156 (1997))を用いて取得されたスプライシングバリアントを含む配列が新規なcDNAについて、該cDNAクローンの塩基配列の相同性に基づきデータベースを検索したところ、該配列に転写調節活性を有するタンパク質に特異的な配列を見出し、これらのcDNAがコードするタンパク質が転写調節因子であると同定した。本発明は、これらの知見に基づいて成し遂げられたものである。
すなわち本発明によれば、以下の1〜15に記載の発明が提供される。
1.以下の(a)または(b)のタンパク質;
(a)配列番号12〜22のいずれかに記載のアミノ酸配列からなるタンパク質、
(b)配列番号12〜22のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質。
2.前項1に記載のタンパク質をコードするDNA。
3.前項1に記載のタンパク質をコードする完全長cDNA。
4.以下の(a)または(b)のいずれかのDNA;
(a)配列番号1〜11のいずれかに記載の塩基配列を有するDNA、
(b)配列番号1〜11のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
(c)配列番号1〜11のいずれかに記載の塩基配列あるいはその相補配列を有するDNAをストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
5.前項2〜4のいずれかに記載のDNAを含む組換えベクター。
6.前項2〜4のいずれかに記載のDNAまたは前項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
7.前項6に記載の細胞により産生される、前項1に記載のタンパク質。
8.前項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
9.前項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
10.抗体がモノクローナル抗体である前項9に記載の抗体。
11.モノクローナル抗体が前項1または7に記載のタンパク質の転写調節活性を中和する作用を有することを特徴とする前項10に記載の抗体。
12.前項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
13.前項1に記載のタンパク質をコードするDNAを発現する細胞または前項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
14.前項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ配列情報および/または前項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
15.前項1に記載のタンパク質および/または前項2〜4のいずれかに記載のDNAを結合させた担体。
本発明のDNAによりコードされる蛋白質は転写調節活性等を有する。このことから、該タンパク質あるいはそれをコードするDNAを用いて該活性を調節する物質をスクリーニングすることができ、該タンパク質が関連する疾患等に作用し得る医薬の開発に有用である。また該タンパク質あるいは該タンパク質に対する抗体、該蛋白質をコードするDNAもしくはRNAもしくはその一部を用いた診断薬への利用、該蛋白質を直接的に利用する疾患治療薬としての利用が挙げられる。さらに該蛋白質をコードするDNAを用いた遺伝子治療、該蛋白質をコードするDNA配列より得られたsiRNA、アンチセンスRNAもしくはDNAもしくは各種アプタマーを利用した、生体内における該蛋白質もしくは該蛋白質をコードするmRNAに対する発現抑制剤として利用することも可能である。
以下に記載する詳細な説明は、本発明の実施態様の一例(代表例)であり、これらの内容に特定はされない。
(1)完全長cDNAの取得
本発明のDNAは、これを取得できる方法であればいかなる方法により取得したものでもよいが、具体的には例えば下述の方法により取得することができる。まず、ヒトの組織あるいは培養細胞等からそれ自体既知の通常用いられる方法によりmRNAを調製する。次に、このmRNAを鋳型としてオリゴキャップ法(Maruyama, K., et al., Gene, 138:171-174 (1994))によりcDNAを取得する。具体的には、取得したmRNAについて酸性ピロフォスファターゼにより5’キャップをはずし、その後露出した5’末端のリン酸基を標的に、オリゴキャップリンカーをRNAライゲースを用いて連結する。ここで、キャップ構造を5’末端に有していないRNA分子について、上記オリゴキャップリンカーが結合しないように、予め5’末端に存在するリン酸基を、5’キャップは外さないが5’端のリン酸基のみ外す活性を有するフォスファターゼ等を用いて外しておくことは有効である。このRNA分子を鋳型として、3’側のプライマーとしてオリゴdTプライマーを用いて逆転写酵素により逆転写を行った後、RNA鎖を分解除去する。
さらに取得された1本鎖DNAを鋳型として、上記オリゴキャップリンカーの部分配列を有するオリゴヌクレオチドを5’プライマーとし、3’末端に特異的なプライマー(オリゴdTプライマー等)を用いてポリメラーゼチェインリアクション(PCR)を行うことにより完全長cDNAライブラリーを作製することができる。ここで、5’プライマーおよび3’プライマーは、上記合成オリゴヌクレオチドおよび逆転写プライマーの全長に対して相補的なものではなく、3’側に3〜10塩基ずらした配列を用いることが好ましい。プライマーの鎖長としては、通常15〜100塩基、好ましくは15〜30塩基が挙げられるが、増幅するcDNAの鎖長が長い場合には25〜35塩基の長さとすることが好ましく、また、Long and Accurate PCR(LA PCR:林健志、実験医学別冊・PCRの最新技術、羊土社;Cheng, S. et al., Nature 369: 684-685 (1994))を用いることが好ましい。
このようにして取得されたcDNAは、これを適当なクローニングベクターに挿入してクローニングを行う。ここで用いられるベクターとしては、取得されたcDNAクローンを細胞に導入して該cDNAがコードするタンパク質を発現できるようなタンパク質発現用ベクターが好ましく用いられる。具体的には例えば、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましく、また大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)等が挙げられる。
かくして取得されるcDNAライブラリーは、それ自体既知の通常用いられる方法により塩基配列の解析を行う。本発明のDNAは、取得されたcDNAの5’末端あるいは3’末端の塩基配列を解析し、これをNCBI(National Center for Biotechnology Information;http://www.ncbi.nlm.nih.gov/)で運用しているGenbank、EMBL、DDBJ、dbEST等の塩基配列データベースをBLAST(Basic local alignment search tool; Altschul, S.F., et al., J. Mol. Biol., 215, 403-410(1990))を用いて検索し、その全長について完全に一致する配列が見出されない場合は新規として以下の解析に供することとした。
上記でcDNAの全長として新規であるとされたクローン、すなわち完全長cDNAの塩基配列を有するDNAとしては、例えば配列番号1〜11のいずれかに記載の塩基配列からなるDNA等が挙げられる。また、これらの塩基配列がコードするアミノ酸配列は配列番号12〜22のいずれかに示すものが挙げられる。さらにその翻訳領域としては、具体的には配列番号1の塩基番号185〜2437、配列番号2の塩基番号2041〜2604、配列番号3の塩基番号466〜3147、配列番号4の塩基番号116〜3646、配列番号5の塩基番号190〜1686、配列番号6の塩基番号1〜1650、配列番号7の塩基番号434〜1180、配列番号8の塩基番号2508〜3953、配列番号9の塩基番号339〜1817、配列番号10の塩基番号170〜1699、配列番号11の塩基番号113〜1600に示される配列を有するものが挙げられる。さらに上記のcDNAの全長でなくても、上記翻訳領域とその3’および/または5’端に隣接する、翻訳領域の発現に最低限必要な部分を含むもの等も本発明のDNAに含まれる。
さらに、本発明のDNAは、上述の方法により取得されたものでも、また合成されたものでもよい。DNAの塩基配列の置換は、例えばサイトダイレクテドミュータジェネシスキット(宝酒造社製)や、クイックチェンジサイトダイレクテッドミュータジェネシスキット(ストラタジーン社製)等の市販キットで容易に行うことができる。
かくして取得され、塩基配列が決定され、また機能が推定される本発明のDNAは上記の配列番号1〜11のいずれかに記載の塩基配列、あるいはその翻訳領域として上記に示した塩基配列を有するものだけでなく、これらの塩基配列において、1もしくは数個(ここで、言う数個とは、例えば15個以下、好ましくは9個以下、より好ましくは6個以下を意味する)の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA、ならびに、これらとストリンジェントな条件下でハイブリダイズし、かつ転写調節活性を有するタンパク質をコードするDNA等も含まれる。これらDNAには前記したとおり、配列番号12〜22のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸配列が欠失、置換および/または付加されたアミノ酸配列からなり、さらに転写調節活性を有するタンパク質をコードするものが含まれる。
ここで、ストリンジェントな条件でハイブリダイズするDNAとは、配列番号1〜12に記載の塩基配列とBLAST解析で80%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有する塩基配列を含むDNA等が挙げられる。また、ストリンジェントな条件下のハイブリダイゼーションとは、通常のハイブリダイゼーション緩衝液中で、温度が40〜70℃、好ましくは60〜65℃等で反応を行い、塩濃度が15mM〜300mM、好ましくは15mM〜60mM等の洗浄液中で洗浄を行う方法に従って行うことができる。
(2)完全長cDNAの塩基配列およびアミノ酸配列の解析
Genbank、EMBL、DDBJ、dbEST等の塩基配列データベースを対象としたBLASTによる相同性検索(homology search)を行い取得されたcDNAの全長として新規な塩基配列は、さらに、NRDBタンパク質データベース(SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース)等のアミノ酸配列データベースを対象としたBLASTによる相同検索等を行うことにより、該塩基配列がコードするタンパク質の機能を推定することができる。その機能予測の具体例として以下に説明する。
配列番号1に記載の塩基配列を有するDNA(BRAMY3011501)は、3498塩基から成り、そのうち塩基番号185から2437までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、750アミノ酸残基から成る(配列番号12)。さらに配列番号12に記載のアミノ酸配列を有するタンパク質は、データベース登録記号Q00839に記載されているアミノ酸配列、Heterogenous nuclear ribonucleoprotein U (hnRNP U) (Scaffold attachment factor A) (SAF-A) (human)と相同性を有する。しかしながら、Q00839に記載されているアミノ酸配列は824アミノ酸から成り、配列番号12に記載のアミノ酸配列とは、全長として89%の相同性しか認められない。
配列番号2に記載の塩基配列を有するDNA(BRACE3041162)は、3381塩基から成り、そのうち塩基番号2041から2604までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、187アミノ酸残基から成る(配列番号13)。さらに配列番号13に記載のアミノ酸配列を有するタンパク質は、データベース登録記号BC006279に記載されているアミノ酸配列、"similar to Zinc finger protein 136" (human) と相同性を有する。しかしながら、BC006279に記載されているアミノ酸配列は504アミノ酸から成り、配列番号13に記載のアミノ酸配列とは、208アミノ酸残基にわたってのみ58%の相同性しか認められない。
配列番号3に記載の塩基配列を有するDNA(THYMU3021586)は、3696塩基から成り、そのうち塩基番号466から3147までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、893アミノ酸残基から成る (配列番号14)。さらに配列番号14に記載のアミノ酸配列を有するタンパク質は,データベース登録記号BC057388に記載されているアミノ酸配列、Sterol regulatory element binding transcription factor 1 (human) と相同性を有する。しかしながら、BC057388に記載されているアミノ酸配列は1147アミノ酸から成り、配列番号14に記載のアミノ酸配列とは、その内の893アミノ酸残基にわたってのみ99%の相同性しか認められない。
配列番号4に記載の塩基配列を有するDNA(BRTHA3014000)は、3864塩基から成り、そのうち塩基番号116から3646までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、1176アミノ酸残基から成る(配列番号15)。配列番号15に記載のアミノ酸配列を有するタンパク質はデータベース登録記号AL096814に記載されているアミノ酸配列、zinc finger transcription regulating protein TReP-132, variant 1 (human) と相同性を有する。しかしながら、AL096814に記載されているアミノ酸配列は1200アミノ酸から成り、配列番号15に記載のアミノ酸配列とは、その内の1176アミノ酸残基にわたってのみ98%の相同性しか認められない。
配列番号5に記載の塩基配列を有するDNA(BRACE3034183)は、3466塩基から成り、そのうち塩基番号190から1686までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、498アミノ酸残基から成る (配列番号16)。配列番号16に記載のアミノ酸配列を有するタンパク質はデータベース登録記号P17020に記載されているアミノ酸配列、zinc finger protein 16 (zinc finger protein kox9) (human) と相同性を有する。しかしながら、P17020に記載されているアミノ酸配列は670アミノ酸から成り、配列番号16に記載のアミノ酸配列とは、その内の385アミノ酸残基にわたってのみ58%の相同性しか認められない。
配列番号6に記載の塩基配列を有するDNA(FCBBF3020030)は、2854塩基から成り、そのうち塩基番号1から1650までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、549アミノ酸残基から成る (配列番号17)。配列番号17に記載のアミノ酸配列を有するタンパク質はデータベース登録記号AF119042に記載されているアミノ酸配列、transcriptional intermediary factor 1 α (human) と相同性を有する。しかしながら、AF119042に記載されているアミノ酸配列は1016アミノ酸から成り、配列番号17に記載のアミノ酸配列とは、その内の490アミノ酸残基にわたってのみ89%の相同性しか認められない。
配列番号7に記載の塩基配列を有するDNA(BRHIP3007960)は、5401塩基から成り、そのうち塩基番号434から1180までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、248アミノ酸残基から成る (配列番号18)。配列番号18に記載のアミノ酸配列を有するタンパク質はデータベース登録記号Y12713に記載されているアミノ酸配列、Pro-Pol-dUTPase polyprotein (mouse) と相同性を有する。しかしながら、Y12713に記載されているアミノ酸配列は、1182アミノ酸から成り、配列番号18に記載のアミノ酸配列とは、その内の246アミノ酸残基にわたってのみ84%の相同性しか認められない。
配列番号8に記載の塩基配列を有するDNA(BRTHA2026290)は、4104塩基から成り、そのうち塩基番号2508から3953までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、481アミノ酸残基から成る (配列番号19)。配列番号19に記載のアミノ酸配列を有するのタンパク質はデータベース登録記号AK056257に記載されているアミノ酸配列、"FLJ31695 fis, clone NT2RI2005811, weakly similar to CELL DIVISION CONTROL PROTEIN 25" (human)と相同性を有する。しかしながら、AK056257に記載されているアミノ酸配列は473アミノ酸から成り、配列番号19に記載のアミノ酸配列とは、その内の446アミノ酸残基にわたってのみ61%の相同性しか認められない。
配列番号9に記載の塩基配列を有するDNA(BRTHA2026311)は、2682塩基から成り、そのうち塩基番号339から1817までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、492アミノ酸残基から成る (配列番号20)。配列番号20に記載のアミノ酸配列を有するタンパク質はデータベース登録記号Q15084に記載されているアミノ酸配列、protein disulfide isomerase a6 precursor (human)と相同性を有する。しかしながら、Q15084に記載されているアミノ酸配列は440アミノ酸から成り、配列番号20に記載のアミノ酸配列とは、その内の434アミノ酸残基にわたってのみ99%の相同性しか認められない。
配列番号10に記載の塩基配列を有するDNA(BRAWH3031342)は、3978塩基から成り、そのうち塩基番号170から1699までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、509アミノ酸残基から成る (配列番号21)。配列番号21に記載のアミノ酸配列を有するタンパク質はデータベース登録記号Q96SE7に記載されているアミノ酸配列、zinc finger protein 347と相同性を有する。しかしながら、Q96SE7に記載されているアミノ酸配列は839アミノ酸から成り、配列番号21に記載のアミノ酸配列とは、その内の508アミノ酸残基にわたってのみ60%の相同性しか認められない。
配列番号11に記載の塩基配列を有するDNA(TESTI4005322)は、3946塩基から成り、そのうち塩基番号113から1600までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、495アミノ酸残基から成る (配列番号22)。配列番号22に記載のアミノ酸配列を有するのタンパク質はデータベース登録記号Q96JC4に記載されているアミノ酸配列、zinc finger protein 479 (human)と相同性を有する。しかしながら、Q96JC4に記載されているアミノ酸配列は524アミノ酸から成り、配列番号22に記載のアミノ酸配列とは、その内の524アミノ酸残基にわたってのみ77%相同性しか認められない。
前述の様に、公知のcDNAおよびそれにコードされる蛋白質のアミノ酸配列と比較した結果、本発明であるcDNAおよびそれにコードされる蛋白質のアミノ酸配列に関して同一のもの全くは存在しないこと、さらに本発明であるcDNAおよびそれにコードされる蛋白質のアミノ酸配列の一部分に関して相同性が見られるものの、その相同性においても同一のもの全くは存在しない。従って、本発明において新規なcDNAおよびそれにコードされる蛋白質のアミノ酸配列を見い出すに至った事となる。しかしながら,本発明に記載されたcDNAおよびそれにコードされる蛋白質のアミノ酸配列は新規のものである事から、公然として知られた状態の情報、例えば単にcDNAもしくはアミノ酸配列に関してデータベースを利用してその相同性を比較検討し、その生体内における機能を特定かつ実証することは困難であり、(3)で述べるさらなる解析に供することが必要である。
なお、相同性検索の場合はGenBank、Swiss-Prot、UniGene、nr、RefSeqといった各データベースを対象にBLASTやFASTAなどで相同性検索を行い、ヒットした遺伝子とそれがコードしている蛋白質の機能を参照することで本発明のcDNAがコードしている蛋白質の機能を推定することができる。また、構造からの予測においては全塩基配列から推定されたアミノ酸配列に対して、シグナル配列、膜貫通領域の予測ならばPSORT [K. Nakai & M. Kanehisa, Genomics, 14: 897-911 (1992)]やSOSUI[T.Hirokawa et.al. Bioimformatics, 14, 378-379 (1998)](三井情報開発株式会社販売)、MEMSAT[D.T.Jones, W.R.Taylor & J.M.Thornton, Biochemistry, 33, 3038-3049 (1994)]など、またモチーフやドメインの予測ならばPfamやPROSITE (http://www.expasy.ch/prosite/)等に対して検索を行うことによって、クローン中にコードされる蛋白質のより詳細な機能予測が可能である。
このようにして、全長として新規な塩基配列を有することが明らかとなったDNAを有する11クローンについて、GenBank、Swiss-Prot、nr、RefSeq の各データベースを対象に相同性検索を行うことができる(実施例3および4参照)。また全長塩基配列から推定されたアミノ酸配列に対してPSORT、SOSUIを用いたシグナル配列、および膜貫通領域の検索を行うことができる(実施例6参照)。
また、Swiss-Protヒットデータ、及びnr、RefSeqヒットデータが、ヒトの遺伝子と疾患のデータベースであるOnline Mendelian Inheritance in Man (OMIM)に登録されている遺伝子、蛋白質であれば、疾患関連蛋白質と推定できる(実施例4参照)。このようにして、アノテーションを基本とした機能予測(Swiss-Protのヒットデータであればキーワードを参照する。nr、RefSeqのヒットデータであればDefinitionやReference情報を参照する)、および推定ORFに対するPSORTを用いたシグナルシークエンス検索、SOSUIを用いた膜貫通領域の検索、OMIM登録の結果をあわせて、14種類の機能カテゴリー(分泌・膜蛋白質、糖蛋白関連蛋白質、シグナル伝達関連蛋白質、転写関連蛋白質、疾患関連蛋白質、酵素・代謝関連蛋白質、細胞分裂・増殖関連蛋白質、細胞骨格関連蛋白質、核蛋白質・RNA合成関連蛋白質、蛋白質合成・輸送関連蛋白質、細胞防御関連蛋白質、発生・分化関連蛋白質、DNA・RNA結合蛋白質、ATP・GTP結合蛋白質)への分類を行うことができる。
具体的には、配列番号12に記載のアミノ酸配列を有する蛋白質は、疾患関連蛋白質、核蛋白質・RNA合成関連蛋白質、DNA・RNA結合蛋白質、ATP・GTP結合蛋白質に属すると推定できる。
配列番号13に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、疾患関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号14に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、疾患関連蛋白質、細胞分裂・増殖関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号15に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号16に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号17に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、疾患関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号18に記載のアミノ酸配列を有する蛋白質は、分泌・膜蛋白質に属すると推定できる。
配列番号19に記載のアミノ酸配列を有する蛋白質は、シグナル伝達関連蛋白質、疾患関連蛋白質に属すると推定できる。
配列番号20に記載のアミノ酸配列を有する蛋白質は、分泌・膜蛋白質、酵素・代謝関連蛋白質に属すると推定できる。
配列番号21に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、疾患関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号22に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、疾患関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
(3)新規cDNAがコードするタンパク質のアミノ酸配列のモチーフおよびドメイン解析
蛋白質全体の構造はモチーフ、ドメインといった最小限構造の寄せ集めで成り立っており、その結果、タンパク質全体としての機能が発揮されると考えられるので、本発明において全塩基配列が明らかになった新規な完全長cDNAがコードするタンパク質のアミノ酸配列に対して、種々の蛋白質が有する最小単位の共通したモチーフ、ドメイン構造に着目し,本発明の蛋白質を解析し、共通となるモチーフ、ドメイン構造もしくは共通となるモチーフ、ドメイン構造機能の解析を行うことができる。具体的には、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics 14: 755-763(1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search:http://pfam.wustl.edu)等を行うことにより、ドメインやモチーフ構造の解析から、その蛋白質が全体として細胞内でどのような働きを担っているかということを分子レベルで予測することができる(実施例5および6参照)。
例えば、アミノ酸配列中にシグナル配列、膜貫通領域、核移行シグナル、糖鎖付加シグナル、リン酸化部位、及びZinc fingerモチーフ、SH3ドメイン等を見出すことにより,本発明のcDNAがコードしている蛋白質の共通となる機能推定を試みることができる。特にモチーフ、ドメインなどの構造はいくつかの蛋白質に共通して見出される部分配列構造で、蛋白質の最小限機能構造であり、現在までに機能が明らかとなっているもの、なっていないもの全て合わせてPfam(http://www.sanger.ac.uk/Software/Pfam/index.shtml)のVersion7.7(2002年12月現在での最新版)においては4832種類が同定され、データベース化されている。かくして行われるタンパク質の機能予測の具体的な例として以下に説明する。
配列番号12に記載のアミノ酸配列は、SAP、SPRY、SRP54と呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号12に記載のアミノ酸配列を有する蛋白質はDNA結合活性、核におけるチャンネル/ポアー転移活性、GTP結合活性、核酸結合活性、蛋白質ターゲッティングシグナル配列に対する認識活性を有していると考えられる。
配列番号13に記載のアミノ酸配列は、zf-C2H2、zf-BED、PHD、zf-MIZ、zf-UBR1と呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号13に記載のアミノ酸配列を有する蛋白質は,DNA結合活性、重金属結合活性、転写因子としての活性、転写調節因子としての活性、DNAライゲーション活性、さらにユビキチンサイクルへの関与、ユビキチンー蛋白質ライゲーション活性を有していると考えられる。
配列番号14に記載のアミノ酸配列は、HLH、G-gammaと呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号14に記載のアミノ酸配列を有する蛋白質は,DNA結合活性、RNAポリメラーゼ活性、転写因子としての活性、蛋白質に対する結合/相互作用活性、G−蛋白質共役受容体におけるシグナル伝達に関与する事、G−蛋白GTPaseやG−蛋白質複合体としての作用、ハイドロラーゼ、核酸結合活性、シグナルトランスディユーサー活性を有していると考えられる。
配列番号15に記載のアミノ酸配列は、Birna VP3、zf-C2H2、ELM2、myb DNA-binding と呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号15に記載のアミノ酸配列を有する蛋白質は、DNA結合活性、重金属結合活性、DNA結合蛋白質に対する結合活性を有していると考えられる。
配列番号16に記載のアミノ酸配列は、zf-C2H2、PHD、Metallothio PEC、TFIIS、FYVE、zf-BED、RNA POL M 15KD、zf-TRAF、LIMと呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号16に記載のアミノ酸配列を有する蛋白質はDNA結合活性、重金属結合活性、転写因子としての活性、転写調節因子としての活性、亜鉛結合活性、ポリメラーゼII型などの転写伸長因子としての活性、RNA伸長活性、RNAポリメラーゼII型などの転写因子としての活性、DNA依存性RNAポリメラーゼ活性、トランスフェラーゼ活性、アポートーシス(プログラム細胞死)に関する調節因子としての活性を有していると考えられる。
配列番号17に記載のアミノ酸配列は、zf-B boxと呼ばれるモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号17に記載のアミノ酸配列を有する蛋白質は、DNA結合活性、重金属結合活性、細胞内局在活性、リボヌクレオ蛋白質としての活性、転写因子としての活性、亜鉛結合活性を有していると考えられる。
配列番号18に記載のアミノ酸配列は、Prog receptor、rvtと呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号18に記載のアミノ酸配列を有する蛋白質は、DNA結合活性、核酸結合活性、ステロイド結合活性、ステロイドホルモン受容体としての活性、転写調節因子としての活性、RNA結合活性、RNA依存性DNA複製活性、RNA依存性DNAポリメラーゼ活性、トランスフェラーゼ活性を有していると考えられる。
配列番号19に記載のアミノ酸配列は、RasGEFN、RepB_protein、RasGEFと呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号19に記載のアミノ酸配列を有する蛋白質は、グアニルーヌクレオチド転移因子としての活性、受容体からのシグナルを伝達する蛋白質としての活性、スモールGTPaseが関与するシグナル伝達蛋白質としての活性、DNA結合活性、DNA複製因子としての活性、DNA複製開始因子としての活性、DNA依存性DNAポリメラーゼとしての活性、エクストラクロモゾームにおける環状DNAへの関与、一本鎖型DNAに対する結合活性、ハイドロラーゼ、細胞内シグナル伝達カスケードへの関与、核酸結合活性、受容体からのシグナル伝達に関与する性質を有していると考えられる。
配列番号20に記載のアミノ酸配列は、thiored、HTH4と呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号20に記載のアミノ酸配列を有する蛋白質は、ジスルフィド結合に対する酸化還元酵素としての活性、電子転移活性、チオレドキシンとしての作用、DNA結合活性、転写因子としての活性、転写調節因子としての活性を有していると考えられる。
配列番号21に記載のアミノ酸配列は、zf-C2H2、zf-MIZ、HNH、TFIIS、SH2と呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号21に記載のアミノ酸配列を有する蛋白質は、DNA結合活性、重金属結合活性、エンドヌクレアーゼ活性、ハイドロラーゼ、核酸結合活性、ポリメラーゼII型などの転写伸長因子としての活性、RNA伸長活性、RNAポリメラーゼII型などの転写因子としての活性、転写因子としての活性、転写調節因子としての活性、細胞内シグナル伝達カスケードへの関与、核酸結合活性、蛋白質に対する結合/相互作用活性を有していると考えられる。
配列番号22に記載のアミノ酸配列は、KRAB、CBD1、zf-C2H2、zf-BED、zf-TRAF、zf-MIZ、LIMと呼ばれる複数のモチーフ、ドメインを有している。そのモチーフ、ドメインが有する性質より、配列番号22に記載のアミノ酸配列を有する蛋白質は、DNA結合活性、核酸結合活性、細胞内局在に関与する性質、転写因子としての活性、転写調節因子としての活性、転写抑制因子としての活性、重金属結合活性、アポートーシス(プログラム細胞死)に関する調節因子としての活性、受容体を有していると考えられる。
さらに、本発明において全塩基配列が明らかになった新規な完全長cDNAを有する11クローンについて、推定されたアミノ酸配列のPfam(http://www.sanger.ac.uk/Software/Pfam/index.shtml)に対するドメイン検索の結果(実施例5参照)から得られるヒットデータのドメイン、モチーフ名やアクセッション番号を用いて、Pfamのサイト内やInterPro(http://www.ebi.ac.uk/interpro/)、PROSITE (http://www.expasy.ch/cgi-bin/prosite-list.pl)等の各リンク先における各ドメイン、モチーフの詳細な説明や、特にPROSITEにおいては独自の機能カテゴリー分類を参照することができる。このようにして、Pfamでヒットした11クローン中にコードされるタンパク質の機能予測を行い、14種類の機能カテゴリー(分泌・膜蛋白質、糖蛋白関連蛋白質、シグナル伝達関連蛋白質、転写関連蛋白質、疾患関連蛋白質、酵素・代謝関連蛋白質、細胞分裂・増殖関連蛋白質、細胞骨格関連蛋白質、核蛋白質・RNA合成関連蛋白質、蛋白質合成・輸送関連蛋白質、細胞防御関連蛋白質、発生・分化関連蛋白質、DNA・RNA結合蛋白質、ATP・GTP結合蛋白質)への分類を行うことができる。
具体的には、配列番号13に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号14に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号15に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号16に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、酵素・代謝関連蛋白質、核蛋白質・RNA合成関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号17に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号18に記載のアミノ酸配列を有する蛋白質は、DNA・RNA結合蛋白質、酵素・代謝関連蛋白質に属すると推定された。
配列番号19に記載のアミノ酸配列を有する蛋白質は、シグナル伝達関連蛋白質、酵素・代謝関連蛋白質、核蛋白質・RNA合成関連蛋白質、DNA・RNA結合蛋白質、ATP・GTP結合蛋白質に属すると推定できる。
配列番号20に記載のアミノ酸配列を有する蛋白質は、酵素・代謝関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号21に記載のアミノ酸配列を有する蛋白質は、シグナル伝達関連蛋白質、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
配列番号22に記載のアミノ酸配列を有する蛋白質は、転写関連蛋白質、DNA・RNA結合蛋白質に属すると推定できる。
また、モチーフやドメインの機能が必ずしも上記に示す機能カテゴリーの一つのみに属するわけではないため、いずれで予測された機能カテゴリーにも該当する可能性がある。またこれら以外にPfamでヒットデータがなかった場合でも、今後タンパク質のデータの蓄積と共に新たなドメイン、モチーフが見い出された場合、再びクローンの推定アミノ酸配列を新しいデータベースに対して解析することで新たな機能を有したドメイン、モチーフが発見され、カテゴリー分類できる可能性がある。
なお、上述したカテゴリー分類において、分泌・膜蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中に growth factor, cytokine, hormone, signal, transmembrane, membrane, extracellular matrix, receptor, G-protein coupled receptor, ionic channel, voltage-gated channel, calcium channel, cell adhesion, collagen, connective tissue 等、分泌・膜蛋白質と推定される記載があった、もしくはPSORTとSOSUIによる推定ORFの解析の結果、シグナルシークエンスや膜貫通領域があった、またPfamによるドメイン、モチーフ検索の結果、受容体、イオンチャンネル、ホルモン、成長因子などと推測されるような例えば7 transmembrane receptor, Pancreatic hormone peptides, Ion transport protein, Fibroblast growth factor等のドメイン、モチーフがあるクローンである。
糖蛋白質関連蛋白質のカテゴリーに属すると推定されるクローンとは、相同性検索の結果、ヒットデータ中に glycoprotein 等、糖蛋白質関連蛋白質と推定される記載がある、あるいはPfamによるドメイン、モチーフ検索の結果、糖タンパク質、糖転移酵素などGlycobiologyに関わると推測されるような例えばImmunoglobulin domain, Glycosyl transferases group 1等のドメイン、モチーフがあるクローンである。
シグナル伝達関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中に serine/threonine-protein kinase, tyrosine-protein kinase, SH3 domain, SH2 domain等、シグナル伝達関連蛋白質と推定される記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、タンパク質リン酸化酵素、脱リン酸化酵素、SH2ドメイン、Small Gタンパク質などと推測されるような例えばEukaryotic protein kinase domain, Protein phosphatase 2C, Ras family等のドメイン、モチーフがあったクローンである。
転写関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中に transcription regulation, zinc finger, homeobox 等、転写関連蛋白質と推定される記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、転写因子や転写調節に関わるタンパク質などと推測されるような例えばbZIP transcription factor, Zinc finger, C2H2 type等のドメイン、モチーフがあったクローンである。
疾患関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中に disease mutation, syndrome 等、疾患関連蛋白質と推定される記載があった、あるいは全長塩基配列に対するSwiss-Prot、nr、RefSeqヒットデータが、後述するヒトの遺伝子と疾患のデータベースであるOnline Mendelian Inheritance in Man (OMIM)(http://www.ncbi.nlm.nih.gov/Omim/)に登録されている遺伝子や蛋白質であった、また、Pfamによるドメイン、モチーフ検索の結果、特定の疾患で発現が見られるようなタンパク質や、疾患で発現が上昇したり減少したりすると推測されるような例えばWilm's tumour protein, von Hippel-Lindau disease tumor suppressor protein等のドメイン、モチーフがあるクローンである。
酵素・代謝関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中にmetabolism, oxidoreductase, E.C.No. (Enzyme commission number)等、酵素・代謝関連蛋白質と推定される記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、転移酵素、合成酵素、加水分解酵素などと推測されるような例えばAldehyde dehydrogenase family, Chitin synthase, Glucose-6-phosphate dehydrogenase等のドメイン、モチーフがあったクローンである。
細胞分裂・増殖関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、cell division, cell cycle, mitosis, chromosomal protein, cell growth, apoptosis等、細胞分裂・増殖関連蛋白質と推定される記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、サイクリン、細胞増殖制御タンパク質などと推測されるような例えばCyclin, Cell division protein等のドメイン、モチーフがあるクローンである。
細胞骨格関連蛋白質のカテゴリーに属すると推定されるクローンとは、相同性検索の結果、ヒットデータ中にstructural protein, cytoskeleton, actin-binding, microtubles等、細胞骨格関連蛋白質と推定される記載がある、あるいはPfamによるドメイン、モチーフ検索の結果、アクチン、キネシン、フィブロネクチンなどと推測されるような例えばActin, Fibronectin type I domain, Kinesin motor domain等のドメイン、モチーフがあるクローンである。
核蛋白質・RNA合成関連蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中にnuclear protein, RNA splicing, RNA processing, RNA helicase, polyadenylation等、核蛋白質・RNA合成関連蛋白質と推定される記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、スプライシング因子、RNA合成酵素、へリカーゼなどと推測されるような例えばHepatitis C virus RNA dependent RNA polymerase, DEAD/DEAH box helicase等のドメイン、モチーフがあったクローンである。
蛋白質合成・輸送関連蛋白質のカテゴリーに属すると推定されるクローンとは、相同性検索の結果、ヒットデータ中にtranslation regulation, protein biosynthesis, amino-acid biosynthesis, ribosomal protein, protein transport, signal recognition particle等、蛋白質合成・輸送関連蛋白質と推定される記載がある、あるいはPfamによるドメイン、モチーフ検索の結果、翻訳関連タンパク質、ユビキチン関連タンパク質、Ribosomal proteinなどと推測されるような例えばTranslation initiation factor SUI1, Ubiquitin family, Ribosomal protein L16等のドメイン、モチーフがあるクローンである。
細胞防御関連蛋白質のカテゴリーに属すると推定されるクローンとは、相同性検索の結果、ヒットデータ中にheat shock, DNA repair, DNA damage等、細胞防御関連蛋白質と推定される記載がある、あるいはPfamによるドメイン、モチーフ検索の結果、分子シャペロン、DNA修復タンパク質などと推測されるような例えばHsp90 protein, DNA mismatch repair protein等のドメイン、モチーフがあるクローンである。
発生・分化関連蛋白質のカテゴリーに属すると推定されるクローンとは、相同性検索の結果、ヒットデータ中にdevelopmental protein等、発生・分化関連蛋白質と推定される記載がある、あるいはPfamによるドメイン、モチーフ検索の結果、器官形成関連タンパク質などと推測されるような例えばFloricaula / Leafy protein等のドメイン、モチーフがあるクローンである。
DNA・RNA結合蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中にDNA-binding, RNA-binding等と記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、転写因子、DNAリガーゼをはじめとしたDNA・RNA関連酵素類、Zinc-finger関連タンパク質などと推測されるような例えばTranscription factor WhiB, B-box zinc finger, tRNA synthetases class I (C)等のドメイン、モチーフがあったクローンである。
ATP・GTP結合蛋白質のカテゴリーに属すると推定されたクローンとは、相同性検索の結果、ヒットデータ中にATP-binding, GTP-binding等と記載があった、あるいはPfamによるドメイン、モチーフ検索の結果、ATPase等をはじめとしたATP・GTP関連酵素類、Gタンパク質などと推測されるような例えばE1-E2 ATPase, Ras family等のドメイン、モチーフがあったクローンである。
以上のように、配列番号12〜22に記載のアミノ酸配列をそれぞれ有する本発明の蛋白質が有する最小単位の共通したモチーフ、ドメイン構造に着目し、共通となるモチーフ、ドメイン構造もしくは共通となるモチーフ、ドメイン構造機能の解析を行い、本発明のDNA(配列番号1〜11)は、特に、DNAもしくはRNAなどの核酸と親和性を有するモチーフやドメイン構造をそれぞれ共通点として有し、さらに転写関連蛋白質、DNA・RNA結合蛋白質としての機能カテゴリーに属する蛋白質をコードすることを共通点として見出すことができる。
(4)新規cDNAがコードするタンパク質
本発明のDNAがコードするタンパク質の翻訳領域は、例えば、該DNAが有する塩基配列について3種類の読み枠によりアミノ酸に変換していき、最も長いポリペプチドをコードする範囲を本発明のタンパク質の翻訳領域としてそのアミノ酸配列を推定することができる。このようなアミノ酸配列として例えば、配列番号12〜22のいずれかに記載のもの等が挙げられる。また、本発明のタンパク質は、上記のアミノ酸配列に限られるものではなく、該アミノ酸配列において1もしくは数個のアミノ酸が置換、欠失、および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するものも含まれる。
本発明のタンパク質の取得方法としては、(1)に記載の本発明のDNAを適当な方法により転写/翻訳する方法が好ましく用いられる。具体的には、適当な発現用ベクターもしくは適当なベクターに適当なプロモーターとともに挿入した組換えベクターを作製し、この組換えベクターで適当な宿主微生物を形質転換したり、適当な培養細胞に導入することにより発現させ、これを精製することにより取得することができる。
また、そのN末端またはC末端に適当なタグが融合するように設計されたベクターなどに挿入してタグを付加したタンパク質も本発明のタンパク質に含まれる。タグとして具体的には、グルタチオン−S−トランスフェラーゼ、ポリヒスチジン、Flagなどが挙げられる。
上記形質転換体が産生するタンパク質には、タンパク質合成時に重原子などで置換・修飾したアミノ酸を取り込ませることにより修飾することができる。また、タンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。例えば、N末端アセチル化、C末端アミド化などの末端修飾、糖鎖付加、脂質付加、アシル化、メチル化、スルホン化、カルボキシル化、水酸化、リン酸化、ADP−リボシル化などであるが、必ずしもこれらに限定されない。これらの修飾タンパク質も上記した転写調節活性を有するものであれば本発明の範囲に含まれる。
また、上記形質転換体が産生するタンパク質を、精製の前又は後に適当なタンパク質修飾酵素を作用させることにより、任意に修飾を加えたり、ポリペプチドを部分的に除去することにより修飾タンパク質とすることができる。これらの修飾タンパク質も上記した転写調節活性を有するものであれば本発明の範囲に含まれる。
本発明のタンパク質の産生を行う際、本発明のDNAを含む組換えベクターの作製に用いるベクターとしては、形質転換体内で該DNAが発現されるものであれば特に制限はなく、プラスミドベクター、ファージベクターのいずれでもよい。これらのうち通常は、該DNAが導入される宿主に適したプロモーター等の発現制御領域DNAが既に挿入されている市販のタンパク質発現用ベクターを用いる。このようなタンパク質発現用ベクターとして、具体的には例えば、宿主が大腸菌の場合では、pET3、pET11(ストラタジーン社製)、pGEX(アマシャムファルマシアバイオテク社製)等が挙げられ、酵母の場合ではpESP−Iエクスプレッションベクター(ストラタジーン社製)等が挙げられ、さらに昆虫細胞の場合ではBacPAK6(クロンテック社製)等が用いられる。また宿主が動物細胞の場合では、ZAP Express(ストラタジーン社製)、pSVK3(アマシャムファルマシアバイオテク社製)が挙げられ、宿主が哺乳動物細胞等の場合にはpME18SFL3(Genbank AB009864)等が好ましい。
発現制御領域が挿入されていないベクターを用いる場合には、発現制御領域として少なくともプロモーターを挿入する必要がある。ここでプロモーターとしては、宿主微生物または培養細胞が保有するプロモーターを用いることができるが、これに限られるものではなく、具体的には例えば、宿主が大腸菌の場合にはT3、T7、tac、lacプロモーター等を用いることができ、酵母の場合にはnmt1プロモーター、Gal1プロモーター等を用いることができる。昆虫細胞の場合には、ポリヘドリンプロモーター等を用いることができる。また宿主が動物細胞の場合にはSV40プロモーター、CMVプロモーター等が好ましく用いられる。
また哺乳動物由来のプロモーターが機能可能な宿主を用いる場合には、本発明の遺伝子に固有のプロモーターを用いることもできる。これらのベクターへの本発明のDNAの挿入は、該DNAまたはこれを含むDNA断片をベクター中のプロモーターの下流に該遺伝子DNAがコードするタンパク質のアミノ酸配列を連結して行えばよい。
このようにして作製した組換えベクターは、それ自体既知の方法により後述する宿主を形質転換して、DNA導入体を作製することができる。宿主への該ベクターの導入方法として、具体的には、ヒートショック法(J. Mol. Biol., 53: 154 (1970))、リン酸カルシウム法(Science, 221: 551 (1983))、DEAEデキストラン法(Science, 215: 166 (1982))、インビトロパッケージング法(Proc. Natl. Acad. Sci. USA, 72: 581 (1975))、ウィルスベクター法(Cell, 37: 1053 (1984))、および電気パルス法(Chu. et al., Nuc. Acids Res., 15: 1331 (1987))等が挙げられる。
DNA導入体を作製するための宿主としては、本発明のDNAが体内で発現するものであれば特に限定されないが、例えば大腸菌、酵母、バキュロウィルス(節足動物多角体ウイルス)−昆虫細胞、あるいは動物細胞等が挙げられる。具体的には、大腸菌ではBL21、XL−2Blue(ストラタジーン社製)等、酵母ではSP−Q01(ストラタジーン社製)等、バキュロウィルスではAcNPV(J. Biol. Chem., 263: 7406 (1988))とその宿主であるSf−9細胞(J. Biol. Chem., 263: 7406 (1988))等が挙げられる。また動物細胞としてはマウス繊維芽細胞C127(J. Viol., 26: 291 (1978))やチャイニーズハムスター卵巣細胞CHO細胞(Proc. Natl. Acad. Sci. USA, 77: 4216 (1980))等が挙げられるが、発現量やスクリーニングの簡便さから好ましくはアフリカミドリザル腎臓由来COS−7細胞(ATCC CRL1651:アメリカンタイプカルチャーコレクション保存細胞)、ヒト胎児腎臓由来HEK293細胞(ATCC CRL1573)またはヒト子宮頸部癌HeLa細胞(ATCC CCL−2)が用いられる。
上記したようなタンパク質発現用ベクターを用いる発現方法の他に、プロモーターを連結した本発明のDNA断片を宿主微生物の染色体中に直接挿入する相同組換え技術(Vertes, A. A. et al., Biosci. Biotechnol. Biochem., 57: 2036 (1993))、あるいはトランスポゾンや挿入配列(Vertes, A. A. et al., Molecular Microbiol., 11: 739 (1994))等を用いてDNA導入体を作製することもできる。
上記で得られた培養物は細胞または菌体を遠心分離等の方法により収集し、これを適当な緩衝液に懸濁し、超音波、リゾチーム、および/または凍結融解等のそれ自体既知の適当な方法により破壊した後、遠心分離や濾過等によりタンパク質粗精製液を得、さらに適当な精製方法を組み合わせることにより精製することができる。
かくして、本発明のタンパク質が取得される。上記したタンパク質発現組換えベクターを用いる発現方法の他に、上記(1)で取得された本発明のDNAを無細胞転写翻訳系(または「無細胞タンパク質合成系」とも称する)に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられる。無細胞タンパク質合成系として具体的には、大腸菌、植物種子の胚芽、ウサギ網状赤血球等の細胞抽出液等の既知のものが用いられる。これらは市販のものを用いることもできるし、それ自体既知の方法、具体的には大腸菌抽出液は、Pratt, J. M., Transcription and Translation (Ed. by Hames, B. D. and Higgins, S. J.), 179-209, IRL Press, Oxford (1984)に記載の方法等に準じて調製することもできる。市販の無細胞タンパク質合成系、または細胞抽出液としては、大腸菌由来のものは、E. coli S30 extract system(Promega社製)とRTS500 Rapid Translation System(Roche社製)等が挙げられ、ウサギ網状赤血球由来のものはRabbit Reticulocyte Lysate System(Promega社製)等、さらにコムギ胚芽由来のものはPROTEIOSTM(TOYOBO社製)等が挙げられる。
得られた無細胞転写翻訳系の転写翻訳産物からの、本発明のタンパク質の分離、および精製は、それ自体既知の通常用いられる方法で行うことができる。具体的には、エピトープペプチド(例えば、ポリヒスチジンペプチド、グルタチオン−S−トランスフェラーゼ(GST)、マルトース結合タンパク質等)をコードするDNA領域を、前記した転写翻訳されるべきDNAに導入し、前記の通り発現させ、該タンパク質と親和性を有する物質とのアフィニティーを利用して精製することができる。
目的とするタンパク質の発現は、SDS−ポリアクリルアミドゲル電気泳動等で分離し、クマシーブリリアントブルー(シグマ社製)等で染色するか、または後述する本発明のタンパク質に特異的に結合する抗体により検出する方法等によって確認できる。また一般的に、発現されたタンパク質は生体内に存在するタンパク質分解酵素により切断されること(プロセッシング)が知られている。本発明のタンパク質も当然のことながら切断されたアミノ酸配列の部分断片であっても、転写調節活性を有するものであれば、本発明のタンパク質に含まれる。
(5)本発明のDNAがコードするタンパク質の活性の確認および解析
(5−1)無細胞タンパク合成系を用いたタンパク質の合成
本発明のDNAがコードする蛋白質(配列番号12〜22)が種々の転写関連蛋白質もしくはDNA・RNA結合蛋白質として機能するか否かは、これを上記に記載のとおり組換えタンパク質として作製し、以下に説明する方法等で、推測した活性を有していることを確認および解析することができる。
一般的に転写関連蛋白質、例えば転写調節因子はプロモーターと呼ばれる転写制御領域のDNAと結合する活性を有する。もし本発明における蛋白質が転写制御領域のDNAと親和性を有するならば、本発明における蛋白質はその転写制御において極めて重要な機能を有していることを実証することとなる。さらにここで使用する転写制御領域のDNAが疾患との関連が示されている場合、その疾患と本発明における蛋白質との関連を結びつけることが可能である。そこで、各種疾患との関与が示されている転写制御領域のDNAに対する本発明蛋白質の親和性を解析することができる。
一方、既知の疾患に関与することが知られている転写因子とその転写制御領域DNAの親和性に関し,本発明における蛋白質が及ぼす影響についても検討を加えることができる。具体的には核内受容体が有するDNA結合活性、より具体的にはPPARγやPPARαなどのPPARファミリー、p53、NFκB、AP-1、HIF-1、Smad3やSmad4などのSmadファミリーなどの転写因子が有するDNA結合活性に着目し、本発明における蛋白質に関し,新しい転写調節因子としての機能を見出すことができる。すなわち、(a)転写調節因子が転写因子と相互作用して転写因子の活性を増強するなら、転写因子とDNAの結合活性は上昇する。(b)転写調節因子が転写因子と相互作用して転写因子の活性を抑制するなら、転写因子とDNAの結合活性は低下し、(c)転写調節因子がDNAと直接相互作用するならば、転写因子とDNAの結合活性を増強または抑制する。そしていずれの場合においても、DNAと転写因子の結合変化を指標に、本発明における蛋白質に関し,新しい転写調節因子として機能を同定することが可能となる。特に数多くの転写制御領域のDNAと個別に合成した本発明蛋白質の親和性をハイスループットで解析する等の際、本発明蛋白質を前述の無細胞タンパク合成系を用いて合成することは極めて有用である(実施例8参照)。
すなわち、本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。本発明で用いられる無細胞転写翻訳系とは、DNAからmRNAへの転写、およびmRNAからタンパク質への翻訳に必要な全ての要素を含む系であり、そこにDNAを加えることによってそのDNAがコードしているタンパク質が合成されるようなあらゆる系を指す。無細胞転写翻訳系の具体例としては、真核細胞、およびバクテリア細胞、又はそれらの一部からの抽出液に基づいて調製された転写翻訳系が挙げられる。無細胞タンパク質合成系として具体的には、大腸菌、植物種子の胚芽、ウサギ網状赤血球等の細胞抽出液等の既知のものが用いられる。これらは市販のものを用いることもできるし、それ自体既知の方法、具体的には大腸菌抽出液は、Pratt, J. M. et al., Transcription and Translation, Hames, 179-209, B.D.& Higgins, S. J., eds, IRL Press, Oxford (1984)に記載の方法等に準じて調製することもできる。市販の無細胞タンパク質合成系、または細胞抽出液としては、大腸菌由来のものは、E. coli S30 extract system(Promega社製)とRTS500 Rapid Translation System(Roche社製)等が挙げられ、ウサギ網状赤血球由来のものはRabbit Reticulocyte Lysate System(Promega社製)等、さらにコムギ胚芽由来のものはPROTEIOSTM(TOYOBO社製)等が挙げられる。
(5−2)疾患関連転写調節因子への作用解析
転写調節因子の場合、前述のように、PPAR、p53、NFκB、AP−1、HIF−1、Smad3等の疾患関連転写調節因子への作用を解析することにより、その転写調節因子が特定の疾患に直接的または間接的に関与しているかを解析することが可能である。
PPARとは、ステロイドホルモン受容体ファミリーであるペルオキシソーム増殖因子活性化受容体(peroxisome proliferator-activated receptor)であり、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られており、これらの疾患の治療薬のターゲット分子として注目されている。このPPARは複数のサブタイプ遺伝子が見いだされ、哺乳動物においてはα、γ、およびδ(ヒトではNUC I、マウスではFAAR(fatty acid-activated receptor)、カエルではPPARβとも呼ばれる)の主に3種類のサブタイプ が明らかとなっている(これらはPPARファミリーと総称される)。α型は主として肝臓、腎臓、褐色脂肪細胞などの脂肪消費臓器、その他心筋や消化管に発現が認められ、脂肪酸酸化、ケトン体生成、アポリポタンパクの生成などに関与する。β型は脳に、δ型は組織特異性がみられず普遍的に発現しているが大腸ガン細胞での発現が顕著であり、発ガンとの関係が注目されている。またγ型はγ1型とγ2型などの数種のアイソホームが知られており、γ1型は脂肪組織や免疫系臓器、副腎、小腸で発現し、γ2型は脂肪細胞で特異的な発現がみられ、脂肪細胞の分化誘導や脂肪合成に重要な役割を担っていると考えられている。これらのPPARは別の転写調節因子であるRXR(レチノイドX受容体)などとヘテロダイマーを形成し、標的遺伝子上流にある応答配列PPRE(PPAR response element)に結合し、転写を制御することが知られている。
p53はRB遺伝子に引き続いて、1989年に2番目に同定された癌抑制遺伝子である。p53遺伝子は染色体の17p13.1に存在し、その遺伝子産物は分子量53kDの核内タンパク質である。最初、p53遺伝子はmycに似た癌遺伝子であると考えられていたが、その後、p53蛋白には野性型と変異型があり、野性型は細胞の増殖機能を制御する機能をもち、RB遺伝子と良く似た働きをもつ癌抑制遺伝子であることが明らかになった。p53蛋白は、転写調節因子としていくつかの遺伝子を制御している。そのうちでもっとも重要なものはサイクリン/Cdk複合体の機能を阻害するp21遺伝子の発現制御であると考えられている。p53の機能自体はリン酸化によって制御されている。癌化の抑制という観点からは、p53の機能として以下の2つが重要である。第1はプログラムされた細胞死であるアポトーシスを起こすシグナル伝達経路上にあることである。第2は細胞がDNA修復を行う間、細胞周期を停止させる働きである。このような機能を通じてp53は放射線や薬剤などによって障害を受けた細胞の細胞周期を停めたり、アポトーシスを引き起こして除去し、遺伝子変化を生じた細胞が癌細胞として増殖していくことを防止していることから、例えば、癌等の治療薬のターゲット分子として注目されている。
NFκBは、サイトカイン(例えば、IL−1、IL−2、IL−6、IL−8、GM−CSF、TNFなど)やケモカイン、インターフェロン、MHC分子、増殖因子、細胞接着分子などの遺伝子発現を制御し、特に免疫系に重要な働きを持つ疾患関連転写調節因子として知られており、例えば、関節リウマチや変形性関節炎などの免疫性疾患や炎症性疾患および癌等の治療薬のターゲット分子として注目されている。
AP−1は、転写調節因子のFosとJunファミリーからなる複合体で、細胞増殖,分化,特に細胞ガン化や炎症性疾患に関与していることが知られており、例えば、炎症性疾患や癌等の治療薬のターゲット分子として注目されている。
HIF−1は、低酸素状況において活性化される遺伝子転写調節因子であり、血管内皮増殖因子などの遺伝子発現制御を通じて血管新生の制御に密接に関わることが示されており、例えば、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等の治療薬のターゲット分子として注目されている。
Smad3は,TGF-β(transforming growth factor-β)と呼ばれるサイトカインのシグナルを受容体を介して細胞内に伝達する転写調節因子であり,癌,組織繊維化,免疫疾患等の治療薬のターゲット分子として注目されている
具体的には、各疾患関連転写調節因子が認識する遺伝子部位の塩基配列を固相に固定化する。特に疾患関連転写調節因子が認識する標的転写調節領域のDNAまたはその部分断片が、好適に用いられる。固定化するDNAまたはその部分断片の配列の例示として、PPARγ解析用として配列番号93及び配列番号94、p53解析用として配列番号95及び配列番号96、NFκB解析用として配列番号97及び配列番号98、AP−1解析用として配列番号99及び配列番号100、HIF−1解析用として配列番号101及び配列番号102、Smad3解析用として配列番号103及び配列番号104をあげたが、これらに限定されるものではない。DNAまたはその部分断片は、アニーリングさせたものを固定化する。固相は、例えばウェルプレートが使われ、直接或は例えばストレプトアビジン処理プレート、ニュートラアビジン処理プレート等に固定化される。DNAまたはその部分断片は、またビオチン標識したものを用いることはより好適な結果をもたらす。DNAまたはその部分断片の添加量は、好ましくは、1〜100nM/100μl/ウェルである。反応は、10〜30℃(室温)で、約30分〜2時間処理で行うことが好ましい。反応完了後、未反応物を除去し、より好ましくはタンパク質によるブロッキング操作を行う。
このようにして調製されたウェルプレートに、転写調節因子を含む被検試料を各疾患関連転写調節因子と共に適宜添加し、被検試料に含まれる転写調節因子の作用を解析する。被検試料に含まれる転写調節因子が、疾患関連転写調節因子と結合し、固定化DNAとの親和性を高めるものであれば、反応洗浄後も疾患関連転写調節因子と転写調節因子の結合体が固定化DNAと結合した状態でウェル中に残り、例えば吸光度で測定すればコントロールに比較してOD値が上がり、転写調節因子が疾患関連転写調節因子と固定化DNAとの親和性に正に作用すると推定できる。一方、被検試料に含まれる転写調節因子が、疾患関連転写調節因子と結合し或は結合せずに、疾患関連転写調節因子と固定化DNAとの親和性を低めるものであれば、反応洗浄後は疾患関連転写調節因子と転写調節因子の結合体はウェル中から除去され、例えば吸光度で測定すればコントロールに比較してOD値が下がり、転写調節因子が疾患関連転写調節因子と固定化DNAとの親和性に負に作用すると推定できる。
本発明のcDNAがコードするタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。
疾患関連転写調節因子は、該疾患関連転写調節因子が含まれている細胞抽出液または細胞核抽出液から取得することができる。また、前述のように、疾患関連転写調節因子をコードするDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、疾患関連転写調節因子をコードするcDNAを使用し、その全長または一部を適当な発現ベクターに挿入し、これを大腸菌などの微生物、昆虫細胞、酵母、動物細胞または動物に導入し、疾患関連転写調節因子が発現したこれらの遺伝子導入細胞の培養上清または細胞内、組織、体液より、組換えタンパク質である疾患関連転写調節因子を取得することができる。
配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号18、配列番号19、配列番号20、配列番号22に記載のアミノ酸配列をそれぞれ有する9種類のタンパク質は、PPARが有する作用を増強または抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測される。
配列番号12、配列番号13、配列番号14、配列番号15、配列番号18、配列番号19、配列番号20、配列番号22に記載のアミノ酸配列をそれぞれ有する8種類のタンパク質は、p53が有する作用を増強または抑制する活性を有し、癌等に関連することが推測される。
配列番号12、配列番号14、配列番号15、配列番号16、配列番号22に記載のアミノ酸配列をそれぞれ有する5種類のタンパク質は、NFκBが有する作用を増強または抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測される。
配列番号13、配列番号14、配列番号15、配列番号16、配列番号19、配列番号20、配列番号21、配列番号22に記載のアミノ酸配列をそれぞれ有する8種類のタンパク質は、AP−1が有する作用を増強または抑制する活性を有し、炎症性疾患や癌等に関連することが推測される。
配列番号12、配列番号13、配列番号15、配列番号18、配列番号20、配列番号21に記載のアミノ酸配列をそれぞれ有する6種類のタンパク質は、HIF−1が有する作用を増強または抑制する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測される。
配列番号15、配列番号16、配列番号17に記載のアミノ酸配列をそれぞれ有するの3種類のタンパク質は、Smad3の作用を抑制する活性を有する、本発明のDNAがコードするタンパク質は、癌,組織繊維化,免疫疾患等に関連することが推測される。
このような転写調節活性の解析系は、本発明の転写調節活性を有するタンパク質のアゴニストやアンタゴニストの評価にも用いることができる。なお、本発明のタンパク質が有する活性の確認は、上記した方法に限定されるものではない。
(5−3)標的転写調節領域への結合活性の解析
また、転写調節因子の場合、既知の転写調節因子が認識し標的とするプロモーターやエンハンサー等の遺伝子転写調節領域(以下、これを「標的転写調節領域」と称することがある)のDNAまたはその部分断片に対する結合能を測定することにより生物学的活性を解析する方法が知られている(特開2001−314190号公報)。解析に使用する標的転写調節領域のDNAまたはその部分断片として、既知の標的転写調節領域の塩基配列(以下、これを「標的配列」と称することがある)を有するものだけでなく、既知の標的転写調節領域の塩基配列をデーターベース解析し分類してそれぞれ設計した、転写調節因子が共通して認識する標的転写調節領域の共通塩基配列(以下、これを「コンセンサス標的配列」と称することがある)を有するものを使用してもよい。
既知の転写調節因子としては、例えば、v−jun、c−jun、junB、junD、dJRA、c−fos、fosB1、fosB2、Fra−1、LRF−1、v−maf、mafG、NF−E2 p45、aNF−E2、fNF−E2、Nrf short form、GCN4、yAP−1、CREB−2、ATF−3、CRE−BP1、CRE−BP3、ATF−a、CREB−341、CREB−327、CREM、dCREB2、dCREB2−b、dCREB2−c、dCREB2−d、dCREB2−q、dCREB2−r、dCREB2−s、C/EBPα、C/EBPβ、p34C/EBPβ、CHOP−10、VBP、Hlf、CPRF−2、EmBP−1b、EmBP−1b、GBF1、GBF2、GBF3、CPRF−1、TAF−1、HBP−1a、GBF9、GBF1、GBF12、CPRF−3、TGA1a、TGA1b、O2、STE4、OPI1、E2A、E47、ITF−2/SEF2−1B、SEF−1A、MyoD、p42Tal−1、HEN−1、AhR、Arnt、USF、NF−1A1、NF−1A1.1、NF−1A6、NF−1B1、NF−1B1、NF−1B2、NF−1C2/CTF−2、CTF−4、CTF−6、RF−X1、AP2αA/AP−2α1、AP2α2、AP2α3、AP2α4、AP2αB、AP2β、AP2γ、GR、AR、ER、RXR−α、PPARα、PPARγ、COUP−TF1、HNF−4α1、HNF−4α2、CF1、GATA−1、GATA−2、GATA−3、GATA−4、AREA/NIT−2、Sp1、YY1、Egr−1、Egr−2、Egr−3、Snail、CF2−II、Evi−1、Ikaros、MZF−1、Tramtrack69K、HOX9、CDP、HNF−1A、Nkx−2.2、Nkx−2.5、TTF−1、Oct−1A、Oct−1B、Oct−1C、Oct−2、Oct−2.1/Oct−2B、Pax−3、Pax−6、Pax−1、HSF1(short)、HSF2、dHSF、fungalHSF、c−Myb、A−Myb、v−Myb、P(long)、P(short)、C1(long)、C1(short)、c−Ets−1_p54、Ets−1_δiV/VII、Ets−2、Elk−1、SAP−1、SAP−1b、Erg−1、p55erg、Fli−1b、E4TF1−60/GABP−α、E74A、IRF−1、IRF−2、p50、NF−ATc、NF−Atp、p91、p84、STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6、p53、MEF−2A、SRF、E2、TBP、SRY、Sox−5、Sox−9、mat−Mc、CP1A、CP1B、CBF−C、AML1a、Smadファミリー(例えばSmad1,Smad2,Smad3,Smad4,Smad5,Smad6,Smad7,Smad8)等が知られており、これらの転写調節因子の標的転写調節領域の塩基配列もそれぞれ報告されている(田村隆明、外2名編、「Bio Science 実験医学別冊 新用語ライブラリー 転写因子」、第2版、株式会社羊土社、1999年12月)。
転写調節因子と標的転写調節領域のDNAまたはその部分断片の結合は、自体公知の測定系を使用して検出することができる。例えば、標的転写調節領域のDNAまたはその部分断片を固定化したプレートに転写調節因子を含む被検試料を添加し、両者の直接的な結合をSPR(Surface Plasmon Resonance, 表面プラズモン共鳴)法を用いて検出することができる。その場合には、前記したような転写調節因子が認識する標的転写調節領域のDNAまたはその部分断片をセンサーチップに固定化する。DNAまたはその部分断片は、アニーリングさせたものを固定化する。また、転写調節因子または標的転写調節領域のDNAまたはその部分断片を蛍光標識したものを用いて、両者の結合を検出することもできる。
本発明のDNAがコードするタンパク質を含む解析用の被検試料は、前述のように本発明のDNAを適当な方法により転写/翻訳する方法により調製することができる。具体的には、例えば、本発明のDNAを無細胞転写翻訳系に供することによりタンパク質発現を誘導し、本発明のタンパク質を取得することができる。
本発明のDNAがコードするタンパク質(配列番号12〜22)は、既知の標的転写調節領域の塩基配列をデーターベース解析して設計したコンセンサス標的配列(配列番号39〜配列番号91)または既知の標的転写調節領域の標的配列(配列番号92)を有する少なくとも一つのDNAまたはその部分断片に対して結合活性を有していた。
各種疾患との関与が示されている転写制御領域のDNAに対する本発明蛋白質の親和性の解析の具体的な例として以下に説明する。
配列番号12に記載のアミノ酸配列を有する蛋白質は、胎児の子宮内成長遅滞、子宮低酸素症等に関連するinsulin-like growth factor binding protein-1遺伝子上流転写調節領域のGR結合部位配列(配列番号114)に結合する。
配列番号13に記載のアミノ酸配列を有する蛋白質は、AhR等のコンセンサス標的配列(配列番号44)、AREA/NIT−2のコンセンサス標的配列(配列番号58)に親和性を示す。このことから該タンパク質はDNA結合性を有し、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
配列番号14に記載のアミノ酸配列を有する蛋白質は、Pax−3等のコンセンサス標的配列(配列番号73)、Pax−1のコンセンサス標的配列(配列番号74)、TBPのコンセンサス標的配列(配列番号87)、mat−Mcのコンセンサス標的配列(配列番号89)に親和性を示す。このことから該タンパク質はDNA結合性を有し、無虹彩症などの眼疾患と関連する転写調節因子である可能性がある。
配列番号15に記載のアミノ酸配列を有する蛋白質は、HEN−1のコンセンサス標的配列(配列番号43)、AhR等のコンセンサス標的配列(配列番号44)に親和性を示す。このことから該タンパク質はDNA結合性を有し、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
配列番号16に記載のアミノ酸配列を有する蛋白質は、HEN−1のコンセンサス標的配列(配列番号43)、AhR等のコンセンサス標的配列(配列番号44)、TBPのコンセンサス標的配列(配列番号87)、SRY等のコンセンサス標的配列(配列番号88)、mat−Mcのコンセンサス標的配列(配列番号89)に親和性を示す。このことから該タンパク質はDNA結合性を有し、神経系の発生・分化、軟骨形成、性分化などの発生・分化、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
配列番号17に記載のアミノ酸配列を有する蛋白質は、CP1A等のコンセンサス標的配列(配列番号90)、PPARγとRXRαの複合体の標的配列(配列番号92)に高い親和性を示す。このことから該タンパク質はDNA結合性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連する転写調節因子である可能性がある。また、該タンパク質は、C/EBPα等のコンセンサス標的配列(配列番号40)、USFのコンセンサス標的配列(配列番号45)、NF−1A1等のコンセンサス標的配列(配列番号46)、RF−X1のコンセンサス標的配列(配列番号47)、AML1aのコンセンサス標的配列(配列番号91)に親和性を示す。さらに、該蛋白質は、insulin receptor遺伝子上流転写調節領域のC/EBPα結合部位(配列番号105、106)、multidrug resistance gene 1遺伝子上流転写調節領域のC/EBPβ結合部位(配列番号107)、small heterodimer partner 1遺伝子上流転写調節領域のFXR/RXR-α結合部位(配列番号118)、Cytochrome P450 3A4遺伝子上流転写調節領域のRXR-α結合部位(配列番号119)、phospholipid transfer protein遺伝子上流転写調節領域のRXR-α結合部位(配列番号120)、solute carrier family 10 (sodium/bile acid cotransporter family), member 2遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号121)、cholesteryl ester transfer protein遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号123)、apolipoprotein AIの遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号124)に結合する。
配列番号18に記載のアミノ酸配列を有する蛋白質は、cdk-inhibiting protein 1遺伝子上流転写調節領域のSTAT5B結合部位(配列番号130、131)およびinterleukin-2 receptor, α chain遺伝子上流転写調節領域のSTAT5A結合部位(配列番号133、134)に結合する。
配列番号19に記載のアミノ酸配列を有する蛋白質は、OPI1等のコンセンサス標的配列(配列番号42)、NF−1A1等のコンセンサス標的配列(配列番号46)、RF−X1のコンセンサス標的配列(配列番号47)、GATA−1等のコンセンサス標的配列(配列番号57)、PPARγとRXRαの複合体の標的配列(配列番号92)に親和性を示す。このことから該タンパク質はDNA結合性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、血球系細胞、神経系細胞、筋細胞、精子形成、臓器形成、アポトーシスなどの異常に起因する疾患、炎症、白血病、癌等に関連する転写調節因子である可能性がある。また、該蛋白質は、small heterodimer partner 1 遺伝子上流転写調節領域FXR/RXR-α結合部位(配列番号118)、solute carrier family 10 (sodium/bile acid cotransporter family), member 2遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号121)、tumor necrosis factor α 遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号122)、cholesteryl ester transfer protein遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号123)、apolipoprotein AI遺伝子上流転写調節部領域のPPAR-α/RXR-α結合部位(配列番号124)に結合する。
配列番号21に記載のアミノ酸配列を有する蛋白質は、OPI1等のコンセンサス標的配列(配列番号42)、RF−X1のコンセンサス標的配列(配列番号47)に高い親和性を示す。このことから該タンパク質はDNA結合性を有し、細胞、特に筋細胞の分化、増殖の異常に起因する疾患に関連する転写調節因子である可能性がある。
また、該タンパク質は、C/EBPα等のコンセンサス標的配列(配列番号40)、VBP等のコンセンサス標的配列(配列番号41)、HEN−1のコンセンサス標的配列(配列番号43)、USFのコンセンサス標的配列(配列番号45)、NF−1A1等のコンセンサス標的配列(配列番号46)、TBPのコンセンサス標的配列(配列番号87)、SRY等のコンセンサス標的配列(配列番号88)、PPARγとRXRαの複合体の標的配列(配列番号92)に親和性を示す。
配列番号22に記載のアミノ酸配列を有する蛋白質は、OPI1等コンセンサス標的配列(配列番号42)、HEN−1のコンセンサス標的配列(配列番号43)、RF−X1のコンセンサス標的配列(配列番号47)、Sp1のコンセンサス標的配列(配列番号59)に親和性を示す。このことから該タンパク質はDNA結合性を有し、細胞、特に筋細胞の分化、増殖の異常に起因する疾患、癌やウイルス性疾患等に関連する転写調節因子である可能性がある。
(6)本発明のDNAと疾患の関連の解析
(6−1)OMIMを用いた解析
疾患関連蛋白質については、前述したように機能ごとの解析が可能であるほか、疾患関連蛋白質を発現して得られた特異認識抗体を用いて、特定の疾患と蛋白質の発現量や活性との相関を知ることができる。あるいは、ヒトの遺伝子と疾患のデータベースであるOnline Mendelian Inheritance in Man (OMIM)を利用し、解析が可能である(実施例4参照)。なおOMIMには常に新しい情報が付加されている。したがって当業者は、特定の疾患と本発明の遺伝子との新たな関係を最新のデータベースから見出すことができる。疾患関連蛋白質は、診断マーカー、発現・活性の増減を制御する薬剤、あるいは遺伝子治療のターゲットになるなど医薬品の開発等に有用である。
また、分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、糖蛋白質関連蛋白質、転写関連蛋白質をはじめ、上記の14種類のカテゴリーの蛋白質に限らず、種々の機能をもつ蛋白質についても、OMIMを利用してキーワードで検索すると、各キーワードにおいて、多くの疾患に関連した結果が得られた(分泌、膜蛋白質について、OMIMで検索した結果を一例として以下に示す)。あるいは、例えば転写関連蛋白質やシグナル伝達関連蛋白質については、疾患との関連がそれぞれ、藤井・田村・諸橋・影山・佐竹編の実験医学増刊「転写因子研究1999」Vol.17, No.3, (1999)や、遺伝子医学Vol.3,No.2(1999)で報告されている。例えば、がんを例に挙げると、裳華房生命科学シリーズ「がんの生物学」(松原聡著、1992)にあるように、がんには分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、糖蛋白質関連蛋白質、転写関連蛋白質ばかりでなく、酵素・代謝関連蛋白質、細胞骨格関連蛋白質、細胞分裂・増殖関連蛋白質といった多くの蛋白質が関与することが示されている。このように、疾患関連蛋白質ばかりでなく、分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、糖蛋白質関連蛋白質、転写関連蛋白質等も疾患に関与することが多く、医療産業上のターゲットとして、有用なことがわかる。
なお、Swiss-Protヒットデータ、及びnr、RefSeqヒットデータが、OMIMに登録されている遺伝子、蛋白質であったクローンのOMIM NumberおよびURLは以下の通りである(配列番号の後ろのカッコ内が対象となったOMIM NumberとそのURL)。
配列番号12(602869; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?602869),
配列番号13(194556; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?194556),
配列番号14(184756; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?184756),
配列番号17(603406; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?603406),
配列番号19(602306; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?602306),
配列番号21(603971; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?603971),
配列番号22(603899; http://www.ncbi.nlm.nih.gov/htbin-post/Omim/dispmim?603899)。
配列番号12に記載のアミノ酸配列を有する蛋白質のヒットデータは、HNRPU (HETEROGENEOUS NUCLEAR RIBONUCLEOPROTEIN U)またはSAFA (SCAFFOLD ATTACHMENT FACTOR A)としてOMIMに登録されており、配列番号12に記載のアミノ酸配列を有する蛋白質は疾患に関連すると推定される。
配列番号13に記載のアミノ酸配列を有する蛋白質のヒットデータは、ZNF14(ZINC FINGER PROTEIN 14)またはKOX6としてOMIMに登録されており、配列番号13に記載のアミノ酸配列を有する蛋白質は疾患に関連すると推定される。
配列番号14に記載のアミノ酸配列を有する蛋白質のヒットデータは、SREBF1(STEROL REGULATORY ELEMENT-BINDING TRANSCRIPTION FACTOR 1)またはSREBP1(STEROL REGULATORY ELEMENT-BINDING PROTEIN 1)としてOMIMに登録されている。SREBF1 はEmery-Dreifuss musclar dystrophy (EDMD),dilated cardiomyopathy (CMD1A),familial partial lipodystrophy (FRLD) に関与するlamin A に相互作用することから、配列番号14に記載のアミノ酸配列を有する蛋白質はこれらの疾患に関連すると推定される。
配列番号17に記載のアミノ酸配列を有する蛋白質のヒットデータは、TIF1(TRANSCRIPTIONAL INTERMEDIARY FACTOR 1)またはPTC6 CHIMERIC ONCOGENEとして OMIMに登録されている。TIF1は human breast cancer cells から単離・検出されることから、配列番号17に記載のアミノ酸配列を有する蛋白質は、癌に関連すると推定された。また、acute promyelocytic leukemia (APL)やpapillary thyroid carcinomas (PTC) に関連すると推定される。
配列番号19に記載のアミノ酸配列を有する蛋白質のヒットデータは、RAB2L(RAS-ASSOCIATED PROTEIN)としてOMIMに登録されている。RAB2Lは,心臓と骨格筋に特異的に発現することから、配列番号19に記載のアミノ酸配列を有する蛋白質は不整脈、心不全、心肥大、肉腫等に関連すると推定される。
配列番号21に記載のアミノ酸配列を有する蛋白質のヒットデータは、ZNF91(ZINC FINGER PROTEIN 91)としてOMIMに登録されている。 ZNF91は、Tリンパ細胞で強く発現することから、配列番号21に記載のアミノ酸配列を有する蛋白質は癌、免疫炎症性疾患等に関連すると推定される。
配列番号22に記載のアミノ酸配列を有する蛋白質のヒットデータは、ZNF85(ZINC FINGER PROTEIN 85)としてOMIMに登録されている。 ZNF85 は、精巣で強く発現することから、配列番号22に記載のアミノ酸配列を有する蛋白質は癌、不妊症等に関連すると推定される。
(6−2)本発明のDNAの発現解析による機能および疾患との関連の予測
本発明のcDNAの塩基配列を用いれば、そのcDNAの塩基配列を有する遺伝子の発現頻度を解析することができる。更にこうして解析された発現頻度情報に基づいて、当該遺伝子の機能を予測することができる(実施例10および11参照)。
疾患に関連した遺伝子を調べる方法として病態組織と正常組織において遺伝子発現量の違いを調べる発現頻度解析がある。発現頻度解析には、ノーザンブロッティング法やRT-PCR法、およびDNAマクロアレイやDNAマイクロアレイを用いた発現頻度解析法がある(実験医学 Vol.17, No.8, 980-1056 (1999)、村松・那波監修 細胞工学別冊「DNAマイクロアレイと最新PCR法」(秀潤社, 2000))。更に、こういった解析方法以外に、発現している遺伝子の塩基配列をコンピューターを利用した解析で比較することによっても発現頻度を解析することができる。例えば、BODYMAPと呼ばれるデータベースは、様々な組織・細胞のcDNAライブラリーから、無作為に遺伝子クローンを抽出し、3'末端領域の塩基配列の相同性情報をもとにして、相同性のあるものはまとめてクラスターとすることによって、クラスター単位で遺伝子を分類して、各クラスターに含有されるクローンの個数を比較することによって遺伝子の発現頻度情報を得ている(http://bodymap.ims.u-tokyo.ac.jp/)。
このような解析手法により、病態組織と正常組織において遺伝子発現量の違いを調べた結果から発現量の違いが明らかな遺伝子は、その疾患に関連した遺伝子といえる。また、病態組織でなくとも、病態に関連した特異的な現象を再現させた培養細胞と正常細胞において遺伝子発現量の違いを調べた結果から発現量の違いが明らかな遺伝子は、その疾患に関連した遺伝子といえる。
本発明のDNAを有する11クローンについて、以下のデータベースを用いて、特定の病態や機能に関連する遺伝子を選択することができる(実施例10.「in silicoにおける発現頻度解析」参照)。本発明の解析に用いるデータベースは、1,402,069個のクローンの塩基配列をデータベース化したものであり、解析母数としては十分なデータベースである。このデータベースを構成している配列情報は、実施例1に示した様々な組織や細胞由来のcDNAライブラリーからcDNAクローンを無作為に選択して、その5'末端領域の配列を決定することによって得ることができる。
次にこのデータベースにある各クローンの塩基配列を、塩基配列の相同性検索プログラムによって相同な配列同士をカテゴライズし(クラスター化)、各クラスターに属するクローン数を各ライブラリー毎に集計し規格化することによって、ある遺伝子のcDNAライブラリー内での存在比を解析できる。この解析によって、cDNAライブラリーのソースとなっている組織や細胞における、ある遺伝子の発現頻度情報を得ることができる。
次に本発明のcDNAの塩基配列を持つ遺伝子の、組織や細胞間での発現を解析するために、大量のcDNAクローンを解析した組織や細胞由来のライブラリーを組織・細胞間での発現量の比較の対象にすることができる。すなわち600個以上のcDNAクローンの塩基配列を解析した組織や細胞について、先に規格化した数値を組織間や細胞間で比較し、遺伝子の発現頻度の変化を解析することができる。この解析によって以下に続く病態や機能に関連する遺伝子であることが示すことができる。なお、以降に示される表4〜表12中の各数値は、相対的な発現頻度を示し、数値が大きいほど発現量が多いことを示す。なお、表の一部に比較したライブラリー間ではさほど大きな差がない遺伝子も含まれるが、実施例11を参照に他の組織、細胞由来のライブラリーと比較した場合は、有意な差が認められるので、それぞれの組織、細胞に特異的な遺伝子であり、疾患の診断マーカーや、分子メカニズム解明に有用な遺伝子と言える。
アルツハイマー病関連遺伝子
アルツハイマー病とは記憶力が低下し、進行すれば生活が困難となり介護が必要となる脳神経系の疾患であり、進行すれば脳そのものが萎縮する。その発症の要因はストレスなどの環境因子、高血圧やコレステロール血症などの血管因子も関わりがあるといわれているが、未だ不明である。したがって、正常脳組織とアルツハイマーの病態組織を比較した時、発現に差のある遺伝子はアルツハイマー病に関連する遺伝子であり、病態の発症メカニズムの解明や、遺伝子診断に有用であると考えられる。アルツハイマー患者の大脳皮質由来のライブラリー(BRALZ、BRASW)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表4)、両者で発現変化のある遺伝子は、配列番号3, 配列番号10に記載の塩基配列をそれぞれ有する2クローンであった。これらの遺伝子はアルツハイマー病に関する遺伝子であると推定された。
パーキンソン病関連遺伝子
パーキンソン病とは脳内の黒質で作られるドーパミンという神経伝達物質が十分量作られなくなり、その結果、手が震え、筋肉の動きが固くなって身体の動きが鈍くなる等の運動障害を引き起こす脳神経系の疾患である。脳の神経細胞は通常、歳を取るにつれて少しずつ減少するが、パーキンソン病では黒質の神経細胞が普通よりも早く著しく減少する。よって脳組織全体と黒質とを比較した時、発現に差のある遺伝子は黒質特異的な変動をするパーキンソン病に関連する遺伝子であり、発症メカニズムの解明や遺伝子診断に有用であると考えられる。黒質由来のライブラリー(BRSSN)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表5)、両者で発現変化のある遺伝子は、配列番号3, 配列番号10に記載の塩基配列をそれぞれ有する2クローンであった。これらの遺伝子はパーキンソン病に関する遺伝子であると推定される。
短期記憶・痴呆症に関連する遺伝子
脳組織の中で海馬とは記憶を扱う非常に重要な部位であり、得た情報の情報の要・不要を判断して、他の脳部位に記憶を蓄えさせる、記憶固定の働きがある。臨床的知見より、海馬に異常をきたしたり最悪海馬が無くなると、5分程度しか新しいことを覚えていられなくなる。また痴呆症患者の一部はこの海馬に異常をきたしていると考えられている。脳組織全体と海馬とを比較した時、発現に差のある遺伝子は記憶に関与したり、痴呆症に関連する遺伝子であり、記憶のメカニズム解明や遺伝子診断に有用であると考えられる。海馬由来のライブラリー(BRHIP)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表6)、両者で発現変化のある遺伝子は、配列番号3, 配列番号7, 配列番号10に記載の塩基配列をそれぞれ有する3クローンであった。これらの遺伝子は記憶および痴呆症に関する遺伝子であると推定される。
平衡感覚・運動機能に関する遺伝子
小脳は平衡感覚と筋肉運動、運動学習の中枢である。この領域は運動の調節に関与していると考えられており、小脳が動作することによって無意識的にスムーズな運動をすることが可能になる。また、運動だけでなく読み書きなどより高次な運動の慣れにも小脳が関与していることも最近の研究で解明されつつある。脳組織全体と小脳とを比較した時、発現に差のある遺伝子は平衡感覚や運動機能に関与する遺伝子であり、脳が制御する運動機能の分子メカニズム解明に有用であると考えられる。小脳由来のライブラリー(BRACE)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表7)、両者で発現変化のある遺伝子は、配列番号2, 配列番号3, 配列番号5, 配列番号10に記載の塩基配列をそれぞれ有する4クローンであった。これらの遺伝子は平衡感覚および運動機能に関する遺伝子であると推定される。
感覚器からの情報伝達に関与する遺伝子
視床は、大脳と結びつきの強い神経細胞が集まった部分であり、脊髄などから伝わってきた感覚情報を大脳の関係部分に伝えたり、大脳の運動の指令を調節する。例えば視覚では映像を大きさ、形、色に分け、聴覚では音声を音量、耳障りの良し悪しで分け、大脳皮質の感覚野に送る。脳組織全体と視床とを比較した時、発現に差のある遺伝子は感覚器からの情報伝達に関与する遺伝子であり、脳が制御する情報伝達の分子メカニズム解明に有用であると考えられる。視床由来のライブラリー(BRTHA)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表8)、両者で発現変化のある遺伝子は、配列番号3, 配列番号4, 配列番号8, 配列番号9, 配列番号10に記載の塩基配列をそれぞれ有する5クローンであった。これらの遺伝子は感覚器からの情報伝達に関する遺伝子であると推定される。
情動反応に関する遺伝子
扁桃は脳の感情中枢である。扁桃を通過した情報は感情反応、例えばパニックや恐怖反応などを引き起こす。刺激が扁桃で情動評価されて強い恐怖を生じたとき、扁桃は脳の各部に警戒信号を出す。その結果、手の平の発汗、心悸亢進、血圧上昇、アドレナリンの急激分泌等の反応が起きる。いわば扁桃体は身体に警戒信号を送り、その結果として体を警戒態勢に入らせる一種の防衛本能を司っている組織とも言える。脳組織全体と扁桃とを比較した時、発現に差のある遺伝子は情動反応に関与する遺伝子であり、感情反応や恐怖反応、パニックなどの分子メカニズム解明に有用であると考えられる。扁桃由来のライブラリー(BRAMY)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表9)、両者で発現変化のある遺伝子は、配列番号3, 配列番号10に記載の塩基配列をそれぞれ有する2クローンであった。これらの遺伝子は情動反応に関する遺伝子であると推定される。
癌関連遺伝子
癌の組織では、正常組織とは異なる遺伝子のセットが発現して組織・細胞の癌化に寄与していると考えられている。したがって、正常組織とは異なる発現をする遺伝子は癌関連遺伝子である。正常な組織と比較して癌組織で発現変化する遺伝子を探索した。
子宮がん由来のライブラリー(TUTER)と、正常な子宮由来のライブラリー(UTERU)のcDNAを解析して比較した結果(表10)、両者で発現変化のある遺伝子は、配列番号3, 配列番号10に記載の塩基配列をそれぞれ有する2クローンであった。
舌がん由来のライブラリー(CTONG)と、正常な舌由来のライブラリー(NTONG)のcDNAを解析して比較した結果(表11)、両者で発現変化のある遺伝子は、配列番号3に記載の塩基配列を有する1クローンであった。
これらの遺伝子は、癌に関する遺伝子であると推定される。
なお、以下の組合わせのライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
CD34+細胞のRNAから作製したライブラリー(CD34C)とCD34+細胞を破骨細胞分化因子で処理した細胞のRNAから作製したライブラリー(D30ST, D60STまたはD90ST)のcDNA;
未分化なNT2細胞由来のライブラリー(NT2RM)と分化誘導処理した細胞のライブラリー(NT2RP, NT2RIまたはNT2NE)のcDNA。
また、以下の組合わせの正常組織と癌組織のライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
乳がん由来のライブラリー(TBAES)と正常な乳房由来のライブラリー(BEAST)のcDNA;
子宮頸癌由来のライブラリー(TCERX)と正常な子宮頸管由来のライブラリー(CERVX)のcDNA;
結腸がん由来のライブラリー(TCOLN)と正常な結腸由来のライブラリー(COLON)のcDNA;
食道がん由来のライブラリー(TESOP)と正常な食道由来のライブラリー(NESOP)のcDNA;
腎臓がん由来のライブラリー(TKIDN)と正常な腎臓由来のライブラリー(KIDNE)のcDNA;
肝臓がん由来のライブラリー(TLIVE)と正常な肝臓由来のライブラリー(LIVER)のcDNA;
肺がん由来のライブラリー(TLUNG)と正常な肺由来のライブラリー(HLUNG)のcDNA;
卵巣がん由来のライブラリー(TOVAR)と正常な卵巣由来のライブラリー(NOVAR)のcDNA;
胃がん由来のライブラリー(TSTOM)と正常な胃由来のライブラリー(STOMA)のcDNA。
また、発生や分化に関連する遺伝子を調べる方法として、発生・分化途中の組織・細胞と、成体の組織細胞において遺伝子発現量の違いを調べる発現頻度解析がある。組織の発生・分化に関する遺伝子は、その組織の構築と機能発現に関する遺伝子であり、傷害のある組織を任意に再生せしめる再生医学に利用可能な有用な遺伝子である。
先に記した1,402,069個のクローンの塩基配列のデータベースを基にして得た遺伝子発現頻度情報を用いて、発生・分化途中の組識・細胞と成体の組識・細胞とを比較して遺伝子発現頻度に変化のある遺伝子を解析することができる。
胎児の脳由来のライブラリー(FCBBF, FEBRAまたはOCBBF)と成体の脳由来のライブラリー(BRACE, BRALZ, BRAMY, BRAWH, BRCAN, BRCOC, BRHIP, BRSSN, BRSTNまたはBRTHA)のcDNAを解析し、胎児と成体で比較した結果(表12)、両者で発現変化のある遺伝子は、配列番号2, 配列番号3, 配列番号4, 配列番号5, 配列番号6, 配列番号7, 配列番号8, 配列番号9, 配列番号10に記載の塩基配列をそれぞれ有する9クローンであった。これらの遺伝子は組織・細胞の再生に関する遺伝子であると推定される。
なお、以下の胎児組織と成体組織のライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
胎児の心臓由来のライブラリー(FEHRT)と成体の心臓由来のライブラリー(HEART)のcDNA;
胎児の腎臓由来のライブラリー(FEKID)と成体の腎臓由来のライブラリー(KIDNE)のcDNA;
胎児の肺由来のライブラリー(FELNG)と成体の肺由来のライブラリー(HLUNG)のcDNA。
(7)本発明のタンパク質の機能解析
かくして得られた新規タンパク質であって、かつ転写調節活性を有する本発明のタンパク質は、上記(5)で確認された転写調節活性以外の機能を解析することによりその新規の利用法が提供される(この転写調節活性以外の機能をさらに解析する対象となるタンパク質を、以下「解析対象タンパク質」と称することがある)。
具体的な機能の解析方法としては、例えば、(a)各組織、疾患、あるいは発生段階における発現状態を比較解析する方法、(b)他のタンパク質、DNAとの相互作用を解析する方法、(c)適当な細胞あるいは個体へ導入し、表現型の変化を解析する方法、(d)適当な細胞あるいは個体において該タンパク質の発現を阻害して表現型の変化を解析する方法などが挙げられる。
(a)の方法においては、本発明のタンパク質の発現を、mRNAレベルあるいはタンパク質レベルで解析することができる。mRNAレベルで発現量を解析する場合は、例えば、in situハイブリダイゼーション法(In situ hybridization: Application to Developmental Biology & Medicine (Ed. by Harris, N. and Wilkinson, D. G.), Cambridge University Press (1990))、DNAチップを利用したハイブリダイゼーション法、定量PCR法等が用いられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法、ELISA、ウェスタンブロット法などが挙げられる。ここで、解析の対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合には、解析対象タンパク質をコードするcDNAにのみ存在し、公知のバリアントをコードするcDNAとはハイブリダイズしないプローブを用いることが好ましい。定量PCR法の場合には、対象バリアントと公知バリアント間で異なる長さの増幅断片ができるプライマーを選択して行う方法(Wong, Y., Neuroscience Let., 320: 141-145 (2002))等が挙げられる。また、タンパク質レベルで解析する場合には、後述する本発明のタンパク質に特異的に結合する抗体を用いた組織染色法などが挙げられる。この場合、対象タンパク質にのみ反応し、公知のバリアントには反応しない抗体を用いることが好ましい。
(b)の方法においては、本発明のタンパク質と既知のタンパク質またはDNAとの相互作用の有無を調べて、本発明のタンパク質の機能を解析することができる。相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法等が挙げられる。該方法においても、解析対象タンパク質が公知のバリアントが存在するスプライシングバリアントの場合には、公知のバリアントも同様にして相互作用する物質を解析し、対象タンパク質特異的に相互作用する物質を同定することが好ましい。
(c)の方法では、本発明のcDNAを導入する細胞は特に制限はないが、ヒト培養細胞等が特に好ましく用いられる。DNAの細胞への導入法としては、上記(4)に記載のものが挙げられる。さらに導入細胞の表現型としては、細胞の生死、細胞の増殖速度、細胞の分化、細胞が神経細胞の場合には神経突起の伸長度、細胞内タンパク質の局在や移行など顕微鏡等で観察可能なものや、細胞内の特定タンパク質の発現変化など生化学的実験により解析可能なものも含む。これらの表現型は、公知のバリアントが存在するスプライシングバリアントの場合には、本DNAまたは公知のバリアントをコードするDNAを同様に細胞へ導入し、比較解析することにより解析対象バリアントに関連する表現型を同定することができる。また、本発明のタンパク質は転写調節活性を有するものであることがわかっているので、キナーゼが関連する疾患に見られる表現型等に注目して解析することも好ましい。
本発明のDNAにコードされる蛋白質は、いずれも全長アミノ酸配列を備えることから、前述のように、適当な発現系を適用して組み換え体として発現させたり、細胞にインジェクションすることにより、あるいは、そのタンパクを特異的に認識する抗体を作製し、用いることで、その生物学的活性、及び細胞増殖・分化といった細胞状態変化への作用を解析することが可能である。
各蛋白質は、それぞれ次に示すような手法にもとづいて、それぞれの蛋白質の生物学的活性の解析が可能である。
分泌蛋白質、膜蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Ion Channels』(R.H.Ashley編、1995)、
『Growth Factors』(I.McKay, I.Leigh編、1993)、『Extracellular Matrix』(M.A.Haralson, J.R.Hassell編、1995)
糖蛋白質関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Glycobiology』(M.Fukuda, A.Kobata編、1993)、
「Method in Molecular Biology」(Humana Press社)シリーズの『Glycoprotein Analysis in Biomedicine』(Elizabeth F.Hounsell編、1993)、
シグナル伝達関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Signal Transduction』(G.Milligan編、1992)、
『Protein Phosphorylation』(D.G.Hardie編、1993)、または「Method in Molecular Biology」(Humana Press社)シリーズの『Signal Transduction Protocols』(David A. Kendall, Stephen J.Hill編、1995)、
転写関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Gene Transcription』(B.D.Hames, S.J.Higgins編、1993)、
『Transcription Factors』(D.S.Latchman編、1993)、
酵素・代謝関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Enzyme Assays』(ROBERT EISENTHAL and MICHAEL J. DANSON編、1992)、
細胞分裂・増殖関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Cell Growth, Differentiation and Senescence』(GEORGE STUDZINSKI編、2000)、
細胞骨格関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Cytoskeleton: Signalling and Cell Regulation』(KERMIT L. CARRAWAY and CAROLIE A. CAROTHERS CARRAWAY編、2000)、
「Method in Molecular Biology」(Humana Press社)シリーズの『Cytoskeleton Methods and Protocols』(Gavin, Ray H.編、2000)、
核蛋白質・RNA合成関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Nuclear Receptors』(DIDIER PICARD編、1999)、
『RNA Processing』(STEPHEN J. HIGGINS and B. DAVID HAMES編、1994)、
蛋白質合成・輸送関連蛋白質:
「The Practical Approach Series」(IRL PRESS社)の『Membrane Transport』(STEPHEN A. BALDWIN編、2000)、
「Method in Molecular Biology」(Humana Press社)シリーズの『Protein Synthesis Methods and Protocols』(Martin, Robin編、1998)、
細胞防御関連蛋白質:
「Method in Molecular Biology」(Humana Press社)シリーズの『DNA Repair Protocols』(Henderson, Daryl S.、1999)、
『Chaperonin Protocols』(Schneider, Christine編、2000)、
発生・分化関連蛋白質:
「Method in Molecular Biology」(Humana Press社)シリーズの『Developmental Biology Protocols』(ROBERT EISENTHAL and MICHAEL J. DANSON編、1992)、
DNA・RNA結合蛋白質:
「Method in Molecular Biology」(Humana Press社)シリーズの『DNA-Protein Interactions Principles and Protocols』(Kneale, G. Geoff編、1994)、
『RNA-Protein Interaction Protocols』(Haynes, Susan R.編、1999)、
ATP・GTP結合蛋白質:
「Method in Molecular Biology」(Humana Press社)シリーズの『Signal Transduction Protocols』(David A. Kendall, Stephen J.Hill編、1995)
これら以外の手法については、Methods in Enzymology(Academic Press)を参照して蛋白質の活性を解析することができる。
(d)の方法では、後述するオリゴヌクレオチドを用いた方法や、RNAインターフェアレンス法により効率的に行うことができる。この方法においても、解析する対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、公知のバリアントやその他のバリアントについても同様の解析を行い、比較解析することにより対象タンパク質特異的な機能を同定することができる。
(8)オリゴヌクレオチドの調製および該オリゴヌクレオチドを用いる機能解析
上記(1)に記載の方法で取得した本発明のDNAまたはその断片を用いて、DNA合成機などを用いる常法により、本発明のDNAの一部の配列を有するアンチセンス・オリゴヌクレオチド、センス・オリゴヌクレオチド等のオリゴヌクレオチドを調製することができる。該オリゴヌクレオチドとしては、上記DNAの有する塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。具体例としては、配列番号1〜11のいずれかで表される塩基配列中の連続した5〜100塩基と同じ配列を有するDNAまたは該DNAと相補的な配列を有するDNAを挙げることができる。ここで、対象タンパク質が、公知のバリアントDNAが存在するスプライシングバリアントの場合には、公知のバリアントと異なる部分の塩基配列を選択することが好ましい。センスプライマーおよびアンチセンスプライマーとして用いる場合には、両者の融解温度(Tm)および塩基数が極端に変わることのない上記のオリゴヌクレオチドが好ましい。また、配列の長さは、一般的には5〜100塩基であり、好ましくは10〜60塩基であり、より好ましくは15〜50塩基である。
また、これらオリゴヌクレオチドの誘導体も本発明のオリゴヌクレオチドとして利用することができる。該オリゴヌクレオチド誘導体としては、オリゴヌクレオチド中のリン酸ジエステル結合がホスホロチオエート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリン酸ジエステル結合がN3’−P5’ホスフォアミデート結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースとリン酸ジエステル結合がペプチド核酸結合に変換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5プロピニルウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のウラシルがC−5チアゾールウラシルで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがC−5プロピニルシトシンで置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のシトシンがフェノキサジン修飾シトシン(phenoxazine-modified cytosine)で置換されたオリゴヌクレオチド誘導体、オリゴヌクレオチド中のリボースが2’−O−プロピルリボースで置換されたオリゴヌクレオチド誘導体、あるいはオリゴヌクレオチド中のリボースが2’−メトキシエトキシリボースで置換されたオリゴヌクレオチド誘導体等をあげることができる。
また、本発明のオリゴヌクレオチドは、これを2本鎖RNAとして調製することにより、RNAインターフェアレンス法に適用することができる。2本鎖RNAの作製方法、及びRNAインターフェアレンス法については、例えば、Elbashir, S., et al., Nature, 411: 494-498 (2001)に記載の方法等を用いることができる。上記2本鎖RNAは、そのすべてがRNAである必要はない。具体的には、その一部がDNAであるものとして、WO02/10374号公報に記載のものを用いることができる。
このRNAインターフェアランス法において標的となる遺伝子(以下これを「標的遺伝子」と称することがある)は、本発明のDNAであれば、いかなるものであってもよい。また、該遺伝子DNAのオルソログと予想される遺伝子も標的遺伝子とすることができる。これらのDNAの少なくとも一部の塩基配列と実質的に同一な配列を有するRNAからなる2本鎖オリゴヌクレオチド(以下、これを「2本鎖オリゴヌクレオチド」と称することがある)とは、標的遺伝子の塩基配列のうち、いずれの部分でもよい15bp以上の配列と実質的に同一な配列からなるものである。ここで、実質的に同一とは、標的遺伝子の配列と80%以上の相同性を有することを意味する。
また、解析対象タンパク質が公知タンパク質と比較して、挿入型あるいは置換型バリアントである場合は、2本鎖オリゴヌクレオチド配列は挿入あるいは置換部位に設定することができる。また、解析対象タンパク質が公知タンパク質の欠失型バリアントである場合は、欠失部を跨ぐ配列を2本鎖オリゴヌクレオチド配列とすることにより、該タンパク質特異的に効果のある配列を選定することができる。さらに、解析対象タンパク質と公知タンパク質のそれぞれをコードするDNAの塩基配列と比較して、解析対象タンパク質をコードするDNAに特異的な塩基配列を選定することによれば、解析対象タンパク質特異的にその発現を阻害することができる。
ヌクレオチドの鎖長は15bpから標的遺伝子のオープンリーディングフレーム(ORF)の全長までのいかなる長さでもよいが、15〜500bp程度のものが好ましく用いられる。ただし、哺乳類動物由来の細胞においては、30bp以上の長い2本鎖RNAに反応して活性化するシグナル伝達系の存在が知られている。これはインターフェロン反応と呼ばれており(Mareus, P. I., et al., Interferon, 5: 115-180 (1983))、該2本鎖RNAが細胞内に侵入すると、PKR(dsRNA-responsive protein kinase: Bass, B. L., Nature, 411: 428-429 (2001))を介して多くの遺伝子の翻訳開始が非特異的に阻害され、それと同時に2’-5’oligoadenylate synthetase(Bass, B. L., Nature, 411: 428-429(2001))を介してRNase Lの活性化が起こり、細胞内のRNAの非特異的な分解が惹起される。これらの非特異的な反応のために、標的遺伝子の特異的反応が隠蔽されてしまう。従って哺乳類動物または該動物由来の細胞あるいは組織を被導入体として用いる場合には15〜30bp、好ましくは19〜24bp、さらに好ましくは21bpの2本鎖オリゴヌクレオチドを用いることが好ましい。2本鎖オリゴヌクレオチドはその全体が2本鎖である必要はなく、5’または3’末端が一部突出したものも含むが、3’末端が2塩基突出したものを用いることが好ましい。2本鎖オリゴヌクレオチドは相補性を有する2本鎖のオリゴヌクレオチドを意味するが、自己相補性を有する1本鎖オリゴヌクレオチドが自己アニーリングしたものでもよい。自己相補性を有する1本鎖オリゴヌクレオチドとしては、例えば、逆方向反復配列を有するもの等が挙げられる。
2本鎖オリゴヌクレオチドの調製方法としては特に制限はないが、それ自体既知の化学合成方法を用いることが好ましい。化学合成は相補性を有する1本鎖オリゴヌクレオチドを別個に合成し、これを適当な方法で会合させることにより2本鎖とすることができる。会合の方法としては上記ポリヌクレオチドを混合し、2本鎖が解離する温度にまで加熱し、その後徐々に冷却する方法等が挙げられる。会合した2本鎖オリゴヌクレオチドは、アガロースゲル等を用いて確認し、残存する1本鎖オリゴヌクレオチドを適当な酵素により分解する等して除去する。
このようにして調製した2本鎖オリゴヌクレオチドを導入する被導入体としては、標的遺伝子がその細胞内でRNAに転写、またはタンパク質に翻訳を受け得るものであればいかなるものであってもよいが、具体的には、植物、動物、原生動物、ウィルス、バクテリア、または真菌種に属するものが挙げられる。植物は単子葉植物、双子葉植物または裸子植物であってよく、動物は、脊椎動物または無脊椎動物であってよい。好ましい微生物は、農業または工業において使用されるものであり、そして植物または動物に対して病原性のものである。真菌には、カビ及び酵母形態両方での生物体が含まれる。脊椎動物の例には、魚類、ウシ、ヤギ、ブタ、ヒツジ、ハムスター、マウス、ラット及びヒトを含む哺乳動物が含まれ、無脊椎動物には、線虫類及び他の虫類、キイロショウジョウバエ(Drosophila)、及び他の昆虫が含まれる。好ましくは、細胞は脊椎動物細胞である。
被導入体は、細胞、組織あるいは個体を意味する。ここで細胞とは、生殖系列または体性、分化全能、または多分化能、分割または非分割、実質組織または上皮、不滅化したものまたは形質転換したもの等からであってよい。細胞は、配偶子または胚であってよく、胚の場合、単一細胞胚または構成性細胞、または多重細胞胚からの細胞であり、胎児組織を含む。さらには、幹細胞のような未分化細胞、または胎児組織を含む器官または組織の細胞からのような分化細胞、または生物内に存在する任意の他の細胞であってよい。分化している細胞型には、脂肪細胞、繊維芽細胞、筋細胞、心筋細胞、内皮細胞、神経細胞、グリア、血液細胞、巨核球、リンパ球、マクロファージ、好中球、好酸球、好塩基球、マスト細胞、白血球、顆粒球、ケラチン生成細胞、軟骨細胞、骨芽細胞、破骨細胞、肝細胞および内分泌腺または外分泌腺の細胞が含まれる。
被導入体への2本鎖オリゴヌクレオチドの導入法としては、被導入体が細胞、あるいは組織の場合は、カルシウムフォスフェート法、エレクトロポレーション法、リポフェクション法、ウィルス感染、2本鎖オリゴヌクレオチド溶液への浸漬、あるいは形質転換法等が用いられる。また、胚に導入する方法としては、マイクロインジェクション、エレクトロポレーション法、あるいはウィスル感染等が挙げられる。被導入体が植物の場合には、植物体の体腔または間質細胞等への注入または灌流、あるいは噴霧による方法が用いられる。また、動物個体の場合には、経口、局所、非経口(皮下、筋肉内及び静脈内投与を含む)、経膣、経直腸、経鼻、経眼、腹膜内投与等によって全身的に導入する方法、あるいはエレクトロポレーション法やウィルス感染等が用いられる。経口導入のための方法には、2本鎖オリゴヌクレオチドを生物の食物と直接混合することができる。さらに、個体に導入する場合には、例えば埋め込み長期放出製剤等として投与することや、2本鎖オリゴヌクレオチドを導入した導入体を摂取させることにより行うこともできる。
RNAインターフェアレンスによる本発明のDNAの導入体内での発現抑制により、本発明のDNAがコードするタンパク質の機能の確認、あるいは新たな機能の解析等を行うことができる。
(9)本発明のタンパク質に特異的に結合する抗体
本発明のタンパク質と特異的に結合する抗体の調製方法としては、通常用いられる公知の方法を用いることができ、抗原として用いられるポリペプチドについても、公知の方法に従って抗原性が高くエピトープ(抗原決定基)として適した配列を選択して用いることができる。エピトープの選択方法としては、例えばEpitope Adviser(富士通九州システムエンジニアリング社製)等の市販のソフトウェアを用いることができる。また、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ反応し、公知の、またはそれ以外のバリアントには反応しない抗体を用いることにより、対象タンパク質に特異的な機能を同定することができる。このような抗体のエピトープとしては、例えば、対象タンパク質が公知のバリアントと比較して欠失しているアミノ酸配列がある場合、欠失部分の前後のアミノ酸配列(ジャンクション部分)等が好ましい。また、対象タンパク質が公知のバリアントのN末またはC末が添加されているアミノ酸配列を有する場合、添加されているアミノ酸配列をエピトープとすることも好ましい。上記以外の方法として、対象タンパク質に対して取得したポリクローナル抗体から、公知の、またはそれ以外のバリアントに反応する抗体を除去することにより、対象タンパク質にのみ反応する抗体を取得することができる。除去する方法としては、公知の、またはそれ以外のバリアントをリガンドとして固定したアフィニティークロマトグラフィー、あるいは、公知の、またはそれ以外のバリアントによる免疫沈降法等が用いられる。
上記の抗原として用いるポリペプチドは、公知の方法に従って合成した合成ペプチドでも、また本発明のタンパク質そのものを用いることもできる。抗原となるポリペプチドは、公知の方法に従って適当な溶液等に調製して、哺乳動物、例えばウサギ、マウス、ラット等に免疫を行えばよいが、安定的な免疫を行ったり抗体価を高めるために抗原ペプチドを適当なキャリアタンパク質とのコンジュゲートにして用いたり、アジュバント等を加えて免疫を行うのが好ましい。
免疫に際しての抗原の投与経路は特に限定されず、例えば皮下、腹腔内、静脈内、あるいは筋肉内等のいずれの経路を用いてもよい。具体的には、例えばBALB/cマウスに抗原ポリペプチドを数日〜数週間おきに数回接種する方法等が用いられる。また、抗原の摂取量としては、抗原がポリペプチドの場合0.3〜0.5mg/1回程度が好ましいが、ポリペプチドの種類、また免疫する動物種によっては適宜調節される。
免疫後、適宜試験的に採血を行ってオクタロニー法、固相酵素免疫検定法(以下、これを「ELISA法」と称することがある)やウエスタンブロッティング等の方法で抗体価の上昇を確認し、十分に抗体価の上昇した動物から採血を行う。これに抗体の調製に用いられる適当な処理を行えばポリクローナル抗体を得ることができる。具体的には、例えば、公知の方法に従い血清から抗体成分を精製した精製抗体を取得する方法等が挙げられる。抗体成分の精製は、塩析、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー等の方法を用いることができる。
また、該動物の脾臓細胞とミエローマ細胞とを用いて公知の方法に従って融合させたハイブリドーマを用いる(Milstein, et al., Nature, 256: 495 (1975))ことによりモノクローナル抗体を作製することもできる。モノクローナル抗体は、例えば以下の方法により取得することができる。
まず、上記した抗原の免疫により抗体価の高まった動物から抗体産生細胞を取得する。抗体産生細胞は、形質細胞、及びその前駆細胞であるリンパ球であり、これは個体のいずれから取得してもよいが、好ましくは脾臓、リンパ節、末梢血等から取得する。これらの細胞と融合させるミエローマとしては、一般的にはマウスから得られた株化細胞、例えば8−アザグアニン耐性マウス(BALB/c由来等)ミエローマ細胞株であるP3X63−Ag8.653(ATCC:CRL−1580)、P3−NS1/1Ag4.1(理研セルバンク:RCB0095)等が好ましく用いられる。細胞の融合は、抗体産生細胞とミエローマ細胞を適当な割合で混合し、適当な細胞融合培地、例えばRPMI1640やイスコフ改変ダルベッコ培地(IMDM)、あるいはダルベッコ改変イーグル培地(DMEM)等に、50%ポリエチレングリコール(PEG)を溶解したもの等を用いることにより行うことができる。また電気融合法(Zimmermann, U. et al., Naturwissenschaften, 68: 577 (1981))によっても行うことができる。
ハイブリドーマは、用いたミエローマ細胞株が8−アザグアニン耐性株であることを利用して適量のヒポキサンチン・アミノプテリン・チミジン(HAT)液を含む正常培地(HAT培地)中で5%CO2、37℃で適当時間培養することにより選択することができる。この選択方法は用いるミエローマ細胞株によって適宜選択して用いることができる。選択されたハイブリドーマが産生する抗体の抗体価を上記した方法により解析し、抗体価の高い抗体を産生するハイブリドーマを限界希釈法等により分離し、分離した融合細胞を適当な培地で培養して得られる培養上清から硫安分画、アフィニティクロマトググラフィー等の適当な方法により精製してモノクローナル抗体を得ることができる。また精製には市販のモノクローナル抗体精製キットを用いることもできる。さらには、免疫した動物と同系統の動物、またはヌードマウス等の腹腔内で上記で得られた抗体産生ハイブリドーマを増殖させることにより、本発明のモノクローナル抗体を大量に含む腹水を得ることもできる。
また、本発明のタンパク質としてヒト由来のものを取得した場合には、かかるポリペプチド、あるいはその部分ペプチドを抗原として、ヒト末梢血リンパ球を移植したSevere combined immune deficiency(SCID)マウスに上記した方法と同様にして免疫し、該免疫動物の抗体産生細胞とヒトのミエローマ細胞とのハイブリドーマを作製することによってもヒト型抗体を作製することができる(Mosier, D. E., et al., Nature, 335: 256-259 (1988); Duchosal, M. A., et al., Nature, 355: 258-262 (1992))。
また、取得したヒト型抗体を産生するハイブリドーマからRNAを抽出し、目的のヒト型抗体をコードする遺伝子をクローニングして、この遺伝子を適当なベクターに挿入し、これを適当な宿主に導入して発現させることにより、さらに大量にヒト型抗体を作製することができる。ここで、抗原との結合性の低い抗体は、それ自体既知の進化工学的手法を用いることによりさらに結合性の高い抗体として取得することもできる。一過性抗体等の部分フラグメントは、例えばパパイン等を用いてFab部分とFc部分を切断し、アフィニティカラム等を用いてFab部分を回収することによって作製することができる。
かくして得られる本発明のタンパク質と特異的に結合する抗体は、本発明のタンパク質に特異的に結合することによって該タンパク質が有する転写調節活性等を阻害する中和抗体として用いることもできる。タンパク質が有する活性を阻害するものの選択方法としては特に制限はないが、例えば、上記(4)で作製したDNA導入体に抗体を接触または導入し、導入体中の目的タンパク質の機能が阻害されるか否かを解析する方法等が挙げられる。
かかる中和抗体は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
(10)本発明のタンパク質が有する活性を調節する分子のスクリーニング
本発明のタンパク質に特異的に結合し、かつ本発明のタンパク質の機能(活性)を阻害、拮抗または増強する作用を有する物質をスクリーニングすることにより本発明のタンパク質の機能調節物質(以下、これを「調節物質」と称することがある)を得ることができる。
この調節物質のスクリーニング方法は、本発明のタンパク質に特異的に結合し、かつ該タンパク質の活性を阻害、拮抗または増強する作用を有する物質が得られる方法であればいかなるものであってもよい。例えば、まずはじめに本発明のタンパク質とスクリーニングに供する物質(以下、これを「被検物質」と称することがある)とを接触させ、該タンパク質との結合性を指標として選抜した後に、本発明のタンパク質が有する活性の変化を指標として被検物質を選抜する方法を用いることができる。
被検物質としては、本発明のタンパク質と相互作用して、該タンパク質が有する活性に影響を及ぼす可能性のある物質であればいかなるものであってもよいが、具体的には、例えば、ペプチド、タンパク質、非ペプチド性化合物、低分子化合物、合成化合物、発酵生産物、細胞抽出液、動物組織抽出液等が挙げられる。これらの物質は新規な物質であってもよいし、公知の物質であってもよい。被検物質と本発明のタンパク質の相互作用の解析法としては、それ自体既知の常法を用いることができるが、具体的には、例えば、酵母ツーハイブリッド法、蛍光偏光解消法、表面プラズモン法、ファージディスプレイ法、リボソーマルディスプレイ法、あるいは上記(9)に記載した抗体との競合解析法等が挙げられる。このような方法により、本発明のタンパク質に結合する活性を見いだされた物質は、次に該物質の存在下で本発明のタンパク質が有する活性がどのような影響を受けるかを解析することによって、調節物質として用いられるか否かが同定される。ここで、対象タンパク質が、公知のバリアントが存在するスプライシングバリアントである場合には、対象タンパク質にのみ結合し、公知のまたは他のバリアントには結合しない物質についてその影響を解析するか、または公知のあるいは他のバリアントにおいても同様に結合するか否かを同定し、結合した場合にはその影響の相違を解析することによって、対象タンパク質に対する該物質の影響を解析することができる。また、該物質の個体内での分布を検討することにより、対象タンパク質や公知のまたは他のバリアントに対する影響を解析することができる。
具体的な解析方法としては、例えば、転写調節活性を調節する物質を解析する場合には、(4)に記載したDNA導入体に標的となるタンパク質も同様の方法で導入する。この導入体について選択された物質の存在下/または非存在下で標的となるタンパク質の転写活性等をそれ自体既知の通常用いられる方法により解析する。具体的には、上記(5)に記載の方法等を用いて行うことができる。転写調節活性が、物質の非存在下の場合と比べて増加した場合には、該物質は転写調節因子の活性化物質として機能する可能性があり、また低下、または阻害された場合には物質は転写調節因子の阻害物質として機能する可能性があると同定できる。
ここで、医薬活性成分の取得を目的として調節物質をスクリーニングするために用いる本発明のDNA、あるいはタンパク質を用いる場合は、上記したヒトのDNAあるいはタンパク質を用いることが好ましい。さらに上記方法によってスクリーニングされた物質は、さらに生体内でのスクリーニングによって医薬候補としての選択を行ってもよい。なお、本発明のタンパク質の機能調節物質の評価は、上記した方法に限定されるものではない。
転写調節因子は、癌に関連するパスウェイ上のシグナル伝達機能、心筋発達に関連するパスウェイ上のシグナル伝達機能、精子の分化・運動性を制御するパスウェイ上のシグナル伝達機能、生殖細胞分化を制御するパスウェイ上のシグナル伝達機能、細胞分化を制御するパスウェイ上のシグナル伝達機能、グリセロール三リン酸を生成する機能、神経細胞の発生・分化・増殖・生存維持を制御するパスウェイ上のシグナル伝達機能、アルツハイマー病発症を制御するパスウェイ上のシグナル伝達機能他、各種細胞の発生、分化、成長、増殖、生存、再生、および、細胞機能等を制御するパスウェイのシグナル伝達機能等、各種シグナル伝達において最終的にDNAに結合して遺伝子の発現制御に関わる。従って、これらシグナル伝達に関わる各種疾患治療剤のスクリーニングの標的とすることができる。本スクリーニング方法により同定できる化合物は、抗ガン剤、糖尿病治療剤、抗炎症剤、神経変性疾患治療剤、心疾患治療剤、不妊治療剤、再生組織誘導剤、アルツハイマー病治療剤、肥満治療剤、糖尿病治療剤、心臓血管疾患治療剤、代謝異常治療剤、食欲不振、過食症などの治療剤等として用いられ得るものである。
また、本発明のタンパク質をコードするDNAは、脳(扁桃核、海馬、黒質、胎児脳)、精巣、気管、成人乳房、軟骨細胞、未分化の神経前駆細胞を含む神経系細胞等の組織、器官または細胞由来のRNAから構築されたcDNAライブラリーよりクローニングされており、取得された本発明のタンパク質は、上記組織または器官等において特有の機能を有している可能性があるので、本発明のタンパク質の機能調節物質は該組織または器官に特有の疾患の治療剤として用いられ得るものである。
かかる調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
(11)本発明のDNAの発現調節物質のスクリーニング
スクリーニングの方法としては、被検物質の存在下で本発明のタンパク質、あるいはそれをコードするmRNAの発現量を解析する方法等が挙げられる。具体的には、例えば、(4)に記載した本発明のタンパク質を発現する細胞を被検物質を含む適当な培地で培養し、該細胞内に発現している本発明のタンパク質量をELISA等の常法を用いて解析するか、あるいは該細胞内の本発明のタンパク質をコードするmRNA量を、定量的逆転写PCR法や、ノーザンブロット法等により解析することにより行うことができる。
被検物質としては、(10)に記載のものを用いることができる。この解析により、被検物質の非存在下で培養された当該細胞内で発現されたタンパク質、あるいはmRNA量と比べてその量が増加すれば、この被検物質は本発明のDNAの発現促進物質として機能する可能性があり、逆に減少した場合には、この被検物質は本発明のDNAの発現阻害物質として用いられ得ると判断することができる。
かかる発現調節物質は、臨床へ応用するに際し、上記有効成分を単独で用いることも可能であるが、薬学的に許容され得る担体と配合して医薬品組成物として用いることもできる。この時の有効成分の担体に対する割合は、1〜90重量%の間で変動され得る。また、かかる薬剤は種々の形態で投与することができ、それらの投与形態としては、錠剤、カプセル剤、顆粒剤、散剤、あるいはシロップ剤等による経口投与、または注射剤、点滴剤、リポソーム剤、坐薬剤等による非経口投与を挙げることができる。また、その投与量は、症状、年齢、体重等によって適宜選択することができる。
なお、本発明のcDNAがコードしている蛋白質が、例えば、細胞の増殖・分化などの細胞状態を制御する機能を有する場合には、以下のようにして医薬品開発を行うことができる。ある種の細胞に、本発明によって提供される蛋白質や抗体を細胞内にマイクロインジェクションすることによって、細胞の増殖・分化などの細胞状態変化や、細胞内の特定の遺伝子の活性化または抑制を指標に低分子化合物等をスクリーニングすることができる。このスクリーニングは、例えば、以下のように行うことができる。
まず、本発明の蛋白質を発現させ組換え蛋白質の精製品を取得する。次いで、その精製蛋白質を、各種細胞株または初代培養細胞の細胞内にマイクロインジェクションして、増殖・分化などの細胞の変化を調べる。または、ある特定の細胞状態変化に作用することが知られている遺伝子の誘導をmRNA量、蛋白質量で検出する。あるいは、ある特定の細胞状態変化に影響を与えることが知られている遺伝子産物(蛋白質)の働きにより変化した細胞内の物質(低分子化合物など)量で検出する。そのときに培養液等に活性をスクリーニングしたい物質(低分子でも高分子でも可能)を添加しておくことにより、細胞状態の変化に及ぼす影響を指標にスクリーニングできる。
マイクロインジェクションしなくとも、本発明で取得した遺伝子を導入した形質転換細胞株を用いてのスクリーニングが可能である。本発明で取得した遺伝子産物が特定の細胞状態変化に作用することが明らかになった場合には、該遺伝子産物の変化を指標にスクリーニングできる。このようなスクリーニングにより、本発明による蛋白質が細胞状態、機能を制御するのを活性化または抑制する物質が開発されれば、医薬品への応用が考えられる。
また、本発明のcDNAがコードしている蛋白質が、例えば、分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、転写関連蛋白質、疾患関連蛋白質の機能を有する場合については、それぞれの蛋白質を用いた機能の解析に基づいて、例えば以下のようにして医薬品開発を行うことができる。
膜蛋白質の場合、細胞上に発現して受容体やリガンドとして機能する蛋白質である可能性が高い。したがって、本発明によって提供される膜蛋白質を、公知の、あるいは新規なリガンドや受容体との結合活性に基づいてスクリーニングすれば、新たなリガンド−受容体の関係を見出すことができる。スクリーニングは公知の方法に従って行うことができる。
たとえば次のようにして本発明の蛋白質に対するリガンドをスクリーニングすることができる。すなわち(a)本発明の蛋白質またはその部分ペプチド、またはそれらを発現する細胞に被検試料を接触させる工程、および(b)該蛋白質、該ペプチドまたは該細胞に結合する被検試料を選択する工程、とによって特定の蛋白質に結合するリガンドのスクリーニングが可能となる。
一方、例えば、以下のようにして本発明の蛋白質の受容体を発現する細胞をスクリーニングすることもできる。すなわち、(a)本発明の蛋白質またはその部分ペプチドに被検細胞試料を接触させる工程、および(b)該蛋白質またはその部分ペプチドに結合する細胞を選択する工程、とによって特定の蛋白質に結合する受容体のスクリーニングが可能である。
このスクリーニングは、例えば、以下のように行うことが可能である。まず、本発明の蛋白質を発現させ組換え蛋白質の精製品を取得する。次いで、その精製蛋白質を標識し、各種細胞株または初代培養細胞に対して結合アッセイを行い、これにより受容体を発現している細胞を選定する(本庶・新井・谷口・村松編 新生化学実験講座7 増殖分化因子とその受容体p203-236 (1991) 東京化学同人)。標識としては、125IなどのRI標識のほか、酵素(アルカリホスファターゼ等)標識も可能である。
また、本発明の蛋白質を標識せずに用いて、本発明の蛋白質と受容体を発現している細胞とを結合させた後に、本発明の蛋白質に対する抗体を標識して用いて検出することも考えられる。上記スクリーニングにより得られた本発明の蛋白質の受容体を発現する細胞は、後述するように該受容体のアゴニストやアンタゴニストのスクリーニングに用いることが可能である。
上記のスクリーニングにより、本発明の蛋白質が結合するリガンドや、本発明の蛋白質の受容体やその受容体を発現する細胞が得られれば、それらリガンドや受容体と結合する化合物のスクリーニングが可能となる。またそれらの結合活性を指標に、両者の結合を阻害する化合物(例えば、受容体アゴニストやアンタゴニスト)のスクリーニングが可能となる。
このスクリーニング方法は、本発明の蛋白質が受容体である場合は、(a)被検試料の存在下で、本発明の蛋白質または本発明の蛋白質を発現する細胞とリガンドとを接触させる工程、(b)該蛋白質または該蛋白質を発現する細胞とリガンドとの結合活性を検出する工程、および(c)被検試料非存在下において検出した場合と比較して該結合活性を低下させる化合物を選択する工程、とを含む。また本発明の蛋白質がリガンドである場合には、(a)被検試料の存在下で、本発明の蛋白質を該蛋白質の受容体または該受容体を発現する細胞に接触させる工程、(b)該蛋白質とその受容体または該受容体を発現する細胞との結合活性を検出する工程、および(c)被検試料非存在下において検出した場合と比較して、該結合活性を低下させる化合物を選択する工程、を含む。
スクリーニングに用いる被検試料としては、例えば、細胞抽出液、遺伝子ライブラリーの発現産物、合成低分子化合物、合成ペプチド、天然化合物などが挙げられるが、これらに制限されない。また、本発明の蛋白質との結合活性を指標とした上記のスクリーニングにより単離された化合物を被検試料として用いることも可能である。
このスクリーニングにより単離される化合物は、本発明の蛋白質自体または本発明の蛋白質に対する受容体のアゴニストやアンタゴニストの候補となる。本発明の受容体とリガンドとの結合活性の低下によるリン酸化などの細胞内シグナルの変化をもとに、得られた化合物が本発明の蛋白質の受容体のアゴニストであるかアンタゴニストであるかを判定することができる。また、スクリーニングによって得られる化合物は、生体内において、本発明の蛋白質と相互作用する分子(受容体も含む)との該相互作用を阻害する化合物の候補ともなる。本発明の蛋白質、または本発明の蛋白質に結合する受容体、またはリガンド、更にはこれらの化合物は、本発明の蛋白質が関連する疾患の予防薬や治療薬への応用、または本発明の蛋白質が関連する疾患の検査薬への応用などが考えられる。
分泌蛋白質の場合、細胞の増殖・分化などの細胞状態を制御する因子の可能性がある。新たな細胞状態を制御する因子は、ある種の細胞に、本発明によって提供される分泌蛋白質を加えることによって、細胞の増殖・分化などの細胞の状態変化や、細胞内の特定の遺伝子の活性化を指標にスクリーニングすることにより見出すことができる。
このスクリーニングは、例えば、以下のように行うことが可能である。まず、本発明の蛋白質を発現させ組換え蛋白質の精製品を取得する。次いで、その精製蛋白質を、各種細胞株または初代培養細胞に添加して、増殖・分化などの細胞の変化を調べる。または、ある特定の細胞状態の変化に影響を与えることが知られている遺伝子の誘導をmRNA量、蛋白質量で検出する。あるいはある特定の細胞状態変化に影響を与えることが知られている遺伝子産物(蛋白質)の働きにより変化した細胞内の物質(低分子化合物など)量で検出する。
このようなスクリーニングにより、本発明による蛋白質が細胞状態、機能を制御するとなれば、本発明の蛋白質は、関連した疾患に対して、そのまま、あるいは一部適した状態に改変して、医薬品や検査薬への応用が考えられる。
また、先に膜タンパクについて記述したように、本発明によって提供される分泌蛋白質を用いて、公知の、あるいは新規なリガンドや受容体との結合活性に基づいてスクリーニングすれば、新たなリガンド−受容体の関係を見出すことができ、同様の方法でアゴニスト、アンタゴニストの判定が可能となる。こうして得られる化合物は、生体内において、本発明の蛋白質と相互作用する分子(受容体も含む)との該相互作用を阻害する化合物の候補ともなる。これら化合物は、本発明の蛋白質が関連する疾患の予防薬や治療薬、あるいは検査薬への応用が考えられる。
シグナル伝達関連蛋白質、転写関連蛋白質の場合は、細胞内外の刺激に反応して、ある蛋白質や遺伝子に作用する因子の可能性がある。新たな蛋白質、遺伝子に作用する因子は、ある種の細胞に、本発明によって提供される蛋白質を発現させることによって、細胞内の特定の遺伝子や蛋白質の活性化を指標にスクリーニングすることにより見出すことができる。
このスクリーニングは、例えば、以下のように行うことが可能である。まず、本発明の蛋白質を発現した形質転換細胞株を取得する。次いで、その形質転換細胞株と、もとの未形質転換細胞株とにおいて、ある特定の遺伝子の変化をmRNA量、蛋白質量で検出する。あるいは、ある特定の遺伝子産物(蛋白質)の働きにより変化した細胞内の物質(低分子化合物など)量で検出する。さらには、ある特定の遺伝子の発現調節領域とマーカー遺伝子(ルシフェラーゼ、β−ガラクトシダーゼ等)の融合遺伝子を導入した細胞に、本発明によって提供される蛋白質を同時に発現させることによって、特定の遺伝子の発現の変化を、マーカー遺伝子産物(蛋白質)由来の活性で判定する。
このようなスクリーニングにより、影響を受けた蛋白質や遺伝子が疾患に関連していた場合、本発明による蛋白質を利用し、直接的に、または、間接的に、その発現や活性調節を行う化合物や遺伝子のスクリーニングが可能となる。
例えば、まず、本発明の蛋白質を発現させ組換え蛋白質の精製品を取得する。次に影響を受けた蛋白質や遺伝子を精製し、その結合を調べる。または、予め阻害剤の候補となる化合物を加えておいた後、それら結合の変化を調べる。あるいは、例えば他遺伝子の発現調節を行う本発明の蛋白質をコードする遺伝子の5'上流転写調節領域を取得し、マーカー遺伝子と融合した遺伝子を導入した細胞に、化合物などを添加して、当該遺伝子の発現を制御する因子を見いだす。
このようなスクリーニングによって得られた化合物は、本発明による蛋白質が関連した疾患に対して医薬品への応用が考えられる。スクリーニングによって得られた制御因子が蛋白質であっても、同様に、その蛋白質の発現・活性に本来ない影響を与える化合物があれば、その化合物は、本発明による蛋白質が関連した疾患に対して医薬品への応用が考えられる。
分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、転写関連蛋白質、疾患関連蛋白質のいずれの場合でも、本発明による蛋白質が酵素としての活性を有するとなれば、本発明によって提供される蛋白質に化合物を適当な条件下で添加し、化合物の変化を指標にスクリーニングすれば可能である。また、この活性を指標に本発明による蛋白質の活性を阻害する化合物のスクリーニングも可能である。
このスクリーニングは、例えば、以下のように行うことが可能である。まず、本発明の蛋白質を発現させ組換え蛋白質の精製品を取得する。次いで、その精製蛋白質に、化合物を添加して、化合物量および反応生成物量を調べる。または、予め阻害剤の候補となる化合物を加えておいた後、精製蛋白質と反応する化合物(基質)を加えて、その基質量および反応生成物量の変化を調べる。
このようなスクリーニングにより、得られた化合物は、本発明の蛋白質が関連した疾患に対して、医薬品への応用が考えられる。また本発明の蛋白質が生体において正常に機能しているかどうかを調べるなどの検査への応用が考えられる。
本発明の分泌蛋白質、膜蛋白質、シグナル伝達関連蛋白質、転写関連蛋白質が、新たな疾患関連蛋白質であるかは、上記に挙げた以外に、本発明による蛋白質を発現して得られた特異認識抗体を用いて、特定の疾患と蛋白質の発現量や活性との相関を知ることができる。あるいは、「Method in Molecular Biology」(Humana Press社)シリーズの『Molecular Diagnosis of Genetic Diseases』(Rob Elles編、1996)を参考に解析が可能である。
疾患関連蛋白質は、前述のようなスクリーニングの対象となり、その発現・活性を制御する薬剤の開発に有用である。また、関連した疾患の診断マーカー、あるいは遺伝子治療のターゲットになるなど医療産業上、有用である。
以上により単離された化合物を医薬品として用いる場合には、単離された化合物自体を直接患者に投与する以外に、公知の製剤学的方法により製剤化して投与を行うことも可能である。例えば、薬理学上許容される担体もしくは媒体、具体的には、滅菌水や生理食塩水、植物油、乳化剤、懸濁剤などと適宜組み合わせて製剤化して投与することが考えられる。患者への投与は、例えば、動脈内注射、静脈内注射、皮下注射など当業者に公知の方法により行いうる。投与量は、患者の体重や年齢、投与方法などにより変動するが、当業者であれば適当な投与量を適宜選択することが可能である。また、該化合物がDNAによりコードされうるものであれば、該DNAを遺伝子治療用ベクターに組込み、遺伝子治療を行うことも考えられる。投与量、投与方法は、患者の体重や年齢、症状などにより変動するが、当業者であれば適宜選択することが可能である。
(12)本発明のDNA導入動物
上記(1)に記載の、本発明のDNAを含む導入DNAを構築し、ヒト以外の哺乳動物の受精卵に導入して、これを雌個体卵管に移植して発生させることにより、本発明のDNAが導入された非ヒト哺乳動物を作製することができる。より具体的には、例えば、雌個体をホルモン投与により過剰排卵させた後、雄と交配し、交配後1日目の卵管から受精卵を摘出し、該受精卵に導入DNAをマイクロインジェクション等の方法により導入する。この後、適当な方法で培養した後、生存している受精卵を、偽妊娠させた雌個体(仮親)の卵管に移植して出産させる。新生仔に目的のDNAが導入されているか否かは、該個体の細胞から抽出したDNAのサザンブロット解析を行うことにより同定することができる。ヒト以外の哺乳動物としては、例えばマウス、ラット、モルモット、ハムスター、ウサギ、ヤギ、ブタ、イヌ、ネコ等が挙げられる。
かくして得られた本発明のDNA導入動物は、この個体を交配し、導入されたDNAが安定的に保持されていることを確認しながら通常の飼育環境で継代飼育することによりその子孫を得ることができる。また、体外受精を繰り返すことによりその子孫を得て、系統を維持することもできる。
本発明のDNAが導入された非ヒト哺乳動物は、本発明のDNAの生体内における機能の解析や、またこれを調節する物質のスクリーニング系等として用いることができる。
(13)本発明のタンパク質及びそれをコードする塩基配列を含むDNAの他の利用
本発明のタンパク質は、それを基盤上に結合させた担体として利用することができる。また、本発明のタンパク質をコードする塩基配列、例えば、配列番号1〜11のいずれかに記載の塩基配列を有するDNAまたはその部分断片は、それらを基板上に結合させた担体として用いられ得る。これらを、以下、「プロテインチップ」、「DNAチップ」または「DNAアレイ」(DNAマイクロアレイ及びDNAマクロアレイ)と称することがある。これらのプロテインチップ、又はDNAチップもしくはアレイには、本発明のタンパク質やDNA以外に、他のタンパク質やDNAが含まれていてもよい。ここで、対象タンパク質が公知のバリアントが存在するスプライシングバリアントである場合、上記プロテインチップには対象タンパク質特異的なアミノ酸配列部分断片を用いることもできるが、他のバリアントと異なる立体構造を有している可能性もあるためその全長を用いることもできる。また、DNAアレイには、対象タンパク質をコードするDNA配列のうち、他のバリアントDNAと異なる配列を選択することが好ましい。
また、タンパク質やDNAを結合させる基盤としては、ナイロン膜、ポリプロピレン膜等の樹脂基板、ニトロセルロース膜、ガラスプレート、シリコンプレート等が用いられるが、ハイブリダイゼーションの検出を非RI的に、例えば、蛍光物質等を用いて行う場合には、蛍光物質を含まないガラスプレート、シリコンプレート等が好適に用いられる。また該基盤へのタンパク質、あるいはDNAの結合は、それ自体公知の通常用いられる方法により容易に行うことができる。これらのプロテインチップ、DNAチップ、あるいはDNAアレイも、本発明の範囲に含まれる。
また、本発明のタンパク質のアミノ酸配列及びDNAの塩基配列は、配列情報としても用いることができる。このDNAの塩基配列には、対応するRNAの塩基配列も含まれる。すなわち、得られたアミノ酸配列や塩基配列をコンピューターが読みとり可能な所定の形式で適当な記録媒体に格納することにより、アミノ酸配列や塩基配列のデータベースが構築できる。このデータベースには、他の種類のタンパク質やそれをコードするDNAの塩基配列が含まれていてもよい。また、本発明においてデータベースとは、上記配列を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピューターシステムをも意味する。ここで適当な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気媒体、CD−ROM、MO、CD−R、CD−RW、DVD―R、DVD−RAM等の光ディスク、半導体メモリ等を挙げることができる。
以下、実施例を挙げて本発明を詳細に説明するが、本発明の範囲はこれらの実施例により限定されるものではない。
オリゴキャップ法によるcDNAライブラリーの作製
ヒト胎児脳(Brain, Fetal)組織より、文献(J.Sambrook,et al.,Molecular Cloning Second edition,Cold Spring harbor Laboratory Press(1989))記載の方法によりmRNAを抽出した。さらに、オリゴdTセルロースでポリ(A)+RNAを精製した。
上記で取得したポリ(A)+RNAと、ヒト各組織より全RNAとして抽出された市販の各mRNA(クロンテック社製:小脳(#64035−1)、全脳(#64020−1)、精巣(#64027−1)、胸腺(#64028−1))、およびヒト各組織よりポリ(A)+RNAとして抽出・精製された市販の各mRNA(クロンテック社製:扁桃(#6574−1)、海馬(#6578−1)、視床(#6582−1))に全脳の全RNAからポリ(A)+RNAをオリゴdTセルロースで除くことにより調製したポリ(A)RNAをそれぞれ混ぜたRNAから、オリゴキャップ法(Maruyama, K., et al., Gene, 138: 171-174 (1994))によりcDNAライブラリーをそれぞれ作製した。以下に、ライブラリー名とその由来の関係を示す。
BRACE:小脳(Brain, cerebellum);
BRAMY:扁桃(Brain, amygdala);
BRAWH:全脳(Brain, whole);
BRHIP:海馬(Brain, hippocampus);
BRTHA:視床(Brain, thalamus);
FCBBF:胎児脳(Brain, Fetal);
TESTI:精巣(Testis);
THYMU:胸腺(Thymus)。
まず、上記RNAをBAP(Bacterial Alkaline Phosphatase)およびTAP(Tobacco Acid Pyrophosphatase)で処理した後に、オリゴキャップリンカー(配列番号23)をRNAライゲースを用いて連結した。このRNA鎖を鋳型としてオリゴdTプライマー(配列番号24)を用いた逆転写反応により第1鎖cDNAを合成し、続いてRNA鎖を分解除去した(鈴木ら、タンパク質 核酸 酵素、41: 603-607 (1996);Suzuki, Y. et al., Gene, 200: 149-156 (1997))。次いで、5’のPCRプライマー(配列番号25)と3’のPCRプライマー(配列番号26)を用いPCR(polymerase chain reaction)により2本鎖cDNAを増幅し、増幅されたDNA鎖をSfiIにより切断した。
次いで、発現用ベクターであるpME18SFL3(GenBank AB009864)のDraIIIサイトに上記で取得したSfiI切断断片をクローニングし、cDNAライブラリーを作成した。上記で用いたpME18SFL3ベクターは、クローニング部位の上流にSRαプロモーターとSV40 small tイントロンが組み込まれており、またその下流にはSV40ポリ(A)付加シグナル配列が挿入されている。pME18SFL3のクローン化部位は非対称性のDraIIIサイトとなっており、cDNA断片の末端にはこれと相補的なSfiI部位を付加しているので、クローン化したcDNA断片はSRαプロモーターの下流に一方向性に挿入される。したがって、全長cDNAを含むクローンでは、得られたプラスミドをそのままCOS細胞に導入することにより、一過的に遺伝子を発現させることが可能である。すなわち、非常に容易に、遺伝子産物であるタンパク質として、あるいはそれらの生物学的活性として実験的に解析することが可能となっている。
これらより得たクローンのプラスミドDNAについて、cDNAの5’端または3’端の塩基配列をDNAシーケンシング試薬(Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine Terminator Cycle Sequencing FS Ready Reaction KitまたはBigDye Terminator Cycle Sequencing FS Ready Reaction Kit:PE Biosystems社製)を用い、マニュアルに従ってシーケンシング反応後、DNAシーケンサー(ABI PRISM 3700:PE Biosystems社製)でDNA塩基配列を解析した。
実施例10および実施例11の発現頻度解析に用いたデータベースに供したクローンを含むcDNAライブラリーも、上記と同様の方法で作成した。cDNAライブラリー名とその由来の関係を以下に示す。『』内にライブラリー名を、その後の()内にライブラリーソースのタイプと由来などを/で区切って記載した。
『3NB69』(培養細胞/NB69細胞 (RCB #RCB0480) )
『ADIPS』(組織/脂肪組織(Adipose) (Invitrogen #D6005-01))
『ADRGL』(組織/副腎(Adrenal gland) (CLONTECH #64016-1))
『AHMSC』(培養細胞/HMSC細胞 (間葉細胞; Human mesenchymal cell))
『ASTRO』(初代培養細胞/正常神経膠星状細胞(Normal Human Astrocyte) NHA5732 (宝酒造 #CC2565))
『BEAST』(組織/成人乳房(Adult Breast) ( STARATAGENE #735044))
『BLADE』(組織/膀胱(Bladder) (Invitrogen #D6020-01))
『BRALZ』(組織/アルツハイマー患者大脳皮質(Brain, cortex, Alzheimer) (Invitrogen #D6830-01))
『BRCAN』(組織/尾状核(Brain, caudate nucleus) (CLONTECH #6575-1))
『BRCOC』(組織/脳梁(Brain, corpus callosum) (CLONTECH #6577-1))
『BRSSN』(組織/黒質(Brain, substantia nigra) (CLONTECH #6580-1))
『BRSTN』(組織/視床下核(Brain, subthalamic nucleus) (CLONTECH #6581-1))
『CERVX』(組織/子宮頸管(Cervix) (Invitrogen #D6047-01))
『CHONS』(培養細胞/軟骨細胞(Chondrocyte))
『COLON』(組織/結腸(Colon) (Invitrogen #D6050-0))
『CTONG』(組織/舌癌(Tongue, Cancer))
『D9OST』(初代培養細胞/CD34+細胞(ODF誘導9日))
『DFNES』(初代培養細胞/新生児正常皮膚繊維芽細胞(Normal Human Dermal Fibroblasts (Neonatal Skin); NHDF-Neo) NHDF2564 (宝酒造 #CC2509))
『ERLTF』(培養細胞/TF-1細胞 (赤白血病細胞; erythroleukemia))
『FEBRA』(組織/胎児脳(Brain, Fetal) (CLONTECH #64019-1))
『FEHRT』(組織/胎児心臓(Heart, Fetal) (STARATAGENE #738012))
『FEKID』(組織/胎児腎臓(Kidney; Fetal))
『FELNG』(組織/胎児肺(Lung, Fetal) (STARATAGENE #738020))
『HCASM』(初代培養細胞/正常冠動脈平滑筋細胞HCASMC(Human coronary artery smooth muscle cells) (東洋紡 #T305K-05))
『HCHON』(初代培養細胞/正常軟骨細胞HC(Human Chondrocytes) (東洋紡 #T402K-05))
『HEART』(組織/心臓(Heart) (CLONTECH #64025-1))
『HHDPC』(初代培養細胞/正常頭髪毛乳頭細胞HDPC(Human dermal papilla cells) (東洋紡 #THPCK-001))
『HLUNG』(組織/肺(Lung) (CLONTECH #64023-1))
『HSYRA』(初代培養細胞/滑膜細胞HS-RA(Human synoviocytes from rheumatioid arthritis)(東洋紡 #T404K-05))
『JCMLC』(培養細胞/白血病細胞(Leukemia, myelogenous))
『KIDNE』(組織/腎臓(Kidney) (CLONTECH #64030-1))
『LIVER』(組織/肝臓(Liver) (CLONTECH #64022-1))
『LYMPB』(初代培養細胞/リンパ芽球(Lymphoblast, EB virus transferred B cell))
『MESAN』(初代培養細胞/正常メサンギウム細胞(Normal human mesangial cells) NHMC56046-2 (宝酒造 #CC2559))
『MESTC』(培養細胞/間葉系幹細胞 (Mesenchyme stem cell))
『N1ESE』(培養細胞/間葉系幹細胞(Mesenchymal stem ceell)
『NETRP』(初代培養細胞/好中球 (Neutrophil))
『NOVAR』(組織/成人卵巣(Adult Ovary) (STARATAGENE #735260))
『NT2NE』(培養細胞/NT2細胞 神経分化後濃縮回収(NT2 Neuron))
『NT2RI』(培養細胞/NT2細胞 RA誘導5週間後生育阻害剤処理2週間)
『NT2RP』(培養細胞/NT2細胞 RA誘導5週間)
『NTONG』(組織/正常舌(Tongue))
『OCBBF』(組織/胎児脳(Brain, Fetal))
『PEBLM』(初代培養細胞/正常末梢血単核細胞(Human peripheral blood mononuclear cells) HPBMC5939 (宝酒造 #CC2702))
『PERIC』(組織/心膜(Pericardium) (Invitrogen #D6105-01))
『PLACE』(組織/胎盤(Placenta) )
『PROST』(組織/前立腺(Prostate) (CLONTECH #64038-1))
『PUAEN』(初代培養細胞/正常肺動脈内皮細胞(Human pulmonary artery endothelial cells) (東洋紡 #T302K-05))
『RECTM』(組織/直腸(Rectum) (Invitrogen #D6110-01))
『SKMUS』(組織/骨格筋(Skeletal Muscle) (CLONTECH #64033-1))
『SKNMC』(培養細胞/SK-N-MC細胞 (ATCC #HTB-10) )
『SKNSH』(培養細胞/SK-N-SH細胞 (RCB #RCB0426) )
『SMINT』(組織/小腸(Small Intestine) (CLONTECH #64039-1))
『SPLEN』(組織/脾臓(Spleen) (CLONTECH #64034-1))
『STOMA』(組織/胃(Stomach) (CLONTECH #64090-1))
『SYNOV』(組織/滑膜組織(Synovial membrane tissue from rheumatioid arthritis))
『T1ESE』(培養細胞/間葉系幹細胞(Mesenchymal stem cell) (トリコスタチンと5アザシチジン処理))
『TBAES』(組織/乳癌(Breast, Tumor) (CLONTECH #64015-1))
『TESOP』(組織/食道癌(Esophageal, Tumor) (Invitrogen #D6860-01))
『TKIDN』(組織/腎臓癌(Kidney, Tumor) (Invitrogen #D6870-01))
『TLIVE』(組織/肝臓癌(Liver, Tumor) (Invitrogen #D6880-01))
『TLUNG』(組織/肺癌(Lung; Tumor))
『TRACH』(組織/気管(Trachea) (CLONTECH #64091-1))
『TSTOM』(組織/胃癌(Stomach, Tumor) (Invitrogen #D6920-01))
『TUTER』(組織/子宮癌(Uterus, Tumor) (CLONTECH #64008-1))
『UTERU』(組織/子宮(Uterus) (CLONTECH #64029-1))
オリゴキャップ法で作製したcDNAライブラリーからのクローンの5’末端の全長性の評価
実施例1で作製したヒトcDNAライブラリーの5’末端の塩基配列は、これを公共データベース中のヒト既知mRNAの配列と比較し、5’末端配列が一致する全クローンについて、公共データベース中の既知mRNA配列より長く5’末端が伸びている場合、または5’末端は短いが翻訳開始コドンは有している場合を「全長」と判断し、翻訳開始コドンを含んでいない場合を「非全長」と判断した。
次に、ESTiMateFLによるクローンの評価を行った。ESTiMateFLは、公共データベース中のESTの5’末端配列や3’末端配列との比較によって全長cDNAの可能性の高いクローンを選択するために、ヘリックス研究所の西川・太田らにより開発された方法である。実施例1で解析したcDNAクローンの5’末端や3’末端配列をESTデータベースに登録されている塩基配列と比較し、取得されたcDNAクローンの配列よりも、5’側または3’側へ伸長しているESTが存在する場合には、そのクローンは「全長ではない可能性が高い」と判断した。公共データベース中のEST配列より5’末端が伸長している場合、あるいは5’末端が短いクローンでも、その差が50塩基以内の場合を便宜的に全長とし、それ以上短い場合を非全長とした。
その結果、BRAMY3011501(配列番号1)、BRACE3041162(配列番号2)、THYMU3021586(配列番号3)、BRTHA3014000(配列番号4)、BRACE3034183(配列番号5)、FCBBF3020030(配列番号6)、BRHIP3007960(配列番号7)、BRTHA2026290(配列番号8)、BRTHA2026311(配列番号9)、BRAWH3031342(配列番号10)、TESTI4005322(配列番号11)の11クローンは、スプライシングバリアントを含む新規な全長cDNAを有することが明らかとなった。
相同性検索による解析
実施例2で新規なcDNAを有することが明らかとなった11クローンについて、決定された塩基配列および蛋白質をコードすると推定されるORF部分のアミノ酸配列についてSwissProt、RefSeq、nrに対するBLAST検索を行った。P値またはE値が10-4以下であり、かつアミノ酸データベースを対象にした解析においてはコンセンサス長×相同性=30以上のBLAST検索ヒットデータの中から、相同性がより高く、塩基配列及び推定アミノ酸配列に対して機能の予測が比較的容易なヒットデータの中から代表的なものを選択し、相同性検索結果データとして以下に示した。したがって示したデータはあくまで代表的なものであり、各クローンに相同性を示す分子が、これのみに限定されるというわけではない。また、一部のクローンにおいて、先に記した条件にあてはまらないBLAST検索ヒットデータについては示さなかった。
全長塩基配列及び推定アミノ酸配列に対する相同性検索結果データを以下に示す。 各データは配列名(配列番号)、ヒットデータのDefinition、P値、比較配列の長さ、相同性、ヒットデータのAccession No.の順に//で区切って記載した。相同性検索の結果、既知のどの配列にもヒットしなかったものについてはクローン名のみ記載した。
BRAMY3011501(配列番号1)// Heterogenous nuclear ribonucleoprotein U (hnRNP U) (Scaffold attachment factor A) (SAF-A).// 0// 469aa// 79%
BRACE3041162(配列番号2)// zinc finger protein 14 (KOX 6); GIOT-4 for gonadotropin inducible transcription repressor-4 [Homo sapiens]// 1.00E-67// 110aa// 60%
THYMU3021586(配列番号3)// Sterol regulatory element binding protein-1 (SREBP-1) (Sterol regulatory element-binding transcription factor 1).// 0// 774aa// 86%
BRTHA3014000(配列番号4)// rapa-1 [Homo sapiens]// 0// 1059aa// 90%
BRACE3034183(配列番号5)// Zinc finger protein 84 (Zinc finger protein HPF2).// 1.00E-141// 216aa// 55%
FCBBF3020030(配列番号6)// Transcription intermediary factor 1-alpha (TIF1-alpha).// 0// 423aa// 80%
BRHIP3007960(配列番号7)// Pro-Pol-dUTPase polyprotein.// 5.00E-117// 246aa// 84%
BRTHA2026290(配列番号8)// Ral guanine nucleotide dissociation stimulator-like 2 (RalGDS-like factor) (RAS-associated protein RAB2L).// 3.00E-17// 116aa// 24%
BRTHA2026311(配列番号9)// Protein disulfide isomerase A6 precursor (EC 5.3.4.1) (Protein disulfide isomerase P5).// 0// 379aa// 87%
BRAWH3031342(配列番号10)// Zinc finger protein 91 (Zinc finger protein HTF10) (HPF7).// 0// 301aa// 59%
TESTI4005322(配列番号11)// Zinc finger protein 85 (Zinc finger protein HPF4) (HTF1).// 0// 339aa// 69%
全長塩基配列および推定アミノ酸配列の相同性検索による機能カテゴリー分類
実施例2で新規なcDNAを有することが明らかとなった11クローンについて、全長塩基配列および推定アミノ酸配列のSwiss-Prot、nr、RefSeqの各データベースを対象に行った相同性検索の結果(相同性検索結果データ参照)から、クローン中にコードされる蛋白質の機能予測、カテゴリー分類を行った。
分泌・膜蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中に growth factor, cytokine, hormone, signal, transmembrane, membrane, extracellular matrix, receptor, G-protein coupled receptor, ionic channel, voltage-gated channel, calcium channel, cell adhesion, collagen, connective tissue 等、分泌・膜蛋白質と推定される記載があった、もしくはPsortとSOSUIによる推定ORFの解析の結果、シグナルシークエンスや膜貫通領域があったクローンである。
糖蛋白質関連蛋白質のカテゴリーに属すると推定されるクローンとは、ヒットデータ中に glycoprotein 等、糖蛋白質関連蛋白質と推定される記載があるクローンである。
シグナル伝達関連蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中に serine/threonine-protein kinase, tyrosine-protein kinase, SH3 domain, SH2 domain等、シグナル伝達関連蛋白質と推定される記載があったクローンである。
転写関連蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中に transcription regulation, zinc finger, homeobox 等、転写関連蛋白質と推定される記載があったクローンである。
疾患関連蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中に disease mutation, syndrome 等、疾患関連蛋白質と推定される記載があった、あるいは全長塩基配列に対するSwiss-Protヒットデータ、及びnr、RefSeqヒットデータが、ヒトの遺伝子と疾患のデータベースであるOnline Mendelian Inheritance in Man (OMIM)に登録されている遺伝子、蛋白質であったクローンである。
酵素・代謝関連蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中にmetabolism, oxidoreductase, E.C.No. (Enzyme commission number)等、酵素・代謝関連蛋白質と推定される記載があったクローンである。
細胞分裂・増殖関連蛋白質のカテゴリーに属すると推定されたクローンとは、cell division, cell cycle, mitosis, chromosomal protein, cell growth, apoptosis等、細胞分裂・増殖関連蛋白質と推定される記載があったクローンである。
細胞骨格関連蛋白質のカテゴリーに属すると推定されるクローンとは、ヒットデータ中にstructural protein, cytoskeleton, actin-binding, microtubles等、細胞骨格関連蛋白質と推定される記載があるクローンである。
核蛋白質・RNA合成関連蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中にnuclear protein, RNA splicing, RNA processing, RNA helicase, polyadenylation等、核蛋白質・RNA合成関連蛋白質と推定される記載があったクローンである。
蛋白質合成・輸送関連蛋白質のカテゴリーに属すると推定されるクローンとは、ヒットデータ中にtranslation regulation, protein biosynthesis, amino-acid biosynthesis, ribosomal protein, protein transport, signal recognition particle等、蛋白質合成・輸送関連蛋白質と推定される記載があるクローンである。
細胞防御関連蛋白質のカテゴリーに属すると推定されるクローンとは、ヒットデータ中にheat shock, DNA repair, DNA damage等、細胞防御関連蛋白質と推定される記載があるクローンである。
発生・分化関連蛋白質のカテゴリーに属すると推定されるクローンとは、developmental protein等、発生・分化関連蛋白質と推定される記載があるクローンである。
DNA・RNA結合蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中にDNA-binding, RNA-binding等と記載があったクローンである。
ATP・GTP結合蛋白質のカテゴリーに属すると推定されたクローンとは、ヒットデータ中にATP-binding, GTP-binding等と記載があったクローンである。
この機能カテゴリー分類では一つのクローンが上記の複数のカテゴリーに該当する場合は、そのまま複数のカテゴリーに分類した。ただし、蛋白質の機能は必ずしも分類された機能カテゴリーに限定されるわけではなく、今後その他の機能も明らかになる可能性がある。
分泌・膜蛋白質に属すると推定されたクローンは、以下の1クローンであった。
BRTHA2026311(配列番号9、20)
シグナル伝達関連蛋白質に属すると推定されたクローンは、以下の1クローンであった。
BRTHA2026290(配列番号8、19)
転写関連蛋白質に属すると推定されたクローンは、以下の7クローンであった。
BRACE3041162(配列番号2、13), THYMU3021586(配列番号3、14), BRTHA3014000(配列番号4、15), BRACE3034183(配列番号5、16), FCBBF3020030(配列番号6、17), BRAWH3031342(配列番号10、21), TESTI4005322 (配列番号11、22)
疾患関連蛋白質に属すると推定されたクローンは、以下の7クローンであった。
BRAMY3011501(配列番号1、12), BRACE3041162(配列番号2、13), THYMU3021586(配列番号3、14), FCBBF3020030(配列番号6、17), BRTHA2026290(配列番号8、19), BRAWH3031342(配列番号10、21), TESTI4005322 (配列番号11、22)
なお、Swiss-Protヒットデータ、及びnr、RefSeqヒットデータが、ヒトの遺伝子と疾患のデータベースであるOnline Mendelian Inheritance in Man (OMIM)に登録されている遺伝子、蛋白質であったクローンのOMIM Numberは以下通りである(クローン名の後ろのカッコ内は対象となったOMIM Number)。
BRAMY3011501(配列番号1、12)(602869), BRACE3041162(配列番号2、13)(194556), THYMU3021586(配列番号3、14)(184756), FCBBF3020030(配列番号6、17)(603406), BRTHA2026290(配列番号8、19)(602306), BRAWH3031342(配列番号10、21)(603971), TESTI4005322 (配列番号11、22)(603899)
BRAMY3011501のアミノ酸配列(配列番号12)に対するヒットデータは、HNRPU (HETEROGENEOUS NUCLEAR RIBONUCLEOPROTEIN U)またはSAFA (SCAFFOLD ATTACHMENT FACTOR A)としてOMIMに登録されており、配列番号12に記載のアミノ酸配列を有する蛋白質は疾患に関連すると推定される。
BRACE3041162のアミノ酸配列(配列番号13)に対するヒットデータは、ZNF14(ZINC FINGER PROTEIN 14)またはKOX6としてOMIMに登録されており、配列番号13に記載のアミノ酸配列を有する蛋白質は疾患に関連すると推定された。
THYMU3021586のアミノ酸配列(配列番号14)に対するヒットデータは、SREBF1(STEROL REGULATORY ELEMENT-BINDING TRANSCRIPTION FACTOR 1)またはSREBP1(STEROL REGULATORY ELEMENT-BINDING PROTEIN 1)としてOMIMに登録されていた。SREBF1 はEmery-Dreifuss musclar dystrophy (EDMD),dilated cardiomyopathy (CMD1A),familial partial lipodystrophy (FRLD) に関与するlamin A に相互作用することから、配列番号14に記載のアミノ酸配列を有する蛋白質はこれらの疾患に関連すると推定された。
FCBBF3020030のアミノ酸配列(配列番号17)に対するヒットデータは、TIF1(TRANSCRIPTIONAL INTERMEDIARY FACTOR 1)またはPTC6 CHIMERIC ONCOGENEとして OMIMに登録されていた。TIF1は human breast cancer cells から単離・検出されることから、配列番号17に記載のアミノ酸配列を有する蛋白質は、癌に関連すると推定された。また、acute promyelocytic leukemia (APL)やpapillary thyroid carcinomas (PTC) に関連すると推定された。
BRTHA2026290のアミノ酸配列(配列番号19)に対するヒットデータは、RAB2L(RAS-ASSOCIATED PROTEIN)としてOMIMに登録されていた。RAB2Lは,心臓と骨格筋に特異的に発現することから、配列番号19に記載のアミノ酸配列を有する蛋白質は不整脈、心不全、心肥大、肉腫等に関連すると推定された。
BRAWH3031342のアミノ酸配列(配列番号21)に対するヒットデータは、ZNF91(ZINC FINGER PROTEIN 91)としてOMIMに登録されていた。 ZNF91は、Tリンパ細胞で強く発現することから、配列番号21に記載のアミノ酸配列を有する蛋白質は癌、免疫炎症性疾患等に関連すると推定された。
TESTI4005322のアミノ酸配列(配列番号22)に対するヒットデータは、ZNF85(ZINC FINGER PROTEIN 85)としてOMIMに登録されていた。 ZNF85 は、精巣で強く発現することから、配列番号22に記載のアミノ酸配列を有する蛋白質は癌、不妊症等に関連すると推定された。
酵素・代謝関連蛋白質のカテゴリーに属すると推定されたクローンは、以下の1クローンであった。
BRTHA2026311(配列番号9、20)
細胞分裂・増殖関連蛋白質のカテゴリーに属すると推定されたクローンは、以下の1クローンであった。
THYMU3021586(配列番号3、14)
核蛋白質・RNA合成関連蛋白質のカテゴリーに属すると推定されたクローンは、以下の1クローンであった。
BRAMY3011501(配列番号1、12)
DNA・RNA結合蛋白質のカテゴリーに属すると推定されたクローンは、以下の8クローンであった。
BRAMY3011501(配列番号1、12), BRACE3041162(配列番号2、13), THYMU3021586(配列番号3、14), BRTHA3014000(配列番号4、15), BRACE3034183(配列番号5、16), FCBBF3020030(配列番号6、17), BRAWH3031342(配列番号10、21), TESTI4005322 (配列番号11、22)
ATP・GTP結合蛋白質のカテゴリーに属すると推定されたクローンは、以下の1クローンであった。
BRAMY3011501(配列番号1、12)
なお、現在のところ相同性検索の情報からは機能を推定できる情報の得られない場合でも、今後、データベースのアップデートによって機能が明らかになる可能性がある。
推定アミノ酸配列に対する機能ドメインの検索による機能カテゴリー分類
ドメイン、モチーフはタンパク質の最小限の機能構造である。一タンパク質の構造はこの最小限構造の寄せ集めで成り立ち、その結果、タンパク質全体としての機能が決定される。よってドメインやモチーフ構造の解析から全体としてのタンパク質が持つ機能を比較的正確に予測することが可能である。また、この結果を機能別にデータベース化することは、特定の機能を持つクローンが容易に選択可能ということであり、個々のクローンの機能解析の際に非常に有用である。
全長塩基配列から推定されたアミノ酸配列のPfamに対するドメイン検索の結果から、ヒットデータのドメイン、モチーフ名やアクセッション番号、Pfam (http://www.sanger.ac.uk/Software/Pfam/index.shtml)における詳細な記述データや、PROSITE (http://www.expasy.ch/cgi-bin/prosite-list.pl)にある機能カテゴリー分類を参照に、ヒットしたクローン中にコードされるタンパク質の機能予測、カテゴリー分類を行った。
分泌・膜蛋白質のカテゴリーに属すると推定されるクローンとは、受容体、イオンチャンネル、ホルモン、成長因子などと推測されるような例えば7 transmembrane receptor, Pancreatic hormone peptides, Ion transport protein, Fibroblast growth factor等のドメイン、モチーフを持つクローンである。
糖蛋白質関連蛋白質のカテゴリーに属すると推定されるクローンとは、糖タンパク質、 糖転移酵素などGlycobiologyに関わると推測されるような例えばImmunoglobulin domain, Glycosyl transferases group 1等のドメイン、モチーフを持つクローンである。
シグナル伝達関連蛋白質のカテゴリーに属すると推定されたクローンとは、タンパク質リン酸化酵素、脱リン酸化酵素、SH2ドメイン、 Small Gタンパク質などと推測されるような例えばEukaryotic protein kinase domain, Protein phosphatase 2C, Ras family等のドメイン、モチーフを持つクローンである。
転写関連蛋白質のカテゴリーに属すると推定されたクローンとは、転写因子、転写調節に関わるタンパク質などと推測されるような例えばbZIP transcription factor, Zinc finger, C2H2 type等のドメイン、モチーフを持つクローンである。
疾患関連蛋白質のカテゴリーに属すると推定されるクローンとは、特定の疾患で発現が見られるようなタンパク質や、疾患で発現が上昇したり減少したりすると推測されるような例えばWilm's tumour protein, von Hippel-Lindau disease tumor suppressor protein等のドメイン、モチーフを持つクローンである。
酵素・代謝関連蛋白質のカテゴリーに属すると推定されたクローンとは、転移酵素、合成酵素、加水分解酵素などと推測されるような例えばAldehyde dehydrogenase family, Chitin synthase, Glucose-6-phosphate dehydrogenase等のドメイン、モチーフを持つクローンである。
細胞分裂・増殖関連蛋白質のカテゴリーに属すると推定されるクローンとは、サイクリン、細胞増殖制御タンパク質などと推測されるような例えばCyclin, Cell division protein等のドメイン、モチーフを持つクローンである。
細胞骨格関連蛋白質のカテゴリーに属すると推定されるクローンとは、アクチン、キネシン、フィブロネクチンなどと推測されるような例えばActin, Fibronectin type I domain, Kinesin motor domain等のドメイン、モチーフを持つクローンである。
核蛋白質・RNA合成関連蛋白質のカテゴリーに属すると推定されたクローンとは、スプライシング因子、RNA合成酵素、へリカーゼなどと推測されるような例えばHepatitis C virus RNA dependent RNA polymerase, DEAD/DEAH box helicase等のドメイン、モチーフを持つクローンである。
蛋白質合成・輸送関連蛋白質のカテゴリーに属すると推定されるクローンとは、翻訳関連タンパク質、ユビキチン関連タンパク質、Ribosomal proteinなどと推測されるような例えばTranslation initiation factor SUI1, Ubiquitin family, Ribosomal protein L16等のドメイン、モチーフを持つクローンである。
細胞防御関連蛋白質のカテゴリーに属すると推定されるクローンとは、分子シャペロン、DNA修復タンパク質などと推測されるような例えばHsp90 protein, DNA mismatch repair protein等のドメイン、モチーフを持つクローンである。
発生・分化関連蛋白質のカテゴリーに属すると推定されるクローンとは、器官形成関連タンパク質などと推測されるような例えばFloricaula / Leafy protein等のドメイン、モチーフを持つクローンである。
DNA・RNA結合蛋白質のカテゴリーに属すると推定されたクローンとは、転写因子、DNAリガーゼをはじめとしたDNA・RNA関連酵素類、Zinc-finger関連タンパク質などと推測されるような例えばTranscription factor WhiB, B-box zinc finger, tRNA synthetases class I (C)等のドメイン、モチーフを持つクローンである。
ATP・GTP結合蛋白質のカテゴリーに属すると推定されたクローンとは、ATPase等をはじめとしたATP・GTP関連酵素類、Gタンパク質などと推測されるような例えばE1-E2 ATPase, Ras family等のドメイン、モチーフを持つクローンである。
なお、この機能カテゴリー分類では一つのクローンが上記の複数のカテゴリーに該当する場合は、そのまま複数のカテゴリーに分類した。ただし、蛋白質の機能は必ずしも分類された機能カテゴリーに限定されるわけではない。
シグナル伝達関連蛋白質に属すると推定されたクローンは、以下の2クローンであった。
BRTHA2026290 (配列番号8、19), BRAWH3031342(配列番号10、21)
転写関連蛋白質に属すると推定されたクローンは、以下の7クローンであった。
BRACE3041162(配列番号2、13), THYMU3021586(配列番号3、14), BRTHA3014000(配列番号4、15), BRACE3034183(配列番号5、16), FCBBF3020030(配列番号6、17), BRAWH3031342(配列番号10、21), TESTI4005322 (配列番号11、22)
酵素・代謝関連蛋白質のカテゴリーに属すると推定されたクローンは、以下の3クローンであった。
BRACE3034183(配列番号5、16), BRTHA2026290 (配列番号8、19), BRTHA2026311 (配列番号9、20)
核蛋白質・RNA合成関連蛋白質のカテゴリーに属すると推定されたクローンは、以下の2クローンであった。
BRACE3034183(配列番号5、16), BRTHA2026290 (配列番号8、19)
DNA・RNA結合蛋白質のカテゴリーに属すると推定されたクローンは、以下の8クローンであった。
BRACE3041162(配列番号2、13), THYMU3021586(配列番号3、14), BRTHA3014000(配列番号4、15), BRACE3034183(配列番号5、16), FCBBF3020030(配列番号6、17), BRTHA2026290 (配列番号8、19), BRAWH3031342(配列番号10、21), TESTI4005322 (配列番号11、22)
ATP・GTP結合蛋白質のカテゴリーに属すると推定されたクローンは、以下の1クローンであった。
BRTHA2026290 (配列番号8、19)
以下のクローンについては、Pfamでヒットデータがあったものの、上記のいずれのカテゴリーに属するか明らかでないクローンであった。今後同様のドメイン、モチーフを持つタンパク質のデータの蓄積と共に機能がより詳細に解明され、上記のカテゴリーに分類できる可能性がある。クローン名と機能ドメイン名をクローン名//機能ドメイン名のように示し、複数の機能ドメインがヒットした場合には//で区切って並記した。
BRAMY3011501(配列番号1、12)// SAP domain//SPRY domain
またこれら以外にPfamでヒットデータがなかった場合でも、今後タンパク質のデータの蓄積と共に新たなドメイン、モチーフが見い出された場合、再びクローンの推定アミノ酸配列を新しいデータベースに対して解析することで新たな機能を有したドメイン、モチーフが発見され、カテゴリー分類できる可能性がある。
推定アミノ酸配列に対するシグナル配列、膜貫通領域および機能ドメインの検索
全長塩基配列から推定されたアミノ酸配列に対して、アミノ末端のシグナル配列の有無と膜貫通領域の有無を予測、さらに蛋白質の機能ドメイン(モチーフ)検索を行った。アミノ末端のシグナル配列についてはPSORT [K. Nakai & M.Kanehisa, Genomics, 14: 897-911 (1992)]を、膜貫通領域についてはSOSUI [T.Hirokawa et.al. Bioinformatics, 14: 378-379 (1998)](三井情報開発株式会社販売)を用いて解析を行った。機能ドメインの検索についてはPfam(Version 5.5)(http://www.sanger.ac.uk/Software/Pfam/index.shtml)を用いた。PSORTやSOSUIにより、アミノ末端のシグナル配列や膜貫通領域が予測されたアミノ酸配列は分泌、膜蛋白質であると予測された。また、Pfamによる機能ドメイン検索において、ある機能ドメインにヒットしたアミノ酸配列はヒットデータをもとに、例えばPROSITE(http://www.expasy.ch/cgi-bin/prosite-list.pl)にある機能カテゴリー分類を参照にしてその蛋白質の機能予測することができる。また、PROSITEでの機能ドメインの検索も可能である。各ソフトウェアによる検索結果を以下に示す。
PSORTにより推定アミノ酸配列にシグナル配列を検出されたクローンは、以下の1クローンであった。
BRTHA2026290 (配列番号8、19)
SOSUIにより推定アミノ酸配列に膜貫通領域を検出されたクローンは、以下の1クローンであった。数字は推定アミノ酸配列中に検出された膜貫通領域の数を示している。検索結果は、クローン名と膜貫通領域の数を//で区切って示した。
THYMU3021586(配列番号3、14)//3
Pfamにより推定アミノ酸配列に機能ドメインを検出されたクローンは以下の11クローンであった。検索結果は、クローン名(配列番号)//機能ドメイン名のように示し、複数の機能ドメインがヒットした場合には//で区切って並記した。なお同一の機能ドメインが複数ヒットした場合も省略せずに記載した。
BRAMY3011501(配列番号1、12)//SAP domain// SPRY domain
BRACE3041162(配列番号2、13)//Zinc finger, C2H2 type// Zinc finger, C2H2 type// PHD-finger// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Putative zinc finger in N-recognin
THYMU3021586(配列番号3、14)//Helix-loop-helix DNA-binding domain
BRTHA3014000(配列番号4、15)//Birnavirus VP3 protein// Zinc finger, C2H2 type// ELM2 domain// Myb-like DNA-binding domain// Zinc finger, C2H2 type// Zinc finger, C2H2 type
BRACE3034183(配列番号5、16)//Zinc finger, C2H2 type// PHD-finger// Zinc finger, C2H2 type// Plant PEC family metallothionein// Transcription factor S-II (TFIIS)// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// FYVE zinc finger// Zinc finger, C2H2 type// RNA polymerases M/15 Kd subunits// Zinc finger, C2H2 type// Zinc finger, C2H2 type// TRAF-type zinc finger// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type
FCBBF3020030(配列番号6、17)//B-box zinc finger.// B-box zinc finger.// Putative zinc finger in N-recognin
BRHIP3007960(配列番号7、18)//Reverse transcriptas
BRTHA2026290(配列番号8、19)//Guanine nucleotide exchange factor for Ras-like GTPases; N-terminal motif// Initiator RepB protein// RasGEF domain
BRTHA2026311(配列番号9、20)//Thioredoxin// Thioredoxin//Ribbon-helix-helix protein, copG family
BRAWH3031342(配列番号10、21)//Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Putative zinc finger in N-recognin// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Transcription factor S-II (TFIIS)// Src homology domain 2// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Src homology domain 2// Zinc finger, C2H2 type
TESTI4005322(配列番号11、22)//KRAB box// Fungal cellulose binding domain// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// TRAF-type zinc finger// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type// Zinc finger, C2H2 type
各cDNAクローンの塩基配列、アミノ酸配列の詳細解析
実施例2〜6で解析したcDNAクローンの全塩基配列について、BLAST(Basic local alignment search tool; Altschul, S. F., et al., J. Mol. Biol., 215: 403-410 (1990))による相同性検索(homology search)や、HMMER(隠れMarkovモデルによる配列解析手法;Eddy, S. R., Bioinformatics, 14: 755-763 (1998))の機能群のひとつであるHMMPFAMによるタンパク質特徴検索(profile search: http://pfam.wustl.edu)に加え、PROSITE(タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベース;Nucleic Acids Res., 30: 235-8 (2002))を検索し、各cDNAクローンがコードするタンパク質の機能を推定した。また、タンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による詳細な解析を行った。その結果を以下に示す。
(1)BRAMY3011501(配列番号1、12)
BRAMY3011501(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号1に示すように、3498塩基から成り、そのうち塩基番号185から2437までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、750アミノ酸残基から成る(配列番号12)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Q00839に記載されているアミノ酸配列、Heterogenous nuclear ribonucleoprotein U (hnRNP U) (Scaffold attachment factor A) (SAF-A) (human)、がヒットした。Q00839に記載されているアミノ酸配列は824アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号1〜824番が、配列番号12に記載のアミノ酸配列のアミノ酸番号1〜750番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、825アミノ酸残基にわたり89%の一致度 (identity) を持つことが認められた。
配列番号12のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号8〜42番にputative DNA binding domainの特徴を示す配列 (PfamにSAPとしてエントリーされるプロファイル) を見出した。また、アミノ酸番号270〜388番にryanodine receptorの特徴を示す配列 (PfamにSPRYとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、アミノ酸番号429〜437番と105〜113番はATP_GTP_A regionで、ATPあるいはGTP結合タンパク質によく見られる特徴である。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は87%、細胞質は8.7%、ミトコンドリアは4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(2)BRACE3041162(配列番号2、13)
BRACE3041162(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号2に示すように、3381塩基から成り、そのうち塩基番号2041から2604までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、187アミノ酸残基から成る (配列番号13)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号BC006279に記載されているアミノ酸配列、"similar to Zinc finger protein 136" (human)、がヒットした。BC006279に記載されているアミノ酸配列は504アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号229〜436番が、配列番号13に記載のアミノ酸配列のアミノ酸番号1〜 180番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):3×10-68、かつ、208アミノ酸残基にわたり58%の一致度 (identity) を持つことが認められた。
配列番号13のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号10〜32番にC2H2 zinc fingerの特徴を示す配列 (Pfamにzf-C2H2としてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、アミノ酸番号12〜33、40〜61、68〜89、96〜117、124〜145、152〜173、94〜117番はZINC_FINGER_C2H2_1 regionで、核酸結合活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は95.7%、ミトコンドリアは4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(3)THYMU3021586(配列番号3、14)
THYMU3021586(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号3に示すように、3696塩基から成り、そのうち塩基番号466から3147までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、893アミノ酸残基から成る (配列番号14)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号BC057388に記載されているアミノ酸配列、Sterol regulatory element binding transcription factor 1 (human)、がヒットした。BC057388に記載されているアミノ酸配列は1147アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号255〜1147番が、配列番号14に記載のアミノ酸配列のアミノ酸番号1〜893番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、893アミノ酸残基にわたり99%の一致度 (identity) を持つことが認められた。
配列番号14のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号70〜120番にHelix-loop-helix DNA-binding domainの特徴を示す配列 (PfamにHLHとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、アミノ酸番号341〜344.番はRGD regionで、タンパク質−タンパク質相互作用に関わる活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は34.8%、小胞体は26.1%、ミトコンドリアは17.4%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(4)BRTHA3014000(配列番号4、15)
BRTHA3014000(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号4に示すように、3864塩基から成り、そのうち塩基番号116から3646までがオープンリーディングフレーム (終止コドンを含む) である。オープンリーディングフレームから予測されるアミノ酸配列は、1176アミノ酸残基から成る (配列番号15)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号AL096814に記載されているアミノ酸配列、zinc finger transcription regulating protein TReP-132, variant 1 (human)、がヒットした。AL096814に記載されているアミノ酸配列は1200アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号45〜1200番が、配列番号15に記載のアミノ酸配列のアミノ酸番号1〜1176番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、1176アミノ酸残基にわたり98%の一致度 (identity) を持つことが認められた。
配列番号15のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号468〜490、989〜1013、1062〜1084番にC2H2 type Zinc fingerの特徴を示す配列 (Pfamにzf-C2H2としてエントリーされるプロファイル) を見出した。また、アミノ酸番号863〜908番にMyb-like DNA-binding domainの特徴を示す配列 (PfamにMyb_DNA-bindingとしてエントリーされるプロファイル) を見出した。更に、アミノ酸番号755〜819番にmyb-like DNA binding domainのN末端側によく存在するELM2 domainの特徴を示す配列 (PfamにELM2としてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、上記PfamのC2H2 type Zinc fingerに重なるアミノ酸番号領域はZINC_FINGER_C2H2_1 regionで、核酸結合活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は95.7%、細胞質は4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(5)BRACE3034183(配列番号5、16)
BRACE3034183(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号5に示すように、3466塩基から成り、そのうち塩基番号190から1686までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、498アミノ酸残基から成る (配列番号16)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号P17020に記載されているアミノ酸配列、zinc finger protein 16 (zinc finger protein kox9) (human)、がヒットした。P17020に記載されているアミノ酸配列は670アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号283〜667番が、配列番号16に記載のアミノ酸配列のアミノ酸番号108〜492番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):5×10-141、かつ、385アミノ酸残基にわたり58%の一致度 (identity) を持つことが認められた。
配列番号16のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号106〜128番等14ヶ所にC2H2 type Zinc fingerの特徴を示す配列 (Pfamにzf-C2H2としてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、上記PfamのC2H2 type Zinc fingerに重なるアミノ酸番号領域はZINC_FINGER_C2H2_1 regionで、核酸結合活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は95.7%、ミトコンドリアは4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(6)FCBBF3020030(配列番号6、17)
FCBBF3020030(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号6に示すように、2854塩基から成り、そのうち塩基番号1から1650までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、549アミノ酸残基から成る (配列番号17)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号AF119042に記載されているアミノ酸配列、transcriptional intermediary factor 1 α (human)、がヒットした。AF119042に記載されているアミノ酸配列は1016アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号67〜552番が、配列番号17に記載のアミノ酸配列のアミノ酸番号24〜510番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、490アミノ酸残基にわたり89%の一致度 (identity) を持つことが認められた。
配列番号17のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号118〜163、178〜217番にB-box zinc fingerの特徴を示す配列 (Pfamにzf-B_boxとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) を検索した結果、本タンパク質に目立った特徴は見出せなかった。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は69.6%、ミトコンドリアは17.4%、細胞質は13.0%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(7)BRHIP3007960(配列番号7、18)
BRHIP3007960(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号7に示すように、5401塩基から成り、そのうち塩基番号434から1180までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、248アミノ酸残基から成る (配列番号18)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Y12713に記載されているアミノ酸配列、Pro-Pol-dUTPase polyprotein (mouse)、がヒットした。Y12713に記載されているアミノ酸配列は1182アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号241〜486番が、配列番号18に記載のアミノ酸配列のアミノ酸番号3〜248番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):5×10-117、かつ、246アミノ酸残基にわたり84%の一致度 (identity) を持つことが認められた。
配列番号18のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号2〜125番にReverse transcriptaseの特徴を示す配列 (Pfamにrvtとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) を検索した結果、本タンパク質に目立った特徴は見出せなかった。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、細胞質は47.8%、ミトコンドリアは34.8%、核は13.0%であることがわかった。よって、本タンパク質は核に存在する確率がある程度あることがわかった。
(8)BRTHA2026290(配列番号8、19)
BRTHA2026290(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号8に示すように、4104塩基から成り、そのうち塩基番号2508から3953までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、481アミノ酸残基から成る (配列番号19)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号AK056257に記載されているアミノ酸配列、"FLJ31695 fis, clone NT2RI2005811, weakly similar to CELL DIVISION CONTROL PROTEIN 25" (human)、がヒットした。AK056257に記載されているアミノ酸配列は473アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号29〜472番が、配列番号19に記載のアミノ酸配列のアミノ酸番号36〜480番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):5×10-160、かつ、446アミノ酸残基にわたり61%の一致度 (identity) を持つことが認められた。
配列番号19のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号211〜412番にRasGEF domainの特徴を示す配列 (PfamにRasGEFとしてエントリーされるプロファイル) を見出した。また、アミノ酸番号39〜96番にRasGEF domain N -terminal motifの特徴を示す配列 (PfamにRasGEF_Nとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、アミノ酸番号254〜257番はRGD regionで、タンパク質−タンパク質相互作用に関わる活性を有すると考えられる。また、アミノ酸番号479〜482番はMicrobodies C-terminal targeting signalで細胞内局在に関わる活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は26.1%、細胞質は21.7%、ミトコンドリアは17.4%、小胞体は17.4%、細胞膜あるいは細胞外が8.7%であることがわかった。よって、本タンパク質は核に存在する確率が比較的高いことがわかった。
(9)BRTHA2026311(配列番号9、20)
BRTHA2026311(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号9に示すように、2682塩基から成り、そのうち塩基番号339から1817までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、492アミノ酸残基から成る (配列番号20)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Q15084に記載されているアミノ酸配列、protein disulfide isomerase a6 precursor (human)、がヒットした。Q15084に記載されているアミノ酸配列は440アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号7〜440番が、配列番号20に記載のアミノ酸配列のアミノ酸番号59〜492番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、434アミノ酸残基にわたり99%の一致度 (identity) を持つことが認められた。
配列番号20のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号78〜184番にThioredoxinの特徴を示す配列 (PfamにThioredoxinとしてエントリーされるプロファイル) を見出した。また、アミノ酸番号307〜324番にDNA結合に関わるRibbon-helix-helix protein, copG familyの特徴を示す配列 (PfamにHTH_4としてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、アミノ酸番号99〜118、234〜253番はTHIOREDOXIN regionで、THIOREDOXIN活性を有すると考えられる。また、アミノ酸番号489〜493番はEndoplasmic reticulum targeting sequenceで、小胞体への局在化に関わると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、小胞体は44.4%、核は22.2%、ミトコンドリアは22.2%、ペルオキシゾーム11.1%であることがわかった。よって、本タンパク質は小胞体に存在する確率が最も高いことがわかった。
(10)BRAWH3031342(配列番号10、21)
BRAWH3031342(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号10に示すように、3978塩基から成り、そのうち塩基番号170から1699までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、509アミノ酸残基から成る (配列番号21)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Q96SE7に記載されているアミノ酸配列、zinc finger protein 347、がヒットした。Q96SE7に記載されているアミノ酸配列は839アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号285〜792番が、配列番号21に記載のアミノ酸配列のアミノ酸番号2〜509番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、508アミノ酸残基にわたり60%の一致度 (identity) を持つことが認められた。
配列番号21のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号6〜28番等18ヶ所にC2H2 type Zinc fingerC2H2 typeの特徴を示す配列 (Pfamにzf-C2H2としてエントリーされるプロファイル) を見出した。また、アミノ酸番号293〜329番等18ヶ所にMYM-type Zinc fingerの特徴を示す配列 (Pfamにzf-MYMとしてエントリーされるプロファイル) を見出した。更に、アミノ酸番号131〜169番等18ヶ所にBED zinc fingerの特徴を示す配列(Pfamにzf-BEDとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、上記PfamのC2H2 type Zinc fingerに重なるアミノ酸番号領域でZINC_FINGER_C2H2_1 regionを見出すことができ、核酸結合活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は95.7%、ミトコンドリアは4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
(11)TESTI4005322(配列番号11、22)
TESTI4005322(以下、これを「本DNA」と称し、該DNAによりコードされるタンパク質を「本タンパク質」と称する)は、配列番号11に示すように、3946塩基から成り、そのうち塩基番号113から1600までがオープンリーディングフレーム(終止コドンを含む)である。オープンリーディングフレームから予測されるアミノ酸配列は、495アミノ酸残基から成る (配列番号22)。
本タンパク質についてBLASTを用いて相同性検索を行ったところ、NRDBタンパク質データベース (SWISS−PROT、PIR、TREMBL、GENPEPT、PDBから作成された重複のないアミノ酸配列のデータベース) 中の、データベース登録記号Q96JC4に記載されているアミノ酸配列、zinc finger protein 479 (human)、がヒットした。Q96JC4に記載されているアミノ酸配列は524アミノ酸から成り、そのアミノ酸配列中のアミノ酸番号1〜524番が、配列番号21に記載のアミノ酸配列のアミノ酸番号1〜495番と、E-value (そのヒットのスコア以上の類似配列がデータベース中に偶然存在する期待値):0.0、かつ、524アミノ酸残基にわたり77%の一致度 (identity) を持つことが認められた。
配列番号21のアミノ酸配列について、HMMPFAMによるタンパク質特徴検索を行ったところ、アミノ酸番号157〜179番等11ヶ所にC2H2 type Zinc fingerC2H2 typeの特徴を示す配列 (Pfamにzf-C2H2としてエントリーされるプロファイル) を見出した。また、アミノ酸番号16〜56番にKRAB boxの特徴を示す配列 (PfamにKRABとしてエントリーされるプロファイル) を見出した。
タンパク質の機能の類似性によりドメイン構造やファミリーを分類したアミノ酸パターンのデータベースであり、機能的に重要な部位を検索可能なPROSITE (Nucleic Acids Res., 30: 235-8 (2002)) によれば、上記PfamのC2H2 type Zinc fingerに重なるアミノ酸番号領域でZINC_FINGER_C2H2_1 regionを見出すことができ、核酸結合活性を有すると考えられる。
更にタンパク質の細胞内局在の予測プログラムであるPSORTII (Trends Biochem. Sci., 24: 34-6 (1999)) による解析を行ったところ、本タンパク質の細胞内での局在の確率は、それぞれ、核は95.7%、ミトコンドリアは4.3%であることがわかった。よって、本タンパク質は核に存在する確率が最も高いことがわかった。
転写調節活性の測定(標的転写調節領域に対する結合活性の解析)
(1)無細胞タンパク質合成系を用いた本発明のタンパク質の調製
実施例3で転写調節活性を有すると推定されたcDNAクローンについて、これがコードするタンパク質を無細胞タンパク質合成系を用いて合成し、該タンパク質が転写調節活性を有するか否かを以下の生化学的実験により解析した。
実施例3で転写調節活性を有すると推定されたcDNAクローンのORF断片を、5’側のプライマーとして各クローンに特異的な下記プライマー、3’側のプライマーとして下記の共通プライマーを使用したPCR法によって取得した。
5’側のプライマー
(a)BRAMY3011501:ATGAGTTCCTCGCCTGTTAATG(配列番号27)
(b)BRACE3041162:ATGGTAATGCACAGTGAAGATGAAC(配列番号28)
(c)THYMU3021586:ATGAAGACAGACGGAGCCAC(配列番号29)
(d)BRTHA3014000:ATGGATGCCCCTCAGGC(配列番号30)
(e)BRACE3034183:ATGGAGTCCCCAAGAGGGT(配列番号31)
(f)FCBBF3020030:ATGGAGGGCCCGCG(配列番号32)
(g)BRHIP3007960:ATGTGTACCTGGTATGCAGCC(配列番号33)
(h)BRTHA2026290:ATGCCCCAGACGTCCG(配列番号34)
(i)BRTHA2026311:ATGAGAAGAGACCTCCGGG(配列番号35)
(j)BRAWH3031342:ATGAGAGAAAAATCTTTCCAATGTATTGAG(配列番号36)
(k)TESTI4005322:ATGGCTAAAAGACCGGGACC(配列番号37)
3’側の共通プライマー
GGCCCTTATGGCCGGAGAAAGGCGGACAGGTAT(配列番号38)
これを、SP6プロモーターを含む翻訳制御領域−グルタチオン−S−トランスフェラーゼ遺伝子−PreScission Protease(アマシャムファルマシアバイオテク社製)切断サイト−DNAクローニングサイト(SmaI, SfiI)−ポリ(A)シグナル配列を有するベクター(pEU−SS4)のクローニングサイトに挿入した。
上記で調製されたプラスミドDNAを鋳型として、SP6 RNAポリメラーゼ(Promega社製)を用いて転写を行い、得られたmRNAをフェノール/クロロホルム抽出、エタノール沈殿の後、Nick Column(Amersham Pharmacia Biotech社製)によって精製した。
上記で精製されたmRNAを用いたタンパク合成は、特開2002−204689号公報、およびProc.Natl.Acad.Sci.USA,99:14652-14657(2002)に準じた重層法による無細胞タンパク質合成系を用いて行った。重層法無細胞タンパク質合成系にて使用する翻訳溶液(25μl)には、Proc.Natl.Acad.Sci.USA,97:559-564(2000)に従って調製された6μlの小麦胚芽抽出液および上述したmRNA(0.02nmol)を添加して用い、その組成は24mM Hepes/KOH(pH7.8)、1.2mM ATP、0.25mM GTP、16mM creatine phosphate、10μg creatine kinase、ribonuclease inhibitor(20units)、2mM DTT、0.4mM spermidine、0.3mM L型アミノ酸(20種)、2.7mM magnesium acetate、100mM potassium acetate、5μg小麦胚芽由来tRNA、0.05% Nonidet P−40および0.005% NaN3から成る。また翻訳用緩衝液は31.3mM HEPES/KOH(pH7.8)、2.67mM Mg(OAc)2、93mM KOAc、1.2mM ATP、0.257mM GTP、16mM creatine phosphate、2.1mM DTT、0.41mM spermidine、0.3mML型アミノ酸(20種)、1μM E−64、0.005% NaN3、0.05% NP−40から成る。重層法による無細胞タンパク質合成は、まず96穴プレートに翻訳用緩衝液を125μlずつ加えて、この翻訳用緩衝液が入ったそれぞれの穴に底からゆっくりと翻訳溶液を重層し、このプレートを26℃インキュベーターで保温して16時間反応させることにより行った。
(2)コンセンサス標的配列または標的配列を有するDNAを固定化したセンサーチップを用いたSPR測定方法
BIAapplications handbook, chapter4.4の記載に従い、センサーチップ表面にビオチン化した以下の54種類の二重鎖DNAを別々に固定化した。センサーチップはSAタイプ(ビアコア社製)を用い、SPR測定および解析は、BIACORE3000(ビアコア社製)を用いた。
既知の転写調節因子と設計したコンセンサス標的配列の関係およびこれらの転写調節因子の機能([1]〜[53])ならびに既知の転写調節因子と標的配列の関係([54])は、次の通りである。
[1]v−jun、c−jun、junB、junD、dJRA、c−fos、fosB1、fosB2、Fra−1、LRF−1、v−maf、mafG、NF−E2 p45、aNF−E2、fNF−E2、Nrf short form、GCN4、yAP−1、CREB−2、ATF−3、CRE−BP1、CRE−BP3、ATF−a、CREB−341、CREB−327、CREM、dCREB2、dCREB2−b、dCREB2−c、dCREB2−d、dCREB2−q、dCREB2−r、dCREB2−sのコンセンサス標的配列:TGATGACGT(配列番号39)
[2]C/EBPα、C/EBPβ、p34C/EBPβ、CHOP−10のコンセンサス標的配列:AAGTGGCGAAAGAGACA(配列番号40)
上記の転写調節因子は、例えば、インシュリン抵抗性糖尿病、断続的ケトン尿症、多剤耐性の誘導に関与していることが知られている。
[3]VBP、Hlf、CPRF−2、EmBP−1b、EmBP−1b、GBF1、GBF2、GBF3、CPRF−1、TAF−1、HBP−1a、GBF9、GBF1、GBF12、CPRF−3、TGA1a、TGA1b、O2、STE4のコンセンサス標的配列:AGAAGCACGTGG(配列番号41)
[4]OPI1、E2A、E47、ITF−2/SEF2−1B、SEF−1A、MyoD、p42Tal−1のコンセンサス標的配列:AACAGATGGT(配列番号42)
上記の転写調節因子は、例えば、さまざまな細胞種の細胞分化・増殖に関与しており、特に骨格筋などの筋分化に関与していることが知られている。
[5]HEN−1のコンセンサス標的配列:GGGGCGCAGCTGCGGCCC(配列番号43)
[6]AhR、Arntのコンセンサス標的配列:GGGGATTGCGTG(配列番号44)
上記の転写調節因子は、成体ではほとんどの細胞や組織において普遍的に発現が認められ、例えば、ダイオキシンによる薬物代謝酵素の誘導に関与していることが知られている。
[7]USFのコンセンサス標的配列:GTCACGTGGT(配列番号45)
[8]NF−1A1、NF−1A1.1、NF−1A6、NF−1B1、NF−1B1、NF−1B2、NF−1C2/CTF−2、CTF−4、CTF−6のコンセンサス標的配列:CTGTGGGGTTTGGCACGGGGCCA(配列番号46)
上記の転写調節因子は、ハウスキーピング遺伝子の転写に関与するだけではなく、例えば、TGF−βによる転写の活性化、インスリンによるグルコーストランスポーター遺伝子の発現抑制など、多くの細胞特異的な遺伝子の転写の促進や抑制に関与していることが示されている。また、癌遺伝子の機能と相互作用している可能性も示唆されている。
[9]RF−X1のコンセンサス標的配列:GGTAACATAGCAAC(配列番号47)
[10]AP2αA/AP−2α1、AP2α2、AP2α3、AP2α4、AP2αB、AP2β、AP2γのコンセンサス標的配列:CGCCCCCCGGCG(配列番号48)
[11]GRのコンセンサス標的配列:GGTACAAAATGTTCT(配列番号49)
上記の転写調節因子は、例えば、Glucocorticoidの放出の促進、ストレス応答、 胎児におけるGlucocorticoid 要求性、肺形成不全、血管新生に関連する癌、妊娠初期の子宮の不適応症、成長ホルモン欠損症、胎児の子宮内成長遅滞、子宮低酸素症、骨形成関連疾患、vitamin Dの誘導等に関与していることが知られている。
[12]ARのコンセンサス標的配列:AACATTATGTTCT(配列番号50)
[13]ERのコンセンサス標的配列:AAGGGAAAATGACCCCC(配列番号51)
[14]RXR−αのコンセンサス標的配列:GGTCATAGGGGT(配列番号52)
上記の転写調節因子は、若年発症糖尿病、肥満、肝臓における薬物代謝、癌、低HDL・低アポ蛋白、アテローム硬化症、下痢、消化不良、栄養失調、多発性硬化症、RA、SLE、インシュリン依存性糖尿病、クローン病、喘息、高HDL、低βリポ蛋白症、高αリポ蛋白症、アミロイド症、動脈硬化等循環器疾患の誘導等に関与していることが知られている。
[15]PPARαのコンセンサス標的配列:CTAGGGCAAAGGTCA(配列番号53)
前述のように、上記の転写調節因子は、主として肝臓、腎臓、褐色脂肪細胞などの脂肪消費臓、その他心筋や消化管に発現が認められ、脂肪酸酸化、ケトン体生成、アポリポタンパクの生成などに関与し、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られている。
[16]PPARγのコンセンサス標的配列:GGTCAAAGGTCA(配列番号54)
前述のように、上記の転写調節因子は、脂肪細胞、脂肪組織、免疫系臓器、副腎、小腸で発現し、脂肪細胞の分化誘導や脂肪合成に重要な役割を担っていると考えられており、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られている。
[17]COUP−TF1、HNF−4α1、HNF−4α2のコンセンサス標的配列:TGAACTTTGA(配列番号55)
[18]CF1のコンセンサス標的配列:GGGGTCACC(配列番号56)
[19]GATA−1、GATA−2、GATA−3、GATA−4のコンセンサス標的配列:CCAGATAAGG(配列番号57)
上記の転写調節因子は、血球系細胞、神経系、心臓および腸管などの内臓に発現しており、血球系細胞の分化、形成、維持、増殖およびアポトーシス、白血病、精子形成、神経系細胞の分化および形成、臓器形成、等に関与していることが示されている。
[20]AREA/NIT−2のコンセンサス標的配列:TATCTC(配列番号58)
[21]Sp1のコンセンサス標的配列:GGGGGGGGGG(配列番号59)
上記の転写調節因子は、ハウスキーピング遺伝子の転写だけでなく、癌遺伝子やウイルス遺伝子の転写にも関与していることが示されている
[22]YY1のコンセンサス標的配列:CGGCCATCTTGGCT(配列番号60)
[23]Egr−1、Egr−2、Egr−3のコンセンサス標的配列:TGCGTGGGCG(配列番号61)
[24]Snailのコンセンサス標的配列:CACCTGTTTTCA(配列番号62)
[25]CF2−IIのコンセンサス標的配列:GTATATATA(配列番号63)
[26]Evi−1のコンセンサス標的配列:AGATAAGATAA(配列番号64)
[27]Ikaros、MZF−1のコンセンサス標的配列:TTGGGAGG(配列番号65)
[28]Tramtrack69Kのコンセンサス標的配列:GGACCTGC(配列番号66)
[29]HOX9のコンセンサス標的配列:TGACAGTTTAACGA(配列番号67)
[30]CDPのコンセンサス標的配列:CCAATAATCGAT(配列番号68)
[31]HNF−1Aのコンセンサス標的配列:GGTTAATGATTAACCAC(配列番号69)
[32]Nkx−2.2、Nkx−2.5、TTF−1のコンセンサス標的配列:TTAAGTGGTT(配列番号70)
[33]Oct−1A、Oct−1B、Oct−1Cのコンセンサス標的配列:ATGCAAAT(配列番号71)
[34]Oct−2、Oct−2.1/Oct−2Bのコンセンサス標的配列:TATTTGCAT(配列番号72)
[35]Pax−3、Pax−6のコンセンサス標的配列:CGTCACGCTTGA(配列番号73)
上記の転写調節因子は、眼形成を誘導し、無虹彩症などの眼疾患に関与していることが知られている。
[36]Pax−1のコンセンサス標的配列:CCGTTCCGCTCTAGATAT(配列番号74)
[37]HSF1(short)、HSF2、dHSF、fungal HSFのコンセンサス標的配列:AGAAAAGAAAAGAAA(配列番号75)
上記の転写調節因子は、ほとんどの細胞や組織において普遍的に発現が認められ、例えば、熱ショック応答に関与していることが知られている。
[38]c−Myb、A−Myb、v−Myb、P(long)、P(short)、C1(long)、C1(short)のコンセンサス標的配列:AACGGGCCC(配列番号76)
[39]c−Ets−1_p54、Ets−1_δiV/VII、Ets−2、Elk−1、SAP−1、SAP−1b、Erg−1、p55erg、Fli−1b、E4TF1−60/GABP−α、E74Aのコンセンサス標的配列:GACAGGAAGTG(配列番号77)
上記の転写調節因子は、癌、サーカディアンリズム関連疾患の誘導等に関与していることが知られている。
[40]IRF−1、IRF−2のコンセンサス標的配列:GAAAAGCGAAACC(配列番号78)
[41]p50のコンセンサス標的配列:GGGGACTTTCC(配列番号79)
[42]NF−ATc、NF−Atpのコンセンサス標的配列:AGGAAAA(配列番号80)
[43]p91(STAT1)、p84のコンセンサス標的配列:GAATTCCGGGAAATGG(配列番号81)
上記の転写調節因子は、各種インターフェロンにより刺激、活性化され、ウイルスや細菌感染の防御に関与していることが知られている。
[44]STAT2、STAT3、STAT4、STAT5A、STAT5B、STAT6のコンセンサス標的配列:TTTCCCGGGAAATG(配列番号82)
上記の転写調節因子は、各種インターフェロンや各種インターロイキンなどのサイトカインにより刺激、活性化され、癌、自己免疫疾患、炎症に関与していることが知られている。
[45]p53のコンセンサス標的配列:GGACATGCCCGGGCATGTC(配列番号83)
前述のように、上記の転写調節因子は、癌抑制遺伝子であることが知られており、アポトーシスを起こすシグナル伝達に関与していることと、細胞がDNA修復を行う間、細胞周期を停止させる機能を有することから、癌等の治療薬のターゲット分子として注目されている。
[46]MEF−2Aのコンセンサス標的配列:CTCTAAAAATA(配列番号84)
[47]SRFのコンセンサス標的配列:CCATATATGGACAT(配列番号85)
[48]E2のコンセンサス標的配列:AACCAAAAACGGTAA(配列番号86)
[49]TBPのコンセンサス標的配列:TATAAAA(配列番号87)
[50]SRY、Sox−5、Sox−9のコンセンサス標的配列:AAAAAACAATAGGG(配列番号88)
上記の転写調節因子は、神経系の発生・分化、軟骨形成、性分化などの発生・分化に関与していることが知られている。
[51]mat−Mcのコンセンサス標的配列:TCATTGTT(配列番号89)
[52]CP1A、CP1B、CBF−Cのコンセンサス標的配列:CTGATTGGCTACC(配列番号90)
[53]AML1aのコンセンサス標的配列:TGTGGT(配列番号91)
[54]PPARγとRXRαの複合体の標的配列:TTCTGTTGTGCTTCTCCAGGGGAGAGGTCAGTAGG(配列番号92)
前述のように、上記の転写調節因子のPPARγは、生活習慣病発症、例えば糖尿病や肥満等と関連する内分泌・糖・脂質代謝、さらには血管機能や炎症などの循環器系や発がん機構に関与する種々の標的遺伝子の発現を調節している疾患関連転写調節因子として知られている。またRXRαは、若年発症糖尿病、肥満、肝臓における薬物代謝、癌、低HDL・低アポ蛋白、アテローム硬化症、下痢、消化不良、栄養失調、多発性硬化症、RA、SLE、インシュリン依存性糖尿病、クローン病、喘息、高HDL、低βリポ蛋白症、高αリポ蛋白症、アミロイド症、動脈硬化等循環器疾患の誘導等に関与していることが知られている。
まず、上記54種類のコンセンサス標的配列(配列番号39〜配列番号91)または標的配列(配列番号92)を有するDNAに関し、それぞれの5’側にビオチンが付加したDNAとその相補な塩基配列を有するDNAを定法により個別にアニーリングさせ、合計54種類の二本鎖化したDNAを調製した。一方、解析に用いるセンサーチップは、1枚に付きフローセルが4分割されている。フローセル1は何も固定化せずコントロール区として用い、フローセル2、3および4はそれぞれ上記で調製した二本鎖DNAを3種類づつ固定化した。センサーチップのDNAの固定化密度を一定にするため、DNA固定化によるSPR応答値の上昇(ΔRU−DNA)をDNA分子量(MW)で割った値(D)が各フローセルで一定になるようにΔRU−DNAを調節した。同様の要領で、残りのDNAについても固定化を行った。
以上のようにセンサーチップの作製ができた後、クローンのcDNAがコードする本発明のタンパク質との結合活性解析を行った。SPR法によるDNAとタンパク質間の結合活性解析は既に多数報告がある。本実施例では、Molecular Microbiology, 36(3), 557-569(2000)の測定条件を参考にして行った。まず、フローセル1−2−3−4が直列につながった流路に設定しておく。そこにランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させた後、各フローセルのベースライン値(SPR−baseline)を測定する。次に、タンパク質溶液を同流量で流し、タンパク質分子とDNA鎖との間で特異的結合を形成させる。一定時間注入後、各フローセルのSPR応答値(SPR−bound)を測定した。
(3)SPR法により得られた測定結果の解析方法
SPR応答値からベースライン値を差し引き([SPR−bound]−[SPR−baseline])することにより、真の結合量(B)を求め、さらに、標準化した値(nB)を求めた。
測定結果より、本発明のcDNAによりコードされるタンパク質(配列番号12〜22)は、前記[1]〜[53]に記載の計53種類のコンセンサス標的配列(配列番号39〜配列番号91)または[54]に記載の標的配列(配列番号92)を有するDNAの少なくとも一つに対して結合活性を有していることがわかった(表1)。表1で、AはnBが100以上、BはnBが50以上100未満、CはnBが5以上50未満、DはnBが0から5未満、であることを示す。
Figure 2004261179
表1より、BRACE3041162(配列番号2)によりコードされるタンパク質(配列番号13)は、AhR等のコンセンサス標的配列(配列番号44)、AREA/NIT−2のコンセンサス標的配列(配列番号58)に親和性を示した。このことから該タンパク質はDNA結合性を有し、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
THYMU3021586(配列番号3)によりコードされるタンパク質(配列番号14)は、Pax−3等のコンセンサス標的配列(配列番号73)、Pax−1のコンセンサス標的配列(配列番号74)、TBPのコンセンサス標的配列(配列番号87)、mat−Mcのコンセンサス標的配列(配列番号89)に親和性を示した。このことから該タンパク質はDNA結合性を有し、無虹彩症などの眼疾患と関連する転写調節因子である可能性がある。
BRTHA3014000(配列番号4)によりコードされるタンパク質(配列番号15)は、HEN−1のコンセンサス標的配列(配列番号43)、AhR等のコンセンサス標的配列(配列番号44)に親和性を示した。このことから該タンパク質はDNA結合性を有し、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
BRACE3034183(配列番号5)によりコードされるタンパク質(配列番号16)は、HEN−1のコンセンサス標的配列(配列番号43)、AhR等のコンセンサス標的配列(配列番号44)、TBPのコンセンサス標的配列(配列番号87)、SRY等のコンセンサス標的配列(配列番号88)、mat−Mcのコンセンサス標的配列(配列番号89)に親和性を示した。このことから該タンパク質はDNA結合性を有し、神経系の発生・分化、軟骨形成、性分化などの発生・分化、薬物代謝などの異常に起因する疾患と関連する転写調節因子である可能性がある。
FCBBF3020030(配列番号6)によりコードされるタンパク質(配列番号17)は、CP1A等のコンセンサス標的配列(配列番号90)、PPARγとRXRαの複合体の標的配列(配列番号92)に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連する転写調節因子である可能性がある。また、該タンパク質は、C/EBPα等のコンセンサス標的配列(配列番号40)、USFのコンセンサス標的配列(配列番号45)、NF−1A1等のコンセンサス標的配列(配列番号46)、RF−X1のコンセンサス標的配列(配列番号47)、AML1aのコンセンサス標的配列(配列番号91)に親和性を示した。
BRTHA2026290(配列番号8)によりコードされるタンパク質(配列番号19)は、OPI1等のコンセンサス標的配列(配列番号42)、NF−1A1等のコンセンサス標的配列(配列番号46)、RF−X1のコンセンサス標的配列(配列番号47)、GATA−1等のコンセンサス標的配列(配列番号57)、PPARγとRXRαの複合体の標的配列(配列番号92)に親和性を示した。このことから該タンパク質はDNA結合性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、血球系細胞、神経系細胞、筋細胞、精子形成、臓器形成、アポトーシスなどの異常に起因する疾患、炎症、白血病、癌等に関連する転写調節因子である可能性がある。
BRAWH3031342(配列番号10)によりコードされるタンパク質(配列番号21)は、OPI1等のコンセンサス標的配列(配列番号42)、RF−X1のコンセンサス標的配列(配列番号47)に高い親和性を示した。このことから該タンパク質はDNA結合性を有し、細胞、特に筋細胞の分化、増殖の異常に起因する疾患に関連する転写調節因子である可能性がある。
また、該タンパク質は、C/EBPα等のコンセンサス標的配列(配列番号40)、VBP等のコンセンサス標的配列(配列番号41)、HEN−1のコンセンサス標的配列(配列番号43)、USFのコンセンサス標的配列(配列番号45)、NF−1A1等のコンセンサス標的配列(配列番号46)、TBPのコンセンサス標的配列(配列番号87)、SRY等のコンセンサス標的配列(配列番号88)、PPARγとRXRαの複合体の標的配列(配列番号92)に親和性を示した。
TESTI4005322(配列番号11)によりコードされるタンパク質(配列番号22)は、OPI1等コンセンサス標的配列(配列番号42)、HEN−1のコンセンサス標的配列(配列番号43)、RF−X1のコンセンサス標的配列(配列番号47)、Sp1のコンセンサス標的配列(配列番号59)に親和性を示した。このことから該タンパク質はDNA結合性を有し、細胞、特に筋細胞の分化、増殖の異常に起因する疾患、癌やウイルス性疾患等に関連する転写調節因子である可能性がある。
(3)転写調節因子が結合する既知の疾患関連蛋白質遺伝子のプロモーター領域DNA配列を有するDNAを固定化したセンサーチップを用いたSPR解析
転写調節因子とそれらが結合する既知の疾患関連蛋白質遺伝子のプロモーター領域DNA配列の関係([55]〜[87])は、次の通りである。
[55]C/EBPα, C/EBPβ, p34C/EBPβ, CHOP-10が結合するinsulin receptor遺伝子のプロモーター領域DNA配列:TCTCCTGCAGTAAGGTAGGT(配列番号105)
insulin receptorは、インシュリン抵抗性糖尿病、断続的ケトン尿症等に関与することが知られている。
[56]C/EBPα, C/EBPβ, p34C/EBPβ, CHOP-10が結合するinsulin receptor遺伝子のプロモーター領域DNA配列:AGGAACCTTGCCCCAGTGC(配列番号106)
insulin receptorは、インシュリン抵抗性糖尿病、断続的ケトン尿症等疾患等に関与することが知られている。
[57]C/EBPα, C/EBPβ, p34C/EBPβ, CHOP-10が結合するmultidrug resistance gene 1遺伝子のプロモーター領域DNA配列:TTCAACCTGTTTCGCAGTTTCTCGAGGAATCA(配列番号107)
multidrug resistance gene 1がコードする蛋白質は、多剤耐性関連等等疾患等に関与することが知られている。
[58]GRが結合するcorticotropin releasing hormone遺伝子のプロモーター領域DNA配列:ATTTTTGTCAATGGACAAGTCATAAGAA(配列番号108)
corticotropin releasing hormoneは、グルココルチコイド要求性による胎児発育不全等に関与することが知られている。
[59]GRが結合するinterleukin-6遺伝子のプロモーター領域DNA配列:GAGGCTCATTCTGCCCTC(配列番号109)
interleukin-6は、高アンドロゲン症, 癌, 炎症、自己免疫疾患等に関与することが知られている。
[60]GRが結合するglycoprotein hormone α-subunit遺伝子のプロモーター領域DNA配列:AGATCAAATTGACGT(配列番号110)
glycoprotein hormone α-subunitは癌, 妊娠初期の子宮の不適応症等に関与することが知られている。
[61]GRが結合するglycoprotein hormone α-subunit遺伝子のプロモーター領域DNA配列:ATTACACCAAGTACC(配列番号111)
glycoprotein hormone α-subunitは癌, 妊娠初期の子宮の不適応症等に関与することが知られている。
[62]GRが結合するglycoprotein hormone α-subunit遺伝子のプロモーター領域DNA配列:GGAATTTCCTGTTGATCC(配列番号112)
glycoprotein hormone α-subunitは癌, 妊娠初期の子宮の不適応症等に関与することが知られている。
[63]GRが結合するgrowth hormone gene-1遺伝子のプロモーター領域DNA配列:GGCACAATGTGTCCT(配列番号113)
growth hormone gene-1がコードする蛋白質は成長ホルモン欠損関連の疾患等に関与することが知られている。
[64]が結合するinsulin-like growth factor binding protein-1遺伝子のプロモーター領域DNA配列:GGGACAAACAGTATG(配列番号114)
insulin-like growth factor binding protein-1は胎児の子宮内成長遅滞、子宮低酸素症等に関与することが知られている。
[65]GRが結合するinsulin-like growth factor binding protein-1遺伝子のプロモーター領域DNA配列:TGAACACTCAGCTCC(配列番号115)
insulin-like growth factor binding protein-1は胎児の子宮内成長遅滞、子宮低酸素症等に関与することが知られている。
[66]GRが結合するinsulin-like growth factor binding protein-1遺伝子のプロモーター領域DNA配列:GGCGCGGCCTGTGCC(配列番号116)
insulin-like growth factor binding protein-1は胎児の子宮内成長遅滞、子宮低酸素症等に関与することが知られている。
[67]GRが結合するosteocalcin遺伝子のプロモーター領域DNA配列:GAGGGTATAAACAGTGCTGGAG(配列番号117)
osteocalcinは骨形成関連疾患等に関与することが知られている。
[68]RXR-α, PPARα, PPARγが結合するsmall heterodimer partner 1遺伝子のプロモーター領域DNA配列:CCTGAGTTAATGACCTTGT(配列番号118)
small heterodimer partner 1は若年発症糖尿病, 肥満等に関与することが知られている。
[69]RXR-α, PPARα, PPARγが結合するCytochrome P450 3A4遺伝子のプロモーター領域DNA配列:CTGAATGAACTTGCTGACCCTCTG(配列番号119)
Cytochrome P450 3A4は肝臓における薬物代謝に関与しており, 癌等に関与することが知られている。
[70]RXR-α, PPARα, PPARγが結合するphospholipid transfer protein遺伝子のプロモーター領域DNA配列:GATCCAACTGAGGGTCAGTGACCCAAGTGA(配列番号120)
phospholipid transfer proteinは低HDL・低アポ蛋白、アテローム硬化症,等に関与することが知られている。
[71]RXR-α, PPARα, PPARγが結合するsolute carrier family 10 (sodium/bile acid cotransporter family), member 2遺伝子のプロモーター領域DNA配列:AGCTCAGAAGTAGGCCAGAGGTCAGTCCCAG(配列番号121)
solute carrier family 10, member 2がコードする蛋白質は下痢, 消化不良, 栄養失調等の脂肪の吸収に関与した疾患等に関与することが知られている。
[72]RXR-α, PPARα, PPARγが結合するtumor necrosis factor α遺伝子のプロモーター領域DNA配列:TGTCCAGGGCTATGGAAGTCGAGTATCG(配列番号122)
tumor necrosis factor αは多発性硬化症, 基底細胞癌, RA, SLE, インシュリン依存性糖尿病, 癌, クローン病, 喘息等に関与することが知られている。
[73]RXR-α, PPARα, PPARγが結合するcholesteryl ester transfer protein遺伝子のプロモーター領域DNA配列:CTTGGGGTCATTGTCGGGCAACAG(配列番号123)
cholesteryl ester transfer proteinは高HDL, 低βリポ蛋白症, 高αリポ蛋白症等に関与することが知られている。
[74]RXR-α, PPARα, PPARγが結合するapolipoprotein AI遺伝子のプロモーター領域DNA配列:CCACTGAACCCTTGACCCCTGCCCTG(配列番号124)
apolipoprotein AIはアミロイド症, 動脈硬化等循環器疾患等に関与することが知られている。
[75]SP1が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:GGGTCCCGCCTCCTTGAGGCGGGCCCGGGCG(配列番号125)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[76]SP1が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:GGGTCCCGCCTCCTTGA(配列番号126)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[77]SP1が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:CCGGGCGGGGCGG(配列番号127)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[78]c-Ets-1_p54, Ets-1_deltaiV/VII, Ets-2, Elk-1, SAP-1, SAP-1b, Erg-1, p55erg, Fli-1b, E4TF1-60/GABP-α, E74Aが結合するepidermal growth factor receptor遺伝子のプロモーター領域DNA配列:CAGCCCCCGGCGCAGC(配列番号128)
epidermal growth factor receptorは癌等に関与することが知られている。
[79]c-Ets-1_p54, Ets-1_deltaiV/VII, Ets-2, Elk-1, SAP-1, SAP-1b, Erg-1, p55erg, Fli-1b, E4TF1-60/GABP-α, E74Aが結合するepidermal growth factor receptor遺伝子のプロモーター領域DNA配列:GCCCCCCGCAC(配列番号129)
epidermal growth factor receptorは癌等に関与することが知られている。
[80]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:CCCTCAGTCTTCTTGGAAATTC(配列番号130)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[81]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:CTTTCTGAGAAATGG(配列番号131)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[82]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:CTCCTTCCCGGAAGCA(配列番号132)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[83]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6が結合するinterleukin-2 receptor α chain遺伝子のプロモーター領域DNA配列:CAGTTTCTTCTAGGAAGTACCA(配列番号133)
interleukin-2 receptor α chainは自己免疫疾患、炎症等に関与することが知られている。
[84]STAT2, STAT3, STAT4, STAT5A, STAT5B, STAT6が結合するinterleukin-2 receptor α chain遺伝子のプロモーター領域DNA配列:CAGACATTTCTGATAATAGAG(配列番号134)
interleukin-2 receptor α chainは自己免疫疾患、炎症等に関与することが知られている。
[85]p53が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:GAACATGTCCCAACATGTTG(配列番号135)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[86]p53が結合するcdk-inhibiting protein 1遺伝子のプロモーター領域DNA配列:GAAGAAGACTGGGCATGTCT(配列番号136)
cdk-inhibiting protein 1は癌等に関与することが知られている。
[87]p53が結合するepidermal growth factor receptor遺伝子のプロモーター領域DNA配列:GAGCTAGACGTCCGGGCAGCCCCCGG(配列番号137)
epidermal growth factor receptorは癌等に関与することが知られている。
上記33種類の、既知の疾患関連蛋白質遺伝子のプロモーター領域配列(配列番号105〜配列番号137)を有するDNAに関しBIAapplication handobook chapter 4.4に従い、センサーチップ表面にビオチン化した二本鎖DNAを別々に固定化した。センサーチップはSAタイプ(ビアコア社製)を用いた。センサーチップ1枚につきフローセルが4分割されているが、フローセル1には何も固定せずコントロール区として用い、フローセル2,3および4はそれぞれ別々のDNA1,2および3を固定化した。センサーチップのDNAの固定化密度を一定にするため、DNA固定化によるSPR応答値の上昇(ΔRU-DNA)をDNA分子量(MW)で割った値(D)が各フローセルで一定になるようにΔRU-DNAを調節した。同様の要領で残りのDNAについても固定化を行なった。以上のようにセンサーチップの作製ができた後、タンパク質との結合活性解析を行った。SPR法によるDNAとタンパク質間の結合活性解析は既に多数報告がある。本実施例では、Molecular Microbiology, 36(3), 557-569(2000)の測定条件を参考にして行った。まず、フローセル1−2−3−4が直列につながった流路に設定しておく。そこにランニングバッファーを一定流量(5μL/min)で流しておき、SPR測定値を安定させる。次に、タンパク質溶液を同流量で流し、タンパク質分子とDNA鎖との間で特異的結合を形成させる。一定時間注入後、各フローセルのSPR応答値(SPR−bound)を測定する。次に0.05%SDSを1分間注入し、センサーチップ表面を洗浄し結合している蛋白質を解離させ、センサーチップ表面を初期状態に戻す。この操作によって、SPR応答値は、蛋白質注入前のベースラインの値にもどる。SPR応答値がベースラインの値に戻ったことを確認した後、次のサンプルを注入・測定する。今回の実施例では、サンプルを12個測定する毎に結合性を示さないGST-GFPを発現させた溶液を注入・測定し、ネガティブコントロール値とした。つまり第1サンプルとしてGST-GFP1の測定を行いその後、第2〜第13サンプルを測定し、最後に第14サンプルとしてGST-GFP2を測定する。フローセル1の値から標準偏差値(SD)を算出した。次にフローセル2から4の測定データを時系列で並べる。サンプルの前後の2つのGST-GFPの測定値を直線で結ぶベースラインを描き、各サンプルのベース値(B)を求める。このB値を各サンプルの測定値(S)から差し引きし、真の結合値V値を求めた。V値がSDより5倍以上の場合、有意な結合を有すると定義し、結合活性を(R=S/B)によって表した。その結果を表2に示す。
Figure 2004261179
BRAMY3011501(配列番号1)によりコードされるタンパク質(配列番号12)は、胎児の子宮内成長遅滞、子宮低酸素症等に関連するinsulin-like growth factor binding protein-1遺伝子上流転写調節領域のGR結合部位配列(配列番号114)に結合した。
FCBBF3020030(配列番号6)によりコードされるタンパク質(配列番号17)は、insulin receptor遺伝子上流転写調節領域のC/EBPα結合部位(配列番号105、106)、multidrug resistance gene 1遺伝子上流転写調節領域のC/EBPβ結合部位(配列番号107)、small heterodimer partner 1遺伝子上流転写調節領域のFXR/RXR-α結合部位(配列番号118)、Cytochrome P450 3A4遺伝子上流転写調節領域のRXR-α結合部位(配列番号119)、phospholipid transfer protein遺伝子上流転写調節領域のRXR-α結合部位(配列番号120)、solute carrier family 10 (sodium/bile acid cotransporter family), member 2遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号121)、cholesteryl ester transfer protein遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号123)、apolipoprotein AIの遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号124)に結合した。
BRHIP3007960(配列番号7)によりコードされるタンパク質(配列番号18)は、cdk-inhibiting protein 1遺伝子上流転写調節領域のSTAT5B結合部位(配列番号130、131)およびinterleukin-2 receptor, α chain遺伝子上流転写調節領域のSTAT5A結合部位(配列番号133、134)に結合した。
BRTHA2026290(配列番号8)によりコードされるタンパク質(配列番号19)は、small heterodimer partner 1 遺伝子上流転写調節領域FXR/RXR-α結合部位(配列番号118)、solute carrier family 10 (sodium/bile acid cotransporter family), member 2遺伝子上流転写調節領域のPPAR-α/RXR-α結合部位(配列番号121)、tumor necrosis factor α 遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号122)、cholesteryl ester transfer protein遺伝子上流転写調節領域のLXR-α/RXR-α結合部位(配列番号123)、apolipoprotein AI遺伝子上流転写調節部領域のPPAR-α/RXR-α結合部位(配列番号124)に結合した。
転写調節活性の測定(疾患関連転写調節因子に対する調節作用活性の解析)
(1)無細胞タンパク質合成系を用いた本発明のタンパク質の調製
本発明のcDNAがコードするタンパク質につき、さらに疾患関連転写調節因子に対する調節作用活性を解析した。各クローンのcDNAがコードするタンパク質は、実施例8(1)の方法に準じて調製した。
(2)解析用プレートの調製
転写調節因子の疾患関連転写調節因子に対する調節作用活性の測定系に用いるDNAは、疾患関連転写調節因子が結合する塩基配列を有することを特徴とし、5’側にビオチン(Bioと表記する)が付加した一本鎖DNA(oligo-Aと記載する)とその相補的配列を有する一本鎖DNA(oligo-B)と記載するをアニーリングさせることにより、二本鎖化したDNAを用いた。以下に用いたDNA配列を記載する。
疾患関連転写調節因子PPARγが認識する配列として、配列番号93と配列番号94を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5´- Bio-GGAACTAGGTCAAAGGTCATCCCCT-3´(配列番号93)
oligo-B;3-CCTTGATCCAGTTTCCAGTAGGGGA-5´(配列番号94)
疾患関連転写調節因子p53が認識する配列として、配列番号95と配列番号96を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5´-Bio-CTTGGACATGCCCGGGCATGTCCCTC-3´(配列番号95)
oligo-B;3´-GAACCTGTACGGGCCCGTACAGGGAG-5´(配列番号96)
疾患関連転写調節因子NFκBが認識する配列として、配列番号97と配列番号98を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5´-Bio-AGTTGAGGGGACTTTCCCAGGC-3´(配列番号97)
oligo-B;3´-TCAACTCCCCTGAAAGGGTCCG-5´(配列番号98)
疾患関連転写調節因子AP−1が認識する配列として、配列番号99と配列番号100含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5´-Bio-CGCTTGATGAGTCAGCCGGAA-3´(配列番号99)
oligo-B;3´-GCGAACTACTCAGTCGGCCTT-5´(配列番号100)
疾患関連転写調節因子HIF−1が認識する配列として、配列番号101と配列番号102を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5'-Bio-GATCGCCCTACGTGCTGTCTCAGATC-3'(配列番号101)
oligo-B;3'-CTAGCGGGATGCACGACAGAGTCTAG-5'(配列番号102)
疾患関連転写調節因子Smad3が認識する配列として、配列番号103と配列番号104を含むビオチン化DNAをアニーリングさせた二本鎖DNA
oligo-A;5´-Bio-GAGAGTCTGGACACGTGGGGAGTCAGCCG-3´(配列番号103)
oligo-B;3´-CTCTCAGACCTGTGCACCCCTCAGTCGGC-5´ (配列番号104)
上記によって作成した二本鎖DNAを固定する固相担体として、BioTechniques ,32:1168-1177(2002)の方法に準じてストレプトアビジンをコートした96ウェルプレート{ビオチン結合能20ng/ウェル(80 pmol/ウェル)、ストレプトアビジンコートエリア300μl}またはTransAMキット(ACTIVE MOTIF社)もしくはBD Mercury TransFactorキットに添付のプレートを適宜使用した。
(3)PPARγに対する調節作用活性の解析
解析試料としてはPPARγを含むPMA処理THP−1細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl,20% glycerol、0.1mM EDTA、10mM NaF、10μM Na2MoO4、1mM NaVO3、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{10mM Hepes(pH7.5)、4% glycerol、50mM NaCl、0.5mM EDTA、1mM MgCl2、10μg/ml Herring sperm}および実施例9(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはPMA処理THP−1細胞核抽出溶液1μl,9μl希釈溶液,35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例9(2)によって作成した、PPARγが認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。
この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗PPARヤギ抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。この後、洗浄用緩衝液によって充分な洗浄を行ない、抗体希釈液によって1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗ヤギIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液によって充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表3の「PPARγ評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
Figure 2004261179
BRAMY3011501(配列番号1)、BRACE3041162(配列番号2)、THYMU3021586(配列番号3)、BRTHA3014000(配列番号4)、BRACE3034183(配列番号5)、BRHIP3007960(配列番号7)、BRTHA2026290(配列番号8)、BRTHA2026311(配列番号9)、TESTI4005322(配列番号11)の9クローンによりコードされるタンパク質、すなわち配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号18、配列番号19、配列番号20、配列番号22に記載のアミノ酸配列をそれぞれ有する9種類のタンパク質は、PPARが有する作用を増強または抑制する活性を有し、内分泌・糖・脂質代謝異常等による糖尿病や肥満等の生活習慣病、血管機能異常等による循環器系疾患、炎症、癌等に関連することが推測された。
(4)p53に対する調節作用活性の解析
解析試料としては活性化p53を含むH22処理MCF−7細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM Na2MoO4、1mM NaVO3、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{20mM Hepes(pH7.5)、10% glycerol、5mM KCl、0.5mM EDTA、5mM MgCl2、1mM DTT、0.17μg/ml ポリ[d(I−C)]}および実施例9(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはH22処理MCF−7細胞核抽出溶液1μl、9μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例9(2)によって作成した、p53が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後、洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗p53ウサギ抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
この後洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗ウサギIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm、リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表3の「p53評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
BRAMY3011501(配列番号1)、BRACE3041162(配列番号2)、THYMU3021586(配列番号3)、BRTHA3014000(配列番号4)、BRHIP3007960(配列番号7)、BRTHA2026290(配列番号8)、BRTHA2026311(配列番号9)、TESTI4005322(配列番号11)の8クローンによりコードされるタンパク質、すなわち配列番号12、配列番号13、配列番号14、配列番号15、配列番号18、配列番号19、配列番号20、配列番号22に記載のアミノ酸配列をそれぞれ有する8種類のタンパク質は、p53が有する作用を増強または抑制する活性を有し、癌等に関連することが推測された。
(5)NFκBに対する調節作用活性の解析
解析試料としてはNFκBを含むTNF−α処理HeLa細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを19μlの希釈溶液{20mM Hepes(pH7.5)、350mM NaCl、20% glycerol、1% Igepal−CA630、1mM MgCl2, 0.5mM EDTA、0.1mM EGTA、5mM DTT}と混合後、25μlの反応溶液{4mM Hepes(pH7.5)、8% glycerol、120mM KCl、1% BSA、2mM DTT、10μg/ml Herring sperm}および実施例9(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはTNF−α処理HeLa細胞核抽出溶液1μl,19μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては20μl希釈溶液,25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては20μl希釈溶液および30μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例9(2)によって作成した、NFκBが認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。
この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1%Tween 20}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween20}に溶解した抗NFκB抗体(0.2μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液1000倍で希釈したHRP(西洋わさびペルオキシターゼ)標識抗IgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1%DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表3の「NFκB評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
BRAMY3011501(配列番号1)、THYMU3021586(配列番号3)、BRTHA3014000(配列番号4)、BRACE3034183(配列番号5)、TESTI4005322(配列番号11)の5クローンによりコードされるタンパク質、すなわち配列番号12、配列番号14、配列番号15、配列番号16、配列番号22に記載のアミノ酸配列をそれぞれ有する5種類のタンパク質は、NFκBが有する作用を増強または抑制する活性を有し、関節リウマチや変形性関節炎などの免疫性疾患、炎症性疾患、癌等に関連することが推測された。
(6)AP−1に対する調節作用活性の解析
解析試料としては活性化AP−1を含むPMAおよびInomycin処理WI−38細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを19μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM Na2MoO4、1mM NaVO3、10mM pNPP、10mM b−glycerophosphate,1mM DTT}と混合後、25μlの反応溶液{10mM Hepes(pH7.5)、 12% glycerol、8mM NaCl、0.2mM EDTA, 0.1% BSA、1mM DTT、0.17μg/ml ポリ[d(I−C)]および実施例9(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としては活性化AP−1を含むPMAおよびInomycin処理WI−38細胞核抽出溶液1μl、19μl希釈溶液、25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては20μl希釈溶液、25μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの、測定ブランク用試料としては20μl希釈溶液および30μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例9(2)によって作成した、AP−1が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、1% BSA}に溶解した抗リン酸化−c−Jun抗体(0.4μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗IgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1% DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm,リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表3の「AP−1評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
BRACE3041162(配列番号2)、THYMU3021586(配列番号3)、BRTHA3014000(配列番号4)、BRACE3034183(配列番号5)、BRTHA2026290(配列番号8)、BRTHA2026311(配列番号9)、BRAWH3031342(配列番号10)、TESTI4005322(配列番号11)の8クローンによりコードされるタンパク質、すなわち配列番号13、配列番号14、配列番号15、配列番号16、配列番号19、配列番号20、配列番号21、配列番号22に記載のアミノ酸配列をそれぞれ有する8種類のタンパク質は、AP−1が有する作用を増強または抑制する活性を有し、炎症性疾患や癌等に関連することが推測された。
(7)HIF−1に対する調節作用活性の解析
解析試料としてはHIF−1を含むCoCl2処理Cos−7細胞核抽出溶液(2.5mg/ml ACTIVE MOTIF社)1μlを9μlの希釈溶液{20mM Hepes(pH7.5)、400mM NaCl、20% glycerol、0.1mM EDTA、10mM NaF、10μM Na2MoO4、1mM NaVO3、10mM pNPP、10mM b−glycerophosphate、1mM DTT}と混合後、35μlの反応溶液{10mM Hepes(pH7.5)、5% glycerol、50mM NaCl、1mM EDTA、10mg/ml BSA, 1mM DTT}および実施例9(1)の方法によって調製した本発明のタンパク質を含むコファクター溶液5μlを混合したものを用いた。陽性試料としてはHIF−1を含むCoCl2処理Cos−7細胞核抽出溶液1μl、9μl希釈溶液、35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したものを用いた。また陰性試料としては10μl希釈溶液,35μl反応溶液および本発明のタンパク質を含まないコファクター溶液5μlを混合したもの,測定ブランク用試料としては10μl希釈溶液および40μl反応溶液を混合したものを用いた。各試料は混合後室温で30分反応させた。次に実施例9(2)によって作成した、HIF−1が認識する二本鎖DNAを結合させた96ウェルプレートに対し、1ウェルあたり上記試料50μlずつを添加し室温で1時間反応させた。この後、洗浄用緩衝液{10mM phosphate buffer(pH7.5)、50mM NaCl、0.1% Tween 20、2.7mM KCl}を用いてウェルを充分な洗浄を行い、抗体希釈液{10mM phosphate buffer(pH7.5)、50mM NaCl、2.7mM KCl、10mg/ml BSA}に溶解した抗HIF−1マウス抗体(0.25μg/ml)を100μlずつウェルに添加し、さらに室温で1時間反応させた。
この後、洗浄用緩衝液で充分な洗浄を行ない、抗体希釈液で1000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識抗マウスIgG抗体を100μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で充分な洗浄を行なった後、発色用基質(TMB)を含む1% DMSO溶液を100μlずつウェルに添加し室温で反応させ発色を行なった。この後0.5M硫酸溶液を100μlずつウェルに添加して反応を止め、測定波長450nm、リファレンス波長655nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}×100で表記した。その結果を、表3の「HIF−1評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
BRAMY3011501(配列番号1)、BRACE3041162(配列番号2)、BRTHA3014000(配列番号4)、BRHIP3007960(配列番号7)、BRTHA2026311(配列番号9)、BRAWH3031342(配列番号10)の6クローンによりコードされるタンパク質、すなわち配列番号12、配列番号13、配列番号15、配列番号18、配列番号20、配列番号21に記載のアミノ酸配列をそれぞれ有する6種類のタンパク質は、HIF−1が有する作用を増強または抑制する活性を有し、血管新生異常や細胞内酸化異常等に起因する、虚血性疾患、貧血、低酸素症、糖尿病性網膜症、循環器系疾患、癌等に関連することが推測された。
(8)Smad3に対する調節作用活性の解析
解析試料として、候補タンパク質(コファクター候補タンパク質)を含むコファクター溶液は5μl使用し、これに対して結合緩衝液{50 mM HEPES-KOH (pH 7.8), 20% Glycerol, 250 mM KCl, 5 mM EDTA, 25 mM MgCl2,5% BSA}10μl,Herring sperm DNA溶液(10mg/ml)0.1μl、DTT (50mM) 1μl、定法によりに大腸菌に遺伝子発現をさせて調製したGST(Glutathion-S-transferase)-Smad3FL3D{転写因子であるSmad3の全長体のC末端の3つのセリン(セリン422、セリン423、セリン425)をアスパラギン酸に置換する変異をPCR(polymerase chain reaction)で導入したもののN末端側に標識タンパク質(タグ)としてGST(Glutathion-S-transferase)を結合させた融合タンパク質,SDS-PAGEによる解析で精製度90%以上,0.74mg/ml }0.014μl(ウェルあたり0.01μgの添加量)を添加し、さらに蒸留水を添加して50μlに調製したものを用意した。陽性試料として合成タンパクを含まないコファクター溶液は5μl使用し、これに対して結合緩衝液{50 mM HEPES-KOH (pH 7.8), 20% Glycerol, 250 mM KCl, 5 mM EDTA, 25 mM MgCl2,5% BSA}10μl,Herring sperm DNA溶液(10mg/ml)0.1μl、DTT (50mM) 1μl、定法によりに大腸菌に遺伝子発現をさせて調製したGST(Glutathion-S-transferase)-Smad3FL3D{転写因子であるSmad3の全長体のC末端の3つのセリン(セリン422、セリン423、セリン425)をアスパラギン酸に置換する変異をPCR(polymerase chain reaction)で導入したもののN末端側に標識タンパク質(タグ)としてGST(Glutathion-S-transferase)を結合させた融合タンパク質,SDS-PAGEによる解析で精製度90%以上,0.74mg/ml }0.014μl(ウェルあたり0.01μgの添加量)を添加し、さらに蒸留水を添加して50μlに調製したものを用意した。陰性試料として、実施例1の方法に記載したエネルギー供給層溶液(125μl)と反応層溶液(25μl)を混合した溶液(コファクターを含まない溶液)は通常5μl使用し、これに対して結合緩衝液{50 mM HEPES-KOH (pH 7.8), 20% Glycerol, 250 mM KCl, 5 mM EDTA, 25 mM MgCl2,5% BSA}10μl,Herring sperm DNA溶液(10mg/ml)0.1μl、DTT (50mM) 1μl、さらに蒸留水を添加して50μlに調製したものを用意した。測定ブランクとして、結合緩衝液{50 mM HEPES-KOH (pH 7.8), 20% Glycerol, 250 mM KCl, 5 mM EDTA, 25 mM MgCl2,5% BSA}10μl,Herring sperm DNA溶液(10mg/ml)0.1μl、DTT (50mM) 1μl、さらに蒸留水を添加して50μlに調製したものを用意した。実施例9により作成したSmad3が認識する二本鎖DNA(PAI-1プロモーター配列)を結合させた384ウェルプレートに対し、1ウェルあたり50μlずつを添加し緩やかに攪拌しながら室温で1時間反応させた。次にウェル内の試料を除去後、ウェルあたり100μlの洗浄用緩衝液{137mM NaCl, 8.10mM Na2HPO4, 2.68mM KCl, 1.47mM KH2PO4, 0.05% Tween 20}を添加して5回洗浄した。この後、抗体希釈液{10 mM Phospate buffer (pH 7.5), 50 mM NaCl, 2.7 mM KCl,1% BSA}によって10000倍に希釈したHRP(西洋わさびペルオキシターゼ)標識した抗GST抗体(アマシャムバイオサイエンス社)を50μlずつウェルに添加し、さらに室温で1時間反応させた。洗浄用緩衝液で5回の洗浄を行なった後、0.4mg/mlオルトフェニレンジアミン(OPD,Sigma社 P-9029)および0.015〜0.03%過酸化水素溶液を含むクエン酸―リン酸緩衝液(pH5.0)を50μl/ウェルずつ添加して室温によって反応させ、発色を行なった。この後、1N 硫酸をウェルあたり50μlずつ添加して反応を止め、測定波長490nm,リファレンス波長650nmで測定を行なった。解析結果は、陽性試料と陰性試料測定値の差に対する解析試料測定値と陽性試料測定値の差の割合を百分率(%)で表示した。すなわち{(解析試料値―陽性試料値)/(陽性試料値―陰性試料値)}x100で表記した。その結果を、表3の「Smad3評価」のカラムに示す。表3で、−Aはこの割合が−50%未満、−Bは−50%以上−30%未満、−Cは−30%以上−10%未満、+/−Dは−10%以上10%未満、+Cは10%以上30%未満、+Bは30%以上50%未満、+Aは50%以上、であることを示す。
BRTHA3014000(配列番号4)、BRACE3034183(配列番号5)、FCBBF3020030(配列番号6)の3クローンによりコードされるタンパク質は、すなわち配列番号15、配列番号16、配列番号17に記載のアミノ酸配列をそれぞれ有するの3種類のタンパク質は、Smad3が有する作用を抑制する活性を有し、癌,繊維化,免疫等に関連することが推測された。
in silicoにおける発現頻度解析
実施例1に示した様々な組織・細胞由来のcDNAライブラリーを作製し、各ライブラリーからcDNAクローンを無作為に選択して、その5'末端領域の配列を決定し、データベース化した。本データベースは1,402,069個のクローンの塩基配列をデータベース化したものであり、解析母数としては十分なデータベースである。
次にこのデータベースにある各クローンの塩基配列を、塩基配列の相同性検索プログラムによって相同な配列同士をカテゴライズし(クラスター化)、各クラスターに属するクローン数を各ライブラリー毎に集計し規格化することによって、ある遺伝子のcDNAライブラリー内での存在比を解析した。この解析によって、cDNAライブラリーのソースとなっている組織や細胞における、ある遺伝子の発現頻度情報を得た。
次に本発明のcDNAの塩基配列を持つ遺伝子の、組織や細胞間での発現を解析するために、大量のcDNAクローンを解析した組織や細胞由来のライブラリーを組織・細胞間での発現量の比較の対象にした。すなわち600個以上のcDNAクローンの塩基配列を解析した組織や細胞について、先に規格化した数値を組織間や細胞間で比較し、遺伝子の発現頻度の変化を解析した。この解析によって以下に続く病態や機能に関連する遺伝子であることが示された。なお、以降に示される表4〜11中の各数値は、相対的な発現頻度を示し、数値が大きいほど発現量が多いことを示す。
アルツハイマー病関連遺伝子
アルツハイマー病とは記憶力が低下し、進行すれば生活が困難となり介護が必要となる脳神経系の疾患であり、進行すれば脳そのものが萎縮する。その発症の要因はストレスなどの環境因子、高血圧やコレステロール血症などの血管因子も関わりがあるといわれているが、未だ不明である。したがって、正常脳組織とアルツハイマーの病態組織を比較した時、発現に差のある遺伝子はアルツハイマー病に関連する遺伝子であり、病態の発症メカニズムの解明や、遺伝子診断に有用であると考えられる。アルツハイマー患者の大脳皮質由来のライブラリー(BRALZ、BRASW)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表4)、両者で発現変化のある遺伝子は、以下の2クローンであった。
THYMU3021586(配列番号3), BRAWH3031342(配列番号10)
これらの遺伝子はアルツハイマー病に関する遺伝子であると推定された。
パーキンソン病関連遺伝子
パーキンソン病とは脳内の黒質で作られるドーパミンという神経伝達物質が十分量作られなくなり、その結果、手が震え、筋肉の動きが固くなって身体の動きが鈍くなる等の運動障害を引き起こす脳神経系の疾患である。脳の神経細胞は通常、歳を取るにつれて少しずつ減少するが、パーキンソン病では黒質の神経細胞が普通よりも早く著しく減少する。よって脳組織全体と黒質とを比較した時、発現に差のある遺伝子は黒質特異的な変動をするパーキンソン病に関連する遺伝子であり、発症メカニズムの解明や遺伝子診断に有用であると考えられる。黒質由来のライブラリー(BRSSN)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表5)、両者で発現変化のある遺伝子は、以下の2クローンであった。
THYMU3021586(配列番号3), BRAWH3031342(配列番号10)
これらの遺伝子はパーキンソン病に関する遺伝子であると推定された。
短期記憶・痴呆症に関連する遺伝子
脳組織の中で海馬とは記憶を扱う非常に重要な部位であり、得た情報の情報の要・不要を判断して、他の脳部位に記憶を蓄えさせる、記憶固定の働きがある。臨床的知見より、海馬に異常をきたしたり最悪海馬が無くなると、5分程度しか新しいことを覚えていられなくなる。また痴呆症患者の一部はこの海馬に異常をきたしていると考えられている。脳組織全体と海馬とを比較した時、発現に差のある遺伝子は記憶に関与したり、痴呆症に関連する遺伝子であり、記憶のメカニズム解明や遺伝子診断に有用であると考えられる。海馬由来のライブラリー(BRHIP)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表6)、両者で発現変化のある遺伝子は、以下の3クローンであった。
THYMU3021586(配列番号3), BRHIP3007960(配列番号7), BRAWH3031342(配列番号10)
これらの遺伝子は記憶および痴呆症に関する遺伝子であると推定された。
平衡感覚・運動機能に関する遺伝子
小脳は平衡感覚と筋肉運動、運動学習の中枢である。この領域は運動の調節に関与していると考えられており、小脳が動作することによって無意識的にスムーズな運動をすることが可能になる。また、運動だけでなく読み書きなどより高次な運動の慣れにも小脳が関与していることも最近の研究で解明されつつある。脳組織全体と小脳とを比較した時、発現に差のある遺伝子は平衡感覚や運動機能に関与する遺伝子であり、脳が制御する運動機能の分子メカニズム解明に有用であると考えられる。小脳由来のライブラリー(BRACE)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表7)、両者で発現変化のある遺伝子は、以下の4クローンであった。
BRACE3041162(配列番号2), THYMU3021586(配列番号3), BRACE3034183(配列番号5) , BRAWH3031342(配列番号10)
これらの遺伝子は平衡感覚および運動機能に関する遺伝子であると推定された。
感覚器からの情報伝達に関与する遺伝子
視床は、大脳と結びつきの強い神経細胞が集まった部分であり、脊髄などから伝わってきた感覚情報を大脳の関係部分に伝えたり、大脳の運動の指令を調節する。例えば視覚では映像を大きさ、形、色に分け、聴覚では音声を音量、耳障りの良し悪しで分け、大脳皮質の感覚野に送る。脳組織全体と視床とを比較した時、発現に差のある遺伝子は感覚器からの情報伝達に関与する遺伝子であり、脳が制御する情報伝達の分子メカニズム解明に有用であると考えられる。視床由来のライブラリー(BRTHA)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表8)、両者で発現変化のある遺伝子は、以下の5クローンであった。THYMU3021586(配列番号3), BRTHA3014000(配列番号4), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), BRAWH3031342(配列番号10)
これらの遺伝子は感覚器からの情報伝達に関する遺伝子であると推定された。
情動反応に関する遺伝子
扁桃は脳の感情中枢である。扁桃を通過した情報は感情反応、例えばパニックや恐怖反応などを引き起こす。刺激が扁桃で情動評価されて強い恐怖を生じたとき、扁桃は脳の各部に警戒信号を出す。その結果、手の平の発汗、心悸亢進、血圧上昇、アドレナリンの急激分泌等の反応が起きる。いわば扁桃体は身体に警戒信号を送り、その結果として体を警戒態勢に入らせる一種の防衛本能を司っている組織とも言える。脳組織全体と扁桃とを比較した時、発現に差のある遺伝子は情動反応に関与する遺伝子であり、感情反応や恐怖反応、パニックなどの分子メカニズム解明に有用であると考えられる。扁桃由来のライブラリー(BRAMY)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果(表9)、両者で発現変化のある遺伝子は、以下の2クローンであった。
THYMU3021586(配列番号3), BRAWH3031342(配列番号10)
これらの遺伝子は情動反応に関する遺伝子であると推定された。
癌関連遺伝子
癌の組織では、正常組織とは異なる遺伝子のセットが発現して組織・細胞の癌化に寄与していると考えられている。したがって、正常組織とは異なる発現をする遺伝子は癌関連遺伝子である。正常な組織と比較して癌組織で発現変化する遺伝子を探索した。
子宮がん由来のライブラリー(TUTER)と、正常な子宮由来のライブラリー(UTERU)のcDNAを解析して比較した結果(表10)、両者で発現変化のある遺伝子は、以下の2クローンであった。
THYMU3021586(配列番号3), BRAWH3031342(配列番号10)
舌がん由来のライブラリー(CTONG)と、正常な舌由来のライブラリー(NTONG)のcDNAを解析して比較した結果(表11)、両者で発現変化のある遺伝子は、以下の1クローンであった。
THYMU3021586(配列番号3)
これらの遺伝子は、癌に関する遺伝子であると推定された。
なお、以下の組合わせのライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
CD34+細胞のRNAから作製したライブラリー(CD34C)とCD34+細胞を破骨細胞分化因子で処理した細胞のRNAから作製したライブラリー(D30ST, D60STまたはD90ST)のcDNA;
未分化なNT2細胞由来のライブラリー(NT2RM)と分化誘導処理した細胞のライブラリー(NT2RP, NT2RIまたはNT2NE)のcDNA。
また、以下の組合わせの正常組織と癌組織のライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
乳がん由来のライブラリー(TBAES)と正常な乳房由来のライブラリー(BEAST)のcDNA;
子宮頸癌由来のライブラリー(TCERX)と正常な子宮頸管由来のライブラリー(CERVX)のcDNA;
結腸がん由来のライブラリー(TCOLN)と正常な結腸由来のライブラリー(COLON)のcDNA;
食道がん由来のライブラリー(TESOP)と正常な食道由来のライブラリー(NESOP)のcDNA;
腎臓がん由来のライブラリー(TKIDN)と正常な腎臓由来のライブラリー(KIDNE)のcDNA;
肝臓がん由来のライブラリー(TLIVE)と正常な肝臓由来のライブラリー(LIVER)のcDNA;
肺がん由来のライブラリー(TLUNG)と正常な肺由来のライブラリー(HLUNG)のcDNA;
卵巣がん由来のライブラリー(TOVAR)と正常な卵巣由来のライブラリー(NOVAR)のcDNA;
胃がん由来のライブラリー(TSTOM)と正常な胃由来のライブラリー(STOMA)のcDNA。
また、発生や分化に関連する遺伝子を調べる方法として、発生・分化途中の組織・細胞と、成体の組織細胞において遺伝子発現量の違いを調べる発現頻度解析がある。組織の発生・分化に関する遺伝子は、その組織の構築と機能発現に関する遺伝子であり、傷害のある組織を任意に再生せしめる再生医学に利用可能な有用な遺伝子である。
先に記した1,402,069個のクローンの塩基配列のデータベースを基にして得た遺伝子発現頻度情報を用いて、発生・分化途中の組識・細胞と成体の組識・細胞とを比較して遺伝子発現頻度に変化のある遺伝子を解析した。
胎児の脳由来のライブラリー(FCBBF, FEBRAまたはOCBBF)と成体の脳由来のライブラリー(BRACE, BRALZ, BRAMY, BRAWH, BRCAN, BRCOC, BRHIP, BRSSN, BRSTNまたはBRTHA)のcDNAを解析し、胎児と成体で比較した結果(表12)、両者で発現変化のある遺伝子は、以下の9クローンであった。
BRACE3041162(配列番号2), THYMU3021586(配列番号3), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9)、BRAWH3031342(配列番号10)これらの遺伝子は組織・細胞の再生に関する遺伝子であると推定された。
なお、以下の胎児組織と成体組織のライブラリーのcDNAについても11クローンの発現を解析して比較したが、11クローンとも両者で発現変化は見られなかった。
胎児の心臓由来のライブラリー(FEHRT)と成体の心臓由来のライブラリー(HEART)のcDNA;
胎児の腎臓由来のライブラリー(FEKID)と成体の腎臓由来のライブラリー(KIDNE)のcDNA;
胎児の肺由来のライブラリー(FELNG)と成体の肺由来のライブラリー(HLUNG)のcDNA。
[表4]
アルツハイマー患者の大脳皮質由来のライブラリー(BRALZ、BRASW)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
---------------------------------------
Clone ID BRAWH BRALZ BRASW
---------------------------------------
THYMU3021586 20.651 0.000 0.000
BRAWH3031342 10.856 0.000 0.000
---------------------------------------
[表5]
黒質由来のライブラリー(BRSSN)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID BRAWH BRSSN
------------------------------
THYMU3021586 20.651 0.000
BRAWH3031342 10.856 0.000
------------------------------
[表6]
海馬由来のライブラリー(BRHIP)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID BRAWH BRHIP
------------------------------
THYMU3021586 20.651 16.855
BRHIP3007960 0.000 100.000
BRAWH3031342 10.856 0.000
------------------------------
[表7]
小脳由来のライブラリー(BRACE)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID BRAWH BRACE
------------------------------
BRACE3041162 0.000 100.000
THYMU3021586 20.651 0.000
BRACE3034183 0.000 100.000
BRAWH3031342 10.856 7.705
------------------------------
[表8]
視床由来のライブラリー(BRTHA)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID BRAWH BRTHA
------------------------------
THYMU3021586 20.651 4.580
BRTHA3014000 0.000 100.000
BRTHA2026290 0.000 100.000
BRTHA2026311 0.000 100.000
BRAWH3031342 10.856 0.000
------------------------------
[表9]
扁桃由来のライブラリー(BRAMY)と、正常全脳組織由来のライブラリー(BRAWH)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID BRAWH BRAMY
------------------------------
THYMU3021586 20.651 4.162
BRAWH3031342 10.856 0.000
------------------------------
[表10]
子宮がん由来のライブラリー(TUTER)と、正常な子宮由来のライブラリー(UTERU)のcDNAを解析して比較した結果、両者で発現変化のある遺伝子
------------------------------
Clone ID UTERU TUTER
------------------------------
THYMU3021586 4.926 0.000
BRAWH3031342 6.474 0.000
------------------------------
[表11]
舌がん由来のライブラリー(CTONG)と、正常な舌由来のライブラリー(NTONG)のcDNAを解析して舌がんと正常舌との間で発現変化のある遺伝子
------------------------------
Clone ID NTONG CTONG
------------------------------
THYMU3021586 0.000 7.693
------------------------------
胎児の脳由来のライブラリー(FCBBF, FEBRAまたはOCBBF)と成体の脳由来のライブラリー(BRACE, BRALZ, BRAMY, BRAWH, BRCAN, BRCOC, BRHIP, BRSSN, BRSTNまたはBRTHA)のcDNAを解析し、胎児と成体の間で発現変化のある遺伝子(表12)
Figure 2004261179
すなわち、BRACE3041162(配列番号2)は小脳(Brain, cerebellum)でスコアー100.0として発現が上昇しており,小脳が関与する疾患例えば運動失調 ,運動の解体 ,構語障害 ,拮抗運動反復不全 ,測定障害 ,緊張低下 筋緊張の低下 ,眼振 ,断綴言語 ,振戦となどの疾患症状との関連が推定される。
THYMU3021586(配列番号3)は扁桃(Brain, amygdala) でスコアー14.2として発現が上昇しており,扁桃腺,扁桃腺癌との関与が疑われる。一方, 全脳(Brain, whole)でスコアー120.7 ,脳梁(Brain, corpus callosum)でスコアー114.6 ,海馬(Brain, hippocampus) (CLONTECH #6578-1)でスコアー116.9, 視床(Brain, thalamus)でスコアー14.6として発現が上昇しており,神経と筋肉の病気との関与が疑われ,例えばアテトーゼ ,脊髄小脳変性症 ,アミロイドニューロパチー ,側頭動脈炎 ,一過性脳虚血 ,多発筋炎 ,下垂体腺腫, 多発性硬化症 ,顔面けいれん, 多発性ニューロパチー ,急性間欠性ポルフィリン症, 多発性脳梗塞 ,急性散在性脳脊髄炎 ,てんかん ,ギラン・バレー症候群 糖尿病性ニューロパチー ,筋萎縮性側索硬化症, 頭部外傷 ,筋緊張性ジストロフィー ,脳炎 ,くも膜下出血, 脳梗塞 ,頚椎捻挫, 脳腫瘍 ,頚部椎間板症候群,脳膿瘍 ,高血圧性脳症 パーキンソン症候群 ,坐骨神経痛 パーキンソン病 ,三叉神経痛, ハンチントン舞踏病 ,ジスキネジア 不随運動 ,ジストニア, ヘミバリスムス ,舌咽神経痛, ヘルペス脳炎 ,シャイド・レージャー症候群 ,ベル麻痺(末梢性顔面神経麻痺) ,周期性四肢麻痺, 本態性振戦 ,重症筋無力症 ,慢性硬膜下出血 ,進行性核上麻痺 ミオクローヌス ,進行性筋ジストロフィー, むち打ち症 ,髄膜炎 モヤモヤ病 ,正常圧水頭症 ,肋間神経痛 ,脊髄腫瘍疾患,アルコール依存症 精神分裂病 ,うつ病 躁病 ,覚せい剤中毒, 心身症 ,過食症, 対人恐怖症 ,強迫神経症 痴呆 ,拒食症 登校拒否 ,躁うつ病 ,頭部外傷後の精神障害 ,自閉症, ナルコレプシー ,人格障害 ヒステリー ,心気神経症, 不安神経症 ,神経性無食欲症, 不眠症状との関連が疑われる。また舌癌(Tongue, Cancer)でスコアー17.7 として発現が上昇しており舌癌との関与,精巣(Testis)でスコアー18.1として発現が上昇しており血精液症 ,精巣(睾丸)腫瘍, 陰嚢水瘤 ,精索捻転症(睾丸回転症) 停留精巣(睾丸) 精巣上体炎 ,副睾丸炎 との関連が推定される。
胸腺(Thymus) でスコアー113.8および気管(Trachea) でスコアー14.6として発現が上昇しており ,過喚起症候群, 肺炎, 気管支炎, 肺がん, 気管支拡張症, 肺気腫, 気管支喘息, 肺結核, 気胸, 肺血栓症, 胸膜炎, 肺サルコイドーシス, 胸膜腫瘍, 肺真菌症, 原発性肺高血圧症, 肺水腫 じん肺症, 肺塞栓症, 縦隔腫瘍, 肺胞蛋白症, 中葉症候群, 無気肺, 膿胸 ナルコーシス, 大動脈縮窄症となどの疾患症状との関連が推定される。
子宮(Uterus)でスコアー14.9 として発現が上昇している。
月経周期異常 ,無月経 , 子宮筋腫, 胎内発育不全 ,高プロラクチン血症, 子宮頚癌, 羊水塞栓 ,月経困難症, 子宮体癌 ,子宮破裂 ,月経前緊張症, 分娩後出血 ,機能性子宮出血, 不妊症,子宮復古不全 ,子宮頚管炎 ,妊娠中毒症 ,子宮内膜症, 多胎妊娠 ,子宮脱 ,過期妊娠,子宮内膜症となどの疾患症状との関連が推定される。
BRTHA3014000(配列番号4)は視床(Brain, thalamus) でスコアー100.0 として発現が上昇している。 BRACE3034183(配列番号5)は小脳(Brain, cerebellum)でスコアー100.0 として発現が上昇しいる。FCBBF3020030は胎児脳(Brain, Fetal)でスコアー100.0 として発現が上昇している。
BRHIP3007960(配列番号7)は海馬(Brain, hippocampus) でスコアー100.0 として発現が上昇している。
BRTHA2026290(配列番号8)は視床(Brain, thalamus) (CLONTECH #6582-1)でスコアー100.0 として発現が上昇している。BRTHA2026311(配列番号9)は視床(Brain, thalamus) (CLONTECH #6582-1)でスコアー100.0 として発現が上昇しており,神経と筋肉の病気との関与が疑われ,例えばアテトーゼ ,脊髄小脳変性症 ,アミロイドニューロパチー ,側頭動脈炎 ,一過性脳虚血 ,多発筋炎 ,下垂体腺腫, 多発性硬化症 ,顔面けいれん, 多発性ニューロパチー ,急性間欠性ポルフィリン症, 多発性脳梗塞 ,急性散在性脳脊髄炎 ,てんかん ,ギラン・バレー症候群 糖尿病性ニューロパチー ,筋萎縮性側索硬化症, 頭部外傷 ,筋緊張性ジストロフィー ,脳炎 ,くも膜下出血, 脳梗塞 ,頚椎捻挫, 脳腫瘍 ,頚部椎間板症候群,脳膿瘍 ,高血圧性脳症 パーキンソン症候群 ,坐骨神経痛 パーキンソン病 ,三叉神経痛, ハンチントン舞踏病 ,ジスキネジア 不随運動 ,ジストニア, ヘミバリスムス ,舌咽神経痛, ヘルペス脳炎 ,シャイド・レージャー症候群 ,ベル麻痺(末梢性顔面神経麻痺) ,周期性四肢麻痺, 本態性振戦 ,重症筋無力症 ,慢性硬膜下出血 ,進行性核上麻痺 ミオクローヌス ,進行性筋ジストロフィー, むち打ち症 ,髄膜炎 モヤモヤ病 ,正常圧水頭症 ,肋間神経痛 ,脊髄腫瘍疾患症状,アルコール依存症 精神分裂病 ,うつ病 躁病 ,覚せい剤中毒, 心身症 ,過食症, 対人恐怖症 ,強迫神経症 痴呆 ,拒食症 登校拒否 ,躁うつ病 ,頭部外傷後の精神障害 ,自閉症, ナルコレプシー ,人格障害 ヒステリー ,心気神経症, 不安神経症 ,神経性無食欲症, 不眠症との関連が推定される。
TESTI4005322(配列番号11)は精巣(Testis) (CLONTECH #64027-1)でスコアー100.0 として発現が上昇しており,血精液症 ,精巣(睾丸)腫瘍, 陰嚢水瘤 ,精索捻転症(睾丸回転症)、 停留精巣(睾丸) 、精巣上体炎 ,副睾丸炎 との関連が推定される。
5’末端配列大量解析データをベースとしたIn silicoにおける発現頻度解析
ある遺伝子が各臓器・組織、また種々の細胞にどの程度発現しているか解析することは、各臓器や組織、細胞自体の機能や遺伝子間のネットワークを明らかにしたり、病態の原因となる遺伝子を調査する上で非常に重要なプロセスである。例えば正常組織と癌化した組織内である遺伝子の発現に差があれば、その遺伝子は癌に関係する遺伝子の可能性があり、その遺伝子発現を抑制することによって組織の癌化も抑制できれば、抑制効果を有する化合物は抗癌剤になりうる。
これまでに遺伝子の発現頻度を解析するためにさまざまな方法が開発されてきた。例えばWetな実験ベースのものではノーザンブロッティング法やRT-PCR法のような方法や、基板上に遺伝子配列の一部分のDNAを合成したり、cDNAクローンをプラスミドの状態で直接貼り付け、そこに組織や細胞由来のRNAから合成したターゲットサンプルをハイブリダイズさせてシグナルを検出する遺伝子チップやマイクロアレイという方法がある(実験医学 Vol.17, No.8, 980-1056 (1999)、村松・那波監修 細胞工学別冊「DNAマイクロアレイと最新PCR法」(秀潤社, 2000))。また組織や細胞由来のRNAより合成したcDNAを切断し、組織や細胞ごとに長さの異なるアダプターを結合させ、アダプターと相補的な配列を持ち蛍光色素のついたプライマーと遺伝子特異的なプライマー間で競合PCRを行い、遺伝子発現量を解析するATAC-PCRという方法もある(Kato.K (1997) Nucleic Acids Res. 25, 4694-6.)。また配列データを用いたin silico解析をベースとした方法では、様々な組織・細胞のcDNAライブラリーから、無作為に遺伝子クローンを抽出し、3'末端領域の塩基配列の相同性情報をもとにして、相同性のあるものはまとめてクラスターとすることによって、クラスター単位で遺伝子を分類して、各クラスターに含有されるクローンの個数を比較することによって遺伝子の発現頻度情報を得ているBODYMAPと呼ばれるデータベースがある(http://bodymap.ims.u-tokyo.ac.jp/)。
実験ベース、in silico解析ベースの両者とも遺伝子発現解析法としては認知された技術であるが、これらの技術を含め従来の遺伝子発現頻度解析技術のほとんど全ては主に遺伝子の3’側の配列に焦点をあてた解析技術である。しかしながらヒトの遺伝子は一般的に3’側の非翻訳領域(3'-UTR)が長いため、これらの方法で解析されたデータがそのまま遺伝子の発現頻度、ひいてはタンパク質の発現様式を示しているかどうかは今だ議論の余地がある。これに対して本発明で用いる遺伝子発現頻度解析技術は遺伝子の5’側の配列に焦点をあてたもので個々の遺伝子の発現様式をより生体内に近い状態で忠実に再現できる遺伝子発現頻度解析技術であると言える。
実施例1に示した様々な組織・細胞より、全長率の非常に高いcDNAライブラリーを作製し、各ライブラリーからcDNAクローンを無作為に選択して、その5'末端領域の配列を決定しデータベース化した。本データベースは1,402,069個のクローンの塩基配列をデータベース化したものであり、解析母数としては十分なデータベースである。以下に解析に用いたライブラリーと5'末端領域の配列を解析したcDNAのクローン数および各ライブラリー中の1配列の重み値(100を各ライブラリー中の解析配列数で割った値)の関係を示す。
[表13]
----------------------------------------------
ライブラリー名 5'末端領域解析 1配列の重み値
クローン数 (100/配列数)
----------------------------------------------
3NB69 8182 0.012221951
ACTVT 684 0.14619883
ADIPS 614 0.16286645
ADRGL 10300 0.009708738
AHMSC 671 0.149031297
ASTRO 17226 0.005805178
BEAST 2736 0.036549708
BGGI1 1904 0.052521008
BLADE 8503 0.011760555
BNGH4 7739 0.012921566
BRACE 84087 0.001189244
BRALZ 16517 0.006054368
BRAMY 59232 0.001688277
BRASW 158 0.632911392
BRAWH 59682 0.001675547
BRCAN 26014 0.003844084
BRCOC 16847 0.005935775
BRHIP 58498 0.00170946
BRSSN 16035 0.006236358
BRSTN 16552 0.006041566
BRTHA 53818 0.001858114
CD34C 1421 0.070372977
CERVX 2888 0.034626039
CHONS 2694 0.037119525
COLON 8501 0.011763322
CORDB 711 0.140646976
CTONG 32043 0.003120806
D3OST 5112 0.019561815
D6OST 889 0.112485939
D9OST 4426 0.022593764
DFNES 10126 0.009874593
ERLTF 2178 0.045913682
FCBBF 32305 0.003095496
FEBRA 23941 0.004176935
FEHRT 2866 0.034891835
FEKID 2759 0.036245016
FELIV 186 0.537634409
FELNG 2775 0.036036036
HCASM 8989 0.011124708
HCHON 9432 0.010602205
HEART 8946 0.01117818
HELAC 680 0.147058824
HHDPC 8476 0.011798018
HLUNG 16272 0.006145526
HSYRA 7985 0.012523482
IMR32 16914 0.005912262
JCMLC 2171 0.046061723
KIDNE 17119 0.005841463
LIVER 6885 0.014524328
LYMPB 2630 0.038022814
MAMGL 184 0.543478261
MESAN 16095 0.00621311
MESTC 691 0.1447178
N1ESE 2628 0.03805175
NB9N4 1764 0.056689342
NCRRM 703 0.142247511
NCRRP 699 0.143061516
NESOP 2805 0.035650624
NETRP 9236 0.010827198
NHNPC 2392 0.04180602
NOVAR 2504 0.039936102
NT2NE 16468 0.006072383
NT2RI 32842 0.003044882
NT2RM 2074 0.048216008
NT2RP 24763 0.004038283
NTISM 181 0.552486188
NTONG 8098 0.012348728
OCBBF 48042 0.002081512
PANCR 182 0.549450549
PEBLM 7940 0.012594458
PERIC 8860 0.011286682
PLACE 33535 0.002981959
PROST 16829 0.005942124
PUAEN 10577 0.009454477
RECTM 2743 0.036456435
SALGL 185 0.540540541
SKMUS 8470 0.011806375
SKNMC 7656 0.013061651
SKNSH 8692 0.011504832
SMINT 16913 0.005912612
SPLEN 34307 0.002914857
STOMA 8770 0.011402509
SYNOV 27671 0.003613892
T1ESE 2687 0.037216226
TBAES 8484 0.011786893
TCERX 2828 0.035360679
TCOLN 2815 0.035523979
TESOP 8723 0.011463946
TESTI 91301 0.001095278
THYMU 71574 0.001397155
TKIDN 16123 0.00620232
TLIVE 8681 0.01151941
TLUNG 2884 0.034674064
TOVAR 2740 0.03649635
TRACH 53281 0.001876842
TSTOM 2779 0.035984167
TUTER 2678 0.037341299
UMVEN 633 0.157977883
UTERU 50040 0.001998401
---------------------------------------------
次にこのデータベースにある各クローンの塩基配列を、塩基配列の相同性検索プログラムによって相同な配列同士をカテゴライズし(クラスター化)、各クラスターに属する構成要素(5'末端領域解析クローン数)を各ライブラリー毎に集計し規格化することによって、ある遺伝子のcDNAライブラリー内での存在比を解析した。また塩基配列の相同性検索プログラムによって、このクラスターに本発明の全長cDNAを含む11クローンのうち以下の9クローンを帰属させた。BRACE3041162(配列番号2), THYMU3021586(配列番号3), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11)
以下、これらの9クローンを「クラスターに帰属した9クローン」と称する。
さらに帰属した遺伝子のcDNAライブラリー内での存在比に加えて、各ライブラリー中の1配列の重み値の合計値を計算した。例えばTHYMU3021586(配列番号3)というクローンでは、発現が見出されたライブラリーは発現解析の結果よりBRAMY、BRAWH、BRCOC、BRHIP、BRTHA、CTONG、TESTI、THYMU、TRACH、UTERUであるがそれぞれの1配列の重み値は表1より0.001688277、0.001675547、0.005935775、0.00170946、0.001858114、0.003120806、0.001095278、0.001397155、0.001876842、0.001998401となるので合計値は0.022355655となる。この数値はライブラリー全体における当該遺伝子の発現頻度の指標となり、この数値が大きいほど当該遺伝子の発現量が多いことを示す。以下にクラスターに帰属した9遺伝子のクローン名、1配列の重み値の合計値、クラスター名および各クラスターに属する5'末端領域解析クローン数の対応関係を示す。
[表14]
--------------------------------------------------
帰属クローン 1配列の重み値 クラスター クラスター
名 の合計値 名 構成
クローン数
--------------------------------------------------
BRACE3041162 0.001189244 231432 1
THYMU3021586 0.022355655 80135 22
BRTHA3014000 0.001858114 242794 1
BRACE3034183 0.001189244 184775 1
FCBBF3020030 0.003095496 285116 1
BRHIP3007960 0.00170946 240423 1
BRTHA2026290 0.001858114 269857 1
BRTHA2026311 0.001858114 42711 1
TESTI4005322 0.001095278 179829 1
--------------------------------------------------
最後にこの解析によって、各cDNAライブラリーのソースとなっている実施例1に示した全ての組織および細胞で、本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子発現頻度情報を得た。以下に発現頻度を示す。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちBGGI1, BLADE, BNGH4, BRACE, BRALZ, BRAMY, BRASWの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表15]
-------------------------------------------------
クローン名//BGGI1//BLADE//BNGH4//BRACE//BRALZ//
BRAMY//BRASW
-------------------------------------------------
BRACE3041162(配列番号2)// 0 // 0 // 0 //
100 // 0 // 0 // 0
THYMU3021586(配列番号3)// 0 // 0 // 0 //
0 // 0 // 4.162 // 0
BRACE3034183(配列番号5)// 0 // 0 // 0 //
100 // 0 // 0 // 0
-------------------------------------------------
なお、BRTHA3014000(配列番号4), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11) の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちBRAWH, BRCAN, BRCOC, BRHIP, BRSSN, BRSTN, BRTHAの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表16]
-------------------------------------------------
クローン名//BRAWH//BRCAN//BRCOC//BRHIP//BRSSN//
BRSTN//BRTHA
-------------------------------------------------
THYMU3021586(配列番号3)// 20.651 // 0 //
14.632 // 16.855// 0 // 0 // 4.580
BRTHA3014000(配列番号4)// 0 // 0 // 0 //
0 // 0 // 0 // 100
BRHIP3007960(配列番号7)// 0 // 0 // 0 //
100 // 0 // 0 // 0
BRTHA2026290(配列番号8)// 0 // 0 // 0 //
0 // 0 // 0 // 100
BRTHA2026311(配列番号9)// 0 // 0 // 0 //
0 // 0 // 0 // 100
-------------------------------------------------
なお、BRACE3041162(配列番号2), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), TESTI4005322(配列番号11) の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちCD34C, CERVX, CHONS, COLON, CORDB, CTONGの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表17]
-------------------------------------------------
クローン名//CD34C//CERVX//CHONS//COLON//CORDB//
CTONG
-------------------------------------------------
THYMU3021586(配列番号3)// 0 // 0 // 0 // 0 //
0 // 7.693
-------------------------------------------------
なお、BRACE3041162(配列番号2), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11) の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちD3OST, D6OST, D9OST, DFNES, ERLTF, FCBBF, FEBRAの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表18]
-------------------------------------------------
クローン名//D3OST//D6OST//D9OST//DFNES//ERLTF//
FCBBF//FEBRA
-------------------------------------------------
FCBBF3020030(配列番号6)// 0 // 0 // 0 // 0 //
0 // 100 // 0
-------------------------------------------------
なお、BRACE3041162(配列番号2), BRACE3034183(配列番号5), THYMU3021586(配列番号3), BRTHA3014000(配列番号4), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11)の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちSYNOV, T1ESE, TBAES, TCERX, TCOLN, TESOP, TESTIの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表19]
------------------------------------------------
クローン名//SYNOV//T1ESE//TBAES//TCERX//TCOLN//
TESOP//TESTI
------------------------------------------------
THYMU3021586(配列番号3)// 0 // 0 // 0 // 0 //
0 // 0 // 8.100
TESTI4005322(配列番号11)// 0 // 0 // 0 // 0 //
0 // 0 // 100
------------------------------------------------
なお、BRACE3041162(配列番号2), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9)の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子のうちTHYMU, TKIDN, TLIVE, TLUNG, TOVAR, TRACH, TSTOMの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表20]
-------------------------------------------------
クローン名//THYMU//TKIDN//TLIVE//TLUNG//TOVAR//
TRACH//TSTOM
-------------------------------------------------
THYMU3021586(配列番号3)// 13.776 // 0 // 0 //
0 // 0 // 4.626 // 0
-------------------------------------------------
なお、BRACE3041162(配列番号2), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11)の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
本発明のcDNAを含むクラスターに帰属した9クローンのうちTUTER, UMVEN, UTERUの各ライブラリーにおいて発現が認められた遺伝子について以下に発現頻度解析の結果を示す。各数値は、全組織での発現量を100とした相対的な値であり、数値が大きいほど発現量が多いことを示す。
[表21]
------------------------------------------------
クローン名// TUTER// UMVEN// UTERU
------------------------------------------------
THYMU3021586(配列番号3)// 0 // 0.000 // 4.926
------------------------------------------------
なお、BRACE3041162(配列番号2), BRTHA3014000(配列番号4), BRACE3034183(配列番号5), FCBBF3020030(配列番号6), BRHIP3007960(配列番号7), BRTHA2026290(配列番号8), BRTHA2026311(配列番号9), TESTI4005322(配列番号11)の遺伝子は、上記各ライブラリーにおいて発現が認められなかった。
なお、本発明のcDNAを含むクラスターに帰属した9クローンの遺伝子は、いずれも3NB69, ACTVT, ADIPS, ADRGL, AHMSC, ASTRO, BEAST, FEHRT, FEKID, FELIV, FELNG, HCASM, HCHON, HEART, HELAC, HHDPC, HLUNG, HSYRA, IMR32, JCMLC, KIDNE, LIVER, LYMPB, MAMGL, MESAN, MESTC, N1ESE, NB9N4, NCRRM, NCRRP, NESOP, NETRP, NHNPC, NOVAR, NT2NE, NT2RI, NT2RM, NT2RP, NTISM, NTONG, OCBBF, PANCR, PEBLM, PERIC, PLACE, PROST, PUAEN, RECTM, SALGL, SKMUS, SKNMC, SKNSH, SMINT, SPLEN, STOMA, の各ライブラリーにおいて発現が認められなかった。
なお、本出願は、2003年2月14日付けの日本特許出願(特願2003−102207)に基づくものであり、その内容は本明細書に参照として取り込まれる。また、本明細書において引用された全ての先行技術文献も、参照として本明細書に取り込まれる。

Claims (15)

  1. 以下の(a)または(b)のタンパク質;
    (a)配列番号12〜22のいずれかに記載のアミノ酸配列からなるタンパク質、
    (b)配列番号12〜22のいずれかに記載のアミノ酸配列において1もしくは数個のアミノ酸が欠失、置換および/または付加されたアミノ酸配列からなり、かつ転写調節活性を有するタンパク質。
  2. 請求項1に記載のタンパク質をコードするDNA。
  3. 請求項1に記載のタンパク質をコードする完全長cDNA。
  4. 以下の(a)または(b)のいずれかのDNA;
    (a)配列番号1〜11のいずれかに記載の塩基配列を有するDNA、
    (b)配列番号1〜11のいずれかに記載の塩基配列において、1もしくは数個の塩基が欠失、置換および/または付加された塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
    (c)配列番号1〜11のいずれかに記載の塩基配列あるいはその相補配列を有するDNAをストリンジェントな条件下でハイブリダイズすることができる塩基配列を有し、かつ転写調節活性を有するタンパク質をコードするDNA。
  5. 請求項2〜4のいずれかに記載のDNAを含む組換えベクター。
  6. 請求項2〜4のいずれかに記載のDNAまたは請求項5に記載の組換えベクターを導入した遺伝子導入細胞または該細胞からなる個体。
  7. 請求項6に記載の細胞により産生される、請求項1に記載のタンパク質。
  8. 請求項2〜4のいずれかに記載のDNAの塩基配列中の連続した5〜100塩基と同じ配列を有するセンスオリゴヌクレオチド、当該センスオリゴヌクレオチドと相補的な配列を有するアンチセンスオリゴヌクレオチド、および、当該センスまたはアンチセンスオリゴヌクレオチドのオリゴヌクレオチド誘導体から成る群から選ばれるオリゴヌクレオチド。
  9. 請求項1または7に記載のタンパク質に特異的に結合する抗体あるいはその部分フラグメント。
  10. 抗体がモノクローナル抗体である請求項9に記載の抗体。
  11. モノクローナル抗体が請求項1または7に記載のタンパク質の転写調節活性を中和する作用を有することを特徴とする請求項10に記載の抗体。
  12. 請求項1または7に記載のタンパク質と被検物質を接触させ、該被検物質による該タンパク質が有する活性の変化を測定することを特徴とする、該タンパク質の活性調節物質のスクリーニング方法。
  13. 請求項1に記載のタンパク質をコードするDNAを発現する細胞または請求項6に記載の遺伝子導入細胞と被検物質を接触させ、該細胞に導入されているDNAの発現レベルの変化を検出することを特徴とする、該DNAの発現調節物質のスクリーニング方法。
  14. 請求項1に記載のタンパク質のアミノ酸配列から選択される少なくとも1以上のアミノ酸配列情報および/または請求項2〜4のいずれかに記載のDNAの塩基配列から選択される少なくとも1以上の塩基配列情報を保存したコンピュータ読み取り可能記録媒体。
  15. 請求項1に記載のタンパク質および/または請求項2〜4のいずれかに記載のDNAを結合させた担体。
JP2004037143A 2003-02-14 2004-02-13 新規タンパク質およびそれをコードするdna Pending JP2004261179A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004037143A JP2004261179A (ja) 2003-02-14 2004-02-13 新規タンパク質およびそれをコードするdna

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003102207 2003-02-14
JP2004037143A JP2004261179A (ja) 2003-02-14 2004-02-13 新規タンパク質およびそれをコードするdna

Publications (1)

Publication Number Publication Date
JP2004261179A true JP2004261179A (ja) 2004-09-24

Family

ID=33134333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004037143A Pending JP2004261179A (ja) 2003-02-14 2004-02-13 新規タンパク質およびそれをコードするdna

Country Status (1)

Country Link
JP (1) JP2004261179A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020230240A1 (ja) * 2019-05-13 2021-12-16 富士通株式会社 評価方法、評価プログラムおよび評価装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020230240A1 (ja) * 2019-05-13 2021-12-16 富士通株式会社 評価方法、評価プログラムおよび評価装置
JP7188573B2 (ja) 2019-05-13 2022-12-13 富士通株式会社 評価方法、評価プログラムおよび評価装置

Similar Documents

Publication Publication Date Title
Rouhana et al. Vertebrate GLD2 poly (A) polymerases in the germline and the brain
Imai et al. The neural RNA-binding protein Musashi1 translationally regulates mammalian numb gene expression by interacting with its mRNA
Olave et al. Identification of a polymorphic, neuron-specific chromatin remodeling complex
Shenk et al. Expression of Cnox-2, a HOM/HOX homeobox gene in hydra, is correlated with axial pattern formation
Wagner et al. The Drosophila melanogaster LEM-domain protein MAN1
Nakajima et al. Isolation of ON bipolar cell genes via hrGFP-coupled cell enrichment using the mGluR6 promoter
Haller et al. Structure, chromosomal localization and expression of the mouse regulator of G-protein signaling10 gene (mRGS10)
Muir et al. Integration of CREB and bHLH transcriptional signaling pathways through direct heterodimerization of the proteins: role in muscle and testis development
JP2004261179A (ja) 新規タンパク質およびそれをコードするdna
US5840532A (en) Neuronal bHLH-PAS domain proteins
US20050130151A1 (en) Method and identification of downstream mrna ligands to fmrp and their role in fragile x syndrome and associated disorders
JP2004008216A (ja) 新規な全長cDNA
US8153764B2 (en) Biomarker specific to brain/nerve or specific to neuronal differentiation
JP2005237384A5 (ja)
WO2004099408A1 (ja) 新規蛋白質およびそれをコードするdna
JP2005052101A (ja) 新規タンパク質およびそれをコードするdna
JP2005021093A (ja) 新規タンパク質およびそれをコードするdna
Shen et al. Identification of candidate genes at the corticoseptal boundary during development
JP2004229642A (ja) 新規タンパク質及びそれをコードするdna
WO2003089466A1 (fr) Nouvelles proteines et adn codant de celles-ci
WO2003089646A1 (fr) Proteines et adn codant ces proteines
WO2004074485A1 (ja) 新規タンパク質およびそれをコードするdna
JP2004229643A (ja) 新規タンパク質及びそれをコードするdna
JP2004229649A (ja) 新規タンパク質及びそれをコードするdna
JP2005237384A (ja) 新規な全長cDNA

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050323

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050523