JP2004533223A

JP2004533223A - 生理学的または病態生理学的プロセスに関連するゲノムおよびプロテオーム経路のアソシエーション法

Info

Publication number: JP2004533223A
Application number: JP2002571921A
Authority: JP
Inventors: ハッツィス，クリストス; プラカッシュ，パンカージ; ジー．バビッシュ，ジョン; エム．パシオレッティー，リンダ
Original assignee: アッシュニナチュラシューティカルズ，インコーポレイティド; シリコインサイツ
Priority date: 2001-03-13
Filing date: 2002-03-13
Publication date: 2004-11-04
Also published as: WO2002072871A2; EP1380001A2; WO2002072871A3; CA2441060A1; US20030124548A1

Abstract

本発明は、細胞中で生成された遺伝子発現を決定すること；
細胞中で生成されたタンパク質修飾を決定すること及び細胞中で生成された遺伝子発現及びタンパク質修飾を調和させることによって、細胞中の遺伝子発現とタンパク質修飾の間の関係を同定する方法を提供している。同様に本発明により提供されているのは、遺伝子発現とタンパク質修飾の間のこのような関係を同定するためのコンピュータシステムである。本発明の方法及びコンピュータシステムは、代謝経路を含めたさまざまな生理的又は病態生理学的プロセスを調査するため、異常細胞の型別判定のため及びテスト材料の生物学的活性の同定のために有用である。

Description

【技術分野】
【０００１】
発明の分野
本発明は、一般に機能的ゲノム学 (genomics) およびプロテオーム学(proteomics) に関し、さらに詳しくは、遺伝子およびタンパク質のデータをアソシエートする方法に関する。
【背景技術】
【０００２】
発明の背景
ヒトゲノム全体の最近の配列決定およびデータベース中の非常に大きい量のDNA配列の蓄積を使用して、ゲノムの完全な配列を単に有することは生物学的機能または病理学を解明するために不十分であることを研究者らは認識しつつある。ヒトゲノム中に埋もれた情報を使用して、(1) 各組織における細胞の特性に対して主要な遺伝子を同定し、(2) 特定の細胞経路における遺伝子間の関係を明らかにし、(3) 生理学的包括的規模で遺伝子のモチーフを検査し、(4) 古典的組織学を補足し、かつ疾患の発生を予測するために発現パターンを使用して腫瘍を型別し、(5) 病理学的状態に対する薬剤の衝撃をモニターし、および／または治療の潜在的毒物学的に作用を評価する。
【０００３】
細胞は、通常、恒常性ならびに生存の両方のために多数の代謝および調節経路に依存する。遺伝子発現と細胞のタンパク質補体またはプロテオームとの間に厳格な直線的関係は存在しない。
【０００４】
細胞において、DNA、RNAおよびタンパク質の合成間の複雑な関係は環状であり、第1図に表すように図解することができる。DNAはRNA合成を指令し、次いでRNAはタンパク質合成を指令する；特別のタンパク質はRNAおよびDNAの両方の合成および分解を触媒し、調節する。この情報のサイクル的流れはすべての細胞において起こり、分子生物学の「セントラルドグマ」と呼ばれてきている。タンパク質は細胞機構の活性な作業構成成分である。DNAはタンパク質合成の情報を貯蔵し、RNAはDNA中にコードされたインストラクションを実施するが、タンパク質は大部分の生物学的活動を実施する；それらの合成および究極的構造は細胞機能の中心に存在する。
【０００５】
メッセンジャーRNA (mRNA) は、アミノ酸配列を特定するヌクレオチド塩基配列の形態でDNAからコピーされた遺伝情報をコードする。mRNAの形態の遺伝情報を発現するプロセスは転写と命名される。他方において、翻訳はアミノ酸をタンパク質の特定の線状配列に序列し、結合するためにmRNAの塩基配列が使用する全手順を意味する；生ずる一次アミノ酸配列はタンパク質構造の初期の決定因子である。
【０００６】
細胞の同一性および機能は転写および翻訳の両方の調節プロセスの直接的結果である。すべての細胞は同一の遺伝物質を有するので、転写調節は1つの細胞型を他と区別するために必要である。転写調節タンパク質、すなわち、DNA結合性タンパク質の1ファミリーは、遺伝子の発現をコントロールする。種々の酵素および構造タンパク質によるmRNAの合成、プロセシングおよび安定化は、遺伝子発現に対する追加のコントロールを提供する。
【０００７】
細胞により発生した種々の転写コントロールに加えて、タンパク質の究極的機能は、タンパク質の構造、それゆえ機能に影響を与える、いくつかの翻訳後のプロセスに依存する。タンパク質分解プロセシングを使用して、一次タンパク質生成物から仕上げられたタンパク質生成物を生成する。他の翻訳後の変更は、(1) ファミシル化、リン酸化および脱リン酸化、(2) ホモまたはヘテロマーの複合体を形成するタンパク質−タンパク質の相互作用、および (3) 細胞内隔室転位を包含する。
【０００８】
ゲノム学およびプロテオーム学の方法
遺伝子構造および遺伝子発現を理解するためにバイオテクノロジーを適用することは、ゲノム学と定義される。現在、分子生物学において最も活動的な領域の1つ、ゲノム学は、ヒトゲノムの組成および転写コントロール関係する情報を大量に提供している。ゲノム学において根源的仮定は、mRNAにより測定した遺伝子発現がタンパク質の発現および機能の正確なインジケーターであるということである。しかしながら、mRNAの存在量およびタンパク質の発現との間の関係は、このアソシエーションが0.5より少ないことを示した。
【０００９】
成熟した機能的タンパク質の転写と存在との間のアソシエーションが低いために、細胞におけるタンパク質発現の測定に特に集中される、
【００１０】
ゲノム学のサブセット (プロテオーム学と呼ぶ) が開発された。細胞のタンパク質を測定する方法は、一般に、労力を必要し、核酸を分析する方法のように、高い処理量を提供するように変更されてきていない。したがって、プロテオーム学の研究はゲノム学の研究よりも非常に遅れている。高い処理量の技術は細胞を外因的因子に対して露出した後、転写変化に関するデータベースの発生を可能としたが、外因的因子がタンパク質発現および翻訳後の変更を混乱する方法に関する知識の現在の状態は、この分野における専門家でさえどんな変化が起こるかを推定できないようなものである。
【００１１】
細胞は、通常、恒常性および順応反応の代謝および調節の多数の経路に依存する。細胞の遺伝子発現とタンパク質補体との間に厳格な関係が存在しないので、任意の生物学的プロセスにおいて重大な細胞経路を明らかにするために、遺伝子発現およびタンパク質発現の両方を必要とする。プロテオーム学は、遺伝子座において活性因子である遺伝子産物に集中するので、ゲノム学に対して相補的である。
【００１２】
プロテオーム学は、通常生化学的方法による、タンパク質の大規模研究である。プロテオーム学という語は、二次元のポリアクリルアミドゲル上で所定の細胞系統または生物から多数のタンパク質を展示することに伝統的に関係付けられてきている。しかしながら、このようなゲルを実験室間で再現可能に展開させることができるときでさえ、タンパク質の同一性の決定は困難である。ゲノム学後の時代において、タンパク質の同定は下記のものを包含する多数の実験室の技術により影響を受けることがある：(1) 一次元ゲル (アフィニティー精製を含むか、あるいは含まない)、(2) 二次元ゲル、(3) 抗体で被覆されたマイクロチップ、(4) 溶液中の非変性タンパク質／タンパク質複合体、(5) 翻訳後の修飾、例えば、リン酸化またはグリコシル化、(6) 酵素活性の機能的アッセイ、(7) サイトカインまたはレセプター／リガンドの結合についてのバイオアッセイ、(8) 細胞内のタンパク質の局在化、(9) 大規模マウスノックアウト、(10) RNAインターフェレンス、(11) 機能的タンパク質についての大規模動物アッセイ、および (12) 二次元ゲルによる示差的展示。
【００１３】
その上、学究的および商業的関心はゲノムからプロテオームに動いている。この動きについて3つの理由が存在する。第1に、強調が新たな配列決定から拡張しているので、自動化配列決定は成熟に到達している。高い処理量の自動化DNA配列決定技術は、複雑なゲノムの配列決定を可能とした。第2に、遺伝子発現およびタンパク質相互作用の理解はゲノム学よりも重要である可能性がある。研究者らはタンパク質が発現される方法および程度について知りたいと思っている。前に示すように、DNAの発現は文字通り話の半分である。一般に、変更されたタンパク質およびタンパク質発現は疾患のメカニズムの理解に対して重要である。最後に、プロテオーム学はゲノム学よりも適用範囲を広くするであろう。学究的研究および進展の新しい領域に加えて、するプロテオーム学は薬剤の発見、臨床前の研究、臨床的研究、臨床的診断、獣医学、法医学、農芸化学およびナチュラシューティカル(naturaceuticals) に有意に影響を与えるであろう。
【００１４】
情報の管理
ゲノム学およびプロテオーム学のデータの統合に対する中心は、各方法の特徴を示す大きいデータの組に対する複雑なデータの取扱いおよび生物情報技術の適用である。
【００１５】
ほぼ35,000のヒト遺伝子天然に存在する遺伝子発現パターンを特性決定する努力は、既に大きいデータベースを生成しつつある。いくつかの推定によれば、3〜5年において、10⁵データベースが完全なヒトゲノムの包括的な遺伝子発現パターンの解析のために入手可能であろう。しかしながら、ゲノム学規模の遺伝子発現およびプロテオーム学研究から収集されたデータを解析し、解釈させることができるシステムはなお初期の段階にある。このようなシステムは、組織を横切る個々の遺伝子の発現挙動、発生および病理学的状態、または細胞混乱に対する応答の比較を可能とするであろう。これらの解析を可能とするために、データ貯蔵システムは下記を支持することが必要である： (1) データのクリーニングおよび確認、(2) 多数の源からのデータの統合、(3) データベース、例えば、Gene Expression Markup Language (GEML) を横切って同様に命名した分野の内容物を標準化する終始一貫したデータモデル。
【００１６】
ゲノム学データを解析する統計的方法
cDNAおよびオリゴヌクレオチドのマイクロアレイ技術の出現は、生物学的研究における範例シフトに導き、こうして研究の傷害をデータ収集からデータ解析にシフトしている。遺伝的調節ネットワークの複雑さを考慮すると、発現パターンの予測的解析はゲノム幅の規模において不可能である。事実、典型的には試験的解析を使用して、データ中の任意の非ランダムパターンまたは構造を認識し、次いでこれらはドメインの知識に基づいて説明される。
【００１７】
最近、このデータの塊を解釈するために、いくつかの試験的技術が使用されてきている。最も普通の技術の間で、ボトムアップ式階層クラスターアルゴリズムは包括的な対方法の比較を使用して、同様に発現された遺伝子を決定する。これらはアルゴリズムの結果は直覚的方法で表示されるが、低いスケーラビリティ、多数の小さいクラスターを生成する傾向、およびアルゴリズムの凝集特質のための包括的最適化の欠如を包含する多数の制限は大きい複雑なデータベースの解析における適用性を制限する。トップダウン式クラスターアルゴリズム、例えば、k−平均クラスター、混合物成分、および支持ベクターメカニズムは包括的に最適なクラスター構造を生成し、また以前の知識を組込んでクラスタープロセスをバイアスすることができる。しかしながら、それらの適用はアルゴリズムを養成するためにクラスター中心番号または以前の例の規格を必要とする。最後に、プロジェクトクラスター法、例えば、主成分の分析、多次元スケーリングおよび自己構築マップは重複する情報を排除するという利点を有し、そして計算的に効率よいが、より低い次元に対するプロジェクトが生物学的に無意味である場合、結果は解釈が困難であろう。
【００１８】
特に遺伝子発現データを解析するために、新しいクラスのクラスター技術が開発された。これらののうちで、遺伝子シェービングは2方向のクラスターのために最適化されており、例えば、最も交差した条件を変化させる遺伝子を発見するために適用できる。アルゴリズムの最も有望なクラスは格子柄クラスターモデルであり、これは多数の遺伝子産物の多機能的特質をいっそう現実的に反映する多クラスターにおけるオーバーラッピングクラスターおよびメンバーシップを可能とする。
【００１９】
プロテオーム学データを解析する統計的方法
多分大規模プロテオーム学データベースの入手可能性が制限されるために、プロテオーム学的パターンを解析する方法はまだ十分に開発されていない。試験的レベルにおいて、遺伝子発現の解析において使用されている同一方法を使用してプロテオーム学のプロファイルにおけるパターンを検出することができるであろう。次いで、タンパク質間の調節的相互作用を時間解明された測定値から推定し、そしてBooleanモデルに基づく遺伝的ネットワークの簡単な表示を使用して捕捉することができる。
【００２０】
したがって、遺伝子発現データは、生理学的適合、病原論または生体内異物に対する暴露のための細胞変化を正確に特性決定するために必要な情報のわずかに一部分である。細胞とその環境との間の関係を完全に理解するために、遺伝子発現のプロファイルを決定しなくてはならない；タンパク質発現およびタンパク質の関連した翻訳後の修飾を記載しなくてはならない；そして遺伝子発現およびタンパク質のプロセシングの両方における変化を調和させなくてはならない。その上、多数の細胞経路の相対的掛かり合いおよび相互作用の急速な同定を可能とするために、遺伝子発現とタンパク質のプロセシングとの間のアソシエーションを提示しなくてはならない。この時点において、このようなプロセスおよび方法は文献に記載されてきていない。
【００２１】
恒常性および病態生理学的に関係する遺伝的およびプロテオーム学的経路を同定する理想的方法は情報を提供すると同時に、遺伝子発現アレイおよびプロテオーム学的変化の両方を提供するであろう。必要に応じて、この手順は発生させた情報の富を生物学的に関係しかつ理解容易な要約された統計量に凝縮するであろう。さらに、このプロセスは、遺伝子発現アレイを測定する技術ならびにタンパク質をプロセシングする技術に適用可能であろう。
【発明の開示】
【００２２】
発明の要約
【００２３】
本発明は、細胞において発生した遺伝子発現を決定し、細胞において発生したタンパク質の修飾を決定し、そして細胞において発生した遺伝子発現またはタンパク質の修飾を調和させることによって、細胞における遺伝子発現とタンパク質の修飾との間の関係を同定する方法を提供する。また、本発明は、下記の構成成分を有する遺伝子発現とタンパク質の修飾との間の関係を同定するコンピュータシステムを提供する：(1) 遺伝子発現のデータおよびタンパク質の修飾に関するデータの記録を包含するデータベース、(2) 遺伝子発現のデータおよびタンパク質の修飾に関するデータを統計的に解析する1または2以上のアルゴリズム、(3) 統計的に解析された遺伝子発現のデータおよびタンパク質の修飾に関するデータを調和させる1または2以上のアルゴリズム、(4) アルゴリズムからの出力および提示のためのシステム、(5) データベースおよび結果を指示し、格納する保存システム、および (6) データベースおよび結果を取出すための照会システム。
【００２４】
発明の詳細な説明
細胞に対する特性決定されない混乱の衝撃を確認することは、生物学において基本的問題である。本発明は、多数の複雑な細胞の機能および相互作用を測定し、モデル化する方法に関する。参照遺伝子またはタンパク質発現のデータベースを構築すること、または以前に発生した発現ライブラリーを参照することは不必要である。
【００２５】
したがって、本発明は、機能的に関係する代謝ネットワーク、プロテオームの変更またはシグナリング経路を同定する方法を提供する。本発明は、タンパク質およびタンパク質プロセシングの機能的面、例えば、リン酸化、ファミシル化、メチル化、および任意の翻訳後のプロセシングならびに細胞下局在化および細胞内を包含し、そして以前のモデル化システムの欠点を克服する。
【００２６】
さらに、本発明は、生物学細胞内の遺伝子発現を識別することができる、数百〜数千の遺伝子から構成された、遺伝子アレイを使用することを含んでなる、遺伝子発現を同定する方法に関する。
【００２７】
さらに、この方法は遺伝子発現を測定し、タンパク質およびタンパク質プロセシングを定量する、種々の技術に適用可能である。例えば、普通の測定技術、例えば、1または2次元ゲルの電気泳動を使用して、例えば、2,000またはそれより多いタンパク質のデータベースを発生させ、解析することができる。
【００２８】
さらに、本発明は、遺伝子およびタンパク質の発現または修飾を個々に解析する統計的手順を提供する。
【００２９】
これらの方法は、生物学的および統計的技術に有用なインターフェースを提供し、そして遺伝子発現およびタンパク質の情報の同定および定量を別々にまたは同時に可能とする。
【００３０】
本発明の態様において、遺伝子発現およびタンパク質プロセシング間の関連およびアソシエーションを決定するアルゴリズムが提供される。好ましい態様において、遺伝子発現アレイおよびタンパク質プロセシングからの実験データを結合された生物学的シグナリングまたは代謝経路として提示する。各関係において、細胞機能のすべての生物学的面を代表する任意に選択されたシグナリング経路のグループの間で、各シグナリング経路の相対的寄与を考察することができる、確率の陳述を含めることができる。
【００３１】
本発明は、また、被験物質または生物学的プロセスにより誘導された代謝的またはシグナリング変化を記載する方法に関し、この方法は真核生物細胞を被験物質に対して暴露し、被験した真核生物細胞を溶解し、細胞のDNAまたはmRNAおよびタンパク質を単離し、細胞タンパク質における遺伝子の発現および機能的変化の間の発生する関係を包含する、遺伝子およびタンパク質の発現データを使用して数学的クラスター解析を実行することを包含する。被験物質は単一の内分子または外分子または内分子と外分子との混合物であることができる。生理学的プロセスは細胞同期化、飢餓、老化または接触阻害であることができる。
【００３２】
本発明は、いずれかの代謝経路を修飾する内因的因子、例えば、ホルモン、サイトカインおよび神経伝達物質に対する生物学的応答の最も確からしいネットワークを推定し、記載する、好ましくはコンピュータに基づく、解析システムを提供する。さらに、本発明は、生体内異物 (被験化合物)、例えば、薬剤、食物成分、環境的汚染物質およびトキシンに対する生物学的応答または生物活性の最も確からしいネットワークを推定し、記載する、再び好ましくはコンピュータに基づく、解析システムを提供する。この完全な計算プロセスは、真核生物細胞からの遺伝子およびタンパク質発現の発生についてシステム、および分子シグナリングの確からしい経路およびネットワークを示唆する遺伝子およびタンパク質のクラスターを同定することができる統計的技術から成るであろう。こうして、本発明は、例えば、薬剤設計、ゲノムおよびプロテオームの情報の適用、および化学的安全性の解析において使用できる、解析方法を提供する。
【００３３】
反復的包括的分配クラスターアルゴリズムおよびBayesian証拠分類を使用して、遺伝子、タンパク質、および同様な発現プロファイルを有する遺伝子およびタンパク質を同定し、特性決定する、遺伝子発現のプロファイルおよび／またはタンパク質の修飾または発現プロファイルが発生された。タンパク質発現は1または2次元の分離技術を使用して特性決定され、そしておよび翻訳後のプロセシングはタンパク質修飾の抗体または化学的検出、例えば、リン酸化、アセチル化、ファミシル化またはメチル化を使用して評価される。細胞のプロセシング技術、例えば、分別遠心を使用することもできる。
【００３４】
最後に、本発明は、上に同定した遺伝子およびタンパク質のクラスターからの分子シグナリングの確からしい経路およびネットワークを示唆することができる知識に基づく、統計的技術を使用する。
【００３５】
本発明は、プロセスの工程および物質を変化させることができるので、例示した特定の立体配置に限定されないことを理解すべきである。また、本発明の範囲は添付された特許請求の範囲およびその同等の態様によってのみ限定されるので、ここにおいて使用する技術は特定の態様を記載することを目的としてのみ使用され、制限を意図しないことを理解すべきである。
【００３６】
ことに注意しなくてはならない
本明細書および添付された特許請求の範囲において使用するとき、特記しない限り、単数の形態は複数を包含する。
【００３７】
本発明は、ある細胞内における遺伝子発現とプロテオーム修飾の関係を確認する方法に関連し、該方法は該細胞内で生じた遺伝子発現を判定するステップ、該細胞内で生じたプロテオーム修飾を判定するステップ、及び該遺伝子発現と該プロテオーム修飾を対応させるステップを含む。
【００３８】
本発明では、細胞が生理的変化をこうむるとき、もしくは化合物又は化合物類の混合物に接触するときに、細胞タンパク質に影響を及ぼす構造的変化のタイプ及び量を相関させて、変化を遺伝子とタンパク質の間に、また既定シグナル経路沿いのタンパク質間に対応させることを目指す。さらに本発明では、真核細胞タンパク質及びそれらのタンパク質が機能する場であるシグナル経路で観測される構造的変化のタイプと量が再現可能である。これが意味するのは、生理的変化の量又はある化合物又は化合物類の抽出物又は混合物の生物活性又は薬理活性の量が、細胞タンパク質中に誘発された構造的変化を定量し、それらが機能する場であるシグナル経路への影響をin vivoで、又は培養細胞中で調べることにより、測定できるということである。同様に、ある化合物又は数種の化合物の抽出物又は混合物の製剤の活性を、別の製剤たとえば対照製剤の活性と比較することもできる。
【００３９】
本発明の方法はまた、1つ又は複数の試験対象物の生物活性の確認に資する。そうした確認は細胞を1つ又は複数の試験対象物に接触させ、その1つ又は複数の試験対象物との接触に反応して細胞内に生じる遺伝子発現とタンパク質修飾の間の関係を本発明の方法によって確認することによって行うことができる。
【００４０】
本発明の恩典の1つは、生物活性又は薬理活性のこうした評価が1つ又は複数の化合物、化合物類の混合物を対象に、多様な生理的条件の下で、該活性をもたらす成分を同定する必要もなく、実行できるという点にある。本発明の方法を使用すれば、化合物の組み合わせについても比較することができる。従って本発明は、単独ではほとんど又はまったく活性を示さないが、他成分と組み合せると顕著な活性を示す1つ又は複数の成分を含むような複雑な混合物の活性を評価するうえで特に有効である。
【００４１】
従って本発明の一実施態様は、真核細胞内のタンパク質中に誘発される構造的変化が遺伝子発現の変化に対応するかどうかを評価することにより試験対象物の生物活性を明らかにする又は生理的変化を記述する方法に関連する。細胞の機能的特性は細胞タンパク質の状態を解析することにより評価することができる。
【００４２】
別の実施態様では、本発明の方法を利用して代謝経路を調べることができる。そのためには、代謝経路に関与する作用物質に細胞を接触させ、該作用物質に反応して細胞内で生じる遺伝子発現とタンパク質修飾の関係を本発明の方法により確認する。本発明との関連では代謝経路を変化させる任意好適の作用物質が使用可能である。この実施態様に使用する作用物質は、その物質を接触させる当の細胞に内在する物質でも外来物質でもよい。さらに、これの方法を使用すれば任意の代謝経路を調べることができる。そうした検査については実施例で詳述する。実施例では、NIH 3T3マウス線維芽細胞の野生型株と突然変異株に接触させる作用物質としてマクロファージコロニー刺激因子(M-CSF)を使用する。M-CSFは受容体型チロシンキナーゼ経路を刺激するので、その代謝経路を調べる。
【００４３】
本発明は別の一実施態様では、試験対象物が細胞シグナル経路に影響を及ぼすかどうかを、試験対象物を培養哺乳動物細胞インキュベートして処置済み試験細胞を生成し、該処置済み試験細胞を溶解し、遺伝子発現とタンパク質チロシンのリン酸化を評価し、また遺伝子とホスホチロシル・タンパク質のクラスターを確立し、遺伝子とホスホチロシル・タンパク質をクラスター・レベルで対応させることにより、評価する。クラスター分析の結果は、試験対象物への接触の結果としての特定生体分子の間又は周りの経路を連結するモデルの生成に使用する。これらの経路結果は、試験対象物と接触させていない対照細胞と比較することができる。あるいは、対照細胞は静止期すなわち非分裂状態にある培養哺乳動物細胞でもよい。また対照細胞は生理的応答をまったく示さないか、又は処置済み試験細胞とは異なる生理的応答を示すような処置済み細胞でもよい。
【００４４】
本発明の方法はまた、異常細胞のタイプの判定にも使用することができる。この実施態様では、本発明の方法に従って異常細胞内の遺伝子発現とタンパク質修飾の関係を確認する。次いで、対応する正常細胞内の遺伝子発現とタンパク質修飾の関係を、やはり本発明の方法に従って確認する。最後に異常細胞内の遺伝子発現とタンパク質修飾の対応関係を正常細胞内のそれと比較する。このようにして任意のタイプの異常細胞を検査する。たとえばがん細胞を検査して、種々の臨床マーカー並びに種々の潜在的治療ターゲットを探すことができる。
【００４５】
本発明では任意の初代培養細胞又は不死化細胞株を使用してよい。本書でいう初代培養細胞の例は任意の組織標本たとえばメサンギウム、胚、脳、肺、乳房、子宮、子宮頚部、卵巣、前立腺、副腎皮質、皮膚、血液、膀胱、胃腸、結腸及び関連組織に由来するがん細胞又は非がん細胞などである。本発明の方法に使用することができる不死化哺乳動物細胞株の例はヒトLNCaP前立腺、ヒトHeLa、結腸201、神経芽細胞腫、網膜芽細胞腫、及びKB細胞株、それにマウス3T3、L及びMPC細胞株などである。不死化細胞株は公認の細胞資源提供機関たとえばAmerican Tupe Culture Collectionなどから入手してもよい。細胞はまた、処置済み又は接触済みのヒト、マウス、イヌ、ヒト以外の霊長類、又は他の動物から採取してもよい。
【００４６】
遺伝子発現の判定又は遺伝子発現解析には周知の様々な好適手法から任意のものを選んで用いてよい。そうした方法の例はマイクロチップ遺伝子アレイ法、ノーザンブロット遺伝子転写解析法、又は化学修飾核酸解析法などである。さらに、遺伝子発現の系統解析(SAGE)によって遺伝子発現を判定してもよい。一般的にはYamamoto et al., J. Immunol. Methods, 250(1-2):45-66 (Apr.2001)を参照。
【００４７】
たとえば試験真核細胞からmRNA(〜1μg)を抽出し、T7連結オリゴ(dT)プライマーを使用して1本目のcDNA鎖を生成させる。2本目のDNA鎖を合成した後、ビオチン化UTP及びCTP(Enzo Diagnostics)を使用してin vitro転写(Ambion)を行い、RNAを40〜80倍に線形増幅させる。40μgのビオチン化RNAを50〜150ntサイズに断片化した後、Affymetrix (Santa Clara, CA) HU6000アレイと一晩インキュベートする。アレイは6,416個のヒト遺伝子[5,223個の既知遺伝子と1,193個の発現配列タグ(EST)]に対応するプローブセットを含んでいる。一部の遺伝子に対応するプローブセットはアレイ上に2回以上存在するため、アレイ上のその総数は7,227である。洗浄後、アレイをストレプトアビジン-フィコエリトリン(Molecular Probes)で染色し、Hewlett Packardスキャナーで走査する。強度値は、同タイプの各チップに対応する全強度が等しくなるようにスケール調整をする。GENECHIP SOFTWARE (Affymetrix, Santa Clara, CA)を使用してアレイの各スポットに対応する強度を記録し、切り落とし平均アルゴリズムを使用して書く遺伝子を表す20プローブペアから各遺伝子に対応する単一生発現レベルを導き出す。20単位の閾値を、計算発現レベルが20未満のすべての遺伝子に割り当てる。このレベルを下回る発現の識別を行ってもこの方法では信頼性を欠くためである。
【００４８】
試験細胞についての遺伝子発現を確立した後、遺伝子発現プロファイルを適当な統計学的分析方法、例えば反復グローバル分配クラスタリングアルゴリズム及びbayesian証拠分類を利用して分析し、類似の発現プロファイルを有する遺伝子のクラスターを同定及び特性決定した。例えば、Long et al. J．Biol．Chem．276(23): 19937-44(Jun 2001)を参照のこと。任意の適当なクラスタリングアルゴリズム、例えば過去に発表された様々なクラスタリングアルゴリスム及び方法が本発明において利用できる。
【００４９】
この統計学的分析に包含されるステップは（１）遺伝子のフォルディング誘導（log比）の決定、（２）遺伝子プロファイルの１に等しい倍率への標準化、（３）固有クラスタリングパターンを決定するための測定した遺伝子全ての分配クラスタリング、（４）集団−平均プロファイルとの対比におけるその発現を基礎に下記の亜群に至る各試験集団の差別化：初期アップレギュレーション、後期アップレギュレーション、ダウンレギュレーション、その他、（５）細胞の試験集団における初期アップレギュレーション及びダウンレギュレーションクラスラー亜群における共通遺伝子の開拓のための比較分析の実施、及び（６）細胞の試験集団における亜群間の違い及び類似性を決定するためのPearson相関係数に基づく相関である。
【００５０】
本発明の方法に従うと、タンパク質修飾（プロテオミックス）はメッセンジャーRNAレベルではなく、タンパク質レベルにて発現を検出及び定量することによる遺伝子活性の定量及び定性測定を包含する。タンパク質修飾は非ゲノムコード化事象、例えばタンパク質の後翻訳修飾（ホスホリル化、グリコシル化、メチル化、及び／又はファーンシル化（farnsylationなど)）、タンパク質間の相互作用、及び細胞内のタンパク質の位置決定も含んでよい。細胞により発現されるタンパク質の構造、機能、発現レベルも注目される。ホ名質的に、タンパク質修飾は細胞内に含まれる又は分泌される総タンパク質の状態の一部又は全てを包含する。
【００５１】
本発明によれば、このような変化が細胞タンパク質において起こっているかどうかを調べるには、細胞タンパク質における翻訳後変化を研究する任意の方法が使用できる。このような変化としては、例えば、タンパク質の量、タンパク質-タンパク質相互作用、共有結合の変化なども挙げられる。試験材料に曝露することによってテストした哺乳類の細胞の細胞タンパク質における機能変化および構造変化の性質や程度は、当業者が利用できる任意の方法で明らかにすることができる。
【００５２】
したがって、タンパク質の修飾を明らかにするのに適切な任意の方法を用いることができる。タンパク質の修飾は、一次元ゲル電気泳動（アフィニティ精製あり、またはなし）、二次元ゲルによる示差表示、抗体でコーティングしたマイクロチップ、酵素活性の機能アッセイ、サイトカインまたは受容体／リガンドの結合を調べるバイオアッセイを利用することによっても明らかにすることができる。タンパク質の修飾は、溶液中で変性していないタンパク質／タンパク質複合体を同定すること、細胞内でタンパク質の位置を特定すること、機能性タンパク質を探す大規模な動物アッセイを行なうことによって明らかにすることができる。
【００５３】
適切な方法としては、さらに、同位体でコードされたアフィニティ・タグ、タンパク質チップ、微小流体工学、ゲル電気泳動における差などが挙げられる。同位体でコードされたアフィニティ・タグを用いると、2つの異なるサンプル中の特定のタンパク質に対して区別できる重い同位体と軽い同位体を化学的に取り付けることができる。質量分析器で相対量を追跡することにより、タンパク質発現の変化を定量的に測定することができる。タンパク質チップの表面には、特定のタンパク質を特定の位置で捕獲するため、分子をチェス板のようなグリッドに配置する。蛍光プローブその他の検出手段を用いると、タンパク質がグリッド上のどの場所に結合しているかがわかる。グリッド上の各スポットにおけるプローブがどのようなものかがわかっているため、こうするとどのタンパク質が捕獲されたかが明らかになる。微小流体工学では、質量分析その他の分析装置によって分析するためのタンパク質サンプルを調製するのに必要な一連のステップを実行するためにサンプル・ホルダー、チャネル、反応チェンバーのネットワークが形成されるように加工した、シリコン、ガラス、プラスチックのチップが開発されている。チップは、迅速にしかも非常に少量のサンプルでの作業が可能であるため、プロテオミクスの分析の速度と感度を劇的に改善する可能性がある。最後に、ゲル電気泳動における差を利用すると、2つのサンプル間でタンパク質発現の変化がどのようなものであるかの全体像が明らかになる。1つのサンプルからのすべてのタンパク質に単一の蛍光性化合物をタグとして付着させ、別のサンプルからのタンパク質には別の色の蛍光性染料をタグとして付着させる。次に、これら2つのサンプルを混合し、単一の二次元ゲル上で個々のタンパク質を分離する。こうすると、タンパク質が、その電荷によって一方向に分離され、その分子量によって垂直な方向に分離される。ゲルをちょっと眺めるだけで、分離したスポットが両方の色を示しているかどうか、あるいは単に一色だけなのかが明らかになる。一色の場合は、どのサンプルがタンパク質を捕獲したのかを示している。
【００５４】
特別な一実施例では、機能が変化した可能性のあるタンパク質のタイプを同定するため、真核細胞のテスト用ポピュレーションからなる細胞ライセートを変性条件または非変性条件のいずれかで分離することができる。非変性条件は、タンパク質-タンパク質相互作用を観察するのに利用される。変性条件にすると、個々のタンパク質の同定を再現することが容易にできる。そのためタンパク質のリン酸化のタイプと量における変化を同定するのに好ましい。タンパク質-タンパク質複合体と個々のタンパク質の両方を分離することは、利用可能なあらゆるクロマトグラフィ法または電気泳動法によって実現できる。例えば細胞タンパク質は、ゲル排除クロマトグラフィ、逆相クロマトグラフィ、電気泳動（一次元または二次元）などの方法を利用し、サイズおよび／または電荷で分離することができる。例えば、サムブルック他、『分子クローニング：実験室マニュアル』、第1〜3巻（コールド・スプリング・ハーバー出版、ニューヨーク、1989年）を参照のこと。
【００５５】
分離後、機能（構造）が変化した可能性のある細胞タンパク質は、従来技術で利用可能な任意の方法で可視化することができる。タンパク質を可視化するための方法および試薬は従来技術において周知であり、例えば、タンパク質と結合する染料で染色することや、レポーター分子に共有結合した抗体とタンパク質を反応させることが挙げられる。リン酸化されたタンパク質は、細胞タンパク質を、そのタンパク質の中に存在するリン酸化されたセリン、トレオニン、チロシンといったアミノ酸に向かうモノクローナル抗体と反応させることによって可視化できる。例えばホスホチロシンを含むタンパク質を分離し同定するのに有効なモノクローナル抗体は、フラケルトンらに付与されたアメリカ合衆国特許第4,53,439号（1985年9月24日）と、シーヴンらの「系統特異的なB細胞のアポトーシスの誘導と、ホスホチロシン・ホスファターゼ・インヒビター・ビス（マルトラト）オキソバナジウム（IV）による変化したシグナル伝達」、J. Biol. Chem.、第270巻、20824ページ、1985年に記載されている。これら参考文献に記載されている方法と試薬は、当業者であれば本発明の方法を実施できるように容易に変更することができる。
【００５６】
細胞タンパク質を可視化するために用いる抗体は、従来技術で知られている任意の方法で標識することができる。例えば、共有結合などの方法によって“レポーター分子”を抗体または抗体検出媒体に組み込む。
【００５７】
この明細書では、レポーター分子は、抗体が結合相手となるタンパク質と結合したときに分析によって同定可能なシグナルを出すため、そのシグナルを当業者が同定することのできる分子である。定性的な検出と定量的な検出が可能である。一般に用いられるレポーター分子としては、蛍光体、酵素、ビオチン、化学発光分子、生物発光分子、ジゴキシゲニン、アビジン、ストレプトアビジン、放射性同位体などが挙げられる。一般に用いられる酵素としては、セイヨウワサビのペルオキシダーゼ、アルカリホスファターゼ、グルコースオキシダーゼ、β-ガラクトシダーゼなどが挙げられる。これら酵素とともに用いられる基質は、一般に、対応する酵素による加水分解の際に検出可能な色彩変化が起こるものが選択される。例えば、レポーター分子であるアルカリホスファターゼとともに用いるにはリン酸p-ニトロフェニルが適切であり、セイヨウワサビのペルオキシダーゼに対しては、1,2-フェニルエチレンジアミン、5-アミノサリチル酸、トルイジンが適切である。レポーター分子を抗体表面に組み込むには、当業者に知られている任意の方法を用いることができる。
【００５８】
タンパク質を分離して可視化した後、各タンパク質の量を簡単に利用できる方法で評価することができる。例えば、タンパク質をポリアクリルアミド・ゲル上の電気泳動によって分離し、分離されたタンパク質を染色した後、その光学密度を評価することによって相対量を定量化することができる。
【００５９】
次に、機能性タンパク質の発現に関するデータ解析を、遺伝子発現のデータ解析と同様にして行なう。各タンパク質につき、まず最初に、バンドの強度を測定した結果を、時間プロファイル全体が大きさ1になるように規格化する。データは、それぞれの時刻におけるタンパク質のバンド全体が大きさ1になるように規格化することもできる。規格化したデータに分割k-平均クラスター化を適用する。各クラスター内のタンパク質について平均プロファイルを計算する。タンパク質のクラスターは、動的累積法に従い、前期リン酸化クラスターと後期リン酸化クラスターにグループ分けする。次に、例えばピアーソンの相関係数または2つのプロファイルのユークリッド距離などの類似性指標に基づいた連想解析により、プロテオミクス・クラスターと遺伝子発現クラスターの類似性を判定する。このようなデータを処理することには、当業者であればわかるように、遺伝子発現とタンパク質修飾の違い、類似性、関係を明らかにするための適切なあらゆるタイプの比較や解析が含まれよう。その結果、細胞内で起こっている活動をより完全に理解できることになる。
【００６０】
細胞内で発現が変化したタンパク質を同定するための現在知られている一般的な方法（例えば質量分析結果の解析）では、翻訳後修飾の同定結果を再現することが難しかったり、まったくできなかったりする。したがってその方法には、1つの実験において試験変数に関係した仮想的な細胞シグナル・ネットワークを同定するための十分な能力が欠けている。この問題は、ヒトゲノムのマッピングを完成させる際により劇的な形で理解された。例えば1つの遺伝子と1つのタンパク質の関係は、下等な生物では一般に当てはまるが、ヒトなどのより複雑な生物では、選択的スプライシングにより、現在のところヒトのゲノムに存在していると想定されている25,000〜35,000個の遺伝子から、極めて複雑なタンパク質群を作り出す。さらに、ヒトゲノムのほんの5％だけが、タンパク質を作る遺伝子を含んでいるとも考えられている。ヒトには150,000〜350,000個の機能性タンパク質が存在しているということを、最近のこれらの知見と合わせて考えると、タンパク質の機能評価が、試験条件に応答する代謝ネットワークまたはシグナル伝達ネットワークを明らかにする上で重要であることがはっきりとする。
【００６１】
本発明のさらに別の目的は、既知のタンパク質のデータセットを提供することである。そのデータセットの中には、例えば、分子量、既知の翻訳後プロセシング（リン酸化、メチル化、アセチル化、複合体の形成など）、機能カテゴリー（アポトーシス、細胞サイクルの調節、増殖、分泌、転写因子など）が含まれる。それぞれの機能カテゴリーについて、他のタンパク質との既知の相互作用も記録する。このデータセットは、最少で2,000個のタンパク質を含んでいる必要がある。
【００６２】
本発明によれば、シグナル伝達経路のネットワークは、すでに説明した遺伝子／タンパク質クラスター解析の結果をもとにしてタンパク質データベースを検索することにより推定できる。本発明の方法により、興味の対象である分子同士をつないでいる経路は、遺伝子／タンパク質クラスター解析において同定された分子の生物学的性質、機能、配列、構造をもとにして、機能性タンパク質のデータベースから再現することができる。再現された経路は、ノードや矢印からなるグラフとして表現される。それぞれのノードは、入力したクラスター解析の結果が機能的に一致していることを表わす。試験変数について特定の経路が関係していることの可能性を表現するため、確率グラフの全長にわたってクラスター解析の結果との一致度に関する確率を用いることができる。この表現方法は、グラフ表示において機能的ノード（データ・ヒット）を用いている点が従来技術と異なっている。
【００６３】
本発明によりさらに、遺伝子の発現とタンパク質の修飾の関係を同定するためのコンピュータ・システムが提供される。このようなコンピュータ・システムには、（1）遺伝子の発現データとタンパク質の修飾データに関する記録を含むデータベース、（2）遺伝子の発現データとタンパク質の修飾データを統計的に解析するための1つ以上のアルゴリズム、（3）統計的に解析した遺伝子の発現データとタンパク質の修飾データを結びつけるための1つ以上のアルゴリズム、（4）結果を出力し表示するためのシステム、（5）データベースと結果を再現するための照会システム、が含まれる。
【００６４】
本発明により、遺伝子の発現と機能性タンパク質の発現の関係を予測するコンピュータに基づいた別のシステムが提供される。このシステムは、以下のものを含んでいる。すなわち、（1）遺伝子の発現データとタンパク質の修飾データを記憶するためのデータベース管理システム、（2）個々の遺伝子とタンパク質に関する情報（染色体上の位置、機能、経路、リン酸化の状態など）を集積するデータベース・システム、（3）実験による偏りがある実験データを修正するためのアルゴリズム、（4）遺伝子の発現プロファイルと機能性タンパク質の発現プロファイルからパターンを抽出するための1つ以上のクラスター化アルゴリズム、（5）遺伝子の発現パターンと機能性タンパク質の発現パターンの関係を抽出するための1つ以上のアルゴリズム、（6）遺伝子の発現またはタンパク質の発現に関する応答から機能を明らかにするため、遺伝子の発現プロファイルに注釈をつけるためのアルゴリズム、（7）得られた関係を記憶するための収納所、（8）別々のパターン、関係、実験条件を再現するための照会システム、が含まれる。
【００６５】
以下の実施例は本発明を説明するためのものであり、本発明がこれら実施例に限定されることはない。
【００６６】
実施例
実施例1
この実施例は、繊維芽細胞内のリガンド刺激性受容体チロシンキナーゼ（RTKS）による誘導を示している。
【００６７】
受容体チロシンキナーゼ（RTK）は、細胞における重要な出来事（例えば有糸分裂、発生、損傷修復、発ガン）をトリガーする細胞外シグナルを伝達する。RTKは、リガンドに結合すると、さまざまな細胞内シグナル経路を活性化することによってこれらの応答を伝える。このようなシグナル伝達経路により、一群の“即時型初期遺伝子”（IEG）が転写される。IEG産物は、タンパク質の合成に依存した細胞プロセス（例えば細胞分裂）を開始させる。マウス繊維芽細胞NIH3T3の野生型の株と突然変異体の株を、さまざまな時刻にマクロファージコロニー刺激因子（M-CSF）を用いて刺激し、M-CSFによって活性化してシグナル伝達経路が誘導された遺伝子の発現を明らかにした。この研究の主な目的は、細胞内シグナル伝達経路同士のRTKを媒介とした相互作用の特徴を明らかにすることである。
【００６８】
実験方法
この実施例における実験では以下の装置を使用した。オハウス・エクスプロアラー社の天秤（オハウス・モデル#EO1140、スイス）、バイオセイフティ・キャビネット（フォルマ・モデル#F1214、マリエッタ、オハイオ州）、100〜1000μlのピペッタ（VWRカタログ#4000-208、ロチェスター、ニューヨーク州）、細胞用特注カウンター（VWRカタログ#23609-102、ロチェスター、ニューヨーク州）、CO2インキュベータ（フォルマ・モデル#F3210、マリエッタ、オハイオ州）、血球計算器（ハウサー・モデル#1492、ホーシャム、ペンシルベニア州）、倒立顕微鏡（ライカ・モデル#DM IL、ヴェツラー、ドイツ）、ピペット補助具（VWRカタログ#53498-103、ロチェスター、ニューヨーク州）、0.5〜10μlのピペッタ（VWRカタログ#4000-200、ロチェスター、ニューヨーク州）、100〜1000μlのピペッタ（VWRカタログ#4000-208、ロチェスター、ニューヨーク州）、2〜20μlのピペッタ（VWRカタログ#4000-202、ロチェスター、ニューヨーク州）、20〜200μlのピペッタ（VWRカタログ#4000-204、ロチェスター、ニューヨーク州）、ピュアラブ・プラス水研磨システム（U.S.フィルタ社、ローウェル、マサチューセッツ州）、4℃の冷蔵庫（フォルマ・モデル#F3775、マリエッタ、オハイオ州）、ボルテックス混合器（VWRカタログ#33994-306、ロチェスター、ニューヨーク州）、水洗バス（シェル・ラブ・モデル#1203、コルネリウス、オレゴン州）、1.7mlのマイクロフュージ管（VWRカタログ#20172-698、ロチェスター、ニューヨーク州）、0.5〜10μlのピペッタのためのピペット先端部（VWRカタログ#53509-138、ロチェスター、ニューヨーク州）、100〜1000μlのピペッタのためのピペット先端部（VWRカタログ#53512-294、ロチェスター、ニューヨーク州）、20〜20μlと20〜200μlのピペッタのためのピペット先端部（VWRカタログ#53512-260、ロチェスター、ニューヨーク州）、10mlのピペット（ベクトン・ディキンソン・カタログ#7551、マリエッタ、オハイオ州）、2mlのピペット（ベクトン・ディキンソン・カタログ#7507、マリエッタ、オハイオ州）、5mlのピペット（ベクトン・ディキンソン・カタログ#7543、マリエッタ、オハイオ州）、細胞スクレーパ（コーニング・カタログ#3008、コーニング、ニューヨーク州）。
【００６９】
必要な化合物、試薬、緩衝液としては、ジメチルスルホキシド（DMSO）（VWRカタログ#5507、ロチェスター、ニューヨーク州）、イーグルの培地を変更したもの（DMEM）（メディアテック・カタログ#10-016-CV、ハーンドン、バージニア州）、熱不活性なウシ胎仔血清（FBS-HI）（メディアテック・カタログ#35-011-CV、ハーンドン、バージニア州）、ペニシリン／ストレプトマイシン（メディアテック・カタログ#30-001-CI、ハーンドン、バージニア州）、ネズミ繊維芽細胞（アメリカ基準培養株コレクション・カタログ#TIB-71、マナサス、バージニア州）、24ウエルで容量が3.4mlの組織培養プレート（ベクトン・ディキンソン・カタログ#3226、フランクリン・レーンズ、ニュージャージー州）、超純水（抵抗値=18MΩcmの脱イオン水）などが挙げられる。
【００７０】
ネズミの3T3細胞（ACTT番号CCL-92）を10％のFBS-HIとともに、ペニシリン／ストレプトマイシンを添加して対数増殖期に維持したDMEMの中で増殖させ、実験の用意を整える。増殖培地を作るため、DMEMを入れた500mlのボトルに50mlの熱不活性なウシ胎仔血清と、5mlのペニシリン／ストレプトマイシンを添加し、4℃で保管する。使用する前に水浴の中で37℃に温める。
【００７１】
細胞表面の受容体の変化
M-CSFRのシグナル伝達活性があり、マクロファージコロニー刺激因子（M-CSF）と結合することによって活性化されるキメラ増殖因子受容体（“野生型”キメラ受容体（ChiR(WT)）と呼ぶ）を、分子生物学において標準的な方法を用いて構成した。また、一般に受け入れられている部位特異的突然変異誘発技術を用いて突然変異株ChiR(F5)-3T3も構成した。
【００７２】
野生型の株で遺伝子を誘導する。ChiR(F5)-3T3細胞をM-CSFだけで刺激し、次いでシクロヘキシミジン（CHX）と組み合わせて刺激し、誘導されたどの遺伝子がIEGとして振る舞うかと、どの遺伝子が誘導のためにタンパク質を合成する必要があるかを評価する。M-CSFによる処理は、40ng/mlの割合で使用して0.5％のウシ胎仔血清の中で20分間、1時間、2時間、4時間にわたって行なった。CHXによる処理は、10μg/mlの割合で使用して4時間にわたって行なった。突然変異株における遺伝子の誘導も明らかにする。F5突然変異株は、M-CSFを用いて20分間、1時間、2時間、4時間にわたって刺激する。
【００７３】
遺伝子の発現レベルは、5938個のマウスの遺伝子とEST配列の検出器を備えたオリゴヌクレオチド・アレイ（アフィメトリックス社）を用いて測定する。遺伝子が野生型の株でIEGに分類されるためには、CHXの存在下と不在下でM-CSFによって誘導される必要がある。66個の遺伝子がIEGとなる基準を満たした。さらに別の43個の遺伝子がM-CSF+CHXによって誘導されたが、M-CSFのみでは強く誘導されなかった。
【００７４】
5938個のマウスの遺伝子とEST配列の検出器を備えたオリゴヌクレオチド・アレイ（アフィメトリックス社）を用いて発現を調べるのにRNAを利用する（図2）。転写物の量における変化は必ずしも転写の上方調節によるものではないが、以前の実験によると、RTKによってIEGが誘導される場合には転写の上方調節が断然優勢であることがわかっていることに注意されたい。
【００７５】
明確な一群のIEGを最初に同定するため、厳しい条件を設定する。それは例えば、1つの時刻で、両方の複製における研究で誘導が少なくとも2倍になり、複製の一方における研究で誘導が少なくとも3倍になるというものである。オリゴヌクレオチド・アレイではマウスの全遺伝子の10％未満しか調べることができないが、66IEGは、おそらく全体のうちのはるかに大きな割合を表わしている。それは、このクラスの遺伝子を発見するため多大な努力がなされたからである。
【００７６】
タンパク質の定量化は、パッカード社のフルオロカウント・モデル#BF10000フルオロメータ（メリデン。コネチカット州）を用いて細胞ライセートに基づいて行なわれた。まだ記載していない他の装置としては、-30℃の冷蔵庫（フォルマ・モデル#F3797）、加熱ブロック（VWRカタログ#13259-030、ロチェスター、ニューヨーク州）、マイクロフュージ（フォルマ・モデル#F3590、マリエッタ、オハイオ州）が挙げられる。ナノオレンジ・タンパク質定量キット（モレキュラー・プローブ・カタログ#N-6666、ユージン、オレゴン州）に記載されている方法をまったく変えずに利用する。
【００７７】
繰り返し式全体分割クラスター化アルゴリズムとベイズ証拠分類を用いて遺伝子発現プロファイルを分析し、似た発現プロファイルを有する遺伝子のクラスターを同定した。遺伝子の機能を明らかにする上で発現プロファイルの動力学が重要であるため、それぞれの遺伝子について発現を測定している時間全体にわたって解析を行なった。
【００７８】
そのためのステップは以下の通りである。
1）時刻0（刺激なし）を出発点とした各時刻に、野生型の株と突然変異株における遺伝子の誘導倍率（対数比）を明らかにする。
【００７９】
2）遺伝子プロファイルを大きさ1に規格化する。
3）それぞれの株の6312個の遺伝子に対して分割クラスター化を実行し、独自のクラスター・パターンを明らかにする。
【００８０】
4）それぞれの株における遺伝子クラスターを、ポピュレーションの平均プロファイルと比較した発現状態に基づき、以下の下部グループに分類する。それは、前期上方調節下部グループ、後期上方調節下部グループ、下方調節下部グループ、その他の下部グループである。
【００８１】
5）2つの下部において比較分析を行ない、前期上方調節下部グループと下方調節下部グループにおいて共通する遺伝子を探す。
【００８２】
6）ピアーソン相関係数に基づいて相関分析を行ない、2つの株におけるIEGの相違点と類似点を明らかにする。
【００８３】
NIH3T3細胞をM-CSFで処理することによって誘導される中間型前期遺伝子
不活性なNIH3T3 WT細胞とF5突然変異細胞を40ng/mlのM-CSFの刺激することによって誘導されるIEGを、誘導が観察されたピークの時刻に従って表2.1にリストにしてある。それぞれの遺伝子は、すでに説明したように、繊維芽細胞内でM-CSFよって誘導可能であるか、あるいは血清によって誘導可能であるかに応じて分類する。
【００８４】
【表１】

【００８５】
【表２】

【００８６】
遺伝子発現プロファイルのクラスター化
階層クラスター化などの集団化アルゴリズムが、別々のクラスに属するそれぞれの対象（遺伝子）に対して開始される。このアルゴリズムは、各ステップにおいて“最も似た”ペアを見いだす。次に、このペアが新しい1つのクラスに入れられて再びこのプロセスが繰り返され、最終的にすべての対象がグループに分類される。データセットに数千の対象が含まれているとき、集団化アルゴリズムは非常に多数のクラスターを生み出す。
【００８７】
クラスター化されたデータを解釈する際に共通する1つの問題点は、クラスターの“本当の”数を明らかにすることである。集団化アルゴリズムは、ユーザーに対してクラスの全体最適数を決める明示的な“停止ルール”を提供することはなく、クラスターの全集合を提示する。したがって、データをどの程度まで構造化するのが適切かはユーザーが決める必要がある。
【００８８】
この実施例では、遺伝子発現プロファイルをクラスター化するのに分割k-平均クラスター化アルゴリズムを繰り返し用いて最大で20のクラスに分類した。このアルゴリズムは、全データセットから出発するため、全体最適な解を生成させることができる。アルゴリズムの各ステップにおいて、少なくとも均一なクラスターが下部分類される。このプロセスが繰り返され、最終的にクラスターの“コンパクトさ”に合致した基準が満たされる。クラスターの均一性またはコンパクトさは、「適合度」という考え方をもとにしている。適合度は、対応するクラスターの重心から観察される距離の和として定義される。すなわち、
【００８９】
【数１】

【００９０】
ここにX_ikは、k番目のクラスターに割り当てられるI番目の観測ベクトルであり、X_kは、k番目のクラスターの重心を表わすベクターであり、N_kは、k番目のクラスターの観測数またはサイズであり、Cは、クラスターの数であり、d（x, y）は2本のベクトル間の距離（一般にはユークリッド距離）である。適合度は、C=1（全ポピュレーション）のときに最大であり、CがN（全観測数）に近づくにつれて単調にゼロに近づいていく。
【００９１】
クラスターの均一性は、以下のように定義される。
【００９２】
【数２】

【００９３】
これは漸近的に100％の値に近づく。クラスターの最適数C*＜Nは、データの内部構造に応じ、均一性のレベルが100未満で見いだされる。
【００９４】
野生型の株と突然変異株に関する遺伝子発現データをクラスター化することによって得られたクラスターの均一性を図3に示してある。所定の設定に対し、アルゴリズムによって35個のクラスターという最適数に到達する。
【００９５】
野生型株：
遺伝子は、クラスター当たり２〜2719個の遺伝子のサイズ範囲である35のクラスターに分類される。クラスター中心のユークリッド長さにより表されるように、個々のクラスターにおける遺伝子の平均発現レベルの測定が、図4においてクラスターサイズの関数として示される。
【００９６】
そのプロットから見出され得るように、2179個の遺伝子（合計43.1％）から成る非常に大きなクラスターが対照（長さ＝０）に対して最も同一である発現レベルを示した。他方では、多くとも４個の遺伝子をそれぞれ含むわずか４個の小さなクラスターが、その時間を通して高い発現レベルを示した（長さ＞２）。最終的に、遺伝子クラスターのほとんどは、中位の発現レベルを有し（長さ＜１）、そしてクラスター当たり50〜200個の遺伝子の範囲のサイズを伴なって図の中央に属する。
【００９７】
クラスターはさらに、それらの発現パターンに基づいて次のカテゴリーに細分される：
（１）初期アップ−レギュレートされる（20分で集団平均よりも高い誘発）；（２後期アップ−レギュレートされる（１時間の進行で集団平均よりも高い誘発）；（３）ダウン−レギュレートされる（集団平均よりも低い誘発）；及び（４）他のもの。上記３種のカテゴリーにおけるクラスターについての典型的な発現“特性”が図５に示される。
【００９８】
初期アップ−レギュレートされた遺伝子は、20分で高レベルの発現を示し、これは、それらの遺伝子がTEGであり、すなわちそれらの誘発がタンパク質合成を必要としないが、しかし細胞にすでに存在する潜在的な転写活性化因子を包含することを示す。後期アップ−レギュレートされた遺伝子の第２カテゴリーに属する遺伝子の転写はたぶん、刺激現象から１時間後、それらの遺伝子の発現レベルはピークになるので、タンパク質合成を必要とする。同様に、発現が細胞外シグナルによる刺激の結果として抑制される最後のカテゴリーに属する遺伝子が重要である。
【００９９】
図６は上記カテゴリーに属する遺伝子のクラスターの相対的サイズを示す。わずか13個の遺伝子（0.2％）が初期アップレギュレートされ、ところが有意な数の481個の遺伝子（7.6％）がその処理の結果としてダウンレギュレートされる。
【０１００】
F5変異体株：
決定的なシグナル分子のためのキー結合部位でのチロシンからフェニルアラニンへの突然変異誘発を担持する変異体株F5との野生型株の発現プロフィールの比較は、オーバーラップの程度及び種々の調節路の相互作用の程度に関してのいくらかの重要な洞察力を提供する。
【０１０１】
野生型（WT）及び変異体（F5）株の発現パターンの比較：
【０１０２】
【表３】

【０１０３】
変異体株からの発現データが同じ手段で分析される。その発現パターンは、34クラスターをもたらす野生型株のそれらのパターンに類似する。２種の株についてのクラスター細分類が表１．２において比較される。
【０１０４】
興味あることには、類似する数の遺伝子が刺激剤に応答して両株に関して誘発されるが、しかし多数の遺伝子は変異体株において抑制される。さらに、多数の遺伝子の発現パターンが野生型に比較して、変異体株において影響されるように思える。これは、突然変異誘発により引き起こされる破壊を補正するための他の又は逆の経路の活性化を示す。
【０１０５】
表１．３は、個々の株についての同定された初期アップ−レギュレートされた遺伝子の発現プロフィール及び機能的注解を要約する。予測されるように、このグループにおけるほとんどの遺伝子は、転写因子又は細胞質調節タンパク質のいずれかであるタンパク質をコードする。
【０１０６】
【表４】

【０１０７】
２種の株間の初期誘発された遺伝子の比較が図７（ａ）に図示されている。13個のうち９個のIEG（69％）が、２種の株間で共通した。すべてにおいて、本発明者は、WT株からの6IEG：4IEGにおける示唆的発現パターンがF5において誘発されなかったことを観察し、ところが新規の２種のIEG組は変異体株において観察された。これは、他のシグナル化経路が、シグナルを形質導入し、そして初期応答遺伝子を活性化するのに活性的であることを示す。しかしながら、それらの経路は、高くオーバーラップするように見える。
【０１０８】
２種の株の初期転写応答は非常に類似するが、後期アップ−レギュレートされた遺伝子は、相当に低い程度のオーバーラップを示す（図７（ｂ）を参照のこと）。後期アップ−レギュレートされた誘発プロフィールに続く遺伝子の合計数は、２種の株間で著しく類似するが、しかしわずか44（18％）個が共通遺伝子であり、このことは、応答経路において高い多様性を示す。また、ダウン−レギュレートされたクラスター間に214（26％）個の共通遺伝子が存在した。
【０１０９】
最終的に、２種の株についての初期アップ−レギュレートされた遺伝子の相関分析が、全15個の遺伝子の発現プロフィールにおける類似性を評価するために行なわれる。図６に示されるように、２種の株における同じ遺伝子間に強い相関性が存在し（アレイの対角線）、さらに、２種の株の１つに関して、IEGに属するものとして分類されるそれらの遺伝子間においてさえ強い相関性が存在する（図７（ａ）と比較して）。さらに、非共通IEGが、他の遺伝子に関するそれらの発現パターンにおける差異に基づいて識別され得る。それらは、アレイの下部相関コードラント（上部右コーナー）に対して集中される。
【０１１０】
クラスター及び相関分析の手段が、生物学的システムの発現プロフィールにおける微妙な差異を同定し、そして特徴づけることにおいて価値あることが示されている。それらの技法は、特にタンパク質データが生理学的経路のさらなる誘発のために入手できる場合、比較ゲノム研究にたぶん強い影響を与えるであろう。
【０１１１】
初期アップ−レギュレートされた遺伝子のクラスター内のシグナル化経路：
従来技術を用いて、シグナル化ネットワーク分析についての現在のプログラムが本発明の機能的寸法を欠いていることが示される。この欠陥は、既知の経路からのデータよりもむしろ新しく開発されたデータを用いる場合、いずれかの経路−発見プログラムの成功を制限する。http//geo.nihs.go.jp/csndb/batch_search.htmlに記載される経路発現操作が、表１．４に列挙される初期アップ−レギュレートされた遺伝子についての遺伝子クラスター内で使用される。データベースはヒト経路のみを含むが、遺伝子クラスター分析により同定されるタンパク質は、ヒト類似体を示すデータベースにすべて列挙される。
【０１１２】
表１．４
20分でのWT3T3細胞における初期アップ−レギュレートされた遺伝子についての遺伝子クラスター：
【０１１３】
【表５】

【０１１４】
経路についての調査は、クラスター12, 19, 20又は35遺伝子発現データについての経路を見出さなかった。この負の結果は、前で論じられた理由のために予測される。機能的データの欠失は、遺伝子発現データからの推論を制限する。しかしながら、例２に示されるように、機能的データのさらに小さなデータ組の付加が、遺伝子マイクロアレイ実験に由来する情報を劇的に高める。
【０１１５】
例２．
この例は、成長因子受容体を通して活性化された生理学的工程及びシグナル化経路データを明確に表す。この実験は、細胞刺激に続いて集められた遺伝子発現及びタンパク質データが、連鎖及び関連性を決定するためのアルゴリズムを用いて、タンパク質の後−翻訳修飾に遺伝子発現プロフィールを比較することによって、機能的用語で解釈され得ることを示す。次に、そのような連鎖及び関連性は、複雑な細胞応答機構に使用される決定的細胞経路を同定するために有用である。
【０１１６】
方法：
RNAの細胞培養、刺激及び調製のための一般方法を、例１に記載のようにして行う。タンパク質分析についての追加の装置が記載される。
【０１１７】
SDS−PAGEのための装置は、Mini Vertical System (Savant Model #MV120, Holbrook, NY)及び電源（Savant Instrument Model #PS2500, Holbrook, NY）を包含する。ウェスターンブロットについての供給材料及び試薬は、10〜20％グラジエントミニゲル（BioWhittaker Molecular Applications Catalog #58506, Rockland, ME）、２×サンプル緩衝液（Sigma Catalog #L-2284, St. Louis, MO）、ビーカー、1000ml（VWR Catalog #13910-239, Rochester, NY）、色彩分子量標準（Sigma Catalog #C-3437, St. Louis, MO）、グリシン（Sigma Catalog #G-7403, St. Louis, MO）、メスシリンダー、1000ml（VWR Catalog #24711-364, Rochester, NY）、超遠心分離管、0.5mlのSafe-Lock (Brinkmann Catalog #2236365-4, Westbury, MY)、遠心分離管、1.7ml（VWR, Catalog #20172-698, Rochester, NY）、２〜20μl及び20〜200μlのピペットのためのピペット先端（VWR Catalog #53512-260, Rochester, NY）、ピペット先端、ゲル充填（VWR Catalog #53509-018, Rochester, NY）、ドデシル硫酸ナトリウム（SDS）（Sigma Catalog #L-4509, St. Louis, MO）、磁気撹拌棒（VWR Catalog #58948-193, Rochester, NY）、貯蔵ボトル、1000ml（Corning Catalog #1395-1L, Corning, NY）及びtrizma Base (Sigma Catalog #T-6066, St. Louis, MO) である。
【０１１８】
磁気撹拌棒を含む1000mlのビーカーにおいて、900mlの蒸留水に15gのトリス塩基、72gのグリシン及び5gのSDSを溶解することによって、５×SDS−PAGE緩衝液を調製する。磁気撹拌機上に置き、そして溶解するまで、撹拌する。1000mlのメスシリンダーにより体積を1000mlに調節する。４℃で貯蔵する。200mlの５×原液と800mlの水とを組合すことによって、１×SDS−PAGE緩衝液を調製する。４℃で1000mlの貯蔵ボトルにおいて貯蔵する。使用の前、室温に暖める。２×サンプル緩衝液を室温で溶解し、そして−30℃のフリーザーにおいて1.7mlの超遠心分離管において500μlのアリコートとして貯蔵する。垂直ゲルシステムを、製造業者の説明書に従って集成する。十分な１×SDS−PAGE緩衝液を、ゲルスステム注に注ぎ、ゲルお上部を被覆し、そして装置の底に十分に注ぎ、ガラスプレートの底を被覆する。フリーザーから２×サンプル緩衝液の管を取り出し、そして室温で溶解する。氷上で凍結された細胞溶解物サンプルを溶融する。細胞溶解物サンプルを、0.5mlのSafe−Lock管において２×サンプル緩衝液により１：１で希釈する（15μlの細胞溶解物サンプル及び15μlの２×緩衝液）。残りの２×サンプル緩衝液を、フリーザー（−30℃）に戻す。細胞溶解物サンプルを、フリーザー（−80°）に戻す。タンパク質サンプル及び分子量標準（必要とされる場合）を、95〜100℃で５分間、加熱する。手短には、超遠心分離機を回転し、管の底にサンプルを集め、そしてプレキャストゲルのウェルに当量のタンパク質を充填する。一定の電流でゲル当たり30mAで60分間、又は色素がゲルの底に達するまで展開する。
【０１１９】
ホスホチロシルタンパク質のウェスターンブロットについての供給材料及び試薬は次のものを包含する：抗−ホスホチロシン抗体4G10（UBI Catalog #05-321, Lake Placid, NY）, Blotting Paper (VWR Catalog #28303-104, Rochester, NY), グリシン（Sigma Catalog #G-7403, St. Louis, MO）、塩酸（HCl）（VWR Catalog #VW3110-3, Rochester NY）、メタノール（VWR Catalog #VW4300-3, Rochester, NY）、 NaOH (Sigma Catalog #S-5881, St. Louis, MO)、ニトロセルロース膜（Schleicher & Schuell Catalog #10402680, Keene, NH）、脱脂粉乳（Carnation Brand）、ペルオキシダーゼラベルにされたヤギ抗−マウスIgG（KPL Catalog #474-1806, Gaithersburg, MD）、及びリン酸緩衝液（PBS）（Mediateck Catalog #21-040-CV, Herndon, VA）。
【０１２０】
例１におけるようにして細胞溶解物サンプル上でのホスホチロシンタンパク質についてSDS−ポリアクリルアミドゲル電気泳動を行なう。ガラスプレート膜を除き、そしてTowbin緩衝液において、室温で軽く回転しながら５分間、平衡化する。ニトロセルロース膜を切断し、すなわち右側下部コーナーを切除する。超純粋水により膜をプレ湿潤し、次に、トランスファー緩衝液において５分間、平衡化する。１×Towbin緩衝液にトランスファーされるべき個々のゲルのために６片のブロット紙をプレ湿潤する。
【０１２１】
トランスファーサンドイッチを、その製造業者の説明書に従って設定する。96mA/ゲルでゲル当たり60分間、タンパク質をトランスファーする。10mlのPonceau S溶液により５分間、染色し、次に水により数回、洗浄することによって、良好なタンパク質トランスファーについて調べる。３％脱脂粉乳を含む新しい調製されたPBS（PBS−NFDM）10mにより、室温で20分間、一定の撹拌を伴なって、ブロットされた膜をブロックする。膜を、5mlの新しく調製されたPBS−NFDMにより1μg/mlに希釈された一次抗体と共に、４℃で一晩インキュベートし、そしてプラスチックバッグにより密封する。
【０１２２】
膜を水により２度、洗浄する。膜を、10mlの新しく調製されたPBS−NFDMにより１：3000に希釈された二次抗体と共に、室温で1.5時間、一定の撹拌下でインキュベートする。膜を水により２度、洗浄する。膜を、PBS−0.05％Tween20により室温で3.5分間、一定の撹拌下で洗浄する。膜を水により３〜４度、洗浄する。化学発光を用いて、チロシンリンタンパク質を検出する。
【０１２３】
ホスホチロシンタンパク質の可視化のための化学発光を、冷却された、組込まれたカメラ（Labworks Softwareを備えたEpi Cemi II Darkroom. UVP, Upland, CA）, LumiGlo（登録商標）Chemiluminescent Substrate A 及びB（KPL Catalog #54-61-02, Gaithersburg, MD）と共に、UVP暗室を用いて行なう。冷蔵庫からLumiGlo（登録商標）化学発光基質A及びBを除く。タンパク質がニトロセルロース又はPVDVにブロットされた後、きれいなKimWipe上に膜の端を接触せしめることによって、膜から過剰の水を排水する。膜を、きれいな重量ボート又は他の適切な容器に配置する。膜に0.8mlの基質A及び基質Bを、直接的に添加し、そして混合するためにかき混ぜる。LumiGlo（登録商標） Chemiluminescent Substrate A及びBを冷蔵庫に配置する。膜上での基質のインキュベーションを、室温で１分間、可能にする。重量ボートから膜を除き、過剰の基質を排水し、そしてEpi Chemi IIシステムのトランスイルミネーター上に直接的に配置する。供給されるLabWorksプログラムにおいては、On−Chip Integrationを選択し、そして良好なシグナルが得られるまで、種々の時間、調整する（いかに多くの興味あるタンパク質が膜上に存在するかに依存して、１，３，６，10及び/又は15分）。ソフトウェアを用いて、興味のバンドを同定し、そしてそれらのバンドの統合された光学密度を印刷する。
【０１２４】
データ分析：
１．個々のタンパク質バンド強度に関しては、測定値をまず、時間プロフィールを通しての大きさに標準化する。データをまた、個々の時点で１の大きさに、タンパク質バンドを通して標準化することができる。
【０１２５】
２．分割κ−平均クラスター化を、例１において説明されるようにして、標準化されたデータに適用する。最適数のクラスターは、５であることが決定された。
【０１２６】
３．平均プロフィールを、個々のクラスター内のタンパク質について計算する。
４．タンパク質のクラスターを、初期又は後期リン酸化されたクラスターに対する力学的蓄積に従ってグループ分けする。
【０１２７】
次に、ゲノム発現クラスターへのタンパク質クラスターの類似性を、Pearson’s相関係数又は２種のプロフィールのユークリッド距離に関して、類似性測定に基づいての関連性分析により決定する。
【０１２８】
表２．５
M−CSF−処理される3T3細胞におけるタンパク質チロシンリン酸化の定量化：
【０１２９】
【表６】

【０１３０】
【表７】

【０１３１】
タンパク質プロフィールのクラスター化：
κ−平均アルゴリズムは、５の最適数のクラスターを決定した。タンパク質クラスターの分布は、図２．１に示される。
【０１３２】
クラスターAは、21の眼に見えるリン酸化されたタンパク質のうち11を含む最大のクラスターである。クラスターBは、他のバンドに比較してユニークなプロフィールを有する。わずか１つのタンパク質バンドを含む最少のクラスターである（図２．２を参照のこと）。
【０１３３】
クラスター化アルゴリズムの結果は、すべてのタンパク質のリン酸化プロフィールが１及び２時間で最も異なり、そして４時間で、最も類似した。これは明らかに、このシステムにおける実験企画に対して密接な関係を有し、このことは、単一時点企画が追跡される場合、タンパク質測定値は、刺激の１又は２時間後に取られるべきであることを示唆する。
【０１３４】
リン酸化されたタンパク質クラスターの時間プロフィールが図２．２に示される。合計量のリン酸化されたタンパク質（すべてのバンドの強度の合計）をまた、比較のために示す。見られるように、クラスターE及びCは、刺激の付与の後、20分後でリン酸化されるタンパク質を含む。特に、クラスターEは、シグナルトランスダクション工程の初期段階において役割を有すると思われる、93.3, 76.4及び50.8kDaの分子量を有する３種のタンパク質を含む。
【０１３５】
遺伝子及びタンパク質プロフィールの関連性の分析：
遺伝子発現及びタンパク質データの別々の分析は、M−CSFによる刺激の後のそれらの力学的プロフィールに従って異なった遺伝子及びリン酸化されたタンパク質の分類をもたらした。遺伝子発現クラスターは特に、タンパク質合成の前、高レベルの誘発を示す遺伝子群を同定した。同様に、２種のタンパク質クラスターは、初期リン酸化を示し、このことは、それらのタンパク質が初期誘発された遺伝子にいくぶん関連することを示唆する。この分析が完全な組の遺伝子発現及びタンパク質クラスターに拡張される場合、タンパク質リン酸化と遺伝子発現との間の関連性がマッピングされ得る。
【０１３６】
次の分析においては、遺伝子発現及びタンパク質プロフィールの類似性を、下記式：
【０１３７】
【数３】

【０１３８】
［式中、Xは遺伝子クラスターの発現プロフィールであり、Yはタンパク質のクラスターの発現プロフィールであり、Nは時点の数であり、そして−X及びs_xは個々のプロフィールにおける値の平均及び標準偏差である］で定義されるPearson’s相関係数に基づいて評価した。
【０１３９】
この分析の結果は図２．３に示される。この図は、関連性のカラーコードされた地図を示す。相関係数の実際の値がまた示されている。視覚的な観察をより明白にするために、その得られる相関マトリックスを両方にクラスター化し、そして縦及び横列を、そのクラスター化の結果に従って再配置した。
【０１４０】
タンパク質−ゲノム関連マトリックスの視覚的観察から、クラスター間の正（赤）又は負（緑）の関連性のいくつかの領域が明らかになる。例えば、初期調節されたクラスターである、遺伝子クラスターに、20及び35は反対の調節を示す、タンパク質のクラスターAとの負の関連性を示す。また、遺伝子クラスター９（56の遺伝子を含む）は、タンパク質クラスターC及びEとの強い正の関連性を示す。
【０１４１】
本発明のタンパク質データベースを用いてのクラスターEタンパク質とのクラスター９遺伝子生成物のさらなる分析は、初期応答タンパク質PTP−１C及びSheとM−CSFとの関連性を示す。それらのタンパク質の両者は、細胞質チロシンホスファターゼである。本発明のタンパク質データ組においては、PTP−１Cからのネットワークシグナル化連鎖が、65kDaの細胞質タンパク質pp65のチロシンリン酸化により同定される。
【０１４２】
遺伝子クラスター９及びタンパク質クラスターEオーバーラップ内のシグナル化経路間のシグナル化関連性を評価する場合、最高の関連性（0.125）が細胞周期調節タンパク質により達成される（図14を参照のこと）。それは、サイクリンD1, D2, D3及びE−サイクリン依存性キナーゼGDK4/6/2及びRBタンパク質を包含する。時間配列の追加の分析は表されないが、p53タンパク質の興味ある強いダウン−レギュレーションが、１時間で本発明により同定され、強いアップ−レギュラーションが４時間までに同定される。
【０１４３】
知識に基づくシステムとして、一連の実験における関連性の情報は、隣接する分子及び経路の関連性の強度の改良を続けるために他の実験と組合され得る。実験企画に付加される他の後−翻訳工程はまた、経路の同定の強度を改良するよう機能するのであろう。この例は、遺伝子発現データ及び構造/機能タンパク質と本発明により記載される構造/機能タンパク質データベースとの組み合わせが、シグナル化ネットワークに関連する卓越した情報を生成し、そして新規経路の発現により有用であることを示す。
【図面の簡単な説明】
【０１４４】
【図１】機能的活性なタンパク質生成物の生成に対する遺伝子の関係を図解する概略線図である。
【図２】65,000〜250,000オリゴを含有し、各々が10⁷〜10⁸の全長のコピーを表す、マイクロチップに結合した合成オリゴヌクレオチドを使用する、遺伝子発現を同定する典型的にはシステムを概略的に図解する。
【図３】野生型 (WT) および突然変異体 (F5) 遺伝子の発現プロファイルについてのクラスター均質性プロットをグラフで図解する。両方の曲線は非常に類似し、2つの系統の包括的発現パターンにおけるほとんど同一の構造を示す。
【図４】各クラスターvsクラスターサイズにおける遺伝子についての対照に関する発現レベルのベクターのEuclidian長さをグラフで図解する。充填した円は遺伝子の全体の組を表す。
【図５】個々のクラスターの発現サインをグラフで図解する。誤差のバーは1標準偏差に等しい。また、遺伝子の全体の組についての平均発現プロファイルを比較のために示す。第5A図〜第5D図は、集団：下記のクラスターに比較した初期のアップレギュレートされた遺伝子クラスターをグラフで表す：クラスター12 (第5A図)、クラスター20 (第5B図)、クラスター35 (第5C図)、およびクラスター19 (第5D図)。第5E図〜第5I図は、後期のアップレギュレートされた遺伝子クラスター：下記のクラスターをグラフで表す：クラスター18 (第5E図)、クラスター16 (第5F図)、クラスター14 (第5G図)、クラスター15 (第5H図)、およびクラスター17 (第5I図)。第5J図〜第5N図は、ダウンレギュレートされた遺伝子クラスター：下記のクラスターをグラフで表す：クラスター6 (第5J図)、クラスター4 (第5K図)、クラスター1 (第5L図)、クラスター10 (第5M図)、およびクラスター22 (第5N図)。
【図６】普通の発現サインに従う遺伝子クラスターの分類のチャートである。
【図７】野生型およびF5突然変異体系統についての即時型遺伝子 (IEG) (第1A図) および後期アップレギュレートされた遺伝子 (第1B図) の比較を概略的に図解する (注解については表2参照)。
【図８】野生型および突然変異体系統からの対応する遺伝子の発現プロファイルについてのPearson相関のアレイを図解する。より輝いた赤色はより高い陽性の相関を示し、緑色は陰性を示し、そして黒色はゼロに近い相関を示す。
【図９】ゲノム発現プロファイルおよびプロテオーム発現プロファイルを決定し、そして各プロファイルを相関する本発明の方法を概略的に図解する。
【図１０】試験物質とインキュベートした後、試験細胞におけるホスホチロシルタンパク質発現における時間に関連する変化を示すゲルである。
【図１１】試験物質とインキュベートした後、試験細胞におけるプロテオームのクラスター分布のチャートである。
【図１２】試験物質とインキュベートした後、試験細胞におけるプロテオームのクラスターのサインプロファイルと集団：下記のクラスターとの比較をグラフで表す：クラスターE (第12A図)、クラスターE (第12A図)、クラスターC (第12B図)、クラスターB (第12C図)、クラスターD (第12D図)、およびクラスターA (第12E図)。
【図１３】試験物質とインキュベートした後、試験細胞におけるプロファイル間のPearsonの相関係数に基づく遺伝子発現およびプロテオームのクラスターのアソシエーションを提供する。
【図１４】試験物質とインキュベートした後、試験細胞におけるアソシエーションの程度が最高であるシグナリング経路を概略的に図解し、これは細胞周期のG1進行期であり、そして細胞周期調節タンパク質を本発明により同定する。

Claims

細胞中の遺伝子発現とタンパク質修飾の間の関係を同定する方法において：
ａ．細胞中で生成された遺伝子発現を決定する段階；
ｂ．細胞中で生成されたタンパク質修飾を決定する段階；
ｃ．細胞中で生成された遺伝子発現及びタンパク質修飾を調和させる段階、
を含んで成り、かくして遺伝子発現とタンパク質修飾の間の関係を同定する方法。
遺伝子発現がｃＤＮＡマイクロアッセイを使用して決定される、請求項１に記載の方法。
遺伝子発現が、遺伝子発現の連続分析（ＳＡＧＥ）により決定される、請求項１又は２に記載の方法。
遺伝子発現が、遺伝子転写のノーザンブロット分析を用いて決定される、請求項１〜３のいずれか１項に記載の方法。
遺伝子発現が化学的に修飾された核酸の分析によって決定される、請求項１〜４のいずれか１項に記載の方法。
タンパク質修飾の決定がタンパク質発現の改変の決定を含んで成る、請求項１〜５のいずれか１項に記載の方法。
タンパク質修飾の決定が翻訳後修飾の決定を含んで成る、請求項１〜５のいずれか１項に記載の方法。
翻訳後修飾がリン酸化、グリコシル化又はメチル化である、請求項７に記載の方法。
タンパク質修飾が１次元ゲル電気泳動を用いて決定される、請求項１〜８のいずれか１項に記載の方法。
一次元ゲル電気泳動がアフィニティ精製を伴って又は伴なわずに達成される、請求項９に記載の方法。
タンパク質修飾が、抗体をコーティングさせたマイクロチップを用いて決定される、請求項１〜１０のいずれか１項に記載の方法。
タンパク質修飾が、溶解状態の非変性タンパク質／タンパク質複合体の同定を用いて決定される、請求項１〜１１のいずれか１項に記載の方法。
翻訳後修飾が、酵素活性についての機能的検定を用いて決定される、請求項１〜１２のいずれか１項に記載の方法。
タンパク質修飾が、サイトカイン又はレセプタ／リガンド結合についての生物学的検定を用いて決定される、請求項１〜１３のいずれか１項に記載の方法。
タンパク質修飾が、細胞内のタンパク質の局在化を通して決定される、請求項１〜１４のいずれか１項に記載の方法。
大規模マウスノックアウトを通してタンパク質修飾が決定される、請求項１〜１５のいずれか１項に記載の方法。
タンパク質修飾が機能的タンパク質についての大規模動物検定を通して決定される、請求項１〜１６のいずれか１項に記載の方法。
タンパク質修飾が２次元ゲルによる示差表示を通して決定される、請求項１〜１７のいずれか１項に記載の方法。
ａ．代謝経路に関与する作用物質に対し細胞を露呈する段階；及び
ｂ．請求項１〜１８のいずれか１項に記載の方法に従って、作用物質に応答して細胞内で生成された遺伝子発現とタンパク質修飾の関係を同定する段階、
を含んで成り、かくして代謝経路を調査する、代謝経路調査方法。
ａ．請求項１〜１８のいずれか１項に記載の方法に従って異常細胞内の遺伝子発現とタンパク質修飾の関係を同定する段階；
ｂ．請求項１〜１８のいずれか１項に記載の方法に従って対応する正常細胞内の遺伝子発現とタンパク質修飾の関係を同定する段階；及び
ｃ．異常細胞の調和された遺伝子発現及びタンパク質修飾を正常細胞と比較する段階、
を含んで成り、かくして異常細胞を型別する、異常細胞型別方法。
単数又は複数のテスト材料の生物活性を同定する方法において：
ａ．単数又は複数のテスト材料に細胞を露呈する段階及び、
ｂ．請求項１〜１８のいずれか１項に記載の方法に従って単数又は複数のテスト材料に対する露呈に応答して細胞中で生成される遺伝子発現とタンパク質修飾の関係を同定する段階、
を含んで成り、かくして単数又は複数のテスト材料の生物活性を同定する、方法。
ａ．請求項２１に記載の方法に従って、単数又は複数のテスト材料の生物活性を同定する段階；
ｂ．請求項２１に記載の方法に従って、単数又は複数のテスト材料の生物活性を同定する段階であって、段階ａ内の単数又は複数のテスト材料が段階ｂ内の単数又は複数のテスト材料とは異なっている段階；
ｃ．段階ｂで同定された生物活性と段階ａで同定された生物活性を比較する段階、
を含んで成る、異なるテスト材料の組合せを比較する方法。
遺伝子発現とタンパク質修飾の関係を同定するためのコンピュータシステムにおいて：
ａ．ｉ．遺伝子発現データ；及び
ｉｉ．タンパク質修飾データ；
を含む記録を内含するデータベース；
ｂ．遺伝子発現及びタンパク質修飾データを統計的に分析するための単数又は複数のアルゴリズム；
ｃ．統計的に分析された遺伝子発現及びタンパク質修飾データを調和させるための単数又は複数のアルゴリズム；
ｄ．アルゴリズムからの結果の出力及び提示用システム；
ｅ．データベース及び結果を索引付けし記憶するためのリポジトリシステム；及び
ｆ．データベース及び結果の検索用問合せシステム、
を含んで成るコンピュータシステム。
遺伝子発現と機能的タンパク質発現の関係を予測するためのコンピュータベースのシステムにおいて：
ａ．遺伝子発現データ及びタンパク質修飾データを記憶するためのデータベース管理システム；
ｂ．染色体の場所、機能、経路成員性、リン酸化状態を含めた、個々の遺伝子及びタンパク質についての情報を統合するためのデータベースシステム；
ｃ．実験的偏向について実験データを補正するためのアルゴリズム；
ｄ．ｉ．遺伝子発現プロファイル；及び
ｉｉ．機能的タンパク質発現プロファイル；
からパターンを抽出するための単数又は複数のクラスタ化アルゴリズム；
ｅ．遺伝子発現パターンと機能的タンパク質発現パターンの関係を抽出するための単数又は複数のアルゴリズム；
ｆ．遺伝子発現又はタンパク質発現応答の機能的特徴づけを導出するべく遺伝子発現プロファイルに注釈付けするためのアルゴリズム；
ｇ．導出された関係の記録用のリポジトリ；及び
ｈ．離散的パターン、関係及び実験条件の検索のための問合せシステム、
を含んで成るコンピュータベースのシステム。
データが遺伝子発現及びタンパク質修飾の調和の結果を含んで成る、デジタル符号化されたデータを含むコンピュータ読取り可能な記憶媒体。