JP4320112B2 - 遺伝子実験データ表示方法 - Google Patents
遺伝子実験データ表示方法 Download PDFInfo
- Publication number
- JP4320112B2 JP4320112B2 JP2000280052A JP2000280052A JP4320112B2 JP 4320112 B2 JP4320112 B2 JP 4320112B2 JP 2000280052 A JP2000280052 A JP 2000280052A JP 2000280052 A JP2000280052 A JP 2000280052A JP 4320112 B2 JP4320112 B2 JP 4320112B2
- Authority
- JP
- Japan
- Prior art keywords
- sample
- gene
- expression intensity
- genes
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
【発明の属する技術分野】
本発明は、特定の遺伝子とハイブイリダイズさせることによって得られた2種類の実験による遺伝子発現データを、視覚的に分かりやすく、そして遺伝子の機能・役割が推測しやすい形式によって表示するための表示方法に関する。
【0002】
【従来の技術】
ゲノム配列が決定された種の増加に伴い、進化に対応すると見られる遺伝子を見つけ出し、どの生物にも共通に持っていると考えられる遺伝子の集合を探したり、それから逆に種に個別な特徴を推測するなど、種間の遺伝子の違いから何かを見出そうとする、いわゆるゲノム比較法が盛んに行われてきた。しかし近年、バイオチップ(DNAチップ)やDNAマイクロアレイなどのインフラストラクチャの発達によって、分子生物学の興味は、種間の情報から種内の情報へ、すなわち同時発生解析へと移りつつあり、これまでの種間の比較と合わせて、情報の抽出から関連付けの場が大きく広がりを持ち始めている。
【0003】
例えば、既知の遺伝子と同一の発現パターンを示す未知の遺伝子が見つかれば、その遺伝子は既知の遺伝子と同様の機能があると類推できる。これら遺伝子や蛋白質そのものの機能的な意味付けは、機能ユニットや機能グループといった形で研究されている。またそれらの間の相互作用も、既知の酵素反応データや物質代謝データとの対応付けによって、あるいはより直接的に、ある遺伝子を破壊あるいは過剰反応させ、その遺伝子の発現をなくすか、あるいは多量に発現させ、その遺伝子の直接的及び間接的影響を、全遺伝子の発現パターンを調べることによって解析している。
【0004】
この分野において成功した事例として、スタンフォード大学のP. Brownらのグループによるイースト菌の発現解析が挙げられる(Michel B. Eisen et al. : Cluster analysis and display of genome-wide expression patterns: Proc. Natl. Acad. Sci. (1998 Dec. 8); 95(25):pp.14863-8)。彼らは、DNAマイクロアレイを用いて、細胞から抽出した遺伝子を時系列にハイブリダイズさせ、遺伝子の発現の度合い(ハイブリダイズした蛍光シグナルの輝度)を数値化した。数値に色を対応させることで、遺伝子の個々の発現過程をわかりやすく表示させている。このとき、細胞の一連のサイクルにおいて発現パターンの過程が近い遺伝子どうし(任意の時点での発現の度合いが近いものどうし)をクラスタリングしている。
【0005】
また、東大医科研は薬の効力に関する実験結果を報告している(T. Tsunoda et al.: Discrimination of Drug Sensitivity of Cancer Using cDNA Microarray and Multivariate Statistical Analysis: Genome Informatics 1999 (1999, Dec.) pp.227-228, Universal Academy Press Inc.)。実験では正常細胞と癌細胞の試料が異なる色の蛍光に標識され、バイオチップ上でハイブリダイスしたのち、双方の蛍光シグナル強度が測定されている。
【0006】
図3は、この実験によって得られる各遺伝子の発現状態の表示方法を示した例である。この表示方法はハイブリダイズした蛍光シグナルの輝度データをプロットしたもので、片方の軸に正常細胞、他方の軸に癌細胞の輝度をとっている。データの分析においては、ある一定以上の強度のシグナルが出ている遺伝子に関して、正常細胞の輝度と癌細胞のシグナル強度の比に着目して、疾病に特異的な遺伝子の候補を絞り込んでいる。具体的には、図3の領域Aに入る遺伝子(正常細胞中で働いているが癌細胞中では働かなくなるもの)と領域Bに入る遺伝子(癌細胞中で働くが正常細胞中では働かなくなるもの)を特に選別している。このような表示方法をとることで、特定の疾病に特異的に働く遺伝子の候補を絞り込むことが可能となっている。
【0007】
【発明が解決しようとする課題】
図3に示した表示方法は、異なる細胞の遺伝子に関する性質の差を視覚的に大まかにとらえる際に有効であり現在一般的に利用されているが、比較したい試料は2種類までという制限がある。しかしながら、遺伝子の機能解析では多数の疾病に罹患した細胞について、それぞれの疾病に特異的な遺伝子やいくつかの疾病に特異的な遺伝子、あるいは正常な状態のみで働く遺伝子など、様々な観点から分析を行いたいという要望がある。このため、2種類に限定した表示方法は必ずしも満足できるものではない。
【0008】
例えば、正常細胞Aと疾病Pに罹った細胞Bと疾病Qに罹った細胞Cの3種類を比較したい場合は、2つずつそれぞれ実験することになる。したがって、図3のような実験結果の表示が2つ得られる。具体的には、例えば正常細胞Aと疾病Pに罹った細胞Bを対象にした実験結果の表示と、正常細胞Aと疾病Qに罹った細胞Cを対象にした実験結果の表示である。これらにより、1種類の細胞の実験値をもとにして他の2種類を比べることが可能である。しかし、図3の表示を2つ並べてみても、これら3種類の細胞における遺伝子発現がどのようであるか、全体のおおまかな状況を一望して判断するのは困難である。
【0009】
さらに、一般には遺伝子の発現状況を調べるために、各時点でバイオチップを使った実験を行い、遺伝子ごとに発現データの時系列を表示して複数遺伝子の変化を把握しようとする。図9はその代表的なグラフ表示例である。図9(a)は、一つの遺伝子(遺伝子1)の発現強度が時間とともにどのように変化するかをグラフで表示したものである。また、図9(b)は、複数の遺伝子の時間変化を一つのグラフ上に表示したものである。図9(b)のグラフからは、グラフ中の丸で囲んだ部分(900)において、遺伝子1と遺伝子2と遺伝子3が、ある一定の時間区間内で協調して機能していると推測できる。
【0010】
しかしながら、これらのグラフ表示方法では、前記3種類の細胞における発現強度の比率に着目したデータに対しては、遺伝子発現がどのように関連しているか、全体の大まかな変化の状況を判断することは困難である。
それ故本発明では、従来技術の問題点を鑑み、1種類の遺伝子発現データをもとにして、他の複数遺伝子発現データを比較し、分類状況および変化の状況を把握するために有効なビジュアル表示を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明では、前記目的を達成すべく、2種類ごとの試料に対する遺伝子発現強度のデータを異なる実験結果の間で比較するため、共通に使用された試料のデータを媒介として3種類の試料に対する遺伝子発現強度を3次元表示する。具体的には、試料Aと試料Bに対する遺伝子発現強度データと試料Aと試料Cに対する遺伝子発現強度データを試料Aに対する遺伝子発現強度を媒介として一つの3次元データに変換し、球体内の点として表示する。さらにまた、試料Aと試料Bに対する遺伝子発現強度の比と試料Aと試料Cに対する遺伝子発現強度の比に着目して球面上へのマッピングを行うことで、各遺伝子の試料A,B及びCにおける発現状況を球面上の分布として表示する。これら、球体内の点の分布や球面上の点の分布をもとにクラスタ分析を行うことで、3種類の試料における遺伝子発現状況をビジュアルに把握することが可能になる。
【0012】
すなわち、本発明による遺伝子実験データ表示方法は、試料Aと試料Bを用いた実験で得られた試料Aと試料Bに対する複数の遺伝子の発現強度データと、試料Aと試料Cを用いた実験で得られた試料Aと試料Cに対する前記複数の遺伝子の発現強度データを、2つの実験で共通に用いられた試料Aに対する遺伝子発現強度データを媒介として結合し、結合によって得られた結果を表示することを特徴とする。
【0013】
試料Aと試料Bを用いて試料Aと試料Bに対する複数の遺伝子の発現強度データを取得する実験では、各遺伝子に試料Aと試料Bを等量混合した試料を作用させることで、試料Aと試料Bに対する実験条件を等しくするのが好ましい。同様に試料Aと試料Cを用いて試料Aと試料Cに対する複数の遺伝子の発現強度データを取得する実験では、各遺伝子に試料Aと試料Cを等量混合した試料を作用させることで、試料Aと試料Cに対する実験条件を等しくするのが好ましい。各遺伝子にハイブリダイズした試料Aと試料Bの量、あるいは試料Aと試料Cの量は、例えば試料Aと試料Bを異なる蛍光物質で標識しておき、試料Aと試料Cを異なる蛍光物質で標識しておくことで区別して検出することができる。
【0014】
2つの実験によって得られた、試料Aと試料Bに対する複数の遺伝子の発現強度データと、試料Aと試料Cに対する前記複数の遺伝子の発現強度データを、試料Aに対する遺伝子発現強度データを媒介として結合した結果の表示方法としては、例えば、試料Bに対する遺伝子発現強度をX軸にとり、試料Cに対する遺伝子発現強度をY軸にとって2次元表示する方法がある。この表示方法によると、実際に実験を行っていない試料Bと試料Cの間における各遺伝子の発現状態を視覚表示することが可能になる。
【0015】
また、2つの実験によって得られた、試料Aと試料Bに対する複数の遺伝子の発現強度データと、試料Aと試料Cに対する前記複数の遺伝子の発現強度データを、試料Aに対する遺伝子発現強度データを媒介として結合した結果の表示方法としては、X,Y,Z軸にそれぞれ試料A,B,Cに対する遺伝子の発現強度をとって前記複数の遺伝子の発現強度データを3次元表示する方法もある。この3次元表示方法によると、3種類の試料に対する各遺伝子の発現状態を一目で把握することができ、類似遺伝子の分類を容易に行うことが可能になる。
【0016】
遺伝子実験データを3次元表示する場合、各遺伝子の試料Aと試料Bに対する発現強度の比と、試料Aと試料Cに対する発現強度の比が保存されるように2つの実験における遺伝子の発現強度データを結合し、その結合によって得られた結果を球面上に表示するようにすることができる。さらに、球面上に表示された各遺伝子の表示位置に基づいてクラスタ分析し、クラスタ分析の結果求められた遺伝子グループを球面上の領域として表示するようにすることもできる。
【0017】
また、各遺伝子の試料Aと試料Bに対する発現強度の大小関係ならびに試料Aと試料Cに対する発現強度の大小関係が保存され、かつ各遺伝子の試料Aと試料Bに対する発現強度の比と、試料Aと試料Cに対する発現強度の比が保存されるように2つの実験における遺伝子の発現強度データを結合し、その結合によって得られた結果を球体内に表示するようにすることができる。このとき、球体は内部に位置するデータ点が見えるように半透明表示するのがよい。この場合においても、球体内に表示した各遺伝子の3次元位置に基づいてクラスタ分析し、クラスタ分析の結果求められた遺伝子グループを球体内の領域として表示するようにすることができる。
上記遺伝子実験データ表示方法において、発現強度データを時系列データとし、各遺伝子に対する各時点の発現強度データに基づく座標位置を時間経過の方向が分かるようにして複数表示することも有効な遺伝子実験データ表示方法である。
【0018】
座標位置を球面上に表示する場合には、球面上の表示位置を結ぶ矢印などによって時間経過の方向を示して表示するようにすればよい。また、座標位置を球体内に表示する場合には、球体内の3次元的な表示位置を結ぶ矢印などによって時間経過の方向を示して表示するようにすればよい。このように、球面上または球体内に表示された試料A・試料B・試料Cの表示位置を、時系列に従って計測した発現強度データに基づいて各遺伝子ごとに球面上または球体内に折れ線または曲線等によってトレースして軌跡を描くことにより、時間変化に対する遺伝子発現の状況を表示することが可能となる。
また、上述の遺伝子実験データ表示方法において、発現強度データを時系列データとし、クラスタ分析の結果求められた領域の時系列変化を表示することも有効な遺伝子実験データ表示方法である。
【0019】
領域の時系列変化は、例えば領域の移動、分割、併合などとして表示される。クラスタ分析の結果求められた遺伝子グループを球面上の領域として表示する場合には、領域の時系列変化も球面上の領域の移動、分割、併合などとして表示され、クラスタ分析の結果求められた遺伝子グループを球体内の領域として表示する場合には、領域の時系列変化も球体内の領域の移動、分割、併合などとして表示されることになる。この表示方法によると、複数遺伝子をまとめて考察する場合に、球面上または球体内に表示した遺伝子グループに対して、これを時系列に従って軌跡を計算し、遺伝子グループとしての移動・分割・合併などを描くことにより、時間変化に対する遺伝子発現の状況を表示できる。
本発明によると、複数の遺伝子発現に関する実験データを、視覚的に分かりやすく、そして遺伝子の機能・役割が推測しやすい形式によって表示することができる。
【0020】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1は本発明のシステム構成図である。本発明のシステムは、一連の細胞のプロセスにおいて遺伝子の発現の度合いを数値化したものを格納している遺伝子発現データ100、その発現データを視覚化して表示するための表示装置101、本システムへの値の入力や選択の操作を行うためのキーボード102やマウス103などの入力装置、遺伝子の発現過程に応じて発現データのクラスタリング等の処理を行なう処理部104から構成される。
【0021】
図2は、本発明の遺伝子実験データ表示方法の概略処理フローを示した図である。この処理フローに従って順次説明する。
まず、遺伝子発現データ100から処理部104へデータを読み込む(ステップ200)。図5に、実験結果である個々の遺伝子発現データの具体的な例を示す。図5は、2つの実験の結果例を示している。実験1では正常の細胞Aと疾病Pに罹患した細胞Bとを比較し、実験2では正常の細胞と疾病Qに罹患した細胞Cとを比較している。各実験の結果は、遺伝子IDをインデックスとする発現量(各細胞に標識した蛍光物質から発せられる蛍光輝度の測定値)として表にまとめてある。例えば実験1では、遺伝子ID1番の遺伝子に関して、バイオチップ上のハイブリダイゼーション反応で正常細胞Aに標識した蛍光色Rの輝度が1,234という数値で計測され、疾病Pに罹った細胞Bは標識した蛍光色Gの輝度が56という数値で計測された、ということを表している。対象遺伝子の総数は実験により異なるが、現在のバイオチップの実験装置としての能力に従い、数百から数万のオーダーまでを想定している。
【0022】
次に、遺伝子発現データの正規化処理を行う(ステップ201)。図5のようなデータとして保存されている測定値を、ある1つの実験に着目してグラフ上にプロットすると図3のようになる。これは上に述べた標準的な遺伝子発現データの表示例である。しかしながら、生の蛍光輝度の測定値には、通常、機器に起因する誤差やその時に生じた実験誤差などが含まれている。
【0023】
そこで本実施の形態では、実験測定値の補正用としてバイオチップ上に特定の遺伝子をスポットしたものを用意する。この遺伝子はコントロールと呼ばれ、その測定値は図3上では白丸でグラフ上にプロットされている。図3では、さらにコントロールとして利用されている遺伝子が希釈されて複数スポットされ、そのデータが複数の点としてプロットされている状況を示している。この例ではコントロールの原液、10分の1希釈液、100分の1希釈液、1000分の1希釈液の4点が打たれている。コントロールとしては、正常細胞か否かに関わらず一定の発現量を示すことが知られている既知の遺伝子を利用するので、図3のグラフでこれらの点は傾き45度の直線上に希釈の度合いに応じた間隔で並ぶべきものである。したがって、実験で得られた遺伝子発現データ全体を変換し、これらのコントロールを傾き45度の直線上に並べる処理を行う。これは各点の原点の周りの回転と拡大・縮小変換を組合わせることで行う。これらの処理を正規化処理と呼ぶ。この正規化処理を行った結果は、やはり図5と同様な構造をもつデータとして取得される。正規化処理後のコントロールデータは、図4のグラフに示すように傾き45度の直線上に並ぶ。
【0024】
次に、正規化処理後の遺伝子発現データをプロットした図4のグラフにおいて、遺伝子発現データの分析対象とする範囲を設定する(ステップ202)。測定値には輝度が小さすぎるものや大きすぎるものが含まれているので、ユーザ指定により下限の閾値Eと上限の閾値Mを設定する。これらは正規化処理後の図4での測定値のばらつきによって相対的に決めるものであるが、本方法では2つの実験結果を同時に比較して表示するため、2つの実験について共通の値を使用する。この分析対象範囲の設定により、図4において斜線で示した原点付近を除く扇形の領域に入る実験値のみ、以後の表示などの処理対象となる。
【0025】
扇形の分析対象領域に入るプロットについては2つの見方が可能である。一方は、正常細胞Aと疾病細胞Bのそれぞれの蛍光発現輝度の絶対量を比較して、この領域内での分布の近い・遠いといったプロットの集まり具合を判定するもので、これは、本発明では球体内にプロットして表示する表示方法に対応する。他方は、正常細胞Aと疾病細胞Bの蛍光発現輝度の相対的な大きさに着目するもので、これは例えばプロットと原点を結ぶ直線によって、図4の各遺伝子データに対応するプロット(黒丸の点)を大きな弧上に集め(白い四角の点)、その弧上で集まり具合を判定することと同等である。これは、本発明では球面上にプロットして表示する表示方法に対応する。
【0026】
次に、表示を行うため、遺伝子発現データのデータ変換を行う(ステップ203)。この変換は、各実験の発現輝度の相対比を保存する立体射影の計算に従う。具体的には以下の計算式で、各実験の測定値からそれぞれの遺伝子ごとに3次元表示用の座標値を求める。
【0027】
まず、図5における実験1の測定値(正常細胞Aの測定値、疾病細胞Bの測定値)を(a,b)、実験2の測定値(正常細胞Aの測定値、疾病細胞Cの測定値)を(A,c)と記号で表すことにする。このとき、これらの2つの測定値を比の値に着目し、共通して測定した正常細胞の値が1となるようにそれぞれ変換すると、(1,b/a)及び(1,c/A)を得る。これをまとめて3次元にした測定値(b/a,c/A,1)を用意する。次に、この3次元測定値を動径方向に拡大又は縮小し、本発明における球体表示又は球面表示とするための動径方向の拡大又は縮小量rとRを以下の計算式で求める。ここで、sqrt{ }は正の平方根を計算する関数とする。
【0028】
r=sqrt{(b/a)2+(c/A)2+1}
R=sqrt{b2+c2+(a+A)2}
このrとRを用いて、各座標値(x,y,z)は以下のように求まる。
(1) 球体内表示用座標値:((R/r)(b/a),(R/r)(c/A),R/r)
(2) 球面上表示用座標値:((K/r)(b/a),(K/r)(c/A),K/r)
ただし、上記の座標値中のKは、表示用球面の半径の値であり、表示する際に拡大・縮小をして見やすく調整するための定数値である。
【0029】
上記の計算によって得られた2つの座標値は、両方とも実験1および実験2で得られた発現強度の比を保存している。これは、3次元座標値をXZ平面およびYZ平面に射影することにより確認できる。2つの3次元座標で与えられる点を方向ベクトルだけに注目して、拡大または縮小のための係数R/rまたはK/rを除いて考えると、3次元方向ベクトル(b/a,c/A,1)で表される直線上にあることがわかる。これをXZ平面に射影するにはy座標値をゼロとすればよいから、射影結果として(b/a,0,1)という座標値を得る。これは方向ベクトルとしてみれば(b,0,a)と同じ方向であるから、z座標値とx座標値の比はa対bになっており、実験1による正常細胞Aの測定値と疾病細胞Bの測定値の比が保存されていることが分かる。同様にしてYZ平面に射影するにはx座標値をゼロにすればよいから、射影結果として(0,c/A,1)という座標値を得る。これは方向ベクトルとしてみれば(0,c,A)と同じ方向であるから、z座標値とy座標値の比はA対cになっており、実験2による正常細胞Aの測定値と疾病細胞Cの測定値の比が保存されていることが分かる。
【0030】
さらに、上記の計算によって得られた球体内表示用座標値は、実験1および実験2で得られた発現強度の大小関係を保存している。これは例えば、2種類の遺伝子に関する実験1の2つの測定値(a1,b1)と(a2,b2)に対して、
(1) 発現強度の比b1/a1とb2/a2が同じ値、
(2) a1の値がa2の値より小さい(したがってb1の値もb2の値より小さい)、
(3) 実験2の2つの測定値(A1,c1)と(A2,c2)がほぼ同じ値、
と仮定したとき、前記球体内表示用座標値をそれぞれXZ平面に射影した点が、XZ平面内の同じ直線上にあって、さらに原点からの距離に関して(a1,b1)に対応する射影点の方が近くにあることを意味している。実際、2つの射影点は発現強度の比が保存されるため、XZ平面内の同じ直線状にある。また原点からの距離はR/rの値で決まるが、前記仮定の(1)と(3)から、2種類の遺伝子に対して計算したrの値は同じになるため、その大小関係はRの値で決まることになる。Rの計算式によれば、前記仮定の(2)から(a1,b1)に対応する射影点の方が近くにあることが分かる。
【0031】
バイオチップ作成時には各スポットの量的な誤差による問題があるので、発現強度の比は、現在もっとも信頼できる定量的に測れる量である。したがって複数の実験結果を組合わせる場合にも、これらの比ついて定量性を保ったまま表示することが特に重要であると考えられる。本発明における球面表示に関しては、数理モデルとして2次元実射影平面となっているため、3つの実験値に関する2つの比の間の距離を球面上の大円の弧の長さで測って比べられるという利点がある。
【0032】
発現強度の大小関係については、二つの実験を組合わせる際にバイアスが入ってしまうので、完全に定量性を保ったまま3次元表示まで変換してゆくことは難しいが、その大きい・小さいという順序は保存することが可能である。この発現強度の大小関係は、ハイブリ反応の結果である蛍光発光の強さの観測値を反映しているものであるから、定量的には対数オーダーの量的違いがあり、その大まかな違いだけでも保存しておくことは、その後のクラスタ分析による遺伝子の分類に与える影響を考慮すると、重要な意味を持つと考えられる。
【0033】
次に、上で求めた3次元表示用の座標値を利用して、変換後の遺伝子発現データの表示を行う(ステップ204)。すなわち、各遺伝子ごとに座標値を計算して、X,Y軸からなる直交座標系あるいはX,Y,Z軸からなる3次元直交座標系内にプロットする。これらのデータは、X座標、Y座標、Z座標が共に正の原点を中心とする8分の1の半透明球体内もしくは球面上にプロットされる。この表示状態を例示したのが図6、図7及び図8である。
【0034】
図6は、試料Aと試料Bの実験結果と試料Aと試料Cの実験結果とを組み合わせて、試料Bと試料Cに対する遺伝子発現強度を比較表示した例を示す図である。
これは図3と同様の表示であるが、試料Bと試料Cを直接比較するためのバイオチップを利用した実験を行なっていない、という点が大きな違いである。この平面表示は、前記球体内表示用座標値の中で、x座標値とy座標値だけを部分的に取り出した平面表示用座標値:((R/r)(b/a),(R/r)(c/A))を各座標値(x,y)として、XY平面にプロットしたものである。
【0035】
図6の解釈のしかたは図3と同様で、試料Bと試料Cの発現量の比がある一定の値以上になるプロット(領域A:直線Y=mXより上方)、あるいはある一定の値以下になるプロット(領域B:直線Y=(1/m)Xより下方)が、試料Bと試料Cを比較した際に、どちらかに特異的に働く遺伝子を代表する発現データと推定することができる。
【0036】
図7は、半透明の球体内にプロットを行った遺伝子発現データの3次元表示例を示す図である。網掛けを施した空間領域が、図3における領域Aや領域Bなどに対応し、正常細胞A、疾病細胞B、疾病細胞Cそれぞれに特異的に働く遺伝子が観測される領域である。特に注目すべきところは、本実施の形態では疾病細胞Bと疾病細胞Cの比較実験は行っていない状況を想定しているが、試料Aと試料B、及び試料Aと試料Cの実験結果を図7のように組合わせて表示し、X−Y平面から高さHの範囲にある楔型の空間領域にプロットされる遺伝子に注目することで、疾病Bに特異的に働く遺伝子や疾病Cに特異的に働く遺伝子、あるいは共通に働く遺伝子の候補を視覚的に捕らえ選別することが可能となる。図8は、球面上にプロットを行った遺伝子発現データの表示例である。
【0037】
図2に戻って、最後に、表示した遺伝子発現データに対してクラスタ分析を行い、球体内もしくは球面上にそのクラスタ範囲を表示する(ステップ205)。図7及び図8には、球体内あるいは球面上にプロットを行った状況に加え、さらにクラスタ分析を行った結果を模式的に示してある。クラスタ分析は通常の多変量解析で利用される階層型アルゴリズムを想定している。例えば図8に示した球面上にプロットする表示方法の場合、2つのプロット間の距離は、もとの2つの実験の結果から保存されている発現量比に基づき、球面上の距離(2点間を繋ぐ大円の弧の長さ)で計るものとする。クラスタ併合のアルゴリズムは、ウォード法・群平均法・最短距離法・最長距離法・重心法・メディアン法など、どの方法を採ってもよい。図8では、正常細胞では働いていないが疾病細胞Bで特異的に機能する遺伝子のクラスタVや疾病細胞Cで特異的に機能する遺伝子のクラスタWが検出された状況を示している。
【0038】
以上のように図2に示した処理フローに従うことによって、試料Aと試料B、及び試料Aと試料Cの実験結果から図6に示したような試料Bと試料Cに対する遺伝子発現強度の比較表示、あるいは図7や図8に示したような遺伝子発現データの球体内もしくは球面上のプロット、及びクラスタ分析結果の表示が可能となる。また、前記3次元表示においてはユーザの視点方向ををマウスなどにより指定し、XYZ座標系を回転したり位置をずらしたりすることで、検出されたクラスタ見やすい位置に配置して確認することも可能である。
【0039】
さらに、遺伝子の時間変化に伴う発現状況を調べるために、各時点でバイオチップなどを使った実験行い、遺伝子ごとに発現データの時系列を表示して複数遺伝子の変化を把握しようとする場合、前記の球面上または球体内の表示を繰り返し実行して、その表示位置をつないでゆくことによって、時間変化を球面上または球体内に表示することが可能となる。
【0040】
図10は、図5に示した実験1の遺伝子発現強度データを、時間変化に従って蓄積した時系列発現データの例を示している。ここでは実験1に対応して配列を1つ用意し、一定時間間隔(1時間ごと、1週間ごとなど)のデータを配列の各要素に貯えるデータ構造を採っている。
【0041】
発現データの時間変化を表示させて折れ線や曲線などを描くためには、図10の配列のインデックスを逐次変化させ、繰り返し処理によって各要素に対応するデータに貯えた蛍光色の輝度を取り出し、球面上あるいは球体内の表示位置を決めてゆき、表示位置の間を矢印や補間曲線などを描く処理をすればよい。また、複数遺伝子を前記クラスタ分析により、遺伝子グループとして捉えたい場合は、変化の状況を遺伝子グループの移動・分割・併合などとして描画処理を行えばよい。
【0042】
表示の手順は、図2のフローの手順を各配列のインデックスごとに繰り返すことになる。ただし、一時点ごとのデータ処理を図2のフローに従って繰り返すのではなく、ステップ200のデータ読み込み部分やステップ201のデータ正規化処理など、フロー中の一部分の処理を一括して処理した後、結果表示を行うという手順をとることも可能である。
【0043】
図11は、前記球面上の表示において、遺伝子発現データの時間変化を表示した表示例を示す図である。
表示1100は、一つの遺伝子(遺伝子1)に着目し、その遺伝子に関する発現データを逐次計算して、その時間変化を球面上の軌跡として、折れ線矢印で表示位置を繋いだものである。この例では、最初、正常細胞A中で強く発現していた遺伝子1が、疾病Cに罹患した細胞中でも、時間が経つにつれて、遅れたかたちで発現してきている状況が推測できる。
【0044】
また、表示1101は、前記クラスタ分析によって計算した遺伝子クラスタVの球面上の表示であり、図11ではこれが時間経過とともに遺伝子クラスタV1(1102)と遺伝子クラスタV2(1103)に分裂して2つのグループに分かれていった状況を、球面上の部分領域とそれを繋ぐ曲線矢印で表している。この例では、最初、特に疾病細胞B中で強く発現していた遺伝子グループが2つのグループになり、片方が正常細胞A中でも働き疾病細胞C中ではほとんど働かないもの、他方が疾病細胞C中でも働き正常細胞A中ではほとんど働かないもの、へと分かれていった状況が推測できる。
【0045】
図12は、球面上における遺伝子発現データの時間変化表示の解釈に関して、模式的に説明した図である。図12は、図11の球面表示用に用意した8分の1球面領域を、三角形の領域として展開して対応づけ、球面内の部分領域を三角形内の部分領域として捉えた球面内領域の模式図である。例えば三角形領域中の上部の菱形領域aは、図11の球面上でZ軸方向の最も上方にある球面内の部分領域に対応している。
【0046】
これらの三角形内の部分領域をまたがって、遺伝子または遺伝子グループの発現データ表示位置が遷移する場合、遺伝子の発現状況の時間変化として解釈し、遺伝子の働きの変化を推測することができる。例えば、最初領域bに表示されていた遺伝子クラスタV(1201)が、領域pや領域cに遷移して遺伝子クラスタV1(1202)や遺伝子クラスタV2(1203)へ移動して表示された場合、着目している遺伝子グループは、初めは特に試料Bにおける発現強度が著しかったが、試料Cにおける発現の方が次第に相対的に強くなっていった状況が推測できる。一方、遺伝子クラスタV(1201)が領域oに遷移して遺伝子クラスタV3(1204)が表示された場合、着目している遺伝子グループは、最初の試料Bにおける発現が著しかった傾向がなくなり、試料A・試料B・試料Cのいずれでも特に偏りなく遺伝子グループが働くようになっていった状況が推測できる。
【0047】
図13は、前記球体内の表示において、遺伝子発現データの時間変化を表示した表示例を示す図である。
表示1300は一つの遺伝子(遺伝子2)に着目し、遺伝子2に関する発現データを逐次計算して、その時間変化を球体内の軌跡として、折れ線矢印で表示位置を繋いだものである。この例では、最初正常細胞A及び疾病Bに罹患した細胞中で中程度に発現していた遺伝子2が、時間が経つにつれて、細胞Aや細胞Bでの発現は弱くなると共に、疾病Cに罹患した細胞中で、特に強く発現してきている状況が推測できる。
【0048】
また、1301は前記クラスタ分析によって計算した遺伝子クラスタWの球体内の表示であり、図13ではこれが時間経過とともに遺伝子クラスタW1(1302)と遺伝子クラスタW2(1303)に分裂して2つのグループに分かれていった状況を、球体内の部分領域とそれを繋ぐ曲線矢印で表している。この例では、最初特に疾病細胞C中で中程度に発現していた遺伝子グループが2つのグループになり、片方が正常細胞A中ではほとんど発現せず疾病細胞Bおよび疾病細胞C中でも発現強度は同じくらいで中程度以下のもの、他方が疾病細胞B中でより強く発現し正常細胞Aおよび疾病細胞C中ではほとんど発現しないもの、へと分かれていった状況が推測できる。
【0049】
これらの表示方法が有効である具体的な実験としては、例えば以下のような実験を行い、遺伝子発現レベルの時間変化を調べたい状況が考えられる。
(1) 疾病Xの罹患状況に関し、患者の体質Aタイプ・Bタイプ・Cタイプを比較する実験
(2) 微生物(細菌など)の活動状況に関し、株A・株B・株Cを比較する実験
(3) ある生物種の発生過程において、頭部・胴体・四肢など、3箇所の部位における複数遺伝子の発現状況を比較する実験
(4) 3種類の臓器(肝臓・腎臓・心臓など)における遺伝子発現の差異を検出するための実験
【0050】
本表示方式によれば、これらの実験は、例えばAとB、およびAとCの実験を時間変化に従って観測しデータ収集するだけで、BとCの比較表示か可能となり、BとCを比較するための時間経過に従った実験を省略することができるため、実験労力の削減においても効果がある。
以上述べたように、時系列に観測した試料Aと試料B、及び試料Aと試料Cの実験結果から、図11に示したような遺伝子発現データの球面上のプロット及びクラスタ分析結果の時系列の表示、もしくは図13に示したような遺伝子発現データの球体内のプロット及びクラスタ分析結果の時系列の表示ができるようになり、複数遺伝子間の時系列変化に関する遺伝子機能推測が可能となる。
【0051】
【発明の効果】
以上説明したように、本発明によれば、1種類の遺伝子発現データをもとにして、2つの実験結果から他の複数遺伝子発現データを比較し、分類状況および変化の状況を大まかに把握するために有効な球体内もしくは球面上のビジュアル表示を提供することができる。
【図面の簡単な説明】
【図1】システム構成図。
【図2】概略処理フローを示す図。
【図3】標準的遺伝子発現データ分析結果表示例(平面状)の説明図。
【図4】発現データの分析対象範囲の設定例の説明図。
【図5】遺伝子発現実験の具体的データ例を示す図。
【図6】遺伝子発現データの表示例を示す図。
【図7】遺伝子発現データの表示例(球体内)を示す図。
【図8】遺伝子発現データの表示例(球面上)を示す図。
【図9】標準的遺伝子発現データの時間変化の表示例を示す図。
【図10】遺伝子発現実験の時系列に従った具体的データ例を示す図。
【図11】遺伝子発現データの時間変化の表示例(球面上)を示す図。
【図12】遺伝子発現データの時間変化表示(球面上)の解釈に関する模式的説明図。
【図13】遺伝子発現データの時間変化の表示例(球体内)を示す図。
【符号の説明】
100 遺伝子発現データ
101 表示装置
102 キーボード
103 マウス
104 処理部
800 表示用球面
801 遺伝子クラスタU
802 遺伝子クラスタV
803 遺伝子クラスタW
Claims (6)
- 複数の遺伝子について、試料A及び試料Bを等量混合して用いた第1の実験及び試料A及び試料Cを等量混合して用いた第2の実験で得られた発現強度データを記憶する記憶部と、処理部と、表示部とを備えたコンピュータにおいて、
前記処理部により、
前記複数の遺伝子の各々について、
試料Bの発現強度をb、試料Aの発現強度をaとすると、第1の実験における試料Bに対する発現強度と試料Aに対する発現強度との第1の比の値(b/a)を計算し、
試料Cの発現強度をc、試料Aの発現強度をAとすると、第2の実験における試料Cに対する発現強度と試料Aに対する発現強度との第2の比の値(c/A)を計算し、
前記表示部により、
3次元グラフに前記複数の遺伝子をプロット表示する方法であって、
前記3次元グラフにおいて前記複数の遺伝子のプロット全てが座標原点から等距離Kの球面上に位置するように、前記複数の遺伝子の各々について、前記第1の比の値、前記第2の比の値、定数1の各々に共通の第1の係数(K/r)を掛けた値を3軸に取り、前記球面とともに表示することを特徴とする遺伝子実験データ表示方法。
ここで、r=((b/a) 2 +(c/A) 2 +1) 1/2
Kは表示用球面の半径の値 - 複数の遺伝子について、試料A及び試料Bを等量混合して用いた第1の実験及び試料A及び試料Cを等量混合して用いた第2の実験で得られた発現強度データを記憶する記憶部と、処理部と、表示部とを備えたコンピュータにおいて、
前記処理部により、
前記複数の遺伝子の各々について、
試料Bの発現強度をb、試料Aの発現強度をaとすると、第1の実験における試料Bに対する発現強度と試料Aに対する発現強度との第1の比の値(b/a)を計算し、
試料Cの発現強度をc、試料Aの発現強度をAとすると、第2の実験における試料Cに対する発現強度と試料Aに対する発現強度との第2の比の値(c/A)を計算し、
前記表示部により、
3次元グラフに前記複数の遺伝子をプロット表示する方法であって、
前記複数の遺伝子の各々について、前記第1の比の値、前記第2の比の値、定数1の各々に共通の第1の係数(1/r)と共通の第2の係数(R)を掛けた値を3軸に取り、前記複数の遺伝子の各々を、前記第2の係数の最大値を半径とする球状領域内に表示することを特徴とする遺伝子実験データ表示方法。
ここで、r=((b/a) 2 +(c/A) 2 +1) 1/2
R=(b 2 +c 2 +(a+A) 2 ) 1/2 - 請求項1記載の遺伝子実験データ表示方法において、前記球面上に表示された各遺伝子のプロット表示位置に基づいてクラスタ分析し、クラスタ分析の結果求められた各遺伝子グループが球面上に占める領域を表示することを特徴とする遺伝子実験データ表示方法。
- 請求項2記載の遺伝子実験データ表示方法において、前記球状領域内に表示した各遺伝子のプロット表示位置に基づいてクラスタ分析し、クラスタ分析の結果求められた各遺伝子グループが球状領域内に占める領域を表示することを特徴とする遺伝子実験データ表示方法。
- 請求項1又は2記載の遺伝子実験データ表示方法において、
前記記憶部は、前記複数の遺伝子の複数の時点における発現強度データを記憶しており、
各遺伝子について各時点のプロットを経時的推移が分かるようにして表示することを特徴とする遺伝子実験データ表示方法。 - 請求項3又は4記載の遺伝子実験データ表示方法において、
前記記憶部は、前記複数の遺伝子の複数の時点における発現強度データを記憶しており、
各時点において前記各遺伝子グループが占める各領域について、経時的推移が分かるようにして表示することを特徴とする遺伝子実験データ表示方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000280052A JP4320112B2 (ja) | 2000-03-27 | 2000-09-14 | 遺伝子実験データ表示方法 |
EP01107168A EP1146127A3 (en) | 2000-03-27 | 2001-03-22 | Method for displaying gene experiment data |
US09/819,179 US7010430B2 (en) | 2000-03-27 | 2001-03-27 | Method for displaying gene experiment data |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000086818 | 2000-03-27 | ||
JP2000-86818 | 2000-03-27 | ||
JP2000280052A JP4320112B2 (ja) | 2000-03-27 | 2000-09-14 | 遺伝子実験データ表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001340079A JP2001340079A (ja) | 2001-12-11 |
JP4320112B2 true JP4320112B2 (ja) | 2009-08-26 |
Family
ID=26588444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000280052A Expired - Fee Related JP4320112B2 (ja) | 2000-03-27 | 2000-09-14 | 遺伝子実験データ表示方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7010430B2 (ja) |
EP (1) | EP1146127A3 (ja) |
JP (1) | JP4320112B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050071140A1 (en) * | 2001-05-18 | 2005-03-31 | Asa Ben-Hur | Model selection for cluster data analysis |
JP2007034343A (ja) * | 2005-07-21 | 2007-02-08 | Fujitsu Ltd | 遺伝子情報表示装置、遺伝子情報表示方法、遺伝子情報表示プログラム、および記録媒体 |
CA2740334C (en) | 2010-05-14 | 2015-12-08 | National Research Council | Order-preserving clustering data analysis system and method |
JP5812269B2 (ja) * | 2011-08-25 | 2015-11-11 | 横河電機株式会社 | 相関表示装置 |
CN105335626B (zh) * | 2015-10-26 | 2018-03-16 | 河南师范大学 | 一种基于网络分析的群lasso特征分群方法 |
JP6564543B1 (ja) * | 2019-03-14 | 2019-08-21 | 株式会社 日立産業制御ソリューションズ | データの三次元可視化方法、データの三次元可視化プログラム、および、データの三次元可視化システム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5751931A (en) * | 1995-04-18 | 1998-05-12 | Lucent Technologies Inc. | Three dimensional graphical display of information |
US6420108B2 (en) * | 1998-02-09 | 2002-07-16 | Affymetrix, Inc. | Computer-aided display for comparative gene expression |
US5986673A (en) * | 1997-10-17 | 1999-11-16 | Martz; David R. | Method for relational ordering and displaying multidimensional data |
-
2000
- 2000-09-14 JP JP2000280052A patent/JP4320112B2/ja not_active Expired - Fee Related
-
2001
- 2001-03-22 EP EP01107168A patent/EP1146127A3/en not_active Ceased
- 2001-03-27 US US09/819,179 patent/US7010430B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1146127A2 (en) | 2001-10-17 |
JP2001340079A (ja) | 2001-12-11 |
EP1146127A3 (en) | 2004-08-25 |
US7010430B2 (en) | 2006-03-07 |
US20020049543A1 (en) | 2002-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6420108B2 (en) | Computer-aided display for comparative gene expression | |
US7750908B2 (en) | Focus plus context viewing and manipulation of large collections of graphs | |
Saeed et al. | [9] TM4 microarray software suite | |
US6897875B2 (en) | Methods and system for analysis and visualization of multidimensional data | |
US7317820B2 (en) | System and method for automatically identifying sub-grids in a microarray | |
US20040080536A1 (en) | Method and user interface for interactive visualization and analysis of microarray data and other data, including genetic, biochemical, and chemical data | |
JPH10272000A (ja) | コンピュータを利用した生物学的配列の解析技術 | |
WO2002030265A2 (en) | Method and display for multivariate classification | |
JP4320112B2 (ja) | 遺伝子実験データ表示方法 | |
US6502039B1 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
US20040213446A1 (en) | System and method for automatically processing microarrays | |
McShane et al. | Statistical issues in the design and analysis of gene expression microarray studies of animal models | |
Hackl et al. | Analysis of DNA microarray data | |
AU783409B2 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
US7031843B1 (en) | Computer methods and systems for displaying information relating to gene expression data | |
JP3880361B2 (ja) | 蛍光シグナル処理方法及びハイブリダイゼーション反応結果表示方法 | |
Ronquist et al. | Insight into dynamic genome imaging: Canonical framework identification and high-throughput analysis | |
Kincaid | VistaClara: an interactive visualization for exploratory analysis of DNA microarrays | |
JP4557609B2 (ja) | スプライスバリアント配列のマッピング表示方法 | |
Wessel et al. | CorrXpression–identification of significant groups of genes and experiments by means of correspondence analysis and ratio analysis | |
JP4271688B2 (ja) | バイオチップ | |
Wilson et al. | Experimental design and analysis of microarray data | |
JP2004355269A (ja) | クラスタ判別結果表示方法 | |
Bakewell et al. | Toward'smart'DNA microarrays: algorithms for improving data quality and statistical inference | |
Grużdź et al. | Interactive SOM-based gene grouping: An approach to gene expression data analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090423 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090601 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120605 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150605 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |