JP3773092B2 - 遺伝子発現パターン表示方法および装置並びに記録媒体 - Google Patents

遺伝子発現パターン表示方法および装置並びに記録媒体 Download PDF

Info

Publication number
JP3773092B2
JP3773092B2 JP2000088695A JP2000088695A JP3773092B2 JP 3773092 B2 JP3773092 B2 JP 3773092B2 JP 2000088695 A JP2000088695 A JP 2000088695A JP 2000088695 A JP2000088695 A JP 2000088695A JP 3773092 B2 JP3773092 B2 JP 3773092B2
Authority
JP
Japan
Prior art keywords
data
expression pattern
gene
displayed
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000088695A
Other languages
English (en)
Other versions
JP2001281244A (ja
Inventor
亮 中重
康行 野崎
恒彦 渡辺
卓郎 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2000088695A priority Critical patent/JP3773092B2/ja
Priority to DE60024029T priority patent/DE60024029T2/de
Priority to EP00121116A priority patent/EP1089211B1/en
Priority to US09/677,042 priority patent/US7031847B1/en
Publication of JP2001281244A publication Critical patent/JP2001281244A/ja
Application granted granted Critical
Publication of JP3773092B2 publication Critical patent/JP3773092B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、特定の遺伝子とハイブイリダイズさせることによって得られた時系列の遺伝子発現パターンデータを視覚的に分かり易く、そして遺伝子の機能・役割が推測し易い形式で表示するための遺伝子発現パターン表示方法および装置に関するものである。
【0002】
【従来の技術】
従来、ゲノム配列が決定された種の増加に伴い、進化に対応すると見られる遺伝子を見つけ出し、どの生物にも共通に持っていると考えられる遺伝子の集合を探したり、それから逆に種に個別な特徴を推測するなど、種間の遺伝子の違いから何かを見出そうとする、いわゆるゲノム比較法が盛んに行われてきた。
【0003】
しかし近年、DNAチップやDNAマイクロアレイなどのインフラストラクチャの発達によって、分子生物学の興味は、種間の情報から種内の情報へ、すなわち同時発生解析へと移りつつあり、これまでの種間の比較と合わせて、情報の抽出から関連付けの場が大きく広がりを持ち始めている。
【0004】
例えば、既知の遺伝子と同一の発現パターンを示す未知の遺伝子が見つかれば、それが既知の遺伝子と同様の機能があると類推できる。これら遺伝子や蛋白質そのものの機能的な意味付けは、機能ユニットや機能グループといった形で研究されている。また、それらの間の相互作用も、既知の酵素反応データや物質代謝データとの対応付けによって、あるいはより直接的に、ある遺伝子を破壊あるいは過剰反応させ、その遺伝子の発現をなくすか、あるいは多量に発現させ、その遺伝子の直接的および間接的影響を、全遺伝子の発現パターンを調べることによって解析している。
【0005】
この分野において成功した事例として、スタンフォード大学のP.Brownらのグループによるイースト菌の発現解析が挙げられる(Michel B.Eisen et al.:Cluster analysis and display of genome-wide expression patterns:Proc.Natl.Acad.Sci.(1998)Dec 8;95(25):14863-8)。彼らは、DNAマイクロアレイを用いて、細胞から抽出した遺伝子を時系列にハイブリダイズさせ、遺伝子の発現の度合い(ハイブリダイズした蛍光シグナルの輝度)を数値化した。数値に色を対応させることで、遺伝子の個々の発現過程を分かり易く表示させている。このとき、細胞の一連のサイクルにおいて発現パターンの過程が近い遺伝子同士(任意の時点での発現の度合いが近いもの同士)をクラスタリングしている。
【0006】
図12は、この方法にそって遺伝子の発現状態1200を表示した例であり、横方向に実験ケース、縦方向に遺伝子を並べている。また左側の樹状図は、クラスタリングの過程で、最も近い2つのクラスタ毎に併合されてきた状況を表しており、各枝の長さは併合時の2つのクラスタ間距離に対応している。なお、図12における1つの枠1201が1つの遺伝子のある時刻における発現状態を示すものであり、図12では白黒の濃度を変えて発現状態を模式的に示している。
このような表示方法をとることにより、共通のクラスタに属する遺伝子は、共通の機能的性質をもつ可能性があると類推することができる。
【0007】
【発明が解決しようとする課題】
ところが、実際の遺伝子発現パターンの分析では、図12と同様な大量のデータをクラスタリングすることになる。遺伝子の種類に関しては、数千から一万、最大では十万を超える量であり、実験ケースも10程度のオーダーから数十、数百など、任意の個数のデータを用意することが出来る。このため、図12の樹状図の部分も非常に複雑な、細かな枝を多量に含んだものになる。
この状況を表わしたものが図13である。大量の遺伝子発現パターンデータを対象にしたクラスタリングの結果全体が図13の左側の部分である。また、右側の点線1301で囲んだ部分は、結果全体のうちユーザが実際に注目して分析結果の詳細を見るため、ウィンドウ枠などで範囲を限定した状況を示している。
このようにして得られた樹状図1302は、クラスタの最も近いものを2つずつ併合してきた過程を正確に表わしているが、この表示を見て遺伝子のグループ分けを判断・推測するユーザが見て、どのくらいのクラスタ数で大まかな分類ができているのかを判断するのは難しい、という難点がある。
ユーザは、例えば十くらい、百くらいの大まかな分類の仕方を提示してもらえるほうがありがたい。すなわち、大きな差異がある分類段階を自動的に計算し、例えば7クラスの場合、28クラスの場合、105クラスの場合、372クラスの場合など、メニューとしての提示があれば、ユーザは細かな差異によるクラスタリングの影響に煩わされることなく、大まかな粒度に応じた適切な分類結果を選択して、遺伝子のグループ分けを考察することができる。
【0008】
本発明は、このような従来技術の問題点を鑑み、クラスタリングの結果から、より大まかな分類結果を自動的に抽出し、ユーザが適切な分類結果を選択して分かり易く表示し、遺伝子のグループ分けを考察することができるようにする遺伝子発現パターン表示方法および装置を提供することを目的とする。換言すれば、上述したクラスタリングの過程で、分類間の隔たりが大きくなるようなクラスタリング結果として、複数の段階を用意し、効果的に表示することができる遺伝子発現パターン表示方法および装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明では、前記目的を達成するために、遺伝子の発現パターンのデータをクラスタ分析した結果に対し、識別誤差範囲を考慮した段階別クラスタ概数を表示するステップを備えることを特徴とする。
例えば、クラスタリング処理過程で、ユーザの指定した識別誤差範囲を超える分類結果を複数保持しておき、結果の表示において、ユーザへ大まかな分類結果を複数提示する。
結果の表示においては、複数の分類結果の中からある分類を選択するための区間スケールバーと樹状図の切断線を用意する。ユーザは、区間スケールバー上の樹状図切断線を動かすことによって、特定の分類を選択できる。樹状図切断線を動かす際には、その位置での分類結果で幾つかのクラスタに分かれているかを明示するために、その遺伝子グループ数を表示する。また、遺伝子発現パターンデータの表示部分には、その樹状図切断線位置での遺伝子グループ間の境界線を引き、一定規模以上の遺伝子グループを明示的に強調表示する。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1は本発明の遺伝子発現パターン表示方法を適用した遺伝子発現パターン解析装置の一実施形態を示すシステム構成図である。この実施形態の解析装置は、一連の細胞のプロセスにおいて遺伝子の発現の度合いを数値化した遺伝子発現パターンデータ100を格納している記憶装置(またはデータベース)101、その発現パターンデータを視覚化して表示するための表示装置102、本システムへの値の入力や選択の操作を行うためのキーボード103、マウス104、遺伝子の発現過程に応じて発現パターンデータ100のクラスタリングを行なう表示処理部105から構成される。表示処理部105は、コンピュータと表示のための処理を行うプログラムによって具体化されるものである。なお、記憶装置101は、ネットワークを介して表示処理部105と結合することも可能である。
【0011】
図2は、本発明によるクラスタ分析結果の表示例である。
図2は、大量の遺伝子発現パターンデータを対象にしたクラスタリングの結果全体を示した図13左側部分の一部を基に表示したものであり、図13の右側の点線1301で囲まれた部分に対応している。もちろん、本発明は、図2自体がクラスタリング結果の全体となり、図13の左側と図2が一致する場合も含むものである。
図2では、区間スケールバー201上を動くことが可能な樹状図切断線202が、ユーザによるマウス104などのポインティングデバイスを利用した指示により、区間スケールバー201上の第2区間(▲2▼)に置かれた状況を示している。第2区間上では、この区間での分類によって遺伝子グループが3個出来ているという情報(クラスタ概数)203を示している。
さらに、遺伝子発現パターンデータ200の部分には、この分類に対応した境界線204を引き、遺伝子グループA,B,Cとして分類結果に対する強調表示205を行っている。
【0012】
図3は、記憶装置101に格納された遺伝子発現パターンデータ100の具体的な構造を示したものである。ここで例示する遺伝子発現パターンデータ100には、各遺伝子の遺伝子ID(geneID)301に対応してm個のベクトルデータ302がある。配列のインデックスはn個の実験ケースに対応し、配列要素の中身には、遺伝子の発現の度合い(ハイブリダイズした蛍光シグナルの輝度)を数値化したデータを格納している。
【0013】
図4はクラスタリング処理において利用するクラスタ構造体の例を示すものである。クラスタ構造体には2種類あり、typeメンバの値がleafのもの(左側)401とnodeのもの(右側)402に分かれる。
leaf型クラスタ構造体401は、各遺伝子ごとの発現パターンデータ、すなわち、図3の各配列データに対応するもので、その遺伝子IDの値をgeneIDメンバの値(例えば17)として設定する。また、クラスタとしてのlevelはゼロに設定する。
node型クラスタ構造体402はクラスタリングにおける併合処理において逐次生成するもので、併合前の2つのクラスタをleftメンバの値とrightメンバの値から辿れるようにし、また、それらの間の距離をdistanceメンバの値として保持する。クラスタとしてのlevelは、識別誤差範囲の値に応じて(例えば5)設定する。
【0014】
図5は、クラスタ分析の過程で生成するデータ構造を示した図である。クラスタ構造体は、最初leaf型の構造体401だけを用意するが、クラスタ分析の過程で2つずつ併合し、その度にnode型クラスタ構造体402を生成してトリー構造を組み立てる。node型クラスタ構造体402はそれを生成した順に、逐次、配列node_clusters[]から辿れるようにポインタを張ってゆく。変数nclus501は、これまで生成したnode型クラスタ構造体402の総数を保持する変数である。
【0015】
図6は、区間スケールバー201や、ある分類結果における遺伝子グループ数の情報203、遺伝子グループ間の境界線204を引くための表示情報を保持するためのデータ構造例を示した図である。区間スケールバー201上の区間に対応するinterval構造体601は、識別誤差範囲を考慮した分類決定処理の過程で逐次生成されて、配列intervals[]602から辿れるようにポインタを張ってゆく。変数levelは、これまで生成したinterval構造体の総数を保持する変数である。
各interval構造体601は、メンバ名としてnum_clust、min_dist、max_dist、bordersがあり、num_clustメンバには、その分類における遺伝子グループ数情報が、min_distメンバとmax_distメンバには、クラスタ間距離に関する区間の上限値と下限値が、bordersメンバには、遺伝子発現パターンデータ200中の境界線を引く位置(行番号)を設定する。
また、配列disp_leaf_clusters[]603には、遺伝子発現パターンデータ200の各行に、図3中のどの遺伝子IDに対応するベクトルデータを表示するかを決定するため、第i行に対応する第i番目の配列要素として表示する遺伝子IDの値を設定する。
【0016】
図7は、本発明の遺伝子発現パターン表示方法における概略処理手順を示すフローチャートである。
まず、記憶装置101に格納された遺伝子発現パターンデータ100を表示処理部105へ読み込む(ステップ700)。この場合、個々の発現パターンデータ100の具体的な構造は、図3に示したものである。
次に、クラスタ分析に必要な各種パラメータを設定する(ステップ701)。この設定段階で、キーボード103を用いたユーザから識別誤差範囲の値の入力を受付け、変数Eに保持する。この識別誤差範囲の値は、図3に示した遺伝子ごとの発現パターンデータを2つずつ、距離や非類似度、類似度などの尺度に基いて比較する際、この値以上の差異があれば別のデータとして識別すべきである、という閾値を意味している。
各種パラメータ設定の後、クラスタ分析を行う(ステップ702)。このクラスタ分析の処理の間に、本発明の表示に必要な情報を収集し、表示用データの計算を行う。これについては、後で詳しく説明する。
最後に分析結果の表示を行う(703)。ここで、先に収集し、計算しておいた表示用のデータを用い、本発明に特有な表示(図2における区間スケールバー201、樹状図切断線202、遺伝子発現パターンデータ中の境界線204、遺伝子グループの強調表示205)を行う。
ここで、遺伝子グループの強調表示205を行う際には、所定数以上の遺伝子発現データが1つのクラスタとしてまとめられている場合に限って表示し、少数の遺伝子発現データで構成されたクラスタに対しては、遺伝子グループとしての表示を行わない、などの方法も可能である。
【0017】
図8は、図7におけるクラスタ分析(ステップ702)の処理の詳細を示すフローチャートであり、第一段階として実行するクラスタ木の生成処理に関するフローチャートである。
図8において、まず、図3に示した各遺伝子ID301に対応するm個のベクトルデータ302をm個のleaf型クラスタ構造体401とし、併合対象クラスタとして登録する(ステップ800)。次に、併合対象クラスタ数cnumの値をm、これまで生成したnode型クラスタ構造体402の数nclusを「0」として初期化する(ステップ801)。さらに、併合対象クラスタの数cnumが「1」に等しいかどうか判定し(ステップ802)、等しくない場合、「1」になるまで以下の一連の処理を繰り返す。
【0018】
最初に、登録された併合対象のクラスタ構造体から相対距離最小の2つのクラスタを選択する(ステップ803)。次に、node型クラスタ構造体Cを新規に生成し(ステップ804)、node型クラスタ数をインクリメントする(ステップ805)。そして、配列node_clusters[]の第nclus番成分に新しいnode型クラスタ構造体を登録する(ステップ806)。さらに、新しいnode型クラスタ構造体のleftメンバ、rightメンバ、distanceメンバに、先にステップ803で選択した2つのクラスタ、およびその間の距離を登録する(ステップ807)。
ここで、2つクラスタのどちらをleftメンバとし、残りをrightメンバとするかについて、予め判定基準を設ける方法を採ることも可能である。
最後に、この2つのクラスタ構造体を併合対象クラスタ構造体から除外、新しいnode型クラスタ構造体を登録し(ステップ808)、併合対象クラスタ数cnumの値をデクリメントする(ステップ809)。
ステップ802の判定においてcnumの値が「1」に等しくなった場合は、図9のフローチャートに示す処理(クラスタレベルの設定)に継続する。
【0019】
図9は、第2段階として実行するクラスタレベルの設定処理に関するフローチャートである。
第1段階の処理で生成されたnode型クラスタ構造体はすべて配列node_clusters[](図5)に登録されており、そのdistanceメンバの値は配列のインデックスに従って一般に昇順データをなっているが、クラスタリングのアルゴリズムの選択によっては、必ずしも昇順とはならない可能性がある。このため、まず、配列node_clusters[]に登録された各node型クラスタ構造体のdistanceメンバを検証する(ステップ900)。
この検証の結果、昇順になっていない場合、node_clusters[]を昇順になるようにソート処理を施す、あるいは昇順になっていない場所だけ検出して別の処理を行う。
【0020】
次に、各種変数の初期値を設定する(ステップ901)。具体的には、配列node_clusters[]用カウンタi(初期値1)、クラスタレベルlevel(初期値0)、処理中のnode型クラスタのdistanceメンバ値curr_dist(初期値0)、前回処理したnode型クラスタのdistanceメンバ値prev_dist(初期値0)を設定する。
そして、カウンタiの値と変数nclusの値を比較することにより、配列node_clusters[]の各要素に対して、以下の一連の処理を実行する(ステップ902)。
【0021】
まず、i番目のnode型クラスタのdistanceメンバ値を変数curr_distに保持し(ステップ903)、変数curr_distの値とprev_distの値の差がユーザにより指定された識別誤差範囲Eの値より小さいかどうかを判定する(ステップ904)。
その差がEの値より小さくない場合は、まず変数levelの値をインクリメントする(ステップ905)。そして、新しくinterval構造体を生成し、そのmin_distメンバにprev_distの値を、max_distメンバにcurr_distの値を、num_clustメンバに(nclus - i + 1)の値を設定し、このinterval構造体自体を配列intervals[]の第level番目の要素として登録する(ステップ906)。ここで、bordersメンバにはデフォルト値として空集合{}を設定しておく。
【0022】
ステップ904の判定において、curr_distの値とprev_distの値の差がEの値より小さい場合には、ステップ905とステップ906の処理を省略し、以下の処理に継続する。
また、node_clusters[i]に登録されたnode型クラスタ構造体のlevelメンバ値として、変数levelの値を登録する(ステップ907)。
最後に、curr_distの値をprev_distに移し、カウンタiの値をインクリメントして(ステップ908)、ステップ902に戻る。
配列node_clusters[]のすべての要素に対して、ステップ903からステップ908までの処理を実行し終えたら(ステップ902)、図10の処理に継続する。
【0023】
図10は、図7におけるクラスタ分析(ステップ702)の処理の詳細を示すフローチャートであり、第3段階として実行する表示用データの作成処理に関するフローチャートである。
まず、配列disp_leaf_clusters[]のインデックスを保持する変数jの値を「1」とし、次の表示用データ作成処理(処理A)に渡す引数clusterの値を、配列node_clusters[]の第nclus番目の要素が指すnode型クラスタ構造体として設定する(ステップ1000)。
そして、clusterを引数として、処理A:表示用データ作成処理ルーチンを呼び出す(ステップ1001)。このステップ1001では、処理Aを再帰的に呼び出し、図8のフローで作成したクラスタ木の構造に従ってトリーウォークを実行する過程で、表示用のデータを収集し、計算している。この再帰的な処理が終了した段階で、クラスタ分析の処理を終了する。
【0024】
図11は、図10における処理A:表示用データ作成処理(ステップ1001)の詳細を示すフローチャートである。
まず、引数culsterで渡されたクラスタ構造体のtypeメンバの値を検査する(ステップ1100)。
その結果、leaf型クラスタ構造体であった場合、配列disp_leaf_clusters[]の第j番目の要素として、そのクラスタのgeneIDメンバの値を設定し(ステップ1101)、jの値をインクリメントする(ステップ1102)。
【0025】
また、引数clusterで渡されたクラスタがnode型クラスタ構造体であった場合、まずleftメンバのクラスタを引数とした処理Aの再起呼び出し(ステップ1103)を行い、次に自分のクラスタに関する処理(ステップ1104からステップ1106まで)を行い、最後にrightメンバのクラスタを引数とした処理Aの再起呼び出し(ステップ1107)を行う。
【0026】
自分のクラスタに関する処理としては、まず、自分のlevelメンバ値、leftメンバから辿れるクラスタのlevelメンバ値、rightメンバから辿れるクラスタのlevelメンバ値の3データをそれぞれ変数my_level、l_level、r_levelに設定する(ステップ1104)。次にl_levelとr_levelの小さいほうの値と、my_levelの値を比較する(ステップ1105)。
その結果、my_levelの方が大きかった場合は、min{l_level、r_level}から(my_level -1)までインデックスkの値を動かし、intervals[k]の指すinterval構造体のbordersメンバに対して、その値の集合に変数jの値を追加する処理を行う(ステップ1106)。
ステップ1105での比較結果、my_levelの方が大きくなかった場合は、ステップ1106の処理を省略し、ステップ1107に移る。
以上、leaf型クラスタ構造体またはnode型クラスタ構造体に対する一連の処理が終了した場合、処理Aは終了する。
【0027】
以上の処理によって、図2に示したようなクラスタ分析結果の表示が可能となる。
まず、遺伝子発現パターンデータ200の部分は配列disp_leaf_clusters[]の情報を利用することによって、上から1行ずつ表示できる。また樹状図の部分は、node_clusters[nclus]の指しているクラスタを根として持つトリー構造のデータから表示が可能である。
本発明の特徴となる区間スケールバー201と樹状図切断線202は、配列intervals[]に登録された各intervalのmin_distメンバ値とmax_distメンバ値を参照することで表示可能であり、分類結果の遺伝子グループ数の表示203は、num_clustメンバ値を参照することで表示可能である。
さらに、遺伝子発現パターンデータの表示中にある遺伝子グループ間の境界線204とグループに対する範囲の強調表示205は、bordersメンバ値を参照することで表示可能である。
【0028】
なお、図7〜図11に示した処理は、CD−ROM等の記録媒体に遺伝子発現パターン解析表示プログラムとして記録してパーソナルコンピュータやワークステーション等のユーザに提供することができる。
【0029】
【発明の効果】
以上説明したように、本発明によれば、クラスタリングの結果から、より大まかな分類結果を自動的に抽出し、その中からユーザが所望する段階の分類結果を選択して分かり易く表示することができる。すなわち、分類間の隔たりが大きくなるようなクラスタリング結果として複数の段階を用意し、効果的に表示することができる。したがって、ユーザは遺伝子のグループ分けを判断・推測する際にこの表示を見て、どのくらいのクラスタ数で大まかな分類ができているのかを容易に判断することができるようになる。
【図面の簡単な説明】
【図1】本発明を適用した遺伝子発現パターン解析装置の一実施形態を示すシステム構成図である。
【図2】遺伝子発現パターンに対する本発明のクラスタ分析結果の表示例を示す図である。
【図3】遺伝子発現パターンデータの構造例を示す図である。
【図4】クラスタ構造体の例を示す図である。
【図5】クラスタ木構造の生成例を示す図である。
【図6】表示用データの例を示す図である。
【図7】本発明の遺伝子発現パターンの表示処理の概略処理手順を示すフローチャートである。
【図8】クラスタ分析の中でクラスタ木の生成処理を示すフローチャートである。
【図9】クラスタ分析の中でクラスタレベルの設定処理を示すフローチャートである。
【図10】クラスタ分析の中で表示用データ作成処理を示すフローチャートである。
【図11】表示用データ作成処理の中で処理Aの詳細を示すフローチャートである。
【図12】遺伝子発現パターンに対する標準的クラスタ分析結果の表示例を示す図である。
【図13】クラスタ分析結果の全体と表示対象部分木の対応例を示す図である。
【符号の説明】
100…遺伝子発現パターンデータ、101…記憶装置、102…表示装置、103…キーボード、104…マウス、201…区間スケールバー、202…樹状図切断線、203…遺伝子グループ数情報、204…遺伝子グループ間境界線、205…遺伝子グループの強調表示、401…leaf型クラスタ構造体、402…node型クラス構造体。

Claims (2)

  1. 複数の遺伝子の発現パターンを視覚的に表示する遺伝子発現パターン表示方法であって、
    遺伝子毎の発現パターンデータを異なるデータとして識別するための識別誤差範囲データを入力手段から受付ける第1のステップと、
    前記遺伝子の発現パターンデータを記憶手段から読み出してクラスタリングを行い、クラスタリングした発現パターンデータの隔たりを示すクラスタ間距離データを昇順に格納した第1のデータ構造体を作成する第2のステップと、
    前記第 1 のデータ構造体に格納されたクラスタ間距離データ同士の差を計算し、計算した差と前記識別誤差範囲データとを比較することによって前記第1のデータ構造体に格納されたクラスタ間距離データを木構造に分類し、各分類段階における遺伝子クラスタ数、クラスタ間距離の最小値、最大値を格納した第2のデータ構造体を作成する第3のステップと、
    前記第2のデータ構造体に格納されたデータに基づき遺伝子発現パターンデータ、前記識別誤差範囲データに基づく分類段階別の樹状図及び区間スケールバーを表示装置画面に表示し、その表示された区間スケールバー及び樹状図上に表示された切断線によって指定された分類段階における遺伝子クラスタ数を表示すると共に、表示された遺伝子発現パターンデータ上に前記分類段階別のクラスタ間距離の最小値、最大値のデータに基づく境界線を表示する第4のステップと
    を備えることを特徴とする遺伝子発現パターン表示方法。
  2. 複数の遺伝子の発現パターンを視覚的に表示する遺伝子発現パターン表示装置であって、
    遺伝子毎の発現パターンデータを異なるデータとして識別するための識別誤差範囲データを入力手段から受付ける第1の手段と、
    前記遺伝子の発現パターンデータを記憶手段から読み出してクラスタリングを行い、クラスタリングした発現パターンデータの隔たりを示すクラスタ間距離データを昇順に格納した第1のデータ構造体を作成する第2の手段と、
    前記第1のデータ構造体に格納されたクラスタ間距離データ同士の差を計算し、計算した差と前記識別誤差範囲データとを比較することによって前記第1のデータ構造体に格納されたクラスタ間距離データを木構造に分類し、各分類段階における遺伝子クラスタ数、クラスタ間距離の最小値、最大値を格納した第2のデータ構造体を作成する第3の手段と、
    前記第2のデータ構造体に格納されたデータに基づき遺伝子発現パターンデータ、前記識別誤差範囲データに基づく分類段階別の樹状図及び区間スケールバーを表示装置画面に表示し、その表示された区間スケールバー及び樹状図上に表示された切断線によって指定された分類段階における遺伝子クラスタ数を表示すると共に、表示された遺伝子発現パターンデータ上に前記分類段階別のクラスタ間距離の最小値、最大値のデータに基づく境界線を表示する第4の手段と
    を備えることを特徴とする遺伝子発現パターン表示装置。
JP2000088695A 1999-09-30 2000-03-28 遺伝子発現パターン表示方法および装置並びに記録媒体 Expired - Fee Related JP3773092B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000088695A JP3773092B2 (ja) 2000-03-28 2000-03-28 遺伝子発現パターン表示方法および装置並びに記録媒体
DE60024029T DE60024029T2 (de) 1999-09-30 2000-09-28 Verfahren und Vorrichtung zur Darstellung von Gen-Expressionsmustern
EP00121116A EP1089211B1 (en) 1999-09-30 2000-09-28 Method and apparatus for displaying gene expression patterns
US09/677,042 US7031847B1 (en) 1999-09-30 2000-09-29 Method and apparatus for displaying gene expression patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000088695A JP3773092B2 (ja) 2000-03-28 2000-03-28 遺伝子発現パターン表示方法および装置並びに記録媒体

Publications (2)

Publication Number Publication Date
JP2001281244A JP2001281244A (ja) 2001-10-10
JP3773092B2 true JP3773092B2 (ja) 2006-05-10

Family

ID=18604536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000088695A Expired - Fee Related JP3773092B2 (ja) 1999-09-30 2000-03-28 遺伝子発現パターン表示方法および装置並びに記録媒体

Country Status (1)

Country Link
JP (1) JP3773092B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3917625B2 (ja) 2003-02-14 2007-05-23 富士通株式会社 データ解析装置
JP4555256B2 (ja) * 2006-05-24 2010-09-29 Necソフト株式会社 時系列遺伝子発現量データの特徴抽出と比較分類を目的とする解析方法、および該解析方法に基づく解析装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200300A (ja) * 1993-11-29 1995-08-04 Toshiba Corp パターン認識型推論方法及び装置
JPH09325890A (ja) * 1996-06-04 1997-12-16 Toshiba Corp パターン発見方法およびパターン発見装置
JP4155363B2 (ja) * 1997-06-19 2008-09-24 富士通株式会社 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
US5889523A (en) * 1997-11-25 1999-03-30 Fuji Xerox Co., Ltd. Method and apparatus for dynamically grouping a plurality of graphic objects
US6304260B1 (en) * 1998-06-24 2001-10-16 Lucent Technologies, Inc. Method and apparatus for generating and displaying views of hierarchically clustered data

Also Published As

Publication number Publication date
JP2001281244A (ja) 2001-10-10

Similar Documents

Publication Publication Date Title
US11756652B2 (en) Systems and methods for analyzing sequence data
US11574706B2 (en) Systems and methods for visualization of single-cell resolution characteristics
US6466923B1 (en) Method and apparatus for biomathematical pattern recognition
US9940433B2 (en) Discovering population structure from patterns of identity-by-descent
CN111913999B (zh) 基于多组学与临床数据的统计分析方法、系统和存储介质
JP3532911B2 (ja) 遺伝子データ表示方法及び記録媒体
CN111180013A (zh) 检测血液病融合基因的装置
US7031847B1 (en) Method and apparatus for displaying gene expression patterns
JP2007011996A (ja) 発現情報の解析方法及びそのシステム
JP3773092B2 (ja) 遺伝子発現パターン表示方法および装置並びに記録媒体
JP3936851B2 (ja) クラスタリング結果評価方法及びクラスタリング結果表示方法
JP3563315B2 (ja) 樹状図表示方法及び樹状図表示システム
JP6356015B2 (ja) 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム
US6994965B2 (en) Method for displaying results of hybridization experiment
JP3628005B2 (ja) 遺伝子発現パターン表示方法および装置
CN111243661A (zh) 基于基因数据的基因体检系统
JP4557609B2 (ja) スプライスバリアント配列のマッピング表示方法
CN114242158B (zh) ctDNA单核苷酸变异位点检测方法、装置、存储介质及设备
Zheng et al. Improving pattern discovery and visualization of SAGE data through poisson-based self-adaptive neural networks
JP4021406B2 (ja) 樹状図表示方法及び樹状図表示システム
JP2004355269A (ja) クラスタ判別結果表示方法
Ranasinghe Categorizing high dimensional unlabelled genomic data
CN116343923A (zh) 一种基因组结构变异同源性识别方法
EP1327223A1 (en) Method and apparatus for biomathematical pattern recognition
WO2000036489A9 (en) Pattern recognition oriented cluster analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060209

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees