JP2001095568A - 遺伝子発現パターン表示方法および装置 - Google Patents

遺伝子発現パターン表示方法および装置

Info

Publication number
JP2001095568A
JP2001095568A JP27791899A JP27791899A JP2001095568A JP 2001095568 A JP2001095568 A JP 2001095568A JP 27791899 A JP27791899 A JP 27791899A JP 27791899 A JP27791899 A JP 27791899A JP 2001095568 A JP2001095568 A JP 2001095568A
Authority
JP
Japan
Prior art keywords
expression pattern
time
clustering
genes
gene expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27791899A
Other languages
English (en)
Other versions
JP3628005B2 (ja
Inventor
Yasuyuki Nozaki
康行 野崎
Akira Nakashige
亮 中重
Tsunehiko Watanabe
恒彦 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP27791899A priority Critical patent/JP3628005B2/ja
Priority to EP00121116A priority patent/EP1089211B1/en
Priority to DE60024029T priority patent/DE60024029T2/de
Priority to US09/677,042 priority patent/US7031847B1/en
Publication of JP2001095568A publication Critical patent/JP2001095568A/ja
Application granted granted Critical
Publication of JP3628005B2 publication Critical patent/JP3628005B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ある時点において異なる遺伝子が同じ機能の
ために同様に発現しているが、ある時点では別々の役割
を持つような場合を見つけ出し、効果的に表示するこ
と。 【解決手段】 複数の遺伝子の時系列発現パターンデー
タの任意の時間区間を指定するステップと、指定された
時間区間における時系列発現パターンデータを予め定め
た基準値によってクラスタリングし、さらに同一クラス
タ内において基準値を変えながら正または負の時間方向
にクラスタリングを繰り返し行い、その結果を予め定め
た表示形式で表示するステップとを備えることを特徴と
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特定の遺伝子とハ
イブイリダイズさせることによって得られた時系列の遺
伝子発現パターンを視覚的に分かり易く、そして遺伝子
の機能・役割が推測し易い表示形式(または出力形式)
によって表示するための表示方法および装置に関するも
のである。
【0002】
【従来の技術】ゲノム配列が決定された種の増加に伴
い、進化に対応するとみられる遺伝子を見つけ出し、ど
の生物にも共通に持っていると考えられる遺伝子の集合
を探したり、それから逆に種に個別な特徴を推測するな
ど、種間の遺伝子の違いから何かを見出そうとする、い
わゆるゲノム比較法が盛んに行われてきた。
【0003】しかし近年、DNAチップやDNAマイク
ロアレイなどのインフラストラクチャの発達によって、
分子生物学の興味は、種間の情報から種内の情報へ、す
なわち同時発生解析へと移りつつあり、これまでの種間
の比較と合わせて、情報の抽出から関連付けの場が大き
く広がりを持ち始めている。
【0004】例えば、既知の遺伝子と同一の発現パター
ンを示す未知の遺伝子が見つかれば、それが既知の遺伝
子と同様の機能があると類推できる。これら遺伝子や蛋
白質そのものの機能的な意味付けは、機能ユニットや機
能グループといった形で研究されている。またそれらの
間の相互作用も、既知の酵素反応データや物質代謝デー
タとの対応付けによって、あるいはより直接的に、ある
遺伝子を破壊あるいは過剰反応させ、その遺伝子の発現
をなくすか、あるいは多量に発現させ、その遺伝子の直
接的および間接的影響を、全遺伝子の発現パターンを調
べることによって解析している。
【0005】この分野において成功した事例として、ス
タンフォード大学のP.Brownらのグループによるイース
ト菌の発現解析が挙げられる(Michel B.Eisen et. a
l.: Cluster analysis and display of genome-wide ex
pression patterns: Proc.Natl.Acad.Sci.(1998) Dec
8;95(25):14863-8)。彼らは、DNAマイクロアレイを
用いて、細胞から抽出した遺伝子を時系列にハイブリダ
イズさせ、遺伝子の発現の度合い(ハイブリダイズした
蛍光シグナルの輝度)を数値化した。数値に色を対応さ
せることで、遺伝子の個々の発現過程を分かり易く表示
させている。このとき、細胞の一連のサイクルにおいて
発現パターンの過程が近い遺伝子同士(任意の時点での
発現の度合いが近いもの同士)をクラスタリングしてい
る。
【0006】図13は、この手法に従って遺伝子の発現
状態1300を表示した例を示す図であり、横方向に時
間軸、縦方向に遺伝子を並べている。このような表示方
法をとることで、共通のクラスタに属する遺伝子は、共
通の機能的性質をもつと類推することができる。なお、
図13における1つ1つの枠1301が1つの遺伝子の
ある時刻における発現状態を示すものであり、図13で
は白黒の濃度を変えて発現状態を模式的に示している。
【0007】
【発明が解決しようとする課題】ところが、実際の遺伝
子間の発現過程では、細胞の全サイクルにおいて同様の
発現パターンを持つ幾つかの遺伝子グループを見つけ出
すことで、その細胞全ての遺伝子間の関連が解明される
というほど単純ではない。
【0008】例えば、ある時点において異なる遺伝子が
同じ機能のために同様に発現しているが、その後、次の
ある時点では別々の役割を持つような場合がある。当然
この場合、遺伝子の発現過程は異なる。細胞の全サイク
ルにおいて発現のパターンが近いもの同士をクラスタリ
ングして表示させる従来技術の手法では、これらの遺伝
子は別々のクラスタとして分類されるため、こういった
性質を見つけ難いという難点があった。
【0009】本発明は、このような従来技術の問題点を
鑑み、ある時点において異なる遺伝子が同じ機能のため
に同様に発現しているが、ある時点では別々の役割を持
つような場合を見つけ出し、これを効果的に表示するこ
とが可能な遺伝子発現パターン表示方法および装置を提
供することを目的とする。
【0010】
【課題を解決するための手段】本発明では、前記目的を
達成するために、時間経過に伴って発現の度合いが変化
する複数の遺伝子の時系列発現パターンを視覚的に表示
する遺伝子発現パターン表示方法であって、前記複数の
遺伝子の時系列発現パターンデータの任意の時間区間を
指定するステップと、指定された時間区間における時系
列発現パターンデータを予め定めた基準値によってクラ
スタリングし、さらに同一クラスタ内において基準値を
変えながら正または負の時間方向にクラスタリングを繰
り返し行い、その結果を予め定めた表示形式で表示する
ステップとを備えることを特徴とする。
【0011】また、前記時間区間において、異なる2つ
以上の遺伝子が、初め同じ発現パターンを示し、途中か
ら異なる発現パターンを示すものを予め定めた表示形式
で表示することを特徴とする。
【0012】また、前記時間区間において、異なる2つ
以上の遺伝子が、初め異なる発現パターンを示し、途中
から同じ発現パターンを示すものを予め定めた表示形式
で表示することを特徴とする。
【0013】また、時間経過に伴って発現の度合いが変
化する複数の遺伝子の時系列発現パターンデータをデー
タベースから取得し、時系列発現パターンを表示装置画
面に視覚的に表示する遺伝子発現パターン解析装置であ
って、前記データベースから取得した前記複数の遺伝子
の時系列発現パターンデータの任意の時間区間を指定す
る入力手段と、指定された時間区間における時系列発現
パターンデータを予め定めた基準値によってクラスタリ
ングし、さらに同一クラスタ内において基準値を変えな
がら正または負の時間方向にクラスタリングを繰り返し
行い、その結果を予め定めた表示形式で前記表示装置画
面に表示させる演算手段とを備えることを特徴とする。
【0014】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は、本発明の遺伝子発現パタ
ーン表示方法を適用した遺伝子発現パターン解析装置の
一実施形態を示すシステム構成図である。この実施形態
の解析装置は、一連の細胞のプロセスにおいて遺伝子の
発現の度合いを数値化した遺伝子発現パターンデータを
格納した記憶装置(またはデータベース)101、発現
パターンデータを視覚化して表示するための表示装置1
02、本システムへの値の入力や選択の操作を行なうた
めのキーボード103およびマウス104、遺伝子の発
現過程に応じて発現パターンデータのクラスタリングを
行なうクラスタリング処理部105から構成される。こ
のクラスタリング処理部105は、コンピュータとその
プログラムによって具体化されるものである。
【0015】ここで、記憶装置101に代えて、ネット
ワーク等を介して遠隔地に設置されたサーバコンピュー
タが管理しているデータベースから遺伝子発現パターン
データを取得する構成にする実施形態がある。
【0016】本実施形態においては、細胞の一連のサイ
クルにおいて特定の時間区間を指定し、その時間区間に
おいて細かい粒度でクラスタリングを行なう。
【0017】すなわち、同一のクラスタに属する遺伝子
は1つに束ね、異なるクラスタとの間には線を引き、さ
らに、クラスタ内の遺伝子において更にクラスタリング
を行なう。細かい粒度のクラスタリングを範囲の始めか
ら正の時間方向へ繰り返し行なうと、図2に示すよう
に、遺伝子の発現過程が木構造のように分岐して表現で
きる。図2において、201は、指定された時間区間、
すなわちクラスタリング範囲である。
【0018】これは、指定された時間区間の始めにおい
て同じ発現パターンを示し、時間区間の途中で異なる発
現パターンを示したことを意味している。このような表
示が得られた場合、始めの時点では異なる遺伝子が同じ
機能のために同様に発現しているが、ある時点において
別々の役割を持つため異なって発現したと類推すること
ができる。
【0019】同様に、細かい粒度のクラスタリングを範
囲の終端から負の時間方向へ繰り返し行なうと、遺伝子
の発現の過程が、図3のように、逆の木構造のような分
岐構造として表現することができる。
【0020】これは、範囲の始めにおいて異なる発現パ
ターンを示し、範囲の途中で同じ発現パターンを示した
ことを意味している。このような表示が得られた場合、
始めの時点では異なる遺伝子が異なる機能を持っていた
が、ある時点において同様の役割を持ったと類推するこ
とができる。
【0021】図4は、遺伝子の発現パターンデータをク
ラスタリングして表示するクラスタリング処理部105
におけるアルゴリズムの概要を示すフローチャートであ
る。
【0022】ここではまず、初期パラメータを設定し
(ステップ401)、表示位置決定処理を行なう(ステ
ップ402)。初期パラメータについては、後述する。
その後、表示処理を行ない、処理を終了する(ステップ
403)。本アルゴリズムは、図2に示したように、異
なる遺伝子が、ある時間区間において、始めにおいて同
じ発現パターンを示し、途中で異なる発現パターンを示
したことを表示するものである。
【0023】図5は、本アルゴリズムで使われる変数と
実データとの対応関係を示す説明図である。図6は、図
4中の初期パラメータ設定処理(ステップ401)に関
するアルゴリズムの詳細を示している。
【0024】まず、遺伝子発現パターンデータを記憶装
置101から読み込む。この遺伝子発現パターンデータ
には、図5に示すようにm+1個のサンプル遺伝子g0,g
1,...gmについて、時刻T0,T1,...Tnにおいて実験し
た結果の発現パターンデータが入っているものとする。
そこで、時刻Tjにおける遺伝子giの発現の観測値をg
[j][i]とおく(ステップ601)。
【0025】次に、キーボード103、マウス104を
使って、クラスタリング適用範囲(開始時刻Tstart
終了時刻Tend)、異なるクラスタとみなすべき基準を
示す正数値(Kstart,Kstart+1,…,Kend)、クラスタ
リングの粒度を示す整数(S)、クラスタリング手法を
それぞれ入力する(ステップ602)。
【0026】クラスタリング適用範囲とは、図2、図3
に太枠実線201で示すように、細胞の一連のプロセス
において、より詳しくクラスタリングする時間区間を示
す。例えば細胞の一連のプロセスにおいて、ある時刻で
細胞に特殊な発現パターンがみられた場合、その時刻の
前後をクラスタリング適用範囲に指定することで、全遺
伝子の発現状態をより詳しくモニタリングするように選
択する。従来のクラスタリングとの基本的な相違点は、
図13のような細胞の全プロセスにおいて発現状態の近
いもの同士をクラスタリングするのではなく、図2に示
すような相異なる遺伝子が範囲の始めにおいて同じ発現
パターンを示し、範囲の途中で異なる発現パターンを示
したことを表示するところにある。
【0027】異なるクラスタとみなす基準とは、異なる
クラスタの間の非類似度が最低でもどれくらいの値をと
るかを示すものである。すなわち、クラスタ間の閾値K
を示している。閾値がKstart,Kstart+1,…,Kendと可
変に設定できることで、時間によって粗いクラスタリン
グから細かいクラスタリングまで調節できる。
【0028】また、クラスタリングを行なうときの非類
似度の計算において、本システムでは、発現データの時
刻T0,T1,...Tnにおける全てのデータを非類似度の計
算の対象とせずに、ある時間区間を設けて、その時間区
間内におけるデータを非類似度の計算の対象とする。こ
の時間区間を図5に示すようにスリット501、このス
リット501の長さ(時間軸方向の幅)Sをクラスタリ
ングの粒度とよぶ。本アルゴリズムでは、まずスリット
501の先頭をTstartに合わせてデータをTs tartから
start+Sの範囲でクラスタリングを行ない、そこで分
割された各々のクラスタ内において、スリット501を
時刻が正の方向へ1つずらし、Tstart+ 1からT
start+S+1の範囲でクラスタリングを行なう。このよう
な操作をスリットの後端がTendになるまで逐次実行す
る。したがって、粒度が細かいほど、すなわち時間区間
の幅が短いほど、より細かい遺伝子間の発現の違いを表
すことができる。
【0029】クラスタリング手法では、クラスタリング
において個体同士の相関関係を表す類似度または非類似
度(ピアソンの相関係数、ユークリッド平方距離、標準
化ユークリッド平方距離、マハラノビスの距離、ミンコ
フスキー距離など)及びクラスタ合併のアルゴリズム
(最短距離法、最長距離法、群平均法、重心法、メディ
アン法、ウォード法、可変法など)を指定する。本アル
ゴリズムは非類似度を対象としているが、クラスタリン
グ手法において類似度を選択した場合は、計算した類似
度に負符号を付けたり、逆数をとるなどの操作を施し、
非類似度に変換すればよい。
【0030】これらの値を設定したら、それぞれの項目
が正しいかどうか調べる。クラスタリング適用範囲T
start、TendがT0からTnの範囲に含まれているか(ス
テップ603)、クラスタリングの粒度Sがクラスタリ
ング適用範囲の幅を超えてないか(S≦ end−start)
(ステップ604)、また設定したクラスタリング手法
において、合併アルゴリズムを重心法、メディアン法、
ウォード法を選択した時、非類似度においてユークリッ
ド平方距離を選択したかなど、類似度または非類似度と
合併アルゴリズムは妥当な組み合わせか(ステップ60
6)を調べる。もし、これらの値で正当なものが入って
いないならば、表示装置102にエラーを出力し、再入
力を促す(ステップ607)。
【0031】しかし、設定項目が適切であった場合、次
に、i=1,2,…,mに対して遺伝子giの平均発現度Gi=(g
[0][i]+g[1][i]+…g[n][i])/nを求める(ステップ60
8)。
【0032】次に、個々の遺伝子の表示情報を格納する
ために図5に示すような配列l[I](I=0,1,…,m)502と
整数値変数lmaxを用意する。各l[I]は構造体データで、
図5に示すように遺伝子のインデックスを表すメンバ
(index)と異なるクラスタ間の仕切り線の位置を表す
メンバ(linepos)からなる。構造体のメンバは、l[I].in
dex,l[I].lineposという形で値を代入・参照できる。そ
こで、全てのIに対してl[I].lineposの値をTendとして
初期化し(ステップ609)、さらにlmaxの値を「0」
としておく(ステップ610)。次に、変数tにstart
の値を設定する(ステップ611)。
【0033】本アルゴリズムでは、整数値の集合を表す
“クラスタ”と呼ばれる抽象データ型を使っている。ク
ラスタには、整数の登録、削除、登録データの参照のイ
ンタフェースを備えているものとする。
【0034】クラスタBを生成し、そこに{0,1,2,…,
m}を登録し処理を終了する(ステップ612)。
【0035】以上のように初期設定をした後、クラスタ
リング適用範囲201に対して処理を行なう。すなわ
ち、上で定めたtとBとを引数として表示位置決定処理
(図4のステップ402の処理A)を行なう。
【0036】図7は、図4中の表示位置決定処理(処理
A)の詳細を示すフローチャートであり、この処理Aの
中で配列lに表示情報を登録する。
【0037】まず、引数として渡されたクラスタをB、
時刻をtとする(ステップ701)。ここでBを更にク
ラスタリングする(処理B)。このときtとBを引数と
して与える。処理Bの結果として、総クラスタ数がcmax
に、クラスタリング結果がA[J](J=1,2,…,cmax)に
設定される(ステップ702)。処理Bの詳細について
は後述する。
【0038】次に、「t+S」がendと等しいかどうか
判定する(ステップ703)。endの時はスリット50
1の終端がクラスタリング適用範囲201の終わりに来
たことを意味し、ここでクラスタリング処理を終了す
る。このとき、J=1としてJがcmaxを超えるまで、各
々のクラスタに対して次の処理を実行する(ステップ7
04,705)。クラスタA[J]の要素が{i1,…,ik
であるとき、これらの要素を一定の基準の下に並べて表
示する。ここでは各要素に対応する遺伝子の平均発現度
i1,...Gikを値の降順に並べて、それをGj1,...Gjk
とおく(ステップ706)。
【0039】次に配列lの値を入力する。すなわち、発
現パターンデータの位置情報を表すl[].indexに平均輝
度が降順になるように l[lmax].index=j1、l[lmax+1].i
ndex=j2、…、l[lmax+k−1].index=jkと設定し(ステッ
プ707)、異なるクラスタとの仕切り線(図2の20
2で代表して示す横方向の太実線)を表す l[lmax+k−
1].lineposに時刻tからt+S(=Tend)の範囲まで線を
引くことを示すtの値を入力する(ステップ708)。
【0040】次に、配列lの入力済みデータの最大数を
示すlmaxにkを加算する(ステップ709)。次に、J
を1つインクリメントし、次のクラスタの処理に移る
(ステップ710)。
【0041】一方、ステップ703において、「t+
S」がendと一致しない場合、すなわちスリット501
の終端がクラスタリング適用範囲201の終わりに来て
いないとき、tを1つインクリメントし、Jに「1」を
設定する(ステップ711)。Jがcmaxを超えるまで、
各々のクラスタに対して次の処理を行なう(ステップ7
12)。すなわちBにA[J]を代入し(ステップ71
3)、引数として時刻t、クラスタBを与えて表示位置
決定処理(処理A)を行なう(ステップ714)。次
に、異なるクラスタとの仕切り線を表す l[lmax−1].li
neposに時刻tからTendの範囲まで線を引くことを示す
tを入力する(ステップ715)。そして、Jを1つイ
ンクリメントし、次のクラスタの処理に移る(ステップ
716)。全てのクラスタA[J](J=1,…,cmax)に関
する処理が終われば終了する。
【0042】図8および図9は、クラスタリング処理
(処理B)のアルゴリズムを示すフローチャートであ
る。まず、引数として入力されたクラスタをB、入力さ
れた時刻をtに入れる(ステップ801)。
【0043】次に、クラスタBの要素がi1,…,ikである
とき、i1,…,ikに対応する遺伝子間の時刻tから時刻t
+Sにおける類似度または非類似度dij(i<jかつi,j∈{i
1,i2,…,ik})を求める(ステップ802)。
【0044】ここで、遺伝子gi,gjに対する遺伝子発現
データ{g[0][i],g[1][i],…,g[n][i]}、{g[0][j],g
[1][j],…,g[n][j]}の時刻tから時刻t+Sにおける類
似度(非類似度)とは、例えば以下のような計算で求め
る量である(ステップ802)。
【0045】(1)類似度としてピアソンの相関係数を
指定したとき
【0046】
【数1】
【0047】となる。本アルゴリズムでは非類似度を対
象にしているので、類似度を適用する場合には負符号を
付ける、逆数をとるなどの操作をして非類似度に変換し
なければならない。
【0048】(2)非類似度としてユークリッド平方距
離を指定したとき、
【0049】
【数2】
【0050】(3)標準化ユークリッド平方距離を指定
したとき、
【0051】
【数3】
【0052】(4)マハラノビスの距離を指定したと
き、
【0053】
【数4】
【0054】(5)ミンコフスキー距離を指定したと
き、
【0055】
【数5】
【0056】クラスタC[1],…,C[k]を生成し、それぞ
れのクラスタにC[1]←{i1},……,C[k]←{ik}を登
録しておく(ステップ803)。そして、生成したクラ
スタの数を表す変数ccntにkを代入しておく(ステップ
804)。次に、空集合のクラスタDを生成する(ステ
ップ805)。
【0057】次に、ここまでで計算した非類似度d
i,j(i,j ∈{1,2,…,ccnt}−D)の値の最小値dp,qを求
め、先に設定した閾値Kt以下かどうか判定する(ステッ
プ806、807)。dp,qがKt以下のとき次のことを実
行する。クラスタC[ccnt+1]を新たに生成し、クラスタ
C[p]とクラスタC[q]に含まれる要素の和集合をクラス
タC[ccnt+1]に登録し(ステップ808)、クラスタC
[p]とクラスタC[q]に含まれる要素を削除する(ステッ
プ809)。次に、C[p]とC[q]はもう必要ないので、
Dにp、qを登録する(ステップ810)。次に、クラス
タC[h] (h ∈{1,2,…,ccnt}−D)とクラスタC[ccnt+
1]間の時刻tから時刻「t+S」における非類似度 d
h,ccnt+1を求める(ステップ811)。ここでd
h,ccnt+1は、次の計算式で求めることができる。すなわ
【0058】
【数6】
【0059】ここでα、β、γ、δは、n(k)をクラスタ
C[k]内の要素の個数としたとき、クラスタリング手法
が (1)最短距離法のときα=0.5、β=0.5、γ=0、δ=−0.5 (2)最長距離法のときα=0.5、β=0.5、γ=0、δ=0.5 (3)群平均法のときα=n(p)/n(ccnt+1)、β=n(q)/n(ccnt+1)、γ=0、δ=0 (4)重心法のときα=n(p)/n(ccnt+1)、β=n(q)/n(ccnt+1)、 γ=−n(p)n(q)/n(ccnt+1)2、δ=0 (5)メディアン法のときα=0.5、β=0.5、γ=−0.25、δ=0 (6)ウォード法のときα={n(h)+n(p)}/{n(h)+n(ccnt+1)}、 β={n(h)+n(q)}/{n(h)+n(ccnt+1)}、γ=−n(h)/{n(h)+n(ccnt+1)}、δ=0 である。
【0060】次に、生成したクラスタの数を表す変数cc
ntに「1」を加える(ステップ812)。これらの処理
を更新したdi,j(i,j∈{1,2,…,ccnt}−D)の最小値がK
tより大きくなるまで続ける。
【0061】ステップ807においてdi,jの最小値dp,q
がKtより大きいとき、クラスタリングを終えて、結果
の出力処理を行なう。まず、クラスタC[1]からC[ccn
t]で、空集合でないものを判定し、この総数をcmaxに入
力する(ステップ813)。そして、cmax個のクラスタ
A[1],…,A[cmax]を生成する(ステップ814)。空
集合でないクラスタに対し、それに含まれる遺伝子の平
均発現度の平均をとる。すなわち、クラスタC[p]={i1,
…,ik}に対して、G’p=(Gi1+...+Gik)/kを求め
る。この値を降順に並べたものを、G’p1,,…,G’
pcmaxとしたときA[1] ← C[p1],…,A[cmax] ← C[p
cmax]を登録する(ステップ815)。最後に、総クラ
スタ数cmaxとクラスタA[1],…,A[cmax]を出力し(ス
テップ816)、処理を終了する。
【0062】図10は、図4における表示処理のアルゴ
リズムの詳細を示すフローチャートである。このアルゴ
リズムは、配列l[I]を読み込み、対応する遺伝子の発現
データを表示する処理である。
【0063】まずiの値を「0」とし(ステップ100
0)、iの値がlmaxと等しくなるまで、各々の遺伝子発
現データに対して以下の操作を続ける(ステップ100
1)。次に、x=l[i].indexが指す遺伝子1行分の発現デ
ータg[k][x](k=0,1,…,n)の数値を対応する表示色に置
き換え、第i行として1行にわたり表示する(ステップ
1002)。更に、クラスタ間の仕切り線を、今表示し
た第i行のすぐ下の時刻l[i].lineposからTendの範囲に
引く(ステップ1003)。
【0064】ここで、l[i].lineposの値が、初期値T
endの場合は、クラスタ間の仕切り線は存在せず線も書
く必要が無い。iを1つずつインクリメントし(ステッ
プ1004)、ステップ1001においてiがlmaxにな
ったら、処理を終える。
【0065】以上の処理によって、図2に示したよう
な、相異なる遺伝子がクラスタリング適用範囲の始めに
おいて同じ遺伝子発現パターンを示し、範囲の途中で異
なる発現パターンを示すような状況を効果的に表示する
ことができる。
【0066】また、図3に示したような、相異なる遺伝
子がクラスタリング適用範囲の始めにおいて異なる遺伝
子発現パターンを示し、範囲の途中で同じ発現パターン
を示すような状況を効果的に表示する場合には、ステッ
プ609(図6)においてl[i].lineposにTstartを、
ステップ611においてtにendを設定し、ステップ7
03(図7)においてt+S=endの判定条件をt−S=st
artにし、ステップ711においてt←t+1をt←t−
1に置き換え、ステップ1003(図10)においてク
ラスタ間の仕切り線を、Tstartからl[i].lineposの範
囲に引けばよい。これは、はじめスリットの終端部分を
endに設定しておき、時間軸の負の方向へ1つずつス
リットを移動してクラスタリングすることを意味してい
る。
【0067】また、これらの詳細なクラスタリング手法
の応用例として、クラスタリング適用範囲の前方から時
間軸の正の方向へスリットを動かしてクラスタリングを
行ない、図11に示したような表示が得られた場合を考
える。このとき、図11の点線1101,1102で囲
んだような似通った発現パターンが見られた場合、それ
らの遺伝子をマーキング(1103)しておき、クラス
タリング適用範囲201の後方から時間軸の負の方向に
向けてクラスタリングを行なう。もし、図12に示した
ようにマーキング(1103)した遺伝子が互いに近い
位置にあるものが見つかる(例えばと、とな
ど)ならば、これらの遺伝子は始め異なる遺伝子発現パ
ターンを示し、途中で同じ発現パターンを示すことを意
味しており、このような双方向のクラスタリングによっ
て個々の遺伝子の発現状態を容易に推測することが出来
る。
【0068】更に、TstartをT0にTendをTnに、スリ
ット幅Sをnに設定すれば、従来の技術の中で説明した
P.Brownらの結果と同様の表示を得ることが出来る。
【0069】なお、本発明は、上記実施形態に限定され
るものではなく、実施に際しては、細部を種々変更して
実施することができる。例えば、途中から発現パターン
が変わった部分あるいは境界においては、フリッカ表
示、高輝度表示、色反転表示などの既知の表示形態を各
種組み合わせて表示することができる。
【0070】また、クラスタリング処理部105の処理
は、プログラムとしてCD−ROM等の記録媒体に記録
してコンピュータユーザに提供することができる。
【0071】また、遺伝子のデータとしては、時系列の
発現データに限定されるものではなく、図3または図4
における横軸(時間軸)を他の基準にとり変えることに
よって、例えば異なる実験間について比較を行うなどの
利用が考えられる。
【0072】また、解析結果を表示装置画面に表示する
例を説明したが、最近においては多色プリンタの精度が
向上しているため、多色プリンタで印刷出力する構成で
あってもよい。本発明の表示とは、プリンタで視覚的に
印刷出力する概念を含むものである。
【0073】
【発明の効果】以上説明したように、本発明によれば、
細胞の発現サイクルの一部区間を指定し、その範囲にお
いて細かい粒度でクラスタリングを行なうことができ
る。そして、この表示結果に基づいて、利用者は遺伝子
の発現経過の状態をより詳細に観測することができ、遺
伝子の発現状態から生物学的機能を効率的よく推測する
ことができる。
【図面の簡単な説明】
【図1】本発明を適用した解析装置の一実施形態を示す
システム構成図である。
【図2】クラスタリングの範囲を制限して細かい粒度で
クラスタリングしたときの遺伝子発現パターン表示例
(その1)を示す模式図である。
【図3】クラスタリングの範囲を制限して細かい粒度で
クラスタリングしたときの遺伝子発現パターン表示例
(その2)を示す模式図である。
【図4】クラスタリング処理の概要を示すフローチャー
トである。
【図5】クラスタリング処理で使用する変数と実データ
の関係を示す説明図である。
【図6】初期パラメータの設定に関するアルゴリズムを
示すフローチャートである。
【図7】表示位置決定処理のアルゴリズムを示すフロー
チャートである。
【図8】クラスタリングのアルゴリズムを示すフローチ
ャートである。
【図9】図8の続きを示すフローチャートである。
【図10】表示処理のアルゴリズムの概要を示すフロー
チャートである。
【図11】クラスタリング適用範囲の前方から時間軸の
正の方向へスリットを動かしてクラスタリングを行った
ときの遺伝子発現パターン表示例を示す説明図である。
【図12】クラスタリング適用範囲の後方から時間軸の
負の方向へスリットを動かしてクラスタリングを行った
ときの遺伝子発現パターン表示例を示す説明図である。
【図13】細胞の全プロセスにおいて発現状態の近いも
のどうしをクラスタリングしたときの遺伝子発現パター
ン表示例を示す説明図である。
【符号の説明】
101…遺伝子発現パターンデータの記憶装置、102
…表示装置、103…キーボード、104…マウス、1
05…クラスタリング処理部、201…クラスタリング
範囲、501…スリット。
フロントページの続き (72)発明者 中重 亮 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 渡辺 恒彦 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 Fターム(参考) 4B024 AA11 CA01 CA09 HA11 4B029 AA07 AA23 BB20 CC01 FA09 FA12

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 時間経過に伴って発現の度合いが変化す
    る複数の遺伝子の時系列発現パターンを視覚的に表示す
    る遺伝子発現パターン表示方法であって、 前記複数の遺伝子の時系列発現パターンデータの任意の
    時間区間を指定するステップと、 指定された時間区間における時系列発現パターンデータ
    を予め定めた基準値によってクラスタリングし、さらに
    同一クラスタ内において基準値を変えながら正または負
    の時間方向にクラスタリングを繰り返し行ない、その結
    果を予め定めた表示形式で表示するステップとを備える
    ことを特徴とする遺伝子発現パターン表示方法。
  2. 【請求項2】 前記基準値は、異なる遺伝子において発
    現のパターンが同じまたは異なるとみなすべき値である
    ことを特徴とする請求項1記載の遺伝子発現パターン表
    示方法。
  3. 【請求項3】 前記時間区間において、異なる2つ以上
    の遺伝子が、初め同じ発現パターンを示し、途中から異
    なる発現パターンを示すものを予め定めた表示形式で表
    示することを特徴とする請求項1または2記載の遺伝子
    発現パターン表示方法。
  4. 【請求項4】 前記時間区間において、異なる2つ以上
    の遺伝子が、初め異なる発現パターンを示し、途中から
    同じ発現パターンを示すものを予め定めた表示形式で表
    示することを特徴とする請求項1または2記載の遺伝子
    発現パターン表示方法。
  5. 【請求項5】 時間経過に伴って発現の度合いが変化す
    る複数の遺伝子の時系列発現パターンデータをデータベ
    ースから取得し、時系列発現パターンを表示装置画面に
    視覚的に表示する遺伝子発現パターン解析装置であっ
    て、 前記データベースから取得した前記複数の遺伝子の時系
    列発現パターンデータの任意の時間区間を指定する入力
    手段と、 指定された時間区間における時系列発現パターンデータ
    を予め定めた基準値によってクラスタリングし、さらに
    同一クラスタ内において基準値を変えながら正または負
    の時間方向にクラスタリングを繰り返し行ない、その結
    果を予め定めた表示形式で前記表示装置画面に表示させ
    る演算手段とを備えることを特徴とする遺伝子発現パタ
    ーン解析装置。
JP27791899A 1999-09-30 1999-09-30 遺伝子発現パターン表示方法および装置 Expired - Fee Related JP3628005B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP27791899A JP3628005B2 (ja) 1999-09-30 1999-09-30 遺伝子発現パターン表示方法および装置
EP00121116A EP1089211B1 (en) 1999-09-30 2000-09-28 Method and apparatus for displaying gene expression patterns
DE60024029T DE60024029T2 (de) 1999-09-30 2000-09-28 Verfahren und Vorrichtung zur Darstellung von Gen-Expressionsmustern
US09/677,042 US7031847B1 (en) 1999-09-30 2000-09-29 Method and apparatus for displaying gene expression patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27791899A JP3628005B2 (ja) 1999-09-30 1999-09-30 遺伝子発現パターン表示方法および装置

Publications (2)

Publication Number Publication Date
JP2001095568A true JP2001095568A (ja) 2001-04-10
JP3628005B2 JP3628005B2 (ja) 2005-03-09

Family

ID=17590113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27791899A Expired - Fee Related JP3628005B2 (ja) 1999-09-30 1999-09-30 遺伝子発現パターン表示方法および装置

Country Status (1)

Country Link
JP (1) JP3628005B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010262667A (ja) * 2010-07-06 2010-11-18 Sony Corp 生体物質情報に係わる可視化方法、可視化装置、並びに情報記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010262667A (ja) * 2010-07-06 2010-11-18 Sony Corp 生体物質情報に係わる可視化方法、可視化装置、並びに情報記憶媒体

Also Published As

Publication number Publication date
JP3628005B2 (ja) 2005-03-09

Similar Documents

Publication Publication Date Title
Kelley et al. Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks
JP5297207B2 (ja) スペクトル分析を介したdnaパターンの同定方法及びシステム
CN110832510A (zh) 基于深度学习的变体分类器
AU2019272065C1 (en) Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs)
CN109887546B (zh) 基于二代测序的单基因或多基因拷贝数检测系统及方法
US6502039B1 (en) Mathematical analysis for the estimation of changes in the level of gene expression
US20070078606A1 (en) Methods, software arrangements, storage media, and systems for providing a shrinkage-based similarity metric
JP3532911B2 (ja) 遺伝子データ表示方法及び記録媒体
EP1089211B1 (en) Method and apparatus for displaying gene expression patterns
EP1630709B1 (en) Mathematical analysis for the estimation of changes in the level of gene expression
JP2001095568A (ja) 遺伝子発現パターン表示方法および装置
Sohn et al. New normalization methods using support vector machine quantile regression approach in microarray analysis
CN115565610A (zh) 基于多组学数据的复发转移分析模型建立方法及系统
JP3563315B2 (ja) 樹状図表示方法及び樹状図表示システム
CN108182347B (zh) 一种大规模跨平台基因表达数据分类方法
US6994965B2 (en) Method for displaying results of hybridization experiment
JP3983569B2 (ja) 多変量解析システム、発現プロファイル解析方法、コンピュータプログラム、コンピュータ読み取り可能な記憶媒体
JP2003028855A (ja) クラスタリング結果評価方法及びクラスタリング結果表示方法
JP3773092B2 (ja) 遺伝子発現パターン表示方法および装置並びに記録媒体
Girija et al. Deep learning for vehement gene expression exploration
US20230316054A1 (en) Machine learning modeling of probe intensity
US20190362811A1 (en) Biological material analysis method, biological material analysis device, and biological material analysis program
Lewin et al. Bayesian methods for microarray data
JP2004355269A (ja) クラスタ判別結果表示方法
Pandey et al. Association analysis techniques for discovering functional modules from microarray data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041206

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees