JP2001095568A - 遺伝子発現パターン表示方法および装置 - Google Patents
遺伝子発現パターン表示方法および装置Info
- Publication number
- JP2001095568A JP2001095568A JP27791899A JP27791899A JP2001095568A JP 2001095568 A JP2001095568 A JP 2001095568A JP 27791899 A JP27791899 A JP 27791899A JP 27791899 A JP27791899 A JP 27791899A JP 2001095568 A JP2001095568 A JP 2001095568A
- Authority
- JP
- Japan
- Prior art keywords
- expression pattern
- time
- clustering
- genes
- gene expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 65
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 abstract description 7
- 238000009396 hybridization Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 238000005192 partition Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000022131 cell cycle Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 235000012976 tarts Nutrition 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ために同様に発現しているが、ある時点では別々の役割
を持つような場合を見つけ出し、効果的に表示するこ
と。 【解決手段】 複数の遺伝子の時系列発現パターンデー
タの任意の時間区間を指定するステップと、指定された
時間区間における時系列発現パターンデータを予め定め
た基準値によってクラスタリングし、さらに同一クラス
タ内において基準値を変えながら正または負の時間方向
にクラスタリングを繰り返し行い、その結果を予め定め
た表示形式で表示するステップとを備えることを特徴と
する。
Description
イブイリダイズさせることによって得られた時系列の遺
伝子発現パターンを視覚的に分かり易く、そして遺伝子
の機能・役割が推測し易い表示形式(または出力形式)
によって表示するための表示方法および装置に関するも
のである。
い、進化に対応するとみられる遺伝子を見つけ出し、ど
の生物にも共通に持っていると考えられる遺伝子の集合
を探したり、それから逆に種に個別な特徴を推測するな
ど、種間の遺伝子の違いから何かを見出そうとする、い
わゆるゲノム比較法が盛んに行われてきた。
ロアレイなどのインフラストラクチャの発達によって、
分子生物学の興味は、種間の情報から種内の情報へ、す
なわち同時発生解析へと移りつつあり、これまでの種間
の比較と合わせて、情報の抽出から関連付けの場が大き
く広がりを持ち始めている。
ンを示す未知の遺伝子が見つかれば、それが既知の遺伝
子と同様の機能があると類推できる。これら遺伝子や蛋
白質そのものの機能的な意味付けは、機能ユニットや機
能グループといった形で研究されている。またそれらの
間の相互作用も、既知の酵素反応データや物質代謝デー
タとの対応付けによって、あるいはより直接的に、ある
遺伝子を破壊あるいは過剰反応させ、その遺伝子の発現
をなくすか、あるいは多量に発現させ、その遺伝子の直
接的および間接的影響を、全遺伝子の発現パターンを調
べることによって解析している。
タンフォード大学のP.Brownらのグループによるイース
ト菌の発現解析が挙げられる(Michel B.Eisen et. a
l.: Cluster analysis and display of genome-wide ex
pression patterns: Proc.Natl.Acad.Sci.(1998) Dec
8;95(25):14863-8)。彼らは、DNAマイクロアレイを
用いて、細胞から抽出した遺伝子を時系列にハイブリダ
イズさせ、遺伝子の発現の度合い(ハイブリダイズした
蛍光シグナルの輝度)を数値化した。数値に色を対応さ
せることで、遺伝子の個々の発現過程を分かり易く表示
させている。このとき、細胞の一連のサイクルにおいて
発現パターンの過程が近い遺伝子同士(任意の時点での
発現の度合いが近いもの同士)をクラスタリングしてい
る。
状態1300を表示した例を示す図であり、横方向に時
間軸、縦方向に遺伝子を並べている。このような表示方
法をとることで、共通のクラスタに属する遺伝子は、共
通の機能的性質をもつと類推することができる。なお、
図13における1つ1つの枠1301が1つの遺伝子の
ある時刻における発現状態を示すものであり、図13で
は白黒の濃度を変えて発現状態を模式的に示している。
子間の発現過程では、細胞の全サイクルにおいて同様の
発現パターンを持つ幾つかの遺伝子グループを見つけ出
すことで、その細胞全ての遺伝子間の関連が解明される
というほど単純ではない。
同じ機能のために同様に発現しているが、その後、次の
ある時点では別々の役割を持つような場合がある。当然
この場合、遺伝子の発現過程は異なる。細胞の全サイク
ルにおいて発現のパターンが近いもの同士をクラスタリ
ングして表示させる従来技術の手法では、これらの遺伝
子は別々のクラスタとして分類されるため、こういった
性質を見つけ難いという難点があった。
鑑み、ある時点において異なる遺伝子が同じ機能のため
に同様に発現しているが、ある時点では別々の役割を持
つような場合を見つけ出し、これを効果的に表示するこ
とが可能な遺伝子発現パターン表示方法および装置を提
供することを目的とする。
達成するために、時間経過に伴って発現の度合いが変化
する複数の遺伝子の時系列発現パターンを視覚的に表示
する遺伝子発現パターン表示方法であって、前記複数の
遺伝子の時系列発現パターンデータの任意の時間区間を
指定するステップと、指定された時間区間における時系
列発現パターンデータを予め定めた基準値によってクラ
スタリングし、さらに同一クラスタ内において基準値を
変えながら正または負の時間方向にクラスタリングを繰
り返し行い、その結果を予め定めた表示形式で表示する
ステップとを備えることを特徴とする。
以上の遺伝子が、初め同じ発現パターンを示し、途中か
ら異なる発現パターンを示すものを予め定めた表示形式
で表示することを特徴とする。
以上の遺伝子が、初め異なる発現パターンを示し、途中
から同じ発現パターンを示すものを予め定めた表示形式
で表示することを特徴とする。
化する複数の遺伝子の時系列発現パターンデータをデー
タベースから取得し、時系列発現パターンを表示装置画
面に視覚的に表示する遺伝子発現パターン解析装置であ
って、前記データベースから取得した前記複数の遺伝子
の時系列発現パターンデータの任意の時間区間を指定す
る入力手段と、指定された時間区間における時系列発現
パターンデータを予め定めた基準値によってクラスタリ
ングし、さらに同一クラスタ内において基準値を変えな
がら正または負の時間方向にクラスタリングを繰り返し
行い、その結果を予め定めた表示形式で前記表示装置画
面に表示させる演算手段とを備えることを特徴とする。
施の形態を説明する。図1は、本発明の遺伝子発現パタ
ーン表示方法を適用した遺伝子発現パターン解析装置の
一実施形態を示すシステム構成図である。この実施形態
の解析装置は、一連の細胞のプロセスにおいて遺伝子の
発現の度合いを数値化した遺伝子発現パターンデータを
格納した記憶装置(またはデータベース)101、発現
パターンデータを視覚化して表示するための表示装置1
02、本システムへの値の入力や選択の操作を行なうた
めのキーボード103およびマウス104、遺伝子の発
現過程に応じて発現パターンデータのクラスタリングを
行なうクラスタリング処理部105から構成される。こ
のクラスタリング処理部105は、コンピュータとその
プログラムによって具体化されるものである。
ワーク等を介して遠隔地に設置されたサーバコンピュー
タが管理しているデータベースから遺伝子発現パターン
データを取得する構成にする実施形態がある。
クルにおいて特定の時間区間を指定し、その時間区間に
おいて細かい粒度でクラスタリングを行なう。
は1つに束ね、異なるクラスタとの間には線を引き、さ
らに、クラスタ内の遺伝子において更にクラスタリング
を行なう。細かい粒度のクラスタリングを範囲の始めか
ら正の時間方向へ繰り返し行なうと、図2に示すよう
に、遺伝子の発現過程が木構造のように分岐して表現で
きる。図2において、201は、指定された時間区間、
すなわちクラスタリング範囲である。
て同じ発現パターンを示し、時間区間の途中で異なる発
現パターンを示したことを意味している。このような表
示が得られた場合、始めの時点では異なる遺伝子が同じ
機能のために同様に発現しているが、ある時点において
別々の役割を持つため異なって発現したと類推すること
ができる。
囲の終端から負の時間方向へ繰り返し行なうと、遺伝子
の発現の過程が、図3のように、逆の木構造のような分
岐構造として表現することができる。
ターンを示し、範囲の途中で同じ発現パターンを示した
ことを意味している。このような表示が得られた場合、
始めの時点では異なる遺伝子が異なる機能を持っていた
が、ある時点において同様の役割を持ったと類推するこ
とができる。
ラスタリングして表示するクラスタリング処理部105
におけるアルゴリズムの概要を示すフローチャートであ
る。
(ステップ401)、表示位置決定処理を行なう(ステ
ップ402)。初期パラメータについては、後述する。
その後、表示処理を行ない、処理を終了する(ステップ
403)。本アルゴリズムは、図2に示したように、異
なる遺伝子が、ある時間区間において、始めにおいて同
じ発現パターンを示し、途中で異なる発現パターンを示
したことを表示するものである。
実データとの対応関係を示す説明図である。図6は、図
4中の初期パラメータ設定処理(ステップ401)に関
するアルゴリズムの詳細を示している。
置101から読み込む。この遺伝子発現パターンデータ
には、図5に示すようにm+1個のサンプル遺伝子g0,g
1,...gmについて、時刻T0,T1,...Tnにおいて実験し
た結果の発現パターンデータが入っているものとする。
そこで、時刻Tjにおける遺伝子giの発現の観測値をg
[j][i]とおく(ステップ601)。
使って、クラスタリング適用範囲(開始時刻Tstart、
終了時刻Tend)、異なるクラスタとみなすべき基準を
示す正数値(Kstart,Kstart+1,…,Kend)、クラスタ
リングの粒度を示す整数(S)、クラスタリング手法を
それぞれ入力する(ステップ602)。
に太枠実線201で示すように、細胞の一連のプロセス
において、より詳しくクラスタリングする時間区間を示
す。例えば細胞の一連のプロセスにおいて、ある時刻で
細胞に特殊な発現パターンがみられた場合、その時刻の
前後をクラスタリング適用範囲に指定することで、全遺
伝子の発現状態をより詳しくモニタリングするように選
択する。従来のクラスタリングとの基本的な相違点は、
図13のような細胞の全プロセスにおいて発現状態の近
いもの同士をクラスタリングするのではなく、図2に示
すような相異なる遺伝子が範囲の始めにおいて同じ発現
パターンを示し、範囲の途中で異なる発現パターンを示
したことを表示するところにある。
クラスタの間の非類似度が最低でもどれくらいの値をと
るかを示すものである。すなわち、クラスタ間の閾値K
を示している。閾値がKstart,Kstart+1,…,Kendと可
変に設定できることで、時間によって粗いクラスタリン
グから細かいクラスタリングまで調節できる。
似度の計算において、本システムでは、発現データの時
刻T0,T1,...Tnにおける全てのデータを非類似度の計
算の対象とせずに、ある時間区間を設けて、その時間区
間内におけるデータを非類似度の計算の対象とする。こ
の時間区間を図5に示すようにスリット501、このス
リット501の長さ(時間軸方向の幅)Sをクラスタリ
ングの粒度とよぶ。本アルゴリズムでは、まずスリット
501の先頭をTstartに合わせてデータをTs tartから
Tstart+Sの範囲でクラスタリングを行ない、そこで分
割された各々のクラスタ内において、スリット501を
時刻が正の方向へ1つずらし、Tstart+ 1からT
start+S+1の範囲でクラスタリングを行なう。このよう
な操作をスリットの後端がTendになるまで逐次実行す
る。したがって、粒度が細かいほど、すなわち時間区間
の幅が短いほど、より細かい遺伝子間の発現の違いを表
すことができる。
において個体同士の相関関係を表す類似度または非類似
度(ピアソンの相関係数、ユークリッド平方距離、標準
化ユークリッド平方距離、マハラノビスの距離、ミンコ
フスキー距離など)及びクラスタ合併のアルゴリズム
(最短距離法、最長距離法、群平均法、重心法、メディ
アン法、ウォード法、可変法など)を指定する。本アル
ゴリズムは非類似度を対象としているが、クラスタリン
グ手法において類似度を選択した場合は、計算した類似
度に負符号を付けたり、逆数をとるなどの操作を施し、
非類似度に変換すればよい。
が正しいかどうか調べる。クラスタリング適用範囲T
start、TendがT0からTnの範囲に含まれているか(ス
テップ603)、クラスタリングの粒度Sがクラスタリ
ング適用範囲の幅を超えてないか(S≦ end−start)
(ステップ604)、また設定したクラスタリング手法
において、合併アルゴリズムを重心法、メディアン法、
ウォード法を選択した時、非類似度においてユークリッ
ド平方距離を選択したかなど、類似度または非類似度と
合併アルゴリズムは妥当な組み合わせか(ステップ60
6)を調べる。もし、これらの値で正当なものが入って
いないならば、表示装置102にエラーを出力し、再入
力を促す(ステップ607)。
に、i=1,2,…,mに対して遺伝子giの平均発現度Gi=(g
[0][i]+g[1][i]+…g[n][i])/nを求める(ステップ60
8)。
ために図5に示すような配列l[I](I=0,1,…,m)502と
整数値変数lmaxを用意する。各l[I]は構造体データで、
図5に示すように遺伝子のインデックスを表すメンバ
(index)と異なるクラスタ間の仕切り線の位置を表す
メンバ(linepos)からなる。構造体のメンバは、l[I].in
dex,l[I].lineposという形で値を代入・参照できる。そ
こで、全てのIに対してl[I].lineposの値をTendとして
初期化し(ステップ609)、さらにlmaxの値を「0」
としておく(ステップ610)。次に、変数tにstart
の値を設定する(ステップ611)。
“クラスタ”と呼ばれる抽象データ型を使っている。ク
ラスタには、整数の登録、削除、登録データの参照のイ
ンタフェースを備えているものとする。
m}を登録し処理を終了する(ステップ612)。
リング適用範囲201に対して処理を行なう。すなわ
ち、上で定めたtとBとを引数として表示位置決定処理
(図4のステップ402の処理A)を行なう。
A)の詳細を示すフローチャートであり、この処理Aの
中で配列lに表示情報を登録する。
時刻をtとする(ステップ701)。ここでBを更にク
ラスタリングする(処理B)。このときtとBを引数と
して与える。処理Bの結果として、総クラスタ数がcmax
に、クラスタリング結果がA[J](J=1,2,…,cmax)に
設定される(ステップ702)。処理Bの詳細について
は後述する。
判定する(ステップ703)。endの時はスリット50
1の終端がクラスタリング適用範囲201の終わりに来
たことを意味し、ここでクラスタリング処理を終了す
る。このとき、J=1としてJがcmaxを超えるまで、各
々のクラスタに対して次の処理を実行する(ステップ7
04,705)。クラスタA[J]の要素が{i1,…,ik}
であるとき、これらの要素を一定の基準の下に並べて表
示する。ここでは各要素に対応する遺伝子の平均発現度
Gi1,...Gikを値の降順に並べて、それをGj1,...Gjk
とおく(ステップ706)。
現パターンデータの位置情報を表すl[].indexに平均輝
度が降順になるように l[lmax].index=j1、l[lmax+1].i
ndex=j2、…、l[lmax+k−1].index=jkと設定し(ステッ
プ707)、異なるクラスタとの仕切り線(図2の20
2で代表して示す横方向の太実線)を表す l[lmax+k−
1].lineposに時刻tからt+S(=Tend)の範囲まで線を
引くことを示すtの値を入力する(ステップ708)。
示すlmaxにkを加算する(ステップ709)。次に、J
を1つインクリメントし、次のクラスタの処理に移る
(ステップ710)。
S」がendと一致しない場合、すなわちスリット501
の終端がクラスタリング適用範囲201の終わりに来て
いないとき、tを1つインクリメントし、Jに「1」を
設定する(ステップ711)。Jがcmaxを超えるまで、
各々のクラスタに対して次の処理を行なう(ステップ7
12)。すなわちBにA[J]を代入し(ステップ71
3)、引数として時刻t、クラスタBを与えて表示位置
決定処理(処理A)を行なう(ステップ714)。次
に、異なるクラスタとの仕切り線を表す l[lmax−1].li
neposに時刻tからTendの範囲まで線を引くことを示す
tを入力する(ステップ715)。そして、Jを1つイ
ンクリメントし、次のクラスタの処理に移る(ステップ
716)。全てのクラスタA[J](J=1,…,cmax)に関
する処理が終われば終了する。
(処理B)のアルゴリズムを示すフローチャートであ
る。まず、引数として入力されたクラスタをB、入力さ
れた時刻をtに入れる(ステップ801)。
とき、i1,…,ikに対応する遺伝子間の時刻tから時刻t
+Sにおける類似度または非類似度dij(i<jかつi,j∈{i
1,i2,…,ik})を求める(ステップ802)。
データ{g[0][i],g[1][i],…,g[n][i]}、{g[0][j],g
[1][j],…,g[n][j]}の時刻tから時刻t+Sにおける類
似度(非類似度)とは、例えば以下のような計算で求め
る量である(ステップ802)。
指定したとき
象にしているので、類似度を適用する場合には負符号を
付ける、逆数をとるなどの操作をして非類似度に変換し
なければならない。
離を指定したとき、
したとき、
き、
き、
れのクラスタにC[1]←{i1},……,C[k]←{ik}を登
録しておく(ステップ803)。そして、生成したクラ
スタの数を表す変数ccntにkを代入しておく(ステップ
804)。次に、空集合のクラスタDを生成する(ステ
ップ805)。
i,j(i,j ∈{1,2,…,ccnt}−D)の値の最小値dp,qを求
め、先に設定した閾値Kt以下かどうか判定する(ステッ
プ806、807)。dp,qがKt以下のとき次のことを実
行する。クラスタC[ccnt+1]を新たに生成し、クラスタ
C[p]とクラスタC[q]に含まれる要素の和集合をクラス
タC[ccnt+1]に登録し(ステップ808)、クラスタC
[p]とクラスタC[q]に含まれる要素を削除する(ステッ
プ809)。次に、C[p]とC[q]はもう必要ないので、
Dにp、qを登録する(ステップ810)。次に、クラス
タC[h] (h ∈{1,2,…,ccnt}−D)とクラスタC[ccnt+
1]間の時刻tから時刻「t+S」における非類似度 d
h,ccnt+1を求める(ステップ811)。ここでd
h,ccnt+1は、次の計算式で求めることができる。すなわ
ち
C[k]内の要素の個数としたとき、クラスタリング手法
が (1)最短距離法のときα=0.5、β=0.5、γ=0、δ=−0.5 (2)最長距離法のときα=0.5、β=0.5、γ=0、δ=0.5 (3)群平均法のときα=n(p)/n(ccnt+1)、β=n(q)/n(ccnt+1)、γ=0、δ=0 (4)重心法のときα=n(p)/n(ccnt+1)、β=n(q)/n(ccnt+1)、 γ=−n(p)n(q)/n(ccnt+1)2、δ=0 (5)メディアン法のときα=0.5、β=0.5、γ=−0.25、δ=0 (6)ウォード法のときα={n(h)+n(p)}/{n(h)+n(ccnt+1)}、 β={n(h)+n(q)}/{n(h)+n(ccnt+1)}、γ=−n(h)/{n(h)+n(ccnt+1)}、δ=0 である。
ntに「1」を加える(ステップ812)。これらの処理
を更新したdi,j(i,j∈{1,2,…,ccnt}−D)の最小値がK
tより大きくなるまで続ける。
がKtより大きいとき、クラスタリングを終えて、結果
の出力処理を行なう。まず、クラスタC[1]からC[ccn
t]で、空集合でないものを判定し、この総数をcmaxに入
力する(ステップ813)。そして、cmax個のクラスタ
A[1],…,A[cmax]を生成する(ステップ814)。空
集合でないクラスタに対し、それに含まれる遺伝子の平
均発現度の平均をとる。すなわち、クラスタC[p]={i1,
…,ik}に対して、G’p=(Gi1+...+Gik)/kを求め
る。この値を降順に並べたものを、G’p1,,…,G’
pcmaxとしたときA[1] ← C[p1],…,A[cmax] ← C[p
cmax]を登録する(ステップ815)。最後に、総クラ
スタ数cmaxとクラスタA[1],…,A[cmax]を出力し(ス
テップ816)、処理を終了する。
リズムの詳細を示すフローチャートである。このアルゴ
リズムは、配列l[I]を読み込み、対応する遺伝子の発現
データを表示する処理である。
0)、iの値がlmaxと等しくなるまで、各々の遺伝子発
現データに対して以下の操作を続ける(ステップ100
1)。次に、x=l[i].indexが指す遺伝子1行分の発現デ
ータg[k][x](k=0,1,…,n)の数値を対応する表示色に置
き換え、第i行として1行にわたり表示する(ステップ
1002)。更に、クラスタ間の仕切り線を、今表示し
た第i行のすぐ下の時刻l[i].lineposからTendの範囲に
引く(ステップ1003)。
endの場合は、クラスタ間の仕切り線は存在せず線も書
く必要が無い。iを1つずつインクリメントし(ステッ
プ1004)、ステップ1001においてiがlmaxにな
ったら、処理を終える。
な、相異なる遺伝子がクラスタリング適用範囲の始めに
おいて同じ遺伝子発現パターンを示し、範囲の途中で異
なる発現パターンを示すような状況を効果的に表示する
ことができる。
子がクラスタリング適用範囲の始めにおいて異なる遺伝
子発現パターンを示し、範囲の途中で同じ発現パターン
を示すような状況を効果的に表示する場合には、ステッ
プ609(図6)においてl[i].lineposにTstartを、
ステップ611においてtにendを設定し、ステップ7
03(図7)においてt+S=endの判定条件をt−S=st
artにし、ステップ711においてt←t+1をt←t−
1に置き換え、ステップ1003(図10)においてク
ラスタ間の仕切り線を、Tstartからl[i].lineposの範
囲に引けばよい。これは、はじめスリットの終端部分を
Tendに設定しておき、時間軸の負の方向へ1つずつス
リットを移動してクラスタリングすることを意味してい
る。
の応用例として、クラスタリング適用範囲の前方から時
間軸の正の方向へスリットを動かしてクラスタリングを
行ない、図11に示したような表示が得られた場合を考
える。このとき、図11の点線1101,1102で囲
んだような似通った発現パターンが見られた場合、それ
らの遺伝子をマーキング(1103)しておき、クラス
タリング適用範囲201の後方から時間軸の負の方向に
向けてクラスタリングを行なう。もし、図12に示した
ようにマーキング(1103)した遺伝子が互いに近い
位置にあるものが見つかる(例えばと、とな
ど)ならば、これらの遺伝子は始め異なる遺伝子発現パ
ターンを示し、途中で同じ発現パターンを示すことを意
味しており、このような双方向のクラスタリングによっ
て個々の遺伝子の発現状態を容易に推測することが出来
る。
ット幅Sをnに設定すれば、従来の技術の中で説明した
P.Brownらの結果と同様の表示を得ることが出来る。
るものではなく、実施に際しては、細部を種々変更して
実施することができる。例えば、途中から発現パターン
が変わった部分あるいは境界においては、フリッカ表
示、高輝度表示、色反転表示などの既知の表示形態を各
種組み合わせて表示することができる。
は、プログラムとしてCD−ROM等の記録媒体に記録
してコンピュータユーザに提供することができる。
発現データに限定されるものではなく、図3または図4
における横軸(時間軸)を他の基準にとり変えることに
よって、例えば異なる実験間について比較を行うなどの
利用が考えられる。
例を説明したが、最近においては多色プリンタの精度が
向上しているため、多色プリンタで印刷出力する構成で
あってもよい。本発明の表示とは、プリンタで視覚的に
印刷出力する概念を含むものである。
細胞の発現サイクルの一部区間を指定し、その範囲にお
いて細かい粒度でクラスタリングを行なうことができ
る。そして、この表示結果に基づいて、利用者は遺伝子
の発現経過の状態をより詳細に観測することができ、遺
伝子の発現状態から生物学的機能を効率的よく推測する
ことができる。
システム構成図である。
クラスタリングしたときの遺伝子発現パターン表示例
(その1)を示す模式図である。
クラスタリングしたときの遺伝子発現パターン表示例
(その2)を示す模式図である。
トである。
の関係を示す説明図である。
示すフローチャートである。
チャートである。
ャートである。
チャートである。
正の方向へスリットを動かしてクラスタリングを行った
ときの遺伝子発現パターン表示例を示す説明図である。
負の方向へスリットを動かしてクラスタリングを行った
ときの遺伝子発現パターン表示例を示す説明図である。
のどうしをクラスタリングしたときの遺伝子発現パター
ン表示例を示す説明図である。
…表示装置、103…キーボード、104…マウス、1
05…クラスタリング処理部、201…クラスタリング
範囲、501…スリット。
Claims (5)
- 【請求項1】 時間経過に伴って発現の度合いが変化す
る複数の遺伝子の時系列発現パターンを視覚的に表示す
る遺伝子発現パターン表示方法であって、 前記複数の遺伝子の時系列発現パターンデータの任意の
時間区間を指定するステップと、 指定された時間区間における時系列発現パターンデータ
を予め定めた基準値によってクラスタリングし、さらに
同一クラスタ内において基準値を変えながら正または負
の時間方向にクラスタリングを繰り返し行ない、その結
果を予め定めた表示形式で表示するステップとを備える
ことを特徴とする遺伝子発現パターン表示方法。 - 【請求項2】 前記基準値は、異なる遺伝子において発
現のパターンが同じまたは異なるとみなすべき値である
ことを特徴とする請求項1記載の遺伝子発現パターン表
示方法。 - 【請求項3】 前記時間区間において、異なる2つ以上
の遺伝子が、初め同じ発現パターンを示し、途中から異
なる発現パターンを示すものを予め定めた表示形式で表
示することを特徴とする請求項1または2記載の遺伝子
発現パターン表示方法。 - 【請求項4】 前記時間区間において、異なる2つ以上
の遺伝子が、初め異なる発現パターンを示し、途中から
同じ発現パターンを示すものを予め定めた表示形式で表
示することを特徴とする請求項1または2記載の遺伝子
発現パターン表示方法。 - 【請求項5】 時間経過に伴って発現の度合いが変化す
る複数の遺伝子の時系列発現パターンデータをデータベ
ースから取得し、時系列発現パターンを表示装置画面に
視覚的に表示する遺伝子発現パターン解析装置であっ
て、 前記データベースから取得した前記複数の遺伝子の時系
列発現パターンデータの任意の時間区間を指定する入力
手段と、 指定された時間区間における時系列発現パターンデータ
を予め定めた基準値によってクラスタリングし、さらに
同一クラスタ内において基準値を変えながら正または負
の時間方向にクラスタリングを繰り返し行ない、その結
果を予め定めた表示形式で前記表示装置画面に表示させ
る演算手段とを備えることを特徴とする遺伝子発現パタ
ーン解析装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27791899A JP3628005B2 (ja) | 1999-09-30 | 1999-09-30 | 遺伝子発現パターン表示方法および装置 |
EP00121116A EP1089211B1 (en) | 1999-09-30 | 2000-09-28 | Method and apparatus for displaying gene expression patterns |
DE60024029T DE60024029T2 (de) | 1999-09-30 | 2000-09-28 | Verfahren und Vorrichtung zur Darstellung von Gen-Expressionsmustern |
US09/677,042 US7031847B1 (en) | 1999-09-30 | 2000-09-29 | Method and apparatus for displaying gene expression patterns |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27791899A JP3628005B2 (ja) | 1999-09-30 | 1999-09-30 | 遺伝子発現パターン表示方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001095568A true JP2001095568A (ja) | 2001-04-10 |
JP3628005B2 JP3628005B2 (ja) | 2005-03-09 |
Family
ID=17590113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27791899A Expired - Fee Related JP3628005B2 (ja) | 1999-09-30 | 1999-09-30 | 遺伝子発現パターン表示方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3628005B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010262667A (ja) * | 2010-07-06 | 2010-11-18 | Sony Corp | 生体物質情報に係わる可視化方法、可視化装置、並びに情報記憶媒体 |
-
1999
- 1999-09-30 JP JP27791899A patent/JP3628005B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010262667A (ja) * | 2010-07-06 | 2010-11-18 | Sony Corp | 生体物質情報に係わる可視化方法、可視化装置、並びに情報記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP3628005B2 (ja) | 2005-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kelley et al. | Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks | |
JP5297207B2 (ja) | スペクトル分析を介したdnaパターンの同定方法及びシステム | |
CN110832510A (zh) | 基于深度学习的变体分类器 | |
AU2019272065C1 (en) | Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs) | |
CN109887546B (zh) | 基于二代测序的单基因或多基因拷贝数检测系统及方法 | |
US6502039B1 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
US20070078606A1 (en) | Methods, software arrangements, storage media, and systems for providing a shrinkage-based similarity metric | |
JP3532911B2 (ja) | 遺伝子データ表示方法及び記録媒体 | |
EP1089211B1 (en) | Method and apparatus for displaying gene expression patterns | |
EP1630709B1 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
JP2001095568A (ja) | 遺伝子発現パターン表示方法および装置 | |
Sohn et al. | New normalization methods using support vector machine quantile regression approach in microarray analysis | |
CN115565610A (zh) | 基于多组学数据的复发转移分析模型建立方法及系统 | |
JP3563315B2 (ja) | 樹状図表示方法及び樹状図表示システム | |
CN108182347B (zh) | 一种大规模跨平台基因表达数据分类方法 | |
US6994965B2 (en) | Method for displaying results of hybridization experiment | |
JP3983569B2 (ja) | 多変量解析システム、発現プロファイル解析方法、コンピュータプログラム、コンピュータ読み取り可能な記憶媒体 | |
JP2003028855A (ja) | クラスタリング結果評価方法及びクラスタリング結果表示方法 | |
JP3773092B2 (ja) | 遺伝子発現パターン表示方法および装置並びに記録媒体 | |
Girija et al. | Deep learning for vehement gene expression exploration | |
US20230316054A1 (en) | Machine learning modeling of probe intensity | |
US20190362811A1 (en) | Biological material analysis method, biological material analysis device, and biological material analysis program | |
Lewin et al. | Bayesian methods for microarray data | |
JP2004355269A (ja) | クラスタ判別結果表示方法 | |
Pandey et al. | Association analysis techniques for discovering functional modules from microarray data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041206 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101217 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |