JP4021406B2 - 樹状図表示方法及び樹状図表示システム - Google Patents
樹状図表示方法及び樹状図表示システム Download PDFInfo
- Publication number
- JP4021406B2 JP4021406B2 JP2003413205A JP2003413205A JP4021406B2 JP 4021406 B2 JP4021406 B2 JP 4021406B2 JP 2003413205 A JP2003413205 A JP 2003413205A JP 2003413205 A JP2003413205 A JP 2003413205A JP 4021406 B2 JP4021406 B2 JP 4021406B2
- Authority
- JP
- Japan
- Prior art keywords
- dendrogram
- subtree
- displaying
- input means
- display device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
- G06F18/41—Interactive pattern learning with a human teacher
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、遺伝子データ901からクラスタリング処理部902へデータを読み込む(ステップ1701)。これについては、後で詳しく説明する。次に、クラスタ分析、及び結果表示に必要な各種パラメータを設定する(ステップ1702)。ここでは、分類アルゴリズム及び(非)類似度の設定、個々の遺伝子情報を表示するか否かなどの設定を行う。
以上の選択が無かった場合には、処理を終了する。
まず、遺伝子数、実験ケースの総数をそれぞれgene_num、exp_numに登録する(ステップ1801)。次に、遺伝子データ901から遺伝子情報を読み取り、遺伝子情報構造体gene_info[i](i = 1,…,gene_num)に登録する(ステップ1802)。遺伝子データ901から遺伝子発現データを読み取り、Exp[i][j](i = 1,…,gene_num, j = 1,…,exp_num)に登録する(ステップ1803)。樹状図の葉の総数を表すleaf_numにgene_numを代入する(ステップ1804)。
windowIDがwidに対応するウィンドウ内の遺伝子間の発現度の非類似度を求める。clusterNoがi,jに対応する遺伝子の非類似度をdist[i][j]に登録する(ステップ1901)。本アルゴリズムでは、クラスタが1つ生成されるごとにclusterNoを1から順に割り振っている。そこで、次のクラスタが生成されたとき、そのクラスタの番号を表すnewclusterNoにleaf_num + 1を代入しておく(ステップ1902)。また、クラスタ間距離(非類似度)を格納する配列の情報として、併合対象クラスタ数を示すall_clustにleaf_numを代入し、i = 1,…,leaf_numに対し、cluster_idx[i]にiを代入して初期化しておく。併合対象クラスタの数all_clustが1に等しいかどうか判定し、等しくない場合、1になるまで以下の一連の処理を繰り返す(ステップ1905)。
6において選択した枝の両端に対応するクラスタを登録する。下(leaf側)のclusterをchildClustに代入し、枝の上(root側)のclusterをparentClustに代入する(ステップ2101,2102)。次に、新しくicon型clusterを生成し、childClustとparentClustの間に挿入する処理を行なう。すなわち、clusterを生成し、typeにiconを、leftにchildClust.clusterNo、をclusterNoにnewclusterNoを、windowIDにwidをそれぞれ登録する(ステップ2103)。そして、ポインタの付け替え操作として、parentClust.leftまたはparentClust.rightに登録されているchildClustのclusterNoをnewclusterNoに変更する(ステップ2104)。全体のクラスタ数がひとつ増加したので、新しいクラスタ構造体に割り振るclusterNoを示すnewclusterNoに1を加えて処理を終了する(ステップ2105)。
選択した枝以下に対応する部分木のルートノードのクラスタのclusterNoをclustNoに代入する(ステップ2201)。また、部分木の先頭からのインデックスを表すleafNoを1で初期化しておく(ステップ2202)。またi =1,…,key_numに対して、search[i].timesを0 、search[i].placeをnullで初期化しておく(ステップ2203)。次に、再帰的にクラスタ木に対するトリーウォークを実行し、searchで指定したキーワードをもつ遺伝子の単語検索処理(処理A)を行なう(ステップ2205)。引数としてclustNo、leafNoを渡す。単語検索処理については、後で詳しく説明する。処理Aを終えると、search構造体に検索結果が入力され、処理を終了する。
引数で渡されたclustNo、leafNoをそれぞれclustNo、leafNoに代入する(ステップ2300)。また、clusterNoの指すclusterをtargetClustに代入する(ステップ2301)。キーワード検索のカウンタを示すi を0に設定しておく(ステップ2302)。
新しく部分木を読み込んでウィンドウを作成するので、新しいウィンドウIDを示すwidをひとつインクリメントしておく(ステップ2401)。また、樹状図の葉の総数を表すleaf_numを0に初期化しておく(ステップ2402)。選択した枝以下に対応する部分木のルートノードのクラスタにおけるclusterNoをclustNoに代入する(ステップ2403)。最後に、部分木のleaf型クラスタに対して、新規clusterを生成する処理(処理B)を行なう(ステップ2404)。現在のクラスタを示すclustNoをこの処理の引数として渡す。この処理の詳細は後で説明する。すべてのleafを読み込み、leafに対応するclusterをすべて生成し処理を終了する。
引数で渡されたclustNoをclustNoとし、clustNoの指すclusterをtargetClustとする(ステップ2501,2502)。次に、targetCluster.typeがleafかどうかを判定する(ステップ2503)。leafであるならば、部分木のleafの数のカウンタであるleaf_numをひとつインクリメントする(ステップ2504)。次に新しいウィンドウの初期値となるleaf型クラスタ構造体を生成する。すなわち、clusterを生成し、typeにleafを、clusterNoにleaf_numを、geneIDにtargetCluster.geneIDを、windowIDにwidを登録し処理を終了する(ステップ2505)。
Claims (8)
- クラスタリング処理を行うプログラムを備えたコンピュータと、表示装置と、入力手段と、を用いた樹状図表示方法において、
前記コンピュータによって前記プログラムを実行することによって、
前記コンピュータに接続された遺伝データベースから、複数種類の生体高分子に対して複数の異なる条件で実験を行って得られたデータの組を入手するステップと、
前記入手したデータの組に基づいて前記複数種類の生体高分子のクラスタリング処理を行うステップと、
前記表示装置によって、該クラスタリング処理の結果を樹状図の形式で表示するステップと、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示するステップと、
前記入力手段によって前記メニューに表示された操作が選択されたとき、前記コンピュータに接続されたキーワード辞書ファイルに保持されている生体高分子に関する情報のキーワードを、前記選択された部分木に含まれる生体高分子から検索するステップと、
前記選択された部分木に含まれる生体高分子のうち、前記キーワード辞書ファイルに保持されているキーワードを含む生体高分子の数を計数するステップと、
前記表示装置にて、該計数結果を表示するステップと、
を実行することを特徴とする樹状図表示方法。 - クラスタリング処理を行うプログラムを備えたコンピュータと、表示装置と、入力手段と、を用いた樹状図表示方法において、
前記コンピュータによって前記プログラムを実行することによって、
前記コンピュータに接続された遺伝データベースから、複数種類の生体高分子に対して複数の異なる条件で実験を行って得られたデータの組を入手するステップと、
前記入手したデータの組に基づいて前記複数種類の生体高分子のクラスタリング処理を行うステップと、
前記表示装置によって、該クラスタリング処理の結果を樹状図の形式で表示するステップと、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示するステップと、
前記入力手段によって前記メニューに表示された操作が選択されたとき、前記コンピュータに接続されたキーワード辞書ファイルに保持されている生体高分子に関する情報のキーワードを、前記選択された部分木に含まれる生体高分子から検索するステップと、
前記選択された部分木において、前記キーワード辞書ファイルに保持されているキーワードを含む生体高分子の位置を検出するステップと、
前記表示装置にて、該検出した位置を表示するステップと、
を実行することを特徴とする樹状図表示方法。 - クラスタリング処理を行うプログラムを備えたコンピュータと、表示装置と、入力手段と、を用いた樹状図表示方法において、
前記コンピュータによって前記プログラムを実行することによって、
前記コンピュータに接続された遺伝データベースから、複数種類の生体高分子に対して複数の異なる条件で実験を行って得られたデータの組を入手するステップと、
前記入手したデータの組に基づいて前記複数種類の生体高分子のクラスタリング処理を行うステップと、
前記表示装置によって、該クラスタリング処理の結果を樹状図の形式で表示するステップと、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示するステップと、
前記入力手段によって前記メニューに表示された操作が選択されたとき、前記選択された部分木をアイコン化して前記表示装置に表示するステップと、
前記アイコン化した部分木を元の樹状図の形式に戻して前記表示装置に再表示するステップと、
を実行することを特徴とする樹状図表示方法。 - 請求項1〜3のいずれか1項記載の樹状図表示方法において、前記生体高分子はcDNA、RNA、DNA断片又は遺伝子であることを特徴とする樹状図表示方法。
- クラスタリング処理を行うプログラムを備えたコンピュータと、表示装置と、入力手段と、を有する樹状図表示システムにおいて、
複数種類の生体高分子に対して複数の異なる条件で実験を行って得られたデータの組を格納した遺伝データベースと、生体高分子に関する情報のキーワードを保持するキーワード辞書ファイルと、を有し、
前記コンピュータによって前記プログラムを実行することによって、
前記遺伝データベースに格納された前記データの組に基づいて前記複数種類の生体高分子のクラスタリング処理を行い、前記表示装置によって、該クラスタリング処理の結果を樹状図の形式で表示し、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示し、前記入力手段によって前記メニューに表示された操作が選択されたとき、前記選択された部分木に含まれる生体高分子のうち、前記キーワード辞書ファイルに保持されているキーワードを含む生体高分子の数を計数し、前記表示装置にて、該計数結果を表示することを特徴とする樹状図表示システム。 - 請求項5記載の樹状図表示システムにおいて、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示し、前記入力手段によって前記メニューに表示された操作が選択されたとき、前記選択された部分木において、前記キーワード辞書ファイルに保持されているキーワードを含む生体高分子の位置を検出し、前記表示装置にて、該検出した位置を表示することを特徴とする樹状図表示システム。 - 請求項5記載の樹状図表示システムにおいて、
前記入力手段によって前記樹状図の部分木が選択されたとき、該部分木に対する操作のリストを表示するメニューを表示し、前記入力手段によって前記メニューに表示された操作が選択されたとき、前記選択された部分木をアイコン化して前記表示装置に表示し、更に、前記アイコン化した部分木を元の樹状図の形式に戻して前記表示装置に再表示することを特徴とする樹状図表示システム。 - 請求項5〜7のいずれか1項記載の樹状図表示システムにおいて、前記生体高分子はcDNA、RNA、DNA断片又は遺伝子であることを特徴とする樹状図表示システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003413205A JP4021406B2 (ja) | 2003-12-11 | 2003-12-11 | 樹状図表示方法及び樹状図表示システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003413205A JP4021406B2 (ja) | 2003-12-11 | 2003-12-11 | 樹状図表示方法及び樹状図表示システム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35440199A Division JP3563315B2 (ja) | 1999-12-14 | 1999-12-14 | 樹状図表示方法及び樹状図表示システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004192651A JP2004192651A (ja) | 2004-07-08 |
JP4021406B2 true JP4021406B2 (ja) | 2007-12-12 |
Family
ID=32768064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003413205A Expired - Fee Related JP4021406B2 (ja) | 2003-12-11 | 2003-12-11 | 樹状図表示方法及び樹状図表示システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4021406B2 (ja) |
-
2003
- 2003-12-11 JP JP2003413205A patent/JP4021406B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004192651A (ja) | 2004-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Saeed et al. | [9] TM4 microarray software suite | |
US10275711B2 (en) | System and method for scientific information knowledge management | |
US8572064B2 (en) | Visualization technique for biological information | |
Sallaberry et al. | Sequential patterns mining and gene sequence visualization to discover novelty from microarray data | |
US20020067358A1 (en) | Data analysis software | |
US20050039123A1 (en) | Method and system for importing, creating and/or manipulating biological diagrams | |
WO2002095659A2 (en) | A system and method for managing gene expression data | |
JP3532911B2 (ja) | 遺伝子データ表示方法及び記録媒体 | |
EP1251435A2 (en) | Knowledge database and method for constructing and merging knowledge database | |
JP3563315B2 (ja) | 樹状図表示方法及び樹状図表示システム | |
JP2008515029A (ja) | 分子機能ネットワークの表示方法 | |
Kaushal et al. | Analyzing and visualizing expression data with Spotfire | |
JP4021406B2 (ja) | 樹状図表示方法及び樹状図表示システム | |
Markowitz et al. | Applying data warehouse concepts to gene expression data management | |
JPWO2005036441A1 (ja) | 生体関連事象間の相関データの可視化方法、解析法及びデータベース | |
US6994965B2 (en) | Method for displaying results of hybridization experiment | |
JP4298101B2 (ja) | 類似発現パターン抽出方法及び関連生体高分子抽出方法 | |
JP3773092B2 (ja) | 遺伝子発現パターン表示方法および装置並びに記録媒体 | |
US20040199544A1 (en) | Method and apparatus for providing an expression data mining database | |
Meert et al. | Clustering maps | |
Moussouni et al. | Database Challenges for Genome Information in the Post Sequencing Phase Moussouni | |
JP2024042485A (ja) | 遺伝子解析支援装置、遺伝子解析支援方法、およびプログラム | |
Cinar et al. | Clustering of short time-course gene expression data with dissimilar replicates | |
KR100882899B1 (ko) | 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체 | |
Dolan et al. | GenoSIS: genome data interpretation using GIS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070926 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131005 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |