JP2007048027A - 遺伝子発現データと遺伝子機能の関連表示方法 - Google Patents

遺伝子発現データと遺伝子機能の関連表示方法 Download PDF

Info

Publication number
JP2007048027A
JP2007048027A JP2005231642A JP2005231642A JP2007048027A JP 2007048027 A JP2007048027 A JP 2007048027A JP 2005231642 A JP2005231642 A JP 2005231642A JP 2005231642 A JP2005231642 A JP 2005231642A JP 2007048027 A JP2007048027 A JP 2007048027A
Authority
JP
Japan
Prior art keywords
gene
function
tree structure
display
expression data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005231642A
Other languages
English (en)
Inventor
Ayako Fujisaki
綾子 藤崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2005231642A priority Critical patent/JP2007048027A/ja
Publication of JP2007048027A publication Critical patent/JP2007048027A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 遺伝子発現データと遺伝子機能との関連性をより明確に表示する方法を提供する。
【解決手段】 遺伝子発現データと遺伝子機能の関連表示方法は、Gene Ontologyによる分子機能のツリー構造、細胞内局在のツリー構造、及び、生物学的過程のツリー構造の少なくとも1つを表示装置に表示するツリー構造表示ステップと、上記ツリー構造に含まれる遺伝子機能の1つが選択されたとき、該遺伝子機能に属する遺伝子数と該遺伝子の発現データを上記表示装置に表示する遺伝子数表示ステップと、を有し、上記遺伝子数表示ステップは、入力装置を介して上記ツリー構造に含まれる遺伝子機能の表示数と該遺伝子機能に属する遺伝子の表示数の制限するためのフィルタリング条件が入力されたとき、該フィルタリング条件に基づいて、遺伝子機能と該遺伝子機能に属する遺伝子数と該遺伝子の発現データを表示する。
【選択図】 図1

Description

本発明は、DNAチップ(又はDNAマイクロアレイ)を用いて得られた遺伝子の発現量の数値データを解析するシステムに関し、特に、遺伝子発現データとGene Ontologyに基づいて表示された遺伝子の機能の関連を表示する方法に関する。
近年、DNAチップ(又はDNAマイクロアレイ)の開発によって、遺伝子の発現を網羅的に調べることができる方法が確立されてきた。DNAチップを用いる方法では、先ず、解析対象の生物種からmRNAを採取し、これをターゲットとする。遺伝子コード領域の一部分であるc DNA配列またはオリゴヌクレオチドを調製し、これをプローブとする。スライドガラス上にプローブを高密度に配置する。このプローブにターゲットをハイブリダイゼーションさせ、ハイブリダイゼーション強度を測定することにより、その転写量を測定する。
ハイブリダイゼーション強度は、蛍光強度として得られる。従って、スライドガラス上のプローブの配列から、蛍光強度画像が得られる。それを、専用のスキャナー装置を用いてスキャンし、定量する。蛍光強度の数値データは、遺伝子の発現量を表す。
近年、ヒト、マウス等の高等動物の遺伝子の発現量を網羅的に調べることが可能となっている。従って、研究者は以前よりもさらに大量の数値データを扱わなければならなくなってきた。そのために、研究者が目的とする遺伝子の機能を調べるための解析システムが必要である。
遺伝子の機能を調べるには、解析対象の遺伝子群を、遺伝子の機能に基づいて、分類し、視覚化する必要がある。遺伝子の機能を表示する方式として、今日最もよく使われているものに、Gene Ontologyがある。Gene Ontologyは、遺伝子の機能に関する統一的な枠組みを制定する必要性から立ち上げられたGene Ontologyコンソーシアム(http://www.geneontology.org/)と呼ばれるプロジェクトによって、提案されたものである。Gene Ontologyによると、遺伝子の機能を3つの情報として体系化している。即ち、1.分子機能(Molecular Function)、2.細胞内局在(Cellular component)、3.生物学的過程(Biological process)である(Nature Genetics. 2000 May;25(1):25-9.)。
特許文献1には、遺伝子の機能や制御情報と数値データ(発現データ)との関連性を示す方法が挙げられている。特許文献1に記載された方法では、複数の遺伝子の関連性をネットワークとして視覚化し表現する。
特開2004−234654(P-2004−234654A)
遺伝子の機能を調べるには、遺伝子の機能をGene Ontologyの3つ形態として体系化して表示すると便利である。従って、DNAチップの発現データとGene Ontologyの3つの形態の関連性を表示するシステムが、望まれている。
特許文献1に記載された手法は、発現解析のデータを扱う上で必要な方法ではあるが、発現解析のデータと3つの形態の関連性を表示することはできない。
本発明の目的は、遺伝子発現データと遺伝子機能との関連性をより明確に表示する方法を提供する。
本発明によると、遺伝子発現データと遺伝子機能の関連表示方法は、
入力装置を介して遺伝子発現データを入力する入力ステップと、
入力装置を介して入力された選択に従って、Gene Ontologyによる分子機能のツリー構造、細胞内局在のツリー構造、及び、生物学的過程のツリー構造の少なくとも1つを表示装置に表示するツリー構造表示ステップと、
入力装置を介して上記ツリー構造に含まれる遺伝子機能の1つが選択されたとき、該遺伝子機能に属する遺伝子数と該遺伝子の発現データを上記表示装置に表示する遺伝子数表示ステップと、
を有し、上記遺伝子数表示ステップは、入力装置を介して上記ツリー構造に含まれる遺伝子機能の表示数と該遺伝子機能に属する遺伝子の表示数の制限するためのフィルタリング条件が入力されたとき、該フィルタリング条件に基づいて、遺伝子機能と該遺伝子機能に属する遺伝子数と該遺伝子の発現データを表示する。
本発明によれば、遺伝子発現データと遺伝子機能との関連性をより明確に表示することができる。
以下、本発明を実施する場合の一形態について、図面を参照して具体的に説明する。図1は、本発明を実現するためのシステム構成図を示している。本例の遺伝子発現データと遺伝子機能の関連表示システムは、中央処理装置11、プログラムを格納するプログラムメモリ12、データの入力や出力のためのインターフェースを提供する表示装置13、情報を選択または入力するためのマウスやキーボード等の入力装置14、及び、遺伝子発現データベース15を有する。
遺伝子発現データベース15には、DNAチップを用いた実験より得られた遺伝子の発現量を表わすシグナル値、及び、遺伝子のアノテーション情報が格納されている。アノテーション情報とは、遺伝子の名称や公共データベースのアクセッション番号などのことを意味する。
プログラムメモリ12に格納されているプログラムには、Gene Ontologyの階層構造を表示する、分子機能の表示プログラム101、細胞内局在の表示プログラム102、生物学的過程の表示プログラム103、及び、遺伝子機能に対応する遺伝子数を演算する遺伝子数の演算プログラム104を有する。
図2は、分子機能の表示プログラム101を実行することによって得られる分子機能(Molecular Function)のツリー構造の表示例200を示す。四角内の文字は、遺伝子の機能201を表す。遺伝子の機能はTermと称される。遺伝子機能201同士の関連性は矢印202で示す。
本例によると、各遺伝子機能201に対して遺伝子発現データが関連付けられる。即ち、各遺伝子機能201に対して、それに関与する遺伝子203が関連づけられる。例えば、遺伝子機能”Lamin/chromatin binding”に関与する遺伝子として、MCM2, MCM4, MCM5が挙げられる。
遺伝子203の発現量は、その文字列の色によって表現する。ここで発現量とは、シグナル値又はLog Ratioの値であるが、これについては後に図4を参照して説明する。こうして、本例によると、分子機能のツリー構造において、遺伝子機能201に遺伝子203を関連付けることによって、Gene Ontologyの階層構造における遺伝子とその機能の関連性を明確に理解することが可能となる。
尚、細胞内局在の表示プログラム102、及び、生物学的過程の表示プログラム103を実行することによって、同様なツリー構造の表示が得られ、各遺伝子機能に対して遺伝子が関連付けられる。
図3を参照して、表示装置13に表示される画面の例を説明する。図3Aは、分子機能のツリー構造301、細胞内局在のツリー構造302、生物学的過程のツリー構造303を表示する初期画面300の例を示す。これらのツリー構造301、302、303は、それぞれ、分子機能の表示プログラム101、細胞内局在の表示プログラム102、及び、生物学的過程の表示プログラム103によって作成されたものである。この画面300では、ツリー構造301、302、303の遺伝子機能201と遺伝子機能同士の関連性202のみを表示し、各遺伝子機能201に属する遺伝子203は表示しない。尚、図3Aのツリー構造301、302、303は、実際には、図2に示したように複雑な構造を有するが、ここでは簡略化して図示されている。
ここでは、3つのツリー構造301、302、303を1つの画面300上に同時に表示しているが、1つの画面に1つのツリー構造のみを表示することもできる。
この画面300の右側には、3つのツリー構造301、302、303の文字表示304が表示されている。画面300上の図形表示とその右側の文字表示304は対応している。従って、例えば、画面300上に1つのツリー構造301のみが表示されている場合には、その右側には、その文字表示のみが表示される。
この画面300の右側には、更に、フィルタリング条件のダイアログビュー305、306が表示されている。フィルタリングとは、ツリー構造301、302、303に含まれる遺伝子機能201の表示数と各遺伝子機能201に属する遺伝子203の表示数を制限することであり、フィルタリング条件とは、そのような表示数の制限条件である。
上側のダイアログビュー305は、二つのシグナル値の比を意味するFold Change(2色法であればLog Ratio)の最小値305aと最大値305bを有する。下側のダイアログビュー306は、P-valueの最小値306aと最大値306bを有する。このように、数値データの範囲を指定することにより、遺伝子機能201の表示数と各遺伝子機能に属する遺伝子203の表示数を制限し、ツリー構造301、302、303を見易くすることができる。
フィルタリング条件として、Fold Change 、P-value以外のパラメータに制限を設けてもよい。例えば、文字列を保持しているデータカラムをフィルタリング対象としてもよく、Descriptionに含まれる文字列や、クラスタ番号をフィルタリングの対象としてもよい。
この初期画面300では、3つのツリー構造301、302、303において、全ての遺伝子機能と各遺伝子機能に属する全ての遺伝子を表示してよいが、フィルタリング条件のデフォルト値又は前回の入力値を用いてもよい。この初期画面300にて、フィルタリング条件を入力すると、入力したフィルタリング条件が反映されたツリー構造301、302、303が表示される。
図3Bは、図3Aのツリー構造301の所定の遺伝子機能201を選択し、クリックしたときに表示される画面300aの例を示す。先ず、選択した遺伝子機能201に隣接して、フィールド310が表示される。このフィールド310には、全遺伝子数に対するこの遺伝子機能201に属する遺伝子数の割合が分数として表示される。図3Bの例では、全遺伝子数は400であり、この遺伝子機能201に属する遺伝子数は30である。フィールド310をクリックすると、その遺伝子機能201に属する遺伝子のシンボル名311が表示される。ここに表示された遺伝子の発現量は、その文字列の色によって表現する。
画面300aの右側の、3つのツリー構造の文字表示304の領域には、選択した遺伝子機能201の名称312が表示される。更に、画面300aの下側には、遺伝子機能201に属する遺伝子の発現データ313が表示される。上述の例では、30個の遺伝子の発現データ313が表示される。この遺伝子の発現データ313は、遺伝子発現データベース15から読み取られたものである。
この画面300aに表示された遺伝子機能201の数及びそれに属する遺伝子の数は、上述のようにフィルタリング条件によって制限されたものである。
こうして本例によると、遺伝子機能を体系的に表現するGene Ontologyのツリー構造において、所望の遺伝子機能をクリックすることにより、それに関連付けられた遺伝子数を表示する。従って、分子機能、細胞、DNA代謝の面から、各遺伝子がツリー構造のどの階層のどの位置に存在し、その存在分布はどれくらいか、また、その発現量のレベルなどを総合的に且つ視覚的に理解することができる。また、フィルタリング条件を所望の値に設定することにより、表示する項目を制限することができるから、遺伝子の機能のうち必要とする部分を視覚的に理解することができる。
通常、DNAチップの発現データの解析においては、膨大な数値データを統計的な処理によって、目的とする生命現象に有意なデータのみを絞り込むステップが必要となる。本例によると、このステップを経て得られる遺伝子グループが、どのような機能を持っているのかをより詳しく調べていく過程において非常に有用性がある。また、クラスタ解析などの大まかな遺伝子の分類わけによって得られた各クラスタが、どのような機能を有しているかを調べるといった過程において、実用性がある。
図4は遺伝子発現データベース15に保存された情報の例を示す。図4(A)は、遺伝子発現データベースをそのまま表示したものであり、図4(B)は、図4(A)のデータから1個の遺伝子のデータを取り出して、その詳細を示したものである。
遺伝子発現データベースは、遺伝子毎に、遺伝子ID400、シグナル値401、402、アクセッション番号403、遺伝子のシンボル名404、生物学的過程405、細胞内局在406、分子機能407、Gene OntologyデータベースのID408、対数比409、及び、計算値(P-Value)410を含む。
遺伝子ID400は、遺伝子を一意に表す数字である。シグナル値401、402は、DNAチップを用いた実験により得られた遺伝子の発現量であり、各遺伝子に対してN個存在する。図示の例では二つのシグナル値401、402がある。アクセッション番号403は、公共データベースにアクセスするための番号である。遺伝子のシンボル名404は、遺伝子に付与された識別名である。生物学的過程405、細胞内局在406、及び、分子機能407は、Gene Ontologyによる分類名である。Gene OntologyデータベースのID408は、生物学的過程405、細胞内局在406、及び、分子機能407の3つの情報に関するデータベースの識別符号である。対数比409は、二つのシグナル値401、402を除算した結果を対数変換(底は2)したものである。計算値(P-Value)410は、複数のシグナル値のグループを比較し検定を行った計算結果である。
図5は本発明による遺伝子発現データと遺伝子機能の関連表示方法の処理の流れを示す。この図に基づいて説明する。先ず、ステップ500にて、ユーザの指示に従って、遺伝子発現データベース104から遺伝子発現データを読み出す。遺伝子発現データは、図4に示したように、遺伝子の発現量であるシグナル値401、402と公共データベースにアクセスするためのアクセッション番号403を含む。
次に、ステップ501にて、図3に示した分子機能のツリー構造301、細胞内局在のツリー構造302、生物学的過程のツリー構造303のいずれかの表示を選択する画面を表示し、ユーザの入力指示を待つ。
ユーザが分子機能のツリー構造301の表示を選択した場合には、ステップ502に進み、ユーザが細胞内局在のツリー構造302の表示を選択した場合には、ステップ503に進み、ユーザが生物学的過程のツリー構造303の表示を選択した場合には、ステップ504に進む。
ステップ502では、分子機能の表示プログラム101を起動し、図3Aに示したように、分子機能のツリー構造301を表示する。ステップ503では、細胞内局在の表示プログラム102を起動し、図3Aに示したように、細胞内局在のツリー構造302を表示する。ステップ504では、生物学的過程の表示プログラム103を起動し、生物学的過程のツリー構造303を表示する。尚、図3Aでは、3つのツリー構造301、302、303を1つの画面に表示したが、ここでは、1つのツリー構造を1つの画面に表示する。
ステップ505にて、ユーザが所定の遺伝子機能(Term) 201を選択したか否かを判定する。所定の遺伝子機能201を選択した場合には、ステップ506に進み、ユーザがフィルタリング条件を入力したか否かを判定する。フィルタリング条件を入力した場合には、ステップ507に進み、フィルタリング条件を入力しない場合には、ステップ508に進む。
ステップ507にて、フィルタリング条件を考慮して、選択された遺伝子機能201に属する遺伝子数を演算する。ステップ508にて、選択された遺伝子機能201に属する遺伝子数を演算する。尚、フィルタリング条件として、デフォルト値又は前回入力値を用いてもよい。ステップ507及び508の演算は、遺伝子数の演算プログラム104によって実行される。
ステップ509にて、フィルタリング条件を考慮して、ツリー構造の遺伝子機能を表示し、図3Bに示したように、全遺伝子数の対するその遺伝子機能201に属する遺伝子数の割合、遺伝子機能201に属する遺伝子の発現データを表示する。
ステップ505にて、ユーザが所定の遺伝子機能201を選択しない場合には、ステップ5010に進み、ユーザがフィルタリング条件を入力したか否かを判定する。フィルタリング条件を入力した場合には、ステップ511に進み、フィルタリング条件を入力しない場合には、ステップ505に戻る。ステップ511にて、フィルタリング条件を考慮して、ツリー構造の遺伝子機能を表示する。
以上、本発明の例を説明したが、本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて様々な変更が可能であることは当業者に理解されよう。
本発明の遺伝子発現データと遺伝子機能の関連表示システムの構成を示す図である。 分子機能(Molecular Function)のツリー構造の例を示す図である。 分子機能、細胞内局在及び生物学的過程の3つのツリー構造を1つの画面に表示した例を示す図である。 分子機能、細胞内局在及び生物学的過程の3つのツリー構造を1つの画面に表示した例を示す図である。 遺伝子発現データベースに保存された遺伝子発現データの例を示す図である。 本発明による遺伝子発現データと遺伝子機能の関連表示方法の処理を示す図である。
符号の説明
11…中央処理装置、12…プログラムメモリ、13…表示装置、14…入力装置、15…遺伝子発現データベース、101…分子機能の表示プログラム、102…細胞内局在の表示プログラム、103…生物学的過程の表示プログラム、104…遺伝子数の演算プログラム

Claims (1)

  1. 入力装置を介して遺伝子発現データを入力する入力ステップと、
    入力装置を介して入力された選択に従って、Gene Ontologyによる分子機能のツリー構造、細胞内局在のツリー構造、及び、生物学的過程のツリー構造の少なくとも1つを表示装置に表示するツリー構造表示ステップと、
    入力装置を介して上記ツリー構造に含まれる遺伝子機能の1つが選択されたとき、該遺伝子機能に属する遺伝子数と該遺伝子の発現データを上記表示装置に表示する遺伝子数表示ステップと、
    を有し、上記遺伝子数表示ステップは、入力装置を介して上記ツリー構造に含まれる遺伝子機能の表示数と該遺伝子機能に属する遺伝子の表示数を制限するためのフィルタリング条件が入力されたとき、該フィルタリング条件に基づいて、遺伝子機能と該遺伝子機能に属する遺伝子数と該遺伝子の発現データを表示することを特徴とする遺伝子発現データと遺伝子機能の関連表示方法。
JP2005231642A 2005-08-10 2005-08-10 遺伝子発現データと遺伝子機能の関連表示方法 Pending JP2007048027A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005231642A JP2007048027A (ja) 2005-08-10 2005-08-10 遺伝子発現データと遺伝子機能の関連表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005231642A JP2007048027A (ja) 2005-08-10 2005-08-10 遺伝子発現データと遺伝子機能の関連表示方法

Publications (1)

Publication Number Publication Date
JP2007048027A true JP2007048027A (ja) 2007-02-22

Family

ID=37850799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005231642A Pending JP2007048027A (ja) 2005-08-10 2005-08-10 遺伝子発現データと遺伝子機能の関連表示方法

Country Status (1)

Country Link
JP (1) JP2007048027A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102349075A (zh) * 2009-03-16 2012-02-08 学校法人明治大学 发现曲线分析系统及其程序
KR20180017706A (ko) * 2016-08-10 2018-02-21 한국원자력연구원 유전자 발현 정보 제공 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102349075A (zh) * 2009-03-16 2012-02-08 学校法人明治大学 发现曲线分析系统及其程序
CN102349075B (zh) * 2009-03-16 2014-12-17 学校法人明治大学 发现曲线分析系统及其程序
KR20180017706A (ko) * 2016-08-10 2018-02-21 한국원자력연구원 유전자 발현 정보 제공 장치
KR101893832B1 (ko) 2016-08-10 2018-08-31 한국원자력연구원 유전자 발현 정보 제공 장치

Similar Documents

Publication Publication Date Title
Zhang et al. mrMLM v4. 0.2: an R platform for multi-locus genome-wide association studies
Fan et al. miRNet—functional analysis and visual exploration of miRNA–target interactions in a network context
Minevich et al. CloudMap: a cloud-based pipeline for analysis of mutant genome sequences
Barrett et al. Mining microarray data at NCBI’s Gene Expression Omnibus (GEO)
Hoban et al. Computer simulations: tools for population and evolutionary genetics
Tseng et al. Tight clustering: a resampling-based approach for identifying stable and tight patterns in data
Gompert et al. INTROGRESS: a software package for mapping components of isolation in hybrids
Jansen Studying complex biological systems using multifactorial perturbation
Jeong et al. GenoCore: A simple and fast algorithm for core subset selection from large genotype datasets
Hou et al. Genetic network complexity shapes background-dependent phenotypic expression
Hillis et al. Contemporary methods and evidence for species delimitation
Richardson et al. Visual annotation display (VLAD): a tool for finding functional themes in lists of genes
Durinck et al. GenomeGraphs: integrated genomic data visualization with R
Seren GWA-Portal: Genome-wide association studies made easy
Darvishi Application of Nexus copy number software for CNV detection and analysis
JP2019514148A (ja) デジタルデータを解析するための方法
Masoudi-Nejad et al. RETRACTED ARTICLE: Candidate gene prioritization
Zhang et al. ezQTL: a web platform for interactive visualization and colocalization of QTLs and GWAS loci
Pommier et al. RAMI: a tool for identification and characterization of phylogenetic clusters in microbial communities
Scutari et al. Improving the efficiency of genomic selection
Spencer et al. Incorporating functional genomic information in genetic association studies using an empirical Bayes approach
Srivas et al. Assembling global maps of cellular function through integrative analysis of physical and genetic networks
Ryoo et al. Underestimation of heritability using a mixed model with a polygenic covariance structure in a genome-wide association study for complex traits
JP2007048027A (ja) 遺伝子発現データと遺伝子機能の関連表示方法
Lareau et al. Network theory for data-driven epistasis networks