JP2005267282A - 研究遺伝子産物関連度予測システム - Google Patents
研究遺伝子産物関連度予測システム Download PDFInfo
- Publication number
- JP2005267282A JP2005267282A JP2004079260A JP2004079260A JP2005267282A JP 2005267282 A JP2005267282 A JP 2005267282A JP 2004079260 A JP2004079260 A JP 2004079260A JP 2004079260 A JP2004079260 A JP 2004079260A JP 2005267282 A JP2005267282 A JP 2005267282A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- data
- genes
- database
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
【課題】発現実験データより発現した遺伝子を選び出し、文献データマイニングで求めた遺伝子関連ネットワークに当該発現データを重ねて関連ネットワーク表示を行うことができる研究遺伝子産物関連度予測システムを提供する。
【解決手段】遺伝子データベース1と薬物データベース2と疾患データベース3とを文献マイニングして文献マイニングデータベース6を作成する。文献マイニングデータベース6には疾患と遺伝子の関連性、薬物と遺伝子の関連性、遺伝子同士の関連性を示すデータなどが作成され保存される。一方、DNA発現データベース7には薬物投与によるDNA発現情報が保存される。文献マイニングデータベース6のデータとDNA発現データベース7のデータとをマージして、文献マイニングデータとDNA発現データとを統合表示する(S3)。
【選択図】 図2
【解決手段】遺伝子データベース1と薬物データベース2と疾患データベース3とを文献マイニングして文献マイニングデータベース6を作成する。文献マイニングデータベース6には疾患と遺伝子の関連性、薬物と遺伝子の関連性、遺伝子同士の関連性を示すデータなどが作成され保存される。一方、DNA発現データベース7には薬物投与によるDNA発現情報が保存される。文献マイニングデータベース6のデータとDNA発現データベース7のデータとをマージして、文献マイニングデータとDNA発現データとを統合表示する(S3)。
【選択図】 図2
Description
本発明は、コンピュータを用いた一塩基多型(SNP)解析のためのデータ処理に関するもので、特にキャピラリー電気泳動法を利用して取得した大量の遺伝子データを高速に効率良く処理するためのクロマトデータ処理システムに関する。
薬物(主に治療薬)の遺伝子への作用を研究するための方法に、文献から収集した情報とDNAチップで発現実験をおこなったデータを両方利用して薬物の遺伝子への作用を検討する方法がある。
この手法は、文献に記載している特定の疾患領域での薬物作用に関する情報をあらかじめ入手して遺伝子と薬物の関係をしる。それと同時に大量の遺伝子を載せたDNAチップにて発現実験を行う。
文献情報から推測される遺伝子の相関や発現情報から得られる遺伝子の相関を考慮しながら、特定疾患における薬物と遺伝子の関連性を見つけていく。
ところで、文献データマイニングネットワークと発現情報を関連付けて解析するような手法は提案されていない。従来、例えば、図14に示すように、文献データを利用して、遺伝子間の関連性をネットワーク条に図式化した例はあるが、疾患との関連は表現できていない。
特開2003−44481号公報
上記従来の技術では、対象となる遺伝子の数が多いために、特定疾患における薬物と遺伝子の関連性を容易に、かつ客観的に知ることができないという問題があった。
本発明は、上述した課題を解決するために創案されたものであり、文献マイニングの手法等を利用し特定の疾患や特定の疾患と治療薬に関する遺伝子同士の関連度をもとめ、その結果をデータベース化し、遺伝子の関連ネットワークデータベースを構築する。同時に細胞に薬物投与を行い、DNAチップを利用した発現実験を行う。発現実験データより発現した遺伝子を選び出し、文献データマイニングで求めた遺伝子関連ネットワークに当該発現データを重ねて関連ネットワーク表示を行う。このような研究遺伝子産物関連度予測システムを提供することを目的としている。
上記目的を達成するために、請求項1記載の発明は、遺伝子情報、薬物情報、疾患情報の各情報をこれらの情報が記載されている文献情報に基づいてデータマイニングを行い、遺伝子の発現情報とともに遺伝子間の関連度を予測する研究遺伝子産物関連度予測システムにおいて、前記文献マイニングにより第1の遺伝子群の各遺伝子に関連する第2の遺伝子群を抽出する手段と、前記第1の遺伝子群の遺伝子間の類似度を前記第2の遺伝子群に共通している遺伝子の個数に基づいて類似度を測る手段と、前記類似度が所定値以上のときに同一グループに配置する手段とを備えたことを特徴とする研究遺伝子産物関連度予測システムである。
また、請求項2記載の発明は、前記同一グループを形成するクラスタの中心を特定の比較される遺伝子とし、この遺伝子が他のクラスタに属するときには両方のクラスタに親子関係を紐付けることを特徴とする請求項1記載の研究遺伝子産物関連度予測システムである。
また、請求項3記載の発明は、前記同一グループを形成するクラスタと他のクラスタとの距離を両方のクラスタに属する遺伝子の個数に基づき決定することを特徴とする請求項1〜請求項2記載の研究遺伝子産物関連度予測システムである。
また、請求項4記載の発明は、前記同一グループを形成するクラスタの遺伝子数を頂点とした多角形の頂点を遺伝子の座標とし、この多角形の重心を求める手段を備え、この重心と前記クラスタ間の距離に基づいて遺伝子の表示座標を決定することを特徴とする請求項3記載の研究遺伝子産物関連度予測システムである。
また、請求項5載の発明は、前記遺伝子の表示座標に基づき、発現情報に関する遺伝子に相関する遺伝子をネットワーク表示することを特徴とする請求項4記載の研究遺伝子産物関連度予測システム特徴とする遺伝子解析システムである。
本発明によれば、画面上に遺伝子マップを表示することで、発現実験に利用した遺伝子と文献での報告の関連が良くわかる。このことを利用すると、発現実験でよく発現している遺伝子の中で文献データベースのエビデンスをもった遺伝子かそうでない遺伝子かを簡単に分類することができる。
以下、図面を参照して本発明の一実施形態を説明する。図1は本発明が適用されるシステム全体の構成を示す。
図1のように、疾患の階層辞書1、薬物の階層辞書2、遺伝子辞書3を文献DB4を利用してマイニング5を行い、遺伝子関連データ6を作成する。遺伝子辞書は次の3つを用意する。まず、family Gene については親データを作成し、階層辞書とし、 symbol:alias =1:N の関係(HUGOとNCBIのマージ)とし、 symbol:fullname =1:N の関係(HUGOとNCBIのマージ)とする。
また、例えば文献DB4の文献数は、XML形式でMedline2003 baseline 1200万件程度のものを想定する。文献マイニングの結果として得られる遺伝子関連データ6とマイクロアレイ発現実験の結果として得られる遺伝子マップデータ7とを統合して遺伝子のネットワーク8を構築する。
図1の内容をフローチャートで示したのが、図2である。
遺伝子データベース1と薬物データベース2と疾患データベース3とを文献マイニングして文献マイニングデータベース6を作成する。文献マイニングデータベース6には疾患と遺伝子の関連性、薬物と遺伝子の関連性、遺伝子同士の関連性を示すデータなどが作成され保存される。
遺伝子データベース1と薬物データベース2と疾患データベース3とを文献マイニングして文献マイニングデータベース6を作成する。文献マイニングデータベース6には疾患と遺伝子の関連性、薬物と遺伝子の関連性、遺伝子同士の関連性を示すデータなどが作成され保存される。
一方、DNAチップ(S2)などを用いたDNA発現実験(S1)を行い、DNA発現データベース7を作成する。この中には薬物投与によるDNA発現情報が保存される。次に、文献マイニングデータベース6のデータとDNA発現データベース7のデータとをマージして、文献マイニングデータとDNA発現データとを統合表示する(S3)。
このようにして、必要なデータを文献マイニングによって作成しておく必要がある。この文献マイニングの手法は、特開2003−44481号公報の内容に基づいて行われる。概略を説明しておく。
(1)必要なデータ
文献マイニングデータベース
(A) 疾患からのアプローチによる遺伝子データ
図3に示すように、疾患データベースと遺伝子データベースとを文献マイニングして、遺伝子と疾患の関連データを作成する。この疾患と関連が論じられた遺伝子群を(A.1)とする。次に、疾患に関連する遺伝子同士の関連データを作成する。この(A.1)の遺伝子と疾患文献上で関連が論じられた遺伝子を(A.2)とする。次に、遺伝子と遺伝子の関連データを作成する。この(A.2)の遺伝子と関連が論じられた遺伝子群を(A.3)とする。
文献マイニングデータベース
(A) 疾患からのアプローチによる遺伝子データ
図3に示すように、疾患データベースと遺伝子データベースとを文献マイニングして、遺伝子と疾患の関連データを作成する。この疾患と関連が論じられた遺伝子群を(A.1)とする。次に、疾患に関連する遺伝子同士の関連データを作成する。この(A.1)の遺伝子と疾患文献上で関連が論じられた遺伝子を(A.2)とする。次に、遺伝子と遺伝子の関連データを作成する。この(A.2)の遺伝子と関連が論じられた遺伝子群を(A.3)とする。
これらの(A.1)、(A.2)、(A.3)のつながりの関係を示すのが図4である。(A.1)と(A.2)は遺伝子シンボルAで結び付いており、(A.2)と(A.3)は遺伝子シンボルBで結びついている。
(B)薬物からのアプローチによる遺伝子データ
図5に示すように薬物データベースと遺伝子データベースとを文献マイニングして、遺伝子と薬物の関連データを作成する。この薬物と関連が論じられた遺伝子群を(B.1)とする。次に、薬物に関連する遺伝子同士の関連データを作成する。この(B.1)の遺伝子と薬物文献上で関連が論じられた遺伝子を(B.2)とする。次に、遺伝子と遺伝子の関連データを作成する。この(B.2)の遺伝子と関連が論じられた遺伝子群を(B.3)とする。
図5に示すように薬物データベースと遺伝子データベースとを文献マイニングして、遺伝子と薬物の関連データを作成する。この薬物と関連が論じられた遺伝子群を(B.1)とする。次に、薬物に関連する遺伝子同士の関連データを作成する。この(B.1)の遺伝子と薬物文献上で関連が論じられた遺伝子を(B.2)とする。次に、遺伝子と遺伝子の関連データを作成する。この(B.2)の遺伝子と関連が論じられた遺伝子群を(B.3)とする。
これらの(B.1)、(B.2)、(B.3)のつながりの関係を示すのが図6である。(B.1)、(B.2)は遺伝子シンボルAで結び付いており、(B.2)、(B.3)は遺伝子シンボルBで結びついている。
(C)薬物投与で動いた遺伝子群、すなわち、図2で示すDNAチップ等を用いて行われた発現実験に基づく薬物投与によるDNA発現情報が必要となる。
(C)薬物投与で動いた遺伝子群、すなわち、図2で示すDNAチップ等を用いて行われた発現実験に基づく薬物投与によるDNA発現情報が必要となる。
(2)文献マイニングの方法
特開2003−44481号公報に記載されているような方法で行う。例えば、遺伝子と疾患の関連データについては、遺伝子に関連するキーワードが論文(文献)情報データベースの論文情報に含まれるかを判別し遺伝子と論文の関係が決定すれば、疾患データベースと論文情報データベースを対応づけたデータを格納する。また、疾患に関連するキーワードが論文(文献)情報データベースの論文情報に含まれるかを判別し疾患と論文の関係が決定すれば、疾患データベースと論文情報データベースを対応づけたデータを格納する。
特開2003−44481号公報に記載されているような方法で行う。例えば、遺伝子と疾患の関連データについては、遺伝子に関連するキーワードが論文(文献)情報データベースの論文情報に含まれるかを判別し遺伝子と論文の関係が決定すれば、疾患データベースと論文情報データベースを対応づけたデータを格納する。また、疾患に関連するキーワードが論文(文献)情報データベースの論文情報に含まれるかを判別し疾患と論文の関係が決定すれば、疾患データベースと論文情報データベースを対応づけたデータを格納する。
次に、疾患と論文との対応データと、遺伝子と論文との対応データとの関係で、共通論文の有無を判別し、共通論文が存在すれば、疾患と遺伝子の関係データを格納する。そして、この共通論文の件数の数が多いほど、疾患と遺伝子との関連度が高いと判断できる。
また、上記のように、共通論文の件数に比例させずに、論文の各種情報に重みをつけ、キーワード同士の関連の強さをあらゆる重み条件で取得できるようにしても良い。
また、上記のように、共通論文の件数に比例させずに、論文の各種情報に重みをつけ、キーワード同士の関連の強さをあらゆる重み条件で取得できるようにしても良い。
次の疾患に関連する遺伝子同士の関連データについても同様に上記処理を行う。図4の例で言えば、遺伝子シンボルAと遺伝子シンボルBとの関連度は、これら2つの遺伝子シンボルが共に現れている論文の件数をカウントして、関連の度合いとする。さらに、遺伝子と遺伝子の関連データ、図4の例では遺伝子シンボルBと遺伝子シンボルCとについても同様に関連度を求めることができる。なお、遺伝子と薬物の関連データについても上記と同様な処理にて関連度を求めることができる。
(遺伝子ネットワーク作成法)
上記文献マイニングによって次のような A遺伝子群(∋Ai ; i =1, … ,N)と、各々に対応する関連遺伝子と関連度のデータを抽出する。
上記文献マイニングによって次のような A遺伝子群(∋Ai ; i =1, … ,N)と、各々に対応する関連遺伝子と関連度のデータを抽出する。
次に、マイクロアレイ実験で発現したB遺伝子群(∋Bj ; j=1…N)のデータに下記の処理を行う。まず、Bjが文献マイニングで抽出したAi遺伝子と一致する場合 BjとAi をリンクする。Bjが文献マイニングで抽出したAi遺伝子と一致しない場合、新規に文献を検索し、Bj に対応する関連遺伝子と関連度のデータを抽出する.。
上記のように処理されたA遺伝子群データとB遺伝子群データとを用いて以下に示す処理を行う。
類似度 : Ai遺伝子とAk遺伝子の類似度は R(Ai) とR(Ak)の共通な遺伝子の数によって定める。Ai遺伝子についてAk(k=i+1,…N)と逐次比較し、AiとAkが類似すればAiをクラスタ中心として同一クラスタとする。
類似度 : Ai遺伝子とAk遺伝子の類似度は R(Ai) とR(Ak)の共通な遺伝子の数によって定める。Ai遺伝子についてAk(k=i+1,…N)と逐次比較し、AiとAkが類似すればAiをクラスタ中心として同一クラスタとする。
次に、上記で作成したクラスタを用いて以下の処理を行う。
クラスタ間の親子関係:クラスタCqの中心となる遺伝子Ai が他のクラスタCrに属すれば CrはCqクラスタの親とする。
クラスタ間の親子関係:クラスタCqの中心となる遺伝子Ai が他のクラスタCrに属すれば CrはCqクラスタの親とする。
Cr(r=1…M) について Cq(q=r+1…M) と逐次比較する。
このようにして、クラスタとクラスタの親子関係の作成フローを示したのが、図7であり、各クラスタ内の遺伝子間の親子関係の結びつきの状態を表すのが、図8である。
このようにして、クラスタとクラスタの親子関係の作成フローを示したのが、図7であり、各クラスタ内の遺伝子間の親子関係の結びつきの状態を表すのが、図8である。
(クラスタ同士間のデータ作成)
遺伝子クラスタデータ作成後、画面表示を行うため、クラスタ間の距離データ、およびクラスタ同士の接続(連結)データをデータベース化する。クラスタに属する遺伝子群について、文献マイニングによって作成されたの遺伝子と遺伝子の関連データベース、(図4、図6で述べたA.3 またはB.3)を参照しながら、距離データを作成する。
遺伝子クラスタデータ作成後、画面表示を行うため、クラスタ間の距離データ、およびクラスタ同士の接続(連結)データをデータベース化する。クラスタに属する遺伝子群について、文献マイニングによって作成されたの遺伝子と遺伝子の関連データベース、(図4、図6で述べたA.3 またはB.3)を参照しながら、距離データを作成する。
図9のように2つの遺伝子クラスタの要素である遺伝子と関連する遺伝子のうち、共通する遺伝子数によってクラスタ間の距離を定め(図9では、CとC'の遺伝子に関連する遺伝子数 である)
共通する遺伝子数が多いほどクラスタ間の距離は近くなるようにする。共通する遺伝子シンボルデータをクラスタ同士の連結(接続)データとする。上記のクラスタ同士間のデータ作成の処理フローをしめすのが図10であり、遺伝子クラスタデータ、クラスタ間距離データ、クラスタとクラスタを接続する遺伝子データの各状態を示したのが図11である。
(遺伝子ネットワーク座標決定のアルゴリズム)
(ST1)データベースからクラスタデータを取り出す。クラスタに属する遺伝子数を頂点の数とした多角形の頂点を遺伝子の座標とする。
(ST2)(ST1)のステップにおけるクラスタの遺伝子について、クラスタ間の接続遺伝子データとして存在するかデータベースを検索し、次の場合に分ける。
(ST3)(ST1)のクラスタの遺伝子が自分Caと他のクラスタCbを接続データとなっている。場合は下記の(ST3)に処理を移す。
(ST1)データベースからクラスタデータを取り出す。クラスタに属する遺伝子数を頂点の数とした多角形の頂点を遺伝子の座標とする。
(ST2)(ST1)のステップにおけるクラスタの遺伝子について、クラスタ間の接続遺伝子データとして存在するかデータベースを検索し、次の場合に分ける。
(ST3)(ST1)のクラスタの遺伝子が自分Caと他のクラスタCbを接続データとなっている。場合は下記の(ST3)に処理を移す。
(ST4)他のクラスタ同士Cd、Ce、・・(2クラスタ以上)の接続データとなっている場合は下記の(ST4)に処理を移す。
(ST5)接続データとして存在しない場合は、下記の(ST8)に処理を移す。
(ST6)(ST1)の中心と接続データとなる遺伝子の座標の重心に関して対称な座標を、新クラスタCbの中心座標とし、Cbを入力データとして(ST1)にもどる。
(ST7)接続データの座標重心を中心とし、他のクラスタの数を頂点の数とした多角形の頂点座標を新クラスタの中心座標とし、Cd、Ce、・・を入力データとして(ST1)にもどる。
(ST5)接続データとして存在しない場合は、下記の(ST8)に処理を移す。
(ST6)(ST1)の中心と接続データとなる遺伝子の座標の重心に関して対称な座標を、新クラスタCbの中心座標とし、Cbを入力データとして(ST1)にもどる。
(ST7)接続データの座標重心を中心とし、他のクラスタの数を頂点の数とした多角形の頂点座標を新クラスタの中心座標とし、Cd、Ce、・・を入力データとして(ST1)にもどる。
(ST8) 現在まで入力したクラスタ群Cxについて、Cx以外の任意のクラスタCyと接続データをもつかデータベースを検索し、次の場合に分ける
(ST9)CxとCyの接続データが存在する
(ST10)接続データがない場合は下記の(ST12)に処理を移す。
(ST11)現在まで入力した全クラスタの中心座標の重心とクラスタCxの中心について対称な座標を接続遺伝子データの座標とし、Cyを入力データとして(ST1)にもどる。
(ST1)〜(ST11)を繰り返し、逐次座標を決定する。
(ST9)CxとCyの接続データが存在する
(ST10)接続データがない場合は下記の(ST12)に処理を移す。
(ST11)現在まで入力した全クラスタの中心座標の重心とクラスタCxの中心について対称な座標を接続遺伝子データの座標とし、Cyを入力データとして(ST1)にもどる。
(ST1)〜(ST11)を繰り返し、逐次座標を決定する。
(ST12)現在配置されたすべてのクラスタの中心の重心と最長距離にあるクラスタ中心に関して対象座標をクラスタの中心座標とし(ST1)にもどる。
(ST13)入力データがなくなったら、クラスタ間の距離データによって、順次クラスタを移動する。
上記の遺伝子ネットワーク座標決定フローを示すのが、図12である。
以上述べた方法を用いて、具体的に画像表示した例が、図13である。
(ST13)入力データがなくなったら、クラスタ間の距離データによって、順次クラスタを移動する。
上記の遺伝子ネットワーク座標決定フローを示すのが、図12である。
以上述べた方法を用いて、具体的に画像表示した例が、図13である。
この例では、DNAチップ発現データベースの作成を行っているが、DNAチップを利用した遺伝子発現実験から得られる、次のデータをデータベース化して用いている。遺伝子発現量で遺伝子に対する薬理作用の有無を判断し、薬物と遺伝子の関連度として扱う。
・薬物名
・遺伝子シンボル
・遺伝子発現量
実験に用いた薬物は高血圧疾患の治療薬として用いられている薬物を投与した(薬物名metoprolol,)。
・薬物名
・遺伝子シンボル
・遺伝子発現量
実験に用いた薬物は高血圧疾患の治療薬として用いられている薬物を投与した(薬物名metoprolol,)。
本実施例では、次の手順でデータベースを作成した。
文献データマイニングデータベースにおける高血圧症からのアプローチによって遺伝子と遺伝子の関連データ(A)を作成した。前述した(A)疾患からのアプローチによる(A.3)の遺伝子データの作成法を基礎としている。
文献データマイニングデータベースにおける同薬物からのアプローチによって遺伝子と遺伝子の関連データ(B)を作成した。前述した(B)薬物からのアプローチによる(B.3)の遺伝子データの作成法を基礎としている。
文献データマイニングデータベースにおける高血圧症からのアプローチによって遺伝子と遺伝子の関連データ(A)を作成した。前述した(A)疾患からのアプローチによる(A.3)の遺伝子データの作成法を基礎としている。
文献データマイニングデータベースにおける同薬物からのアプローチによって遺伝子と遺伝子の関連データ(B)を作成した。前述した(B)薬物からのアプローチによる(B.3)の遺伝子データの作成法を基礎としている。
DNAチップ発現データベースにおける同薬物で薬理作用のあった遺伝子シンボル(C)を作成し、(A)(B)(C)の遺伝子シンボル名を照合し、(A)のみの遺伝子、(A)と(C)に共通する遺伝子、(B)のみの遺伝子、(B)と(C)に共通する遺伝子、(C)のみの遺伝子の5データに分けた。
(A)(B)から遺伝子ネットワークデータベースを構築し(前述した遺伝子ネットワーク作成アルゴリズムと遺伝子ネットワーク座標決定方法に基づく)、(C)のみの遺伝子 については、別途文献マイニングを行い(前述した文献マイニングデータベースの薬物からのアプローチによるデータ(B.3)等に基づく)、DNAチップ発現データベースに使用した遺伝子と、関連のある遺伝子のデータベースを作成し遺伝子ネットワークデータベースに追加した。
遺伝子ネットワークデータをもとに遺伝子ネットワーク表示する際、5データを視覚的に区別できるようにした(色分け)。
図13は、このようにして遺伝子クラスターデータベースの遺伝子を表示したものである。
(1)遺伝子を表す図形の意味
□ 文献データマイニングでHypertension と関連があり かつDNAチップを利用した発現実験で発現した遺伝子。
□ 文献データマイニングでMetoprolol と関連があり かつDNAチップを利用した発現実験で発現した遺伝子。
○ 薬物metoprolol を投与した DNAチップを利用した発現実験でのみ発現した遺伝子。
△ 文献データマイニングでHypertension とMetoprololの両方と関連があり、かつDNAチップを利用した発現実験で発現した遺伝子 (今回は該当なし)。
(2)薬物metoprolol を投与したDNAチップを利用した発現実験で 発現した遺伝子 ○ は metoprolol と線で結ぶ
(1)遺伝子を表す図形の意味
□ 文献データマイニングでHypertension と関連があり かつDNAチップを利用した発現実験で発現した遺伝子。
□ 文献データマイニングでMetoprolol と関連があり かつDNAチップを利用した発現実験で発現した遺伝子。
○ 薬物metoprolol を投与した DNAチップを利用した発現実験でのみ発現した遺伝子。
△ 文献データマイニングでHypertension とMetoprololの両方と関連があり、かつDNAチップを利用した発現実験で発現した遺伝子 (今回は該当なし)。
(2)薬物metoprolol を投与したDNAチップを利用した発現実験で 発現した遺伝子 ○ は metoprolol と線で結ぶ
(3)文献データマイニングで薬物metoprolol とだけ(Hypertensionとの関連が論文上になかった) 関連のある遺伝子はmetoprolol と線で結ぶ
(4)文献データマイニングで疾患Hypertensionとだけ 関連のある Hypertensionと線で結ぶ
(5)遺伝子シンボルをあらわすgene Aなどのアルファベット以外に、Y,R,P,G,W,Bの符号がつけられているのは、実際にはカラー表示されているためで、その遺伝子がどの色で表されているかを示す。Yは黄色、Rは赤、Pはピンク、Gはグリーン、Wは水色、Bはブルーを表す。
(6)同じクラスターに属する遺伝子は同色で表す。
(4)文献データマイニングで疾患Hypertensionとだけ 関連のある Hypertensionと線で結ぶ
(5)遺伝子シンボルをあらわすgene Aなどのアルファベット以外に、Y,R,P,G,W,Bの符号がつけられているのは、実際にはカラー表示されているためで、その遺伝子がどの色で表されているかを示す。Yは黄色、Rは赤、Pはピンク、Gはグリーン、Wは水色、Bはブルーを表す。
(6)同じクラスターに属する遺伝子は同色で表す。
この図から、gene A は 実験でのみmetoprololに作用した遺伝子であるが、文献マイニングを別途行うと、gene C,D,E,F らと同じクラスターに属することが分かった。さらに geneC が 文献データマイニングによってgeneH と関連が ある。geneH は geneN と関連しており geneNと同じクラスターに属する geneMがHypertension との関連性がわかっている。つまり gene A は Hypertension との直接的な関連性が まだ判明していないが、文献データマイニングによる遺伝子ネットワーク上の遺伝子を介することでHypertensionとのつながりがあることが予測できる。
1 遺伝子データベース
2 薬物データベース
3 疾患データベース
4 文献データベース
6 文献マイニングデータベース
7 DNA発現データベース
2 薬物データベース
3 疾患データベース
4 文献データベース
6 文献マイニングデータベース
7 DNA発現データベース
Claims (5)
- 遺伝子情報、薬物情報、疾患情報の各情報をこれらの情報が記載されている文献情報に基づいてデータマイニングを行い、遺伝子の発現情報とともに遺伝子間の関連度を予測する研究遺伝子産物関連度予測システムにおいて、
前記文献マイニングにより第1の遺伝子群の各遺伝子に関連する第2の遺伝子群を抽出する手段と、
前記第1の遺伝子群の遺伝子間の類似度を前記第2の遺伝子群に共通している遺伝子の個数に基づいて類似度を測る手段と、
前記類似度が所定値以上のときに同一グループに配置する手段とを備えたことを特徴とする研究遺伝子産物関連度予測システム。 - 前記同一グループを形成するクラスタの中心を特定の比較される遺伝子とし、この遺伝子が他のクラスタに属するときには両方のクラスタに親子関係を紐付けることを特徴とすることを特徴とする請求項1記載の研究遺伝子産物関連度予測システム。
- 前記同一グループを形成するクラスタと他のクラスタとの距離を両方のクラスタに属する遺伝子の個数に基づき決定することを特徴とする請求項1〜請求項2記載の研究遺伝子産物関連度予測システム。
- 前記同一グループを形成するクラスタの遺伝子数を頂点とした多角形の頂点を遺伝子の座標とし、この多角形の重心を求める手段を備え、この重心と前記クラスタ間の距離に基づいて遺伝子の表示座標を決定することを特徴とする請求項3記載の研究遺伝子産物関連度予測システム。
- 前記遺伝子の表示座標に基づき、発現情報に関する遺伝子に相関する遺伝子をネットワーク表示することを特徴とする請求項4記載の研究遺伝子産物関連度予測システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004079260A JP2005267282A (ja) | 2004-03-18 | 2004-03-18 | 研究遺伝子産物関連度予測システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004079260A JP2005267282A (ja) | 2004-03-18 | 2004-03-18 | 研究遺伝子産物関連度予測システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005267282A true JP2005267282A (ja) | 2005-09-29 |
Family
ID=35091765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004079260A Pending JP2005267282A (ja) | 2004-03-18 | 2004-03-18 | 研究遺伝子産物関連度予測システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005267282A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615913A (zh) * | 2014-12-31 | 2015-05-13 | 深圳先进技术研究院 | 一种标志物相关性检测方法以及装置 |
JP2016099674A (ja) * | 2014-11-18 | 2016-05-30 | 国立研究開発法人産業技術総合研究所 | 薬剤探索装置、薬剤探索方法およびプログラム |
CN106681920A (zh) * | 2016-12-27 | 2017-05-17 | 河南理工大学 | 一种基于测地距的并发系统模型检测方法 |
JP2018530815A (ja) * | 2015-08-17 | 2018-10-18 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 生体データにおけるパターン認識のマルチレベルアーキテクチャ |
JP2020181378A (ja) * | 2019-04-25 | 2020-11-05 | 富士通株式会社 | 関連性探索方法、関連性探索装置、及び関連性探索プログラム |
-
2004
- 2004-03-18 JP JP2004079260A patent/JP2005267282A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099674A (ja) * | 2014-11-18 | 2016-05-30 | 国立研究開発法人産業技術総合研究所 | 薬剤探索装置、薬剤探索方法およびプログラム |
CN104615913A (zh) * | 2014-12-31 | 2015-05-13 | 深圳先进技术研究院 | 一种标志物相关性检测方法以及装置 |
JP2018530815A (ja) * | 2015-08-17 | 2018-10-18 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 生体データにおけるパターン認識のマルチレベルアーキテクチャ |
JP7041614B2 (ja) | 2015-08-17 | 2022-03-24 | コーニンクレッカ フィリップス エヌ ヴェ | 生体データにおけるパターン認識のマルチレベルアーキテクチャ |
JP7041614B6 (ja) | 2015-08-17 | 2022-05-31 | コーニンクレッカ フィリップス エヌ ヴェ | 生体データにおけるパターン認識のマルチレベルアーキテクチャ |
CN106681920A (zh) * | 2016-12-27 | 2017-05-17 | 河南理工大学 | 一种基于测地距的并发系统模型检测方法 |
CN106681920B (zh) * | 2016-12-27 | 2020-11-03 | 河南理工大学 | 一种基于测地距的并发系统模型检测方法 |
JP2020181378A (ja) * | 2019-04-25 | 2020-11-05 | 富士通株式会社 | 関連性探索方法、関連性探索装置、及び関連性探索プログラム |
JP7404648B2 (ja) | 2019-04-25 | 2023-12-26 | 富士通株式会社 | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Safran et al. | The genecards suite | |
Heumos et al. | Best practices for single-cell analysis across modalities | |
Madhavan et al. | Rembrandt: helping personalized medicine become a reality through integrative translational research | |
Nikolsky et al. | Biological networks and analysis of experimental data in drug discovery | |
Rentería et al. | Using PLINK for genome-wide association studies (GWAS) and data analysis | |
Becich | The role of the pathologist as tissue refiner and data miner: the impact of functional genomics on the modern pathology laboratory and the critical roles of pathology informatics and bioinformatics | |
Cannon et al. | DiagHunter and GenoPix2D: programs for genomic comparisons, large-scale homology discovery and visualization | |
CN106971071A (zh) | 一种临床决策支持系统及方法 | |
Akker et al. | Integrating protein-protein interaction networks with gene-gene co-expression networks improves gene signatures for classifying breast cancer metastasis | |
Cathryn et al. | A review of bioinformatics tools and web servers in different microarray platforms used in cancer research | |
Roe et al. | Accurate and efficient KIR gene and haplotype inference from genome sequencing reads with novel K-mer signatures | |
US20080281864A1 (en) | Method of Displaying Molecule Function Network | |
JP2005267282A (ja) | 研究遺伝子産物関連度予測システム | |
Agapito | Computer tools to analyze microarray data | |
Chu et al. | GeneSpringTM: tools for analyzing microarray expression data | |
Zou et al. | eQTL Viewer: visualizing how sequence variation affects genome-wide transcription | |
Markowitz et al. | Applying data warehouse concepts to gene expression data management | |
Chen et al. | Giotto Suite: a multi-scale and technology-agnostic spatial multi-omics analysis ecosystem | |
Piñero et al. | Genomic and proteomic biomarker landscape in clinical trials | |
US20050066276A1 (en) | Methods for identifying, viewing, and analyzing syntenic and orthologous genomic regions between two or more species | |
Seo et al. | GRACOMICS: software for graphical comparison of multiple results with omics data | |
Zheng et al. | Visual comprehension and orientation into the COVID-19 CIDO ontology | |
Nagarajan et al. | Database challenges in the integration of biomedical data sets | |
Mühlberger et al. | Computational analysis workflows for Omics data interpretation | |
Halim-Fikri et al. | Central resources of variant discovery and annotation and its role in precision medicine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070306 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070731 |