JP2005338957A - 遺伝子ネットワークの推定方法及び推定プログラム - Google Patents

遺伝子ネットワークの推定方法及び推定プログラム Download PDF

Info

Publication number
JP2005338957A
JP2005338957A JP2004153739A JP2004153739A JP2005338957A JP 2005338957 A JP2005338957 A JP 2005338957A JP 2004153739 A JP2004153739 A JP 2004153739A JP 2004153739 A JP2004153739 A JP 2004153739A JP 2005338957 A JP2005338957 A JP 2005338957A
Authority
JP
Japan
Prior art keywords
gene
causal
indirect
causal relationship
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004153739A
Other languages
English (en)
Other versions
JP4617448B2 (ja
Inventor
Shuichi Onami
修一 大浪
Koji Kyoda
耕司 京田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Keio University
Original Assignee
Japan Science and Technology Agency
Keio University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, Keio University filed Critical Japan Science and Technology Agency
Priority to JP2004153739A priority Critical patent/JP4617448B2/ja
Priority to US11/597,428 priority patent/US7917300B2/en
Priority to PCT/JP2005/009448 priority patent/WO2005114531A1/ja
Publication of JP2005338957A publication Critical patent/JP2005338957A/ja
Application granted granted Critical
Publication of JP4617448B2 publication Critical patent/JP4617448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 基礎データのデータ量を失っていない遺伝子ネットワークを推定する。
【解決手段】 直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係から存在を説明できない間接的因果関係を検索し、検索された間接的因果関係を直接的因果関係からなるネットワークに補うことで、遺伝子ネットワークを推定する。
【選択図】 なし

Description

本発明は、遺伝子発現データ等に基づいて遺伝子ネットワークを構築する際に適用できる遺伝子ネットワークの推定方法及び推定プログラムに関する。
最近の分子生物学分野の進歩により、得られる遺伝子情報量は膨大である。従って、次々と明らかになり急激に増加する配列データ数又は膨大な遺伝子発現データから情報を取り出すには、コンピュータを利用して努力する必要がある。これまでは、ホモロジー検索、タンパク質分類、遺伝子集積など各種のコンピュータツールを開発することに関心が注がれてきた。
こうした試みの中で、遺伝子発現データから遺伝子調節ネットワーク(以下、遺伝子ネットワークと称する)を推論する方法として、数例ではあるがいくつかの研究が知られている。遺伝子発現データは、時系列データ(時系列データとは、対象遺伝子群の遺伝子発現量を経時的に測定したもの)又は定常状態データ(定常状態データとは、対象遺伝子群の遺伝子発現量を複数の異なる実験条件下(例えば、遺伝子変異や薬剤投与)で測定したもの)のどちらかの形で得られる。
時系列データを分析する方法の場合は、種々の方法、例えば情報理論、遺伝アルゴリズム又はシミュレーテッドアニーリング法を用いてネットワークを推定することができる(非特許文献1)。しかし、時系列データを分析するアプローチでは、試験結果を非常に短いインターバルで取得し、かつ試験的ノイズのない状態で取得することが必要とされる。これは現在の技術では非常に困難である。
一方、定常状態データを分析する方法は、すでにいくつかの方法が提唱されている。この定常状態データは、特定の遺伝子活性を変異させて、例えば遺伝子を欠失させたりあるいは過剰発現させることにより得ることができる。欠失は、酵母ゲノム欠失コンソーシアム (Yeast Genome Deletion Consortium)等で現在大規模に行われており、これによって各種遺伝子欠失型の発現プロファイルを近い将来容易に入手することができる(非特許文献2)。
本発明者は、突然変異を誘発したときに得られる遺伝子発現プロファイル(検出値)を基礎データとして、遺伝子発現量を単純化(二値化)することなく遺伝子ネットワークの推定を行う新たな遺伝子ネットワークの推定方法及び推定プログラムを開発した(特許文献1)。この方法では、複数の遺伝子のうち一の遺伝子の発現量を2つの条件下でそれぞれ発現させたときの他の遺伝子の発現量をそれぞれ検出し、得られる検出値の差を求め、当該差を指標として前記一の遺伝子と他の遺伝子との因果関係を導いている。
また、特許文献1には、与えられた遺伝子ネットワークから間接的因果関係(特許文献1では「冗長な因果関係」と表現されている)を検出し、この間接的因果関係を除いた遺伝子ネットワークの推定方法も開示されている。
Liang, S.et al., Proc.Pacific Symp. Biocomputing '98, World Scientific, 18-29, 1998.; Morohashi, M. and Kitano, H., Proc. 5thEuro. Conf. Artificial Life, Springer, 477-486, 1999.; Mjolsness, E., et al., Tech. Rept. JPL-ICTR-99-4, Jet Propulsion Lab., NASA, 1999. Winzeler, E.A.et al., Science, 285 (5429): 901-906, 1999. WO 2002/038749
ところが、例えば特許文献1に開示された遺伝子ネットワーク推定方法を適用して、間接的因果関係を含む遺伝子ネットワークから間接的因果関係を除去して遺伝子ネットワークを推定した場合、推定された遺伝子ネットワークからは全ての間接的因果関係の存在を説明できないことがある。すなわち、遺伝子ネットワークから間接的因果関係を除去して遺伝子ネットワークを推定した場合、基礎データの一部を失った遺伝子ネットワークを推定することになるといった問題があった。ここで、基礎データは生物内における実際の遺伝子発現制御関係を反映したものであるため、その一部を失うということは、推定された遺伝子ネットワークが実際の遺伝子発現制御関係を反映したものにならない場合が生じるということである。
そこで、本発明者らは、上述した問題を解決するために鋭意検討した結果、間接的因果関係として検出された因果関係のうちで、間接的でない因果関係(以下、直接的因果関係と称する。)及び/又は直接的因果関係から存在を説明できる間接的因果関係から存在を説明できない間接的因果関係を検索し、検索された間接的因果関係を直接的因果関係からなるネットワークに補うことで、データ量の損失がない遺伝子ネットワークを推定できることを見出し、本発明を完成するに至った。
すなわち、本発明は以下を包含する。
(1)一対の遺伝子間における制御関係を因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有しない場合の当該一対の遺伝子間の因果関係を直接的因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有する場合であって、当該一対の遺伝子と当該他の遺伝子との間の因果関係によって当該一対の遺伝子間の因果関係の存在を説明できない場合に当該一対の遺伝子間の因果関係を直接的因果関係とし、説明できる場合を間接的因果関係とした、間接的因果関係及び直接的因果関係からなる遺伝子ネットワークを推定するに際して、
3以上の遺伝子に関する因果関係のセットから、間接的因果関係を検索する工程Aと、
前記工程Aで検索した間接的因果関係の中で、直接的因果関係から存在を説明できる間接的因果関係を検索し、その後、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係から、存在を説明できる間接的因果関係を検索する工程Bと、
前記工程Aで検索した間接的因果関係から前記工程Bで検索した間接的因果関係を除いた間接的因果関係の中で、直接的因果関係及び前記工程Bで検索した間接的因果関係とともに、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索する工程Cと、
前記因果関係のセットから間接的因果関係を除くとともに前記工程Cで検索した最小数の間接的因果関係を加えることで因果関係のセットを算出し、算出した因果関係のセットから構成される遺伝子ネットワークを推定する工程Dと
を備える遺伝子ネットワークの推定方法。
(2) 上記工程Aでは、
遺伝子A、遺伝子B及び遺伝子C間に、遺伝子A及び遺伝子B間の因果関係、遺伝子A及び遺伝子C間の因果関係並びに遺伝子C及び遺伝子B間の因果関係が存在し、前記遺伝子A及び遺伝子B間の因果関係が正の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が偶数個含まれているならば、或いは
前記遺伝子A及び遺伝子B間の因果関係が負の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が奇数個含まれているならば、
前記遺伝子A及び遺伝子B間の因果関係を間接的因果関係であるとすることを特徴とする(1)記載の遺伝子ネットワークの推定方法。
(3) 上記工程Cは、
前記工程Aで検索した間接的因果関係から前記工程Bで検索した間接的因果関係を除いた間接的因果関係を説明不可能間接的因果関係とし、この説明不可能間接的因果関係の中で、上記工程Aで検索対象とした因果関係のセットに含まれる因果関係の中の1つの因果関係とともに説明不可能間接的因果関係を一つも説明できない間接的因果関係を、非主要な説明不可能間接的因果関係として検索する工程Eと、
説明不可能間接的因果関係から非主要な説明不可能間接的因果関係を除いた間接的因果関係のなかで、上記工程Aで検索対象とした因果関係のセットのなかの1つの因果関係とともに、説明不可能間接的因果関係の中では非主要な説明不可能間接的因果関係しか説明できない間接的因果関係を、非主要な説明不可能間接的因果関係のセットに加える処理を、加える間接的因果関係がなくなるまで繰り返す工程Fと、
上記工程Fで検出された間接的因果関係のセットに含まれない、説明不可能間接的因果関係のセットをグループに分割する工程Gと、
上記工程Gで形成されたグループ毎に、当該グループに含まれる間接的因果関係に基づいてグループ毎の最小数の間接的因果関係を検索する工程Hとを含むことを特徴とする(1)記載の遺伝子ネットワークの推定方法。
(4) 上記工程Gでは、特定のグループ内に含まれる最小数の間接的因果関係によって、当該グループに含まれる間接的因果関係のみを説明するようにグループに分割することを特徴とする(3)記載の遺伝子ネットワークの推定方法。
(5) 一対の遺伝子間における制御関係を因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有しない場合の当該一対の遺伝子間の因果関係を直接的因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有する場合であって、当該一対の遺伝子と当該他の遺伝子との間の因果関係によって当該一対の遺伝子間の因果関係の存在を説明できない場合に当該一対の遺伝子間の因果関係を直接的因果関係とし、説明できる場合を間接的因果関係とした、間接的因果関係及び直接的因果関係からなる遺伝子ネットワークを推定するに際して、
3以上の遺伝子に関する因果関係のデータセットから、間接的因果関係を検索手段によって検索する工程Aと、
前記工程Aで検索した間接的因果関係のデータセットの中で、直接的因果関係から存在を説明できる間接的因果関係を検索手段によって検索し、その後、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係のデータセットから、存在を説明できる間接的因果関係を検索手段によって検索する工程Bと、
前記工程Aで検索した間接的因果関係のデータセットから、前記工程Bで検索した間接的因果関係のデータを演算手段によって除いて算出された間接的因果関係のデータセットの中で、直接的因果関係及び前記工程Bで検索した間接的因果関係とともに、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索手段によって検索する工程Cと、
前記因果関係のデータセットから、間接的因果関係のデータを演算手段によって除くとともに前記工程Cで検索した最小数の間接的因果関係のデータを演算手段によって加えることで因果関係のデータセットを算出し、算出した因果関係のデータセットから構成される遺伝子ネットワークを出力手段によって出力する工程Dと
をコンピュータに実行させる遺伝子ネットワークの推定プログラム。
(6) 上記工程Aにおいて検索手段は、
遺伝子A、遺伝子B及び遺伝子C間に、遺伝子A及び遺伝子B間の因果関係、遺伝子A及び遺伝子C間の因果関係並びに遺伝子C及び遺伝子B間の因果関係が存在し、前記遺伝子A及び遺伝子B間の因果関係が正の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が偶数個含まれているという条件、或いは
前記遺伝子A及び遺伝子B間の因果関係が負の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が奇数個含まれているという条件を満たした場合に、
前記遺伝子A及び遺伝子B間の因果関係を間接的因果関係として検索することを特徴とする(5)記載の遺伝子ネットワークの推定プログラム。
(7) 上記工程Cは、
前記工程Aで検索した間接的因果関係のデータセットから、前記工程Bで検索した間接的因果関係のデータを演算手段によって除いた間接的因果関係を説明不可能間接的因果関係のデータセットとし、この説明不可能間接的因果関係のデータセットの中で、上記工程Aで検索対象とした因果関係のデータセットに含まれる因果関係の中の1つの因果関係とともに説明不可能間接的因果関係を一つも説明できない間接的因果関係を、非主要な説明不可能間接的因果関係として検索手段によって検索する工程Eと、
説明不可能間接的因果関係のデータセットから非主要な説明不可能間接的因果関係を演算手段によって除いた間接的因果関係のデータセットなかで、上記工程Aで検索対象とした因果関係のセットのなかの1つの因果関係とともに、説明不可能間接的因果関係の中では非主要な説明不可能間接的因果関係しか説明できない間接的因果関係を検索手段によって検索し、検索された間接的因果関係を演算手段によって非主要な説明不可能間接的因果関係のセットに加える処理を、加える間接的因果関係がなくなるまで繰り返す工程Fと、
上記工程Fで検出された間接的因果関係のセットに含まれない、説明不可能間接的因果関係のデータセットを演算手段によりグループに分割する工程Gと、
上記工程Gで形成されたグループ毎に、当該グループに含まれる間接的因果関係に基づいてグループ毎の最小数の間接的因果関係を検索手段によって検索する工程Hとを含むことを特徴とする(5)記載の遺伝子ネットワークの推定プログラム。
(8) 上記工程Gにおいて演算手段は、特定のグループ内に含まれる最小数の間接的因果関係のデータセットによって、当該グループに含まれる間接的因果関係のみを説明するようにグループに分割することを特徴とする(7)記載の遺伝子ネットワークの推定プログラム。
本発明によれば、遺伝子発現データ等を基礎データとして遺伝子ネットワークを推定するに際して、当該基礎データのデータ量を損失することがない遺伝子ネットワークの推定方法及び推定プログラムを提供することができる。
以下、本発明に係る遺伝子ネットワーク推定方法及び推定プログラムを、図面を参照して詳細に説明する。
1.本発明の概念
本発明に係る推定プログラムは、直接的因果関係及び間接的因果関係からなり、遺伝子発現データ等に基づいて構築された遺伝子ネットワーク(以下、オリジナル・ネットワークと称する)から、間接的因果関係を除くとともに当該遺伝子発現データ等を再現しうる最小数の間接的因果関係を加えることによって、遺伝子ネットワークを推定する。
ここで、因果関係とは、一対の遺伝子の間における制御関係のことを意味する。制御関係とは、一方の遺伝子が他方の遺伝子の発現を抑制或いは亢進する関係(遺伝子発現制御関係)、一方の遺伝子産物が他方の遺伝子産物を活性化或いは不活性化する関係等を意味する。例えば、遺伝子aと遺伝子bについて、遺伝子aを変異(例えば、遺伝子aを欠損)させたときの遺伝子bの発現量が、遺伝子aを変異させないとき(例えば野生型のとき)の遺伝子bの発現量と比較して有意差があれば或いは発現量の差が閾値を超えれば、遺伝子aと遺伝子bの間における因果関係があることとなる。
また、因果関係は、正に制御する因果関係及び負に制御する因果関係として定義するものであっても良い。すなわち、遺伝子aが遺伝子bの発現を亢進する関係を正の因果関係とし、遺伝子aが遺伝子bの発現を抑制する関係を負の因果関係とすることができる。或いは、遺伝子a産物が遺伝子b産物を活性化する関係を正の因果関係とし、遺伝子a産物が遺伝子b産物を不活性化する関係を負の因果関係とすることができる。
ここで、遺伝子ネットワークは、説明の便宜上「符号付有向グラフ」と呼ばれる図に置き換えて考えることができる(図1)。図1において、アルファベットは遺伝子を表し、矢印(→)は遺伝子aが遺伝子bを正に制御する因果関係を、T字型矢印(┤)は遺伝子bが遺伝子cを負に制御する因果関係を意味するものとする。個々の矢印を、本発明では「エッジ」という。
一方、間接的因果関係とは、遺伝子a及び遺伝子bの間に因果関係を有するとともに遺伝子a及び遺伝子bがそれぞれ共通する他の遺伝子(以下、遺伝子c)との間に更に因果関係を有する場合であって、遺伝子a及び遺伝子bの間の因果関係を、遺伝子aと遺伝子cとの間の因果関係及び遺伝子cと遺伝子bとの間の因果関係によって説明できる関係にある因果関係を意味する。
ここで「遺伝子aと遺伝子cとの間の因果関係及び遺伝子cと遺伝子bとの間の因果関係によって説明できる関係」とは、遺伝子aと遺伝子cとの間の因果関係並びに遺伝子cと遺伝子bとの間の因果関係から、遺伝子aと遺伝子bとの間の因果関係が遺伝子発現制御関係或いはシグナル伝達等の制御関係の観点から矛盾なく説明できる関係であって、遺伝子aの遺伝子bに対する作用が間接的である可能性を含む関係である。
例えば、間接的因果関係は、実際には遺伝子aが遺伝子bを活性化する能力はなくても、遺伝子aを不活性化した時に遺伝子b及び遺伝子cの発現解析の結果として、遺伝子aは遺伝子cを間接的に活性化する能力があると認識された場合に生じうる因果関係である。
便宜上、図2に示す符号付有向グラフで説明すると、遺伝子aが遺伝子bを正に制御する因果関係(破線)において、遺伝子aが遺伝子cとの間、遺伝子cが遺伝子bとの間に更に因果関係を有する場合に、遺伝子a及び遺伝子cの間の因果関係と遺伝子c及び遺伝子bの間の因果関係のなかに負に制御する因果関係が偶数個含まれているとき、この「遺伝子aが遺伝子bを正に制御する因果関係」を間接的因果関係とする。また、図3に示すように、遺伝子aが遺伝子bを負に制御する因果関係(破線)において、遺伝子aが遺伝子cとの間、遺伝子cが遺伝子bとの間に更に因果関係を有する場合に、遺伝子a及び遺伝子cの間の因果関係と遺伝子c及び遺伝子bの間の因果関係のなかに負に制御する因果関係が奇数個含まれているとき、この「遺伝子aが遺伝子bを負に制御する因果関係」を間接的因果関係とする。
一方、直接的因果関係とは、上述した間接的因果関係でない全ての因果関係のことを意味する。すなわち、遺伝子a及び遺伝子bの間の因果関係を、遺伝子aと遺伝子cとの間の因果関係及び遺伝子cと遺伝子bとの間の因果関係によって説明できない関係にある因果関係を意味する。換言すれば直接的因果関係とは、遺伝子aと遺伝子cとの間の因果関係並びに遺伝子cと遺伝子bとの間の因果関係から遺伝子aと遺伝子bとの間の因果関係を説明しようとすると、遺伝子発現制御関係或いはシグナル伝達等の制御関係の観点から矛盾してしまう関係であって、遺伝子aの遺伝子bに対する作用が直接的であると合理的に推認できる関係である。
便宜上、図4に示す符号付有向グラフで説明すると、遺伝子aが遺伝子bを正に制御する因果関係において、遺伝子aが遺伝子cとの間、遺伝子cが遺伝子bとの間に更に因果関係を有する場合に、遺伝子a及び遺伝子cの間の因果関係と遺伝子c及び遺伝子bの間の因果関係のなかに負に制御する因果関係が奇数個含まれているとき、この「遺伝子aが遺伝子bを正に制御する因果関係」を直接的因果関係とする。また、図5に示すように遺伝子aが遺伝子bを負に制御する因果関係において、遺伝子aが遺伝子cとの間、遺伝子cが遺伝子bとの間に更に因果関係を有する場合に、遺伝子a及び遺伝子cの間の因果関係と遺伝子c及び遺伝子bの間の因果関係のなかに負に制御する因果関係が偶数個含まれているとき、この「遺伝子aが遺伝子bを負に制御する因果関係」を直接的因果関係とする。さらに、遺伝子a及び遺伝子bの間の因果関係において、どの遺伝子cに対しても、遺伝子aが遺伝子cとの間、遺伝子cが遺伝子bとの間に因果関係を有しない場合に、この「遺伝子aが遺伝子bを正または負に制御する因果関係」を直接的因果関係とする。すなわち、この場合、遺伝子a及び遺伝子bは、共通する他の遺伝子との間に因果関係を有しない場合に、「遺伝子aが遺伝子bを正または負に制御する因果関係」を直接的因果関係とする。
ところで、遺伝子発現データ等を再現しうる最小数の因果関係(以下、MEGN(Minimum Equivalent Gene Network)と称する場合もある)とは、オリジナル・ネットワークから間接的因果関係を除いたネットワークに、オリジナル・ネットワークを再構築できるよう、すなわち、除いた間接的因果関係の全ての存在を説明できるよう、最小数の間接的因果関係を加えた因果関係のことを意味する。
説明の便宜上、簡略化したオリジナル・ネットワークとして、図6に示すように、遺伝子aが遺伝子bを正に制御する因果関係、遺伝子aが遺伝子cを正に制御する因果関係、遺伝子bが遺伝子cを正に制御する因果関係及び遺伝子cが遺伝子bを正に制御する因果関係からなる遺伝子ネットワークを仮定する。図6に示す遺伝子ネットワークでは、上述した間接的因果関係の定義より、遺伝子aが遺伝子bを正に制御する因果関係及び遺伝子aが遺伝子cを正に制御する因果関係の2つが間接的因果関係となる。この場合、オリジナル・ネットワークから間接的因果関係を除いて遺伝子ネットワークを構築すると、図7に示すように、遺伝子b及び遺伝子cとの間の直接的因果関係のみとなる。図7に示す遺伝子ネットワークからは、遺伝子aと遺伝子bとの間の間接的因果関係及び遺伝子aと遺伝子cとの間の間接的因果関係の存在を説明することはできない。これは、遺伝子発現データ等に基づいて推定したオリジナル・ネットワークと比較して情報量が減少したこととなり好ましくない。
そこで、図7に示す遺伝子ネットワークにおいて失われた情報、すなわち、遺伝子aと遺伝子bとの間の間接的因果関係及び遺伝子aと遺伝子cとの間の間接的因果関係のいずれか一方の因果関係を「遺伝子発現データ等を再現しうる最小数の因果関係」として定義する。
本発明に係る遺伝子ネットワーク推定方法及び推定プログラムにおいては、上述したように定義される「遺伝子発現データ等を再現しうる最小数の因果関係」をオリジナル・ネットワークから検索し、間接的因果関係を除いたオリジナル・ネットワークに「遺伝子発現データ等を再現しうる最小数の間接的因果関係」を加えた遺伝子ネットワークを推定する。図7に示す遺伝子ネットワークの場合には、図8に示すように、図8中破線で示す2つの因果関係のいずれか一方を最小数の因果関係として加えた遺伝子ネットワークを推定することとなる。
2.本発明に係る推定プログラム
以下、本発明に係る遺伝子ネットワーク推定プログラムを説明するが、本プログラムは上記「1.本発明の概念」に説明した情報処理をコンピュータにおいて実現するものである。なお、以下の説明においては、因果関係として、一方の遺伝子が他方の遺伝子の発現を抑制或いは亢進するといった制御関係(遺伝子発現制御関係)を例にして説明する。しかし、本プログラムは、因果関係として、一方の遺伝子産物が他方の遺伝子産物を活性化或いは不活性化する関係を意味する場合でも同様に適用することができる。
コンピュータは、例えば図9に示すように、CPU101(制御手段)、ROM102、RAM103、入力手段104、送信/受信手段105、出力手段106、ハードディスクドライブ(HDD)107及びCD-ROMドライブ108を備える。また、コンピュータは、ROM102、RAM103、HDD107及びパブリックデータベース110等に記録されたデータを検索する検索手段111、検索手段111で検索したデータや入力手段104で入力したデータを加算減算処理する演算手段112を備える。
ここで、本推定プログラムは、例えば、ROM102、RAM103又はHDD107に記憶される。そして、本プログラムに従ってCPU101がコンピュータの上記ハードウェアの駆動制御を行うことで、上記「1.本発明の概念」に説明した情報処理を行い遺伝子ネットワークを推定する。
CPU101は、遺伝子ネットワークシステム全体を制御し、後述する遺伝子ネットワーク推定処理を実行する。RAM103は、ネットワーク推定処理を実行する上で必要なデータを一時的に格納する。入力手段104は、キーボードやマウス等であり、ネットワーク推定処理を実行する上で必要な条件を入力するとき等に操作される。送信/受信手段105は、CPU101の命令に基づいて、通信回線を介してパブリックデータベース110等との間でデータの送受信処理を実行する。出力手段106は、遺伝子の発現量、入力手段104から入力された各種条件、遺伝子の塩基配列、ネットワークの推定結果等を、CPU101からの命令に基づいて表示処理を実行する。なお、出力手段106としては、コンピュータのディスプレイ、又はプリンターなどが例示される。HDD107は、遺伝子ネットワーク推定プログラム、遺伝子発現量、塩基配列等を格納し、CPU101の命令に基づいて、格納しているプログラム又はデータ等を読み出し、例えばRAM103に格納する。CD-ROMドライブ108は、CPU101の指示に基づいて、CD-ROM109に格納されている遺伝子ネットワーク推定プログラム又は発現量等から、プログラム又はデータ等を読み出し、例えばRAM103に格納する。
CPU101は、入力手段104などから受け取ったデータを出力手段106に供給するとともに、データベースから受け取ったデータに基づいて遺伝子ネットワークの推定処理を実行する。
ここで、遺伝子ネットワークの推定プログラムは、コンピュータを下記(i)〜(iv)の手段として機能させる。
(i)直接的因果関係及び間接的因果関係からなる因果関係のセットから、間接的因果関係を検索する手段(「間接的因果関係検索エンジン」ともいう)
(ii)間接的因果関係検出エンジンで検索した間接的因果関係の中で、直接的因果関係から存在を説明できる間接的因果関係を検索し、その後、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係から存在を説明できる間接的因果関係を検索する手段(「説明可能間接的因果関係検索エンジン」ともいう)
(iii)間接的因果関係検出エンジンで検索した間接的因果関係から前記説明可能間接的因果関係検索エンジンで検索した間接的因果関係を除いた間接的因果関係の中で、直接的因果関係及び前記説明可能間接的因果関係検索エンジンで検索した間接的因果関係とともに、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索する手段(「最小数関係検索エンジン」ともいう)
(iv)前記因果関係のセットから間接的因果関係を除くとともに前記最小数関係検索エンジンで検索した最小数の間接的因果関係を加えることで算出される因果関係のセットから構成される遺伝子ネットワークを推定する手段(「推定エンジン」ともいう)
(i)間接的因果関係検索エンジン
間接的因果関係検索エンジンは、遺伝子発現データ等に基づいて推定されたオリジナル・ネットワークから、間接的因果関係を検索する。ここで、オリジナル・ネットワークとは、例えば、WO 2002/038749号公報に開示された方法で与えられたものでも良いし、その他の方法で与えられたものでも良い。以下の説明では、一例として、WO 2002/038749に開示された方法及びプログラムを適用したオリジナル・ネットワークの推定について説明する。
オリジナル・ネットワークを推定するためのプログラムは、コンピュータを以下の(a)〜(c)の手段として機能させるものである。
(a)ある一の遺伝子の発現量を2条件に設定した場合に他の遺伝子の発現レベル(発現量)をそれぞれ検出する手段(「検出エンジン」ともいう)、
(b)得られる検出値を比較してその差を求める手段(「比較エンジン」ともいう)、
(c)当該差を指標として前記一の遺伝子と他の遺伝子との因果関係を求める手段(「因果関係作成エンジン」ともいう)、
(a)検出エンジン
検出エンジンは、一対の遺伝子間の制御関係の基礎となるデータ(基礎データ)を検出する手段を意味する。例えば、遺伝子発現の検出は、DNAマイクロアレイ、オリゴヌクレオチドチップ、RT-PCR、遺伝子発現の連続分析、定常発現レベル、プロテオミクス等を使用又は適用することにより行うことができる。すなわち、検出エンジンによれば、これらの結果を遺伝子発現データ(発現量)としてコンピュータに入力することができる。なお、遺伝子発現データは、本発明では検出値という。
検出値は、絶対値であっても相対値であってもよい。また、実験により得られた値のみならず、文献的に又は遺伝子データベース等から得られた値でもよい。例えば、DNAマイクロアレイから得られる発現量は、マイクロアレイ上に発せられる蛍光強度等を測定し、その蛍光強度を数値化することができる。データベースの具体例としては、インターネットを通じて利用できるデータベースを例示でき、より具体的には、GenBank、DDBJ、EMBL、NCI60等を例示できる。
検出エンジンにて検出した遺伝子発現データとしては、例えば、図10に示すように、遺伝子a(n=0,1,2,3…)の発現量Xを、遺伝子a破壊株a 毎に蓄積したデータとして表現することができる。なお、wtは野生型を意味する。
(b)比較エンジン
比較エンジンでは、ある遺伝子の遺伝子発現量を2条件に設定した場合のこれらの2条件下における対象となる遺伝子の発現レベルの差の情報、並びに上記遺伝子間の機能(例えば活性化又は阻害)に関する情報を算出するとともに蓄積する。上記遺伝子発現量の2条件設定には、遺伝子の変異が含まれ、遺伝子変異は、塩基配列の欠失、置換又は付加によりもとの遺伝子の機能を失わせることや過剰発現させることを意味し、遺伝子の破壊も変異に含まれる。すなわち、上記遺伝子発現量の2条件としては、野生型における遺伝子発現量と、所定の遺伝子の破壊株または過剰発現株における遺伝子発現量として定義することができる。
より具体的には、検出エンジンにて図10に示したデータを検出したと仮定すると、比較エンジンでは、野生型wtにおける所定の遺伝子の発現量と各破壊株における当該遺伝子の発現量との差分を演算する。すなわち、破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差はゼロ(3.750-3.750=0)である。破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差は-0.17(8.769-8.939=-0.17)ある。さらに、破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差は-0.067(0.011-0.078=-0.067)である。なお、比較エンジンにおいて、上記検出エンジンで検出した検出値の差分値は演算回路によって算出することができる。
このよう算出された差分値データは、例えば、破壊株の種類或いは破壊株で破壊されている遺伝子の種類を示すコードデータと、差分をとる対象とした遺伝子の種類を示すコードデータと関連付けてROM102、RAM103又はHDD107等の記憶手段に記憶する。
(c)因果関係作成エンジン
因果関係作成エンジンは、比較エンジンにより得られた発現量の差分値データに基づいて、比較エンジンにて比較を行った一対の遺伝子間の因果関係を導き、オリジナル・ネットワークを推定する手段である。この手段は、例えば遺伝子aと遺伝子bとの因果関係を調べる場合において、遺伝子aを変異させたときの遺伝子bの発現量が、遺伝子aを変異させないとき(野生型のとき)の遺伝子bの発現量と比較してどの程度変化したときに、その遺伝子aは遺伝子bに対して活性化するのか若しくは抑制するのか(すなわち、因果関係がある)、あるいは無関係である(すなわち、因果関係がない)のか、という判断を実行する手段である。
具体的に因果関係作成エンジンにおいては、先ず、上記比較エンジンにて蓄積された差分値データを読み出し、既定の閾値と差分値データとを比較する。そして、因果関係作成エンジンでは、差分値データが当該閾値を超える場合に、差分データに関連付けられているコードデータから、破壊株で破壊されている遺伝子と差分をとる対象とした遺伝子との間に因果関係があると見なす。
例えば、差分値データが閾値を超えない場合には、当該差分値データに関連付けられたコードデータが示す破壊株で破壊されている遺伝子は、差分をとる対象とした遺伝子を活性化していない、又は無関係であると判断することができる。一方、差分値データが閾値を超える場合には、当該差分値データに関連付けられたコードデータが示す破壊株で破壊されている遺伝子は、差分をとる対象とした遺伝子を活性化又は抑制していると判断することができる。なお閾値は、ネットワークを推定する際に目的となる遺伝子に応じて適宜設定できる。但し、閾値は、誤差検定を行い、例えば有意差危険度0.01以下となるような基準で設定し、採用することが好ましい。
より具体的には、検出エンジンにて図10に示したデータを検出した場合には、上述したように、破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差はゼロ(3.750-3.750=0)であるため、遺伝子aは遺伝子aと無関係、すなわち因果関係が無いものとみなす。また、破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差は-0.17(8.769-8.939=-0.17)あるため、閾値を無視して考えれば遺伝子aは遺伝子aを活性化させると推定することができる。さらに、破壊株a における遺伝子aの発現量と、野生型における遺伝子aの発現量との差は-0.067(0.011-0.078=-0.067)であるため、遺伝子aは遺伝子aを活性化させるものと推定することができる。
したがって、因果関係作成エンジンによれば、図10に示したデータに基づいて、例えば図11に示すようなリレーショナルデータベースを構築することができる。図11において、「+」は活性化を、「−」は抑制を意味する。また、因果関係作成エンジンによれば、図10に示したデータに基づいて、例えば、図12に示すような、遺伝子a〜aをノードとした符号付有向グラフを構築することができる。
なお、ある遺伝子aを欠失又は過発現させたときの遺伝子bの発現レベルの増加及び減少との関係を表1に示す。この比較プロセスの計算量はO(n2)である。
Figure 2005338957
このようにして検出エンジンにて検出した遺伝子発現データを用いて、因果関係作成エンジンによって、例えば、図11に示ようなデータベース或いは図12に示すような符号付有向グラフとしてオリジナル・ネットワークを推定することができる。なお、オリジナル・ネットワークに含まれる因果関係のセットを、以下の説明ではETとする。
間接的因果関係検索エンジンでは、上述したようにして推定されたオリジナル・ネットワーク或いは他の方法によって推定されたオリジナル・ネットワークから、間接的因果関係を検索する。
対象とするオリジナル・ネットワークには間接的因果関係及び直接的因果関係が存在しうるが、間接的因果関係は、エッジの道筋(ルート)に関与する負の調節数の偶奇性にのみ依存する(Thieffry, D., and Thomas, R., Proc. Pacific Symp. Bio-computing ’98, World Scientific, 77-88, 1998.)。
間接的因果関係検索エンジンおいては、オリジナル・ネットワークに含まれる間接的因果関係を検索する。間接的因果関係の検索方法としては、特に限定されないが、例えば、グラフ理論(Gross, J., and Yellen, J., CRC Press, 1999.)の分野のWarshallのアルゴリズムを修正したアルゴリズムにより実行することができる。
修正したWarshallのアルゴリズムを実行するためのフローチャートを図13に示す。図13におけるステップは以下の通りである。最初に、全ての遺伝子に1からn(遺伝子の総数)の通し番号をつけ、オリジナル・ネットワークを構成している因果関係をマトリクス表記したものをTとする。ここで、Tの要素をtpqとし、遺伝子pから遺伝子qへの因果関係の有無を表現している。活性の因果関係(正の因果関係)が存在する場合には、tpq=1、抑制の因果関係(負の因果関係)が存在する場合には、tpq=-1、因果関係が存在しない場合には、tpq=0とする。
図13においてS1〜S7に示す処理によって、インデックスi=1〜n、インデックスj=1〜nに対して、tij≠0、すなわち遺伝子iから遺伝子jへの因果関係が存在するかどうかを確認する。図13においてS8〜S11に示す処理によって、遺伝子iから遺伝子jへの因果関係が存在するとき、インデックスk=1〜nに対して、tjk≠0、すなわち遺伝子jから遺伝子kへの因果関係が存在するかどうかを確認する。さらに、遺伝子iから遺伝子kへの因果関係が存在し(図13においてS12に示す処理)、かつtij×tjk=tikである場合には(図13においてS13に示す処理)、遺伝子iから遺伝子kへの因果関係は間接的因果関係であるので、tikをチェックする(図13においてS14に示す処理)。最終的に導出されるマトリクスから、直接的因果関係と間接的因果関係を区別することができる(図13においてS15に示す処理)。
なお、間接的因果関係検索エンジンにて検索された間接的因果関係のセットを以下の説明においてEIとする。従って、オリジナル・ネットワークに含まれる直接的因果関係のセットはET−EIで与えられ、以下の説明においてESとする。
ここで、一例として、図14に示すような、遺伝子A〜Pの16個の遺伝子に関する因果関係を含むオリジナル・ネットワークを仮定する。間接的因果関係検索エンジンによれば、図15に示すように、間接的因果関係(図15中破線)及び直接的因果関係(図15中実線)からなる遺伝子ネットワークを推定することができる。
(ii)説明可能間接的因果関係検索エンジン
説明可能間接的因果関係検索エンジンでは、先ず、間接的因果関係検出エンジンで検索した間接的因果関係(EI)の中で、直接的因果関係(ES)から存在を説明できる間接的因果関係を検索する。
直接的因果関係から存在を説明できる間接的因果関係を、便宜上、図2に示す符号付有向グラフで説明すると、遺伝子aと遺伝子bとの間を正に制御する間接的因果関係(破線)において、遺伝子a及び遺伝子cの間の直接的因果関係と遺伝子c及び遺伝子bの間の直接的因果関係のなかに負に制御する因果関係が偶数個含まれているとき、この「遺伝子aが遺伝子bを正に制御する間接的因果関係」を「直接的因果関係から存在を説明できる間接的因果関係」とする。また、図3に示すように、遺伝子aが遺伝子bを負に制御する間接的因果関係(破線)において、遺伝子a及び遺伝子cの間の直接的因果関係と遺伝子c及び遺伝子bの間の直接的因果関係のなかに負に制御する因果関係が奇数個含まれているとき、この「遺伝子aが遺伝子bを負に制御する間接的因果関係」を直接的因果関係から存在を説明できる間接的因果関係とする。
例えば、図15に示した遺伝子ネットワークに含まれる間接的因果関係(破線)においては、遺伝子Cと遺伝子Fとの間の因果関係、遺伝子Cと遺伝子Gとの間の因果関係及び遺伝子Lと遺伝子Oとの間の因果関係は、直接的因果関係から存在を説明できる間接的因果関係である。
説明可能間接的因果関係検索エンジンにて検索された間接的因果関係を、以下の説明においてEIとする。
次に、説明可能間接的因果関係検索エンジンでは、上述したように検索された直接的因果関係から存在を説明できる間接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係を検索する。換言すれば、図2或いは3に示した遺伝子ネットワークにおいて、遺伝子aと遺伝子cとの間の因果関係及び遺伝子cと遺伝子bとの間の因果関係のいずれか一方又は両方が、上述したように検索された直接的因果関係から存在を説明できる間接的因果関係であっても、遺伝子a、遺伝子b及び遺伝子cが図2或いは図3に示した関係にある時には、遺伝子aと遺伝子bとの間接的因果関係」を直接的因果関係から存在を説明できる間接的因果関係とする。
すなわち、図2或いは3に示した遺伝子ネットワークにおいて、遺伝子aと遺伝子cとの間の因果関係及び遺伝子cと遺伝子bとの間の因果関係がES∪EIに存在し、遺伝子a、遺伝子b及び遺伝子cが図2或いは図3に示した関係にある時には、遺伝子aと遺伝子bとの間接的因果関係を直接的因果関係から存在を説明できる間接的因果関係として、EIに加える。説明可能間接的因果関係検索エンジンでは、EIに加える間接的因果関係が無くなるまで実行する。
上記のアルゴリズムを実行するためのフローチャートを図16に示す。図16におけるステップは以下の通りである。オリジナル・ネットワークを構成している因果関係をマトリクス表記したものをTとし、直接的因果関係をマトリクス表記したものをSとする。ここで、TおよびSの要素を、tpqおよびspqとし、遺伝子pから遺伝子qへの因果関係の有無を表現している。活性の因果関係が存在する場合には、tpq, spq=1、抑制の因果関係が存在する場合には、tpq, spq=-1、因果関係が存在しない場合には、tpq, spq=0とする。
図16においてS16〜S30に示す処理によって、Sに存在している因果関係で説明することができる間接的因果関係を探索している。この処理において、間接的因果関係の中に新しく説明可能な間接的因果関係が検出されたかどうかを、flagを用いてチェックしている(図16においてS31に示す処理)。見つかった場合には、その因果関係を用いて他の間接的因果関係が説明できるかもしれないので、図16においてS16〜S30に示す処理を繰り返す。新しく説明可能な間接的因果関係が検出されなくなったとき、図16においてS16〜S30に示す処理を抜ける。図16に示すフローチャートによって、EIに含まれるすべての因果関係が検出されることになる(図16においてS32に示す処理)。
説明可能間接的因果関係検索エンジンによって検出された間接的因果関係(EI)は、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係から存在を説明できる関係であるため、オリジナル・ネットワークから除去されたとしてもオリジナル・ネットワークに含まれる情報量を低減させることにならない。
(iii)最小数関係検索エンジン
最小数関係検索エンジンは、間接的因果関係検出エンジンで検索した間接的因果関係(EI)から前記説明可能間接的因果関係検索エンジンで検索した間接的因果関係(EI)を除いた間接的因果関係(以下、「説明不可能な間接的因果関係」という)が存在する場合の情報処理である(図7参照)。なお、以下の説明において、説明不可能な間接的因果関係のセットをEN(=EI−EI)とする。すなわち、最小数関係検索エンジンは、ES∪EI≠ETの場合に実行される手段である。
具体的には、図15に示した遺伝子ネットワークに含まれる間接的因果関係(破線)においては、間接的因果関係から遺伝子Cと遺伝子Fとの間の因果関係、遺伝子Cと遺伝子Gとの間の因果関係及び遺伝子Lと遺伝子Oとの間の因果関係を除いた因果関係のセットが、説明不可能な間接的因果関係(EN)である。
最小数関係検索エンジンでは、遺伝子ネットワークに存在する多数の説明不可能な間接的因果関係のセット(EN)から、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索する。
具体的には、本発明に係る遺伝子ネットワークの推定プログラムは、コンピュータを以下の(α)〜(γ)の手段として機能させるものであることが好ましい。
(α)間接的因果関係(EI)から説明可能間接的因果関係検索エンジンで検索した間接的因果関係(EI)を除いた説明不可能な間接的因果関係のセット(EN)のなかで、オリジナル・ネットワークに含まれる因果関係(ET)のなかの1つの因果関係とともに、他の説明不可能な間接的因果関係を一つも説明できない間接的因果関係を検索する手段(なお、以下の説明において、本手段により検索された間接的因果関係のセットをENとする)
(β)説明不可能な間接的因果関係のセット(EN)からENに含まれる間接的因果関係を除いた間接的因果関係のなかで、オリジナル・ネットワークに含まれる因果関係(ET)のなかの1つの因果関係とともに、ENの中ではENに含まれる他の説明不可能な間接的因果関係しか説明できない間接的因果関係をENに加える処理を、ENに加える間接的因果関係がなくなるまで繰り返す手段
(γ)上記(β)手段によって検出されたENに含まれない説明不可能な間接的因果関係のセット(EN−EN)をグループに分割する手段
(δ)上記(γ)手段によって形成されたグループ毎に、当該グループに含まれる間接的因果関係に基づいてグループ毎の最小数の間接的因果関係を検索する手段
(α)手段
具体的に上記(α)手段では、図17に示す遺伝子ネットワークの一部(図15に示した遺伝子ネットワークの一部)において、遺伝子Oと遺伝子Jとの間の間接的因果関係(EN0 )をENとする。
(β)手段
上記(β)手段では、図17に示す遺伝子ネットワークの一部(図15に示した遺伝子ネットワークの一部)において、遺伝子Nと遺伝子Jとの間の間接的因果関係(EN1 )が遺伝子Oと遺伝子Nとの間の直接的因果関係(ET)とともに、ENの中ではENに含まれる遺伝子Oと遺伝子Jとの間の間接的因果関係(EN0 )しか説明することができないため、この遺伝子Nと遺伝子Jとの間の間接的因果関係(EN1 )をENに加える。同様に、上記(β)手段では、図17に示す遺伝子ネットワークの一部において、遺伝子Mと遺伝子Jとの間の間接的因果関係(EN2 )及び、遺伝子Iと遺伝子Jとの間の間接的因果関係(EN3 )をENに加える。
(γ)手段
上記(γ)手段では、先ず、EN−ENに含まれる1つの間接的因果関係を空のグループに加える。次に、以下の(A)又は(B)の関係にある、EN−ENに含まれる他の間接的因果関係を当該グループに加える。
(A)グループに含まれる1つの間接的因果関係と、ETに含まれる1つの因果関係とにより、EN−ENに含まれる所定の間接的因果関係を説明できる場合、当該所定の間接的因果関係を同グループに加える。
(B)グループに含まれる1つの間接的因果関係を説明できる、ETに含まれる一対の因果関係のうち、一方又は両方の因果関係がEN−ENに含まれる間接的因果関係である場合、当該EN−ENに含まれる間接的因果関係を同グループに加える。
次に上記(γ)手段では、上記(A)または(B)の関係にあるEN−ENに含まれる間接的因果関係をさらに上記グループに加え、この処理を加える間接的因果関係が無くなるまで繰り返す。
次に、上記(γ)手段では、EN−ENに含まれ、上記グループに加えられなかった1つの間接的因果関係を他の新規グループとして同様の処理を行い、EN−ENに含まれる間接的因果関係が無くなるまで新規グループの作成を繰り返す。このように上記(γ)手段によれば、(β)手段によって検索された間接的因果関係(EN)に基づいてEN−ENに含まれる間接的因果関係を、複数のグループに分割することができる。なお、場合によっては、(γ)手段による処理によっても単一のグループしか形成されないこともある。
例えば、図15に示した遺伝子ネットワークにおいて、直接的因果関係(ES)及びEN−ENに含まれる間接的因果関係のみからなる遺伝子ネットワークとして表すと図18に示すようになる。上記(γ)手段によれば、図18に「S1」及び「S2」として示す2つのグループに分割されることとなる。
(δ)手段
(δ)手段では、上記(γ)手段によって形成されたグループ毎に、当該グループに含まれる間接的因果関係から、ES∪EIに含まれる因果関係とともに当該グループに含まれる全ての間接的因果関係を説明するのに必要な、最小数の間接的因果関係を検出する。
具体的には、先ず、対象とするグループの中から1つの間接的因果関係を取り出し、ES∪EIに含まれる因果関係とともに当該グループに含まれる全ての間接的因果関係を説明できるか検証する処理を、当該グループに含まれる間接的因果関係の全てについて行う。(δ)手段では、説明可能であった間接的因果関係の全てを「最小数の間接的因果関係」として検出する。
説明できなかった場合には、対象とするグループの中から2つの間接的因果関係を組み合わせで取り出し、これら2つの間接的因果関係とES∪EIに含まれる因果関係とによって当該グループに含まれる全ての間接的因果関係を説明できるか検証する処理を、当該グループに含まれる間接的因果関係を用いた全ての組み合わせについて行う。また、2つの間接的因果関係の如何なる組み合わせでも、グループに含まれる間接的因果関係を説明できない場合には、組み合わせの数を1つずつ増加させて、同様に処理を行う。(δ)手段では、説明可能であった間接的因果関係の組み合わせの全てを「最小数の間接的因果関係」として検出する。
具体的に、最小数関係検索エンジンによれば、図18に示したS1グループにおいて遺伝子Eと遺伝子Jとの間の間接的因果関係又は遺伝子Fと遺伝子Jとの間の間接的因果関係を最小数の間接的因果関係として検索し、S2グループにおいては遺伝子Hと遺伝子Kとの間の間接的因果関係又は遺伝子Hと遺伝子Lとの間の間接的因果関係を最小数の間接的因果関係として検索する。
上記のアルゴリズムの(α)手段および(β)手段を実行するためのフローチャートを図19に示す。図19におけるステップは以下の通りである。オリジナル・ネットワークを構成している因果関係をマトリクス表記したものをTとし、間接的因果関係をマトリクス表記したものをCとし、説明不可能な間接的因果関係をマトリクス表記したものをVとする。ここで、T、CおよびVの要素を、tpq、 cpqおよびvpqとし、遺伝子pから遺伝子qへの因果関係の有無を表現している。活性の因果関係が存在する場合には、tpq, cpq, vpq=1、抑制の因果関係が存在する場合には、tpq, cpq, vpq=-1、因果関係が存在しない場合には、tpq, cpq, vpq=0とする。
図19におけるS33〜S40に示す処理によって、最初に、Vにおいてvij≠0であるような要素を検出する、すなわち、ENから1つの因果関係を取り出す。次に、図19におけるS41〜S48に示す処理及びS49〜S56に示す処理によって、取り出した因果関係とETの1つの因果関係とともに、他のENに含まれる因果関係を説明しているかどうかを確認する。説明する場合には、flagは1となり、説明しない場合には0になる(図19におけるS48及びS56に示す処理)。すべてのETに含まれる因果関係に対して確認した後、他のENに含まれる因果関係を説明しない場合には、ENから取り出したその因果関係をチェックしておく(図19におけるS58に示す処理)。vij≠0であるすべてのVの要素に対して、上記の探索が終了した後で、チェックされた要素を0にする(図19におけるS60に示す処理)。新しくチェックされた因果関係が存在する場合には、上記処理を新しくチェックされる因果関係が無くなるまで繰り返す(図19におけるS61に示す処理)。上記処理の1ターン目でチェックされる因果関係がEN n0であり、xターン目以降でチェックされる因果関係がEN n(x-1)である(図19におけるS62に示す処理)。
上記アルゴリズムの(γ)手段を実行するためのフローチャートを図20に示す。図20におけるステップは以下の通りである。オリジナル・ネットワークを構成している因果関係をマトリクス表記したものをTとし、EN-EN*に含まれる因果関係をマトリクス表記したものをEとする。ここで、TおよびEの要素を、tpqおよびepqとし、遺伝子pから遺伝子qへの因果関係の有無を表現している。活性の因果関係が存在する場合には、tpq, epq=1、抑制の因果関係が存在する場合には、tpq, epq=-1、因果関係が存在しない場合には、tpq, epq=0とする。
図20におけるS63〜S70に示す処理によって、最初に、Eの要素でeij≠0であるものを検出する、すなわち、EN-EN*に含まれる因果関係を1つ取り出す。次に、図20におけるS72に示す処理で、S70で取り出した因果関係を空の関係リストに加える。また、図20におけるS73に示す処理で、S70で取り出した因果関係を構成する一対の遺伝子のそれぞれを、空の遺伝子リストに加える。この遺伝子リストは、後の処理(δ)手段で必要となる。
次に、図20におけるS74に示す処理で、eijを0にする、すなわち、eijの因果関係をEN-EN*から削除している。次に、図20におけるS75に示す処理で、S70で取り出した因果関係と同一のグループに入るEN-EN*に含まれる因果関係をすべて探索するサブルーチン1にi及びjを入れる。次に、図20におけるS76に示す処理で、サブルーチン1で検索された全ての因果関係を構成する遺伝子リストを番号の小さい順に並び替え、重複する遺伝子を除く。
次に、Eの要素がすべて0、すなわちEN-EN*が空であるかどうかを調べ(図20におけるS77に示す処理)、空でない場合には(図20におけるS77に示す処理で「yes」)、図20におけるS78に示す処理で関係リストと遺伝子リストを1つのグループとして作成した後、同様に上記処理(図20におけるS63〜S77に示す処理)を繰り返す。空の場合には(図20におけるS77に示す処理で「no」)、EN-EN*に含まれるすべての因果関係がグループに分割されているので、処理を終了させる。
(γ)手段のサブルーチン1を実行するためのフローチャートを図21に示す.図21におけるステップは以下の通りである.最初に、図21におけるS79〜S85に示す処理で、サブルーチン1に渡された引数を(a,b)として、tai、tibなる因果関係を検索する。そして、本サブルーチンでは、先ず、(γ)手段の(B)に当たる処理(図21におけるS86〜S95に示す処理)を行う。図21におけるS86〜S95に示す処理では、eai及びeibが0でない場合、eai及びeibを関係リストに入れるとともに、iを遺伝子リストに入れる。
次に(γ)手段の(A)に当たる処理を行う(図21におけるS96〜S103に示す処理と図21におけるS104〜S111に示す処理)。ここで、(A)に当たる処理は2通りの場合が存在する。すなわち、EN-EN*に含まれる間接的因果関係を説明する2つの因果関係のうち、グループに含まれる1つの間接的因果関係が先でETに含まれる1つの因果関係が後の場合(図21におけるS96〜S103に示す処理)と、ETに含まれる1つの因果関係が先でグループに含まれる1つの間接的因果関係が後の場合(図21におけるS104〜S111に示す処理)である。
図21におけるS96〜S103に示す処理においてe ib が0でない場合、図21におけるS104〜S111に示す処理においてeaiが0でない場合、eai及びeibを関係リストに入れると共に、iを遺伝子リストに入れる。
また、本サブルーチン1では、図21におけるS86〜S95に示す処理、図21におけるS96〜S103に示す処理、図21におけるS104〜S111に示す処理で新たに関係リストに加えられた因果関係に対しても、(γ)手段の(A)および(B)に当たる処理を行うために、本サブルーチン1が入れ子の状態になる。
上記アルゴリズムの(δ)手段を実行するためのフローチャートを図22に示す。図22におけるステップは以下の通りである。すべてのグループに対して、各グループの関係リストに含まれるすべての因果関係をES∪EI*とともに説明するような最小数の関係リストに含まれる因果関係のセットを探索するため、インデックスiを用いて、下記の処理をグループの個数回だけ行う。
すなわち、先ず、図22におけるS112〜S118に示す処理によって、グループの関係リストの中からj個の関係からなる組み合わせを生成する。次に、図22におけるS119〜S122に示す処理によって、ES∪EI*∪EIS kで説明できる、そのグループの関係リストの中に含まれる因果関係を検出する。なお、S122に示す処理は、図23に示すフローチャートに従って実行されるが、詳細を後述する。
次に、図22におけるS123に示す処理によって、そのグループの関係リストの中に含まれる因果関係がすべて説明できたかどうかを調べる。説明できた場合(S123に示す処理において「yes」)には、図22におけるS124へ進み、説明できない場合(S123に示す処理において「no」)には、異なる組み合わせをES∪EI*に加えてS120〜S123の処理を同様に行う。図22におけるS124では、EIS kを、グループの関係リストに含まれるすべての因果関係をES∪EI*とともに説明するような最小数の関係リストに含まれる因果関係のセットとして保存する。図22におけるS125において、このようなセットが見つかった場合flagは1、見つからなかった場合flagは0である。図22におけるS126において、見つからなかった場合(flag=0)には、1個増やした関係数からなる組み合わせを生成させて(図22におけるS117およびS118に示す処理)、S119〜S125に示す処理を繰り返す。
(δ)手段におけるS122に示す処理を実行するためのフローチャートを図23に示す。図23におけるステップは以下の通りである。EをES∪EI*をマトリクス表記したものに初期化し(図23におけるS127に示す処理)、そこにEIS kに含まれる因果関係をEの要素に加える(図23におけるS128に示す処理)。図23におけるS129〜S144に示す処理によって、Eに存在している因果関係で説明可能な、関係リストに含まれるその他の因果関係を探索する。すなわち、図23におけるS130及びS131で設定した遺伝子lから遺伝子uへの因果関係がEに存在し(S132における「yes」)、遺伝子uからS133で設定した遺伝子wへの因果関係がEに存在し(S134における「yes」)、かつ遺伝子lから遺伝子wへの関係がTに存在し、その因果関係が上記2つの因果関係で説明可能な場合(S135およびS136における「yes」)、遺伝子lから遺伝子wへの因果関係は説明可能であることを保存する(図23におけるS137に示す処理)。なお、S140、S142及びS144において、「w++」、「u++」及び「l++」は、i番目のグループに含まれる遺伝子リストの次の遺伝子を意味している。
新たに説明できる因果関係が見つかったら、その因果関係を用いて新たに関係リストに含まれる因果関係が説明可能となるかもしれないので、図23におけるS145に示す処理によって、cflagを用意して、説明可能となる因果関係が無くなるまで繰り返す。
以上のように、最小数関係検索エンジンによれば、オリジナル・ネットワークに含まれる間接的因果関係の中で、直接的因果関係とともに全ての間接的因果関係の存在を説明するのに必要な最小数の間接的因果関係を検索することができる。言い換えると、最小数関係検索エンジンにより検索された間接的因果関係と直接的因果関係とを用いることによって、オリジナル・ネットワークの基となる遺伝子発現データ等を再現することができる。
(iv)推定エンジン
推定エンジンでは、直接的因果関係のセット(ES)に、前記最小数関係検索エンジンにより検索した最小数の間接的因果関係を加えることで、遺伝子ネットワークを推定する。このとき、最小数関係検索エンジンにおいて、複数の間接的因果関係或いはその組み合わせを、最小数の間接的因果関係として検索した場合には、推定エンジンにより複数の遺伝子ネットワークを推定することとなる。
また、最小数関係検索エンジンにおいて、最小数の間接的因果関係を複数のグループ毎に検索した場合には、各グループにおいて検索された最小数の間接的因果関係の組み合わせとして複数の遺伝子ネットワークを推定することとなる。
具体的に、最小数関係検索エンジンによって図18に示すように、遺伝子Eと遺伝子Jとの間の間接的因果関係又は遺伝子Fと遺伝子Jとの間の間接的因果関係をS1グループの最小数の間接的因果関係として検索し、遺伝子Hと遺伝子Kとの間の間接的因果関係又は遺伝子Hと遺伝子Lとの間の間接的因果関係をS2グループの最小数の間接的因果関係として検索した場合、推定エンジンによれば、図24に示すように、4種類の遺伝子ネットワークを推定することとなる。
推定エンジンを実行するためのフローチャートを図25に示す。図25におけるステップは以下の通りである。各グループから1つづつ、ES∪EI*とともにそのグループの関係リストに含まれるすべての因果関係を説明するような最小数の間接的因果関係のセットを、ESに加えることによりMEGNを導出するサブルーチン2に入る(図25におけるS146〜S148に示す処理)。グループが存在しない、すなわち、直接的因果関係でオリジナル・ネットワークを構成するすべての因果関係が説明可能かどうかをチェックするのが図25におけるS149に示す処理である。すべての因果関係が説明可能な場合の処理が図25におけるS150に示す処理である。
推定エンジンにおけるサブルーチン2を実行するためのフローチャートを図26に示す。図26におけるステップは以下の通りである。図26におけるS154〜S161では、各グループから1つづつ、ES∪EI*とともにそのグループの関係リストに含まれるすべての因果関係を説明するような最小数の間接的因果関係のセットを取り出しESに加え、MEGN(最小数の因果関係)を導出している。その中のS157及びS158では、すべてのグループから1つづつの関係のセットをESに加えたかを調べており、加えられていた場合にはMEGNとして保存している。
本プログラムによれば、直接的因果関係及び最小数の間接的因果関係から構成される遺伝子ネットワークを推定することとなる。推定された遺伝子ネットワークは、当該遺伝子ネットワークに含まれる直接的因果関係及び最小数の間接的因果関係によって、遺伝子発現データから推定されるオリジナル・ネットワークを完全に説明することが可能となっている。
したがって、本プログラムによれば、オリジナル・ネットワークの基礎となる遺伝子発現データに含まれる情報量を失うことのない遺伝子ネットワークを推定することができる。
なお、本推定プログラムによって得られた遺伝子ネットワークは、例えば、符号付有向グラフのかたちでディスプレイ等の出力手段106に出力することができる。また、得られた遺伝子ネットワークは、当該遺伝子ネットワークに含まれる直接的因果関係及び最小数の間接的因果関係を数値として出力することもできる。
遺伝子ネットワークを説明するための符号付有向グラフを簡略化して示す図である。 遺伝子a、遺伝子b及び遺伝子cからなる遺伝子ネットワークにおいて、遺伝子aが遺伝子bを正に制御する因果関係であって間接的因果関係である場合を説明するための符号付有向グラフを示す図である。 遺伝子a、遺伝子b及び遺伝子cからなる遺伝子ネットワークにおいて、遺伝子aが遺伝子bを負に制御する因果関係であって間接的因果関係である場合を説明するための符号付有向グラフを示す図である。 遺伝子a、遺伝子b及び遺伝子cからなる遺伝子ネットワークにおいて、遺伝子aが遺伝子bを正に制御する因果関係であって直接的因果関係である場合を説明するための符号付有向グラフを示す図である。 遺伝子a、遺伝子b及び遺伝子cからなる遺伝子ネットワークにおいて、遺伝子aが遺伝子bを負に制御する因果関係であって直接的因果関係である場合を説明するための符号付有向グラフを示す図である。 遺伝子a、遺伝子b及び遺伝子cからなる遺伝子ネットワークの一例を符号付有向グラフとして示す図である。 図6に示す遺伝子ネットワークにおいて間接的因果関係を除いて構築した遺伝子ネットワークを示す図である。 図7に示す遺伝子ネットワークに、遺伝子発現データ等を再現しうる最小数の因果関係を加えて構築した遺伝子ネットワークを示す図である。 本発明に係る推定プログラムがインストールされるコンピュータの一構成例を示す図である。 遺伝子a(n=0、1、2、3…)の発現量Xを、遺伝子a破壊株a 毎に蓄積したデータの一例を示す図である。 遺伝子間の発現制御関係を示すデータベースの一例を示す図である。 図10及び11に示したデータを用いて構築した遺伝子ネットワークを符号付有向グラフとして示す図である。 オリジナル・ネットワークから間接的因果関係を検索するプログラムを実行するためのフローチャートを示す図である。 遺伝子A〜Pの16個の遺伝子に関する因果関係を含むオリジナル・ネットワークを示す図である。 図14に示すオリジナル・ネットワークに含まれる間接的因果関係を破線として示す遺伝子ネットワークを示す図である。 説明可能間接的因果関係検索エンジンを実行するためのフローチャートを示す図である。 図15に示した遺伝子ネットワークの一部であって、最小数関係検索エンジンにおける処理の一部を説明するための符号付有向グラフを示す図である。 図15に示した遺伝子ネットワークにおいて、説明不可能な間接的因果関係のセット(EN−EN)をグループに分割した遺伝子ネットワークを符号付有向グラフとして示す図である。 最小数関係検索エンジンにおける(α)手段及び(β)手段を実行するためのフローチャートを示す図である。 最小数関係検索エンジンにおける(γ)手段を実行するためのフローチャートを示す図である。 図20におけるS75に示す処理で実行するサブルーチン1のフローチャートを示す図である。 最小数関係検索エンジンにおける(δ)手段を実行するためのフローチャートを示す図である。 図20におけるS122に示す処理のフローチャートを示す図である。 本発明に係る推定プログラムによって得られた遺伝子ネットワークを符号付有向グラフとして示す図である。 推定エンジンにおける処理を実行するためのフローチャートを示す図である。 図25におけるS148に示す処理で実行するサブルーチン2のフローチャートを示す図である。
符号の説明
101…CPU(制御手段)、102…ROM、103…RAM、104…入力手段、105…送信/受信手段、106…出力手段、107…ハードディスクドライブ(HDD)、108…CD-ROMドライブ、110…パブリックデータベース、111…検索手段、112…演算手段

Claims (8)

  1. 一対の遺伝子間における制御関係を因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有しない場合の当該一対の遺伝子間の因果関係を直接的因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有する場合であって、当該一対の遺伝子と当該他の遺伝子との間の因果関係によって当該一対の遺伝子間の因果関係の存在を説明できない場合に当該一対の遺伝子間の因果関係を直接的因果関係とし、説明できる場合を間接的因果関係とした、間接的因果関係及び直接的因果関係からなる遺伝子ネットワークを推定するに際して、
    3以上の遺伝子に関する因果関係のセットから、間接的因果関係を検索する工程Aと、
    前記工程Aで検索した間接的因果関係の中で、直接的因果関係から存在を説明できる間接的因果関係を検索し、その後、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係から、存在を説明できる間接的因果関係を検索する工程Bと、
    前記工程Aで検索した間接的因果関係から前記工程Bで検索した間接的因果関係を除いた間接的因果関係の中で、直接的因果関係及び前記工程Bで検索した間接的因果関係とともに、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索する工程Cと、
    前記因果関係のセットから間接的因果関係を除くとともに前記工程Cで検索した最小数の間接的因果関係を加えることで因果関係のセットを算出し、算出した因果関係のセットから構成される遺伝子ネットワークを推定する工程Dと
    を備える遺伝子ネットワークの推定方法。
  2. 上記工程Aでは、
    遺伝子A、遺伝子B及び遺伝子C間に、遺伝子A及び遺伝子B間の因果関係、遺伝子A及び遺伝子C間の因果関係並びに遺伝子C及び遺伝子B間の因果関係が存在し、前記遺伝子A及び遺伝子B間の因果関係が正の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が偶数個含まれているならば、或いは
    前記遺伝子A及び遺伝子B間の因果関係が負の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が奇数個含まれているならば、
    前記遺伝子A及び遺伝子B間の因果関係を間接的因果関係であるとすることを特徴とする請求項1記載の遺伝子ネットワークの推定方法。
  3. 上記工程Cは、
    前記工程Aで検索した間接的因果関係から前記工程Bで検索した間接的因果関係を除いた間接的因果関係を説明不可能間接的因果関係とし、この説明不可能間接的因果関係の中で、上記工程Aで検索対象とした因果関係のセットに含まれる因果関係の中の1つの因果関係とともに説明不可能間接的因果関係を一つも説明できない間接的因果関係を、非主要な説明不可能間接的因果関係として検索する工程Eと、
    説明不可能間接的因果関係から非主要な説明不可能間接的因果関係を除いた間接的因果関係のなかで、上記工程Aで検索対象とした因果関係のセットのなかの1つの因果関係とともに、説明不可能間接的因果関係の中では非主要な説明不可能間接的因果関係しか説明できない間接的因果関係を、非主要な説明不可能間接的因果関係のセットに加える処理を、加える間接的因果関係がなくなるまで繰り返す工程Fと、
    上記工程Fで検出された間接的因果関係のセットに含まれない、説明不可能間接的因果関係のセットをグループに分割する工程Gと、
    上記工程Gで形成されたグループ毎に、当該グループに含まれる間接的因果関係に基づいてグループ毎の最小数の間接的因果関係を検索する工程Hとを含むことを特徴とする請求項1記載の遺伝子ネットワークの推定方法。
  4. 上記工程Gでは、特定のグループ内に含まれる最小数の間接的因果関係によって、当該グループに含まれる間接的因果関係のみを説明するようにグループに分割することを特徴とする請求項3記載の遺伝子ネットワークの推定方法。
  5. 一対の遺伝子間における制御関係を因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有しない場合の当該一対の遺伝子間の因果関係を直接的因果関係とし、当該一対の遺伝子がそれぞれ共通する他の遺伝子との間に更に因果関係を有する場合であって、当該一対の遺伝子と当該他の遺伝子との間の因果関係によって当該一対の遺伝子間の因果関係の存在を説明できない場合に当該一対の遺伝子間の因果関係を直接的因果関係とし、説明できる場合を間接的因果関係とした、間接的因果関係及び直接的因果関係からなる遺伝子ネットワークを推定するに際して、
    3以上の遺伝子に関する因果関係のデータセットから、間接的因果関係を検索手段によって検索する工程Aと、
    前記工程Aで検索した間接的因果関係のデータセットの中で、直接的因果関係から存在を説明できる間接的因果関係を検索手段によって検索し、その後、直接的因果関係及び/又は直接的因果関係から存在を説明できる間接的因果関係のデータセットから、存在を説明できる間接的因果関係を検索手段によって検索する工程Bと、
    前記工程Aで検索した間接的因果関係のデータセットから、前記工程Bで検索した間接的因果関係のデータを演算手段によって除いて算出された間接的因果関係のデータセットの中で、直接的因果関係及び前記工程Bで検索した間接的因果関係とともに、全ての間接的因果関係の存在を説明できる最小数の間接的因果関係を検索手段によって検索する工程Cと、
    前記因果関係のデータセットから、間接的因果関係のデータを演算手段によって除くとともに前記工程Cで検索した最小数の間接的因果関係のデータを演算手段によって加えることで因果関係のデータセットを算出し、算出した因果関係のデータセットから構成される遺伝子ネットワークを出力手段によって出力する工程Dと
    をコンピュータに実行させる遺伝子ネットワークの推定プログラム。
  6. 上記工程Aにおいて検索手段は、
    遺伝子A、遺伝子B及び遺伝子C間に、遺伝子A及び遺伝子B間の因果関係、遺伝子A及び遺伝子C間の因果関係並びに遺伝子C及び遺伝子B間の因果関係が存在し、前記遺伝子A及び遺伝子B間の因果関係が正の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が偶数個含まれているという条件、或いは
    前記遺伝子A及び遺伝子B間の因果関係が負の因果関係であるとき、前記遺伝子A及び遺伝子C間の因果関係並びに前記遺伝子C及び遺伝子B間の因果関係に負の因果関係が奇数個含まれているという条件を満たした場合に、
    前記遺伝子A及び遺伝子B間の因果関係を間接的因果関係として検索することを特徴とする請求項5記載の遺伝子ネットワークの推定プログラム。
  7. 上記工程Cは、
    前記工程Aで検索した間接的因果関係のデータセットから、前記工程Bで検索した間接的因果関係のデータを演算手段によって除いた間接的因果関係を説明不可能間接的因果関係のデータセットとし、この説明不可能間接的因果関係のデータセットの中で、上記工程Aで検索対象とした因果関係のデータセットに含まれる因果関係の中の1つの因果関係とともに説明不可能間接的因果関係を一つも説明できない間接的因果関係を、非主要な説明不可能間接的因果関係として検索手段によって検索する工程Eと、
    説明不可能間接的因果関係のデータセットから非主要な説明不可能間接的因果関係を演算手段によって除いた間接的因果関係のデータセットなかで、上記工程Aで検索対象とした因果関係のセットのなかの1つの因果関係とともに、説明不可能間接的因果関係の中では非主要な説明不可能間接的因果関係しか説明できない間接的因果関係を検索手段によって検索し、検索された間接的因果関係を演算手段によって非主要な説明不可能間接的因果関係のセットに加える処理を、加える間接的因果関係がなくなるまで繰り返す工程Fと、
    上記工程Fで検出された間接的因果関係のセットに含まれない、説明不可能間接的因果関係のデータセットを演算手段によりグループに分割する工程Gと、
    上記工程Gで形成されたグループ毎に、当該グループに含まれる間接的因果関係に基づいてグループ毎の最小数の間接的因果関係を検索手段によって検索する工程Hとを含むことを特徴とする請求項5記載の遺伝子ネットワークの推定プログラム。
  8. 上記工程Gにおいて演算手段は、特定のグループ内に含まれる最小数の間接的因果関係のデータセットによって、当該グループに含まれる間接的因果関係のみを説明するようにグループに分割することを特徴とする請求項7記載の遺伝子ネットワークの推定プログラム。
JP2004153739A 2004-05-24 2004-05-24 遺伝子ネットワークの推定方法及び推定プログラム Expired - Fee Related JP4617448B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004153739A JP4617448B2 (ja) 2004-05-24 2004-05-24 遺伝子ネットワークの推定方法及び推定プログラム
US11/597,428 US7917300B2 (en) 2004-05-24 2005-05-24 Method and program for predicting gene network
PCT/JP2005/009448 WO2005114531A1 (ja) 2004-05-24 2005-05-24 遺伝子ネットワークの推定方法及び推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004153739A JP4617448B2 (ja) 2004-05-24 2004-05-24 遺伝子ネットワークの推定方法及び推定プログラム

Publications (2)

Publication Number Publication Date
JP2005338957A true JP2005338957A (ja) 2005-12-08
JP4617448B2 JP4617448B2 (ja) 2011-01-26

Family

ID=35428566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004153739A Expired - Fee Related JP4617448B2 (ja) 2004-05-24 2004-05-24 遺伝子ネットワークの推定方法及び推定プログラム

Country Status (3)

Country Link
US (1) US7917300B2 (ja)
JP (1) JP4617448B2 (ja)
WO (1) WO2005114531A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017187537A1 (ja) * 2016-04-26 2017-11-02 三菱電機株式会社 依存関係抽出装置および依存関係抽出プログラム
KR102228701B1 (ko) * 2018-09-11 2021-03-16 가천대학교 산학협력단 의존관계망 차별성에 대한 지식 기반 평가 방법 및 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262019A (ja) * 1994-03-25 1995-10-13 Osaka Gas Co Ltd 知識情報変換装置及び有向グラフ解析装置
WO2002038749A1 (fr) * 2000-11-13 2002-05-16 Japan Science And Technology Corporation Procede d'anticipation de reseau de genes, systeme d'anticipation et support d'enregistrement

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023933A1 (en) * 1998-10-21 2000-04-27 Bios Group Lp Systems and methods for analysis of genetic networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262019A (ja) * 1994-03-25 1995-10-13 Osaka Gas Co Ltd 知識情報変換装置及び有向グラフ解析装置
WO2002038749A1 (fr) * 2000-11-13 2002-05-16 Japan Science And Technology Corporation Procede d'anticipation de reseau de genes, systeme d'anticipation et support d'enregistrement

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6010029176, Kyoda, K.M., "A gene network inference method from continuous−value gene expression data of wild−type and mutants", Genome informatics. Workshop on Genome Informatics, 2000, Vol.11, p.196−204 *
JPN6010050870, Kyoda, K., "DBRF−MEGN method: an algorithm for deducing minimum equivalent gene networks from large−scale gene e", Bioinformatics, 20040527, Vol.20, No.16, p.2662−75 *

Also Published As

Publication number Publication date
JP4617448B2 (ja) 2011-01-26
US20080015788A1 (en) 2008-01-17
WO2005114531A1 (ja) 2005-12-01
US7917300B2 (en) 2011-03-29

Similar Documents

Publication Publication Date Title
Wu et al. Most parsimonious reconciliation in the presence of gene duplication, loss, and deep coalescence using labeled coalescent trees
Rasmussen et al. Unified modeling of gene duplication, loss, and coalescence using a locus tree
Markowetz et al. Nested effects models for high-dimensional phenotyping screens
Forslund et al. Evolution of protein domain architectures
US8332347B2 (en) System and method for inferring a network of associations
KR20160073406A (ko) 방향성 비순환 구조에서 쌍형성된-말단 데이터를 사용하기 위한 시스템 및 방법
Forslund et al. Evolution of protein domain architectures
Kurtz et al. Disentangling microbial associations from hidden environmental and technical factors via latent graphical models
CN113555062A (zh) 一种用于基因组碱基变异检测的数据分析系统及分析方法
Ultsch et al. Functional abstraction as a method to discover knowledge in gene ontologies
Du et al. Unifying gene duplication, loss, and coalescence on phylogenetic networks
Liu et al. NSRGRN: a network structure refinement method for gene regulatory network inference
Bodinier et al. Automated calibration for stability selection in penalised regression and graphical models: a multi-OMICs network application exploring the molecular response to tobacco smoking
Gao et al. Clustering algorithms for detecting functional modules in protein interaction networks
Beyer et al. A graph‐theoretic approach to the partition of individuals into full‐sib families
JP4617448B2 (ja) 遺伝子ネットワークの推定方法及び推定プログラム
Lee et al. Survival prediction and variable selection with simultaneous shrinkage and grouping priors
Garamszegi et al. Working with the tree of life in comparative studies: how to build and tailor phylogenies to interspecific datasets
Mount Using hidden Markov models to align multiple sequences
Liu et al. The community coevolution model with application to the study of evolutionary relationships between genes based on phylogenetic profiles
van Haagen et al. Generic information can retrieve known biological associations: implications for biomedical knowledge discovery
Du et al. Genetic algorithms
Cai et al. Identification of protein complexes from tandem affinity purification/mass spectrometry data via biased random walk
US20230245785A1 (en) Method for constructing functional classifiers for microbiome analysis
WO2002038749A1 (fr) Procede d'anticipation de reseau de genes, systeme d'anticipation et support d'enregistrement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100907

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100929

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees