JP3443039B2 - ネットワーク推定方法および装置 - Google Patents
ネットワーク推定方法および装置Info
- Publication number
- JP3443039B2 JP3443039B2 JP17442699A JP17442699A JP3443039B2 JP 3443039 B2 JP3443039 B2 JP 3443039B2 JP 17442699 A JP17442699 A JP 17442699A JP 17442699 A JP17442699 A JP 17442699A JP 3443039 B2 JP3443039 B2 JP 3443039B2
- Authority
- JP
- Japan
- Prior art keywords
- network
- data
- triplet
- fitness
- triplets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Physiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【0001】
【発明の属する技術分野】本発明は、互いに関連し、干
渉し合う別々の要素のネットワークとしてモデル化でき
るシステムを、そのネットワークの挙動や状態を表す情
報から逆に推定することに関する。特に、生物学的現象
における遺伝子の発現データ、タンパク質の濃度データ
等から、その現象を引き起こしている遺伝子の制御ネッ
トワークや酵素やタンパク質の反応を示す代謝ネットワ
ークの構造等を推定することに関する。
渉し合う別々の要素のネットワークとしてモデル化でき
るシステムを、そのネットワークの挙動や状態を表す情
報から逆に推定することに関する。特に、生物学的現象
における遺伝子の発現データ、タンパク質の濃度データ
等から、その現象を引き起こしている遺伝子の制御ネッ
トワークや酵素やタンパク質の反応を示す代謝ネットワ
ークの構造等を推定することに関する。
【0002】
【技術の背景】最近の分子生物学の急激な進歩によっ
て、主要な生物に関する多くの情報が蓄積されつつあ
る。その典型例が、酵母、線虫、ショウジョウバエであ
る。例えば、線虫(C.elegans)では、その全細胞系譜の
推定、神経系の結合の同定などがすでに行われており、
昨年、DNAの全塩基配列の決定が発表された。酵母、
大腸菌、マイコプラズマ等のモデル生物においても、D
NAの全塩基配列がすでに決定されており、究極の目標
であるヒトのDNAの全塩基配列も数年以内には終了す
ると思われる。しかしながら、配列が分かるということ
と、遺伝子やその機能、さらには遺伝子間の相互作用が
分かるという間には、大きなギャップがある。
て、主要な生物に関する多くの情報が蓄積されつつあ
る。その典型例が、酵母、線虫、ショウジョウバエであ
る。例えば、線虫(C.elegans)では、その全細胞系譜の
推定、神経系の結合の同定などがすでに行われており、
昨年、DNAの全塩基配列の決定が発表された。酵母、
大腸菌、マイコプラズマ等のモデル生物においても、D
NAの全塩基配列がすでに決定されており、究極の目標
であるヒトのDNAの全塩基配列も数年以内には終了す
ると思われる。しかしながら、配列が分かるということ
と、遺伝子やその機能、さらには遺伝子間の相互作用が
分かるという間には、大きなギャップがある。
【0003】このような遺伝子の機能や遺伝子間の相互
作用の決定は非常に困難な仕事である。現在、分子生物
学の多くの研究は、注目する現象に関わる遺伝子および
その転写産物の特定と、それらのカスケードの決定に重
点を置いている。このような遺伝子間の相互作用の理解
を行う段階において、複雑な相互作用を人間の直感のみ
を用いて行うことは極めて難しい。これは、データが大
量にあることやこれに関わる相互作用等の関係も色々と
考えられるからである。我々は、この困難をコンピュー
タという計算能力をもった道具を導入することで乗り越
えようとしている。
作用の決定は非常に困難な仕事である。現在、分子生物
学の多くの研究は、注目する現象に関わる遺伝子および
その転写産物の特定と、それらのカスケードの決定に重
点を置いている。このような遺伝子間の相互作用の理解
を行う段階において、複雑な相互作用を人間の直感のみ
を用いて行うことは極めて難しい。これは、データが大
量にあることやこれに関わる相互作用等の関係も色々と
考えられるからである。我々は、この困難をコンピュー
タという計算能力をもった道具を導入することで乗り越
えようとしている。
【0004】この考えを図式したのが図1である。これ
は、コンピュータを利用する部分(バーチャル)と、実
際に生物学的に実験する部分(リアル)との関係を示す
図である。図1において、まず、解明しようとする現象
を特定すると、現在知られている生物学的知識(図1
フェーズ−I A)から、モデルをコンピュータ上に実
装する(図1 フェーズ−I B)。また、すでに仮説
が提示されている場合には、その仮説を実装する。実装
されたモデルを使ってシミュレーションを行い(図1
フェーズ−I C)、観測されているデータとの整合性
を検証する(図1 フェーズ−I D)。シミュレーシ
ョンの結果と、観測データと一致しない場合は、2つの
可能性が考えられる。まず、シミュレーションが正確で
ない場合である。これは、シミュレーションの精度をあ
げて、確実なものとすることで解決する。次に考えられ
るのは、モデルが不完全または間違っている場合であ
る。この場合は知られている実験データに整合するモデ
ルを構築する必要がある。その後に、できるならば、こ
のモデルを用いて、コンピュータ上で実験を行う(図1
フェーズ−II F)。フェーズIIの後、又はフェーズ
IIができないなら、直接、仮説的に決めたモデル等が正
しいか実際に生物学的な実験を開始する(図1フェーズ
−IIIおよびIV)。このようにして、「生物のリバース
・エンジニアリング」を行うことができる。このような
コンピュータ上におけるシミュレーションにより、仮説
的に求めたモデルの絞り込みを必要としている分野は、
上述の生物の分野に限らない。
は、コンピュータを利用する部分(バーチャル)と、実
際に生物学的に実験する部分(リアル)との関係を示す
図である。図1において、まず、解明しようとする現象
を特定すると、現在知られている生物学的知識(図1
フェーズ−I A)から、モデルをコンピュータ上に実
装する(図1 フェーズ−I B)。また、すでに仮説
が提示されている場合には、その仮説を実装する。実装
されたモデルを使ってシミュレーションを行い(図1
フェーズ−I C)、観測されているデータとの整合性
を検証する(図1 フェーズ−I D)。シミュレーシ
ョンの結果と、観測データと一致しない場合は、2つの
可能性が考えられる。まず、シミュレーションが正確で
ない場合である。これは、シミュレーションの精度をあ
げて、確実なものとすることで解決する。次に考えられ
るのは、モデルが不完全または間違っている場合であ
る。この場合は知られている実験データに整合するモデ
ルを構築する必要がある。その後に、できるならば、こ
のモデルを用いて、コンピュータ上で実験を行う(図1
フェーズ−II F)。フェーズIIの後、又はフェーズ
IIができないなら、直接、仮説的に決めたモデル等が正
しいか実際に生物学的な実験を開始する(図1フェーズ
−IIIおよびIV)。このようにして、「生物のリバース
・エンジニアリング」を行うことができる。このような
コンピュータ上におけるシミュレーションにより、仮説
的に求めたモデルの絞り込みを必要としている分野は、
上述の生物の分野に限らない。
【0005】
【発明が解決しようとする課題】本発明の目的は、コン
ピュータにより、仮説的に求めたモデルの絞り込みを効
率良く行うことである。例えば分子生物学においては、
DNAチップやマイクロアレイ、さらには、PCRなど
を利用して得られた遺伝子産物やタンパク質の量の時間
的変化に関するデータ、電気生理学的実験や電圧感受性
色素などを用いた神経回路網の活動に関するデータ等か
ら、その背後にある遺伝子やタンパク質、酵素の相互作
用のネットワーク、および、神経細胞のネットワークで
表されるモデルを、コンピュータを用いて推定すること
である。与えられたデータから考えられるモデルの総数
は莫大な数である。従来は、これを人間の勘に頼ってあ
たりを付け、生物学的な実験により確かめていた。本発
明は、与えられたデータから、類似したデータを生成す
る可能性のあるモデル(ネットワーク)を、コンピュー
タを用いて推定することにより、確からしいモデルの数
をある程度まで絞り込もうとするものである。これは、
上述の図1に示した場合では、フェーズIに関するもの
である。これらの相互作用のモデルの推定(ネットワー
クの推定)は、疾病の原因遺伝子の特定や、投薬の効果
の推定等に必要である。また、未知の遺伝子や遺伝子産
物の推定にも用いることができる。
ピュータにより、仮説的に求めたモデルの絞り込みを効
率良く行うことである。例えば分子生物学においては、
DNAチップやマイクロアレイ、さらには、PCRなど
を利用して得られた遺伝子産物やタンパク質の量の時間
的変化に関するデータ、電気生理学的実験や電圧感受性
色素などを用いた神経回路網の活動に関するデータ等か
ら、その背後にある遺伝子やタンパク質、酵素の相互作
用のネットワーク、および、神経細胞のネットワークで
表されるモデルを、コンピュータを用いて推定すること
である。与えられたデータから考えられるモデルの総数
は莫大な数である。従来は、これを人間の勘に頼ってあ
たりを付け、生物学的な実験により確かめていた。本発
明は、与えられたデータから、類似したデータを生成す
る可能性のあるモデル(ネットワーク)を、コンピュー
タを用いて推定することにより、確からしいモデルの数
をある程度まで絞り込もうとするものである。これは、
上述の図1に示した場合では、フェーズIに関するもの
である。これらの相互作用のモデルの推定(ネットワー
クの推定)は、疾病の原因遺伝子の特定や、投薬の効果
の推定等に必要である。また、未知の遺伝子や遺伝子産
物の推定にも用いることができる。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、あるデータを生成する要素を少なくとも
1つ用いて、互いに関連している要素間の関係をネット
ワークとして記述でき、前記ネットワークにより生成さ
れたデータが与えられたときにおける、前記与えられた
データから、前記データを再現できるネットワークをコ
ンピュータ・システムを用いて推定する方法であって、
前記ネットワークは、ネットワーク構造と、それに対応
するパラメータ・セットと、ネットワーク構造およびパ
ラメータ・セットから生成されるデータと前記与えられ
たデータとの適応度とからなるトリプレットとして表現
され、前記与えられたデータを実現することが想定され
る、部分的に既知のネットワーク構造を基にネットワー
ク構造を生成し、それに対応するパラメータ・セットお
よび適応度を作成し、前記適応度を利用して最適化した
複数の候補トリプレットを第1記憶手段に格納するステ
ップと、前記与えられたデータとは異なる、ネットワー
ク構造の一部が変異したネットワーク構造から生成でき
る他のデータを用いて、前記第1記憶手段に格納された
候補トリプレットから適切な候補トリプレットを絞り込
み、第2記憶手段に格納するステップとを備えることを
特徴とする。
に、本発明は、あるデータを生成する要素を少なくとも
1つ用いて、互いに関連している要素間の関係をネット
ワークとして記述でき、前記ネットワークにより生成さ
れたデータが与えられたときにおける、前記与えられた
データから、前記データを再現できるネットワークをコ
ンピュータ・システムを用いて推定する方法であって、
前記ネットワークは、ネットワーク構造と、それに対応
するパラメータ・セットと、ネットワーク構造およびパ
ラメータ・セットから生成されるデータと前記与えられ
たデータとの適応度とからなるトリプレットとして表現
され、前記与えられたデータを実現することが想定され
る、部分的に既知のネットワーク構造を基にネットワー
ク構造を生成し、それに対応するパラメータ・セットお
よび適応度を作成し、前記適応度を利用して最適化した
複数の候補トリプレットを第1記憶手段に格納するステ
ップと、前記与えられたデータとは異なる、ネットワー
ク構造の一部が変異したネットワーク構造から生成でき
る他のデータを用いて、前記第1記憶手段に格納された
候補トリプレットから適切な候補トリプレットを絞り込
み、第2記憶手段に格納するステップとを備えることを
特徴とする。
【0007】前記候補トリプレットを第1記憶手段に格
納するステップの前記適応度を利用した最適化は、作成
したネットワーク構造からN個を選択して、各々に最適
化したパラメータ・セットをM個適合してN×M個のト
リプレットを作成し、さらに、該N個のネットワーク構
造から新たなN個のネットワーク構造を生成して、各々
に最適化したパラメータ・セットをM個適合してN×M
個のトリプレットを作成し、作成した2N×M個のトリ
プレットから適応度の高いP個のトリプレットを選択す
ることもできる。前記候補トリプレットを第1記憶手段
に格納するステップの前記適応度を利用した最適化は、
さらに、前記P個のトリプレットの近傍を探索して、よ
り適合度の高いトリプレットを見つけて置き換えること
もできる。このように広域探索をしたり、さらに局所探
索をハイブリッドで用いることにより、効率的に最適な
トリプレットを選択することができる。前記候補トリプ
レットを第1記憶手段に格納するステップの前記適応度
を利用した最適化は、遺伝的アルゴリズム(GA)、シ
ミュレーテッド・アニーリング(SA)、及び/又は、
山登り法を用いることができる。これにより、与えられ
たデータを再現するための、ネットワーク構造に対する
最適なパラメータを早く推定することができる。このよ
うにして、最終的に、効率的に比較的少数の最適化され
た候補トリプレットを得ることができる。上述のネット
ワーク推定方法を実行する装置および、上述のネットワ
ーク推定方法をコンピュータ・システムに実現させるこ
とができるプログラムを格納した記録媒体も本発明であ
る。
納するステップの前記適応度を利用した最適化は、作成
したネットワーク構造からN個を選択して、各々に最適
化したパラメータ・セットをM個適合してN×M個のト
リプレットを作成し、さらに、該N個のネットワーク構
造から新たなN個のネットワーク構造を生成して、各々
に最適化したパラメータ・セットをM個適合してN×M
個のトリプレットを作成し、作成した2N×M個のトリ
プレットから適応度の高いP個のトリプレットを選択す
ることもできる。前記候補トリプレットを第1記憶手段
に格納するステップの前記適応度を利用した最適化は、
さらに、前記P個のトリプレットの近傍を探索して、よ
り適合度の高いトリプレットを見つけて置き換えること
もできる。このように広域探索をしたり、さらに局所探
索をハイブリッドで用いることにより、効率的に最適な
トリプレットを選択することができる。前記候補トリプ
レットを第1記憶手段に格納するステップの前記適応度
を利用した最適化は、遺伝的アルゴリズム(GA)、シ
ミュレーテッド・アニーリング(SA)、及び/又は、
山登り法を用いることができる。これにより、与えられ
たデータを再現するための、ネットワーク構造に対する
最適なパラメータを早く推定することができる。このよ
うにして、最終的に、効率的に比較的少数の最適化され
た候補トリプレットを得ることができる。上述のネット
ワーク推定方法を実行する装置および、上述のネットワ
ーク推定方法をコンピュータ・システムに実現させるこ
とができるプログラムを格納した記録媒体も本発明であ
る。
【0008】
【0009】
【0010】
【発明の実施の形態】本発明の実施形態を、図面を参照
して詳細に説明する。本発明は、例えば、特定の生物学
的現象における遺伝子の発現データ、タンパク質の濃度
データ等のプロファイルから、その現象を引き起こして
いる遺伝子の制御ネットワークや、酵素やタンパク質の
反応を示す代謝ネットワークの構造と反応の強さや速度
などを決定するいろいろな変数を推定する場合に適用す
ることができる。この場合を例に以下説明する。
して詳細に説明する。本発明は、例えば、特定の生物学
的現象における遺伝子の発現データ、タンパク質の濃度
データ等のプロファイルから、その現象を引き起こして
いる遺伝子の制御ネットワークや、酵素やタンパク質の
反応を示す代謝ネットワークの構造と反応の強さや速度
などを決定するいろいろな変数を推定する場合に適用す
ることができる。この場合を例に以下説明する。
【0011】(遺伝子ネットワーク)本発明の実施形態
を、図2に示すような遺伝子の相互関係を示しているネ
ットワークを例に説明する。図2(a)は、遺伝子をノ
ードとして、その遺伝子が発現する物質等の発現に対し
て活性を示す関係と、抑制を示す関係を示している。そ
れをネットワーク構造として図示したものが図2(b)
である。さて、与えられたターゲット・プロファイル
(発現プロファイル)に対する遺伝子のネットワーク
は、構成要素(DNA,RNA,タンパク質等)間の反
応関係を示すネットワーク構造(トポロジー)、ネット
ワーク内部での反応や状態のモデルを記述する際に必要
な変数の集合であるパラメータ・セット、および、ター
ゲット・プロファイルとの類似度を示す適応度の3つを
単位とした、「トリプレット」で表すことができる。
を、図2に示すような遺伝子の相互関係を示しているネ
ットワークを例に説明する。図2(a)は、遺伝子をノ
ードとして、その遺伝子が発現する物質等の発現に対し
て活性を示す関係と、抑制を示す関係を示している。そ
れをネットワーク構造として図示したものが図2(b)
である。さて、与えられたターゲット・プロファイル
(発現プロファイル)に対する遺伝子のネットワーク
は、構成要素(DNA,RNA,タンパク質等)間の反
応関係を示すネットワーク構造(トポロジー)、ネット
ワーク内部での反応や状態のモデルを記述する際に必要
な変数の集合であるパラメータ・セット、および、ター
ゲット・プロファイルとの類似度を示す適応度の3つを
単位とした、「トリプレット」で表すことができる。
【0012】まず、遺伝子のネットワーク構造の例につ
いて説明する。構成要素(ノード)間の反応規則は、簡
単化すると、N×Nの結合重み行列W(パラメータ・セ
ット)および結合行列C(ネットワーク構造)で表現さ
れる。結合重み行列Wの値wは、例えば、+1.0と−
1.0の間の実数をとる。wの負の値は抑制を示し、正
の値は活性を示す。結合行列Cでは、要素cpqの0と1
の2値で、ノードpとノードqの間の結合関係を示す。
0はノード間に結合関係がないことを意味し、1は結合
関係があることを示す。また、Nノードを有する遺伝子
ネットワーク構造のある時間tにおける発現状態は、N
次元空間のベクトルx(t)で表現することができる。
ベクトルxの各要素は、xi(t)(i=1,…,N)
で表される。そして、Si(t)を、要素i(i=1,
…,N)の発現型の濃度であり、hiを活性要素iの活
性レベルを決定するしきい値であるとすると、各要素
は、例えば、次のように定義することができる。この関
数は、様々に定義することが可能である。
いて説明する。構成要素(ノード)間の反応規則は、簡
単化すると、N×Nの結合重み行列W(パラメータ・セ
ット)および結合行列C(ネットワーク構造)で表現さ
れる。結合重み行列Wの値wは、例えば、+1.0と−
1.0の間の実数をとる。wの負の値は抑制を示し、正
の値は活性を示す。結合行列Cでは、要素cpqの0と1
の2値で、ノードpとノードqの間の結合関係を示す。
0はノード間に結合関係がないことを意味し、1は結合
関係があることを示す。また、Nノードを有する遺伝子
ネットワーク構造のある時間tにおける発現状態は、N
次元空間のベクトルx(t)で表現することができる。
ベクトルxの各要素は、xi(t)(i=1,…,N)
で表される。そして、Si(t)を、要素i(i=1,
…,N)の発現型の濃度であり、hiを活性要素iの活
性レベルを決定するしきい値であるとすると、各要素
は、例えば、次のように定義することができる。この関
数は、様々に定義することが可能である。
【数1】
【0013】(実施形態の処理の概略)このような遺伝
子ネットワークの場合は、複数の発現物質の濃度の時間
的変化で示される発現プロファイルが与えられて、この
発現プロファイルを発現する遺伝子ネットワークの候補
を探し出すことが本発明の目的である。例えば、図3
(a)に示すような発現プロファイルを与えて、図3
(b)に示すような遺伝子ネットワークの候補を探し出
すのである。なお、この図3(a)に示した発現プロフ
ァイルは、野生型の遺伝子構造に対する発現プロファイ
ルである。最初に用いる発現プロファイルは、これに示
されるような野生型であることが望ましい。ネットワー
クの結合(リンク)部分の数字は、上述における結合重
み行列Wの値wの絶対値を示している。なお、結合重み
行列Wの値wの符号は、結合の活性か抑制かにより正負
が決められる。また、遺伝子Bがない突然変異(ミュー
タント)のプロファイル、遺伝子Cのない突然変異(ミ
ュータント)のプロファイルがそれぞれ図3(c)、図
3(d)に示されている。このプロファイルの用いられ
方については後で説明する。
子ネットワークの場合は、複数の発現物質の濃度の時間
的変化で示される発現プロファイルが与えられて、この
発現プロファイルを発現する遺伝子ネットワークの候補
を探し出すことが本発明の目的である。例えば、図3
(a)に示すような発現プロファイルを与えて、図3
(b)に示すような遺伝子ネットワークの候補を探し出
すのである。なお、この図3(a)に示した発現プロフ
ァイルは、野生型の遺伝子構造に対する発現プロファイ
ルである。最初に用いる発現プロファイルは、これに示
されるような野生型であることが望ましい。ネットワー
クの結合(リンク)部分の数字は、上述における結合重
み行列Wの値wの絶対値を示している。なお、結合重み
行列Wの値wの符号は、結合の活性か抑制かにより正負
が決められる。また、遺伝子Bがない突然変異(ミュー
タント)のプロファイル、遺伝子Cのない突然変異(ミ
ュータント)のプロファイルがそれぞれ図3(c)、図
3(d)に示されている。このプロファイルの用いられ
方については後で説明する。
【0014】本実施形態は、図4の概略フローチャート
に示すようなプロセスにより行われる。図4において、
まず、対象である発現プロファイルを実現することがで
きるネットワークの構造を想定し、そのネットワーク構
造(トポロジー)を生成して、トポロジー・プール30
0を作成する(S102)。想定されるネットワーク構
造の数が少ない場合は、想定される全てのネットワーク
構造を生成して、トポロジー・プール300に格納する
ことができるが、想定されるネットワーク構造の数が多
い場合は、トポロジー・プール300に格納するトポロ
ジーに対して何らかの制限を設ける必要がある。なお、
必ずしも、トポロジー・プール300にトポロジーを生
成して格納する必要はない。想定されるネットワーク構
造により構成されるトポロジー空間を定義することがで
きれば、この定義されたトポロジー空間から任意のトポ
ロジーを生成するアルゴリズムを用いることにより、ト
ポロジー・プール300からトポロジーを取り出すのと
同様のことができる。
に示すようなプロセスにより行われる。図4において、
まず、対象である発現プロファイルを実現することがで
きるネットワークの構造を想定し、そのネットワーク構
造(トポロジー)を生成して、トポロジー・プール30
0を作成する(S102)。想定されるネットワーク構
造の数が少ない場合は、想定される全てのネットワーク
構造を生成して、トポロジー・プール300に格納する
ことができるが、想定されるネットワーク構造の数が多
い場合は、トポロジー・プール300に格納するトポロ
ジーに対して何らかの制限を設ける必要がある。なお、
必ずしも、トポロジー・プール300にトポロジーを生
成して格納する必要はない。想定されるネットワーク構
造により構成されるトポロジー空間を定義することがで
きれば、この定義されたトポロジー空間から任意のトポ
ロジーを生成するアルゴリズムを用いることにより、ト
ポロジー・プール300からトポロジーを取り出すのと
同様のことができる。
【0015】生成したトポロジーのそれぞれに、発現プ
ロファイルからのパラメータを適応度を利用して適合さ
せる(S104)。パラメータは、上述の結合重み行列
Wの値としきい値である。また、適応度は、このパラメ
ータの確からしさ(どれだけ合致しているか)である。
この適応度は、評価関数を用いて計算されるが、例え
ば、この評価関数として最小自乗誤差などがある。
ロファイルからのパラメータを適応度を利用して適合さ
せる(S104)。パラメータは、上述の結合重み行列
Wの値としきい値である。また、適応度は、このパラメ
ータの確からしさ(どれだけ合致しているか)である。
この適応度は、評価関数を用いて計算されるが、例え
ば、この評価関数として最小自乗誤差などがある。
【0016】ネットワーク構造(トポロジー)に対し
て、パラメータと適応度を組み合わせられたものは、前
述したように、トリプレット(トポロジー、パラメー
タ、適応度の3点セット)という。処理結果のトリプレ
ットをトリプレット・プール400に格納する。トポロ
ジーを選択してパラメータを適合させ、適応度を算出す
るときに、GA(遺伝的アルゴリズム)やSA(シミュ
レーテッド・アニーリング:焼きなまし法)等の手法を
用いて、与えられている発現プロファイルに対して最適
化する。
て、パラメータと適応度を組み合わせられたものは、前
述したように、トリプレット(トポロジー、パラメー
タ、適応度の3点セット)という。処理結果のトリプレ
ットをトリプレット・プール400に格納する。トポロ
ジーを選択してパラメータを適合させ、適応度を算出す
るときに、GA(遺伝的アルゴリズム)やSA(シミュ
レーテッド・アニーリング:焼きなまし法)等の手法を
用いて、与えられている発現プロファイルに対して最適
化する。
【0017】ここまでは、処理対象である標本(トリプ
レット)を抽出する段階である。これから、目的に適合
した標本(トリプレット)をトリプレット・プール40
0から絞り込む段階となる。この処理には、例えば、突
然変異アナリシスを用いている(S106)。この処理
により、標本(トリプレット)が絞り込まれて、目的と
する候補トリプレットの集合(候補トリプレット・プー
ル500)ができる。
レット)を抽出する段階である。これから、目的に適合
した標本(トリプレット)をトリプレット・プール40
0から絞り込む段階となる。この処理には、例えば、突
然変異アナリシスを用いている(S106)。この処理
により、標本(トリプレット)が絞り込まれて、目的と
する候補トリプレットの集合(候補トリプレット・プー
ル500)ができる。
【0018】(ネットワーク抽出過程)ネットワーク構
造の生成(S102)の処理は、例えば、最大でいくつ
のノードを含むネットワークを想定するか定める。その
ネットワークの構造を、予備知識無しから生成するか、
部分的にその構造が分かっているネットワークを基に生
成する。生成したネットワークをトポロジー・プール3
00に格納する。この場合に用いられるネットワークの
分かっている構造には、例えば、ファンアウトの制限が
ある。これを説明するのが図5である。ファンアウトと
は、ノードから他のノードへの働きかけ(活性、抑制)
の数である。図5(a)は、AからB〜Eへ、4個のフ
ァンアウトがあることを示している。このファンアウト
の数には制約があると考えられ、この制約は、図5
(b)に示す例のように、確率で示されている。図5
(b)では、ファンアウトの数の確率は、2付近で極大
となり、5以上のファンアウトの数の確率は無視できる
程度であることを示している。なお、この制約も様々に
定義することが可能である。また、すでに同定されてい
る結合や未結合が分かっている場合は、その結合以外の
部分に対してネットワーク構造を発生させる。ネットワ
ーク構造を発生させるときに、ある部分の結合構造を仮
定して、発生させることも可能である。このような色々
な構造に対する制約的な規則を適用して、トポロジーを
作成することもできる。
造の生成(S102)の処理は、例えば、最大でいくつ
のノードを含むネットワークを想定するか定める。その
ネットワークの構造を、予備知識無しから生成するか、
部分的にその構造が分かっているネットワークを基に生
成する。生成したネットワークをトポロジー・プール3
00に格納する。この場合に用いられるネットワークの
分かっている構造には、例えば、ファンアウトの制限が
ある。これを説明するのが図5である。ファンアウトと
は、ノードから他のノードへの働きかけ(活性、抑制)
の数である。図5(a)は、AからB〜Eへ、4個のフ
ァンアウトがあることを示している。このファンアウト
の数には制約があると考えられ、この制約は、図5
(b)に示す例のように、確率で示されている。図5
(b)では、ファンアウトの数の確率は、2付近で極大
となり、5以上のファンアウトの数の確率は無視できる
程度であることを示している。なお、この制約も様々に
定義することが可能である。また、すでに同定されてい
る結合や未結合が分かっている場合は、その結合以外の
部分に対してネットワーク構造を発生させる。ネットワ
ーク構造を発生させるときに、ある部分の結合構造を仮
定して、発生させることも可能である。このような色々
な構造に対する制約的な規則を適用して、トポロジーを
作成することもできる。
【0019】トポロジー・プール300に格納されてい
るネットワーク構造(トポロジー)の全てにパラメータ
や適応度を適合して、トリプレット・プール400に格
納するか、抽出して格納するかは、生成され得るネット
ワークの数による。生成され得るネットワークの数が少
ないとき、すなわち、ネットワークのノードの数が少な
い場合は、あり得る全てのネットワークを網羅的に処理
することが可能であるので、生成されたトポロジーに全
てパラメータおよび適応度を適合させてトリプレット・
プール400に格納する。しかし、生成されるネットワ
ークの数が膨大で、全数を検討することができない場合
は、トポロジーを選択してパラメータや適応度を割り当
て、トリプレット・プール400に格納する。
るネットワーク構造(トポロジー)の全てにパラメータ
や適応度を適合して、トリプレット・プール400に格
納するか、抽出して格納するかは、生成され得るネット
ワークの数による。生成され得るネットワークの数が少
ないとき、すなわち、ネットワークのノードの数が少な
い場合は、あり得る全てのネットワークを網羅的に処理
することが可能であるので、生成されたトポロジーに全
てパラメータおよび適応度を適合させてトリプレット・
プール400に格納する。しかし、生成されるネットワ
ークの数が膨大で、全数を検討することができない場合
は、トポロジーを選択してパラメータや適応度を割り当
て、トリプレット・プール400に格納する。
【0020】(トポロジーが多数存在する場合)さて、
トポロジーの数が膨大で、トポロジーの選択が必要な場
合における処理を、図6のフローチャートと図7および
図8を用いて、もっと詳しく説明する。図7および図6
のフローチャートを参照する。まず、最初にいくつのト
ポロジーを選択するか定める。この場合は、N個のトポ
ロジーをランダムに選択するとする。そして、図4のト
ポロジー・プール300(又は、トポロジー空間)か
ら、ランダムに1つトポロジーを取り出す(S20
2)。これに対して、与えられた発現プロファイルを実
現できる発現パラメータを、GA(遺伝的アルゴリズ
ム)/SA(シミュレーティド・アニーリング)などを
用いて適合させる(S204)。このとき、各発現パラ
メータによる発現プロファイルとの適応度の高いものか
ら、異なるパラメータ・セットをM個とり、トリプレッ
ト・プール400に格納する。これをN個のトポロジー
について繰り返す。繰り返しにおいて、ランダムにトポ
ロジーを選択するとき(S202)、前に選択したトポ
ロジーとは異なる構造のものを選択する。繰り返しが終
了した段階(S206でYES)では、N×Mのトリプ
レットがトリプレット・プール400に格納されてい
る。なお、上述では、ランダムにトポロジーを選択して
いるが、他の確率的サンプリングを用いてもよい。ま
た、異なるパラメータ・セットをM個とるとき、パラメ
ータ・セット同士の類似度を計算して、その類似度が極
めて近いとき(あるしきい値より小さいとき)は、同じ
として選択しないようにしてもよい。これは、同じよう
な解の近傍を複数選択しても意味が無いことが多いの
で、代表値のみを選択していることを意味している。
トポロジーの数が膨大で、トポロジーの選択が必要な場
合における処理を、図6のフローチャートと図7および
図8を用いて、もっと詳しく説明する。図7および図6
のフローチャートを参照する。まず、最初にいくつのト
ポロジーを選択するか定める。この場合は、N個のトポ
ロジーをランダムに選択するとする。そして、図4のト
ポロジー・プール300(又は、トポロジー空間)か
ら、ランダムに1つトポロジーを取り出す(S20
2)。これに対して、与えられた発現プロファイルを実
現できる発現パラメータを、GA(遺伝的アルゴリズ
ム)/SA(シミュレーティド・アニーリング)などを
用いて適合させる(S204)。このとき、各発現パラ
メータによる発現プロファイルとの適応度の高いものか
ら、異なるパラメータ・セットをM個とり、トリプレッ
ト・プール400に格納する。これをN個のトポロジー
について繰り返す。繰り返しにおいて、ランダムにトポ
ロジーを選択するとき(S202)、前に選択したトポ
ロジーとは異なる構造のものを選択する。繰り返しが終
了した段階(S206でYES)では、N×Mのトリプ
レットがトリプレット・プール400に格納されてい
る。なお、上述では、ランダムにトポロジーを選択して
いるが、他の確率的サンプリングを用いてもよい。ま
た、異なるパラメータ・セットをM個とるとき、パラメ
ータ・セット同士の類似度を計算して、その類似度が極
めて近いとき(あるしきい値より小さいとき)は、同じ
として選択しないようにしてもよい。これは、同じよう
な解の近傍を複数選択しても意味が無いことが多いの
で、代表値のみを選択していることを意味している。
【0021】次に、トリプレット・プール400に格納
されているN個のトリプレットのトポロジー組みかえを
したN個のネットワーク構造(トポロジー)をGA/S
A等により得る(S208)。これらのN+1〜2Nの
得られた各トポロジーに対して、上述と同様に、パラメ
ータ・セットをGA/SAにより適合させ、発現プロフ
ァイルとの適応度の高いものをM個残して、トリプレッ
ト・プール400に格納する(S210)。これによ
り、2N×M個のトリプレットがトリプレット・プール
400に格納されることになる。この2N×M個のトリ
プレットから、適応度が高いものから所定のしきい値以
下の値を有するP個を選択してトリプレット・プール4
00に残す(S212)。これで、トリプレット・プー
ル400に格納されているトリプレットはP個となっ
た。ここまでの処理は、トリプレットに対する広域探索
である。
されているN個のトリプレットのトポロジー組みかえを
したN個のネットワーク構造(トポロジー)をGA/S
A等により得る(S208)。これらのN+1〜2Nの
得られた各トポロジーに対して、上述と同様に、パラメ
ータ・セットをGA/SAにより適合させ、発現プロフ
ァイルとの適応度の高いものをM個残して、トリプレッ
ト・プール400に格納する(S210)。これによ
り、2N×M個のトリプレットがトリプレット・プール
400に格納されることになる。この2N×M個のトリ
プレットから、適応度が高いものから所定のしきい値以
下の値を有するP個を選択してトリプレット・プール4
00に残す(S212)。これで、トリプレット・プー
ル400に格納されているトリプレットはP個となっ
た。ここまでの処理は、トリプレットに対する広域探索
である。
【0022】(局所探索)トリプレット・プール400
に格納されているP個のトリプレットの近傍を、例えば
SA(シミュレーテッド・アニーリング)により探索し
て、より適応度の高いトリプレットを探す(S21
4)。これを図示したのが、図8である。図8におい
て、P個の各トリプレットにおけるトポロジー空間のS
Aの対象となる近傍に対して、探索を行っていることを
示している。これにより、より適応度の高いトリプレッ
トを得ることができる。より適応度が高いトリプレット
が見つかった場合は、それもトリプレット・プール40
0に格納する(S216)。これにより、P個以上のト
リプレットがトリプレット・プール400に格納される
ことになる。なお、このとき、より適応度が高いトリプ
レットが、あるトリプレットの近傍に発見された場合、
そのトリプレットに代えて、より適応度が高いトリプレ
ットをトリプレット・プール400に格納することもで
きる。この場合、トリプレット・プール400に格納さ
れているトリプレットの個数は、P個のままである。こ
こで、SAを用いて、近傍の探索を行ったが、他の手
法、例えば山登り法(可能性のある探索点のなかで最も
有望な点を選んで探索を進めていく方法)等により行う
ことが可能である。
に格納されているP個のトリプレットの近傍を、例えば
SA(シミュレーテッド・アニーリング)により探索し
て、より適応度の高いトリプレットを探す(S21
4)。これを図示したのが、図8である。図8におい
て、P個の各トリプレットにおけるトポロジー空間のS
Aの対象となる近傍に対して、探索を行っていることを
示している。これにより、より適応度の高いトリプレッ
トを得ることができる。より適応度が高いトリプレット
が見つかった場合は、それもトリプレット・プール40
0に格納する(S216)。これにより、P個以上のト
リプレットがトリプレット・プール400に格納される
ことになる。なお、このとき、より適応度が高いトリプ
レットが、あるトリプレットの近傍に発見された場合、
そのトリプレットに代えて、より適応度が高いトリプレ
ットをトリプレット・プール400に格納することもで
きる。この場合、トリプレット・プール400に格納さ
れているトリプレットの個数は、P個のままである。こ
こで、SAを用いて、近傍の探索を行ったが、他の手
法、例えば山登り法(可能性のある探索点のなかで最も
有望な点を選んで探索を進めていく方法)等により行う
ことが可能である。
【0023】このようにして、トリプレット・プール4
00に格納されているトリプレットの適応度を高めてい
るので、サンプリング段階を終了した時点で、トリプレ
ット・プール400に格納されているトリプレット中
に、目的とするトリプレットが入っていることが、高い
確率であり得る。しかし、この段階のトリプレットの数
は、まだ、これに対して生物学的な実験を行うのに、十
分には小さくない。
00に格納されているトリプレットの適応度を高めてい
るので、サンプリング段階を終了した時点で、トリプレ
ット・プール400に格納されているトリプレット中
に、目的とするトリプレットが入っていることが、高い
確率であり得る。しかし、この段階のトリプレットの数
は、まだ、これに対して生物学的な実験を行うのに、十
分には小さくない。
【0024】(絞り込み過程)次に、トリプレット・プ
ール400に格納されているトリップレットから、より
少数の候補トリプレットを選別する処理の段階である。
この処理を、突然変異分析を用いて行っている図9およ
び図10を例として説明する。図9において、トリプレ
ット・プール400から各トリプレットに対して、ミュ
ータント(突然変異)・トリプレットを作成する(S4
02)。この場合のミュータント・トリプレットは、あ
る遺伝子を除去(ノックアウト)して、その遺伝子から
の結合を全て取り去ることで作成している。このとき、
トリプレットにおけるその他の結合や、パラメータは変
化させない。これを遺伝子(ネットワーク構造のノー
ド)に対して行う。したがって、トリプレットのトポロ
ジーにおけるノードのうち、x個の遺伝子のそれぞれの
ノードをノックアウトすると、ミュータント・トリプレ
ットをそれぞれ格納したミュータント・プール452〜
456はx個できる。そして、与えられたそれぞれのタ
ーゲット・データである突然変異プロファイルとの間の
適応度を各ミュータント・プールごとに評価する(S4
04)。そして、各ミュータント・プールごとに評価し
た適応度を統合して、最終的に、ある値以上の適応度を
有する候補群を選出して、候補トリプレット・プール5
00に格納する(S406)。この場合、適応度によ
り、得られた候補トリプレットをソートしておいて、そ
の適応度を参照して、高い順に生物学的な実験を行って
もよい。ここで用いる突然変異としては、上述のノック
アウトの他に、例えば、ヘテロザイゴート(Heterozygo
te),過剰発現(over expression)、温度感受性突然変異
(temperature sensitive mutation)等があり、いずれも
使用可能である。例えば、へテロザイゴートは、相同染
色体の特定の遺伝子座においての一方の対立遺伝子をつ
ぶしてしまうことにより、全体としてその遺伝子の発現
量が例えば半分などに減少してしまう突然変異である。
また、過剰発現は、ある遺伝子について過剰に発現して
しまう突然変異である。温度感受性突然変異は、温度感
受性のある物質を用いて、計測中のある時点で遺伝子の
発現を止めてしまう、又は、過剰に発現させる突然変異
である。
ール400に格納されているトリップレットから、より
少数の候補トリプレットを選別する処理の段階である。
この処理を、突然変異分析を用いて行っている図9およ
び図10を例として説明する。図9において、トリプレ
ット・プール400から各トリプレットに対して、ミュ
ータント(突然変異)・トリプレットを作成する(S4
02)。この場合のミュータント・トリプレットは、あ
る遺伝子を除去(ノックアウト)して、その遺伝子から
の結合を全て取り去ることで作成している。このとき、
トリプレットにおけるその他の結合や、パラメータは変
化させない。これを遺伝子(ネットワーク構造のノー
ド)に対して行う。したがって、トリプレットのトポロ
ジーにおけるノードのうち、x個の遺伝子のそれぞれの
ノードをノックアウトすると、ミュータント・トリプレ
ットをそれぞれ格納したミュータント・プール452〜
456はx個できる。そして、与えられたそれぞれのタ
ーゲット・データである突然変異プロファイルとの間の
適応度を各ミュータント・プールごとに評価する(S4
04)。そして、各ミュータント・プールごとに評価し
た適応度を統合して、最終的に、ある値以上の適応度を
有する候補群を選出して、候補トリプレット・プール5
00に格納する(S406)。この場合、適応度によ
り、得られた候補トリプレットをソートしておいて、そ
の適応度を参照して、高い順に生物学的な実験を行って
もよい。ここで用いる突然変異としては、上述のノック
アウトの他に、例えば、ヘテロザイゴート(Heterozygo
te),過剰発現(over expression)、温度感受性突然変異
(temperature sensitive mutation)等があり、いずれも
使用可能である。例えば、へテロザイゴートは、相同染
色体の特定の遺伝子座においての一方の対立遺伝子をつ
ぶしてしまうことにより、全体としてその遺伝子の発現
量が例えば半分などに減少してしまう突然変異である。
また、過剰発現は、ある遺伝子について過剰に発現して
しまう突然変異である。温度感受性突然変異は、温度感
受性のある物質を用いて、計測中のある時点で遺伝子の
発現を止めてしまう、又は、過剰に発現させる突然変異
である。
【0025】(適応度の統合の計算例)この適応度の統
合の計算例について、図10を用いて説明する。図10
では、全ての突然変異ごと(突然変異ではない野生型も
含む)の各トポロジーごとの適応度を合計したものを、
そのトポロジーの適応度として取り扱う例を示してい
る。この計算例では単純な合計をしているが、必要に応
じて、突然変異ごとに重み付けて加重加算等を行っても
よい。なお、突然変異の発現プロファイルは、対象の全
ての突然変異遺伝子ネットワークに対して得られている
とは限らない。この場合は、得られている突然変異の発
現プロファイルのみを用いて、適応度の算出および統合
を行う。このようにして、最終的に、候補トリプレット
を得ることができる。
合の計算例について、図10を用いて説明する。図10
では、全ての突然変異ごと(突然変異ではない野生型も
含む)の各トポロジーごとの適応度を合計したものを、
そのトポロジーの適応度として取り扱う例を示してい
る。この計算例では単純な合計をしているが、必要に応
じて、突然変異ごとに重み付けて加重加算等を行っても
よい。なお、突然変異の発現プロファイルは、対象の全
ての突然変異遺伝子ネットワークに対して得られている
とは限らない。この場合は、得られている突然変異の発
現プロファイルのみを用いて、適応度の算出および統合
を行う。このようにして、最終的に、候補トリプレット
を得ることができる。
【0026】(実施例)具体的な遺伝子のトリプレット
を例に、上述の処理を詳しく説明する。ここでは、図3
(a)に示したような時系列データである発現プロファ
イルを実現する遺伝子のネットワークを例とする。ま
ず、トポロジーの結合関係を示す結合行列をもとに染色
体にコーディングを行う。ここでは、図3(a)に示し
た発現物質が3つであるので、ノードが3つあるネット
ワークのトポロジーとしては、例えば、以下のような結
合行列Cで表される。これは、図3(b)に示されてい
るものである。
を例に、上述の処理を詳しく説明する。ここでは、図3
(a)に示したような時系列データである発現プロファ
イルを実現する遺伝子のネットワークを例とする。ま
ず、トポロジーの結合関係を示す結合行列をもとに染色
体にコーディングを行う。ここでは、図3(a)に示し
た発現物質が3つであるので、ノードが3つあるネット
ワークのトポロジーとしては、例えば、以下のような結
合行列Cで表される。これは、図3(b)に示されてい
るものである。
【数2】
【0027】このトポロジーの結合は4カ所あり、各々
に対する重み付けをする必要があるので、4つの遺伝子
型(genotype)を持つ染色体を生成する。さらに各ノー
ドのしきい値も最適化する必要があるので、結局、全体
として4(結合数)+3(ノードのしきい値数)で7の
遺伝子型を持つ染色体を生成することになる。この場合
の染色体の荷重およびしきい値の取りうる範囲(実数
値)は、図11(a)のようになる。このような図3
(a)に示す発現プロファイルを実現可能な複数のトポ
ロジーを発生して、トポロジー・プール300(図4)
に格納する。この発生した各トポロジーに対して、GA
を用いてパラメータ(荷重およびしきい値)の最適化を
行う。まず、トポロジーに対して決められた範囲のパラ
メータをN組ランダムに発生させ、染色体の初期集団と
する。図11(b)に、上述の結合行列で定められたト
ポロジーに対する初期集団を示す。このように、トポロ
ジーに対して、リストの形で染色体が定まる。この初期
集団に対してGAを適用することにより、最適化を行う
のである。この最適化の指標として、各パラメータの適
応度を用いる。
に対する重み付けをする必要があるので、4つの遺伝子
型(genotype)を持つ染色体を生成する。さらに各ノー
ドのしきい値も最適化する必要があるので、結局、全体
として4(結合数)+3(ノードのしきい値数)で7の
遺伝子型を持つ染色体を生成することになる。この場合
の染色体の荷重およびしきい値の取りうる範囲(実数
値)は、図11(a)のようになる。このような図3
(a)に示す発現プロファイルを実現可能な複数のトポ
ロジーを発生して、トポロジー・プール300(図4)
に格納する。この発生した各トポロジーに対して、GA
を用いてパラメータ(荷重およびしきい値)の最適化を
行う。まず、トポロジーに対して決められた範囲のパラ
メータをN組ランダムに発生させ、染色体の初期集団と
する。図11(b)に、上述の結合行列で定められたト
ポロジーに対する初期集団を示す。このように、トポロ
ジーに対して、リストの形で染色体が定まる。この初期
集団に対してGAを適用することにより、最適化を行う
のである。この最適化の指標として、各パラメータの適
応度を用いる。
【0028】初期集団の適応度は、染色体のパラメータ
をもとに、各個体で発現プロファイルを生成し、ターゲ
ット・プロファイルとの間で、例えば最小自乗誤差TS
S(Total Sum Square error)の処理を行うことにより
求める。この最小自乗誤差TSSは、以下の計算を行
う。図3(a)に示すように、ターゲット・プロファイ
ルが濃度の時系列データとして与えられている。このた
め、各発現物質A,B,Cそれぞれのある時間tにおけ
る濃度はLTA(t),LTB(t),LTC(t)と表さ
れ、生成した染色体の各パラメータをもとに、上述の式
(1)により計算される各発現物質の濃度は、L
EA(t),LEB(t),LEC(t)と表すことができ
る。これらの間の最小自乗誤差TSSは次のようにあら
わすことができる。
をもとに、各個体で発現プロファイルを生成し、ターゲ
ット・プロファイルとの間で、例えば最小自乗誤差TS
S(Total Sum Square error)の処理を行うことにより
求める。この最小自乗誤差TSSは、以下の計算を行
う。図3(a)に示すように、ターゲット・プロファイ
ルが濃度の時系列データとして与えられている。このた
め、各発現物質A,B,Cそれぞれのある時間tにおけ
る濃度はLTA(t),LTB(t),LTC(t)と表さ
れ、生成した染色体の各パラメータをもとに、上述の式
(1)により計算される各発現物質の濃度は、L
EA(t),LEB(t),LEC(t)と表すことができ
る。これらの間の最小自乗誤差TSSは次のようにあら
わすことができる。
【数3】
このようにして求めた最小自乗誤差TSSを各発生した
ネットワーク(染色体)の適応度とする。
ネットワーク(染色体)の適応度とする。
【0029】さて、このように求められる適応度を利用
することにより、GAを用いてトポロジー毎にパラメー
タ(結合荷重としきい値)の最適化を行うことができ
る。この処理について、図12,図13を用いて、GA
のクロスオーバと突然変異を用いて最適化を行っている
例で説明する。
することにより、GAを用いてトポロジー毎にパラメー
タ(結合荷重としきい値)の最適化を行うことができ
る。この処理について、図12,図13を用いて、GA
のクロスオーバと突然変異を用いて最適化を行っている
例で説明する。
【0030】図12(a)で示されているように、トポ
ロジーのパラメータは、結合荷重としきい値のリストで
表されている。まず、親となる個体対の決定を、例えば
トーナメント戦略を用いて行う。これは、トーナメント
・サイズの数の個体(例えば2)をランダムに選択す
る。この選択した個体の中から一番適応度が高い個体を
一方の親とする。これをもう一度行うことにより、親と
なる個体対が決定される。この個体対に対して、図12
(b)に示すように、交叉(crossover)を行って子孫
のパラメータを作成し、さらに、突然変異を適用して、
生成したパラメータで適応度を計算する。このような処
理を、例えば、定められた数の子孫が作成されるまで行
うと、第2世代の個体集団が得られる。
ロジーのパラメータは、結合荷重としきい値のリストで
表されている。まず、親となる個体対の決定を、例えば
トーナメント戦略を用いて行う。これは、トーナメント
・サイズの数の個体(例えば2)をランダムに選択す
る。この選択した個体の中から一番適応度が高い個体を
一方の親とする。これをもう一度行うことにより、親と
なる個体対が決定される。この個体対に対して、図12
(b)に示すように、交叉(crossover)を行って子孫
のパラメータを作成し、さらに、突然変異を適用して、
生成したパラメータで適応度を計算する。このような処
理を、例えば、定められた数の子孫が作成されるまで行
うと、第2世代の個体集団が得られる。
【0031】交叉および突然変異の処理を、図13を用
いて具体的に説明する。図13(a)において、リスト
で表された親1および親2のパラメータの矢印で示され
た部分を入れ替えて、子1および子2が作成される。こ
れが交叉の処理である。図13(b)は、子1の丸を付
けられたパラメータの1つ(結合荷重0.4)が、別の
値(結合荷重0.6)に変化したことが示されている。
この変化が突然変異で、例えば、固定された確率でラン
ダムにおきるように処理される。この交叉と突然変異の
処理を、例えば、決められた世代数分繰り返すことで、
あるトポロジーに対するパラメータを最適化することが
できる。なお、全世代で、エリート保存戦略を適用して
もよい。エリート保存戦略は、集団中で最も適応度の高
い個体を、交叉や突然変異により変化させず、そのまま
次世代に残す手法である。
いて具体的に説明する。図13(a)において、リスト
で表された親1および親2のパラメータの矢印で示され
た部分を入れ替えて、子1および子2が作成される。こ
れが交叉の処理である。図13(b)は、子1の丸を付
けられたパラメータの1つ(結合荷重0.4)が、別の
値(結合荷重0.6)に変化したことが示されている。
この変化が突然変異で、例えば、固定された確率でラン
ダムにおきるように処理される。この交叉と突然変異の
処理を、例えば、決められた世代数分繰り返すことで、
あるトポロジーに対するパラメータを最適化することが
できる。なお、全世代で、エリート保存戦略を適用して
もよい。エリート保存戦略は、集団中で最も適応度の高
い個体を、交叉や突然変異により変化させず、そのまま
次世代に残す手法である。
【0032】以上の処理をすべてのトポロジーに対して
終了したときに、その中で、所定の適応度T+(この例
の場合、最小自乗誤差)以下の適応度を持つトポロジー
のサブグループD+を決定する。このサブグループD
+は、次の式により定義される。
終了したときに、その中で、所定の適応度T+(この例
の場合、最小自乗誤差)以下の適応度を持つトポロジー
のサブグループD+を決定する。このサブグループD
+は、次の式により定義される。
【数4】
抽出されたトポロジー・サブグループのトリプレット
(トポロジー,パラメータ,適応度)を、トリプレット
・プール400へ格納する。なお、この実施例ではトポ
ロジー・プール300に格納されているすべてのトポロ
ジーに対してGAにより最適なパラメータを作成してい
るが、トポロジー・プール300に格納されたトポロジ
ーが莫大な数である場合には、定められた数のトポロジ
ーをランダムに選択して、これに対して最適なパラメー
タをGAにより生成してもよい。ここまでが、トリプレ
ットの広域探索である。
(トポロジー,パラメータ,適応度)を、トリプレット
・プール400へ格納する。なお、この実施例ではトポ
ロジー・プール300に格納されているすべてのトポロ
ジーに対してGAにより最適なパラメータを作成してい
るが、トポロジー・プール300に格納されたトポロジ
ーが莫大な数である場合には、定められた数のトポロジ
ーをランダムに選択して、これに対して最適なパラメー
タをGAにより生成してもよい。ここまでが、トリプレ
ットの広域探索である。
【0033】このトリプレット・プールに格納されてい
るトリプレットに対して、さらに別のGA手法を適用し
て最適化したものを追加する。ここで適応するGAは2
次元GAである。この2次元GAについて図14を用い
て説明する。図14(a)は、結合行列で表した例で、
それを図式化したものを図14(b)に示す。図14
(a)に示すように、親1および親2の結合行列の十字
形で示される部分(即ちBを中心とする結合関係:図1
4(b)参照)を交叉させて、子1および子2を生成す
る。このように、図13(a)で説明したリスト(パラ
メータ)上の交叉とは異なり、ネットワークの物理的な
構造自体に着目して交叉を行っている。このような処理
は、2次元構造の最適化に有用である。2次元GAを適
用して得られたトポロジーに対してパラメータを、GA
を前述と同様に用いることで最適化を行って求める。こ
れを例えば、決められた世代数実行する。そして、上述
と同じように、適応度T+以下であるトリプレットのみ
を、さらにトリプレット・プール400に格納する。こ
の追加して行うGAでもエリート保存戦略を適用するこ
とができる。
るトリプレットに対して、さらに別のGA手法を適用し
て最適化したものを追加する。ここで適応するGAは2
次元GAである。この2次元GAについて図14を用い
て説明する。図14(a)は、結合行列で表した例で、
それを図式化したものを図14(b)に示す。図14
(a)に示すように、親1および親2の結合行列の十字
形で示される部分(即ちBを中心とする結合関係:図1
4(b)参照)を交叉させて、子1および子2を生成す
る。このように、図13(a)で説明したリスト(パラ
メータ)上の交叉とは異なり、ネットワークの物理的な
構造自体に着目して交叉を行っている。このような処理
は、2次元構造の最適化に有用である。2次元GAを適
用して得られたトポロジーに対してパラメータを、GA
を前述と同様に用いることで最適化を行って求める。こ
れを例えば、決められた世代数実行する。そして、上述
と同じように、適応度T+以下であるトリプレットのみ
を、さらにトリプレット・プール400に格納する。こ
の追加して行うGAでもエリート保存戦略を適用するこ
とができる。
【0034】トリプレット・プール400に格納されて
いるトリプレットを対象としてSA(シミュレーティド
・アニーリング)を実行して、各トポロジーの近傍トポ
ロジー空間を探索し、得られたトポロジーに対して、前
と同様にGAにより最適化されたパラメータを求める。
この近傍の探索を行うのは、GAが局所的な探索能力に
劣っているためである。ここで用いているSAの基本ア
ルゴリズムは、疑似コードを用いると、以下のようにな
る。これは、各トポロジーに対して適用される部分であ
る。 上述のACCEPT(E, E', T)中のEは、SAではエネルギー
と呼ばれる状態を規定する変数で、この場合は、各ネッ
トワークの適応度を使用している。E’は、「次の状態
生成()」処理で生成されたトリプレットの適応度であ
る。また、Tは、SAのアルゴリズムでは温度パラメー
タで、この場合は、この処理のみで用いられる状態を規
定する変数である。変数Tは、処理が始まるときに、初
期値Tin itに設定される。また、停止条件や平衡条件
は、例えば、処理回数を用いることができる。「ACCEPT
(E, E', T)」, 「REDUCE(T)」は、次のように定義され
る。
いるトリプレットを対象としてSA(シミュレーティド
・アニーリング)を実行して、各トポロジーの近傍トポ
ロジー空間を探索し、得られたトポロジーに対して、前
と同様にGAにより最適化されたパラメータを求める。
この近傍の探索を行うのは、GAが局所的な探索能力に
劣っているためである。ここで用いているSAの基本ア
ルゴリズムは、疑似コードを用いると、以下のようにな
る。これは、各トポロジーに対して適用される部分であ
る。 上述のACCEPT(E, E', T)中のEは、SAではエネルギー
と呼ばれる状態を規定する変数で、この場合は、各ネッ
トワークの適応度を使用している。E’は、「次の状態
生成()」処理で生成されたトリプレットの適応度であ
る。また、Tは、SAのアルゴリズムでは温度パラメー
タで、この場合は、この処理のみで用いられる状態を規
定する変数である。変数Tは、処理が始まるときに、初
期値Tin itに設定される。また、停止条件や平衡条件
は、例えば、処理回数を用いることができる。「ACCEPT
(E, E', T)」, 「REDUCE(T)」は、次のように定義され
る。
【数5】
上述の疑似コードで表される処理を説明する。処理対象
のトポロジーが選択されると、変数TとEとが初期化さ
れる。そして、回数で規定されるループの内側の繰り返
し処理で、まず、「次の状態発生()」という処理を行
う。この「次の状態発生()」は、以下のような処理を
行う。処理対象のトポロジーを基に、結合関係を変化さ
せたトポロジーを発生させる。この変化は、図15
(a)に示した遷移図に基づき、処理対象のトポロジー
を、確率Pにより変化させる。この遷移確率は、上述の
変数Tを用いて、次のように定義される。
のトポロジーが選択されると、変数TとEとが初期化さ
れる。そして、回数で規定されるループの内側の繰り返
し処理で、まず、「次の状態発生()」という処理を行
う。この「次の状態発生()」は、以下のような処理を
行う。処理対象のトポロジーを基に、結合関係を変化さ
せたトポロジーを発生させる。この変化は、図15
(a)に示した遷移図に基づき、処理対象のトポロジー
を、確率Pにより変化させる。この遷移確率は、上述の
変数Tを用いて、次のように定義される。
【数6】
ここで、Tは上述の変数、しきい値Thresholdは、ここ
では例えば、0.5に設定されている。しきい値を導入
した理由は、遷移確率をあまり高くすると、対象とした
トポロジーに対して多数の変化したトポロジーを探索す
ることになり、近傍探索とはならないからである。T
は、外側のループの「REDUCE(T)」で変化するので、内
側のループ内では遷移確率は変化しない。外側のループ
のステップにより、遷移確率がどのように変化するのか
を示したのが、図15(b)である。この場合、γは例
えば、0.8である。トポロジーの変化を図15(c)
に示したトポロジーを例に説明する。これは、図3
(b)のトポロジーと同じものである。なお、遷移確率
を0.5とした場合で説明する。
では例えば、0.5に設定されている。しきい値を導入
した理由は、遷移確率をあまり高くすると、対象とした
トポロジーに対して多数の変化したトポロジーを探索す
ることになり、近傍探索とはならないからである。T
は、外側のループの「REDUCE(T)」で変化するので、内
側のループ内では遷移確率は変化しない。外側のループ
のステップにより、遷移確率がどのように変化するのか
を示したのが、図15(b)である。この場合、γは例
えば、0.8である。トポロジーの変化を図15(c)
に示したトポロジーを例に説明する。これは、図3
(b)のトポロジーと同じものである。なお、遷移確率
を0.5とした場合で説明する。
【0035】図15(c)において、AからAの結合
は、活性化で結合しているので、図15(a)の状態遷
移図では、活性606の状態にある。この状態からは、
未結合604への状態遷移のみが可能である。この状態
遷移が起こる確率は0.5である。次に、AからBへの
結合を見るとこれも活性として結合しているので、同様
に、0.5の確率で、未結合の状態に変化する。Bから
Bへの結合は、未結合なので、抑制と活性とに0.25
づつ(合計で0.5)の確率で遷移する。以下同様に、
すべての結合関係について、図15(a)に示した状態
遷移図と、図15(b)の確率に基づいて、変化させ
る。このようにして、対象のトポロジーを構成する各結
合関係を上述で説明した確率で、各遷移図に従って変化
させた結果得られたトポロジーに対して、次に、前述の
GAを用いて、最適なパラメータを決定し、そのパラメ
ータに対する適応度を計算する。これで新しいトリプレ
ットが作成される。これで「次の状態発生()」は完了
し、次の処理である「ACCEPT(E, E', T)」を実行する。
は、活性化で結合しているので、図15(a)の状態遷
移図では、活性606の状態にある。この状態からは、
未結合604への状態遷移のみが可能である。この状態
遷移が起こる確率は0.5である。次に、AからBへの
結合を見るとこれも活性として結合しているので、同様
に、0.5の確率で、未結合の状態に変化する。Bから
Bへの結合は、未結合なので、抑制と活性とに0.25
づつ(合計で0.5)の確率で遷移する。以下同様に、
すべての結合関係について、図15(a)に示した状態
遷移図と、図15(b)の確率に基づいて、変化させ
る。このようにして、対象のトポロジーを構成する各結
合関係を上述で説明した確率で、各遷移図に従って変化
させた結果得られたトポロジーに対して、次に、前述の
GAを用いて、最適なパラメータを決定し、そのパラメ
ータに対する適応度を計算する。これで新しいトリプレ
ットが作成される。これで「次の状態発生()」は完了
し、次の処理である「ACCEPT(E, E', T)」を実行する。
【0036】この「ACCEPT(E, E', T)」では、処理対象
であるトポロジーを有するトリプレットの適応度(E)
と、発生したトポロジーの適応度(E’)を比較し、発
生させたトポロジーの適応度が低い(より適合してい
る)と、1(真)を返す。また、発生した適応度が高く
ても(適合していなくても)、ある確率で1(真)を返
している。この場合、Tが高い場合(あまり処理回数が
多くないとき)に1(真)を返す確率を多くしている。
「ACCEPT(E, E', T)」は1(真)を返すと、「更
新()」処理が行われて、「次の状態発生()」で発生
したトリプレットに更新する。このようにして、内側の
ループを平衡状態が得られるまで(この場合はある回数
の処理が行われるまで)続ける。所定回数の処理が行わ
れると、外側の処理(「REDUCE(T)」)が行われて、新
しいTが定められ、また、このTを用いて、内側の処理
が行われる。外側の処理も、この場合、例えばある所定
回数行われる。そして、最終的にたどり着いたトリプレ
ットの適応度がT+であると、トリプレット・プールに
入れる。
であるトポロジーを有するトリプレットの適応度(E)
と、発生したトポロジーの適応度(E’)を比較し、発
生させたトポロジーの適応度が低い(より適合してい
る)と、1(真)を返す。また、発生した適応度が高く
ても(適合していなくても)、ある確率で1(真)を返
している。この場合、Tが高い場合(あまり処理回数が
多くないとき)に1(真)を返す確率を多くしている。
「ACCEPT(E, E', T)」は1(真)を返すと、「更
新()」処理が行われて、「次の状態発生()」で発生
したトリプレットに更新する。このようにして、内側の
ループを平衡状態が得られるまで(この場合はある回数
の処理が行われるまで)続ける。所定回数の処理が行わ
れると、外側の処理(「REDUCE(T)」)が行われて、新
しいTが定められ、また、このTを用いて、内側の処理
が行われる。外側の処理も、この場合、例えばある所定
回数行われる。そして、最終的にたどり着いたトリプレ
ットの適応度がT+であると、トリプレット・プールに
入れる。
【0037】上述のようにこの段階終了時では、トリプ
レット・プール400には、各トポロジーの近傍を探索
して、より良い適応度のトリプレットと置き換えられた
ものが格納されている。このトリプレットから、最終的
な候補トリプレットを選択する処理を以下で説明する。
これは、種々の突然変異の発現プロファイルを用いて、
これに対する適応度を計算することにより行う。この処
理を、図16のフローチャートを用いて説明するこれに
は、まず、図3(c)、図3(d)に示されているよう
な、突然変異によるプロファイルを用意する。図3
(c)、図3(d)は、遺伝子Bがない突然変異(ミュ
ータント)のプロファイル、遺伝子Cがない突然変異
(ミュータント)のプロファイルである。そして、それ
ぞれに対応したミュータント・プールを用意し、上述の
トリプレット・プール内の全トリプレットを各ミュータ
ント・プールに格納する(S802)。各ミュータント
・プールに格納されたトリプレットに対して、トリプレ
ットのトポロジーをその突然変異のトポロジーとし、パ
ラメータはそのまま用いて、対応する突然変異のプロフ
ァイルに対する適応度を計算する(S804)。各ミュ
ータント・プールにおけるトリプレットのうち、計算し
た適応度が各突然変異ごとの定めた所定のしきい値以下
であるトリプレットを選択する(S806)。選択した
各ミュータント・プール内のトリプレットで、全部のミ
ュータント・プールに共通するトリプレットであり、か
つ、所定のしきい値以下の適応度を有するものに対応す
るトリプレットを、候補トリプレット・プールへ格納す
る(S808)。これで、適切な候補トリプレットを確
定することができる。
レット・プール400には、各トポロジーの近傍を探索
して、より良い適応度のトリプレットと置き換えられた
ものが格納されている。このトリプレットから、最終的
な候補トリプレットを選択する処理を以下で説明する。
これは、種々の突然変異の発現プロファイルを用いて、
これに対する適応度を計算することにより行う。この処
理を、図16のフローチャートを用いて説明するこれに
は、まず、図3(c)、図3(d)に示されているよう
な、突然変異によるプロファイルを用意する。図3
(c)、図3(d)は、遺伝子Bがない突然変異(ミュ
ータント)のプロファイル、遺伝子Cがない突然変異
(ミュータント)のプロファイルである。そして、それ
ぞれに対応したミュータント・プールを用意し、上述の
トリプレット・プール内の全トリプレットを各ミュータ
ント・プールに格納する(S802)。各ミュータント
・プールに格納されたトリプレットに対して、トリプレ
ットのトポロジーをその突然変異のトポロジーとし、パ
ラメータはそのまま用いて、対応する突然変異のプロフ
ァイルに対する適応度を計算する(S804)。各ミュ
ータント・プールにおけるトリプレットのうち、計算し
た適応度が各突然変異ごとの定めた所定のしきい値以下
であるトリプレットを選択する(S806)。選択した
各ミュータント・プール内のトリプレットで、全部のミ
ュータント・プールに共通するトリプレットであり、か
つ、所定のしきい値以下の適応度を有するものに対応す
るトリプレットを、候補トリプレット・プールへ格納す
る(S808)。これで、適切な候補トリプレットを確
定することができる。
【0038】(他の適用)上述の説明では、遺伝子ネッ
トワークの例で説明したが、例えば遺伝子・代謝回路ネ
ットワークにも適用することが可能である。図17は、
遺伝子・代謝回路のネットワークについて示している。
図17(a)に示すように、遺伝子と、代謝における酵
素、タンパク質をノードとして、活性、抑制、媒介等の
関係をリンクで表す。そして、これを用いたネットワー
ク例を図17(b)に示す。この図17(b)に示した
ようなネットワーク構造に対して、上述で説明した処理
を適用する。上述においては、対象ネットワークとし
て、遺伝子ネットワーク、代謝回路ネットワークを示し
たが、そのほかにも神経回路ネットワーク等に対しても
適用することができる。この場合のデータ(ターゲット
・プロファイル)としては、ニューロン活動電位等を用
いる必要がある。このように、本発明の手法は色々なも
のに対して用いることができる。適用できるターゲット
・プロファイルの色々な例を図18に示す。図18
(a)は、ターゲット・プロファイルが0次元空間デー
タである場合を示している。このデータの例としては、
時間や周波数に対して変化するようなデータである。例
えば、濃度、活性度、電位等がある。図18(b)は、
1次元空間データを示している。データは、空間として
xに、および、時間又は空間に依存する量である。この
量としては、濃度、活性度、電位等がある。図18
(c)および(d)として示したターゲット・プロファ
イルは、2次元空間データおよび3次元空間データであ
る。これは、2次元(x,y)および3次元(x,y,
z)の空間、および、時間又は周波数に依存する量のデ
ータである。この量としては、濃度、活性度、電位等が
ある。図12に示すように、色々なデータ形式で、ター
ゲット・プロファイルを与えることができる。
トワークの例で説明したが、例えば遺伝子・代謝回路ネ
ットワークにも適用することが可能である。図17は、
遺伝子・代謝回路のネットワークについて示している。
図17(a)に示すように、遺伝子と、代謝における酵
素、タンパク質をノードとして、活性、抑制、媒介等の
関係をリンクで表す。そして、これを用いたネットワー
ク例を図17(b)に示す。この図17(b)に示した
ようなネットワーク構造に対して、上述で説明した処理
を適用する。上述においては、対象ネットワークとし
て、遺伝子ネットワーク、代謝回路ネットワークを示し
たが、そのほかにも神経回路ネットワーク等に対しても
適用することができる。この場合のデータ(ターゲット
・プロファイル)としては、ニューロン活動電位等を用
いる必要がある。このように、本発明の手法は色々なも
のに対して用いることができる。適用できるターゲット
・プロファイルの色々な例を図18に示す。図18
(a)は、ターゲット・プロファイルが0次元空間デー
タである場合を示している。このデータの例としては、
時間や周波数に対して変化するようなデータである。例
えば、濃度、活性度、電位等がある。図18(b)は、
1次元空間データを示している。データは、空間として
xに、および、時間又は空間に依存する量である。この
量としては、濃度、活性度、電位等がある。図18
(c)および(d)として示したターゲット・プロファ
イルは、2次元空間データおよび3次元空間データであ
る。これは、2次元(x,y)および3次元(x,y,
z)の空間、および、時間又は周波数に依存する量のデ
ータである。この量としては、濃度、活性度、電位等が
ある。図12に示すように、色々なデータ形式で、ター
ゲット・プロファイルを与えることができる。
【0039】このように、ターゲット・プロファイルが
存在し、そのターゲット・プロファイルを生じるネット
ワーク構成を推定するような場合に、本発明は有効であ
る。本発明は、スタンド・アローンのコンピュータ・シ
ステムばかりではなく、複数のコンピュータから構成さ
れる例えばクライアント・サーバ・システム等に適用し
てもよい。本発明に関するプログラムを格納した記憶媒
体から、プログラムをシステムで読み出して実行するこ
とにより、本発明の構成を実現することができる。この
記録媒体には、DVD、MD、MO、フロッピー・ディ
スク、CD−ROM、磁気テープ、ROMカセット等が
ある。
存在し、そのターゲット・プロファイルを生じるネット
ワーク構成を推定するような場合に、本発明は有効であ
る。本発明は、スタンド・アローンのコンピュータ・シ
ステムばかりではなく、複数のコンピュータから構成さ
れる例えばクライアント・サーバ・システム等に適用し
てもよい。本発明に関するプログラムを格納した記憶媒
体から、プログラムをシステムで読み出して実行するこ
とにより、本発明の構成を実現することができる。この
記録媒体には、DVD、MD、MO、フロッピー・ディ
スク、CD−ROM、磁気テープ、ROMカセット等が
ある。
【発明の効果】上記の説明のように、本発明は、データ
としてターゲット・プロファイルが存在し、そのターゲ
ット・プロファイルを生じるネットワーク構成を推定す
るような場合に、極めて有効である。特に、遺伝子ネッ
トワークや代謝ネットワークのように、分子生物学にお
けるモデルの推定に対して有効に適用することができ
る。
としてターゲット・プロファイルが存在し、そのターゲ
ット・プロファイルを生じるネットワーク構成を推定す
るような場合に、極めて有効である。特に、遺伝子ネッ
トワークや代謝ネットワークのように、分子生物学にお
けるモデルの推定に対して有効に適用することができ
る。
【図1】分子生物学におけるコンピュータ利用を説明す
る図である。
る図である。
【図2】遺伝子ネットワークの例を示す図である。
【図3】発現プロファイルおよびそれに対応するネット
ワークを示す図である。
ワークを示す図である。
【図4】実施形態における処理例の概略フローチャート
である。
である。
【図5】ネットワークのファンアウト制限を説明する図
である。
である。
【図6】選択処理のフローチャートである。
【図7】選択処理の手法を説明するための図である。
【図8】SAによる再探索を説明する図である。
【図9】候補の選別処理を説明する図である。
【図10】適応度の総合処理の例を説明する図である。
【図11】SAを行う場合の表記例および初期集団を示
す図である。
す図である。
【図12】GAの適用例を示す図である。
【図13】具体的にGA処理(交叉と突然変異)を行っ
ている例を示す図である。
ている例を示す図である。
【図14】2次元GAを適用した例を示す図である。
【図15】SAによる近傍探索を説明するための例であ
る。
る。
【図16】突然変異による候補トリプレット選択の処理
を示すフローチャートである。
を示すフローチャートである。
【図17】遺伝子・代謝ネットワークの例を示す図であ
る。
る。
【図18】ターゲット・プロファイルのデータ例を示す
図である。
図である。
─────────────────────────────────────────────────────
フロントページの続き
(73)特許権者 599079344
濱橋 秀互
東京都江東区木場6−8−15 ハウス木
場3C
(72)発明者 北野 宏明
埼玉県川越市西小仙波町2−18−3
(72)発明者 諸橋 峰雄
東京都北区西ケ原1−27−3−1010
(72)発明者 京田 耕司
神奈川県横浜市青葉区奈良町2423−208
(72)発明者 濱橋 秀互
神奈川県川崎市中原区木月1566佐藤ビル
303号室
(56)参考文献 特表2002−518021(JP,A)
特許2881711(JP,B2)
国際公開98/30722(WO,A1)
富永大介、岡本正宏,「逆問題(in
verse problem)解決のた
めの遺伝的アルゴリズムを用いた多次元
非線形数値最適化手法の開発」,化学工
学論文集,日本,社団法人化学工学会,
1999年 3月10日,Vol.25,No.
2,pp.220−225,JST資料番号:
S0110B
篠原歩、竹田正幸、野田清志,「重み
付きネットワークを用いた遺伝子発現ネ
ットワークの発見」,1998年度科学研究
費補助金研究成果報告書,日本,1999年
3月,pp.290−293,JST資料番
号:N19993074
矢田哲士・他,「隠れマルコフモデル
と遺伝的アルゴリズムによるDNA配列
のシグナルパターン抽出」,情報処理学
会論文誌,日本,社団法人情報処理学
会・発行,1996年 6月15日,Vol.
37,No.6,pp.1117−1129
矢田哲士・他,「DNA配列の複合モ
チーフを表現する隠れマルコフモデルの
生成」,情報処理学会論文誌,日本,社
団法人情報処理学会・発行,1999年 2
月15日,Vol.40,No.2,pp.
750−767
阿久津達也,「遺伝子ネットワークの
推定アルゴリズム」,数理科学,日本,
株式会社サイエンス社・発行,1999年
5月28日,Vol.37,No.6,p
p.40−46
北野宏明,「システム・バイオロジー
の試み」,数理科学,日本,株式会社サ
イエンス社・発行,1999年 5月28日,
Vol.37,No.6,pp.54−60
北野宏明・他,「遺伝的アルゴリズ
ム」,日本,産業図書株式会社,1993年
6月 3日,初版,pp.61−88,I
SBN:4−7828−5136−7
阿久津達也・他,「遺伝子発現量の時
系列データからの遺伝子ネットワーク推
定」,1999年度人工知能学会全国大会
(第13回)論文集,日本,社団法人人工
知能学会,1999年 6月15日,pp.
328−329,JST資料番号:X0580A
阿久津達也・他,「遺伝子制御ネット
ワーク解明のための学習理論」,人工知
能学会研究会資料(SIG−FAI−
9703−6),日本,社団法人人工知能学
会,1998年 3月26日,pp.37−42
北野宏明・他,「遺伝的アルゴリズム
2」,日本,産業図書株式会社,1995年
5月 8日,初版,pp.71−87,I
SBN:4−7828−5141−3
Tominaga,D.,et.a
l,”Design of Canon
ical Model Describ
ing Complex Nonlin
ear Dynamics”,Pro
c.IFAC Int.Conf.Co
mputer Application
s in Biotechnolog
y,1998年,pp.85−90,JST資料
番号:K19990184
久原哲・他,「DNAチップの情報科
学的取り扱い」,数理科学,日本,株式
会社サイエンス社,1999年 6月 1
日,Vol.37,No.6,pp.33−
39
(58)調査した分野(Int.Cl.7,DB名)
G06N 1/00 - 7/08
G06F 19/00
C12N 15/00
JSTファイル(JOIS)
CSDB(日本国特許庁)
INSPEC(DIALOG)
Claims (6)
- 【請求項1】 あるデータを生成する要素を少なくとも
1つ用いて、互いに関連している要素間の関係をネット
ワークとして記述でき、前記ネットワークにより生成さ
れたデータが与えられたときにおける、前記与えられた
データから、前記データを再現できるネットワークをコ
ンピュータ・システムを用いて推定する方法であって、前記ネットワークは、 ネットワーク構造と、 それに対応するパラメータ・セットと、 ネットワーク構造およびパラメータ・セットから生成さ
れるデータと前記与えられたデータとの適応度とからな
るトリプレットとして表現され、 前記与えられたデータを実現することが想定される、部
分的に既知のネットワーク構造を基にネットワーク構造
を生成し、それに対応するパラメータ・セットおよび適
応度を作成し、前記適応度を利用して最適化した複数の
候補トリプレットを第1記憶手段に格納するステップ
と、 前記与えられたデータとは異なる、ネットワーク
構造の一部が変異したネットワーク構造から生成できる
他のデータを用いて、前記第1記憶手段に格納された候
補トリプレットから適切な候補トリプレットを絞り込
み、第2記憶手段に格納するステップとを備えることを
特徴とするネットワーク推定方法。 - 【請求項2】 請求項1に記載のネットワーク推定方法
において、前記候補トリプレットを第1記憶手段に格納するステッ
プの前記適応度を利用した最適化は、作成したネットワ
ーク構造からN個を選択して、各々に最適化したパラメ
ータ・セットをM個適合してN×M個のトリプレットを
作成し、さらに、該N個のネットワーク構造から新たな
N個のネットワーク構造を生成して、各々に最適化した
パラメータ・セットをM個適合してN×M個のトリプレ
ットを作成し、作成した2N×M個のトリプレットから
適応度の高いP個のトリプレットを選択することを特徴
とするネットワーク推定方法。 - 【請求項3】 請求項2に記載のネットワーク推定方法
において、前記候補トリプレットを第1記憶手段に格納するステッ
プの前記適応度を利用した最適化は、さらに、前記P個
のトリプレットの近傍を探索して、より適合度の高いト
リプレットを見つけて置き換えることを特徴とするネッ
トワーク推定方法。 - 【請求項4】 請求項1又は2に記載のネットワーク推
定方法において、 前記候補トリプレットを第1記憶手段に格納するステッ
プの前記適応度を利用した最適化は、遺伝的アルゴリズ
ム(GA)、シミュレーテッド・アニーリング(S
A)、及び/又は、山登り法を用いることを特徴とする
ネットワーク推定方法。 - 【請求項5】 あるデータを生成する要素を少なくとも
1つ用いて、互いに関連している要素間の関係をネット
ワークとして記述でき、前記ネットワークにより生成さ
れたデータが与えられたときにおける、前記与えられた
データから、前記データを再現できるネットワークを推
定するネットワーク推定装置であって、ネットワークを、 ネットワーク構造とそれに対応するパ
ラメータ・セットと、ネットワーク構造とパラメータ・
セットから生成されるデータと前記与えられたデータと
の適応度とからなる候補トリプレットとして表現して記
憶する第1の記憶手段と、 最終的な候補としてのトリプレットを格納する第2の記
憶手段と、 前記与えられたデータを実現することが想定される、部
分的に既知のネットワーク構造を基にネットワーク構造
を生成し、それに対応するパラメータ・セットおよび適
応度を作成し、前記適応度を利用して最適化した複数の
候補トリプレットを前記第1の記憶手段に格納する手段
と、 前記与えられたデータとは異なる、ネットワーク
の一部が変異したネットワークから生成できる他のデー
タを用いて、前記第1の記憶手段に格納されているトリ
プレットから適切な候補トリプレットを絞り込み、前記
第2の記憶手段に格納する手段とを備えることを特徴と
するネットワーク推定装置。 - 【請求項6】 請求項1〜4のいずれかに記載のネット
ワーク推定方法をコンピュータ・システムに実現させる
プログラムを格納した記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17442699A JP3443039B2 (ja) | 1999-06-21 | 1999-06-21 | ネットワーク推定方法および装置 |
DE60027911T DE60027911T2 (de) | 1999-06-21 | 2000-06-21 | Verfahren und vorrichtung zur netzwerk folgerung |
EP00940777A EP1223547B1 (en) | 1999-06-21 | 2000-06-21 | Method and device for network inference |
PCT/JP2000/004050 WO2000079479A1 (fr) | 1999-06-21 | 2000-06-21 | Procede et dispositif d'inference de reseau |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17442699A JP3443039B2 (ja) | 1999-06-21 | 1999-06-21 | ネットワーク推定方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001005797A JP2001005797A (ja) | 2001-01-12 |
JP3443039B2 true JP3443039B2 (ja) | 2003-09-02 |
Family
ID=15978347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17442699A Expired - Fee Related JP3443039B2 (ja) | 1999-06-21 | 1999-06-21 | ネットワーク推定方法および装置 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1223547B1 (ja) |
JP (1) | JP3443039B2 (ja) |
DE (1) | DE60027911T2 (ja) |
WO (1) | WO2000079479A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005270909A (ja) * | 2004-03-26 | 2005-10-06 | Advanced Telecommunication Research Institute International | ハードウエアシミュレータ |
JP4761286B2 (ja) * | 2004-03-26 | 2011-08-31 | 株式会社国際電気通信基礎技術研究所 | ハードウエアシミュレータ |
JP5024583B2 (ja) * | 2005-09-14 | 2012-09-12 | ソニー株式会社 | 情報処理装置および情報処理方法、情報処理システム、プログラム、並びに、記録媒体 |
JP5905781B2 (ja) * | 2012-06-13 | 2016-04-20 | 学校法人沖縄科学技術大学院大学学園 | 相互作用予測装置、相互作用予測方法、および、プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2881711B2 (ja) | 1989-03-28 | 1999-04-12 | ハネウエル・インコーポレーテツド | 神経回路網の遺伝子的合成 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001508303A (ja) * | 1997-01-13 | 2001-06-26 | デイヴィッド・エイチ・マック | 遺伝子機能同定のための発現モニタリング |
US6132969A (en) * | 1998-06-19 | 2000-10-17 | Rosetta Inpharmatics, Inc. | Methods for testing biological network models |
-
1999
- 1999-06-21 JP JP17442699A patent/JP3443039B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-21 WO PCT/JP2000/004050 patent/WO2000079479A1/ja active IP Right Grant
- 2000-06-21 EP EP00940777A patent/EP1223547B1/en not_active Expired - Lifetime
- 2000-06-21 DE DE60027911T patent/DE60027911T2/de not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2881711B2 (ja) | 1989-03-28 | 1999-04-12 | ハネウエル・インコーポレーテツド | 神経回路網の遺伝子的合成 |
Non-Patent Citations (12)
Title |
---|
Tominaga,D.,et.al,"Design of Canonical Model Describing Complex Nonlinear Dynamics",Proc.IFAC Int.Conf.Computer Applications in Biotechnology,1998年,pp.85−90,JST資料番号:K19990184 |
久原哲・他,「DNAチップの情報科学的取り扱い」,数理科学,日本,株式会社サイエンス社,1999年 6月 1日,Vol.37,No.6,pp.33−39 |
北野宏明,「システム・バイオロジーの試み」,数理科学,日本,株式会社サイエンス社・発行,1999年 5月28日,Vol.37,No.6,pp.54−60 |
北野宏明・他,「遺伝的アルゴリズム」,日本,産業図書株式会社,1993年 6月 3日,初版,pp.61−88,ISBN:4−7828−5136−7 |
北野宏明・他,「遺伝的アルゴリズム2」,日本,産業図書株式会社,1995年 5月 8日,初版,pp.71−87,ISBN:4−7828−5141−3 |
富永大介、岡本正宏,「逆問題(inverse problem)解決のための遺伝的アルゴリズムを用いた多次元非線形数値最適化手法の開発」,化学工学論文集,日本,社団法人化学工学会,1999年 3月10日,Vol.25,No.2,pp.220−225,JST資料番号:S0110B |
矢田哲士・他,「DNA配列の複合モチーフを表現する隠れマルコフモデルの生成」,情報処理学会論文誌,日本,社団法人情報処理学会・発行,1999年 2月15日,Vol.40,No.2,pp.750−767 |
矢田哲士・他,「隠れマルコフモデルと遺伝的アルゴリズムによるDNA配列のシグナルパターン抽出」,情報処理学会論文誌,日本,社団法人情報処理学会・発行,1996年 6月15日,Vol.37,No.6,pp.1117−1129 |
篠原歩、竹田正幸、野田清志,「重み付きネットワークを用いた遺伝子発現ネットワークの発見」,1998年度科学研究費補助金研究成果報告書,日本,1999年 3月,pp.290−293,JST資料番号:N19993074 |
阿久津達也,「遺伝子ネットワークの推定アルゴリズム」,数理科学,日本,株式会社サイエンス社・発行,1999年 5月28日,Vol.37,No.6,pp.40−46 |
阿久津達也・他,「遺伝子制御ネットワーク解明のための学習理論」,人工知能学会研究会資料(SIG−FAI−9703−6),日本,社団法人人工知能学会,1998年 3月26日,pp.37−42 |
阿久津達也・他,「遺伝子発現量の時系列データからの遺伝子ネットワーク推定」,1999年度人工知能学会全国大会(第13回)論文集,日本,社団法人人工知能学会,1999年 6月15日,pp.328−329,JST資料番号:X0580A |
Also Published As
Publication number | Publication date |
---|---|
DE60027911T2 (de) | 2006-12-14 |
WO2000079479A1 (fr) | 2000-12-28 |
JP2001005797A (ja) | 2001-01-12 |
DE60027911D1 (de) | 2006-06-14 |
EP1223547A4 (en) | 2002-10-29 |
EP1223547B1 (en) | 2006-05-10 |
EP1223547A1 (en) | 2002-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kalkatawi et al. | DeepGSR: an optimized deep-learning structure for the recognition of genomic signals and regions | |
Hashim et al. | Review of different sequence motif finding algorithms | |
Bower et al. | Computational modeling of genetic and biochemical networks | |
Kikuchi et al. | Dynamic modeling of genetic networks using genetic algorithm and S-system | |
Zomaya et al. | Biomolecular networks: methods and applications in systems biology | |
De Campos et al. | Optimization of neural networks through grammatical evolution and a genetic algorithm | |
Cho et al. | Identification of biochemical networks by S-tree based genetic programming | |
CN107862173A (zh) | 一种先导化合物虚拟筛选方法和装置 | |
Gibson et al. | Modeling the activity of single genes | |
WO2008044242A2 (en) | Gene expression analysis using genotype-pheontype based programming | |
Mitra et al. | Genetic networks and soft computing | |
WO2001048690A1 (fr) | Procede de deduction de reseau | |
CN114783526A (zh) | 基于高斯混合图变分自编码器的深度无监督单细胞聚类方法 | |
Chen et al. | Inferring genetic interactions via a nonlinear model and an optimization algorithm | |
Shen et al. | A preference-based evolutionary biobjective approach for learning large-scale fuzzy cognitive maps: An application to gene regulatory network reconstruction | |
JP3443039B2 (ja) | ネットワーク推定方法および装置 | |
Spieth et al. | Multi-objective model optimization for inferring gene regulatory networks | |
Bumgarner et al. | Methods for the inference of biological pathways and networks | |
Dang et al. | Determining 2-Optimality consensus for DNA structure | |
Hashim et al. | Comparative analysis of DNA motif discovery algorithms: a systemic review | |
Hu et al. | Internet credit risk scoring based on simulated annealing and genetic algorithm | |
CN114512188B (zh) | 基于改进蛋白质序列位置特异性矩阵的dna结合蛋白识别方法 | |
JP3012441B2 (ja) | タンパク質立体構造予測方法 | |
Knabe et al. | Genetic algorithms and their application to in silico evolution of genetic regulatory networks | |
Vodilovska et al. | Hyperparameter Optimization of Graph Neural Networks for mRNA Degradation Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |