JP2005267592A - エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置 - Google Patents

エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置 Download PDF

Info

Publication number
JP2005267592A
JP2005267592A JP2004120918A JP2004120918A JP2005267592A JP 2005267592 A JP2005267592 A JP 2005267592A JP 2004120918 A JP2004120918 A JP 2004120918A JP 2004120918 A JP2004120918 A JP 2004120918A JP 2005267592 A JP2005267592 A JP 2005267592A
Authority
JP
Japan
Prior art keywords
energy
adjacent
hairpin
structures
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004120918A
Other languages
English (en)
Inventor
Masaki Hagitani
昌己 萩谷
Mitsuhiro Kubota
光宏 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP2004120918A priority Critical patent/JP2005267592A/ja
Publication of JP2005267592A publication Critical patent/JP2005267592A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】解析対象物質の構造の形態変化経路における真のエネルギー障壁を求めるエネルギー地形解析方法と、この解析結果を利用して分岐状態を実現できる多状態分子機械を提供する。
【解決手段】基準構造Sから目標構造Sに構造が変化する解析対象物質Xの構造変化経路におけるエネルギー障壁を含むエネルギーのエネルギー地形を解析する方法であって、1)隣接構造を探索するステップ、2)重複判定するステップ、3)エネルギーを計算するステップ、4)優先度付き待ち行列に追加するステップ、5)ステップ1)から4)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返すステップ、6)最小エネルギーの隣接構造を最小流域Bに移行させるステップおよび7)ステップ1)から5)を、目標構造Sが最小流域Bに移行されるまで繰り返すステップを含む。
【選択図】図2

Description

この出願の発明は、エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置に関するものである。さらに詳しくは、この出願の発明は、解析対象物質の構造における基準構造から目標構造への形態変化に際しての形態変化経路における真のエネルギー障壁を効率よく求めることができる、新しいエネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置に関するものである。
近年、DNAやRNA等の核酸分子や蛋白質等の熱力学的エネルギーを見積もる計算法が、予測法として実用的な水準までに発展を遂げている。また、核酸分子の会合や形態変化といった分子反応を解析する上で、エネルギー障壁をはじめとするエネルギー地形の解析が有効であることも示されてきている。このため、このエネルギー地形の解析から、核酸の塩基配列の設計や評価を行うことができると考えられ、核酸の塩基配列のエネルギー地形を効率的かつ効果的に評価する手法が望まれている。
たとえば、既存の方法としては、MorganとHiggsのヒューリスティクス等の最短経路(Direct Path)を用いた解析方法(非特許文献1)が知られている。この解析方法における経路は、解析対象物質の構造の形態変化前と形態変化後における塩基対のみに着目した解析方法であり、それ以外の塩基対を考慮しないという近似的なものである。このような近似によって、優れた計算効率でエネルギー障壁を求めることができるが、その障壁が真のエネルギー障壁であるか、あるいは、偽のエネルギー障壁であるかの判断が難しく、また、エネルギー地形の特徴についての判断も困難であるという問題があった。
一方、全ての塩基の相互作用を考慮したエネルギー地形を解析する方法としては、マルコフ過程(非特許文献2)やモンテ・カルロ法(非特許文献2)に基づく確率的な解析、そして、Flooding法の研究が行われている(非特許文献3および4)。特にFlooding法は、真のエネルギー障壁を求めることができる方法である。しかしながら、この方法は、あらかじめ、核酸の塩基配列がとり得る全ての構造を列挙し、そのそれぞれの構造のエネルギーを求めることが必要であるという問題があった。このようにすべての構造とエネルギーを求めることが理想であるが、80から100塩基を超えるような配列に対しては、極めて困難であり、またすべて求めても、そのほとんど非常に不安定なエネルギーとなることが報告されている(非特許文献5)。
S.R.Morgan,and P.G.Higgs,J.Phys.A:Math.Gen.,31:3153−3170,1998 C.Flamm,W.,et al.,RNA,6:325−338,2000 P.F.Stadler,and C.Flamm,J.Gen.Prog.Evol.Machines,4:7−20,2003 C.Flamm,et al.,Z.Phys.Chem.,216:155−173,2002 J.Cupal,et al.,Proc.of ISMB−97(Proceedings of the 5th International Conference on Intelligent Systems for Molecular Biology),88−91,2002
そこでこの出願の発明は、以上のとおりの事情に鑑みてなされたものであって、従来の問題点を解消し、解析対象物質Xの構造における基準構造Sから目標構造Sへの形態変化に際しての形態変化経路における真のエネルギー障壁を効率よく求めることができる、新しいエネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置を提供することを課題としている。
この出願の発明は、上記の課題を解決する手段として、第1には、基準構造Sから目標構造Sに構造が変化する解析対象物質Xの構造変化経路におけるエネルギー障壁を含むエネルギーのエネルギー地形を解析する方法であって、
(I)処理部により、解析対象物質Xの基準構造Sに対して隣接する隣接構造を探索するステップ、
(II)処理部が、上記ステップ(I)で探索された隣接構造が、以前にも探索された隣接構造であるか、または、新たに探索された隣接構造であるかを重複判定するステップ、
(III)前記処理部が、上記ステップ(II)で新たに探索されたと判定された隣接構造のエネルギーを計算するステップ、
(IV)前記処理部が、上記ステップ(III)で計算されたエネルギーを既存のエネルギー障壁の閾値と比較して、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造を、隣接構造の集合である隣接集合Nを管理する優先度付き待ち行列に追加するステップ、
(V)前記処理部が、ステップ(I)から(IV)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返すステップ、
(VI)前記処理部が、隣接集合Nから最小エネルギーの隣接構造を選択して、基準構造Sと目標構造Sとを結ぶ最小の流域の集合である最小流域Bに移行させるステップ、および
(VII)前記処理部が、ステップ(I)から(V)を、目標構造Sが最小流域Bに移行されるまで繰り返すステップ、
を含むことを特徴とするエネルギー地形解析方法を提供し、第2には、上記第1の発明のエネルギー地形解析方法をコンピュータに実行させるためのエネルギー地形解析プログラムを、第3には、上記第2の発明のエネルギー地形解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
また、第4には、基準構造Sから目標構造Sに構造が変化する解析対象物質Xの構造変化経路におけるエネルギー障壁を含むエネルギーのエネルギー地形を解析する装置であって、
(I)解析対象物質Xの基準構造Sに対して隣接する隣接構造を探索する隣接構造探索手段、
(II)上記(I)で探索された隣接構造が、以前にも探索された隣接構造であるか、または、新たに探索された隣接構造であるかを判定する重複判定手段、
(III)上記(II)で新たに探索されたと判定された隣接構造のエネルギーを計算する計算手段、
(IV)上記(III)で計算されたエネルギーを既存のエネルギー障壁の閾値と比較して、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造を、隣接構造の集合である隣接集合Nを管理する優先度付き待ち行列に追加する追加手段、
(V)上記(I)から(IV)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返す追加繰り返し手段、
(VI)隣接集合Nから最小エネルギーの隣接構造を選択して、基準構造Sと目標構造Sとを結ぶ最小流域の集合である最小流域Bに移行させる移行手段、および
(VII)上記(I)から(V)を、目標構造Sが最小流域Bに移行されるまで繰り返す移行繰り返し手段、
を備えていることを特徴とするエネルギー地形解析装置を提供する。
さらに、この出願の発明は、第5には、上記第1の発明のエネルギー地形解析方法、または、上記第4の発明のエネルギー地形解析装置による解析結果に基づいて、DNA分子、または、RNA分子を構成する塩基配列を有する多状態分子機械の設計する方法であって、
(I)処理部が、多状態分子機械に、2つの二本鎖部分であるヘアピン構造間を繋ぐ一本鎖部分である一本鎖構造と、少なくとも2つの二本鎖部分であるヘアピン構造とを持つ複合構造を与えて、この複合構造が最も安定な構造となる塩基配列を算出するステップ、
(II)前記処理部が、2つのヘアピン構造間にある一本鎖構造の塩基配列と、この一本鎖構造と隣接している少なくともどちらか一方のヘアピン構造の塩基配列とそれぞれに対して相補的である前記ヘアピン構造を崩すための入力オリゴマーを算出するステップ、
(III)前記処理部が、ステップ(I)にて算出された複合構造の塩基配列に対して、多状態分子機械の設計基準に基づく検査を行うステップ、および
(IV)前記処理部が、ステップ(I)から(III)を繰り返して、その中から多状態分子機械の設計基準を満たす塩基配列を出力するステップ、
を含むことを特徴とする多状態分子機械の設計方法を提供し、第6には、多状態分子機械の設計基準は、1つのヘアピン構造が崩れた適切な形態から2つのヘアピン構造が同時に崩れた不適切な形態へと形態が変化する形態変化経路におけるエネルギー障壁の最大化および適切な形態と不適切な形態とのエネルギー差の最小化であることを特徴とする多状態分子機械の設計方法を提供する。
さらにまた、この出願の発明は、第7には、上記第5または第6の発明の多状態分子機械の設計方法をコンピュータに実行させるための多状態分子機械の設計プログラムを、第8には、上記第7の発明の多状態分子機械の設計プログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。
この出願の発明は、第9には、上記第1の発明の記載のエネルギー地形解析方法、または、上記第4の発明のエネルギー地形解析装置による解析結果に基づいて、DNA分子、または、RNA分子を構成する塩基配列を有する多状態分子機械を設計する装置であって、
(I)多状態分子機械に、2つの二本鎖部分であるヘアピン構造間を繋ぐ一本鎖部分である一本鎖構造と、少なくとも2つの二本鎖部分であるヘアピン構造とを持つ複合構造を与えて、この複合構造が最も安定な構造となる塩基配列を算出する塩基配列算出手段、
(II)2つのヘアピン構造間にある一本鎖構造の塩基配列と、この一本鎖構造と隣接している少なくともどちらか一方のヘアピン構造の塩基配列とそれぞれに対して相補的である前記ヘアピン構造を崩すための入力オリゴマーを算出する入力オリゴマー算出手段、
(III)上記(I)にて算出された複合構造の塩基配列に対して、多状態分子機械の設計基準に基づく検査を行う検査手段、および
(IV)前記処理部が、上記(I)から(III)を繰り返して、その中から多状態分子機械の設計基準を満たす前記塩基配列および前記入力オリゴマー出力する塩基配列出力手段、
を備えていることを特徴とする多状態分子機械の設計装置を提供し、第10には、多状態分子機械の設計基準は、1つのヘアピン構造が崩れた適切な形態から2つのヘアピン構造が同時に崩れた不適切な形態へと形態が変化する形態変化経路におけるエネルギー障壁の最大化および適切な形態と不適切な形態とのエネルギー差の最小化であることを特徴とする多状態分子機械の設計装置を提供する。
この出願の発明によって、解析対象物質Xの構造における基準構造Sから目標構造Sへの形態変化に際しての形態変化経路における真のエネルギー障壁を効率よく求めることができる、新しいエネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置を提供することができる。
さらには、この出願の発明によって、安定性が高く、また、分岐状態を実現することのできる多状態分子機械に関する設計方法およびこの設計方法による多状態分子機械をも提供することができる。
上記のとおりの特徴を有するこの出願の発明は、コンピュータを用いて、コンピュータ演算によって解析対象物質X、たとえば、DNA分子やRNA分子等の核酸分子、蛋白質等におけるエネルギー地形を解析するものである。また、このエネルギー地形の解析結果に基づいて、安定な多状態分子機械を設計することができる。多状態分子機械としては、たとえば、分岐状態を実現できるもの(分岐機械)等を設計することもできる。
この出願の発明は、DNA(デオキシリボ核酸)やRNA(リボ核酸)等の核酸分子や蛋白質等の解析対象物質Xの基準構造(初期構造)Sだけからなる集合を隣接関係を用いて広げていき、その集合が目標構造Sを包含した時点で終了するというアルゴリズムコンピュータで実行させることにより、真のエネルギー障壁を効率よく求めることができる。ここでは、このアルゴリズムを最小領域法と呼ぶこととする。この最小流域法は、従来の方法である、最短経路問題のダイクストラ法(Dikstra法)や最小木問題のヤルニークプリム法(Jarnik−Prim法)と比較して、計算の複雑さは、これらの方法(DJP法、つまりDikstra−Jarnik−Prim法)よりもシンプルな方法となっている。これは、グラフ理論で通常用いられるグラフは辺に重みを持つ一方で、エネルギー地形においては頂点に重みを持つために生じる特徴である。
このようなアルゴリズムによって求められた集合は、始点である基準構造Sと終点である目標構造Sを結ぶ最小の流域、つまり最小流域の集合Bを表現している。イメージとしては、始点Sに湧水口(ソース)があって、この始点から水が湧き出し続け、終点Sにはその水を止めるためのスイッチがあって、この終点に水の流域が到達した時に湧水が止まる時、グラフに表現されたエネルギー地形上に現れる水の流域になる。ここでの水は、地形を透過せず、地形上にとどまる性質を持つものである。
最小流域法は、たとえば、DNA分子やRNA分子等の配列から解析に用いるグラフ(エネルギー地形)を動的に生成・探索する方法であり、得られたグラフは構造変化において到達し得る低エネルギーな構造を網羅している。このため、実際のDNA分子反応との比較に適しており、求められた最小流域の集合Bによって、実際の反応がどのようなものかを解析することができる。そして、最小流域の集合Bに含まれる最大エネルギーの構造は真のエネルギー障壁となる。
エネルギー地形は、例えば、DNAの場合、一つの塩基配列が与えられても、様々な形態(構造)をとることができる。そして、それら構造に対して、それぞれ熱力学的な自由エネルギーを算出することができる。このような各構造間において、「1つの塩基対の形成」または「1つの塩基対の解離」という単位で到達できるかどうかの関係(隣接関係)を定義した時にできるグラフを意味する。通常のグラフ理論のグラフにおいて考えると、頂点が形態(構造)を、辺が隣接関係を表すということになり、頂点にエネルギーという重みを持つことになる。このように、頂点に重みを持つグラフには、エネルギー地形だけではなく、組み合わせ最適化問題における評価関数地形(fitness landscape)もあり、評価関数地形においても、この出願の発明における最小流域アルゴリズム(最小流域法)を適用することができる。
なお、たとえば、DNA分子等における二次構造のエネルギーは、二次構造を構成する各ループ構造のエネルギーによって近似される。図1は、ループ構造を例示した模式図であり、(A)はヘアピン構造、(B)はスタック構造、(C)はバルジ構造、(D)は内部構造、(E)は3−ループ構造である。この図1において、実線は、塩基と塩基を結ぶバックボーン(主鎖)であり、点線は、塩基対を作る水素結合である。つまり、ループ構造とは、これらバックボーンと水素結合によって囲まれた領域のことであり、曲線で示されているバックボーンは何個かの塩基を結んでいることを意味している。
一般に、二次構造におけるk−ループとは、k個の塩基対で囲まれたループ構造のことである。1−ループはヘアピン(hairpin)構造とも呼ばれる。つまり、ヘアピン構造とは、1組の塩基対と一連の塩基から作られるバックボーンからなるものである。バックボーンには少なくとも3個の塩基が含まれている。ただ、実際には、塩基数は、もっと多くなければ自由エネルギー非常に大きいなものとなる。2−ループ構造としては、図1に例示したとおり、スタック(stack)構造、バルジ(bulge)ループ構造および内部(interior)ループ構造がある。
「スタック構造」とは、二つの隣接する塩基対が作るループ構造のことであり、二次構造において最も基本的な構造であり、純粋な二本鎖はスタックのみからなる。このスタック構造に自由エネルギーを割り当てるエネルギー・モデルを、Nearest−Neighborモデルという。「内部ループ構造」は、二つの隣接していない塩基対が作るループ構造である。また「バルジ・ループ構造」は、内部ループ構造の特別な場合と考えられ、2組の塩基対の片方の塩基が隣接している。さらに、kが3つ以上の場合のk−ループ構造は、マルチ・ループ(multi−loop)構造と呼ばれる。
これら各ループ構造に対して、経験的に得られた自由エネルギーのパラメータを割り当てることにより、DNA分子等の核酸分子における二次構造のエネルギーがこれらの自由エネルギーの和によって近似されることとなる。
この出願の発明におけるエネルギー地形では、エネルギーが頂点に割り当てられており、その一方で上記のような最短経路問題(ダイクストラ法)や最小木問題(ヤルニークプリム法)におけるグラフでは、距離等のコストが辺に与えられている。このような特徴の違いから、DJP法では各頂点までの一時的な最小辺や最短距離を保持して、その値を更新しながら計算を行うが、この出願の発明において使用する最小流域法では、各頂点にエネルギーが割り当てられていることから、このような値の更新の操作が必要ない。
以下、このエネルギー地形解析、また、後述の多状態分子機械設計のための処理について、図2から図4を適宜参酌しながらより詳細に説明する。図2はエネルギー地形解析処理のフローチャートであり、図3および図4はエネルギー地形解析処理を実行するエネルギー地形解析装置を例示したシステム構成図および機能ブロック図である。
図3のシステム構成では、表示部(1)、入力部(2)、処理部(CPU)(3)、主記憶部(メインメモリ)(4)およびバス(5)を備えている。主記憶部(4)には、エネルギー地形解析プログラムや多状態分子機械設計プログラム、各種データが記憶されている。これら主記憶部(4)とバス(5)により接続されている処理部(3)は、主記憶部(4)に記憶されているプログラムの指令を受けて、エネルギー地形解析処理および多状態分子機械設計処理を実行する。また、処理部(4)は、入力画面やエネルギー地形解析データ、多状態分子機械の設計データ等を表示するディスプレイ等の表示部(1)と、エネルギー地形解析や多状態分子機械設計するための各種データ等を入力するキーボードやマウス等の入力部(2)とも、バス(5)により接続されている。
なお、上記のエネルギー地形解析するための各種データや多状態分子機械を設計するための各種データ等は、データベース(6)に蓄積してもよい。データベース(6)については、図示したようにバス(5)を通じて処理部(3)や主記憶部(4)等と接続されていても、通信手段を介して双方向データ送受可能な別体として構築されていてもよい。
<ステップI>
まず、処理部(3)により、エネルギー地形解析のためのデータ、たとえば解析対象物質Xの基準構造Sや隣接構造のリスト等、の入力を入力部(2)から受け付ける。そして、処理部(3)が、基準構造Sに対して隣接する隣接構造を探索し、特定する(隣接構造探索手段)。なお、たとえば、基準構造Sや隣接構造はデータベース(6)に蓄積しておき、敵地読み出すようにしてもよい。
<ステップII>
次に、処理部(3)により、上記ステップ(I)で探索、特定された隣接構造が、以前にも探索された隣接構造であるか、または、新たに探索された隣接構造であるかを重複判定する(重複判定手段)。
この処理も、たとえば探索の有無に関するデータを各隣接構造はデータベース(6)に蓄積しておき、適宜読み出すようにしてもよい。
<ステップIII>
次に、処理部(3)により、上記ステップ(II)で新たに探索されたと判定された隣接構造のエネルギーを計算する(計算手段)。
<ステップIV>
次に、処理部(3)により、上記ステップ(III)で計算されたエネルギーを既存のエネルギー障壁の閾値と比較して、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造を、隣接構造の集合である隣接集合Nを管理する優先度付き待ち行列に追加する(追加手段)。
なお、「既存のエネルギーの閾値」については、ステップ(IV)の処理時に逐次算出したものや、本解析処理前に既に知られているもの等を考慮でき、また何れの場合のものでもデータベースに蓄積させて利用してもよい。
<ステップV>
ここで、処理部(3)は、ステップ(I)から(IV)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返す(追加繰り返し手段)。
<ステップVI>
続いて、処理部(3)が、隣接集合Nから最小エネルギーの隣接構造を選択して、基準構造Sと目標構造Sとを結ぶ最小の流域の集合である最小流域Bに移行させる(移行手段)。
<ステップVII>
そして、処理部(3)が、ステップ(VI)を、目標構造Sが最小流域Bに移行されるまで繰り返す(移行繰り返し手段)。
なお、基準構造Sは、最小流域の集合である最小流域Bに加えられる。
以上により、DNA分子やRNA分子等の核酸分子等の解析対象物質Xの反応の分析や予測を効率よく行うことができる。
また、状規格処理には、たとえば、表1に示した方法を使用することができる。
Figure 2005267592
この表1に例示した各方法を説明すると、まず、最小流域法の主な手順のステップ(I)では、たとえば、DNA分子(もしくは、RNA分子)の場合では、基準構造Sに対しての隣接構造を求めるために塩基対を形成、または、解離できる個所を特定する。そのためには、図5および図6(後述)に例示したような、DNA分子の二次構造を表現するデータ構造を効果的に実装するとよい。なお、この図5は、この出願の発明における、二次構造を表現するデータ構造の例として、87塩基長の配列がとる構造を例示した模式図であり、(A)は平面グラフ、(B)はOrdered Root Tree、(C)はRing List Tree、(D)はドットと括弧による表現をそれぞれ示した図である。
まず、塩基対の「形成」の場合では、pseudoknotというループ構造にならないようにWatson−Crick塩基対を形成しなければならない。pseudoknotを持つ構造についても最小流域アルゴリズムを適用する方法を考えることができるが、ここでは、このpseudoknotを考えないこととした。一般的にも、このpseudoknot構造は三次構造であると考えられていて、二次構造には含まないこととしている。このpseudoknot構造とならないように塩基対を形成するには、同一のk−ループに属する塩基で対を作ればよい。核酸の二次構造は、Flammたちがモンテカルロ・シミュレーションを行った際に実装したRing List Tree(C.Flamm,Kinetic Folding of RNA.,PhD Thesis,University of Vienna,Austria(1998),および、C.Flamm et al.RNA6:325−338,2000等を参照)は、Ordered Rooted Tree(W.Fontana et al.Biopolymers 33:1389−1404,1993および,I.L.Hofacker et al.Monatshefte f.Chemie 125:167−188,1994等を参照)の一つであり、同じk−ループに属する塩基が一つに接続されている。このため、Ring List Treeでは、塩基対形成による隣接構造を効率よく求めることができる。
しかし、このデータ構造でも、塩基対の解離の時には木全体を走査しなくてはならないため、「解離」の場合には、塩基対の集合をリスト、すなわちBase Pair Listで表現するのがよい。このリストは、塩基の番号の順序に並んでいるものとする。解離は、リストの要素となるノードを一つ削除することで実現できる。この時、形成の場合と違い、pseudoknotの検査は必要ない。このリストによる表現は、長い塩基配列において、塩基対の数が少ない場合に特に有効である。
したがって、二次構造を表現するデータ構造としては、上記のとおりRing List TreeとBase Pair Listを用いることが好ましい。塩基対を形成・解離して計算を行う際は、必要に応じてこれら両方の表現を操作した。なお、DNA分子やRNA分子等の構造を形成している塩基配列中には、交叉点移動(Branch Migration)等のような塩基対を解離してすぐ同じ箇所で塩基対がかなりの速さで形成される反応があり、この反応に対する対処のために従来の解析((たとえば、C.Flamm et al.,RNA,6:325−338,2000等)の基本単位に含まれている、入れ替え(shift)については、最小流域法では特別な考慮しなくても、形成と解離によって問題なく実現される。
グラフ探索において、同じ頂点を再び訪れてしまう場合がある。これは特に、隣接構造として求められた構造の隣接構造を求めると、再び元の構造が現れるという場合がある。このため、最小流域法の主な手順のステップ(II)は、上記ステップ(I)で隣接構造として求められた新しい構造が、以前に現れていないことを確認する重複検査を行う。この重複検査のためには、タブー探索におけるタブーリストのような以前に現れた構造を保持する機構が必要となる。このため、新しい構造を以前に現れた全ての構造と効率よく比較するために、図6に例示したようなBase Pair Listを利用する木構造の利用が考えられる。このBase Pair Treeは、複数のBase Pair Listを合わせて、以前に現れた全ての二次構造を表現する。そのため、ノードは塩基対を表している。なお、この図6は、この出願の発明におけるBase Pair Listの例として、18塩基長の配列がとる構造を示した模式図であり、(A)はドットと括弧による表現、(B)は(A)のそれぞれの構造に対応するBase Pair List、(C)はこれらすべてを表現するRing List Treeである
ここで、Base Pair Treeの各ノードには、重複を判定するための2値の値を保持できるものとする。この値の初期値は0である。新しい構造が求められた際、そのBase Pair Listの順序にしたがい、Base Pair Tree上を走査し、新たなノードが必要になった場合にそのノードを生成していく。そして、Base Pair Listのノードがなくなる時、該当するBase Pair Treeの最後のノードの2値の値を1にする。この時、この値が0の場合は、そのノードからルートまでの経路上にある塩基対からなる二次構造は、まだ現れていないことを示し、1であったならば既に現れていることを示す。このように、Base Pair Treeのノードを任意に1つ選ぶと、そのノードから特定の二次構造を一意に求めることができる。
ステップ(III)は、上記ステップ(II)で重複していないと判定された構造のエネルギーを計算するステップである。隣接関係を使って求められた構造のエネルギーをNearest−Neighborモデルで計算すると、全てのk−ループのエネルギーを求める必要はなく、差分エネルギーだけを計算するため効率がよい。塩基対の形成・解離で構造変化をした場合は、構造変化の前後で異なっているk−ループというのは常に3つであることから、この3つのk−ループから求められる差分エネルギーを計算するだけでよく、またRing List Treeを用いることにより、各k−ループのエネルギー計算をより効率的に行うことができる図7に、差分になる3つのk−ループとRing List Treeの変化の状態を例示した模式図を示し、(A)から(B)は塩基対の形成、(B)から(A)は塩基対の解離を示している。
最小流域法の主な手順のステップ(IV)では、Morgan−Higgs法によって得られたDirect Path上のエネルギー障壁を閾値として用いることができ、上記ステップ(III)にて計算された隣接構造のエネルギーと比較する。これは、隣接集合Nに、非常に大きなエネルギーの構造が多くなる場合、それらを保持する必要がないため、空間的に有効となる。これは、下記数1に示すような関係があることによって、利用することができる。
Figure 2005267592
通常、Morgan−Higgs法は、構造変化後の塩基対を形成するために、解離しなければならない非互換の塩基対を構造変化前の構造から選び、それらを解離してから、目的の塩基対を形成していく手法である。しかし、このままでは、非互換の関係にない構造変化前の構造の塩基対は解離されないため、改善する必要があった。そこで、この出願の発明におけるMorgan−Higgs法では、塩基対の数に着目してできるだけ多くの塩基対を維持して構造変化を行いたいということから、このような非互換の関係にない塩基対は、最後に解離すればよいこととすることができる。
このようにして、エネルギーと構造の決定後は、隣接集合Nの構造を管理している優先度付き待ち行列(Priority Queue)に追加する。多くの頂点を加えながら(Insert)、最小の要素を取り出す操作(Find−min,Delete−min)が必要なため、一般的にDJP法においても、隣接する頂点の集合である隣接集合Nは、優先度付き待ち行列で管理する。最小流域法では、DJP法のように一時的な最小辺や最短距離を保持して、その値を更新する必要がないので、優先度付き待ち行列においては、Decrease−key操作は必要ない。なお、ここでの実装は、バイナリヒープを用いることにした。
このバイナリヒープにおいては、データ構造として配列(array)を用いた実装があるが、短いDNA配列だけでなく、長いDNA配列の解析も想定した場合には、この配列の最大要素数を決めることが難しい。そこで、隣接集合Nの要素の数に応じてメモリを動的に使用するデータ構造とすることが好ましい。
このヒープの各要素が持つ情報は、(1)構造のエネルギー、(2)Base Pair Tree上の構造を示す最後のノードへのポインタ、(3)現在の基準構造、の3つである。特に、(3)にある「現在の基準構造」を保持することで、構造変化前の構造からのMinimax経路(後述)を求めることができる。この現在の基準構造は、最小流域Bに含まれるものであるので、後述のFinal Basin Listのノードへのポインタを用いることができる。
隣接集合Nには、上記のとおりのバイナリヒープを用いたが、最小流域Bには、リスト構造、つまり、Final Basin Listを用いることが好ましい。これは、隣接集合Nから最小エネルギーの要素を選択して、最小流域Bに逐次的に加えていくためである。このように、最小流域Bが、逐次的に構成されているという性質は、後述する解析においても大変役立つため、各要素が加えられた順序はリストにも保持することが好ましい。また、このFinal Basin Listの各要素が持つ情報は、バイナリヒープの各要素が持つ情報と同じでもよい。
このように、最小流域Bには、Final Basin Listが用いられているため、上記(3)の現在の基準構造は、Final Basin Listの要素へのポインタを用いることができる。最終的に、得られるFinal Basin Listが、最小流域法の出力となる最小流域Bを示す。
隣接集合Nにおいて、一般には、最小エネルギーの構造は1つとは限らない。たとえば、構造変化経路における真のエネルギー障壁を求めることを目的とした場合は、複数の最小エネルギーの構造の中から1つ選んで、深さ優先でその構造の隣接構造を求めていく計算を続けることで支障もなく、しかも効率よく行うことができる。
一方、最小流域Bの解析によって、実際のDNA等の核酸の反応等の分析や予測を目的とした場合は、この出願の発明における最小流域Bによる解析を行う場合には、構造が現れる順序が守られ、かつ、最小流域Bの要素が全て存在していることが必要になる。このため、最小エネルギーの構造が複数ある場合には、幅優先でこれら全ての構造を最小流域Bへ加える。そして、最小流域Bに加えられた個々の構造に隣接する構造を全て求め、隣接集合Nへと加えることが必要になる。
ウィーン大学で開発され、インターネットで配布されているVienna Package(URL:http://www.tbi.univie.ac.at/ivo/RNA/)でエネルギーの計算を行う場合は、配列は1つでなければならず、複数の配列による二次構造のエネルギーを求めることができない。そこで、複数の配列を塩基対を形成しない塩基、つまり「仮想塩基」で1つの配列に繋いで、エネルギー計算を行うという工夫をする。ただ、この仮想塩基を含むk−ループ構造に割り当てるエネルギーが問題となる。先行研究において、二分子が離れている時と、ハイブリダイズした時のエネルギーを比較する必要があることからも、DNAの二分子反応での平衡論の解析に基づき、このk−ループに割り当てるエネルギー・パラメータ△Ginitが算出された(H.Uejima and M.Hagiya,Preliminary Proc.of 9th Int.Meeting on DNA Based Computers(DNA9),80−91.,2003を参照)。このように得られた値を用いることができ、これは二分子反応の解析であることから、Tmの計算等において整合性がよい。また、その他の先行研究において、仮想塩基を16個用いる近似などもある(J.Ackermann et al.Zeitschrift f.Naturforschung 58a:157−161,2003を参照)。
ただ、以上ような解析においては、仮想塩基を含むk−ループ内の塩基や塩基対の個々のエネルギーについては考慮されていない。このため、たとえば、2つの配列AとBの繋ぎ方によって、すなわち、「5’−A−spacer−B−3’」と「5’−B−spacer−A−3’」とでは、エネルギーが異なる。さらに、繋ぎ方によって最小自由エネルギー構造(minimum free energy構造、mfe構造)もまた異なる。このような違いは、5’末端と3’末端を繋げたときにできるループである、外部ループ(external loop)に割り当てられるエネルギーと、仮想塩基を含むループのエネルギーとの違いから生じる。仮想塩基を含むループは、5’末端と3’末端を持つため、外部ループであるとみなすことができる。
この出願の発明においては、分子が出会った後の経路の解析を行うために、仮想塩基を含むk−ループのエネルギーとして、そのk−ループを外部ループとしたときのエネルギーを考える。この方法は、上記のような繋ぎ方によるエネルギーの違いはない。
計算による予測の結果を分析する上で、最小流域Bから、なんらかの意味のある経路を得ることは有効なため、このような経路として、たとえば、次のとおりの2つの経路生成法を用いた。
1つは、Minimax経路である。エネルギー地形は、最小木問題の変形の一つであるMinimax経路問題との関連が深い。これは、最小木の部分グラフになるMinimax経路木を構成して、グラフ上の2点を結ぶMinimax経路を求める問題である。つまり、このMinimax経路というのは、最小木(Minimum Spanning Tree)上の経路になる。たとえば、ある地点からほかのある地点まで、砂漠を横断する時に、最短経路で横断するよりも、横断する経路において、砂漠に点在するオアシス間の最大距離ができるだけ小さい経路を選択したいという場合の経路が、このMinimax経路である。
このMinimax経路は、ある一つの構造に注目した時に、その構造を隣接構造として求めた基準構造をたどることで生成することができる。
もう1つの方法は、ダイクストラ法による最短経路である。エネルギー地形において、エネルギーはグラフの頂点に割り当てられていることから、経路上のエネルギーの和が最小の経路ということになる。この経路を求めるためには、最小流域Bの構造からなるグラフを求める必要がある。まず、隣接行列を求めてから経路を生成することになるが、この隣接行列の各要素は、該当する構造間の距離によって与えられる。二次構造Sは、構造が持つ塩基対の集合として定義されている。そして、2つの構造SとSとの間の距離は、それらの集合の対称差の大きさによって定義される。つまり、距離D(S,S)は、下記数2に例示した関係となる。
Figure 2005267592
このため、D>1のとき、隣接行列の要素が0になり、D=1のとき1となる。D(S,S)=0の場合は、SとSは、同じ構造だということを示すが、最小流域法では重複判定(重複検査)をするため、同じ構造は最小流域Bに現れない。
また、グラフの頂点の数をn、辺の数をmとした場合、ダイクストラ法に必要な時間は、O(n log n)=O(m log n)であるが、隣接行列を求めるために必要な時間はO(n)であることから、隣接行列を求めるための時間が全体の半分以上とすることができる。このように解析時間について述べたが、ここでのダイクストラ法でボトルネックとなるのは、メモリ容量である。そのため、隣接行列を記憶するためのメモリの使い方を改善する必要がある。行列の要素は、0または1であるため、32ビットのint型にはおよそ30倍の要素を記憶できる。また、この行列は対称になるので、行列全体の半分だけ記憶すればよい。このようなことから、使用するメモリを約1/60にすることができる。
DNA計算の分野では、様々な展開がなされてきているが、その中で、DNA分子を使ったナノスケールの分子機械を設計・実装しようという試みがある。たとえば、入力信号の順序によって逐次的に構造が変化することで、より多くの状態を表現できる多状態分子機械が提案され、連続するヘアピン構造の逐次的開裂を利用した分子機械の設計が行われている(H.Uejima and M.Hagiya,Preliminary Proc.of 9th Int.Meeting on DNA Based Computers(DNA9),80−91.,2003)。このヘアピン多状態機械では、入力信号としてDNAを加え、その入力DNAが交叉点移動(Branch Migration)により、ヘアピン構造のステム部分に割り込むことでヘアピン構造を開いていく。
このような動作を実現するためのDNA配列(あるいは、RNA配列)の設計において、二次構造DNAのNearest−Neighborモデルに基づく熱力学エネルギーを考慮した構造変化経路を利用することが考えられる。
そして、配列設計の基準としては、
(1)配列間干渉を排除するための順序性と選択性、
(2)適切な構造変化におけるエネルギー障壁の最小化と、不適切な構造変化におけるエネルギー障壁の最大化、および
(3)適切な二次構造やその近傍の準最適な構造も含めた出現頻度の最大化、
の3つが挙げられる。
「選択性」とは、交叉点移動の起点となる一本鎖部分(sticky end)が現れている時に、そのsticky endとsticky endのあとに繋がっているヘアピン構造のステム部分に相補的な入力DNAだけが、ヘアピン構造を開くことができる性質を意味する。これは、想定される入力DNAのみが選択されてヘアピン構造を開くための条件である。また、選択性は、sticky endのあるヘアピン構造と入力DNAとの二分子での最小自由エネルギー構造と、ヘアピン構造が開いた時、または、閉じたままの時の構造との距離によって検証される。
「順序性」とは、sticky endが現れていない部分、つまり、2つの連続するヘアピン構造間において、入力DNA(入力オリゴマー)が加わってもヘアピン構造が開かれない(崩れない)性質を意味する。これは、逐次的な構造変化をするために、ヘアピンを開く順序が守られるための条件である。順序性の検証には、Morgan−Higgs法の経路によるエネルギー障壁と、エネルギー差を利用することができ、そのような基準が利用されている。この出願の発明によって、エネルギー障壁の解析、特定において、Morgan−Higgs法だけでなく、最小流域アルゴリズムを利用することができる。
出現頻度の最大化は、分子の構造変化の反応が平衡反応であることから、できるだけ目的の構造が多く存在するようにするものである。準最適なエネルギーの構造を求める際には、公知のアルゴリズム(S.Wuchty,et al.,Biopolymers,49:145−165,1999等)を利用することができる。
そして、たとえば、Vienna Packageを利用した逆フォールディング法(URL:http://www.tbi.univie.ac.at/ivo/RNA/)で、分子機械DNAの一部となるヘアピン構造が最も安定な配列を求め、上記のような検査を網羅的に行って、良い条件の配列を選択することでDNA配列を決定する。なお、「逆フォールディング」とは、二次構造を先に与えて、その二次構造を最小自由エネルギーの構造とする配列や、その二次構造をとる確率が最大になる(もしくは十分に大きい)配列を求めるという問題である。この問題は、二次構造の自由エネルギーと分配関数によって表現されたコスト関数を最小化する配列を探索する問題として定式化することができ、また、分配関数を求めるには、たとえば、McCaskillのアルゴリズム(J.S.McCaskill,Biopolymers,29:1105−1119,1990)を利用することができる。
この出願の発明は、ヘアピン構造を有する多状態分子機械において、分岐できる状態を実現するための基礎として、2つのヘアピン構造が一本鎖部分で繋がっているDNA配列を逆フォールディングで求め、動作確認をする。このような多状態分子機械(分岐機械)は、図8に例示したように、1回だけ分岐できるものであり、一方のヘアピンループが開いた構造で分岐した状態を表現しようとするものである。そのため、ヘアピンループが1つ開いた構造は適切であるが、同時に2つ開いた構造は不適切となる。なお、(A)はヘアピン構造におけるクローズド状態(初期状態)を示し、(B)は左側ヘアピン構造の開裂状態を、(C)は右側ヘアピン構造が開裂できない状態をそれぞれ示しており、(D)は特に(B)および(C)の状態におけるエネルギーの変化を示したグラフである。この(D)における「B」は不適切な構造変化におけるエネルギー障壁の最大箇所を示し、「V」は適切な構造変化の前後におけるエネルギー差を示しており、白抜きの三角印は(B)の状態(適切な形態)を、黒塗りの三角印は(C)の状態(不適切な形態)を示している。
配列設計(すなわち、多状態分子機械の設計基準)においては、逆フォールディングで求められた配列に対して、
(1)不適切な構造変化におけるエネルギー障壁の最大化、
(2)適切な形態と不適切な形態とのエネルギー差を最小化
の2つを基準として、この出願の発明における最小流域法による解析結果を利用して、構造変化経路の検査を行う。そして、最も良い条件の配列で動作確認の実験を行い、入力DNAの順序によって、それぞれ1つのヘアピンループが開いた異なる構造をとり、2つのヘアピンループが開いた構造には変化しないという、目的とする動作が実現できることができる。実際のDNAを用いた実験の結果、最小流域アルゴリズムの反応解析の結果で、実際の分子反応の挙動を説明できる。
このように、逆フォールディングと構造変化経路を用いた配列設計によって、目的の動作を行うことができる分岐状態を実現することができる多状態分子機械を有効に設計することができる。
以下にこの多状態分子機械の設計のための処理について、図9および図10を適宜参酌しながらより詳細に説明する。図9はエネルギー地形解析のための処理のフローチャートである。また、図10は、多状態分子機械の設計のための処理の機能ブロック図である。なお、多状態分子機械の設計装置のシステム構成は、基本的に上記の図3と同様である。
図9および図10に沿って説明すると、上記のような動作を実現するためのDNA配列(あるいは、RNA配列)を有する多状態分子機械の設計手順としては、上記のとおりのエネルギー地形解析方法、または、エネルギー地形解析装置による解析結果に基づくことにより、効率よく、DNA分子、または、RNA分子を構成する塩基配列を有する多状態分子機械の設計を実現することができる。
<ステップI>
まず、処理部(3)が、多状態分子機械に、2つの二本鎖部分であるヘアピン構造間を繋ぐ一本鎖部分である一本鎖構造と、少なくとも2つの二本鎖部分であるヘアピン構造とを持つ複合構造を与えて、この複合構造が最も安定な構造となる塩基配列を算出する(塩基配列手段)。
<ステップII>
次に、処理部(3)が、2つのヘアピン構造間にある一本鎖構造の塩基配列と、この一本鎖構造と隣接している少なくともどちらか一方のヘアピン構造の塩基配列とそれぞれに対して相補的である前記ヘアピン構造を崩すための入力オリゴマーを算出する(入力オリゴマー算出手段)。
<ステップIII>
次に、処理部(3)が、ステップ(I)にて算出された複合構造の塩基配列に対して、多状態分子機械の設計基準に基づく検査を行う(検査手段)。
<ステップIV>
次に、処理部(3)が、ステップ(I)から(III)を繰り返して、その中から多状態分子機械の設計基準を満たす前記塩基配列および前記入力オリゴマーを出力する(塩基配列出力手段)。
以上により、最終的に、上記のとおりの目的の動作を行うことができる分岐状態を実現することができる多状態分子機械を実現するためのDNA配列(あるいは、RNA配列)を有する多状態分子機械、また分岐状態をじつを設計することができる。
そして、このような配列設計で求められた最も良い条件の配列として、たとえば、表2のような配列(DNA配列)を用いている。
Figure 2005267592
表2に例示したとおり、分岐機械となるヘアピンDNAが114塩基長(配列番号1)、入力となるDNA(入力オリゴマー)はそれぞれ40塩基長であり、Open5は5’側(配列番号2)、Open3は3’側(配列番号3)のヘアピンループを開くための入力DNA(入力オリゴマー)である。
図11に、この出願の発明おける最小流域法によるMinimax経路上のエネルギー変化を示す。この最小流域法においては、経路の生成法に2種類の方法があるが、Minimax経路と最短経路でわずかな違いがみられるだけであり、いずれの経路においても、障壁になるであろうと考えられる構造は同一である。この構造は、図11中にて、三角印の左下の頂点によって示されている。
この図11に例示したとおり、最小流域法は、従来のMorgan−Higgs法によるDirect Pathの経路では求めることができなかった真のエネルギー障壁を見つけることができ、このため、5’側および3’側の双方にも、構造変化前の基準構造Sよりも不安定な構造を経由する必要もない。なお、図12に、比較対照として、モーガンヒッグスヒューリスティックス(Morgan−Higgs法)におけるエネルギー変化を例示した。
さらに、最小流域法では、経路上のエネルギー障壁の議論だけでなく、最小流域Bを用いた解析や途中経路の分析もすることができる。
次の表3にて、最小流域Bと経路の特徴を例示した。
Figure 2005267592
最初の欄は、最小流域を構成している構造の数で、ここでは構造変化後の目標構造Sに到達するまでに取り得る構造の数を示している。次の欄は、構造変化前の基準構造Sのエネルギーからみた、エネルギー障壁になるであろうと考えられる構造のエネルギーB、そして、その構造に到達するまでに到達し得る構造の数と、流域に対するその構造数の割合を示している。最後の欄は、得られた経路の長さで、距離というのは、Direct Pathの長さである。
ここで、構造変化の分析をする上で、以下の3つの基準を考えることができる。
1つ目は、エネルギー障壁である。ここでは、このような障壁としてBを用いている。5’側のBは約−5kcal/molであり、3’側は約−0kcal/molである。3’側のBは、5’側と比較して高い障壁になっていることを示している。
2つ目は、最小流域Bを構成する構造の数|B|である。5’側約3400構造であり、3’側は約65000構造である。3’側の構造変化後の目標構造Sに到達するまでに取り得る構造の数が、ここでは、5’側の約20倍近くになる。
3つ目は、Bの構造に到達するまでに取り得る構造の数の最小流域に対する割合である。5’側はこの割合が、約67〜69%であるのに対して、3’側は約93〜95%であった。この割合も、3’側が5’側と比較して高い。特に、3’側における割合は非常に高く、大半の構造が、この部分流域に存在することが考えられる。
以上から、この出願の発明における最小流域法の利用によって、実際の分子反応における3’側の反応が5’側の反応と比べて起こりにくいことを説明することができる。構造の数とその割合は、Bの大きさによって大きくなるものだが、配列設計などの場合は、最もよいと考えられる指標は構造の数だと考えられる。構造の数にある閾値を設けて、それを基準に判定することが最も効率的な方法であることが考慮される。
なお、5’側についての最小流域の計算に用いるコンピュータとしては、特に限定されるものではないが、たとえば、Windows(登録商標)2000、Pentium(登録商標)3500MHz、320MBRAMのコンピュータ環境でも行うことができる。このようなコンピュータ環境の場合では、8〜9秒(CPU時間)かかり、約200MBのメモリを使用することになる。計算する時の配列は、入力+仮想塩基+分岐機械である。たとえば、156塩基長(入力+仮想塩基+分岐機械=40+4+114)等のように100塩基を超える長い配列長でも、最小流域法ならば十分解析をすることができる。
以上のような優れた特徴を有するこの出願の発明における最小流域Bに、たとえば、Flooding法等の解析手法を組み合わせることもでき、構造のエネルギーと構造間の隣接関係が定義できるものであれば、DNA分子やRNA分子等の核酸分子はもちろん、蛋白質等その他の物質についても適用でき、解析ができる。また、この手法を用いた配列設計により、より安定で、分岐状態を効率よく実現できる多状態分子機械の実現も可能となる。
なお、この出願の発明の多状態分子機械における「ヘアピン構造」とは、上記図1に沿って説明したが、より詳しく説明すると、一本鎖DNA分子または、一本鎖RNA分子の塩基配列中に、相補的な部分配列が存在すると形成される2次構造のことである。このヘアピン構造の中で二本鎖を形成している部分(“stem”)とヘアピン構造の末端に塩基対を形成していない部分(“sticky end”)とからなる、一本鎖DNA分子または一本鎖RNA分子である。また、逐次的にDNA分子またはRNA分子の状態遷移を得るためには、このヘアピン構造が複数個備えられ、連続的に配置されていることが好ましい。なお、ヘアピン構造を構成する一本鎖DNA分子または一本鎖RNA分子の塩基配列は、ヘアピン構造を形成するのであれば、当然に限定されるものではない。また、複数のヘアピン構造が備えられている場合、ヘアピン構造それぞれが、異なる塩基配列による一本鎖DNA分子または一本鎖RNA分子で構成されていてももちろんよい。この出願の発明において、RNA分子よりDNA分子のほうが、安定であるため、DNA分子を利用することが好ましい。
「入力オリゴマー(または、インプットオリゴマー)」とは、“stem”および“sticky end”の塩基配列に対して相補的な塩基配列を有する一本鎖DNA分子または一本鎖RNA分子であり、この入力オリゴマーをヘアピン構造に作用させると、2次構造変化(“branch migration”)が起こり、その結果ヘアピン構造の開裂が生じる。入力オリゴマーは、10から50塩基の範囲で、形成されることが好ましい。入力オリゴマーにおいても、前記のとおり、複数種のヘアピン構造の場合、それぞれのヘアピン構造に対応して、複数種の入力オリゴマーが使用される。
「逐次的」とは、一本鎖DNA分子または一本鎖RNA分子が連続して2個以上のヘアピン構造が形成される場合、連続したヘアピン構造のうち、“sticky end”を有している末端のヘアピン構造のみが、このヘアピン構造に対応する入力オリゴマーによって開裂が生じることである。詳しくは、他のヘアピン構造は、“stem”の配列に相補的な配列を有する入力オリゴマーが存在していても、“sticky end”を有していないため、入力オリゴマーが結合できず開裂は生じない。しかし、末端のヘアピン構造が開裂すると、その開裂したヘアピン構造の“stem”であった部分が一本鎖となり(すなわち、“sticky end”に相当する)、そこに入力オリゴマーが結合し、隣接するヘアピン構造も開裂する。つまり、連続するヘアピン構造においては、一端から順序性を保って他端へ次々と開裂し、しかもヘアピン構造と入力オリゴマーの塩基配列が、相互に対応している必要があるため、ヘアピン構造の塩基配列と入力オリゴマーの塩基配列とが対応(相補的)していなければ、開裂が生じない。すなわち、選択性をも備えている。
「分子状態」とは、物理的、もしくは化学的に分子の性質が一定時間以上持続することであり、特にこの出願の発明においては、一本鎖DNA分子または一本鎖RNA分子で構成されている前記のヘアピン構造が開裂状態であるか、または未開裂状態であるかを意味し、前記のヘアピン構造が、順次に開裂していく状態のことである。
また、「多状態分子機械」は、分子状態の遷移により信号の伝達、もしくは信号の出力を行うことも特徴としており、ヘアピン構造のDNA分子またはRNA分子(外部からの入力に応じて、その状態を遷移可能な分子)を機械、すなわち分子機械とみなし、入力オリゴマーのDNA分子またはRNA分子をその機械の入力操作としてみなし、ヘアピン構造の開裂状態および未開裂状態の状態遷移を備え、これを利用したプログラムの演算等をおこなうことのできるものである。たとえば、分子メモリのアドレッシング等があり、この出願の発明を適用することができる。分子メモリアドレッシングは、ヘアピン構造の塩基配列が種々の順序で連結された分子の集合を用意し、入力オリゴマーの入力列をアドレスとしてみなすと、それによって特定の分子のみが、ヘアピン構造をすべて開裂することにより、そのアドレスに対応する分子を特定でき、アドレッシングが行われることとなることを特徴としている。
このような特徴を有する多状態分子機械は、たとえば、入力オリゴマーを添加し、ヘアピン構造を開裂させることによって、その際の一本鎖DNA分子と二本鎖DNA分子との導電性の差異に基づいた電気信号の伝達によって、入力された情報を伝達することも考えられる。また、ヘアピン構造の大きく開裂する側の一端に蛍光物質等を付加させ、この蛍光物質の波長の変化をもって、状態を検出すること等も期待できる。
なお、この出願の発明における分岐状態を有する分子機械を実現するのにあたり、上記の表2に例示した、配列番号1の塩基配列からなるヘアピン構造を有し、このヘアピン構造に対応(相補的)した配列番号2および3の入力オリゴマーが、最小流域法によって得られた構造変化経路から配列設計における最適な条件を備えたものであり、好ましい。そして、上記のヘアピン構造を次々と連結させ、多状態分子機械とすることもできる。
もちろん、この出願の発明は以上の例示によって限定されるものではなく、その細部の形態において様々に可能であることは言うまでもない。
ループ構造の種類を例示した模式図であり、(A)はヘアピン構造、(B)はスタック構造、(C)はバルジ構造、(D)は内部構造、(E)は3−ループ構造である。 この出願の発明におけるエネルギー地形解析について説明するためのフローチャートである。 エネルギー地形解析を実行するエネルギー地形解析装置を例示したシステム構成図である。 この出願の発明におけるエネルギー地形解析について説明するための機能ブロック図である。 この出願の発明における、二次構造を表現するデータ構造として、87塩基長の配列がとる構造を例示した模式図であり、(A)は平面グラフ、(B)はOrdered Root Tree、(C)はRing List Tree、(D)はドットと括弧によって、それぞれ示した図である。 この出願の発明におけるBase Pair Listの例として、18塩基長の配列がとる構造を示した模式図であり、(A)はドットと括弧による表現、(B)は(A)のそれぞれの構造に対応するBase Pair List、(C)はこれらすべてを表現するRing List Treeである。 塩基対の形成または解離において差分になる3つのk−ループとRing List Treeの変化の状態を例示した模式図であり、(A)は塩基対の形成、(B)は塩基対の解離を示している。 分岐機械の状態変化を例示した模式図とその設計基準を例示した図であり、(A)はクローズド状態(初期状態)、(B)は左側ヘアピン構造の開裂状態、(C)は右側ヘアピン構造が開裂できない状態であり、(D)はエネルギーの変化を示したグラフである。 この出願の発明における多状態分子機械設計について説明するためのフローチャートである。 この出願の発明における多状態分子機械設計について説明するための機能ブロック図である。 最小流域法によるMinimax経路上のエネルギー変化を例示した図である。 モーガンヒッグスヒューリスティックスにおけるエネルギー変化を例示した図である。
符号の説明
1 表示部
2 入力部
3 処理部(CPU)
4 主記憶部(メインメモリ)
5 バス
6 データベース

Claims (10)

  1. 基準構造Sから目標構造Sに構造が変化する解析対象物質Xの構造変化経路におけるエネルギー障壁を含むエネルギーのエネルギー地形を解析する方法であって、
    (I)処理部が、解析対象物質Xの基準構造Sに対して隣接する隣接構造を探索するステップ、
    (II)前記処理部が、探索された前記隣接構造が、以前にも探索された隣接構造であるか、または、新たに探索された隣接構造であるかを判定するステップ、
    (III)前記処理部が、新たに探索されたと判定された前記隣接構造のエネルギーを計算するステップ、
    (IV)前記処理部が、計算された前記エネルギーを既存のエネルギー障壁の閾値と比較して、該エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造を、隣接構造の集合である隣接集合Nを管理する優先度付き待ち行列に追加するステップ、
    (V)前記処理部が、ステップ(I)から(IV)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返すステップ、
    (VI)前記処理部が、隣接集合Nから最小エネルギーの隣接構造を選択して、基準構造Sと目標構造Sとを結ぶ最小の流域の集合である最小流域Bに移行させるステップ、および
    (VII)前記処理部が、ステップ(I)から(VI)を、目標構造Sが最小流域Bに移行されるまで繰り返すステップ、
    を含むことを特徴とするエネルギー地形解析方法。
  2. 請求項1記載のエネルギー地形解析方法をコンピュータに実行させるためのエネルギー地形解析プログラム。
  3. 請求項2記載のエネルギー地形解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
  4. 基準構造Sから目標構造Sに構造が変化する解析対象物質Xの構造変化経路におけるエネルギー障壁を含むエネルギーのエネルギー地形を解析する装置であって、
    (I)解析対象物質Xの基準構造Sに対して隣接する隣接構造を探索する手段、
    (II)探索された前記隣接構造が、以前にも探索された隣接構造であるか、または、新たに探索された隣接構造であるかを判定する段、
    (III)新たに探索されたと判定された前記隣接構造のエネルギーを計算する手段、
    (IV)計算された前記エネルギーを既存のエネルギー障壁の閾値と比較して、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造を、隣接構造の集合である隣接集合Nを管理する優先度付き待ち行列に追加する手段、
    (V)上記(I)から(IV)を、エネルギー障壁の閾値よりも小さいエネルギーを有する隣接構造すべてを優先度付き待ち行列に追加するまで繰り返す手段、
    (VI)隣接集合Nから最小エネルギーの隣接構造を選択して、基準構造Sと目標構造Sとを結ぶ最小流域の集合である最小流域Bに移行させる手段、および
    (VII)上記(I)から(VI)を、目標構造Sが最小流域Bに移行されるまで繰り返す手段、
    を備えていることを特徴とするエネルギー地形解析装置。
  5. 請求項1記載のエネルギー地形解析方法、または、請求項4記載のエネルギー地形解析装置による解析結果に基づいて、DNA分子、または、RNA分子を構成する塩基配列を有する多状態分子機械を設計する方法であって、
    (I)処理部が、多状態分子機械に、2つの二本鎖部分であるヘアピン構造間を繋ぐ一本鎖部分である一本鎖構造と、少なくとも2つの二本鎖部分であるヘアピン構造とを持つ複合構造を与えて、この複合構造が最も安定な構造となる塩基配列を算出するステップ、
    (II)前記処理部が、2つのヘアピン構造間にある一本鎖構造の塩基配列と、この一本鎖構造と隣接している少なくともどちらか一方のヘアピン構造の塩基配列とそれぞれに対して相補的である前記ヘアピン構造を崩すための入力オリゴマーを算出するステップ、
    (III)前記処理部が、算出された前記複合構造の塩基配列に対して、多状態分子機械の設計基準に基づく検査を行うステップ、および
    (IV)前記処理部が、ステップ(I)から(III)を繰り返して、その中から多状態分子機械の設計基準を満たす塩基配列を出力するステップ、
    を含むことを特徴とする多状態分子機械の設計方法。
  6. 多状態分子機械の設計基準は、1つのヘアピン構造が崩れた適切な形態から2つのヘアピン構造が同時に崩れた不適切な形態へと形態が変化する形態変化経路におけるエネルギー障壁の最大化および適切な形態と不適切な形態とのエネルギー差の最小化であることを特徴とする請求項5記載の多状態分子機械の設計方法。
  7. 請求項5または6記載の多状態分子機械の設計方法をコンピュータに実行させるための多状態分子機械の設計プログラム。
  8. 請求項7記載の多状態分子機械の設計プログラムを記録したコンピュータ読み取り可能な記録媒体。
  9. 請求項1記載のエネルギー地形解析方法、または、請求項4記載のエネルギー地形解析装置による解析結果に基づいて、DNA分子、または、RNA分子を構成する塩基配列を有する多状態分子機械を設計する装置であって、
    (I)多状態分子機械に、2つの二本鎖部分であるヘアピン構造間を繋ぐ一本鎖部分である一本鎖構造と、少なくとも2つの二本鎖部分であるヘアピン構造とを持つ複合構造を与えて、この複合構造が最も安定な構造となる塩基配列を算出する手段、
    (II)2つのヘアピン構造間にある一本鎖構造の塩基配列と、この一本鎖構造と隣接している少なくともどちらか一方のヘアピン構造の塩基配列とそれぞれに対して相補的である前記ヘアピン構造を崩すための入力オリゴマーを算出する手段、
    (III)算出された前記複合構造の塩基配列に対して、多状態分子機械の設計基準に基づく検査を行う手段、および
    (IV)前記処理部が、上記(I)から(III)を繰り返して、その中から多状態分子機械の設計基準を満たす前記塩基配列および前記入力オリゴマーを出力する手段、
    を備えていることを特徴とする多状態分子機械の設計装置。
  10. 多状態分子機械の設計基準は、1つのヘアピン構造が崩れた適切な形態から2つのヘアピン構造が同時に崩れた不適切な形態へと形態が変化する形態変化経路におけるエネルギー障壁の最大化および適切な形態と不適切な形態とのエネルギー差の最小化であることを特徴とする請求項9記載の多状態分子機械の設計装置。
JP2004120918A 2004-03-18 2004-03-18 エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置 Pending JP2005267592A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004120918A JP2005267592A (ja) 2004-03-18 2004-03-18 エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004120918A JP2005267592A (ja) 2004-03-18 2004-03-18 エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置

Publications (1)

Publication Number Publication Date
JP2005267592A true JP2005267592A (ja) 2005-09-29

Family

ID=35092036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004120918A Pending JP2005267592A (ja) 2004-03-18 2004-03-18 エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置

Country Status (1)

Country Link
JP (1) JP2005267592A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103827875A (zh) * 2011-09-26 2014-05-28 富士胶片株式会社 用于预测质点系统的行为的仿真装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103827875A (zh) * 2011-09-26 2014-05-28 富士胶片株式会社 用于预测质点系统的行为的仿真装置

Similar Documents

Publication Publication Date Title
Bianchi et al. Hybrid metaheuristics for the vehicle routing problem with stochastic demands
Pérez-Rodríguez et al. A hybrid estimation of distribution algorithm for the vehicle routing problem with time windows
Merz et al. Fitness landscapes and memetic algorithm design
Knowles et al. Reducing local optima in single-objective problems by multi-objectivization
Lin et al. Applying hybrid meta-heuristics for capacitated vehicle routing problem
Nemati et al. A novel ACO–GA hybrid algorithm for feature selection in protein function prediction
Nagata et al. A new genetic algorithm for the asymmetric traveling salesman problem
Prins et al. Tour splitting algorithms for vehicle routing problems
Pérez et al. Variable neighborhood tabu search and its application to the median cycle problem
Estevez et al. Selecting the most influential nodes in social networks
Daolio et al. Communities of minima in local optima networks of combinatorial spaces
US20150019592A1 (en) Systems, methods and software for computing reachability in large graphs
Caserta et al. A hybrid algorithm for the DNA sequencing problem
US20100225650A1 (en) Networks for Organic Reactions and Compounds
JP4940396B2 (ja) Rna配列情報処理装置
Whelan New approaches to phylogenetic tree search and their application to large numbers of protein alignments
Mweshi et al. An improved grammatical evolution approach for generating perturbative heuristics to solve combinatorial optimization problems
Islam et al. RNA secondary structure prediction with pseudoknots using chemical reaction optimization algorithm
Pop et al. A genetic algorithm for solving the generalized vehicle routing problem
Basu et al. A review of the tabu search literature on traveling salesman problems
Ren et al. An iterated three-phase search approach for solving the cyclic bandwidth problem
Rezazadegan et al. Multiplicity of phenotypes and RNA evolution
JP2005267592A (ja) エネルギー地形解析方法、エネルギー地形解析プログラムおよびこのプログラムを記録したコンピュータ読み取り可能な記録媒体ならびにエネルギー地形解析装置
Zok et al. New models and algorithms for RNA pseudoknot order assignment
Takitou et al. Ant colony optimization for predicting RNA folding pathways

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406