JPWO2007116787A1 - Rnaの二次構造予測方法、予測装置及び予測プログラム - Google Patents

Rnaの二次構造予測方法、予測装置及び予測プログラム Download PDF

Info

Publication number
JPWO2007116787A1
JPWO2007116787A1 JP2008509798A JP2008509798A JPWO2007116787A1 JP WO2007116787 A1 JPWO2007116787 A1 JP WO2007116787A1 JP 2008509798 A JP2008509798 A JP 2008509798A JP 2008509798 A JP2008509798 A JP 2008509798A JP WO2007116787 A1 JPWO2007116787 A1 JP WO2007116787A1
Authority
JP
Japan
Prior art keywords
stem
sequence
stem structure
rna
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008509798A
Other languages
English (en)
Other versions
JP5022361B2 (ja
Inventor
穣 秋冨
穣 秋冨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2008509798A priority Critical patent/JP5022361B2/ja
Publication of JPWO2007116787A1 publication Critical patent/JPWO2007116787A1/ja
Application granted granted Critical
Publication of JP5022361B2 publication Critical patent/JP5022361B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/10Nucleic acid folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Abstract

シュードノット構造など二次構造の予測が困難であった二次構造の予測を行い得るRNAの二次構造予測方法及びこの予測方法を用いたRNAの二次構造予測装置を提供する。本発明によるRNAの二次構造予測方法は、対象となるRNA配列のうちステム構造を形成し得る塩基を探索する工程と、前記ステム構造を構成する各塩基の自由エネルギーに基づいて、ステム構造候補を設定する工程と、前記ステム構造候補から確定ステム構造を設定する工程と、前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する工程と、前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する工程と、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する工程と、を有することを特徴とする。

Description

本発明は、RNAの二次構造予測方法、この予測方法を用いた予測装置及びこの予測方法を実行する予測プログラムに関する。
RNAは、アデニン(A)、シトシン(C)、グアニン(G)及びウラシル(U)の4種類の塩基からなる核酸であり、AとU、GとCなどの組み合わせで水素結合を形成して塩基対となり、その組み合わせによって様々な二次構造を形成する。このRNAの二次構造の種類としては、塩基対の連続する領域であるステム構造をはじめ、例えば図7Aにあるような様々な二次構造が挙げられる。とりわけ、機能性RNAにおいて、二次構造以上の高次構造は、RNAの機能と密接に関わる。そのため、RNAの構造を知ることは、非常に重要である。しかしながら、実験的なRNAの構造解析には、多大な労力とコスト等を必要とする。従って、コンピューター等による構造予測シミュレーションを行う方法が古くから研究されてきた。従来の二次構造の予測方法の一例としては、例えば特許文献1のようなものがある。
従来のRNAの二次構造を予測する方法のうち、一本のRNA配列から二次構造の予測を行う方法は、大きく分けて2通りの方法が存在する。その一つは、動的計画法を用いて自由エネルギーの計算を行う手法であり、他の一つは、先にステム構造候補を列挙して、ニューラルネットワークなどを用いてその組み合わせの最適化を図る方法である。これらについては、非特許文献1などに述べられており、特に動的計画法による二次構造予測及びその自由エネルギー計算に用いるパラメータについては、非特許文献2などに詳しく述べられている。
動的計画法による二次構造を予測する方法を用いる場合、その計算は、比較的高速であるが、シュードノット構造の予測が困難である。一方、組み合わせ最適化を用いる手法では、シュードノット構造を予測することはできても、比較的低速であるという特徴がある。
また、このどちらの方法を用いたとしても、RNAがシュードノット構造をとるときの自由エネルギーの値は実験的に調査されていないため、構造予測にシュードノット構造のパラメータを用いることができないという問題がある。
さらに、この他にも、RNAの二次構造予測に複数の配列を用いて、その進化学的関係から二次構造予測を行う手法(構造アラインメントによる方法)なども存在するが、この方法は、性質上、人工的に合成されたRNAの構造予測に用いることはできない。
特許公開平8−154677号公報 金久實著、「ポストゲノム情報への招待」、共立出版、2001年6月10日、p.108−111 岡崎康司/坊農秀雅監訳、「バイオインフォマティクス ゲノム配列から機能解析へ」、株式会社メディカル・サイエンス・インターナショナル、p.212−242 Gorodkinら著、"Discovering common stem−loop motifs in unaligned RNA sequences"、2001年、Nucleic Acids Research、29巻、10号、p.2135−2144
本発明は、上述の問題に鑑みてなされたものであり、シュードノット構造など二次構造の予測が困難であった二次構造の予測を行い得るRNAの二次構造予測方法及びこの予測方法を用いたRNAの二次構造予測装置を提供することを目的とする。
本発明によるRNAの二次構造予測方法は、対象となるRNA配列のうちステム構造を形成し得る塩基を探索する工程と、前記ステム構造を構成する各塩基の自由エネルギーに基づいて、ステム構造候補を設定する工程と、前記ステム構造候補から確定ステム構造を設定する工程と、前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する工程と、前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する工程と、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する工程と、
を有することを特徴とする。
本発明によるRNAの二次構造予測装置は、対象となるRNA配列のうちステム構造を形成し得る塩基を検索して、ステム構造候補を設定するステム構造候補探索手段と、前記ステム構造候補から確定ステム構造を設定する確定ステム構造設定手段と、前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する配列構造状態調査手段と、前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する配列エネルギー状態計算手段と、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する追加ステム構造探索手段と、を有することを特徴とする。
本発明によるRNAの二次構造予測プログラムは、 対象となるRNA配列のうちステム構造を形成し得る塩基を探索する工程と、
前記ステム構造を構成する各塩基の自由エネルギーに基づいて、ステム構造候補を設定する工程と、
前記ステム構造候補から確定ステム構造を設定する工程と、
前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する工程と、
前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する工程と、
前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する工程と、
を実行することを特徴とする。
第1の効果は、自由エネルギー計算によるシュードノット構造を含んだ二次構造の予測ができることにある。
その理由は、シュードノット構造をステム構造の周辺の構造のパターンに応じた他の二次構造の組み合わせに置換して構造予測を行うためである。
本発明によるRNAの二次構造予測装置の一例を示す概念図である。 本発明によるRNAの二次構造予測方法のフローチャートの一例である。 ステム構造候補探索のフローチャートである。 配列構造状態調査のフローチャートである。 配列エネルギー状態計算のフローチャートである。 追加ステム構造探索のフローチャートである。 RNAの二次構造の例を示す概略図である。 本発明における二次構造の判定式の一例である。 ステム構造領域を示す概略図である。 未検索領域の一例を示す概略図である。 入力RNA配列の構造状態とこれに対応する自由エネルギーの一例を示す。 未検索領域の一例を示す他の概略図である。 入力RNA配列の構造状態とこれに対応する自由エネルギーの一例である。 未検索領域の一例を示すさらに他の概略図である。
符号の説明
1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
21 ステム構造候補探索手段
22 確定ステム構造設定手段
23 配列構造状態調査手段
24 配列エネルギー状態計算手段
25 追加ステム構造探索手段
26 配列構造エネルギー状態計算手段
31 記憶部記憶部
32 ステム構造候補記憶部
33 確定ステム構造記憶部
34 配列構造状態記憶部
35 配列エネルギー状態記憶部
本発明は、一本のRNAによるステム構造の組み合わせ最適化の方法の一つとして分類されると考えられるが、予測には自由エネルギー計算を用いる。自由エネルギー計算を行う上で問題となるシュードノット構造を、その周辺のステム構造との位置関係によって、既知の他の構造の組み合わせとして扱うことによって、自由エネルギー計算を実現する。
以下、図面を参照しながら、本発明の好適な実施形態につき、説明する。
本発明によるRNAの二次構造予測装置は、図1を参照すると、キーボードなどの入力装置1と、プログラム制御により動作するデータ処理装置(コンピュータ;中央処理装置;プロセッサ)2と、情報を記憶する記憶装置3と、ディスプレイ装置や印刷装置等の出力装置4とを有する。
記憶装置3は、記憶部記憶部31と、ステム構造候補記憶部32と、確定ステム構造記憶部33と、配列構造状態記憶部34と、配列エネルギー状態記憶部35とを備える。
記憶部記憶部31は、塩基対が連続することによる自由エネルギーの値、ループ構造が形成されることによる自由エネルギーの値、許容される最低のステム構造の長さ、シュードノット構造の長さ、二次構造予測の試行回数などの、計算中には変更されない数値情報を予め記憶する。
ステム構造候補記憶部32は、ステム構造候補探索手段21によって探索されステム構造の候補部位であるステム構造候補に関する各種の情報を記憶する。例えば、ステム構造候補記憶部32は:ステム構造候補を構成する塩基;この塩基が入力されたRNA配列(以下、入力RNA配列とも称する。)において例えばRNA配列の末端から何残基目の塩基に相当するかという情報;ステム構造候補がステム構造を形成した際の自由エネルギーの値;等を記憶する。この際、ステム構造候補は、各ステム構造の保持する自由エネルギーの昇順に整列されてもよく、ユーザーの所望に応じた順序に整列されてもよい。
確定ステム構造記憶部33は、その周回で採用されることが決まったステム構造候補が、ステム構造候補記憶部32のどこに記憶されているかを記憶する。
配列構造状態記憶部34は、入力されたRNA配列についての計算の過程で各塩基がどのような構造状態をとっているか等の、配列構造状態調査手段23によって判定された結果を記憶する。構造状態としては、ステムの一部、バルジループの一部、内部ループの一部、ヘアピンループの一部、多岐ループの一部、一本鎖、RNA配列の端の一部などの末端構造が挙げられる。
配列エネルギー状態記憶部35は、配列構造状態記憶部34に記憶されている各構造状態の自由エネルギー等に基づいて配列エネルギー状態計算手段24によって計算した結果の数値(例えば、各構造状態のエネルギー状態を示すもの)を各塩基ごとに記憶する。隣接する同一の構造に含まれる塩基同士は、同一の数値を保持する。例えば、同一の内部ループの一部である塩基は全て、その内部ループが持つ自由エネルギーの値を保持する。
データ処理装置2は、ステム構造候補探索手段21と、確定ステム構造設定手段22と、配列構造状態調査手段23と、配列エネルギー状態計算手段24と、追加ステム構造探索手段25とを備える。
ステム構造候補探索手段21は、入力装置1から入力されたRNA配列について、記憶部記憶部31に記憶されている情報(塩基対が連続することによる自由エネルギーの値、ループ構造が形成されることによる自由エネルギーの値、許容される最低のステム構造の長さ、シュードノット構造の長さ、二次構造予測の試行回数など)を用いて、この入力されたRNA配列のうち、ステム構造をとり得る領域を探索するとともに、そのステム構造が形成されたときに保持するであろう自由エネルギーを計算する。ステム構造候補探索手段21は、この探索及び計算により得た、ステム構造をとり得る領域をステム構造候補と設定してステム構造候補記憶部32に記憶すると共に、各ステム構造候補の自由エネルギーを、探索結果として、ステム構造候補記憶部32に記憶する。
確定ステム構造設定手段22は、ステム構造候補記憶部32からステム構造候補の情報(塩基の情報、自由エネルギーの情報等)を受け取り、後の調査、計算、探索等を行う対象となるステム構造候補を選択して、確定ステム構造記憶部33に記憶する。選択の対象となるステム構造候補は、入力されたRNA配列についての探索、調査、計算等に応じて、異なる。例えば、二次構造予測の試行回数が1回目の場合、入力装置1から入力されたRNA配列についてステム構造候補が探索され、これらのステム構造候補が上述の通りに整列された後、確定ステム構造設定手段22が最初に選択するステム構造候補は、ステム構造候補探索手段21が整列した最上位にあるステム構造候補である。この場合、確定ステム構造設定手段22は、このステム構造候補を、確定ステム構造として、確定ステム構造記憶部33に記憶する。また、試行回数が2回目の場合、確定ステム構造設定手段22は、試行回数が1回目である場合に確定ステム構造設定手段22が選択したステム構造候補(つまり、確定ステム構造記憶部33に記憶されている確定ステム構造の最上位のステム構造候補)の次の順番に整列されたステム構造候補を確定ステム構造と設定する。このようにして、確定ステム構造設定手段22は、これ以降、試行回数に応じて、確定ステム構造記憶部33に記憶された、整列されたステム構造候補を順に確定ステム構造と設定する。
配列構造状態調査手段23は、確定ステム構造記憶部33に記憶されている確定ステム構造の塩基情報などの各種情報を受け取り、入力RNA配列中の該当する塩基をステム構造の一部に含まれる状態であると指定する。次に、配列構造状態調査手段23は、このステム構造を構成する末端塩基を境に、入力RNA配列の領域のうち、このステム構造を構成する領域と、残りの塩基で構成される領域とに区切る。その後、配列構造状態調査手段23は、このように区切られた各領域とステム構造との位置関係から構造状態を判定して、その結果を配列構造状態記憶部34に記憶する。
配列エネルギー状態計算手段24は、記憶部記憶部31から実験で調査されている塩基対やループ構造の持つ自由エネルギーについての情報と、配列構造状態記憶部34から入力RNA配列の構造状態の情報とを受け取り、入力RNA配列の各領域の構造状態に対応した自由エネルギーの値を逐次計算し、その領域に含まれる各塩基にその値を保持させて、その結果を配列エネルギー状態記憶部35に記憶する。
追加ステム構造探索手段25は、ステム構造候補記憶部32からステム構造候補の情報を受け取り、確定ステム構造記憶部33に記憶されているステム構造に含まれる各塩基と重複しない塩基によってのみ構成されるステム構造候補を追加されるステム構造の候補(以下、追加ステム構造候補とも称する。)とする。
次に、追加ステム構造探索手段25は、この追加ステム構造候補を確定ステム構造とするかについて探索する。つまり、追加ステム構造探索手段25は、確定ステム構造記憶部33に記憶されている確定ステム構造を反映した入力RNA配列の構造状態と、この確定ステム構造を反映した入力RNA配列に追加ステム構造候補を反映させたRNA配列の構造状態とを、自由エネルギーの点で比較して、より自由エネルギーの状態が低い構造状態をとり得る追加ステム構造候補を、追加すべきステム構造として確定ステム構造と判定する。
追加ステム構造探索手段25が、追加すべきステム構造として確定ステム構造と判定することについて、説明する。追加ステム構造探索手段25は、まず、確定ステム構造記憶部33に記憶されている確定ステム構造によって形成される二次構造の各塩基ごとの構造の情報を配列構造状態記憶部34から受け取り、且つその二次構造における各塩基が含まれる構造ごとのエネルギーの状態を配列エネルギー状態記憶部35から受け取る。次に、追加ステム構造探索手段25は、この二次構造の自由エネルギーと、この二次構造に追加ステム構造候補が実際に追加されたときに生じる二次構造の変化による入力RNA配列全体の自由エネルギーとの変化量(差分)を計算する。
この変化量の計算は、全ての追加ステム構造候補について行われる。この変化量のうち、負の最小値を与える追加ステム構造候補は、追加すべきステム構造と判定されて、確定ステム構造として確定ステム構造記憶部33に記憶される。この確定ステム構造は、入力RNA配列に反映されて一定の二次構造を与える。この反映された二次構造について、配列構造状態調査手段23において、配列構造状態を計算し、配列エネルギー状態計算手段24においてその自由エネルギーを計算する。
一方、この変化量の最小値が正の値であった場合、その周回の二次構造予測はそこで打ち切られ、その時点で確定ステム構造記憶部33に記憶されているステム構造を過不足なく含む二次構造を出力装置4に出力する。この後、その時点での二次構造予測の試行回数が、記憶部記憶部31に記憶されている二次構造予測の試行回数に満たない場合は、確定ステム構造設定手段22以下の手順を繰り返し、規定回数に達した場合は計算を打ち切る。
本発明において、入力装置1、データ処理装置2、記憶装置3及び出力装置4は、それぞれ一体のコンピューター上に設けられてもよく、それぞれをインターネットなどの回線を介して別々のコンピューター上に設けられてもよい。
なお、図1において、データ処理装置2と記憶装置3とを結ぶ矢印のうち、データ処理装置2の各手段から伸びる矢印を破線で示し、記憶装置3の各部から伸びる矢印を実線で示す。
次に、図1、及び図2乃至図6を参照して、本発明を詳細に説明する。
入力装置1から与えられたRNA配列(入力RNA配列)の文字列情報は、ステム構造候補探索手段21に供給される(図2のステップA1)。塩基対が連続することによる自由エネルギーの値、ループ構造が形成されることによる自由エネルギーの値、許容される最低のステム構造の長さ、シュードノット構造の長さ、二次構造予測の試行回数などの規定値の情報は、あらかじめ記憶部記憶部31に記憶されている。これらの値を変更する場合は、配列情報と同様に入力装置1から与えられ(図2のステップA2)、記憶部記憶部31に記憶される。
ステム構造候補探索手段21は、まず、この入力RNA配列を構成する各塩基のうち塩基対を形成する可能性がある領域を探索し(図3のステップA31)、その情報を元に、ステム構造(塩基対が連続する部位)が存在する可能性がある箇所を探索する(ステップA32)。探索されたステム構造の候補は、その構造の持つ塩基対の連続による自由エネルギーの単純和を計算された後に(図3のステップA33)、自由エネルギーの低い順番にソート(整列)される(ステップA34)。ステム構造候補探索手段21は、このようにソートされたステム構造候補について、各ステム構造候補を構成する塩基の情報と、そのステム構造候補のもつ自由エネルギーの情報とをセットにして、ステム構造候補記憶部32に記憶する(ステップA35)。ここで記憶されたステム構造候補は、二次構造予測の周回(試行回数)に応じて先頭から順に取り出され、形成されることが確定した最初のステム構造として確定ステム構造記憶部33に記憶される(ステップA4)。
確定ステム構造記憶部33から確定ステム構造の情報を受け取った配列構造状態調査手段23は、まず、確定ステム構造を入力RNA配列上に配置する(図4のステップA51)。配置が終わったら、ステム構造に属さない塩基の領域について、近傍のステム構造の位置関係から、それぞれの領域の二次構造を調査(判定)する(図4のステップA52)。この調査は、RNA配列の二次構造において公知の構造に帰属させることで、行われる。図7Aは、RNAの二次構造を示す概略図を示し、図7Bは、本発明における二次構造の判定式の一例を示す。
ここで、図7B中:
ステム構造に含まれる塩基で最もRNA配列の先頭に近いものを基準のAとして;
ステム構造の同一鎖の反対側の端にある塩基をBとし;
Aと塩基対を形成する塩基をCとし;
Bと塩基対を形成する塩基をDとする。
また、「’」又は「’’」の有無により、同一のステム構造かどうかを区別する。
また、表に該当する(A、C)又は(B、D)の組み合わせが無い場合は、それぞれの周辺構造はバルジループとする。
なお、一般的に、ステム構造の配列の端に当たる塩基は、ループ構造を形成しないと考え得るが、この調査においては、独自の二次構造を形成しているとみなす。このようにして、あるステム構造の周辺の構造の調査を行う。確定ステム構造の周辺に未調査の領域がある場合は、その周辺の構造の調査に移り、未調査(未判定)の領域が無い場合は、調査した構造の状態を配列構造状態記憶部34に記憶する(図4のステップA53及びステップA54)。
配列の構造状態が決まったら、配列エネルギー状態計算手段24は、配列構造状態記憶部34から配列の構造状態を受け取り(図5のステップA61)、記憶部記憶部31に記憶されている規定値であるループ構造形成に伴う自由エネルギーの値を用いて、各領域の自由エネルギーの値を計算する。この際、その領域に含まれる塩基全てに同じ値を保持させてもよい(図5のステップA62)。その配列の各塩基のエネルギー状態は、配列エネルギー状態記憶部35に記憶される(図5のステップA63)。
配列のエネルギー状態が求まると、追加ステム構造探索手段25は、まず、ステム構造候補記憶部32からステム構造候補を受け取り(図6のステップA71)、ステム構造候補を構成する塩基について、確定ステム構造の塩基と重複が無いかを調査する(図6のステップA72)。重複があった場合は、次のステム構造候補について再び重複の調査を行う。重複が無かった場合、このステム構造候補は、確定ステム構造に追加されるステム構造の候補(追加ステム構造候補)となる。追加ステム構造探索手段25は、確定ステム構造を入力RNA配列に反映して得られる構造状態と、この構造状態に追加ステム構造候補を反映させた構造状態との間で、それぞれの構造状態に由来する自由エネルギーの変化量(差分)を計算する(図6のステップA73)。このときに計算された変化量の中で最低の(負の方向に最も大きい)値及び、その値が計算されたときのステム構造候補の情報は一時的に保持され、最低の値が更新される度に最低の変化量と追加ステム構造の候補が書き換わっていく(図6のステップA74及びステップA75)。
この重複の調査以下の手順は、未調査のステム構造候補が無くなるまで繰り返される(図6のステップA76)。
未調査のステム構造候補がなくなると、追加ステム構造探索手段25は、その時点の最低の変化量として保持されている値が正であるか負であるかを判定する(図2のステップA8)。
変化量が負の値の場合は、その時点で追加ステム構造探索手段25に保持されている追加ステム構造候補が確定ステム構造として確定ステム構造記憶部33に追加され、確定ステム構造記憶部33の情報が更新される(図2のステップA9)。その後、再び配列構造状態調査手段23以下の手順(ステップA5〜A9)を繰り返す。
変化量が正の値であった場合は、その時点で保持されている追加ステム構造候補は、破棄される。その時点で確定ステム構造記憶部33に記憶されている各確定ステム構造は、入力RNA配列の二次構造の予測結果であり、この結果が出力装置4に出力される(図2のステップA10)。
結果が出力されると、次は、現時点での二次構造予測の試行回数が判定される(図2のステップA11)。現在の試行回数が規定値として入力されていた試行回数に満たない場合、ステム構造候補記憶部32に記憶されているステム構造候補のうち、その回で確定ステム構造設定手段22に設定されたステム構造候補(初回の試行においては、確定ステム構造)の次にソートされているステム構造候補を、確定ステム構造と設定して、上記の配列構造状態調査手段23以下の手順を繰り返す(図2のステップA4)。規定の試行回数に達した場合は、計算を終了する。
次に、図8乃至13等を参照して、具体例を用いて本実施例の動作を説明する。
今、入力装置1に入力RNA配列としてGCAACCCGCAUAGGGが与えられたとする。その際に規定値の入力は無かったとすると、記憶部記憶部31にあらかじめ入力されている自由エネルギーの情報などが以下の計算に用いられる。なお、便宜上、図8の「1」に対応する塩基「G」を5’末端とし、「15」に対応する塩基「G」を3’末端と称して、以下、説明する。
ステム構造候補探索手段21は、ステム構造候補として、例えば図8の白枠部(ステム候補領域1)及び斜線部(ステム候補領域2)のような、G−C、A−U、G−Uの塩基対が連続する箇所を発見し、列挙する。ステム候補領域の自由エネルギーは、主に塩基対の積み重なりの種類によって固有の値の和で計算されるので、G−Cの塩基対が連続した場合の自由エネルギーの値が−2であると仮定すると、ステム候補領域1の自由エネルギーは、−4となり、ステム候補領域2の自由エネルギーは、−6となる。ステム構造候補探索手段21は、各ステム構造候補を、例えば自由エネルギーの昇順にソートして、ステム構造候補記憶部32に記憶する。図8に示した入力RNA配列の場合、ステム構造候補探索手段21は、このようにソートされた各ステム候補領域(ステム候補領域2、ステム候補領域1)の順と、これらステム候補領域を構成する塩基と、この領域の自由エネルギーの値とを、ステム構造候補記憶部32に記憶する。
次に、確定ステム構造設定手段22は、最初の確定ステム構造として、ステム構造候補記憶部32の先頭に記憶されているステム構造候補であるステム候補領域2を設定し、確定ステム構造記憶部33に記憶する。
配列構造状態調査手段23は、まず、確定ステム構造記憶部33に記憶されているステム構造候補のうちステム候補領域2の情報を受け取り、入力RNA配列の該当する塩基をステム候補領域2の一部に含まれる状態であると指定する。あるステム構造が決まったとき、そのステム構造の周辺には4箇所の構造未判定領域が存在し得る。即ち、この4箇所の構造未判定領域とは、図9に示すように、入力RNA配列の5’末端の5塩基目から5’末端方向の領域(未検索領域2−1)と、5’末端の7塩基目から3’末端方向の領域(未検索領域2−2)と、5’末端の13塩基目から5’末端方向の領域(未検索領域2−3)と、5’末端の15塩基目から3’末端方向の領域(未検索領域2−4)とである。それぞれの領域は、元のステム構造の領域を始点として、他のステム構造の領域或いは配列の端に到達するまでの領域である。
配列構造状態調査手段23は、例えば、入力RNA配列の5’末端に近い領域(この場合では未検索領域2−1)から調査する。すると、この場合、5’末端の5残基目から5’末端のまでの領域にはステム構造が存在しないため、未検索領域2−1は、入力RNA配列の5’末端に接続することが分かる。この場合、未検索領域2−1は、四残基からなる一本鎖領域であるとする。次に、未検索領域2−2、及び未検索領域2−3を探索する。すると、これらは、それぞれ、未検索領域2−3の先頭、及び未検索領域2−2の先頭に接続することが分かる。この場合、未検索領域2−2(=未検索領域2−3)は、五塩基からなるヘアピンループ構造を形成するということが分かる。最後に、未検索領域2−4の探索を行う。未検索領域2−4は、すぐに配列の端に接続するが、そこに含まれる塩基は一つも無いことが分かる。これでステム候補領域2に関してのステム周辺構造判定(図4のステップA52)が終了する。
図8に示した入力RNA配列の二次構造予測において、この時点で確定ステム構造記憶部33に記憶されている確定ステム構造は、ステム候補領域2のみであるので、これで調査を終了する。
探索が終わると、配列構造状態調査手段23は、調査したRNA配列の構造状態の情報を配列構造状態記憶部34に記憶する。
次に、配列エネルギー状態計算手段24は、配列構造状態記憶部34から構造状態の情報を受け取り、記憶部記憶部31から受け取った自由エネルギーのデータを用いて、各構造に対応した自由エネルギーを計算する。構造状態の情報より、入力RNA配列は、四塩基からなる一本鎖領域(未検索領域2−1に対応)と、五塩基からなるヘアピンループ構造(未検索領域2−2及び2−3に対応)と、3つのG−Cペアからなるステム構造領域とで構成されていることが分かるため、一本鎖領域の自由エネルギーを0、五塩基からなるヘアピンループ構造の自由エネルギーを4とすれば、配列エネルギー状態計算手段24は、配列エネルギー状態記憶部3535に、図10のように、各塩基にそれぞれの構造状態に対応したエネルギーを記憶する。
次に、追加ステム構造探索手段25は、ステム構造候補記憶部32に記憶されているステム構造候補のうち、確定ステム構造に含まれていない塩基のみからなるステム構造候補をソート順にステム構造候補記憶部32から受け取る。この場合、追加ステム構造探索手段25は、まず図8のステム候補領域1を受け取る。配列構造状態記憶部34に記憶されている入力RNA配列の構造の情報によると、ステム候補領域1を構成する塩基は、現在のステム構造(つまり、ステム候補領域2)に含まれる塩基と重複していないため、ステム候補領域1は追加ステム構造候補になる。次に、確定ステム構造記憶部33に記憶されているステム構造に追加ステム構造候補であるステム候補領域1を追加して配列構造状態調査手段23に送る。
次に、配列構造状態調査手段23は、図9に示す入力RNA配列の構造状態に、ステム候補領域1を反映させた構造状態(つまり、図11に示す入力RNA配列の構造状態)について、調査する。即ち、上述の通りステム構造候補記憶部32からステム候補領域1を受け取った配列構造状態調査手段23は、上述のステム構造候補2について行った調査と同様に、まず、入力RNA配列の該当する塩基をステム候補領域1の一部に含まれる状態であると指定する。その後、配列構造状態調査手段23は、ステム候補領域1の周辺の構造状態を調査する。つまり、配列構造状態調査手段23は、図11に示すように、1塩基目から5’末端方向の領域(未検索領域1−1)と、2塩基目から3’末端方向の領域(未検索領域1−2)と、8塩基目から5’末端方向の領域(未検索領域1−3)と、9塩基目から3’末端方向の領域(未検索領域1−4)とについて、それぞれ探索する。まず、未検索領域1−1と未検索領域1−4とについて見ると、未検索領域1−1は、すぐに配列の端に接続するために含まれる塩基が無いのに対して、未検索領域1−4は、他のステム候補領域(ここでは、上述のステム候補領域2)に接続する。この場合、未検索領域1−1は、0塩基からなる一本鎖領域、未検索領域1−4は三塩基からなるバルジループ構造であると判定する。次に、未検索領域1−2と未検索領域1−3とについて探索すると、それぞれが同じステム構造の同じ側の鎖に接続する。この場合は、この未検索領域1−2及び未検索領域1−3は、それぞれ、長さ2のバルジループ構造、長さ0のバルジループ構造を形成していると判定する。このときのステム候補領域1の周辺の構造状態の情報を配列エネルギー状態計算手段24に送る。
このときの配列エネルギー状態計算手段24は、まず、先ほど判定されたステム候補領域1の周りの構造情報を用いて自由エネルギーを計算する。二塩基からなるバルジループ構造の自由エネルギーを2、三塩基からなるバルジループ構造の自由エネルギーを3であるとすると、自由エネルギーは図12のように計算される。ここで、元々の構造である図9と、ステム候補領域1を反映させて得た構造である図11とを比較すると、ステム候補領域1の形成によって構造が変化した部位は、図9の5塩基目から5’末端方向の領域の一本鎖領域と、7塩基目から13塩基目までの間のヘアピンループ構造の領域とである。図11に示す構造では、この領域の構造に代えて、ステム候補領域1のステム構造と、2塩基目から5塩基目までの間のバルジループ構造と、9塩基目から13塩基目までの間のバルジループ構造とが新たに形成されていることが分かる。この場合の局所的な自由エネルギーは、図9の一本鎖領域とヘアピンループ構造との合計値である4から、ステム候補領域1のステム構造と二つのバルジループ構造との合計値である1に変化したことになる。これは自由エネルギーの変化量が負であったということであるので、ステム候補領域1は追加ステム構造として認められる(ステップA74、ステップA75)。今回はステム候補領域1以外のステム構造候補がステム構造候補記憶部に記憶されていないため、ステム候補領域1が新たな確定ステム構造として確定ステム構造記憶部33に記憶される(ステップA76)。
次に、配列構造状態調査手段23は、確定ステム構造が増えたことに応じて、再び入力RNA配列全体の構造状態を調査する。構造の調査は、各ステム構造を形成する塩基のうちで最も配列の先頭に近い塩基の配列の先頭からの距離の順によって順番に周辺構造が調査される。この場合、図8のステム候補領域1、ステム候補領域2の順で調査される。ステム候補領域1の周辺構造の判定については、先のものと同様である。ステム候補領域2の周辺構造については、図13を参照すると、5塩基目から5’末端方向の領域(未検索領域2−1−2)、7塩基目から3’末端方向の領域(未検索領域2−2−2)、13塩基目から5’末端方向の領域(未検索領域2−3−2)、及び15塩基目から3’末端方向の領域(未検索領域2−4−2)が存在する。また、未検索領域2−1−2及び未検索領域2−4−2についてみると、未検索領域2−1−2は、ステム構造に接続し、未検索領域2−4−2は、配列の端に接続することが分かる。従って、未検索領域2−1−2は、二塩基からなるバルジループ構造であると判定され、未検索領域2−4−2は、0塩基からなる一本鎖領域であると判定される。また、未検索領域2−2−2及び未検索領域2−3−2では、どちらも同じステム構造の同じ側の鎖に接続することが分かるため、それぞれ0塩基からなるバルジループ構造、三塩基からなるバルジループ構造であることが分かる。ここで、未検索領域2−1−2、未検索領域2−2−2及び未検索領域2−3−2は、ステム候補領域1の周辺構造として既に構造が判定されている領域であるが、これはステム候補領域2の周辺構造として判定したものと結果が矛盾しないので、ステム候補領域2の周辺構造調査の結果をそのまま用いる。これで現時点の確定ステム構造の周辺構造を全て判定したので、配列構造状態調査手段23は、調査したRNA配列の構造状態の情報を配列構造状態記憶部34に、以前のものを上書きする形で、記憶する。
配列エネルギー状態計算手段24は、先のRNA配列全体の自由エネルギー計算を行ったときと同様の処理を行い、その結果を配列エネルギー状態記憶部35に以前のものを上書きする形で記憶する。
次に、追加ステム構造探索手段25は、ステム構造候補記憶部32に記憶されたステム構造候補のリストを参照して追加すべきステム構造候補を参照する。この場合、図8の配列において候補とすべきステム構造候補の全てについて上述の通り判定が終了しているので、追加ステム構造探索手段25は、追加するステム構造がないと判定する(ステップA76)。
以上をもって、入力RNA配列に対する第一回目の二次構造予測は終了し、確定ステム構造記憶部33に記憶されているステム構造であるステム候補領域1、ステム候補領域2を過不足無く含む構造(配列構造状態記憶部34に記憶されている構造)が出力装置4によって出力される(ステップA10)。ここで、記憶部記憶部31に記憶されている二次構造予測の試行回数が2回以上であった場合は、確定ステム構造設定手段22において、ステム候補領域1をステム構造候補としてステム構造候補記憶部32から受け取り、上述と同様の手順により結果が出力される。
本発明の他の態様としては、図2においては二つの手順に分けられている配列構造状態調査手段23と配列エネルギー状態計算手段24とを一つにまとめて、行ってもよい。即ち、配列構造状態調査手段23において未検索領域の構造が決定されると同時に、その領域のエネルギーを計算して構造の情報を配列構造状態記憶部34に記憶し、エネルギーの情報を配列エネルギー状態記憶部35に記憶するという配列構造エネルギー状態計算手段26を用いて行ってもよい。
従って、本発明によるRNAの二次構造予測方法、本発明によるRNAの二次構造予測装置及び本発明によるRNAの二次構造予測プログラムは、それぞれ、以上の工程を行う予測方法であり、以上の工程を行う各手段を有する予測装置であり、以上の工程を実行する予測プログラムである。
(例1)
下記の各配列(配列1〜22)に関して、上述の通り、本発明によるRNAの二次構造予測方法を用いて、RNA配列の二次構造の予測を行い、非特許文献3に記載のsensitivity及びspecificityを算出した。その結果を表1に示す。
配列1:GGAACCGGUGCGCAUAACCACCUCAGUGCGAGCAA
配列2:GGAUCCCGACUGGCGAGAGCCAGGUAACGAAUGGAUCC
配列3:GGACCGUCAGAGGACACGGUUAAAAAGUCCUCU
配列4:GGCCGAAAUCCCGAAGUAGGCC
配列5:GGCGAUACCAGCCGAAAGGCCCUUGGCAGCGUC
配列6:CAUACUUGAAACUGUAAGGUUGGCGUAUG
配列8:GGGAGCUUGAUCCCGGAAACGGUCGAUCGCUCCC
配列9:GGCGAUACCAGCCGAAAGGCCCUUGGCAGCGUC
配列11:GGAGAUCGCACUCCA
配列12:CGAAACAUAGAUUCGA
配列13:ACUUGGUUUAGGUAAUGAGU
配列14:GGCGUGUAGGAUAUGCUUCGGCAGAAGGACACGCC
配列17:GGACUGGGCGAGAAGUUUAGUCC
配列20:GGAUCCCGACUGGCGAGAGCCAGGUAACGAAUGGAUCC
配列21:GGGAAGGGAAGAAACUGCGGCUUCGGCCGGCUUCCC
配列22:GGCACGAGGUUUAGCUACACUCGUGCC
(例2)
例1と同様の配列に関して、MFOLD(http://www.bioinfo.rpi.edu/applications/mfold/old/rna/)を用いて、RNA配列の二次構造の予測を行った以外は、例1と同様に、sensitivity及びspecificityを算出した。その結果を表2に示す。
一般的に、specificity及びsensitivityが増加すると、精度よく予測されていると考えられる。本発明によるRNAの二次構造予測方法の予測精度について上記(例1)と(例2)とを比較すると、平均値が増加した。従って、本発明により、RNAの二次構造の予測は、より精度よく行うことが可能であることが分かる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。

Claims (15)

  1. 対象となるRNA配列のうちステム構造を形成し得る塩基を探索する工程と、
    前記ステム構造を構成する各塩基の自由エネルギーに基づいて、ステム構造候補を設定する工程と、
    前記ステム構造候補から確定ステム構造を設定する工程と、
    前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する工程と、
    前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する工程と、
    前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する工程と、
    を有することを特徴とするRNAの二次構造予測方法。
  2. 前記のステム構造候補を設定する工程は、ステム構造の自由エネルギーの昇順に行われることを特徴とする請求項1に記載のRNAの二次構造予測方法。
  3. 前記配列構造状態は、ステム構造、バルジループ構造、内部ループ構造、ヘアピンループ構造、多岐ループ構造、一本鎖及びRNA配列の末端構造からなる群から選択された構造であることを特徴とする請求項1又は2に記載のRNAの二次構造予測方法。
  4. 前記の配列エネルギー状態を計算する工程は、前記配列構造状態を構成する各塩基の自由エネルギーの単純和を計算する工程であることを特徴とする請求項1乃至3のいずれか一項に記載のRNAの二次構造予測方法。
  5. 前記の追加ステム構造候補を新たな確定ステム構造と設定する工程は、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とを差分して得た変化量が負である場合、該追加ステム構造候補を該新たな確定ステム構造と設定する工程であることを特徴とする請求項1乃至4のいずれか一項に記載のRNAの二次構造予測方法。
  6. 対象となるRNA配列のうちステム構造を形成し得る塩基を検索して、ステム構造候補を設定するステム構造候補探索手段と、
    前記ステム構造候補から確定ステム構造を設定する確定ステム構造設定手段と、
    前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する配列構造状態調査手段と、
    前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する配列エネルギー状態計算手段と、
    前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する追加ステム構造探索手段と、
    を有することを特徴とするRNAの二次構造予測装置。
  7. 前記ステム構造候補探索手段は、前記ステム構造候補を自由エネルギーの昇順に整列することを特徴とする請求項6に記載のRNAの二次構造予測装置。
  8. 前記配列構造状態は、ステム構造、バルジループ構造、内部ループ構造、ヘアピンループ構造、多岐ループ構造、一本鎖及びRNA配列の末端構造からなる群から選択された構造であることを特徴とする請求項6又は7に記載のRNAの二次構造予測装置。
  9. 前記配列エネルギー状態計算手段は、前記配列構造状態を構成する各塩基の自由エネルギーの単純和を計算することを特徴とする請求項6乃至8のいずれか一項に記載のRNAの二次構造予測装置。
  10. 前記追加ステム構造探索手段は、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とを差分して得た変化量が負である場合、該追加ステム構造候補を該新たな確定ステム構造と設定することを特徴とする請求項6乃至9のいずれか一項に記載のRNAの二次構造予測装置。
  11. 対象となるRNA配列のうちステム構造を形成し得る塩基を探索する工程と、
    前記ステム構造を構成する各塩基の自由エネルギーに基づいて、ステム構造候補を設定する工程と、
    前記ステム構造候補から確定ステム構造を設定する工程と、
    前記確定ステム構造の塩基情報に基づいて、前記RNA配列の配列構造状態を調査する工程と、
    前記配列構造状態に基づいて、前記RNA配列を構成する各塩基の配列エネルギー状態を計算する工程と、
    前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とに基づいて、該追加ステム構造候補を新たな確定ステム構造と設定する工程と、
    を実行することを特徴とするRNAの二次構造予測プログラム。
  12. 前記のステム構造候補を設定する工程は、ステム構造の自由エネルギーの昇順に行われることを特徴とする請求項11に記載のRNAの二次構造予測プログラム。
  13. 前記配列構造状態は、ステム構造、バルジループ構造、内部ループ構造、ヘアピンループ構造、多岐ループ構造、一本鎖及びRNA配列の末端構造からなる群から選択された構造であることを特徴とする請求項11又は12に記載のRNAの二次構造予測プログラム。
  14. 前記の配列エネルギー状態を計算する工程は、前記配列構造状態を構成する各塩基の自由エネルギーの単純和を計算する工程であることを特徴とする請求項11乃至13のいずれか一項に記載のRNAの二次構造予測プログラム。
  15. 前記の追加ステム構造候補を新たな確定ステム構造と設定する工程は、前記確定ステム構造を反映した前記RNA配列の二次構造の配列エネルギー状態と、前記ステム構造候補から選択した追加ステム構造候補を該二次構造に反映した新たな二次構造の配列エネルギー状態とを差分して得た変化量が負である場合、該追加ステム構造候補を該新たな確定ステム構造と設定する工程であることを特徴とする請求項11乃至14のいずれか一項に記載のRNAの二次構造予測プログラム。
JP2008509798A 2006-03-28 2007-03-28 Rnaの二次構造予測装置、予測方法、プログラム及び記録媒体 Expired - Fee Related JP5022361B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008509798A JP5022361B2 (ja) 2006-03-28 2007-03-28 Rnaの二次構造予測装置、予測方法、プログラム及び記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006088599 2006-03-28
JP2006088599 2006-03-28
JP2008509798A JP5022361B2 (ja) 2006-03-28 2007-03-28 Rnaの二次構造予測装置、予測方法、プログラム及び記録媒体
PCT/JP2007/056618 WO2007116787A1 (ja) 2006-03-28 2007-03-28 Rnaの二次構造予測方法、予測装置及び予測プログラム

Publications (2)

Publication Number Publication Date
JPWO2007116787A1 true JPWO2007116787A1 (ja) 2009-08-20
JP5022361B2 JP5022361B2 (ja) 2012-09-12

Family

ID=38581082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008509798A Expired - Fee Related JP5022361B2 (ja) 2006-03-28 2007-03-28 Rnaの二次構造予測装置、予測方法、プログラム及び記録媒体

Country Status (5)

Country Link
US (1) US20100235155A1 (ja)
EP (1) EP2012246A4 (ja)
JP (1) JP5022361B2 (ja)
AU (1) AU2007236811B2 (ja)
WO (1) WO2007116787A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5348702B2 (ja) * 2008-07-11 2013-11-20 Necソフト株式会社 特徴抽出方法、特徴抽出装置及び特徴抽出プログラム
CN101717817B (zh) * 2009-07-17 2011-11-23 中国人民解放军国防科学技术大学 对基于随机上下文无关文法的rna二级结构预测进行加速的方法
WO2011062166A1 (ja) * 2009-11-17 2011-05-26 武田薬品工業株式会社 Rnaの二次構造の動態を予測する方法
CN101908102B (zh) * 2010-08-13 2011-11-09 山东建筑大学 基于茎区的核糖核酸二级结构的预测方法及装置
CN102819692A (zh) * 2012-08-10 2012-12-12 上海交通大学 基于fpga的rna二级结构预测装置、系统及其实现方法
CN104298894B (zh) * 2014-09-17 2017-10-20 山东建筑大学 基于k茎的核糖核酸假结结构的预测方法及装置
CN104375807B (zh) * 2014-12-09 2017-05-17 中国人民解放军国防科学技术大学 基于众核协处理器的三级流水序列比对方法
CN109215740A (zh) * 2018-11-06 2019-01-15 中山大学 基于Xgboost的全基因组RNA二级结构预测方法
DE202022101929U1 (de) 2022-04-09 2022-06-02 Pradipta Bhowmick Intelligentes System zur Vorhersage der Sekundärstruktur von RNA unter Verwendung von faltbaren neuronalen Netzen und künstlicher Intelligenz

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2944434B2 (ja) 1994-12-07 1999-09-06 日本電気株式会社 Rna2次構造予測装置及び方法
JP3129202B2 (ja) * 1996-08-30 2001-01-29 日本電気株式会社 配列2次構造予測方法及び配列2次構造予測装置
JP3881238B2 (ja) * 2001-12-28 2007-02-14 セレスター・レキシコ・サイエンシズ株式会社 Rna配列解析装置、rna配列解析方法、プログラム、および、記録媒体
US20040002083A1 (en) * 2002-01-29 2004-01-01 Ye Ding Statistical algorithms for folding and target accessibility prediction and design of nucleic acids

Also Published As

Publication number Publication date
AU2007236811B2 (en) 2012-03-01
WO2007116787A1 (ja) 2007-10-18
EP2012246A1 (en) 2009-01-07
AU2007236811A1 (en) 2007-10-18
EP2012246A4 (en) 2009-04-01
JP5022361B2 (ja) 2012-09-12
US20100235155A1 (en) 2010-09-16

Similar Documents

Publication Publication Date Title
JP5022361B2 (ja) Rnaの二次構造予測装置、予測方法、プログラム及び記録媒体
Zhou et al. Modeling within-motif dependence for transcription factor binding site predictions
JP2021532439A (ja) コドン最適化
Havgaard et al. RNA structural alignments, part I: Sankoff-based approaches for structural alignments
Kim et al. Graph applications to RNA structure and function
Mamuye et al. A graph grammar for modelling RNA folding
JP4614949B2 (ja) 塩基配列検索装置及び塩基配列検索方法
Zhao et al. Improving prediction accuracy using decision-tree-based meta-strategy and multi-threshold sequential-voting exemplified by miRNA target prediction
Meng et al. Improved structure-related prediction for insufficient homologous proteins using MSA enhancement and pre-trained language model
Wei et al. Comparative analysis of regulatory motif discovery tools for transcription factor binding sites
Chopra et al. Evolved cellular automata for protein secondary structure prediction imitate the determinants for folding observed in nature
US20050112577A1 (en) Rna sequence analyzer, and rna sequence analysis method, program and recording medium
Xiao et al. RNA-targeted small-molecule drug discoveries: a machine-learning perspective
JP2008118923A (ja) 核酸高次構造予測方法、核酸高次構造予測装置及び核酸高次構造予測プログラム
Bi SEAM: A stochastic EM-type algorithm for motif-finding in biopolymer sequences
Yehdego et al. Secondary structure predictions for long RNA sequences based on inversion excursions and MapReduce
Chan et al. Generic spaced DNA motif discovery using Genetic Algorithm
Kaya Motif discovery using multi-objective genetic algorithm in biosequences
Ganjtabesh et al. Inverse RNA folding solution based on multi-objective genetic algorithm and Gibbs sampling method
Do et al. An improvement of the overlap complexity in the spaced seed searching problem between genomic DNAs
Cavattoni et al. Boosting Metagenomic Classification with Reads Overlap Graphs
González-Álvarez et al. Analysing the scalability of multiobjective evolutionary algorithms when solving the motif discovery problem
Fu et al. A rule-based approach for RNA pseudoknot prediction
JP5348702B2 (ja) 特徴抽出方法、特徴抽出装置及び特徴抽出プログラム
Cheung et al. RIPGA: RNA-RNA interaction prediction using genetic algorithm

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120615

R150 Certificate of patent or registration of utility model

Ref document number: 5022361

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees